Как помочь учёным, ничего не делая

Скринсейвер с визуализацией расшифровки сигнала SETI@home.

Среди наших читателей наверняка нашлось бы много желающих поддержать важные исследования, если бы они знали, что иногда для этого нужен только компьютер и подключение к интернету. Рассказываем, как помочь науке бездействием.

В 2014 году в Оксфордский словарь, наконец, внесли термин «гражданская наука» (citizen science), так называют привлечение любителей к научным исследованиям. Явление зародилось ещё тогда, когда «профессиональных» учёных не существовало, но особенно популярным этот метод стал после появления интернета: исследователи просят добровольцев помочь со сбором и обработкой данных, а самую сложную часть работы берут на себя. Обычно от волонтёров ждут активных действий: нужно наблюдать за птицами или растениями, отмечать на фотографиях астероиды или распознавать изображения. Но иногда всё, чего не хватает учёным, — мощные компьютеры. И тогда на помощь приходят тысячи добровольцев с домашними ПК, ноутбуками и смартфонами. Они устанавливают специальные программы, и их компьютеры в моменты простоя принимаются решать важные научные задачи. Такие распределённые вычисления называются добровольными (volunteer computing).

Большинство проектов распределённых вычислений работают на платформе BOINC, разработанной университетом Беркли. Когда-то она была создана для собственной успешной программы университета — SETI@home — но позже разработчики сделали её доступной для всех. Добровольные вычисления оказались очень удачным инструментом — некоторым сетям удавалось по мощности приблизиться к суперкомпьютерам. Желающих применить этот инструмент для решения тех или иных задач нашлось очень много. Сейчас на просторах сети можно обнаружить больше сотни таких проектов, и в этой статье мы расскажем о самых интересных из них. Если вы захотите помочь науке — достаточно загрузить программу-клиент и зарегистрироваться, остальное компьютер сделает сам.

Список заданий для вычисления программ Rosetta@home и World Community Grid в расширенном варианте интерфейса клиента BOINC.

Информация о задании программы Rosetta@home в упрощённой версии интерфейса клиента BOINC.
Rosetta@Home изучает строение белков. Белки (протеины) — одна из трёх основных макромолекул в клетках живых существ, в нашем организме они составляют основу мышечной массы, переносят кислород, участвуют в обмене веществ, нейтрализуют вирусы и так далее. Знание их природы позволит проектировать новые протеины и создавать лекарства от рака, малярии и других болезней, которые пока не удалось победить.

Каждый белок уникален, и, чтобы воссоздать его строение, нужно знать не только то, какие аминокислоты его составляют, но и как они располагаются в пространстве, какова их третичная структура. Экспериментальные способы определить эту структуру уже существуют — рентгеноструктурный анализ и ядерный магнитный резонанс, — но они весьма дороги и требуют много времени. Создатели проекта добровольных вычислений Rosetta@Home поставили перед собой цель — добиться той же точности при меньших затратах времени и денег.

Сотрудники лаборатории Дэвида Бэйкера при Вашингтонском университете (исследовательское учреждение, курирующее проект) и их коллеги с помощью вычислительной сети сделали множество полезных вещей.

  • Разработали вакцину от респираторного синцитиального вируса человека

РСВ — вирус, вызывающий примерно 7% смертей младенцев в возрасте от месяца до года. Он очень быстро мутирует, поэтому создать вакцину раньше не удавалось. Учёные знали, какие антитела нужны для борьбы с вирусом и каков эпитоп вируса (та уникальная часть, на которую реагируют антитела). Основной задачей было разработать белковый каркас для эпитопа вакцины, чтобы она убедительно притворялась вирусом и могла вызывать настоящую иммунную реакцию. С помощью компьютерного моделирования в добровольческой сети удалось воспроизвести третичную структуру белкового каркаса и создать вакцину. Поскольку в новой молекуле использован один эпитоп (в настоящем вирусе их несколько), детскому организму будет проще справиться с вакциной, и она не ухудшит его состояние. Лекарство успешно протестировали на мышах и макаках и теперь опробуют на людях.

  • Создали металлопротеин (белок, содержащий ионы металлов) MB_07, который может служить реагентом для удаления радиоактивных и токсичных отходов из сточных вод.
  • Синтезировали белок BINDI, который вызывает саморазрушение раковых клеток, инфицированных вирусом Эпштейна — Барр (вирусом герпеса человека 4-го типа).

Особенность вируса Эпштейна — Барр в том, что он не уничтожает клетки, а, наоборот, приводит к разрастанию тканей. Это может послужить причиной возникновения раковых опухолей (лимфомы Бёркитта и лимфомы Ходжкина). Белок BINDI, вызывающий саморазрушение раковых клеток, инфицированных этих вирусом, был разработан и синтезирован исследователями из Institute for Protein Design (Вашингтонский университет, Сиэтл, США), и это также было сделано при существенной помощи добровольцев, на домашних компьютерах которых велись расчёты по программе Rosetta@Home. Эксперименты с этим белком на мышах оказались успешными: введённый в ткань лимфомы протеин BINDI сдерживал рост опухоли и позволял животным жить дольше.

Практическая польза исследований и внимательное отношение к сообществу (волонтёров всегда держат в курсе последних новостей) привлекают многих, и число активных участников Rosetta@Home сейчас составляет более 690 000 человек. Эти добровольцы сумели задействовать в проекте более полутора миллионов компьютеров.

Great Internet Mersenne Prime Search (GIMPS) — созданный в 1996 году программистом Джорджем Уолтманом проект по поиску чисел Мерсенна с помощью сети распределённых вычислений.

Числа Мерсенна — это числа вида Mn = 2n − 1, где n — целое положительное число. Они названы в честь французского монаха и математика Марена Мерсенна и на практике применяются для построения генераторов псевдослучайных чисел.

Простые числа Мерсенна являются простыми числами специального вида Mp = 2p − 1, где р — другое простое число.

GIMPS не только первая в истории, но и чрезвычайно успешная попытка использовать компьютеры добровольцев для решения общей задачи: участниками сети найдено 14 из 48 известных на сегодняшний день простых чисел Мерсенна. Последнее из них было открыто в 2013 году и оказалось самым большим простым числом — чтобы записать его, нужно 17 миллионов знаков. Некоммерческая правозащитная организация Electronic Frontier Foundation («Фонд Электронных Рубежей») дважды награждала участников проекта: в 2000 и 2009 годах за открытие простых чисел, длина которых превышает миллион и десять миллионов знаков соответственно. Денежные выплаты от EEF в 100 000 долларов GIMPS разделил на небольшие премии для поощрения будущих открытий.

LHC@Home — платформа распределённых вычислений, созданная учёными ЦЕРН для помощи в разработке и эксплуатации Большого адронного коллайдера. В рамках LHC@Home действуют несколько проектов с разными целями.

Компьютерная сеть ATLAS@Home моделирует столкновения частиц в одноимённом детекторе. Этот массив детекторов помогает в поисках новых элементарных частиц, которые дадут нам возможность больше узнать о тёмной материи и других измерениях. Учёные предполагают, что открытие подобных частиц может в корне изменить сегодняшние представления о физике.
ATLAS (A Toroidal LHC ApparatuS) — детектор протон-протонных столкновений диаметром 25 метров и весом 7000 тонн. Тот самый, события на котором моделируются на тысячах домашних компьютеров в рамках программы ATLAS@Home.
Проект SixTrack использует компьютеры волонтёров для предотвращения аварий во время экспериментов. Программа моделирует движение 60 элементарных частиц в кольце ускорителя БАК на протяжении миллиона циклов. Эта симуляция позволяет подобрать такие параметры оборудования, при которых пучок частиц останется стабильным. Так волонтёры помогают снизить риск того, что эксперимент выйдет из-под контроля, а ускоритель будет остановлен или повреждён. В будущем SixTrack планируют использовать не только для отладки, но и для усовершенствования Большого адронного коллайдера.
vLHCathome позволяет пользователям запускать на своих компьютерах моделирование столкновений высокоэнергетических частиц. Результаты попадают в базу данных для учёных, работающих с БАК. Так последние получают возможность сравнить реальные данные экспериментов с теорией и выявить несоответствие.

SETI@Home — проект Лаборатории космических наук Калифорнийского университета. Его цель — поиск сигналов внеземных цивилизаций. Для сбора нужной информации используют радиотелескоп в обсерватории Аресибо в Пуэрто-Рико, откуда носители данных почтой высылают в Беркли. Там данные делят на маленькие кусочки, по 0,25 Мбайт каждый, и отправляют для анализа на компьютеры участников проекта.

Специальное ПО отсеивает радиосигналы земного происхождения — слишком сильные или широкополосные — и оставляет слабые «позывные», которые затихают и усиливаются в течение 12 секунд (именно столько времени нужно объекту, чтобы попасть в поле зрения неподвижного телескопа и пройти его насквозь). Если сигналы соответствуют всем требованиям, их проверяет команда SETI@Home (99% оказываются радиопомехами) и в случае успеха объявляет «многообещающими кандидатами», то есть приговаривает к дальнейшему изучению.

SETI@Home — один из первых проектов добровольных распределённых вычислений, и, хотя за 15 лет энтузиасты не обнаружили сообщений от инопланетян, а лишь назвали несколько «кандидатов» на эту роль, он до сих пор очень популярен. Сейчас анализировать данные телескопа помогают более 120 000 активных пользователей, а вычислительная мощность сети — 688 395 терафлопc. Это, конечно, меньше, чем у китайского суперкомпьютера Тяньхэ-2 (в пятьдесят раз), но вполне сопоставимо с компьютером Эдинбургского университета.

Главный радиотелескоп обсерватории Аресибо, Пуэрто-Рико.

Распределённая вычислительная система RNA World предназначена для выявления, анализа и дизайна РНК. Согласно описанию на официальном сайте, её цель — «идентифицировать все семейства РНК во всех ныне известных организмах и сделать результаты доступными широкой публике». Проще говоря, исследователи хотят узнать, какие РНК присутствуют в протеоме любого организма и где именно они расположены.

RNA World использует полностью автоматизированную версию программы Infernal (INFERence of RNA ALignment), первоначально разработанной в лаборатории Шона Эдди при Медицинском институте Говарда Хьюза. Она работает с базами данных известных последовательностей нуклеиновых кислот и предсказывает на их основе новые возможные вторичные структуры, как гомологичные отдельным уже изученным, так и на основе сопоставления нескольких последовательностей.

Молекулы РНК выполняют в человеческом организме множество функций: выступают катализаторами биохимических реакций, используются как матрица синтеза белков (иРНК или мРНК), доставляют аминокислоты к рибосомам клеток (тРНК), регулируют активность генов. Кроме того, от микроРНК в раковых клетках зависит успех иммунной противораковой реакции, а некоторые вирусы хранят в виде РНК свой генетический материал. Поэтому результаты работы RNA World могут оказаться невероятно полезными и помочь с разработкой новых лекарств. Название вычислительной системы отсылает к «гипотезе мира РНК» — теории, согласно которой на раннем этапе жизни на Земле ДНК не существовало, а хранение наследственной информации осуществляла рибонуклеиновая кислота.

Участники проекта опубликовали несколько статей в научных журналах, выступали на семинарах и воркшопах, а в 2013 году RNA World получил премию Thomas Krenn Open Source Sponsorship как лучший проект с открытым исходным кодом.

distributed.net — одна из старейших распределённых вычислительных сетей — появилась благодаря призу в 10 000 долларов. Компания RSA Laboratories объявила конкурс и пообещала награду тому, кто сможет взломать разработанный ею шифр RC5. Несколько энтузиастов сплотились в сообщество и сначала создали систему из пяти страхующих друг друга серверов (чтобы уберечься от сетевых атак конкурентов), а потом зарегистрировали домен distributed.net и некоммерческую организацию Distributed Computing. Они выиграли этот приз через 250 дней, и ещё один — в следующем соревновании, через 1757 дней вычислений. Количество участников сети быстро росло и скоро достигло десятков, а потом и сотен тысяч.

Линейка Голомба 4-го порядка. Порядком называется число делений на линейке. Соответственно, на линейке Голомба 28-го порядка должно быть 28 чисел, разность между двумя любыми из которых не равнялась бы разности между любыми другими двумя или одним из первой пары и любым другим.
Сейчас distributed.net занимается двумя проектами: взломом шифра RC5-72 и поиском оптимальной линейки Голомба 28 порядка — набора неотрицательных целых чисел, расположенных в виде делений на воображаемой линейке таким образом, что расстояние между любыми двумя делениями является уникальным. Этот набор используют в радиоастрономии, комбинаторике и теории кодирования. В 2007 году RSA Laboratories заявила о прекращении соревнований по взлому RC5-72, но команда Distributed Computing решила продолжить вычисления и назначила премию из собственных средств. Статистика этого проекта неутешительна — сервис показывает, что для проверки всего пространства ключей понадобятся десятки тысяч дней, — но добровольцы не отчаиваются.

Climateprediction.net пытается ответить на вопрос, как изменение климата влияет на мир сейчас и к чему приведёт в будущем. Для этого учёные создают множество разных, но близких к реальности моделей климата. Кроме того, они пытаются предсказать, какой в будущем будет погода и насколько вероятны экстремальные погодные явления. При поддержке Оксфордского университета и Института экологических изменений Climateprediction работает над четырьмя крупными и множеством региональных проектов.

Эксперимент Geoengineering — Solar-Radiation Management должен выяснить, как управление солнечной радиацией повлияет на климат в разных частях планеты. Управлением солнечной радиацией называют метод снижения температуры с помощью распыления специальных аэрозолей в атмосфере. Это доступное решение проблемы глобального потепления, которое можно было бы использовать уже сейчас, но пока не просчитаны последствия, идти на такой шаг слишком рискованно.
Другие два проекта изучают океаническое устройство. RAPID-RAPIT использует компьютерное моделирование, чтобы узнать, не исчезнут ли известные нам течения Атлантического океана под влиянием глобального потепления. А в ходе эксперимента RAPID-CHAAOS учёные хотят построить модели, отражающие недавние изменения климата океана.
Организаторы проекта HYDRA хотят узнать, как современное землепользование повлияло на выпадение осадков, их испарение и русла рек. Для этого они сравнивают компьютерные модели с наблюдениями последних пятидесяти лет. Исследователи предполагают, что самым важным последствием глобального потепления окажется не повышение температуры, а связанное с ним изменение круговорота воды в природе.
С момента старта в сентябре 2003 года Climateprediction.net благодаря добровольцам завершил уже 9 проектов и опубликовал множество материалов, включая статьи, лекции, отчёты и презентации. Одним из самых долгих стал эксперимент по моделированию изменений климата в XXI веке до 2080 года — BBC Climate Change. Он длился пять лет, с 2006 по 2011 гг., и по завершении BBC обнародовала результаты на сайте.

MilkyWay@Home изучает историю нашей галактики и ищет загадочную тёмную материю, для этого он картографирует и анализирует движение групп звёзд по орбите Млечного Пути.

Система распределённых вычислений проекта использует данные Слоановского цифрового небесного обзора. Этот проект исследования изображений и спектров звёзд и галактик за 14 лет с момента запуска собрал данные о почти двух миллионах объектов и спектры более чем 800 000 галактик и 100 000 квазаров. MilkyWay@Home с помощью этой информации и эволюционных алгоритмов пытается получить точное описание звёздных потоков. При помощи компьютеров энтузиастов учёным уже удалось создать модели звёздного потока в Стрельце, Потока-сироты и потока GD-1. Сейчас система продолжает изучение звёздных потоков Северного полюса галактики, а затем будет анализировать звёзды галактической короны, которые не принадлежат звёздным потокам карликовых галактик.

Латинским квадратом n-го порядка называют таблицу размера n × n, заполненную n элементами множества M так, что в каждой строке и в каждом столбце каждый элемент множества M встречается ровно один раз. На фото — окно в Кембридже с витражом в виде латинского квадрата седьмого порядка.
Сайт сети добровольных вычислений Sat@Home сообщает читателю, что цель этого проекта — «решение разнообразных трудных комбинаторных задач из областей криптографии, дискретной оптимизации и биоинформатики». «Трудная задача» здесь — не туманная характеристика, а вполне конкретное определение: речь идёт об NP-трудных задачах (ещё их называют NP-трудными проблемами). Если проблему относят к данному классу, это означает, что при увеличении размеров задачи на один пункт, время, необходимое для её решения, увеличивается сразу в несколько раз. Поэтому за разумное время решения для NP-трудных задач могут быть найдены только для сравнительно простых случаев. Увеличение размеров задачи быстро приводит к тому, что она становится неразрешимой даже с применением самых мощных вычислительных устройств.

В соответствие с правилами булевой алгебры, любое высказывание можно привести к определённому виду, который называется конъюнктивной нормальной формой (КНФ). Эту форму используют, например, для автоматизированного доказательства теорем. Организаторы SAT@Home сводят трудные задачи из разных областей к КНФ, что позволяет иногда сократить их размерность и немного сдвинуть границу между решаемыми и нерешаемыми случаями.

Основан проект был в 2011 году Институтом динамики систем и теории управления Сибирского отделения РАН в сотрудничестве с Институтом системного анализа РАН по банальной причине: не хватало вычислительных мощностей. Первая решённая Sat@Home задача — криптоанализ поточного алгоритма шифрования A5/1, который используется в GSM-связи. После этого с помощью вычислительной сети нашли 17 новых пар диагональных ортогональных латинских квадратов порядка 10. Хотя этот результат звучит не слишком впечатляюще, на самом деле латинские квадраты применяются в комбинаторике, теории кодирования и даже в планировании экспериментов. Сейчас Sat@Home анализирует шифр Bivium. Непрофессионалу может показаться, что исследователи проекта занимаются бесполезными на практике вещами, наукой ради науки. Но если проекты по поиску внеземных цивилизаций так и не дали никакого результата, но продолжают привлекать волонтёров, почему не поддержать российских учёных, разработки которых могут оказаться полезными?

Основная цель проекта Einstein@Home — зарегистрировать гравитационное излучение вращающихся нейтронных звёзд (пульсаров). Гравитационные волны — неподтверждённое экспериментально предсказание Общей теории относительности и прямое доказательство теории инфляции. Теория инфляции утверждает, что сразу после Большого Взрыва Вселенная во много раз расширилась, и при этом возникло гравитационное излучение. Его существование подтверждено косвенно, но на практике зарегистрировать гравитационные волны никому не удавалось. Такое событие наделает не меньше шума, чем открытие бозона Хиггса, и наверняка принесёт исследователям Нобелевскую премию. Вот почему разные группы учёных работают над этой проблемой, и каждая мечтает оказаться первой.

Основной проект по поиску гравитационных волн был запущен в 2005 году, в рамках «Всемирного года физики». Через несколько лет поле исследований расширилось, и Einstein@Home начал параллельно работать над новой задачей — поиском пульсаров. Сейчас в рамках основного проекта он анализирует данные мощных гравитационных детекторов LIGO и GEO600, а для обнаружения новых нейтронных звёзд использует сведения обсерватории Аресибо. И если с гравитационными волнами исследователям пока не везёт, то открытие пульсаров идёт полным ходом: волонтёрам удалось обнаружить уже 54 новых космических тела.


Автор — Юлия Коровски.

Примечание редактора

Вдохновившись сведениями, полученными в процессе подготовки этого материала, коллектив редакции портала «XX2 ВЕК» также решил поучаствовать в добровольных вычислениях. Мы установили на свои компьютеры BOINC, подключились к работе нескольких вычислительных сетей и даже создали собственную команду в сети Rosetta@home. Теперь, пока мы пишем и редактируем статьи для вас, пока занимаемся другими делами и даже пока спим, наши компьютеры рассчитывают трёхмерные структуры протеинов, ищут сигналы внеземных цивилизаций и маркеры раковых опухолей, а также открывают ранее неизвестные РНК и решают сложные криптографические задачи. Будучи последовательными сторонниками прогресса, призываем и вас, уважаемые читатели, присоединяться к волонтёрским сетям. С вашей помощью исследователи разберутся с загадками Сфинкса Природы значительно быстрее, чем без неё, — быстрее создадут новые лекарства, найдут дорогу к звёздам, поймут устройство Вселенной. Неужели не хочется поучаствовать?

Основатель портала «XX2 ВЕК» Сергей С. Марков — пользователь дня на сервере Rosetta@home 26 февраля 2015 года. Вы тоже можете оказаться на этом месте.
Юлия Коровски :