Среди наших читателей наверняка нашлось бы много желающих поддержать важные исследования, если бы они знали, что иногда для этого нужен только компьютер и подключение к интернету. Рассказываем, как помочь науке бездействием.
В 2014 году в Оксфордский словарь, наконец, внесли термин «гражданская наука» (citizen science), так называют привлечение любителей к научным исследованиям. Явление зародилось ещё тогда, когда «профессиональных» учёных не существовало, но особенно популярным этот метод стал после появления интернета: исследователи просят добровольцев помочь со сбором и обработкой данных, а самую сложную часть работы берут на себя. Обычно от волонтёров ждут активных действий: нужно наблюдать за птицами или растениями, отмечать на фотографиях астероиды или распознавать изображения. Но иногда всё, чего не хватает учёным, — мощные компьютеры. И тогда на помощь приходят тысячи добровольцев с домашними ПК, ноутбуками и смартфонами. Они устанавливают специальные программы, и их компьютеры в моменты простоя принимаются решать важные научные задачи. Такие распределённые вычисления называются добровольными (volunteer computing).
Большинство проектов распределённых вычислений работают на платформе BOINC, разработанной университетом Беркли. Когда-то она была создана для собственной успешной программы университета — SETI@home — но позже разработчики сделали её доступной для всех. Добровольные вычисления оказались очень удачным инструментом — некоторым сетям удавалось по мощности приблизиться к суперкомпьютерам. Желающих применить этот инструмент для решения тех или иных задач нашлось очень много. Сейчас на просторах сети можно обнаружить больше сотни таких проектов, и в этой статье мы расскажем о самых интересных из них. Если вы захотите помочь науке — достаточно загрузить программу-клиент и зарегистрироваться, остальное компьютер сделает сам.
Rosetta@Home изучает строение белков. Белки (протеины) — одна из трёх основных макромолекул в клетках живых существ, в нашем организме они составляют основу мышечной массы, переносят кислород, участвуют в обмене веществ, нейтрализуют вирусы и так далее. Знание их природы позволит проектировать новые протеины и создавать лекарства от рака, малярии и других болезней, которые пока не удалось победить.
Каждый белок уникален, и, чтобы воссоздать его строение, нужно знать не только то, какие аминокислоты его составляют, но и как они располагаются в пространстве, какова их третичная структура. Экспериментальные способы определить эту структуру уже существуют — рентгеноструктурный анализ и ядерный магнитный резонанс, — но они весьма дороги и требуют много времени. Создатели проекта добровольных вычислений Rosetta@Home поставили перед собой цель — добиться той же точности при меньших затратах времени и денег.
Сотрудники лаборатории Дэвида Бэйкера при Вашингтонском университете (исследовательское учреждение, курирующее проект) и их коллеги с помощью вычислительной сети сделали множество полезных вещей.
- Разработали вакцину от респираторного синцитиального вируса человека
РСВ — вирус, вызывающий примерно 7% смертей младенцев в возрасте от месяца до года. Он очень быстро мутирует, поэтому создать вакцину раньше не удавалось. Учёные знали, какие антитела нужны для борьбы с вирусом и каков эпитоп вируса (та уникальная часть, на которую реагируют антитела). Основной задачей было разработать белковый каркас для эпитопа вакцины, чтобы она убедительно притворялась вирусом и могла вызывать настоящую иммунную реакцию. С помощью компьютерного моделирования в добровольческой сети удалось воспроизвести третичную структуру белкового каркаса и создать вакцину. Поскольку в новой молекуле использован один эпитоп (в настоящем вирусе их несколько), детскому организму будет проще справиться с вакциной, и она не ухудшит его состояние. Лекарство успешно протестировали на мышах и макаках и теперь опробуют на людях.
- Создали металлопротеин (белок, содержащий ионы металлов) MB_07, который может служить реагентом для удаления радиоактивных и токсичных отходов из сточных вод.
- Синтезировали белок BINDI, который вызывает саморазрушение раковых клеток, инфицированных вирусом Эпштейна — Барр (вирусом герпеса человека 4-го типа).
Особенность вируса Эпштейна — Барр в том, что он не уничтожает клетки, а, наоборот, приводит к разрастанию тканей. Это может послужить причиной возникновения раковых опухолей (лимфомы Бёркитта и лимфомы Ходжкина). Белок BINDI, вызывающий саморазрушение раковых клеток, инфицированных этих вирусом, был разработан и синтезирован исследователями из Institute for Protein Design (Вашингтонский университет, Сиэтл, США), и это также было сделано при существенной помощи добровольцев, на домашних компьютерах которых велись расчёты по программе Rosetta@Home. Эксперименты с этим белком на мышах оказались успешными: введённый в ткань лимфомы протеин BINDI сдерживал рост опухоли и позволял животным жить дольше.
Практическая польза исследований и внимательное отношение к сообществу (волонтёров всегда держат в курсе последних новостей) привлекают многих, и число активных участников Rosetta@Home сейчас составляет более 690 000 человек. Эти добровольцы сумели задействовать в проекте более полутора миллионов компьютеров.
Great Internet Mersenne Prime Search (GIMPS) — созданный в 1996 году программистом Джорджем Уолтманом проект по поиску чисел Мерсенна с помощью сети распределённых вычислений.
Простые числа Мерсенна являются простыми числами специального вида Mp = 2p − 1, где р — другое простое число.
GIMPS не только первая в истории, но и чрезвычайно успешная попытка использовать компьютеры добровольцев для решения общей задачи: участниками сети найдено 14 из 48 известных на сегодняшний день простых чисел Мерсенна. Последнее из них было открыто в 2013 году и оказалось самым большим простым числом — чтобы записать его, нужно 17 миллионов знаков. Некоммерческая правозащитная организация Electronic Frontier Foundation («Фонд Электронных Рубежей») дважды награждала участников проекта: в 2000 и 2009 годах за открытие простых чисел, длина которых превышает миллион и десять миллионов знаков соответственно. Денежные выплаты от EEF в 100 000 долларов GIMPS разделил на небольшие премии для поощрения будущих открытий.
LHC@Home — платформа распределённых вычислений, созданная учёными ЦЕРН для помощи в разработке и эксплуатации Большого адронного коллайдера. В рамках LHC@Home действуют несколько проектов с разными целями.
SETI@Home — проект Лаборатории космических наук Калифорнийского университета. Его цель — поиск сигналов внеземных цивилизаций. Для сбора нужной информации используют радиотелескоп в обсерватории Аресибо в Пуэрто-Рико, откуда носители данных почтой высылают в Беркли. Там данные делят на маленькие кусочки, по 0,25 Мбайт каждый, и отправляют для анализа на компьютеры участников проекта.
Специальное ПО отсеивает радиосигналы земного происхождения — слишком сильные или широкополосные — и оставляет слабые «позывные», которые затихают и усиливаются в течение 12 секунд (именно столько времени нужно объекту, чтобы попасть в поле зрения неподвижного телескопа и пройти его насквозь). Если сигналы соответствуют всем требованиям, их проверяет команда SETI@Home (99% оказываются радиопомехами) и в случае успеха объявляет «многообещающими кандидатами», то есть приговаривает к дальнейшему изучению.
SETI@Home — один из первых проектов добровольных распределённых вычислений, и, хотя за 15 лет энтузиасты не обнаружили сообщений от инопланетян, а лишь назвали несколько «кандидатов» на эту роль, он до сих пор очень популярен. Сейчас анализировать данные телескопа помогают более 120 000 активных пользователей, а вычислительная мощность сети — 688 395 терафлопc. Это, конечно, меньше, чем у китайского суперкомпьютера Тяньхэ-2 (в пятьдесят раз), но вполне сопоставимо с компьютером Эдинбургского университета.
Распределённая вычислительная система RNA World предназначена для выявления, анализа и дизайна РНК. Согласно описанию на официальном сайте, её цель — «идентифицировать все семейства РНК во всех ныне известных организмах и сделать результаты доступными широкой публике». Проще говоря, исследователи хотят узнать, какие РНК присутствуют в протеоме любого организма и где именно они расположены.
RNA World использует полностью автоматизированную версию программы Infernal (INFERence of RNA ALignment), первоначально разработанной в лаборатории Шона Эдди при Медицинском институте Говарда Хьюза. Она работает с базами данных известных последовательностей нуклеиновых кислот и предсказывает на их основе новые возможные вторичные структуры, как гомологичные отдельным уже изученным, так и на основе сопоставления нескольких последовательностей.
Молекулы РНК выполняют в человеческом организме множество функций: выступают катализаторами биохимических реакций, используются как матрица синтеза белков (иРНК или мРНК), доставляют аминокислоты к рибосомам клеток (тРНК), регулируют активность генов. Кроме того, от микроРНК в раковых клетках зависит успех иммунной противораковой реакции, а некоторые вирусы хранят в виде РНК свой генетический материал. Поэтому результаты работы RNA World могут оказаться невероятно полезными и помочь с разработкой новых лекарств. Название вычислительной системы отсылает к «гипотезе мира РНК» — теории, согласно которой на раннем этапе жизни на Земле ДНК не существовало, а хранение наследственной информации осуществляла рибонуклеиновая кислота.
Участники проекта опубликовали несколько статей в научных журналах, выступали на семинарах и воркшопах, а в 2013 году RNA World получил премию Thomas Krenn Open Source Sponsorship как лучший проект с открытым исходным кодом.
distributed.net — одна из старейших распределённых вычислительных сетей — появилась благодаря призу в 10 000 долларов. Компания RSA Laboratories объявила конкурс и пообещала награду тому, кто сможет взломать разработанный ею шифр RC5. Несколько энтузиастов сплотились в сообщество и сначала создали систему из пяти страхующих друг друга серверов (чтобы уберечься от сетевых атак конкурентов), а потом зарегистрировали домен distributed.net и некоммерческую организацию Distributed Computing. Они выиграли этот приз через 250 дней, и ещё один — в следующем соревновании, через 1757 дней вычислений. Количество участников сети быстро росло и скоро достигло десятков, а потом и сотен тысяч.
Сейчас distributed.net занимается двумя проектами: взломом шифра RC5-72 и поиском оптимальной линейки Голомба 28 порядка — набора неотрицательных целых чисел, расположенных в виде делений на воображаемой линейке таким образом, что расстояние между любыми двумя делениями является уникальным. Этот набор используют в радиоастрономии, комбинаторике и теории кодирования. В 2007 году RSA Laboratories заявила о прекращении соревнований по взлому RC5-72, но команда Distributed Computing решила продолжить вычисления и назначила премию из собственных средств. Статистика этого проекта неутешительна — сервис показывает, что для проверки всего пространства ключей понадобятся десятки тысяч дней, — но добровольцы не отчаиваются.
Climateprediction.net пытается ответить на вопрос, как изменение климата влияет на мир сейчас и к чему приведёт в будущем. Для этого учёные создают множество разных, но близких к реальности моделей климата. Кроме того, они пытаются предсказать, какой в будущем будет погода и насколько вероятны экстремальные погодные явления. При поддержке Оксфордского университета и Института экологических изменений Climateprediction работает над четырьмя крупными и множеством региональных проектов.
MilkyWay@Home изучает историю нашей галактики и ищет загадочную тёмную материю, для этого он картографирует и анализирует движение групп звёзд по орбите Млечного Пути.
Система распределённых вычислений проекта использует данные Слоановского цифрового небесного обзора. Этот проект исследования изображений и спектров звёзд и галактик за 14 лет с момента запуска собрал данные о почти двух миллионах объектов и спектры более чем 800 000 галактик и 100 000 квазаров. MilkyWay@Home с помощью этой информации и эволюционных алгоритмов пытается получить точное описание звёздных потоков. При помощи компьютеров энтузиастов учёным уже удалось создать модели звёздного потока в Стрельце, Потока-сироты и потока GD-1. Сейчас система продолжает изучение звёздных потоков Северного полюса галактики, а затем будет анализировать звёзды галактической короны, которые не принадлежат звёздным потокам карликовых галактик.
Сайт сети добровольных вычислений Sat@Home сообщает читателю, что цель этого проекта — «решение разнообразных трудных комбинаторных задач из областей криптографии, дискретной оптимизации и биоинформатики». «Трудная задача» здесь — не туманная характеристика, а вполне конкретное определение: речь идёт об NP-трудных задачах (ещё их называют NP-трудными проблемами). Если проблему относят к данному классу, это означает, что при увеличении размеров задачи на один пункт, время, необходимое для её решения, увеличивается сразу в несколько раз. Поэтому за разумное время решения для NP-трудных задач могут быть найдены только для сравнительно простых случаев. Увеличение размеров задачи быстро приводит к тому, что она становится неразрешимой даже с применением самых мощных вычислительных устройств.
В соответствие с правилами булевой алгебры, любое высказывание можно привести к определённому виду, который называется конъюнктивной нормальной формой (КНФ). Эту форму используют, например, для автоматизированного доказательства теорем. Организаторы SAT@Home сводят трудные задачи из разных областей к КНФ, что позволяет иногда сократить их размерность и немного сдвинуть границу между решаемыми и нерешаемыми случаями.
Основан проект был в 2011 году Институтом динамики систем и теории управления Сибирского отделения РАН в сотрудничестве с Институтом системного анализа РАН по банальной причине: не хватало вычислительных мощностей. Первая решённая Sat@Home задача — криптоанализ поточного алгоритма шифрования A5/1, который используется в GSM-связи. После этого с помощью вычислительной сети нашли 17 новых пар диагональных ортогональных латинских квадратов порядка 10. Хотя этот результат звучит не слишком впечатляюще, на самом деле латинские квадраты применяются в комбинаторике, теории кодирования и даже в планировании экспериментов. Сейчас Sat@Home анализирует шифр Bivium. Непрофессионалу может показаться, что исследователи проекта занимаются бесполезными на практике вещами, наукой ради науки. Но если проекты по поиску внеземных цивилизаций так и не дали никакого результата, но продолжают привлекать волонтёров, почему не поддержать российских учёных, разработки которых могут оказаться полезными?
Основная цель проекта Einstein@Home — зарегистрировать гравитационное излучение вращающихся нейтронных звёзд (пульсаров). Гравитационные волны — неподтверждённое экспериментально предсказание Общей теории относительности и прямое доказательство теории инфляции. Теория инфляции утверждает, что сразу после Большого Взрыва Вселенная во много раз расширилась, и при этом возникло гравитационное излучение. Его существование подтверждено косвенно, но на практике зарегистрировать гравитационные волны никому не удавалось. Такое событие наделает не меньше шума, чем открытие бозона Хиггса, и наверняка принесёт исследователям Нобелевскую премию. Вот почему разные группы учёных работают над этой проблемой, и каждая мечтает оказаться первой.
Основной проект по поиску гравитационных волн был запущен в 2005 году, в рамках «Всемирного года физики». Через несколько лет поле исследований расширилось, и Einstein@Home начал параллельно работать над новой задачей — поиском пульсаров. Сейчас в рамках основного проекта он анализирует данные мощных гравитационных детекторов LIGO и GEO600, а для обнаружения новых нейтронных звёзд использует сведения обсерватории Аресибо. И если с гравитационными волнами исследователям пока не везёт, то открытие пульсаров идёт полным ходом: волонтёрам удалось обнаружить уже 54 новых космических тела.
Примечание редактора
Вдохновившись сведениями, полученными в процессе подготовки этого материала, коллектив редакции портала «XX2 ВЕК» также решил поучаствовать в добровольных вычислениях. Мы установили на свои компьютеры BOINC, подключились к работе нескольких вычислительных сетей и даже создали собственную команду в сети Rosetta@home. Теперь, пока мы пишем и редактируем статьи для вас, пока занимаемся другими делами и даже пока спим, наши компьютеры рассчитывают трёхмерные структуры протеинов, ищут сигналы внеземных цивилизаций и маркеры раковых опухолей, а также открывают ранее неизвестные РНК и решают сложные криптографические задачи. Будучи последовательными сторонниками прогресса, призываем и вас, уважаемые читатели, присоединяться к волонтёрским сетям. С вашей помощью исследователи разберутся с загадками Сфинкса Природы значительно быстрее, чем без неё, — быстрее создадут новые лекарства, найдут дорогу к звёздам, поймут устройство Вселенной. Неужели не хочется поучаствовать?