1 июня команда учёных из Гарвардского университета и специалисты компании Google выложили в открытый доступ набор данных о небольшом участке коры головного мозга человека. Набор, получивший название H01, состоит из 1,4-петабайтного трёхмерного изображения фрагмента неокортекса, выполненного с разрешением 4 нанометра и детально описанного, и сопровождается научной публикацией «Коннектомное исследование петамасштабного фрагмента коры головного мозга человека» (A connectomic study of a petascale fragment of human cerebral cortex). Набор содержит сведения о десятках тысяч нервных клеток, ста тридцати миллионах синапсов, а также о субклеточных структурах.
Ранее, в январе, Google выложил в открытый доступ выполненный в сотрудничестве с Janelia Research Campus коннектом плодовой мушки. Нынешняя работа — ещё один шаг на пути к коннектому человека. Шаг скромный (опубликованная модель отображает всего около одного кубического миллиметра мозга), но по-своему грандиозный: на текущий момент H01 — это самый большой и подробный аннотированный набор данных, описывающий образец мозговой ткани.
История датасета H01 началось с того, что в больницу в Бостоне поступила 45-летняя пациентка с эпилепсией, которой удалили часть коры головного мозга. Учёные исследовали полученный образец (исследование показало, что удалённая часть была здоровой) и с помощью [TBS_POPOVER placement=»top» title=»Микротом» content=»Инструмент для приготовления срезов биологической ткани, а также небиологических образцов для оптической микроскопии микрометровой и нанометровой толщины.» style=»border: 1px solid #ddd; padding: 3px;»]микротома[/TBS_POPOVER] разделили его на 5292 среза, толщина каждого из которых составила, в среднем, 33 нанометра. Затем исследователи с помощью электронного микроскопа отсканировали каждый срез и получили 225 млн двумерных изображений. А специалисты из Google, в свою очередь, объединили плоские изображения в 3D. Несмотря на то, что в целом качество изображений было превосходным, для преобразования их в трёхмерную модель необходимо было преодолеть некоторые проблемы: артефакты визуализации, утерянные срезы, изменение параметров микроскопа, физическое растяжение и сжатие ткани при изготовлении срезов и сканировании. Для этого в Google использовали закрашивающие нейронные сети (flood-filling network, FFNs), запущенные на тысячах TPU платформы Google Cloud.
С получившейся в результате трёхмерной моделью можно ознакомиться по ссылке с помощью обычного браузера.
Вероятно, набор данных H01, как и опубликованные ранее работы по мозгу дрозофилы, послужит материалом для исследований по широкому кругу тем и направлений, от нейрофизиологии до искусственного интеллекта. А создатели этого набора данных уже нацелены на описание более крупных фрагментов мозга. Правда, на этом пути есть некоторые препятствия, в частности — предполагаемый размер данных: если данные по одному кубическому миллиметру коры занимают почти полтора петабайта, то сколько займёт описание клеток и межклеточных связей всего мозга? Мозг мыши, говорится в блоге Google AI, способен генерировать данные объёмом в эксабайт — такие объёмы дорого хранить, ими сложно оперировать, и эти проблемы ещё потребуют решения.