Нобелевская премия по химии-2024: структура белка — предсказание и проектирование

+7 926 604 54 63 address
 Аминокислоты и строение белка.
Аминокислоты и строение белка.

В среду 9 октября Нобелевский комитет объявил лауреатов премии этого года по химии. Половину премии получил Дэвид Бейкер (David Baker) из университета Вашингтона «за вычислительное проектирование белков»; вторую половину разделили Демис Хассабис (Demis Hassabis) и Джон Джампер (John M. Jumper) из компании Google DeepMind «за предсказание структуры белка».

Nobel prize chemistry 2024 patch
Логотип премии 2024 года.

Нобелевская премия по химии в 2024 году отмечает исследования структуры белков. Она посвящена двум различным, но связанным между собой открытиям. Дэвид Бейкер смог решить сложнейшую задачу построения новых видов белков. Д.Хассабис и Дж. Джампер разработали модель искусственного интеллекта для решения задачи, над которой химики и биологи работали пятьдесят лет: предсказание сложной структуры белков.

Белки состоят из 20 различных аминокислот — «строительных блоков» жизни. В 2003 году Дэвид Бейкер смог при помощи этих блоков создать новый белок, непохожий на известные к тому времени. С тех пор исследователи создали множество таких новых белков включая вещества, которые можно использовать в фармацевтике, производстве наноматериалов и, например, в качестве микродатчиков.

Сфера проектирования белков («белковый дизайн») начала интенсивно развиваться с конца 1990-х. Чаще всего исследователи занимались модификацией существующих белков. Группа Бейкера пыталась создавать белки «с нуля» (такое направление проектирования называется de novo design, или проектирование из первопринципов). В частности, для определения, какой набор аминокислот может создать белок с заданными свойствами и структурой, использовался программный комплекс Rosetta, разработкой которого занимался Д.Бейкер.

Top7 first constructed protein
Top7 — первый искусственный белок, непохожий на известные в природе.
Для поиска нужного набора Rosetta просматривала базу данных всех известных белковых структур и находила короткие фрагменты белков, свойства которых напоминали желаемую структуру нового белка. Затем программа оптимизировала такие фрагменты и предлагала последовательность аминокислот для конструирования нужного белка.

Один из первых удачных полученных таким образом белков под названием Top7 имел практически такую структуру, которую и пытались спроектировать. То есть оказалось, что Rosetta действительно умеет проектировать новые белки. До этого химикам, которые занимались тем самым дизайном ab novo, удавалось только имитировать существующие структуры. Структуры Top7 в природе не существовало. Кроме того, новый белок содержал цепочку из 93 аминокислот и стал самой большой молекулой, полученной по технологии белкового проектирования. Бейкер опубликовал своё открытие в 2003 году. Оно стало первым шагом в этом направлении. На рисунке представлены только несколько из новых белков, которые его лаборатория впоследствии создала из первопринципов.

Proteins ceated by Rosetta software
Белки, созданные при помощи ПО Rosetta Бейкера.

Второе открытие относится к предсказанию структуры белков. Два десятка известных аминокислот могут сочетаться в молекуле белка разными способами, создавая большое число комбинаций. Используя информацию в ДНК, аминокислоты соединяются вместе, создавая длинные цепочки. Далее, цепочка аминокислот может сворачиваться и переплетаться, формируя уникальную трёхмерную структуру. Именно эта структура определяет функцию белка. С начала 1960-х годов химики поняли, что эта трёхмерная структура должна определяться последовательностью аминокислот в белке: так, в экспериментах тех лет такую трёхмерную ленту белка удавалось «распутать», и после этого белок снова принимал ту же форму. С 1970 годов биологи и химики пытались научиться предсказывать структуры белков исходя из последовательностей аминокислот, которые входят в их состав, и эта задача оказалась невероятно сложной. Четыре года назад удалось сделать существенный рывок в её решении.

В 2020 году Демис Хассабис и Джон Джампер представили модель ИИ под названием AlphaFold2. С её помощью они смогли предсказать структуру практически всех 200 миллионов белков, которые на этот момент были известны биологам.

Protein structure deternimed by AlphaFold2 AI model
Белковые структуры, которые удалось определить при помощи ИИ-модели AlphaFold2.
.
Комментарии