Строку «Hello, world!» записали в ДНК живой бактерии

+7 926 604 54 63 address
 Прямое кодирование цифровой информации в ДНК клеток. <a href=https://www.nature.com/articles/s41589-020-00711-4>S.Yim, <i>Nat Chem Biol</i> (2021)</a>.
Прямое кодирование цифровой информации в ДНК клеток. S.Yim, Nat Chem Biol (2021).

Исследователи из Колумбийского университета использовали технологию редактирования генома CRISPR для кодирования и сохранения двоичной информации в ДНК живых бактерий. Они смогли «записать» в культуре кишечной палочки короткую фразу и надёжно считать её после смены нескольких десятков поколений микробов.

Идея сохранения информации в ДНК выглядит привлекательной, и она не нова. Компактность такого «носителя» позволяет хранить огромные массивы данных. Так, носитель генетического материала для хранения десяти полнометражных фильмов теоретически может иметь размер кристаллика соли.

Информация в виде последовательности нулей и единиц в двоичной записи конвертируется в комбинацию четырёх основ, которые составляют генетический код: аденина, гуанина, цитозина, тимина. После этого из них можно синтезировать соответствующую ДНК. Однако пока это слишком дорогостоящая процедура, чтобы говорить о её реальном применении. Кроме того, ДНК со временем разрушается вместе с закодированной информацией. Исследователи Колумбийского университета сделали следующий шаг в этом направлении: они решили кодировать данные непосредственно в живом организме. Новое исследование, совершенствующее уже ведущиеся разработки по кодированию информации в живых культурах, опубликовано в январе 2021 года в Nature Chemical Biology.

В качестве носителя информации использовали одноклеточный микроорганизм — кишечную палочку Escherichia coli. Закодированные в её ДНК данные должны сохраняться намного дольше, чем собственно отдельные молекулы: при размножении необходимая информация будет передаваться следующим поколениям. Кроме того, эти бактерии живучи и легко адаптируются к изменениям среды, соответственно молекула ДНК как носитель информации получает дополнительную защиту в виде бактериальной клетки со всеми её естественными механизмами.

Electrochemical redox controller for DNA coding
Электрохимический контроллер — батарея из 24 окислительно-восстановительных ячеек для записи информации в ДНК клеточной культуры. S.Yim, Nat Chem Biol (2021).

На предыдущем этапе исследований при помощи метода геномного редактирования CRISPR клетку обучали реагировать на определённый биологический сигнал, в частности, в 2017 году в экспериментах в том же Колумбийском университете это было присутствие фруктозы. Добавление фруктозы в культуру E. coli вызывало рост экспрессии определённых генов плазмиды бактерий. Собственный защитный механизм CRISPR-бактерии затем разрезает плазмиду с излишней экспрессией и встраивает её часть в участок бактериальной ДНК, предназначенный для «запоминания» вирусных возбудителей. Вставленный генетический отрезок соответствует цифровой единице. Если фруктозного сигнала нет, бактерии сохраняют случайный отрезок ДНК, который соответствует цифровому нулю. Эта система позволяла записывать очень небольшое число бит. Затем систему распознавания фруктозы заменили на систему, реагирующую на электрический импульс. Это дало возможность существенно увеличить объём данных для хранения. Суть нового исследования, опубликованного в Nature, в разработке такого многоканального электрохимического контроллера. Каждый из его 24 элементов в виде двухкамерных окислительно-восстановительных устройств (редокс-камер с органическими соединениями, меняющими состояние в зависимости от наличия электрического потенциала на их электроде) позволяет закодировать 3 бита информации в клеточной культуре, транслируя в свою ячейку с бактериальной культурой соответственно электрический импульс или его отсутствие.

6-bit coding scheme
Одна из схем кодирования алфавита двумя битовыми тройками с битом контрольной суммы.

Таким образом удалось создать устройство в виде батареи редокс-камер, кодирующее 24 × 3 = 72 бита информации, которыми записали строку «Hello, World!» (с учётом битов коррекции ошибок, как и в обычных устройствах памяти). После этого бактерии были помещены в почву. Через некоторое время, когда бактерии размножились, исходное сообщение всё ещё удавалось считать из ДНК в следующих поколениях микробов. Для считывания последовательности нулей и единиц из ДНК можно использовать стандартную технологию секвенирования. Всего в эксперименте «закодированные» бактерии находились в почве 16 дней, за которые сменилось около сотни поколений. С течением времени, однако, вероятность правильного считывания сообщения предсказуемо ухудшается из-за мутаций и разной адаптации штаммов с разными «буквами».

Технологии хранения данных в ДНК ещё далеко до промышленного применения. Кроме того, пока неизвестно, как долго хранится занесённая в клетку таким образом информация: при размножении бактерий неизбежны мутации, которые будут искажать записанные данные.

.
Комментарии