Нейроны в чашке заиграли в понг

Нейроны человека и нейроны мыши в пробирке (а точнее в чашке) научились играть в видеоигру Pong. Об этом учёные сообщили в журнале Neuron. Игра — простейшая двумерная имитация пинг-понга: условный мячик-кружок надо отбивать полоской-ракеткой. Её уже давно используют для машинного обучения и работы с нейроинтерфейсами. Эксперимент свидетельствует о том, что даже выращенные в чашке клетки мозга могут действовать скоординированно, реализуя присущую им способность производить адаптивные вычисления в стремлении минимизировать непредсказуемость среды.

«Вопрос заключался в том, можем ли мы взаимодействовать с нейронами таким образом, чтобы использовать их врождённый интеллект?» — пояснил Бретт Каган (Brett Kagan), главный научный сотрудник Cortical Labs в Мельбурне (Австралия).

Для начала исследователи вырастили в питательных средах поверх электродной сетки культуры кортикальных нейронов мыши и человека. Затем подключили их к содержащей игру Pong системе таким образом, чтобы нейроны могли как управлять ракеткой в игре, так и получать при помощи сигнала с электродов обратную связь, сообщающую, бьёт ли их ракетка по мячу. Учёные отслеживали активность нейронов и их реакцию на обратную связь.

Опыт показал, что нейроны могут целенаправленно менять активность в зависимости от условий среды в режиме реального времени. Им также хватило пяти минут обучения, привыкания к ситуации, чтобы начать целенаправленно передвигать ракетку в игре и отбивать мяч.


 

«Мы выбрали Pong из-за её простоты и привычности, а также потому, что это была одна из первых игр, использованных в машинном обучении, — рассказывает Каган. — К клеткам применялся неожиданный стимул, и система в целом реорганизовывала свою деятельность, чтобы лучше играть в игру и свести к минимуму случайность».

Теория, стоящая за этим экспериментом, строится вокруг тезиса, согласно которому мозг адаптируется к окружающей среде, меняя либо своё восприятие, либо свои действия таким образом, чтобы лучше соответствовать окружающему миру. Поскольку в построенной экспериментальной системе не было внешнего для нейронов механизма вознаграждения, считают авторы, выходит, что структура клеток обучалась не реагируя на, допустим, дофамин, а исключительно ради адаптации, т.е. ради исключения из своего взаимодействия со средой элемента случайности. По утверждению авторов работы, им удалось представить первое в мире силико-биологическое устройство, демонстрирующее адаптивное поведение в режиме реального времени.

Получившаяся система не привязана исключительно к игре Pong и может адаптироваться для других задач.

«Вы знаете, когда происходит сбой браузера Google Chrome, появляется этот динозавр, который может прыгать через препятствия, — рассказывает Бретт Каган. — Мы попробовали это и получили неплохие предварительные результаты, но нам предстоит ещё много работы».

Если в систему вносить незначительные изменения — выбирать разные типы нервных клеток, добавлять разные лекарства, менять условия обратной связи, — с её помощью можно будет получать данные о том, как клетки обрабатывают информацию, как на их адаптивное поведение влияют различные вещества. У системы есть потенциал в моделировании болезней, испытаниях лекарств и расширении текущего понимания того, как работает мозг и как возникает интеллект.

Лидия Сорокина :