Новые модели глубокого обучения: меньше нейронов, высокая эффективность, интерпретируемость

Системы искусственного интеллекта (ИИ) давно стали частью повседневности и применяются в самых разных сферах, от поисковиков и автопереводчиков до беспилотных автомобилей. Это во многом связано со значительно возросшей в последние годы вычислительной мощностью компьютеров, позволяющей продуктивно эксплуатировать ресурсоёмкие технологии машинного обучения. Однако новые результаты исследований в области ИИ показывают, что и чрезвычайно простые маленькие нейронные сети могут решать определённые задачи с очень высокой степенью надёжности и эффективности.

Международная исследовательская группа из Венского технического университета (TU Wien), Австрийского института науки и техники (IST Austria) и Массачусетского технологического института (MIT) разработала новую модель искусственной нейросети, смоделированную по подобию нервной системы крошечных животных — нематод. Авторы разработки утверждают, что эта система обладает решающими преимуществами по сравнению с предыдущими моделями глубокого обучения, в частности — хорошо справляется с зашумлённостью входящих данных. При этом она гораздо проще устроена — настолько, что процесс её работы не надо рассматривать как некий «чёрный ящик», а можно подробно объяснить. Описание новой модели глубокого обучения опубликовано в журнале Nature Machine Intelligence, а код размещён на GitHub.

Подобно живому мозгу, искусственные нейронные сети состоят из множества отдельных нейронов. Когда нейрон активен, он посылает сигнал другим нейронам. Все сигналы, получаемые следующим нейроном, объединяются, чтобы решить, станет ли этот нейрон также активным. То, как один нейрон влияет на активность следующего, определяет поведение системы — эти параметры корректируются в автоматическом процессе обучения до тех пор, пока нейронная сеть не сможет решить конкретную задачу.

«В течение многих лет мы наблюдали, чему можем научиться у природы, чтобы улучшить глубокое обучение, — говорит профессор Раду Гросу (Radu Grosu), руководитель исследовательской группы «Киберфизические системы» в Венском техническом университете. — Нематода Caenorhabditis elegans, например, обладает удивительно малым количеством нейронов и, тем не менее, показывает интересные поведенческие закономерности. Нервная система нематоды эффективно и гармонично обрабатывает информацию».

Для проверки новых идей команда выбрала тестовое задание. Нейронная сеть должна была управлять автомобилями так, чтобы они оставались на полосе движения. В качестве входного сигнала сеть получает изображение дороги с камеры и автоматически решает, двигаться ли ей вправо или влево.

«Современные модели глубокого обучения с многомиллионными параметрами часто используются для изучения подобных задач, — говорит Матиас Лехнер (Mathias Lechner), выпускник Венского технического университета и аспирант Австрийского института науки и техники. — Наши системы имеют только 75 000 обучаемых параметров».

Входные данные камеры сначала обрабатываются одной частью системы, так называемой свёрточной нейронной сетью, которая воспринимает только визуальные данные для извлечения структурных особенностей из входящих пикселей. Она решает, какие части изображения интересны и важны, а затем передаёт сигналы «системе управления». Та, в свою очередь, управляет транспортным средством.

Обе подсистемы обучаются одновременно и обмениваются информацией. Исследователи собрали много часов видео вождения и загружают их в сеть вместе с информацией о том, как управлять автомобилем в любой конкретной ситуации — до тех пор, пока система не научится автоматически соединять изображения с соответствующим направлением руля и не сможет самостоятельно справляться с новыми проблемами.

Система управления, которая называется нейронной цепью (neural circuit policy или NCP), состоит всего из 19 нейронов. Матиас Лехнер объясняет, что эта NCP до трёх порядков меньше, чем было бы возможно с более ранними современными моделями.

Благодаря небольшим размерам и простоте, утверждают исследователи, эта новая нейронная сеть лучше интерпретирует данные, чем её предшественники побольше. Она фокусируется на специфических частях изображения камеры и точнее различает то, что видит. Также учёные могут понять функции и поведение отдельных клеток. Такая степень интерпретируемости недосягаема для более крупных моделей глубокого обучения. Большинство предыдущих моделей — это так называемые «чёрные ящики», гораздо менее прозрачные для изучения.

Исследователи надеются, что в будущем смогут сократить время обучения моделей ИИ нового типа и станут внедрять их в относительно простые системы, от автоподъёмников на складах до механизмов передвижения у роботов.

XX2 век :