Беспроводной нейроинтерфейс для управления синтезатором речи

+7 926 604 54 63 address
мозговой имплантант
Когда Эдвард Чанг и его коллеги сравнили звуки речи с сигналами мозга, они обнаружили, что одинаковые акустические характеристики вызывают одинаковый нейронный ответ в зоне Вернике, одной из речевых зон мозга. Например, среди согласных есть так называемые взрывные, которые характеризуются одинаковой манерой произношения и обладают рядом общих звуковых черт. Вот именно такие общие характеристики, объединяющие согласные — взрывные, фрикативные или сонорные, — и регистрировали нейроны зоны Вернике. Благодаря этому умению мозга различать систематические признаки звуков речи мы можем узнать звук «б» независимо от особенностей дикции говорящего.

Появившаяся недавно возможность регистрации нейронной активности участков головного мозга дала ученым надежду на создание в будущем имплантантов, которые дадут парализованным людям возможность использовать различные управляемые «силой мысли» протезы, включая синтезатор речи. Первые успехи в этой области уже достигнуты: проведены эксперименты, в ходе которых парализованные люди управляли роботизированными конечностями. Технология оказалось жизнеспособной и работает благодаря тому, что ученые с достаточной точностью способны обнаруживать возбуждение нейронов в двигательной области коры головного мозга и сопоставлять их с определенными движениями рук или ног.

Задача создания устройства, которое будет детектировать мозговую деятельность, связанную с человеческим разговором, все еще не решена. Над ней работают многие научные учреждения. О предварительных результатах своей работы над построением беспроводного нейрокомпьютерного интерфейса, который может переводить сигналы мозга непосредственно в слышимую речь с помощью голосового синтезатора сообщил нейрохирург из Калифорнийского университета Эдвард Чанг.

Чанг проводит операции на головном мозге людей, страдающих эпилепсией. Пластина с электродами помещается под череп пациентов для записи электрической активности поверхности мозга. Пациенты носят такое устройство, известное как «electrocorticography array», в течение нескольких дней, для того, чтобы врачи могли найти причину и источник эпилептического припадка.

Кроме основной задачи лечения эпилепсии, Чанг имеет возможность изучать активность головного мозга своих пациентов в различных ситуациях. В статье, опубликованной в журнале «Nature» в прошлом году, он и его коллеги описали эксперимент, в ходе которого они использовали матрицу электродов для построения модели электрической активности в области мозга, называемой вентральной сенсомоторной корой, в то время, когда пациенты произносили простые слова, похожие на просто звуки, на подобии «bah» («чушь»), «goo» («слизь») и др.

Идея заключается в том, чтобы записать электрическую активность в двигательной области коры головного мозга, которая приводит в движение губы, язык и голосовые связки, когда человек разговаривает. Математические расчеты позволили команде Чанга утверждать, что из этих данных они могут выделить «много ключевых фонетических особенностей».

Одно из самых страшных последствий заболевания, известного как боковой (латеральный) амиотрофический склероз (БАС) — паралич, при котором человек не только теряет возможность к передвижению, но и к речи. Некоторые пациенты используют устройства, которые позволяют использовать остаточную способность к общению. В случае Стивена Хокинга, это программное обеспечение, которое позволяет очень медленно по слогам произносить слова, сокращая мышцы щеки. Другие пациенты используют устройства отслеживания движения глаза («ай-трекеры»), чтобы управлять компьютерной мышью.

Другое исследование в этом же направлении провел Марк Слуцкий из Северо-Западного университета — он сделал попытку расшифровать сигналы в двигательной области коры головного мозга, в то время, когда пациенты читают вслух слова, содержащие все 39 фонем английского языка (согласных и гласных звуков, которые составляют речь). Команда определила фонемы со средней точностью в 36 процентов. В исследовании были использованы те же типы поверхностных электродов, которые использует Чанг.

Слуцкий говорит, что хотя такая точность может показаться очень низкой, следует принять во внимание, что она была достигнута с относительно небольшой выборкой слов, сказанных в ограниченное количество времени. «Мы ожидаем достижения гораздо лучших результатов декодирования в будущем», — говорит он.

.
Комментарии