В Microsoft научили программу-переводчик переводить не хуже профессионалов

Компания Microsoft объявила, что научила свой переводчик переводить тексты с китайского на английский на уровне не хуже подготовленного человека. Разработчикам удалось добиться того, чтобы переводные фразы звучали естественно. Для создания системы использовались нейронные сети и глубокое обучение.

Работа продолжительностью в несколько десятков лет наконец завершилась успехом. Специалисты Microsoft заявили, что получили естественно звучащие фразы от программы-переводчика. Пока речь идёт только о китайском и английском языках. По словам разработчиков, им удалось достичь уровня профессионального переводчика.

В совершенствовании искусственного интеллекта принимали участие специалисты из США и Китая. Для оценки результата компания пригласила билингвов, которые могли бы оценить, насколько удачным получается перевод. Чтобы ИИ мог учиться на своих ошибках и улучшать первоначальный вариант получившейся из оригинала фразы, исследователи проверяли её точность и переводили обратно с английского на китайский и наоборот. Через некоторое время искусственный интеллект выдавал улучшенный результат.

При использовании глубоких нейронных систем разработчики постарались представить более широкий контекст для перевода. Они ориентировались на то, как выполняют перевод люди, владеющие соответствующей профессией. Благодаря такому подходу, по мнению разработчиков, им удалось добиться уровня выбора средств для выражения той или иной мысли, который пока не был доступен компьютеру. «Машинный перевод сложнее, чем просто распознавание определённых структур, — рассказал руководитель группы по исследованию обработки естественных языков и заместитель директора Microsoft Research Asia Мин Чжоу (Ming Zhou). — Люди могут использовать много разных слов, чтобы сказать одно и то же, но не всегда можно точно установить, какая именно формулировка лучше».

Программу проверяли на двух тысячах предложений из подборки профессионально переведённых новостных сообщений WMT 2017 для пары из английского и китайского языков. WMT в различных вариациях — это сборники текстов для тестирования программ-переводчиков (по большей части они рассчитаны для пар европейских языков). Получая задание, программа переводит фразу снова и снова, постепенно подбирая наиболее точный вариант. Кроме того, ИИ использует «опыт» перевода с одного языка на другой, чтобы позже при помощи получившихся результатов лучше перевести новое предложение в обратную сторону (то есть программа будет учитывать получившиеся пары английского оригинала и перевода на китайский, чтобы перевести незнакомую фразу с китайского на английский).

Разработку планируют продолжать в сторону увеличения числа языковых пар. Специалисты надеются, что методы на основе повторения заданий в различных вариантах с учётом уже выполненных пригодятся в развитии нейросетей, в том числе, в областях за рамками перевода.

Елена Смотрова :