Facebook покупает ИИ-стартап, лидирующий в области обработки естественного языка

Facebook подтвердил намерение приобрести Bloomsbury AI, лондонский стартап, который разработал инструмент машинного обучения для анализа и оценки содержания неструктурированного текста. Приобретение компании показывает, что Facebook готов полагаться на сторонний опыт в решении некоторых из его самых больших проблем.

По данным финансовой компании PitchBook, до слияния с Facebook Bloomsbury привлёк 1,9 млн долларов инвестиций. Деньги не были потрачены впустую — команда из пяти человек, по мнению представителей Facebook, заняла лидирующие позиции в области обработки естественного языка.

Bloomsbury развивался в технологическом инкубаторе Entrepreneur First, но его коммерческое будущее было туманным, пока Facebook не заинтересовался им.

Bloomsbury работает над API Cape, который сторонние разработчики смогут использовать для создания приложений, отвечающих на вопросы о содержании текста.

Bloomsbury далеко не единственная компания, занятая разработкой такого продукта. Калифорнийский стартап Kyndi привлёк 11,7 млн долларов (по информации PitchBook) и создал программу для работы с научными документами. В статье в The New York Times говорится, что система способна распознавать не только слова, но и понятия. Человек получает помощника, способного «прочитать» тысячу научных статей за семь часов и ответить на вопросы. Например, было ли получено экспериментальное подтверждение описываемым в статье процессам. При этом не обязательно, чтобы это было указано в документе прямым текстом.

Интерес Facebook к Bloomsbury может быть связан с проблемой фейковых новостей. Себастьян Ридель (Sebastian Riedel), технический директор Bloomsbury AI, ранее тесно сотрудничал с Factmata, ещё одним лондонским ИИ-стартапом, который построил новостную платформу, на которой, параллельно с проверкой фактов людьми, используются инструменты машинного обучения.

CEO Factmata, Дхрув Гулати (Dhruv Ghulati), говорит, что для Facebook и других социальных медиа очень сложно бороться с ложной информацией и ботами из-за объёма инвестиций в уже существующую инфраструктуру.

«Это похоже на бесконечный цикл», — говорит Гулати. По его словам, проблему легче будет решить новым компаниям, изначально построенным на взаимодействии людей и машин. Такой подход называется «человек в цикле» (Human-in-the-loop, HITL). «Старички», среди которых Facebook, будут отставать.

Но Facebook считает, что для решения вышеуказанных проблем можно найти программные решения.

Рой Азулай (Roy Azoulay) (создал систему распознавания фальшивых фотографий в социальных медиа) считает, что для решения проблем с фальшивыми новостями нужен комплексный подход.

«ИИ не волшебная пуля, которая всё решит», — сказал он в интервью Forbes, добавив, что отводит ИИ ведущую роль в анализе контента и считает, что системы машинного обучения смогут бороться против поддельных фотографий и видео.

Азулай не считает, что Facebook пора заменить новой, более надёжной платформой. Социальная сеть может многого добиться путём добавления инструментов проверки данных на своей платформе.

Этот процесс может занять годы. В январе 2018 года Facebook анонсировал, что будет пересматривать свой алгоритм News Feed, структурирующий контент в бесконечной ленте постов от семьи, друзей, местных изданий и проверенных новостных источников. Хотя компания может создавать собственные инструменты машинного обучения для очистки контента, скорее всего Facebook продолжит также искать таланты среди таких стартапов, как Bloomsbury.

Юлия Сивенок and Сергей Сыров :