От летающего оператора до мобильного приложения, которое помогает слепым: на недавней конференции, посвящённой ИИ, стартапы программы Inception («Начало») продемонстрировали технологии на базе NVIDIA.
Персональный летающий оператор, компьютер, определяющий ваше настроение, программа для распознавания лиц, которая способствует поиску преступников, смышлёные пользовательские карты, помогающие найти именно то, что вам нужно, приложение, которое помогает слепым, — всё это не из области научной фантастики. Эти системы реально существуют. И это всего лишь пять разработок, с которыми можно было ознакомиться на проходившей в прошлом месяце в Гонолулу конференции CVPR («Компьютерное зрение и распознавание образов»). Данные разработки представлены стартапами, работающими в рамках программы NVIDIA Inception.
Не прошло и года, как в списке этой программы оказалось более 1300 стартапов, продвигающих интеллектуальные системы. Около 30 стартапов участвовали в конференции CVPR, почти две дюжины из них — с выставочными стендами, в том числе и те пять, о которых мы расскажем сейчас подробней.
Skydio и «восхитительная сила полёта»
Любой, кто управлял дроном, знает, насколько это трудно. Ещё труднее, если с дрона нужно снять видео о том, кто не стоит на месте.
Чтобы решить эту проблему, компания Skydio занимается разработкой автономного дрона, который летит туда, куда указало мобильное приложение, чтобы, следуя за каким-то объектом, снимать его с лучших ракурсов. Как заявил Абрахам Бахрах (Abraham Bachrach), соучредитель и технический директор компании, пользуясь такой техникой, гуляющие любители селфи смогут выставлять в интернете видеокадры, снятые ими с «восхитительной силой полёта».
«Благодаря нашим разработкам дроны учатся понимать мир, — сказал Бахрах. — Пока техническое средство передвижения не воспринимает и не понимает окружающий мир, человеку приходится быть пилотом».
Компания Skydio основана три года назад в Силиконовой долине. Глава компании — Андриссен Горовиц (Andreessen Horowitz), в штате — 50 сотрудников, на разработки получено 28 миллионов долларов венчурного финансирования. Компания, которая всё еще разрабатывает свой продукт и маркетинговую стратегию, планирует начать с потребительского рынка. Однако, по словам Бахраха, в конечном итоге Skydio станет продавать свои дроны для патрулирования инфраструктуры с труднодоступными местами.
WRNCH: всё, кроме мокрого носа, — даёшь компьютеры с собачьими качествами!
У Пола Кружевски (Paul Kruszewski), генерального директора компании WRNCH, участвующей в программе Inception, цель простая: он хочет, чтобы компьютеры учились у собак.
Зачем? Дело в том, что собаки легко читают невербальные сигналы. Эти животные прекрасно освоили язык человеческого тела, поэтому Кружевски и взял их в качестве модели.
«В итоге, — сказал он, — если мы дадим машинам собачье зрение и научим их понимать наши намерения, мы сможем построить очень интересный мир».
Кружевски и его команда создают продукт под названием Body Slam, который извлекает 3D-образы людей из 2D-видео, отслеживая 23 элемента человеческого тела — ключевые черты и точки сочленения. В процессе разработки этот монреальский стартап использует ряд технологий NVIDIA, включая графические процессоры, архитектуру параллельных вычислений (CUDA) и библиотеку для быстрого обучения нейронных сетей cuDNN. Варианты применения Body Slam разнообразны: от интеллектуальной помощи пожилым людям до мониторинга местности при движении автомобиля и просто игры.
«Наш продукт будет востребован везде, где используются графические процессоры», — сказал Кружевски.
Sensetime: как ловить плохих парней при помощи компьютерного зрения
Программа распознавания лиц компании Sensetime, безусловно, обладает огромным потенциалом. Но уже сейчас у этой программы такой послужной список, что, взглянув на него, многие амбициозные борцы с преступностью почувствовали бы себя неловко.
За последние шесть месяцев программа, сравнивая лица, зафиксированные уличными камерами наблюдения, с теми, что имеются в полицейских базах данных, помогла китайским правоохранительным органам поймать 40 преступников. И это притом, что были задействованы камеры, размещённые на территории всего лишь двух полицейских участков!
Возраст компании Sensetime — два года. Она продаёт своё программное обеспечение полицейским управлениям и общественным транспортным компаниям. В настоящее время Sensetime обслуживает территорию сорока полицейских участков, и, как надеется Цзюньцзе Ян (Junjie Yan), директор отдела НИОКР и ведущий разработчик, это число будет расти.
Sensetime продает полный пакет алгоритмов, аппаратного и программного обеспечения. Компания использует графические процессоры для «обкатки» и доведения до ума своих моделей глубокого обучения. По словам Яна, команда NVIDIA, которая обслуживает программу Inception, помогла Sensetime прийти к более эффективному применению графических процессоров и даже подключилась к исправлению ошибок.
В этом году Ян в шестой раз участвует в конференции CVPR, и, по его подсчётам, за годы его участия в данном мероприятии, им было послано в оргкомитет конференции 15 научных статей.
AIPoly: гуманитарная сторона ИИ
Стартап из Сан-Франциско AIPoly хочет использовать камеры смартфонов для того, чтобы слепые получили возможность «видеть».
К настоящему времени программа компании AIPoly классифицировала 2 миллиарда изображений. Знания, приобретаемые в процессе этого глубокого обучения, вводятся в мобильное приложение, применяя которое люди с ослабленным зрением, направляя камеры своих смартфонов на тот или иной объект, могут получать голосовые сообщения о том, что они видят. Неважно, какой объект оказался в поле зрения программы, — сэндвич или номер на передней панели автобуса, — в любом случае приложение стремится быть суррогатными глазами.
Соучредитель стартапа Альберто Риццоли (Alberto Rizzoli) отмечает, что 90 процентов слепых людей на планете живут в бедности. Поэтому для большинства из них собаки-поводыри — непозволительная роскошь: приобретение и обучение этих животных порой стоит более 60 000 долларов США.
«ИИ может демократизировать эту ситуацию», — уверен Риццоли.
Mapillary: краудсорсинг более точных локальных карт
Карты великолепны. Но карты, содержащие именно то, что вам необходимо найти, ещё лучше.
Шведский венчурный стартап Mapillary, перелопачивая огромное количество источников, собирает данные изображений для создания массива данных отображения, который способен предоставить такой уровень детализации и конкретизации, какой в других местах отыскать не удастся.
Таким образом, если какая-то неправительственная организация хочет создать карту специально для людей с ограниченными возможностями, или если группа байкеров вознамерилась обзавестись картой для байкеров, они получат то, что им нужно. При этом необходимые им карты, возможно, будут созданы при их участии.
«Помогите нам — и мы решим вашу проблему», — говорит Ян Эрик Солем (Jan Erik Solem), генеральный директор и соучредитель компании.
Компания Mapillary основана в 2013 году. В ней работают 32 человека. Каждый день она получает несколько сотен тысяч изображений со всего мира, и её программа распознала уже более 10 миллиардов запечатлённых на них объектов. Данный стартап использует инстансы Amazon P2 на базе графических процессоров для вычислений и офисный кластер видеокарт Titan XP для обучения и экспериментирования с целью создания массивов данных в виде API (интерфейсов прикладного программирования).
Затем компания продает эти API клиентам, — таким как автомобилестроительные фирмы, картографические компании и муниципалитеты, — либо в виде автономных наборов данных, либо в виде подписки на все её данные. Физическим лицам данные предоставляются бесплатно.