Как Google удалось «научить» оборудованную ИИ камеру Clips выделять лучшие кадры пользователей и их семей? Об этом компания рассказала в посте, опубликованном в корпоративном блоге. Для начала инженеры Google обратились к профессионалам — наняли «кинодокументалиста, фотожурналиста и хорошего художественного фотографа». Эти люди должны были обеспечить нейронную сеть, «мозг» камеры, визуальными данными.
Чтобы ИИ смог «выучить», какие кадры считать удачными, а какие — неудачными, ему нужно много примеров. Программисты подумали не только об очевидных вариантах испорченного снимка — например, размытого или такого, на котором камеру что-то заслонило. В ИИ были внесены и более абстрактные критерии, например «время». Теперь камера подчиняется правилу «не снимать слишком долгие планы, на которых нет ничего значимого».
Чтобы «научить» Clips распознавать удачные изображения и сделать пользовательский интерфейс настолько понятным, насколько это возможно, инженеры Google прибегли к тому, что назвали «человекоцентрированным дизайном» (human-centered design). Этот подход применили в надежде избавить пользователей от лишнего стресса. Пока камеры Clips нет в свободной продаже, но уже сейчас её ждут с нетерпением — чтобы выяснить, действительно ли «умная камера» способна достичь тех амбициозных целей, которые поставили перед ней создатели.
Кроме того, в блоге компании сообщается, что обучение программ, подобное использованному в Clips ИИ, — процесс неточный. Неважно, какой объём данных будет загружен в «обучающую» базу, камера всё равно не сможет выявить наиболее ценные лично для вас снимки. Да, она способна опознать хорошо кадрированные сфокусированные фотографии без пересвеченных или затемнённых участков, но откуда ИИ знать, что размытый снимок вашего сына, который впервые едет на двухколёсном велосипеде, обладает для вас особой ценностью?
«Когда речь заходит о вещах субъективных и личных, идеал просто недостижим — и он даже не должен рассматриваться в качестве цели, — пишут авторы поста в блоге. — В отличие от обычных программ, софт, разработанный с использованием технологий машинного обучения, никогда не будет «безошибочным», потому что предсказание — по определению наука неточная».