Технологии распознавания изображений могут в скором времени появиться в практической медицине. Группа учёных из Стэнфордского университета (Stanford University) научила компьютер определять наличие рака кожи по фотографиям «родинок» или «бородавок». Точность такой «компьютерной диагностики» оказалась сопоставима с результатами работы врача-дерматолога.
Авторы исследования, опубликованного в журнале Nature, предполагают, что в будущем люди будут проходить проверку на рак кожи через приложение для смартфона.
«Наша цель — принести помощь дерматологов высокого класса туда, где дерматологов просто нет», — рассказал ведущий автор работы Себастьян Тран (Sebastian Thrun), доцент Стэнфордского университета. Он также добавил, что в развивающихся государствах нет доступа к медицинской помощи того уровня, который доступен американцам и жителям других развитых стран.
На долю меланомы приходится менее 5% всех случаев рака кожи в США. Однако с этим диагнозом связано примерно три четверти смертей от онкодерматологических заболеваний. В России в 2008 г. было зарегистрировано около 8 тыс. новых случаев меланомы и около 3 тыс. обусловленных этой болезнью летальных исходов.
Если меланома выявлена на ранней стадии, пятилетняя выживаемость больных составляет около 97%. Но при позднем обнаружении болезни этот показатель стремительно падает до 14%.
Диагностика меланомы начинается с визуального осмотра. Дерматолог ищет признаки злокачественного заболевания, осматривая «родинку» или «бородавку». Затем диагноз подтверждается (или снимается) при помощи биопсии и дополнительных обследований.
Совместно с группой коллег, Тран обучил компьютер выполнению первой задачи из этого списка: определять меланому по внешнему виду. Таким образом, учёным удалось создать «автоматического дерматолога».
Работа началась с формирования у машины навыков распознавания образов. Для этого использовался метод, известный как «глубокое обучение». В частности, исследователи разработали свёрточную нейронную сеть.
Карл Вондрик (Carl Vondrick), сотрудник лаборатории компьютерных наук и искусственного интеллекта (Computer Science and Artificial Intelligence Lab) Массачусетского технологического института (Massachusetts Institute of Technology), не принимавший участие в исследовании, поясняет: «Свёрточная нейронная сеть — это тип программного обеспечения, который очень хорошо обучается распознаванию образов. Загружая оцифрованные изображения, исследователи одновременно «говорили» компьютеру, есть ли на фотографии меланома. Машина, в свою очередь, пыталась разработать правила, которые помогли бы определить наличие этого вида рака на снимках».
Соавтор исследования Андре Эстева (Andre Esteva), аспирант Стэнфордского университета, рассказывает: «Мы начали с того, что «объясняли» компьютеру, как выглядит мир в целом. Обучали его распознавать фотографии кошек и собак, столов и стульев — словом, всего, что мы видим вокруг. При этом использовалась обширная база данных, содержавшая около миллиона изображений». Эта стадия обучения заняла около недели.
Затем Эстева и его коллеги перешли к формированию у компьютера «представлений» о разных заболеваниях кожи. На этом этапе исследователи столкнулись со сложной проблемой: злокачественные и доброкачественные изменения у разных пациентов могут выглядеть очень по-разному.
Чтобы преодолеть это затруднение, учёные «показали» уже прошедшему определённое обучение компьютеру 129 450 изображений 2000 кожных заболеваний. Все фотографии были получены из онлайн-хранилищ, курируемых врачами, и каждая фотография сопровождалась диагнозом — эти данные были загружены в компьютер вместе с самими изображениями.
«„Машинное зрение“ и нейронные компьютерные сети являются таким мощным инструментом, потому что вам достаточно определить ввод и вывод — компьютер сам сформирует правила, по которым будет работать, — рассказывает Вондрик. — Он изучит серию математических операций, которые необходимо провести, чтобы превратить фотографию в ответ на вопрос „Есть ли здесь рак кожи?“»
В этом заключается существенная разница между человеческим зрением и компьютерными системами распознавания образов. Человек может научиться распознавать образы при помощи небольшого числа примеров. Машине потребуются тысячи или даже миллионы изображений.
«Вы можете вырасти до 20 с лишним лет, ни разу не увидев рак кожи. А потом вы идёте в медицинский институт, видите несколько примеров на слайдах — и вот вы уже собираетесь диагностировать рак кожи, причём делать это достаточно хорошо», — добавляет Вондрик.
Компьютеры не способны повторить этот опыт. Однако, как сообщается в новом исследовании, машинные системы распознавания образов могут выявлять в цифровых фотографиях особенности, неразличимые человеческим глазом.
Момент истины наступил, когда учёные загрузили в компьютер изображение, не «виденное» машиной раньше. По словам Эстевы, «алгоритм решил несколько важных диагностических задач с точностью сертифицированного дерматолога».
«Важно, что машина «научилась» распознавать несколько разных типов рака кожи, а не только меланому. Кроме того, диагностику теперь можно проводить при помощи обычных фотографий, не ограничиваясь изображениями, полученными в результате дерматоскопии», — рассказывает соавтор исследования Роберто Новоа (Roberto Novoa), дерматолог из Стэнфордского университета.
Хотя авторы исследования подчёркивают, что «офлайновая» диагностика в кабинете врача всё ещё необходима, они полагают, что со временем разработанный ими метод может найти применение в других областях медицины, например, в офтальмологии или радиологии.