Нейросети помогут специалистам различать очень близкие виды насекомых

Многие виды насекомых внешне настолько похожи друг на друга, в том числе при близком рассмотрении, что даже опытному специалисту с трудом удаётся различить их. Недавно российские учёные применили технологию визуального распознавания на основе машинного обучения, позволившую точно определить очень близкие виды. Этот новый подход, как показало исследование, существенно упрощает работу энтомологов, что важно не только для фундаментальной науки, но и для разработки эффективных способов борьбы с вредителями. Результаты исследования, поддержанного грантом Российского научного фонда (РНФ), опубликованы в журнале Systematic Entomology.

На сегодняшний день науке известно около миллиона видов насекомых. Это больше, чем найдено и определено видов всех других животных, растений и микроорганизмов вместе взятых. Несмотря на ежедневный кропотливый труд энтомологов, описана лишь часть видов насекомых, обитающих на планете, а многие из некогда обнаруженных ещё не встроены в общую систему научной классификации.

Часто бывает, что известных признаков недостаточно, чтобы отличить друг от друга похожие виды, и учёным приходится искать различия в мельчайших деталях строения. Это требует использования дорогого оборудования, например, не только высококлассной оптической, но и сканирующей электронной микроскопии. Такого рода исследования занимают массу времени специалистов и требуют значительных денежных затрат. К тому же всё равно существует риск ошибки, которая может повлечь за собой, например, неправильный подбор пестицидов против насекомого-вредителя, а значит, и потерю урожая.

«На примере растительноядных клопов-слепняков из хозяйственно значимого рода Adelphocoris мы пробовали автоматизировать процесс точного определения насекомых с помощью компьютерного зрения. Для этого нам надо было научить компьютер распознавать виды так, как это делает специалист-энтомолог, или ещё лучше. Это процесс трудоёмкий, но возможный благодаря оцифровке обширных научных коллекций. Анализируя множество фотографий экземпляров, которые ранее правильно определили люди, компьютер учится распознавать виды, и после некоторой тренировки делает это быстрее и точнее, чем человек», — рассказывает руководитель проекта по гранту РНФ Алексей Солодовников, кандидат биологических наук, старший научный сотрудник Зоологического института РАН.

Так, коллектив российских учёных из Зоологического института РАН (Санкт-Петербург) предложил определять насекомых с помощью нейронных сетей на основе машинного обучения. Исследование проводили на тысячах экземпляров Adelphocoris из уникальной коллекции Зоологического института. В природе существует более 48 видов этих насекомых, 18 из которых обитают в России и наносят вред бобовым культурам.

Обычно, чтобы определить представителя рода Adelphocoris, внешнего вида насекомого недостаточно, и энтомологи, в том числе соавторы статьи Федор Константинов и Владимир Нейморовец, исследуют строение половых органов самцов, которые ещё надо специальным образом препарировать. Это трудоёмкий процесс, поэтому исследователи решили проверить, можно ли с помощью машинного обучения определять этих насекомых только по внешнему виду и тем самым заметно ускорить работу.

Исследование включало четыре этапа на основе анализа цифровых фотографий клопов: сначала учёные проверили способность нейронных сетей отличать все виды Adelphocoris друг от друга, а затем — сам род Adelphocoris от похожих на него родов, на следующем, третьем, этапе — распознавать самцов и самок внутри этого рода, и, наконец, на четвёртом этапе необходимо было проверить, насколько обученные только на коллекционных экземплярах модели способны распознавать изображения представителей таксона, найденные в Интернете.

«Обученные нами модели не позволяют достаточно точно идентифицировать изображения Adelphocoris, полученные в живой природе, однако, сузив условия наших экспериментов, чётко определив правила съёмки, включая ракурс, мы достигли отличных результатов. Кроме того, мы хотели получить более интерпретируемую картину. Для этого мы генерировали теплокарты изображений, подаваемых на вход итоговым моделям. Теплокарты подтвердили, что классификация видов Adelphocoris основывается на ряде важных частей тела насекомого. Таким образом, с помощью машинного обучения мы смогли извлекать набор присущих Adelphocoris паттернов и принимать решение, к какому из заранее определённых на этапе обучения видов относится тот или иной экземпляр», — комментирует Александр Попков, специалист по нейронным сетям в команде энтомологов и самый молодой участник проекта, недавно защитивший магистерскую диссертацию.

Современные достижения в области машинного обучения помогут биологам практически безошибочно определять очень похожие виды насекомых по внешнему виду как в целях познания биологического разнообразия планеты, так и для практических разработок, важных для сельского хозяйства.

XX2 век :