Сверточные нейронные сети (CNN) отлично зарекомендовали себя в распознавании изображений и все чаще применяются в
биологии. Разработка автоматизированных систем для быстрого и надежного определения видов в недалеком будущем может произвести революцию и в систематике насекомых. Однако быстрому развитию видовой диагностики на основе CNN препятствует отсутствие достаточного количества изображений для каждого интересующего таксона. Несмотря на растущие усилия по оцифровке коллекций, большинство доступных баз данных содержат лишь несколько изображений для каждого достоверно определенного вида.
Доклад обобщает несколько исследований, в которых мы демонстрируем способность CNN с высокой точностью
идентифицировать виды на основе фотографий внешнего вида в таксонах, где определение профессионального систематика
могло бы потребовать вскрытия генитальных структур. В каждом случае мы исследовали изменчивость производительности 11 CNN моделей, наиболее часто используемых для классификации изображений, проверяли роль дисбаланса классов на оценку производительности модели и визуализировали области интереса с помощью трех алгоритмов интерпретации (RISE, LIME и GradCAM). В качестве модельных групп мы использовали роды полужесткокрылых Adelphocoris (Miridae) и Eurygaster (Scutelleridae) фауны России. Это полиморфные и таксономически сложные группы, включающие несколько важных вредителей пшеницы, люцерны и бобовых культур. Помимо исследования разрешающей способности CNN, для вредных черепашек рода Eurygaster было создано веб-доступное приложение, способное определять виды рода по сделанным на смартфон фотографиям.