С февраля 1945 года сотрудники Иркутского государственного университета ведут непрерывные наблюдения планктонного сообщества озера Байкал. Напротив биостанции НИИ биологии ИГУ в посёлке Большие Коты на расстоянии 2.7 км от берега находится так называемая «Точка № 1», где еженедельно берутся, а потом анализируются пробы фито- и зоопланктона с глубин от 0 до 800 метров. В ранние годы эти исследования велись для оценки рыбопродуктивности озера. Например, основу питания байкальского омуля составляет зоопланктон, который, в свою очередь, питается фитопланктоном. Поэтому размер популяции рыб зависит от видового состава и численности микроскопических водорослей. Сейчас же мониторинг планктона озера нужен в первую очередь для оценки экологического состояния самого Байкала.
«Сообщество фито- и зоопланктона является по сути фундаментом всей экосистемы Байкала. Понимая процессы в этом фундаменте, их динамику, мы можем делать прогнозы по векторам развития всей экосистемы озера. Мониторинговый проект „Точка №1“ уникален тем, что позволяет сделать анализ на основе долговременных и непрерывных рядов наблюдений, накопленных за 75 лет, – рассказывает Максим Тимофеев, доктор биологических наук, директор НИИ биологии ИГУ. – Наибольшие время и трудозатраты идут в части микроскопирования и распознавания видов и форм планктона в пробах. Это может сделать только специалист. Причём не простой биолог, а специалист по группам анализируемым в пробе. Одни из них специализируются на фитопланктоне, другие на зоопланктоне. Подготовка такого специалиста, способного различить, к примеру, 400 форм фитопланктона, занимает годы».
Из-за этого в последние годы проект «Точка №1» находился под угрозой закрытия – методика распознавания данных, которую сейчас применяют в проекте, технологически устарела. Для поддержания проекта потребовалось бы несколько десятков специалистов высокого уровня, согласных при этом на выполнение рутинных операций. Чтобы сохранить и продолжить развивать уникальный проект объединённая команда учёных и разработчиков создаёт нейросетевой алгоритм, который будет автоматически распознавать и классифицировать микроорганизмы в пробах байкальской воды.
Для обучения алгоритма учёные из НИИ биологии ИГУ предоставили более 1000 снимков каждого вида байкальского планктона разработчикам моделей искусственного интеллекта для изучения морских экосистем MaritimeAI. На основе этих данных будет создан механизм классификации видов планктона с использованием Yandex DataSphere — сервиса Yandex.Cloud для анализа данных, разработки и эксплуатации моделей машинного обучения. Изображения микроорганизмов будут передаваться в Yandex.Cloud прямо с микроскопов лаборатории НИИ биологии ИГУ. Предполагается, что алгоритм сможет определять до 99% всех видов планктона, а специалисты института биологии будут контролировать качество его работы.
«Мы обучаем алгоритмы с помощью достаточно стандартного в этой области алгоритма градиентного спуска с вариациями, но большее внимание мы уделяем архитектуре нейронных сетей. Коллеги из НИИ собирают изображения объектов из-под микроскопа, и мы начинаем обучение нейросетей с уже собранного массива изображений. Конечно, никто не может говорить о массиве изображений за 75 лет наблюдений, ведь возможность сохранить изображение с микроскопа на компьютер появилась не так давно, но одним из важных моментов в нашей работе стало изменение процесса анализа таким образом, чтобы в дальнейшем накопление изображений было его неотъемлемой составной частью», – комментирует Сергей Орешков из MaritimeAI.
Хотя сейчас существует много онлайн-проектов по привлечению научных волонтёров к обработке больших массивов данных, например, для классификации астрономических снимков или определения животных на видеозаписях, в задаче распознавания байкальских микроорганизмов в пробах важен именно опыт специалистов, в помощь которым и создаётся новый нейроинтерфейс. В то же время помощь волонтёров может быть полезна в процессе создания самой нейросети. Для обучения алгоритмов важно предоставлять им качественные размеченные данные – этой задачей как раз и могли бы заняться добровольные помощники науки. Для них специалисты MaritimeAIготовят интерфейсы проекта Яндекс.Толоки. Рабочий прототип нейросети исследователи и разработчики обещают представить уже этим летом.
По материалам пресс-релиза Яндекс.
Фото: Байкальская эпишура Epishura baicalensis - один из наиболее известных эндемиков Байкала, населяет всю толщу вод и формирует до 90 % всей биомассы озера. На фото - самка рачка на 5-й стадии развития. Фото: Пресс-служба Яндекс.
Комментарии:
Авторизуйтесь, чтобы оставить отзыв