По статистике ВОЗ, рак легких ― самый смертоносный вид рака на сегодняшний день. Только в 2020 году это заболевание унесло жизни 1,8 млн человек по всему миру. Единственный гарантированный способ спасти человека ― вовремя диагностировать опухоль. Для первичной диагностики используют разные методы (флюорографию, рентгенографию, МРТ), но один из самых информативных — компьютерная томография (КТ). Она позволяет проводить послойное сканирование тканей и обнаруживать различные опухоли на ранних стадиях.

Результаты КТ интерпретирует врач: сначала специалист проверяет, есть ли в принципе на снимке опухоль, и если есть, то какая — доброкачественная или злокачественная. В зависимости от результатов назначаются дополнительные обследования или лечение.

Получить такую консультацию по результатам КТ сегодня можно не только на очном приеме у врача, но и онлайн с помощью сервисов телемедицины ― например, с помощью «Яндекс.Здоровья», Sber Med AI и некоторых других. Это может быть актуально для тех, кто хочет получить второе мнение у другого специалиста или не может попасть на очный прием к своему врачу.

Обычно онлайн-консультация проходит так: пациент загружает КТ-снимки легких на платформу для медицинских консультаций и квалифицированный врач-рентгенолог самостоятельно проверяет, есть ли опухоль на снимке. Затем специалист созванивается с пациентом и рассказывает ему о результатах или высылает заключение.

Автоматизировать процесс и провести диагностику точнее и быстрее врачу могут помочь технологии машинного зрения. Это технологии, которые позволяют автоматически получать, обрабатывать и описывать изображения для решения разных прикладных задач. Например, их используют на производстве, в системах безопасности и системах визуального контроля. Машинное зрение также уже внедряют в медицинскую практику для анализа снимков. Например, по данным Департамента здравоохранения Москвы, сервисы искусственного интеллекта анализируют в столичных поликлиниках 50% всех лучевых исследований пациентов.

Пример снимка КТ легких с новообразованием: до сегментации изображения с помощью метода водоразделов (слева) и после (справа). Изображения предоставлены авторами работы

Пример снимка КТ легких с новообразованием: до сегментации изображения с помощью метода водоразделов (слева) и после (справа). Изображения предоставлены авторами работы

Методы, которые позволяют с помощью машинного зрения обнаруживать опухоли на КТ-снимках легких, разрабатывают и ученые ИТМО. Например, в 2020 году они предложили алгоритм, который обучен на наборе КТ-снимков из открытого доступа и анализирует одно изображение за 2,15 секунды и при этом ошибается менее чем в одном проценте случаев. Это подтверждается метрикой F1-score, которая оценивает точность классификации изображения и полноту — то есть насколько хорошо модель находит новообразование. Значение метрики составило 0,996 (максимальное значение — 1): чем выше значение F1-score, тем лучше модель справляется с классификацией и распознаванием.

В решении последовательно используются две модели: первая выделяет на снимке полости легких, а вторая — ищет новообразования в каждой из полостей с помощью классификатора, основанного на нейросетях. Анализ происходит в два этапа, поэтому система работает медленно — это напрямую влияет на количество снимков, которые сможет обработать платформа. Поэтому такое решение не совсем уместно для сервисов онлайн-диагностики.

Новое решение

Чтобы быстрее определять опухоли на КТ-снимках легких, студенты и сотрудники Высшей школы цифровой культуры ИТМО модифицировали базовую двухэтапную модель, предложенную в 2020 году. В итоге их система стала работать более чем в два раза быстрее ― теперь обработка одного снимка занимает 0,38 секунды, при этом не потеряв в точности.

Разработчики убрали детектор, который определяет полости легких, заменив его на другое решение. Чтобы не искать полости в легких, студенты модифицировали сверточную нейросетевую модель для сегментации биомедицинских изображений U-Net.

Модель обучали и тестировали на выборках из открытых источников Radiology Moscow и The Cancer Imaging Archive, которые включают в себя более десяти тысяч КТ-снимков легких. Проведенные эксперименты показали: новое решение не утратило точности и ошибается менее чем в одном проценте случаев (метрика F1-score составила также 0,996).

Что дальше

Авторы предполагают, что разработанный алгоритм можно интегрировать в сервисы онлайн-диагностики — это поможет врачам быстрее находить опухоли на КТ-снимках. При этом технология не заменит специалиста, а станет для него помощником, который сможет предоставить альтернативное мнение.

«Один из самых больших трендов в современном компьютерном зрении — автоматизация медицинских процедур, в частности — обследований. При этом интеграция новых технологий в медицину — это сложный и долгий процесс, поэтому важно развивать разработки в этой сфере. Мы выбрали онлайн-сервисы консультаций как актуальное направление в медицине, решения для которого сейчас востребованы», — рассказал один из участников проекта, студент Высшей школы цифровой культуры ИТМО Александр Савельев.

Александр Савельев. Фото из личного архива

Александр Савельев. Фото из личного архива

Студенты подготовили проект для конкурса научно-исследовательских работ магистрантов и аспирантов (НИРМА). Участники проводят исследования на реальных данных, получают опыт составления и подачи заявки, подготовки и оформления научных статей, выступления на конференциях. Узнать о конкурсе подробнее и подать заявку можно на сайте.