Собрать пазл без половины деталей
Российские ученые — в топ-10 международного соревнования по восстановлению томографических сканов сердца
Решением этой проблемы занялись специалисты по искусственному интеллекту. С помощью генеративных алгоритмов, похожих на те, что улучшают качество старых фотографий, они учатся «достраивать» недостающие детали на снимках, превращая нечеткие кадры в информативные изображения. Отличие этой задачи от других в медицинском компьютерном зрении — острая нехватка общедоступных наборов сырых данных k-пространства, то есть исходных данных, которые томограф собирает перед построением итогового изображения. Для поиска решений этой проблемы был организован международный конкурс по восстановлению томографических сканов сердца в сотрудничестве с 27-й Международной конференцией по медицинской визуализации MICCAI. CMRxRecon предложил обширный набор данных k-пространства, включавший сырые данные картирования, сопровождаемые подробными аннотациями анатомических структур сердца. В итоге конкурс привлек около 600 команд-участников.
Фото: Getty Images
Фото: Getty Images
Сборная команда лаборатории «Сильный ИИ в медицине» Института AIRI и Сколтеха стала единственной командой из России, кому удалось попасть в топ-10 призовых мест. Представленное решение оказалось самым стабильным в различных номинациях: в отличие от узконаправленных решений конкурентов, команда заняла шестое-седьмое места сразу во всех восьми категориях оценки. Хотя соревнование было проведено в 2023 году, детали решения и результаты были опубликованы в ведущем журнале по медицинской визуализации только весной 2025 года.
О том, зачем ученые участвуют в соревнованиях по выполнению медицинских задач с помощью искусственного интеллекта и перспективах его применения для кардиологического скрининга, «Ъ-Науке» рассказывает Ph.D., руководитель лаборатории «Сильный ИИ в медицине» Института AIRI и руководитель лаборатории вычислительных методов формирования изображений Центра ИИ Сколтеха Дмитрий Дылов.
— Зачем вообще улучшать МРТ? Кажется, что современная медицина вполне успешно освоила магнитно-резонансную томографию…
— Начнем с того, как проходит исследование в МРТ-аппарате. Пациент ложится на кушетку и помещается в сканер. После начинается сбор частот Фурье — это буквально те самые громкие звуки, которые мы слышим внутри. Инструмент проводит сбор данных на одной частоте, перенастраивается, делает сбор на другой частоте, перенастраивается, опять перенастраивается, и так в течение 20–40 минут, а иногда и целого часа, когда пациенту необходимо лежать и не шевелиться, чтобы врач получил четкое изображение.
Естественно, это довольно долгий процесс, а количество пациентов, нуждающихся в проведении такого исследования, всегда велико. В ходе рассуждений о том, как его ускорить, возник вопрос: «А что, если сканировать не каждую доступную частоту? Получится ли изображение хорошим?» Из этого вопроса родилось целое направление исследований с использованием Compressed sensing или Compressed sampling, то есть с «Компрессионным или разряженным, неполным семплированием». В рамках этих исследований ученые формируют методики получения и восстановления сигналов, используя знания об их предыдущих значениях. То есть часть частот пропускается при сканировании, а появившиеся промежутки заполняются с помощью какого-то математического алгоритма. Подобным алгоритмам уже лет 50, но сейчас к задаче вернулись заново во многом именно благодаря необходимости «ускорить» процедуру МРТ и, конечно, благодаря современным методам ИИ.
— На основе чего работали эти методы и какое отношение они имеют к искусственному интеллекту?
— Изначально это работало так: брали два известных крайних значения, а значение в промежуточной точке — скажем, в середине интервала — определяли путем линейной интерполяции, чуть ли не как среднее арифметическое этих двух крайних значений. Это очень упрощенный подход, и, конечно, он не учитывал возможную нелинейность данных.
С появлением глубокого обучения и генеративного искусственного интеллекта появилась возможность делать более точные предсказания о том, что именно должно содержаться в этих пропусках, и «дорисовывать» итоговые изображения с учетом этой информации. Но речь не только об анатомических деталях, а еще и о фундаментальных технических ограничениях. Например, если попытаться ускорить сканирование в частотном представлении сигнала, просто пропуская каждую вторую частоту, то после обратного преобразования Фурье вылезут явные артефакты. Представьте: вместо одного только сердца на изображении появится «эхо» — контуры дублируются, и смотрящему кажется, что на изображении целых три сердца. Если не учесть такие моменты, включая классический критерий Найквиста (частота дискретизации должна быть вдвое выше максимальной частоты сигнала.— «Ъ-Наука»), реконструируемая картинка выйдет «грязной», появятся шумы, размытие, фантомные структуры.
— То есть артефакты неизбежны при ускорении?
— Не совсем. Если правильно обучить модель, то «заполнение» недостающих частот будет происходить и с учетом физики процесса, и с учетом анатомического априорного знания. Именно здесь в игру вступает генеративный искусственный интеллект, который можно обучить избавляться от артефактов. И речь идет не только об МРТ. С применением ИИ-алгоритмов мы не просто интерполируем пробелы, а стараемся учитывать физику процесса. В МРТ это магнитные поля, релаксация намагниченности тканей, а в КТ — поглощение рентгена. В низкодозной компьютерной томографии (LDCT) врачи сознательно снижают излучение, но тогда изображения становятся более зашумленными. Умные алгоритмы «достраивают» недостающее, опираясь на паттерны из тренировочных данных. Это как собрать пазл, потеряв половину деталей, но зная, как должна выглядеть итоговая картинка. При этом методика обучения сама следит за тем, чтобы ИИ не рисовал ерунду и восстанавливаемые анатомические структуры имели смысл.
— Расскажите поподробнее о конкурсе CMRxRecon и вашем решении. Почему именно это соревнование важно для сообщества исследователей искусственного интеллекта в медицине?
— Обычно из МРТ-аппарата можно выгрузить DICOM-файлы, то есть уже готовые изображения, которыми пользуются врачи,— снимки рук, ног, сердца. Помимо них «под капотом» лежат сырые данные частотного пространства, из которых потом создается картинка. Именно эти данные предоставили организаторы конкурса для обучения ИИ-алгоритмов. Во-первых, такие данные очень много весят, а во-вторых, встретить их в открытых источниках практически невозможно. Кроме того, сердца отличаются не только морфологией — формой, размером, но и динамикой, например, тем, как происходит биение сердца и реакция на нагрузку. Чтобы алгоритм не «затачивался» под узкую выборку, набор данных должен включать огромное количество примеров и учитывать геометрию, патологии, охватывать возрастные группы. Вариативность обучающей выборки позволяет «усреднить» индивидуальные отклонения и выявить общие паттерны. Организаторы конкурса предоставили доступ и к сырым данным, и к финальным картинкам обширного и репрезентативного набора реальных данных, и мы можем использовать этот опыт в дальнейших исследованиях.
— Вам удалось попасть в топ-10 во всех номинациях. Как это вышло?
— Основная задача соревнования заключалась в том, в какой последовательности следует семплировать частоты, чтобы максимально улучшить качество финальной картинки. Мы избегали хайповых решений, которые полностью основаны на технологиях ИИ, и использовали гибридный подход, аппроксимируя через нейронные сети результаты работы классических методов, о которых я рассказал в самом начале нашей беседы. Получилось универсальное и надежное решение.
— Почему публикация результатов заняла целых два года?
— Когда речь идет о медицинских данных, процесс рецензирования всегда занимает много времени. Препринты на том же arxiv могут лежать аж по пять лет. В первую очередь это связано с тем, что журналу нужно найти рецензентов, которые поймут и медицинскую часть работы, и техническую. Также нужно найти врачей, которые убедятся, что с точки зрения медстатистики все сделано верно. Авторам же нужно ответить на все вопросы, которые возникнут у рецензентов, а это, как правило, не просто письма: нужно искать данные, иллюстрировать свои утверждения. Результаты соревнования были представлены в Medical Image Analysis. Его репутация в научном сообществе достаточно велика, чтобы, если хотя бы один из рецензентов в чем-то сомневается, пригласили дополнительных рецензентов и работа отправилась на новый круг проверок.
— Зачем вообще нужны научные соревнования?
— Все начинается с конкретной задачи. Как правило, полная проверка жизнеспособности амбициозной гипотезы от а до я невозможна в рамках одной компании, даже если это международный гигант. Она требует огромного количества сотрудников и дополнительных финансовых вложений. Однако компания может вложить средства в подготовку основы для проверки гипотезы и организовать конкурс, чтобы привлечь к проблеме внешних специалистов. В хороших соревнованиях — подчеркну, хороших и уважаемых соревнованиях — результатом получается обоюдный выигрыш: организаторы занимаются краудсорсингом идей и получают первичное представление о том, в каком направлении лучше развивать свой проект, куда инвестировать, участники находят способ сравнить свои идеи друг с другом или получить уникальные данные, ну и, разумеется, следом лучшие результаты публикуются в открытом доступе, чтобы любой научный сотрудник мог использовать их в своей работе. Организовать соревнование может не только «клинический партнер». Иногда это отдельный научный коллектив, техническая команда или даже клиника. Для студента, кстати, призовое место в одном из таких соревнований — очень большой буст в карьере.
Лично я очень люблю использовать соревнования как мотивационный фактор для молодых ученых в своей лаборатории, ведь помимо практической ценности это и дополнительная строчка в их резюме, и общение с другими экспертами, с такими же аспирантами, как они сами. Иногда и призы, в том числе достаточно неплохие суммы денег, а для студента это всегда бонус. Себя я мотивирую успехом подопечных. Да и, честно говоря, когда твоя модель обходит сотни других, понимаешь, что вы не зря потратили несколько ночей на анализ и дебаггинг (поиск и устранение ошибок в программном обеспечении.— «Ъ-Наука»).
— Организаторы проверяют гипотезы. А какую практическую пользу помимо признания получают участники конкурсов?
— Как минимум доступ к уникальным данным. Я напомню, что самостоятельно собрать такой датасет очень сложно, долго и дорого. В остальном — польза та же самая, что и для организаторов. Перспектива становится ясна на примере кардиологического скрининга, ведь именно ускорение МРТ-процедуры позволит чаще проверять сердце и у здоровых людей тоже. Мы приняли участие в соревновании и уже получили ряд рабочих и нерабочих рецептов от топ-10 команд. Представим, что перед нами встанет задача включения МРТ-исследования в рутинный кардиоскрининг населения страны. Так же, как мы делаем флюорографию грудной клетки раз в год, но только смотрим на МРТ сердца. Что делать на первом этапе, чтобы процедура стала быстрой и доступной? Так вот, проанализировав все решения с соревнования, можно в своей стране исключить первый шаг научного поиска. Это очень экономит время и позволяет заранее отбросить заведомо нерабочие подходы.
Еще один плюс — бенчмарк. Соревнования помогают создать унифицированное стандартизированное пространство для количественной оценки моделей и понять пределы применимости нейронных сетей и других алгоритмов в решении медицинских задач. Мы перед своей лабораторией, например, поставили вопрос: до каких пределов можно ускорять МРТ? В этом конкурсе участники дошли до ускорения сканирования в восемь раз. А мы проработали и оценили альтернативы и в другой своей работе достигли ускорения в 16, а в определенных условиях и в 32 раза. Если на практике так ускорить процедуру МРТ, то рутинные проверки сердца в МРТ (среди здоровых людей) станут реальностью.
— Звучит как та самая коллективная международная наука, которая…
— Которая жива.
— Вернемся к применению искусственного интеллекта в анализе медицинских изображений. На каком этапе сейчас находится область исследований в сфере ускорения МРТ?
— Сейчас большая часть исследований далека до попадания прямо в МРТ-аппараты, так как «внутрь» попасть могут только алгоритмы производителей самих аппаратов. Но уже около пяти лет как FDA стало разрешать первые МРТ- и КТ-модули с искусственным интеллектом для реконструкции изображений прямо «под капотом» в известных брендах медсканеров. Производятся самые разные калибровки, проверки, валидационные эксперименты. Очень важно, чтобы «дорисованное» алгоритмами имело смысл для врачей. Самое простое, что приходит в голову,— взять любую сверточную сеть, какой-то набор данных, где измерены все частоты, и данные, где нет этих частот. А затем натренировать нейронную сеть так, чтобы она из одного делала другое. В результате у вас получатся хорошо выглядящие картинки, но у них с высокой вероятностью появятся несуществующие в реальности анатомические структуры. Тренированный глаз специалиста лучевой диагностики тут же это отметит. В решении таких проблем используются специальные регуляризации для контроля генерации нейронной сети. И даже после них наборы данных надо показать врачам для валидации.
Поскольку собственного МРТ-аппарата мы не производим, полученные в ходе исследований по ускорению МРТ результаты можно попытаться синтетически сопоставить с базами данных кардиологических центров. Сейчас мы исследуем перспективы внедрения различных ИИ-алгоритмов в рутинный кардиоскрининг: например, у лаборатории есть отдельные проекты с НМИЦ им. В. А. Алмазова и НМИЦ кардиологии имени академика Е. И. Чазова по поиску ранних признаков сердечно-сосудистых заболеваний для нашей популяции.
— И как, на ваш взгляд, можно улучшить текущий скрининг, чтобы выявлять риски на ранних стадиях?
— Классический скрининг здоровых людей включает анализ крови, иногда ЭКГ, редко — УЗИ сердца или сосудов. Но есть нюанс: у здоровых пациентов стандартные биомаркеры могут быть в норме в день анализа, а ухудшение обнаруживается лишь при повторном визите, когда патология уже очевидна. Чтобы находить ранние признаки, в идеальном мире нужен стандартизированный мультимодальный подход: человек сдал кровь, сделал ЭКГ и быстрый МРТ-скан за один визит, не бегая по разным кабинетам. Если собрать такой датасет для нескольких десятков тысяч пациентов, ИИ сможет научиться выявлять скрытые закономерности и ранние признаки заболеваний. Доступность и быстрота сканирования здесь будут играть ключевую роль.
Очень хочется, чтобы на такую рутинную проверку своей сердечно-сосудистой системы стали больше обращать внимания и чтобы скрининг анатомических структур сердца вошел в общую практику.
— Представьте, что в очень короткий промежуток времени искусственный интеллект и алгоритмы научатся идеально восстанавливать изображения в процессе кардиоскрининга. А что дальше?
— Если помечтать, то, мне кажется, мы встанем на пороге открытия какой-то технологии, которая будет функциональные, биохимические и анатомические особенности нашей сердечно-сосудистой системы предоставлять в качестве мониторинга в реальном времени. Так же, как мы сейчас носим на руке умные часы и измеряем пульс, ищем аритмию. Кто-то придумает очень классные продольные исследования с таким прибором, когда одни и те же пациенты будут наблюдаться в течение долгого времени. Не тяжело же сейчас взять и сохранить фотографию в телефоне? А если так же взять и сохранить мгновенный МРТ-скан? В результате появится значимый датасет, и мы сможем отвечать на вопросы, которые пока никто даже задавать не берется, например, о формировании, старении и контроле износа тканей сердца для каждого отдельного человека.