Перекрашивая рак
Как ИИ заменяет сложные анализы и приближает эру доступной онкологии
Искусственный интеллект продолжает проникать в медицину и помогает извлекать из стандартных медицинских снимков информацию, которая раньше требовала сложных и дорогих анализов. Один из таких проектов был признан победителем конкурса «Женщины за здоровое общество», финал которого состоялся на Петербургском международном экономическом форуме.
Руководитель исследовательской группы Центра искусственного интеллекта Сколтеха Светлана Илларионова,
Фото: Тимур Сабиров / Сколтех
Руководитель исследовательской группы Центра искусственного интеллекта Сколтеха Светлана Илларионова,
Фото: Тимур Сабиров / Сколтех
Исследовательница Светлана Илларионова из Сколтеха и ее коллеги разрабатывают технологию, которая позволяет превращать гистологические изображения тканей в полноценные молекулярные портреты рака молочной железы, минуя трудоемкую иммуногистохимию.
«Ъ-Наука» поговорила со Светланой Илларионовой, руководителем исследовательской группы Центра искусственного интеллекта Сколтеха, чтобы узнать, как проект может изменить терапию заболевания, как ИИ-алгоритм может сделать лечение более доступным в отдаленных регионах, почему ИИ-инструменты долго не входят в реальную клиническую практику и на какие направления на стыке медицины и искусственного интеллекта стоит обратить внимание молодым ученым.
— Светлана, ваша научная группа занимается разными проектами, один из них — ИИ-система получения молекулярного портрета рака молочной железы без иммуногистохимии. Расскажите, пожалуйста, о нем подробнее. В чем его практическая значимость?
— Проект посвящен разработке алгоритмов искусственного интеллекта для диагностики гистологических данных, то есть срезов тканей, которые патолог анализирует для назначения терапии и планирования лечения рака молочной железы. В рамках конкретно этой части проекта мы разрабатываем алгоритмы виртуального окрашивания — это алгоритмы генеративного искусственного интеллекта.
Мотивирована наша задача тем, что есть стандартный подход к диагностике, основанный на анализе данных гематоксилина и эозина. Это базовый подход, по которому патолог может определить некоторые общие характеристики тканей в случае рака молочной железы. Для назначения терапии — гормональной либо таргетной — важно не ошибиться, так как они имеют разную степень агрессивности. Если сделать неправильный выбор, лечение будет либо недостаточным, либо чрезмерно агрессивным, а это лишь усилит нагрузку на организм, не давая реальной пользы.
Чтобы определиться с типом терапии, врач-патолог анализирует данные иммуногистохимии — это сложный процесс окрашивания тканей, где с помощью химических растворов подсвечивается определенная область на тканях и врач может выделить различные биологические структуры, например скопление клеток, форму, реакцию тканей на эти химические растворы. На основе этого анализа уже можно делать прогнозы и назначать более целенаправленную терапию для пациента.
Здесь есть свои ограничения. Это процесс занимает много времени — пять—семь дней — и требует дорогостоящего оборудования, которого в некоторых удаленных регионах может просто не оказаться. Кроме того, когда делается биопсия, один и тот же срез ткани нельзя одновременно окрасить разными красителями и провести разный анализ на одном и том же срезе. Нужны дополнительные срезы.
Чтобы обойти все эти ограничения, мы разрабатываем алгоритмы, позволяющие с помощью генеративных нейронных сетей переводить один тип окрашивания в другой — из H&E в IHC. Используя только базовый тип данных, мы можем сделать синтетические данные, которые будут сохранять те же биологические структурные характеристики, на основе которых патолог сможет провести анализ.
— Вместо сложной и дорогой иммуногистохимии вы предлагаете с помощью ИИ «перекрашивать» обычные срезы. Но этого, наверное, недостаточно — нужно еще уметь правильно интерпретировать полученные изображения?
— Да, другая часть проекта — это уже непосредственно анализ данных: определение основных биологических структур на снимках, предсказание статуса тканей, рецепторов, а также распознавание основных структурных клеток и других параметров, которые важны при анализе патолога. Для этой задачи распознавания также разрабатываются алгоритмы искусственного интеллекта, и они настраиваются под эти определенные задачи.
В целом идея в том, чтобы перейти от ограниченных данных, которые сложно получить в клинике, к более доступным, но при этом даже на основе этих доступных данных получать достаточно полный морфологический анализ тканей.
— Каких результатов вам уже удалось достичь?
— Собран уникальный набор данных — снимки тканей 100 пациентов с подтвержденным раком молочной железы, которые аннотированы вручную. Для разработки генеративных алгоритмов это данные двух типов окрашивания, и на их основе происходит обучение этих алгоритмов. Также мы готовимся выложить наш датасет в открытый доступ, чтобы специалисты и исследователи могли на его основе создавать свои решения.
Что касается алгоритмов, мы провели обучение моделей и разработали методологию, позволяющую учитывать специфику медицинских данных. Наша цель — создать решение, адаптированное именно под клинические задачи, а не просто еще один инструмент компьютерного зрения, работающий с фотографиями. Кроме того, мы активно сотрудничаем не только с российскими клиниками и медицинскими учреждениями, но и с зарубежными университетами — в частности, с Университетом Шарджи, с которым у нас в Сколтехе действует совместная лаборатория BIMAI-Lab по искусственному интеллекту в медицине, а также с коллегами из Университета Токай и Катарского биомедицинского института. Их экспертиза помогает нам корректировать планы с учетом реальных медицинских потребностей, в то время как наша сторона отвечает непосредственно за разработку алгоритмов.
— Вы упомянули корректировку планов с учетом потребностей врачей, а сам проект тоже был сподвигнут запросом клиники?
— Да, конечно. При разработке таких проектов в первую очередь нужно понять, чего сейчас не хватает, что является актуальным и востребованным, и, уже отталкиваясь от этого запроса, думать, как можно адаптировать и разрабатывать алгоритмы на основе искусственного интеллекта, чтобы решить этот конкретный запрос. Все наши проекты — результат совместной работы с докторами.
— Когда ваш инструмент будет разработан, врачу понадобится только компьютер, для того чтобы им пользоваться?
— Да. Базовое окрашивание везде проводится по умолчанию. А дальше достаточно будет использовать алгоритм, чтобы провести дальнейшую диагностику и помочь врачу принять решение, либо подсветить, например, что случай сложный и он потребует все-таки проведения дополнительного анализа, то есть реального окрашивания. Важно, что наш алгоритм не заменит врача, а станет лишь дополнительным инструментом в его работе.
— Как вы оцениваете вероятность скорого появления таких ИИ-инструментов в реальной клинической практике? Какие барьеры до сих пор остаются?
— Есть достаточно сложный барьер, связанный с регуляторным механизмом. Система здравоохранения — это область, очень чувствительная к внедрению чего-то нового. Алгоритмы должны проходить достаточно серьезный и строгий процесс апробации. Также есть ограничения по передаче и использованию персональных данных. С моей точки зрения, этот вопрос решается проще, так как алгоритм может работать в контуре клиники — данные пациентов из этого контура не уходят. Но подтвердить надежность и эффективность алгоритма сложно. Сейчас в этом направлении работают, так что предполагаю, что в скором будущем этот путь станет более понятным и, может быть, его можно будет проходить быстрее.
— Светлана, ваш проект принес вам победу в конкурсе «Женщины за здоровое общество». Вы представили свою работу в финале на ПМЭФ и получили награду из рук Валентины Матвиенко. Как вы считаете, важны ли такие конкурсы? Могут ли они стать дополнительной мотивацией для женщин в науке?
— Да, я считаю, что конкурс действительно важен. Проекты, о которых я узнала, когда принимала участие в финале, вдохновляют и мотивируют заниматься не только исследованием алгоритмов, иногда оторванных от реальной жизни, но и думать о том, как это можно применить с пользой для людей.
— Можете ли вы дать совет молодым исследователям, которые тоже хотели бы заниматься прикладным искусственным интеллектом в области здравоохранения и медицины? Может быть, какие-то актуальные направления, в которые стоит идти, с чего начинать, какие навыки наиболее востребованы сейчас в этой сфере?
— В нашей команде есть специалисты из смежных дисциплин. Здорово, когда коллектив устроен именно таким образом и вся работа проводится в коллаборации, когда выстроено общение и понимание между техническими специалистами и экспертами в медицине. Поэтому если говорить о совете, который можно было бы дать, то очень важна коллаборация. Сделать что-то полезное и востребованное, находясь в вакууме, сфокусировавшись только на математическом аппарате или только на медицинской составляющей, сейчас не получится.
Актуальных направлений сегодня много. Одно из новых — создание цифрового двойника, то есть не диагностика отдельной модальности, где мы работаем только с изображениями или только с клиническими данными и результатами анализов, а где мы пробуем проанализировать систему в комплексе. Если у нас есть такая система и мы понимаем, как выстроена взаимосвязь между ее частями, то у нас появляется больше возможностей для перехода от анализа к прогнозированию результатов лечения и откликов на терапию. Я думаю, это должно помочь более эффективно бороться с болезнями.