обновлено 16:34

Белки под прицелом ИИ

Как устроена современная разработка лекарств

Внутри нашего организма непрерывно работают тысячи белков. Когда один из таких белков выходит из строя, развивается болезнь. Задача лекарства — найти сломанный белок и исправить его работу.

Дмитрий Иванков

Дмитрий Иванков

Фото: Предоставлено Сколтехом

Дмитрий Иванков

Фото: Предоставлено Сколтехом

Как среди бесконечного множества химических соединений отыскать то единственное, которое подойдет к нужному белку? Ответ дает компьютерное моделирование. «Ъ-Наука» поговорила со старшим преподавателем Центра био- и медицинских технологий Сколтеха Дмитрием Иванковым, чтобы узнать, какой путь проходит лекарство, прежде чем оказаться в аптеке, почему именно белки стали главными мишенями фармацевтики и как искусственный интеллект помогает ускорить поиск новых препаратов в несколько раз.

Как устроен процесс разработки лекарств

Процесс создания нового лекарственного препарата включает в себя вычислительный этап поиска кандидатов-веществ, а также последующие доклинические и клинические исследования. Средняя продолжительность полного цикла — от 10 до 15 лет, а средние совокупные финансовые затраты на вывод одного успешно зарегистрированного препарата на рынок превышают $1 млрд. Эта цифра обусловлена высокой долей неудачных попыток — значительная часть соединений-кандидатов отсеивается на различных стадиях из-за несоответствия требованиям безопасности, эффективности либо фармакокинетическим параметрам, а также неудавшимися проектами, в которых лекарства вообще не удалось найти.

Первый этап разработки лекарств включает компьютерное моделирование, в частности виртуальный скрининг, в ходе которого происходит перебор соединений из баз данных малых молекул с целью выявления кандидатов, способных взаимодействовать с белковой мишенью. Это конкретный белок, нарушение работы которого вызывает заболевание. Если удается найти соединение, способное повлиять на активность такого белка, появляется возможность корректировать течение болезни. Виртуальный скрининг проводится методом молекулярного докинга: программа поочередно оценивает, насколько хорошо каждое соединение подходит к активному центру белка по форме и физико-химическим свойствам. В результате отбираются наиболее подходящие варианты для дальнейшей проверки в лаборатории.

После формирования списка перспективных соединений проводятся биохимические эксперименты, подтверждающие факт взаимодействия и его количественные характеристики. Далее следуют испытания на животных, направленные на оценку эффективности и безопасности в условиях живого организма.

Если результаты доклинических испытаний признаны успешными, разработчик подает заявку на проведение клинических испытаний с участием людей. Клинические испытания делятся на три фазы. Первая фаза проводится на небольшой группе здоровых добровольцев. Ее цель — убедиться в безопасности препарата и изучить, как он ведет себя в организме человека. Вторая фаза выполняется на ограниченной группе пациентов с соответствующим заболеванием. На этом этапе оценивается предварительная эффективность и подбирается оптимальная дозировка. Третья фаза представляет собой масштабное исследование с участием большого числа пациентов. Оно необходимо для подтверждения эффективности и выявления редких побочных эффектов, которые могли остаться незамеченными на предыдущих этапах. После успешного завершения всех трех фаз компания подает документы на регистрацию препарата в государственные органы. Только после получения регистрации лекарство поступает в аптеки и медицинские учреждения.

Почему белки важны для разработки лекарств

Большинство лекарств действуют на белки, которые выполняют основные функции в клетках и тканях организма. Геном человека содержит около 20 тыс. генов, и почти все они несут информацию о строении различных белков. Каждый белок отвечает за свою конкретную задачу: одни белки ускоряют химические реакции, другие переносят вещества, третьи передают сигналы между клетками.

Белки построены из аминокислот 20 типов, соединенных в длинную цепь. Для сравнения, ДНК и РНК состоят всего из четырех типов строительных блоков. Небольшое число блоков в ДНК и РНК связано с их главной задачей — точным хранением и копированием наследственной информации. Белки же выполняют разнообразную работу, поэтому для их построения требуется больше вариантов исходных деталей.

Как форма белка связана с его работой

Чтобы белок мог выполнять свою функцию, его аминокислотная цепь должна свернуться в определенную трехмерную структуру. В развернутом виде цепь подвижна и не способна к полезной работе. После сворачивания образуется компактная и относительно жесткая конструкция, форма которой стабилизирована множеством внутренних контактов между разными участками цепи.

Именно сочетание жесткости и определенной геометрии позволяет белку выполнять его функцию. Если форма белка меняется, его работа нарушается или прекращается полностью.

Откуда берутся нарушения в работе белков

При передаче генетической информации от родителей к детям в каждом поколении возникает примерно 50–80 новых мутаций. Это естественный процесс, связанный с тем, что механизм копирования ДНК не является абсолютно точным. Наличие ошибок копирования создает генетическое разнообразие, необходимое для эволюции.

Если мутация затрагивает участок гена, кодирующий белок, это может привести к замене одной аминокислоты на другую в белковой цепи. Последствия такой замены могут быть разными. В одних случаях белок продолжает работать нормально, а в других — теряет активность или, наоборот, становится чрезмерно активным и перестает реагировать на регулирующие сигналы.

Как лекарства воздействуют на белки

Задача лекарственного соединения — связаться с белком-мишенью и изменить его активность. Чаще всего требуется подавить избыточную активность белка. Соединение должно подходить к определенному участку белка по форме и физико-химическим характеристикам. При совпадении этих параметров происходит связывание, и работа белка корректируется.

Отдельную группу составляют антибиотики. Их мишенью часто служит бактериальная рибосома — сложная молекулярная машина, отвечающая за производство белков в клетке. Рибосома бактерий отличается по строению от рибосомы человека. Это различие позволяет создавать вещества, которые останавливают синтез белка в бактериях, но не затрагивают клетки человека. Именно так работают многие антибактериальные препараты.

Как определяют структуру белков

Чтобы целенаправленно искать соединения, способные связываться с белком, необходимо знать его трехмерную структуру. До недавнего времени эту информацию получали только экспериментальными методами. К ним относятся рентгеноструктурный анализ, ядерный магнитный резонанс и криоэлектронная микроскопия.

В 2020 году ситуация изменилась благодаря появлению программы AlphaFold 2, разработанной компанией DeepMind. Эта программа использует методы искусственного интеллекта для предсказания трехмерной структуры белка по его аминокислотной последовательности. На международном соревновании CASP14 точность предсказаний AlphaFold 2 достигла 90%. Это сопоставимо с различиями между структурами одного и того же белка, полученными в разных лабораториях или при разных условиях. За эту разработку Джон Джампер и Демис Хассабис получили Нобелевскую премию по химии в 2024 году.

Какую роль в виртуальном скрининге играет искусственный интеллект

Дальнейшее развитие вычислительных методов направлено не только на предсказание структуры белка, но и на ускорение самого процесса виртуального скрининга. В этой области значимым событием стала разработка алгоритма «Матча», созданного стартапом нашей команды «Лиганд Про», который основали профессора и аспирант Сколтеха. «Матча» представляет собой модель искусственного интеллекта для молекулярного докинга, которая выполняет виртуальный перебор потенциальных соединений в 30 раз быстрее, чем крупные ко-фолдинговые модели класса AlphaFold.

Разница в скорости имеет принципиальное значение при работе с большими базами данных. Обработка одного комплекса «белок—лиганд» занимает у «Матчи» примерно 13 секунд, тогда как AlphaFold 3 требуется около 6,5 минуты. При этом модель демонстрирует высокую точность и физическую корректность результатов, сопоставимую или превосходящую показатели аналогов.

Алгоритм «Матчи» работает поэтапно. Сначала определяется грубое положение малой молекулы в активном центре белка. Затем последовательно уточняются ее поворот и внутренняя конформация. Встроенные механизмы проверки автоматически отбрасывают физически нереалистичные варианты расположения, а отдельная нейросеть оценивает правдоподобность оставшихся конфигураций и выбирает оптимальную.

Мы опубликовали описание алгоритма в форме препринта и выложили в открытый доступ программный код и веса обученной модели. Таким образом, мы упростили независимую проверку результатов другими исследовательскими группами, и интегрировать «Матчу» в существующие процессы разработки лекарств можно без дополнительных технических ограничений. В перспективе наше решение будет способствовать более быстрому выводу новых препаратов на рынок.

Итог

Разработка новых лекарств остается длительным и дорогостоящим процессом. Успех зависит от совместной работы специалистов в области молекулярной биологии, химии, фармакологии и компьютерного моделирования. Совершенствование вычислительных методов и применение искусственного интеллекта позволяют ускорить начальные этапы поиска перспективных соединений. Одна из главных задач, стоящих перед отраслью,— это сокращение времени перед доклиническими и клиническими стадиями с нескольких лет до одного года или менее. Решение этой задачи поможет быстрее выводить на рынок новые эффективные препараты и снижать общие затраты на их создание.

Олег Щербаков, Сколтех