Алгоритм для идеальной молекулы

На химфаке МГУ разработали цифрового помощника при поиске лекарств

Ученые химического факультета МГУ создали цифрового помощника — программу, которая контролирует качество данных при лабораторной расшифровке ДНК. Главная миссия этой программы — обеспечение надежности самых ответственных проектов (SELEX), отвечающих за поиск лекарственных аптамеров — специфических молекул, способных связываться с белками. Инновация не заменит ученого в лаборатории, а лишь усилит его работу, уверяют авторы.

Фото: Getty Images

Фото: Getty Images

Ценность инновации заключается в упрощении проведения так называемого нанопорового секвенирования клеток, в процессе которого происходит считывание нуклеотидного состава той или иной анализируемой молекулы. Метод основан на применении белковых или твердотельных пор диаметром всего лишь несколько нанометров, чувствительных к нуклеиновым кислотам. Отрицательно заряженная молекула ДНК при воздействии электрического поля проходит через такую нанопору, что приводит к изменению силы тока и позволяет определить, какой нуклеотид проходит в тот или иной момент.

Однако, чтобы верно идентифицировать исследуемые образцы, ученым приходится прикреплять к анализируемым молекулам искусственные метки, такие как адаптеры и баркоды. Если они прикреплены не в той последовательности или их мало, это сразу негативно отразится на результатах. Процесс присоединения меток — очень кропотливая и тонкая работа. Если они будут стоять неправильно, то на выходе вместо четкого научного результата получится хаотичный цифровой шум.

Как работает цифровой помощник

Для анализа ученые создали онлайн-сервис — своего рода цифрового двойника для молекул. Это веб-приложение, реализованное на Flask (микрофреймворк для создания веб-приложений на языке программирования Python) с использованием менеджера очередей задач Celery.

Принцип его работы следующий. В сервис загружается блок с итоговой информацией секвенирования клетки и указанными искусственными метками. Далее программа анализирует данные с помощью определенных алгоритмов и моделирует графики распределения последовательностей. Система работает методом нечеткого поиска известных фрагментов нуклеотидов с использованием алгоритма Левенштейна или BLASTn (по выбору).

Цифровой помощник отслеживает расположение этих молекулярных меток в научных данных на разных этапах исследования и сводит вероятность неточностей к минимуму. Технически проект создан на базе научно-исследовательского вычислительного центра МГУ, а идея, валидация результатов и тестирование легли на плечи ученых химфака.

Помощник, а не замена

Ученые подчеркивают, что инновация — не искусственный интеллект и не намерена заменять человека в лаборатории. Изобретение облегчит рабочий процесс и сэкономит время.

«Программа позволяет визуализировать распределение позиций искусственных последовательностей, она облегчает анализ, поэтому появилось слово “помощник”. Она помогает пользователю оценить качество данных. Так что человек здесь — важное звено»,— говорит доктор химических наук, профессор химического факультета МГУ Мария Зверева.

Значимость для SELEX и поиска лекарств

Инновация многообещающая для поиска лекарственных аптамеров — синтетических одноцепочечных молекул ДНК или РНК в процессе создания технологий типа SELEX, где цена ошибки максимальна.

«SELEX — это технология эволюции в пробирке для искусственного отбора аптамеров — нуклеиновых кислот, направленно взаимодействующих с выбранной целевой молекулой. Наша разработка помогает оценить данные, которые мы получаем нанопоровым секвенированием»,— объясняет Мария Зверева.

В процессе создания новых лекарств ученые отбирают одну идеальную молекулу из множества. Оставшиеся молекулы снова секвенируют и проверяют с помощью новой технологии. Цифровой помощник ускоряет этот процесс и контролирует ключевые риски.

Анна Героева