Эволюцию предскажут по слогам

Созданный для распознавания текста ИИ может быть использован для прогнозирования мутаций вируса

Обнаружение мутаций COVID-19 и начавшаяся вакцинация, которая теоретически может привести к появлению новых штаммов, обострила проблему борьбы с эволюцией вируса и своевременного ее выявления. Ученые из Массачусетского технологического института (MIT), Гарварда и Кембриджа предложили использовать для анализа мутаций ИИ, который прежде был разработан для распознавания текста. Причем модели языкового анализа могут быть использованы для предсказания эволюции не только COVID-19, но и обычного гриппа, а также вируса иммунодефицита человека (ВИЧ).

Фото: Fernando Llano / AP

Фото: Fernando Llano / AP

Исследование коллектива ученых под руководством Бонни Бергер из MIT было опубликовано в конце минувшей недели в журнале Science. Целью исследования было выявить возможность отслеживания и предсказания так называемого уклонения вируса — мутаций вируса и приобретения им устойчивости к лекарствам или выработанным ранее антителам.

«Мы смоделировали уклонение вируса при помощи алгоритмов ИИ и машинного обучения, изначально созданного для распознавания человеческой речи и ее генерации при помощи изученных алгоритмов (по типу речевой или текстовой нейросети.— “Ъ”),— отмечают исследователи.— Мы идентифицировали различные мутации, при которых вирус сохраняет свою способность к инфицированию, но при этом воспринимается иммунной системой человека по-другому — примерно так же, как замена одного слова в предложении может сохранить грамматику и синтаксис этого предложения, но изменить значение этого предложения. Используя такой подход, мы применили ИИ языкового анализа для понимания моделей уже имеющихся изменений в вирусе обычного гриппа, гликопротеина вирусной оболочки вируса иммунодефицита человека (ВИЧ) и вирусной оболочки коронавируса SARS-CoV-2. Путем создания меток на вирусных белках наш метод позволил предсказать модели изменения вирусных оболочек».

Таким образом, отмечают ученые, исследование позволяет создать своеобразный «мост» между анализом языковых моделей и эволюции вируса, то есть понять «язык» вируса и создать модели, по которым он может создавать различные «фразы» или «предложения».

Именно поэтому ученые использовали в моделировании ИИ, созданный ранее для анализа семантической сочетаемости и грамматической корректности.

Речь идет о так называемой технологии NLP (natural language processing — обработка естественного языка), которая создает нечто вроде математического кода, составляющего вместе сочетаемые по смыслу, значению и контексту слова. Этот процесс известен как embedding, то есть встраивание или преобразование отдельного слова, предложения или фразы в набор чисел, который способна воспринять машина. Проанализировав сочетание слов друг с другом, машина таким образом может сама строить довольно осмысленные фразы.

Примеры таких машинных текстов на заданные темы уже существуют и могут сбить с толку неподготовленного читателя. Применительно к вирусу такой embedding может использоваться для того, чтобы создать модель сочетания друг с другом наиболее близких генетических секвенций — нуклеотидных последовательностей в генетической структуре — что в итоге и образует мутацию.

Ученые сообщают, что в ходе испытания они смоделировали мутации ВИЧ, гриппа и COVID-19 и сравнили свои модели с уже известными мутациями этих вирусов. Для оценки совпадения они создали шкалу, при которой 0,5 — самая низкая степень совпадения, а 1 — самое точное совпадение. В результате совпадение оказалось на уровне 0,69 для уже известных мутаций ВИЧ и на уровне 0,85 для одной из известных мутаций коронавируса.

По заявлениям ученых, эти результаты гораздо лучше всех имеющихся сейчас моделей предсказания мутаций.

Результаты исследований уже получили высокую оценку ряда ученых.

«Понимание языка эволюции вируса и изменчивости вируса дает мощный инструментарий для прогнозирования мутаций, которые позволяют вирусу повышать свою устойчивость к лекарственным препаратам»,— отметили в интервью изданию Singularity Hub исследователи Национального института здравоохранения при Минздраве США Ю А Ким и Тереза Пжытыцка.

«Это может стать феноменальным способом сужения целой вселенной потенциальных мутаций вирусов»,— цитирует посвященный высоким технологиям интернет-ресурс Wired ученого-микробиолога Бенгура Ли из нью-йоркского научно-исследовательского центра ISMMS (Icahn School of Medicine at Mount Sinai).

Евгений Хвостик

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...