«ИИ в каждую кофемашину»
Как молодой доктор наук строит лабораторию на Физтехе
Александр Безносиков — один из самых молодых докторов наук в России. Он защитил диссертацию в 27 лет. Сейчас возглавляет BRAIn Lab — лабораторию фундаментальных исследований искусственного интеллекта МФТИ, где под его руководством работают около 100 студентов. В интервью «Ъ-Науке» Александр рассказывает о том, как устроена наука на переднем крае оптимизации и машинного обучения, почему не считает уход студентов в индустрию провалом, как выстроен «контролируемый хаос» в его лаборатории и зачем сегодня вообще идти в науку.
Доктор наук, руководитель BRAIn Lab — лаборатории фундаментальных исследований искусственного интеллекта МФТИ Александр Безносиков
Фото: Мила Гращенкова
Доктор наук, руководитель BRAIn Lab — лаборатории фундаментальных исследований искусственного интеллекта МФТИ Александр Безносиков
Фото: Мила Гращенкова
— Докторская в 27 лет — для большинства это звучит как фантастика. Не было сопротивления среды? Как восприняли коллеги, что вы защитились так рано?
— Сейчас так много задач, которые нужно решить, и будет еще больше: мир меняется настолько быстро, что нужно ловить вызовы налету. Лично у меня времени хватает изредка следить за тем, как там дела у коллег с точки зрения основных научных результатов. Формировать «сопротивления» — последнее, на что хотелось бы тратить силы. Успевать бы созидать, да и радоваться, что у кого-то что-то получилось, и в среднем по больнице мы движемся вперед. Надеюсь, что другие коллеги ровно так и рассуждают. Перед защитой я выступал на различных семинарах — около 20 в разных городах и научных группах, ровно для того чтобы показать результаты нашему сообществу.
Защита — важный этап, но не сказать, что краеугольный камень, разделивший жизнь на до и после. Вообще вся эта история началась в большей степени со спортивного интереса моего научного руководителя А. В. Гасникова. Подумал: а почему нет? В какой-то момент я притормозил, было так много других активностей. Но в итоге собрался, потому что почувствовал, что, если не сделаю сейчас, активностей станет еще больше и могу такими темпами не защититься никогда. Про спортивный интерес я немного утрирую, Александр Владимирович искренне переживает за нашу страну, и вот эта быстрая защита — один из возможных сюжетов ускорения развития науки.
— Ваша тема — оптимизация и машинное обучение. Если отбросить формулы, то какая фундаментальная проблема вас сейчас волнует больше всего? Что именно вы пытаетесь «заставить» алгоритмы делать лучше, чем они умеют сейчас?
— Если кратко, хочется, чтобы ИИ-решения проникли во все сферы жизни и даже на самые мало-мальски пригодные к этому устройства. Давайте попробуем сформулировать цель как-нибудь колоритно, например «ИИ в каждое домохозяйство», «ИИ в каждую кофемашину». Как это реализовать — вопрос интересный. Несмотря на бум в ИИ, существует много нерешеных задач до достижения озвученной цели.
Те же LLM-модели действительно поражают своими возможностями, но надо понимать, что это все еще очень дорогой продукт — как с точки зрения создания, так и использования. Впечатляющие результаты показывают модели, для которых требуется оборудование на десятки, а то и сотни миллионов рублей даже для локального и штучного использования. Как заставить работать эти чудеса прогресса на дешевом и неприхотливом железе — вопрос непраздный, но он требует решения, если мы действительно хотим запихнуть ИИ в каждую кофемашину. При текущих темпах использования ИИ-моделей с каждым годом оптимизация стоимости использования будет стоять острее и острее. Как делать эту оптимизацию, существует масса различных способов: новые архитектуры самой модели, методы эффективного обучения и дообучения моделей, алгоритмы сжатия самих моделей и вспомогательной информации, подходы на уровне организации точного набора специализированных промтов и формирования системы взаимодействия набора специализированных моделей. И много чего еще. Практически всем из этого мы и занимаемся.
При этом стоит понимать, что уже сейчас с помощью ИИ можно автоматизировать большое число рутинных задач. Как это хорошо работает с написанием программного кода, мировое сообщество удостоверилось. Существует целый пласт задач и даже областей, где уровень развития ИИ-технологии достаточен для активного внедрения, но такого активного движения не наблюдается. С точки зрения науки главный барьер здесь то, что это не делается в лоб: не получится просто так натравить модель на сложную задачу, и она ее с ходу решит. Создание большой и всемогущей модели — это тупиковый путь, от которого уже многие отказались. Очевидно, что специалист, обученный на одну конкретную узкую задачу, будет решать ее лучше, чем любой универсальный всезнайка. Да, всезнайка при этом умеет писать стихи и пишет чистый код на assembler, но какое это имеет отношение к тому, какая сумма расходов была в январе у предприятия? Объединяем узких специалистов в боеспособные команды — и поехали закрывать одну задачу за другой. Тут нет никакой новости: так жизнь устроена тысячу лет. Большой вопрос: как быстро и массово создавать такие команды специалистов? И тут сразу несколько интересных ответвлений: от того, как автоматизировать процесс создания этих команд специалистов, до ручного создания решений под сверхсложные, но востребованные задачи. Это второе большое направление нашей деятельности.
Если суммировать: хотим делать дешево, быстро, но при этом качественно. Говорят, что достичь всех трех критериев одновременно невозможно — чем не задача для науки?
— В МЛ сейчас бешеный хайп вокруг больших языковых моделей. А вы занимаетесь оптимизацией — более фундаментальной, менее модной темой. Не обидно, что вашу область реже упоминают в новостях? Или наоборот, спрос на хороших оптимизаторов только вырос, потому что LLM нужно учить эффективно?
— Как рассказал выше, задачи оптимизации разного рода являются ключевым в работе с ИИ и движением к его массовому и повсеместному использованию. Поэтому никакой проблемы в хайпе/нехайпе вокруг нашей деятельности не вижу.
Раз уж заговорили про оптимизацию для ИИ, можно параллельно обсудить еще одно наше направление — про то, как «хайповый» ИИ можно использовать для «нехайповой» классической оптимизации. О чем я? Мировое сообщество скопило огромный опыт решения различных оптимизационных задач. Мы знаем, как учитывать те или иные особенности задачи, переписывать задачу удобным способом, использовать теоретически обоснованные методы и эвристики. И все эти знания может обрабатывать ИИ: рассматривать задачу под микроскопом и выявлять главные подводные камни или, наоборот, упрощения, читать специализированную литературу и доставать из нее необходимые подходы, реализовывать это все в виде программного кода, генерировать примеры задачи, валидировать работу кода на этих примерах, анализировать результат и заходить на новый цикл, для того чтобы усовершенствовать решение. То, что я описал, это по факту полноценный цикл исследований, который на самом деле можно делать далеко не только в области оптимизации. И это лишь пример, как через «хайповую» область можно смотреть на «нехайповую».
— Вы остались в академии, хотя могли бы уйти в индустрию с вашей квалификацией, тем более что премия «Яндекса» открывает двери. Это осознанный выбор или так сложилось? И если выбор, то что именно вас держит в университете?
— Конечно, выбор осознанный, и тут далеко не один аспект, который сыграл роль. Академия — это в некотором смысле свобода и независимость. По умолчанию ты предоставлен себе. Можно углубиться в преподавание и подтягивать новое поколение к переднему краю науки. Можно заниматься исследованиями, которые ты самостоятельно сформулировал. Можно больше взаимодействовать с внешними компаниями, занимаясь наукой под заказ. При этом ты находишься равноудаленно от всех бизнес-игроков, никто не запрещает взаимодействовать с каждым из них, находя взаимную пользу. Это только основной спектр возможностей. Каждый день мы стараемся его расширять, чтобы у каждого, кто выбрал остаться в институте, было больше возможностей для самореализации.
Главный ресурс института — это люди. Находясь в МФТИ, ты имеешь прямой доступ к самым талантливым технарям страны. И общаешься ты с этими ребятами не про вилки (зарплатные), ложки и другие столовые приборы эйчаров, а про задачи, которые можно решать. Многие наши студенты в этом плане уникальны, они искренне любят решать сложные исследовательские проблемы, просто потому что они интересные. Это же круто иметь личную уникальную задачу, а не биться с рутиной, которая сваливается на тебя сверху от руководителя в компании. Тут наши пути и сходятся, и вряд ли такое пересечение много где можно найти. При этом творожные сырки у нас в холодильнике в лаборатории тоже есть, и не только по средам.
Находясь на Физтехе, можно и делать что-то для души. На Физтехе делают большое количество социальных проектов. Спектр очень широкий, описать все сложно, но то, что ближе мне и где мы с ребятами тоже пытаемся двигаться: школьное образование и развитие региональных команд. Даже в этих тематиках необъятный пласт задач, которые очевидно нужно решать. Даже если смотреть узко через тематику ИИ. Да, много чего можно делать и самостоятельно, но под зонтиком Физтеха это делать значительно легче. Бренд МФТИ работает как магнит и гарант качества одновременно: сюда тянутся люди, готовые помочь, а те, кому нужна помощь, верят в открытость начинаний.
Такой сплав, который описал выше, сложно найти где-то еще. Минусы будут везде, о них даже вспоминать не будем: сегодня они, может, и правда мешают и заставляют переживать, но на горизонте о них даже и не вспомнишь.
— У вас в лаборатории около 100 человек. Как выстроена работа с таким количеством студентов, чтобы каждый действительно занимался исследованиями уровня A*, а не просто «числился»?
— Три года назад ко мне пришел большой набор ребят, с которыми мы начали активно работать и вместе расти над собой. Сейчас эти ребята и составляют ядро команды. Я бы описал концепцию лаборатории как «контролируемый хаос». Ребята-лиды занимаются различными тематиками, мы в этом плане сильно разрослись, но при этом между всеми этими тематиками можно найти массу пересечений — и это ценно! К лидам присоединятся новые ребята, и тут у нас тоже нет ограничений (особенно на ранних этапах): ребята могут пробовать себя в нескольких проектах у разных руководителей, чтобы найти задачу по душе. При этом младшие ребята находятся под кураторством даже не одного, а сразу нескольких тим-лидов — за вовлеченностью мы сильно следим.
С одной стороны, это хаос. С другой — это движение в большое число сторон, но не обособленно, а сильно переплетаясь с командами по другим направлениям. Конструкция сама по себе получается устойчивой за счет этого. Да, она сложнее, чем линейные команды разработки,— контролировать такого рода структуру иногда требует больше усилий. Но верю, что это тот самый формат для того, чтобы существовать на фронтире науки, и решения реальных прикладных задач.
— Многие молодые исследователи жалуются, что руководители кладут свои идеи на студентов, а студенты превращаются в дешевую рабочую силу без собственного научного роста. А как у вас? Чьи темы решаются в лаборатории — ваши или студентов? Кто приносит идеи?
— Не для того мы со старшими ребятами прошли такой путь, длиной три года, чтобы мне дальше можно было единолично рулить уже крутыми исследователями! Нет цели учить их жизни, все как раз наоборот: я очень жду, когда они меня будут учить! Каждый день я ощущаю, что могу дать моим старшим ребятам все меньше и меньше. Это нормально. Когда-то мы вместе радовались их первым шагам и успехам, вместе проходили через неудачи и несправедливости. И было очень тепло на душе в момент, когда видишь полноценную самостоятельность и автономность в их исполнении. У них есть все возможности, чтобы знать больше меня, уметь больше меня, при этом эффективно использовать тот опыт, который у меня скопился. Круто, что они этими возможностями активно пользуются. Очень надеюсь, что каждый из них сможет перерасти меня во многих аспектах. Это и есть прогресс, развитие и движение вперед! Ставлю ли я им задачи? Иногда да, редко явно, чаще неявно и в совместных обсуждениях. Но многое, что сейчас развивается у нас,— это идеи ребят, отвалидированные и отполированные друг об друга и об меня. Ведь ничто так не вдохновляет, как задача, которой ты искренне готов заниматься: в субботу, в воскресенье, поздно ночью и на рассвете, с продуктивностью китайца (восхищаюсь тут нашими коллегами из Поднебесной).
Хотя стоит оговориться, что в озвученной в вопросе схеме взаимодействия ничего плохого не вижу. Все сильно зависит от области и конкретных людей.
— Какого студента вы считаете неудачей? Если человек проучился у вас два года, не написал хорошую статью и ушел в обычную IT-компанию писать бэкенд — это провал вашей системы или нормальный исход?
— Одна из главных фишек системы Физтеха, которую заложили отцы-основатели,— это возможность раннего старта в науке. В районе третьего-четвертого курса студент распределяется на базовую кафедру, расположенную в исследовательском институте, либо же на Физтехе в пределах наших научных групп, и уже на старте один—три учебных дня он тратит на активности в рамках базовой кафедры. В последние годы грань немного сместилась в сторону второго-третьего курса, кроме того, среди базовых кафедр появились IT-компании, но суть осталась прежней — это возможность как можно раньше погрузиться в реальные исследовательские задачи.
И по-хорошему, любой студент, раз уже он поступил на Физтех, должен попробовать себя на научном поприще.
Полноценно уйти в IT легко, а вот вернуться обратно значительно сложнее, даже если появилось желание. Поэтому вот тот пример, что озвучили,— это скорее одна из правильных траекторий для выпускника Физтеха: честно, без халтуры попробовал себя в науке — не получилось, пошел дальше. Как это можно называть неудачей? Более того, мы же не знаем, с каким запасом знаний он ушел на плечах. Может, он настолько погрузился в мультиагентные системы на основе генеративных моделей, что может настроить себе не просто хороший вспомогательный инструмент, а целый оркестр, который будет кодить как 100 программистов. А потом еще сделает стартап по разработке. А все почему? Потому что реально владеет передним краем технологии и не боится за него выходить, чтобы получить что-то новое,— это ценный навык, который развивает научная деятельность.
Да и вообще у нас в лаборатории таких случаев вообще не было, все ребята, кто уходил от нас, через два года работы оставались на научном поприще и чаще всего шли на повышение в лучшие научные группы по всему миру.
— Вы защитились в 27. Если представить, что у вас появится студент с таким же потенциалом и амбициями, сколько времени ему потребуется сегодня? Какие этапы стали длиннее, какие короче по сравнению с вашим путем?
— В моей текущей картине мира в первую очередь это я должен думать о защитах и слегка тормошить ребят по этому поводу. Очень надеюсь, что уже сейчас получается создавать такую научную среду для молодых ребят, в которой мысли о защите их посещают далеко не в первую очередь. Кандидатская — это не самоцель, все идет от задачи, которую решаешь. И жить надо именно ей, какой бы она ни была: сложной фундаментальной проблемой на перспективу или более прикладной и инженерной разработкой, которая нужна обществу здесь и сейчас. Но если у ребят хватит времени и желания еще и на оперативную защиту кандидатской и докторской диссертаций, то можно попробовать пройти этот путь еще быстрее, чем вышло у меня.
— Как вы думаете, зачем сегодня молодым людям идти в науку?
— Чтобы жить интересными задачами, решение которых сделают этот мир чуточку лучше!