«Если технология уже на хайпе — значит, вы опоздали»

Глава R&D-центра «Авито» Александр Рыжков о том, зачем компаниям вкладываться в прикладную науку

Крупный бизнес все чаще переходит от использования готовых технологических решений к собственным разработкам. Для этого компании открывают исследовательские подразделения, R&D (Research and Development), которые не только исследуют технологии будущего, но и сразу встраивают их в существующие бизнес-процессы. О том, как и для чего это нужно, зачем R&D-центру нужны студенты, и какие перспективы у российского рынка ИИ, «Ъ-Технологиям» рассказал глава центра исследований и разработок «Авито» Александр Рыжков.

Фото: Предоставлено пресс-службой «Авито»

Фото: Предоставлено пресс-службой «Авито»

— Вы запустили R&D-центр в прошлом году. Зачем это было нужно?

— Главная задача была в том, чтобы побороть классическую для разных компаний ситуацию, когда в использовании пионерских технологий ты неожиданно для себя оказываешься в состоянии догоняющего. Вот простой пример: сегодня у нас на хайпе технология Х, ее все обсуждают, делятся кейсами применения. Компания понимает это и решает, что ей тоже нужно применять эту технологию, и начинает поиск подходящих специалистов внутри и на рынке. Параллельно со сбором команды происходит дополнительный ресерч, приходит понимание, под какие задачи бизнеса подойдет эта технология. И вот спустя полтора-два года наступает момент: «Ура, о чудо», технологию готовы внедрять, но к этому моменту на хайпе уже технология Y, а X отошла на второй план. Чтобы таких историй не происходило, и ты не находился в режиме догоняющего, нужны все-таки команды, которые занимаются исследованием новых технологий заранее. И когда эта технология выходит на хайп, у нас она уже есть внутри, и с ее использованием можем в этой области становиться лидерами рынка.

— А какие есть направления разработки?

— Сейчас наш R&D-центр выстроен в формате нескольких стримов. Первый – генеративное компьютерное зрение: технологии создания изображений и видео сегодня развиваются стремительно, и мы уже видим здесь конкретные кейсы, полезные для бизнеса, активно растем и движемся вперед вместе со всей индустрией.

Второе направление – голосовые технологии и синтез речи. Речь идет о развитии голосовых ассистентов, с которыми можно было бы общаться почти так же естественно и свободно, как с человеком. Почти – потому что пользователь все-таки должен понимать, что он общается с машиной.

Третье – разработка универсальных эмбеддингов. Здесь надо пояснить, что такое эмбеддинг – способ перевести любую информацию в набор чисел, понятный машине. Фотографию, звук, историю действий любого пользователя можно «сжать» до компактной числовой записи, которая при этом сохраняет всю суть исходных данных. Ценность такой записи в ее универсальности: одни и те же эмбеддинги работают сразу для множества задач без необходимости каждый раз заново обрабатывать «сырые» данные. Например, на основе того, как человек пользуется приложением, можно с высокой точностью предсказать, купит ли он автомобиль в ближайший месяц. Эмбеддинги помогут предсказать склонность пользователя к покупке, подобрать релевантный контент, улучшить качество рекомендаций и так далее.

Принципиально важно понимать разницу между тем, чем мы занимаемся, и академической наукой в классическом смысле – мы работаем над технологиями, которые улучшают многие основополагающие системы внутри «Авито». Академическая наука может позволить себе работать ради научной новизны, а в бизнесе это скорее роскошь. Именно поэтому мы занимаемся прикладными исследованиями, и каждая наша разработка направлена на решение конкретных бизнес-задач.

— Как работает центр?

— Как правило, у каждой технологии, которую мы разрабатываем, одновременно есть несколько заказчиков – внутренних команд «Авито», отвечающих за те или иные сервисы. При этом их ситуации могут заметно различаться: у одной команды смещаются приоритеты, и наша разработка временно уходит на второй план; у другой данные требуют долгой доработки; с третьей удается довести решение до результата быстрее.

Процесс работы я обычно описываю через образ пальмы, в котором ствол – это базовая технология, где 80% работы делается в едином формате, а листья – ответвления под конкретные задачи каждого заказчика. Сначала мы выстраиваем общую часть, а уже потом адаптируем ее под нужды бизнеса.

— Ранее вы заявляли, что в R&D-центр планируется вложить 1 млрд руб. до 2028 года. На что эти деньги направятся?

— Прежде всего, нам необходимы специалисты достаточно высокой квалификации – не просто умеющие строить базовые модели ИИ, но способные придумывать новые технологии, глубоко разбираться в постоянно меняющихся трендах машинного обучения и при этом хорошо понимать, как устроен бизнес и продуктовые процессы.

Второй момент – инфраструктура. Создать по-настоящему прорывное решение технически возможно и на стандартном десктопном компьютере с парой ядер и 4 ГБ памяти, но это крайне долго и трудоемко: качественные вычислительные мощности в нашей сфере не роскошь, а необходимое условие достижения результата.

Наконец, развитие в исследовательской области невозможно силами только внутренней команды, поэтому часть ресурсов мы целенаправленно вкладываем во взаимодействие с внешним сообществом – университетами, независимыми лабораториями и отдельными исследователями. R&D – это та область, где синергия с широким комьюнити не просто полезна, а во многом определяет качество результата.

— Вы говорили, что вам нужны специалисты высокого уровня, но при этом упомянули вузы. Причем тут они?

— Найти эксперта высокого уровня в конкретной технологии – задача непростая. На рынке очень мало специалистов, которые способны не просто применять модели, а придумывать новые подходы, и большинство из них уже связаны с какой-то компанией. Поэтому мы стараемся работать с будущими специалистами еще на этапе университета и сокращать разрыв между вузом и индустрией: студентам даем те же задачи, которые решают наши сотрудники. В такой модели зачастую вырастить человека, который прошел с тобой огонь, воду и медные трубы, оказывается существенно проще, чем искать готового на рынке. Ты понимаешь, как подготовить его к решению конкретной задачи или работе с конкретной технологией: можешь заранее рассказать, какие артефакты встречаются в данных, дать возможность самому пройти через все сложности, напороться на грабли – и разобраться в них, при этом не оставляя без поддержки, объясняя ошибки, выступая ментором. Человек, быстро проживший этот опыт рядом со старшими коллегами и сделавший работу над ошибками, развивается несравнимо быстрее – и в итоге становится ценным специалистом, способным по-настоящему усилить команду.

— А как с вузами работа строится?

— Один из наших подходов – собственные магистерские и бакалаврские программы в МФТИ, ИТМО и ВШЭ. Только в моей команде сейчас работают стажерами три человека оттуда, да и в других отделах ребята с этих программ тоже есть. Важно, что лекции и курсы в магистратурах читают не приглашенные теоретики, а люди, которые реально работают в «Авито» и на собственном опыте понимают, что работает на практике, а что нет – то есть буквально рассказывают о том, с чем сами сталкиваются каждый день. Помимо этого, у нас есть планы на совместные с университетами научно-исследовательские работы, и мы активно движемся в этом направлении.

— А как правильно выстраивать работу со студентами в ситуации, когда учатся они долго, а технологии меняются очень быстро?

— Мои преподаватели когда-то говорили: «В университете тебя учат тому, как нужно учиться». Эта мысль точно отражает и нашу логику: задача не в том, чтобы научить человека работать с конкретной технологией, важнее объяснить, как находить интересные решения, как разбираться в сырых и недоработанных репозиториях, как доводить их до рабочего состояния. Мы учим не привязываться к конкретному инструменту, а понимать его суть: как технология устроена и где у нее потенциально слабые места. В конечном счете наша цель – не передать набор навыков, а сформировать сам подход к обучению и развитию в мире, где все меняется быстрее, чем успеваешь освоить предыдущее.

— А как вы измеряете реальную пользу для бизнеса от обучения кадров?

— Измеряем результаты стажеров ровно так же, как и у обычных сотрудников: смотрим на результаты, которые ребята показывают в работе, пусть пока и не самостоятельно, а под руководством более опытных коллег.

При этом обучение строится на реальных бизнес-задачах, а не на модельных примерах вроде предсказания выживаемости на «Титанике». Здесь работает простая истина: сложно научиться решать прикладные задачи, не решая прикладные задачи. Столкнувшись с реальной проблемой впервые, человек рискует просто упереться в стену и не понять, куда двигаться дальше – именно поэтому рядом всегда есть ментор, который не даст готового ответа, но поможет найти верное направление.

Отдельно мы стараемся научить стажеров не бояться задавать вопросы. Самостоятельно разбираться в сложном – крайне полезный навык, и мы его поощряем, но если что-то совсем не идет, лучше спросить и продвинуться вперед, чем неделю биться об одно и то же место.

— А если говорить про ИИ в целом, компания заявляла, что вложит 12 млрд руб. в ИИ. Как планируется окупать эти деньги? И на что они пойдут?

— Как мы уже говорили, для серьезной работы нужны квалифицированные кадры, мощная инфраструктура и партнерство с университетами. Но важно понимать: это не абстрактные вложения в исследования ради исследований. На тех же вычислительных мощностях, которые обеспечивают работу R&D-центра, запускаются и наши ИИ-ассистенты «Ави» и «Ави Pro» – их тестирование началось в прошлом году и уже меняет то, как люди взаимодействуют с платформой.

Раньше поиск на «Авито» работал по простой логике: знаешь, что хочешь – вводишь запрос, находишь товар. Но что делать, если запрос еще не сформулирован? Человек знает, что хочет купить машину, но не знает какую, и если написать в поиск просто «машина», получишь тысячи результатов и растеряешься. Ассистент работает иначе: он уточняет, для чего нужна машина: ездить на работу, выбираться на дачу или что-то еще, и постепенно сужает выбор до действительно подходящих вариантов, помогая человеку понять, чего он на самом деле хочет. Это стало возможным только с появлением ИИ и уже заметно влияет на конверсию в сделку.

Именно на стыке R&D и бизнеса и будут появляться новые сервисы, которые позволят «Авито» сохранять лидерские позиции в своей области. А значит, все вложения, и в исследования, и в инфраструктуру, должны не просто окупиться, но и принести платформе реальный рост.

— Насколько ИИ для «Авито» — это вообще отдельное направление бизнеса, а не дополнение к основным продуктам?

— На этот вопрос можно смотреть по-разному. Разговоры о повсеместной ИИ-трансформации, которые мы все слышим, по большей части отражают реальность: сегодня практически любой продукт, выходящий на рынок, так или иначе включает в себя искусственный интеллект. ИИ давно вышел за рамки отдельной технологической ниши и стал частью того, как строится бизнес в целом. Именно поэтому выделить его в самостоятельное направление у нас, честно говоря, не получится: это было бы упрощением. Искусственный интеллект встроен в основу всего, что делает «Авито», и когда мы хотим сделать продукт лучше, мы работаем с моделями, которые стоят внутри каждого из них, и именно через это достигаем нужного качества.

— А какие сейчас тренды на российском рынке ИИ вы выделяете?

— Сейчас ИИ-агенты повсюду, и индустрия переживает важный переход: от монолитных решений к мультиагентной архитектуре, где несколько автономных агентов взаимодействуют ради достижения общих целей. Это серьезный вызов для всего рынка, потому что выстроить такую систему – значит буквально разобрать свой бизнес на части: понять, как агенты должны взаимодействовать между собой, что каждый из них видит, а что нет, и в каком формате один должен отвечать, чтобы другой корректно его понял.

При этом рынок движется настолько быстро, что обучать каждую модель с нуля – дорого и по человеческим, и по вычислительным ресурсам. Поэтому здесь важен баланс: с одной стороны, нужно успевать подхватывать опенсорс-решения по мере их появления, с другой – уметь грамотно их отбирать: из условных ста моделей, выходящих в месяц, находить те десять-пятнадцать, которые действительно подходят под твои задачи.

— А что может сдержать рост российского рынка ИИ?

— Инфраструктурные ограничения создают определенные сложности, однако индустрия находит способы с ними работать. С точки зрения кадров дефицит специалистов был, есть и, скорее всего, останется. Именно поэтому мы инвестируем в подготовку людей на уровне магистратуры: интересных задач становится все больше, а нужные компетенции сами по себе не появляются так быстро, их приходится формировать самостоятельно.

Отдельный вызов – растущая сложность самих моделей. Раньше все было относительно просто: система получала данные, проходила через стандартный цикл обучения, и модель была готова к работе достаточно быстро. Сегодня картина другая — агентные модели требуют куда большего: нужно найти подходящие данные, правильно дообучить модель, подобрать промпты, настроить взаимодействие компонентов, и это лишь часть работы. В результате время от идеи до запуска заметно выросло, а вместе с ним и требования: к квалификации команды, к вычислительным мощностям, а в ряде случаев и ко времени на разработку.

— На искусственный интеллект есть две точки зрения: ИИ — это пузырь и ИИ — это новая технологическая революция. Вы как считаете?

— Я работаю с искусственным интеллектом уже 15 лет и разговоры о том, что ИИ — это пузырь, слышу примерно столько же. Определенный перегрев рынка и завышенные ожидания действительно есть, поскольку это довольно типичная история для любой большой технологической волны. Но индустрия при этом растет: технологий становится больше, компании и люди используют ИИ все активнее, и это неслучайно. ИИ уже меняет целые отрасли и то, как устроен наш мир – это не временное увлечение, а технология, которая останется с нами надолго и будет только расширять свое присутствие.

При этом важно не питать иллюзий: ИИ – не серебряная пуля и не решит в одночасье всех проблем человечества. Это очень мощный инструмент, который берет на себя рутину и освобождает время для более осмысленной работы: направлять, выстраивать, принимать решения. Путь от идеи до рабочего прототипа, который раньше занимал год кропотливой работы, сегодня можно пройти за несколько дней – и это и есть реальная ценность.

— Представьте R&D-центр «Авито» через 10 лет. Чем он занимается?

— Сейчас мы активно создаем инновационные решения, по которым планируем публиковать исследовательские статьи и выходить на ведущие конференции по машинному обучению. Наша амбиция – стать одним из значимых исследовательских центров в своей области. Но поскольку мы прежде всего технологическая компания, для нас важно не просто присутствовать в научном сообществе, а создавать фундаментальные решения, которые меняют индустрию, а для этого нужно быть заметными на рынке и притягивать сильных людей.

При этом мы сознательно избегаем жесткой привязки к конкретным архитектурам или подходам. В мире, где технологии меняются стремительно, гибкость – одно из главных преимуществ: нам важно уметь быстро адаптироваться, переключаться и находить для бизнеса «Авито» решение, которое действительно работает лучше всего.

Интервью взял Дмитрий Шер