Российская компания «Яндекс» опубликовала нейросеть YaLM 100B, позволяющую генерировать и обрабатывать тексты на русском и английском языках. В компании утверждают, что это самая большая GPT-подобная нейросеть в открытом доступе.
Нейросеть YaLM 100B позволяет генерировать тексты любых видов (поздравления, стихи, ответы и др.), а также классифицировать их, например, по стилю речи. Также нейросеть поможет при разработке рекламной кампании, создания описания видео или товара. С более чем 100 млрд параметров YaLM 100B нейросеть является самой объемной из доступных моделей на русском языке.
В основе системы законы лингвистики и представления о мире, определяющие принцип построения текста и позволяющие генерировать новые. Во время обучения YaLM 100B обработала около 2 ТБ текстов из открытых источников на английском и русском языках.
«Яндекс» уже использует YaLM 100B в более чем 20 проектах, в том числе в голосовом помощнике «Алиса» и поисковике, а также в ответах на обращения, для генерации объявлений, описаний сайтов и подготовке быстрых ответов. Как заявил генеральный директор «Яндекс Технологий» Петр Попов: «Выкладывая YaLM 100B в открытый доступ, мы рассчитываем, что это даст толчок развитию генеративных нейросетей».
Еще больше новостей — в Telegram-канале «Коммерсантъ».