Нейросеть GigaChat получила для обучения тексты на удмуртском языке от «Рувики»
Интернет-энциклопедия «Рувики» передала данные для обучения нейросети GigaChat (Сбер) 20 языкам народов РФ, в их числе удмуртский, пишет «Лента.ру».
Фото: Анатолий Жданов, Коммерсантъ
Фото: Анатолий Жданов, Коммерсантъ
«На основе собранных волонтерами энциклопедических статей генеративный ИИ будет осваивать языки народов России, что позволит не только повысить качество генерации текстов на них, но и сохранить уникальное культурное наследие в цифровую эпоху»,— говорится в сообщении.
Помимо удмуртского, в числе языков находятся алтайский, башкирский, бурятский, вепсский, горномарийский, ингушский, коми, коми-пермяцкий, марийский, мокшанский, ливии-карельский, татарский, тувинский, калмыцкий, хакасский, чеченский, чувашский, эрзянский и якутский.
Сбер открыл доступ к GigaChat для всех в сентябре 2023 года. Она способна генерировать тексты, создавать и распознавать изображения, писать код, работать с файлами различных форматов и др. В марте 2024 года журнал Arabian Business отнес нейросеть к числу 10 лучших больших языковых моделей в мире (четвертое место). В марте 2025 года появился GigaChat 2.0.
Интернет-энциклопедия «Рувики» была анонсирована в мае 2023 году. Является аналогом «Википедии». На сайте портала указано, что на платформе размещено более 2,1 млн статей.