По данным РАН, в России с начала XX века вымерли или заснули 15 языков, а под угрозой исчезновения находятся около 150 языков малых народов. В условиях глобализации непросто приходится даже русскому языку, который постоянно пополняется иностранными заимствованиями и англицизмами.

Выйти из полноэкранного режима Развернуть на весь экран Чум потомственных оленеводов, Ханты-Мансийский автономный округ

Фото: Юрий Кавер / РИА Новости Чум потомственных оленеводов, Ханты-Мансийский автономный округ

Фото: Юрий Кавер / РИА Новости

Языкам малых народов приходится значительно хуже: им практически невозможно конкурировать с языками-миллионниками.

На грани исчезновения

Россия — многоязычная страна, где наряду с русским в обиходе используются десятки языков малых народов, но многие из них находятся на грани исчезновения. Считается, что под угрозой — около 10%, более 60% приближаются к этой границе, а вполне благополучными можно признать только 7%. Яркие примеры исчезающих языков — ханты и манси (финно-угорские языки, численность носителей которых крайне мала), водский (родственный эстонскому и финскому языкам, практически потерянный в результате ассимиляции), удэгейский (язык небольшого этноса Дальнего Востока, стремительно утрачивающийся из-за миграций и перехода на русский язык) и др.

Почему это происходит

Главные факторы, ускоряющие исчезновение языков,— урбанизация, миграция в крупные города, переход образования преимущественно на русский язык, отсутствие медийной среды для малых языков. Влияние глобализации лишь усиливает этот процесс: интернет и массовая культура задают стандарты общения, вытесняя локальные практики.

Как показывают социолингвистические опросы, на жизнеспособность языков влияют миграционные процессы, демография, увеличение количества межнациональных браков, реформы в системе образования (в частности, внедрение системы ЕГЭ, сокращение количества часов на изучение родных языков, прием заявлений от родителей на изучение родных языков), низкая востребованность национального языка для карьерного роста и др.

В итоге люди переходят на языки большинства, потому что это удобнее: это может открыть им доступ к образованию, карьере. Язык исчезает, когда его не усваивают дети, младшее поколение, которое увлечено интернетом. Они смотрят сериалы и слушают песни на более распространенных языках, потому что в их родном даже нет слов, связанных с современностью.

Зачем сохранять языки

Язык — это не просто инструмент общения, но и стержень этнической идентичности. Если язык умирает, то и сам этнос исчезает в культурном плане: забывает свою историю, традиции и уникальные знания о природе, традициях, мировоззрении народа.

Для лингвистики сохранение языков малых народов важно потому, что эти языки часто обладают уникальными фонетическими системами, грамматическими структурами и лексическими особенностями. Изучение редких и исчезающих языков способствует восстановлению исторических связей между народами, развитию теорий о происхождении и эволюции языков, а также помогает понять, как язык связан с культурой и мышлением.

Кроме того, многоязычие — важнейший элемент человеческого культурного и интеллектуального богатства. Неслучайно уже сформировалось такое научное направление, как эколингвистика, которая исследует отношения между человеческими языками и окружающей средой. В его основе лежит утверждение профессора Университета Пенсильвании Ларри Горенфло о том, что «сокращение лингвистического разнообразия ведет к сокращению биоразнообразия». Иными словами, языковое разнообразие — это ресурс для достижения гармоничного сосуществования человека и природы.

Методы и технологии

Для сохранения языков используются разные подходы: образовательные программы в школах, создание словарей и грамматик, выпуск книг и учебников, проекты по документированию устной речи. Однако ключевым фактором становится вовлечение молодежи и использование современных технологий.

Сегодня в России ведется большая работа, направленная на сохранение языкового и культурного многообразия нашей страны. Например, создаются специальные институты, курирующие вопросы этнокультурного образования, сохранения материального наследия народов России и др. Совершенствуются законы, связанные с функционированием языков. В условиях распространения ИИ преимущество получают те языки, которые обладают значительной ресурсной базой: большим количеством носителей и обширным массивом текстового, аудио- и видеоконтента. Это позволяет эффективно использовать данные языка для обучения ИИ-моделей. Фактически такой язык сначала оцифровывают, а затем на его основе тренируют алгоритмы. Языки, которые не пройдут этап цифровизации, по сути, обречены на вымирание. Поэтому сегодня цифровизация языка — ключевой фактор для его сохранения.

Специалисты из различных регионов нашей страны сегодня занимаются решением этих задач. Например, с конца 2019 года сотрудники отдела филологических исследований Удмуртского института истории, языка и литературы УдмФИЦ УрО РАН собирают монокорпус удмуртского языка (это тексты, написанные на одном языке, без перевода; они помогают обучать модели структуре языка лучше, чем учебники и правила грамматики). Объем этого монокорпуса сейчас составляет более 10 млн словоупотреблений. Кроме того, с 1 августа прошлого года реализуется проект «Русско-удмуртский параллельный корпус: разработка инструментария и сопоставительные исследования», который финансируется за счет средств гранта РНФ №24-78-10041. В рамках этого проекта собирается параллельный русско-удмуртский корпус, состоящий из русских оригинальных текстов и их переводов на удмуртский язык. Он станет основой для сопоставительных исследований и послужит базой для машинного перевода на нейросетях.

В конце ноября 2024 года УдмФИЦ УрО РАН и «Яндекс» подписали договор о научно-техническом сотрудничестве, чтобы расширить использование удмуртского языка в интернете. Уже сейчас перевод с русского языка на удмуртский в «Яндекс Переводчике» стал значительно лучше. Также проведена масштабная работа по созданию технологий синтеза и распознавания речи на удмуртском языке, которые в ближайшее время будут интегрированы в сервисы «Яндекса».

Следующий этап цифровизации удмуртского языка — создание продуктов на основе искусственного интеллекта. Так, качественный машинный переводчик в сочетании с синтезатором удмуртской речи откроет возможность для синхронного перевода, в том числе озвучивания мультфильмов на родном языке. Этот контент играет ключевую роль в формировании языковых навыков у детей и является важным инструментом их воспитания.

Наталья Кондратьева, д. ф. н., в. н. с. отдела филологических исследований Удмуртского института истории, языка и литературы УдмФИЦ УрО РАН