Исчезающие голоса
Как сохраняют языки малых народов в эпоху глобализации
По данным РАН, в России с начала XX века вымерли или заснули 15 языков, а под угрозой исчезновения находятся около 150 языков малых народов. В условиях глобализации непросто приходится даже русскому языку, который постоянно пополняется иностранными заимствованиями и англицизмами.
Чум потомственных оленеводов, Ханты-Мансийский автономный округ
Фото: Юрий Кавер / РИА Новости
Чум потомственных оленеводов, Ханты-Мансийский автономный округ
Фото: Юрий Кавер / РИА Новости
Языкам малых народов приходится значительно хуже: им практически невозможно конкурировать с языками-миллионниками.
На грани исчезновения
Россия — многоязычная страна, где наряду с русским в обиходе используются десятки языков малых народов, но многие из них находятся на грани исчезновения. Считается, что под угрозой — около 10%, более 60% приближаются к этой границе, а вполне благополучными можно признать только 7%. Яркие примеры исчезающих языков — ханты и манси (финно-угорские языки, численность носителей которых крайне мала), водский (родственный эстонскому и финскому языкам, практически потерянный в результате ассимиляции), удэгейский (язык небольшого этноса Дальнего Востока, стремительно утрачивающийся из-за миграций и перехода на русский язык) и др.
Почему это происходит
Главные факторы, ускоряющие исчезновение языков,— урбанизация, миграция в крупные города, переход образования преимущественно на русский язык, отсутствие медийной среды для малых языков. Влияние глобализации лишь усиливает этот процесс: интернет и массовая культура задают стандарты общения, вытесняя локальные практики.
Как показывают социолингвистические опросы, на жизнеспособность языков влияют миграционные процессы, демография, увеличение количества межнациональных браков, реформы в системе образования (в частности, внедрение системы ЕГЭ, сокращение количества часов на изучение родных языков, прием заявлений от родителей на изучение родных языков), низкая востребованность национального языка для карьерного роста и др.
В итоге люди переходят на языки большинства, потому что это удобнее: это может открыть им доступ к образованию, карьере. Язык исчезает, когда его не усваивают дети, младшее поколение, которое увлечено интернетом. Они смотрят сериалы и слушают песни на более распространенных языках, потому что в их родном даже нет слов, связанных с современностью.
Зачем сохранять языки
Язык — это не просто инструмент общения, но и стержень этнической идентичности. Если язык умирает, то и сам этнос исчезает в культурном плане: забывает свою историю, традиции и уникальные знания о природе, традициях, мировоззрении народа.
Для лингвистики сохранение языков малых народов важно потому, что эти языки часто обладают уникальными фонетическими системами, грамматическими структурами и лексическими особенностями. Изучение редких и исчезающих языков способствует восстановлению исторических связей между народами, развитию теорий о происхождении и эволюции языков, а также помогает понять, как язык связан с культурой и мышлением.
Кроме того, многоязычие — важнейший элемент человеческого культурного и интеллектуального богатства. Неслучайно уже сформировалось такое научное направление, как эколингвистика, которая исследует отношения между человеческими языками и окружающей средой. В его основе лежит утверждение профессора Университета Пенсильвании Ларри Горенфло о том, что «сокращение лингвистического разнообразия ведет к сокращению биоразнообразия». Иными словами, языковое разнообразие — это ресурс для достижения гармоничного сосуществования человека и природы.
Методы и технологии
Для сохранения языков используются разные подходы: образовательные программы в школах, создание словарей и грамматик, выпуск книг и учебников, проекты по документированию устной речи. Однако ключевым фактором становится вовлечение молодежи и использование современных технологий.
Сегодня в России ведется большая работа, направленная на сохранение языкового и культурного многообразия нашей страны. Например, создаются специальные институты, курирующие вопросы этнокультурного образования, сохранения материального наследия народов России и др. Совершенствуются законы, связанные с функционированием языков. В условиях распространения ИИ преимущество получают те языки, которые обладают значительной ресурсной базой: большим количеством носителей и обширным массивом текстового, аудио- и видеоконтента. Это позволяет эффективно использовать данные языка для обучения ИИ-моделей. Фактически такой язык сначала оцифровывают, а затем на его основе тренируют алгоритмы. Языки, которые не пройдут этап цифровизации, по сути, обречены на вымирание. Поэтому сегодня цифровизация языка — ключевой фактор для его сохранения.
Специалисты из различных регионов нашей страны сегодня занимаются решением этих задач. Например, с конца 2019 года сотрудники отдела филологических исследований Удмуртского института истории, языка и литературы УдмФИЦ УрО РАН собирают монокорпус удмуртского языка (это тексты, написанные на одном языке, без перевода; они помогают обучать модели структуре языка лучше, чем учебники и правила грамматики). Объем этого монокорпуса сейчас составляет более 10 млн словоупотреблений. Кроме того, с 1 августа прошлого года реализуется проект «Русско-удмуртский параллельный корпус: разработка инструментария и сопоставительные исследования», который финансируется за счет средств гранта РНФ №24-78-10041. В рамках этого проекта собирается параллельный русско-удмуртский корпус, состоящий из русских оригинальных текстов и их переводов на удмуртский язык. Он станет основой для сопоставительных исследований и послужит базой для машинного перевода на нейросетях.
В конце ноября 2024 года УдмФИЦ УрО РАН и «Яндекс» подписали договор о научно-техническом сотрудничестве, чтобы расширить использование удмуртского языка в интернете. Уже сейчас перевод с русского языка на удмуртский в «Яндекс Переводчике» стал значительно лучше. Также проведена масштабная работа по созданию технологий синтеза и распознавания речи на удмуртском языке, которые в ближайшее время будут интегрированы в сервисы «Яндекса».
Следующий этап цифровизации удмуртского языка — создание продуктов на основе искусственного интеллекта. Так, качественный машинный переводчик в сочетании с синтезатором удмуртской речи откроет возможность для синхронного перевода, в том числе озвучивания мультфильмов на родном языке. Этот контент играет ключевую роль в формировании языковых навыков у детей и является важным инструментом их воспитания.