Оптический искусственный интеллект
Оптические нейросети станут основой новой архитектуры вычислительных систем
Бурное развитие вычислительно емких направлений — от ядерной энергетики до космических технологий — уже ко второй половине ХХ века выявило фундаментальное ограничение: классические электронные вычислительные системы не всегда обеспечивают необходимую скорость обработки. По мере роста сложности задач — от моделирования физических процессов до анализа больших данных — это ограничение становилось все более критичным. В этих условиях оптика начала рассматриваться как альтернативная вычислительная среда. Здесь обработка информации идет за счет физических свойств света, а не электронных компонентов, что позволяет реализовать принципиально иной уровень параллелизма и скорости.
Установка аналогового фотонного вычислителя на базе гибридной 4F-архитектуры
Фото: Самарский университет им. Королёва
Установка аналогового фотонного вычислителя на базе гибридной 4F-архитектуры
Фото: Самарский университет им. Королёва
ВИИЭФ (Российский федеральный ядерный центр — Всероссийский научно-исследовательский институт экспериментальной физики).
На раннем этапе (основан в 1946 году) — важнейший научный и экспериментальный центр атомного проекта. Именно здесь разработаны советские атомная и водородная бомбы. Сейчас является крупным научным центром не только военного назначения. Расположен в Сарове Нижегородской области.
Тематика оптической обработки информации берет начало с публикации Вандер Люгта 1964 года. Предложенная им 4F-система с дифракционной структурой в частотной плоскости стала стандартным инструментом для оптических вычислений. Уже в 1970–1980-е годы на ее основе рассматривалась возможность создания аналоговых вычислительных машин, способных обеспечить высокий уровень параллелизма и значительно повысить скорость обработки сигналов, особенно в задачах обработки изображений, корреляционного анализа и фильтрации данных.
Современный этап развития связан с появлением оптических и гибридных оптико-цифровых нейросетей. Новейшие исследования сосредоточены на использовании дифракционно-оптических структур и гибридных архитектур, сочетающих преимущества оптических и цифровых вычислений. По ключевым параметрам, прежде всего энергоэффективности, такие системы на порядки превосходят традиционные архитектуры. Эти системы рассматриваются как потенциальная основа будущих ИИ-систем, особенно в условиях стремительного роста энергопотребления современных дата-центров и вычислительных кластеров.
Вообще-то, идея реализации нейронных сетей с помощью оптики не нова: еще в 1990-е годы были проработаны базовые принципы, включая проблему нелинейных преобразований. Тогда эти подходы оставались в основном теоретическими, однако развитие технологий производства микро- и нанооптических элементов, а также рост интереса к энергоэффективным вычислениям позволили вернуть их в актуальную повестку.
В Самарском университете в рамках проекта с ВНИИЭФ создана установка аналогового фотонного вычислителя на базе гибридной 4F-архитектуры. В задаче распознавания рукописных символов достигнута точность 98,7%. При анализе последовательности изображений итоговая точность превысила 96%. Эффективность системы оказалась в 3,5 раза выше, чем у NVIDIA Tesla H100, что демонстрирует не только теоретический, но и практический потенциал фотонных вычислений в прикладных задачах и сценариях обработки данных.
NVIDIA Tesla H100 — высокопроизводительный графический процессор. Один из мировых стандартов для работы с тяжелыми моделями искусственного интеллекта.
4F-архитектура — одна из стандартных оптических схем. Состоит из двух линз и имеет общую длину, равную четырем фокусным расстояниям, отсюда ее название.
Отдельным направлением являются оптические трансформеры — архитектуры, лежащие в основе современных моделей искусственного интеллекта. Их ключевые преимущества — высокая скорость и низкое энергопотребление, однако традиционно они уступали цифровым решениям по точности, что ограничивало их применение в реальных задачах и масштабируемых системах.
Предложенный в Самарском университете подход позволяет преодолеть это ограничение. Численная модель оптического матричного умножения встроена непосредственно в процесс обучения нейросети, благодаря чему система адаптируется к физике вычислений и компенсирует погрешности. Параметры умножения становятся обучаемыми и подстраиваются под конкретную задачу, что фактически превращает математическую операцию в адаптивный элемент архитектуры и расширяет возможности оптимизации моделей.
Установка аналогового фотонного вычислителя на базе гибридной 4F-архитектуры
Фото: Самарский университет им. Королёва
Установка аналогового фотонного вычислителя на базе гибридной 4F-архитектуры
Фото: Самарский университет им. Королёва
Эксперименты подтвердили эффективность подхода на задачах обработки текста (Tiny LLM), изображений (Tiny ViT) и кредитного скоринга. В частности, показатель перплексии был снижен примерно в 1,5 раза, что улучшает качество генерации текста, устойчивость модели к шумам и повышает предсказуемость ее поведения.
Перплексия, если совсем просто,— это мера качества предсказания, используется для сравнения статистических моделей. Низкий показатель перплексии указывает на то, что распределение вероятности хорошо предсказывает выборку.
Кредитный скоринг — система оценки заемщика, анализирует кредитную историю и иные параметры клиента, сравнивая с данными множества других заемщиков. Важная область применения систем искусственного интеллекта.
Дополнительный прирост точности обеспечен за счет введения обучаемого дифракционного элемента — компактного пассивного компонента, не требующего энергозатрат. В цифровых системах аналогичный эффект достигается увеличением вычислений, что приводит к росту энергопотребления и усложнению инфраструктуры, тогда как в оптическом случае достигается более эффективный баланс между точностью и затратами.
Перспективность такого подхода подтверждает и экспертная оценка. Как отмечает Станислав Страупе, научный руководитель Центра квантовых технологий «Сбера»: «Использование дифракционно-оптических устройств для реализации матричного умножения — это крайне перспективное направление в оптических вычислениях. Потенциально такие устройства могут за один такт умножать матрицы очень большой размерности и, как удалось показать коллегам из Самарского университета, обеспечивая при этом высокую точность. Однако при разработке на основе пространственной оптики устройств для реальных задач в области искусственного интеллекта мы сталкиваемся со значительными техническими трудностями. В частности, крайне сложно обеспечить большую частоту обновления матриц, сохраняя при этом размерность — это существенный инженерный вызов на пути к устройству, которое сможет заменить графические и тензорные процессоры для обучения и инференса современных больших моделей. Потенциально огромное преимущество оптических вычислителей в энергоэффективности мотивирует искать решение этой сложной и интересной задачи».
Директор института искусственного интеллекта Самарского университета им. Королева Артем Никоноров
Фото: Самарский университет им. Королёва
Директор института искусственного интеллекта Самарского университета им. Королева Артем Никоноров
Фото: Самарский университет им. Королёва
Работы в Самарском университете ведутся во взаимодействии с Центром квантовых технологий «Сбера». Такое сотрудничество демонстрирует высокий интерес индустрии к этому направлению и его прикладному потенциалу.
Таким образом, оптические нейросети постепенно переходят из фундаментальной области в прикладную и могут стать основой новой архитектуры вычислительных систем — прежде всего там, где критичны скорость, энергоэффективность и компактность решений, а также способность работать в условиях ограниченных ресурсов и высокой нагрузки.