В Новосибирске десять университетов и институтов объявили о создании партнерства для строительства электрон-позитронного коллайдера. На нем будут вестись исследования «очарованных» частиц и тау-лептонов. Новый эксперимент запланирован на «Супер С-тау фабрике». В десятку основателей вошли две международные и восемь российских команд, включая Высшую школу экономики.
Фото: Дмитрий Лебедев, Коммерсантъ
«Супер С-тау фабрика» — один из шести проектов класса мегасайенс, отобранных правительственной комиссией для реализации на территории России. Проект включает создание электрон-позитронного коллайдера и детектора для анализа получаемых в результате столкновений данных.
Цель проекта — детальное исследование очарованных частиц D-мезонов и тау-лептонов. Изучение D-мезонов поможет понять начальные этапы развития Вселенной и, возможно, объяснить судьбу антивещества, родившегося после Большого взрыва. Исследователи находят этот сектор особенно интересным после открытия CP-нарушения в распадах D0-мезонов в 2019 году. Изучение же тау-лептонов должно пролить свет на недавние громкие открытия нарушения лептонного аромата — процесса, не вписывающегося в современное понимание Стандартной модели элементарных частиц.
Фабрика включает ускорительный комплекс, в нем формируются интенсивные пучки электронов и позитронов, а также детектор, который регистрирует и идентифицирует частицы, рожденные в столкновениях электронов с позитронами. Новый эксперимент дополнит исследования «прелестных» частиц на детекторах LHCb в ЦЕРНе в Женеве и Belle2 в Японии.
ВШЭ уже участвует в обоих «прелестных» экспериментах: Научно-учебная лаборатория методов анализа больших данных ФКН (LAMBDA) в сотрудничестве со Школой анализа данных «Яндекса» разрабатывает новейшие методы машинного обучения для оптимизации детекторов, эффективного сбора, обработки и анализа данных в эксперименте LHCb; Лаборатория физики элементарных частиц МИЭМ в сотрудничестве с Физическим институтом имени П. Н. Лебедева (ФИАН) поддерживает работу мюонного детектора и развивает физический анализ данных в Belle2. Ученые уверены, что эти уникальные компетенции будут востребованы при разработке и эксплуатации будущего детектора «Супер С-тау фабрики».
Строительство нового электрон-позитронного ускорителя для этого проекта планируется в Сарове Нижегородской области в рамках создаваемого там госкорпорацией «Росатом» Национального центра физики и математики.
Денис Деркач, доцент департамента больших данных и информационного поиска факультета компьютерных наук НИУ ВШЭ, старший научный сотрудник научно-учебной лаборатории методов анализа больших данных факультета компьютерных наук НИУ ВШЭ:
— Что будет делать ваша команда?
— Команда ВШЭ составлена из исследователей двух лабораторий: Международной лаборатории физики элементарных частиц (ЛФВЭ) и научно-учебной лаборатории методов анализа больших данных (ЛАМБДА). Они обладают дополняющей друг друга экспертизой и участвуют в исследованиях самых крупных на текущий момент экспериментов в части физики частиц, занимающейся тяжелыми ароматами: Belle2 и LHCb. ЛФВЭ принимает участие в работе эксперимента Belle2, в частности, они работают над специальной частью детектора, отвечающей за регистрацию мюонов.
Я представляю ЛАМБДА, специализирующуюся на применении методов машинного обучения к анализу данных в естественных науках. Мы занимаемся экспериментами на Большом адронном коллайдере (с фокусом на эксперимент LHCb, но также мы работали с экспериментом CMS), в Дубне (эксперимент MPD) и другими экспериментами (SHiP в ЦЕРН). Область нашей экспертизы в применении современных методов машинного обучения для обработки данных. К интересным проектам можно отнести разработку и внедрение онлайн-системы принятия решений о записи физической информации (триггер, определяет за доли секунды, есть интересные распады или нет), эта система отвечала за большую часть данных, собранных LHCb в 2015–2018 годах; построение системы быстрой симуляции пролета частиц через детектор с помощью генеративных нейронных сетей без применения физически мотивированной симуляции (сейчас этот проект продолжается); оптимизацию магнита для эксперимента SHiP в CERN. Для решения каждой этой задачи были предложены уникальные решения, но самым важным элементом этой работы явилась подготовка людей, которые теперь могут решать сложные задачи по применению машинного обучения к экспериментальным и теоретическим задачам физики частиц.
В рамках этой экспертизы мы будем разрабатывать несколько направлений в c-tau. Сейчас точный вклад находится на стадии обсуждения, но нашими (ЛАМБДА) предложениями являются:
— Осуществление быстрой реконструкции событий, происходящих в детекторе c-tau. Мы ожидаем, что полученный алгоритм будет обладать достаточной скоростью для принятия своевременного решения о записи события. Кроме того, алгоритм должен будет первично анализировать данные и снижать размер информации, необходимой для хранения. Здесь у нас есть широкий опыт в эксперименте LHCb, где мы участвовали в ускорении решений машинного обучения и обучении триггера.
— Быстрая симуляция происходящих в детекторе событий методами искусственного интеллекта. Для осуществления физического анализа нам необходимо знать, что именно происходит в детекторе (чтобы отличать то, что, как мы знаем, происходит в детекторе, от того, что в детекторе происходить не должно, а значит, интересно для изучения). В «C-tau фабрике» нас интересуют калориметр и черенковский детектор. Именно эти части детекторов обычно занимают существенное время.
— Оптимизация детектора. Набор алгоритмов, направленных на снижение трудоемкости построения, а также снижение стоимости полученного детектора. Пока мы начали изучать технологии некоторых компонент будущей c-tau.
— Автоматическая рекомендательная система проверки качества данных. Такая система будет подстраховывать дежурного оператора коллайдера и снимать с него часть рутинных операций.
Кроме того, лаборатория ЛФВЭ будет принимать участие в физическом анализе на эксперименте и разработкой компонент детектора.
— Как разрабатываются новые методы машинного обучения для оптимизации детекторов, эффективного сбора, обработки и анализа данных в эксперименте?
— В нашей лаборатории тесно работают люди с разной областью экспертизы: как физики, так и специалисты по машинному обучению. Это позволяет получить наиболее полную картину как задач в физике, так и методов их решений. Естественно, со временем физики учатся понимать современные статьи по искусственному интеллекту, а математики начинают понимать больше в тех частицах, которые мы изучаем. Именно от такой диффузии экспертизы рождаются наиболее интересные результаты. Физикам это позволяет сформулировать задачу, которая под силу современным методам искусственного интеллекта, а математикам — обратить внимание на тонкие особенности моделей, которые необходимо настроить. Замечу, что при этом результаты работы нашей лаборатории интересны обоим сообществам: физики получают решенные задачи, а математики — методы, которые можно будет быстрее применить в индустриальных приложениях.
— Что такое физический анализ данных в Belle2?
— Belle2 — область экспертизы лаборатории ЛВФЭ, но мы работаем с экспериментом, близким по тематике (хотя немного отличающимся по подходу),— LHCb.
Обычно физический анализ заключается в проверке той или иной гипотезы, сформулированной на основании научных теорий. Перед строительством нового эксперимента собирают все возможные теории, которые можно проверить в предлагаемом типе эксперимента. Концептуально предлагают детектор, потом делают техническое описание. Оценивают чувствительность к теориям, которые заранее рассматривали. Основная задача детектора — уметь записывать события, характерные для этих теорий, а также предоставлять достаточно информации для выделения этих событий на фоне остальных «неинтересных».
Потом строят запланированный детектор и начинают набирать данные. Задачей физического анализа является построить такой способ селекции событий, который обеспечит статистически значимое выявление частиц или распадов, характеризуемых новыми теориями. Для этого применяются как простое разделение («импульс больше 1 ГэВ/c»), так и нейронные сети и прочие подходы современного анализа данных (именно здесь и нужна симуляция, которую разработает наша лаборатория).
Важно подчеркнуть, что ключевую роль здесь играет оптимизированный детектор. Если разработать «плохой» детектор, то никакими продвинутыми методами селекции не получить хорошего разделения. Потому в каком-то смысле работа над анализом данных начинается задолго до начала сбора данных.
— Есть ли где-то в мире похожие проекты?
— «С-tau фабрика» — эксперимент нового поколения, на текущий момент он не имеет аналогов в мире по специфике ожидаемых результатов. SCT дополняет существующие проекты LHCb и Belle2, при этом некоторые физические результаты SCT будут совпадать по направлению с результатами LHCb и Belle2, а некоторые находятся в области, недоступной другим экспериментам.
— Когда планируется запустить эксперимент?
— Сейчас ожидается финальное решение о строительстве ускорительного комплекса и детектора. После этого пройдет несколько лет до непосредственного старта сбора данных. Перед этим будет проводиться работа по развитию новых методов машинного обучения и новых материалов и подходов к экспериментальным установкам. Ключевым в данном случае будет являться система черенковских детекторов с фокусирующим аэрогелем FARICH, разрабатываемым в Новосибирске.