Исследователи Высшей школы экономики разработали метод, позволяющий с высокой точностью отличать разные типы элементарных частиц на Большом адронном коллайдере. Результаты исследования опубликованы в Journal of Physics: Conference Series.
Одна из нерешённых проблем физики — наблюдаемое преобладание вещества над антивеществом в окружающей нас части Вселенной (Барионная асимметрия Вселенной). В первые доли секунд после Большого взрыва образовались вещество и антивещество. Физики пытаются понять, куда исчезло антивещество. Как предположил академик А. Д. Сахаров в 1966 году, в результате нарушения CP-инвариантности (симметрии частиц и античастиц) возник дисбаланс вещества и антивещества. После их аннигиляции (взаимоуничтожения) остались частицы.
Эксперимент LHCb (Large Hadron Collider beauty experiment) проводится для изучения B-мезонов, неустойчивых частиц, при распаде которых наиболее ярко проявляется асимметрия между веществом и антивеществом. Установка LHCb состоит из нескольких специализированных детекторов, в т. ч. калориметров, измеряющих энергию незаряженных частиц. Ещё калориметры идентифицируют разные типы частиц: для этого проводится поиск и анализ кластеров энерговыделения. Однако сигналы от двух типов фотонов — первичных и фотонов из распада π0-мезона — легко перепутать. Учёные из ВШЭ разработали метод, позволяющий с высокой точностью различать их.
Авторы исследования применили нейронные сети и градиентный бустинг (алгоритм машинного обучения) для классификации кластеров энерговыделения.
«Мы взяли матрицу размером 5 × 5 с центром в точке с самым большим энерговыделением, — комментирует автор исследования, ведущий научный сотрудник Научно-учебной лаборатории методов анализа больших данных ВШЭ Фёдор Ратников. — Вместо того чтобы самим анализировать специальные характеристики исходных данных, мы их сразу передали для анализа алгоритму. И машина смогла разобраться в них лучше человека».
Новый метод на основе машинного обучения в четыре раза повысил качество идентификации частиц в калориметре по сравнению с предыдущим — начальной интеллектуальной предобработкой данных. Алгоритм улучшил показатель кривой ошибок с 0,89 до 0,97 — чем выше это значение, тем качественнее работает классификатор. При эффективности идентификации первичных фотонов в 98% новый подход уменьшил поток ложных идентификаций событий с 60% до 30%.
Особенность предложенного метода в том, что он позволяет идентифицировать элементарные частицы без предварительного изучения особенностей анализируемого кластера.
«Можно обрабатывать данные, не ограничиваясь нашими знаниями о свойствах идентифицируемых частиц, а предоставить это машинному обучению в надежде на то, что алгоритм найдёт взаимосвязи, которые мы не рассматривали. Очевидно, у нас это получилось», — рассказал Фёдор Ратников.