По данным, собранным китайскими лунными орбитальными станциями Чанъэ, система искусственного интеллекта смогла идентифицировать более 100 тысяч ударных кратеров на Луне. Для 19 тысяч из найденных таким образом крупных кратеров при помощи машинного обучения на имеющихся базах данных также удалось определить геологический возраст.
Поверхность Луны покрыта многочисленными ударными кратерами, которые занимают большую её часть. Поскольку на Луне нет атмосферы, она никак не защищена от падения метеоритов, а образовавшиеся кратеры сохраняются на её поверхности миллиарды лет в отличие от Земли, где кратеры очень быстро по геологическим меркам исчезают в силу различных геологических процессов. Метеориты падали на Луну на протяжении всей её истории, поэтому формирование и эволюция её метеоритных кратеров отображают также историю внутренней Солнечной системы. Кроме того, изучение характеристик кратеров и особенностей их распределения — один из основных способов, позволяющих определить возраст различных участков поверхности, то есть исследовать стратиграфию и геохронологию Луны и Марса. Так, на Луне выделяют всего пять геологических периодов, причём самый молодой из них (коперниканский) продолжается больше миллиарда лет — в два раза больше, чем фанерозойская эра на Земле. Кратеры каждого из этих периодов различаются по некоторым характерным признакам, поэтому задачу определения их возраста в принципе можно автоматизировать, поручив нейронной сети. (Про геологию Луны и периодизацию её геологической истории на нашем сайте есть более подробная статья).
Работа по выявлению лунных кратеров на снимках орбитальных аппаратов раньше проводилась в основном вручную. К настоящему времени существует несколько независимых баз данных кратеров, полученных по результатам съёмки разных спутников при помощи ручной или автоматизированной обработки (пример — карта в конце статьи, построенная на одной из таких баз). В исследовании, опубликованном в декабре 2020 года в Nature Communications, используется искусственный интеллект для обнаружения и датировки кратеров на Луне. Система машинного обучения была обучена на массиве данных, собранных китайскими лунными орбитальными станциями серии «Чанъэ». Авторы работы представляют несколько научно-исследовательских заведений Китая и европейских стран.
Обучение нейросетей распознаванию кратеров — нетривиальный процесс из-за того, что кратеры сильно различаются не только по размерам (от метров до сотен километров), но и по форме и возрасту. Возраст в первую очередь определяет, насколько принятые идентификационные признаки кратера могут быть «испорчены» в процессе его разрушения со временем. Задача-максимум для системы искусственного интеллекта — определение координат и размеров всех кратеров и датировка каждого из них, хотя бы с точностью до лунной геологической эпохи.
Для идентификации лунных кратеров применяются алгоритмы глубокого обучения (deep learning, DL). Они опираются на большой набор уже выявленных кратеров, используя их как базу для обучения. Но имеющиеся образцы, на которых тренируются нейронные сети, в основном включают простые кратеры и избегают множества асимметричных или сильно эродированных объектов, которые могли образоваться в ранние эпохи. Новая работа предлагает усовершенствованную методику алгоритмов машинного обучения для определения и датирования кратеров, которая позволяет лучше учесть в том числе и такие нерегулярные образования.
Космические станции «Чанъэ-1» и «Чанъэ-2», выведенные на орбиту в рамках китайской программы исследования Луны, собрали большой массив данных. В частности, в нашем распоряжении теперь имеются два набора изображений с разной пространственной разрешающей способностью. Мелкомасштабные данные с низким разрешением от спутника «Чанъэ-1» (120 м/пиксель) могут фиксировать структуру крупных кратеров, например, в десятки километров и крупнее, а данные более высокого разрешения от «Чанъэ-2» (50 м/px) подходят для идентификации мелких кратеров, то есть величиной километры и меньше. Исследователям удалось использовать эти наборы для обучения глубокой нейронной сети идентификации кратеров разного вида. «Размеченные данные» здесь (в терминологии машинного обучения) — это база из 9137 кратеров, признанных Международным астрономическим союзом (IAU). Из этого множества только у 1675 кратеров различными способами определён их геологический возраст, то есть привязка к одному из пяти геологических периодов на Луне. Эти сравнительно небольшие массивы используются в качестве «образцов», которые сначала идентифицируют по данным двух первых станций Чанъэ для обучения сети.
После этапа обучения нейронную сеть использовали для анализа данных орбитальной станции «Чанъэ-5» — того самого аппарата, который позволил в декабре 2020 года доставить на Землю образцы лунного грунта. Отдельный алгоритм применялся для оценки возраста кратеров. Для этого использовались данные по степени разрушения кратеров из «обучающего набора» с их привязкой к лунной геологической эпохе.
В результате система ИИ определила около 110 тысяч новых кратеров, не содержащихся в базе IAU. Это не значит, что все эти кратеры таким образом «открыли»: в настоящее время используется около десятка баз данных, созданных на разных принципах, и число кратеров в них также измеряется десятками тысяч. Новая база данных содержит больше элементов, чем другие базы кратеров, созданные при помощи машинного обучения, за счёт более развитых алгоритмов обучения, позволяющих рассматривать более сложную геометрию объектов. Всего в предложенной базе данных 117240 кратеров размером больше километра. Из них около 19 тысяч кратеров диаметром более 8 км датированы по геологическим эпохам. Выявленные кратеры расположены в низких и средних широтах Луны (до широты 65˚ из-за ограничений орбит и поля зрения лунных спутников). Алгоритм можно далее адаптировать и для других тел Солнечной системы. В частности, интерес здесь, кроме каменных планет, представляют и крупнейшие астероиды — Веста и Церера, системы кратеров которых также позволяют реконструировать их геологическую историю.