Исследователи лаборатории искусственного интеллекта Google DeepMind представили модель машинного обучения Alpha Geometry. Она предназначена для решения сложных геометрических задач олимпиадного уровня. Учёные отметили, что с помощью разработанной системы можно будет улучшить нейросети общего назначения.
Alpha Geometry
Разработчики DeepMind рассказали, что для решения задач по геометрии важно строить последовательные логические рассуждения, основываясь на исходных данных. Исследователям надо было подобрать универсальный способ для доказательства теорем и представить это в формате, который понимают нейросети. Кроме того, учёные столкнулись с нехваткой данных для обучения моделей.
В Alpha Geometry используется сразу две нейросети. Первая похожа на большую языковую модель и используется для поиска закономерностей и генерации идей. Вторая нейросеть принимает решения, проверяет гипотезы и формирует итоговое доказательство. С помощью такого разделения обязанностей исследователи попытались имитировать творческий и аналитический подходы к решению задач.
Олимпиадные задачи по геометрии сопровождают чертежами, на которых изображают исходные данные для решения. Обычно чертёж надо дополнить вспомогательными геометрическими конструкциями, облегчающими доказательство. Исследователи обучили Alpha Geometry достраивать фигуры и использовать полученные данные для решения задачи.
Как обучали модель
Для обучения Alpha Geometry использовали синтетические данные, созданные с помощью другой нейросети. На первом этапе система сгенерировала примерно 1 млрд случайных чертежей к геометрическим задачам, отмечая взаимосвязи всех объектов и точек. После этого для каждого чертежа нейросеть вывела теоремы, доказательства и дополнительные конструкции.
Полученный массив задач отфильтровали, чтобы исключить из него повторяющиеся примеры. В итоге получился датасет из 100 млн геометрических задач, который использовали для обучения Alpha Geometry.
Решение задач
Нейросеть Alpha Geometry протестировали на решении реальных задач, которые встречались на Международной математической олимпиаде. За отведённое время нейросеть решила 25 задач, а золотой медалист олимпиады — 25,9. Модель машинного обучения на основе алгоритма Ву успевает решить только 10 задач.
Исследователи Google DeepMind опубликовали код Alpha Geometry в открытом GitHub-репозитории. В нём содержатся инструкции, которые помогут настроить окружение и запустить нейросеть.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!