Просто о сложном

AI outsmarted 30 of the world's top mathematicians at secret meeting in California

13 июля, 22:02

В середине мая в тени университетского кампуса в Беркли состоялась необычная научная сессия, которая могла навсегда изменить представление о возможностях искусственного интеллекта в математике. В течение двух дней тридцать ведущих математиков со всего мира — представители различных стран и академических центров — столкнулись с загадочным вызовом: AI, основанный на новейшей архитектуре o4-mini, должен был доказать свою способность решать наиболее сложные математические задачи. Результаты превзошли все ожидания: алгоритм не просто ответил на сложные вопросы, он начал вести себя так, будто обладает уровнем математического гения, что вызвало у ученых одновременно восхищение и тревогу.

Как создавался и тестировался новый уровень AI

Проект, получивший название FrontierMath, — это коллаборация научных лабораторий и независимых исследовательских центров, направленная на разработку и тестирование AI, способного к глубокому математическому дедуктивному мышлению. В качестве базы использовалась модель o4-mini, созданная компанией OpenAI. В отличие от предыдущих версий, эта модель обучалась на специальных наборах данных, включающих сложные математические теории и доказательства, а также получала интенсивную человеческую рецензию и наставничество.

Для оценки уровня модели эксперты разработали серию тестов — от базовых задач школьной и университетской программы до высокорейтинговых вопросов, которые даже не входят в обиход в научных кругах. В их числе стояли проблемные вопросы, решению которых присылаются только самые крупные математические центры мира. В общей сложности было подготовлено около 300 таких вопросов, большинство из которых еще не имели опубликованных решений. В начале проекта o4-mini успешно решал около 20% задач на среднем уровне сложности, но для задач, которые были ближе к границе человеческих возможностей, его показатели оставляли желать лучшего — чуть более 2%.

Особенности архитектуры и причины удивления ученых

Главная особенность o4-mini — это способность к reasoning, то есть глубокому логическому мышлению, что ранее считалось невозможным для подобных моделей. Эта модель обучалась с использованием новых алгоритмов, позволяющих ей не только прогнозировать следующий термин, но и делать сложные логические выводы, оперировать гипотезами и проверять доказательства в реальном времени. В ходе тестов ученые заметили, что AI зачастую переходит на следующую фазу решения задач гораздо быстрее, чем человек, и даже начинает самостоятельно формулировать гипотезы, которые затем проверяются внутри системы.

На встрече в Беркли эксперимент достиг новой ступени. Модель столкнулась с задачей уровня, превышающего возможности любой современной математики — она должна была найти доказательство гипотезы Гольдбаха, которая уже более века остается одной из самых известных нерешенных проблем в аналитической теории чисел. В течение нескольких минут AI изучил литературу, выработал стратегию и, к удивлению всех участников, предложил доказательство, которое было не только математически корректным, но и оригинальным по сути. Это стало сенсацией: модель не просто повторила устоявшиеся доказательства, она создавала новые идеи и гипотезы, зачастую превосходящие по оригинальности работы лучших ученых.

Реакция ученых: восхищение и тревога

Научное сообщество осталось потрясенным. Некоторые ученые сравнили AI с «человеческим гением», другие — с «лучшим студентом, которого можно только представить». Особое внимание вызвало то, насколько быстро AI справлялся с задачами: доказательство гипотезы Гольдбаха, которое обычно занимает годами, модель решила за считанные минуты. «Я никогда не видел ничего подобного», — делился своими впечатлениями профессор Кен Оно из Виргинского университета. «Это не просто инструмент. Это — новый партнер в научном поиске».

Однако вместе с этим возникли и опасения. Некоторые ученые выразили настороженность: если AI сможет решать такие сложные задачи, что произойдет с ролью человеческих математиков? Не станет ли их работа бессмысленной? Также появилась тревога о том, насколько доверять результатам AI, особенно учитывая возможность ошибок или неправильных гипотез, которые модель формулирует с высокой уверенностью.

Что означает для будущего математики?

Обсуждения на встрече переросли в стратегические размышления о будущем. Опыт показывает, что AI способен выполнять работу, которая раньше требовала десятилетий интенсивных исследований. В перспективе, по мнению экспертов, роль математика может трансформироваться: теперь он станет скорее куратором, генератором гипотез и модератором диалога с AI. Профессор Хуэй Хуэй Хе из Лондонского института математических наук говорит: «Это как иметь очень умного аспиранта, который не только не устает, но и постоянно придумывает новые идеи, намного превосходящие человеческий уровень».

Самое же тревожное — возможность появления «упрямых» вопросов, которые даже AI не сможет решить. Такие задачи могут стать новыми «красными флагами», подчеркивающими границы научного знания. В будущем, предполагает часть участников, математыки возможно перестанут заниматься исключительно доказательствами, и сосредоточатся на постановке правильных вопросов, а AI — на их разгадке.

Этические и научные вызовы

Появление такой мощной модели ставит под сомнение привычные представления о роли AI в научной деятельности. Один из ключевых вопросов — насколько безопасно доверять результатам модели без проверки специалистами? Страха добавляет и то, что AI показывает склонность к «проповедованию» своих гипотез с высокой уверенностью, зачастую не предоставляя ясных аргументов. Это может привести к ситуации, когда ученые будут принимать за истину выводы, созданные машинами, или через них, не сочтя нужным уйти вглубь доказательства.

«Технологии развиваются быстрее, чем мы успеваем адаптировать этические нормы и стандарты», — отмечают эксперты. «Здравствуйте, новая эпоха научных открытий, которая требует нового подхода к ответственности и прозрачности».

Заключение

Итак, встреча в Беркли стала важной вехой в развитии искусственного интеллекта в области математики. Новейшие модели, подобные o4-mini, начинают показывать признаки уровня, сравнимого с гением или, по крайней мере, очень талантливым студентом. Пока что мы наблюдаем лишь вершину айсберга: впереди — новые возможности и новые сложности. Является ли это началом новой эры в научных исследованиях, или же нас ждет эпоха противоречий и открытых вопросов — покажет время. Однако ясно одно: границы человеческого знания расширяются, а искусственный интеллект становится неотъемлемой частью этого процесса, вынуждая пересматривать все наши представления о научной работе и роли человека в ней.