GPT-5.2 Pro установил рекорд на одном из самых сложных математических тестов
Динмухамед Бейсембаев Автор
Новая версия языковой модели OpenAI показала рекордный результат в решении сложных математических задач, превзойдя все предыдущие ИИ-системы на специализированном тесте FrontierMath, пишет ИА El.kz со ссылкой на Epoch AI.
Модель GPT-5.2 Pro стала лучшей на сегодняшний день в рамках одного из самых жёстких бенчмарков по математике. По данным исследовательской организации Epoch AI, система набрала 31% на самом сложном уровне теста, который известен как Tier 4. Для сравнения, прежний максимальный результат принадлежал модели Gemini 3 Pro и составлял лишь 19%, что подчёркивает заметный разрыв между новым ИИ и его ближайшими конкурентами.
Тестирование проводилось вручную через интерфейс ChatGPT, поскольку при использовании API возникли технические ограничения. В общей сложности GPT-5.2 Pro смогла решить 15 задач из 48. Особое внимание исследователей привлекло то, что четыре из этих задач ранее не поддавались ни одной другой модели искусственного интеллекта.
Часть решений была передана профессиональным математикам для оценки. В целом отзывы оказались положительными: эксперты отметили, что модель действительно находит корректные подходы и демонстрирует понимание сложных математических структур. Вместе с тем некоторые специалисты указали на недостаточную строгость формулировок и неточности в отдельных объяснениях, что остаётся слабым местом даже при правильном итоговом ответе.
Результаты FrontierMath хорошо согласуются с более ранними наблюдениями о развитии математических способностей новых моделей OpenAI. Ранее сообщалось, что версии GPT-5 Thinking и GPT-5 Pro начали показывать практическую ценность при решении нетривиальных математических задач. В отдельных случаях GPT-5 самостоятельно находила решения задач, связанных с проблемами Эрдёша, а в других помогала исследователям продвигаться в их анализе.
При этом ведущие математики призывают не делать поспешных выводов. Известный специалист в области анализа и теории чисел Теренс Тао подчёркивает, что, несмотря на впечатляющие успехи, подобные результаты ещё не означают полноценного понимания математики в человеческом смысле. По его мнению, ИИ может эффективно комбинировать известные методы и находить неожиданные ходы, но это не равнозначно самостоятельному созданию новых теорий.
Тем не менее сам факт того, что GPT-5.2 Pro смогла преодолеть барьеры, считавшиеся недоступными для машин, указывает на серьёзный прогресс в развитии математических возможностей искусственного интеллекта. FrontierMath долгое время рассматривался как тест, отделяющий формальное вычисление от глубокого рассуждения, и новый результат показывает, что этот разрыв постепенно сокращается.
Ранее El.kz писал о том, что Alibaba выпустил бесплатного «убийцу» ChatGPT.

