Генеральний директор OpenAI, Сем Альтман, оголосив про запуск нових моделей штучного інтелекту o3 і o3-mini під час останнього дня заходу «12 днів OpenAI». Ці новинки засновані на попередніх моделях o1 і застосовують новий метод «приватного ланцюжка думок», що дозволяє їм планувати свої відповіді наперед, використовуючи симульоване міркування (SR).
Про це розповідає KURAZH
Вражаючі досягнення моделі o3
Модель o3 показала рекордні результати в бенчмарку ARC-AGI, де вона отримала 75,7% в умовах низьких обчислювальних ресурсів і 87,5% в умовах високих обчислювальних ресурсів, що є порівняльним з продуктивністю людини. Крім того, o3 досягла 96,7% на Американському запрошувальному іспиті з математики 2024 року і 87,7% на тесті GPQA Diamond, який включає питання з біології, фізики та хімії на рівні магістратури. В бенчмарку Frontier Math від EpochAI модель вирішила 25,2% завдань, у той час як жодна інша модель не перевершила 2%.
Особливості моделі o3-mini
Модель o3-mini відрізняється впровадженням функції адаптивного часу мислення, яка дозволяє вибирати між низькою, середньою та високою швидкістю обробки. OpenAI підкреслює, що налаштування на більш високі обчислювальні ресурси сприяють кращим результатам. Моделі будуть доступні для тестування дослідниками безпеки. Запуск o3-mini заплановано на кінець січня, а o3 з’явиться незабаром після цього.