OpenAI объявила о тестировании новых моделей искусственного интеллекта под названием o3 и o3 mini, способных решать более сложные задачи. Обзор новинки доступен на YouTube-канале компании.

Генеральный директор OpenAI Сам Альтман охарактеризовал модели o3 и o3 mini как «очень-очень умную» и «невероятно умную». На реальных задачах программирования (SWE Bench) модель o3 достигла точности 71,7%, что на 20 процентных пунктов выше показателей o1.

В соревнованиях по кодированию (Codeforces) модель получила ELO-оценку 2727, что значительно превосходит предыдущую модель o1 (1891). Например, программисты OpenAI в среднем набирают около 2500, а их ведущие специалисты — немногим больше.

В математическом тесте EpochAI Frontier Math o3 достигла точности 25,2%, что более чем в 12 раз лучше предыдущих моделей.

Модель o3-mini поддерживает три уровня рассуждения: low, medium и high. Чем больше времени модель тратит на обработку задачи, тем точнее результат. В режиме low latency (низкая задержка) o3-mini демонстрирует скорость на уровне GPT-4o, что позволяет быстро получать ответы.

Новые модели o3 mini планируется выпустить к концу января 2025 года, а полная версия o3 появится после этого. Благодаря данным моделям OpenAI надеется превзойти существующие языковые модели, а также привлечь новых пользователей и инвестиции.

OpenAI уже открыла процесс подачи заявок для внешних исследователей безопасности, чтобы протестировать новые модели до их публичного релиза. Прием заявок завершится 10 января 2025 года. Подать заявку на тестирование модели можно по ссылке.

Ранее Spot писал, что OpenAI запустила инструмент для генерации видео на основе текстовых запросов.