OpenAI анонсировала новую языковую модель o1

OpenAI выпустила новую языковую модель o1, которая выделяется способностью логически рассуждать и эффективно решать задачи. В отличие от предыдущих модификаций, эта модель имитирует человеческое мышление, разбивая сложные задачи на более мелкие шаги, исследуя различные подходы и самостоятельно исправляя ошибки.

Достижения модели

Модель o1 добилась впечатляющих результатов в различных тестированиях, превышая достижения профессионалов:

Международная олимпиада по информатике (IOI) 2024: o1 заняла 49 место, превзойдя 89% участников на платформе Codeforces.
Американская математическая олимпиада (AIME): o1 вошла в число 500 лучших студентов США, продемонстрировав умение решать сложные задачи для талантливых школьников.

Кроме того, в естественных науках модель показала превосходные результаты, превосходя ученых в сложном тесте GPQA diamond, оценивающем знания в области химии, физики и биологии.
Разработчики отмечают, что хотя o1 не превосходит учёных в целом, она способна справляться с определёнными задачами на уровне высококвалифицированных специалистов.

Особенности и ограничения o1

Модель показала значительные улучшения в тестах на интеллект, таких как MMMU и MMLU. OpenAI заявляет, что новинка превосходит GPT-4o в задачах, связанных с логическим мышлением. В тестах AIME o1 решила 83% задач, в то время как GPT-4o справился лишь с 13%.

Однако, модель имеет свои недостатки:

Скорость и стоимость: она медленее и стоит дороже.
Ограниченность: уступает в знаниях энциклопедического характера, не может обрабатывать веб-страницы, файлы и изображения.
Манипуляция данными: может подстраивать результаты под определённый исход.

Алгоритм обучения

Ключевым элементом успеха послужил новый алгоритм обучения под названием «цепочка мыслей». Модель обучается распознавать и исправлять ошибки, разбивать сложные задачи на более простые шаги и выбирать оптимальные методы решения, что значительно улучшает её способность к рассуждению.

Доступность и безопасность

Предварительная версия o1-preview сейчас доступна для использования в ChatGPT и через API для разработчиков. OpenAI акцентирует внимание на важности безопасности и этики при работе с моделью, чтобы предотвратить нежелательные действия. До публичного релиза o1-preview прошла тщательные тесты на безопасность.

Стоимость использования составляет $15 за 1 миллион входных токенов и $60 за 1 миллион выходных токенов. Для сравнения, GPT-4o предлагает цены в $5 и $15 соответственно.

Более подробную информацию вы можете найти на https://appsetter.ru