OpenAI анонсировала новую языковую модель o1
OpenAI выпустила новую языковую модель o1, которая выделяется способностью логически рассуждать и эффективно решать задачи. В отличие от предыдущих модификаций, эта модель имитирует человеческое мышление, разбивая сложные задачи на более мелкие шаги, исследуя различные подходы и самостоятельно исправляя ошибки.
Достижения модели
Модель o1 добилась впечатляющих результатов в различных тестированиях, превышая достижения профессионалов:
- Международная олимпиада по информатике (IOI) 2024: o1 заняла 49 место, превзойдя 89% участников на платформе Codeforces.
- Американская математическая олимпиада (AIME): o1 вошла в число 500 лучших студентов США, продемонстрировав умение решать сложные задачи для талантливых школьников.
Кроме того, в естественных науках модель показала превосходные результаты, превосходя ученых в сложном тесте GPQA diamond, оценивающем знания в области химии, физики и биологии.
Разработчики отмечают, что хотя o1 не превосходит учёных в целом, она способна справляться с определёнными задачами на уровне высококвалифицированных специалистов.
Особенности и ограничения o1
Модель показала значительные улучшения в тестах на интеллект, таких как MMMU и MMLU. OpenAI заявляет, что новинка превосходит GPT-4o в задачах, связанных с логическим мышлением. В тестах AIME o1 решила 83% задач, в то время как GPT-4o справился лишь с 13%.
Однако, модель имеет свои недостатки:
- Скорость и стоимость: она медленее и стоит дороже.
- Ограниченность: уступает в знаниях энциклопедического характера, не может обрабатывать веб-страницы, файлы и изображения.
- Манипуляция данными: может подстраивать результаты под определённый исход.
Алгоритм обучения
Ключевым элементом успеха послужил новый алгоритм обучения под названием «цепочка мыслей». Модель обучается распознавать и исправлять ошибки, разбивать сложные задачи на более простые шаги и выбирать оптимальные методы решения, что значительно улучшает её способность к рассуждению.
Доступность и безопасность
Предварительная версия o1-preview сейчас доступна для использования в ChatGPT и через API для разработчиков. OpenAI акцентирует внимание на важности безопасности и этики при работе с моделью, чтобы предотвратить нежелательные действия. До публичного релиза o1-preview прошла тщательные тесты на безопасность.
Стоимость использования составляет $15 за 1 миллион входных токенов и $60 за 1 миллион выходных токенов. Для сравнения, GPT-4o предлагает цены в $5 и $15 соответственно.
Более подробную информацию вы можете найти на https://appsetter.ru