OpenAI представила о1: эта модель имитирует человеческое мышление
13 сентября 2024
По заявлению OpenAI, их новая языковая модель обладает логикой и способностью к рассуждениям. «Человечность» мышления о1 заключается в умении разделять сложные задачи на простые подзадачи и исправлять собственные ошибки. В OpenAI заверяют, что о1 превосходит GPT-4o в плане логики: если GPT-4o может решить только 13% задач в тестах AIME, то o1 — 83%.
о1 посоревновалась и с живыми людьми. Например, модель заняла 49-е место на Международной олимпиаде по информатике: на платформе Codeforces она превзошла 89% людей. о1 также вошла в число 500 лучших студентов США на квалификационном этапе Американской математической олимпиады. По словам представителей OpenAI, в плане естественных наук о1 обошла кандидатов наук в тесте GPQA diamond на знание физики, биологии и химии:
— Наши испытания показали, что o1 последовательно улучшает результаты с увеличением объема реинфорсмент-обучения и времени, потраченного на размышления. Это не означает, что o1 умнее любого кандидата наук. Но это говорит о том, что модель способна решать некоторые задачи на уровне высококвалифицированных специалистов.
При этом о1 не может обрабатывать веб-страницы, файлы и изображения, как GPT-4o. Также последняя и быстрее, и дешевле о1: использование o1-preview обходится в 15 долларов за 1 миллион входных токенов, GPT-4o — в 5 долларов за один миллион входных токенов.
Всего комментариев 0
Поделиться: