OpenAI выпустила o1 — свою первую модель со способностью рассуждать — Лайфхакер
OpenAI выпустила свою новейшую генеративную модель под названием o1. Это первая ласточка в запланированной серии «рассуждающих» нейросетей, обученных отвечать на сложные вопросы быстрее людей. Её представили вместе с o1-mini — меньшей и более дешёвой версией. Судя по всему, это и есть разрекламированный проект Strawberry, который, как сообщалось, был засекречен даже внутри компании.
Это очередной шаг создателей ChatGPT к своей ключевой цели — созданию искусственного интеллекта, сравнимого с человеческим разумом. Если говорить о практических новшествах, то новинка лучше справляется с написанием кода и решением многошаговых задач по сравнению с предшественниками. Но она также дороже и медленнее. Поэтому для повседневных дел лучше использовать старые инструменты.
Модель также способна самостоятельно исправлять ошибки, используя технику обучение с подкреплением (Reinforcement Learning, RL) — систему поощрений и штрафов. Ещё она умеет запускать «цепочку мыслей» для обработки запросов, подобно тому, как люди справляются с трудностями — шаг за шагом. Другими словами, она сама может проверять себя и делать определённые выводы на будущее, сохраняя их в своей памяти. При всём этом полностью избавиться от галлюцинаций ещё не удалось, признались разработчики. Проблема остаётся, но уже в гораздо меньшей степени.
Зато в математике она уже почти как рыба в воде. Для сравнения: GPT-4o правильно решила только 13% задач из программы Международной математической олимпиады, а o1 набрала 83%.
Она определённо лучше справляется с тестом по математике AP, чем я, а я изучал математику в колледже.
Главный научный сотрудник OpenAI
Обучение, лежащее в основе o1, принципиально отличается от предыдущих методов, рассказал руководитель исследований в компании Джерри Творек. С ней использовали другие алгоритмы и новый набор данных. Компания называет релиз «предварительным просмотром», чтобы подчеркнуть, что она ещё молода.
Пользователи ChatGPT Plus и Team получают o1 и o1-mini уже сегодня. Клиенты Enterprise и Edu смогут начать испытывать их в начале следующей недели. Позже OpenAI обещает сделать «мини» общедоступной.