Враховуючи, що вони досить обережні з назвами (від березня 2023 року вони не додали навіть 4.1. до назви GPT, хоча зробили багато помітних апгрейдів), це вже цікаво.

Ще цікавіше, наскільки ця модель стає розумнішою, згідно з їх технічним блогом.

По-перше, вони пишуть, що модель перевершує рівень кандидатів наук (PhD) у розв'язанні задач з фізики, хімії, біології. Вдумайтесь у це. Це модель, яка стає доступною відсьогодні (хоча я так думаю, технічно не всім навіть платним користувачам, як правило, практично доступ упродовж тижнів). Вересень 2024 року. Рівень PhD. Точніше краще.

По-друге, в екзамені на відбір на Міжнародну Математичну Олімпіаду GPT4о (поточна найкраща модель) правильно розв'язує 13% задач. GPTо1 – нова модель – розв'язує 83% задач. Вдумайтесь у цю різницю. Скоро ця метрика стане нерелевантною. Потрібно буде придумати складніші задачі, щоб розуміти, чи моделі стають кращими.

По-третє, у змагальних задачах з програмування GPT4о вирішує правильно 11% задач, GPTо1 – 89% задач. 

Модель має такий вигляд, що не є суттєво більшою за GPT4, 4о, але її натренували розв'язувати задачі суттєво інакше. "Думати" довше, будувати "ланцюжок думок", пробувати різні варіанти, оцінювати їх, виправляти свої помилки — і вже тоді видавати "відрефлексований" варіант рішення.

Для простих питань вона, найімовірніше, буде надто повільною і "зарозумною". Але для складних виглядає як gamechanger.

Оригінал