Компания OpenAI совершила исторический поворот в своей стратегии развития, представив две новые языковые модели с открытыми весами — gpt-oss-120b и gpt-oss-20b. Это первые открытые модели компании за последние пять лет и важный шаг к демократизации искусственного интеллекта.
Две модели для разных задач
OpenAI выпустила две модели, каждая из которых рассчитана на определённые сценарии использования. gpt-oss-120b — мощная модель с 117 миллиардами параметров, из которых активируется около 5 миллиардов на один токен. Она ориентирована на сложные производственные задачи и может эффективно работать на одном современном графическом процессоре H100 с 80 ГБ памяти.
Вторая модель, gpt-oss-20b, гораздо компактнее — 21 миллиард параметров, из которых активируется примерно 3,5 миллиарда за токен. Благодаря скромным требованиям к ресурсам (достаточно 16 ГБ оперативной памяти), эта модель становится доступной для более широкой аудитории пользователей и может применяться на обычных компьютерах.
Ключевые преимущества новых моделей
Обе версии получили открытый статус под лицензией Apache 2.0, что позволяет использовать, модифицировать и внедрять их в коммерческие проекты без ограничений. Важной особенностью является настраиваемая цепочка рассуждений — пользователи могут выбирать уровень глубины анализа (низкий, средний или высокий), адаптируя работу модели под свои задачи.
Кроме того, предоставляется полный доступ к процессу рассуждений — можно видеть, каким образом модель приходит к тем или иным выводам. Есть возможность дообучения, что позволяет подстраивать модели под узкоспециализированные задачи. Также реализованы агентские функции: поддержка вызова внешних функций, работа с веб-поиском и выполнение кода на Python.
Причины изменения стратегии OpenAI
Решение открыть весовые коэффициенты моделей связано с усиливающейся конкуренцией на рынке. Особенно заметным стал успех китайской компании DeepSeek, которая в начале 2025 года выпустила DeepSeek-R1 — открытую модель, сравнимую по качеству с закрытыми моделями OpenAI, но более экономичную в разработке.
Генеральный директор OpenAI Сэм Альтман признал, что компания некоторое время была «на неправильной стороне истории» в вопросах открытости. В своем заявлении по запуску gpt-oss он подчеркнул: «Мы рады представить эту модель, результат многомиллиардных исследований, миру, чтобы передать ИИ в руки как можно большему числу людей».
Технические характеристики и результаты
Обе модели построены на архитектуре трансформеров с применением технологии Mixture of Experts (MoE), которая позволяет эффективно распределять вычислительную нагрузку. Контекстное окно моделей достигает 128 000 токенов, что значительно расширяет возможности анализа больших текстов. Модели работают исключительно с текстовой информацией.
Тестирование на бенчмарке Humanity's Last Exam показало, что новые модели OpenAI превосходят аналоги от DeepSeek и Qwen, хотя пока уступают закрытым внутренним версиям OpenAI.
Реакция индустрии и перспективы развития
Запуск открытых моделей вызвал живой отклик в отрасли. Nvidia оптимизировала их работу под свои графические процессоры, обеспечивая производительность до 256 токенов в секунду на RTX 5090. Уже сегодня модели доступны через популярные платформы, такие как Ollama и llama.cpp.
Основатель Nvidia Дженсен Хуанг отметил: «OpenAI показала миру, что можно построить на базе Nvidia AI — и теперь они продвигают инновации в открытом программном обеспечении».
Новый этап для искусственного интеллекта
Появление gpt-oss знаменует переход к эпохе, где открытость и доступность технологий становятся главными факторами развития и конкуренции. Это решение способно стимулировать волну новых исследований и продуктов, а также ускорить внедрение ИИ в разнообразные сферы жизни.
Сэм Альтман выразил надежду, что релиз «позволит проводить новые виды исследований и создавать новые типы продуктов», а также приведёт к «значительному ускорению инноваций в нашей области». OpenAI планирует и дальше развивать открытые модели, что может существенно изменить ландшафт индустрии искусственного интеллекта.