Революция в мире искусственного интеллекта

Компания OpenAI совершила исторический поворот в своей стратегии развития, представив две новые языковые модели с открытыми весами — gpt-oss-120b и gpt-oss-20b. Это первые открытые модели компании за последние пять лет и важный шаг к демократизации искусственного интеллекта.

Две модели для разных задач

OpenAI выпустила две модели, каждая из которых рассчитана на определённые сценарии использования. gpt-oss-120b — мощная модель с 117 миллиардами параметров, из которых активируется около 5 миллиардов на один токен. Она ориентирована на сложные производственные задачи и может эффективно работать на одном современном графическом процессоре H100 с 80 ГБ памяти.

Вторая модель, gpt-oss-20b, гораздо компактнее — 21 миллиард параметров, из которых активируется примерно 3,5 миллиарда за токен. Благодаря скромным требованиям к ресурсам (достаточно 16 ГБ оперативной памяти), эта модель становится доступной для более широкой аудитории пользователей и может применяться на обычных компьютерах.

Ключевые преимущества новых моделей

Обе версии получили открытый статус под лицензией Apache 2.0, что позволяет использовать, модифицировать и внедрять их в коммерческие проекты без ограничений. Важной особенностью является настраиваемая цепочка рассуждений — пользователи могут выбирать уровень глубины анализа (низкий, средний или высокий), адаптируя работу модели под свои задачи.

Кроме того, предоставляется полный доступ к процессу рассуждений — можно видеть, каким образом модель приходит к тем или иным выводам. Есть возможность дообучения, что позволяет подстраивать модели под узкоспециализированные задачи. Также реализованы агентские функции: поддержка вызова внешних функций, работа с веб-поиском и выполнение кода на Python.

Причины изменения стратегии OpenAI

Решение открыть весовые коэффициенты моделей связано с усиливающейся конкуренцией на рынке. Особенно заметным стал успех китайской компании DeepSeek, которая в начале 2025 года выпустила DeepSeek-R1 — открытую модель, сравнимую по качеству с закрытыми моделями OpenAI, но более экономичную в разработке.

Генеральный директор OpenAI Сэм Альтман признал, что компания некоторое время была «на неправильной стороне истории» в вопросах открытости. В своем заявлении по запуску gpt-oss он подчеркнул: «Мы рады представить эту модель, результат многомиллиардных исследований, миру, чтобы передать ИИ в руки как можно большему числу людей».

Технические характеристики и результаты

Обе модели построены на архитектуре трансформеров с применением технологии Mixture of Experts (MoE), которая позволяет эффективно распределять вычислительную нагрузку. Контекстное окно моделей достигает 128 000 токенов, что значительно расширяет возможности анализа больших текстов. Модели работают исключительно с текстовой информацией.

Тестирование на бенчмарке Humanity's Last Exam показало, что новые модели OpenAI превосходят аналоги от DeepSeek и Qwen, хотя пока уступают закрытым внутренним версиям OpenAI.

Реакция индустрии и перспективы развития

Запуск открытых моделей вызвал живой отклик в отрасли. Nvidia оптимизировала их работу под свои графические процессоры, обеспечивая производительность до 256 токенов в секунду на RTX 5090. Уже сегодня модели доступны через популярные платформы, такие как Ollama и llama.cpp.

Основатель Nvidia Дженсен Хуанг отметил: «OpenAI показала миру, что можно построить на базе Nvidia AI — и теперь они продвигают инновации в открытом программном обеспечении».

Новый этап для искусственного интеллекта

Появление gpt-oss знаменует переход к эпохе, где открытость и доступность технологий становятся главными факторами развития и конкуренции. Это решение способно стимулировать волну новых исследований и продуктов, а также ускорить внедрение ИИ в разнообразные сферы жизни.

Сэм Альтман выразил надежду, что релиз «позволит проводить новые виды исследований и создавать новые типы продуктов», а также приведёт к «значительному ускорению инноваций в нашей области». OpenAI планирует и дальше развивать открытые модели, что может существенно изменить ландшафт индустрии искусственного интеллекта.