Alibaba представила ИИ Qwen3 с открытым исходным кодом

Новое семейство моделей искусственного интеллекта с открытым исходным кодом Qwen3 выпустила китайская корпорация Alibaba Group Holding, сообщает 29 апреля издание Yicai.
Новая серия Qwen3 включает шесть «плотных» модели и две модели Mixture-of-Experts, «обеспечивая разработчикам гибкость при создании приложений нового поколения для мобильных устройств, умных очков, автономных транспортных средств, робототехники и не только», — объявила Alibaba.
Qwen3 также знаменует собой появление гибридных моделей рассуждений Alibaba, которые сочетают в себе обычные возможности больших языковых моделей с передовыми динамическими рассуждениями, заявила компания из Ханчжоу. Эти модели могут плавно переключаться между «думающим» режимом, используемым для решения сложных многоэтапных задач, таких как математика, кодирование и логические рассуждения, и «недумающим» режимом для быстрых ответов общего назначения, добавили в компании.
Qwen3 предлагает значительно более высокую производительность при снижении затрат на развертывание, сообщил источник в подразделении облачных вычислений Alibaba. Для полной версии серии требуется всего четыре чипа Nvidia H20, а объем видеопамяти сократился до трети по сравнению с DeepSeek-R1, добавил собеседник.
«Qwen3 представляет собой важную веху на нашем пути к искусственному общему интеллекту и искусственному сверхинтеллекту», — говорится в техническом блоге команды Alibaba Tongyi Qianwen. «Мы считаем, что переходим от эры, сосредоточенной на обучении моделей, к эре, сосредоточенной на обучении агентов».
Разработчики создали более 100 000 производных моделей на основе Qwen на Hugging Face (сообщество по созданию ИИ инструментов) с момента его дебюта в 2023 году, что делает модель одной из самых распространенных в мире серий ИИ с открытым исходным кодом, по данным Alibaba.