Корпорация Alibaba представила следующее поколение своих открытых больших языковых моделей Qwen3, что эксперты называют очередным прорывом в быстро развивающейся китайской сфере искусственного интеллекта с открытым исходным кодом.
Китайский технологический гигант сообщил, что Qwen3 обещает улучшить рассуждения, следование инструкциям, использование инструментов и многоязыковые задачи, конкурируя с другими моделями высшего уровня, такими как R1 от DeepSeek.
Серия LLM включает восемь вариантов, охватывающих различные архитектуры и размеры, что обеспечивает разработчикам гибкость при использовании Qwen для создания ИИ-приложений для граничных устройств, таких как мобильные телефоны.
Qwen3 также знаменует дебют Alibaba в области так называемых «гибридных моделей рассуждений», которые, по заявлению компании, сочетают в себе традиционные возможности LLM с «передовыми динамическими рассуждениями».
По словам Alibaba, такие модели способны плавно переключаться между «режимом мышления» для сложных задач, таких как кодирование, и «режимом без мышления» для более быстрых ответов общего назначения.
Новые модели уже находятся в свободном доступе для индивидуальных пользователей на таких платформах, как Hugging Face и GitHub, а также в веб-интерфейсе Alibaba Cloud. Qwen3 также используется в работе ИИ-ассистента Alibaba, Quark.
Аналитики в области ИИ отмечают, что Qwen3 представляет собой серьезный вызов для китайских и американских конкурентов.
– Qwen3 является значительным прорывом благодаря лучшей в своем классе производительности, а также ряду особенностей, указывающих на прикладной потенциал моделей. К таким особенностям относятся гибридный режим мышления Qwen3, многоязыковая поддержка 119 языков и диалектов, а также наличие открытого исходного кода, – говорит главный аналитик по искусственному интеллекту Counterpoint Research Вэй Сунь.