Alibaba представила Qwen3-235B-A22B: новая ИИ-модель превзошла Claude 4 и Kimi K2

Китайская корпорация Alibaba продолжает активно развивать свои искусственные интеллекты, представив новое поколение языковой модели. Компания делает серьезную заявку на лидерство в сфере ИИ-технологий, конкурируя с западными разработчиками. Новая модель демонстрирует впечатляющие результаты в различных тестах и бенчмарках. Особенно важно, что китайские разработчики выбрали стратегию открытого исходного кода.

Это решение может значительно ускорить внедрение технологии в различных отраслях. Модель показывает высокую производительность даже без использования модулей имитации рассуждений. Такой подход открывает новые возможности для быстрой обработки запросов в реальном времени.

Обновленная Qwen3-235B-A22B превзошла ведущие западные аналоги по ключевым показателям:

Модель построена на архитектуре Mixture of Experts с 235 миллиардами параметров в базе, из которых активны только 22 миллиарда за проход.
Система обучалась на расширенном корпусе данных объемом 36 триллионов токенов с поддержкой 119 языков, включая русский.
Модель поддерживает длинный контекст до 128 тысяч токенов благодаря технологии YaRN.

Qwen3-235B-A22B обошла Kimi K2 и Claude 4 Opus в задачах генерации текстов, математических рассуждений и программирования. В некоторых метриках модель набрала рекордные показатели среди всех конкурентов.

Система работает в двух режимах — с активацией модулей размышлений и без них для максимально быстрой генерации. В-пятых, модель распространяется под открытой лицензией Apache 2.0, что дает разработчикам полную свободу использования в коммерческих проектах.

Большинство высококачественных моделей полагаются на reasoning-модуль, который замедляет генерацию ответов. Qwen3 демонстрирует возможность достижения отличных результатов даже без этого компонента», — отметил эксперт редакции.

Новая версия поддерживает сверхдлинный контекст до 256 тысяч токенов при масштабировании, что позволяет анализировать объемные документы без потери информации. В-седьмых, упрощен доступ к модели через Hugging Face и API Aimlapi.

В тесте ARC-AGI показатель модели достиг 41.8 балла, что является рекордным среди систем, работающих в ускоренном режиме без функции рассуждений.

neuronews.by

Alibaba представила Qwen3-235B-A22B: новая ИИ-модель превзошла Claude 4 и Kimi K2

Последние новости: