Alibaba представила Qwen3-235B-A22B: новая ИИ-модель превзошла Claude 4 и Kimi K2
Китайская корпорация Alibaba продолжает активно развивать свои искусственные интеллекты, представив новое поколение языковой модели. Компания делает серьезную заявку на лидерство в сфере ИИ-технологий, конкурируя с западными разработчиками. Новая модель демонстрирует впечатляющие результаты в различных тестах и бенчмарках. Особенно важно, что китайские разработчики выбрали стратегию открытого исходного кода.
Это решение может значительно ускорить внедрение технологии в различных отраслях. Модель показывает высокую производительность даже без использования модулей имитации рассуждений. Такой подход открывает новые возможности для быстрой обработки запросов в реальном времени.
Обновленная Qwen3-235B-A22B превзошла ведущие западные аналоги по ключевым показателям:
- Модель построена на архитектуре Mixture of Experts с 235 миллиардами параметров в базе, из которых активны только 22 миллиарда за проход.
- Система обучалась на расширенном корпусе данных объемом 36 триллионов токенов с поддержкой 119 языков, включая русский.
- Модель поддерживает длинный контекст до 128 тысяч токенов благодаря технологии YaRN.
Qwen3-235B-A22B обошла Kimi K2 и Claude 4 Opus в задачах генерации текстов, математических рассуждений и программирования. В некоторых метриках модель набрала рекордные показатели среди всех конкурентов.
Система работает в двух режимах — с активацией модулей размышлений и без них для максимально быстрой генерации. В-пятых, модель распространяется под открытой лицензией Apache 2.0, что дает разработчикам полную свободу использования в коммерческих проектах.
Большинство высококачественных моделей полагаются на reasoning-модуль, который замедляет генерацию ответов. Qwen3 демонстрирует возможность достижения отличных результатов даже без этого компонента», — отметил эксперт редакции.
Новая версия поддерживает сверхдлинный контекст до 256 тысяч токенов при масштабировании, что позволяет анализировать объемные документы без потери информации. В-седьмых, упрощен доступ к модели через Hugging Face и API Aimlapi.
В тесте ARC-AGI показатель модели достиг 41.8 балла, что является рекордным среди систем, работающих в ускоренном режиме без функции рассуждений.
Рекомендуем к прочтению
- ИИ-диагност Microsoft превзошел врачей в четыре раза по точности постановки диагноза
- Google представила Magenta RealTime: нейросеть для генерации музыки в реальном времени
- Появился ИИ-инструмент, ускоряющий реставрацию картин в 70 раз
- ChatGPT получает революционные функции интеграции с бизнес-платформами
- Сбер анонсировал выход новой мультиагентной версии нейросети GigaChat