DeepSeek: прорыв в искусственном интеллекте, меняющий игру
Китайский стартап DeepSeek стал важным игроком в области искусственного интеллекта, оспаривая лидерство OpenAI с помощью своей экономически эффективной языковой модели DeepSeek-R1.
Несмотря на ограничения США на экспорт высокотехнологичных чипов, компания добилась значительных успехов благодаря инновационным методам. В отличие от западных компаний, ориентирующихся на увеличение вычислительных мощностей, DeepSeek сосредоточилась на оптимизации алгоритмов и программного обеспечения.
Стартап представил две новые модели ИИ. DeepSeek-V3, предназначенную для различных сфер, таких как обработка естественного языка и здравоохранение. Эта модель адаптирована для китайского языка и культурного контекста, но также поддерживает международные возможности. DeepSeek-R1 демонстрирует результаты, сопоставимые с ChatGPT от OpenAI, при этом затраты значительно ниже.
Основатель Лян Вэньфэн собрал команду молодых исследователей из ведущих университетов Китая, предоставив им свободу для экспериментов. Это привело к созданию новых технологий, таких как Multi-head Latent Attention и Mixture-of-Experts, которые уменьшают потребность в вычислительных ресурсах.
Рекомендуем к прочтению
- Дуров анонсировал интеграцию чат-бота Grok в Telegram
- OpenAI выпустила GPT-4.1 и GPT-4.1 mini в ChatGPT с улучшенными возможностями для разработчиков
- Alibaba представляет Qwen 3: новое поколение языковых моделей с открытым исходным кодом
- OpenAI представляет Deep Research: революционный инструмент для исследований теперь доступен бесплатно
- Названы 8 скрытых возможностей ChatGPT для повышения эффективности работы