Mistral AI совместно с NVIDIA анонсировали новую языковую модель NeMo с 12 миллиардами характеристик
18 июля компания Mistral AI представила NeMo – новую мощную языковую модель, разработанную в сотрудничестве с NVIDIA.
Эта модель обладает впечатляющими характеристиками – ее контекстное окно достигает 128 000 токенов, что позволяет ей демонстрировать передовые результаты в области рассуждений, общих знаний и точности кодирования в сравнении с аналогичными решениями.
Плодотворное партнерство между Mistral AI и NVIDIA привело к созданию инновационной модели, которая не только расширяет границы производительности, но и ставит удобство использования на первый план.
Разработанная с учетом потребностей пользователей, NeMo представляет собой легкую и эффективную замену для систем, полагающихся на модель Mistral 7B, опираясь на проверенную архитектуру.
Компания Mistral AI взяла курс на ускорение внедрения и дальнейших исследований своих разработок. С этой целью она предоставила открытый доступ к предварительно обученным базовым и адаптированным моделям под лицензией Apache 2.0. Такой подход, несомненно, привлечет внимание как научного сообщества, так и представителей бизнеса, что в свою очередь ускорит интеграцию моделей Mistral в различные приложения.
Ключевые преимущества языковой модели Mistral NeMo
Одним из ключевых преимуществ технологии Mistral NeMo является возможность квантования данных во время обучения. Это позволяет выполнять вывод в формате FP8 без потери производительности. Данная функция может стать решающим фактором для организаций, стремящихся эффективно внедрять крупные языковые модели в свои продукты и сервисы.
Открытость Mistral AI к сотрудничеству и инновационные технические решения, такие как квантование, создают благоприятные условия для ускоренного развития и широкого применения передовых языковых моделей.
Рекомендуем к прочтению
- Опасность неофициального доступа к нейросетям: предупреждение эксперта
- Право (диалог) – первый ИИ-помощник в Телеграмме для арбитражных процессов
- ChatGPT покоряет сердца стилем Ghibli: сервера не выдержали ажиотажа
- Google представила бесплатный доступ к мощному ИИ Gemini 2.5 Pro
- YandexGPT 5 Lite Instruct: новая модель для бизнеса и разработчиков