Mistral AI совместно с NVIDIA анонсировали новую языковую модель NeMo с 12 миллиардами характеристик

18 июля компания Mistral AI представила NeMo – новую мощную языковую модель, разработанную в сотрудничестве с NVIDIA.

Эта модель обладает впечатляющими характеристиками – ее контекстное окно достигает 128 000 токенов, что позволяет ей демонстрировать передовые результаты в области рассуждений, общих знаний и точности кодирования в сравнении с аналогичными решениями.

Плодотворное партнерство между Mistral AI и NVIDIA привело к созданию инновационной модели, которая не только расширяет границы производительности, но и ставит удобство использования на первый план.

Разработанная с учетом потребностей пользователей, NeMo представляет собой легкую и эффективную замену для систем, полагающихся на модель Mistral 7B, опираясь на проверенную архитектуру.

Компания Mistral AI взяла курс на ускорение внедрения и дальнейших исследований своих разработок. С этой целью она предоставила открытый доступ к предварительно обученным базовым и адаптированным моделям под лицензией Apache 2.0. Такой подход, несомненно, привлечет внимание как научного сообщества, так и представителей бизнеса, что в свою очередь ускорит интеграцию моделей Mistral в различные приложения.

Ключевые преимущества языковой модели Mistral NeMo

Одним из ключевых преимуществ технологии Mistral NeMo является возможность квантования данных во время обучения. Это позволяет выполнять вывод в формате FP8 без потери производительности. Данная функция может стать решающим фактором для организаций, стремящихся эффективно внедрять крупные языковые модели в свои продукты и сервисы.

Открытость Mistral AI к сотрудничеству и инновационные технические решения, такие как квантование, создают благоприятные условия для ускоренного развития и широкого применения передовых языковых моделей.