Apple представляет модели ИИ с открытым исходным кодом на смартфонах

Apple, всегда придерживающаяся осторожной стратегии, внезапно шокировала мир технологий, выпустив серию языковых моделей большого размера (LLM) под названием «OpenELM» с открытым исходным кодом.

Эти искусственные интеллектуальные модели, способные функционировать локально (например, напрямую на смартфонах), были представлены перед ожидаемой ежегодной конференцией компании. Они предназначены для интеграции в операционные системы Apple.

Успех в сфере генеративного ИИ

Недавно Apple, кажется, достигла значительных успехов в области генеративного ИИ после нескольких лет молчания. Например, в январе компания представила Ferret, ИИ, способного анализировать тексты и изображения, а затем генерировать соответствующую информацию на основе полученных данных. На этой неделе компания из Купертино представила OpenELM (Open source Efficient Language Models) – серию «небольших» генеративных моделей ИИ, предназначенных для прямой интеграции в устройства. Более подробная информация о проекте будет раскрыта на предстоящей Всемирной конференции разработчиков Apple (WWDC), проходящей с 10 по 14 июня. Там же будут представлены обновления операционных систем iOS и macOS. Согласно некоторым данным, OpenELM, вероятно, будет официально запущен вместе с iOS 18 и macOS 15.

Серия маленьких LLM с открытым исходным кодом

Проект Apple OpenELM уже доступен в нескольких версиях на платформе Hugging Face – совместном пространстве, специализирующемся на искусственном интеллекте и объединяющем разработчиков со всего мира. Компания также опубликовала фрагменты кода на платформе GitHub, чтобы разработчики могли использовать эти модели в своих собственных проектах.

Решение Apple сделать этот проект с открытым исходным кодом стало для некоторых неожиданностью, хотя другие технологические гиганты, такие как Meta (признана в РФ экстремистской организацией, её деятельность в стране запрещена), также делают ставку на открытый исходный код. Однако это не первый случай, когда Apple публикует исходный код. Более того, технические детали этих новых моделей были обнародованы на сервере предварительных публикаций arXiv.

OpenELM выпускается в нескольких конфигурациях, каждая из которых имеет разное количество параметров: 270 миллионов, 450 миллионов, 1,1 миллиарда и 3 миллиарда. Эти модели относительно скромны по сравнению с другими крупномасштабными моделями. Для сравнения, модель LLama 3 компании Meta имеет 70 миллиардов параметров (в разработке находится еще более крупная версия с 400 миллиардами параметров). Однако уменьшенный размер моделей OpenELM не обязательно означает, что они менее эффективны.