Gemini Nano с Google AI Edge SDK

На поддерживаемых устройствах на базе Android вы можете предоставлять богатые возможности генеративного искусственного интеллекта без необходимости подключения к сети или отправки данных в облако. Искусственный интеллект на устройстве — отличное решение для случаев, когда ваши основные задачи — низкая задержка, низкая стоимость и защита конфиденциальности.

Для случаев использования на устройстве вы можете воспользоваться базовой моделью Google Gemini Nano. Хотя он меньше, чем другие модели Gemini, выполняющие логический вывод в облаке, вы можете настроить Gemini Nano для выполнения специализированных задач так же, как и его более крупные аналоги. Gemini Nano работает в системной службе Android AICore , которая использует аппаратное обеспечение устройства для обеспечения низкой задержки вывода и поддержания актуальности модели.

Доступ к API Gemini Nano и AICore обеспечивается с помощью Google AI Edge SDK. Google AI Edge — это комплексный набор инструментов для машинного обучения на устройстве. Узнайте больше о Google AI Edge .

Архитектура

Будучи модулем системного уровня, вы получаете доступ к AICore через ряд API-интерфейсов, чтобы выполнить вывод на устройстве. Кроме того, AICore имеет несколько встроенных функций безопасности, обеспечивающих тщательную проверку на соответствие нашим фильтрам безопасности. На следующей диаграмме показано, как приложение обращается к AICore для запуска Gemini Nano на устройстве.

Google AI Edge SDK, AICore и Gemini Nano.
Рис. 1. Google AI Edge SDK, AICore и Gemini Nano.

Обеспечьте конфиденциальность и безопасность пользовательских данных

Генеративный искусственный интеллект на устройстве выполняет запросы локально, исключая вызовы сервера. Этот подход повышает конфиденциальность за счет хранения конфиденциальных данных на устройстве, обеспечивает функциональность в автономном режиме и снижает затраты на выводы.

AICore придерживается принципов Private Compute Core со следующими ключевыми характеристиками:

Ограниченное связывание пакетов : AICore изолирован от большинства других пакетов, за некоторыми исключениями для определенных системных пакетов. Любые изменения в этом разрешенном списке могут произойти только во время полного OTA-обновления Android.

Косвенный доступ в Интернет : AICore не имеет прямого доступа в Интернет. Все интернет-запросы, включая загрузку моделей, перенаправляются через сопутствующий APK-файл Private Compute Services с открытым исходным кодом. API в рамках частных вычислительных служб должны явно демонстрировать свою ориентированность на конфиденциальность.

Кроме того, AICore создан для изоляции каждого запроса и не сохраняет никаких записей о входных данных или результирующих выходных данных после их обработки для защиты конфиденциальности пользователей. Чтобы узнать больше, прочтите публикацию в блоге «Введение в конфиденциальность и безопасность для Gemini Nano» .

Иллюстрация архитектуры AICore
Рисунок 2. Архитектура AICore

Преимущества доступа к базовым моделям ИИ с помощью AICore

AICore позволяет ОС Android предоставлять базовые модели искусственного интеллекта и управлять ими. Это значительно снижает стоимость использования этих больших моделей в вашем приложении, главным образом благодаря следующему:

Простота развертывания : AICore управляет распространением Gemini Nano и обрабатывает будущие обновления. Вам не нужно беспокоиться о загрузке или обновлении больших моделей по сети, а также о влиянии на дисковый ресурс вашего приложения и бюджет памяти во время выполнения.

Ускоренный вывод : AICore использует аппаратное обеспечение устройства для ускорения вывода. Ваше приложение обеспечивает максимальную производительность на каждом устройстве, и вам не нужно беспокоиться о базовых аппаратных интерфейсах.

Поддерживаемая функциональность

AICore поддерживает следующие устройства и модальности:

  • Поддерживаемые устройства : AICore в настоящее время доступен на устройствах серии Pixel 9, устройствах серии Google Pixel 8, включая Pixel 8 1 и Pixel 8a 2 , устройствах серии Samsung S24, Samsung Z Fold6, Samsung Z Flip6, Realme GT 6, Motorola Edge 50 Ultra, Motorola. Razr 50 Ultra, Xiaomi 14T/Pro и Xiaomi MIX Flip.
  • Поддерживаемые модальности : AICore в настоящее время поддерживает текстовую модальность для Gemini Nano.

Поддержка дополнительных устройств и модальностей — это области активных инвестиций.

Варианты использования

Из-за ограниченности ресурсов мобильных устройств по сравнению с облачными серверами, модели генеративного искусственного интеллекта на устройствах разрабатываются с упором на эффективность и размер. Эта оптимизация отдает приоритет конкретным, четко определенным задачам над более общими приложениями. Подходящие варианты использования включают в себя:

  • Перефразирование текста : измените тон и стиль текста (например, с повседневного на формальный).
  • Умный ответ : генерируйте контекстуально релевантные ответы в ветке чата.
  • Корректура : выявление и исправление орфографических и грамматических ошибок.
  • Подведение итогов : Сократите объемные документы в краткие изложения (абзацы или пункты).

Для оптимальной производительности обратитесь к документации по стратегиям подсказок . Чтобы изучить эти варианты использования своими глазами, загрузите наш образец приложения и начните экспериментировать с Gemini Nano.

Gemini Nano используется несколькими приложениями Google. Вот некоторые примеры:

  • Talkback: приложение для специальных возможностей Android Talkback использует возможности мультимодального ввода Gemini Nano для улучшения описаний изображений для пользователей с ослабленным зрением.
  • Pixel Voice Recorder: приложение Pixel Voice Recorder использует Gemini Nano и AICore для реализации функции обобщения на устройстве. Команда рекордера использовала новейшую модель Gemini Nano для поддержки более длительных записей и обеспечения более высокого качества сводок.
  • Gboard: интеллектуальный ответ Gboard использует Gemini Nano на устройстве с AICore для предоставления точных интеллектуальных ответов.

  1. Gemini Nano можно включить на устройствах Pixel 8 в качестве опции разработчика .

  2. Gemini Nano можно включить на устройствах Pixel 8a в качестве опции разработчика .