IA generativa en Android

En Google I/O 2024, presentamos una visión de Android rediseñada con la IA como elemento central. En este video, encontrarás las 3 actualizaciones principales para compilar con IA en Android para desarrolladores de Android.

Elige la solución de IA generativa que más te convenga

En este documento, se proporciona una descripción general de la IA generativa en Android, incluidos los modelos de Gemini disponibles y los SDKs asociados.

IA integrada en el dispositivo de alto rendimiento

Ícono de Gemini

En dispositivos Android compatibles, puedes ofrecer experiencias enriquecidas de IA generativa sin necesidad de una conexión de red ni de mover datos fuera del dispositivo. Los modelos de IA generativa integrados en el dispositivo, como Gemini Nano, son excelentes soluciones para casos de uso en los que las principales preocupaciones son la baja latencia, el bajo costo y las protecciones de la privacidad.

Casos de uso

  • Consumo de contenido mejorado con IA: resumen de texto, respuesta de preguntas de documentos y extracción de entidades.
  • Generación de contenido asistido por IA: revisión de texto, corrección gramatical, asistencia para la escritura y respuestas inteligentes contextuales.
  • Clasificación de texto: análisis de opiniones o estado de ánimo
  • Privacidad: Desbloquea funciones de IA generativa y, al mismo tiempo, mantiene los datos en el dispositivo.

Soluciones

Usa el SDK de Google AI Edge para aprovechar la inferencia de Gemini Nano en el dispositivo. Gemini Nano ahora está disponible de forma pública para el acceso experimental.

Más información sobre Gemini Nano

Publica modelos personalizados para funciones de IA integrada en el dispositivo de forma más eficiente con Play para IA integrada en el dispositivo. Google Play simplifica el lanzamiento, la segmentación, la versión, la descarga y la actualización de tus modelos integrados en el dispositivo, lo que te ayuda a mejorar la experiencia del usuario y, al mismo tiempo, mantener el tamaño de tu app optimizado. Play for IA integrada en el dispositivo está disponible sin costo adicional. Completa el formulario si te interesa el acceso anticipado a Play para la IA integrada en el dispositivo.

Regístrate para obtener acceso anticipado a Play para IA integrada en el dispositivo

IA multimodal de Cloud con los modelos más capaces de Google

Puedes crear experiencias de IA generativa multimodal en tus apps aprovechando los modelos de base que ejecutan inferencias en la nube, como los modelos de Gemini Pro. Estos modelos son una excelente solución cuando deseas admitir la variedad más amplia posible de dispositivos Android.

Casos de uso

  • Descripción y subtítulos de imágenes y videos: Identificar objetos y describirlos en texto
  • Razonamiento multimodal: Procesa contenido de texto, imagen y video.
  • Generación de texto: Resume artículos, responde preguntas sobre contenido textual y extrae entidades.
  • Formato de la respuesta: Da formato a la respuesta del modelo en JSON o Markdown.

Soluciones

Para crear prototipos de tus funciones de IA generativa, puedes comenzar con el SDK cliente de Google AI. Este SDK te brinda acceso a la API de Gemini y ayuda a simplificar las interacciones de tu app con los modelos de Gemini. El SDK de cliente de Google AI está en versión preliminar y solo debe usarse para prototipar.

Más información sobre el SDK de cliente de Google AI

Para llevar tus experiencias de IA a producción, usa Vertex AI en Firebase. Al igual que el SDK cliente de Google AI, este SDK de Firebase proporciona acceso a los modelos de Gemini, pero también ofrece opciones de configuración y seguridad que son fundamentales para las apps de producción. Además, Firebase incluye compatibilidad y funciones a nivel de producción en varias plataformas para dispositivos móviles.

Más información sobre Vertex AI en Firebase

IA para empresas

Ícono de Vertex AI

Vertex AI es la plataforma de desarrollo de IA unificada y completamente administrada de Google. Las empresas pueden usar la plataforma de Vertex AI de Google para ofrecer experiencias de IA personalizadas a dispositivos Android mediante integraciones de backend. Compila, entrena y, luego, implementa aplicaciones de IA en la infraestructura escalable y de primer nivel de Google. Es una gran solución para la IA a gran escala empresarial, con acceso a más de 130 modelos y herramientas, incluidos AI Studio, Agent Builder y modelos de Gemini.

Casos de uso

  • Entrenamiento y entrega de modelos personalizados
  • Generación de imágenes y videos
  • Agentes virtuales y asistencia al cliente
  • Procesamiento de lenguaje natural y voz a texto

Solución

Usa la plataforma de Vertex AI de Google para compilar aplicaciones de IA personalizadas y conectar apps para Android a la capa de servicio.

Más información sobre Vertex AI

Recursos adicionales

Kit de herramientas de IA generativa responsable

Los modelos de IA deben alinearse con las políticas de seguridad, evaluarse en cuanto a equidad y exactitud, y diseñarse para que sean transparentes. El kit de herramientas de IA generativa responsable te brinda ayuda y orientación para diseñar, compilar, evaluar e implementar modelos de IA abierta de forma responsable.

Gemini en Android Studio

Gemini en Android Studio es un complemento de programación para el desarrollo de Android. Se basa en la inteligencia artificial y puede interpretar el lenguaje natural. Te ayuda a ser más productivo respondiendo tus consultas sobre el desarrollo de Android. Gemini puede ayudarte a encontrar recursos relevantes, conocer las prácticas recomendadas y ahorrar tiempo.

Plantilla de partida de la API de Gemini

La plantilla de partida de la API de Gemini sigue de cerca la guía de inicio rápido en línea para comenzar a usar Gemini en Android. Aprovecha el SDK cliente de Google AI para Android y muestra cómo trabajar con instrucciones de texto y respuestas de modelos.

Referencia

APIs y SDKs de Google para la IA generativa en Android

Entorno

API o SDK

Modelos compatibles

Disponibilidad

Uso recomendado

Integración de Android con inferencia integrada en el dispositivo

SDK de Google AI Edge

Gemini Nano

Acceso experimental público

Experimental

Integración de Android con inferencia en la nube

SDK de cliente de Google AI

Gemini 1.5 Flash
Gemini 1.5 Pro
Gemini 1.0 Pro

Versión preliminar pública

Solo prototipado

Vertex AI en el SDK de Firebase

Gemini 1.5 Flash
Gemini 1.5 Pro
Gemini 1.0 Pro

Disponibilidad general (DG)

Opción recomendada para la producción

Integración del backend con la inferencia en la nube

Plataforma de Vertex AI

Más de 130 modelos de base (incluidos los modelos de Gemini 1.5)

Disponibilidad general (DG)

Opción recomendada para la producción

Integración de Android con inferencia integrada en el dispositivo

Inferencia de LLM de MediaPipe

Gemma 2B
Falcon 1B
LM estable 3B
Phi-2

Experimental

Modelos de IA generativa de Google

Google ofrece varios modelos de IA generativa que puedes usar en tu app para Android.

Entorno

Modelo

Tipo (costo)

Formatos de entrada admitidos

Datos de salida

En el dispositivo

Gemini Nano

Sin costo

Texto, imagen

Texto

Nube

Gemini 1.5 Flash

Sin costo/Pagado

Texto, imagen, video, audio

Texto

Gemini 1.5 Pro

Sin costo/Pagado

Texto, imagen, video, audio

Texto

Gemini 1.0 Pro

Sin costo/Pagado

Texto

Texto

En el dispositivo, en la nube

Gemma y Gemma 2

Sin costo (modelo abierto)

Texto

Texto

Para obtener detalles completos sobre las capacidades de cada modelo, incluidos los límites de tokens y tasas, consulta Modelos de Gemini.