En Google I/O 2024, presentamos una visión de Android rediseñada con la IA como elemento central. En este video, encontrarás las 3 actualizaciones principales para compilar con IA en Android para desarrolladores de Android.
Elige la solución de IA generativa que más te convenga
En este documento, se proporciona una descripción general de la IA generativa en Android, incluidos los modelos de Gemini disponibles y los SDKs asociados.
IA integrada en el dispositivo de alto rendimiento
En dispositivos Android compatibles, puedes ofrecer experiencias enriquecidas de IA generativa sin necesidad de una conexión de red ni de mover datos fuera del dispositivo. Los modelos de IA generativa integrados en el dispositivo, como Gemini Nano, son excelentes soluciones para casos de uso en los que las principales preocupaciones son la baja latencia, el bajo costo y las protecciones de la privacidad.
Casos de uso
- Consumo de contenido mejorado con IA: resumen de texto, respuesta de preguntas de documentos y extracción de entidades.
- Generación de contenido asistido por IA: revisión de texto, corrección gramatical, asistencia para la escritura y respuestas inteligentes contextuales.
- Clasificación de texto: análisis de opiniones o estado de ánimo
- Privacidad: Desbloquea funciones de IA generativa y, al mismo tiempo, mantiene los datos en el dispositivo.
Soluciones
Usa el SDK de Google AI Edge para aprovechar la inferencia de Gemini Nano en el dispositivo. Gemini Nano ahora está disponible de forma pública para el acceso experimental.
Más información sobre Gemini Nano
Publica modelos personalizados para funciones de IA integrada en el dispositivo de forma más eficiente con Play para IA integrada en el dispositivo. Google Play simplifica el lanzamiento, la segmentación, la versión, la descarga y la actualización de tus modelos integrados en el dispositivo, lo que te ayuda a mejorar la experiencia del usuario y, al mismo tiempo, mantener el tamaño de tu app optimizado. Play for IA integrada en el dispositivo está disponible sin costo adicional. Completa el formulario si te interesa el acceso anticipado a Play para la IA integrada en el dispositivo.
Regístrate para obtener acceso anticipado a Play para IA integrada en el dispositivo
IA multimodal de Cloud con los modelos más capaces de Google
Puedes crear experiencias de IA generativa multimodal en tus apps aprovechando los modelos de base que ejecutan inferencias en la nube, como los modelos de Gemini Pro. Estos modelos son una excelente solución cuando deseas admitir la variedad más amplia posible de dispositivos Android.
Casos de uso
- Descripción y subtítulos de imágenes y videos: Identificar objetos y describirlos en texto
- Razonamiento multimodal: Procesa contenido de texto, imagen y video.
- Generación de texto: Resume artículos, responde preguntas sobre contenido textual y extrae entidades.
- Formato de la respuesta: Da formato a la respuesta del modelo en JSON o Markdown.
Soluciones
Para crear prototipos de tus funciones de IA generativa, puedes comenzar con el SDK cliente de Google AI. Este SDK te brinda acceso a la API de Gemini y ayuda a simplificar las interacciones de tu app con los modelos de Gemini. El SDK de cliente de Google AI está en versión preliminar y solo debe usarse para prototipar.
Más información sobre el SDK de cliente de Google AI
Para llevar tus experiencias de IA a producción, usa Vertex AI en Firebase. Al igual que el SDK cliente de Google AI, este SDK de Firebase proporciona acceso a los modelos de Gemini, pero también ofrece opciones de configuración y seguridad que son fundamentales para las apps de producción. Además, Firebase incluye compatibilidad y funciones a nivel de producción en varias plataformas para dispositivos móviles.
Más información sobre Vertex AI en Firebase
IA para empresas
Vertex AI es la plataforma de desarrollo de IA unificada y completamente administrada de Google. Las empresas pueden usar la plataforma de Vertex AI de Google para ofrecer experiencias de IA personalizadas a dispositivos Android mediante integraciones de backend. Compila, entrena y, luego, implementa aplicaciones de IA en la infraestructura escalable y de primer nivel de Google. Es una gran solución para la IA a gran escala empresarial, con acceso a más de 130 modelos y herramientas, incluidos AI Studio, Agent Builder y modelos de Gemini.
Casos de uso
- Entrenamiento y entrega de modelos personalizados
- Generación de imágenes y videos
- Agentes virtuales y asistencia al cliente
- Procesamiento de lenguaje natural y voz a texto
Solución
Usa la plataforma de Vertex AI de Google para compilar aplicaciones de IA personalizadas y conectar apps para Android a la capa de servicio.
Más información sobre Vertex AI
Recursos adicionales
- Descripción general de Vertex AI
- Vertex AI con Gemini 1.5 Pro
- Ruta de aprendizaje de IA generativa para desarrolladores
Kit de herramientas de IA generativa responsable
Los modelos de IA deben alinearse con las políticas de seguridad, evaluarse en cuanto a equidad y exactitud, y diseñarse para que sean transparentes. El kit de herramientas de IA generativa responsable te brinda ayuda y orientación para diseñar, compilar, evaluar e implementar modelos de IA abierta de forma responsable.
Gemini en Android Studio
Gemini en Android Studio es un complemento de programación para el desarrollo de Android. Se basa en la inteligencia artificial y puede interpretar el lenguaje natural. Te ayuda a ser más productivo respondiendo tus consultas sobre el desarrollo de Android. Gemini puede ayudarte a encontrar recursos relevantes, conocer las prácticas recomendadas y ahorrar tiempo.
Plantilla de partida de la API de Gemini
La plantilla de partida de la API de Gemini sigue de cerca la guía de inicio rápido en línea para comenzar a usar Gemini en Android. Aprovecha el SDK cliente de Google AI para Android y muestra cómo trabajar con instrucciones de texto y respuestas de modelos.
Referencia
APIs y SDKs de Google para la IA generativa en Android
Entorno |
API o SDK |
Modelos compatibles |
Disponibilidad |
Uso recomendado |
Integración de Android con inferencia integrada en el dispositivo |
Gemini Nano |
Acceso experimental público |
Experimental |
|
Integración de Android con inferencia en la nube |
Gemini 1.5 Flash |
Versión preliminar pública |
Solo prototipado |
|
Gemini 1.5 Flash |
Disponibilidad general (DG) |
Opción recomendada para la producción |
||
Integración del backend con la inferencia en la nube |
Más de 130 modelos de base (incluidos los modelos de Gemini 1.5) |
Disponibilidad general (DG) |
Opción recomendada para la producción |
|
Integración de Android con inferencia integrada en el dispositivo |
Gemma 2B |
Experimental |
Modelos de IA generativa de Google
Google ofrece varios modelos de IA generativa que puedes usar en tu app para Android.
Entorno |
Modelo |
Tipo (costo) |
Formatos de entrada admitidos |
Datos de salida |
En el dispositivo |
Gemini Nano |
Sin costo |
Texto, imagen |
Texto |
Nube |
Gemini 1.5 Flash |
Sin costo/Pagado |
Texto, imagen, video, audio |
Texto |
Gemini 1.5 Pro |
Sin costo/Pagado |
Texto, imagen, video, audio |
Texto |
|
Gemini 1.0 Pro |
Sin costo/Pagado |
Texto |
Texto |
|
En el dispositivo, en la nube |
Gemma y Gemma 2 |
Sin costo (modelo abierto) |
Texto |
Texto |
Para obtener detalles completos sobre las capacidades de cada modelo, incluidos los límites de tokens y tasas, consulta Modelos de Gemini.