El SDK de Android XR llegó a la versión preliminar para desarrolladores 4, y queremos tus comentarios. Pruébalo y visita nuestra página de asistencia para comunicarte con nosotros.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Integración con la API de Gemini Live para anteojos de audio y anteojos con pantalla

Dispositivos de realidad extendida correspondientes

Esta guía te ayuda a crear experiencias para estos tipos de dispositivos de realidad extendida.

Más información sobre los tipos de dispositivos de realidad extendida →

Lentes de audio y
visualización

Más información sobre los tipos de dispositivos de realidad extendida →

La API de Gemini Live proporciona una solución integral para implementar interfaces conversacionales con tu usuario. Cuando compilas para Android XR, puedes realizar la integración con la API de Gemini Live a través de Firebase AI Logic. A diferencia del uso de Text-to-Speech (TTS) y el reconocimiento de voz automático (ASR), la API de Gemini Live controla la entrada y la salida de audio de forma fluida. La API de Gemini Live requiere una conexión a Internet persistente , genera costos, admite una cantidad limitada de conexiones simultáneas por proyecto y podría no ser ideal para controlar las condiciones de error o cualquier otra comunicación crítica del usuario , en especial en los lentes de audio, ya que no tienen pantalla.

Además de admitir interfaces de audio, también puedes usar la API de Gemini Live para crear experiencias de agentes.

Para comenzar a usar la API de Gemini Live, sigue los pasos que se describen en la guía de la API de Gemini Live. Te guía por la creación de instancias y la configuración de un LiveGenerativeModel, el establecimiento de un LiveSession y la creación de instancias FunctionDeclaration personalizadas que permiten que tu app procese solicitudes de Gemini.

Cómo controlar la salida de audio con Text-to-Speech

Integración con la API de Gemini Live para anteojos de audio y anteojos con pantalla Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Integración con la API de Gemini Live para anteojos de audio y anteojos con pantalla