Das Android XR SDK hat die Entwicklervorschau 4 erreicht und wir freuen uns über Ihr Feedback. Probieren Sie es aus und wenden Sie sich an uns, wenn Sie Hilfe benötigen.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Integration mit der Gemini Live API für Audio- und Displaybrillen

XR‑Geräte, für die der Leitfaden gilt

Dieser Leitfaden hilft Ihnen dabei, Erlebnisse für die folgenden Arten von XR-Geräten zu entwickeln.

Informationen zu XR‑Gerätetypen

Audio- und
Displaybrillen

Informationen zu XR‑Gerätetypen

Die Gemini Live API bietet eine umfassende Lösung für die Implementierung von Konversationsschnittstellen mit Ihren Nutzern. Wenn Sie für Android XR entwickeln, können Sie die Gemini Live API über Firebase AI Logic einbinden. Im Gegensatz zur Verwendung von Text-to-Speech (TTS) und automatischer Spracherkennung (ASR) verarbeitet die Gemini Live API sowohl Audioeingaben als auch Audioausgaben nahtlos. Die Gemini Live API erfordert eine dauerhafte Internet verbindung, verursacht Kosten, unterstützt eine begrenzte Anzahl gleichzeitiger Verbindungen pro Projekt und ist möglicherweise nicht ideal für die Verarbeitung von Fehlerbedingungen oder anderer kritischer Nutzer kommunikation, insbesondere bei Audiobrillen, da diese kein Display haben.

Neben der Unterstützung von Audioschnittstellen können Sie die Gemini Live API auch verwenden, um agentenbasierte Erlebnisse zu entwickeln.

Eine Einführung in die Gemini Live API finden Sie im Leitfaden zur Gemini Live API. Dort wird beschrieben, wie Sie ein LiveGenerativeModel instanziieren und konfigurieren, eine LiveSession einrichten und benutzerdefinierte FunctionDeclaration-Instanzen erstellen, mit denen Ihre App Anfragen von Gemini verarbeiten kann.

Zurück

Audioausgabe mit Text-to-Speech verarbeiten

Integration mit der Gemini Live API für Audio- und Displaybrillen Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Integration mit der Gemini Live API für Audio- und Displaybrillen