Die Gemini Live API bietet eine umfassende Lösung für die Implementierung von Konversationsschnittstellen mit Ihren Nutzern. Wenn Sie für Android XR entwickeln, können Sie die Gemini Live API über Firebase AI Logic einbinden. Im Gegensatz zur Verwendung von Text-to-Speech (TTS) und automatischer Spracherkennung (ASR) verarbeitet die Gemini Live API sowohl Audioeingaben als auch Audioausgaben nahtlos. Die Gemini Live API erfordert eine dauerhafte Internet verbindung, verursacht Kosten, unterstützt eine begrenzte Anzahl gleichzeitiger Verbindungen pro Projekt und ist möglicherweise nicht ideal für die Verarbeitung von Fehlerbedingungen oder anderer kritischer Nutzer kommunikation, insbesondere bei Audiobrillen, da diese kein Display haben.
Neben der Unterstützung von Audioschnittstellen können Sie die Gemini Live API auch verwenden, um agentenbasierte Erlebnisse zu entwickeln.
Eine Einführung in die Gemini Live API finden Sie im
Leitfaden zur Gemini Live API. Dort wird beschrieben, wie Sie ein
LiveGenerativeModel instanziieren und konfigurieren, eine
LiveSession einrichten und benutzerdefinierte
FunctionDeclaration-Instanzen erstellen, mit denen Ihre App
Anfragen von Gemini verarbeiten kann.