Gemini Live API 提供全方位解決方案,可協助你建置使用者對話介面。開發 Android XR 應用服務時,可以透過 Firebase AI Logic 整合 Gemini Live API。與使用文字轉語音 (TTS) 和自動語音辨識 (ASR) 不同,Gemini Live API 能夠以無縫接軌的方式,同時處理音訊輸入和輸出。Gemini Live API 需要持續與網路保持連線,除了會產生費用之外,每個專案支援的並行連線數量也有限制,可能不適合處理錯誤狀況或其他重要使用者通訊,尤其不適用於沒有螢幕的 AI 眼鏡。
除了支援音訊介面,您也可以使用 Gemini Live API 來打造具備代理功能的服務體驗。
如要開始使用 Gemini Live API,請按照 Gemini Live API 指南中的步驟操作。這份指南將逐步說明如何例項化及設定 LiveGenerativeModel、建立 LiveSession,以及建立自訂 FunctionDeclaration 例項,讓應用程式處理來自 Gemini 的要求。