Gemini Live API menyediakan solusi komprehensif untuk menerapkan antarmuka percakapan dengan pengguna Anda. Saat membangun untuk Android XR, Anda dapat berintegrasi dengan Gemini Live API melalui Firebase AI Logic. Tidak seperti penggunaan Text to Speech (TTS) dan Automatic Speech Recognition (ASR), Gemini Live API menangani input dan output audio dengan lancar. Gemini Live API memerlukan koneksi internet yang persisten, menimbulkan biaya, mendukung sejumlah koneksi serentak yang terbatas per project, dan mungkin tidak ideal untuk menangani kondisi error atau komunikasi pengguna penting lainnya, terutama di kacamata AI tanpa layar.
Selain mendukung antarmuka audio, Anda juga dapat menggunakan Gemini Live API untuk membangun pengalaman berbasis agen.
Untuk mulai menggunakan Gemini Live API, ikuti langkah-langkah yang diuraikan dalam
panduan Gemini Live API. Panduan ini akan memandu Anda dalam membuat instance dan mengonfigurasi
LiveGenerativeModel, membuat
LiveSession, dan membuat instance
FunctionDeclaration kustom yang memungkinkan aplikasi Anda memproses
permintaan dari Gemini.