توفّر Gemini Live API حلاً شاملاً لتنفيذ واجهات محادثة مع المستخدم. عند إنشاء تطبيقات لأجهزة Android XR، يمكنك الدمج مع Gemini Live API من خلال Firebase AI Logic. على عكس استخدام تحويل النص إلى كلام (TTS) والتعرّف التلقائي على الكلام (ASR)، تعالج واجهة Gemini Live API كلاً من الإدخال والإخراج الصوتيَّين بسلاسة. تتطلّب واجهة Gemini Live API اتصالاً دائمًا بالإنترنت، وتتضمّن تكلفة، وتتيح عددًا محدودًا من الاتصالات المتزامنة لكل مشروع، وقد لا تكون مناسبة للتعامل مع حالات الخطأ أو غيرها من الاتصالات المهمة مع المستخدمين، خاصةً على نظارات الذكاء الاصطناعي التي لا تحتوي على شاشة.
بالإضافة إلى إتاحة استخدام واجهات الصوت، يمكنك أيضًا استخدام واجهة Gemini Live API لإنشاء تجارب مستندة إلى الوكيل.
لبدء استخدام واجهة برمجة تطبيقات Gemini Live، اتّبِع الخطوات الموضّحة في
دليل واجهة برمجة تطبيقات Gemini Live. ويشرح لك كيفية إنشاء
LiveGenerativeModel وإعداده، وإنشاء
LiveSession، وإنشاء نُسخ مخصّصة من
FunctionDeclaration تتيح لتطبيقك معالجة الطلبات الواردة من Gemini.