توفّر Google مجموعة كبيرة من نماذج الذكاء الاصطناعي وواجهات برمجة التطبيقات الرائدة في المجال للاستدلال المستند إلى السحابة الإلكترونية وعلى الجهاز فقط. تتيح لك الاستنتاج المختلط تحقيق توازن سلس بين أحمال عمل الذكاء الاصطناعي على الجهاز المحلي والسحابة الإلكترونية، ما يؤدي إلى تحسين الأداء والتكلفة ومدى التوفّر.
تقدّم الاستدلال المختلط ميزتَين أساسيتَين لتطبيق Android:
- تحقيق أقصى قدر من الوصول: تعمل النماذج المستندة إلى السحابة الإلكترونية كحلّ احتياطي مهم عندما لا تتوفّر النماذج على الجهاز فقط، مثل Gemini Nano، بسبب قيود في أجهزة الجهاز أو نظام التشغيل. يساعد ذلك في ضمان استمرار عمل ميزات الذكاء الاصطناعي على أكبر عدد ممكن من أجهزة المستخدمين.
- التكلفة والإمكانات بلا إنترنت: تساعد النماذج على الجهاز فقط في ضمان عمل ميزات الذكاء الاصطناعي بسلاسة عندما يكون المستخدم غير متصل بالإنترنت. بالإضافة إلى ذلك، يساعد تفويض المهام الروتينية إلى الجهاز المحلي في خفض تكاليف الاستدلال السحابي.
خيارات التنفيذ
يمكنك تنفيذ الاستدلال المختلط باستخدام الطرق التالية:
Firebase AI Logic Hybrid API
توفّر واجهة Firebase AI Logic Hybrid API واجهة موحّدة واحدة لتقسيم الاستنتاج بين البيئات المستندة إلى السحابة الإلكترونية والبيئات على الجهاز فقط.
يتضمّن هذا الملف المَعلمة onDeviceConfig التي توفّر عناصر تحكّم بسيطة لتحديد وضع الاستدلال وإدارة التوجيه:
-
PREFER_ON_DEVICE: محاولة استخدام النموذج الذي يعمل على الجهاز فقط، والرجوع تلقائيًا إلى النموذج المستضاف على السحابة الإلكترونية إذا كان النموذج الذي يعمل على الجهاز فقط غير متاح أو غير متوافق مع الطلب -
PREFER_IN_CLOUD: يحاول استخدام النموذج المستضاف على السحابة الإلكترونية عندما يكون الجهاز متصلاً بالإنترنت والنموذج متاحًا، ولا يعود إلى النموذج المتوفّر على الجهاز إلا إذا كان الجهاز غير متصل بالإنترنت. -
ONLY_ON_DEVICE: يحاول استخدام النموذج على الجهاز فقط، ولكنّه يعرض استثناءً إذا كان غير متاح أو غير متوافق مع الطلب. ONLY_IN_CLOUD: تحاول استخدام النموذج المستضاف على السحابة الإلكترونية عندما يكون الجهاز متصلاً بالإنترنت ويتوفّر النموذج، ويتم طرح استثناء في جميع الحالات الأخرى.
val model = Firebase.ai(backend = GenerativeBackend.googleAI())
.generativeModel(
modelName = "gemini-2.5-flash",
onDeviceConfig = OnDeviceConfig(mode = InferenceMode.PREFER_ON_DEVICE)
)
val response = model.generateContent("Write a story about a green robot.")
print(response.text)
للحصول على تفاصيل التنفيذ، راجِع مستندات Firebase واستكشِف نموذج الذكاء الاصطناعي المختلط في "كتالوج الذكاء الاصطناعي".
التوجيه المخصّص
إذا كان تطبيقك يتضمّن متطلبات خاصة بالنشاط التجاري أو تجربة المستخدم، يمكنك أيضًا تنفيذ منطق توجيه مخصّص. يتيح لك ذلك تحديد مسار الاستنتاج بشكل ديناميكي استنادًا إلى عوامل في الوقت الفعلي، مثل:
- وقت استجابة الشبكة
- سلامة نظام الجهاز (مثل مستويات شحن البطارية وحِمل المعالج)
- مدى تعقيد طلب بحث المستخدم
يتم استخدام نهج الاستدلال المخصّص المختلط هذا من قِبل التطبيقات الرائدة التي نفّذت توجيهًا مخصّصًا خاصًا بها لتقديم تجارب موثوقة مستندة إلى الذكاء الاصطناعي، بما في ذلك:
GBoard: تستخدم Gboard استنتاجًا مخصّصًا مختلطًا لتشغيل أدوات الكتابة، مثل التدقيق اللغوي وإعادة الكتابة.
Kakao Mobility: أنشأت شركة Kakao Mobility أداة لاستخراج الكيانات باستخدام استدلال مخصّص مختلط لخدمة توصيل الطرود، وتعمل هذه الأداة على استخراج أسماء المستلمين والعناوين وأرقام الهواتف تلقائيًا من الرسائل المكتوبة باللغة الطبيعية بهدف تبسيط نماذج الطلبات.