हाइब्रिड इन्फ़रेंस

Google, इंडस्ट्री में सबसे आगे रहने वाले एआई मॉडल और एपीआई का कलेक्शन उपलब्ध कराता है. इनका इस्तेमाल, क्लाउड-आधारित और डिवाइस पर इन्फ़रेंस के लिए किया जा सकता है. हाइब्रिड इन्फ़रेंस की मदद से, एआई से जुड़े वर्कलोड को स्थानीय डिवाइस और क्लाउड के बीच आसानी से बैलेंस किया जा सकता है. इससे परफ़ॉर्मेंस, लागत, और उपलब्धता को ऑप्टिमाइज़ किया जा सकता है.

हाइब्रिड इन्फ़रेंस से, आपके Android ऐप्लिकेशन को ये दो मुख्य फ़ायदे मिलते हैं:

  • ज़्यादा लोगों तक पहुंचना: डिवाइस के हार्डवेयर या ओएस की पाबंदियों की वजह से, अगर Gemini Nano जैसे डिवाइस पर मौजूद मॉडल उपलब्ध नहीं हैं, तो क्लाउड मॉडल एक अहम फ़ॉल बैक के तौर पर काम करते हैं. इससे यह पक्का करने में मदद मिलती है कि एआई की आपकी सुविधाएं, ज़्यादा से ज़्यादा उपयोगकर्ताओं के डिवाइसों पर काम करती रहें.
  • लागत और ऑफ़लाइन काम करने की क्षमता: डिवाइस पर मौजूद मॉडल की मदद से, यह पक्का किया जा सकता है कि उपयोगकर्ता के ऑफ़लाइन होने पर भी, एआई की आपकी सुविधाएं आसानी से काम करें. इसके अलावा, सामान्य टास्क को स्थानीय डिवाइस पर ऑफ़लोड करने से, क्लाउड इन्फ़रेंस की लागत कम करने में मदद मिलती है.
इस डायग्राम में, ऑन-डिवाइस इन्फ़रेंस और क्लाउड इन्फ़रेंस के बीच अंतर बताया गया है.
पहली इमेज: डिवाइस पर इन्फ़रेंस और क्लाउड इन्फ़रेंस के फ़ायदे.

यह सुविधा लागू करने से जुड़े विकल्प

हाइब्रिड इन्फ़रेंस को इन तरीकों से लागू किया जा सकता है:

Firebase AI Logic Hybrid API

Firebase AI Logic Hybrid API, क्लाउड और डिवाइस पर इन्फ़रेंस को अलग-अलग करने के लिए एक ही इंटरफ़ेस उपलब्ध कराता है.

इसमें onDeviceConfig पैरामीटर शामिल है. इससे इन्फ़रेंस मोड तय करने और राउटिंग मैनेज करने के लिए, आसान कंट्रोल मिलते हैं:

  • PREFER_ON_DEVICE: डिवाइस पर मौजूद मॉडल का इस्तेमाल करने की कोशिश करता है. अगर डिवाइस पर मौजूद मॉडल, अनुरोध के लिए उपलब्ध नहीं है या काम नहीं करता है, तो यह अपने-आप क्लाउड पर होस्ट किए गए मॉडल पर फ़ॉल बैक हो जाता है.
  • PREFER_IN_CLOUD: डिवाइस के ऑनलाइन होने और मॉडल के उपलब्ध होने पर, क्लाउड पर होस्ट किए गए मॉडल का इस्तेमाल करने की कोशिश करता है. अगर डिवाइस ऑफ़लाइन है, तो यह डिवाइस पर मौजूद मॉडल पर फ़ॉल बैक हो जाता है.
  • ONLY_ON_DEVICE: डिवाइस पर मौजूद मॉडल का इस्तेमाल करने की कोशिश करता है. हालांकि, अगर यह अनुरोध के लिए उपलब्ध नहीं है या काम नहीं करता है, तो यह एक अपवाद दिखाता है.
  • ONLY_IN_CLOUD: डिवाइस के ऑनलाइन होने और मॉडल के उपलब्ध होने पर, क्लाउड पर होस्ट किए गए मॉडल का इस्तेमाल करने की कोशिश करता है. अन्य सभी मामलों में, यह एक अपवाद दिखाता है.
val model = Firebase.ai(backend = GenerativeBackend.googleAI())
    .generativeModel(
        modelName = "gemini-2.5-flash",
        onDeviceConfig = OnDeviceConfig(mode = InferenceMode.PREFER_ON_DEVICE)
    )


val response = model.generateContent("Write a story about a green robot.")
print(response.text)

लागू करने से जुड़ी जानकारी के लिए, Firebase का दस्तावेज़ पढ़ें और एआई कैटलॉग में, हाइब्रिड एआई का सैंपल देखें.

कस्टम राउटिंग

अगर आपके ऐप्लिकेशन के लिए, कारोबार या यूएक्स से जुड़ी कोई खास ज़रूरत है, तो कस्टम राउटिंग लॉजिक भी लागू किया जा सकता है. इससे, रीयल-टाइम फ़ैक्टर के आधार पर, इन्फ़रेंस पाथ को डाइनैमिक तरीके से तय किया जा सकता है. जैसे:

  • नेटवर्क लेटेंसी
  • डिवाइस के सिस्टम की परफ़ॉर्मेंस (उदाहरण के लिए, बैटरी लेवल और प्रोसेसर लोड)
  • उपयोगकर्ता की क्वेरी की जटिलता

कस्टम हाइब्रिड इन्फ़रेंस के इस तरीके का इस्तेमाल, उन बड़े ऐप्लिकेशन ने किया है जिन्होंने एआई के भरोसेमंद अनुभव देने के लिए, अपनी पसंद के मुताबिक राउटिंग लागू की है. इनमें ये ऐप्लिकेशन शामिल हैं:

  • GBoard: Gboard, प्रूफरीड और फिर से लिखने जैसे टूल को बेहतर बनाने के लिए, कस्टम हाइब्रिड इन्फ़रेंस का इस्तेमाल करता है.

  • Kakao Mobility: Kakao Mobility ने अपनी पार्सल डिलीवरी सेवा के लिए, कस्टम हाइब्रिड इन्फ़रेंस का इस्तेमाल करके, एंटिटी एक्सट्रैक्शन टूल बनाया है. यह टूल, ऑर्डर फ़ॉर्म को बेहतर बनाने के लिए, सामान्य भाषा में लिखे गए मैसेज से पाने वाले के नाम, पते, और फ़ोन नंबर अपने-आप निकालता है.