Google I/O '24 में, हमने एआई के साथ फिर से डिज़ाइन किए गए Android के बारे में बताया था. इस वीडियो में, Android डेवलपर के लिए Android पर एआई की मदद से ऐप्लिकेशन बनाने से जुड़े तीन अहम अपडेट देखें.
अपनी ज़रूरत के हिसाब से जनरेटिव एआई का सही समाधान चुनना
इस दस्तावेज़ में, Android पर जनरेटिव एआई के बारे में खास जानकारी दी गई है. इसमें, उपलब्ध Gemini मॉडल और उनसे जुड़े SDK टूल के बारे में भी बताया गया है.
डिवाइस पर बेहतर परफ़ॉर्म करने वाला एआई
जिन Android डिवाइसों पर यह सुविधा काम करती है उन पर, नेटवर्क कनेक्शन या डिवाइस से डेटा हटाए बिना, जनरेटिव एआई के बेहतरीन अनुभव दिए जा सकते हैं. Gemini Nano जैसे डिवाइस पर इस्तेमाल किए जा सकने वाले जनरेटिव एआई मॉडल, उन कामों के लिए बेहतरीन समाधान हैं जिनमें कम इंतज़ार, कम लागत, और निजता की सुरक्षा आपकी मुख्य चिंता है.
इस्तेमाल के उदाहरण
- एआई की मदद से कॉन्टेंट को बेहतर तरीके से इस्तेमाल करना: टेक्स्ट की खास जानकारी जनरेट करना, दस्तावेज़ में मौजूद सवालों के जवाब देना, और इकाई की जानकारी निकालना.
- एआई की मदद से कॉन्टेंट जनरेट करना: प्रूफ़रीडिंग, व्याकरण में सुधार, लिखने में मदद, और कॉन्टेक्स्ट के हिसाब से स्मार्ट जवाब.
- टेक्स्ट को अलग-अलग कैटगरी में बांटना: सेंटीमेंट या मूड का विश्लेषण
- निजता: इस मोड में, डिवाइस पर डेटा सेव रहता है और जनरेटिव एआई की सुविधाएं इस्तेमाल की जा सकती हैं
समाधान
डिवाइस पर Gemini Nano के अनुमान का फ़ायदा पाने के लिए, Google AI Edge SDK का इस्तेमाल करें. Gemini Nano, एक्सपेरिमेंट के तौर पर ऐक्सेस करने के लिए अब सभी के लिए उपलब्ध है.
Gemini Nano के बारे में ज़्यादा जानें
Play for On-device AI की मदद से, डिवाइस पर मौजूद एआई की सुविधाओं के लिए कस्टम मॉडल को ज़्यादा बेहतर तरीके से डिलीवर करें. Google Play, डिवाइस पर मौजूद मॉडल को लॉन्च करने, टारगेट करने, वर्शन बनाने, डाउनलोड करने, और अपडेट करने की प्रोसेस को आसान बनाता है. इससे, आपको अपने ऐप्लिकेशन का साइज़ ऑप्टिमाइज़ करने के साथ-साथ, उपयोगकर्ता अनुभव को बेहतर बनाने में मदद मिलती है. Play for On-device AI की सुविधा के लिए, कोई शुल्क नहीं लिया जाता. अगर आपको Play for On-device AI का रिलीज़ होने से पहले ऐक्सेस चाहिए, तो यह फ़ॉर्म भरें.
Play for On-device AI के रिलीज़ होने से पहले ऐक्सेस करने के लिए साइन अप करना
Google के सबसे बेहतरीन मॉडल के साथ, मल्टीमोडल क्लाउड एआई
अपने ऐप्लिकेशन में, कई मोड वाले जनरेटिव एआई का अनुभव दिया जा सकता है. इसके लिए, Gemini Pro मॉडल जैसे फ़ाउंडेशन मॉडल का इस्तेमाल करके, क्लाउड में अनुमान लगाने की सुविधा का फ़ायदा लें. अगर आपको Android डिवाइसों की सबसे ज़्यादा रेंज के साथ काम करना है, तो ये मॉडल एक बेहतरीन विकल्प हैं.
इस्तेमाल के उदाहरण
- इमेज और वीडियो का ब्यौरा और कैप्शन: ऑब्जेक्ट की पहचान करना और टेक्स्ट में उनके बारे में बताना
- मल्टीमॉडल रीज़निंग: टेक्स्ट, इमेज, और वीडियो कॉन्टेंट को प्रोसेस करना
- टेक्स्ट जनरेशन: लेखों की खास जानकारी देना, टेक्स्ट कॉन्टेंट के बारे में सवालों के जवाब देना, इकाइयों को निकालना.
- रिस्पॉन्स को फ़ॉर्मैट करना: मॉडल के रिस्पॉन्स को JSON या Markdown में फ़ॉर्मैट करना
समाधान
एआई से जुड़े अनुभवों को प्रोडक्शन में लाने के लिए, Firebase में Vertex AI का इस्तेमाल करें. Firebase SDK टूल, Gemini मॉडल का ऐक्सेस देता है. साथ ही, यह प्रोडक्शन ऐप्लिकेशन के लिए ज़रूरी सुरक्षा और कॉन्फ़िगरेशन के विकल्प भी उपलब्ध कराता है. इसके अलावा, Firebase में प्रोडक्शन-लेवल की सहायता और अलग-अलग मोबाइल प्लैटफ़ॉर्म पर काम करने वाली सुविधाएं भी शामिल हैं.
Firebase में Vertex AI के बारे में ज़्यादा जानें
एंटरप्राइज़ के लिए एआई
Vertex AI, Google का एआई के लिए एक ऐसा यूनिफ़ाइड डेवलपमेंट प्लैटफ़ॉर्म है जिसे पूरी तरह से मैनेज किया जाता है. Android डिवाइसों पर एआई के अनुभव को अपनी पसंद के मुताबिक बनाने के लिए, एंटरप्राइज़ Google के Vertex AI प्लैटफ़ॉर्म का इस्तेमाल कर सकते हैं. इसके लिए, उन्हें बैकएंड इंटिग्रेशन का इस्तेमाल करना होगा. Google के दुनिया के बेहतरीन और स्केलेबल इंफ़्रास्ट्रक्चर पर, एआई (AI) ऐप्लिकेशन बनाएं, उन्हें ट्रेन करें, और डिप्लॉय करें. यह एंटरप्राइज़-स्केल एआई के लिए एक बेहतरीन समाधान है. इसमें 130 से ज़्यादा मॉडल और टूल का ऐक्सेस मिलता है. इनमें AI Studio, एजेंट बिल्डर, और Gemini मॉडल शामिल हैं.
इस्तेमाल के उदाहरण
- कस्टम मॉडल की ट्रेनिंग और डिलीवरी
- इमेज और वीडियो जनरेट करने की प्रोसेस
- वर्चुअल एजेंट, ग्राहक सहायता
- बोली को टेक्स्ट में बदलने की सुविधा, नैचुरल लैंग्वेज प्रोसेसिंग
समाधान
पसंद के मुताबिक एआई ऐप्लिकेशन बनाने और Android ऐप्लिकेशन को सेवा लेयर से कनेक्ट करने के लिए, Google के Vertex AI प्लैटफ़ॉर्म का इस्तेमाल करें.
Vertex AI के बारे में ज़्यादा जानें
अन्य संसाधन
- Vertex AI के बारे में खास जानकारी
- Gemini 1.5 Pro के साथ Vertex AI
- डेवलपर के लिए जनरेटिव एआई लर्निंग पाथ
ज़िम्मेदारी के साथ जनरेटिव एआई का इस्तेमाल करने के लिए टूलकिट
एआई मॉडल को सुरक्षा नीतियों के मुताबिक बनाया जाना चाहिए. साथ ही, यह भी ज़रूरी है कि इन मॉडल की निष्पक्षता और सटीक होने की जांच की जाए. साथ ही, इन्हें पारदर्शी तरीके से डिज़ाइन किया जाना चाहिए. ज़िम्मेदारी के साथ जनरेटिव एआई का इस्तेमाल करने के लिए टूलकिट, आपको ज़िम्मेदारी के साथ ओपन एआई मॉडल डिज़ाइन करने, बनाने, उनका आकलन करने, और उन्हें डिप्लॉय करने में मदद और दिशा-निर्देश देता है.
Android Studio में Gemini
Android Studio में Gemini, Android डेवलपमेंट के लिए एक कोडिंग कंपैनियन है. यह आर्टिफ़िशियल इंटेलिजेंस की मदद से काम करता है और आम भाषा को समझ सकता है. इससे आपको Android डेवलपमेंट से जुड़ी क्वेरी के जवाब मिलते हैं. Gemini की मदद से, काम के संसाधन ढूंढे जा सकते हैं, सबसे सही तरीके जाने जा सकते हैं, और समय बचाया जा सकता है.
Android पर जनरेटिव एआई के लिए Google के एपीआई और SDK टूल
नीचे दी गई टेबल में, Firebase में Vertex AI के साथ काम करने वाले मॉडल और उनके सबसे नए मॉडल के नामों के बारे में खास जानकारी दी गई है. इस टेबल में, झलक और प्रयोग के तौर पर उपलब्ध मॉडल की सूची भी दी गई है. ये मॉडल, इस्तेमाल के उदाहरणों के प्रोटोटाइप बनाने के लिए उपलब्ध हैं. हर मॉडल की सुविधाओं के बारे में ज़्यादा जानकारी के लिए, Gemini मॉडल देखें. इसमें टोकन और दर की सीमाओं के बारे में भी जानकारी मिलती है.
मॉडल | टेक्स्ट लिखो | आउटपुट | ब्यौरा |
---|---|---|---|
Gemini स्टेबल वर्शन वाले मॉडल | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो |
टेक्स्ट, कोड, JSON (इमेज और ऑडियो जल्द ही उपलब्ध होगा!) |
अलग-अलग तरह के टास्क के लिए, अगली पीढ़ी की सुविधाएं और तेज़ी से काम करने की सुविधा (मल्टीमोडल जनरेशन जल्द ही उपलब्ध होगा!) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | किफ़ायती और कम लेटेंसी वाली परफ़ॉर्मेंस देता है. साथ ही, ज़्यादा ट्रांज़िट |
Gemini 1.5 Progemini-1.5-pro-002
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | ज़्यादा जानकारी की ज़रूरत वाले जटिल कामों के लिए काम करता है. साथ ही, 20 लाख शब्दों का कॉन्टेक्स्ट इस्तेमाल करता है |
Gemini 1.5 Flashgemini-1.5-flash-002
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर परफ़ॉर्मेंस देता है |
Gemini ऐसे मॉडल जिनके लिए सिर्फ़ झलक और एक्सपेरिमेंटल वर्शन उपलब्ध हैं (सिर्फ़ प्रोटोटाइप के इस्तेमाल के उदाहरणों के लिए सुझाया गया) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | खास तौर पर कोड और दुनिया के बारे में जानकारी के लिए, सबसे अच्छी मॉडल क्वालिटी देता है; 20 लाख वर्णों का कॉन्टेक्स्ट |
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
|
टेक्स्ट, कोड, PDF, इमेज | टेक्स्ट, कोड, JSON | यह बेहतर तरीके से तर्क करने की सुविधा देता है. साथ ही, जवाबों में सोचने की प्रोसेस को शामिल करता है |
Imagen 3 मॉडल (Vertex AI in Firebase के साथ इस्तेमाल करने पर) | |||
Imagen 3imagen-3.0-generate-002
|
टेक्स्ट | इमेज | सामान्य भाषा के टेक्स्ट के प्रॉम्प्ट से, असली जैसी और अच्छी क्वालिटी की इमेज जनरेट करता है |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
टेक्स्ट | इमेज | प्रोटोटाइप बनाने या कम इंतज़ार वाले इस्तेमाल के उदाहरणों के लिए इमेज जनरेट करता है |