In occasione della conferenza Google I/O 2024, abbiamo presentato una visione di Android reinventata con l 'IA al centro. In questo video sono riportati i tre aggiornamenti principali per la creazione di app con l'IA su Android per gli sviluppatori Android.
Scegli la soluzione di IA generativa più adatta a te
Questo documento fornisce una panoramica dell'IA generativa su Android, inclusi i modelli Gemini disponibili e gli SDK associati.
AI on-device ad alte prestazioni
Sui dispositivi Android supportati puoi offrire esperienze IA generativa complete senza bisogno di una connessione di rete o di spostare i dati dal dispositivo. I modelli di AI generativa on-device come Gemini Nano sono ottime soluzioni per casi d'uso in cui la bassa latenza, il basso costo e le misure di salvaguardia della privacy sono le tue principali preoccupazioni.
Casi d'uso
- Utilizzo dei contenuti migliorato con l'IA: riassunto del testo, risposta alle domande sui documenti ed estrazione delle entità.
- Genesi di contenuti con l'aiuto dell'IA: correzione bozze, correzione grammaticale, assistenza alla scrittura e risposte rapide contestuali.
- Classificazione del testo: analisi del sentiment o dell'umore
- Privacy: sblocca le funzionalità di IA generativa mantenendo i dati sul dispositivo
Soluzioni
Utilizza l'SDK Google AI Edge per sfruttare l'inferenza di Gemini Nano sul dispositivo. Gemini Nano è ora disponibile pubblicamente per l'accesso sperimentale.
Pubblica modelli personalizzati per le funzionalità di IA on-device in modo più efficiente con Play per l'IA on-device. Google Play semplifica il lancio, il targeting, la gestione delle versioni, il download e l'aggiornamento dei modelli on-device, aiutandoti a migliorare l'esperienza utente mantenendo ottimizzate le dimensioni dell'app. La funzionalità Gioca per l'AI on-device è disponibile senza costi aggiuntivi. Compila il modulo se ti interessa l'accesso in anteprima a Play per l'AI on-device.
Registrati per l'accesso in anteprima a Play per l'AI on-device
IA cloud multimodale con i modelli più avanzati di Google
Puoi creare esperienze di IA generativa multimodale nelle tue app sfruttando i modelli di base che eseguono l'inferenza nel cloud, come i modelli Gemini Pro. Questi modelli sono un'ottima soluzione se vuoi supportare la gamma più ampia possibile di dispositivi Android.
Casi d'uso
- Descrizioni e sottotitoli codificati di immagini e video: identificare gli oggetti e descriverli in testo
- Ragionamento multimodale: elaborazione di contenuti di testo, immagini e video
- Generare testo: riassumere articoli, rispondere a domande sui contenuti testuali, estrarre entità.
- Formattazione della risposta: formatta la risposta del modello in JSON o Markdown
Soluzioni
Per implementare le tue esperienze di IA in produzione, utilizza Vertex AI in Firebase. L'SDK Firebase fornisce accesso ai modelli Gemini, ma offre anche opzioni di sicurezza e configurazione fondamentali per le app di produzione. Inoltre, Firebase include funzionalità e assistenza a livello di produzione su varie piattaforme mobile.
Scopri di più su Vertex AI in Firebase
AI per le aziende
Vertex AI è la piattaforma di sviluppo AI unificata e completamente gestita di Google. Le aziende possono utilizzare la piattaforma Vertex AI di Google per offrire esperienze di IA personalizzate ai dispositivi Android utilizzando le integrazioni di backend. Crea, addestra e esegui il deployment di applicazioni di IA sull'infrastruttura scalabile e di livello mondiale di Google. È una ottima soluzione per l'IA su larga scala aziendale, con accesso a oltre 130 modelli e strumenti, tra cui AI Studio, Agent Builder e i modelli Gemini.
Casi d'uso
- Addestramento e pubblicazione di modelli personalizzati
- Generazione di immagini e video
- Agenti virtuali, assistenza clienti
- Trascrizione vocale, elaborazione del linguaggio naturale
Soluzione
Utilizza la piattaforma Vertex AI di Google per creare applicazioni IA personalizzate e collegare le app Android al livello di servizio.
Risorse aggiuntive
- Panoramica di Vertex AI
- Vertex AI con Gemini 1.5 Pro
- Percorso di apprendimento per l'IA generativa per sviluppatori
Responsible Generative AI Toolkit
I modelli di IA devono essere in linea con le norme di sicurezza, valutati per equità e accuratezza e progettati per essere trasparenti. Il toolkit per l'AI generativa responsabile fornisce assistenza e indicazioni per progettare, sviluppare, valutare ed eseguire il deployment di modelli di AI aperti in modo responsabile.
Gemini in Android Studio
Gemini in Android Studio è un assistente alla programmazione per lo sviluppo di Android. È basato sull'intelligenza artificiale e può comprendere il linguaggio naturale. Ti aiuta a migliorare la produttività rispondendo alle tue domande sullo sviluppo di Android. Gemini può aiutarti a trovare risorse pertinenti, imparare le best practice e risparmiare tempo.
API e SDK Google per l'IA generativa su Android
La tabella seguente è una breve panoramica dei modelli supportati per Vertex AI in Firebase e dei relativi nomi dei modelli stabili più recenti. Questa tabella elenca anche i modelli di anteprima e sperimentali disponibili per i casi d'uso di prototipazione. Per ulteriori dettagli sulle funzionalità di ciascun modello, inclusi i limiti di token e di frequenza, consulta Modelli Gemini.
Modello | Input | Output | Descrizione |
---|---|---|---|
Gemini modelli con versioni stabili | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
testo, codice, PDF, immagini, video, audio |
testo, codice, JSON (immagini e audio disponibili a breve) |
Offre funzionalità e velocità di nuova generazione per una vasta gamma di compiti (la generazione multimodale sarà disponibile a breve) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
testo, codice, PDF, immagini, video, audio | testo, codice, JSON | Offre prestazioni convenienti e a bassa latenza; supporta un'elevata velocità in bit |
Gemini 1.5 Progemini-1.5-pro-002
|
testo, codice, PDF, immagini, video, audio | testo, codice, JSON | Supporta attività di ragionamento complesse che richiedono maggiore intelligenza; contesto di 2 milioni di caratteri |
Gemini 1.5 Flashgemini-1.5-flash-002
|
testo, codice, PDF, immagini, video, audio | testo, codice, JSON | Offre prestazioni rapide e versatili per una vasta gamma di attività |
Modelli Gemini con solo versioni di anteprima ed sperimentali (consigliati solo per casi d'uso di prototipazione) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
testo, codice, PDF, immagini, video, audio | testo, codice, JSON | Offre la qualità del modello più elevata, in particolare per il codice e la conoscenza del mondo; contesto lungo 2 milioni |
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
|
testo, codice, PDF, immagini | testo, codice, JSON | Offre capacità di ragionamento più efficaci e include il processo di pensiero nelle risposte |
Modelli Imagen 3 (se utilizzati con Vertex AI in Firebase) | |||
Imagen 3imagen-3.0-generate-002
|
messaggio | immagini | Genera immagini realistiche e di alta qualità da prompt di testo in linguaggio naturale |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
messaggio | immagini | Genera immagini per la prototipazione o casi d'uso a bassa latenza |