IA generativa su Android

In occasione della conferenza Google I/O 2024, abbiamo presentato una visione di Android reinventata con l 'IA al centro. In questo video sono riportati i tre aggiornamenti principali per la creazione di app con l'IA su Android per gli sviluppatori Android.

Scegli la soluzione di IA generativa più adatta a te

Questo documento fornisce una panoramica dell'IA generativa su Android, inclusi i modelli Gemini disponibili e gli SDK associati.

AI on-device ad alte prestazioni

Icona di Gemini

Sui dispositivi Android supportati puoi offrire esperienze IA generativa complete senza bisogno di una connessione di rete o di spostare i dati dal dispositivo. I modelli di AI generativa on-device come Gemini Nano sono ottime soluzioni per casi d'uso in cui la bassa latenza, il basso costo e le misure di salvaguardia della privacy sono le tue principali preoccupazioni.

Casi d'uso

  • Utilizzo dei contenuti migliorato con l'IA: riassunto del testo, risposta alle domande sui documenti ed estrazione delle entità.
  • Genesi di contenuti con l'aiuto dell'IA: correzione bozze, correzione grammaticale, assistenza alla scrittura e risposte rapide contestuali.
  • Classificazione del testo: analisi del sentiment o dell'umore
  • Privacy: sblocca le funzionalità di IA generativa mantenendo i dati sul dispositivo

Soluzioni

Utilizza l'SDK Google AI Edge per sfruttare l'inferenza di Gemini Nano sul dispositivo. Gemini Nano è ora disponibile pubblicamente per l'accesso sperimentale.

Scopri di più su Gemini Nano

Pubblica modelli personalizzati per le funzionalità di IA on-device in modo più efficiente con Play per l'IA on-device. Google Play semplifica il lancio, il targeting, la gestione delle versioni, il download e l'aggiornamento dei modelli on-device, aiutandoti a migliorare l'esperienza utente mantenendo ottimizzate le dimensioni dell'app. La funzionalità Gioca per l'AI on-device è disponibile senza costi aggiuntivi. Compila il modulo se ti interessa l'accesso in anteprima a Play per l'AI on-device.

Registrati per l'accesso in anteprima a Play per l'AI on-device

IA cloud multimodale con i modelli più avanzati di Google

Puoi creare esperienze di IA generativa multimodale nelle tue app sfruttando i modelli di base che eseguono l'inferenza nel cloud, come i modelli Gemini Pro. Questi modelli sono un'ottima soluzione se vuoi supportare la gamma più ampia possibile di dispositivi Android.

Casi d'uso

  • Descrizioni e sottotitoli codificati di immagini e video: identificare gli oggetti e descriverli in testo
  • Ragionamento multimodale: elaborazione di contenuti di testo, immagini e video
  • Generare testo: riassumere articoli, rispondere a domande sui contenuti testuali, estrarre entità.
  • Formattazione della risposta: formatta la risposta del modello in JSON o Markdown

Soluzioni

Per implementare le tue esperienze di IA in produzione, utilizza Vertex AI in Firebase. L'SDK Firebase fornisce accesso ai modelli Gemini, ma offre anche opzioni di sicurezza e configurazione fondamentali per le app di produzione. Inoltre, Firebase include funzionalità e assistenza a livello di produzione su varie piattaforme mobile.

Scopri di più su Vertex AI in Firebase

AI per le aziende

Icona Vertex AI

Vertex AI è la piattaforma di sviluppo AI unificata e completamente gestita di Google. Le aziende possono utilizzare la piattaforma Vertex AI di Google per offrire esperienze di IA personalizzate ai dispositivi Android utilizzando le integrazioni di backend. Crea, addestra e esegui il deployment di applicazioni di IA sull'infrastruttura scalabile e di livello mondiale di Google. È una ottima soluzione per l'IA su larga scala aziendale, con accesso a oltre 130 modelli e strumenti, tra cui AI Studio, Agent Builder e i modelli Gemini.

Casi d'uso

  • Addestramento e pubblicazione di modelli personalizzati
  • Generazione di immagini e video
  • Agenti virtuali, assistenza clienti
  • Trascrizione vocale, elaborazione del linguaggio naturale

Soluzione

Utilizza la piattaforma Vertex AI di Google per creare applicazioni IA personalizzate e collegare le app Android al livello di servizio.

Scopri di più su Vertex AI

Risorse aggiuntive

Responsible Generative AI Toolkit

I modelli di IA devono essere in linea con le norme di sicurezza, valutati per equità e accuratezza e progettati per essere trasparenti. Il toolkit per l'AI generativa responsabile fornisce assistenza e indicazioni per progettare, sviluppare, valutare ed eseguire il deployment di modelli di AI aperti in modo responsabile.

Gemini in Android Studio

Gemini in Android Studio è un assistente alla programmazione per lo sviluppo di Android. È basato sull'intelligenza artificiale e può comprendere il linguaggio naturale. Ti aiuta a migliorare la produttività rispondendo alle tue domande sullo sviluppo di Android. Gemini può aiutarti a trovare risorse pertinenti, imparare le best practice e risparmiare tempo.

API e SDK Google per l'IA generativa su Android

La tabella seguente è una breve panoramica dei modelli supportati per Vertex AI in Firebase e dei relativi nomi dei modelli stabili più recenti. Questa tabella elenca anche i modelli di anteprima e sperimentali disponibili per i casi d'uso di prototipazione. Per ulteriori dettagli sulle funzionalità di ciascun modello, inclusi i limiti di token e di frequenza, consulta Modelli Gemini.

Modello Input Output Descrizione
Gemini modelli con versioni stabili
Gemini 2.0 Flash
gemini-2.0-flash-001
testo, codice, PDF, immagini, video, audio testo, codice, JSON
(immagini e audio disponibili a breve)
Offre funzionalità e velocità di nuova generazione per una vasta gamma di compiti
(la generazione multimodale sarà disponibile a breve)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
testo, codice, PDF, immagini, video, audio testo, codice, JSON Offre prestazioni convenienti e a bassa latenza; supporta un'elevata velocità in bit
Gemini 1.5 Pro
gemini-1.5-pro-002
testo, codice, PDF, immagini, video, audio testo, codice, JSON Supporta attività di ragionamento complesse che richiedono maggiore intelligenza; contesto di 2 milioni di caratteri
Gemini 1.5 Flash
gemini-1.5-flash-002
testo, codice, PDF, immagini, video, audio testo, codice, JSON Offre prestazioni rapide e versatili per una vasta gamma di attività
Modelli Gemini con solo versioni di anteprima ed sperimentali (consigliati solo per casi d'uso di prototipazione)
Gemini 2.0 Pro
gemini-2.0-pro-exp-02-05
testo, codice, PDF, immagini, video, audio testo, codice, JSON Offre la qualità del modello più elevata, in particolare per il codice e la conoscenza del mondo; contesto lungo 2 milioni
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
testo, codice, PDF, immagini testo, codice, JSON Offre capacità di ragionamento più efficaci e include il processo di pensiero nelle risposte
Modelli Imagen 3 (se utilizzati con Vertex AI in Firebase)
Imagen 3
imagen-3.0-generate-002
messaggio immagini Genera immagini realistiche e di alta qualità da prompt di testo in linguaggio naturale
Imagen 3 Fast
imagen-3.0-fast-generate-001
messaggio immagini Genera immagini per la prototipazione o casi d'uso a bassa latenza