IA generativa no Android

No Google I/O 2024, apresentamos uma visão do Android reimaginado com a IA no centro. Confira as três principais atualizações para criar com IA no Android para desenvolvedores Android neste vídeo.

Escolha a solução de IA generativa ideal para você

Este documento apresenta uma visão geral da IA generativa no Android, incluindo os modelos Gemini disponíveis e os SDKs associados.

IA no dispositivo com alto desempenho

Ícone do Gemini

Em dispositivos Android com suporte, é possível oferecer experiências ricas de IA generativa sem precisar de uma conexão de rede ou mover dados para fora do dispositivo. Modelos de IA generativa no dispositivo, como o Gemini Nano, são ótimas soluções para casos de uso em que baixa latência, baixo custo e proteção de privacidade são as principais preocupações.

Casos de uso

  • Consumo de conteúdo aprimorado por IA: resumo de texto, resposta a perguntas de documentos e extração de entidades.
  • Criação de conteúdo com tecnologia de IA: revisão, correção gramatical, assistência na escrita e respostas inteligentes contextuais.
  • Classificação de texto: análise de sentimento ou humor
  • Privacidade: desbloqueia recursos de IA generativa e mantém os dados no dispositivo

Soluções

Use o SDK da Google AI Edge para aproveitar a inferência do Gemini Nano no dispositivo. O Gemini Nano agora está disponível publicamente para acesso experimental.

Saiba mais sobre o Gemini Nano

Forneça modelos personalizados para recursos de IA no dispositivo com mais eficiência com o Google Play para IA no dispositivo. O Google Play simplifica a inicialização, a segmentação, a versão, o download e a atualização dos modelos no dispositivo, ajudando você a melhorar a experiência do usuário e manter o tamanho do app otimizado. O recurso AI On-device está disponível sem custo extra. Preencha o formulário se você tiver interesse no acesso antecipado ao Google Play para IA no dispositivo.

Inscrever-se no acesso antecipado ao Google Play para IA no dispositivo

IA multimodal na nuvem com os modelos mais avançados do Google

É possível criar experiências de IA generativa multimodais nos seus apps usando modelos de fundação que executam inferência na nuvem, como os modelos Pro do Gemini. Esses modelos são uma ótima solução quando você quer oferecer suporte à maior variedade possível de dispositivos Android.

Casos de uso

  • Descrição e legendagem de imagens e vídeos: identificar objetos e descrevê-los em texto
  • Raciocínio multimodal: processamento de conteúdo de texto, imagem e vídeo
  • Geração de texto: resuma artigos, responda a perguntas sobre conteúdo textual e extraia entidades.
  • Formatação da resposta: formate a resposta do modelo para JSON ou Markdown.

Soluções

Para levar suas experiências de IA para a produção, use a Vertex AI no Firebase. O SDK do Firebase oferece acesso aos modelos Gemini, mas também oferece opções de segurança e configuração essenciais para apps de produção. Além disso, o Firebase inclui suporte e recursos de produção em várias plataformas móveis.

Saiba mais sobre a Vertex AI no Firebase

IA para empresas

Ícone da Vertex AI

A Vertex AI é uma plataforma de desenvolvimento de IA unificada e totalmente gerenciada do Google. As empresas podem usar a plataforma Vertex AI do Google para oferecer experiências de IA personalizadas a dispositivos Android usando integrações de back-end. Crie, treine e implante aplicativos de IA na infraestrutura escalonável e de nível internacional do Google. É uma ótima solução para IA em escala empresarial, com acesso a mais de 130 modelos e ferramentas, incluindo o AI Studio, o Agent Builder e os modelos Gemini.

Casos de uso

  • Treinamento e envio de modelos personalizados
  • Geração de imagens e vídeos
  • Agentes virtuais, suporte ao cliente
  • Processamento de linguagem natural e conversão de voz em texto

Solução

Use a plataforma Vertex AI do Google para criar aplicativos de IA personalizados e conectar apps Android à camada de serviço.

Saiba mais sobre a Vertex AI

Outros recursos

Toolkit para IA generativa responsável

Os modelos de IA precisam estar alinhados às políticas de segurança, ser avaliados quanto à imparcialidade e precisão e projetados para serem transparentes. O Kit de ferramentas de IA generativa responsável oferece ajuda e orientação para projetar, criar, avaliar e implantar modelos abertos de IA com responsabilidade.

Gemini no Android Studio

O Gemini no Android Studio é um parceiro de programação para desenvolvimento Android. Ele é baseado em inteligência artificial e pode entender a linguagem natural. Ele ajuda a aumentar a produtividade ao responder perguntas sobre desenvolvimento Android. O Gemini pode ajudar você a encontrar recursos relevantes, aprender as práticas recomendadas e economizar tempo.

APIs e SDKs do Google para IA generativa no Android

A tabela a seguir é uma breve visão geral dos modelos compatíveis com a Vertex AI no Firebase e os nomes dos modelos estáveis mais recentes. Essa tabela também lista modelos de pré-lançamento e experimentais disponíveis para casos de uso de protótipos. Para mais detalhes sobre os recursos de cada modelo, incluindo limites de taxa e de token, consulte Modelos Gemini.

Modelo Entrada Saída Descrição
Modelos Gemini com versões estáveis
Gemini 2.0 Flash
gemini-2.0-flash-001
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON
(imagens e áudio em breve)
Oferece recursos e velocidade de última geração para uma variedade de tarefas
(geração multimodal em breve)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Oferece desempenho econômico e de baixa latência e oferece suporte a alta taxa de transferência
Gemini 1.5 Pro
gemini-1.5-pro-002
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Suporte a tarefas de raciocínio complexas que exigem mais inteligência; contexto 2 milhões de tokens
Gemini 1.5 Flash
gemini-1.5-flash-002
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Oferece desempenho rápido e versátil em diversas tarefas
Modelos Gemini com somente versões de pré-lançamento e experimentais (recomendado apenas para casos de uso de prototipagem)
Gemini 2.0 Pro
gemini-2.0-pro-exp-02-05
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Oferece a melhor qualidade de modelo, especialmente para código e conhecimento mundial; contexto de 2 milhões
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
texto, código, PDFs, imagens texto, código, JSON Oferece recursos de raciocínio mais fortes e inclui o processo de pensamento nas respostas
Modelos Imagen 3 (ao usar com Vertex AI in Firebase)
Imagen 3
imagen-3.0-generate-002
texto imagens Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural
Imagen 3 Fast
imagen-3.0-fast-generate-001
texto imagens Gera imagens para prototipagem ou casos de uso de baixa latência