Generatywna AI na Androidzie

Na konferencji Google I/O 2024 przedstawiliśmy nową wizję Androida, w której sztuczna inteligencja odgrywa kluczową rolę. W tym filmie znajdziesz 3 najważniejsze aktualizacje dotyczące tworzenia aplikacji z wykorzystaniem AI na Androida.

Wybierz rozwiązanie z generatywnej AI odpowiednie dla siebie

Ten dokument zawiera ogólne informacje o generatywnej AI na Androidzie, w tym o dostępnych modelach Gemini i powiązanych pakietach SDK.

Wysokiej jakości AI na urządzeniu

Ikona Gemini

Na obsługiwanych urządzeniach z Androidem możesz korzystać z bogatych funkcji generatywnej AI bez konieczności łączenia się z internetem ani przesyłania danych z urządzenia. Modele generatywnej AI na urządzeniu, takie jak Gemini Nano, to świetne rozwiązania do zastosowań, w których najważniejsze są mała opóźnienie, niski koszt i zabezpieczenia prywatności.

Przykłady zastosowań

  • Konsumpcja treści z użyciem AI: podsumowywanie tekstu, odpowiadanie na pytania dotyczące dokumentów i wyodrębnianie encji.
  • Generowanie treści z pomocą AI: sprawdzanie pisowni, poprawianie gramatyki, pomoc w pisaniu i kontekstowe inteligentne odpowiedzi.
  • Klasyfikacja tekstu: analiza nastawienia lub nastroju
  • Prywatność: funkcja umożliwia korzystanie z funkcji generatywnej AI, zachowując dane na urządzeniu.

Rozwiązania

Użyj pakietu Google AI Edge SDK, aby korzystać z funkcji wnioskowania Gemini Nano na urządzeniu. Gemini Nano jest teraz dostępny publicznie w wersji eksperymentalnej.

Więcej informacji o Gemini Nano

Dzięki wdrożeniu AI na urządzeniach za pomocą Google Play możesz skuteczniej dostarczać niestandardowe modele do obsługi funkcji AI na urządzeniach. Google Play upraszcza uruchamianie, kierowanie, wersjonowanie, pobieranie i aktualizowanie modeli na urządzeniu, co pomaga poprawić wrażenia użytkowników przy jednoczesnym zoptymalizowaniu rozmiaru aplikacji. Graj bezpłatnie AI na urządzeniu jest dostępny bez dodatkowych kosztów. Jeśli chcesz skorzystać z wcześniejszego dostępu do wdrażania AI na urządzeniach za pomocą Google Play, wypełnij ten formularz.

Rejestracja w programie Play for On-device AI w ramach wczesnego dostępu

Multimodal Cloud AI z najbardziej zaawansowanymi modelami Google

Możesz tworzyć w swoich aplikacjach multimodalne rozwiązania oparte na generatywnej AI, korzystając z modeli podstawowych, które wykonują wnioskowanie w chmurze, takich jak modele Gemini Pro. Te modele to świetne rozwiązanie, jeśli chcesz obsługiwać jak największą liczbę urządzeń z Androidem.

Przykłady zastosowań

  • Opis i napisy do obrazu lub filmu: identyfikowanie obiektów i opisywanie ich w tekście.
  • Rozumowanie multimodalne: przetwarzanie tekstu, obrazów i treści wideo.
  • Generowanie tekstu: streszczanie artykułów, udzielanie odpowiedzi na pytania dotyczące treści tekstowych, wyodrębnianie jednostek.
  • Formatowanie odpowiedzi: możesz sformatować odpowiedź modelu w formacie JSON lub Markdown.

Rozwiązania

Aby wdrożyć rozwiązania AI w produkcji, użyj Vertex AI w Firebase. Pakiet SDK Firebase zapewnia dostęp do modeli Gemini, ale oferuje też opcje zabezpieczeń i konfiguracji, które są kluczowe w przypadku aplikacji produkcyjnych. Firebase zapewnia też obsługę i funkcje na poziomie produkcji na różnych platformach mobilnych.

Więcej informacji o Vertex AI w Firebase

Sztuczna inteligencja dla firm

Ikona Vertex AI

Vertex AI to w pełni zarządzana, ujednolicona platforma Google do tworzenia rozwiązań AI. Firmy mogą korzystać z platformy Vertex AI firmy Google, aby dostarczać spersonalizowane rozwiązania AI na urządzeniach z Androidem, korzystając z integracji z backendem. Tworzenie, trenowanie i wdrażanie aplikacji AI w skalowanej, światowej klasy infrastrukturze Google. Jest to świetne rozwiązanie do tworzenia AI na potrzeby przedsiębiorstw, które zapewnia dostęp do ponad 130 modeli i narzędzi, w tym AI Studio, Agent Builder i modele Gemini.

Przykłady zastosowań

  • Trenowanie i dostarczanie modelu niestandardowego
  • generowanie obrazów i filmów,
  • Wirtualni asystenci, obsługa klienta
  • przekształcanie mowy na tekst i przetwarzanie języka naturalnego;

Rozwiązanie

Używaj platformy Vertex AI od Google do tworzenia niestandardowych aplikacji AI i łączenia aplikacji na Androida z poziomem usług.

Więcej informacji o Vertex AI

Dodatkowe materiały

Zestaw narzędzi odpowiedzialnej generatywnej AI

Modele AI powinny być zgodne z zasadami bezpieczeństwa, oceniane pod kątem sprawiedliwości i dokładności oraz zaprojektowane w sposób przejrzysty. Zestaw narzędzi do odpowiedzialnego tworzenia generatywnej AI zawiera wskazówki, które pomogą Ci odpowiedzialnie projektować, tworzyć, oceniać i wdrażać otwarte modele AI.

Gemini w Android Studio

Gemini w Android Studio to asystent kodowania do tworzenia aplikacji na Androida. Jest ona oparta na sztucznej inteligencji i rozumie język naturalny. Pomaga zwiększyć produktywność, odpowiadając na pytania dotyczące programowania aplikacji na Androida. Gemini może Ci pomóc znaleźć odpowiednie zasoby, dowiedzieć się o sprawdzonych metodach i zaoszczędzić czas.

Interfejsy API i pakiety SDK Google do generatywnej AI na Androidzie

W tabeli poniżej znajdziesz krótki przegląd obsługiwanych modeli Vertex AI w Firebase oraz ich najnowsze stabilne nazwy. Tabela zawiera też modele w wersji zapoznawczej i eksperymentalne, które są dostępne do tworzenia prototypów. Więcej informacji o możliwościach poszczególnych modeli, w tym o limitach tokenów i stawek, znajdziesz w artykule Modele Gemini.

Model Urządzenie wejściowe Urządzenie wyjściowe Opis
Geminimodele z wersjami stabilnymi
Gemini 2.0 Flash
gemini-2.0-flash-001
tekst, kod, pliki PDF, obrazy, filmy, dźwięk tekst, kod, JSON
(wkrótce: obrazy i dźwięk)
Zapewnia funkcje nowej generacji i szybkość w przypadku różnych zadań
(wkrótce udostępnimy generowanie multimodalne)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
tekst, kod, pliki PDF, obrazy, filmy, dźwięk tekst, kod, JSON Zapewnia wydajność z niskim opóźnieniem przy niskich kosztach; obsługuje wysoką przepustowość
Gemini 1.5 Pro
gemini-1.5-pro-002
tekst, kod, pliki PDF, obrazy, filmy, dźwięk tekst, kod, JSON Obsługuje złożone zadania wymagające większej inteligencji; kontekst o długości 2 mln tokenów
Gemini 1.5 Flash
gemini-1.5-flash-002
tekst, kod, pliki PDF, obrazy, filmy, dźwięk tekst, kod, JSON Zapewnia szybką i wszechstronną wydajność w wielu różnych zadaniach
Geminimodele z tylko wersjami wstępnymi i eksperymentalnymi (zalecane tylko do tworzenia prototypów)
Gemini 2.0 Pro
gemini-2.0-pro-exp-02-05
tekst, kod, pliki PDF, obrazy, filmy, dźwięk tekst, kod, JSON Zapewnia najwyższą jakość modelu, zwłaszcza w przypadku kodu i wiedzy o świecie; kontekst o długości 2 mln.
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
tekst, kod, pliki PDF, obrazy tekst, kod, JSON Oferuje lepsze możliwości rozumowania i zawiera w odpowiedziach proces myślowy
Imagen 3 modeli (w przypadku korzystania z Vertex AI in Firebase)
Imagen 3
imagen-3.0-generate-002
tekst zdjęcia generuje realistyczne, wysokiej jakości obrazy na podstawie promptów w języku naturalnym.
Imagen 3 Fast
imagen-3.0-fast-generate-001
tekst zdjęcia generuje obrazy do tworzenia prototypów lub do zastosowań wymagających niskiego opóźnienia;