Na konferencji Google I/O 2024 przedstawiliśmy nową wizję Androida, w której sztuczna inteligencja odgrywa kluczową rolę. W tym filmie znajdziesz 3 najważniejsze aktualizacje dotyczące tworzenia aplikacji z wykorzystaniem AI na Androida.
Wybierz rozwiązanie z generatywnej AI odpowiednie dla siebie
Ten dokument zawiera ogólne informacje o generatywnej AI na Androidzie, w tym o dostępnych modelach Gemini i powiązanych pakietach SDK.
Wysokiej jakości AI na urządzeniu
Na obsługiwanych urządzeniach z Androidem możesz korzystać z bogatych funkcji generatywnej AI bez konieczności łączenia się z internetem ani przesyłania danych z urządzenia. Modele generatywnej AI na urządzeniu, takie jak Gemini Nano, to świetne rozwiązania do zastosowań, w których najważniejsze są mała opóźnienie, niski koszt i zabezpieczenia prywatności.
Przykłady zastosowań
- Konsumpcja treści z użyciem AI: podsumowywanie tekstu, odpowiadanie na pytania dotyczące dokumentów i wyodrębnianie encji.
- Generowanie treści z pomocą AI: sprawdzanie pisowni, poprawianie gramatyki, pomoc w pisaniu i kontekstowe inteligentne odpowiedzi.
- Klasyfikacja tekstu: analiza nastawienia lub nastroju
- Prywatność: funkcja umożliwia korzystanie z funkcji generatywnej AI, zachowując dane na urządzeniu.
Rozwiązania
Użyj pakietu Google AI Edge SDK, aby korzystać z funkcji wnioskowania Gemini Nano na urządzeniu. Gemini Nano jest teraz dostępny publicznie w wersji eksperymentalnej.
Więcej informacji o Gemini Nano
Dzięki wdrożeniu AI na urządzeniach za pomocą Google Play możesz skuteczniej dostarczać niestandardowe modele do obsługi funkcji AI na urządzeniach. Google Play upraszcza uruchamianie, kierowanie, wersjonowanie, pobieranie i aktualizowanie modeli na urządzeniu, co pomaga poprawić wrażenia użytkowników przy jednoczesnym zoptymalizowaniu rozmiaru aplikacji. Graj bezpłatnie AI na urządzeniu jest dostępny bez dodatkowych kosztów. Jeśli chcesz skorzystać z wcześniejszego dostępu do wdrażania AI na urządzeniach za pomocą Google Play, wypełnij ten formularz.
Rejestracja w programie Play for On-device AI w ramach wczesnego dostępu
Multimodal Cloud AI z najbardziej zaawansowanymi modelami Google
Możesz tworzyć w swoich aplikacjach multimodalne rozwiązania oparte na generatywnej AI, korzystając z modeli podstawowych, które wykonują wnioskowanie w chmurze, takich jak modele Gemini Pro. Te modele to świetne rozwiązanie, jeśli chcesz obsługiwać jak największą liczbę urządzeń z Androidem.
Przykłady zastosowań
- Opis i napisy do obrazu lub filmu: identyfikowanie obiektów i opisywanie ich w tekście.
- Rozumowanie multimodalne: przetwarzanie tekstu, obrazów i treści wideo.
- Generowanie tekstu: streszczanie artykułów, udzielanie odpowiedzi na pytania dotyczące treści tekstowych, wyodrębnianie jednostek.
- Formatowanie odpowiedzi: możesz sformatować odpowiedź modelu w formacie JSON lub Markdown.
Rozwiązania
Aby wdrożyć rozwiązania AI w produkcji, użyj Vertex AI w Firebase. Pakiet SDK Firebase zapewnia dostęp do modeli Gemini, ale oferuje też opcje zabezpieczeń i konfiguracji, które są kluczowe w przypadku aplikacji produkcyjnych. Firebase zapewnia też obsługę i funkcje na poziomie produkcji na różnych platformach mobilnych.
Więcej informacji o Vertex AI w Firebase
Sztuczna inteligencja dla firm
Vertex AI to w pełni zarządzana, ujednolicona platforma Google do tworzenia rozwiązań AI. Firmy mogą korzystać z platformy Vertex AI firmy Google, aby dostarczać spersonalizowane rozwiązania AI na urządzeniach z Androidem, korzystając z integracji z backendem. Tworzenie, trenowanie i wdrażanie aplikacji AI w skalowanej, światowej klasy infrastrukturze Google. Jest to świetne rozwiązanie do tworzenia AI na potrzeby przedsiębiorstw, które zapewnia dostęp do ponad 130 modeli i narzędzi, w tym AI Studio, Agent Builder i modele Gemini.
Przykłady zastosowań
- Trenowanie i dostarczanie modelu niestandardowego
- generowanie obrazów i filmów,
- Wirtualni asystenci, obsługa klienta
- przekształcanie mowy na tekst i przetwarzanie języka naturalnego;
Rozwiązanie
Używaj platformy Vertex AI od Google do tworzenia niestandardowych aplikacji AI i łączenia aplikacji na Androida z poziomem usług.
Dodatkowe materiały
Zestaw narzędzi odpowiedzialnej generatywnej AI
Modele AI powinny być zgodne z zasadami bezpieczeństwa, oceniane pod kątem sprawiedliwości i dokładności oraz zaprojektowane w sposób przejrzysty. Zestaw narzędzi do odpowiedzialnego tworzenia generatywnej AI zawiera wskazówki, które pomogą Ci odpowiedzialnie projektować, tworzyć, oceniać i wdrażać otwarte modele AI.
Gemini w Android Studio
Gemini w Android Studio to asystent kodowania do tworzenia aplikacji na Androida. Jest ona oparta na sztucznej inteligencji i rozumie język naturalny. Pomaga zwiększyć produktywność, odpowiadając na pytania dotyczące programowania aplikacji na Androida. Gemini może Ci pomóc znaleźć odpowiednie zasoby, dowiedzieć się o sprawdzonych metodach i zaoszczędzić czas.
Interfejsy API i pakiety SDK Google do generatywnej AI na Androidzie
W tabeli poniżej znajdziesz krótki przegląd obsługiwanych modeli Vertex AI w Firebase oraz ich najnowsze stabilne nazwy. Tabela zawiera też modele w wersji zapoznawczej i eksperymentalne, które są dostępne do tworzenia prototypów. Więcej informacji o możliwościach poszczególnych modeli, w tym o limitach tokenów i stawek, znajdziesz w artykule Modele Gemini.
Model | Urządzenie wejściowe | Urządzenie wyjściowe | Opis |
---|---|---|---|
Geminimodele z wersjami stabilnymi | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
tekst, kod, pliki PDF, obrazy, filmy, dźwięk |
tekst, kod, JSON (wkrótce: obrazy i dźwięk) |
Zapewnia funkcje nowej generacji i szybkość w przypadku różnych zadań (wkrótce udostępnimy generowanie multimodalne) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
tekst, kod, pliki PDF, obrazy, filmy, dźwięk | tekst, kod, JSON | Zapewnia wydajność z niskim opóźnieniem przy niskich kosztach; obsługuje wysoką przepustowość |
Gemini 1.5 Progemini-1.5-pro-002
|
tekst, kod, pliki PDF, obrazy, filmy, dźwięk | tekst, kod, JSON | Obsługuje złożone zadania wymagające większej inteligencji; kontekst o długości 2 mln tokenów |
Gemini 1.5 Flashgemini-1.5-flash-002
|
tekst, kod, pliki PDF, obrazy, filmy, dźwięk | tekst, kod, JSON | Zapewnia szybką i wszechstronną wydajność w wielu różnych zadaniach |
Geminimodele z tylko wersjami wstępnymi i eksperymentalnymi (zalecane tylko do tworzenia prototypów) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
tekst, kod, pliki PDF, obrazy, filmy, dźwięk | tekst, kod, JSON | Zapewnia najwyższą jakość modelu, zwłaszcza w przypadku kodu i wiedzy o świecie; kontekst o długości 2 mln. |
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
|
tekst, kod, pliki PDF, obrazy | tekst, kod, JSON | Oferuje lepsze możliwości rozumowania i zawiera w odpowiedziach proces myślowy |
Imagen 3 modeli (w przypadku korzystania z Vertex AI in Firebase) | |||
Imagen 3imagen-3.0-generate-002
|
tekst | zdjęcia | generuje realistyczne, wysokiej jakości obrazy na podstawie promptów w języku naturalnym. |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
tekst | zdjęcia | generuje obrazy do tworzenia prototypów lub do zastosowań wymagających niskiego opóźnienia; |