Android 生成式 AI

在 Google I/O '24 大會上,我們揭露了以 AI 為核心的 Android 願景。請觀看這部影片,瞭解 Android 開發人員在 Android 上使用 AI 建構應用程式時的 3 大更新。

選擇適合您的生成式 AI 解決方案

本文概略說明 Android 上的生成式 AI,包括可用的 Gemini 模型和相關 SDK。

高效能裝置端 AI

Gemini 圖示

在支援的 Android 裝置上,您可以提供豐富的生成式 AI 體驗,而無需連上網路或將資料移出裝置。裝置端生成式 AI 模型 (例如 Gemini Nano) 是低延遲、低成本和隱私權保護為主要考量的使用情境中,非常實用的解決方案。

用途

  • AI 強化內容消費功能:文字摘要、文件問答和實體擷取。
  • AI 輔助內容產生功能:校對、文法校正、寫作輔助,以及依據內容提供智慧回覆建議。
  • 分類文字:情緒或心情分析
  • 隱私權:啟用生成式 AI 功能,同時保留裝置上的資料

解決方案

使用 Google AI Edge SDK 在裝置上運用 Gemini Nano 推論。Gemini Nano 實驗功能現已開放一般使用者體驗。

進一步瞭解 Gemini Nano

您可以使用 Play for On-device AI,更有效率地為裝置端 AI 功能提供自訂模型。Google Play 簡化了裝置端模型的啟動、指定目標、版本、下載和更新作業,協助您改善使用者體驗,同時維持應用程式大小。Play for On-device AI 可免費使用。如果您有興趣搶先體驗 Play for On-device AI,請填寫這份表單。

申請 Play for On-device AI 搶先體驗

使用 Google 最強大的模型,打造多模態雲端 AI

您可以利用在雲端執行推論的基礎模型 (例如 Gemini Pro 模型),在應用程式中建立多模態生成式 AI 體驗。如果您想支援盡可能廣泛的 Android 裝置,這些模型就是絕佳的解決方案。

用途

  • 圖片和影片說明和字幕:識別物件並以文字描述
  • 多模態推理:處理文字、圖片和影片內容
  • 文字產生:摘要文章、回答有關文字內容的問題,以及擷取實體。
  • 回應格式:將模型回應格式化為 JSON 或 Markdown

解決方案

如要將 AI 體驗投入正式環境,請使用 Firebase 中的 Vertex AI。Firebase SDK 可讓您存取 Gemini 模型,但也提供對實際應用程式而言至關重要的安全性和設定選項。此外,Firebase 也提供各行動平台的正式版支援和功能。

進一步瞭解 Firebase 中的 Vertex AI

企業 AI

Vertex AI 圖示

Vertex AI 是 Google 全代管的統合式 AI 開發平台。企業可以使用 Google 的 Vertex AI 平台,透過後端整合功能,為 Android 裝置提供客製化 AI 體驗。運用 Google 可擴充的世界級基礎架構,建構、訓練及部署 AI 應用程式。這項解決方案非常適合企業級 AI 應用,可讓您存取超過 130 個模型和工具,包括 AI Studio、Agent Builder 和 Gemini 模型。

用途

  • 自訂模型訓練和提交
  • 圖像和影片生成
  • 虛擬服務專員、客戶服務
  • 語音轉文字、自然語言處理

解決方案

使用 Google 的 Vertex AI 平台建構自訂 AI 應用程式,並將 Android 應用程式連結至服務層。

進一步瞭解 Vertex AI

其他資源

負責任的生成式 AI 技術工具包

AI 模型應符合安全政策,並經過公平性和準確性的評估,且設計上應具備透明度。負責任的生成式 AI 工具包提供協助和指引,協助您負責地設計、建構、評估及部署開放式 AI 模型。

Gemini 版 Android Studio

Android Studio 中的 Gemini 是 Android 開發的程式碼編寫助理。這項服務採用人工智慧技術,可以解讀自然語言。它可回答您的 Android 開發相關問題,協助您提高工作效率。Gemini 可協助您找到相關資源、瞭解最佳做法,並節省時間。

適用於 Android 上生成式 AI 的 Google API 和 SDK

下表簡要概述 Firebase 中支援的 Vertex AI 模型,以及最新的穩定模型名稱。這份表格也會列出可用於原型設計用途的預覽和實驗模型。如要進一步瞭解各模型的功能 (包括符記和頻率限制),請參閱Gemini 模型

型號 輸入 輸出 說明
Gemini 穩定版模型
Gemini 2.0 Flash
gemini-2.0-flash-001
文字、程式碼、PDF 檔案、圖片、影片、音訊 文字、程式碼、JSON
(圖片和音訊功能即將推出!)
提供新一代功能和速度,可處理各種任務
(多模態生成功能即將推出!)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
文字、程式碼、PDF 檔案、圖片、影片、音訊 文字、程式碼、JSON 提供成本效益高且延遲時間短的效能,支援高處理量
Gemini 1.5 Pro
gemini-1.5-pro-002
文字、程式碼、PDF 檔案、圖片、影片、音訊 文字、程式碼、JSON 支援需要更多智慧的複雜推理工作;長達 200 萬個詞元的脈絡
Gemini 1.5 Flash
gemini-1.5-flash-002
文字、程式碼、PDF 檔案、圖片、影片、音訊 文字、程式碼、JSON 在各種任務中提供快速且多功能的效能
Gemini 模型 (僅提供預覽和實驗版本) (僅建議用於原型設計用途)
Gemini 2.0 Pro
gemini-2.0-pro-exp-02-05
文字、程式碼、PDF 檔案、圖片、影片、音訊 文字、程式碼、JSON 提供最強的模型品質,特別適用於程式碼和世界知識;長達 200 萬個詞元的脈絡
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
文字、程式碼、PDF 和圖片 文字、程式碼、JSON 提供更強的推理能力,並在回覆中加入思考過程
Imagen 3 模型 (與 Vertex AI in Firebase 搭配使用時)
Imagen 3
imagen-3.0-generate-002
text 圖片 根據自然語言文字提示產生逼真且高品質的圖片
Imagen 3 Fast
imagen-3.0-fast-generate-001
text 圖片 產生圖片,用於原型設計或低延遲用途