在 Google I/O '24 大會上,我們揭露了以 AI 為核心的 Android 願景。請觀看這部影片,瞭解 Android 開發人員在 Android 上使用 AI 建構應用程式時的 3 大更新。
選擇適合您的生成式 AI 解決方案
本文概略說明 Android 上的生成式 AI,包括可用的 Gemini 模型和相關 SDK。
高效能裝置端 AI
在支援的 Android 裝置上,您可以提供豐富的生成式 AI 體驗,而無需連上網路或將資料移出裝置。裝置端生成式 AI 模型 (例如 Gemini Nano) 是低延遲、低成本和隱私權保護為主要考量的使用情境中,非常實用的解決方案。
用途
- AI 強化內容消費功能:文字摘要、文件問答和實體擷取。
- AI 輔助內容產生功能:校對、文法校正、寫作輔助,以及依據內容提供智慧回覆建議。
- 分類文字:情緒或心情分析
- 隱私權:啟用生成式 AI 功能,同時保留裝置上的資料
解決方案
使用 Google AI Edge SDK 在裝置上運用 Gemini Nano 推論。Gemini Nano 實驗功能現已開放一般使用者體驗。
您可以使用 Play for On-device AI,更有效率地為裝置端 AI 功能提供自訂模型。Google Play 簡化了裝置端模型的啟動、指定目標、版本、下載和更新作業,協助您改善使用者體驗,同時維持應用程式大小。Play for On-device AI 可免費使用。如果您有興趣搶先體驗 Play for On-device AI,請填寫這份表單。
使用 Google 最強大的模型,打造多模態雲端 AI
您可以利用在雲端執行推論的基礎模型 (例如 Gemini Pro 模型),在應用程式中建立多模態生成式 AI 體驗。如果您想支援盡可能廣泛的 Android 裝置,這些模型就是絕佳的解決方案。
用途
- 圖片和影片說明和字幕:識別物件並以文字描述
- 多模態推理:處理文字、圖片和影片內容
- 文字產生:摘要文章、回答有關文字內容的問題,以及擷取實體。
- 回應格式:將模型回應格式化為 JSON 或 Markdown
解決方案
如要將 AI 體驗投入正式環境,請使用 Firebase 中的 Vertex AI。Firebase SDK 可讓您存取 Gemini 模型,但也提供對實際應用程式而言至關重要的安全性和設定選項。此外,Firebase 也提供各行動平台的正式版支援和功能。
企業 AI
Vertex AI 是 Google 全代管的統合式 AI 開發平台。企業可以使用 Google 的 Vertex AI 平台,透過後端整合功能,為 Android 裝置提供客製化 AI 體驗。運用 Google 可擴充的世界級基礎架構,建構、訓練及部署 AI 應用程式。這項解決方案非常適合企業級 AI 應用,可讓您存取超過 130 個模型和工具,包括 AI Studio、Agent Builder 和 Gemini 模型。
用途
- 自訂模型訓練和提交
- 圖像和影片生成
- 虛擬服務專員、客戶服務
- 語音轉文字、自然語言處理
解決方案
使用 Google 的 Vertex AI 平台建構自訂 AI 應用程式,並將 Android 應用程式連結至服務層。
其他資源
負責任的生成式 AI 技術工具包
AI 模型應符合安全政策,並經過公平性和準確性的評估,且設計上應具備透明度。負責任的生成式 AI 工具包提供協助和指引,協助您負責地設計、建構、評估及部署開放式 AI 模型。
Gemini 版 Android Studio
Android Studio 中的 Gemini 是 Android 開發的程式碼編寫助理。這項服務採用人工智慧技術,可以解讀自然語言。它可回答您的 Android 開發相關問題,協助您提高工作效率。Gemini 可協助您找到相關資源、瞭解最佳做法,並節省時間。
適用於 Android 上生成式 AI 的 Google API 和 SDK
下表簡要概述 Firebase 中支援的 Vertex AI 模型,以及最新的穩定模型名稱。這份表格也會列出可用於原型設計用途的預覽和實驗模型。如要進一步瞭解各模型的功能 (包括符記和頻率限制),請參閱Gemini 模型。
型號 | 輸入 | 輸出 | 說明 |
---|---|---|---|
Gemini 穩定版模型 | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 |
文字、程式碼、JSON (圖片和音訊功能即將推出!) |
提供新一代功能和速度,可處理各種任務 (多模態生成功能即將推出!) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 提供成本效益高且延遲時間短的效能,支援高處理量 |
Gemini 1.5 Progemini-1.5-pro-002
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 支援需要更多智慧的複雜推理工作;長達 200 萬個詞元的脈絡 |
Gemini 1.5 Flashgemini-1.5-flash-002
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 在各種任務中提供快速且多功能的效能 |
Gemini 模型 (僅提供預覽和實驗版本) (僅建議用於原型設計用途) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 提供最強的模型品質,特別適用於程式碼和世界知識;長達 200 萬個詞元的脈絡 |
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
|
文字、程式碼、PDF 和圖片 | 文字、程式碼、JSON | 提供更強的推理能力,並在回覆中加入思考過程 |
Imagen 3 模型 (與 Vertex AI in Firebase 搭配使用時) | |||
Imagen 3imagen-3.0-generate-002
|
text | 圖片 | 根據自然語言文字提示產生逼真且高品質的圖片 |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
text | 圖片 | 產生圖片,用於原型設計或低延遲用途 |