Google I/O 2024 では、AI を中核として Android を再構築するビジョンを発表しました。Android デベロッパー向けの Android で AI を活用した開発に関する最新情報のトップ 3 を、この動画でご確認ください。
最適な生成 AI ソリューションを選択する
このドキュメントでは、利用可能な Gemini モデルと関連する SDK など、Android での生成 AI の概要について説明します。
高性能なオンデバイス AI
対応している Android デバイスでは、ネットワーク接続やデバイス外へのデータの移動を必要とせずに、豊富な生成 AI エクスペリエンスを提供できます。Gemini Nano などのオンデバイス生成 AI モデルは、低レイテンシ、低コスト、プライバシー保護を主に重視するユースケースに最適なソリューションです。
ユースケース
- AI を活用したコンテンツの利用: テキストの要約、ドキュメントの質問応答、エンティティの抽出。
- AI を活用したコンテンツ生成: 校正、文法の修正、文章作成支援、コンテキストに応じたスマート リプライ。
- テキストの分類: センチメントまたはムード分析
- プライバシー: データをデバイスに保持しながら生成 AI 機能を利用可能
ソリューション
Google AI Edge SDK を使用して、デバイス上の Gemini Nano 推論を活用します。Gemini Nano の試験運用版が一般公開されました。
オンデバイス AI のための Google Play を使用すると、オンデバイス AI 機能のカスタムモデルをより効率的に提供できます。Google Play では、オンデバイス モデルの起動、ターゲティング、バージョニング、ダウンロード、更新が簡素化されているため、アプリのサイズを最適化しながらユーザー エクスペリエンスを向上させることができます。Play for On-device AI は追加料金なしで利用できます。オンデバイス AI のための Google Play の早期アクセスにご興味をお持ちの場合は、こちらのフォームにご記入ください。
オンデバイス AI のための Google Play の早期アクセスに登録する
Google の最上位モデルを搭載したマルチモーダル Cloud AI
Gemini Pro モデルなど、クラウドで推論を実行する基盤モデルを利用すると、アプリでマルチモーダル生成 AI エクスペリエンスを作成できます。これらのモデルは、可能な限り幅広い Android デバイスをサポートする場合に最適なソリューションです。
ユースケース
- 画像と動画の説明と字幕: オブジェクトを特定し、テキストで説明する
- マルチモーダル推論: テキスト、画像、動画のコンテンツを処理する
- テキスト生成: 記事の要約、テキスト コンテンツに関する質問への回答、エンティティの抽出。
- レスポンスのフォーマット: モデルのレスポンスを JSON または Markdown にフォーマットします。
ソリューション
AI エクスペリエンスを本番環境に導入するには、Firebase で Vertex AI を使用します。Firebase SDK は Gemini モデルへのアクセスを提供しますが、本番環境アプリに不可欠なセキュリティと構成オプションも提供します。さらに、Firebase には、さまざまなモバイル プラットフォームにわたる本番環境レベルのサポートと機能が含まれています。
エンタープライズ向け AI
Vertex AI は、AI 向けの Google のフルマネージド統合 AI 開発プラットフォームです。企業は、Google の Vertex AI プラットフォームを使用して、バックエンド統合を使用して Android デバイスにカスタマイズされた AI エクスペリエンスを提供できます。Google のスケーラブルで世界クラスのインフラストラクチャで AI アプリケーションを構築、トレーニング、デプロイします。AI Studio、Agent Builder、Gemini モデルなど、130 を超えるモデルとツールにアクセスできるため、エンタープライズ スケールの AI に最適なソリューションです。
ユースケース
- カスタムモデルのトレーニングと配信
- 画像と動画の生成
- 仮想エージェント、カスタマー サポート
- 音声文字変換、自然言語処理
解決策
Google の Vertex AI プラットフォームを使用してカスタム AI アプリケーションを構築し、Android アプリをサービスレイヤに接続します。
参考情報
責任ある生成 AI ツールキット
AI モデルは、安全性に関するポリシーに準拠し、公平性と精度が評価され、透明性を確保するように設計する必要があります。責任ある生成 AI ツールキットは、オープン AI モデルを責任を持って設計、構築、評価、デプロイするためのヘルプとガイダンスを提供します。
Gemini in Android Studio
Android Studio の Gemini は、Android 開発用のコーディング アシスタントです。人工知能を活用し、自然言語を理解できます。Android 開発に関する質問に回答することで、生産性を高めることができます。Gemini は、関連するリソースの検索、ベスト プラクティスの学習、時間の節約に役立ちます。
Android の生成 AI 用の Google API と SDK
次の表に、Firebase で Vertex AI でサポートされているモデルと、最新の安定版モデル名の概要を示します。この表には、ユースケースのプロトタイピングに使用できるプレビュー版モデルと試験運用版モデルも示されています。トークンとレート制限など、各モデルの機能の詳細については、Gemini モデルをご覧ください。
モデル | 入力 | 出力 | 説明 |
---|---|---|---|
安定版の Gemini モデル | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
テキスト、コード、PDF、画像、動画、音声 |
テキスト、コード、JSON (画像と音声は近日提供予定) |
さまざまなタスクに対応する次世代の機能と速度を提供 (マルチモーダル生成は近日提供予定) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | 費用対効果に優れた低レイテンシのパフォーマンスを提供し、高スループットをサポートします。 |
Gemini 1.5 Progemini-1.5-pro-002
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | より高度なインテリジェンスを必要とする複雑な推論タスクをサポート。200 万文字の長いコンテキスト |
Gemini 1.5 Flashgemini-1.5-flash-002
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | さまざまなタスクで高速で汎用性の高いパフォーマンスを提供します。 |
プレビュー バージョンと試験運用版のみの Gemini モデル (プロトタイピングのユースケースにのみ推奨) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | 非常に品質の高いモデルで、特にコードと世界中の知識に優れています。200 万個のトークンの長いコンテキストに対応しています。 |
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
|
テキスト、コード、PDF、画像 | テキスト、コード、JSON | 推論機能が強化されており、回答に思考プロセスが含まれます。 |
Imagen 3 モデル (Vertex AI in Firebase で使用する場合) | |||
Imagen 3imagen-3.0-generate-002
|
text | 画像 | 自然言語テキスト プロンプトからリアルで高品質な画像を生成します。 |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
text | 画像 | プロトタイピングや低レイテンシのユースケース用の画像を生成する |