Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

ハイブリッド推論

Google は、クラウドベースとデバイスベースの両方の推論に対応する、業界をリードする AI モデルと API を幅広く提供しています。ハイブリッド推論を使用すると、ローカルデバイスとクラウドの間で AI ワークロードをシームレスに分散し、パフォーマンス、費用、可用性を最適化できます。

ハイブリッド推論には、Android アプリに主に次の 2 つのメリットがあります。

リーチを最大化: デバイスのハードウェアや OS の制約により、Gemini Nano などのデバイスモデルが利用できない場合、クラウドモデルが重要なフォールバックとして機能します。これにより、可能な限り幅広いユーザーデバイスで AI 機能を維持できます。
費用とオフライン機能: デバイスモデルを使用すると、ユーザーがオフラインの場合でも AI 機能をシームレスに利用できます。また、ルーティンタスクをローカルデバイスにオフロードすることで、クラウド推論の費用を削減できます。

デバイスでの推論とクラウドでの推論のメリットは次のとおりです。

デバイスでの推論	クラウドでの推論
オフラインで使用可能	あらゆるデバイスに対応
推論費用なし	高度なモデル機能

実装オプション

次の方法でハイブリッド推論を実装できます。

Firebase AI Logic Hybrid API

Firebase AI Logic Hybrid API は、クラウド環境とデバイス環境の間で推論を分割するための単一の統合インターフェースを提供します。

推論モードを定義してルーティングを管理するためのシンプルなコントロールを提供する onDeviceConfig パラメータが含まれています。

PREFER_ON_DEVICE: デバイスモデルの使用を試み、デバイスモデルがリクエストで利用できない場合やサポートされていない場合は、クラウドホスト型モデルに自動的にフォールバックします。
PREFER_IN_CLOUD: デバイスがオンラインでモデルが利用可能な場合は、クラウドホスト型モデルの使用を試み、デバイスがオフラインの場合にのみデバイスモデルにフォールバックします。
ONLY_ON_DEVICE: デバイスモデルの使用を試みますが、リクエストで利用できない場合やサポートされていない場合は例外をスローします。
ONLY_IN_CLOUD: デバイスがオンラインでモデルが利用可能な場合は、クラウドホスト型モデルの使用を試み、それ以外の場合は例外をスローします。

val model = Firebase.ai(backend = GenerativeBackend.Companion.googleAI())
    .generativeModel(
        modelName = "gemini-2.5-flash",
        onDeviceConfig = OnDeviceConfig(mode = InferenceMode.Companion.PREFER_ON_DEVICE)
    )

val response = model.generateContent("Write a story about a green robot.")
print(response.text)HybridInferenceSnippets.kt

実装の詳細については、Firebase のドキュメントを確認し、 AI カタログでハイブリッド AI サンプルをご覧ください。

カスタムルーティング

アプリに特定のビジネス要件または UX 要件がある場合は、カスタムルーティングロジックを実装することもできます。これにより、次のようなリアルタイムの要因に基づいて推論パスを動的に決定できます。

ネットワークレイテンシ
デバイスのシステムヘルス（バッテリー残量やプロセッサの負荷など）
ユーザークエリの複雑さ

このカスタムハイブリッド推論アプローチは、独自のカスタムルーティングを実装して信頼性の高い AI エクスペリエンスを提供している主要なアプリで使用されています。例を次に示します。

Gboard: Gboard は、カスタムハイブリッド推論を使用して、校正や書き換えなどの文章作成ツールを強化しています。
Kakao Mobility: Kakao Mobility は、カスタムハイブリッド推論を使用して、宅配サービス用のエンティティ抽出ツールを構築しました。このツールは、自然言語メッセージから受取人の名前、住所、電話番号を自動的に抽出して、注文フォームを効率化します。

ハイブリッド推論 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

実装オプション

Firebase AI Logic Hybrid API

カスタム ルーティング

ハイブリッド推論

カスタムルーティング