การอนุมานแบบไฮบริด

Google มีโมเดลและ API ของ AI ชั้นนำในอุตสาหกรรมให้เลือกมากมาย สำหรับการอนุมานทั้งในระบบคลาวด์และในอุปกรณ์ การอนุมานแบบไฮบริดช่วยให้คุณปรับสมดุลภาระงาน AI ระหว่างอุปกรณ์ในพื้นที่กับระบบคลาวด์ได้อย่างราบรื่น ซึ่งจะช่วยเพิ่มประสิทธิภาพ ลดค่าใช้จ่าย และเพิ่มความพร้อมใช้งาน

การอนุมานแบบไฮบริดมีข้อดีหลักๆ 2 ประการสำหรับแอป Android ของคุณ ดังนี้

  • เพิ่มการเข้าถึงสูงสุด: โมเดลระบบคลาวด์เป็นตัวเลือกสำรองที่สำคัญเมื่อโมเดลในอุปกรณ์ เช่น Gemini Nano ไม่พร้อมใช้งานเนื่องจากข้อจำกัดด้านฮาร์ดแวร์ของอุปกรณ์หรือระบบปฏิบัติการ ซึ่งจะช่วยให้ฟีเจอร์ AI ของคุณยังคงทำงานได้ในอุปกรณ์ของผู้ใช้ที่หลากหลายที่สุดเท่าที่จะเป็นไปได้
  • ความสามารถด้านต้นทุนและออฟไลน์: โมเดลในอุปกรณ์ช่วยให้มั่นใจได้ว่าฟีเจอร์ AI จะทำงานได้อย่างราบรื่นเมื่อผู้ใช้ออฟไลน์ นอกจากนี้ การส่งต่อ งานประจำไปยังอุปกรณ์ในพื้นที่ยังช่วยลดต้นทุนการอนุมานในระบบคลาวด์ได้อีกด้วย
แผนภาพแสดงเหตุผลของการอนุมานในอุปกรณ์เทียบกับการอนุมานบนระบบคลาวด์
รูปที่ 1: ประโยชน์ของการอนุมานในอุปกรณ์และการอนุมานในระบบคลาวด์ ตามลำดับ

ตัวเลือกในการใช้งาน

คุณสามารถใช้การอนุมานแบบไฮบริดได้โดยใช้วิธีต่อไปนี้

Firebase AI Logic Hybrid API

Firebase AI Logic Hybrid API มีอินเทอร์เฟซแบบรวมเป็นหนึ่งเดียวสำหรับ การแยกการอนุมานระหว่างสภาพแวดล้อมในระบบคลาวด์และในอุปกรณ์

โดยมีพารามิเตอร์ onDeviceConfig ที่ให้การควบคุมอย่างง่ายเพื่อกำหนดโหมดการอนุมานและจัดการการกำหนดเส้นทาง

  • PREFER_ON_DEVICE: พยายามใช้โมเดลในอุปกรณ์ และจะกลับไปใช้โมเดลที่โฮสต์ในระบบคลาวด์โดยอัตโนมัติหากโมเดลในอุปกรณ์ไม่พร้อมใช้งานหรือไม่รองรับคำขอ
  • PREFER_IN_CLOUD: พยายามใช้โมเดลที่โฮสต์บนระบบคลาวด์เมื่ออุปกรณ์ออนไลน์และโมเดลพร้อมใช้งาน โดยจะกลับไปใช้โมเดลในอุปกรณ์ก็ต่อเมื่ออุปกรณ์ออฟไลน์เท่านั้น
  • ONLY_ON_DEVICE: พยายามใช้โมเดลในอุปกรณ์ แต่จะแสดงข้อยกเว้นหากโมเดลไม่พร้อมใช้งานหรือไม่รองรับคำขอ
  • ONLY_IN_CLOUD: พยายามใช้โมเดลที่โฮสต์ในระบบคลาวด์เมื่ออุปกรณ์ออนไลน์และโมเดลพร้อมใช้งาน โดยจะส่งข้อยกเว้นในกรณีอื่นๆ ทั้งหมด
val model = Firebase.ai(backend = GenerativeBackend.googleAI())
    .generativeModel(
        modelName = "gemini-2.5-flash",
        onDeviceConfig = OnDeviceConfig(mode = InferenceMode.PREFER_ON_DEVICE)
    )


val response = model.generateContent("Write a story about a green robot.")
print(response.text)

ดูรายละเอียดการติดตั้งใช้งานได้ในเอกสารประกอบของ Firebase และสำรวจตัวอย่าง AI แบบไฮบริดในแคตตาล็อก AI

การกำหนดเส้นทางที่กำหนดเอง

หากแอปมีข้อกำหนดทางธุรกิจหรือ UX ที่เฉพาะเจาะจง คุณก็สามารถใช้ตรรกะการกำหนดเส้นทางที่กำหนดเองได้เช่นกัน ซึ่งช่วยให้คุณกำหนดเส้นทางการอนุมานแบบไดนามิก โดยอิงตามปัจจัยแบบเรียลไทม์ เช่น

  • เวลาในการตอบสนองของเครือข่าย
  • ประสิทธิภาพของระบบอุปกรณ์ (เช่น ระดับแบตเตอรี่และภาระของโปรเซสเซอร์)
  • ความซับซ้อนของคำค้นหาของผู้ใช้

แอปชั้นนำที่ใช้การกำหนดเส้นทางที่กำหนดเองของตนเองเพื่อมอบประสบการณ์การใช้งาน AI ที่เชื่อถือได้จะใช้แนวทางการอนุมานแบบไฮบริดที่กำหนดเองนี้ ซึ่งรวมถึงแอปต่อไปนี้

  • GBoard: Gboard ใช้การอนุมานแบบไฮบริดที่กำหนดเองเพื่อขับเคลื่อนเครื่องมือการเขียน เช่น พิสูจน์อักษรและเขียนใหม่

  • Kakao Mobility: Kakao Mobility สร้างเครื่องมือการแยกเอนทิตีโดยใช้การอนุมานแบบไฮบริดที่กำหนดเอง สำหรับบริการจัดส่งพัสดุ ซึ่งจะแยกชื่อผู้รับ ที่อยู่ และหมายเลขโทรศัพท์จากข้อความภาษาธรรมชาติโดยอัตโนมัติเพื่อปรับปรุง แบบฟอร์มคำสั่งซื้อ