Generative AI ใน Android

ในงาน Google I/O 2024 เราได้เปิดตัววิสัยทัศน์ของ Android เวอร์ชันใหม่ที่ใช้ AI เป็นหัวใจ ดูการอัปเดต 3 อันดับแรกสำหรับการสร้างด้วย AI บน Android สําหรับนักพัฒนาแอป Android ได้ในวิดีโอนี้

เลือกโซลูชัน Generative AI ที่เหมาะกับคุณ

เอกสารนี้ให้ภาพรวมของ Generative AI ใน Android รวมถึงโมเดล Gemini ที่มีและ SDK ที่เกี่ยวข้อง

AI ในอุปกรณ์ที่มีประสิทธิภาพสูง

ไอคอน Gemini

ในอุปกรณ์ Android ที่รองรับ คุณจะมอบประสบการณ์การใช้งาน Generative AI ที่สมบูรณ์แบบได้โดยไม่ต้องเชื่อมต่อเครือข่ายหรือย้ายข้อมูลออกจากอุปกรณ์ โมเดล Generative AI ในอุปกรณ์ เช่น Gemini Nano เป็นโซลูชันที่ยอดเยี่ยมสำหรับกรณีการใช้งานที่ความล่าช้าต่ำ ต้นทุนต่ำ และการคุ้มครองความเป็นส่วนตัวเป็นข้อกังวลหลัก

กรณีการใช้งาน

  • การบริโภคเนื้อหาที่ปรับปรุงโดย AI: การสรุปข้อความ การตอบคำถามในเอกสาร และการดึงข้อมูลเอนทิตี
  • การสร้างเนื้อหาด้วยความช่วยเหลือจาก AI: การพิสูจน์อักษร การแก้ไขไวยากรณ์ ความช่วยเหลือด้านการเขียน และช่วยตอบตามบริบท
  • การจัดประเภทข้อความ: การวิเคราะห์ความรู้สึกหรืออารมณ์
  • ความเป็นส่วนตัว: ปลดล็อกฟีเจอร์ Generative AI ขณะเก็บข้อมูลไว้ในอุปกรณ์

โซลูชัน

ใช้ Google AI Edge SDK เพื่อใช้ประโยชน์จากการอนุมานของ Gemini Nano ในอุปกรณ์ Gemini Nano พร้อมให้ทดลองใช้แบบสาธารณะแล้ว

ดูข้อมูลเพิ่มเติมเกี่ยวกับ Gemini Nano

แสดงโมเดลที่กําหนดเองสําหรับฟีเจอร์ AI ในอุปกรณ์ได้อย่างมีประสิทธิภาพมากขึ้นด้วย Play สําหรับ AI ในอุปกรณ์ Google Play ลดความซับซ้อนในการเปิดตัว การกำหนดเป้าหมาย การกำหนดเวอร์ชัน การดาวน์โหลด และการอัปเดตโมเดลในอุปกรณ์ ซึ่งจะช่วยให้คุณปรับปรุงประสบการณ์ของผู้ใช้ได้ในขณะที่ยังคงเพิ่มประสิทธิภาพขนาดของแอป Play สำหรับ AI ในอุปกรณ์พร้อมให้ใช้งานโดยไม่มีค่าใช้จ่ายเพิ่มเติม กรอกแบบฟอร์มนี้หากคุณสนใจทดลองใช้ Play สำหรับ AI ในอุปกรณ์ก่อนเปิดตัว

ลงชื่อสมัครใช้ Play สำหรับ AI ในอุปกรณ์เพื่อรับสิทธิ์ทดลองใช้ก่อนเปิดตัว

AI แบบหลายรูปแบบในระบบคลาวด์ที่มีโมเดลที่เก่งที่สุดของ Google

คุณสามารถสร้างประสบการณ์การใช้งาน Generative AI แบบหลายรูปแบบในแอปได้ด้วยการใช้ประโยชน์จากโมเดลพื้นฐานที่ทำงานแบบอนุมานในระบบคลาวด์ เช่น โมเดล Gemini Pro รุ่นเหล่านี้เป็นโซลูชันที่ยอดเยี่ยมเมื่อคุณต้องการรองรับอุปกรณ์ Android หลากหลายรุ่นมากที่สุด

กรณีการใช้งาน

  • คำอธิบายและคำบรรยายแทนเสียงของรูปภาพและวิดีโอ: การระบุวัตถุและอธิบายเป็นข้อความ
  • การอนุมานแบบมัลติโมด: ประมวลผลเนื้อหาข้อความ รูปภาพ และวิดีโอ
  • การสร้างข้อความ: สรุปบทความ ตอบคําถามเกี่ยวกับเนื้อหาที่เป็นข้อความ ดึงข้อมูลเอนทิตี
  • การจัดรูปแบบการตอบกลับ: จัดรูปแบบการตอบกลับของโมเดลเป็น JSON หรือ Markdown

โซลูชัน

หากต้องการนําประสบการณ์ AI ไปใช้ในเวอร์ชันที่ใช้งานจริง ให้ใช้ Vertex AI ใน Firebase Firebase SDK ให้สิทธิ์เข้าถึงโมเดล Gemini รวมถึงมีตัวเลือกการรักษาความปลอดภัยและการกําหนดค่าที่สําคัญสําหรับแอปเวอร์ชันที่ใช้งานจริง นอกจากนี้ Firebase ยังมีการสนับสนุนและฟีเจอร์ระดับเวอร์ชันที่ใช้งานจริงในแพลตฟอร์มอุปกรณ์เคลื่อนที่ต่างๆ

ดูข้อมูลเพิ่มเติมเกี่ยวกับ Vertex AI ใน Firebase

AI สำหรับองค์กร

ไอคอน Vertex AI

Vertex AI เป็นแพลตฟอร์มการพัฒนา AI แบบรวมศูนย์ที่มีการจัดการโดยสมบูรณ์ของ Google องค์กรสามารถใช้แพลตฟอร์ม Vertex AI ของ Google เพื่อมอบประสบการณ์ AI ที่ปรับแต่งเองให้กับอุปกรณ์ Android โดยใช้การผสานรวมแบ็กเอนด์ สร้าง ฝึก และทำให้แอปพลิเคชัน AI ใช้งานได้บนโครงสร้างพื้นฐานระดับโลกที่ปรับขนาดได้ของ Google เครื่องมือนี้เป็นโซลูชันที่ยอดเยี่ยมสำหรับ AI ระดับองค์กร โดยมีสิทธิ์เข้าถึงโมเดลและเครื่องมือกว่า 130 รายการ ซึ่งรวมถึง AI Studio, Agent Builder และโมเดล Gemini

กรณีการใช้งาน

  • การฝึกโมเดลและการนำส่งแบบกำหนดเอง
  • การสร้างรูปภาพและวิดีโอ
  • ตัวแทนเสมือน ฝ่ายสนับสนุนลูกค้า
  • การแปลงคำพูดเป็นข้อความ การประมวลผลภาษาธรรมชาติ

โซลูชัน

ใช้แพลตฟอร์ม Vertex AI ของ Google เพื่อสร้างแอปพลิเคชัน AI ที่กําหนดเองและเชื่อมต่อแอป Android กับเลเยอร์บริการ

ดูข้อมูลเพิ่มเติมเกี่ยวกับ Vertex AI

แหล่งข้อมูลเพิ่มเติม

เครื่องมือ Generative AI อย่างมีความรับผิดชอบ

โมเดล AI ควรสอดคล้องกับนโยบายด้านความปลอดภัย ได้รับการประเมินความยุติธรรมและความถูกต้อง และออกแบบมาให้โปร่งใส ชุดเครื่องมือ Generative AI ที่มีความรับผิดชอบให้ความช่วยเหลือและคำแนะนำในการช่วยคุณออกแบบ สร้าง ประเมิน และใช้งานโมเดล AI แบบเปิดอย่างมีความรับผิดชอบ

Gemini ใน Android Studio

Gemini ใน Android Studio เป็นผู้ช่วยในการเขียนโค้ดสำหรับการพัฒนาแอป Android ซึ่งทำงานด้วยระบบปัญญาประดิษฐ์ (AI) และเข้าใจภาษาธรรมชาติ ซึ่งจะช่วยให้คุณทำงานได้อย่างมีประสิทธิภาพมากขึ้นด้วยการตอบคำถามเกี่ยวกับการพัฒนา Android Gemini ช่วยคุณค้นหาแหล่งข้อมูลที่เกี่ยวข้อง เรียนรู้แนวทางปฏิบัติแนะนำ และประหยัดเวลาได้

Google API และ SDK สำหรับ Generative AI ใน Android

ตารางต่อไปนี้เป็นภาพรวมคร่าวๆ ของโมเดลที่รองรับสําหรับ Vertex AI ใน Firebase และชื่อโมเดลเวอร์ชันล่าสุดที่เสถียร ตารางนี้ยังแสดงตัวอย่างและโมเดลเวอร์ชันทดลองที่ใช้สำหรับการสร้างต้นแบบกรณีการใช้งานได้ด้วย ดูรายละเอียดเพิ่มเติมเกี่ยวกับความสามารถของโมเดลแต่ละแบบ รวมถึงขีดจํากัดโทเค็นและอัตราได้ที่โมเดล Gemini

รุ่น อินพุต เอาต์พุต คำอธิบาย
Gemini รุ่นที่มีเวอร์ชันเสถียร
Gemini 2.0 Flash
gemini-2.0-flash-001
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง ข้อความ โค้ด JSON
(รูปภาพและเสียงจะพร้อมใช้งานเร็วๆ นี้)
มอบฟีเจอร์และความเร็วรุ่นถัดไปสำหรับงานหลากหลายประเภท
(การสร้างแบบหลายสื่อจะพร้อมใช้งานเร็วๆ นี้)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง ข้อความ โค้ด JSON ให้ประสิทธิภาพที่คุ้มค่าและเวลาในการตอบสนองต่ำ รองรับปริมาณข้อมูลที่ส่งผ่านสูง
Gemini 1.5 Pro
gemini-1.5-pro-002
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง ข้อความ โค้ด JSON รองรับงานที่ต้องใช้การคิดที่ซับซ้อนซึ่งต้องใช้ความฉลาดมากขึ้น บริบทยาว 2 ล้านคำ
Gemini 1.5 Flash
gemini-1.5-flash-002
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง ข้อความ โค้ด JSON มีประสิทธิภาพที่รวดเร็วและหลากหลายสำหรับงานต่างๆ
Gemini โมเดลที่มีเวอร์ชันตัวอย่างและเวอร์ชันทดลองเท่านั้น (แนะนำสำหรับกรณีการใช้งานการสร้างต้นแบบเท่านั้น)
Gemini 2.0 Pro
gemini-2.0-pro-exp-02-05
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง ข้อความ โค้ด JSON มีคุณภาพโมเดลที่แข็งแกร่งที่สุด โดยเฉพาะสำหรับโค้ดและความรู้ทั่วไป บริบทยาว 2 ล้านคำ
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
ข้อความ โค้ด PDF รูปภาพ ข้อความ โค้ด JSON มีความสามารถในการให้เหตุผลที่ดีขึ้นและแสดงกระบวนการคิดในคำตอบ
Imagen 3 โมเดล (เมื่อใช้กับ Vertex AI in Firebase)
Imagen 3
imagen-3.0-generate-002
ข้อความ รูปภาพ สร้างรูปภาพที่สมจริงและมีคุณภาพสูงจากพรอมต์ข้อความที่เป็นภาษาธรรมชาติ
Imagen 3 Fast
imagen-3.0-fast-generate-001
ข้อความ รูปภาพ สร้างรูปภาพสําหรับการสร้างต้นแบบหรือกรณีการใช้งานที่มีเวลาในการตอบสนองต่ำ