Tại Google I/O 2024, chúng tôi đã công bố tầm nhìn về một Android được tái thiết kế với AI làm cốt lõi. Tìm hiểu 3 nội dung cập nhật hàng đầu về cách xây dựng bằng AI trên Android dành cho nhà phát triển Android trong video này.
Chọn giải pháp AI tạo sinh phù hợp với bạn
Tài liệu này cung cấp thông tin tổng quan về AI tạo sinh trên Android, bao gồm các mô hình Gemini hiện có và các SDK liên quan.
AI trên thiết bị có hiệu suất cao
Trên các thiết bị Android được hỗ trợ, bạn có thể mang đến trải nghiệm AI tạo sinh phong phú mà không cần kết nối mạng hoặc di chuyển dữ liệu ra khỏi thiết bị. Các mô hình AI tạo sinh trên thiết bị như Gemini Nano là giải pháp tuyệt vời cho các trường hợp sử dụng mà độ trễ thấp, chi phí thấp và biện pháp bảo vệ quyền riêng tư là mối lo ngại chính của bạn.
Trường hợp sử dụng
- Trải nghiệm xem nội dung được AI nâng cao: tóm tắt văn bản, trả lời câu hỏi về tài liệu và trích xuất thực thể.
- Tạo nội dung có sự trợ giúp của AI: hiệu đính, sửa lỗi ngữ pháp, hỗ trợ viết và trả lời thông minh theo ngữ cảnh.
- Phân loại văn bản: phân tích cảm xúc hoặc tâm trạng
- Quyền riêng tư: khai thác các tính năng AI tạo sinh trong khi vẫn giữ dữ liệu trên thiết bị
Giải pháp
Sử dụng SDK AI Edge của Google để tận dụng tính năng suy luận Gemini Nano trên thiết bị. Gemini Nano hiện đã được phát hành công khai để thử nghiệm.
Cung cấp các mô hình tuỳ chỉnh cho các tính năng AI trên thiết bị một cách hiệu quả hơn bằng Play cho AI trên thiết bị. Google Play đơn giản hoá việc khởi chạy, nhắm mục tiêu, tạo phiên bản, tải xuống và cập nhật các mô hình trên thiết bị, giúp bạn cải thiện trải nghiệm người dùng trong khi vẫn tối ưu hoá kích thước ứng dụng. Bạn có thể sử dụng Play cho AI trên thiết bị mà không mất thêm phí. Hãy hoàn tất biểu mẫu nếu bạn quan tâm đến việc sử dụng sớm Play cho AI trên thiết bị.
Đăng ký sử dụng sớm Play cho AI trên thiết bị
AI đa phương thức trên đám mây với các mô hình mạnh nhất của Google
Bạn có thể tạo trải nghiệm AI tạo sinh đa phương thức trong ứng dụng của mình bằng cách tận dụng các mô hình cơ sở chạy suy luận trên đám mây như các mô hình Gemini Pro. Các mô hình này là giải pháp tuyệt vời khi bạn muốn hỗ trợ nhiều thiết bị Android nhất có thể.
Trường hợp sử dụng
- Nội dung mô tả và phụ đề hình ảnh và video: xác định các đối tượng và mô tả các đối tượng đó bằng văn bản
- Suy luận đa phương thức: xử lý nội dung văn bản, hình ảnh và video
- Tạo văn bản: tóm tắt bài viết, trả lời câu hỏi về nội dung văn bản, trích xuất thực thể.
- Định dạng phản hồi: định dạng phản hồi của mô hình thành JSON hoặc Markdown
Giải pháp
Để đưa trải nghiệm AI vào sản xuất, hãy sử dụng Vertex AI in Firebase. SDK Firebase cung cấp quyền truy cập vào các mô hình Gemini, đồng thời cung cấp các tuỳ chọn bảo mật và cấu hình quan trọng cho các ứng dụng phát hành công khai. Ngoài ra, Firebase còn cung cấp các tính năng và dịch vụ hỗ trợ ở cấp độ sản xuất trên nhiều nền tảng di động.
Tìm hiểu thêm về Vertex AI in Firebase
AI cho doanh nghiệp
Vertex AI là nền tảng phát triển AI hợp nhất, do Google quản lý toàn bộ. Các doanh nghiệp có thể sử dụng nền tảng Vertex AI của Google để cung cấp trải nghiệm AI tuỳ chỉnh cho thiết bị Android bằng cách tích hợp phần phụ trợ. Xây dựng, huấn luyện và triển khai các ứng dụng AI trên cơ sở hạ tầng đẳng cấp thế giới, có khả năng mở rộng của Google. Đây là một giải pháp tuyệt vời cho AI ở quy mô doanh nghiệp, với quyền truy cập vào hơn 130 mô hình và công cụ, bao gồm cả AI Studio, Trình tạo tác nhân và các mô hình Gemini.
Trường hợp sử dụng
- Huấn luyện và phân phối mô hình tuỳ chỉnh
- Tạo hình ảnh và video
- Nhân viên hỗ trợ ảo, dịch vụ hỗ trợ khách hàng
- Chuyển lời nói sang văn bản, xử lý ngôn ngữ tự nhiên
Giải pháp
Sử dụng nền tảng Vertex AI của Google để xây dựng các ứng dụng AI tuỳ chỉnh và kết nối ứng dụng Android với lớp dịch vụ.
Tài nguyên khác
- Tổng quan về Vertex AI
- Vertex AI với Gemini 1.5 Pro
- Lộ trình học tập về AI tạo sinh dành cho nhà phát triển
Bộ công cụ AI tạo sinh có trách nhiệm
Các mô hình AI phải tuân thủ các chính sách về an toàn, được đánh giá về tính công bằng và chính xác, đồng thời được thiết kế để đảm bảo tính minh bạch. Bộ công cụ AI tạo sinh có trách nhiệm cung cấp hướng dẫn và trợ giúp để bạn thiết kế, xây dựng, đánh giá và triển khai các mô hình AI mở một cách có trách nhiệm.
Gemini trong Android Studio
Gemini trong Android Studio là một công cụ hỗ trợ lập trình cho việc phát triển Android. Công cụ này được hỗ trợ bởi trí tuệ nhân tạo và có thể hiểu ngôn ngữ tự nhiên. Công cụ này giúp bạn làm việc hiệu quả hơn bằng cách trả lời các truy vấn phát triển Android. Gemini có thể giúp bạn tìm thấy các tài nguyên phù hợp, tìm hiểu các phương pháp hay nhất và tiết kiệm thời gian.
API và SDK của Google dành cho AI tạo sinh trên Android
Bảng sau đây là thông tin tổng quan ngắn gọn về các mô hình được hỗ trợ cho Vertex AI trong Firebase và tên mô hình ổn định mới nhất của các mô hình đó. Bảng này cũng liệt kê các mô hình xem trước và thử nghiệm có sẵn cho các trường hợp sử dụng nguyên mẫu. Để biết thêm thông tin chi tiết về các tính năng của từng mô hình, bao gồm cả giới hạn mã thông báo và tốc độ, hãy xem bài viết Mô hình Gemini.
Mẫu | Đầu vào | Đầu ra | Mô tả |
---|---|---|---|
mô hình Gemini có phiên bản ổn định | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh |
văn bản, mã, JSON (ảnh và âm thanh sắp ra mắt!) |
Cung cấp các tính năng và tốc độ thế hệ mới cho nhiều loại
tác vụ (sẽ sớm tạo ra nhiều phương thức!) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Cung cấp hiệu suất hiệu quả về chi phí và độ trễ thấp; hỗ trợ thông lượng cao |
Gemini 1.5 Progemini-1.5-pro-002
|
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Hỗ trợ các tác vụ suy luận phức tạp đòi hỏi nhiều trí tuệ hơn; ngữ cảnh dài 2 triệu |
Gemini 1.5 Flashgemini-1.5-flash-002
|
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Cung cấp hiệu suất nhanh và linh hoạt trên nhiều tác vụ |
Các mô hình Gemini có chỉ các phiên bản xem trước và thử nghiệm (chỉ nên dùng cho các trường hợp sử dụng tạo nguyên mẫu) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Cung cấp chất lượng mô hình tốt nhất, đặc biệt là đối với mã và kiến thức về thế giới; ngữ cảnh dài 2 triệu |
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
|
văn bản, mã, tệp PDF, hình ảnh | văn bản, mã, JSON | Cung cấp khả năng suy luận mạnh mẽ hơn và đưa quy trình suy nghĩ vào câu trả lời |
Mô hình Imagen 3 (khi sử dụng với Vertex AI in Firebase) | |||
Imagen 3imagen-3.0-generate-002
|
văn bản | hình ảnh | Tạo hình ảnh chân thực, chất lượng cao từ các câu lệnh văn bản bằng ngôn ngữ tự nhiên |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
văn bản | hình ảnh | Tạo hình ảnh để tạo bản mô hình hoặc các trường hợp sử dụng có độ trễ thấp |