现代移动应用非常依赖用户生成的内容来提高用户互动度和留存率。由于设备功能、光照条件和用户体验各不相同,应用会观察到内容质量的自然变化。对于管理来自各种来源的大量照片和视频的应用,有机会提升此类用户生成的内容的基本质量。为了保持最佳质量,我们需要在编辑、上传和下载等操作所需的压缩程度与保留足够细节以实现高保真播放之间取得适当的平衡。
媒体增强 API 概览
Google Play 服务中的媒体增强 API 提供全面的设备端 AI 解决方案来弥合这一差距。它使用设备端图形处理单元 (GPU) 加速功能,为图片和视频提供高质量、低延迟的改进。它通过自动色调映射、模糊修复、降噪和高清重塑等功能来实现这些增强功能。
此 API 通过 Google Play 服务以原生方式交付,可将计算密集型图像和视频恢复任务直接分流到宿主设备的原生 GPU 和神经处理单元 (NPU)。该 API 提供了一个低延迟、可保护隐私的流水线,不会造成 APK 膨胀,并且仅在需要时按需下载模型,以节省设备磁盘空间。
核心功能和使用场景
该框架通过以下三种核心机器学习功能来定位特定的媒体故障点,您可以单独配置这些功能,也可以同时配置:
| 能力 | 算法功能 | 最佳应用使用场景 |
|---|---|---|
| 色调映射 | 一种 SDR 到 SDR 的局部色调映射算法,可增强标准动态范围 (SDR) 图像,以模拟 HDR 般的画质(例如提高局部对比度和提亮阴影),同时保持在可显示的 SDR 范围内。这种实时、节能的算法针对移动设备性能进行了优化。 | 拯救光线不足、阴天拍摄的风景照片或严重逆光的室内人像照片。 |
| 消除模糊 | 通过估计由拍摄对象运动或相机抖动引起的数学模糊内核来重建清晰的边缘。应用空间过滤来平滑色度噪点,并充当去块过滤来缓解锐利边缘附近的压缩伪影。 | 修复抖动或模糊的照片、增强颗粒感较强的弱光照片,以及从压缩的 JPEG 图片和视频流中移除块状伪影。 |
| 高档 | 使用超分辨率生成模型来增加像素数量并重建缺失的高频细节。 | 缩放小缩略图或标清视频文件以进行全屏显示。 |
硬件要求
使用机器学习或深度学习模型在设备上运行推理需要时间,并且性能在很大程度上取决于设备使用的硬件加速器。媒体增强 API 针对配备专用张量核心和高带宽内存的高端设备(例如 Pixel 10 Pro 或 Samsung Galaxy S26 Ultra)进行了优化。
如果设备的硬件未达到最低性能阈值,初始化进程会停止并报告不支持的状态,以防止丢帧或热节流。