Unity 游戏的常见 ANR 问题

Unity 发生 ANR 问题的原因有很多。最常见的 ANR 问题是由 Android 和 Unity 组件滥用及其通信不畅导致的。

WebView

WebView 是一个用于显示网页的 Android 类。第三方 SDK(例如广告)使用 WebViewUnityPlayerActivity 之外的 activity 中显示动态 Web 内容。当第三方 SDK 滥用 WebView 时,就会出现 ANR 问题。

堆栈轨迹

堆栈轨迹是您了解 ANR 原因的首要资源。

/data/app/~~p-0ksfCD6bF6Sdq6kpVePg==/com.google.android.webview-5YQZOqKbbqp-uoLY6WYnTw==/base.apk!libmonochrome.so
  at J.N.Mhc_M_H$ (Native method)
  at org.chromium.components.viz.service.frame_sinks.ExternalBeginFrameSourceAndroid.doFrame (chromium-TrichromeWebViewGoogle.aab-stable-579013831:60)
  at android.view.Choreographer$CallbackRecord.run (Choreographer.java:1054)
  at android.view.Choreographer.doCallbacks (Choreographer.java:878)
  at android.view.Choreographer.doFrame (Choreographer.java:807)
  at android.view.Choreographer$FrameDisplayEventReceiver.run (Choreographer.java:1041)
  at android.os.Handler.handleCallback (Handler.java:938)
  at android.os.Handler.dispatchMessage (Handler.java:99)
  at android.os.Looper.loop (Looper.java:223)
  at android.app.ActivityThread.main (ActivityThread.java:7721)
  at java.lang.reflect.Method.invoke (Native method)
  at com.android.internal.os.RuntimeInit$MethodAndArgsCaller.run (RuntimeInit.java:592)
  at com.android.internal.os.ZygoteInit.main (ZygoteInit.java:952)

图 1.futex 等待导致的 ANR 堆栈轨迹。

原因

到目前为止,此问题的根本原因尚不清楚。一些潜在原因可能包括:

  • 广告实施不当。
  • WebView 的过时版本,因为用户可能已选择不自动更新应用。
  • 系统资源(CPU、GPU 等)使用率高,可能需要进行大量分析。
  • 着色器编译崩溃,这可能表明内容具有不兼容的着色器,或者用户安装了旧版 WebView

解决方案

  • 为了缩小导致 WebView 阻塞主线程的内容类型,请在每次加载、显示或关闭网页时向游戏添加日志。
    • 您可以使用 BacktraceCrashlytics 报告服务。
    • 然后,在分析数据并找到问题后,尝试停用违规的广告提供商。
    • 添加内存日志,以确保问题与内存无关。
  • 提醒用户从 Google Play 更新 WebView。从 Android 5.0(API 级别 21)及更高版本开始,WebView 已移至 APK。因此,它可以与 Android 平台分开更新。如需查看设备上使用的 WebView 版本,请依次前往设置 > 应用 > Android System WebView,然后查看页面底部的版本。
显示 WebView 版本的“应用信息”界面。
图 1:检查 WebView 版本。

Unity 暂停

UnityPlayerActivity 收到 onPause() 调用时,会启动以下操作链:

  1. UnityPlayerActivity 通知 Unity 运行时引擎相应 activity 已暂停。
  2. Unity 会调用实现 OnApplicationPause 事件的每个 MonoBehaviour
  3. Unity 会停止其组件和模块,例如声音播放、渲染、游戏循环和动画。
  4. 为确保 Unity Android Player (UAP) 和引擎同步,UAP 会等待 4 秒,直到引擎停止。
  5. 如果该操作花费的时间超过 5 秒,系统会触发 ANR。

堆栈轨迹

"main" tid=1 Timed Waiting
jdk.internal.misc.Unsafe.park (Native method)
java.util.concurrent.locks.LockSupport.parkNanos (LockSupport.java:234)
java.util.concurrent.locks.AbstractQueuedSynchronizer.doAcquireSharedNanos (AbstractQueuedSynchronizer.java:1079)
java.util.concurrent.locks.AbstractQueuedSynchronizer.tryAcquireSharedNanos (AbstractQueuedSynchronizer.java:1369)
java.util.concurrent.Semaphore.tryAcquire (Semaphore.java:415)
com.unity3d.player.UnityPlayer.pauseUnity (UnityPlayer.java:833)
com.unity3d.player.UnityPlayer.pause (UnityPlayer.java:796)
com.unity3d.player.UnityPlayerActivity.onPause (UnityPlayerActivity.java:117)
android.app.Activity.performPause (Activity.java:8517)
android.app.Instrumentation.callActivityOnPause (Instrumentation.java:1618)
android.app.ActivityThread.performPauseActivityIfNeeded (ActivityThread.java:5061)
android.app.ActivityThread.performPauseActivity (ActivityThread.java:5022)
android.app.ActivityThread.handlePauseActivity (ActivityThread.java:4974)
android.app.servertransaction.PauseActivityItem.execute (PauseActivityItem.java:48)
android.app.servertransaction.ActivityTransactionItem.execute (ActivityTransactionItem.java:45)
android.app.servertransaction.TransactionExecutor.executeLifecycleState (TransactionExecutor.java:179)
android.app.servertransaction.TransactionExecutor.execute (TransactionExecutor.java:97)
android.app.ActivityThread$H.handleMessage (ActivityThread.java:2303)
android.os.Handler.dispatchMessage (Handler.java:106)
android.os.Looper.loopOnce (Looper.java:201)
android.os.Looper.loop (Looper.java:288)
android.app.ActivityThread.main (ActivityThread.java:7884)
java.lang.reflect.Method.invoke (Native method)
com.android.internal.os.RuntimeInit$MethodAndArgsCaller.run (RuntimeInit.java:548)
com.android.internal.os.ZygoteInit.main (ZygoteInit.java:936)

图 3. 由从未释放的信号量导致的 ANR。

解决方案

确保您的 C# 游戏代码在暂停或恢复事件期间不会花费太长时间来完成执行。

  • 分析游戏,并检查 OnApplicationPause 是否为开销较大的操作。您可以使用 Stopwatch
  • 避免执行 I/O 操作或同步网络请求。
  • 使用 Task 将操作移至另一个 Thread。Unity 2023.1 支持使用 C# asyncawait 关键字的简化异步编程模型

UnitySendMessage 已被屏蔽

Java Unity 插件和 SDK 使用 JNI 将数据发送到 C# 游戏层。不过,由于互斥锁等原生同步例程,此通信可能会阻塞主线程,进而因锁争用而导致 ANR。

堆栈轨迹

图 4 中的 ANR 是由 Java 插件调用的 C# 代码中的长时间运行的操作导致的。Unity 引擎使用非优先级继承互斥锁来确保正确执行。

libc.so NonPI::MutexLockWithTimeout(pthread_mutex_internal_t*, bool, timespec const*) + 604
com.unity3d.player.UnityPlayer.nativeUnitySendMessage (Native method)
com.unity3d.player.UnityPlayer.UnitySendMessage (UnityPlayer.java:665)

图 4.ANR 是由锁争用导致的。

原因

问题在于,当应用恢复时,系统会调度多条消息。消息会排队,因为当游戏在后台运行时无法发送消息。当应用恢复时,所有消息都会同时分派。

在暂停期间,您通常会将游戏信息存储在服务器上;例如,记录玩家在游戏中的位置,以便玩家在游戏恢复时返回到同一位置。

此工作负载与其他创建自有工作负载的第三方代码相结合,可能会使设备资源(尤其是主线程)过载。主线程运行应用的用户界面,通常是 ANR 的主要发生位置。因此,主线程上任何新增的工作负载都会增加发生 ANR 的可能性。

解决方案

在应用暂停期间,请确保所有代码操作都是必需的,或者尝试将用户状态保存在本地设备内存中。当然,您还可以查看是否可以在暂停期之外完成这些操作。

几种方法

  • 将处理 消息的 C# 操作移至主线程以外的线程。
    • 如果您的代码不依赖于 Unity 的主线程上下文,请使用 Task 进行通信,而不是使用消息。
  • 当游戏暂停时,请勿从插件发送多条消息。
    • 游戏在后台运行时,引擎无法发送消息。
    • 仅当不会影响游戏功能时,才将最后的数据状态发送到游戏。

安装引荐来源网址

Play Install Referrer 是用户每次点击广告时发送给 Play 商店的唯一字符串。这是 Android 专用的广告跟踪标识符。安装完成后,应用会将安装引荐来源网址发送给归因合作伙伴,后者会将来源与安装进行匹配(归因转化)。

堆栈轨迹

图 5 显示了使用 Facebook SDK 检索安装归因的游戏的 ANR 堆栈轨迹。

图 5. 包含 Binder 调用的 Android Vitals 报告。

原因

ANR 是由 binder 调用速度缓慢导致的。不过,如果不访问 SDK 源代码,就无法确定根本原因。

解决方案

解决此类问题需要与 SDK 开发者沟通,或者在网上搜索可能的解决方案,查看较新版本的 SDK 是否能为其他人解决 ANR 问题,甚至尝试小规模发布策略。

Google 提供了一个 SDK 索引页面,其中整合了 Google Play 应用的使用情况数据和通过代码检测收集到的信息,以便提供属性信息和信号,帮助您决定在应用中采用、保留还是移除某个 SDK。

其他资源

如需详细了解 ANR,请参阅以下资源: