面试系列—— App 稳定性问题分析总结

240 阅读3分钟

稳定性问题 集中在 应用Crash 和 ANR ,分别作为简要记录。

ANR问题

概念

ANR(Application Not responding),是指应用程序未响应,Android系统对于一些事件需要在一定的时间范围内完成,如果超过预定时间能未能得到有效响应或者响应时间过长,都会造成ANR。一般地,这时往往会弹出一个提示框,告知用户当前xxx未响应,用户可选择继续等待或者Force Close

ANR场景

  • Service Timeout:比如前台服务在20s内未执行完成;(前台会弹框)
  • BroadcastQueue Timeout:比如前台广播在10s内未执行完成(前台会弹框)
  • InputDispatching Timeout: 输入事件分发超时5s,包括按键和触摸事件。(前台会弹框)
  • ContentProvider Timeout:内容提供者,在publish过超时10s;(不会弹框)

弹框场景: 应用处于前台,或者打开 开发者选项中"展示后台ANR" 弹框选项。

ANR发生原因

  1. 当前消息长耗时
  2. 历史消息长耗时
  3. 历史多消息长耗时
  4. 系统负载导致大量消息长耗时

ANR日志解读

ANR采集原理

ANR监控

Android 版本 <21 采用 FileOberser 机制 监听 /data/anr 目录 Android 版本 >=21 采用 系统信号机制 注册信号处理器 监听 信号为 SIGQUIT

ANR分析和治理

ANR治理

  1. 死锁 ——导致主线程卡住无法继续运行,优化锁逻辑
  2. 系统资源不足 -- 较难处理,可以适当在低端机做业务逻辑降级
  3. 主线程函数执行耗时等-- 优化执行逻辑等 例如开启新线程等

Crash 问题

Crash概念

未处理的异常或信号导致的意外退出,会使 Android 应用崩溃。使用 Java 编写的应用会在抛出未处理的异常(由 Throwable 类表示)时崩溃。使用原生代码语言编写的应用,会在执行过程中遇到未处理的信号(如 SIGSEGV)时崩溃。 当应用崩溃时,Android 会终止应用的进程并显示一个对话框,告知用户应用已停止。

Crash 场景

虚拟机Java Crash 未处理的异常 Native Crash 未处理的信号

Crash 监控

虚拟机Crash

Java层的崩溃可以直接交给JVM的崩溃捕获机制去处理。 Thread.setDefaultUncaughtExceptionHandler(this); 系统默认处理 是 输出堆栈信息 然后弹出崩溃框;

Native Crash

输出错误信号,弹出崩溃弹框; 利用 信号捕获机制 捕获这八类信号 SIGABRT SIGBUS SIGFPE SIGILL SIGSEGV SIGTRAP SIGSYS SIGSTKFLT

Crash 治理

  1. 业务代码问题 优化代码逻辑 ,合理添加异常捕获逻辑等
  2. 系统问题 尝试在特殊系统或版本上做特殊逻辑处理,例如增加hook逻辑等
  3. 异常防护 如果启动崩溃 执行安全逻辑,例如清除缓存等;

捕获堆栈 的方法

参见gityuan 的总结 gityuan.com/2017/07/09/…