Android Native Crash 处理全流程：从崩溃到日志的通俗解析一、什么是 Native Crash？底层代

Native Crash 是发生在 C/C++ 代码中的崩溃，比如野指针访问、内存越界等，相当于应用的 "底层生产线故障"。

与 Java Crash 的区别：
- Java Crash 是 "管理层决策失误"（如空指针），系统会直接抛出异常；
- Native Crash 是 "生产线机械故障"（如访问已释放的内存），由 Linux 内核通过信号（如 SIGSEGV）通知系统。

当 Native 代码出错时，Linux 内核会向进程发送致命信号（如 SIGSEGV 表示非法内存访问），触发以下流程：

信号捕获与初步处理
- 进程启动时，linker会注册信号处理器debuggerd_signal_handler，类似为生产线安装 "故障报警器"。
- 当收到信号（如 SIGSEGV），处理器会：
  - 记录简要日志（类似工厂初步事故记录）；
  - 通过 socket 向debuggerd守护进程发送崩溃通知（"报告工厂事故！"）。
debuggerd 介入：专业的 "事故调查员"
- debuggerd是系统常驻的调试进程，专门处理 Native 崩溃，类似 "工厂安全监察部门"。
- 收到 socket 通知后，debuggerd通过ptrace附着到崩溃进程（类似派调查员到现场），获取：
  - 寄存器状态（CPU 当时的工作状态）；
  - 内存映射（所有加载的 so 库位置）；
  - 函数调用栈（生产线哪个环节出错）。

创建 tombstone 文件
- 在/data/tombstones/目录生成崩溃日志，记录关键信息：
  - 进程 ID、信号类型（如 SIGSEGV）；
  - 崩溃时的函数调用栈（如libnative-lib.so!Java_com_example_NativeClass_crash）；
  - 内存状态（出错的内存地址、寄存器值）。
与系统服务通信
- 通过 socket 连接system_server中的NativeCrashListener（类似通知工厂管理层），发送崩溃数据：
  - 进程 PID、信号类型；
  - 详细的崩溃堆栈信息。

监听与接收数据
- NativeCrashListener是system_server中的监听线程，在/data/system/ndebugsocket创建服务端，等待debuggerd连接（类似管理层开设 "事故报告热线"）。
生成 Crash 报告并处理
- 收到数据后，创建NativeCrashReporter线程，将 Native Crash 转换为 Java 层可处理的CrashInfo对象：
  - 异常类名为 "Native crash"，消息为信号描述（如 "Segmentation fault"）；
  - 调用AMS.handleApplicationCrashInner，进入与 Java Crash 相同的处理流程：
    - 记录日志到 DropBox；
    - 弹出崩溃对话框；
    - 终止进程并尝试重启（若策略允许）。

组件	比喻角色	核心作用
信号（如 SIGSEGV）	生产线故障警报	通知系统 "底层出问题了"
debuggerd	事故调查员	收集崩溃现场数据（寄存器、堆栈），生成详细报告
tombstone 文件	事故调查报告	存储崩溃时的关键信息，供开发者分析
NativeCrashListener	管理层热线接线员	接收调查报告，通知上层处理
AMS.handleApplicationCrashInner	工厂应急处理小组	执行崩溃后的清理、通知用户、尝试重启流程

定位崩溃位置
- 在 tombstone 文件中查找backtrace部分，如：
  
  plaintext
```
#00 pc 0x0000000000012345  /data/app/lib/libnative-lib.so (Java_com_example_NativeClass_crash+124)
```
  表示libnative-lib.so的Java_com_example_NativeClass_crash方法第 124 行出错。
分析常见问题
- SIGSEGV：非法内存访问（野指针、越界访问）；
- SIGABRT：程序主动调用abort()终止；
- SIGBUS：硬件相关错误（如未对齐的内存访问）。
预防措施
- 使用AddressSanitizer（ASan）检测内存问题；
- 避免在 JNI 中使用裸指针，改用智能指针（如 C++11 的shared_ptr）；
- 对关键 Native 函数添加异常捕获（通过try-catch配合__try/__except）。

崩溃触发：Native 代码错误 → 内核发送信号 → 进程捕获信号并通知 debuggerd。
数据收集：debuggerd 通过 ptrace 附着进程 → 生成 tombstone 文件 → 发送数据到 system_server。
上层处理：NativeCrashListener 接收数据 → 转换为 Java Crash 信息 → AMS 执行常规崩溃流程（日志记录、进程终止、重启）。

理解这个流程后，开发者可通过分析 tombstone 文件快速定位 Native 层问题，同时利用系统提供的调试工具（如 Android Studio 的 Native Debug）提升排查效率。