Android性能优化-线程监控与线程统一

7,316 阅读9分钟

本文为稀土掘金技术社区首发签约文章,14天内禁止转载,14天后未获授权禁止转载,侵权必究!

背景

在我们日常开发中,多线程管理一直是非常头疼的问题之一,尤其在历史性长,结构复杂的app中,线程数会达到好几百个甚至更多,然而过多的线程不仅仅带来了内存上的消耗同时也降低了cpu调度的效率,过多的cpu调度带来的消耗的坏处甚至超过了多线程带来的好处。

在我们日常开发中,通常会遇到以下几个问题

  • 某个场景会创造过多的线程,最终导致oom
  • 线程池过多问题,比如三方库有一套线程池,自己项目也有一套线程池,随着三方/二方业务接入,导致了不相兼容的线程池数越多,降低了全体线程池数的调度效率,比如多个okhttp的调用
  • 历史原因导致,new Thread横行,又或者是各种线程使用不规范,导致工程混乱
  • 即使是空闲时候,依旧有线程在不断Waiting
  • 各种线程死锁问题

最终种种原因导致,我们的项目在上线过程中,会遇到各种线程不明的情况,对排查问题或者解决问题带来极大的考验。

常规解决方案

对于上述问题的解决,许多团队通过codeview去限制代码准入,比如定制Thread的规范,又或者是定义项目统一的线程池,在项目中去使用。这个方案优点就是可操作性强,便于团队去实施,但是这比较依靠review(或者其他代码扫描插件),对于历史项目来说比较容易出现疏漏,而且后期也依旧需要维护,对于大型团队来说,需要兼顾所有人代码,且三方库无法处理。同时Thread的衍生物也有很多,比如Android中的HandlerThread等等,也是线程。

现在比较流行的方案是通过字节码插桩的方式,统一做线程监控亦或进行线程统一,比如监控处理的matrix,还有优化相关的booster等。线程统一这个依靠项目的情况,会有全统一线程池的情况(所以共用一个线程池),也有统一某单一业务的线程池的情况(比如只收口项目okhttp的线程池)下面我们围绕这两个主题,分别进行探讨

线程监控

当前线程统计

对线程的监控,首先我们要统计当前的信息对不对,可以直接通过

Thread.getAllStackTraces()

获取到当前所有thread的信息与堆栈情况,其返回值是一个map对象,

Map<Thread, StackTraceElement[]>

获取结果例子如下

[Thread[Binder:30506_2,5,main], Thread[FinalizerWatchdogDaemon,5,system], Thread[Binder:30506_3,5,main], Thread[Jit thread pool worker thread 0,5,system], Thread[ReferenceQueueDaemon,5,system], Thread[Profile Saver,5,system], Thread[main,5,main], Thread[Binder:30506_1,5,main], Thread[RenderThread,7,main], Thread[pika_thread,5,main], Thread[vivo.PerfThread,5,main], Thread[Signal Catcher,10,system], Thread[FinalizerDaemon,5,system], Thread[HeapTaskDaemon,5,system]]

我们可以看到key是一个thread对象,如果我们要设计一个自己的apm的话可以通过遍历key拿到一个Thread对象,然后再通过该Thread对象拿到自身的信息即可,比如获取thread的名称

Thread.getAllStackTraces().keys.map {
    it.name
}

线程信息具体化

通过上述,我们可以拿到了当前所有的线程信息,但是很遗憾的是,其中有一些线程信息几乎是“不可用”的,比如我们用new Thread构建出来的线程,如果不给它指定的名字的话,默认就会出现类似这种情,比如Thread-1,这种名称的线程对我们来说几乎是没有任何意义的,我们暂且把它称为“匿名线程”,解决匿名线程的手段有很多,之前在学完ASM Tree api,再也不怕hook了这篇我们可以看到,我们可以用asm对调用thread进行插桩,通过改变指令调用函数,把普通的空参数Thread()方法变成带有name的构造方法Thread(String)进行hook处理,把调用者名称的信息放到前置的ldc指令,从而到达一个转化的效果。

转化前Thread构造函数转化后Thread构造函数
Thread()Thread(String)
Thread(Runnable)Thread(Runnable, String)
Thread(ThreadGroup, Runnable)Thread(ThreadGroup, Runnable, String)
......

asm 代码实例如下

method.instructions.insertBefore(
        node,
        new LdcInsnNode(klass.name)
)
def r = node.desc.lastIndexOf(')')

把构造函数描述变成了带有string name的构造函数描述
def desc =
 "${node.desc.substring(0, r)}Ljava/lang/String;${node.desc.substring(r)}"

println(" * ${node.owner}.${node.name}${node.desc} => ${node.owner}.${node.name}$desc: ${klass.name}.${method.name}${method.desc}")
node.desc = desc

当然,Thread还有很多构造函数,我们就不一一举例子去适配,相关的操作也是类似的,涉及到Executors等其他创建线程的方式,我们也可以通过这种指令替换的方式去进行Thread的命名操作。这里就不再赘述,可以参考booster 的做法,文档可点击

线程统一

线程的统一可以依靠项目统一的线程池,但是这个约束不到第三方,我们可以利用ASM等工具进行线程的统一,线程统一包括全模块统一跟单模块统一(特定模块),由于单模块统一涉及具体业务,比如对okhttpclient的调度线程统一,由于不具备通用性,需要根据模块具体实现去统一,我们这里就不讨论了,单模块统一有个好处就是风险低,只影响单一模块的线程调度。我们讨论一下全模块的统一。

在项目中,我们有各种各样的线程调度api,直接new Thread,Executors,ThreadPoolExecutor等等,它们公共点就是都用到了Thread,最终都是靠着Thread去运行,但是想要把它们统一起来,我们要兼顾更上一层的api,那么适配工作量可是不少!!那么我们有没有一种黑科技,能够简单点就把线程统一到一个特定的线程池,作为收口呢?(注意这里讨论的是把全项目的线程统一,包括三方库),为了找到突破点,我们先看一下最基本的Thread是怎么创建出来的

Thread创建

最常用的Thread创建肯定是最简单的,我们举个例子

var thread = Thread{
    Log.i("hello","this is my thread ${Thread.currentThread().name}")
}

那么这段代码它做了什么呢?我们要从字节码的角度去分析,才能找到突破点

    NEW java/lang/Thread
    DUP
    INVOKEDYNAMIC run()Ljava/lang/Runnable; [
      // handle kind 0x6 : INVOKESTATIC
      java/lang/invoke/LambdaMetafactory.metafactory(Ljava/lang/invoke/MethodHandles$Lookup;Ljava/lang/String;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodHandle;Ljava/lang/invoke/MethodType;)Ljava/lang/invoke/CallSite;
      // arguments:
      ()V, 
      // handle kind 0x6 : INVOKESTATIC
      com/example/spider/MainActivity.onCreate$lambda-0()V, 
      ()V
    ]
    INVOKESPECIAL java/lang/Thread.<init> (Ljava/lang/Runnable;)V
    ASTORE 2

我们来一一说明下调用的指令:

  1. NEW 创建一个java/lang/Thread对象,此时只是引用被创建,所引用的对象还没有创建,并加入操作数栈顶部

image.png 2. DUP 将操作数栈顶部的参数复制一份,并加入操作数栈

image.png

3.INVOKEDYNAMIC lambad用到的函数调用指令,运行时绑定信息,()Ljava/lang/Runnable,由于入参为null,所以不消耗操作数栈的参数,返回值是Runnable,所以会在操作数栈上新加入一个Runnable对象

image.png 4.INVOKESPECIAL 构造函数能调用到的特殊指令,即创建一个对象,(Ljava/lang/Runnable;)V,我们看到入参只有一个Runnable对象,但是实际上调用INVOKESPECIAL的构造函数隐藏了一个条件,就是需要一个被创建对象对应的引用对象,这就是dup存在的原因,因为需要消耗一个Thread引用对象!这点需要注意

image.png 5.ASTORE 2,就是把操作数栈顶部的变量放到了局部变量表index为2的地方,这里为什么是2呢,是由当前运行环境决定的,静态方法中index为0的就是参数1,而普通方法index为0的地方却是this指针,这点是需要注意的,除了index = 0 的地方有这个约定,其他index下标其实就是函数环境的决定的。(这也侧面说明,存在AStore,ALoad这些指令的时候,我们很难去做通用性插桩,因为这里依赖了局部变量表的具体实现)

image.png

看到这里,我们就能够明白了一个Thread创建的字节码是怎么样的了

那么我们想想看,怎么达到我们统一线程池的目的。看到Thread的创建过程我们就知道,Thread会依赖局部变量表(第5条),所以我们如果直接对Thread进行操作的话,是不行的,因为局部变量表的存储index是依靠当前环境的!其实我们统一线程池,想要统一的也不一定是要统一Thread,而是统一Runnable执行的线程环境对吧!突破点就来了,我们对Runnable进行操作,把其原本依赖执行的Thread变成我们自己线程池的Thread是不是就可以了!

目标明确了,但是我们也需要为此做一些特定的处理,因为这种自定义指令集的处理,用其他ASM工具也是无法生成的,所以我们才具体解释相关的指令集。最终这边的方案就是,进行Thread调用替换,即把new Thread这个指令,替换为我们自己的MyThread的指令进行定制化处理。步骤如下

  1. 替换原本的INVOKESPECIAL指令调用为我们自己的MyThread调用,这里给出MyThread实现
class MyThread(private val runnable: Runnable) : Thread(runnable) {

   // 调用到自己的start
   override fun start() {
       Log.i("hello", "MyThread")
       
       // runnable 在定义的统一线程池执行
       ThreadHelper.runInCustomPool(runnable)
   }

}

image.png

  1. 原本指令返回的是Thread,由于我们替换为了MyThread,那么原本跟Thread强绑定的NEW指令,DUP指令就也需要变更跟MyThread类型相关的指令,我们这里就不采用替换,采取新加的方式(替换也可以,这里选择方便处理,因为操作数只对栈顶元素生效)

image.png

3.到了这一步,还不行,因为我们原本要返回的是Thread对象,现在变成了MyThread对象,所以我们需要一个转化指令CHECKCAST

image.png

我们给出具体的ASM代码

class MyThreadHookUtils {
    static THREAD = "java/lang/Thread"

    static void transform(ClassNode klass) {
        // 我们自定义的MyThread类不需要参加转化
        if (klass.name.equals("com/example/spider/MyThread")) {
            return
        }
        klass.methods?.forEach { methodNode ->
            methodNode.instructions.each {
                if (it.opcode == Opcodes.INVOKESPECIAL) {
                    transformInvokeSpecial((MethodInsnNode) it, klass, methodNode)
                }
            }
            
        }


    }


    private static void transformInvokeSpecial(MethodInsnNode node, ClassNode klass, MethodNode method) {
        // 如果不是构造函数,就直接退出 
        if (node.owner != THREAD) {
            return
        }
        println("transformInvokeSpecial")
        transformThreadInvokeSpecial(node, klass, method)

    }

    private static void transformThreadInvokeSpecial(
            MethodInsnNode node,
            ClassNode klass,
            MethodNode method
    ) {
        println("init  ===>  " + node.desc + " " + node.owner)

        if (node.desc.equals("(Ljava/lang/Runnable;)V")) {

            int index = method.instructions.indexOf(node)
            def dyc = method.instructions[index - 1]
            InsnList insertNodes1 = new InsnList()
            TypeInsnNode newInsnNode = new TypeInsnNode(Opcodes.NEW, "com/example/spider/MyThread")
            InsnNode dupNode = new InsnNode(Opcodes.DUP)
            insertNodes1.add(newInsnNode)
            insertNodes1.add(dupNode)
            method.instructions.insertBefore(dyc, insertNodes1)

            MethodInsnNode methodHookNode = new MethodInsnNode(Opcodes.INVOKESPECIAL,
                    "com/example/spider/MyThread",
                    "<init>",
                    "(Ljava/lang/Runnable;)V",
                    false)

            TypeInsnNode typeInsnNode = new TypeInsnNode(Opcodes.CHECKCAST, "java/lang/Thread")
            InsnList insertNodes = new InsnList()
            insertNodes.add(methodHookNode)
            insertNodes.add(typeInsnNode)
            method.instructions.insertBefore(node, insertNodes)
            method.instructions.remove(node)

            println("hook  ===>  " + node.name + " " + node.owner + " " + method.instructions.indexOf(node))
        }
        
    }
}

这个时候,任何Thread的start方法或者其他方法,都会调用到我们自定义的MyThread类的方法里面,在这里做线程池统一的处理,就非常方便了,因为我们有Runnable对象!同时所以方法我们都可以随意去玩了!

注意

注意的是,这种全局Thread插桩是有风险的,在实际项目中,我们会通过白名单的方式,选择性的去统一部分Thread,因为全局统一容易导致不可预期的问题。同时还有一个非常注意的点,我们可以看到上面关于指令的代码全部是基于index的去定位各种指令集的,NEW -> DUP ->INVOKEDYNAMIC ->INVOKESPECIAL 然而在真实项目中,这个指令集顺序不一定可靠,因为可能会被插入其他指令或者无关指令,所以我们还有一步就是指令顺序的校验,必须是满足NEW -> DUP ->INVOKEDYNAMIC ->INVOKESPECIAL这几个顺序的函数指令集才进行插桩,这部分内容比较简单,就不列举了,比较INSN指令的OpCode即可,校验规则按照项目实际需要。

总结

看到这里,我们对Thread应该有了足够的了解,同时本篇也介绍了ASM相关黑科技操作在Thread类的使用!同时也是android 性能优化系列的第一篇,在未来我会继续输出更多的文章,感谢大家观看!

image.png