JVM之Java线程启动流程

1,894 阅读5分钟
原文链接: zhuanlan.zhihu.com

欢迎关注我的专栏:半栈工程师

周末抽了点时间,研究了下HotSpot是如何创建Java线程的,顺便总结一下。文中引用的源码里删除很多细节,只保留了主要过程,感兴趣的同学可以自己去深入研究。能力有限,错误地方恳请指正。

一:Java线程介绍

做Java开发或者Android的同学,肯定对Java线程很熟悉。之前在阅读一些JVM相关的书时,了解到Java线程其实是映射到操作系统的内核线程上的,所以Java线程基本上也就是操作系统在进行管理。在Linux中,线程和进程用的是同一个结构体进行描述的,只不过进程拥有自己独立的地址空间,而同一个进程的线程之间是共享资源的。

二:Java线程入口分析

想要启动一个Java线程,主要有两种方法,第一种可以实现一个继承自Thread的子类,重写run();第二种可以实现一个Runnable,交给Thread执行。这两种方法都很简便,我们可以根据自己的业务需求选择,但是无论选择哪种方法,都需要调用Thread.start(),才能真正的启动一个异步线程进行工作,笔者刚上大学接触Java时,曾经天真的以为调用Thread.run()就行了,其实直接调用run(),JVM并不会去创建一个线程,run()只会工作在原有线程,和调用普通对象的方法没有任何区别。

上面提到了要想启动线程,必须要调用Thread.start(),那么这个方法便是我们研究的入口了。

   public synchronized void start() {
        
        if (threadStatus != 0)
            throw new IllegalThreadStateException();
        group.add(this);

        boolean started = false;
        try {
            start0();
            started = true;
        } finally {
            try {
                if (!started) {
                    group.threadStartFailed(this);
                }
            } catch (Throwable ignore) {
                /* do nothing. If start0 threw a Throwable then
                  it will be passed up the call stack */
            }
        }
    }

    private native void start0();

通过上面的代码可以得知,start()方法中做了一些线程状态判断等工作,但是真正启动Java线程的地方是调用了start0(),start0()是一个Native方法。start0()是何处实现的呢?我们先来看看Thread.c 中的一段定义:

static JNINativeMethod methods[] = {
    {"start0",           "()V",        (void *)&JVM_StartThread},
    {"stop0",            "(" OBJ ")V", (void *)&JVM_StopThread},
    {"isAlive",          "()Z",        (void *)&JVM_IsThreadAlive},
    {"suspend0",         "()V",        (void *)&JVM_SuspendThread},
    {"resume0",          "()V",        (void *)&JVM_ResumeThread},
    {"setPriority0",     "(I)V",       (void *)&JVM_SetThreadPriority},
    {"yield",            "()V",        (void *)&JVM_Yield},
    {"sleep",            "(J)V",       (void *)&JVM_Sleep},
    {"currentThread",    "()" THD,     (void *)&JVM_CurrentThread},
    {"countStackFrames", "()I",        (void *)&JVM_CountStackFrames},
    {"interrupt0",       "()V",        (void *)&JVM_Interrupt},
    {"isInterrupted",    "(Z)Z",       (void *)&JVM_IsInterrupted},
    {"holdsLock",        "(" OBJ ")Z", (void *)&JVM_HoldsLock},
    {"getThreads",        "()[" THD,   (void *)&JVM_GetAllThreads},
    {"dumpThreads",      "([" THD ")[[" STE, (void *)&JVM_DumpThreads},
    {"setNativeName",    "(" STR ")V", (void *)&JVM_SetNativeThreadName},
};

上面定义了一个数组,数组中存放的为JNINativeMethod类型的结构体变量,JNINativeMethod定义在jni.h中:

typedef struct {
    char *name;
    char *signature;
    void *fnPtr;
} JNINativeMethod;

JNINativeMethod主要是进行一个jni方法的映射关系,将native方法和真正的实现方法进行绑定。那么具体是何时进行绑定的呢?java层的Thread在类的静态初始化块中,调用了registerNatives()方法:

   private static native void registerNatives();
    static {
        registerNatives();
    }

我们来看看registerNatives()对应的Jni方法:

JNIEXPORT void JNICALL Java_java_lang_Thread_registerNatives(JNIEnv *env, jclass cls)
{
    (*env)->RegisterNatives(env, cls, methods, ARRAY_LENGTH(methods));
}

可见此时会将上述数组methods中的方法映射关系进行注册。

注册好了后,我们再来看看上面定义的数组,这里面将Java线程中的很多native方法与实现其功能的方法指针进行了绑定,比如start0()就和JVM_StartThread进行了绑定。所以我们想研究start0(),就直接看看JVM_StartThread指针所指向的方法即可。

三:Java线程的创建

JVM_StartThread定义在jvm.cpp中:

JVM_ENTRY(void, JVM_StartThread(JNIEnv* env, jobject jthread))
  JVMWrapper("JVM_StartThread");
  JavaThread *native_thread = NULL;
  bool throw_illegal_thread_state = false;

  {

    MutexLocker mu(Threads_lock);
    if (java_lang_Thread::thread(JNIHandles::resolve_non_null(jthread)) != NULL) {
      throw_illegal_thread_state = true;
    } else {
      jlong size =
             java_lang_Thread::stackSize(JNIHandles::resolve_non_null(jthread));
    
      size_t sz = size > 0 ? (size_t) size : 0;
      native_thread = new JavaThread(&thread_entry, sz);
      if (native_thread->osthread() != NULL) {
        native_thread->prepare(jthread);
      }
    }
  }
  
  ......
  Thread::start(native_thread);

JVM_END

源码中本来有很多英文注释,我这里先给删了,下面来一步步分析下上面的代码吧。

1:判断Java线程是否已经启动,如果已经启动过,则会抛异常。

if (java_lang_Thread::thread(JNIHandles::resolve_non_null(jthread)) != NULL) {
      throw_illegal_thread_state = true;
 }

2: 如果第一步判断中,Java线程没有启动过,则会开始创建Java线程。

jlong size = java_lang_Thread::stackSize(JNIHandles::resolve_non_null(jthread));
size_t sz = size > 0 ? (size_t) size : 0;
native_thread = new JavaThread(&thread_entry, sz);

Java线程的创建过程主要就在JavaThread的构造函数中:

JavaThread::JavaThread(ThreadFunction entry_point, size_t stack_sz) :
                       Thread()
{
  initialize();
  _jni_attach_state = _not_attaching_via_jni;
  set_entry_point(entry_point);
  os::ThreadType thr_type = os::java_thread;
  thr_type = entry_point == &compiler_thread_entry ? os::compiler_thread :
                                                     os::java_thread;
  os::create_thread(this, thr_type, stack_sz);
}

最后一句os::create_thread(this, thr_type, stack_sz) 便开始真正的创建Java线程对应的内核线程。

bool os::create_thread(Thread* thread, ThreadType thr_type,
                       size_t req_stack_size) {
    ......
    pthread_t tid;
    int ret = pthread_create(&tid, &attr, (void* (*)(void*)) thread_native_entry, thread);
    ......
    return true;
}

上面这个方法主要就是利用pthread_create()来创建线程。其中第三个参数thread_native_entry便是新起的线程运行的初始地址,其为定义在os_bsd.cpp中的一个方法指针,而第四个参数thread即thread_native_entry的参数:

static void *thread_native_entry(Thread *thread) {
  ......
  thread->run();
  ......
  return 0;
}

新线程创建后就会从thread_native_entry()开始运行,thread_native_entry()中调用了thread->run():

// thread.cpp
void JavaThread::run() {
  ......
  thread_main_inner();
}

此方法最后调用了thread_main_inner():

// thread.cpp
void JavaThread::thread_main_inner() {
  if (!this->has_pending_exception() &&
      !java_lang_Thread::is_stillborn(this->threadObj())) {
    {
      ResourceMark rm(this);
      this->set_native_thread_name(this->get_thread_name());
    }
    HandleMark hm(this);
    this->entry_point()(this, this);
  }
  DTRACE_THREAD_PROBE(stop, this);
  this->exit(false);
  delete this;
}

我们重点关注下this->entry_point()(this, this),entry_point()返回的其实就是在 new JavaThread(&thread_entry, sz) 时传入的thread_entry。这里就相当于调用了thread_entry(this,this)。thread_entry定义在jvm.cpp中:

// jvm.cpp
static void thread_entry(JavaThread* thread, TRAPS) {
  HandleMark hm(THREAD);
  Handle obj(THREAD, thread->threadObj());
  JavaValue result(T_VOID);
  JavaCalls::call_virtual(&result,
                          obj,
                          KlassHandle(THREAD, SystemDictionary::Thread_klass()),
                          vmSymbols::run_method_name(),
                          vmSymbols::void_method_signature(),
                          THREAD);
}

哈哈,这里见到了一个老朋友:JavaCalls。JavaCalls模块是用来调用Java方法的。不了解的朋友可以直接看之前写的文章《JVM方法执行的来龙去脉》

我们来看看这里调用JavaCalls::call_virtual()传入的一些参数:

obj:Java线程对象;

KlassHandle(THREAD, SystemDictionary::Thread_klass()):Java线程类,记录在SystemDictionary中,即java_lang_Thread;

vmSymbols::run_method_name():即"run";

vmSymbols::void_method_signature():即"()V";

经过上面的分析,这里其实就是开始调用Java线程对象的run()方法。

3:开始执行所创建的内核线程,即从第二步所说的thread_entry处开始执行。

Thread::start(native_thread);

四:总结

到这里Java线程就已经真正的运行起来了,总结下上面的过程:

1:调用Java线程start()方法,通过jni方式,调用到JVM层。

2:JVM通过pthread_create()创建一个系统内核线程,并指定内核线程的初始运行地址,即一个方法指针。

3:在内核线程的初始运行方法中,利用JavaCalls模块,调用java线程的run()方法,开始java级别的线程执行。

欢迎关注我的专栏:半栈工程师