ThreadLocal

笔者上个星期参加了微盟新零售的业务工程师面试，得到了几家offer，最终选择了一家上市国企，955不打卡，公积金拉满，下面是我面试遇到的一些问题，我觉得有必要深入探讨一下细节。

微盟_ABC看图.jpg

   面试官：看你项目用了ThreadLocal是什么，怎么实现（给我详细讲讲）？
   
  我（微微一笑）：我先讲一下什么是ThreadLocal，首先，ThreadLocal
  不是用来解决共享对象的多线程访问问题的，一般情况下，通过
  ThreadLocal.set() 到线程中的对象是该线程自己使用的对象，
  其他线程是不需要访问的，也访问不到的。各个线程中访问的是不同的对象。

面试官：给我讲讲里面的ThreadLocal类中的变量

我：

  private final int threadLocalHashCode = nextHashCode();
  private static final int HASH_INCREMENT = 0x61c88647;
  private static AtomicInteger nextHashCode =     new AtomicInteger();

连续生成的散列码之间的差异-将隐式顺序线程本地ID转换为近似最优分布的乘法散列值，以获得两个大小表的幂。

看看官方文档的定义

    ThreadLocals rely on per-thread linear-probe hash maps attached to
     each thread (Thread.threadLocals and inheritableThreadLocals). The 
     ThreadLocal objects act as keys, searched via threadLocalHashCode. 
     This is a custom hash code (useful only within ThreadLocalMaps) that 
     eliminates collisions in the common case where consecutively 
     constructed ThreadLocals are used by the same threads, while remaining 
     well-behaved in less common cases  
   翻译官方文档的定义：
   这句话什么意思呢，ThreadLocals 依赖于附加到每个线程
   （Thread.threadLocals 和inheritable ThreadLocals）的每线程线性探针哈希映射。
   当把ThreadLocal 对象充当键，通过threadLocal ashCode 进行搜索。 
   这是一个自定义散列代码（仅在 ThreadLocalMaps 中有用），它在相同线程
   使用连续构造的 ThreadLocals 的常见情况下消除了冲突，同时在极端的情况下保持稳定的行为。
   
 面试官：小伙子可以呀，那你跟我说说他怎么实现每个线程区分开的呢？
   我： ThreadLocal类提供线程局部变量。这些变量不同于它们的普通对应变量，
   因为每个访问一个（通过其 get 或 set 方法）的线程都有自己的、独立初始化的
   变量副本。 ThreadLocal 实例通常是希望将状态与线程相关联的类中的私有静态
   字段（例如，用户 ID 或事务 ID）。
   例如，下面的类生成每个线程本地的唯一标识符。线程的 id 在第一次调用 ThreadId.get() 时
   被分配，并且在后续调用中保持不变。
   导入 java.util.concurrent.atomic.AtomicInteger;
      // 包含每个线程 ID 的线程局部变量
   私有静态最终 ThreadLocal<Integer> threadId =
       新线程本地<整数>（）{
           @Override 受保护的整数 initialValue() {
               返回 nextId.getAndIncrement();
       }
   };
  
   // 返回当前线程的唯一 ID，必要时分配它
   公共静态 int get() {
       返回 threadId.get();
   }

面试官：你再讲讲ThreadLocal与Synchronized的区别吧

我：ThreadLocal<T>其实是与线程绑定的一个变量。ThreadLocal和Synchonized都用于
解决多线程并发访问。
但是ThreadLocal与synchronized有本质的区别：
1、Synchronized用于线程间的数据共享，而ThreadLocal则用于线程间的数据隔离。
2、Synchronized是利用锁的机制，使变量或代码块在某一时该只能被一个线程访问。而ThreadLo
cal为每一个线程都提供了变量的副本，使得每个线程在某一时间访问到的并不是同一个对象，这样
就隔离了多个线程对数据的数据共享。
而Synchronized却正好相反，它用于在多个线程间通信时能够获得数据共享。
一句话理解ThreadLocal，向ThreadLocal里面存东西就是向它里面的Map存东西
的，然后ThreadLocal把这个Map挂到当前的线程底下，这样Map就只属于这个线程了。

面试官：讲讲ThreadLocal的原理

要看原理那么就得从源码看起。

 ThreadLocal的set()方法：
public void set(T value) {
      //1、获取当前线程
      Thread t = Thread.currentThread();
      //2、获取线程中的属性 threadLocalMap ,如果threadLocalMap 不为空，
      //则直接更新要保存的变量值，否则创建threadLocalMap，并赋值
      ThreadLocalMap map = getMap(t);
      if (map != null)
          map.set(this, value);
      else
          // 初始化thradLocalMap 并赋值
          createMap(t, value);
  }
       从上面的代码可以看出，ThreadLocal  set赋值的时候首先会获取当前线程thread,并获取thread线程中的ThreadLocalMap属性。如果map属性不为空，则直接更新value值，如果map为空，则实例化threadLocalMap,并将value值初始化。

```js

那么ThreadLocalMap又是什么呢，还有createMap又是怎么做的，我们继续往下看。大家最后自己再idea上跟下源码，会有更深的认识。


static class ThreadLocalMap {

      /**
       * The entries in this hash map extend WeakReference, using
       * its main ref field as the key (which is always a
       * ThreadLocal object).  Note that null keys (i.e. entry.get()
       * == null) mean that the key is no longer referenced, so the
       * entry can be expunged from table.  Such entries are referred to
       * as "stale entries" in the code that follows.
       */
      static class Entry extends WeakReference<ThreadLocal<?>> {
          /** The value associated with this ThreadLocal. */
          Object value;

          Entry(ThreadLocal<?> k, Object v) {
              super(k);
              value = v;
          }
      }

      
  }
  可看出ThreadLocalMap是ThreadLocal的内部静态类，而它的构成主要是用Entry来保存数据 ，
  而且还是继承的弱引用。在Entry内部使用ThreadLocal作为key，使用我们设置的value作为value。

 这个是threadlocal 的内部方法
void createMap(Thread t, T firstValue) {
      t.threadLocals = new ThreadLocalMap(this, firstValue);
  }


  //ThreadLocalMap 构造方法
ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
          table = new Entry[INITIAL_CAPACITY];
          int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
          table[i] = new Entry(firstKey, firstValue);
          size = 1;
          setThreshold(INITIAL_CAPACITY);
      }
    ThreadLocal的get方法
   
  public T get() {
      //1、获取当前线程
      Thread t = Thread.currentThread();
      //2、获取当前线程的ThreadLocalMap
      ThreadLocalMap map = getMap(t);
      //3、如果map数据为空，
      if (map != null) {
          //3.1、获取threalLocalMap中存储的值
          ThreadLocalMap.Entry e = map.getEntry(this);
          if (e != null) {
              @SuppressWarnings("unchecked")
              T result = (T)e.value;
              return result;
          }
      }
      //如果是数据为null，则初始化，初始化的结果，TheralLocalMap中存放key值为threadLocal，值为null
      return setInitialValue();
  } 
private T setInitialValue() {
      T value = initialValue();
      Thread t = Thread.currentThread();
      ThreadLocalMap map = getMap(t);
      if (map != null)
          map.set(this, value);
      else
          createMap(t, value);
      return value;
  }
ThreadLocal的remove方法
public void remove() {
       ThreadLocalMap m = getMap(Thread.currentThread());
       if (m != null)
           m.remove(this);
   }

   remove方法，直接将ThrealLocal 对应的值从当前相差Thread中的ThreadLocalMap中删除。
   为什么要删除，这涉及到内存泄露的问题。实际上 ThreadLocalMap 中使用的 key 为 ThreadLocal 的弱引用，
   弱引用的特点是，如果这个对象只存在弱引用，那么在下一次垃圾回收的时候必然会被清理掉。所以如果 
   ThreadLocal 没有被外部强引用的情况下，在垃圾回收的时候会被清理掉的，这样一来 ThreadLocalMap中使用这个
   ThreadLocal 的 key 也会被清理掉。但是，value 是强引用，不会被清理，这样一来就会出现 key 为 null 的 
   value。ThreadLocal其实是与线程绑定的一个变量，如此就会出现一个问题：如果没有将ThreadLocal内的变量删除
   （remove）或替换，它的生命周期将会与线程共存。通常线程池中对线程管理都是采用线程复用的方法，在线程池
   中线程很难结束甚至于永远不会结束，这将意味着线程持续的时间将不可预测，甚至与JVM的生命周期一致。举个例子
   ，如果ThreadLocal中直接或间接包装了集合类或复杂对象，每次在同一个ThreadLocal中取出对象后，再对内容做操作
   ，那么内部的集合类和复杂对象所占用的空间可能会开始持续膨胀。

面试官：ThreadLocal 常见使用场景

我：

1、每个线程需要有自己单独的实例
2、实例需要在多个方法中共享，但不希望被多线程共享
对于第一点，每个线程拥有自己实例，实现它的方式很多。例如可以在线程内部构建一个单独的实例。ThreadLocal
可以以非常方便的形式满足该需求。
对于第二点，可以在满足第一点（每个线程有自己的实例）的条件下，通过方法间引用传递的形式实现。
ThreadLocal 使得代码耦合度更低，且实现更优雅。

场景

1）存储用户Session

一个简单的用ThreadLocal来存储Session的例子：

private static final ThreadLocal threadSession = new ThreadLocal();

   public static Session getSession() throws InfrastructureException {
       Session s = (Session) threadSession.get();
       try {
           if (s == null) {
               s = getSessionFactory().openSession();
               threadSession.set(s);
           }
       } catch (HibernateException ex) {
           throw new InfrastructureException(ex);
       }
       return s;
   }
场景二、数据库连接，处理数据库事务

场景三、数据跨层传递（controller,service, dao）

     每个线程内需要保存类似于全局变量的信息（例如在拦截器中获取的用户信息），可以让不同方法
     直接使用，避免参数传递的麻烦却不想被多线程共享（因为不同线程获取到的用户信息不一样）。

例如，用 ThreadLocal 保存一些业务内容（用户权限信息、从用户系统获取到的用户名、用户ID 等），
这些信息在同一个线程内相同，但是不同的线程使用的业务内容是不相同的。
在线程生命周期内，都通过这个静态 ThreadLocal 实例的 get() 方法取得自己 set 过的那个对象，
避免了将这个对象（如 user 对象）作为参数传递的麻烦。
比如说我们是一个用户系统，那么当一个请求进来的时候，一个线程会负责执行这个请求，然后这个请求就会依次调用
service-1()、service-2()、service-3()、service-4()，这4个方法可能是分布在不同的类中的。
这个例子和存储session有些像。

package com.Jason.threadlocal;


public class ThreadLocalDemo05 {
   public static void main(String[] args) {
       User user = new User("jack");
       new Service1().service1(user);
   }

}

class Service1 {
   public void service1(User user){
       //给ThreadLocal赋值，后续的服务直接通过ThreadLocal获取就行了。
       UserContextHolder.holder.set(user);
       new Service2().service2();
   }
}

class Service2 {
   public void service2(){
       User user = UserContextHolder.holder.get();
       System.out.println("service2拿到的用户:"+user.name);
       new Service3().service3();
   }
}

class Service3 {
   public void service3(){
       User user = UserContextHolder.holder.get();
       System.out.println("service3拿到的用户:"+user.name);
       //在整个流程执行完毕后，一定要执行remove
       UserContextHolder.holder.remove();
   }
}

class UserContextHolder {
   //创建ThreadLocal保存User对象
   public static ThreadLocal<User> holder = new ThreadLocal<>();
}

class User {
   String name;
   public User(String name){
       this.name = name;
   }
}



执行的结果：

service2拿到的用户:jack
service3拿到的用户:jack
场景四、Spring使用ThreadLocal解决线程安全问题 

我们知道在一般情况下，只有无状态的Bean才可以在多线程环境下共享，
在Spring中，绝大部分Bean都可以声明为singleton作用域。就是因为Spring对一些Bean
（如RequestContextHolder、TransactionSynchronizationManager、LocaleContextHolder等）
中非线程安全的“状态性对象”采用ThreadLocal进行封装，让它们也成为线程安全的“状态性对象”，
因此有状态的Bean就能够以singleton的方式在多线程中正常工作了。 
一般的Web应用划分为展现层、服务层和持久层三个层次，在不同的层中编写对应的逻辑，下层通过接口向上层开放
功能调用。在一般情况下，从接收请求到返回响应所经过的所有程序调用都同属于一个线程，如图所示。

引用.jpg


这样用户就可以根据需要，将一些非线程安全的变量以ThreadLocal存放，在同一次请求响应的调用线程中，所有
对象所访问的同一ThreadLocal变量都是当前线程所绑定的。



下面的实例能够体现Spring对有状态Bean的改造思路：




代码清单9-5  TopicDao：非线程安全


public class TopicDao {
 //①一个非线程安全的变量
 private Connection conn; 
 public void addTopic(){
      //②引用非线程安全变量
     Statement stat = conn.createStatement();
     …
 }
由于①处的conn是成员变量，因为addTopic()方法是非线程安全的，必须在使用时创建一个新TopicDao实例
（非singleton）。下面使用ThreadLocal对conn这个非线程安全的“状态”进行改造： 

代码清单9-6  TopicDao：线程安全 


import java.sql.Connection;
import java.sql.Statement;
public class TopicDao {

//①使用ThreadLocal保存Connection变量
private static ThreadLocal<Connection> connThreadLocal = new ThreadLocal<Connection>();
public static Connection getConnection(){
       
      //②如果connThreadLocal没有本线程对应的Connection创建一个新的Connection，
      //并将其保存到线程本地变量中。
if (connThreadLocal.get() == null) {
  		Connection conn = ConnectionManager.getConnection();
  		connThreadLocal.set(conn);
            return conn;
  	}else{
            //③直接返回线程本地变量
  		return connThreadLocal.get();
  	}
  }
  public void addTopic() {

  	//④从ThreadLocal中获取线程对应的
       Statement stat = getConnection().createStatement();
  }


不同的线程在使用TopicDao时，先判断connThreadLocal.get()是否为null，如果为null，
则说明当前线程还没有对应的Connection对象，这时创建一个Connection对象并添加到本地线程变量中；
如果不为null，则说明当前的线程已经拥有了Connection对象，直接使用就可以了。这样，就保证了不同
的线程使用线程相关的Connection，而不会使用其他线程的Connection。因此，这个TopicDao就可以做到
singleton共享了。 
当然，这个例子本身很粗糙，将Connection的ThreadLocal直接放在Dao只能做到本Dao的多个方法共享
Connection时不发生线程安全问题，但无法和其他Dao共用同一个Connection，要做到同一事务多Dao
共享同一个Connection，必须在一个共同的外部类使用ThreadLocal保存Connection。但这个实例基本上
说明了Spring对有状态类线程安全化的解决思路。在本章后面的内容中，我们将详细说明Spring如何通过
ThreadLocal解决事务管理的问题。

ThreadLocal最全详解

ThreadLocal

面试官：给我讲讲里面的ThreadLocal类中的变量

看看官方文档的定义

面试官：你再讲讲ThreadLocal与Synchronized的区别吧

面试官：讲讲ThreadLocal的原理