Java培训多线程+List分段解决批量更新太慢

159 阅读2分钟

写在前面

相信不少开发者在遇到项目对数据进行批量操作的时候,都会有不少的烦恼,尤其是针对数据量极大的情况下,效率问题就直接提上了菜板。

因此,开多线程来执行批量任务是十分重要的一种批量操作思路,其实这种思路实现起来也十分简单,就拿批量更新的操作举例:

整体流程图

​编辑

 

步骤

  • 获取需要进行批量更新的大集合A,对大集合进行拆分操作,分成N个小集合A-1 ~ A-N 。
  • 开启线程池,针对集合的大小进行调参,对小集合进行批量更新操作_java培训
  • 对流程进行控制,控制线程执行顺序。

按照指定大小拆分集合的工具类

import com.google.common.collect.Lists;

import org.apache.commons.collections.CollectionUtils;

import java.util.List;

/**

  • 拆分结合工具类

  • @author shiwen

*/

public class SplitListUtils {

/**

  • 拆分集合

  • @param 泛型对象

  • @param resList 需要拆分的集合

  • @param subListLength 每个子集合的元素个数

  • @return 返回拆分后的各个集合组成的列表

  • 代码里面用到了guava和common的结合工具类

**/

public static List<List> split(List resList, int subListLength) {

if (CollectionUtils.isEmpty(resList) || subListLength <= 0) {

return Lists.newArrayList();

}

List<List> ret = Lists.newArrayList();

int size = resList.size();

if (size <= subListLength) {

// 数据量不足 subListLength 指定的大小

ret.add(resList);

} else {

int pre = size / subListLength;

int last = size % subListLength;

// 前面pre个集合,每个大小都是 subListLength 个元素_java视频

for (int i = 0; i < pre; i++) {

List itemList = Lists.newArrayList();

for (int j = 0; j < subListLength; j++) {

itemList.add(resList.get(i * subListLength + j));

}

ret.add(itemList);

}

// last的进行处理

if (last > 0) {

List itemList = Lists.newArrayList();

for (int i = 0; i < last; i++) {

itemList.add(resList.get(pre * subListLength + i));

}

ret.add(itemList);

}

}

return ret;

}

// 运行代码

public static void main(String[] args) {

List list = Lists.newArrayList();

int size = 1099;

for (int i = 0; i < size; i++) {

list.add("hello-" + i);

}

// 大集合里面包含多个小集合

List<List> temps = split(list, 100);

int j = 0;

// 对大集合里面的每一个小集合进行操作

for (List obj : temps) {

System.out.println(String.format("row:%s -> size:%s,data:%s", ++j, obj.size(), obj));

}

}

}

开启异步执行任务的线程池

public void threadMethod() {

List updateList = new ArrayList();

// 初始化线程池, 参数一定要一定要一定要调好!!!!

ThreadPoolExecutor threadPool = new ThreadPoolExecutor(20, 50,

4, TimeUnit.SECONDS, new ArrayBlockingQueue(10), new ThreadPoolExecutor.AbortPolicy());

// 大集合拆分成N个小集合, 这里集合的size可以稍微小一些(这里我用100刚刚好), 以保证多线程异步执行, 过大容易回到单线程

List splitNList = SplitListUtils.split(totalList, 100);

// 记录单个任务的执行次数

CountDownLatch countDownLatch = new CountDownLatch(splitNList.size());

// 对拆分的集合进行批量处理, 先拆分的集合, 再多线程执行

for (List singleList : splitNList) {

// 线程池执行

threadPool.execute(new Thread(new Runnable(){

@Override

public void run() {

for (Entity yangshiwen : singleList) {

// 将每一个对象进行数据封装, 并添加到一个用于存储更新数据的list

// ......

}

}

}));

// 任务个数 - 1, 直至为0时唤醒await()

countDownLatch.countDown();

}

try {

// 让当前线程处于阻塞状态,直到锁存器计数为零

countDownLatch.await();

} catch (InterruptedException e) {

throw new BusinessLogException(ResponseEnum.FAIL);

}

// 通过mybatis的批量插入的方式来进行数据的插入, 这一步还是要做判空

if (GeneralUtil.listNotNull(updateList)) {

batchUpdateEntity(updateList);

LogUtil.info("xxxxxxxxxxxxxxx");

}

}

写在最后

多线程是Java的一个难点,但是它也很有趣,听说玩得溜得起飞的人,人生都开启多线程模式了…

文章来源于Java知音