前言
平時接觸過多線程開發的童鞋應該都或多或少了解過線程池,之前發布的《阿里巴巴 Java 手冊》里也有一條:
可見線程池的重要性。
簡單來說使用線程池有以下幾個目的:
線程是稀缺資源,不能頻繁的創建。
解耦作用;線程的創建于執行完全分開,方便維護。
應當將其放入一個池子中,可以給其他任務進行復用。
線程池原理
談到線程池就會想到池化技術,其中最核心的思想就是把寶貴的資源放到一個池子中;每次使用都從里面獲取,用完之后又放回池子供其他人使用,有點吃大鍋飯的意思。
那在 Java 中又是如何實現的呢?
在 JDK 1.5 之后推出了相關的 api,常見的創建線程池方式有以下幾種:
Executors.newCachedThreadPool():無限線程池。
Executors.newFixedThreadPool(nThreads):創建固定大小的線程池。
Executors.newSingleThreadExecutor():創建單個線程的線程池。
其實看這三種方式創建的源碼就會發現:
publicstaticExecutorServicenewCachedThreadPool(){returnnewThreadPoolExecutor(0,?Integer.MAX_VALUE,60L,?TimeUnit.SECONDS,newSynchronousQueue());????}
實際上還是利用ThreadPoolExecutor類實現的。
所以我們重點來看下ThreadPoolExecutor是怎么玩的。
首先是創建線程的 api:
ThreadPoolExecutor(intcorePoolSize,intmaximumPoolSize,longkeepAliveTime,?TimeUnit?unit,?BlockingQueue?workQueue,?RejectedExecutionHandler?handler)
這幾個核心參數的作用:
corePoolSize為線程池的基本大小。
maximumPoolSize為線程池最大線程大小。
keepAliveTime和unit則是線程空閑后的存活時間。
workQueue用于存放任務的阻塞隊列。
handler當隊列和最大線程池都滿了之后的飽和策略。
了解了這幾個參數再來看看實際的運用。
通常我們都是使用:
threadPool.execute(newJob());
這樣的方式來提交一個任務到線程池中,所以核心的邏輯就是execute()函數了。
在具體分析之前先了解下線程池中所定義的狀態,這些狀態都和線程的執行密切相關:
RUNNING自然是運行狀態,指可以接受任務執行隊列里的任務
SHUTDOWN指調用了shutdown()方法,不再接受新任務了,但是隊列里的任務得執行完畢。
STOP指調用了shutdownNow()方法,不再接受新任務,同時拋棄阻塞隊列里的所有任務并中斷所有正在執行任務。
TIDYING所有任務都執行完畢,在調用shutdown()/shutdownNow()中都會嘗試更新為這個狀態。
TERMINATED終止狀態,當執行terminated()后會更新為這個狀態。
用圖表示為:
然后看看execute()方法是如何處理的:
獲取當前線程池的狀態。
當前線程數量小于 coreSize 時創建一個新的線程運行。
如果當前線程處于運行狀態,并且寫入阻塞隊列成功。
雙重檢查,再次獲取線程狀態;如果線程狀態變了(非運行狀態)就需要從阻塞隊列移除任務,并嘗試判斷線程是否全部執行完畢。同時執行拒絕策略。
如果當前線程池為空就新創建一個線程并執行。
如果在第三步的判斷為非運行狀態,嘗試新建線程,如果失敗則執行拒絕策略。
這里借助《聊聊并發》的一張圖來描述這個流程:
如何配置線程
流程聊完了再來看看上文提到了幾個核心參數應該如何配置呢?
有一點是肯定的,線程池肯定是不是越大越好。
通常我們是需要根據這批任務執行的性質來確定的。
IO 密集型任務:由于線程并不是一直在運行,所以可以盡可能的多配置線程,比如 CPU 個數 * 2
CPU 密集型任務(大量復雜的運算)應當分配較少的線程,比如 CPU 個數相當的大小。
當然這些都是經驗值,最好的方式還是根據實際情況測試得出最佳配置。
優雅的關閉線程池
有運行任務自然也有關閉任務,從上文提到的 5 個狀態就能看出如何來關閉線程池。
其實無非就是兩個方法shutdown()/shutdownNow()。
但他們有著重要的區別:
shutdown()執行后停止接受新任務,會把隊列的任務執行完畢。
shutdownNow()也是停止接受新任務,但會中斷所有的任務,將線程池狀態變為 stop。
兩個方法都會中斷線程,用戶可自行判斷是否需要響應中斷。
shutdownNow()要更簡單粗暴,可以根據實際場景選擇不同的方法。
我通常是按照以下方式關閉線程池的:
longstart?=?System.currentTimeMillis();for(inti?=0;?i?<=5;?i++)?{????????????pool.execute(newJob());????????}
pool.shutdown();
while(!pool.awaitTermination(1,?TimeUnit.SECONDS))?{
LOGGER.info(“線程還在執行。。。”);
}
longend?=?System.currentTimeMillis();
LOGGER.info(“一共處理了【{}】”,?(end?–?start));
pool.awaitTermination(1, TimeUnit.SECONDS)會每隔一秒鐘檢查一次是否執行完畢(狀態為TERMINATED),當從 while 循環退出時就表明線程池已經完全終止了。
SpringBoot 使用線程池
2018 年了,SpringBoot 盛行;來看看在 SpringBoot 中應當怎么配置和使用線程池。
既然用了 SpringBoot ,那自然得發揮 Spring 的特性,所以需要 Spring 來幫我們管理線程池:
@ConfigurationpublicclassTreadPoolConfig{
/**
*?消費隊列線程
*@return
*/
@Bean(value?=“consumerQueueThreadPool”)
publicExecutorServicebuildConsumerQueueThreadPool(){
ThreadFactory?namedThreadFactory?=newThreadFactoryBuilder()
.setNameFormat(“consumer-queue-thread-%d”).build();
ExecutorService?pool?=newThreadPoolExecutor(5,5,0L,?TimeUnit.MILLISECONDS,
newArrayBlockingQueue(5),namedThreadFactory,newThreadPoolExecutor.AbortPolicy());
returnpool?;
}
}
使用時:
@Resource(name?="consumerQueueThreadPool")privateExecutorService?consumerQueueThreadPool;
@Override
publicvoidexecute(){
//消費隊列
for(inti?=0;?i?<5;?i++)?{
consumerQueueThreadPool.execute(newConsumerQueueThread());
}
}
其實也挺簡單,就是創建了一個線程池的 bean,在使用時直接從 Spring 中取出即可。
監控線程池
談到了 SpringBoot,也可利用它 actuator 組件來做線程池的監控。
線程怎么說都是稀缺資源,對線程池的監控可以知道自己任務執行的狀況、效率等。
關于 actuator 就不再細說了,感興趣的可以看看這篇,有詳細整理過如何暴露監控端點。
其實 ThreadPool 本身已經提供了不少 api 可以獲取線程狀態:
很多方法看名字就知道其含義,只需要將這些信息暴露到 SpringBoot 的監控端點中,我們就可以在可視化頁面查看當前的線程池狀態了。
甚至我們可以繼承線程池擴展其中的幾個函數來自定義監控邏輯:
看這些名稱和定義都知道,這是讓子類來實現的。
可以在線程執行前、后、終止狀態執行自定義邏輯。
線程池隔離
線程池看似很美好,但也會帶來一些問題。
如果我們很多業務都依賴于同一個線程池,當其中一個業務因為各種不可控的原因消耗了所有的線程,導致線程池全部占滿。
這樣其他的業務也就不能正常運轉了,這對系統的打擊是巨大的。
比如我們 Tomcat 接受請求的線程池,假設其中一些響應特別慢,線程資源得不到回收釋放;線程池慢慢被占滿,最壞的情況就是整個應用都不能提供服務。
所以我們需要將線程池進行隔離。
通常的做法是按照業務進行劃分:
比如下單的任務用一個線程池,獲取數據的任務用另一個線程池。這樣即使其中一個出現問題把線程池耗盡,那也不會影響其他的任務運行。
hystrix 隔離
這樣的需求Hystrix已經幫我們實現了。
Hystrix 是一款開源的容錯插件,具有依賴隔離、系統容錯降級等功能。
下面來看看Hystrix簡單的應用:
首先需要定義兩個線程池,分別用于執行訂單、處理用戶。
/**?*?Function:訂單服務?*?*@authorcrossoverJie?*?????????Date:?2018/7/28?16:43?*@sinceJDK?1.8?*/publicclassCommandOrderextendsHystrixCommand{
privatefinalstaticLogger?LOGGER?=?LoggerFactory.getLogger(CommandOrder.class);
privateString?orderName;
publicCommandOrder(String?orderName){
super(Setter.withGroupKey(
//服務分組
HystrixCommandGroupKey.Factory.asKey(“OrderGroup”))
//線程分組
.andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey(“OrderPool”))
//線程池配置
.andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter()
.withCoreSize(10)
.withKeepAliveTimeMinutes(5)
.withMaxQueueSize(10)
.withQueueSizeRejectionThreshold(10000))
.andCommandPropertiesDefaults(
HystrixCommandProperties.Setter()
.withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.THREAD))
)
;
this.orderName?=?orderName;
}
@Override
publicStringrun()throwsException{
LOGGER.info(“orderName=[{}]”,?orderName);
TimeUnit.MILLISECONDS.sleep(100);
return“OrderName=”+?orderName;
}
}
/**
*?Function:用戶服務
*
*@authorcrossoverJie
*?????????Date:?2018/7/28?16:43
*@sinceJDK?1.8
*/
publicclassCommandUserextendsHystrixCommand{
privatefinalstaticLogger?LOGGER?=?LoggerFactory.getLogger(CommandUser.class);
privateString?userName;
publicCommandUser(String?userName){
super(Setter.withGroupKey(
//服務分組
HystrixCommandGroupKey.Factory.asKey(“UserGroup”))
//線程分組
.andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey(“UserPool”))
//線程池配置
.andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter()
.withCoreSize(10)
.withKeepAliveTimeMinutes(5)
.withMaxQueueSize(10)
.withQueueSizeRejectionThreshold(10000))
//線程池隔離
.andCommandPropertiesDefaults(
HystrixCommandProperties.Setter()
.withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.THREAD))
)
;
this.userName?=?userName;
}
@Override
publicStringrun()throwsException{
LOGGER.info(“userName=[{}]”,?userName);
TimeUnit.MILLISECONDS.sleep(100);
return“userName=”+?userName;
}
}
api特別簡潔易懂,具體詳情請查看官方文檔。
然后模擬運行:
publicstaticvoidmain(String[]?args)throwsException{????????CommandOrder?commandPhone?=newCommandOrder("手機");????????CommandOrder?command?=newCommandOrder("電視");
//阻塞方式執行
String?execute?=?commandPhone.execute();
LOGGER.info(“execute=[{}]”,?execute);
//異步非阻塞方式
Future?queue?=?command.queue();
String?value?=?queue.get(200,?TimeUnit.MILLISECONDS);
LOGGER.info(“value=[{}]”,?value);
CommandUser?commandUser?=newCommandUser(“張三”);
String?name?=?commandUser.execute();
LOGGER.info(“name=[{}]”,?name);
}
運行結果:
可以看到兩個任務分成了兩個線程池運行,他們之間互不干擾。
獲取任務任務結果支持同步阻塞和異步非阻塞方式,可自行選擇。
它的實現原理其實容易猜到:
利用一個 Map 來存放不同業務對應的線程池。
通過剛才的構造函數也能證明:
還要注意的一點是:
自定義的 Command 并不是一個單例,每次執行需要 new 一個實例,不然會報This instance can only be executed once. Please instantiate a new instance.異常。
總結
池化技術確實在平時應用廣泛,熟練掌握能提高不少效率。
文末的 hystrix 源碼:
https://github.com/crossoverJie/Java-Interview/tree/master/src/main/java/com/crossoverjie/hystrix
最后插播個小廣告:
Java-Interview截止目前將近 8K star。