channel[通道]是golang的一種重要特性,正是因為channel的存在才使得golang不同于其它語言。channel使得并發編程變得簡單容易有趣。
channel的概念和語法
一個channel可以理解為一個先進先出的消息隊列。channel用來在協程[goroutine]之前傳遞數據,準確的說,是用來傳遞數據的所有權。一個設計良好的程序應該確保同一時刻channel里面的數據只會被同一個協程擁有,這樣就可以避免并發帶來的數據不安全問題[data races]。
channel的類型
像數組、切片和字典一樣,channel類型是一種組合類型,每一種channel類型都對應著一種簡單的數據類型。比如元素的類型是string,那么對應的channel類型就是chan string,進入channel的數據也就必須是string類型的值。
官方的go編譯器限制channel最多能容納到65535個元素,盡管如此,我們也不應該傳遞體積過大的元素值,因為channel的數據從進入到流出會涉及到數據拷貝操作。如果元素體積過大,最好的方法還是使用傳遞指針來取代傳遞值。
channel類型是可以帶有方向的,假設T是一種類型
chan T是雙向channel類型,編譯器允許對雙向channel同時進行發送和接收。
chan<- T是只寫channel類型,編譯器只允許往channel里面發送數據。
<-chan T是只讀channel類型,編輯器只允許從channel里面接收數據。
雙向類型的channel,可以被強制轉換成只讀channel或者是只寫channel,但是反過來卻不行,只讀和只寫channel是不可以轉換成雙向channel的。
channel類型的零值形式稱為空channel。一個非空channel類型必須通過make關鍵字進行創建。例如make(chan int, 10)將會創建出一個可以容納10個int值的channel。第二個整形的參數值代表的就是channel可以容納數據的大小,如果不提供這個參數值,那默認值就是零。
varchchanstring;// nil channelch:=make(chanstring);// zero channelch:=make(chanstring,10);// buffered channel
channel里面的value buffer的容量也就是channel的容量。channel的容量為零表示這是一個阻塞型通道,非零表示緩沖型通道[非阻塞型通道]。
channel內部結構
每個channel內部實現都有三個隊列
接收消息的協程隊列。這個隊列的結構是一個限定最大長度的鏈表,所有阻塞在channel的接收操作的協程都會被放在這個隊列里。
發送消息的協程隊列。這個隊列的結構也是一個限定最大長度的鏈表。所有阻塞在channel的發送操作的協程也都會被放在這個隊列里。
環形數據緩沖隊列。這個環形數組的大小就是channel的容量。如果數組裝滿了,就表示channel滿了,如果數組里一個值也沒有,就表示channel是空的。對于一個阻塞型channel來說,它總是同時處于即滿又空的狀態。
一個channel被所有使用它的協程所引用,也就是說,只要這兩個裝了協程的隊列長度大于零,那么這個channel就永遠不會被垃圾回收。另外,協程本身如果阻塞在channel的讀寫操作上,這個協程也永遠不會被垃圾回收,即使這個channel只會被這一個協程所引用。
channel的使用
channel支持以下操作
使用cap(ch)函數查詢channel的容量,cap是golang的內置函數
使用len(ch)函數查詢channel內部的數據長度,len函數也是內置的,表面上這個函數很有意義,但實際上它很少用。
使用close(ch)關閉channel,close也是內置函數。一個非空channel只能夠被關閉一次,如果關閉一個已經被關閉的或者是關閉一個空channel將會引發panic。另外關閉一個只讀channel是非法的,編譯器直接報錯。
使用ch <- v發送一個值v到channel。發送值到channel可能會有多種結果,即可能成功,也可能阻塞,甚至還會引發panic,取決于當前channel在什么狀態。
使用 v, ok <- ch 接收一個值。第二個遍歷ok是可選的,它表示channel是否已關閉。接收值只會又兩種結果,要么成功要么阻塞,而永遠也不會引發panic。
所有的這些操作都是同步的協程安全的,不需要加任何其它同步控制。
For-Range
for-range語法可以用到通道上。循環會一直接收channel里面的數據,直到channel關閉。不同于array/slice/map上的for-range,channel的for-range只允許有一個變量。
forv=rangeaChannel{// use v}
等價于
for{v,ok=<-aChannelif!ok{break}// use v}
注意,for-range對應的channel不能是只寫channel。
Select-Cases
select塊是為channel特殊設計的語法,它和switch語法非常相近。分支上它們都可以有多個case塊和做多一個default塊,但是也有很多不同
select 到 括號{之間不得有任何表達式
fallthrough關鍵字不能用在select里面
所有的case語句要么是channel的發送操作,要么就是channel的接收操作
select里面的case語句是隨機執行的,而不能是順序執行的。設想如果第一個case語句對應的channel是非阻塞的話,case語句的順序執行會導致后續的case語句一直得不到執行除非第一個case語句對應的channel里面的值都耗盡了。
如果所有case語句關聯的操作都是阻塞的,default分支就會被執行。如果沒有default分支,當前goroutine就會阻塞,當前的goroutine會掛接到所有關聯的channel內部的協程隊列上。 所以說單個goroutine是可以同時掛接到多個channel上的,甚至可以同時掛接到同一個channel的發送協程隊列和接收協程隊列上。當一個阻塞的goroutine拿到了數據接觸阻塞的時候,它會從所有相關的channel隊列中移除掉。
channel簡單規則表
下標的活躍Channel表示即非空又非關閉的Channel
channel規則詳細解釋
空channel
關閉一個空channel會導致當前goroutine引發panic
向一個空channel發送值會導致當前的goroutine阻塞
從一個空channel接收值也會導致當前的goroutine阻塞
在空channel上的調用len和cap函數都統一返回零。
已關閉的Channel
關閉一個已關閉的channel會引發panic
向一個已關閉的channel發送值會引發panic。當這種send操作處于select塊里面的case語句上時,它會隨時導致select語句引發panic。
從一個已關閉的channel上接收值既不會阻塞也不能panic,它一直能成功返回。只是返回的第二個值ok永遠是false,表示接收到的v是在channel關閉之后拿到的,對應得值也是相應元素類型的零值。可以無限循環從已關閉的channel上接收值。
活躍的Channel
關閉操作
從channel的接收協程隊列中移除所有的goroutine,并喚醒它們。
從channel的接收協程隊列中移除所有的goroutine,并喚醒它們。
一個已關閉的channel內部的緩沖數組可能不是空的,沒有接收的這些值會導致channel對象永遠不會被垃圾回收。
發送操作
如果是阻塞型channel,那就從channel的接收協程隊列中移出第一個協程,然后把發送的值直接遞給這個協程。
如果是阻塞型channel,并且channel的接收協程隊列是空的,那么當前的協程將會阻塞,并進入到channel的發送協程隊列里。
如果是緩沖型channel,并且緩沖數組里還有空間,那么將發送的值添加到數組最后,當前協程不阻塞。
如果是緩沖型channel,并且緩沖數組已經滿了,那么當前的協程將會阻塞,并進入到channel的發送協程隊列中。
接收操作
如果是緩沖型channel,并且緩沖數組有值,那么當前的協程不會阻塞,直接從數組中拿出第一個值。如果發送隊列非空,還需要將隊列中的第一個goroutine喚醒。
如果是阻塞型channel,并且發送隊列非空的話,那么喚醒發送隊列第一個協程,該協程會將發送的值直接遞給接收的協程。
如果是緩沖型channel,并且緩沖數組為空,或者是阻塞型channel,并且發送協程隊列為空,那么當前協程將會阻塞,并加入到channel的接收協程隊列中。
總結
根據以上規則,我們可以得出以下結論
如果channel關閉了,那么它的接收和發送協程隊列必然空了,但是它的緩沖數組可能還沒有空。
channel的接收協程隊列和緩沖數組,同一個時間必然有一個是空的
channel的緩沖數組如果未滿,那么它的發送協程隊列必然是空的
對于緩沖型channel,同一時間它的接收和發送協程隊列,必然有一個是空的
對于非緩沖型channel,一般來說同一時間它的接收和發送協程隊列,也必然有一個是空的,但是有一個例外,那就是當它的發送操作和接收操作在同一個select塊里出現的時候,兩個隊列都不是空的。
點擊查看英文版原文
閱讀更多相關文章,關注知乎專欄 【碼洞】