前言
要探索Block前先說一下我對Block的理解,我把它理解為:能夠捕獲它所在函數內部的變量的函數指針、匿名函數或者閉包。注意紅色部份說的是它的精髓所在。希望看我這篇文章的人能夠跟我說的步驟去做,做起來也比較簡單,基本上是手把手,這樣會有更好的效果,更深刻,當然如果只看文章就能夠讓讀者明白,那是我更加希望的。
一、首先,我們準備一個.m文件。我這里是main.m。內容如下:
int main(int argc, char * argv[]) {
void (^test)() = ^(){
};
test();
}
接下來我要用到一個命令clang src.m -rewrite-objc -o dest.cpp.這個意思是用clang編譯器對源文件src.m中的objective-c代碼轉換成C代碼放在dest.cpp文件。其實xode編譯時也會幫我們轉換。我們這樣就可以dest.cpp在看到我們定義和調用的block轉換成C是怎么樣的。執行命令后查看這個dest.cpp會發現有一大堆代碼。下面我把對我們有用并能夠說清楚原理的關鍵貼上來并加以注釋:
//__block_imp: 這個是編譯器給我們生成的結構體,每一個block都會用到這個結構體
struct __block_impl {
void *isa; //對于本文可以忽略
int Flags; //對于本文可以忽略
int Reserved; //對于本文可以忽略
void *FuncPtr; //函數指針,這個會指向編譯器給我們生成的下面的靜態函數__main_block_func_0
};
/*__main_block_impl_0:
是編譯器給我們在main函數中定義的block
void (^test)() = ^(){
};
生成的對應的結構體
*/
struct __main_block_impl_0 {
struct __block_impl impl; //__block_impl 變量impl
struct __main_block_desc_0* Desc; //__main_block_desc_0 指針,指向編譯器給我們生成的結構體變量__main_block_desc_0_DATA __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) { //結構體的構造函數
impl.isa = &_NSConcreteStackBlock; //說明block是棧blockimpl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;}};
//__main_block_func_0:
編譯器根據block代碼生成的全局態函數,會被賦值給impl.FuncPtr
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
}
//__main_block_desc_0: 編譯器根據block代碼生成的block描述,主要是記錄下__main_block_impl_0結構體大小
static struct __main_block_desc_0 {
size_t reserved;
size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)}; //這里就生成了__main_block_desc_0的變量__main_block_desc_0_DATA
//這里就是main函數了
int main(int argc, char * argv[]) {
void (*test)() = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA)); //下面單獨講
((void (*)(__block_impl *))((__block_impl *)test)->FuncPtr)((__block_impl *)test); //下面單獨講
}
what the hell is that!!!! 沒錯,這也是我一開始看到這堆東西的感受。因為很多人講Block原理都貼這個而且沒有注釋或很少注釋,我也從網上搜出來看了幾個。接下來就要說明白這堆代碼。一定要有耐心,首先,對著上面代碼注釋過幾遍main函數前系統給我們生成的這些結構體函數之間的關系,如果一次能明白自然是好,過了幾遍都沒明白也沒關系,但如果不明一定回頭要再理清。
回歸一開始我對block的理解,先忽略它能夠捕獲所在函數內部的變量,那么它就是一個函數指。
void (^test)() = ^(){
};
就對應著
void (*test)() = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
這個總的來說就是定義一個函數指針指向一個地址,但是這個地址并不是我樣平常的函數的入口地址
轉換后代碼的要一段段從后往前組合分析:
__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA))就是創建了一個__main_block_impl_0結構體的一個實例
&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA))取這個實例的地址
((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA))把實例地址強轉為一個函數地址
void (*test)() = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
那么這整句就是說定義一個函數指針指向一個新創建的__main_block_impl_0實例的地址。注意創建這個實例時構選函數傳的兩個參數,
正是編譯器幫我們生成的靜態函數__main_block_func_0及__main_block_desc_0的變量__main_block_desc_0_DATA
test();
對應著
((void (*)(__block_impl *))((__block_impl *)test)->FuncPtr)((__block_impl *)test);
總的來說意思就是通過函數指針test調用函數FnucPtr,傳的參數為指針test本身。
雖然能夠理解這句的意思,但這里有點隱晦,還是要進行說明一下
1、調用時不是應該這樣調才對嗎 test(test它指向__main_block_impl_0)->impl.FuncPtr,其實它跟((__block_impl *)test)->FuncPtr)是同等作用。
2、FuncPtr(即__main_block_func_0)的參數類型不是__main_block_impl_0 ,為什么clang編譯出來后是__block_impl。其實這里不管類型是什么,它還是傳了test作為參數進去,所是不會有錯的。
好了講到這里,就可以進行一個中途簡單性的總結:忽略中間的復雜分支,留下主線,當我們聲明一個block變量a并為它賦值時,其實就是創建一個函數指針ptrA,再根據block a賦值的代碼生成一個靜態函數,而指針ptrA就指向這個靜態函數。block a調用時就是使用函數指ptrA調用生成的靜態函數。
講到這里第一部分就結束了,接下來進行第二部分。
二、這部分就要開始講精髓的部分,捕獲它所在函數內部的變量,接下來的部分都不會像第一部分那樣寫那么詳細的注釋,只會在關鍵和不一樣的地方加上注釋。并且通過觀看不同變化,從實踐中得出結論并明白它實現原理。即然要說捕獲它所在函數內部的變量,那么接下來我們就把main.m修改一下,加個變量(基本類型變量)唄。代碼變成這樣:
int main(int argc, char * argv[]) {
int value = 1;
void (^test)() = ^(){
int valueTest = value;
};
test();
}
那么經過clang轉換之后會變成這樣, 與第一部份不一樣的地方我會把它變成粗體,仔細對比第一部分并思考,應該不難理解。
struct __block_impl {
void *isa;
int Flags;
int Reserved;
void *FuncPtr;
};
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
int value;
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _value, int flags=0) : value(_value) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
int value = __cself->value; // bound by copy
int valueTest = value;
}
static struct __main_block_desc_0 {
size_t reserved;
size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
int main(int argc, char * argv[]) {
int value = 1;
void (*test)() = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, value));
((void (*)(__block_impl *))((__block_impl *)test)->FuncPtr)((__block_impl *)test);
}
首先我們可以看到的變化點有:1、__main_block_impl_0結構體中多了個value,其實它就是用來保存main函數中的value,還有它的構造函數多了一個參數2、__main_block_func_0這個函數的實現會新增一個變量value并被賦值。
從對比中我們可以知道,變量其實是在構造__main_block_impl_0實例時傳進去了并被保存,當回調時通過把test(其實就是指向一個__main_block_impl_0實例)作為參數傳進來,通過它拿到了變量。這樣就實現了捕獲局部變量。當block要捕獲多個變量時會是怎么的呢?其實不難猜,有N個變量要被捕__main_block_impl_0結構體中就會有N個變量用于保存,它的構造函數就會有N個參數是用來傳這N個變量進來保存。回調時通過test(指向__main_block_impl_0實例)一一拿到。這里就不貼代碼了,有興趣可以自己驗證一下。
原來捕獲函數內部變量其實就是這樣實現的呀。有了上面的基礎,你是否會想那么__block修飾的變量是怎么樣的?變量是個NSObject對象是怎么樣的?
回調傳參又是怎么樣的?還有人們經常說的對self的引用什么的會是怎么樣?接下來就進入第三部分。有了前面兩部份的基礎,后面的基本就是看代碼得結論,會少很多文字說明了。所以前面兩部份一定要理解好。
三、 在寫這部份前想著,不就像前面一樣用clang一下,對比一下代碼就可以知道了嗎。先來簡單一點的。
(1)帶有參數和返回值的block.
把main.m改成這樣
int main(int argc, char * argv[]) {
int (^test)(int a) = ^(int a){
return a;
};
test(1);
}
接著它轉換后的:
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
static int __main_block_func_0(struct __main_block_impl_0 *__cself, int a) {
return a;
}
static struct __main_block_desc_0 {
size_t reserved;
size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
int main(int argc, char * argv[]) {
int (*test)(int a) = ((int (*)(int))&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
((int (*)(__block_impl *, int))((__block_impl *)test)->FuncPtr)((__block_impl *)test, 1);
}
這里應該沒什么難度,不難理解,就是__main_block_func_0函數多了個參數和返回值,就不細說了。
(2)加上了__block修飾符的基本變量時:
把main.m代碼改成這樣:
int main(int argc, char * argv[]) {
__block int value = 1;
void (^test)() = ^(){
value = 2;
};
test();
int value1 = value;
}
轉換后就變成:(接下來會稍微有點復雜,不要緊,只要耐心點也是可以明白的)
//這個是導出的一些接口,用于管理__block變量value內存的一些接口
extern "C" __declspec(dllexport) void _Block_object_assign(void *, const void *, const int);
extern "C" __declspec(dllexport) void _Block_object_dispose(const void *, const int);
//根據帶__block修飾符的變量value,編譯器給我們生成了個結構體
struct __Block_byref_value_0 {
void *__isa;
__Block_byref_value_0 *__forwarding; //這個會指向被創建出來的__Block_byref_value_0實例
int __flags;
int __size;
int value;
};
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
__Block_byref_value_0 *value; //保存__Block_byref_value_0變量
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_value_0 *_value, int flags=0) : value(_value->__forwarding) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
__Block_byref_value_0 *value = __cself->value; // bound by ref
(value->__forwarding->value) = 2;
}
//這兩個函數分別會在test block 被拷貝到堆和釋構時調用的,作用是對__Block_byref_value_0實例的內存進行管理,至于怎么管理,這里就不討論了,這里就會調用上面導出來的接口。
static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->value, (void*)src->value, 8/*BLOCK_FIELD_IS_BYREF*/);}
static void __main_block_dispose_0(struct __main_block_impl_0*src) {_Block_object_dispose((void*)src->value, 8/*BLOCK_FIELD_IS_BYREF*/);}
static struct __main_block_desc_0 {
size_t reserved;
size_t Block_size;
void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*); //回調函數指針,會被賦值為__main_block_copy_0
void (*dispose)(struct __main_block_impl_0*); //回調函數指針,會被賦值為__main_block_dispose_0
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0}; /*{ 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0},這句就是創建一個例的意思,這是結構體的一種構造方式。*/
int main(int argc, char * argv[]) {
/*我們定義的__block int value轉換后并不是一個簡單的棧變量,而會是新建的__Block_byref_value_0堆變量*/
__attribute__((__blocks__(byref))) __Block_byref_value_0 value = {(void*)0,(__Block_byref_value_0 *)&value, 0, sizeof(__Block_byref_value_0), 1};
void (*test)() = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_value_0 *)&value, 570425344));
((void (*)(__block_impl *))((__block_impl *)test)->FuncPtr)((__block_impl *)test);
//最后面使這句int value1 = value;使用value時,在我們表面看到是好像是使用main函數里的一個局部棧變量,其實不是,使用的是堆里面的容int value1 = (value.__forwarding->value);
}
從代碼里的注釋再加上前面兩部份這講解,應該是可以看明白這段代碼的。簡單做個說明:一開始我會猜想__block修飾的變量的值能在block代碼塊中被修改,不就是在第二部分中的傳一個變量值變成傳這個變量的地址進去嗎?其實這樣是有問題的,要明白如果這樣,就是相當是傳了一個棧變量的地址進去,函數結束這個地址就不可用了,編譯器才會給我們創建一個新的結構__Block_byref_value_0
小結:
本文是我在學習block的過程中,通過看別人文章,源碼并自己親自己動手實踐得出來的結果,宗旨是讓大家更容易明白block的底層實現原理。