在搞明白這三者的區(qū)別之前,我們來看一看下面的代碼
FYPerson *p1 = [FYPerson alloc];
FYPerson *p2 = [p1 init];
FYPerson *p3 = [p1 init];
FYNSLog(@"%@ - %p - %p",p1,p1,&p1);
FYNSLog(@"%@ - %p - %p",p2,p2,&p2);
FYNSLog(@"%@ - %p - %p",p3,p3,&p3);
分別輸出3個對象的內容
、對象指針指向的內存地址
、對象的指針地址
,下面是打印結果:
<FYPerson: 0x281adfe90> - 0x281adfe90 - 0x16f1b5c28
<FYPerson: 0x281adfe90> - 0x281adfe90 - 0x16f1b5c20
<FYPerson: 0x281adfe90> - 0x281adfe90 - 0x16f1b5c18
通過上面的打印結果,你可能會看出一些端倪:
三個對象指向的是同一塊內存空間
,所以內容和內存地址
是相同的,但是指針地址
是不同的
接下來,我們來探索alloc
、init
到底做了什么
準備工作
- 作為一個NB的程序員,一定要經(jīng)常去看底層源碼,這里我就以當前最新的objc4-781源碼為例來探索
- 編譯源碼可參考iOS-底層(3):objc4-781 源碼編譯及調試
alloc 源碼探索
alloc init流程圖
- 【第一步】首先根據(jù)main函數(shù)中的LGPerson類的alloc方法進入alloc方法的源碼實現(xiàn)(即源碼分析開始),
//alloc源碼分析-第一步
+ (id)alloc {
return _objc_rootAlloc(self);
}
- 【第二步】跳轉至_objc_rootAlloc的源碼實現(xiàn)
id
_objc_rootAlloc(Class cls)
{
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
- 【第三步】跳轉至callAlloc的源碼實現(xiàn)
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)// alloc 源碼 第三步
{
#if __OBJC2__ //有可用的編譯器優(yōu)化
/*
參考鏈接:http://www.lxweimin.com/p/536824702ab6
*/
// checkNil 為false,!cls 也為false ,所以slowpath 為 false,假值判斷不會走到if里面,即不會返回nil
if (slowpath(checkNil && !cls)) return nil;
//判斷一個類是否有自定義的 +allocWithZone 實現(xiàn),沒有則走到if里面的實現(xiàn)
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available. // 沒有可用的編譯器優(yōu)化
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
如上所示,在calloc方法中,當我們無法確定實現(xiàn)走到哪步時,可以通過斷點調試,判斷執(zhí)行走哪部分邏輯。這里是執(zhí)行到_objc_rootAllocWithZone
slowpath & fastpath
其中關于slowpath和fastpath這里需要簡要說明下,這兩個都是objc源碼中定義的宏,其定義如下
//x很可能為真, fastpath 可以簡稱為 真值判斷
#define fastpath(x) (__builtin_expect(bool(x), 1))
//x很可能為假,slowpath 可以簡稱為 假值判斷
#define slowpath(x) (__builtin_expect(bool(x), 0))
其中的__builtin_expect
指令是由gcc
引入的
1、目的:編譯器可以對代碼進行優(yōu)化,以減少指令跳轉帶來的性能下降。即性能優(yōu)化
2、作用:允許程序員將最有可能執(zhí)行的分支告訴編譯器。
3、指令的寫法為:__builtin_expect(EXP, N)
。表示 EXP==N
的概率很大。
4、fastpath定義中__builtin_expect((x),1)
表示 x
的值為真的可能性更大;即 執(zhí)行if
里面語句的機會更大
5、slowpath定義中的__builtin_expect((x),0)
表示x
的值為假的可能性更大。即執(zhí)行 else 里面語句的機會更大
6、在日常的開發(fā)中,也可以通過設置來優(yōu)化編譯器,達到性能優(yōu)化的目的,設置的路徑為:Build Setting --> Optimization Level --> Debug -->
將None
改為fastest
或者 smallest
cls->ISA()->hasCustomAWZ()
其中fastpath
中的cls->ISA()->hasCustomAWZ()
表示判斷一個類是否有自定義的 +allocWithZone
實現(xiàn),這里通過斷點調試,是沒有自定義的實現(xiàn),所以會執(zhí)行到 if 里面的代碼,即走到_objc_rootAllocWithZone
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
{
// allocWithZone under __OBJC2__ ignores the zone parameter
return _class_createInstanceFromZone(cls, 0, nil,
OBJECT_CONSTRUCT_CALL_BADALLOC);
}
- 【第四步】跳轉至
_objc_rootAllocWithZone
的源碼實現(xiàn)
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)// alloc 源碼 第四步
{
// allocWithZone under __OBJC2__ ignores the zone parameter
//zone 參數(shù)不再使用 類創(chuàng)建實例內存空間
return _class_createInstanceFromZone(cls, 0, nil,
OBJECT_CONSTRUCT_CALL_BADALLOC);
}
- 【第五步】跳轉至_class_createInstanceFromZone的源碼實現(xiàn),這部分是alloc源碼的核心操作,由下面的流程圖及源碼可知,該方法的實現(xiàn)主要分為三部分
- cls->instanceSize:計算需要開辟的內存空間大小
- calloc:申請內存,返回地址指針
- obj->initInstanceIsa:將 類 與 isa 關聯(lián)
static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
int construct_flags = OBJECT_CONSTRUCT_NONE,
bool cxxConstruct = true,
size_t *outAllocatedSize = nil)// alloc 源碼 第五步
{
ASSERT(cls->isRealized()); //檢查是否已經(jīng)實現(xiàn)
// Read class's info bits all at once for performance
//一次性讀取類的位信息以提高性能
bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
bool hasCxxDtor = cls->hasCxxDtor();
bool fast = cls->canAllocNonpointer();
size_t size;
//計算需要開辟的內存大小,傳入的extraBytes 為 0
size = cls->instanceSize(extraBytes);
if (outAllocatedSize) *outAllocatedSize = size;
id obj;
if (zone) {
obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
} else {
//申請內存
obj = (id)calloc(1, size);
}
if (slowpath(!obj)) {
if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
return _objc_callBadAllocHandler(cls);
}
return nil;
}
if (!zone && fast) {
//將 cls類 與 obj指針(即isa) 關聯(lián)
obj->initInstanceIsa(cls, hasCxxDtor);
} else {
// Use raw pointer isa on the assumption that they might be
// doing something weird with the zone or RR.
obj->initIsa(cls);
}
if (fastpath(!hasCxxCtor)) {
return obj;
}
construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
return object_cxxConstructFromClass(obj, cls, construct_flags);
}
我們看一下cls->instanceSize是如何計算的
1、instanceSize
的源碼實現(xiàn)
size_t instanceSize(size_t extraBytes) const {
//編譯器快速計算內存大小
if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
return cache.fastInstanceSize(extraBytes);
}
// 計算類中所有屬性的大小 + 額外的字節(jié)數(shù)0
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
//如果size 小于 16,最小取16
if (size < 16) size = 16;
return size;
}
2、跳轉至fastInstanceSize的源碼實現(xiàn),通過斷點調試,會執(zhí)行到align16
size_t fastInstanceSize(size_t extra) const
{
ASSERT(hasFastInstanceSize(extra));
//Gcc的內建函數(shù) __builtin_constant_p 用于判斷一個值是否為編譯時常數(shù),如果參數(shù)EXP 的值是常數(shù),函數(shù)返回 1,否則返回 0
if (__builtin_constant_p(extra) && extra == 0) {
return _flags & FAST_CACHE_ALLOC_MASK16;
} else {
size_t size = _flags & FAST_CACHE_ALLOC_MASK;
// remove the FAST_CACHE_ALLOC_DELTA16 that was added
// by setFastInstanceSize
//刪除由setFastInstanceSize添加的FAST_CACHE_ALLOC_DELTA16 8個字節(jié)
return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
}
}
3、align16
的源碼實現(xiàn),這個方法是16字節(jié)對齊算法
//16字節(jié)對齊算法,也就是16的倍數(shù)
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
內存字節(jié)對齊原則
數(shù)據(jù)成員對齊規(guī)則:struct 或者 union 的數(shù)據(jù)成員,第一個數(shù)據(jù)成員放在offset為0的地方,以后每個數(shù)據(jù)成員存儲的起始位置要從該成員大小或者成員的子成員大小(只要該成員有子成員,比如數(shù)據(jù)、結構體等)的整數(shù)倍開始(例如int在32位機中是4字節(jié),則要從4的整數(shù)倍地址開始存儲)
數(shù)據(jù)成員為結構體:如果一個結構里有某些結構體成員,則結構體成員要從其內部最大元素大小的整數(shù)倍地址開始存儲(例如:struct a里面存有struct b,b里面有char、int、double等元素,則b應該從8的整數(shù)倍開始存儲)
結構體的整體對齊規(guī)則:結構體的總大小,即sizeof的結果,必須是其內部做大成員的整數(shù)倍,不足的要補齊
為什么需要16字節(jié)對齊
需要字節(jié)對齊的原因,有以下幾點:
- 通常內存是由一個個字節(jié)組成的,cpu在存取數(shù)據(jù)時,并不是以字節(jié)為單位存儲,而是以塊為單位存取,塊的大小為內存存取力度。頻繁存取字節(jié)未對齊的數(shù)據(jù),會極大降低cpu的性能,所以可以通過減少存取次數(shù)來降低cpu的開銷
- 16字節(jié)對齊,是由于在一個對象中,第一個屬性isa占8字節(jié),當然一個對象肯定還有其他屬性,當無屬性時,會預留8字節(jié),即16字節(jié)對齊,如果不預留,相當于這個對象的isa和其他對象的isa緊挨著,容易造成訪問混亂
- 16字節(jié)對齊后,可以加快CPU讀取速度,同時使訪問更安全,不會產生訪問混亂的情況
calloc:申請內存,返回地址指針
通過instanceSize
計算的內存大小,向內存中申請 大小 為 size
的內存,并賦值給obj
,因此 obj
是指向內存地址的指針
obj = (id)calloc(1, size);
執(zhí)行完calloc之后,此時obj為0x000000010112efa0
,我們平時打印的指針為<FYPerson: 0x01111111f>這樣,因為現(xiàn)在obj地址和傳入的cls并沒有關聯(lián),由此可見calloc只是開辟內存
obj->initInstanceIsa:類與isa關聯(lián)
執(zhí)行完obj->initInstanceIsa
,我們在po一下obj,發(fā)現(xiàn)已經(jīng)將isa和類關聯(lián)。具體如何關聯(lián)請看iOS-底層(5):isa如何與類關聯(lián)
總結:
- 通過對alloc源碼的分析,可以得知alloc的主要目的就是開辟內存,而且開辟的內存需要使用16字節(jié)對齊算法,現(xiàn)在開辟的內存的大小基本上都是16的整數(shù)倍
- 開辟內存的核心步驟有3步:計算 -- 申請 -- 關聯(lián)
init 源碼探索
- inti的源碼實現(xiàn)有以下兩種
類方法 init
+ (id)init {
return (id)self;
}
這里的init是一個構造方法 ,是通過工廠設計(工廠方法模式),主要是用于給用戶提供構造方法入口。這里能使用id強轉的原因,主要還是因為 內存字節(jié)對齊后,可以使用類型強轉為你所需的類型
實例方法 init
- (id)init {
return _objc_rootInit(self);
}
id
_objc_rootInit(id obj)
{
// In practice, it will be hard to rely on this function.
// Many classes do not properly chain -init calls.
return obj;
}
返回的是傳入的self本身。
new 源碼探索
一般在開發(fā)中,初始化除了init,還可以使用new,兩者本質上并沒有什么區(qū)別,以下是objc中new的源碼實現(xiàn),通過源碼可以得知,new函數(shù)中直接調用了callAlloc函數(shù)(即alloc中分析的函數(shù)),且調用了init函數(shù),所以可以得出new 其實就等價于 [alloc init]的結論
+ (id)new {
return [callAlloc(self, false/*checkNil*/) init];
}
一般我們開發(fā)中不使用new,主要有因為:
在開發(fā)中我們經(jīng)常重寫init,而用new無法走到自己的init方法里面