01 問題的引入:
在看《躍遷》這本書時,第二章講到冪律時,提到:
冪律分布的第一個特征,就是高度的不平均。
冪律的第二個重要特色,就是分形(fractual)。
作者對 冪律——分形 之間所做的關(guān)聯(lián)讓我本能的產(chǎn)生了好奇,準確地說是產(chǎn)生了疑問。
后來才發(fā)現(xiàn),之所產(chǎn)生疑問,是因為當(dāng)我看到下面這個“冪律分布函數(shù)”時,我腦海里出現(xiàn)的是一個指數(shù)函數(shù)的表達式!我把冪律分布和指數(shù)分布搞混淆了。
02 問題的求解過程:
我面對這個問題的第一反應(yīng)是:冪律、指數(shù)、分形,肯定都是源于數(shù)學(xué)的概念吧?!
回到最源頭,去找這幾個概念對應(yīng)的數(shù)學(xué)定義和數(shù)學(xué)表達式。
找到的比較有價值的資料有:
1.指數(shù)分布與冪律分布定義及不同(泊松分布、伽馬分布)
2.從盛極而衰的指數(shù)衰減律到冪律分布律——弱而不太衰的堅強少數(shù)派
回到我的思路:數(shù)學(xué)定義與數(shù)學(xué)表達式
1、定義(1)冪律分布(pow law distribution),其概率密度函數(shù)形式如下,這種分布的共性是絕大多數(shù)事件的規(guī)模很小,而只有少數(shù)事件的規(guī)模相當(dāng)大。
冪律分布的 概率密度函數(shù)其中x,y是正的隨機變量,c,r均為大于零的常數(shù)。
對上式兩邊取對數(shù),可知lny與lnx滿足線性關(guān)系lny=lnc-rlnx,也即在雙對數(shù)坐標下,冪律分布表現(xiàn)為一條斜率為冪指數(shù)的負數(shù)的直線,這一線性關(guān)系是判斷給定的實例中隨機變量是否滿足冪律的依據(jù)。判斷兩個隨機變量是否滿足線性關(guān)系,可以求解兩者之間的相關(guān)系數(shù);利用一元線性回歸模型和最小二乘法,可得lny對lnx的經(jīng)驗回歸直線方程,從而得到y(tǒng)與x之間的冪律關(guān)系式。
(2)指數(shù)分布
指數(shù)分布一個重要特征是無記憶性(Memoryless Property,又稱遺失記憶性)。這表示如果一個隨機變量呈指數(shù)分布,當(dāng)s,t>0時有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的壽命,已知元件使用了t小時,它總共使用至少s+t小時的條件概率,與從開始使用時算起它使用至少s小時的概率相等。其概率密度函數(shù)和分布函數(shù)如下:
指數(shù)分布的 概率密度函數(shù)λ > 0是分布的一個參數(shù),常被稱為率參數(shù)(rate parameter)。即每單位時間內(nèi)發(fā)生某事件的次數(shù)。指數(shù)分布的區(qū)間是[0,∞)。 如果一個隨機變量X呈指數(shù)分布,則可以寫作:X~ E(λ)
把兩種分布的概率密度表達式放在一起對比,就是根據(jù)其表達式的函數(shù)類型給起的名兒。
把他們畫在同一個線形坐標系,很像,難區(qū)分。但如果放到雙對數(shù)坐標系,很容易就區(qū)分開了。在雙對數(shù)坐標系里,冪律分布的曲線是一條直線。
可是,為什么冪律分布會具有分形的特點呢?(我的第六感)難道跟它在雙對數(shù)坐標系里是一條直線有關(guān)?
作者:彭鳴? ? ?鏈接:https://www.zhihu.com/question/19931652/answer/37261102
來源:知乎
分形圖形的基本特征是具有標度不變性。
即在使用不同的尺度下觀測分形圖形時所得到的結(jié)果是具有相似性的,分形圖形具有尺度上的對稱性。
這種特性表明,不同的尺度(大小)的同一種分形圖形之間具有某個共同的幾何參數(shù),即這一參數(shù)是一個與尺度大小無關(guān)的不變量,這個量就是分形集合中的分數(shù)維。
但是通常幾何體的維度一般是整數(shù)維度,比如一條直線的維度是1,一個平面的維度是2,一個立方體的維度是3。這種維度的定義可以這樣理解:在平面中有一個邊長為a的正方形,那么它的面積是a^2,如果將其邊長放大b倍,則新的正方形面積為(ab)^2,即在邊長放大b倍之后面積變?yōu)榱?b>b^2倍,占據(jù)原先圖形b^2的面積;同樣的如果是在空間中有一個邊長為a的立方體,其邊長放大b倍后得到的新立方體,體積為原來的b^3倍,占據(jù)相當(dāng)于b^3個原先的立方體疊放在一起的空間。
照這樣的理解,如果在D維空間中有一個幾何體,把其每個方向的長度都放大b倍后,得到的新幾何體的“體積”放大的倍數(shù)為:
那么對于分形圖形,具體舉個例子吧:
康托爾集合:
<img src="https://pic3.zhimg.com/50/b732894ab38c14f59e2922c054c9974e_hd.jpg" data-rawwidth="729" data-rawheight="118" class="origin_image zh-lightbox-thumb" width="729" data-original="https://pic3.zhimg.com/b732894ab38c14f59e2922c054c9974e_r.jpg">取一條線段,三等分后去掉中間一段,可以的到余下的兩段;再對于這兩段,同樣地去掉中間的1/3,每一段又能余下兩段,就成了一個四條線段組成的圖形,如此循環(huán)下去,無窮多次以后,最終能得到一個只由點組成的集合(到最后分得只剩下點了*^__^*)。
取一條線段,三等分后去掉中間一段,可以的到余下的兩段;再對于這兩段,同樣地去掉中間的1/3,每一段又能余下兩段,就成了一個四條線段組成的圖形,如此循環(huán)下去,無窮多次以后,最終能得到一個只由點組成的集合(到最后分得只剩下點了*^__^*)。
對于這樣的一個集合,若取如圖所示長度內(nèi)的這樣一個點集的圖形,將它放大3倍以后,只能得到相當(dāng)于兩個原來的圖形大小的新圖形,那么這個分形的維度就是:
其它分形圖形的維度也可由類似的方法得到。
好像真的是這樣!
所以,冪律分布曲線的【分形維數(shù)】= ln y/ln x = r ?
因為只有從它的表達式才可以推導(dǎo)出【分形維數(shù)】是一個常量!指數(shù)函數(shù)就做不到!
03 此次思考的結(jié)論
最后的結(jié)論好像是說服了我自己。
要驗證這個結(jié)論是否正確,改天可以找時間做如下嘗試:按照這個邏輯再推導(dǎo)出幾個結(jié)論,或者按照這個規(guī)律自己造幾個符合此規(guī)律的函數(shù),然后作圖,看看這些圖形效果是不是真的具有“分形”的特點。
收獲:加深了對冪律分布、分形的了解,進一步區(qū)分了一些基本概念,比如[冪函數(shù)、指數(shù)函數(shù)]? 與? [ 冪律分布函數(shù)、指數(shù)分布函數(shù) ]完全是分屬兩套系統(tǒng)的不同概念,雖然有一定關(guān)聯(lián),但內(nèi)涵大不相同,不能簡單將它們按照字面意思進行粗暴連接。