冪律分布與指數(shù)分布、冪律與分形

01 問題的引入:

在看《躍遷》這本書時,第二章講到冪律時,提到:

冪律分布的第一個特征,就是高度的不平均。

冪律的第二個重要特色,就是分形(fractual)。

作者對 冪律——分形 之間所做的關(guān)聯(lián)讓我本能的產(chǎn)生了好奇,準確地說是產(chǎn)生了疑問。

后來才發(fā)現(xiàn),之所產(chǎn)生疑問,是因為當(dāng)我看到下面這個“冪律分布函數(shù)”時,我腦海里出現(xiàn)的是一個指數(shù)函數(shù)的表達式!我把冪律分布和指數(shù)分布搞混淆了。

冪律分布(長尾分布)

02 問題的求解過程:

我面對這個問題的第一反應(yīng)是:冪律、指數(shù)、分形,肯定都是源于數(shù)學(xué)的概念吧?!

回到最源頭,去找這幾個概念對應(yīng)的數(shù)學(xué)定義和數(shù)學(xué)表達式。

找到的比較有價值的資料有:

1.指數(shù)分布與冪律分布定義及不同(泊松分布、伽馬分布)

2.從盛極而衰的指數(shù)衰減律到冪律分布律——弱而不太衰的堅強少數(shù)派

回到我的思路:數(shù)學(xué)定義與數(shù)學(xué)表達式

1、定義(1)冪律分布(pow law distribution),其概率密度函數(shù)形式如下,這種分布的共性是絕大多數(shù)事件的規(guī)模很小,而只有少數(shù)事件的規(guī)模相當(dāng)大。

冪律分布的 概率密度函數(shù)

其中x,y是正的隨機變量,c,r均為大于零的常數(shù)。

對上式兩邊取對數(shù),可知lny與lnx滿足線性關(guān)系lny=lnc-rlnx,也即在雙對數(shù)坐標下,冪律分布表現(xiàn)為一條斜率為冪指數(shù)的負數(shù)的直線,這一線性關(guān)系是判斷給定的實例中隨機變量是否滿足冪律的依據(jù)。判斷兩個隨機變量是否滿足線性關(guān)系,可以求解兩者之間的相關(guān)系數(shù);利用一元線性回歸模型和最小二乘法,可得lny對lnx的經(jīng)驗回歸直線方程,從而得到y(tǒng)與x之間的冪律關(guān)系式。

(2)指數(shù)分布

指數(shù)分布一個重要特征是無記憶性(Memoryless Property,又稱遺失記憶性)。這表示如果一個隨機變量呈指數(shù)分布,當(dāng)s,t>0時有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的壽命,已知元件使用了t小時,它總共使用至少s+t小時的條件概率,與從開始使用時算起它使用至少s小時的概率相等。其概率密度函數(shù)和分布函數(shù)如下:

指數(shù)分布的 概率密度函數(shù)

λ > 0是分布的一個參數(shù),常被稱為率參數(shù)(rate parameter)。即每單位時間內(nèi)發(fā)生某事件的次數(shù)。指數(shù)分布的區(qū)間是[0,∞)。 如果一個隨機變量X呈指數(shù)分布,則可以寫作:X~ E(λ)

把兩種分布的概率密度表達式放在一起對比,就是根據(jù)其表達式的函數(shù)類型給起的名兒。

把他們畫在同一個線形坐標系,很像,難區(qū)分。但如果放到雙對數(shù)坐標系,很容易就區(qū)分開了。在雙對數(shù)坐標系里,冪律分布的曲線是一條直線。

可是,為什么冪律分布會具有分形的特點呢?(我的第六感)難道跟它在雙對數(shù)坐標系里是一條直線有關(guān)?

作者:彭鳴? ? ?鏈接:https://www.zhihu.com/question/19931652/answer/37261102

來源:知乎

分形圖形的基本特征是具有標度不變性

即在使用不同的尺度下觀測分形圖形時所得到的結(jié)果是具有相似性的,分形圖形具有尺度上的對稱性。

這種特性表明,不同的尺度(大小)的同一種分形圖形之間具有某個共同的幾何參數(shù),即這一參數(shù)是一個與尺度大小無關(guān)的不變量,這個量就是分形集合中的分數(shù)維

但是通常幾何體的維度一般是整數(shù)維度,比如一條直線的維度是1,一個平面的維度是2,一個立方體的維度是3。這種維度的定義可以這樣理解:在平面中有一個邊長為a的正方形,那么它的面積是a^2,如果將其邊長放大b倍,則新的正方形面積為(ab)^2,即在邊長放大b倍之后面積變?yōu)榱?b>b^2倍,占據(jù)原先圖形b^2的面積;同樣的如果是在空間中有一個邊長為a的立方體,其邊長放大b倍后得到的新立方體,體積為原來的b^3倍,占據(jù)相當(dāng)于b^3個原先的立方體疊放在一起的空間。

照這樣的理解,如果在D維空間中有一個幾何體,把其每個方向的長度都放大b倍后,得到的新幾何體的“體積”放大的倍數(shù)為:

那么對于分形圖形,具體舉個例子吧:

康托爾集合:

<img src="https://pic3.zhimg.com/50/b732894ab38c14f59e2922c054c9974e_hd.jpg" data-rawwidth="729" data-rawheight="118" class="origin_image zh-lightbox-thumb" width="729" data-original="https://pic3.zhimg.com/b732894ab38c14f59e2922c054c9974e_r.jpg">取一條線段,三等分后去掉中間一段,可以的到余下的兩段;再對于這兩段,同樣地去掉中間的1/3,每一段又能余下兩段,就成了一個四條線段組成的圖形,如此循環(huán)下去,無窮多次以后,最終能得到一個只由點組成的集合(到最后分得只剩下點了*^__^*)。

取一條線段,三等分后去掉中間一段,可以的到余下的兩段;再對于這兩段,同樣地去掉中間的1/3,每一段又能余下兩段,就成了一個四條線段組成的圖形,如此循環(huán)下去,無窮多次以后,最終能得到一個只由點組成的集合(到最后分得只剩下點了*^__^*)。

對于這樣的一個集合,若取如圖所示長度內(nèi)的這樣一個點集的圖形,將它放大3倍以后,只能得到相當(dāng)于兩個原來的圖形大小的新圖形,那么這個分形的維度就是:

其它分形圖形的維度也可由類似的方法得到。

好像真的是這樣!

所以,冪律分布曲線的【分形維數(shù)】= ln y/ln x = r ?

因為只有從它的表達式才可以推導(dǎo)出【分形維數(shù)】是一個常量!指數(shù)函數(shù)就做不到!


03 此次思考的結(jié)論

最后的結(jié)論好像是說服了我自己。

要驗證這個結(jié)論是否正確,改天可以找時間做如下嘗試:按照這個邏輯再推導(dǎo)出幾個結(jié)論,或者按照這個規(guī)律自己造幾個符合此規(guī)律的函數(shù),然后作圖,看看這些圖形效果是不是真的具有“分形”的特點。

收獲:加深了對冪律分布、分形的了解,進一步區(qū)分了一些基本概念,比如[冪函數(shù)、指數(shù)函數(shù)]? 與? [ 冪律分布函數(shù)、指數(shù)分布函數(shù) ]完全是分屬兩套系統(tǒng)的不同概念,雖然有一定關(guān)聯(lián),但內(nèi)涵大不相同,不能簡單將它們按照字面意思進行粗暴連接。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容

  • 原作者:張江作者簡介:北京師范大學(xué)系統(tǒng)科學(xué)學(xué)院副教授張江原發(fā)平臺:混沌巡洋艦微信二維碼微信號:chaoscruis...
    星辰進取號閱讀 18,538評論 6 31
  • 陌生的城市,陌生的路邊, 一對年輕的情侶有些纏綿。 他們走進路邊的咖啡館, 里面的燈光有些繾綣。 咖啡的香氣氤氳彌...
    腦洞少年閱讀 199評論 0 1
  • 花飛花謝花滿天,紅消香斷有誰憐? 自古情人終成侶,為何獨留我一人? 可悲可嘆人生淚,滿紙荒唐淚無言 最恨世間離別難...
    日晨閱讀 183評論 0 0
  • 人物介紹 女主1:姓名:宋晨星-星兒 性別:女(不用說應(yīng)該也知道吧) 性...
    草莓味的小仙女mua閱讀 161評論 0 1
  • 還記得朗讀者里那個寫給叛逆兒子一封信的麥家嗎?我也是從那刻起知道了麥家老師,認知了這位曾獲得茅盾文學(xué)獎的作家。再次...
    永遠眼眶濕潤閱讀 361評論 0 2