Deep Learning - 第三章-概率論重要知識點復習-Deep Learning 讀書筆記

概率論

概率論為定量的描述不確定性提供了一個數學框架，伴隨而來的是一整套標準的的描述不確定性的定理和表示方式。通過概率論來定量描述不確定性，使得對于頻率和概率的描述不再因人而異，而是可以像程序語言一樣在不同的程序員和計算機之間可以準確的被傳遞和解釋，這使得我們在了解一個事件的時候，不會被“非常”，“相當”，“極其”... 等定性的描述語言所困惑。

在人工智能相關應用中要面臨很多的不確定性問題，在這個領域概率論主要應用在以下兩個方面：

需要算法可以基于目前呈現給它的信息根據概率理論進行推理
從業人員可以使用概率工具來分析人工智能系統的表現

頻率概率 frequentist probability：通過一個比率來描述一個或多個事件在多次重復實驗中發生的概率，例如在 10000 次鍵盤敲擊中，有多少次輸入由于沒有激發電容而導致輸入失敗。

貝葉斯概率 Bayesian probability：通過一個概率來給出一個事件屬于某一性質的置信程度 degree of belief，例如某個來訪的病人以多大的概率患有某種疾病。

隨機變量

隨機變量是一個可以隨機取得不同值的變量，在本書中隨機變量用不加任何修飾的小寫字母 x 來表示，其可能的取值用 x₁，x₂... x_n 來表示。當隨機變量的結果是一個向量時，用黑體小寫字母 x 表示，其可能的一個取值則用斜黑體字母表示 x。

隨機變量本身只是對變量的所有可能的取值狀態的一個描述，即 x = x_i，i =
1，... ，n。而對于隨機變量取得各個值的概率，則需要使用概率分布 Probability distributions 來描述。例如對于診斷一個疾病來說，診斷結果這個隨機變量最簡單的取值就是有（1）或沒有（0）某種疾病，而疾病發生的概率則需要采用概率分布來描述，例如如果流行病學數據統計發現患病率為 10%，則 P(1) = 10%, P(0) = 90%。

根據取值的分布情況，可以將隨機變量分為離散型隨機變量和連續性隨機變量，離散型隨機變量的取值是一個個獨立的分類或狀態，而連續性隨機變量的取值則是任意實數。基于取值情況的差異，離散型隨機變量和連續性隨機變量的概率分布情況也用不同的方式來描述。

概率分布

離散型隨機變量的概率分布用概率分布函數 Probability mass function，PMF 來表示，離散型隨機變量的概率分布函數用大寫斜體字母 P 表示。概率分布函數建立了一個從隨機變量取值到取得這個值的概率之間的一個函數關系：

這個函數的定義域 domain 是隨機變量的所有可能取值
對于任意一個取值來說，0 ≤ P(x_i) ≤ 1
對于所有取值來說，ΣP(x_i) = 1

連續性隨機變量的概率分布用概率密度函數 Probability density function，PDF 來表示，連續性隨機變量的概率密度函數用小寫斜體字母 p 來表示。概率密度函數在某個取值范圍內的積分代表隨機變量的取值在這個范圍內的概率。概率密度函數的要求如下：

這個函數的定義域 domain 是隨機變量的所有可能取值
對于任意一個取值來說，0 ≤ P(x_i) ，注意這里不需要 ≤ 1，并且在實際應用中，連續型隨機變量取得任意一個具體數值的概率都為 0
∫ p(x)dx = 1

邊緣概率 Marginal probability

有時我們知道了一組隨機變量的聯合概率分布情況，而如果想知道只沿著其中一個變量方向的概率變化情況，則需要使用邊緣概率分布。“邊緣概率”這個命名實際上來源于在紙面上手動計算概率分布的過程：如果在計算聯合概率分布時將所有 x 的取值作為行，將所有 y 的取值作為列，則 x 取某一特定值的概率將可以在行的右側邊緣加總得到。

對于離散型隨機變量，如果已知 P(x, y)，則 P(x = x_i) = Σ_yP(x=x_i,y=y_i)，即加總 x = x_i 時 y 沿 y 軸變化時的全部取值的概率
對于連續性隨機變量，上述計算需要改成 ∫ p(x, y)dy

條件概率 Conditional probability

在某隨機事件已發生的情況下，求另一個具有一定相關性的隨機事件發生的概率稱為條件概率，例如對于隨機變量 x, y，當 x 取 x_i 時，求 y 取 y_i 的概率，這一計算的數學表示及計算公式為：

P(y = y_i | x = x_i) = P(x = x_i, y = y_i) / P(x = x_i)

條件概率的鏈式法則

多維隨機變量的聯合概率分布可以分解為基于一個隨機變量的條件概率的形式，例如對于三個隨機變量：由于 P(a, b, c) = P(a| b, c)P(b, c)，而 P(b, c) = P(b| c)P(c)，因此 P(a, b, c) = P(a| b, c)P(b| c)P(c)。

獨立分布 Independence 和條件獨立 Conditional independence

如果對于兩個隨機變量 x，y, 如果對于其各自的任意取值，都有 P(x = x_i, y = y_i) = P(x = x_i)P(y = y_i)，則稱這兩個隨機變量 x，y 彼此獨立，記做 x ⊥ y
如果對于兩個隨機變量 x，y 和第三個隨機變量 z，如果對于x，y，z 各自的任意取值，都有 P(x = x_i, y = y_i | z = z_i ) = P(x = x_i | z = z_i)P(y = y_i | z = z_i)，則稱這兩個隨機變量 x，y 在給定隨機變量 z 下條件獨立，記做 x ⊥ y | z

期望 Expectation，方差 Variance 和協方差 Covariance

在一般性的期望、方差和協方差定義時，都討論的是隨機變量本身的期望、方差和協方差，這里作者直接討論的是隨機變量的函數的期望、方差和協方差。為了便于理解，一并給出隨機變量本身的期望、方差和協方差公式。

期望

隨機變量自身的期望計算公式為：

E_x = x? = Σx_i / n，其中 i = 1, ... , n

如果隨機變量 x 的概率分布為 P(x)，則對于 x 的一個函數 ?(x)，其在這個概率分布下的期望值記為 E_x~P[?(x)]，在不至混淆的情況下可以簡記為其計算方法為 E_x[?(x)]：

離散型隨機變量：E_x~P[?(x)] = ΣP(x)?(x)，即加總 x 所有可能取值的概率與相應取值下的 ?(x) 的乘積
連續型隨機變量：E_x~P[?(x)] = ∫P(x)?(x)dx

從計算可以看出，由于隨機變量的概率分布取值為一個標量，因此期望的計算是線性的，所以有：

E_x[α?(x) + βg(x)] = αE_x[?(x)] + βE_x[g(x)]

方差

方差則衡量的是隨機變量圍繞均值變化的離散程度，方差越小則分布越集中，其本質是一個期望值。隨機變量自身的方差計算公式為：

Var(x) = E[(x_i - x?)²] = Σ(x_i - x?)² / n ，其中 i = 1, ... , n

注意這個 n 是針對樣本的總體 Population 而言的，在實際計算中，我們計算的都是來自總體的部分樣本的方差，假設樣本的數量為 m，如果需要借此來估計總體的方差，則分母需要用 m - 1 做校正。其原因在于我們有理由相信樣本本身的分布相對總體來說會更加集中，因此可以將這個結果做一定程度的放大來逼近總體的方差值。方差的平方根稱為標準差 Standard deviation。

對于隨機變量的某個函數 ?(x) 來說，其方差則可以表示為 Var(?(x)) = E_x[(?(x) - E_x[?(x)])²]。

協方差

上述期望和方差的定義都是針對單一隨機變量的，而協方差衡量的是兩個隨機變量之間的線性相關性。

兩個隨機變量樣本集 x，y 的協方差計算公式為：

Cov(x, y) = Σ(x_i - x?)(y_i - y?) / n - 1，其中 i = 1, ... , n，n - 1 為考慮樣本集對于總體的一個校正

相應的隨機變量的函數 ?(x)，g(y) 的協方差計算公式為：

Cov(?(x), g(y)) = E[(?(x) - E[?(x)])(g(y) - E[g(y)])

從這個計算過程可知：

協方差的絕對值越大代表兩個變量圍繞各自均值同步偏離的程度越大，也即相關性越強
如果結果是正的，則代表兩個隨機變量的多個取值圍繞各自的均值總體上變化方向是一致的，即同時增加或減小，加總項中相同方向變化的項多于相反方向變化的項
如果結果是負值，則代表隨機變量的多個取值圍繞各自均值的變化方向總體上是相反的，加總項中常出現的是一個變量的取值在均值的一側，而另一個變量的取值在均值的另一側。這里還可以參考 GRAYLAMB的回答

協方差矩陣

當將多個隨機變量構成一個向量 x 時，可以通過計算這個向量中各個隨機變量之間的協方差，并構造一個協方差矩陣：Cov(x)_i,j = Cov(x_i, x_j)，這個矩陣的對角線上的元素為向量中各個隨機變量的方差，即 Cov(x_i, x_i) = Var(x_i)。

幾種常見的分布

正態分布 Normal distribution

中心極限定理 Central limit theorem：從總體中多次隨機抽取 n 個隨機變量并計算其均值，這些均值在 n 較大時呈正態分布。中心極限定理的另一個解讀方式是從總體中多次抽取 n 個隨機變量并求和，這個加總的值符合正態分布。

最后編輯于：2018.08.06 16:12:05

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 230,825評論 6贊 546
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 99,814評論 3贊 429
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 178,980評論 0贊 384
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 64,064評論 1贊 319
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 72,779評論 6贊 414
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 56,109評論 1贊 330
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 44,099評論 3贊 450
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 43,287評論 0贊 291
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 49,799評論 1贊 338
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 41,515評論 3贊 361
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 43,750評論 1贊 375
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 39,221評論 5贊 365
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,933評論 3贊 351
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 35,327評論 0贊 28
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 36,667評論 1贊 296
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 52,492評論 3贊 400
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 48,703評論 2贊 380

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

Deep Learning - 第三章-概率論重要知識點復習-Deep Learning 讀書筆記

Deep Learning - 第三章-概率論重要知識點復習-Deep Learning 讀書筆記

概率論

隨機變量

概率分布

邊緣概率 Marginal probability

條件概率 Conditional probability

條件概率的鏈式法則

獨立分布 Independence 和條件獨立 Conditional independence

期望 Expectation，方差 Variance 和協方差 Covariance

期望

方差

協方差

相關系數

協方差矩陣

幾種常見的分布

正態分布 Normal distribution

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

Deep Learning - 第三章-概率論重要知識點復習-Deep Learning 讀書筆記

概率論

隨機變量

概率分布

邊緣概率 Marginal probability

條件概率 Conditional probability

條件概率的鏈式法則

獨立分布 Independence 和條件獨立 Conditional independence

期望 Expectation，方差 Variance 和協方差 Covariance

期望

方差

協方差

相關系數

協方差矩陣

幾種常見的分布

正態分布 Normal distribution

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频