第二章 概率介紹
在本章中,我們描述了一個緊湊的概率論知識。每一個很細微的想法,單獨來看每個都比較簡單。然而,它們結合起來在描述不確定性的問題上變得強大。
2.1 隨機變量
隨機變量X表示一個不確定的量。變量可以表示實驗的結果,如硬幣的正反面,也可以表示為現實世界實際測量的一個波動特性(如氣溫的變化)。如果我們考慮許多實例{Xi}(共 I 個)那么每次它們都可能具有不同的值。然而,一些值可能比另一些值更加容易出現,隨機變量X的概率分布Pr(X)決定。(注:Pr = Probability)。
隨機變量有兩種,離散的(discrete)和連續的(continuous) ,離散的變量從定義好的集合中取值。可能是你扔一個骰子,結果在1-6中取值,也可能是預測天氣,在“晴天”,“雨天”,“雪天”之間抉擇。離散集可能是有限的,如52張撲克牌,也可能是無限的,自然數集合中取一個數。離散變量的概率分布可以表示為圖2-1所示的直方圖或Hinton圖。每個結果都具有與之相關的積極概率,并且所有結果的概率之和始終為一。? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
連續型隨機變量從實數值中取值。隨機變量的值可能是有限的,例如完成限時兩小時的考試的總時間在0-2小時之間;或者無限的,你不知道下一輛公交車到達的世界,可以在整個實數范圍內定義無限變量,或者限制在某個值之間。
可以通過繪制概率函數(pdf)的方式來可視化連續形變量的概率分布。如圖2.2所示,概率密度的分布表示隨機變量取某個值的相對的傾向。然而,無論概率函數如何,對概率函數整體積分的結果永遠為1.