隨機(jī)變量概述
隨機(jī)變量與事件
隨機(jī)變量的本質(zhì)是一種函數(shù)(映射關(guān)系),在古典概率模型中,“事件和事件的概率”是核心概念;但是在現(xiàn)代概率論中,“隨機(jī)變量及其取值規(guī)律”是核心概念。
隨機(jī)變量的分類
隨機(jī)變量從其可能取的值全體的性質(zhì)可以分為兩大類:離散型隨機(jī)變量和連續(xù)型隨機(jī)變量。
離散型隨機(jī)變量
離散型隨機(jī)變量的取值在整個(gè)實(shí)數(shù)軸上是間隔的,要么只有有限個(gè)取值,要么是無(wú)限可數(shù)的。
常見的離散型隨機(jī)變量包括以下幾種:
0-1分布(也叫兩點(diǎn)分布或伯努利分布,bernouli distribution)
又叫做0-1分布,指一次隨機(jī)試驗(yàn),結(jié)果只有兩種。也就是一個(gè)隨機(jī)變量的取值只有0和1。
最簡(jiǎn)單的例子就是,拋一次硬幣,預(yù)測(cè)結(jié)果為正還是反。二項(xiàng)分布(binomial distrubution)
表示n次伯努利實(shí)驗(yàn)的結(jié)果。
例子就是,求多次拋硬幣,預(yù)測(cè)結(jié)果為正面的次數(shù)。
P(X=0) = 1/32
P(X=1) = 5/32
P(X=2) = 10/32 = 5/16
P(X=3) = 10/32 = 5/16
P(X=4) = 5/32
P(X=5) = 1/32
這是隨機(jī)變量X 表示五次拋硬幣出現(xiàn)的正面的次數(shù);
二項(xiàng)分布的期望值公式:E(X) = np
-
幾何分布
幾何分布概率質(zhì)量函數(shù) 泊松分布
泊松分布就是描述某段時(shí)間內(nèi),事件具體的發(fā)生概率。
日常生活中,大量事件是有固定頻率的。
某醫(yī)院平均每小時(shí)出生3個(gè)嬰兒
某公司平均每10分鐘接到1個(gè)電話
某超市平均每天銷售4包xx牌奶粉
某網(wǎng)站平均每分鐘有2次訪問
它們的特點(diǎn)就是,我們可以預(yù)估這些事件的總數(shù),但是沒法知道具體的發(fā)生時(shí)間。
泊松分布的圖形大概是下面的樣子。
可以看到,在頻率附近,事件的發(fā)生概率最高,然后向兩邊對(duì)稱下降,即變得越大和越小都不太可能。
- 超幾何分布
一個(gè)袋子中有n個(gè)球,其中r個(gè)是黑球,n-r是白球,從袋中取出m個(gè)球,讓X表示取出球中的黑球的個(gè)數(shù),那么X是一個(gè)符合超幾何分布(hypergeometric distribution)的隨機(jī)變量。
連續(xù)型隨機(jī)變量
連續(xù)型隨機(jī)變量的取值要么包括整個(gè)實(shí)數(shù)集(?∞,+∞),要么在一個(gè)區(qū)間內(nèi)連續(xù),總之這類隨機(jī)變量的可能取值要比離散型隨機(jī)變量的取值多得多,它們的個(gè)數(shù)是無(wú)限不可數(shù)的。
常見的連續(xù)型隨機(jī)變量包括以下幾種:
-
均勻分布
均勻分布概率密度函數(shù) 指數(shù)分布
指數(shù)分布是事件的時(shí)間間隔的概率。下面這些都屬于指數(shù)分布。
嬰兒出生的時(shí)間間隔
來(lái)電的時(shí)間間隔
奶粉銷售的時(shí)間間隔
網(wǎng)站訪問的時(shí)間間隔
指數(shù)分布的公式可以從泊松分布推斷出來(lái)。
指數(shù)分布的圖形大概是下面的樣子。
可以看到,隨著間隔時(shí)間變長(zhǎng),事件的發(fā)生概率急劇下降,呈指數(shù)式衰減。
-
正態(tài)分布
正態(tài)分布是比較常見的,最常用的分布就是正態(tài)分布(normal distribution),也稱為高斯分布 (Gaussian distribution),譬如學(xué)生考試成績(jī)的人數(shù)分布等。
正太分布概率密度函數(shù)
隨機(jī)變量的基本性質(zhì)
隨機(jī)變量最主要的性質(zhì)是其所有可能取到的這些值的取值規(guī)律,即取到的概率大小。如果我們把一個(gè)隨機(jī)變量的所有可能的取值的規(guī)律都研究透徹了,那么這個(gè)隨機(jī)變量也就研究透徹了。隨機(jī)變量的性質(zhì)主要有兩類:一類是大而全的性質(zhì),這類性質(zhì)可以詳細(xì)描述所有可能取值的概率,例如累積分布函數(shù)和概率密度函數(shù);另一類是找到該隨機(jī)變量的一些特征或是代表值,例如隨機(jī)變量的方差或期望等數(shù)字特征。