概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)

隨機(jī)變量概述

隨機(jī)變量與事件

隨機(jī)變量的本質(zhì)是一種函數(shù)(映射關(guān)系),在古典概率模型中,“事件和事件的概率”是核心概念;但是在現(xiàn)代概率論中,“隨機(jī)變量及其取值規(guī)律”是核心概念。

隨機(jī)變量的分類

隨機(jī)變量從其可能取的值全體的性質(zhì)可以分為兩大類:離散型隨機(jī)變量和連續(xù)型隨機(jī)變量

離散型隨機(jī)變量

離散型隨機(jī)變量的取值在整個(gè)實(shí)數(shù)軸上是間隔的,要么只有有限個(gè)取值,要么是無(wú)限可數(shù)的。

離散型隨機(jī)變量的概率質(zhì)量分布函數(shù)

常見的離散型隨機(jī)變量包括以下幾種

  • 0-1分布(也叫兩點(diǎn)分布或伯努利分布,bernouli distribution)
    又叫做0-1分布,指一次隨機(jī)試驗(yàn),結(jié)果只有兩種。也就是一個(gè)隨機(jī)變量的取值只有0和1。
    最簡(jiǎn)單的例子就是,拋一次硬幣,預(yù)測(cè)結(jié)果為正還是反。

  • 二項(xiàng)分布(binomial distrubution)
    表示n次伯努利實(shí)驗(yàn)的結(jié)果。
    例子就是,求多次拋硬幣,預(yù)測(cè)結(jié)果為正面的次數(shù)。

P(X=0) =  1/32
P(X=1) =  5/32
P(X=2) = 10/32 = 5/16
P(X=3) = 10/32 = 5/16
P(X=4) =  5/32
P(X=5) =  1/32

這是隨機(jī)變量X 表示五次拋硬幣出現(xiàn)的正面的次數(shù);

二項(xiàng)分布的期望值公式:E(X) = np

二項(xiàng)分布的期望值
二項(xiàng)分布概率質(zhì)量函數(shù)
  • 幾何分布


    幾何分布概率質(zhì)量函數(shù)
  • 泊松分布
    泊松分布就是描述某段時(shí)間內(nèi),事件具體的發(fā)生概率
    日常生活中,大量事件是有固定頻率的。

某醫(yī)院平均每小時(shí)出生3個(gè)嬰兒
某公司平均每10分鐘接到1個(gè)電話
某超市平均每天銷售4包xx牌奶粉
某網(wǎng)站平均每分鐘有2次訪問

它們的特點(diǎn)就是,我們可以預(yù)估這些事件的總數(shù),但是沒法知道具體的發(fā)生時(shí)間。
泊松分布的圖形大概是下面的樣子。


泊松分布的圖形

poisson分布概率質(zhì)量函數(shù)

泊松分布與二項(xiàng)分布對(duì)比

可以看到,在頻率附近,事件的發(fā)生概率最高,然后向兩邊對(duì)稱下降,即變得越大和越小都不太可能。

  • 超幾何分布
    一個(gè)袋子中有n個(gè)球,其中r個(gè)是黑球,n-r是白球,從袋中取出m個(gè)球,讓X表示取出球中的黑球的個(gè)數(shù),那么X是一個(gè)符合超幾何分布(hypergeometric distribution)的隨機(jī)變量。

連續(xù)型隨機(jī)變量

連續(xù)型隨機(jī)變量的取值要么包括整個(gè)實(shí)數(shù)集(?∞,+∞),要么在一個(gè)區(qū)間內(nèi)連續(xù),總之這類隨機(jī)變量的可能取值要比離散型隨機(jī)變量的取值多得多,它們的個(gè)數(shù)是無(wú)限不可數(shù)的。

連續(xù)型隨機(jī)變量的概率密度分布函數(shù)

常見的連續(xù)型隨機(jī)變量包括以下幾種

  • 均勻分布


    均勻分布概率密度函數(shù)
  • 指數(shù)分布
    指數(shù)分布是事件的時(shí)間間隔的概率。下面這些都屬于指數(shù)分布。

嬰兒出生的時(shí)間間隔
來(lái)電的時(shí)間間隔
奶粉銷售的時(shí)間間隔
網(wǎng)站訪問的時(shí)間間隔

指數(shù)分布的公式可以從泊松分布推斷出來(lái)。
指數(shù)分布的圖形大概是下面的樣子。


指數(shù)分布的圖形

指數(shù)分布概率密度函數(shù)

可以看到,隨著間隔時(shí)間變長(zhǎng),事件的發(fā)生概率急劇下降,呈指數(shù)式衰減

  • 正態(tài)分布
    正態(tài)分布是比較常見的,最常用的分布就是正態(tài)分布(normal distribution),也稱為高斯分布 (Gaussian distribution),譬如學(xué)生考試成績(jī)的人數(shù)分布等。


    正太分布概率密度函數(shù)

隨機(jī)變量的基本性質(zhì)

隨機(jī)變量最主要的性質(zhì)是其所有可能取到的這些值的取值規(guī)律,即取到的概率大小。如果我們把一個(gè)隨機(jī)變量的所有可能的取值的規(guī)律都研究透徹了,那么這個(gè)隨機(jī)變量也就研究透徹了。隨機(jī)變量的性質(zhì)主要有兩類:一類是大而全的性質(zhì),這類性質(zhì)可以詳細(xì)描述所有可能取值的概率,例如累積分布函數(shù)和概率密度函數(shù);另一類是找到該隨機(jī)變量的一些特征或是代表值,例如隨機(jī)變量的方差或期望等數(shù)字特征。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。