分類--貝葉斯分類

1、貝葉斯分類方法是統計學的分類方法,它利用概率統計知識預測給定元組屬于特定類的概率。

2、貝葉斯分類源于貝葉斯定理,最簡單的貝葉斯分類算法是樸素貝葉斯分類法。該方法雖然簡單,但是在實際應用上表現出了很高的準確率和效率,而且可以用到大型數據庫中。

3、我們先聊了解下貝葉斯定理是怎么一回事兒。

給出情景:有一批產品,在機器良好的時候生產產品合格的概率為70%,在機器故障的時候生產產品合格的概率為30%,機器良好的概率為60%,那么當我們生產出的產品合格時,機器良好的概率為多少?

1)先根據語句寫出已知條件:假設機器良好為A1,機器故障為A2,產品合格為B

? ? ? ?P(B|A1)=70%, P(B|A2)=30%,P(A1)=60%

2)可知先驗概率 ? A1:A2=60%:(1-60%)=6:4

? ? ? 似然函數 ? ? ? ?P(B|A1)=70%:P(B|A2)=30%=7:3

? ? ? 兩兩相乘得42:12

? ? ?42+12=54便是全概率公式計算出來的值

? ? ? 故而得出后驗概率為42/54=7/9

3)作圖來直面一下過程:(把先驗概率寫x向,證據因子寫y向)

P(B|A1)=(70%X60%)/(70%X60%+30%X40%)=7/9

4)貝葉斯定理公式:

5)并且,比值?P(B|A)/P(B)>1,意味著"先驗概率"被增強,事件A的發生的可能性變大;

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? =1,意味著B事件無助于判斷事件A的可能性;

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? <1,意味著"先驗概率"被削弱,事件A的可能性變小。

4、樸素貝葉斯分類有一個簡單的前提假設,即屬性之間是條件獨立的,也叫做類條件獨立性假設。

5、舉例說明


一只大晚上懶得敲公式直接打的統計狗

6、樸素貝葉斯的優缺點:

它的優勢在于它易于實現,而且在大多數情況下能夠獲得較好的分類準確率。劣勢在于它的類條件獨立性假設,如果數據的各個屬性之間有較強的依賴關系,那么樸素貝葉斯就不能取得較好的結果。

7、如何處理屬性之間的依賴關系呢?

貝葉斯信念網絡告訴你做人的道理~

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容