1、貝葉斯分類方法是統計學的分類方法,它利用概率統計知識預測給定元組屬于特定類的概率。
2、貝葉斯分類源于貝葉斯定理,最簡單的貝葉斯分類算法是樸素貝葉斯分類法。該方法雖然簡單,但是在實際應用上表現出了很高的準確率和效率,而且可以用到大型數據庫中。
3、我們先聊了解下貝葉斯定理是怎么一回事兒。
給出情景:有一批產品,在機器良好的時候生產產品合格的概率為70%,在機器故障的時候生產產品合格的概率為30%,機器良好的概率為60%,那么當我們生產出的產品合格時,機器良好的概率為多少?
1)先根據語句寫出已知條件:假設機器良好為A1,機器故障為A2,產品合格為B
? ? ? ?P(B|A1)=70%, P(B|A2)=30%,P(A1)=60%
2)可知先驗概率 ? A1:A2=60%:(1-60%)=6:4
? ? ? 似然函數 ? ? ? ?P(B|A1)=70%:P(B|A2)=30%=7:3
? ? ? 兩兩相乘得42:12
? ? ?42+12=54便是全概率公式計算出來的值
? ? ? 故而得出后驗概率為42/54=7/9
3)作圖來直面一下過程:(把先驗概率寫x向,證據因子寫y向)
4)貝葉斯定理公式:
5)并且,比值?P(B|A)/P(B)>1,意味著"先驗概率"被增強,事件A的發生的可能性變大;
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? =1,意味著B事件無助于判斷事件A的可能性;
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? <1,意味著"先驗概率"被削弱,事件A的可能性變小。
4、樸素貝葉斯分類有一個簡單的前提假設,即屬性之間是條件獨立的,也叫做類條件獨立性假設。
5、舉例說明
6、樸素貝葉斯的優缺點:
它的優勢在于它易于實現,而且在大多數情況下能夠獲得較好的分類準確率。劣勢在于它的類條件獨立性假設,如果數據的各個屬性之間有較強的依賴關系,那么樸素貝葉斯就不能取得較好的結果。
7、如何處理屬性之間的依賴關系呢?
貝葉斯信念網絡告訴你做人的道理~