在我的文本建模文集里面介紹過Unigram Model 模型,這種模型其實非常的簡單,這是因為簡單所以我才最先看,畢竟好容易理解嘛!(畢竟之前完全沒有接觸過,導師交代后才慢慢看論文看的...............本來想打滑稽臉的,但是簡書沒這個功能 手動流汗流汗中。。。。。。),但是這個模型太過理想化,和我們人類寫文章的思路差距有點大了,所以需要找更貼切的模型咯!
這里打算和大家分享一下PLSA??? 主題模型,這應該算是入門級的算法模型了,也算是比較經典的模型之一了。
以上PLSA模型的文檔生成過程就可以用圖形化的表示為