原文鏈接:
http://blog.csdn.net/itplus/article/details/37969817
感謝作者高質(zhì)量文章。
word2vec 是 Google 于 2013 年開源推出的一個(gè)用于獲取 word vector 的工具包,它簡(jiǎn)單、高效,因此引起了很多人的關(guān)注。由于 word2vec 的作者 Tomas Mikolov 在兩篇相關(guān)的論文 [3,4] 中并沒有談及太多算法細(xì)節(jié),因而在一定程度上增加了這個(gè)工具包的神秘感。一些按捺不住的人于是選擇了通過解剖源代碼的方式來(lái)一窺究竟,出于好奇,我也成為了他們中的一員。讀完代碼后,覺得收獲頗多,整理成文,給有需要的朋友參考。
相關(guān)鏈接
(一)目錄和前言
(二)預(yù)備知識(shí)
(三)背景知識(shí)
(四)基于 Hierarchical Softmax 的模型
(五)基于 Negative Sampling 的模型
(六)若干源碼細(xì)節(jié)
作者: peghoty
出處: http://blog.csdn.net/itplus/article/details/37969635
歡迎轉(zhuǎn)載/分享, 但請(qǐng)務(wù)必聲明文章出處.