正文之前
上上周,終于被我們實(shí)驗(yàn)室的一個(gè)小老板收編了。后續(xù)應(yīng)該就是安安靜靜的當(dāng)一個(gè)搞研究的博士新人了。。暫定方向可能是下面三個(gè):
- 知識(shí)圖譜
- 自然語言處理
- 圖數(shù)據(jù)庫
加入了課題組的最大的改變,大概就是我的生活成了ddl驅(qū)動(dòng)式了。一周一次的組會(huì),兩周一次的匯報(bào)~ 簡直是達(dá)摩克利斯之劍,懸在頭上催著我奔走。不過昨兒個(gè)第一次匯報(bào),feel還不錯(cuò)~ 所以今兒個(gè)有時(shí)間來復(fù)興簡書了.
不過說真的,簡書現(xiàn)在都些什么鬼當(dāng)?shù)腊 !!M耆珱]有以前那種大家都在看的味道了。。本來帶點(diǎn)社交屬性還挺好,現(xiàn)在好了~全是賣課的。。。。烏煙瘴氣。。
正文
知識(shí)圖譜是什么?
知識(shí)圖譜是結(jié)構(gòu)化的語義知識(shí)庫,用于以符號(hào)形式描述物理世界的概念及其相互關(guān)系。基本組成單位是【實(shí)體--關(guān)系--實(shí)體】或者是【實(shí)體--屬性--屬性值】等三元組。實(shí)體之間通過關(guān)系相互鏈接,構(gòu)成網(wǎng)狀的知識(shí)結(jié)構(gòu)。
知識(shí)圖譜有什么作用?
知識(shí)圖譜最早被應(yīng)用于搜索引擎領(lǐng)域,Google公司為了提高用戶在搜索時(shí),搜索殷勤返回的答案質(zhì)量以及用戶查詢的效率,與2012年5月16日發(fā)不了第一版的知識(shí)圖譜。而后,在國內(nèi)外都有很多的效仿者開始進(jìn)入這個(gè)行業(yè)。
如今知識(shí)圖譜廣泛應(yīng)用于聊天機(jī)器人,推薦系統(tǒng)等方面,而在金融、農(nóng)業(yè)、電商、醫(yī)療健康、環(huán)境保護(hù)、工業(yè)制造場(chǎng)景等各種不同的垂直領(lǐng)域,得益于知識(shí)圖譜的先驗(yàn)知識(shí)的特性,均得到了廣泛的應(yīng)用。
說的抽象點(diǎn),知識(shí)圖譜就是把離散的符號(hào)表述,變成了連續(xù)的向量表示的巨大的知識(shí)網(wǎng)絡(luò)圖。
知識(shí)圖譜如何實(shí)現(xiàn)?
下面是技術(shù)架構(gòu)和工作流程,首先從各種數(shù)據(jù)源中得到我們想要的知識(shí)。然后經(jīng)過一定的處理得到知識(shí)表示。而我的主要兩個(gè)領(lǐng)域,我覺得,圖數(shù)據(jù)庫主要應(yīng)用于知識(shí)存儲(chǔ)方面,而NLP自然語言處理,則是主要作用于知識(shí)挖掘和后期的知識(shí)推理中。
經(jīng)過知識(shí)表示,進(jìn)入到知識(shí)融合。主要有實(shí)體對(duì)齊和知識(shí)加工部分,這兒昨天報(bào)告的時(shí)候老師還特地給我點(diǎn)正了。。感謝老師~
后面是質(zhì)量評(píng)估以及最終的知識(shí)圖譜應(yīng)用。我自己也不清楚,不多說了。
下面是我這陣子看教程、博客等地方的知識(shí)圖譜的思維導(dǎo)圖架構(gòu)。。肯定看不清楚的。。。所以。我就裝個(gè)比。。
資源描述框架RDF
這里我懶得多說了。。打字好辛苦,從ppt上復(fù)制來的都是圖片,見鬼了。。前面的字都是我一個(gè)個(gè)敲進(jìn)來的啊。。。我還要看論文。。不多費(fèi)時(shí)間了。。直接上圖。。力求高清。。
圖數(shù)據(jù)庫Neo4j
這玩意可真是個(gè)好東西。。當(dāng)然,我老師說這玩意也就給外行玩玩。主要是用戶友好,實(shí)際性能就。。反正意思就是。。我以后就玩玩就好,這東西深入不得。。畢竟是商業(yè)化的產(chǎn)品了。。
至于下頭的那個(gè)數(shù)據(jù),就是指一個(gè)人,要找到他的所有的某個(gè)深度(幾層關(guān)系)的朋友,在不同形式的數(shù)據(jù)庫下要多少時(shí)間。反正就說明圖數(shù)據(jù)庫的實(shí)用性吧
這是我自己瞎雞兒玩的東西
跟著例程跑的結(jié)果,你還別說,好看,好用。。雖然效率是硬傷
二三直接被老師建議pass了。。悲傷
正文之后
溜了溜了、、再看會(huì)論文找人吃東西去。。then happy time