文本相似性的應(yīng)用場景會(huì)有很多,在工業(yè)界我粗略遇到過: 熱點(diǎn)做輿情識(shí)別監(jiān)控的時(shí)候,需要對(duì)全網(wǎng)文章進(jìn)行聚合,聚合過程中需要知道哪些文章是一致的 推薦...

文本相似性的應(yīng)用場景會(huì)有很多,在工業(yè)界我粗略遇到過: 熱點(diǎn)做輿情識(shí)別監(jiān)控的時(shí)候,需要對(duì)全網(wǎng)文章進(jìn)行聚合,聚合過程中需要知道哪些文章是一致的 推薦...
1 HMM模型 馬爾科夫過程: 以天氣判斷為例:引出隱馬爾科夫模型image.pngimage.png 以天氣判斷為例:由海藻信息推測天氣 于是...
前言 在自然語言處理領(lǐng)域,我們有一種類型的問題是如何在一堆文本中提取出核心詞/句子。而無論是對(duì)于長文本還是短文本,往往幾個(gè)關(guān)鍵詞就可以代表整個(gè)文...
更多來自于GitHub:Reflection_Summary. Bert的雙向體現(xiàn)在什么地方? mask+attention,mask的word...
前言 最近在看AutoML,業(yè)界在 automl 上的進(jìn)展還是很不錯(cuò)的,個(gè)人比較看好這個(gè)方向,所以做了一些了解: Google: Cloud A...
本系列為深入篇,盡可能完善專題知識(shí),并不會(huì)所有的都會(huì)出現(xiàn)在面試中,更多內(nèi)容,詳見:Reflection_Summary,歡迎交流。 另外,歡迎大...
本系列為深入篇,盡可能完善專題知識(shí),并不會(huì)所有的都會(huì)出現(xiàn)在面試中,更多內(nèi)容,詳見:Reflection_Summary,歡迎交流。 另外,歡迎大...
本文主要用于理解主題模型LDA(Latent Dirichlet Allocation)其背后的數(shù)學(xué)原理及其推導(dǎo)過程。本菇力求用簡單的推理來論證...
我們搞了個(gè)python的工具包PyTls。 做這件事的初衷是發(fā)生了一個(gè)星期要用python同時(shí)開發(fā)3個(gè)項(xiàng)目的情況,我發(fā)現(xiàn)了兩個(gè)現(xiàn)象:1.有很多定...
一臺(tái)電腦, 多個(gè)github帳號(hào)的SSH key切換, 更新多個(gè)hexo博客 github賬號(hào),工作有一個(gè),自己有一個(gè)。但是默認(rèn)下使用ssh k...