因百度對時效性內(nèi)容識別技術(shù)升級,原獨立新聞源數(shù)據(jù)庫的形式已不再適合使用,故取消新聞源數(shù)據(jù)庫。

一群站長在QQ群里炸窩,探討關(guān)于百度取消新聞源數(shù)據(jù)庫的事兒,做為一個老站長,跟著新聞源十多年了,深知拿了新聞源就等于往手里送流量一般,自然這個聲音出來后,很多人都會開始叫苦。
丁道師在文章里說:“曾幾何時,網(wǎng)站或者媒體成為百度新聞源,遠比在北京買一套房子價值大。”
我想說:“挺好的,畢竟從今天開始新聞領(lǐng)域可以出現(xiàn)公平的競爭”。
不公平的競爭格局
新聞源時代,其實本是一個不公平的競爭格局,雖然以優(yōu)質(zhì)內(nèi)容為標(biāo)準(zhǔn),但是對個人站長來講,其實獲取優(yōu)質(zhì)新聞源的門檻是特別高的,要堅定不移的保持原創(chuàng),但是界定原創(chuàng)的標(biāo)準(zhǔn)其實很模糊,假設(shè)A站點是一個未獲得新聞源的站點,B站點獲取了新聞源,當(dāng)A站點進行原創(chuàng),而B站點持續(xù)轉(zhuǎn)載A站點的原創(chuàng)文章時,那么B站點就可以獲取海量流量,而像B這樣的站點轉(zhuǎn)載內(nèi)容源的變多,那么A申請新聞源就不一定成功。
那些年,WEB2.0時代,說實話我們被地方性的新聞?wù)军c沒少欺負。
新聞源沒了怎么玩?
自新媒體時代來臨,今日頭條、百度百家、搜狐自媒體、一點資訊、北京時間、微信公眾號等內(nèi)容平臺的衍生,流量已經(jīng)分散了,百度新聞源的內(nèi)容其實并沒有原本那么重了,既然目標(biāo)是更好的獲取流量,所以不如去好好的想想,自己的站點入口到底在哪,要更好些。
我很慶幸,能遇到阿喵她們這樣專業(yè)的算法團隊,因為在一年前,為了提升我們的新聞源我們的內(nèi)容運營團隊,制定了一系列機制,來保證站點的收錄率,結(jié)果現(xiàn)在到正好是更好的運營的契機。
不賣關(guān)子,圍繞我們愛尖刀科技媒體運營團隊,去年開始建立的這些機制給大家一點思路。
蜘蛛池
蜘蛛是一群管不住的孩子,一直都是基于URL在互聯(lián)網(wǎng)上面漫無目的的奔走,站群跨了以后很多人開始考慮如何通過N個站點去養(yǎng)一個站點的玩法,于是就出現(xiàn)了蜘蛛池,蜘蛛池原理是很粗暴,從站群方式衍生,大量采集數(shù)據(jù)建立站點,前臺用動態(tài)模式來欺騙蜘蛛,當(dāng)蜘蛛每次進入站點一個頁面的時候,網(wǎng)站程序會自動隨機頁面給它抓取,從而讓蜘蛛不停的在網(wǎng)站內(nèi)抓取新類容。
繁殖池
還是依靠站群的模式,通過大量網(wǎng)站將蜘蛛引導(dǎo)到一個集成的池,通過程序控制自動繁殖外鏈地址給蜘蛛,不管蜘蛛從哪個子站走進來,最終都引導(dǎo)到一個目標(biāo)站點,如果你有很多站,你也可以為這些大量的蜘蛛定制任務(wù),分發(fā)到N個站。
蜘蛛識別系統(tǒng)
不同的蜘蛛,他們的使命是不同的,比如新聞源、網(wǎng)頁、圖片這些蜘蛛的屬性都是不同的,掛好鉤子識別這些蜘蛛是干嘛的,為每個蜘蛛建立一個檔案庫,與繁殖池進行聯(lián)動,精準(zhǔn)分發(fā)讓他去干他該干的事兒。
技術(shù)驅(qū)動新格局
外面一堆關(guān)于大數(shù)據(jù)、區(qū)塊鏈、AI的聲音,但是看了很多產(chǎn)品確實LOW的一筆,在魚龍混雜的互聯(lián)網(wǎng)行業(yè),TO VC、TO G的企業(yè)大有人在,抱怨的同時未嘗不是一個好的機會。
新的競爭格局不在是基于資源,而是基于技術(shù),這會是公平的競爭,因為在這個時代,一定是數(shù)據(jù)和結(jié)果說話的。
不要在談什么SEO,在站長領(lǐng)域里已經(jīng)是個最基礎(chǔ)的配置,SEO層面很多事情都沒有什么競爭優(yōu)勢了,外鏈?內(nèi)連?權(quán)重?
自己想想該如何發(fā)揮。

順便show一下愛尖刀科技媒體的爬取頻次吧,日爬取量平均差不多在30萬左右。
上面的幾項技術(shù),并未用于愛尖刀,我們用的是另外一種思路,畢竟技術(shù)要向前看嘛。
來自:愛尖刀科技媒體,原帖:http://www.ijiandao.com/2b/marketing/48977.html