博客搭建系列三:如何使博客支持百度搜索

我們寫自己的博客,當然是想被更多的人看到,分享下自己的研究成果。這里,各種搜索引擎起著重要的作用。查網站的seo,大家可以去站長之家, 輸入查詢的網址即可。搜索引擎是靠爬蟲去爬網站的上的內容,我們的博客是一個靜態博客,內容托管在github上。打開終端,輸入以下命令:


curl -A "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)" https://github.com

我們會看到結果如下圖:

百度爬蟲爬github

github把百度爬蟲屏蔽了,原因就是百度爬蟲爬得太厲害,已經對很多Github用戶造成了可用性的問題了。當然,大家也可以嘗試下百度爬蟲能不能爬到自己的網站內容,我想結果是一樣的。我們可以再試試谷歌爬蟲,輸入以下命令:

|

curl -A "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" https://github.com

發現確實可以爬到網頁的內容。也就是說,如果用谷歌搜索一些我們博客上的關鍵字是能搜索到我們文章的,但是百度是搜不到的。國內我們都知道,谷歌被墻了,所以用百度搜索還是有很大比例的。那么我們如何才能使百度搜索到呢?推薦大家一篇技術分析的文章解決 Github Pages 禁止百度爬蟲的方法與可行性分析

最好的解決辦法還是要將我們博客的內容托管在百度爬蟲可以爬的到的地方。最好不需要我們自己購買主機什么的,其實就是一個類似于github的代碼托管平臺。其實,國內還真有:coding.net,將gitcafe收購了,是國內最大的代碼托管平臺,界面也很清爽簡潔。操作的步驟其實和github類似。我們這里就不詳述了,大家可以參考這篇文章:解決 Github Pages 禁止百度爬蟲的方法2–從gitcafe遷移到coding.net。

不過注意下,mac的ssh key獲取我們在系列文章一中說過;還有dns的設置大家參考我系列文章二中的設置。這里吐槽一下,github做了cname處理綁定域名后,訪問原來提供的github.io域名,會提示301永久重定向到我現在的域名。但是coding.me的域名還是可以正常訪問的。這個就有點不爽了。一樣的內容,多個域名,會造成網站的分流,seo權重下降。但是服務器是人家的,我們也不能不能做什么。不過,我已經在coding的論壇上提了這個問題,人家技術人員說正在開發,說是下周就能出來。

這樣設置好以后,大家可以用上面的命令看能不能爬到。而且,每次用hexo部署后,我們的博客代碼會同時部署到github和coding上,非常方便。這里建議大家將自己的博客目錄創建一個github倉庫,備份一下里邊的source文件夾和_config.yml等配置文件。這樣一來我們就不必非得用自己的電腦才能寫博客;二來可以做博客內容備份。

至此,博客搭建系列完畢!


原文鏈接:https://www.wty90.com/2016/11/20/support-for-baidu-search/
原作者:Teal

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容