本章主要介紹SEO優化工作中,在增加收錄技術方面需要了解的工作。
本文版權由“ 北朔潛龍 ”所有,僅供學習使用,請勿轉載或用于商業用途。
九、增加收錄
? 1、影響收錄的因素
? ? ? 如果你的網站沒有被收錄,請檢查你的內容質量與爬蟲抓取量
? 2、爬蟲抓取方式
? ? ? 搜索引擎爬蟲抓取方式
? 3、模仿
? ? ? (httrack 網站鏡像工具“整站下載器”)http://www.httrack.com/英文;下載-安裝(中文版本)
? 4、收錄原理
? ? ? 過程:robots.txt—首頁—欄目頁—CSS/JS—內容頁
? 5、爬蟲內部因素
? ? ? ?A)爬蟲內部因素
? ? ? ? ? ?1.網站速度影響爬蟲訪問
? ? ? ? ? ? ? 機房—DNS服務器—CDN—出口寬帶—硬件—操作系統—服務器—軟件—程序
? ? ? ? ? ?2.nofollow標簽的使用控制爬蟲抓取
? ? ? ? ? ? ? Nofollow是指不追蹤此鏈接
? ? ? ? ? ? ? Nofollow掉每個頁面重復出現的鏈接和對SEO無價值的頁面,減少爬蟲重復抓取每個頁面內的鏈接,提高爬蟲抓取效率增強對重復頁面的抓取。
? ? ? ? ? ? ? 使用方法:rel=“nofollow”舉例“京東商城”使用火狐瀏覽器插件“Highfight nofollow links”查看
? ? ? ? ? 3.其他影響爬蟲抓取的因素
? ? ? ? ? ? ?防火墻規則,防攻擊設計,防止采集設置規則;一個網站訪問N次后,自動斷開,爬蟲被拒。
? ? ? ? ? ? ?分隔硬盤:在服務器下安裝多個虛擬機,硬盤轉速慢,爬蟲訪問不到網頁,多個返回碼;一個鏈接返回多個返回碼,搜索引擎是不會抓取的。
? 6、爬蟲外部因素
? ? ? ?A)外部鏈接
? ? ? ? ? ?外鏈的作用有兩個,一個是吸引爬蟲來抓取,另一個是提升排名,相關性、流通性、廣泛性(給每個網頁加外鏈,不要全部指向首頁)
? ? ? B)文章
? ? ? ? ? ?文章的原創度,更新頻率及獨特性,原創文章一定收錄,只是時間問題。
? ? ? C)權重
? ? ? ? ? ?權重是指搜索引擎對你的網站的信任程度,權重高的網站爬蟲數量多,抓取及時,權重高的網站有爬蟲長期“隱居”。
? ? ? D)網站地圖
? ? ? ? ? 網站地圖促進爬蟲抓取,是增進收錄的重要因素
? ? ? E)PR值
? ? ? ? ? PR值是谷歌對于網站質量的衡量標準,但是PR對SEO的作用非常小,有些參考價值,但是意義并不是很大。
? 7、爬蟲外部因素
? ? ? A)爬蟲抓取頁面的過程中是可以看到網頁URL、Html代碼 和 head信息
? ? ? B)URL規范化
? ? ? ? ? 1.靜態化、唯一化
? ? ? ? ? ? ?http://www.seojiaoxue.com/?P=9
? ? ? ? ? ? ?http://www.seojiaoxue.com/9.html
? ? ? ? ? ? 網站中同一網頁,只對應一個URL
? ? ? ? ? ? 1.1如果網站上多重URL都能訪問同樣的內容,會有如下危險
? ? ? ? ? ? 1.1.1搜索引擎會選一種標準,可能會與正版不同
? ? ? ? ? ? 1.1.2用戶可能為同一網頁的不同URL推薦,多重URL形式分散了該網頁的權重
? ? ? ? ? ? 1.2如果你的網站上已存在多重URL形式,建議按以下方式處理
? ? ? ? ? ? 1.2.1在系統中只使用正常形式的URL,不讓用戶接觸到非正常形式的URL
? ? ? ? ? ? 1.2.2不把session ID統計代碼等不必要的內容放到URL中
? ? ? ? ? ? 1.2.3不同形式的URL:301永久跳轉正常形式
? ? ? ? ? ? 1.2.4防止用戶輸錯啟用備用域名,301永久跳轉到主域名
? ? ? ? ? ? 1.2.5使用robots.txt禁止baiduspider抓取不想向用戶展示的形式
? 2.URL中帶有拼音/英文在排名上有優勢
? ? ? C)W3C標準
? ? ? ? ? ? Html代碼符合標準,結構層、表現層、行為層標簽的完整性,用開源程序就好了。
? ? ? D)Heal信息的正確性(服務器)
? ? ? ? ? ?抓包工具httpwatck(下載、安裝、使用)
? ? ? D)Accept
? ? ? ? ? 指不能夠接受返回數據的規范*/*表示所有
? ? ? ? ? Accept-language ??????????zh-cn
? ? ? ? ? 表示能夠接受的返回數據語言
? ? ? ? ? ?Accept-encoding ??????????gzip.deflate
? ? ? ? ? ?Accept-encoding表明了瀏覽器可接受的除了純文本之外的內容編碼的類型,比如zip壓縮文件的壓縮內容
? ? ? ? ? Last-modified ????fri ????04 ??????jan 2008 ??????01:01:00 ?????gmt
? ? ? ? ? 指定被請求資源上次被修改的日期和時間節省寬帶,減少重復抓取
? ? ? ? ? Server ??????????Apache
? ? ? ? ? 一種標明WEB服務器軟件及其版本號的頭標
? ? ? ? ? Content-length
? ? ? ? ? 內容長度通過文字長度判斷是否更新過但是不準,如果文字一樣就無法判斷了
? ? ? E)內容與收錄
? ? ? ? ? ?1.原創性
? ? ? ? ? ?1.1原創文章一定會收錄,但只是時間問題
? ? ? ? ? ?1.2原創性是影響網站權重的很重要的因素,其他因素沒有原創性重要
? ? ? ? ? ?1.3原創影響權重,權重影響收錄,收錄影響排名,排名影響流量
? ? ? ? ? ? 2.重復性
? ? ? ? ? ? 2.1轉載或采集的頁面內容和之前頁面都一樣,URL不統一也是重復,網頁的相似度高就算重復頁面,頁面重復SEO負頁面。
? ? ? ? ? ? 2.2重復頁面與總頁面比例要低于30%,網站大量重復會被懲罰,避免重復的方法。
? ? ? ? ? ? 2.2.1在網站的正文部分多調用些隨機調用增加文章內容
? ? ? ? ? ? 2.2.2URL唯一化,解決重復性最高境界就是原創
? ? ? ? ? ? 3.排名模型
? ? ? ? ? ? 3.1真有排名秘籍嗎?有多少人知道搜索引擎算法?
? ? ? ? ? ? 3.1.1沒有秘籍,沒有人知道全部的算法,工程師,SE給客戶最好的搜索結果,給用戶最好的價值,搜索引擎給我們排名,流量是被搜索引擎給我們的數據和SEO經驗,總結出了SEO排名模版。
? ? ? ? ? ? 4.定義
? ? ? ? ? ? 4.1基于對搜索引擎的排名特種和算法一集SEO經驗分析得出一個排名的原理,這個原理就是SEO模型
? ? ? ? ? ?4.2操作
? ? ? ? ? ?4.2.1網站結構符合:內容也的相關推薦板塊
? ? ? ? ? ?4.2.2內鏈和外鏈
? ? ? ? ? ?4.2.3其他:SEO頻道和錨文本等
? ? ? ? ? ?5.注意
? ? ? ? ? ?5.1網頁都是相關性的(信任投票)注意質量
? ? ? ? ? ?5.2相關網頁數量很多