產品有了一部分內容,要開始考慮 seo 方面了。
對于搜索引擎來說,內容的質量最重要,不過這主要靠編輯或運營,技術層面可以做到的主要有以下幾點:
URL
搜索引擎喜歡靜態頁面,最好同一個 path 就是同一份內容,避免通過參數改變。
簡書的所有文章都是 /p/xxx 用戶主頁都是 /users/xxx 就是這個道理。
所以最好在開始能夠將路徑規劃好,否則雖然也可以配置路由調整,搜索引擎基本也都支持改版功能,不過一來改版功能有時附有一些條件不容易滿足,再者外部鏈接可能無法正常使用或者貢獻權重,還是有一定的影響。
結構化數據
網頁上總是有各種數據,如果能主動標記清楚各種信息分別是什么意思,搜索引擎就可以更好找到主題并且排版展示,對于搜索引擎判斷內容質量應該會有幫助。
google 推薦使用 schema.org 的標記法,除此之外還有 microdata、json-ld 等其他標記法,各大搜索引擎幾乎也都支持。
頁面元信息
例如 title、description、keywords(雖然據說主流搜索引擎已經無視了)有助于搜索結果的匹配,所以幾乎所有的站點都會在頁面原標題前或后加上自己產品的名稱。
簡書就是使用 『標題 - 簡書』這種形式。
canonical 有助于不同入口訪問到該頁面的蜘蛛去重。
sitemap
有些孤島頁面蜘蛛沒法直接爬到于是無法收錄,另外一些動態頁面雖然蜘蛛也不同程度支持,畢竟不能完全信任。于是主動將期望收錄的頁面更新到 sitemap 里引導蜘蛛爬取會比較安全。
目前各大引擎除了自己解析外,基本都可以通過各自的站長平臺主動提交,效果應該會更好。
內外鏈
鏈接數是頁面權重的一個影響因素,內鏈不說了自己設計頁面就好。
外鏈貌似一般會搞站群互刷,不過可能會被搜索引擎懲罰。于是能做的就是簡化自己內容的分享操作,利用各種分享組件便于用戶主動將內容分享到其他平臺。
但是有部分平臺(例如知乎)會給自己站點用戶提交內容中 a 標簽加上 rel="nofollow" 的屬性以避免蜘蛛流出為目標站點貢獻權重。
其他
- 盡量避免 404 錯誤,常見的失誤是忘了放 favicon.ico,如果用戶可以提交富文本內容的話,像上面說的給 a 標簽加 nofollow 也是不錯的選擇。
- 主動向搜索引擎提交新頁面,各搜索引擎的站長平臺幾乎都有這個接口,比起單純被動等待蜘蛛要靠譜的多。
- 事實上 url 如果能更有意義的話效果更好,所以很多英文站點(例如 medium)直接將標題當 url 的 path,不過很遺憾中文涉及編碼問題沒法用這個方法。