搜索引擎發展分為3個階段:
1、組織網絡,讓信息可供使用;2、語言關聯,一句話與另一句話什么聯系,同義詞轉換怎么實現,計算機如何處理;3、新的人工智能和人工交互領域以及整個世界的數字模型;
搜索包括辨別同義詞、補充輸入的同義詞、句子以及問題,修正語法,整合消息、圖片和視頻。
怎樣自動將一個模糊的搜索請求補充完整。
教會機器系統理解人類交流中的細微差別。 ?哲學家路德維?!ぞS特根斯坦的語境理論為戈麥斯提供幫助,理論詳細說明了上下文對字句含義的影響;
現有算法還不能將所有情況作為一個問題的答案全部總結起來。
知識圖譜——事物之間不可見的聯系展示出來。
2011~2015google在超過6億個地點、人物、物品之間建立500多億條這樣的聯系。
計算機通過算法讀取所有數據庫(從維基百科到存檔信息),進行分析,然后進行信息關聯;
框計算:所有信息匯聚到一個小框中。
Google語音識別系統還可以利用知識圖譜來更好的理解語言并修正。
如:搜柏林 可能由于口音識別不清,但是 說德國柏林 則根據德國排除了因含糊不清而產生的其他搜索結果。
Google開發的個性化語音助手google now 類似box,已電子卡片的形式出現在用戶手機中
還組織了幾千名用戶進行大型研究,每天多次詢問,此時的需求而應用程序要如何滿足需求。
深度學習-人工神經網絡領域的研究,基于的一個極端觀點為人的智慧根據俄只有非常少的幾種甚至只有1種算法。
關于搜索中產品作用的看法:
1、搜索是一個技術主導的產品,所以算法是整個產品的基礎。而產品經理做的則是圍繞算法進行的,而不是獨立創造出某個功能
應該做的事是尋找一個合適的場景,對算法的效果進行包裝,使得包裝后的效果可以很好的改進產品體驗,把產品最大價值體現出來。
但是前提是,你的搜索算法需要達到一個及格的狀態。
所以首先你要學會評估現有的算法的優質程度,這里就是拆分問題。
1、首先要讓你的數據有測試環境(場景)、讓數據可視化(便于與場景結合從而評判數據)
2、數據出來后,首先評判數據是否有錯誤(搜 google網站 出來了 ?新浪);其次排序,再看落地頁(具體的呈現信息的質量);最后看下其他影響排序的因素是否達標(地理位置、時間——時效性等)。從而可以幫助技術確定算法的優化方向——梳理了問題,剩下就是解決問題。這之后就是確立量化標準/核心指標從而可以檢驗技術同學的優化效果,最后是通過評測來驅動算法改進。
搜索不像其他產品,用戶對自己的搜索意圖可能描述不清,也可能搜索算法的問題導致有些關鍵詞的搜索質量較差,但可能改一個同樣意思不同表達的詞,就可以出現令人滿意的結果,那這也涉及到引導。
有點像大禹治水方法,疏導為主--疏通用戶與真實需求的路徑。
3、在搜索結果不變的情況下,可以優化用戶的搜索路徑,如搜索的第一步就是錄入,而用戶的水平有高有低,所以表達也有準確和不準確,怎么保證不準確的用戶也能搜到自己想要的過此時有2個產品,一個是“為您推薦”一個是“下拉框”都是通過一輸入的內容最匹配詞和搜索質量最好的詞顯示,從而幫助用戶快速找到自己需要的信息。這種也算是在搜索質量沒辦法突然躍升時一種揚長避短的方式。
以上是我對搜索產品的現階段理解。僅供參考。