PM搜索總結(jié)(一)——如何通過query分析、session分析挖掘用戶搜索需求把握行為習(xí)慣

搜索產(chǎn)品和推薦產(chǎn)品一樣,是策略主導(dǎo)的產(chǎn)品類型,與功能型產(chǎn)品相比,前者更加注重背后邏輯策略的設(shè)計(jì),但在用戶的需求和行為的把握方面,搜索產(chǎn)品,或者說任何產(chǎn)品,面臨的要求挑戰(zhàn)都是相同的。了解你的目標(biāo)用戶,通過功能或者策滿足用戶需求,追求更好的用戶體驗(yàn),是產(chǎn)品設(shè)計(jì)的重要目標(biāo)之一。

跟其他pm一樣,需求挖掘是策略產(chǎn)品經(jīng)理的基本功,定性定量的用戶行為分析是需求挖掘的重要方法,也是數(shù)據(jù)分析的重要方法之一,這里分析的用戶行為指的是用戶使用搜索產(chǎn)品的最終訴求在于找到自己想要的商品或者信息。為滿足此需求,用戶會在搜索產(chǎn)品留下一系列的行為軌跡信息。我們都應(yīng)該聽過“方案》數(shù)據(jù)》算法”的說法,很多例子都證明,方案層的優(yōu)化往往比一味的提高算法準(zhǔn)確率對更加有效,我們要做的用戶分析、需求挖掘是一切方案的基礎(chǔ)。

搜索產(chǎn)品在進(jìn)行用戶行為分析中常用的兩種分析方法:“query分析”,“session分析”。

一.query分析

概念:query即查詢的意思,query分析指的是通過對用戶查詢詞的拆解與分析,了解用戶意圖與需求。

query分析通常會從case的定性分析入手,然后結(jié)合數(shù)據(jù)進(jìn)行定量分析,最終實(shí)現(xiàn)了解用戶目的。case抽樣中,采用隨機(jī)抽樣即可,筆者在進(jìn)行一次完整分析時通常抽取數(shù)量500+或1000+。

第一步:數(shù)據(jù)分析過程中,在完成數(shù)據(jù)采集及清洗過后,將數(shù)據(jù)分類整理是重要的第一步。

1.query類型劃分:

query按照不同維度可以有多種分類方法,以電商產(chǎn)品為例。

按照query組成結(jié)構(gòu)分類:

在分析組成結(jié)構(gòu)的時候要注意分詞粒度,對于電商產(chǎn)品,可以以索引基本單元劃分,即term級。

例如“zara兒童包包”,可以分為zara/兒童/包包:三個term的類型分別為品牌,性別,類目,這個query的類型就是品牌+性別+類目。

按照query的精準(zhǔn)程度分類:

“zara兒童包包”與“包”對比,前者的精準(zhǔn)程度明顯大于后者,根據(jù)query精準(zhǔn)程度的不同,可以劃分為“泛搜索詞”與“精準(zhǔn)搜索詞”,劃分粒度根據(jù)需求決定。

按照query是否含有不明意圖修飾詞劃分:

例如“最好看的包包”,“最好看的”就是非明確意圖的修飾詞,一般這種類型的query在電商行業(yè)比重較小。

按query是否錯誤劃分:

同音字、錯別字、輸入法錯誤導(dǎo)致的query錯誤,也是一種類型。

2.query類型劃分的意義:

?2.1通過抽樣調(diào)查的結(jié)果,統(tǒng)計(jì)各個類型query所占比例,了解你的搜索產(chǎn)品用戶需求的分布,是策略設(shè)計(jì)的前提,同時也要注意,產(chǎn)品設(shè)計(jì)中考慮投入產(chǎn)出比,并不是所有的問題都需要解決,所有的點(diǎn)都需要優(yōu)化,哪些問題影響面廣,優(yōu)化覆蓋率高,各個類型的query比例是優(yōu)先級的依據(jù)。明確高頻詞(頭部)、低頻詞(長尾)組成,按照基本的二八原則,可以指導(dǎo)很多策略的確定。這里需要注意以上幾個分類并不是獨(dú)立的,不同分類維度不同,結(jié)果存在耦合。

?2.2query組成結(jié)構(gòu)代表用戶的關(guān)注點(diǎn),通常電商產(chǎn)品用戶一般關(guān)注品牌、類目、性別、有明確意圖的修飾詞,類似:顏色、款式等,不同垂直領(lǐng)域會有分布差別,了解用戶關(guān)注點(diǎn),才能有的放矢的匹配用戶需求。

?2.3query精準(zhǔn)程度、需求明確程度通常反應(yīng)代表用戶的購買意圖,搜索“zara兒童包包”的用戶往往比搜索“zara”的用戶購買意愿更加強(qiáng)烈。

?2.4包含無明確意圖的修飾詞往往代表用戶是專業(yè)內(nèi)新手,無法明確表達(dá)自己的需求,當(dāng)此類query過多的時候,需要考慮更多的資訊類內(nèi)容進(jìn)行新手的教育。

?2.5query錯誤的時候,需要糾錯、改寫策略。

第二步,query分類后續(xù)分析。

通過query分析,我們通常能得到搜索產(chǎn)品的需求分布與比例,但query類型劃分并不是query分析的終點(diǎn),而是分類查找問題的開始。

概念:

召回:搜索查詢返回物品的過程。

召回率:返回物品的數(shù)量/數(shù)據(jù)庫內(nèi)應(yīng)該被召回的物品的總量。

準(zhǔn)確率:召回物品中準(zhǔn)確的物品數(shù)量/召回物品的總量。

F1-sorce:是統(tǒng)計(jì)學(xué)中用來衡量二分類模型精確度的一種指標(biāo),它同時兼顧了分類模型的準(zhǔn)確率和召回率。F1-sorce是模型準(zhǔn)確率和召回率的一種加權(quán)平均,F(xiàn)1-sorce=2*p*r/(p+r),最大值是1,最小值是0

召回率、準(zhǔn)確率以及F1-sorce是評估策略的重要指標(biāo)。

示例一個簡單的query抽樣分析:


抽樣分類后仍然需要結(jié)合定量的數(shù)據(jù)統(tǒng)計(jì),查看抽樣case暴露出來的問題總量。

可以思考以下問題

1.哪類query召回數(shù)量少?

是否資源過少無法滿足用戶需求?是否需要通過招商配合豐富商品?

2.哪類query的召回率低?

低的原因:商品信息填寫不全導(dǎo)致無法命中?部分信息未建索引導(dǎo)致無法命中?其他技術(shù)問題?

3.哪類query準(zhǔn)確率低?

低的原因:商品信息填寫不準(zhǔn)確導(dǎo)致誤召回?商家seo作弊?技術(shù)bug?

4.哪類query平均瀏覽結(jié)果數(shù)量少?

少的原因:排序不合理?商品數(shù)量過多降低瀏覽欲望?

5.哪類query點(diǎn)擊/購買數(shù)量少?

少的原因:缺乏優(yōu)質(zhì)/新穎商品?未召回優(yōu)質(zhì)商品?排序不合理無法迅速查找目標(biāo)商品?價格太貴?

……

搜索結(jié)果頁的產(chǎn)品展示設(shè)計(jì)問題、信息整合問題、ui設(shè)計(jì)問題都可以此逐一分析。

具體問題解決環(huán)節(jié)要從占比大、程度重的解決。

二. session分析

query分析側(cè)重從用戶在搜索過程中留下的查詢詞入手,session分析則側(cè)重用戶從進(jìn)入搜索到推出搜索的整個過程分析用戶行為。

概念:

session:即會話,是指在制定的時間段內(nèi)在網(wǎng)站上發(fā)生的一系列互動,搜索的sesion分析指的是從點(diǎn)擊搜索輸入框/icon至離開搜索的一些列行為。

session分析:是一種專業(yè)的數(shù)據(jù)分析,把用戶單點(diǎn)行為串聯(lián)成一個整體,在此基礎(chǔ)上進(jìn)行分析,解決用戶分析中的“線”型難題。

(以上定義參考神策-張喬的文章《數(shù)據(jù)分析方法論:你真的懂session(會話)分析嗎?》)

session切割時間:session切割一向是比較模糊的難題,有很多論文論述session切割標(biāo)準(zhǔn)與方法,筆者在做搜索session分析時通常采用“離開搜索30分鐘未返回”標(biāo)準(zhǔn)切割。

搜索中用戶單點(diǎn)行為包括:

?輸入查詢詞

?點(diǎn)擊查詢

?瀏覽結(jié)果

?點(diǎn)擊結(jié)果

?返回結(jié)果瀑布流

?更換搜索詞

?收藏商品

?加入購物車

?購買/下單商品

……

一個session中通常包含多個單點(diǎn)行為,同時每個單點(diǎn)行為通常帶有其他信息。

舉例筆者分析通過session分析查找用戶搜索后無點(diǎn)擊行為的例子。

通過數(shù)據(jù)分析,發(fā)現(xiàn)搜索后無點(diǎn)擊行為占比比較高,分析前先做調(diào)查,搜索后無點(diǎn)擊原因包含常規(guī)的原因,如用戶對商品不滿意,用戶對召回結(jié)果不滿意等原因,除此之外,用戶搜索心理對點(diǎn)擊的影響卻很難憑空猜測,通過session分析的方法,查找其原因,尤其是用戶自身原因。

第一步:采集數(shù)據(jù)與人工整理。

數(shù)據(jù)采集可以采用第三方數(shù)據(jù)平臺,例如神策,在埋點(diǎn)詳細(xì)的情況下,也可直接找研發(fā),好處是可以根據(jù)自己需要靈活提取詳細(xì)數(shù)據(jù)。

本次選取包含從輸入某查詢詞點(diǎn)擊查詢至改寫查詢詞或者離開搜索頁過程中,無點(diǎn)擊結(jié)果行為的100個搜索session。


第二步:將用戶搜索意圖根據(jù)需求程度大致分類。

電商行業(yè)區(qū)別于o2o行業(yè),用戶在沒有購買轉(zhuǎn)化意愿的時候也會常常使用產(chǎn)品,其目的是多樣的,且每一種目的比例都很可觀。結(jié)合線下訪談與平臺特性大致劃分以下三類。

1.了解認(rèn)識:出于了解行業(yè)動向了解,“換季了,新出了什么衣服”,“聽說了兩個牌子,搜搜看什么風(fēng)格”,或者無意義瀏覽,類似線下的無目標(biāo)逛街,打發(fā)時間,標(biāo)準(zhǔn)的“瀏覽型”用戶。

2.關(guān)注偏好:用戶對某些品牌或者商品有特定愛好,會定期查詢了解相關(guān)動態(tài)。

3.準(zhǔn)確意圖:有具體的商品目標(biāo),通常一定要找到該目標(biāo)商品,可能加入購物車或者購買,也可能最終決定放棄。這一類是典型的“購買型”用戶。

出于不同搜索目的的用戶在搜索后無點(diǎn)擊行為的原因是不同的,例如:出于了解認(rèn)識的用戶,搜索后無點(diǎn)擊行為,但是如果發(fā)生瀏覽行為仍然說明本次搜索滿足了用戶需求。而出于準(zhǔn)確意圖的用戶,搜索后無點(diǎn)擊則說明搜索或者商品本身是存在需要解決的重大問題。

第三步,以上分類粒度是無法滿足定位具體原因目的的,需要將用戶搜索行為按照一定的標(biāo)準(zhǔn)歸入大類,并繼續(xù)劃分次級類型,并分析每種類型背后的原因。

如何將搜索行為歸納到以上類型,并繼續(xù)劃分次級類型,以下行為標(biāo)準(zhǔn)可以參考:

1.查詢次數(shù):一次完整的搜索session通常由多次查詢組成。

2.query類型:參照上面query分析里的分類,確定意圖。

3.查詢改寫的類型:?

用戶將查詢提交給搜索引擎,然后對搜索結(jié)果進(jìn)行瀏覽,如果發(fā)現(xiàn)搜索結(jié)果不能完全解決用戶的信息需求,則會根據(jù)搜索結(jié)果的啟發(fā),改寫查詢,以便更精確地描述自己的信息需求,之后重新構(gòu)造新的查詢請求,如此形成用戶和搜索引擎交互的閉合回路。后續(xù)的查詢改寫是用戶逐步澄清搜索需求的一個過程。

抽象化改寫:將原來的查詢進(jìn)行語義抽象,比如由“zara兒童包包”經(jīng)過抽象改寫為“zara包包”,后者在語義概念層次上要更加寬泛,包含了兒童包包這個概念,之所以要做這種類型的改寫,往往是因?yàn)樵炔樵冋业降臇|西太少了,通過概念泛化增加搜索的召回率,以此方法找到更多內(nèi)容。

具體化改寫:具體化改寫與抽象化改寫相反,從寬泛的語義概念下行收窄,改寫后的查詢更加具體,這么做可以更加精準(zhǔn)的的定位查找內(nèi)容。

同義化改寫:此類型改寫則保持改寫前后的查詢含義不變,比如將“兒童”改寫為“小孩”,兩者代表的含義是相同的,用戶如此改寫往往是對原先查詢的搜索結(jié)果不滿意,所以換了一種同一說法來繼續(xù)搜索。

多類型改寫:用戶在目標(biāo)明確且查找意愿非常強(qiáng)烈而返回結(jié)果不能讓其滿意的情況下,用戶會進(jìn)行反復(fù)的查詢改寫,導(dǎo)致一次搜索session包含多次改寫,改寫類型也不相同。

其他關(guān)聯(lián)類型:即使用戶的查詢語義并無上述邏輯,通常也不代表前后查詢毫無關(guān)聯(lián),尤其是在電商行業(yè),依然可以根據(jù)查詢詞是否存在“品牌”“類目”“顏色”“款式”等內(nèi)在相同點(diǎn)來判斷用戶意圖的相關(guān)性和連續(xù)性。這里還有一類隱藏較深的關(guān)聯(lián)關(guān)系,例如“Sandro”與“maje”兩個品牌類型查詢詞,看似無關(guān),了解品牌的同學(xué)可能會知道這兩個品牌都是著名的少女風(fēng)格時尚品牌,因此這次的查詢改寫仍然是有關(guān)聯(lián)的。

4.瀏覽行為與點(diǎn)擊行為:瀏覽的深度和是否發(fā)生點(diǎn)擊行為往往代表用戶是否找到滿意的商品。

5.切換排序方式:搜索的結(jié)果頁提供多種排序方式,默認(rèn)-按照熱度-按照價格-按照銷量-按照時間,用戶在切換排序方式的時候反應(yīng)影響查找商品決策的因素。

6.篩選行為:通過篩選,縮小查詢范圍。

7.加入購物車行為與購買行為:發(fā)生加入購物車或者購買行為代表用戶找到目標(biāo)商品,目標(biāo)信息與第一次查詢的偏移程度也可作為用戶行為分析的內(nèi)容。

用戶搜索意圖是由整個session綜合分析得到,任何單一的行為都不能完整的代表用戶意圖。

最終可形成初步結(jié)果:


以上述表格中session為例進(jìn)行分析。

session1:用戶第一次查詢詞“zara兒童包包”,召回結(jié)果數(shù)=瀏覽數(shù)量,點(diǎn)擊次數(shù)為0,無加入購物車以及購買行為,第二次查詢改寫為“zara包包”,為抽象化改寫,這次召回商品數(shù)量為5000,瀏覽數(shù)量1000,遠(yuǎn)多于第一次,本次發(fā)生點(diǎn)擊行為,但點(diǎn)擊商品位置排名較后。

說明用戶有明確的商品目標(biāo),第一次“zara兒童包包”召回結(jié)果數(shù)過少,未包含用戶目標(biāo)商品,進(jìn)行抽象化改寫后,擴(kuò)大搜索范圍,找到目標(biāo)商品,發(fā)生點(diǎn)擊,猜測可能存在目標(biāo)商品無法召回問題,需分析召回問題,點(diǎn)擊位置說明排序存在問題,有優(yōu)化空間。

session2:用戶第一次查詢詞“chanel”,瀏覽深度大于平時瀏覽平均深度,切換過“按價格排序”,第二次改寫查詢詞為“gucci”,瀏覽深度大于平時瀏覽平均深度,無其他行為,兩次搜索都無點(diǎn)擊行為。

分析“chanel”與“gucci”并無風(fēng)格類似等內(nèi)在聯(lián)系,但都為大家耳熟能詳?shù)臒衢T奢侈品品牌,同時用戶瀏覽深度較大,可判斷是出于了解認(rèn)識目的,“線上逛街”,并無明顯的優(yōu)化點(diǎn),可考慮增加更多資訊信息,以及信息組織形式,滿足瀏覽型用戶“逛”的需求,用戶切換過“按價格排序”,可能屬于價格敏感性用戶,可考慮增加優(yōu)惠信息,輔助激發(fā)購物欲望。

這里面的“行為原因”就是用戶出于不同目的引發(fā)的無點(diǎn)擊行為原因,據(jù)本次分析,包括“了解認(rèn)識_正常瀏覽”“準(zhǔn)確意圖_懶,首次查詢輸入信息不全”等多種原因。

第四步,從問題角度匯總整理。


這樣就能完成一次session分析查找無點(diǎn)擊行為總結(jié)。

最終根據(jù)整理的問題,按照優(yōu)先級依次解決。




蕭飯飯,搜索推薦產(chǎn)品經(jīng)理,WX:xiao-xiao1991,歡迎大家一同探討,共同進(jìn)步~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容