搜索-Elasticsearch-進(jìn)階1

outline

一.function_score
二.搜索字段的權(quán)重控制

一.function_score

functions是一個(gè)數(shù)組,存放加強(qiáng)函數(shù)列表

1.加強(qiáng)_score的計(jì)算函數(shù)

(1) weight
設(shè)置一個(gè)簡單而不被規(guī)范化的權(quán)重提升值
new_score = old_score * weight

(2) field_value_factor
將某個(gè)字段的值乘上old_score

(3) random_score :
為每個(gè)用戶都使用一個(gè)不同的隨機(jī)評分對結(jié)果排序,但對某一具體用戶來說,看到的順序始終是一致的

2.輔助參數(shù)

(1) boost_mode : 決定 old_score 和 加強(qiáng)score 如何合并
(2) score_mode:先合并functions中的函數(shù),然后使用加強(qiáng)score和old_score合并(boost_mode)
(3) max_boost

3.衰減函數(shù)

以某個(gè)字段的值為基準(zhǔn),距離某個(gè)值越近得分越高
linear : 線性函數(shù)是條直線,一旦直線與橫軸0香蕉,所有其他值的評分都是0
exp : 指數(shù)函數(shù)是先劇烈衰減然后變緩
guass(最常用) : 高斯函數(shù)則是鐘形的,他的衰減速率是先緩慢,然后變快,最后又放緩

4.script_score

當(dāng)需求超出以上范圍時(shí),可以用自定義腳本完全控制評分計(jì)算,不過因?yàn)檫€要額外維護(hù)腳本不好維護(hù),因此盡量使用ES提供的評分函數(shù),需求真的無法滿足再使用script_score

weight-example:

<pre><code class="shell">
GET 127.0.0.1/mytest/doc/_search
{
"query": {
"function_score": {
"query": {
"match_all": {} //match_all查出來的所有文檔的_score都是1
},
"functions": [
//第一個(gè)filter(使用weight加強(qiáng)函數(shù)),如果language是java,加強(qiáng)score就是2
{
"filter": {
"term": {
"language": "java"
}
},
"weight": 2
},
//第二個(gè)filter(使用weight加強(qiáng)函數(shù)),如果language是go,加強(qiáng)score就是3
{
"filter": {
"term": {
"language": "go"
}
},
"weight": 3
},
//第三個(gè)filter(使用weight加強(qiáng)函數(shù)),如果like數(shù)大于等于10,加強(qiáng)score就是5
{
"filter": {
"range": {
"like": {
"gte": 10
}
}
},
"weight": 5
},
//field_value_factor加強(qiáng)函數(shù),會(huì)應(yīng)用到所有文檔上,加強(qiáng)score就是like值
{
"field_value_factor": {
"field": "like"
}
}
],
"score_mode": "multiply", //設(shè)置functions裡面的加強(qiáng)score們怎麼合併成一個(gè)總加強(qiáng)score
"boost_mode": "multiply" //設(shè)置old_score怎麼和總加強(qiáng)score合併
}
}
}
</code></pre>

按受歡迎度提升權(quán)重/field_value_factor

<pre><code class="shell">
GET /forum/article/_search
{
"query": {
"function_score": {
"query": {
"multi_match": {
"query": "java spark",
"fields": ["tile", "content"]
}
},
"field_value_factor": {
"field": "follower_num",
"modifier": "log1p",
"factor": 0.5
},
"boost_mode": "sum",
"max_boost": 2
}
}
}
</code></pre>

field_value_factor中如果只有field,那么會(huì)將每個(gè)doc的分?jǐn)?shù)都乘以follower_num,如果有的doc follower是0,那么分?jǐn)?shù)就會(huì)變?yōu)?,效果很不好。因此一般會(huì)加個(gè)log1p函數(shù),公式會(huì)變?yōu)?,new_score = old_score * log(1 + number_of_votes),這樣出來的分?jǐn)?shù)會(huì)比較合理
factor的作用:new_score = old_score * log(1 + factor * number_of_votes)
boost_mode:可以決定分?jǐn)?shù)與指定字段的值如何計(jì)算,multiply,sum,min,max,replace
max_boost,限制計(jì)算出來的分?jǐn)?shù)不要超過max_boost指定的值

new_score的函數(shù)曲線

image

二.搜索字段的權(quán)重控制

在多個(gè)field中搜索,field的權(quán)重不同/增加某個(gè)term的權(quán)重
(1)
<pre><code class="shell">
{
"multi_match" : {
"query" : "天龍八部",
"type" : "best_fields",
"tie_breaker" : 0.3,
"fields" : [ "title^1.5", "body" ],
"minimun_should_match" : "30%"
}
}
</code></pre>
(2)
<pre><code class="shell">
GET /_search
{
"query": {
"bool": {
"should": [
{
"match": {
"title": {
"query": "quick brown fox",
"boost": 2
}
}
},
{
"match": {
"content": "quick brown fox"
}
}
]
}
}
}
</code></pre>

Not Quite Not

<pre><code class="shell">
GET /_search
{
"query": {
"bool": {
"must": {
"match": {
"text": "apple"
}
},
"must_not": {
"match": {
"text": "pie tart fruit crumble tree"
}
}
}
}
}
</code></pre>

negative boost

<pre><code class="shell">
GET /forum/article/_search
{
"query": {
"boosting": {
"positive": {
"match": {
"content": "java"
}
},
"negative": {
"match": {
"content": "spark"
}
},
"negative_boost": 0.2
}
}
</code></pre>

elasticsearch筆記
elasticsearch控制度相關(guān)
ElasticSearch - function_score 簡介

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容