ElasticSearch官網:https://www.elastic.co/cn/downloads/
RelaxHeart官網:https://relaxheart.cn
原文:ES(入門一):走進ElasticSearch
ElasticSearch是什么?
ES(ElasticSearch)是一款非常強大的開源搜索引擎,可以幫助我們從海量數據中快速的找到相應的內容。
例如說我們在github上進行搜索的時候,它不僅可以幫我們快速找到對應的倉庫,還可以幫我們實現代碼級的搜索及高亮的顯示;當我們在網上購物的時候,ES可以幫我們做商品的推薦;當我們下班打車的時候,ES可以幫我們定位附近的乘客及司機,幫助平臺實現優化調度。
那除了搜索,結合Kibana Logstash Beats,Elastic stack還被廣泛使用在大數據、近實時分析的領域,包括日志分析、指標監控、信息安全等多個領域。可以幫助我們探索海量的、結構化的、非結構化的數據,按需創建可視化報表、對監控數據設置報警閾值、甚至使用機器學習的技術自動識別異常和狀況,及時發出警報。
場景一:淘寶的搜索、喜好推薦/猜你喜歡等
場景二:GitHub的倉庫搜索及代碼高亮
場景三:高德打車附近車輛定位
我為什么要學習ElasticSearch?
在DBRanking2019年5月的數據庫評測中,ES在Search Engine(搜索引擎)分類中名列第一。國內也有大量公司在使用ES,包括滴滴、今日頭條、餓了么、小米、360安全、VIVO等知名公司。
今天ES在全球的下載量已經超過3.5億次,阿里、google、微軟等云計算巨頭也在云平臺上提供了ES的托管服務。開發人員、運維工程師、架構師都值得去學習這門優秀的Search Engine,因為在大數據時代掌握近實時的搜索和分析能力才能掌握核心競爭力,共建未來。
主要功能及產品特性
主要功能:
- 分布式搜索引擎
- 大數據近實時分析引擎
產品特性:
- 高性能,遠離T+1
- 容易使用,容易擴展
學習的背景
通過一些了解,我自己以最新的7.1的版本進行學習,相信可以對ES的新特性有更全面直觀了解,例如使用機器學習進行異常監測,使用Canvas進行展示我的數據,使用索引的生命周期管理工具對我的索引數據進行優化等。
學習計劃或目標
從最基本的概念入手,逐步探索更加高級的搜索技術,進而了解的底層的細節,工作原理等。比如集群安裝部署等注意細節?Query-then-fatch的工作機制是怎樣的?它會對搜索的算分產生怎樣的影響?再比如ES的統計結果在什么樣的情況下會不準,又如何才能避免這種情況的發生?數據建模先關的最佳實踐等?運維及性能優化等?
最終目標:學以致用,構建自己的搜索和數據分析產品。
學習大體可以分為這幾塊:
開發
產品的基本功能,底層工作原理及數據建模實踐運維
容量規劃;性能優化;問題診斷;滾動升級方案
- 搜索與如何解決搜索的相關性問題
- 大數據分析實踐與項目實戰,理論知識如何運用到實際場景
歡迎大家關注個人博客網站:RelaxHeart網 - Tec博客