Elasticsearch 創始人 Shay Banon:讓數據自己說話

摘要11 月 13 日,在 2017 杭州云棲大會上,Elasticsearch 與阿里云宣布達成戰略合作,共同研發及發布阿里云上提供托管的 Elasticsearch,為中國市場提供嶄新的用戶體驗。Elasticsearch 挺進中國市場面臨的機遇和挑戰如何?阿里云 Elasticsearch 為中國用戶提供了哪些新服務?為此,InfoQ 采訪了 Elasticsearch 的創始人兼首席執行官 Shay Banon。

隨著互聯網數據規模的爆炸式增長,如何從海量的歷史、實時數據中快速獲取有用的信息,變得越來越具有挑戰性。而這其中,搜索作為獲取信息最高效的途徑之一,已經越來越受到人們的青睞。

一款優秀的搜索引擎,它連接了普通用戶和網站網頁,用戶可以輕而易舉且免費地搜索到想看的網站和內容,而這些網站的內容被搜索引擎檢索到,通過搜索引擎技術呈現給用戶。

11 月 13 日,在 2017 杭州云棲大會上,Elasticsearch 與阿里云宣布達成戰略合作,共同研發及發布阿里云上提供托管的 Elasticsearch,為中國市場提供嶄新的用戶體驗。Elasticsearch 挺進中國市場面臨的機遇和挑戰如何?阿里云 Elasticsearch 為中國用戶提供了哪些新服務?為此,InfoQ 采訪了 Elasticsearch 的創始人兼首席執行官 Shay Banon。

經過短短一個小時的交流,能明顯感覺 ?Shay Banon 有著靈敏的商業嗅覺。他在搜索的領域深耕了 18 年,差不多 8 年前創立了 Elasticsearch,他說,創業最重要的是找到自己擅長的地方,并且保持激情和熱愛,創業,意味著你要尋找生活中的問題,然后用創造性思維去解決它們。

Elasticsearch 源于一個食譜的應用

在談及當年接觸 Lucene 并開發 Elasticsearch 的初衷的時候, Shay Banon 認為自己參與 Lucene 完全是一種偶然,當年他還是一個待業工程師,跟隨自己的新婚妻子來到倫敦,妻子想在倫敦學習做一名廚師,而自己則想為妻子開發一個方便搜索菜譜的應用,所以才接觸到 Lucene。直接使用 Lucene 構建搜索有很多問題,包含大量重復性的工作,所以 Shay Banon 便在 Lucene 的基礎上不斷地進行抽象,讓 Java 程序嵌入搜索變得更容易,經過一段時間的打磨便誕生了他的第一個開源作品“Compass”,中文即“指南針”的意思。之后,他找到了一份面對高性能分布式開發環境的新工作,在工作中他漸漸發現越來越需要一個易用的、高性能、實時、分布式搜索服務,于是決定重寫 Compass,將它從一個庫打造成了一個獨立的 server,并創建了開源項目。

第一個公開版本出現在 2010 年 2 月,在那之后 Elasticsearch 已經成為 Github 上最受歡迎的項目之一。

Elasticsearch 的成功源自開源

經過八年,Elasticsearch 在中國也頗受廣大工程師歡迎, Shay Banon 說 Elasticsearch 成功的關鍵因素就是開源還有除了搜索之外的不同用例,如 日志管理、安全和分析。

他認為,開放源代碼搜索引擎為人們學習、研究并掌握搜索技術提供了極好的途徑與素材,推動了搜索技術的普及與發展,使越來越多的人開始了解并推廣使用搜索技術。使用開源搜索引擎,可以大大縮短構建搜索應用的周期,并可根據應用需求打造個性化搜索應用,甚至構建符合特定需求的搜索引擎系統。搜索引擎的開源,無論是對技術人員還是普通用戶,都是一個福音。

Shay Banon 有一個愿景,使世界上每個開發人員能夠使用搜索作為基礎來簡單地解決他們最復雜的用例。通過實時和大規模提供數據,Elastic 的產品已經下載了超過 1.5 億次累積的時間,用于構建現代搜索,日志記錄,安全性,指標和分析應用程序。

技術助推力量

當今世界,技術的日新月異加劇了市場競爭力的此消彼漲過程,企業越來越重視技術創新所帶來的競爭力量的增強以及由此創造的短期和長期市場利益,逐步形成以技術創新為核心的發展戰略。企業之間的競爭,不僅僅是規模上的競爭,更重要的是企業間的技術創新實力的較量。

馬云在云棲大會上演講時,談到技術對于未來的重要性,“在未來面前我們都是孩子,未來沒有專家”,他認為未來發展得好的公司一定是能將互聯網技術用得最好的公司。

任何一種新興技術,都必然要經歷螺旋式上升的發展軌跡,也必須符合技術生命周期的發展規律,即從概念提出、泡沫、破滅、冷靜、成熟、應用興起,再到重生與再創新。對于企業來講,在企業方向和研發戰略上,一定要把握和尊重技術產業領域的發展規律。

Shay Banon 介紹了 Elasticsearch 里的幾項關鍵技術處于的趨勢。

Elasticsearch 和阿里云合作 大步邁進中國市場

當談及 Elasticsearch 挺進中國市場的戰略時, Shay Banon 表示:“中國對我們來說是一個不斷增長的市場,過去幾年間,我們看到 Elasticsearch 的社區版圖擴展至超過 5000 多位開發人員。中國也是全球最大的市場之一,差不多有 1.9 億的開發者,希望這 1.9 億開發者都能用到開源的 Elasticsearch 的產品,并且取得成功。今天 Elasticsearch 選擇與阿里云合作,并配合 Elasticsearch 的實時處理能力、強大的 X-Pack 功能,如 security,alerting 和 machine learning,共同加快中國廣大開發者生態的創新步伐,構建、托管及管理更多不同的應用。”除此之外,Shay Banon 認為 Elasticsearch 接下來會針對中國市場,大力推廣其商業化產品 X-Pack,讓越來越多的人了解與使用。

搜索引擎的數據挖掘優勢

大數據時代,也是信息爆炸的時代,是否擁有信息已經不再重要,重要的是如何能夠快速的找到所需信息,而搜索引擎在這方面有著天然優勢,搜索引擎的數據挖掘將產生更加明顯的效果。

很多搜索技術的改進都離不開大數據技術。搜索引擎從本質上看,就是一種典型的大數據應用。目前,搜索在大數據領域已經跨進了一大步,人們可以實時搜索到想要的信息。

根據最新的數據庫引擎排名顯示,Elasticsearch,Solr 和 Splunk 分別占據了數據庫搜索引擎的前三位

從趨勢上來看,Elasticsearch 和 Splunk 上升明顯,Elasticsearch 更是表現出了非常強勁的勢頭。

在生產環境記錄應用的運行日志已經成為慣例,但日志需要經過處理和分析才有意義,第三方日志管理工具的出現正旨在解決這個問題。當下比較有代表性的日志管理工具有 Splunk 和 Logstash (注:Logstash 用途在于將數據插入到 Elasticsearch 和 Kibana 中可視化日志)。

Shay Banon 表示在日志分析領域,Elasticsearch 最大的競爭對手就是 Splunk ,在商業軟件付錢與開源軟件免費之間選擇,Elasticsearch 是全世界最受歡迎的開源解決方案,而且會以靈活性,實時能力和規模地處理大量數據,所以如果你在內地問開發者,大部分開發者傾向于 Elastic Stack。

他舉例, 類似于 Netflix,Facebook,Microsoft 以及 Linkedln 公司在日志基礎架構上會選擇運行大型 Elasticsearch 集群。此外,Elastic Stack 能夠在不同范疇使用,比如欺詐檢測和特定領域的業務分析,這將使 Elastic 不繼擴張。

機器學習賦能用戶解決復雜問題

云計算的發展,使得數據的采集、處理和分析都變得容易,大數據得以存在于各行各業各種數據體系中,人工智能因此成為了一個火爆的領域。

而其中的機器學習就是基于搜索技術建立起來的,而搜索帶來的海量數據積累,又能夠構建一套基于海量數據的數據統計分析,從而能夠為一些應用場景下的關鍵決策帶來指導和支撐。

Shay Banon 強調機器學習在數據搜索領域的重要價值:“以后不是跟數據講我們要什么,而是數據主動告訴我們這邊有什么,這就是機器學習的力量。

一點小小的擔憂

搜索引擎知道我們的出行路線、地理位置、工作信息、日常行為模式和交際圈子,它比任何保險公司或銀行都了解我們的風險狀況,隨著可穿戴智能設備的興起,它也可能比醫生更了解我們自身的身體狀況。或者說,搜索引擎將變得比我們自己更了解自己。

這是信息時代獨特的背景,對于效率的追求使我們不可避免的享受互聯網搜索引擎等服務帶給我們的信息服務,同時也不可避免的享受個人信息外泄的苦惱。搜索引擎的機器學習勢必需要越來越多的用戶信息,這與我們的隱私權存在本質上的沖突。或許,我們已經意識到這一點,但在效率面前對此無能為力。

給廣大工程師的建議:

計算機世界變化的速度是驚人的。程序員被認為是最接近計算機世界的職業,幾乎所有的科技新產品都得由程序員來寫代碼。

Shay Banon 建議廣大程序員要不斷地學習新的技能,并且銘記在過往使用那些技能時得到的經驗。有激情,并且熱愛這份職業,時刻站在終端用戶的角度去評估自己所編寫的軟件,而不是在封閉的空間里編寫代碼。

除此之外,程序員還要擅于借助工具,開發過程中選擇適合自己和項目開發所需要的工具。正所謂工欲善其事, 必先利其器。

寫在最后:馬云說過的這句話,“幫助年輕人,幫助弱小的人,因為小樹苗也可能成長為參天大樹。你將種子埋入這些年輕人的腦中,等他們成長起來,就可以改變世界。”

Shay Banon很喜歡這句話,幫助別人,讓別人強大,你才能更強大。這才是生命的意義。

本文由北郵@愛可可-愛生活老師推薦,阿里云云棲社區組織翻譯。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,622評論 6 544
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,716評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,746評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,991評論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,706評論 6 413
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 56,036評論 1 329
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,029評論 3 450
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,203評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,725評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,451評論 3 361
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,677評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,161評論 5 365
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,857評論 3 351
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,266評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,606評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,407評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,643評論 2 380

推薦閱讀更多精彩內容