初識大數據

最近幾年IT技術的發展真的是日新月異,什么云計算、大數據、機器學習、AI等等名詞層出不窮。多數程序員內心其實是恐慌的,我也時常會感到危機感。每每看到“xx培訓,大數據就業,錢景好”我嘴上說不要,身體還是很誠實的。

大數據已經深入我們的生活當中,今天呢我們也不聊4個V(Volume 規模大、Varity 多樣性、Velocity 高速性、Value 價值大)也不談數據挖掘,機器學習。就單純的用大白話聊聊大數據。

從哪里開始說呢,我們先馬后炮一句,可以說“大數據的出現是順應了潮流”。為什么這么講,我們回想一下。我們從PC時代進入了移動互聯網時代,現在又重提物聯網。聯網的設備越來越多,人們對于網絡的依賴時間越來越長,自然產生的數據就越來越大,種類也越來越多。在技術上呢我們發展出了分布式和云計算,分布式技術和云計算高速發展,進而推進了大數據發展的進程。自此大數據擁有了3個V,,天時地利。而最重要的是大量的數據里面存在著大量的價值,以致于各大互聯網企業想在大數據時代去獲得紅利(比如Google利用人們的搜索記錄挖掘數據二次利用的價值,Amazon利用用戶的購買和瀏覽記錄進行商品的針對性推薦等)。這就是最后一個V也就是人和。所以大數據技術也在飛速發展,發展成從采集、處理、存儲、計算到應用這么一個完整的體系。

看到這估計有很多大佬會說“這游戲真好玩,我要充錢!”。那么我們如何入門大數據呢。相信每個人都有自己的學習方法,我自己的經驗呢是首先要有大局觀,然后再深入實踐,最后補充基礎。因為計算機技術涉及到的知識非常廣,想把底子打好再學習相關技術是一件非常困難的事情,不是因為你底子打不好,而是你底子打好了技術也更新換代了。所以我們先從大局入手,對整個技術和行業有一個大的認識,再選擇某一塊進行具體的學習作為切入點,最終對整個行業有一個自己的認識。

概覽

bigdata.png

上面這張圖呢就是我自己根據大數據技術的特性進行分類,包含存儲、計算、常用工具、應用四大部分。每個分類下有常用的技術和開源項目等。我們先上圖,看看各個模塊都包含哪些技術。

存儲

storage.png

我這里把存儲分為兩類,一類是分布式文件存儲,一類是分布式數據庫。上面列出了常用的開源項目,比如HDFS,Hadoop的一大核心。Ceph 為OpenStack提供支持,HBase、Cassandra、MongoDB、Redis我們在工作中經常使用到。這么一看,大數據其實也不難對吧。

計算

count.png

這張圖就是對于大數據的處理和計算部分了,有Hadoop的另一大核心MapReduce,我們熟知的分布式計算引擎Spark和Flink,數據倉庫Hive,數據分析引擎Presto、Impala和Drill以及機器學習相關的模塊比如TensorFlow等等。這些都是我們接觸大數據之后經常用到的技術和工具。

常用工具

other.png

這張圖里面很多工具是早于大數據技術已經發展起來的,比如Solr、ES,還有很多是通用的工具比如可視化的工具superset。他們有一個共同的特點就是,好用??梢詭椭覀兘鉀Q很多問題,在大數據的場景也不例外,都是需要我們熟悉和了解的。

對于應用部分呢我不是太熟悉就不多介紹了。通過上面這幾張圖片呢我們可以先對大數據有一個大局觀。要想學好大數據技術,首先你要知道大數據如何存儲吧,要知道大數據如何處理和計算吧,要知道我們在大數據應用中常用的工具吧。這些了解之后我們可以深入的去了解某個技術使用方法,優缺點,適用場景,實現原理,體系架構,優化技巧等等。當我們對于行業內常用的技術都有了一個大致的了解之后,面對客戶的需求,不同行業的特性就可以提出針對性的解決方案,而不是空談大數據的規模大、多樣性、高速性和價值高了。

所以,你到現在有大局觀了嗎?快和我一起學習大數據吧。

歡迎關注我:叁金大數據(不穩定更新~~~)


qrcode_for_gh_efc75f192a16_258.jpg
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,619評論 6 539
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,155評論 3 425
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 177,635評論 0 382
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,539評論 1 316
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,255評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,646評論 1 326
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,655評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,838評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,399評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,146評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,338評論 1 372
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,893評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,565評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,983評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,257評論 1 292
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,059評論 3 397
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,296評論 2 376

推薦閱讀更多精彩內容

  • 關于Mongodb的全面總結 MongoDB的內部構造《MongoDB The Definitive Guide》...
    中v中閱讀 31,997評論 2 89
  • 一、 什么是大數據?大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合。大數據 = “...
    VVictoriaLee閱讀 679評論 0 0
  • 半年多前,進行過一次三天斷食。在三伏天的這次斷食純粹湊巧,天氣熱得沒胃口,忙得沒時間吃中飯,干脆輕斷食。多喝溫水,...
    李墨卿閱讀 2,932評論 2 10
  • 昨天在蠟像館,所有人都排隊要跟小貝照相的時候我突然在他身邊發現了鳥叔的蠟像 其實我很奇怪為什么在倫敦的蠟像館里,足...
    飛翔的帥閱讀 897評論 0 1
  • 兒子天生善良,一般不會給人當眾難堪,讓人下不來臺,遇到不想回答的問題或者不想做的事,他會轉移開來。比如,我讓兒子再...
    霖少爺閱讀 104評論 0 2