B
批處理(Batch processing):盡管批量數據處理從大型機(mainframe)時代就已經存在了,但是在處理大量數據的大數據時代面前,批處理獲得了更重要的意義。批量數據處理是一種處理大量數據(如在一段時間內收集到的一堆交易數據)的有效方法。分布式計算(Hadoop),后面會討論,就是一種專門處理批量數據的方法。
行為分析(Behavioral Analytics):你有沒有想過谷歌是如何為你需要的產品/服務提供廣告的?行為分析側重于理解消費者和應用程序所做的事情,以及如何與為什么它們以某種方式起作用。這涉及了解我們的上網模式,社交媒體互動行為,以及我們的網上購物活動(購物車等),連接這些無關的數據點,并試圖預測結果。舉一個例子,在我找到一家酒店并清空購物車后,我收到了度假村假期線路的電話。我還要說多點嗎?
商業智能(Business Intelligence):我將重用 Gartner 對 BI 的定義,因為它解釋的很好。商業智能是一個總稱,包括應用程序、基礎設施、工具以及最佳實踐,它可以訪問和分析信息,從而改善和優化決策及績效。
生物測定學(Biometrics):這是一項 James Bondish 技術與分析技術相結合的通過人體的一種或多種物理特征來識別人的技術,如面部識別,虹膜識別,指紋識別等。
描述性分析法(Descriptive Analytics):如果你只說出自己去年信用卡消費情況為:食品方面 25%、衣物方面 35%、娛樂方面 20%、剩下 20% 為雜項開支,那么這種分析方法被稱為描述性分析法。當然,你也可以找出更多細節。
大數據科學家(Big Data Scientist):能夠設計大數據算法使得大數據變得有用的人
大數據創業公司(Big data startup):指研發最新大數據技術的新興公司
B字節 (BB: Brontobytes):約等于1000 YB(Yottabytes),相當于未來數字化宇宙的大小。1 B字節包含了27個0!
大數據 (Big data):指的是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
數據科學平臺(Data science platforms):是數據科學家創造和測試數據科學解決方案的工作平臺。按照高德納的定義,數據科學平臺是“由緊密相關的多項數據處理核心技術模塊組合而成的軟件系統,以支持各類數據科學解決方案的開發及其在業務流程、周邊基礎設施和產品中的應用。