C
點擊流分析(Clickstream analytics):用于分析用戶在網絡上瀏覽時的在線點擊數據。有沒有想過即使在切換網站時,為什么某些谷歌廣告還是陰魂不散?因為谷歌大佬知道你在點擊什么。
聚類分析(Cluster Analysis):是一個試圖識別數據結構的探索性分析,也稱為分割分析或分類分析。更具體地說,它試圖確定案例的同質組(homogenous groups),即觀察、參與者、受訪者。如果分組以前未知,則使用聚類分析來識別案例組。因為它是探索性的,確實對依賴變量和獨立變量進行了區分。SPSS 提供的不同的聚類分析方法可以處理二進制、標稱、序數和規模(區間或比率)數據。
比較分析(Comparative Analytics):因為大數據的關鍵就在于分析,顧名思義,比較分析是使用諸如模式分析、過濾和決策樹分析等統計技術來比較多個進程、數據集或其他對象。我知道它涉及的技術越來越少,但是我仍無法完全避免使用術語。比較分析可用于醫療保健領域,通過比較大量的醫療記錄、文件、圖像等,給出更有效和更準確的醫療診斷。
關聯分析(Connection Analytics):你一定看到了像圖表一樣的蜘蛛網將人與主題連接起來,從而確定特定主題的影響者。關聯分析分析可以幫助發現人們、產品、網絡之中的系統,甚至是數據與多個網絡結合之間的相關連接和影響。
Cassandra:是一個很流行的開源數據管理系統,由 Apache Software Foundation 開發并運營。Apache 掌握了很多大數據處理技術,Cassandra 就是他們專門設計用于在分布式服務器之間處理大量數據的系統。
云計算(Cloud computing):構建在網絡上的分布式計算系統,數據是存儲于機房外的(即云端),軟件或數據在遠程服務器上進行處理,并且這些資源可以在網絡上任何地方被訪問,那么它就可被稱為云計算。
集群計算(Cluster computing):這是一個來描述使用多個服務器豐富資源的一個集群(cluster)的計算的形象化術語。更技術層面的理解是,在集群處理的語境下,我們可能會討論節點(node)、集群管理層(cluster management layer)、負載平衡(load balancing)和并行處理(parallel processing)等等。
分類分析(Classification analysis) :從數據中獲得重要的相關性信息的系統化過程; 這類數據也被稱為元數據(meta data),是描述數據的數據。
商業分析(Commerce analytics):指的是包括審視預計的銷售額、成本和利潤是否達到公司預計目標;如達到,則此產品概念才能進一步發展到產品開發階段。
聚類分析(Clustering analysis) – 它是將相似的對象聚合在一起,每類相似的對象組合成一個聚類(也叫作簇)的過程。這種分析方法的目的在于分析數據間的差異和相似性。
冷數據存儲(Cold data storage) – 在低功耗服務器上存儲那些幾乎不被使用的舊數據。但這些數據檢索起來將會很耗時。
眾包(Crowdsourcing):從一廣泛群體,特別是在線社區,獲取所需想法,服務或內容貢獻的實踐。
集群服務器(Cluster server):把多臺服務器通過快速通信鏈路連接起來,從外部看來,這些服務器就像一臺服務器在工作,而對內來說,外面來的負載通過一定的機制動態地分配到這些節點機中去,從而達到超級服務器才有的高性能、高可用。
對比分析(Comparative analysis) – 在非常大的數據集中進行模式匹配時,進行一步步的對比和計算過程得到分析結果。
復雜結構的數據(Complex structured data) – 由兩個或多個復雜而相互關聯部分組成的數據,這類數據不能簡單地由結構化查詢語言或工具(SQL)解析。
計算機產生的數據(Computer generated data) – 如日志文件這類由計算機生成的數據。
并發(Concurrency) – 同時執行多個任務或運行多個進程。
相關性分析(Correlation analysis) – 是一種數據分析方法,用于分析變量之間是否存在正相關,或者負相關。
客戶關系管理(CRM: Customer Relationship Management) – 用于管理銷售、業務過程的一種技術,大數據將影響公司的客戶關系管理的策略。
云數據(Cloud data):是基于云計算商業模式應用的數據集成、數據分析、數據整合、數據分配、數據預警的技術與平臺的總稱。