《大數據時代》總結

1.假如你的電腦上有兩張狗狗的照片,一張像素高,一張像素低,如果要看一個整體的輪廓,那么這兩張圖片的區別并不大,你可以清除地判斷出這是一只狗,可是如果你真想看看這只狗的眼睛什么顏色,皮毛、表情等這些很細致的東西,你會用放大鏡放大,這樣就可以看的清清楚楚,如果用像素低的照片則會越放大越模糊。這張清晰的圖片就是大數據,而那個看起來模糊的就是抽樣數據。這是大數據的第一個特點樣本量大。

2.數據不是數字,文字是數據、方位是數據、溝通是數據、世間萬物都是數據,數據化的核心是量化一切。

3.是維度特別大,一個城市的市長要搞GDP造假,但是用電量他就很難造假?。∪绻偌由鲜裁春jP的進出口數據啊,大宗消費品的銷售增長啊等等,那數據造假就不難識破

4. 預測是大數據的核心,通過研究相關性,而不是因果關系。如通過大數據發現,啤酒的銷量和紙尿褲的銷量成正相關,于是會捆綁促銷或者把這兩組產品放在相鄰的貨架上,而不必去問為什么。這種方法準確、快捷而且不易受偏見影像。

5.數據產業鏈分為三種,一種是采集數據,第二種是數據的分析,第三種是從數據的分析中找到創新和機會。

7.對將來的判斷,專家相對消亡,數據科學家崛起,數據科學家實際上是統計學家,統計專家,軟件程序員、圖形設計師和作家的合體。數據非常之多而且具有戰略重要性,但是真正缺少的是從數據中提取價值的能力。這也就是為什么統計學家、數據庫管理者和掌握機器理論的人是真正了不起得人。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容