大數據這三個字想必大家都不陌生,但是起初它就像哥倫布發現的新大陸一樣,被認為是新時代的“啟明星”,充滿了神秘感。小編對商業領域頗感興趣,平日里也熱衷于閱讀這方面的書籍,自然大數據對小編來說也充滿了吸引力。生活中,我們手機上的許多軟件出現了“為你推薦”、“你可能喜歡”之類的功能,比如說某寶、某東、某度等等,而這也是小編對大數據的初步印象。在沒有深入了解大數據之前,小編是這樣揣測大數據的:人類活動的每一項數據都十分有價值,深層次地表現了人的本質特征,如果統計足夠多的數據,進一步加以分析,就可以從宏觀上帶來預測,然后取得巨大的商業利潤,就是這么簡單,所以大數據非常好。平心而論,這樣的想法是十分狹隘的,對于大數據的理解是非常淺層次和單調的,大數據的作用和帶來的影響遠非上述過程那樣簡單,并且任何事物都有其兩面性,所以看待事物要保持客觀性、全面性,對待大數據這樣的新事物更是如此,而大數據相關的問題在這本《大數據》里都比較系統的呈現出來了,小編看完之后有一種豁然開朗的感覺,對大數據有了比較全面的理解,不扯那么多,直接碼字吧。
為你推薦
維克托
一般來說,每本書的作者都是十分出眾的,小編一般也就看看而已,因為他們的頭銜看的真是心累,維克托也不例外。自然,維克托在大數據領域是一名權威專家了,是最早洞見大數據時代發展趨勢的數據科學家之一,二十多年來,一直致力于網絡經濟、信息和創新、信息監管、網絡規范與戰略管理的研究,先后有100多篇論文公開發表在《科學》《自然》等著名學術期刊上,開闊的學術視野和系統的學術造詣給他提供了強大的理論支持,他的咨詢客戶包括微軟、惠普、IBM、亞馬遜等大數據先鋒們。而在《大數據》出版之后,維克托從繼父去世留下的16000張收藏的照片中進一步探索,推出了又一力作《刪除》,該書也得到了各大權威媒體的廣泛好評。其實,大家只要知道,維克托在大數據領域很厲害,這就夠了,然而這一點似乎也是顯然的。
《大數據》
這本書的結構還是十分的清晰的,除去序言之后,本書只有三個篇章,分別闡釋大數據時代下的思維變革、商業變革和管理變革,每一個大的章節又都圍繞各自的主題分類展開,從較小的方面分條敘述,最后則留下的是維克托的一些思考,對于未來的展望。這樣的一個結構是一個標準的總——分——總三段式結構,跟我們高中語文老師教的方法相差無幾,好熟悉的味道啊~
你可能喜歡
思維變革
更多
這里的更多正是大數據帶來的第一個轉變:利用所有的數據,而不是僅僅依靠一小部分數據。在過去,因為記錄、存儲和分析數據的工具不夠好,我們只能收集少量數據進行分析,于是我們開始提取具有代表性的樣本,用樣本估計整體的方法一直都是很有效的,至少在過去我們對此深信不疑,這就是在小數據時代的隨機采樣,用最少的數據獲得最多的信息。但這只是一條捷徑,是在不可收集和分析全部數據的情況下最好的選擇,然而大數據技術的出現則打破了這種限制,大數據是指不用隨機分析法這樣的途徑,而采用全部數據的方法。這就意味著大數據的樣本就是總體,采集到的數據不再是局部的有代表性的那一小部分,數據更多了,慢慢地,我們很可能會完全拋棄樣本分析。
更雜
大數據通常用概率說話,而不是板著“確定無疑”的面孔,整個社會要習慣這種思維需要很長的時間,其中也會出現一些問題,但現在有必要指出的是,當我們試圖擴大數據規模的時候,要學會去擁抱混亂,要學會接受不確定性。很多時候,當數量很大時,一個系統往往只會顯示近似值,這并不代表系統不知道確定的數據是多少,只是當數量規模變得足夠大時,確切的數量已經不那么重要了,據估計,只有5%的數字數據是結構化的,適用于傳統的數據庫,但是如果只接受確定性而不接受混亂,那么剩下的95%的非結構化的數據都無法被利用,這樣我們就不會去使用更多的數據了,但對于很多事情,快速地獲得一個大概的輪廓和發展脈絡,要比嚴格的精確性重要的多。過去精確性似乎一直都是我們生活的支撐,凡事都試圖去尋找一份標準答案,然而每個問題只有一個答案的想法是非常站不住腳的,不管我們承不承認。一旦我們承認這個事實,也就是承認數據變得更雜了,那么我們離真相就又近了一步。
更好
大數據的核心之一就是建立在相關關系分析法基礎上的預測,相關關系的核心是量化兩個數據值之間的相關關系,也就是指當一個數據發生變化時,另一個數據會相應地發生什么變化,這可以幫助我們捕捉現在和預測未來。這個系統依賴的是相關關系,而不是因果關系,它告訴你的是會發生什么,而不是為什么發生。過去在小數據時代,因為對于整體認知的缺乏,只能依據小部分的關鍵數據做出預測,這就必然要去理解前后的因果關系,這才具有前后的邏輯性;但是大數據時代為我們提供了新的視角,它展現的就是整體本身,對于“是什么”的問題有更為直接的預測,這幫助我們更好地了解了這個世界,在這樣的一個過程中,數據更好地展現了一種探索世界的新視角。
商業變革
數據化
數據代表著對某件事物的描述,它可以記錄、分析和重組,而數據化就是指一種吧現象轉變為可制表分析的量化形式的過程,也就是說,量化一切是數據化的核心。讓我們來看一個數據化帶來商業上的巨大變革:2004年,谷歌開始把所有版權條例允許的書本內容進行數字化,然后將這些數字化圖像轉化為數據化文本,這樣一來,信息的巨大價值就被挖掘出來了,人可以閱讀,機器也可以用于分析,量化這一切之后一系列增值服務便產生了,帶來的商業價值無法想象。這就是文字數據化的商業變革,此外,方位數據化產生了虛擬地圖和定位功能,溝通數據化產生了各種社交平臺,也就是說,一旦世界被數據化,就只有你想不到,而沒有信息做不到的事情了,我們開始意識到世界本質上是由信息構成的,這為我們提供了一個從未有過審視現實的視角,它是一種可以滲透到所有生活領域的世界觀。
價值
不同于物質性的東西,數據的價值不會隨著它的使用而減少,而是可以不斷地被處理,它的價值不限于特定的用途,可以為了同一目的而被多次使用,也可以用于其他的目的,我想這一點是非常好理解的,就比如說,阿里巴巴和眾多的快遞公司之間的數據對接,才使得這樣的一種O2O模式可以正常運轉,這里數據對雙方的商業價值不言而喻。數據所代表的潛在價值是巨大的,可以多次利用,可以組合利用,可以創新利用,你很難將數據的價值解釋清楚,你唯一清楚的就是數據的價值不可估量。
角色定位
我們正處于大數據時代的早期,思維和技術是最有價值的,但是數據的角色定位會變得越來越重,最終大部分的價值還是會從數據本身中挖掘。那么使用數據的公司和個人是如何融入大數據價值鏈中的呢?首先,根據所提供價值的不同來源,分別出現了三種大數據公司,分別是基于數據本身的公司,比如說Twitter;基于技能的公司,通常是一些咨詢公司、技術供應商和分析公司;基于思維的公司,比如說Jetpac就是通過想法來獲得價值的公司。再說到個人,越來越多的行業專家都已經“消亡”,取而代之的是數據科學家的崛起,從而產生了各種大數據先鋒,他們是數據分析家、人工智能專家、數學家或者統計學家,他們將它們掌握的技能運用到了許多的領域,過去的主導地位會因為大數據而發生很大的改變。在未來,我們可以利用數據做更多的事情,而數據擁有者也會真正意識到他們所擁有的財富,這就是數據帶來的角色轉變,給世界帶來了前所未知的新鮮色彩。
管理變革
風險
大數據帶來巨大的創新性的同時,風險也正變得越來越不可控,沒有任何組織或個人能夠保證自己的數據不被濫用。除了對隱私的不良影響,大數據的濫用也會導致不公平,比如冒險把定罪權放在了數據手中,如果在隱私和預測方面對大數據管理不當,或者出現數據分析錯誤,其所導致的不良后果比定制化的在線廣告要嚴重的多,而不利的一面是,在大數據時代,不管是告知與否、模糊化還是匿名化,這三大隱私保護策略都失效了,當大數據變得更加普遍的時候,情況將更加不堪設想。因此,這些方面給我們一個巨大的警示,必須杜絕對數據的過分依賴,以防讓我們成為數據的奴隸。
掌控
當世界邁入大數據時代時,社會也將經歷類似的地殼運動。在改變人類基本的生活與思考方式的同時,大數據早已在推動人類信息管理準則方面重新定位。這里維克托羅列了幾條管理上的變革:第一,個人隱私保護從個人許可到讓數據使用者承擔責任,對大數據使用進行評測和正確的引導,可以更好地保護個人的隱私;第二,拓寬公正的理解,把對個人動因的保護納入進來,而不能單純地依靠大數據做出的預測對一個人進行評判,如若不然,公正的信念就有可能被破壞;第三,大數據將需要被監測并保持透明度,當然還需要新的專業技術和機構,否則大數據復雜算法的“黑盒子”將帶來巨大的風險。
大數據時代的到來揭示了信息社會的面紗,數據已經變成了一種“武器”,變成了一種“財富”,而且它所帶來的正反兩面的效應復雜交錯,小編覺得處于大數據早期的我們是比較“和平”的時期,然而接下來,隨著技術的深入,很可能會出現從未有過的“混亂期”,這是公司或者個人都無法控制的,但不必過于悲觀,小編認為,市場的游戲規則能夠將大數據產生的混亂有效地控制下來,畢竟不管技術如何發展,人始終都是主導因素,任何的社會或者商業活動都脫離不了人這個主體而單獨存在,因此這一點是樂觀的。總之,在看完這本書之后,小編對大數據的了解不再是先前的那種簡單邏輯了,對于大數據背后的邏輯有了一個更加全面的把握,感覺眼界和思維提升了不止一個檔次呢,嘻嘻。
晚安~