姓名:于川皓 學(xué)號(hào):16140210089
轉(zhuǎn)載自:https://www.zhihu.com/question/20176089/answer/23302503
【嵌牛導(dǎo)讀】:想做數(shù)據(jù)處理尤其是大數(shù)據(jù)量處理的相關(guān)工作必須兼具計(jì)算機(jī)科學(xué)基礎(chǔ)和統(tǒng)計(jì)基礎(chǔ)。
現(xiàn)在有一個(gè)高大上的職業(yè)叫數(shù)據(jù)科學(xué)家,有人說(shuō)數(shù)據(jù)科學(xué)家就是一個(gè)比程序員更懂統(tǒng)計(jì)的統(tǒng)計(jì)學(xué)家,一個(gè)比統(tǒng)計(jì)學(xué)家更會(huì)編程的程序員。覺(jué)得說(shuō)得很形象。
【嵌牛鼻子】:大數(shù)據(jù)
【嵌牛提問(wèn)】:微波殺菌的特點(diǎn)?
【嵌牛正文】:
想做數(shù)據(jù)處理尤其是大數(shù)據(jù)量處理的相關(guān)工作必須兼具計(jì)算機(jī)科學(xué)基礎(chǔ)和統(tǒng)計(jì)基礎(chǔ)。
現(xiàn)在有一個(gè)高大上的職業(yè)叫數(shù)據(jù)科學(xué)家,有人說(shuō)數(shù)據(jù)科學(xué)家就是一個(gè)比程序員更懂統(tǒng)計(jì)的統(tǒng)計(jì)學(xué)家,一個(gè)比統(tǒng)計(jì)學(xué)家更會(huì)編程的程序員。覺(jué)得說(shuō)得很形象。
<img src="https://pic3.zhimg.com/50/b36ae1d535cbb0fd4ec53b8bf78513ba_hd.jpg" data-rawwidth="852" data-rawheight="582" class="origin_image zh-lightbox-thumb" width="852" data-original="https://pic3.zhimg.com/b36ae1d535cbb0fd4ec53b8bf78513ba_r.jpg">
考慮到你還是在讀本科生,有很多知識(shí)和課程還需要作為基礎(chǔ)來(lái)學(xué)習(xí)和鞏固。
基礎(chǔ)中的基礎(chǔ):
線性代數(shù),概率論
核心知識(shí):
數(shù)理統(tǒng)計(jì)
預(yù)測(cè)模型
機(jī)器學(xué)習(xí)
計(jì)算機(jī):
數(shù)學(xué)軟件:強(qiáng)大矩陣運(yùn)算和優(yōu)化功能的matlab,專(zhuān)而精的mathematica。
語(yǔ)言:python(很流行的科學(xué)語(yǔ)言,潛力也很大,ipython這樣交互式環(huán)境十分有利),fortran(強(qiáng)大的計(jì)算語(yǔ)言,充分優(yōu)化的現(xiàn)成代碼),R(相比于matlab,java,c,R是個(gè)高富帥)
可視化
<img src="https://pic2.zhimg.com/50/14e81b9356cba0e6c0c18ad481f241bd_hd.jpg" data-rawwidth="508" data-rawheight="334" class="origin_image zh-lightbox-thumb" width="508" data-original="https://pic2.zhimg.com/14e81b9356cba0e6c0c18ad481f241bd_r.jpg">這是數(shù)據(jù)分析各類(lèi)語(yǔ)言使用度的圖表,R占的比例還是相當(dāng)高啊。想利用現(xiàn)在動(dòng)輒TB級(jí)的數(shù)據(jù)大顯身手,光靠excel可不夠啊。你真的需要寫(xiě)很多代碼…
這是數(shù)據(jù)分析各類(lèi)語(yǔ)言使用度的圖表,R占的比例還是相當(dāng)高啊。想利用現(xiàn)在動(dòng)輒TB級(jí)的數(shù)據(jù)大顯身手,光靠excel可不夠啊。你真的需要寫(xiě)很多代碼…
統(tǒng)計(jì):時(shí)間序列分析
應(yīng)用回歸(很簡(jiǎn)單,亦很實(shí)用)
多元統(tǒng)計(jì)分析
強(qiáng)烈推薦:Distance Education § Harvard University Extension School和哈佛的學(xué)生一起學(xué)習(xí)Data Science。
課后問(wèn)題的材料:http://cs109.org/
網(wǎng)絡(luò)課程同樣有豐富的資源:
機(jī)器學(xué)習(xí)類(lèi):
斯坦福大學(xué):機(jī)器學(xué)習(xí) coursera
數(shù)據(jù)分析類(lèi):
杜克: Data Analysis and Statistical Inference
約翰霍普金斯: Computing for Data Analysis
編程類(lèi):
萊斯大學(xué): Introduction to Interactive Programming in Python
MIT: Introduction to Computer Science & Programming in Python
相關(guān)問(wèn)題:
Data Science: What are some good free resources to learn data science?
Where can I learn pandas or numpy for data analysis?
What are some good resources for learning about statistical analysis?
Data Science: How do I become a data scientist?
What are some good "toy problems" in data science?
What are some good resources for learning about machine learning?
水平有限,歡迎補(bǔ)充。另外我制作了一個(gè)個(gè)人網(wǎng)站Daniel's Site on Strikingly和專(zhuān)欄DαΓαSciεηce - 知乎專(zhuān)欄希望激發(fā)更多人對(duì)data science 的興趣。
874?23 條評(píng)論
?分享
?收藏?感謝收起
數(shù)據(jù)挖掘工程師,DW,數(shù)據(jù)運(yùn)營(yíng)
收錄于編輯推薦·226 人贊同了該回答
海量數(shù)據(jù)分成兩塊,一是系統(tǒng)建設(shè)技術(shù),二,海量數(shù)據(jù)應(yīng)用。先說(shuō)系統(tǒng)建設(shè),現(xiàn)在主流的技術(shù)是HADOOP,主要基于mapreduce的分布式框架。目前可以先學(xué)習(xí)這個(gè)。但是我的觀點(diǎn),在分布式系統(tǒng)出來(lái)之前,主要是集中式架構(gòu),如DB2,oracle。為什么現(xiàn)在用分布式架構(gòu),那是因?yàn)楝F(xiàn)在集中式架構(gòu)受限于IO性能,出來(lái)速度慢,如果又一種硬件技術(shù),可以很快地處理海量數(shù)據(jù),性能上能滿足需求,那么集中式架構(gòu)優(yōu)于分布式架構(gòu),因?yàn)榧惺郊軜?gòu)穩(wěn)定,運(yùn)維壓力小。現(xiàn)在的集中式架構(gòu)要么性能達(dá)不到要求,要么就是過(guò)于昂貴。我期待一種技術(shù)出現(xiàn),可以非常快地傳輸和處理數(shù)據(jù),那么集中式架構(gòu)將再次進(jìn)入人們眼球。再說(shuō)海量數(shù)據(jù)應(yīng)用。海量數(shù)據(jù)應(yīng)用主要是數(shù)據(jù)挖掘和機(jī)器算法。具體有不同的應(yīng)用場(chǎng)景,如個(gè)性化搜索和推薦,社交網(wǎng)絡(luò)發(fā)現(xiàn),精準(zhǔn)營(yíng)銷(xiāo),精準(zhǔn)廣告,實(shí)時(shí)最優(yōu)路徑,人工智能等等。看你想做系統(tǒng)支撐技術(shù)還是與業(yè)務(wù)結(jié)合的應(yīng)用技術(shù)。
如果現(xiàn)在學(xué)系統(tǒng)建設(shè)技術(shù),可以讀下如下書(shū)籍:
<img src="https://pic3.zhimg.com/50/eb38178cf7fcf92db4c3655d6c06d462_hd.jpg" data-rawwidth="541" data-rawheight="202" class="origin_image zh-lightbox-thumb" width="541" data-original="https://pic3.zhimg.com/eb38178cf7fcf92db4c3655d6c06d462_r.jpg">
如果學(xué)數(shù)據(jù)挖掘和機(jī)器算法,推薦先看數(shù)據(jù)挖掘?qū)д摚y(tǒng)計(jì)分析原理,Mahout,R,MATLAB
226?18 條評(píng)論
?分享
?收藏?感謝
大數(shù)據(jù)話題的優(yōu)秀回答者
169 人贊同了該回答
1. 自己裝個(gè)小集群跑hadoop/hive,可以到cloudera網(wǎng)站上下現(xiàn)成的打包虛擬機(jī)。看看hadoop in action. 這本書(shū)比權(quán)威指南容易懂很多。
2. 裝個(gè)cassandra什么的玩玩,在上面架個(gè)小項(xiàng)目,比如留言板什么的。。
3. 讀一些著名的paper,nosql的或者mapreduce。
4. 看看apache hadoop家族的其他幾個(gè)項(xiàng)目,比如zookeeper,pig,了解一下生態(tài)圈
到這里為止你大概有個(gè)概念,知道bigdata怎么回事了
找個(gè)開(kāi)源項(xiàng)目,看看ticket list,看看能不能自己修。。
能的話看看能不能混進(jìn)項(xiàng)目組
個(gè)人覺(jué)得,大數(shù)據(jù)要靠實(shí)踐多一點(diǎn)。在真的上百上千節(jié)點(diǎn)的cluster上跑hadoop和自己虛擬機(jī)架的完全不同。cluster上跑各種奇葩的事情單機(jī)都是碰不到的。。就好比dba靠讀書(shū)考證很難牛屄一樣。所以最終還是要找個(gè)公司實(shí)戰(zhàn)。。不過(guò)如果上面幾個(gè)都做到的花,基本上應(yīng)聘大數(shù)據(jù)公司問(wèn)題不大了。
----------------------------------
做大數(shù)據(jù)平臺(tái)工作現(xiàn)在滿一周年多幾天,再看上面的答案覺(jué)得說(shuō)得不是很到位。
在國(guó)內(nèi)的環(huán)境下,似乎還是Hadoop用得更多,其他更fancy的東西比如presto/spark什么的,灣區(qū)也算是新鮮事物,并不是很多公司都在用(也有原因是真的適用的公司也不算太多了)。更實(shí)際節(jié)省的做法是,學(xué)Hadoop,至少要了解系統(tǒng)架構(gòu)和數(shù)據(jù)的流向,比如怎么partition,怎么shuffle,combiner怎么work之類(lèi)的大概念,對(duì)入門(mén)人士面試官大多也就是面這些,不會(huì)問(wèn)太深,再深入的問(wèn)題,是留給有行業(yè)經(jīng)驗(yàn)的人的。對(duì)剛?cè)腴T(mén)想入行的人,知道上面這些,再寫(xiě)寫(xiě)類(lèi)似Word Count(大數(shù)據(jù)版的helloworld),之類(lèi)的有個(gè)實(shí)際概念,就可以找公司面著玩看了。
其他東西可以都了解個(gè)皮毛,跟上社群的演進(jìn)。大數(shù)據(jù)更多是工程的東西,不是那么學(xué)術(shù),多看看比深挖一個(gè)對(duì)初學(xué)者更有好處。每個(gè)工具被發(fā)明,都是解決一個(gè)特定問(wèn)題的,大數(shù)據(jù)沒(méi)有一個(gè)產(chǎn)品是萬(wàn)能的,都是解決某個(gè)特定問(wèn)題來(lái)的,看到新鮮事物就想想為什么需要這樣的工具,背后有什么需求。
比如有了Hive為什么facebook還要搞Presto;為什么Hadoop 2.0要做Yarn。看的時(shí)候多想想這個(gè),視野就會(huì)更開(kāi)闊。
建議如果想深入學(xué)習(xí),沒(méi)有什么比找個(gè)真的做相關(guān)行業(yè)的公司來(lái)的靠譜了。工程的東西,尤其是這樣新鮮出爐的工程領(lǐng)域,光看書(shū)看資料是沒(méi)有任何用處的,你很難了解每個(gè)技術(shù)背后的關(guān)鍵,也很難了解實(shí)踐中會(huì)遇到的問(wèn)題。我之前打雜過(guò)的實(shí)驗(yàn)室,到處找客戶免費(fèi)用他們的產(chǎn)品,每個(gè)出去的學(xué)生都會(huì)義務(wù)跟雇主推薦實(shí)驗(yàn)室的產(chǎn)品,為什么,因?yàn)闆](méi)有真的在PB級(jí)別的數(shù)據(jù)上跑,你就不知道哪里設(shè)計(jì)有問(wèn)題。你深入看一個(gè)項(xiàng)目,就會(huì)發(fā)現(xiàn),其實(shí)用得技術(shù)沒(méi)什么新鮮深?yuàn)W的,比如你看Hive或者Presto,會(huì)發(fā)現(xiàn)用到的技術(shù),在Query引擎領(lǐng)域只能算是入門(mén)級(jí)的知識(shí),傳統(tǒng)數(shù)據(jù)庫(kù)廠商都用了幾十年了。真正好玩的是,每個(gè)Feature設(shè)計(jì)是如何切入大數(shù)據(jù)這個(gè)背景的。
所以說(shuō),沒(méi)有比找一家公司真的干一段時(shí)間更能讓你了解大數(shù)據(jù)的了。當(dāng)然請(qǐng)別被忽悠去拿大數(shù)據(jù)做噱頭的公司了。現(xiàn)在有些公司招聘,就算不用hadoop也會(huì)往上寫(xiě),反正去了老板會(huì)說(shuō),現(xiàn)在數(shù)據(jù)不夠,以后肯定會(huì)需要Hadoop的。
以上都是關(guān)于平臺(tái)方向的,數(shù)據(jù)方向的我完全不懂。
169?16 條評(píng)論
?分享
?收藏?感謝收起
搞一下算法,深一點(diǎn)的那種
20 人贊同了該回答
好吧,我來(lái)說(shuō)一下我的看法吧
首先
我由各種編程語(yǔ)言的背景——matlab,R,java,C/C++,python,網(wǎng)絡(luò)編程等
我又一定的數(shù)學(xué)基礎(chǔ)——高數(shù),線代,概率論,統(tǒng)計(jì)學(xué)等
我又一定的算法基礎(chǔ)——經(jīng)典算法,神經(jīng)網(wǎng)絡(luò),部分預(yù)測(cè)算法,群智能算法等
但這些目前來(lái)講都不那么重要,但慢慢要用到
Step 1:大數(shù)據(jù)理論,方法和技術(shù)
大數(shù)據(jù)理論——啥都不說(shuō),人家問(wèn)你什么是大數(shù)據(jù)時(shí),你能夠講到別人知道什么是大數(shù)據(jù)
大數(shù)據(jù)方法——然后別人問(wèn)你,那怎么實(shí)現(xiàn)呢?嗯,繼續(xù)講:說(shuō)的是方法(就好像歸并排序算法:分,并)。到目前外行人理解無(wú)障礙
大數(shù)據(jù)技術(shù)——多嘴的人繼續(xù)問(wèn):用的技術(shù)。
這階段只是基礎(chǔ),不涉及任何技術(shù)細(xì)節(jié),慢慢看慢慢總結(jié),積累對(duì)“大數(shù)據(jù)”這個(gè)詞的理解。
Step 2:大數(shù)據(jù)思維
Bang~這是繼Step 1量變發(fā)展而來(lái)的質(zhì)變:學(xué)了那么久“大數(shù)據(jù)”,把你扔到制造業(yè),你怎么辦?
我想,這就是“學(xué)泛”的作用吧,并不是學(xué)到什么具體東西,而是學(xué)到了對(duì)待事物的思維。
就像知友討論的:如何評(píng)價(jià)《Big Data:大數(shù)據(jù)時(shí)代》這本書(shū)?中有提到
這個(gè)我也朦朦的不懂 @.@
----------------------------------------------------------------------
以下階段我還沒(méi)開(kāi)始=_=,不好誤導(dǎo)大家
Step 3:大數(shù)據(jù)技術(shù)基礎(chǔ)
Step 4:大數(shù)據(jù)技術(shù)進(jìn)階
Step 5:打?qū)崙?zhàn)
Step 6:大融合
我現(xiàn)在也在學(xué)習(xí)之中~~這只是我自己為自己打算的學(xué)習(xí)歷程,歡迎給出各種建議~~
本來(lái)想回答你在評(píng)論里的提問(wèn),但是被提示不超過(guò)1000字...只能這里回答了。。。(跟問(wèn)題本身也有些相關(guān))
對(duì)@Du Crystal評(píng)論提問(wèn)的回答:
我現(xiàn)在回看了一下我原來(lái)答案,太糟糕了,雖然路線還可以,但好像也沒(méi)答到問(wèn)題的點(diǎn)子上(因?yàn)槲业狞c(diǎn)子是:打基礎(chǔ)就得了解概念先,后面才是聯(lián)系自己現(xiàn)狀調(diào)想學(xué)的東西,但看贊同最多好像是:這個(gè)領(lǐng)域什么技術(shù)比較熱?有哪些資源?)...
承蒙你的肯定,就回答一下你的問(wèn)題吧~
我覺(jué)得重要的還是:
1. 積累對(duì)(工業(yè))大數(shù)據(jù)的理解:定義和案例;
2. 不斷改進(jìn)自己的思維:要哪些能力?如何培養(yǎng)。
下面說(shuō)說(shuō)我的理解吧
1. 積累對(duì)(工業(yè))大數(shù)據(jù)的理解:定義和案例
大數(shù)據(jù)到目前為止也沒(méi)有統(tǒng)一的定義,但倒是有些觀點(diǎn)可借鑒一番:
(1)? ? Gartner的3V定義:
Volume,數(shù)據(jù)量大;
Velocity,數(shù)據(jù)更新速度快;
Variety,數(shù)據(jù)多樣性。
(2)? ? 維基百科/谷歌(我記得好像是...)的定義:
Big Data is a broad term for data sets so large or complex that traditional data processing applications are inadequate.(即 大數(shù)據(jù)指的是所涉及的資料量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理并整理成為幫助企業(yè)經(jīng)營(yíng)決策目的的資訊。)
這兩個(gè)定義,一個(gè)從“大數(shù)據(jù)”的屬性層面入手,一個(gè)從“大數(shù)據(jù)”的方法層面入手,以理解、定義大數(shù)據(jù)。網(wǎng)上有各種各樣的定義,這是我覺(jué)得比較好的兩個(gè)。
然而,一兩句化的定義是解決不了“對(duì)大數(shù)據(jù)的理解”這個(gè)問(wèn)題的,更多的是需要通過(guò)對(duì)大數(shù)據(jù)案例學(xué)習(xí)、對(duì)網(wǎng)上別人觀點(diǎn)和看法的吸收以及自己的實(shí)踐等渠道,來(lái)慢慢加深對(duì)大數(shù)據(jù)的理解,最終才能明白這些定義的隱含內(nèi)涵。
那我對(duì)這些定義的隱含內(nèi)涵的理解是什么呢?
(1)? ? 我覺(jué)得大數(shù)據(jù)的3V定義中,核心在于“Variety”(多樣性)上。其實(shí),我想表達(dá)的是:多數(shù)據(jù)源,或者說(shuō),解決問(wèn)題的多個(gè)視角。
對(duì)問(wèn)題的理解使得我們可以通過(guò)多個(gè)視角去考慮問(wèn)題,而不同的視角代表了不同的數(shù)據(jù)源,通過(guò)綜合這些數(shù)據(jù)源,我們可以得到更準(zhǔn)確、更精確的分析結(jié)果。而Volume(量)和Velocity(數(shù)據(jù)更新速度)只是Variety(多樣性)附帶的“紅利”而已:考慮的視角多了,數(shù)據(jù)量自然也大了,把動(dòng)態(tài)的視角考慮進(jìn)去,那么自然也就考慮了數(shù)據(jù)更新了。(例如,在考慮機(jī)器故障預(yù)測(cè)這件事上,我們不僅可以利用它加工出來(lái)的零件的尺寸這個(gè)數(shù)據(jù),也可以考慮機(jī)器本身的振動(dòng)信號(hào)、電壓電流信號(hào),甚至加工過(guò)程中產(chǎn)生的噪聲信號(hào)等等,那么我們從機(jī)器、零件、環(huán)境等多個(gè)視角考慮問(wèn)題,考慮多個(gè)數(shù)據(jù)源,從而實(shí)現(xiàn)了一個(gè)大數(shù)據(jù)應(yīng)用。)
數(shù)據(jù)采集受硬件約束,而硬件越來(lái)越便宜。多視角考慮問(wèn)題則受人的思維約束,同時(shí)也是更好解決問(wèn)題的主要瓶頸。所以,對(duì)問(wèn)題的理解和思考,應(yīng)該成為我們的優(yōu)勢(shì)所在。
(2)? ? 而維基百科關(guān)于大數(shù)據(jù)的定義,告訴我們算法、數(shù)據(jù)分析的困難和重要性將更上一層。而由于實(shí)現(xiàn)部分,不用制造考慮,交給IT部吧。
也就是說(shuō),一個(gè)定義分別告訴我們:多視角;另一個(gè):能做不可能的事情,雖然很難。
綜上,我認(rèn)為,(制造中)大數(shù)據(jù)應(yīng)該是一種基于多視角分析問(wèn)題,并利用高擴(kuò)展性、實(shí)時(shí)性的算法分析問(wèn)題的一種科學(xué)范式。
這樣還是很泛,真的制造大數(shù)據(jù)是很狹隘的(就目前而言)。
而無(wú)論是工業(yè)4.0,還是工業(yè)大數(shù)據(jù)或智能制造,從本質(zhì)上看就是IT技術(shù)(信息)與工業(yè)技術(shù)(物理)的融合,而制造的人將是這場(chǎng)融合中重要的催化劑:最貼近工業(yè)技術(shù),同時(shí)又能幾時(shí)吸收一些前沿IT技術(shù)的思想,將兩者融合以優(yōu)化制造流程!(你可以看看GE的那個(gè)白皮書(shū))
所以,其實(shí)對(duì)制造的大數(shù)據(jù),我還有一點(diǎn)想法:
切勿切勿切勿一心落到“大數(shù)據(jù)”中“大”的追求當(dāng)中!
McKinsey的報(bào)告中強(qiáng)調(diào),并不是說(shuō)一定要超過(guò)特定TB 級(jí)的數(shù)據(jù)集才能算是大數(shù)據(jù)。(Big Data: The Next Frontier For Innovation, Competition, And Productivity)而其實(shí)對(duì)于大數(shù)據(jù)上“量”閾值的界定,是取決于不同行業(yè)的,因此用一個(gè)單純的閾值來(lái)判斷是否是大數(shù)據(jù)是不實(shí)際的。
在制造步入數(shù)據(jù)化時(shí)代之際,更重要的是改變思維:以往無(wú)數(shù)據(jù)狀況下,只能依靠純粹機(jī)理的因果分析;而今獲取數(shù)據(jù)的渠道多樣且容易,應(yīng)該多考慮如何利用數(shù)據(jù)以輔助優(yōu)化、決策,而不單單利用機(jī)理分析!
最后,數(shù)據(jù)分析更貼近實(shí)際,而大數(shù)據(jù)分析可能是屠龍之技,是需要積累的(看看人家互聯(lián)網(wǎng)都積累那么久,現(xiàn)在都還沒(méi)多少很成功出名的大數(shù)據(jù)case)!
2. 不斷改進(jìn)自己的思維:要哪些能力?如何培養(yǎng)。
上面說(shuō)了,制造的人是Cyber Physics System中 cyber 和 physics融合的leader,那么作為leader得做什么呢?
(1) 啟動(dòng)智能制造模式;
(2) 明確所需能力,并培養(yǎng)及獲取。
領(lǐng)導(dǎo)做事并共同進(jìn)步。
啟動(dòng)智能制造模式
GE在提出工業(yè)互聯(lián)網(wǎng)時(shí)涉及了三個(gè)點(diǎn):傳感器、全新的互聯(lián)網(wǎng)連接(平臺(tái))和數(shù)據(jù)分析與技術(shù),這三個(gè)點(diǎn)結(jié)合實(shí)現(xiàn)了智能設(shè)備、智能系統(tǒng)和智能決策,從而支撐起工業(yè)互聯(lián)網(wǎng)的框架。
智能設(shè)備
為工業(yè)設(shè)備提供數(shù)字化設(shè)備是工業(yè)互聯(lián)網(wǎng)革命的第一步。而智能設(shè)備為這一步的實(shí)現(xiàn)提供了強(qiáng)大的基礎(chǔ):硬件成本的大幅下滑及物聯(lián)網(wǎng)技術(shù)的實(shí)現(xiàn)、成熟,使實(shí)時(shí)、全方位監(jiān)控設(shè)備、獲取設(shè)備數(shù)據(jù)成為可能,而微處理器芯片和大數(shù)據(jù)分析工具及分析技術(shù)的持續(xù)進(jìn)步,支撐了海量數(shù)據(jù)的處理。
這讓更廣泛的利益相關(guān)者能夠參與到資產(chǎn)維護(hù)、管理和優(yōu)化之中。它還確保在合適的時(shí)間引入本地和遠(yuǎn)程擁有相關(guān)機(jī)器專(zhuān)業(yè)知識(shí)的人。智能信息還可以返回至最初的機(jī)器。這不僅包括該機(jī)器產(chǎn)生的數(shù)據(jù),還包括可以加強(qiáng)機(jī)器、設(shè)施和大型系統(tǒng)的運(yùn)營(yíng)或維護(hù)的外部數(shù)據(jù)。這些數(shù)據(jù)反饋循環(huán)讓機(jī)器能夠從歷史中“學(xué)習(xí)”,從而控制系統(tǒng)更智能的運(yùn)行。
智能系統(tǒng)
智能系統(tǒng)不單單將智能設(shè)備、數(shù)據(jù)及人結(jié)合為一個(gè)整體,使智能信息在機(jī)器、系統(tǒng)網(wǎng)絡(luò)、個(gè)人或群體之間分享,推動(dòng)智能協(xié)作和更好的決策,還負(fù)責(zé)網(wǎng)絡(luò)優(yōu)化、維護(hù)優(yōu)化、系統(tǒng)恢復(fù)、學(xué)習(xí)等智能功能。
智能決策
工業(yè)互聯(lián)網(wǎng)的全部威力將通過(guò)第三個(gè)元素實(shí)現(xiàn)——智能決策。當(dāng)從智能設(shè)備和系統(tǒng)收集到足夠的信息以促進(jìn)數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)時(shí),智能決策就出現(xiàn)了,這反過(guò)來(lái)讓機(jī)器子集和系統(tǒng)網(wǎng)絡(luò)級(jí)運(yùn)營(yíng)功能從操作員轉(zhuǎn)到安全的數(shù)字系統(tǒng)。
明確所需能力,并培養(yǎng)及獲取
(1)? ? 精心制定的大數(shù)據(jù)規(guī)劃:
大數(shù)據(jù)及高級(jí)數(shù)據(jù)分析看起來(lái)漂亮,但就像戰(zhàn)略規(guī)劃一樣,需要無(wú)論是對(duì)制造等業(yè)務(wù)流程,還是對(duì)數(shù)據(jù)理解,都具有全局觀念和深刻認(rèn)識(shí)的人才、管理者(像Microsoft這樣的公司都需要請(qǐng)mu sigma這樣的數(shù)據(jù)處理公司做咨詢)。無(wú)論何時(shí),在推進(jìn)工業(yè)大數(shù)據(jù)的過(guò)程中,一定要有人總結(jié)關(guān)于公司的數(shù)據(jù)概況及其應(yīng)用案例。
(2)? ? 時(shí)刻關(guān)注三個(gè)關(guān)鍵能力的成長(zhǎng):
A.鑒別、結(jié)合及管理多種數(shù)據(jù)源:對(duì)自己部門(mén)相關(guān)的總體數(shù)據(jù)有深刻理解,對(duì)其他部門(mén)數(shù)據(jù)有一個(gè)數(shù)據(jù)概況的認(rèn)識(shí),并思考如何結(jié)合及管理。
B.? ? 構(gòu)建高級(jí)分析模型的能力。
C.? ? 為了確保數(shù)據(jù)和模型能夠真正生成更好的決策,管理層必須具備推動(dòng)轉(zhuǎn)變體制的能力:如賦權(quán)相關(guān)人員,組織扁平化,數(shù)據(jù)共享會(huì)等習(xí)慣。
(3)? ? 自動(dòng)化帶來(lái)的效益是明顯的,信息化建設(shè)則是長(zhǎng)期的;可能需要新的管理架構(gòu)、角色或分工在其中進(jìn)行協(xié)調(diào):
信息化建設(shè)是長(zhǎng)期且需要不斷投入的,大方向?qū)α耍€需要高執(zhí)行力的領(lǐng)導(dǎo)層及獨(dú)立部門(mén)人員進(jìn)行推行。