? ? ? ?在現代科技發展的浪潮中,隨著摩爾定律的應驗發展、PC互聯網和移動互聯網的突起,不僅在各行業造成數據量的冪級上升,軟硬件的發展也給大數據的收集、清洗、分析、應用帶來了可能,一大批公司(互聯網巨頭、傳統行業巨頭和新時期的大數據公司)懷揣夢想圍繞數據和數據應用展開了角逐,關于大數據的定義、應用、價值,企業與各界大數據大牛都給出了自己的獨到見解,關于數據的算法使用、數據模型建設的重要性隨著水漲船高,出現在大眾視野,普及型大增。
? ? ? ?大數據既屬于科技,同時科技的各方面數據又可以反過來為科技服務,所有的科技都只有在實踐中實現應用、量產、商業化,才不辜負它的誕生,才能真正為人類生活帶來福祉。身在專業做政企大數據應用的企業里,深感電子政務環境文化的濃厚與大數據應用發展與競爭的漩渦激流。
? ? ? ?大數據應用按照使用者總的領域分為三個:政用、商用、民用。深度應用覆蓋汽車、教育、醫療、科技、輿情、質監、公安等40多個行業。針對每個行業進行數據收集、需求分析,為各行業、各企業定制出個性化全方位的大數據應用系統。美國最著名的大數據公司Palantir曾幫助CIA成功通過數據分析找到了本拉登的線索,間接而無法推卸的導致本拉登被海豹突擊隊擊斃;還曾通過對各個銀行系統、數據交易系統的綜合分析,幫助各個銀行追回在華爾道夫詐騙案中被詐騙的幾十億美元財產;互聯網巨頭在數據方面對于競爭對手的摳搜、防護、保密、炫耀、對于數據在自家產品的深耕應用、將海量數據作為彰顯企業競爭力和提高企業估值的企業資產、應用產生數據-數據反哺應用的正向閉環,如此種種,大數據的神秘力量早已經滲透在我們的生活中啦!
? ? ? ?本人作為一名大數據產品汪,就結合所“孕育并正在出生過程中”的政務科技大數據產品從四個角度(應用策劃、方法論、項目方案側重點、應用點集合)闡述一下大數據應用方案的設計與實現:
一、 應用策劃:
1. “巨人的肩膀”:行業深耕本身的積累與應用洞察,對于大數據應用已經打造的一套通用方案作為底座,通用的方案包含了:輿情分析、預警系統、數據分析維度策劃、數據可視化呈現方案、數據安全保護、算法模型隨時待命、數據存儲分析框架的軟硬件配置。
2. 數據收集:“巧婦難為無米之炊”,大數據應用的資產是數據,在政務科技方案,需要收集政府部門的內部業務數據、相關部門的關聯數據,圍繞這些數據,收集PC互聯網和移動互聯網、新聞資訊、科技行業報告、國際國內科技行業情報、微博、微信、QQ、知乎等社交平臺的科技輿情數據,國家整體各省市科技發展分析數據。
3. 行業特性:科技政務數據具有鮮明的行業特色,需要響應國家科技發展策略,要緊隨科技發展大趨勢,充分調動地區各科技企業、研究機構、高校的高度重視和積極行動,及時保障各行業科技人才的持續輸出與培育,同時對科技專家既敬重又進行信用監督,不僅要推動科技項目的綠色申請與進行,又能保障科技項目的質量,對于項目給予的資金支持,量入為出,做一個盡職的管家婆。根據這樣的特性,在方案的設計上,基于數據的收集,基于行業特性,給出一個全面有效的規劃。
4. 客戶需求:設計方案的第一要素,“這個設計給誰用”至關重要!滿足客戶實際應用需求,是設計方案的基礎,產品能夠投放使用并且創造價值是設計方案目標!圍繞目標用戶,描繪用戶畫像,調研用戶需求,坐在客戶的位子上,從客戶角度進行思考,將客戶喜歡的產品體驗、風格、實際需求對已經設計出的方案進行細化描繪。
二、 方法論:
1. 模塊化:不僅在代碼編寫上對于功能進行模塊化開發,方案也可以從功能角度進行模塊化劃分和設計,一個一個的功能方案模塊不僅方便復用移植,在客戶不想要某個功能模塊的時候,可以方便刪除,而又不影響其他的部分,模塊劃分清晰明了,低耦合高復用。
2. 任務包與任務節點:方案的實施一樣需要量化,設計好的方案按功能分成不同的任務包,每個包中再劃分小的任務節點,方便估算方案實現的人力、物力、時間。
三、 項目方案側重點:
1. 初期需求采集:初期階段,要發散思維、開腦洞,根據客戶需求確定數據生態模型建設,在持續進行的數據收集工作結束之前,假定所有的數據都是可以獲取的,對于功能方案設計要盡善盡美,盡量全方位挖掘數據價值,匯總數據展示維度,根據數據應用分析,匹配適宜的可視化方式。
2. 項目方案初步定稿:項目方案定稿之后,將項目方案結構分成多個任務包,每個任務包再劃分多個任務節點,立項之后,根據方案建立項目組,找組員組隊打怪了。
3. 項目開發實現過程中:一個是數據實際情況,要根據收集數據的齊全程度以及維度,對方案設計進行微調與優化;要打破各業務部門之間的信息孤島,實現數據共享;要對歷史數據進行收集;這些都并非是容易的事情。數據丟失,各部門數據格式不統一,數據沖突,存儲數據由于人力硬件等原因,明確的只有一部分,在對數據清洗、去噪的過程中,對數據進行加工又是一個繁瑣慎重的工序。
另一個是客戶需求,期初的客戶需求都還在想像階段,是腦海中的完美演繹,這個跟買衣服一樣:想象中穿上會好看,但只有真試穿后才知道是否漂亮。在開發過程中,在每一個小任務點完成后,交給客戶再次確認,這個實際的體驗是否是他們想要的,根據客戶需求對方案不斷優化調整是個必經的過程。
4. 項目驗收:項目整體完成,設計方案成果終于變成現實中的樣子,當所有的功能點和客戶的需求碰撞在一起的時候,都會出現調整,盡量滿足客戶的應用需求的同時,也要考慮到數據本身的特性,積極溝通,使項目順利完成。
5. 項目上線:孩子出生后,放出去跑一跑,看看四肢是否健全,是否人見人愛花見花開,不管是方案還是產品,實際的反饋都是一個成長,對這些反饋進行記錄,一方面在產品的迭代更新中擇優上新,一方面反哺到方案,進行項目總結和方案設計總結。
四、 應用點:
1. 數據監測:數據的產生是實時的流動信息,對數據實時監測,實時顯示各方面數據的變動、科技項目數量、項目進度和負責人、項目的預算和產出、科技企業的科技成果與商業實現。
2. 數據對比:科技發展的國際趨勢、國內趨勢、某地區趨勢,當三條數據線放在一起時,對比的戲劇化效果就出來了,通過從時間和地域兩個維度,對數據進行橫向縱向對比分析,數據和目標數據的可視化對比,給客戶提供有效的決策支撐。
3. 未來預測:在海量的歷史數據中得出數據之間的相關關系,通過算法模型將關系表達出來。歷史都是循環往復的,當同樣的數據異常波動出現時,我們就可以知道接下來會發生什么,應該采取怎樣的措施應對。
4. 預警系統:我們對于系統的運行設置一些正常范圍的閥值,當超出正常范圍,發出預警信號,不同的程度使用不同等級的預警信息、預警強度、顏色標識,發送給不同等級的相關部門負責人處理,能及時引起重視,控制事態,找出原因。
5. 輿情系統:“聽見群眾的聲音”,實時監測輿論,企業和工作者的正負面輿論評價,輿論的來源、發布者、牽扯利益方、輿論導向、輿論影響力、輿論浪潮勢能??蛻裟芗皶r控制,及時了解底層信息。
6. 定向服務:不同的業務部門關注的點是不一樣的,業務職責的不同造成他們觀察世界的角度不同,除了通用的數據展示之外,根據不同的需求和觀察維度,定制設計出不同的數據挖掘方式、分析角度、展示方案。
7. 數據權限保護:數據安全和隱私保護是一項重中之重,是數據共享開放所帶來的硬幣另一面,對于數據設置權限,對于功能模塊設置權限,不同的業務部門、不同的人員角色看到的只是自己權限范圍之內的數據、不同的功能模塊。
? ? ? ?以上是對于產品工作和方案工作綜合的感悟,大數據的設計和實現是一個奇妙而充滿挑戰的過程,科技之美的樂趣與甘苦也正在于這樣翻越一座又一座的大山的過程中。