隨著“大數據”應用的火爆,“地理大數據”逐漸成為了一個時髦的概念。“具有空間位置特征的地理信息數據天生具有大數據屬性”更是給這個概念打上了完美的注腳。地理信息從業者敏銳地捕捉到了技術發展的方向,推出了一些優秀得“地理可視化”產品。老俞在《地理數據可視化:Simple,Not Easy》一文中從應用的角度闡述了對地理數據可視化的看法。今天老俞打算從地理數據可視化概念本身出發,尋找地理可視化應用的引爆點。
揭開地理大數據的面具
地理空間數據天生就是大數據。這是一句容易讓人熱血沸騰的話。如今我們獲取地理空間數據的手段越來越多,除了衛星、無人機、移動測量車這些傳統測繪技術帶來的海量基礎測繪數據外,很多傳感器的實時監測數據、移動終端數據甚至各種UGC數據都構成了地理大數據。地理大數據滿足了大數據定義中海量數據(Volume)、快速的數據流轉和動態數據體系(Velocity)、多樣的數據類型(Variety)以及真實性(Veracity)等四個特征指標。
我們更多關注的是地理大數據的第五個特征指標:價值(Value),也就是地理大數據的功用,它能夠幫助用戶干什么? 地理大數據(主要是基礎測繪數據)在地表要素分析、遙感影像解譯等領域已經有了深入的應用,但在其它行業領域似乎還沒有太多典型應用。地理空間數據經過數據挖掘和數據分析后,需要揭示某些規律/行為模式/發展趨勢。它的核心價值是發現規律和預測趨勢,以便于最大限度地發揮業務潛力。這樣的地理空間數據才算得上真正意義的地理大數據。
單純的地理空間數據很難承擔起規律分析和趨勢預測的“重任”,只有和業務特征數據結合之后才能真正發揮大數據發現和預測的作用。這個結合點就是空間位置。空間數據被賦予業務屬性之后便擁有了大數據分析的基礎,業務數據裝上了空間屬性的翅膀后,才有機會在空間維度發掘數據價值。
地理可視化和地圖制圖
地理可視化是地理大數據應用的最后一公里。它涵蓋了一系列不同的規模,小到單個房產, 大到全球比例尺的海量地景數據的可視化。地理可視化充分利用了地理信息技術的空間數據可視化能力,用地圖的方式進行可視化表達,解決了大數據中空間位置表達的問題;同時,利用地理信息技術的空間分析能力,為地理大數據涉及到的大量空間分析提供了處理能力,在空間維度上初步實現了大數據的分析。
從本質上說,地理可視化開發了人的空間思維能力,使人們能夠更加容易的發現隱藏在空間位置背后的復雜關系,提供對隱藏現象的清晰認識,縮短搜索時間和揭示事物之間可能被忽略的關系。比起使用文本或數字描述,地理可視化更加有效的幫助用戶進行分析和學習,是一種用于探索、分析、綜合和表達的強大研究方法。
從地圖學/地理信息技術角度看,地理可視化是地圖和信息可視化的結合,是在地圖可視化基礎上衍生的一種研究方法。地圖是地理可視化的原型,地理可視化用地圖的方式提供了獨一無二的工具,讓人們可以對龐大復雜無法直接觀察的空間信息進行分類、表達和交流。
提到地圖表達,自然會想起地圖制圖。 事實上,地圖制圖作為地圖表達的一種既定表述方式和地理可視化是如此的相似,他們之間區別非常感性和微妙:地理可視化集成了數據可視化、地圖制圖、圖像分析、探索性數據分析和可視分析,其可視化結果應當引導并最終提供有助于輔助決策的洞察力。兩者的細微差別不在于地圖語言的表述,而在于最終結果的價值導向。
地理可視化是銀彈嗎?
地理可視化能否作為地理大數據分析表達的銀彈?我覺得,地理可視化至少還存在三個問題沒有解決。
- 地理可視化的效果是否存在標準的、有效的評價指標?
- 什么樣的地理可視化效果是有效的,為什么會有效?
- 針對某類地理大數據,它最好的地圖表達方法是什么?
地理數據可視化雖然是借助于地圖制圖的手段, 基于地圖清晰有效地發掘和傳達信息。但是,這并不就意味著,地理可視化就一定因為要實現其功能用途而令人感到枯燥乏味,或者是為了看上去絢麗多彩而顯得極端復雜。為了有效地傳達空間位置背后的信息概念,美學形式與功能需要齊頭并進,通過直觀地傳達關鍵的方面與特征,從而實現對于相當稀疏而又復雜的數據集的深入洞察。
從已有的幾款地理可視化產品使用體驗來看,產品設計本身往往并不能很好地把握地圖效果與數據探索之間的平衡。 有些地理可視化產品雖然堅持地圖設計的既定用語(地圖制圖規范),但其基于UGC生產的應用案例從地圖審美價值觀方面來說,相當難看;另一些地理可視化產品雖然能創造出優美的可視化效果, 但其對于真實世界的分析并不起任何作用。
地理可視化應用的引爆點
地理可視化作為數據可視化的分支,目的是要解決大數據在地理空間維度的相關問題。從地理可視化內在的地圖特性來看,我覺得,在三個應用場景可能存在引爆點:
- 網絡制圖應用
- 在線地理信息應用
- 基于特定意義的模型驅動
網絡制圖應用是用戶最為熟悉的產品設計形態。對于廣大不具備地圖制圖技術背景的用戶,網絡制圖應用不僅免去了專業制圖軟件高昂的購置費用,還簡化了地圖制圖表達要求,降低了地圖制作的技術門檻。作為一款優秀的網絡制圖應用,需要具備三方面的能力:第一,幫助用戶制作標準的、規范的、符合地圖表達要求的地圖;第二,能夠盡可能多的兼容用戶自有的數據格式,并且能引導用戶分析和制作有意義有價值的地理可視化產品(通過場景模板或地理分析業務模型);第三,能銜接用戶最終使用的真實應用場景,比如用戶創作的地圖產品能夠導入excel/word等常用軟件和。網絡制圖應用的另一種模式是地圖中間件的形式和某些特定行業的專業軟件(如金融行業/ERP軟件)進行集成耦合,滿足它們對空間數據的處理和表達需求。
在線地理信息應用以SaaS的形態向用戶提供專業的地理可視化服務,它隱藏了復雜的地理數據分析過程,把最終結果簡潔直觀的提供給用戶。在線地理信息應用產品的一種服務方式,是在滿足基本的地圖設計原則上,引入地理分析技術,比如:商業選址/路線動態規劃等;它的另一種服務方式是垂直業務模式,通過關注某類或某幾類行業的業務數據和業務需求,在線提供一套完整的業務解決方案,滿足大部分用戶基本的業務需求。實際上,網絡制圖應用和在線GIS服務正在慢慢的改變地理可視化和空間數據的生態環境,它們的未來發展目標是成為大眾可以使用的門戶服務之一,可以集成或者混搭到其它眾多應用中去。
基于特定意義的模型驅動是從地理大數據的大數據特性出發,強調大數據的規律發現和趨勢預測的能力。地理可視化的一個重要作用是基于地理空間數據可視化效果,為用戶提供輔助決策,引導用戶進行形態預測。也就是,基于地理大數據(復雜散亂的帶有業務特質的空間數據),抽象出業務特征維度,基于各種數據挖掘和分析形成客戶畫像,最終對客戶人群的行為做出預測。地理數據的空間描述永遠是簡單的X/Y/Z或標準地址編碼,而業務數據則是紛繁復雜各不相同。空間數據和業務數據的結合點就是空間位置,利用數據融合技術(海量數據清洗/處理/挖掘)融合兩種不同數據類型。基于一套符合行業業務需求的具有特定意義的業務模型,驅動數據在業務通道中流動,最后形成一個對真實數據背后隱藏的復雜關系有顯性指導意義的結論。