作者:Thomas Maydon, Principa. ? ?翻譯:Jason Ye, TalkingData.
在我過去的博客文章中,我們已經介紹了數據分析的一些基本原理和陷阱。在這篇博文中,我們專注于數據科學中會遇到的四種數據分析:描述性分析,診斷性分析,預測性分析和規范性分析。
當我與剛剛進入數據科學世界的年輕分析師相遇時,我經常會問他們“你認為數據科學家最重要的技能是什么?”。他們的答案是非常多樣。
我對他們的回饋是:數據科學家最重要的技能應該是將數據轉化為非定量的、清晰的、有意義的見解的能力。瑞典統計學家漢斯·羅斯林(Hans Rosling)為此而聞名。這是一個經常被忽視的技能。
以下是Hans Rosling在“Ted Talk”的一次演講所散發出的光芒:
視頻鏈接:https://www.youtube.com/embed/hVimVzgtD6w?feature=oembed
圍繞今天主題,非常有必要為大家詳細介紹一些幫助個人如何使用分析相關的知識提煉出有價值的見解的工具。其中的一款工具就是四維范式分析。
簡單地,可以將數據分析分類成四個主要類型。下面我將會詳細介紹里面的細節。
一、描述性分析:發生了什么?
這是所有形式中最常見的。在業務中,它為分析人員提供了業務中關鍵指標和措施的視圖。
例如公司每月的收支表。類似地,分析師可以獲得大量客戶的數據。了解客戶的人口統計信息(例如我們的客戶的30%是個體經營者)將被歸類為“描述性分析”,利用有效的可視化工具可以增強描述性分析的信息。
二、診斷性分析:為什么發生?
這是數據分析的復雜性的下一步是診斷性分析。在對描述性數據進行評估時,診斷分析工具將使分析師能夠深入到細分的數據,從而隔離出問題的根本原因。
精心設計的商業信息(BI)儀表板包含讀取時間序列數據(即多個連續時間點的數據),并具有過濾器和鉆取能力,可進行此類分析。
三、預測性分析:將發生什么?
預測分析是關于預測的。無論是將來發生事件的可能性,預測可量化的數量還是估計可能發生事件的時間點。這些都是通過預測模型完成的。
預測模型通常利用各種可變數據進行預測。組件數據的變異性將與可能預測的關系(例如,一個較老的人,他們對心臟病發作的敏感程度越高-我們會說年齡與心臟病發作風險呈線性相關),然后將這些數據一起編譯成分數或預測。
在一個很大的不確定性的世界中,能夠預測能夠做出更好的決定。預測模型是許多領域中最重要的一些模型。
這是預測中需要避開的坑:http://insights.principa.co.za/the-top-predictive-analytics-pitfalls-to-avoid
四、規范性分析:需要做什么?
在價值和復雜性方面的下一步是規范性模式。規范模型利用對發生的事情的理解,為什么發生了這種情況以及各種“可能發生的”分析,以幫助用戶確定采取的最佳行動方案。規定性分析通常不僅僅是一個單獨的行動,而且實際上是其他一些行動。
一個很好的例子是一個交通應用程序,幫助您選擇最佳路線回家,并考慮每個路線的距離,每個路上可以行駛的速度,以及當前的交通限制。
另一個例子可能是制作考試時間表,使得各個班級的學生沒有沖突的時間表。
總結
雖然不同形式的分析可能為企業提供不同數量的價值,但它們都具有自己的位置。要了解數據分析如何為您的業務帶來更多價值,請給我們發郵件以安排聊天。