數據分析師業(yè)務模型基礎篇

一、數據分析的定義:

數據分析的目就是把隱藏在一大批看似雜亂無章的數據背后的信息集中和提煉出來,總結出所研究對象的內在規(guī)律。


二、數據分析過程:

第一步、以事實為基礎提出假設,界定問題

第二步、將問題細分,形成互不重疊的子問題

第三步、進行數據收集與分析,證實或者證偽假設的問題

第四步、提出方案,推進問題的解決

第五步、執(zhí)行方案,驗證數據分析。


三、數據的種類:


統計學上把數據分為三類,分類數據,順序數據,數值數據

分類型數據:主要是對事物的類別進行描述,比如電商網站中的品類,社交系統中用戶的等級

順序型數據:顧名思義,就是按照順序排列的數據,這種數據也是文字的,如時間順序,空間順序,優(yōu)先等級

數值型數據:最常見的數據類型,用數字或文字描述事物,是 數據分析的主要來源


四、數據分析的種類有三種:


1,描述性數據分析:常用對比分析法,平均分析法,交叉分析法。

算數平均數:算數平均法和加權算術平均法簡單方便,容易受異常值影響。

幾何平均數:主要用于 對比率,指數進行平均,用來計算平均發(fā)展速度,用來計算復利下的平均年利率,在變量可能為負數和零的時候,不能使用,當數據呈倍數關系或者不對稱分布時適用性強。

調和平均數:也叫倒數平均數,主要是用來解決無法掌握總體單位數的情況下,只有每組的變量值和相應的標志總量,而需要得到平均數的問題,通常在遇到需要計算平均速度,平均利潤,平均成本指標時使用,尤其是觀測值是階段性變異的資料。

2,探索性數據分析:相關分析法,因子分析法,回歸分析法

3,驗證性數據分析:同上


五、數據分析的作用


主要三作用:現狀分析,原因分析,預測分析


六、數據分析操作過程:


1.明確目標:搜集和明確數據分析上下游需求,資源,能力和表達形式,時間節(jié)點等。

2.數據獲取:從數據庫,公開出版物,互聯網,市場調查等方面搜集數據。

3.數據清洗:數據清洗,數據轉化,數據提取,數據計算,具體包括數據整理入庫,去除無效? 數據,填充缺失信息,選擇變量

? 第一階段:預處理,數據導入,元數據分析,觀察數據,一般來說100萬條以下用excel,單機大量? 100萬條以上MYSQL+Navicat,單機海量1000萬條以上,文本文件+python

? 第二階段:去除補齊有缺失的數據

? 第三階段:去除修改格式和內容錯誤的數據

? 第四階段:去除不需要的數據

? 第五階段:去除不需要的數據

? 第六階段:關聯性驗證

4.數據整理:數據離散化,數據標準化,對數據進行重新編碼,對數據表進行統計計算,生成各級指標,主要的目的是將清洗后的數據進行統一格式,集中存儲。

5.數據分析:數據分析是將處理后的數據進行建模分析,描述分析,模型測試,價值提取,高層次的分析方法也叫數據挖掘,數據挖掘側重解決四類問題,分類,聚類,關聯,預測

6.數據展現:餅圖,柱狀圖,條形圖,折線圖,雷達圖等等

7.報告撰寫:將模型加載,對數據分析過程總結和呈現‘


七、數據分析報告邏輯


結論先行,數據跟上,邏輯自恰,描述觀點,一般以總分總模式為主;


八、數據分析模型:


事實上是使用常見的企業(yè)分析方法論,設計數據分析的維度和范圍,常用的方法包括

1、思考模型

5W+2H:為什么,什么目的,誰,那個領域,什么時候,怎么做

金字塔模型

魚骨圖模型

事實--解釋--行為

水平思考,事實,感情,批判,樂觀,創(chuàng)造,宏觀

2、戰(zhàn)略分析工具

戰(zhàn)略-3C 公司,對手,顧客

戰(zhàn)略規(guī)劃,橫軸表示競爭要素,縱軸表示競爭水平

對業(yè)務進行優(yōu)先排序,縱軸表示公司優(yōu)勢,橫軸表示市場價值

SWOT矩陣,優(yōu)勢,弱點,機會,危機

影響要素,五個力分析,供應鏈的變化,需求鏈變化,技術沖擊,新進入者,有無替代者

組織7S,保持戰(zhàn)略,共同價值,結構,體制,員工,技能,組織文化


3.市場營銷分析模型


市場4P,產品,價格,渠道,廣告

銷售漏斗模型

根據收入分類的家庭數量的相對度分布,

人口分布曲線,

意愿能力矩陣

用戶發(fā)布,技術革新者,有號召力的人,早期用戶,后期跟風,滯后采用的

服務營銷三角形,服務營銷的滲透的過程中,最初關注功能,然后轉移到渠道,最后由品牌影響力

PPM分析,縱軸表示成長率,市場占有率,分為,兒童業(yè)務,明星業(yè)務,瘦狗業(yè)務,現金牛

VRIO分析,價值,稀缺性,跟進難度,組織能力

4.常見管理模型


六西格瑪

PDCA循環(huán),計劃,實施,改善,驗證,

價值鏈,橫軸表示研究,開發(fā),采購,生產,流通,銷售,售后,縱軸表示競爭對手

緊迫性和重要性的矩陣,重要性和緊迫性


九、數據挖掘模型


聚類:kmeans、系統層次聚類

分類:相似度計算、決策樹

回歸:邏輯回歸,線性回歸

降維:主成分分析、因子分析,對應分析/mds

文本挖掘:Word2vec、DOC2ver/LDA、文本相似度計算

時間序列等等

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,117評論 6 537
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 98,860評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,128評論 0 381
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,291評論 1 315
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,025評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,421評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,477評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,642評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 49,177評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,970評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,157評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,717評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,410評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,821評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,053評論 1 289
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,896評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,157評論 2 375

推薦閱讀更多精彩內容