本次先講下整體框架和關(guān)系,后續(xù)我會更新相關(guān)的使用教程。
隨著數(shù)據(jù)分析工具的不斷更新,我們所熟知的Excel可能已經(jīng)不是你想象中的樣子了。
Excel和Power BI又有何千絲萬縷的聯(lián)系?
M語言和DAX語言又是什么樣的存在?
操作他們又需要掌握什么樣的技能?
通過我的講解,從此你將發(fā)現(xiàn)一扇通往新世界的大門,開啟你新的人生,讓我們啟航吧!
為方便書寫,以下內(nèi)容使用簡寫
Power Query : PQ
Power Pivot : PP
Power BI Desktop : PBI
一、先讓我們大致了解下他們的聯(lián)系
關(guān)系說明:
在Office2010時(shí)代,BI組建均以插件形式存在;2013時(shí)代,除了PQ,其他插件已全部內(nèi)置;2016時(shí)代已全部內(nèi)置相關(guān)插件;而Power BI就是將這些插件打包起來做了一個(gè)獨(dú)立的軟件,更加方便我們的使用,同時(shí)提供了在線版、移動(dòng)版、桌面版,而我們通常所說的PBI指的就是Power BI的桌面版(Power BI Desktop)。其中BI組件包含Power Query、Power Pivot、Power View、Power Map四個(gè)。操作Power Query需要學(xué)習(xí)M語言、操作Power Pivot需要學(xué)習(xí)DAX語言,兩則均屬于函數(shù)式編程。而Power View和Power Map主要是做可視化,在Excel里面不是重點(diǎn),已經(jīng)逐漸被更為強(qiáng)大的PBI的儀表板取代。
Power BI系列組件:
Power BI 是一套商業(yè)分析工具,用于在組織中提供見解,全稱:Power-BI決策分析系統(tǒng)。可連接數(shù)百個(gè)數(shù)據(jù)源、簡化數(shù)據(jù)準(zhǔn)備并提供即時(shí)分析。集數(shù)據(jù)獲取、整理、呈現(xiàn)與一體。早期作為插件和Excel搭配使用,后續(xù)逐漸內(nèi)置到Excel當(dāng)中,現(xiàn)在已經(jīng)開發(fā)出來獨(dú)立的軟件可以使用。
二、對各部分做個(gè)簡單的介紹
Office Excel
關(guān)于Office辦公軟件就不做過多的介紹了,只需要知道從Excel 2010開始才涉及到我們今天開始講的內(nèi)容,這之前的版本比如2003版和2007版均不支持相關(guān)功能。
Excel 中可用的三大數(shù)據(jù)分析工具:
Power Query
Power Query 是一種數(shù)據(jù)連接技術(shù),可用于發(fā)現(xiàn)、連接、合并和優(yōu)化數(shù)據(jù)源以滿足分析需要。Power Query 的功能在 Excel 和 Power BI Desktop 中可用。通常需執(zhí)行一些常見步驟才可使用 Power Query。——微軟的解釋
Power Query使用場景:
- 1、PQ可以加載N多種數(shù)據(jù)源,包括常見的Excel文件、文件夾、TXT文件、CSV文件、SQL Server、MySQL、Web等。可對數(shù)據(jù)進(jìn)行合并、追加等之前需要VBA才能完成的工作。
- 2、PQ操作完的步驟可以重復(fù)執(zhí)行,下次再操作同樣的步驟只需要刷新即可得到最新的數(shù)據(jù)。
- 3、PQ寫好的操作步驟可以再次編輯和更改,還可調(diào)整操作步驟。你可以想象成你錄制了一個(gè)宏,并且這個(gè)宏是可以根據(jù)你的需要隨時(shí)可以編輯的。如果我們直接修改宏的代碼實(shí)現(xiàn)則需要學(xué)習(xí)VBA編程,但是在PQ里面操作基礎(chǔ)功能只需要像在Excel中的工具欄按鈕進(jìn)行操作一樣簡單。
- 4、PQ加載的數(shù)據(jù)可以突破Excel中100萬行的限制,而加載數(shù)據(jù)的大小取決于你的內(nèi)存上限。我曾經(jīng)測試過9千萬條的數(shù)據(jù)進(jìn)行加載,而有人測試過100億條數(shù)據(jù)。 在你原有的認(rèn)識中你認(rèn)為Excel可以加載100億條數(shù)據(jù)嗎?
- 5、PQ和PP結(jié)合,我們出日報(bào)則只需要更新數(shù)據(jù)源后刷新一下就可以完成。對于重復(fù)性的工作,可以稱為是【神器】,效果堪比VBA,但學(xué)習(xí)門檻缺非常低。
- 6、Office2010、Office2013沒有內(nèi)置PQ,使用必須去微軟官網(wǎng)下載插件才能使用。下載Power Query,下載安裝后會在Excel菜單欄新增一個(gè)Power Query的菜單。Office2016內(nèi)置了PQ,在數(shù)據(jù)菜單下-新建查詢。
M語言:
M語言是操作PQ的語言,目前由700多個(gè)函數(shù)組成。但你不用怕,我們學(xué)習(xí)PQ只是為了完成我們基本的工作,沒有必要對這些函數(shù)全部都熟悉,就像我們學(xué)習(xí)Excel不需要對VBA和全部的函數(shù)熟悉一樣,只需要掌握幾個(gè)基本的函數(shù)即可讓你游刃有余,即便是你不會任何M函數(shù),則依然可以通過工具欄上的按鈕來實(shí)現(xiàn),而且很多功能與Excel中是類似的,學(xué)習(xí)門檻很低。后續(xù)我會提供這些按鈕的功能講解和PQ的相關(guān)操作教程。
Power Query總結(jié):
你可以簡單的理解為是一個(gè)數(shù)據(jù)加載和數(shù)據(jù)清洗工具。在實(shí)際操作中由于受限于Power Query計(jì)算效率,通常作為數(shù)據(jù)加載使用的較多,但其數(shù)據(jù)清洗功能也是非常強(qiáng)大的,甚至可以做網(wǎng)絡(luò)爬蟲。
Power Pivot
PowerPivot 是一種數(shù)據(jù)建模技術(shù),用于創(chuàng)建數(shù)據(jù)模型,建立關(guān)系,以及創(chuàng)建計(jì)算。 可使用 PowerPivot 處理大型數(shù)據(jù)集,構(gòu)建廣泛的關(guān)系,以及創(chuàng)建復(fù)雜(或簡單)的計(jì)算,這些操作全部在高性能環(huán)境中和所你熟悉的 Excel 內(nèi)執(zhí)行。——微軟的解釋
Power Pivot使用場景:
- 1、PP是PQ的好搭檔,一般配合使用的場景非常多,如果你要做一份日報(bào),可以通過PQ加載數(shù)據(jù)直接生成想要的數(shù)據(jù)。如果有更加復(fù)雜的需求可以再鏈接到PP里面使用度量值+多維數(shù)據(jù)集函數(shù)將你需要的結(jié)果返回。下次在做日報(bào)只需要在更新數(shù)據(jù)源后全部刷新即可完成。下載Power Pivot
- 2、可以突破數(shù)據(jù)透視表的限制,制作更加自由的數(shù)據(jù)呈現(xiàn)結(jié)構(gòu)。
- 3、可對整個(gè)數(shù)據(jù)庫進(jìn)行復(fù)雜查詢,具有快速內(nèi)存處理能力,和PQ一樣不受Excel100萬行的限制,結(jié)合使用DAX Studio可以實(shí)現(xiàn)類似SQL的查詢效果。
- 4、和PQ一樣,也無需受限于數(shù)據(jù)來源形式,PP也支持非常多的數(shù)據(jù)源格式,不需要受限于Excel文件。我們可以選擇直接使用PP加載源數(shù)據(jù),也可也通過PQ加載然后再鏈接到PP中進(jìn)行使用。
- 5、使用PP中的DAX語言可以有兩個(gè)方向,數(shù)據(jù)分析方向和數(shù)據(jù)查詢方向。數(shù)據(jù)分析方向主要使用度量值,數(shù)據(jù)分析師使用的較多。查詢方向是使用DAX處理各種復(fù)雜的表格關(guān)系,其查詢效果類似SQL。
DAX語言:
與PQ一樣,操作PP也需要一門變成語言,叫做DAX語言。DAX語言由200多個(gè)函數(shù)組成,和PP的M語言均被成為函數(shù)式編程。看到編程二字,你不必害怕,因?yàn)镈AX的函數(shù)實(shí)際上部分函數(shù)跟我使用的Excel函數(shù)一樣或者類似,如果作為入門你會很快上手。涉及到DAX更加復(fù)雜的操作需要你需要理解兩個(gè)概念:篩選上下文和行上下文,后續(xù)我會做簡單的介紹。
Power Pivot總結(jié):
PP主要適用于數(shù)據(jù)模型的搭建方向,作為數(shù)據(jù)的查詢也是優(yōu)秀的工具。PQ和PP是一對在數(shù)據(jù)處理方面具有劃時(shí)代意義的工具。但不要聽到搭建數(shù)據(jù)模型就感覺很復(fù)雜,其實(shí)并沒有我們想象的那么高大上,只要開始學(xué)習(xí)都會很容易的入門。
Power View
Power View 是一種數(shù)據(jù)可視化技術(shù),用于創(chuàng)建交互式圖表、圖形、地圖和其他視覺效果,以便直觀呈現(xiàn)數(shù)據(jù)。 Power View 在 Excel、BI SharePoint、SQL Server 和 Power BI 中均可用。——微軟的解釋
Power View、Power Map使用場景:
Power View在Excel中已經(jīng)被微軟放棄,如果你對Excel不熟悉,你甚至找不到它,所以實(shí)際工作中,使用的并不是很多,而這部分內(nèi)容在PBI中對應(yīng)的就是儀表板。而Power Map在Excel中做展示使用的相對多一些,而同樣可以在PBI中通過地圖來實(shí)現(xiàn)。
三、學(xué)習(xí)BI組件的入門途徑
-
從Excel入門-該方法適合Excel用戶
如果你之前只是使用Excel,那么可以通過Excel開始學(xué)習(xí)這些BI組件,你會發(fā)現(xiàn)這將顛覆你以前對Excel的認(rèn)識。
-
從Power BI入門-該方法適合數(shù)據(jù)分析人員
如果你是一名數(shù)據(jù)分析相關(guān)人員,那么使用Power BI Desktop將是一個(gè)不錯(cuò)的選擇,其和Excel中的組件基本雷同,可以非常方便的使用儀表板展示你所需要表達(dá)的內(nèi)容,是數(shù)據(jù)分析師的不二之選。
-
從SSAS入門-該方法適合開發(fā)人員
SSAS是SQL Server的一個(gè)組件,具體我也未曾使用過,是屬于企業(yè)級BI的工具。
從任何途徑開始學(xué)習(xí)都可以對其他部分觸類旁通,其關(guān)鍵部分均是一樣的。
四、缺點(diǎn)
凡是都有兩面,雖然PQ和PP萬般好,但是也有其限制。
- 1、不適合數(shù)據(jù)量特別大的數(shù)據(jù),一般數(shù)據(jù)超過2G就不建議使用了,其效率會明顯降低。而我們平時(shí)處理個(gè)幾十萬上百萬的數(shù)據(jù)還是非常流暢的。如果要優(yōu)化其性能并結(jié)合SQL使用能發(fā)揮更大的效果。
-2、PQ的計(jì)算效率低,在之前的探討中,如果大量在PQ中做復(fù)雜的計(jì)算會導(dǎo)致計(jì)算效率明顯降低,尤其是分組操作、合并查詢等。我們目前的處理方式是僅使用PQ加載數(shù)據(jù)并做簡單的數(shù)據(jù)清洗,大量的分析和計(jì)算則交給PP來做,因?yàn)镻P的效率比PQ高了很多。但PQ的效率依然比在Excel里面高了很多。
-3、定位有點(diǎn)尷尬,一般辦公人員學(xué)習(xí)可能稍嫌難一些,同時(shí)作為IT人員一般又不屑于使用。但目前的現(xiàn)狀正在改善,Power BI也在不斷迭代,桌面版平均每月都有更新,有時(shí)候甚至是周,已經(jīng)成為微軟戰(zhàn)略及產(chǎn)品,學(xué)習(xí)BI的人員也在不斷的增多。 - 4、參考資料少,不像Excel那么成熟,教程特別多,網(wǎng)上隨處可見。BI組件的有質(zhì)量的教程網(wǎng)上還是不太容易找,這些限制了部分想要學(xué)習(xí)的同學(xué)的積極性。如果是Excel入門可以看看劉凱老師翻譯的《用PowerPivot建立數(shù)據(jù)模型》,如果是從PBI入門可以看看馬世權(quán)老師的《從Excel到Power BI》,或者也可也看下Power 工坊的網(wǎng)絡(luò)課程。后續(xù)我也會寫或者錄制一些相關(guān)的教程,方便大家學(xué)習(xí)。
五、總結(jié)
其實(shí)今天已經(jīng)介紹了非常多的內(nèi)容,最后也做一個(gè)總結(jié)。我得聲明一下,今天我介紹的功能,WPS都是不支持的,必須是微軟Office辦公軟件才可以。如果你是首次使用PP,這需要設(shè)置一下,才能使用,文件-選項(xiàng)-自定義功能區(qū)-將開發(fā)工具打勾,設(shè)置完畢后點(diǎn)擊開發(fā)工具菜單下的COM加載項(xiàng),對Power Pivot勾選后才能使用,會多一個(gè)Power Pivot的菜單。