在日常數(shù)據(jù)分析時,經(jīng)常會遇到需要按列分組 (groupby) 的任務(wù),如計算某公司各部門的人數(shù),計算各部門男女平均工資,計算不同年代的員工的平均工資等等。在進(jìn)行這類運算時,P...

在日常數(shù)據(jù)分析時,經(jīng)常會遇到需要按列分組 (groupby) 的任務(wù),如計算某公司各部門的人數(shù),計算各部門男女平均工資,計算不同年代的員工的平均工資等等。在進(jìn)行這類運算時,P...
Excel文件是常見的數(shù)據(jù)文件,數(shù)據(jù)分析過程中經(jīng)常會用到。有時我們需要用程序代碼對 Excel 文件進(jìn)行一些自動化處理,這需要程序語言能夠方便地解析 Excel 數(shù)據(jù)。 可以...
幾乎所有的程序語言都能處理數(shù)據(jù),但有些過于通用,缺乏專業(yè)的結(jié)構(gòu)化計算函數(shù),用于數(shù)據(jù)處理時代碼比較繁瑣,比如C++、JAVA,這些語言更適合去實現(xiàn)大型專業(yè)的項目。還有專業(yè)的數(shù)學(xué)...
Python作為一門程序設(shè)計語言,在易讀、易維護(hù)方面有獨特優(yōu)勢,越來越多的人使用 Python 進(jìn)行數(shù)據(jù)分析和處理,而 Pandas 正是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的,其包含...
什么是大文件?大文件是指大到計算機(jī)內(nèi)存不足以一次性讀入的文件。這種情況,直接使用桌面數(shù)據(jù)工具(比如 Excel)都無能為力了,常常需要編寫程序來處理。而即使是寫程序,也必須是...
無論程序員,還是數(shù)據(jù)分析師或科研工作者,有很多人都會編寫SQL。無論單機(jī)上的access,還是局域網(wǎng)中的mysql或云環(huán)境中的Hadoop,也有很多平臺都支持SQL。經(jīng)過半個...
一句“人生苦短,我用 Python”,讓多少職場人為之瘋狂,培訓(xùn)機(jī)構(gòu)甚至豪言小到黃口小兒,大到七旬老漢都學(xué)得會 Python。如果你在職場中經(jīng)常跟數(shù)據(jù)打交道,曾經(jīng)可能 Exc...
在企業(yè)財務(wù)工作中,每個財務(wù)周期都要制作資產(chǎn)負(fù)債表,周期分為月度、季度、年度。季度報表可由月度報表合并得來,年度報表可由季度報表合并而來。有些大企業(yè)有許多部門,各部門也有資產(chǎn)負(fù)...
遇到Excel難以實現(xiàn)的復(fù)雜或特殊運算時,可先用剪貼板將數(shù)據(jù)復(fù)制到esProc,利用esProc強(qiáng)大的計算能力完成,再用剪貼板返回Excel。剪貼板方式比傳統(tǒng)的add-ins...
職場人員使用 Excel 進(jìn)行數(shù)據(jù)處理已經(jīng)成為家常便飯。不過相信大家一定有過很無助的情況,比如復(fù)雜計算、重復(fù)計算、自動處理等,再遇上個死機(jī)沒保存,整個人崩潰掉也不是完全不可能...
資產(chǎn)負(fù)債表是財務(wù)人員每個財務(wù)周期都必須制做的報表,周期可能為月份、季度、年度,表樣為: 如果每月都給我們一份這樣的最新財務(wù)數(shù)據(jù) Excel,讓我們做出如下的資產(chǎn)負(fù)載表,我們來...
目前每個月都有產(chǎn)品銷售明細(xì)數(shù)據(jù),要求根據(jù)“地區(qū)”及“銷售員”兩個分組匯總統(tǒng)計各產(chǎn)品類別的銷售情況編寫一張統(tǒng)計報表。 如表樣所示,左側(cè)分別有“地區(qū)”和“銷售員”兩個分組,均按照...
轉(zhuǎn)置即旋轉(zhuǎn)數(shù)據(jù)表的橫縱方向,常用來改變數(shù)據(jù)布局,以便用新的角度觀察。有些轉(zhuǎn)置算法比較簡單,比如行轉(zhuǎn)列、列轉(zhuǎn)行、雙向轉(zhuǎn)置;有些算法變化較多,比如動態(tài)轉(zhuǎn)置、轉(zhuǎn)置時跨行計算、關(guān)聯(lián)轉(zhuǎn)...
在數(shù)據(jù)處理業(yè)務(wù)中,經(jīng)常要把文件結(jié)構(gòu)相同或近似相同的數(shù)據(jù)文件合并成一個文件,或者將一個比較大的數(shù)據(jù)文件拆分成小的數(shù)據(jù)文件。本文將介紹文本文件和 Excel 文件合并及拆分會遇到...
用 Excel 處理數(shù)據(jù)時,經(jīng)常會涉及到多頁 sheet 數(shù)據(jù)之間的關(guān)聯(lián)運算需求,用 vlookup 可以完成部分簡單關(guān)聯(lián),但較復(fù)雜的情況時仍然不太方便,常常需要多次操作才能...
用 Excel 處理數(shù)據(jù)時,有時需要對字符串進(jìn)行拆分。對于比較簡單的拆分,使用 Excel 函數(shù)可以順利完成,但碰到一些特殊需求,或者拆分的規(guī)則比較復(fù)雜時,則很難用 Exce...
1. 最大值 / 最小值 最大值 / 最小值可以理解為 TopN 查詢中,N 等于 1 時的情況,因為很常用所以單獨拿出來講一下。取最大值 / 最小值是很常見的需求,例如一班...
Excel 可以對數(shù)據(jù)進(jìn)行分組匯總,也可以用透視表對數(shù)據(jù)進(jìn)行多層次分析,但提供的匯總及相關(guān)運算都很簡單,稍復(fù)雜一些的運算沒法實現(xiàn)或者很難實現(xiàn)了。比如我們希望計算分組內(nèi)的排名,...
現(xiàn)在市場上開源 BI 產(chǎn)品比較多,各個產(chǎn)品的側(cè)重點不同,有的以報表為主、有的以可視化為主、有的以查詢分析為主。這里我們選取了一些主流的開源 BI 產(chǎn)品,從產(chǎn)品功能、可視化能力...