時間過得飛快,猴年就這樣悄悄溜走,轉眼迎來了雞年。雞年的第一篇關于數據分析的文章,我打算用來紀念2016年這個對于我來說并不平凡的猴年。
我常常在想,數據分析真的和生活聯系的非常緊密。例如說,提到猴子,我們通常想起來孫悟空,提到孫悟空,我們又不難想到“真假美猴王”。其實在平常接觸的數據中,我們總是會遇到很多重復的數據,這些重復數據就像六耳獼猴干擾我們的視聽,擾亂分析的思路。于是,我們要有本事把重復的數據挑選出來,還要有本事把不需要的重復數據剔除掉。這可是很需要功力的哦。
關于篩選和剔除重復的數據,你平常是怎么操作的呢?猶記得,我剛剛參加工作的時候,對待重復數據的處理方式就是排序,而后挑選著刪除一些重復的數據。這樣的操作也能夠達成目的,只不過確實相當費時間而且容易看花了眼。
我今天為大家介紹幾種可以快速查找重復項并對其進行刪除的方式,希望可以在工作中有所幫助,畢竟我們需要更多的時間來好好生活好好戀愛嘛~
請注意,我們今天的原始數據是這樣的:
方法一:利用Excel條件格式
Excel在處理日常工作的過程中,其功能還是非常強大的。我們可以利用的最簡便的方法常常藏在其中。
Step1,選中單元格區域A1:A10,選擇“開始”--->“條件格式”--->“突出單元格顯示規則”--->“重復值”,如圖1.1所示。
Step2,經過上面的操作,我們會看到如下結果,如圖1.2所示,在這里我們還可以為重復的單元格選擇標記的顏色哦,是不是一目了然呢?
Step3,那么接下來,如何把重復的內容刪掉,保留我們想要的數據呢?如圖1.3所示,在“數據”選項卡中的“數據工具”組中,單擊“刪除重復項”,在“列”區域下面,選擇要刪除的列(這里只有“編號”這一列),并單擊“確定按鈕”。(PS:如果你只想刪除重復的數據,卻并不需要知道哪些數據重復,那么你可以選擇跳過STEP1和STEP2,直接進行這一步。)
Step4,得到如圖1.4所示的結果,在這里我們可以看到有多少重復值被刪除,同時有多少唯一值被保留下來了。單擊“確定”即可完成操作,得到我們最終的想要的結果。
總結一下,這種方法的優缺點如下:
優點:可以看到到底是哪些數據重復了,而且比較快捷的得到重復值刪除后的結果。
缺點:至于每一個重復項的數量有幾個,并不能夠直觀看到。
方法二:利用“高級篩選”功能處理重復值
如果想要找出重復值,“高級篩選”功能又怎么能被我們忽略呢?更何況在處理重復數據的過程中,該方法還十分簡便易行。
Step1:選中單元格區域A1:A10,在“數據”選項卡中的“排序和篩選”分組中找到“高級”按鈕,點擊該按鈕,可以看到彈出一個“高級篩選”對話框。如圖2.1所示:
Step2:在上圖所示的對話框中,選中“將篩選結果復制到其他位置”,在“復制到”文本框中選中B1區域,同時注意勾選“選擇不重復的記錄”,點擊“確定”按鈕,如圖2.2所示。得到的結果如圖2.3所示。
總結一下,這種方法的優缺點如下:
優點:非常方便快捷的得到刪除重復數據后的結果。
缺點:并不能直觀的看到到底是哪些數據重復了,重復數據的個數分別是多少。
方法三:利用COUNTIF函數處理重復數據
綜合上述方法一和方法二我們不難看出,上面的兩種方法操作起來非常簡單,但是缺點也非常明顯。那就是,如果想要定位到具體的重復項,并且直觀了解到該重復項的數量,上述兩種方法就略顯不足了。所以,如果需求比較復雜,需要了解到重復項的數量或者排序的話,我們就要借用COUNTIF函數來進行處理了。
Step1:首先了解一下COUNTIF函數。COUNTIF函數的作用是:對所選區域中滿足單個指定條件的單元格進行計數,如圖3.1所示。
Step2:選中B2單元格,然后輸入函數公式:=COUNTIF(A:A,A2),如圖3.2所示。這就表示“數一數在A列,像A2這樣的有幾個”:
Step3:選中C2單元格,輸入函數公式:=COUNTIF(A$2:A2,A2),如圖3.3所示。這就表示“在A列中,該單元格中的項目是第幾次出現”
Step4:將B2和C2的公式復制到B3:C11的所有單元格,可以得到如下結果,如圖3.4所示。這里需要說明下,拿“AD652280”舉例子,這里的B4表示“AD652280”在A列一共有兩個;而C4則表示,“AD652280”在A列第一次出現,C10表示“AD652280”在A列第二次出現。這樣我們就能夠直觀看到有哪些項是重復的,重復了幾次(可以看B列);這些項從哪里開始重復的,第幾次重復(看C列)。
Step5:為了方便講解,我們給B列命名為“有幾個”,給C列命名為“第幾個”。我們可以通過刪除C列中計數不為“1”的項目來達到刪除重復數據的目的(即把第二次、第三次。。。第N次出現的都刪掉)。選中“第幾個”列即C列中有數據的單元格,在“數據”選項卡中選擇“排序和篩選”--->點擊“篩選”--->點擊C列的列標簽上出現的下拉菜單--->點擊“數字篩選”--->選擇“不等于”,如圖3.5所示。
Step6:在圖3.6所示的對話框中,紅框內填入“1”,而后點擊“確定”。
Step7:刪除在上一步中得到的行,即可得到最終的不重復的結果。
看了上面介紹的幾種方法,是不是感覺自己的功力又有所提高了呢?
其實呀,正是因為我們在日常的工作中,掌握了一個又一個看起來平凡但卻非常有用的方法,才使得我們能夠脫穎而出、與眾不同呢。
還猶豫什么,趕快學起來吧,下一個升職加薪的,一定是你哦~