私信回復關鍵詞【福利】~
獲取豐富辦公資源,助你高效辦公早下班!
小伙伴們,大家好,我是專治各種疑難雜「數」的農夫~
今天,我就為大家介紹一種高效的數據清洗方法,助你告別熬夜加班,擁抱美好的夜晚時光~
日常工作中,我們經常需要將其他同事發來的 Word 文件中的數據提取出來。

但粘貼進 Excel 表格后,數據就成了介個樣子,出現很多空行、重復的標題行、多個相同的部門數據等~

看到這樣的表格,大家的內心可能是這樣的~

如果我們想處理成下圖這樣規整的數據,應該如何操作呢?

那么,現在請大家先思考幾秒~~~
01
問題分析
Word 中的數據表格,基本上不能直接操作計算,在數據處理上被認為是張「死表」。
(而且 Word 中常常有合并的行列、重復的標題行,「無腦復制粘貼」容易出現格式問題。)
而 Excel 中的數據相當于數據倉庫,我們可以隨意取部分數據,
或者全部數據進行計算、合并、數據透視等,這類表格我們稱之為「活表」。
知道了這些可能存在的問題,接下來,我們就需要逐個擊破,把 Word 中的「死表」變成 Excel 中的「活表」。

應該怎么做呢?小伙伴們請隨農夫走進本期的「數據農場」~
02
解決方法
▌備份數據
? 數據處理數據之前,我們需要先將原表進行備份,保留原始數據。

備份原始數據是處理數據中很重要的習慣。不然,原始數據被修改了,想要從頭再來,你可能只能哭了~
▌清理無效行列
? 刪除不需要的行,即「分部」和「投訴受理量」列。
數據清理中,根據自己處理需求保留或增添數據列,不要讓無效數據列影響到數據清理。
? 刪除列中的無用行,包括 Word 中合并單元格形成的大量空行,及設置「重復標題行」形成的多個標題行。
這些數據是 Word 粘貼進入 Excel 之后,生成的冗余數據。
我們從以下兩點進行操作:
首先,去除列中空值行,選中整列—【F5】快捷鍵進入【定位】條件頁面—點擊「定位條件」—勾選空值—確定。
即可選中列中所有空值,然后右鍵,選擇【刪除整行】即可!


其實,空值也可視為重復值。數據選項卡下的【刪除重復值】按鈕,也可以刪除列中重復值。
但是,考慮到某些部門辦件數量相同,因此本次不用這個方法。
其次,刪除「重復標題行」所形成的無用行。
① 點擊【數據】選項卡—【篩選】—勾選帶有「部門」的行。
② 選中除第一行之后的其他部門行,右鍵刪除,最后取消篩選。
還是基于上面剛剛說的原因,沒有使用【刪除重復值】功能。
以上就是我們初步的預處理數據了。
我們用動圖來演示下:

這個時候離最終的數據,是不是有那么幾分像了?
好了,下面我們繼續進行數據處理,也是本次數據清洗最為關鍵的操作。
▌錯行填值
數據錯行:即第二列的第一行數據引用的是前一列或后一列的第二行數據,以次類推。
? 命名新列(辦件量)存儲數值。
以錯行形式引入前一列(部門)數據。
即當填充 B 列第 2 行的時候,我們在 B2 單元格中引入 A3 單元格的數值。
公式為:
=A3
下拉單元格即可填充整列,或使用快速填充功能,雙擊即可自動填充整列。


? 這是最簡單的一步,當然也是最為重要的一步哦!
選中填充好的辦件量列,復制—單擊【右鍵】—粘貼為【值】。
如果不進行這個操作,最后的數據全部都會出現#REF 錯誤哦!
#REF 代表什么呢?
意思是「無效的單元格引用」錯誤。
因為在后續操作中,我們會把部門列中所有數字全部刪除。
僅保留真正的部門名稱數據。
聽到這里,是不是恍然大悟?


▌再次清理無用行
? 數據清洗進行過半,我們再次刪除第一列中的無用行。
點擊數據選項卡—選中「部門列」—選中帶有「件」字關鍵詞的行—選中全部—刪除。


取消篩選,這樣的數據形式,是不是和最終數據有七八分像了呢?

但是,數據中咋出現了重復部門呢?就連辦件量都是一模一樣。
? 存在這樣重復的數據,是 Word 中的手動拆分單元格造成的。

在 Word 中一個頁面無法容納一個部門的多個分部,就會自動將數據分割到兩頁。
所以,粘貼進入 Excel,就會出現一個部門重復多行的數據。
如何清理?
選中部門列—點擊【數據】選項卡—刪除重復行—選擇刪除重復項警告頁面的【擴展選定區域】——確定。



當命令執行完成,Excel 會貼心提示,刪除重復值的數量和保留多少唯一值。
就問你,這樣的 Office 服務感不感動?

操作步驟太多?沒有關系,動圖已到~


▌整理數據
? 替換的一小步,數據的一大步。
新建最終數據列——手動把第一行第二行的數據寫下來。
讓 Excel 識別出數據提取規律;
然后,雙擊第二行的填充柄

進行快速填充,即可提取所有數據。
就問你是不是比老郭的神奇小元宵還要神奇?

PS:快速填充適用于 Office 2013 及以上版本、WPS 2019 及以上版本~
? 刪除中間的辦件量列,獲得最終想要的效果~

03
總結回顧
最后小小總結一下:
? 備份數據
? 定位條件【F5】—刪除空行
? 篩選—刪除重復的標題行
? 錯行數據填充【B2=A3】
? 函數生成的列數據粘貼為值
? 篩選關鍵詞行—刪除無用行
? 刪除重復行
? 快速填充
今天也是干貨滿滿的一天~好了,小伙伴趕緊打開電腦操作一番吧!
畢竟這種實操性的東西,眼睛看會了可不等于手會了哦!

私信回復關鍵詞【福利】~
獲取豐富辦公資源,助你高效辦公早下班!
