Excel將表格文件由寬數據轉為長數據的方法

??本文介紹基于Excel軟件的Power Query模塊,實現表格數據由寬數據轉為長數據的具體方法。

??長數據寬數據是數據分析中的2種基本數據組織形式,二者在結構、用途、適用場景等方面各有特點。其中,寬數據 (Wide Format)以“橫向擴展”為特征,每個獨立個體(如一名患者、一家公司)獨占一行,而該個體的多個觀測值(如不同時間點的指標)則橫向排列在不同列中。這種布局讓數據一目了然,適合直接查看或制作報表,但涉及時間序列或多指標對比時,會顯得冗余且不利于程序化分析。長數據 (Long Format)則采用“縱向堆疊”的結構,每一行僅記錄一個觀測值,通過新增分類列(如“時間點”“指標類型”)來區分不同條件下的數據。這種格式雖然增加行數、降低可讀性,卻更貼合統計建模和可視化工具的需求,尤其適合重復測量分析或繪制多變量趨勢圖。

??在我們之前的文章R語言讀取Excel表格數據并繪制多系列柱狀圖、條形圖(https://fkxxgis.blog.csdn.net/article/details/128986301)中,就介紹過基于R語言實現寬數據與長數據的轉換方法;而本文我們則介紹不用代碼、直接在Excel內,實現寬數據與長數據的轉換方式。

??首先,已知我們有一個如下圖所示的Excel表格,其目前的數據形式為寬數據;我們的需求就是將這一寬數據轉為長數據

??轉換的方式也很簡單。首先,我們需要新建另一個Excel表格文件,并在“數據”一欄中,依次選擇“獲取數據”→“來自文件”→“從工作簿”,如下圖所示。

??隨后,在彈出的窗口中,選擇存放了前述寬數據的那個Excel表格文件,如下圖所示。

??接下來,在導航器中,首先選擇寬數據所在的Sheet,此時在右側就會出現數據的預覽;接下來,點擊右下角的“轉換數據”按鈕,如下圖所示。

??隨后,即可出現如下圖所示的Power Query編輯器界面。由于前述數據導入過程中,可能會存在問題,因此此時我們首先對數據做一下檢查。比如有一種情況,就是在數據導入時,Excel可能會將原本寬數據的第一行(列名行)也當作導入數據的一行記錄(相當于導入后的數據比之前多了1行而少了列名);因為我這里沒有遇到這個情況,所以這里就沒記錄這個問題的解決方法,如果大家遇到了這個問題,再搜索解決方法即可。

??但是本文中,遇到了另一種問題:原本我的寬數據的第3列是一個文本格式的列,其具有形如0010的編號;而在上述導入過程中,這一列被Excel識別為了整數格式的列,也就導致將原本的0010變為了10,很顯然這個是不正確的。

??針對這種情況,我們就選中這一列,此時可以看到此列的數據格式確實被識別為了整數,如下圖所示。

??因此,將這一列修改為文本格式即可,如下圖所示。

??接下來,會彈出如下圖所示的提示窗口,選擇“替換當前轉換”即可。

??修改格式后,可以看到這一列的數據已經是正常的了,例如0010這個值顯示就是正確的了,如下圖所示。

??接下來,我們回歸主題,開始進行寬數據向長數據的轉換。轉換的方式也很多,首先如果大家需要參與轉換的列比較多,那就可以首先選中不需要轉換的列,然后選擇“轉換”欄目中的“逆透視其他列”,如下圖所示。

??這樣,就會將我們沒有選中的其他列加以轉換,如下圖所示。可以看到,此時前三列(也就是公司、產品、產品編號等基本信息列)沒有參與轉換,而轉換的是后面幾列,也就是不同年份的銷量。

??同樣的,我們還可以直接選中需要轉換的列,那么此時選擇“逆透視列”即可,如下圖所示。

??可以看到,上圖中我們只選中了2021年銷售額這一列,因此逆透視后,只有這一年的銷售量被轉換了,如下圖所示。

??此外,在Power Query編輯器右側,有一個應用的步驟模塊,如下圖所示。這里會記錄數據導入過程、編輯過程中的操作,如果需要撤回操作,直接點擊這里最新操作左側的叉號即可。

??如果數據已經處理完畢, 那么選擇“文件”中的“關閉并上載”選項即可,如下圖所示。

??隨后,即可看到導入、轉換完畢的數據,已經出現在了當前的Excel表格文件中,如下圖所示。

??此外,對于基于Power Query編輯器導入數據的Excel表格,其右側會出現如下圖所示的“查詢 & 連接”窗口,其中會記錄數據導入情況。如果在上述操作中有數據導入錯誤,這里也會顯示出來,所以大家也可以多多留意這個位置的信息,避免數據導入或轉換錯誤。

??至此,大功告成。

歡迎關注:瘋狂學習GIS

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/85195.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/85195.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/85195.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

SpringAI + DeepSeek大模型應用開發 - 入門篇

三、SpringAI Spring AILangChain4jChat支持支持Function支持支持RAG支持支持對話模型1515向量模型1015向量數據庫1520多模態模型51JDK178 1. 對話機器人 1.1 快速入門 步驟①:引入依賴(先去掉openai的starter依賴,因為要配置API_KEY&#…

ROS docker使用顯卡驅動rviz gazebo,以及接入外設和雷達

ROS docker使用顯卡驅動rviz gazebo,以及接入外設和雷達 由于我的電腦裝ubuntu22.04系統,想使用ros noetic開發,使用魚香ros一鍵安裝docker安裝。但是啟動dockek中rviz無法使用顯卡驅動,usb相機端口不顯示,網口雷達無…

ruoyi后端框架的mapper層復雜字段數據獲取問題

背景。如下是復雜字段。需要在mapper.java類注解中聲明autoResultMap true才會進行處理。前提是,創建后端程序代碼沒有添加mapp.xml文件。故用注解簡化代替。

產品推薦|一款具有單光子級探測能力的科學相機千眼狼Gloria 1605

在生命科學超分辨率成像、量子物理單光子探測、交叉領域單分子追蹤等應用場景中,具有單光子級探測能力的科學相機是科學實驗的關鍵設備。 千眼狼Gloria 1605采用16μm16μm大像元尺寸設計,基于Gpixel科學級背照式CMOS芯片,集成千眼狼底層圖像…

JS.Day2-堆選(Py)/三路快排-快速選擇-215,11,560,21,128,20,121

目錄 215.找第k大元素 三路的快速排序 快速選擇 法2.堆選 (堆排序) 11.盛更多水的容器 代碼1 代碼2 560.和為K的子數組(題意!) 慣性思維 正解 21.合并生序鏈表 遞歸寫法 128.最長連續序列 20.有效的括號…

第8章 處理幾何圖形 面向 ArcGIS的Python腳本編程

一、折點坐標(.txt 或 .xlsx 或 .xls) > 點線面圖層(.shp) (一).xlsx 或 .xls > .shp 新建一個文件夾,連接到該文件夾,并將其設置為工作空間 在該文件夾下,新建一個pts.xlsx的文件,并輸入下圖內容 …

使用(h3.js)繪制六角網格碼

今天來記錄一篇關于h3.js插件庫的使用,他可以很高效的計算出地球上某個經緯度坐標六邊形頂點。 前段時間領導突然給我個售前功能,要求是使用h3.js插件在地球上繪制出六邊形網格碼,本來以為挺棘手的,結果看完文檔后發現也挺簡單的…

GO 1.25

Go 1.25 發布說明(草案) Go 1.25 尚未發布。 本文檔是正在編寫中的發布說明。Go 1.25 預計于 2025 年 8 月發布。 語言變更 Go 1.25 中沒有影響 Go 程序的語法變更。然而,在語言規范中,“核心類型”(core types&…

解析Android SETUP_DATA_CALL 鏈路信息字段

Android 對象返回的log信息經常都不是標準的JSON字符串,排查字段不直觀,比如下面的日志: 06-13 15:56:36.204 8076 8407 D RILJ : [1655]> SETUP_DATA_CALL,reason=NORMAL,accessNetworkType=EUTRAN,dataProfile=[DataProfile=[ApnSetting] IMS, 2318, 310260, ims,…

跨語言RPC:使用Java客戶端調用Go服務端的HTTP-RPC服務

在構建分布式系統時,實現不同編程語言之間的無縫通信是一個常見的需求。本文將詳細介紹如何使用Go語言創建一個HTTP-RPC服務,并通過Java客戶端進行遠程調用。我們將探索整個過程,包括服務端的實現、客戶端的編寫以及測試驗證。 一、背景介紹…

CVPR2024遷移學習《Unified Language-driven Zero-shot Domain Adaptation》

摘要 本文提出了一個名為 Unified Language-driven Zero-shot Domain Adaptation(ULDA)的新任務設置,旨在使單一模型能夠適應多種目標領域,而無需明確的領域標識(domain-ID)知識。現有語言驅動的零樣本領域…

AI安全風險監測平臺:全周期防護體系構建

AI安全風險監測平臺通過構建全生命周期防護體系,實現對人工智能系統研發、部署、運行、迭代各階段的安全風險動態監測。該平臺融合算法審計、行為分析、合規驗證等核心能力,建立覆蓋模型安全、數據安全、應用安全的立體防御網絡,為智能系統提…

數據集-目標檢測系列- 杯子 數據集 bottle >> DataBall

數據集-目標檢測系列- 杯子 數據集 bottle >> DataBall 貴在堅持! * 相關項目 1)數據集可視化項目:gitcode: https://gitcode.com/DataBall/DataBall-detections-100s/overview 2)數據集訓練、推理相關…

視頻點播web端AI智能大綱(自動生成視頻內容大綱)的代碼與演示

通過AI技術將視頻課程自動生成結構化大綱和摘要,支持PPT教學視頻、企業內訓等場景應用。核心功能包括:自動匹配視頻知識點生成文本大綱、快速內容定位、降低課程制作成本。系統采用模塊化架構,包含Vue2.7前端組件、JS邏輯庫和演示項目&#x…

Linux: errno: EINPROGRESS-115

在connect接口的使用說明里,有這個錯誤:EINPROGRESS。 The socket is nonblocking and the connection cannot be completed immediately. It is possible to select(2) or poll(2) for completion by selecting the socket for writing. After select(2…

Node.js特訓專欄-基礎篇:3. Node.js內置模塊的使用

🔥 歡迎來到 Node.js 實戰專欄!在這里,每一行代碼都是解鎖高性能應用的鑰匙,讓我們一起開啟 Node.js 的奇妙開發之旅! Node.js 特訓專欄主頁 Node.js內置模塊:強大功能的基石 在Node.js的世界里&#xff…

基于MATLAB實現的Capon、MUSIC、ESPRIT和PM算法進行DOA

使用Capon、MUSIC、ESPRIT和PM多種算法進行doa估計,通過譜峰搜索函數估計到達角,并使用蒙特卡洛方法估計各算法的RMSE。(可能計算時間較長,如需節省時間可以減小蒙特卡洛次數) PM.m , 574 RMSE.m , 274 TLS_ESPRIT.m …

某網站極驗4滑塊驗證碼逆向分析

文章目錄 1. 寫在前面2. 接口分析3. w逆向分析4. JSON參數分析5. 距離識別6. RSA純算還原7. AES純算還原【??作者主頁】:吳秋霖 【??作者介紹】:擅長爬蟲與JS加密逆向分析!Python領域優質創作者、CSDN博客專家、阿里云博客專家、華為云享專家。一路走來長期堅守并致力于…

深入理解 C++ inline:三大語法特性 + 七大高頻考點全解析

一、什么是內聯函數 編譯器嘗試將 inline 函數的代碼直接插入調用處(類似宏展開),避免函數調用的壓棧、跳轉、返回等額外開銷。適用于短小頻繁調用的函數:如簡單的 getter/setter、數學運算等。inline 只是 建議,編譯…

Flink 與 Hive 深度集成

引言 在大數據生態中,Flink 的流批一體化處理能力與 Hive 的數據存儲分析優勢結合,通過 Flink Connector for Hive 實現無縫對接,能顯著提升數據處理效率。本文將系統解析 Flink 與 Hive 集成的核心操作,涵蓋配置、讀寫、優化全流…