R語言學習--Day02--實戰經驗反饋

最近在做需要用R語言做數據清洗的項目,在網上看再多的技巧與語法,都不如在項目中實戰學習的快,下面是我通過實戰得來的經驗。

判斷Rstudio是否卡死

很多時候,我們在運行R語言代碼時,即使只是運行框選的幾行代碼,也會運行很久。其實,除了觀察控制臺是否有>或者>閃爍,以及在終端用命令查看運行狀態之外,還可以觀察我們的右上角的運行內存,如果在運行的過程中,觀察其變化區間,如果在100M或以上,就算是正常,如果變化很少或基本不動,那就要考慮是否卡死了。(有時候Rstudio卡死并不會有提醒你重啟的彈窗)

warnings()

有時候,我們在運行代碼的過程中會看到控制臺彈出error或者warning,但代碼仍然能繼續運行;此時記得分辨其意思,不要盲目得忽視。有時候的確只是提示我們某些包的版本過低需要更新,或者是畫圖的代碼有問題,但不影響實際使用;但是有時候的warning,比如我們調用連接語法right_join或left_join時,如果對于識別拼接的列名或變量沒有做好預處理的話,很容易彈出warning,在控制臺打印warnings()的話,會看到比如“16564 of 'x' 匹配了 16 of 'y'”的警告,這個一般是因為有過多重復的列名,需要提前做去重的預處理。

數據類型

不同于其他語言,在控制臺打印數據類型時,我們往往能看到輸出不止一個,代表其擁有很多數據特性。對應的,用于篩選的語法,就顯得尤為重要。這不只是,會不會報錯的問題,更是關乎于發現問題的方向。比如,如果我們使用了其他類型的語法,而不是單純的語法使用方法的錯誤,有時報錯會顯示要篩選的列名或數據不在列表或數據框里,但你打印列名,卻又能看到其在里面。而這往往就是我們使用了錯誤的語法,導致代碼無法識別數據的結構,打不開數據,也就找不到對應的數據了。

當然,并不是說語法方法使用錯誤,就只會報錯提示我們去改了。這也是一個需要重視的問題,其危害往往藏在我們看不見,又尤為重要的地方。很多時候我們語法使用不妥當,是不會報錯的,相反,代碼依舊會運行,但是你會發現結果跟我們想的不一樣,這個時候可能就會把我們思考問題的方向帶偏,去思考是不是數據本身有問題了。比如,只是單純的根據時間篩選最早的值賦予base.cr,使用pull(value)和直接用mutate新建一個變量,看似前者更簡潔,算力節省更多,實際上,卻會因為其邏輯是遍歷每個數據去篩選,而后者則只是在某一行直接讀數據,每次處理的數據量不同,前者會讓代碼一直在跑,等待的時間很久。(特別的,如果在運行代碼時,沒有報錯,Rstudio也沒有卡死,但觀察運行內存變化在一個小區間內反復橫跳,這個時候要注意是否是因為篩選的語法選擇錯了)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/905522.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/905522.shtml
英文地址,請注明出處:http://en.pswp.cn/news/905522.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

How Sam‘s Club nudge customers into buying more

Here’s how Sam’s Club (or similar warehouse memberships) nudge customers into buying more: It’s a classic psychological strategy rooted in sunk cost fallacy and loss aversion. 1. Prepaid Membership Creates a “Sunk Cost” Once you’ve paid the annual …

OpenHarmony系統HDF驅動開發介紹(補充)

一、HDF驅動簡介 HDF(Hardware Driver Foundation)驅動框架,為驅動開發者提供驅動框架能力,包括驅動加載、驅動服務管理、驅動消息機制和配置管理。 簡單來說:HDF框架的驅動和Linux的驅動比較相似都是由配置文件和驅動…

自然語言處理 (NLP) 入門:NLTK 與 SpaCy 的初體驗

自然語言處理入門:NLTK 與 SpaCy 的初體驗 在當今數字化飛速發展的浪潮中,自然語言處理(NLP)已經成為了極具熱度的技術領域。自然語言處理的核心目標是讓計算機能夠理解、分析并生成人類語言,其應用場景極為廣泛&…

LLaVA:開源多模態大語言模型深度解析

一、基本介紹 1.1 項目背景與定位 LLaVA(Large Language and Vision Assistant)是由Haotian Liu等人開發的開源多模態大語言模型,旨在實現GPT-4級別的視覺-語言交互能力。該項目通過視覺指令微調技術,將預訓練的視覺編碼器與語言模型深度融合,在多個多模態基準測試中達到…

如何利用大模型對文章進行分段,提高向量搜索的準確性?

利用大模型對文章進行分段以提高向量搜索準確性,需結合文本語義理解、分塊策略優化以及向量表示技術。以下是系統性的解決方案: 一、分塊策略的核心原則 語義完整性優先 分塊需確保每個文本單元在語義上獨立且完整。研究表明,當分塊內容保持單一主題時,向量嵌入的語義表征能…

Java高頻面試之并發編程-17

volatile 和 synchronized 的區別 在 Java 并發編程中,volatile 和 synchronized 是兩種常用的同步機制,但它們的適用場景和底層原理有顯著差異。以下是兩者的詳細對比: 1. 核心功能對比 特性volatilesynchronized原子性不保證復合操作的原…

技術債務積累,如何進行有效管理

識別和評估技術債務、明確技術債務的優先級、制定系統的還債計劃、持續監控與預防技術債務產生是有效管理技術債務積累的重要策略。其中尤其要注重識別和評估技術債務,只有準確識別技術債務的種類和嚴重程度,才能制定出高效且有針對性的解決方案&#xf…

安裝windows版本的nacos

一、下載nacos安裝包 瀏覽器搜索nacos,進入nacos官網 https://nacos.io/docs/latest/overview/ 選擇下載windows版本的nacos 二、解壓縮 三、進入bin目錄,cmd命令行窗口 四、啟動nacos 查看日志 五、打開可視化頁面查看 以上,就是安裝wind…

小結:Android系統架構

https://developer.android.com/topic/architecture?hlzh-cn Android系統的架構,分為四個主要層次:應用程序層、應用框架層、庫和運行時層以及Linux內核層。: 1. 應用程序層(Applications) 功能:這一層包…

鴻蒙5.0項目開發——鴻蒙天氣項目的實現(歡迎頁)

【高心星出品】 文章目錄 歡迎頁面效果數據字典創建數據庫表格Splash頁面頁面功能歡迎頁代碼亮點 項目按照從數據庫連接層–視圖層–業務邏輯層這種三層架構開發,所以先設計了數據庫表格的結構,在EntryAbility中創建表格。 歡迎頁面效果 數據字典 sear…

使用譜聚類將相似度矩陣分為2類

使用譜聚類將相似度矩陣分為2類的步驟如下: 構建相似度矩陣:提供的1717矩陣已滿足對稱性且對角線為1。 計算度矩陣:對每一行求和得到各節點的度,形成對角矩陣。 計算歸一化拉普拉斯矩陣:采用對稱歸一化形式 LsymI?D…

MySQL 8.0 OCP 英文題庫解析(三)

Oracle 為慶祝 MySQL 30 周年,截止到 2025.07.31 之前。所有人均可以免費考取原價245美元的MySQL OCP 認證。 從今天開始,將英文題庫免費公布出來,并進行解析,幫助大家在一個月之內輕松通過OCP認證。 本期公布試題16~25 試題16:…

【SQL】如何在 SQL 中統計結構化字符串的特征頻率

在數據分析場景中,我們經常會遇到需要解析結構化字符串并統計特征出現次數的需求。本文將以常用數據庫為例,探討如何高效處理類似 [特征A][特征B][特征C] 格式的字符串數據,并實現特征頻率統計。以下是完整的實現思路和解決方案。 一、問題場…

Docker Compose 的安裝方法

以下是 Docker Compose 的安裝方法整理,綜合了多篇指南的推薦步驟和注意事項: 一、安裝前準備 確保已安裝 Docker Docker Compose 依賴 Docker 引擎運行,需先安裝 Docker。若未安裝,可通過以下命令一鍵安裝(國內服…

配置Nginx解決http host頭攻擊漏洞【詳細步驟】

前言 大概內容: 安全系統滲透測試出host頭攻擊漏洞,下面是解決步驟,本人已測過無問題。 server_name aaabbb.com; if ($http_Host !~* ^127.0.0.1|aaabbb.com|localhost$){return 403;}

自研時序大模型講解(4月29日)直播回顧

4 月 29 日,清華團隊揭秘:時序大模型如何讓數據“活”起來線上直播圓滿結束。清華大學軟件學院博士生,IoTDB 原生機器學習引擎 AINode 研發同學劉雍在線上面向數千人次的時序數據分析人員與 AI 大模型行業關注者,就時序大模型的發…

attention_weights = torch.ones_like(prompt_embedding[:, :, 0]):切片操作獲取第二維度,第三維度

attention_weights = torch.ones_like(prompt_embedding[:, :, 0]):切片操作獲取第1 維度,第二維度 attention_weights = torch.ones_like(prompt_embedding[:, :, 0]) 這行代碼的作用是創建一個與 prompt_embedding[:, :, 0] 形狀相同且所有元素都為 1 的張量,它用于初始化…

鴻蒙Next API17新特性學習之如何使用新增鼠標軸事件

今天咱們接著學習鴻蒙開發文檔API17版本的新特性——對鼠標軸事件的支持。這對于需要精細交互的應用來說是一個非常有用的特性,例如地圖滾動、文檔瀏覽等場景。本文將詳細介紹在鴻蒙 Next 中如何使用新增的鼠標軸事件。 開發步驟 環境準備 在開始開發之前&#x…

【行為型之命令模式】游戲開發實戰——Unity可撤銷系統與高級輸入管理的架構秘鑰

文章目錄 ?? 命令模式(Command Pattern)深度解析一、模式本質與核心價值二、經典UML結構三、Unity實戰代碼(可撤銷的建造系統)1. 定義命令接口與接收者2. 實現具體命令3. 命令管理器(Invoker)4. 客戶端使…

計算機網絡|| 路由器和交換機的配置

一、實驗目的 1. 了解路由器和交換機的工作模式和使用方法; 2. 熟悉 Cisco 網絡設備的基本配置命令; 3. 掌握 Cisco 路由器的基本配置方式及配置命令; 4. 掌握路由器和交換機的基本配置與管理方法。 二、實驗環境 1. 運行 Windows 操作…