異常值檢測-3σ法提交 代碼注釋

背景信息里面都給了相應的答案,但我們可以多了解一下代碼的含義,而不是簡單的復制粘貼

import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
import numpy as npdata = pd.read_csv("src/death.csv", index_col='Unnamed: 0')data = data.dropna(axis=1, thresh=data.shape[0] * 0.2)
data = data.dropna(axis=0, thresh=data.shape[1] * 0.2)a = pd.isna(data).sum()
cols = [x for i, x in enumerate(a.index) if a[i] > 0]mode_list = 'FIPS Admin2'
for i in cols:if mode_list.find(i) != -1:data[i] = data[i].fillna(data[i].mode().iloc[0])else:data[i] = data[i].fillna(data.mean()[i])cols = '2008/10/20,2008/11/20,2008/12/20'.split(',')
x = data[cols]########## Begin ########## 
# 創建一個空的 pandas DataFrame 對象,用于后續存儲異常值檢測結果
a=pd.DataFrame()
for i in x.columns:
# 計算每個特征(列)的標準分數 (z-score),即 (觀測值 - 平均值) / 標準差z=(x[i]-x[i].mean())/x[i].std()
# 判斷差值的絕對值是否大于3,將判斷結果賦值給 DataFrame a 的對應列
# 這里,大于3通常被視作可能的異常值a[i]=abs(z)>3# 統計各列異常值個數 
print(a.sum())
# 刪除異常值
# 使用布爾型 DataFrame a 來篩選數據子集 x,保留非異常值
# ~a 會對 DataFrame a 中的布爾值取反,使得 True 變為 False,False 變為 True
# 即保留原數據中那些在 a 中標記為非異常值的位置,x中異常值會被標記成NAN
# 然后調用 dropna() 方法刪除包含缺失值(NAN)的行
x[~a].dropna()########## End ########## 

df.dropna() ?#將所有含有NAN項的row刪除

?在這一關中去掉“.dropna()”也能過,上一關中結尾沒加上“.dropna()”,也成功了,目前看來應該不影響,可能是系統自動處理了。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/713816.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/713816.shtml
英文地址,請注明出處:http://en.pswp.cn/news/713816.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ASPICE實操中的那點事兒-如何避免重復性測試

寫在前面 ASPICE理解起來容易,畢竟是有條有理的。但實操起來,尤其是把ASPICE各過程域做全的時候,會遇到各種各樣的問題(不是技術問題有多難,而是該如何做選擇,如何既能符合ASPICE要求,保證過程質…

智慧城市建設的新里程碑:公共服務電子支付大屏

隨著科技的飛速發展,我們的生活正在經歷前所未有的變革。電子支付的出現,無疑是這場變革中的一大亮點,它不僅改變了我們日常的支付方式,更成為智慧城市建設的重要一環,為公眾提供了更加便捷、高效的服務體驗。 在以前&…

python SHP2COCO

1. 將shp的標簽數據轉成coco # -*- coding: utf-8 -*- import os, json import cv2 from osgeo import gdal import numpy as np from osgeo import ogr, gdal, osr from shapely.geometry import box, shape from shapely.geometry.polygon import Polygon import collection…

Flutter 的狀態管理

狀態提升(Lifting-state-up) 把子組件的狀態,提升到上級組件中,從而實現在多個組件之間共享和同步數據的效果 以 flutter counter demo,那個按按鈕1 的來說,現在的 count 是幾,不是存在頁面顯…

政府采購標書制作的要點解析

導語:政府采購是政府為滿足公共利益,按照法定程序和標準,通過招標、競爭性談判等方式,購買商品、工程和服務的行為。標書作為政府采購活動中的重要文件,其制作質量直接影響到項目的順利進行。本文將圍繞政府采購標書制…

二路歸并排序的算法設計和復雜度分析and周記

數據結構實驗報告 實驗目的: 通過本次實驗,了解算法復雜度的分析方法,掌握遞歸算法時間復雜度的遞推計算過程。 實驗內容: 二路歸并排序的算法設計和復雜度分析 實驗過程: 1.算法設計 第一步,首先要將數組進行…

【網站項目】314學生二手書籍交易平臺

🙊作者簡介:擁有多年開發工作經驗,分享技術代碼幫助學生學習,獨立完成自己的項目或者畢業設計。 代碼可以私聊博主獲取。🌹贈送計算機畢業設計600個選題excel文件,幫助大學選題。贈送開題報告模板&#xff…

關于游戲公司組織架構的小討論

過完年剛剛上班沒幾天,就有一件比較搞笑的事情,可以和大家分享一下。 ??某一天我們在公司的會議室開會,發現有非常多蚊子,于是找行政問能不能找專業人士來滅蚊。行政的答復是,專業滅蚊是有固定時間的,還要…

JVM相關面試題(2024大廠高頻面試題系列)

一、JVM的組成 1、JVM由哪些部分組成,運行流程是什么? 回答:在JVM中共有四大部分,分別是Class Loader(類加載器)、Runtime Data Area(運行時數據區,內存分區)、Execut…

MyBatis的補充用法

說明:之前介紹過MyBatis的用法,像 用注解和Mapper.xml操作數據庫、在Mapper.xml里寫動態SQL。最近在一次用MyBatis批量更新數據庫對象的場景中,意識到對MyBatis的一些標簽用法不太熟悉,所以去 MyBatis官網 看了一些文檔&#xff0…

php httpfs鏈接hdfs

一.代碼(有bug) GitHub - michaelbutler/php-WebHDFS: A PHP client for WebHDFS 二.調用代碼 1.代碼1.代碼 require_once(../webhdfs/src/org/apache/hadoop/WebHDFS.php);require_once(../webhdfs/src/org/apache/hadoop/tools/Curl.php); require_o…

什么是人才儲備?如何做人才儲備?

很多小伙伴都會有企業面試被拒的情況,然后HR會告訴你,雖然沒有錄用你,但是你進入了他們的人才儲備庫,那么這個儲備庫有什么作用和特點呢?我們如何應用人才測評系統完善人才儲備庫呢? 人才儲備一般有以下三…

Python打發無聊時光:12.用PyQt實現簡易的心電起搏器界面

第一步:裝PyQt庫 pip install PyQt5 第二步:復制代碼 import sys from PyQt5.QtWidgets import (QApplication, QMainWindow, QPushButton, QVBoxLayout,QWidget, QLabel, QProgressBar, QSlider, QLineEdit, QHBoxLayout) from PyQt5.QtCore import …

軟件分層(數據結構/軟件邏輯上分層+舉例),相連節點的概念+如何相連,為什么是層狀結構(軟件分層,網絡協議分層+梳理協議順序),協議分層(打電話例子)

目錄 軟件分層 介紹 舉例 類的繼承 虛擬文件系統 線程接口封裝 虛擬地址空間 總結 為什么是層狀的 軟件分層 網絡協議 原因 梳理協議順序 相連節點 協議分層 引入 示例 實際上 邏輯上 制定出協議 軟件分層 介紹 通過將軟件系統劃分為不同的層次,每一層都有…

uniApp 調整小程序 單個/全部界面橫屏展示效果

我們打開uni項目 小程序端運行 默認是豎著的一個效果 我們打開項目的 pages.json 給需要橫屏的界面 的 style 屬性 加上 "mp-weixin": {"pageOrientation": "landscape" }界面就橫屏了 如果是要所有界面都橫屏的話 就直接在pages.json 的 gl…

Ps:海綿工具

海綿工具 Sponge Tool可用于調整圖像中特定區域的飽和度,常用于增加或減少顏色的飽和度。 快捷鍵:O 在特別的灰度圖像上,則可用于調整對比度,這可以開發出更多的創意技巧。 ◆ ◆ ◆ 常用操作方法與技巧 1、海綿工具主要用于調整…

源碼解析篇 | YOLOv8官方源碼項目目錄結構解析

前言:Hello大家好,我是小哥談。YOLOv8是一種目標檢測算法,它是YOLO(You Only Look Once)系列算法的第8個版本。YOLOv8相比于之前的版本,在檢測精度和速度上都有所提升,它在各種場景下都表現出色…

Git源碼管理

參考視頻:16-git的日志以及版本管理_嗶哩嗶哩_bilibili 參考博客:Git && Docker 學習筆記-CSDN博客 目錄 簡介 個人操作初始化 初始化git目錄 查看生成的git目錄文件 配置git工作目錄的用戶信息 查看工作區的狀態,生成文件的…

【JS】生成N位隨機數

作用 用于郵箱驗證碼 碼 ramNum.js /*** 生成N位隨機數字* param {Number} l 默認&#xff1a;6&#xff0c;默認生成6位隨機數字* returns 返回N位隨機數字*/ const ramNum (l 6) > {let num for (let i 0; i < l; i) {const n Math.random()const str String(n…

C++面試干貨---帶你梳理常考的面試題(一)

顧得泉&#xff1a;個人主頁 個人專欄&#xff1a;《Linux操作系統》 《C從入門到精通》 《LeedCode刷題》 鍵盤敲爛&#xff0c;年薪百萬&#xff01; 1.C和C的區別 1.語法和特性&#xff1a;C是一種過程式編程語言&#xff0c;而C是一種面向對象編程語言。C在C的基礎上增加…