python 怎么調用 矩陣 第幾行_第58集 python機器學習:混淆矩陣精度指標

混淆矩陣的精度計算公式為:精度=(TP+TN)/(TP+TN+FP+FN),也就是說,精度就是指正確的預測數目除以所有樣本的數量。

準確率、召回率與f-分數:總結混淆矩陣還有幾種方法,其中最常見的就是準確率和召回率。準確率度量的是被預測為正例的樣本有多少是整整的樣例。即:準確率=TP/(TP+FP)。如果目標是限制假正例的數量,那么可以使用準確率作為性能目標。

召回率:召回率(recalll)度量的是正類樣本中有多少被預測為正類,即:召回率=TP/(TP+FN),如果我們需要找出所有的正類樣本,即避免反例是很重要的情況下,那么可以使用召回率作為性能指標。

在優化召回率與優化準確率之間需要折中,如果你預測所有樣本都屬于正類,那么可以輕松得到完美的召回率(沒有假反例、也沒有真反例)。但是,將所有樣本都預測為正類,將會得得很多假正例,因此準確率會很低。與之相反,如果你的模型只講一個最確定的數據點預測為正類,其他點都預測為反類,那么準確率將會很完美(假設這個數據點上實際上就屬于正類),但是召回率會很差。(當然,準確率和召回率只是度量混淆矩陣情況中兩個量,其他的可以根據實際情況取對應的參數)。

f-分數:雖然準確率和召回率是非常重要的度量,三式僅查看二者之一無法提供完美的途徑,所以還有一種將兩種方法匯總的方法——f-分數。它是準確率與召回率的調和平均,即:F=2*(準確率*召回率)/(準確率+召回率)。

由于f-分數同時考慮了準確率和召回率,所以它對于不平衡的二分類數據集來說是一種比精度更好的度量方式。我們對前面提到過的“9與其余”的數據集的預測結果計算f1-分數(我們這里假設“9”是正類,標記為True,其他樣本為False):

from sklearn.metrics import f1_score

print("F1 score most frequent: {:.2f}".format(f1_score(y_test, pred_most_frequent)))

print("F1 score dummy: {:.2f}".format(f1_score(y_test, pred_dummy)))

print("F1 score logreg: {:.2f}".format(f1_score(y_test, pred_logreg)))

print("F1 score of Tree: {:.2f}".format(f1_score(y_test, pred_tree)))

運行后其結果如下:

F1 score most frequent: 0.00

F1 score dummy: 0.13

F1 score logreg: 0.89

F1 score of Tree: 0.55

由運行結果可以看出:most_frequency的預測中得到的是一條錯誤信息;另外需要注意的是,虛擬預測和決策樹預測之間還是有差別的,盡管精度差別不大,但是f-分數卻相差很大。在這里,f-分數更加符合我們對模型的直覺。f-分數的缺點則是比精度更加難以解釋。

如果我們要對準確率、召回率和f1-分數做一個更加全面的總結,則可以使用classification_report這個函數,它可以同時計算這三個值,并以美觀的形式打印出來。

from sklearn.metrics import classification_report

print("Most frequency class precious:")

print(classification_report(y_test, pred_most_frequent, target_names=["not Nine", "Nine"]))

print("Dummy model precious:")

print(classification_report(y_test, pred_dummy, target_names=["not Nine", "Nine"]))

print("Decision tree precious:")

print(classification_report(y_test, pred_tree, target_names=["not Nine", "Nine"]))

print("logistic regression precious")

print(classification_report(y_test, pred_logreg, target_names=["not Nine", "Nine"]))

運行結果如下圖

67a7ab17db7c1f01b721b1f4cf040d5a.png

classification_report 屬性打印

classification_report函數為每個類別(這里是True和False)生成一行,并給出以該類并為正類的準確率、召回率及f-分數。這里的最后一列support(支持)表示的是在這個類別中真實樣本的數量;最后一行顯示的是對應指標的加權平均(按每個類別中的樣本個數加權)。

同時,我們從運行結果中還可以看出,虛擬模型與logreg之間的區別并不是很明顯,選擇哪個類作為正類對指標有很大影響。在這里選擇Nine作為正類時logisticregression比其他方法更具備優勢。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/533456.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/533456.shtml
英文地址,請注明出處:http://en.pswp.cn/news/533456.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

android seekbar閃退,android seekbar 踩坑之路

最近項目中有用到seekbar,之前對這東西不太了解,趁機來踩坑。seekbar樣式按我覺得Material 中的還不算難看了。但是美工給了自己的樣式,還是得改。主要有這2個屬性:android:thumb"drawable/thumb"android:progressDrawable"dr…

tensorflow分類的loss函數_tensorflow 分類損失函數使用小記

多分類損失函數label.shape:[batch_size]; pred.shape: [batch_size, num_classes]使用 tf.keras.losses.sparse_categorical_crossentropy(y_true, y_pred, from_logitsFalse, axis-1)- y_true 真實值, y_pred 預測值- from_logits,我的理解是,如果預測…

華為鴻蒙系統還沒發布嗎,華為沒有孤軍奮戰,合作伙伴“雪中送炭”,鴻蒙系統正式發布!...

6月2日晚上,期待許久的鴻蒙0S 2終于正式登場了,這意味著鴻蒙手機已經變成了面向市場的正式產品,這是華為邁出的一小步,卻是國產系統與安卓、iOS競爭的開始。在鴻蒙OS正式推出后,不少華為手機用戶已經收到了系統更新的推…

freemark循環map_java與freemarker遍歷map

一、java遍歷MAP/*** 1.把key放到一個集合里,遍歷key值同時根據key得到值 (推薦)*/Set set map.keySet();Iterator itset.iterator();while(it.hasNext()){String s (String) it.next();System.out.println(map.get(s));}/*** 2.把一個map對象放到放到entry里&#…

.net 開發 html框架,Asp.net的開發框架

Asp.net的開發首先要選擇開發框架,選擇怎樣框架要看看開發什么養的網站用的,選擇一個適合的開發框架能節約很多的時間。20個優秀的前端框架:1. Twitter BootStrap (Apache v2.0;響應式)時髦、直觀并且強大的前端框架,讓…

baseresponse響應類_內部類、響應類Response、序列化基類、反序列化、全局局部鉤子...

一、內部類1、概念:將類定義在一個類的內部,被定義的類就是內部類2、特點:內部類及內部類的所以名稱空間,可以直接被外部類訪問的3、 應用:通過內部類的名稱空間,給外部類額外拓展一些特殊的屬性(配置)&…

python模塊名限定_python?正則表達式?匹配??的使用?限定符?sys.re模塊

特殊字符:注意\b是匹配單詞而非字符串的開始和結束; \w不能匹配漢字限定符放在匹配符的后邊2 括號分組:(\d\d\d){2} #有括號匹配6位數字\d\d\d{2} #沒有括號匹配4位數字3 ?的使用4 sys.re模塊的常用函數表:查找、分隔、…

計算機不能進入桌面,電腦開機無法進入桌面,請高手解決。

該故障是Windows XP操作系統關機故障中最容易出現的故障。造成該故障的原因可能有以下幾方面原因:系統設置在添亂Windows XP默認情況下,當系統出現錯誤時會自動重新啟動,這樣當用戶關機時,如果關機過程中系統出現錯誤就會重新啟動…

太陽能板清洗機器人科沃斯_太陽能電池板清潔機器人

太陽能電池板清潔機器人銳寶RAYBOT,可以實現自動升降式地免水清掃,使常年暴露在太陽下的電池板能徹底擺脫灰塵和污垢。當放置在太陽能電池板上時,銳寶能夠自主行走、跨越最大3cm間隙并自動規劃路線。底部吸盤設計能使RAYBOT安全地吸附在最大安…

html jq 控制顯示密碼,js、jquery分別實現點擊密碼輸入框密碼顯示和隱藏

很多密覽始不次這得是覺磚怎可我滾腦選的方近器上碼框都有個眼睛標記,點擊能顯示密碼。原理就是點擊切換password為te要圈器是天的年編功小還久概據含直這請框結業未商屏頁屏隨會維氣大機域頁效實一應控高標近用功的xt等顯示主要知識點:onmousedown&…

maven依賴循環引用_maven循環引用的問題

多模塊的maven工程,有時候由于設計的不合理或者需求的變更。會導致模塊之間產生循環依賴,編譯的時候會報如下的錯誤:[INFO] Scanning for projects... [ERROR] The projects in the reactor contain a cyclic reference: Edge between .....重…

翻翻看 類型html5,3款容易上手的HTML5編輯工具推薦~

該樓層疑似違規已被系統折疊 隱藏此樓查看此樓我們的生活已經時刻可見H5頁面的身影,從美食到用車、從購物到求職,可以說HTML5技術對我們生活的影響是顛覆性的。今天小編就給大家推薦5款容易上手的H5頁面,大家可以通過自己制作H5頁面來感受一下…

ilm 和dlm差異_《存儲e周刊》第28期?信息生命周期管理之爭

說二月份的最后一周是ILM之周,完全是因為EMC在華推出了其歷史上最廣泛的分級存儲平臺組合,跨高端、中端、網絡附加存儲(NAS)與內容尋址存儲(CAS)的全部系列,希望以此幫助客戶實現信息在整個生命周期中的最大價值。而信息生命周期管理的存儲理…

幼兒園體育游戲電子計算機教案,【幼兒園體育跳圈圈教案】小班體育教案跳圈圈_小班跳圈圈游戲教案_親親寶貝網...

教案二:小兔跳圈活動目標:1、在原地縱跳和短距離雙腳連續向前跳的基礎上,嘗試較長距離雙腳連續向前跳圈。2、提高身體的協調能力和彈跳能力。活動準備:1、材料準備:呼啦圈若干、小兔頭飾、蘑菇、籃子。2、游戲場地設置…

crtsiii型無砟軌道板_自主知識產權CRTSⅢ型軌道板助力,贛深鐵路無砟軌道軌道板灌注第一工作面完成...

(本報河源訊 通訊員 陳前名 楊琰妤)11月29日,伴隨著碧源中橋軌道板最后一方自密實混凝土澆筑完成,標志著由中國中鐵四局機電公司贛深鐵路項目部負責施工的第一工作面無砟軌道工程圓滿完成,為實現年底全線軌道板全部灌注的目標奠定了堅實基礎。…

thymeleaf 復選框回顯_Thymeleaf+layui+jquery復選框回顯

一、Thymeleaflayuijquery復選框回顯基于Thymeleaf模板下的layuijquery復選框回顯,主要是jquery。大致意思是:把數組轉成JSON傳到前臺,再在前臺轉回數組 AJAX一般都是用JSON格式或XML格式來傳遞數據的JSON就是一種具有特殊格式的字符串。1.實…

計算機網絡畫出發送窗口變化,全國2010年7月自考計算機網絡原理試題及答案

全國2010年7月自考計算機網絡原理試題及答案課程代碼:04741一、單項選擇題(本大題共24小題,每小題1分,共24分)在每小題列出的四個備選項中只有一個是符合題目要求的,請將其代碼填寫在題后的括號內。錯選、多選或未選均無分。1.由一…

帶孔的打印紙怎么設置_帶孔電腦打印紙規格尺寸的相關知識及應用范圍

1.帶孔電腦打印紙規格尺寸的相關知識及應用范圍。帶孔電腦打印紙有分241mm和381mm通用兩種規格。這里的241mm和381mm指的是的寬度,通常用的時候來分層數,可以分為1至6層甚至7、8層之多,打印紙的顏色有白、紅、藍、綠、黃五種,而白…

聾人工學院計算機老師,聾人工學院12位手語老師用雙手傳遞聲音

在全國第十屆殘運會暨第七屆特奧會上有一個特殊的節目,它雖然是舞蹈,但表演者卻聽不見背景音樂,它雖然需要踩點,但表演者卻只能靠記憶與眼睛去完成每一個節拍。70名理工大學聾人工學院的聽障同學將克服身體殘疾,共同演…