詳談P(查準率)，R(查全率)，F1值

news/2025/7/13 15:27:23/文章來源:https://blog.csdn.net/weixin_30312659/article/details/97409466

怎么來的？

????我們平時用的精度accuracy，也就是整體的正確率

????????acc = predict_right_num / predict_num

這個雖然常用，但不能滿足所有任務的需求。比如，因為香蕉太多了，也不能撥開人工的一個一個的看它的好壞(我愛吃啊，想想就心疼)，此時我們就需要有一種方法，代替撥開香蕉這種粗魯的手段。這時我們需要通過一些測試，看看哪種方法能更加準確的預測。我們可以通過

????“準”：預測的準確度，就是我預測的結果中真正好的香蕉要越多越好；

????“全”：就是所有的好的香蕉預測出來的越多越好，雖然把有些壞的也預測是好的了，那也不管，“全”就行。

其實這兩者都想要達到就好了，但是不行的：

????比如"準",我就預測一個算了，好的香蕉肯定比壞的比例高，也就是我只預測一個，100%比例幾率最大了，這時就不“全”了，海域好多好的不能都當成壞的扔了吧。。

? ? 再比如"全",我去全部預測成好的這真正好的都在我的預測里，也就是100%。可是這時的"準"就賊不準了。。

? ? 所以就必須來平衡這倆同志的關系了，怎么平衡呢？肯定是通過權重來的呀，此時，F值登上歷史舞臺!

啥意思捏？

? ? 實例化講解吧。比如我們的香蕉中 1 表示好的，0表示壞的，有10個香蕉：

? ? ? ?gold : ? ? [ 1，1，1，1，1，0，0，0，0，0 ]

? ? ? ?pred： ? [ 1，0，1，1，1，1，1，0，0，0 ]

? ? 注釋：gold是現實的好壞；pred是預測的好壞。

????P(Precision) 查準率：就是上面說的"準"。字面意思好理解呀，就是在預測當中查找準確個數的比例。公式為：

? ? ? ? P = 真正預測準確的數量 / 預測是準確的數量 = 4 / 6

? ? R(Recall) 查全率：就是上面的"全"。根據字面理解，在預測中看看真正預測對的占全有對的比率。公式為：

? ? ? R =?真正預測準確的數量 / 所有真正好的數量 = 4 / 5

? ? F值是：

? ? ? ? F(k) = ( 1 + k ) * P * R / ( ( k*k ) * P + R )

????????注釋：k>0 度量了查全率對查準率的相對重要性。k>1查全率有更大影響；k<1查準率有更大影響。

????????在這個實例中可以表示為：k>1就是查全率有更大影響，就是好的香蕉最好都預測出來，因為你覺得不想把好的當成壞的扔點( 真可惜，我愛吃啊 ) ；k<1查準率有更大影響，就是一定要準確，省時間，省力更重要，不在乎好的香蕉當壞的扔點。

? ? 而我們常用的是F1，就是F(1)的意思，k=1，比如我們做一個分類任務，這幾個類覺得都一樣重要。此時：

????????F(1) = 2 * P * R / ( P + R )

代碼實現：

? ? 背景：用evalList的長度是我需要求的P，R，F1的個數，比如我的實驗是立場檢測，分類為FAVOR(支持)，AGAINST(反對)，NONE(中立)。而NONE一般不考慮，只要求得FAVOR，AGAINST各自的P，R，F1，然后F1求個平均即可。比如這個論文的數據：

from Stance Detection with Bidirectional Conditional Encoding paper

? ? 這時我的evalList里有兩個數據分別表示FAVOR，AGAINST各自的P，R，F1值。

????這個P，R，F1的代碼為：

code

print

就這樣吧。應該講的很詳細了！

作者：zenRRan
鏈接：https://www.jianshu.com/p/6536d584d5fd
來源：簡書
簡書著作權歸作者所有，任何形式的轉載都請聯系作者獲得授權并注明出處。

轉載于:https://www.cnblogs.com/yourcool/p/9609538.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/388570.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/388570.shtml
英文地址，請注明出處：http://en.pswp.cn/news/388570.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

網站系統分布式架構

網站系統分布式架構

寫這篇文章之前，需要有些論點和論據，以表明網絡系統在極端情況下的情況，先來看看世界上排名靠前的網站。 1、 FaceBook 2、 Google 從這兩個站可以看出，當下比較極限的日均訪問量在2~3億，PV值…

閱讀更多...

linux文件系統學習,linux文件系統之tmpfs學習

linux文件系統學習,linux文件系統之tmpfs學習

關于文件系統，我們在下面的博文中已有做簡單的介紹，外鏈網址已屏蔽本篇博文我們學習的是文件系統中的tmpfs。tmpfs是一種偽文件系統，它是從DRAM中創建出來的，相比于磁盤而言，其具有更高的訪問效率。如何創建一個tmpfs&…

閱讀更多...

python 數據科學包_什么時候應該使用哪個Python數據科學軟件包？

python 數據科學包_什么時候應該使用哪個Python數據科學軟件包？

python 數據科學包Python is the most popular language for data science. Unfortunately, it can be tricky to know which of the many data science libraries to use when. ??Python是數據科學中最流行的語言。不幸的是，要知道何時使用許多數據科學庫中的哪…

閱讀更多...

Go語言開發環境配置

Go語言開發環境配置

http://blog.csdn.net/hil2000/article/details/41261267/ 一.我為什么要學習go語言當今已經是移動和云計算時代，Go出現在了工業向云計算轉型的時刻，簡單、高效、內置并發原語和現代的標準庫讓Go語言尤其適合云端軟件開發（畢竟它就是為此而…

閱讀更多...

微軟研發致勝策略

微軟研發致勝策略

第一章奠定基礎 1．千萬不要把程序設計師的時間浪費在改善產品以外的工作上。 2．保護程序設計師不受任何阻礙和干擾。 3．永遠記得自己真正的目標，然后讓團隊用最有將效又最愉快的方法把它完成。 4．理清詳細的項目目…

閱讀更多...

熊貓tv新功能介紹_您應該知道的4種熊貓繪圖功能

熊貓tv新功能介紹_您應該知道的4種熊貓繪圖功能

熊貓tv新功能介紹Pandas is a powerful package for data scientists. There are many reasons we use Pandas, e.g. Data wrangling, Data cleaning, and Data manipulation. Although, there is a method that rarely talks about regarding Pandas package and that is the …

閱讀更多...

CPP_封裝_繼承_多態

CPP_封裝_繼承_多態

類的三方法：封裝，繼承，多態。封裝：使用一整套方法去創建一個新的類型，這叫類的封裝。繼承：從一個現有的類型基礎上，稍作改動，得到一個新的類型的方法，叫類的繼承。多態&a…

閱讀更多...

win與linux淵源,微軟與Linux從對立走向合作，WSL是如何誕生的

win與linux淵源,微軟與Linux從對立走向合作，WSL是如何誕生的

原標題：微軟與Linux從對立走向合作，WSL是如何誕生的正文Windows Subsystem for Linux(WSL)的開發，讓微軟從Linux的對立面走向合作，并且不斷加大對開源社區的支持力度。而作為微軟歷史上的重要轉折點，外界對WSL技術在Pr…

閱讀更多...

文件編輯器 vi

文件編輯器 vi

1、關于文本編輯器； 文本編輯器有很多，比如圖形模式的gedit、kwrite、OpenOffice ... ... ，文本模式下的編輯器有vi、vim（vi的增強版本）和nano ... ... vi和vim是我們在Linux中最常用的編輯器。我們有必要介紹一下vi&a…

閱讀更多...

MFC80.DLL復制到程序目錄中，也有的說復制到安裝目錄中

MFC80.DLL復制到程序目錄中，也有的說復制到安裝目錄中

在用VS2005學習C調試程序的時候，按F5鍵，總提示這個問題， 不曉得什么原因，網上有的說找到MFC80.DLL復制到程序目錄中，也有的說復制到安裝目錄中，可結果很失望，也有的VS2005安裝有問題&#xff0…

閱讀更多...

vs顯示堆棧數據分析_什么是“數據分析堆棧”？

vs顯示堆棧數據分析_什么是“數據分析堆棧”？

vs顯示堆棧數據分析A poor craftsman blames his tools. But if all you have is a hammer, everything looks like a nail.一個可憐的工匠責怪他的工具。但是，如果您只有一把錘子，那么一切看起來都像釘子。 It’s common for web developers or databa…

閱讀更多...

服務器

服務器

服務器主流品牌：華為、浪潮、戴爾、惠普華為服務器：華為FusionServer RH2288 V3 華為FusionServer RH5885 V3 浪潮服務器： 浪潮英信NP3020M4 浪潮英信NF5280M4 戴爾服務器： 戴爾PowerEdge R730 機架式服務器戴爾PowerEdge R740 機…

閱讀更多...

樹莓派 zero linux,樹莓派 zero基本調試

樹莓派 zero linux,樹莓派 zero基本調試

回家之前就從網上購買了一堆設備，回去也不能閑著，可以利用家里相對齊全的準備安裝調試。結果人還沒回來，東西先到了。購買的核心裝備是樹莓派zero w，雖然已經知道它比家族大哥樹莓派小不少，但拿到手里還是驚奇它的小巧…

閱讀更多...

error C2440 “static_cast” 無法從“void (__thiscall CPppView )(void)”轉換為“LRESULT (__thiscall

error C2440 “static_cast” 無法從“void (thiscall CPppView )(void)”轉換為“LRESULT (thiscall

error C2440 “static_cast” 無法從“void (__thiscall CPppView )(void)”轉換為“LRESULT (__thiscall CWnd )(WPARAM,LPARAM)” 不能轉換void (_thiscall CMainFrame::*)(void)to LRESULT (__thiscall CWnd::* )(WPARAM,LPARAM)開發平臺由VC6.0升級至VS2005，需要…

閱讀更多...

簡單的編譯流程

簡單的編譯流程

簡易編譯器流程圖: 一個典型的編譯器，可以包含為一個前端，一個后端。前端接收源程序產生一個中間表示，后端接收中間表示繼續生成一個目標程序。所以，前端處理的是跟源語言有關的屬性，后端處理跟目標機器有關的屬性。復…

閱讀更多...

廣告投手_測量投手隱藏自己的音高的程度

廣告投手_測量投手隱藏自己的音高的程度

廣告投手As the baseball community has recently seen with the Astros 2017 cheating scandal, knowing what pitch is being thrown gives batters a game-breaking advantage. However, unless you have an intricate system of cameras and trash cans set up, knowing wh…

閱讀更多...

linux事務隔離級別,事務的隔離級別（Transaction isolation levels）2

linux事務隔離級別,事務的隔離級別（Transaction isolation levels）2

READ COMMITTEDREAD COMMITTED這是數據庫默認的隔離級別。它能保證你不能讀取那張表格數據，只要有其它事務還在改變這張表格數據。可是，因為sql server在select操作的時，鎖表格時間就那么一小會兒，如果一個事務在READ COMMITTED級…

閱讀更多...

Asp導出到Excel之二

Asp導出到Excel之二

response.contentType "application/vnd.ms-excel" response.addheader "Content-Disposition", "attachment; filename引出文件.xls" 一、適用于動態和表態表。二、頁面最好只存放數據表，不要有其它內容。三、對于分頁的情…

閱讀更多...

warning C4996: “strcpy”被聲明為否決的解決辦法

warning C4996: “strcpy”被聲明為否決的解決辦法

VC2005中，使用了很多標準的C函數，比如fopen，strcpy之類的。編譯時會出現警告，比如這個： d:\xxxx.c(1893) : warning C4996: “strcpy”被聲明為否決的緊接著IDE有提示說:“This function or variable…

閱讀更多...

驗證部分表單是否重復

驗證部分表單是否重復

1. 效果圖片中的名稱、機構編碼需要進行重復驗證2. 思路及實現表單驗證在獲取數據將需要驗證的表單數據進行保存this.nameChangeTemp response.data.orgName;this.codeChangeTemp response.data.orgCode; 通過rule對表單進行驗證以名字的驗證為例rules: {orgName: [// 設置…

閱讀更多...

最新文章