詳談P(查準率),R(查全率),F1值

怎么來的?

????我們平時用的精度accuracy,也就是整體的正確率

????????acc = predict_right_num / predict_num

這個雖然常用,但不能滿足所有任務的需求。比如,因為香蕉太多了,也不能撥開人工的一個一個的看它的好壞(我愛吃啊,想想就心疼),此時我們就需要有一種方法,代替撥開香蕉這種粗魯的手段。這時我們需要通過一些測試,看看哪種方法能更加準確的預測。我們可以通過

????“準”:預測的準確度,就是我預測的結果中真正好的香蕉要越多越好;

????“全”:就是所有的好的香蕉預測出來的越多越好,雖然把有些壞的也預測是好的了,那也不管,“全”就行。

其實這兩者都想要達到就好了,但是不行的:

????比如"準",我就預測一個算了,好的香蕉肯定比壞的比例高,也就是我只預測一個,100%比例幾率最大了,這時就不“全”了,海域好多好的不能都當成壞的扔了吧。。

? ? 再比如"全",我去全部預測成好的這真正好的都在我的預測里,也就是100%。可是這時的"準"就賊不準了。。

? ? 所以就必須來平衡這倆同志的關系了,怎么平衡呢?肯定是通過權重來的呀,此時,F值登上歷史舞臺!

啥意思捏?

? ? 實例化講解吧。比如我們的香蕉中 1 表示好的,0表示壞的,有10個香蕉:

? ? ? ?gold : ? ? [ 1,1,1,1,1,0,0,0,0,0 ]

? ? ? ?pred: ? [ 1,0,1,1,1,1,1,0,0,0 ]

? ? 注釋:gold是現實的好壞;pred是預測的好壞。

????P(Precision) 查準率:就是上面說的"準"。字面意思好理解呀,就是在預測當中查找準確個數的比例。公式為:

? ? ? ? P = 真正預測準確的數量 / 預測是準確的數量 = 4 / 6

? ? R(Recall) 查全率:就是上面的"全"。根據字面理解,在預測中看看真正預測對的占全有對的比率。公式為:

? ? ? R =?真正預測準確的數量 / 所有真正好的數量 = 4 / 5

? ? F值是:

? ? ? ? F(k) = ( 1 + k ) * P * R / ( ( k*k ) * P + R )

????????注釋:k>0 度量了 查全率 對 查準率 的相對重要性。k>1查全率有更大影響;k<1查準率有更大影響。

????????在這個實例中可以表示為:k>1就是查全率有更大影響,就是好的香蕉最好都預測出來,因為你覺得不想把好的當成壞的扔點( 真可惜,我愛吃啊 ) ;k<1查準率有更大影響,就是一定要準確,省時間,省力更重要,不在乎好的香蕉當壞的扔點。

? ? 而我們常用的是F1,就是F(1)的意思,k=1,比如我們做一個分類任務,這幾個類覺得都一樣重要。此時:

????????F(1) = 2 * P * R / ( P + R )

代碼實現:

? ? 背景:用evalList的長度是我需要求的P,R,F1的個數,比如我的實驗是立場檢測,分類為FAVOR(支持),AGAINST(反對),NONE(中立)。而NONE一般不考慮,只要求得FAVOR,AGAINST各自的P,R,F1,然后F1求個平均即可。比如這個論文的數據:

from Stance Detection with Bidirectional Conditional Encoding paper

? ? 這時我的evalList里有兩個數據分別表示FAVOR,AGAINST各自的P,R,F1值。

????這個P,R,F1的代碼為:

code
print

就這樣吧。應該講的很詳細了!



作者:zenRRan
鏈接:https://www.jianshu.com/p/6536d584d5fd
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯系作者獲得授權并注明出處。

轉載于:https://www.cnblogs.com/yourcool/p/9609538.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/388570.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/388570.shtml
英文地址,請注明出處:http://en.pswp.cn/news/388570.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

網站系統分布式架構

寫這篇文章之前&#xff0c;需要有些論點和論據&#xff0c;以表明網絡系統在極端情況下的情況&#xff0c;先來看看世界上排名靠前的網站。 1、 FaceBook 2、 Google 從這兩個站可以看出&#xff0c;當下比較極限的日均訪問量在2~3億&#xff0c;PV值…

linux文件系統學習,linux文件系統之tmpfs學習

關于文件系統&#xff0c;我們在下面的博文中已有做簡單的介紹&#xff0c;外鏈網址已屏蔽本篇博文我們學習的是文件系統中的tmpfs。tmpfs是一種偽文件系統&#xff0c;它是從DRAM中創建出來的&#xff0c;相比于磁盤而言&#xff0c;其具有更高的訪問效率。如何創建一個tmpfs&…

python 數據科學 包_什么時候應該使用哪個Python數據科學軟件包?

python 數據科學 包Python is the most popular language for data science. Unfortunately, it can be tricky to know which of the many data science libraries to use when. ??Python是數據科學中最流行的語言。 不幸的是&#xff0c;要知道何時使用許多數據科學庫中的哪…

Go語言開發環境配置

http://blog.csdn.net/hil2000/article/details/41261267/ 一.我為什么要學習go語言 當今已經是移動和云計算時代&#xff0c;Go出現在了工業向云計算轉型的時刻&#xff0c;簡單、高效、內 置并發原語和現代的標準庫讓Go語言尤其適合云端軟件開發&#xff08;畢竟它就是為此而…

微軟研發致勝策略

第一章奠定基礎 1&#xff0e;千萬不要把程序設計師的時間浪費在改善產品以外的工作上。 2&#xff0e;保護程序設計師不受任何阻礙和干擾。 3&#xff0e;永遠記得自己真正的目標&#xff0c;然后讓團隊用最有將效又最愉快的方法把它完成。 4&#xff0e;理清詳細的項目目…

熊貓tv新功能介紹_您應該知道的4種熊貓繪圖功能

熊貓tv新功能介紹Pandas is a powerful package for data scientists. There are many reasons we use Pandas, e.g. Data wrangling, Data cleaning, and Data manipulation. Although, there is a method that rarely talks about regarding Pandas package and that is the …

CPP_封裝_繼承_多態

類的三方法&#xff1a;封裝&#xff0c;繼承&#xff0c;多態。封裝&#xff1a;使用一整套方法去創建一個新的類型&#xff0c;這叫類的封裝。繼承&#xff1a;從一個現有的類型基礎上&#xff0c;稍作改動&#xff0c;得到一個新的類型的方法&#xff0c;叫類的繼承。多態&a…

win與linux淵源,微軟與Linux從對立走向合作,WSL是如何誕生的

原標題&#xff1a;微軟與Linux從對立走向合作&#xff0c;WSL是如何誕生的正文Windows Subsystem for Linux(WSL)的開發&#xff0c;讓微軟從Linux的對立面走向合作&#xff0c;并且不斷加大對開源社區的支持力度。而作為微軟歷史上的重要轉折點&#xff0c;外界對WSL技術在Pr…

文件編輯器 vi

1、關于文本編輯器&#xff1b; 文本編輯器有很多&#xff0c;比如圖形模式的gedit、kwrite、OpenOffice ... ... &#xff0c;文本模式下的編輯器有vi、vim&#xff08;vi的增強版本&#xff09;和nano ... ... vi和vim是我們在Linux中最常用的編輯器。我們有必要介紹一下vi&a…

MFC80.DLL復制到程序目錄中,也有的說復制到安裝目錄中

在用VS2005學習C調試程序的時候&#xff0c;按F5鍵&#xff0c;總提示這個問題&#xff0c; 不曉得什么原因&#xff0c;網上有的說找到MFC80.DLL復制到程序目錄中&#xff0c;也有的說復制到安裝目錄中&#xff0c;可結果很失望&#xff0c;也有的VS2005安裝有問題&#xff0…

vs顯示堆棧數據分析_什么是“數據分析堆棧”?

vs顯示堆棧數據分析A poor craftsman blames his tools. But if all you have is a hammer, everything looks like a nail.一個可憐的工匠責怪他的工具。 但是&#xff0c;如果您只有一把錘子&#xff0c;那么一切看起來都像釘子。 It’s common for web developers or databa…

服務器

服務器主流品牌&#xff1a;華為、浪潮、戴爾、惠普華為服務器&#xff1a;華為FusionServer RH2288 V3 華為FusionServer RH5885 V3 浪潮服務器&#xff1a; 浪潮英信NP3020M4 浪潮英信NF5280M4 戴爾服務器&#xff1a; 戴爾PowerEdge R730 機架式服務器 戴爾PowerEdge R740 機…

樹莓派 zero linux,樹莓派 zero基本調試

回家之前就從網上購買了一堆設備&#xff0c;回去也不能閑著&#xff0c;可以利用家里相對齊全的準備安裝調試。結果人還沒回來&#xff0c;東西先到了。購買的核心裝備是樹莓派zero w&#xff0c;雖然已經知道它比家族大哥樹莓派小不少&#xff0c;但拿到手里還是驚奇它的小巧…

error C2440 “static_cast” 無法從“void (__thiscall CPppView )(void)”轉換為“LRESULT (__thiscall

error C2440 “static_cast” 無法從“void (__thiscall CPppView )(void)”轉換為“LRESULT (__thiscall CWnd )(WPARAM,LPARAM)” 不能轉換void (_thiscall CMainFrame::*)(void)to LRESULT (__thiscall CWnd::* )(WPARAM,LPARAM)開發平臺由VC6.0升級至VS2005&#xff0c;需要…

簡單的編譯流程

簡易編譯器流程圖: 一個典型的編譯器&#xff0c;可以包含為一個前端&#xff0c;一個后端。前端接收源程序產生一個中間表示&#xff0c;后端接收中間表示繼續生成一個目標程序。所以&#xff0c;前端處理的是跟源語言有關的屬性&#xff0c;后端處理跟目標機器有關的屬性。 復…

廣告投手_測量投手隱藏自己的音高的程度

廣告投手As the baseball community has recently seen with the Astros 2017 cheating scandal, knowing what pitch is being thrown gives batters a game-breaking advantage. However, unless you have an intricate system of cameras and trash cans set up, knowing wh…

linux事務隔離級別,事務的隔離級別(Transaction isolation levels)2

READ COMMITTEDREAD COMMITTED這是數據庫默認的隔離級別。它能保證你不能讀取那張表格數據&#xff0c;只要有其它事務還在改變這張表格數據。可是&#xff0c;因為sql server在select操作的時&#xff0c;鎖表格時間就那么一小會兒&#xff0c;如果一個事務在READ COMMITTED級…

Asp導出到Excel之二

response.contentType "application/vnd.ms-excel" response.addheader "Content-Disposition", "attachment; filename引出文件.xls" 一、適用于動態和表態表。 二、頁面最好只存放數據表&#xff0c;不要有其它內容。 三、對于分頁的情…

warning C4996: “strcpy”被聲明為否決的解決辦法

VC2005中&#xff0c;使用了很多標準的C函數&#xff0c;比如fopen&#xff0c;strcpy之類的。編譯時會出現警告&#xff0c;比如這個&#xff1a; d:\xxxx.c(1893) : warning C4996: “strcpy”被聲明為否決的 緊接著IDE有提示說:“This function or variable…

驗證部分表單是否重復

1. 效果 圖片中的名稱、機構編碼需要進行重復驗證2. 思路及實現 表單驗證在獲取數據將需要驗證的表單數據進行保存this.nameChangeTemp response.data.orgName;this.codeChangeTemp response.data.orgCode; 通過rule對表單進行驗證 以名字的驗證為例rules: {orgName: [// 設置…