成為AI產品經理——模型評估指標

目錄

一、模型評估分類

1.在線評估

2.離線評估?

二、離線模型評估

1.特征評估

① 特征自身穩定性

② 特征來源穩定性

③ 特征成本

2.模型評估

① 統計性評估

覆蓋度

最大值、最小值

分布形態

② 模型性能指標

分類問題

回歸問題

?③ 模型的穩定性


模型評估指標分五小節課程,這節課全局講述模型評估指標有什么,下三節課重點講解模型性能指標,了解他們的計算;最后一節課,詳細講解模型的穩定性指標。

一、模型評估分類

模型評估分為:離線評估和在線評估兩類。

1.在線評估

在線評估通常是將模型部署上線后,使用線上真實數據對模型進行評估。通常會采取ABTest方式來評估業務的表現。

ABTest的操作方式是先導入一部分流量到模型中,使得一部分用戶使用模型訓練后的商品頁面,而一部分用戶看到原來的界面,這兩部分用戶互相獨立,測試1周或1天,觀察兩者點擊率或者購買轉化率的差異,判斷模型是否達到業務預期。

如果想繼續了解ABTest,請查看詳情:

產品經理需要懂的AB測試 - 知乎 (zhihu.com)

如何避免產品開發的致命陷阱?AB測試是你不可或缺的救命稻草! | 人人都是產品經理 (woshipm.com)

2.離線評估?

離線評估是模型在上線之前進行的驗證和評估工作,如果驗收不通過,算法同學要進行模型的調整和優化。

離線評估更關注模型指標,如:準確率、穩定性等;而上線評估更加關注業務指標,如:用戶轉化率、優惠劵的核銷率。

接下來我們為了講述模型指標,主要關注離線模型的評估。

二、離線模型評估

離線模型評估分為特征評估模型評估兩類。

特征是模型的基礎,所以我們不僅要對模型最終效果進行評估,還要對特征進行評估。

1.特征評估

對于特征評估我們并不是對所有的特征進行評估,我們只對重要特征進行評估。那么我們就需要和算法同學進行溝通,了解哪些特征比較重要。

特征評估包括三點:特征自身穩定性、特征來源穩定性、特征成本

① 特征自身穩定性

特征自身穩定性我們會使用PSI指標進行評估。PSI指標(模型隨著時間推移發生變化而不穩定的指標)。特征自身穩定性會影響模型的整體效果,所以我們需要測評重要特征是否達到穩定指標。

② 特征來源穩定性

特征一般分為:內部來源和外部來源

如果特征是從集團內部接入的,那我們需要看他從哪條業務線獲取的,這個業務的穩定性如何,業務方是否有可能中止共享數據或者收回數據。

如果特征是從集團外部接入的,我們需要審核外部公司的資質是否合法,技術儲備是否完善

③ 特征成本

不同來源的特征可能成本也不相同,如果特征來源是集團內部業務,可能不需要成本或者需要年終進行成本均攤。如果是外部購買的特征數據,那就正常支付就好了。

作為產品經理,我們在進行評估的時候要充分考慮到付費特征在模型中產生的增益是否大于成本,如果成本過高,那么我們考慮是否可以替換特征或者使用數據緩存的方式減少調用

2.模型評估

模型評估也包括三部分:統計性評估、模型性能指標和模型的穩定性。

① 統計性評估

?在進行模型性能指標和穩定性評估之前,我們首先要對統計性能進行評估。包括:覆蓋度、最大值、最小值、分布規律。

覆蓋度

計算公式:打分的人數/需要打分的人數

結果越大,覆蓋度越大。比如我們要做一個用戶逾期還款預測的模型,如果覆蓋率只有60%,那么銀行就沒有辦法按照這個模型進行決策,這個模型就是沒有用的。

最大值、最小值

我們需要對最大值和最小值進行評估。

如果最大值和最小值相隔太近,例如:0-100作為一個信用劃分的區間,用戶很容易集中在一個分數段,難以進行用戶的區分。如果將0-100作為一個劃分的總區間,相當于過去大的1份區間被細化成為現在的10份,就會更便于劃分用戶。

分布形態

我們的預測結果和我們的人群行為的分布應該符合一定的規律。

比如:預測用戶消費能力,人群的分布情況應該滿足應該滿足正態分布。?

業務場景不同,需要重點觀察的統計性能指標也不同。

② 模型性能指標

根據問題的差異被分為:回歸問題和分類問題。

模型被分為:分類模型和回歸模型。不同類型的模型評估指標不相同。

分類問題

主要指標:混淆矩陣、KS、AUC。

將混淆矩陣作為基礎工具,我們可以計算出召回率、準確率。評判模型的區分能力。我們也可以計算出TPR、FPR,從而計算出AUC和KS等相關指標。

因此,混淆矩陣是二分類問題的基礎工具。

回歸問題

主要指標:MAE(平均絕對誤差)、MSE(均方誤差)、RMSE(均方根誤差)、R方等。?

這些指標主要預測數值回歸問題。

?③ 模型的穩定性

最后,我們需要評估模型整體效果的穩定性。主要使用PSI指標進行評估。

這節課我們主要從全局角度了解模型評估,評估指標計算方法后面文章會詳細說明。

今天的知識思維導圖如下所示:

參考文獻:劉海豐——《成為AI產品經理》?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/166436.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/166436.shtml
英文地址,請注明出處:http://en.pswp.cn/news/166436.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

配置mvn打包參數,不同環境使用不同的配置文件

方法一: 首先在/resource目錄下創建各自環境的配置 要在不同的環境中使用不同的配置文件進行Maven打包,可以使用Maven的profiles特性和資源過濾功能。下面是配置Maven打包參數的步驟: 在項目的pom.xml文件中,添加profiles配置…

python 負數 處理

num_negative -4 print(num_negative) num_dec_to_hex hex(num_negative) print(負數轉十六進制: num_dec_to_hex) /---------------------------------------------------------/ -4 負數轉十六進制:-0x4通過上面代碼片段可以看到,python…

第一個Mybatis項目

(一)為什么要用Mybatis? (1)Mybatis對比JDBC而言,sql(單獨寫在xml的配置文件中)和java編碼分開,功能邊界清晰,一個專注業務,一個專注數據。 (2&…

【C++】:多態

朋友們、伙計們,我們又見面了,本期來給大家解讀一下有關多態的知識點,如果看完之后對你有一定的啟發,那么請留下你的三連,祝大家心想事成! C 語 言 專 欄:C語言:從入門到精通 數據結…

Linux(CentOS7)上安裝mysql

在CentOS中默認安裝有MariaDB(MySQL的一個分支),可先移除/卸載MariaDB。 yum remove mariadb // 查看是否存在mariadb rpm -qa|grep -i mariadb // 卸載 mariadb rpm -e --nodeps rpm -qa|grep mariadb yum安裝 下載rpm // 5.6版本 wge…

XML映射文件

<?xml version"1.0" encoding"UTF-8" ?> <!DOCTYPE mapperPUBLIC "-//mybatis.org//DTD Mapper 3.0//EN""http://mybatis.org/dtd/mybatis-3-mapper.dtd"> <mapper namespace"org.mybatis.example.BlogMapper&q…

conan 入門(三十二):package_info中配置禁用CMakeDeps生成使用項目自己生成的config.cmake

conanfile.py中定義的package_info()方法用于向package的調用者(conumer)提供包庫名&#xff0c;編譯/連接選項&#xff0c;文件夾等等信息&#xff0c;有了這些信息構建工具的generator就可以根據它們生成對應的文件&#xff0c;用于調用者引用package. 比如基于cmake的CMakeD…

線索二叉樹:C++實現

引言&#xff1a; 線索二叉樹是一種特殊的二叉樹&#xff0c;它可以通過線索&#xff08;線索是指在二叉樹中將空指針改為指向前驅或后繼的指針&#xff09;的方式將二叉樹轉化為一個線性結構&#xff0c;從而方便對二叉樹進行遍歷。本文將介紹如何使用C實現線索二叉樹。 技術…

安全地公網訪問樹莓派等設備的服務 內網穿透--frp 23年11月方法

如果想要樹莓派可以被公網訪問&#xff0c;可以選擇直接網上搜內網穿透提供商&#xff0c;一個月大概10塊錢&#xff0c;也有免費的&#xff0c;但是免費的速度就不要希望很好了。 也可以選擇接下來介紹的frp&#xff0c;這種方式不需要付費&#xff0c;但是需要你有一臺有著公…

vue3自定義拖拽指令

<template><div v-move class"box"></div> </template><script setup lang"ts"> import { Directive } from vue const vMove:Directive (el:HTMLElement) >{const mousedown (e:MouseEvent) >{// 鼠標按下const s…

【Golang】解決使用interface{}解析json數字會變成科學計數法的問題

在使用解析json結構體的時候&#xff0c;使用interface{}接數字會發現變成了科學計數法格式的數字&#xff0c;不符合實際場景的使用要求。 舉例代碼如下&#xff1a; type JsonUnmStruct struct {Id interface{} json:"id"Name string json:"name"…

Linux 的性能調優的思路

Linux操作系統是一個開源產品&#xff0c;也是一個開源軟件的實踐和應用平臺&#xff0c;在這個平臺下有無數的開源軟件支撐&#xff0c;我們常見的apache、tomcat、mysql等。 開源軟件的最大理念是自由、開放&#xff0c;那么Linux作為一個開源平臺&#xff0c;最終要實現的是…

Java反射調用kotlin中的類,Object類,Companion對

Java反射調用kotlin中的類&#xff0c;Object類&#xff0c;Companion對象 1. Java反射調用kotlin中的普通類 kotlin普通類&#xff1a; package com.common; class TestNormal {fun get():String{return "Nolmal abc"}fun showNum(v:Int){println("Nolmal s…

uniApp微信支付實現

后端&#xff1a;小程序下單 - 小程序支付 | 微信支付商戶文檔中心 服務端需要請求&#xff1a;https://api.mch.weixin.qq.com該地址獲取微信支付Api接口需要的參數。 服務端請求接口需要的Body參數&#xff1a; 客戶端&#xff08;前端&#xff09;需要調用&#xff1a;wx.…

12V降3.3V100mA穩壓芯片WT7133

12V降3.3V100mA穩壓芯片WT7133 WT71XX系列是一款采用CMOS工藝實現的三端高輸入電壓、低壓差、小輸出電流電壓穩壓器。 它的輸出電流可達到100mA&#xff0c;輸入電壓可達到18V。其固定輸出電壓的范圍是2.5V&#xff5e;8.0V&#xff0c;用戶 也可通過外圍應用電路來實現可變電壓…

加載minio中存儲的靜態文件html,不顯示樣式與js

問題描述:點擊鏈接獲取的就是純靜態文件,但是通過瀏覽器可以看到明明加載了css文件與js文件 原因:仔細看你會發現加載css文件顯示的contentType:text/html文件,原來是minio上傳文件時將所有文件的contentType設置成了text/html 要在上傳時指定文件,根據文章的類型指定的Conten…

css 固定按鈕到頁面頂部或者底部的實現方式

實現方式 要將按鈕固定到頂部或底部&#xff0c;可以使用CSS的定位屬性來實現。下面是一種常用的方法&#xff1a; 創建一個包含按鈕的HTML元素&#xff0c;例如一個<div>元素。確保給它添加一個唯一的id&#xff0c;以便在CSS中進行定位。 <div id"myButton&qu…

從二極管到linux服務器

軟件設計: os: 批處理系統: 輪詢系統:單片機裸機開發 實時系統:ucosii,rtos,rt-thread、風和系統、liteos(主要是海思系列soc在用)等 非實時系統:linux 對os任務切換時寄存器的功能有理解。 對ipc機制有理解。 bsp: 需要對寄存器、單片機內部總線、iic、spi、uart、c…

win10開機黑屏只有鼠標?這份指南幫你輕松解決!

win10是一個出色的操作系統&#xff0c;但有時用戶可能會遇到開機后只有鼠標顯示在屏幕上的問題&#xff0c;這種情況可能會讓人感到困惑和沮喪。在本文中&#xff0c;我們將介紹三種解決win10開機黑屏只有鼠標的方法&#xff0c;以幫助您快速恢復正常的桌面環境。 方法1&#…

Ubuntu18.4中安裝wkhtmltopdf + Odoo16配置【二】

deepin Linux 安裝wkhtmltopdf 1、先從官網的鏈接里下載linux對應的包 wkhtmltopdf/wkhtmltopdf 下載需要的版本&#xff0c;推薦版本&#xff0c;新測有效&#xff1a; wkhtmltox-0.12.4_linux-generic-amd64.tar.xz 2、解壓下載的文件 解壓后會有一個wkhtmltox文件夾 3…