成為AI產品經理——模型評估概述

目錄

一、模型宣講和評估的原因

二、模型宣講

三、模型評估

1. 重要特征

① 特征來源

②特征意義

2.選擇測試樣本

3.模型性能和穩定性


一、模型宣講和評估的原因

劉海豐老師提到他們在做一個金融AI產品未注重模型指標,過于注重業務指標,導致產生了大量的業務損失。

主要問題為:

1.模型上線未評估

2.模型上線未監控

3.特征無評估、無監控

因此他們增加了模型宣講和模型評估的節點,對這兩個節點的工作內容和交付物做了相應的規定。

二、模型宣講

首先算法同學在宣講之前給產品經理交付模型報告

模型報告包括:模型設計、算法選型、特征來源、測試結果。

產品經理在看過模型報告之后請算法同學進行模型宣講,宣講內容為:

1.為什么選擇這個算法?

2.選擇了哪些特征?

3.訓練樣本是哪些?

4.測試的方案和結果是什么?

宣講目的是搞清楚算法的邏輯且對于算法同學容易忽略的三個問題進行評估:

1.特征的來源:來源是否合理,避免出現后續特征無法獲取的情況

2.訓練樣本的合理性:避免選擇的樣本數據和業務數據不符合,比如:樣本太久

3.測試結果是否符合預期:測試結果太好或者太差,無法滿足業務預期

這里是我們給模型上線的第一道保障。在這個環節中,我們需要知道算法的基本邏輯,特征來源的穩定性,訓練樣本的合理性以及測試結果是否符合預期,我們對于模型進行粗略的評估。

三、模型評估

很多同學對于模型宣講和模型評估之間的差異有疑惑,這里說明一下:

模型宣講我們只是進行粗略評估,但是此時的模型評估環節我們要站在業務的角度上對模型進行詳細的評估。

模型評估產物:輸出模型驗收報告。

這里是劉老師給出的一個例子,不同業務標準的評估指標不相同,可以進行相應的調整。

1.重要特征

2.選擇測試樣本

3.模型性能和穩定性測試結果

1. 重要特征

我們需要列出重要特征,對于每一個重要特征的來源和意義進行評估。

① 特征來源

如果這個特征來自于外部數據,那么我們就要關注這個特征的可持續性和穩定性。

②特征意義

這個特征是否符合業務或者是否符合常理。eg:我們要用到夜間購物特征,如果這個特征設置在23點-2點不合理。一般設置在0點-5點。

2.選擇測試樣本

我們需要根據業務的場景和特性選擇指標,比如我們觀察一個線上商城的購買量,我選擇的測試樣本應該是2019.1-2019.12月的樣本,因為購買能力會根據季節和周期進行浮動,我們應該盡量全面的選擇樣本。選擇好測試樣本之后我們交給算法同學進行測試,看是否達到業務預期效果。

注意樣本的選擇直接決定了測試結果,所以一定要謹慎選擇,符合業務場景。

3.模型性能和穩定性

模型性能和穩定性是最最重要的,直接決定了模型是否能夠上線。

模型性能分為四步進行評估:

  • 評估重要特征的測試結果是否符合預期:包括特征IV,KS等等
  • 評估重要特征的穩定性:一般是PSI值(PSI<0.2)
  • 評估模型性能測試結果是否符合預期:包括模型KS、AUC、MSE等等
  • 評估模型的穩定性,一般也是PSI值(PSI<0.2)

如果一個算法是回歸模型,就不需要AUC和KS這些指標啦,隨機應變。

至此,模型驗收結束,就可以進行后期的模型部署,工程開發,集成測試,集成驗收,產品上線的環節了。

產品上線流程圖如下所示:

參考文獻:劉海豐——《成為AI產品經理》?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/165406.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/165406.shtml
英文地址,請注明出處:http://en.pswp.cn/news/165406.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

解決:ImportError: cannot import name ‘Adam‘ from ‘keras.optimizers‘

解決&#xff1a;ImportError: cannot import name ‘Adam‘ from ‘keras.optimizers‘ 背景 在使用之前的代碼時&#xff0c;報錯&#xff1a; from keras.optimizers import Adam ImportError: cannot import name ‘Adam’ 報錯問題 from keras.optimizers import Adam I…

2023年亞太數學建模大賽--A題(水果采摘機器人的圖像識別功能)

中國是世界上最大的蘋果生產國&#xff0c;年產量約為 3500 萬噸。同時&#xff0c;中國也是世界上最大的蘋果出口國&#xff0c;世界上每兩個蘋果中就有一個出口到國。世界上每兩個蘋果中就有一個來自中國&#xff0c;中國出口的蘋果占全球出口量的六分之一以上。來自中國。中…

Vue CLI的介紹【vue利器之一】

文章目錄 前言Vue CLI 介紹CLICLI 服務CLI 插件后言 前言 hello world歡迎來到前端的新世界 &#x1f61c;當前文章系列專欄&#xff1a;vue.js &#x1f431;?&#x1f453;博主在前端領域還有很多知識和技術需要掌握&#xff0c;正在不斷努力填補技術短板。(如果出現錯誤&am…

【Java 進階篇】Redis持久化之RDB:數據的安全守護者

Redis&#xff0c;作為一款高性能的鍵值存儲系統&#xff0c;支持多種持久化方式&#xff0c;其中RDB&#xff08;Redis DataBase&#xff09;是其最常用的一種。RDB可以將當前時刻的數據快照保存到磁盤&#xff0c;以便在Redis重啟時快速恢復數據。本文將深入探討RDB的原理、配…

飛書智能伙伴之 AI 數智參謀:先進團隊,北極星指標也要遙遙領先

11 月 22 日&#xff0c;飛書在 2023 秋季飛書未來無限大會上正式發布了飛書智能伙伴。作為首批生態伙伴&#xff0c;基于 Kyligence 智能一站式指標平臺實現的 AI 數智參謀也正式亮相。這是繼 11 月 21 日 Kyligence 產品發布會后&#xff0c;Kyligence 在數據驅動決策智能領域…

第十五屆藍橋杯(Web 應用開發)模擬賽 1 期-大學組(詳細分析解答)

目錄 1.動態的Tab欄 1.1 題目要求 1.2 題目分析 1.3 源代碼 2.地球環游 2.1 題目要求 2.2 題目分析 2.3 源代碼 3.迷惑的this 3.1 題目要求 3.2 題目分析 3.3 源代碼 4.魔法失靈了 4.1 題目要求 4.2 題目分析 4.3 源代碼 5.燃燒你的卡路里 5.1 題目要求 5.2…

第十七章:數據庫操作

數據庫基礎 SQL語言 1、select 語句 select 語句用于從數據中檢索數據。語法如下&#xff1a; SELECT 搜選字段列表 FROM 數據表名 WHERE 條件表達式 GROUP BY 字段名 HAVING 條件表達式(指定分組的條件) ORDER BY 字段名[ASC|DESC] 2、insert 語句 insert 語句用于向表中插入…

重新使用hbase前

啟動關閉Hadoop和HBase的順序一定是&#xff1a; 啟動Hadoop—>啟動HBase—>關閉HBase—>關閉Hadoop 1.掛載共享文件夾到掛載點 sudo mount -t vboxsf virtualmachineShare /mnt/shared2.進入hadoop目錄下啟動hadoop cd /usr/local/hadoop/ ./sbin/start-all.sh …

【UE5】五大基類及其使用

UObject UObject表示對象&#xff0c;準確來說&#xff0c;虛幻引擎中的對象基礎類為UObject UObject提供了以下功能&#xff1a; 垃圾收集&#xff08;Garbage collection&#xff09;引用自動更新&#xff08;Reference updating&#xff09;反射&#xff08;Reflection&am…

火電廠電氣部分設計

摘要 本文首先根據任務書上所給系統與線路及所有負荷的參數&#xff0c;分析負荷發展趨勢。從負荷增長方面闡明了建站的必要性&#xff0c;然后通過對擬建變電站的概括以及出線方向來考慮&#xff0c;并通過對負荷資料的分析&#xff0c;安全&#xff0c;經濟及可靠性方面考慮…

計算機基礎知識57

前后端數據傳輸的編碼格式(contentType) # 我們只研究post請求方式的編碼格式&#xff1a; get請求方式沒有編碼格式-- index?useranme&password get請求方式沒有請求體&#xff0c;參數直接在url地址的后面拼接著 # 有哪些方式可以提交post請求&#xff1a;f…

構建個性化預約服務:預約上門服務系統源碼解讀與實戰

隨著社會的發展&#xff0c;預約上門服務系統在滿足用戶需求、提升服務效率方面發揮著越來越重要的作用。在本文中&#xff0c;我們將深入研究預約上門服務系統的源碼&#xff0c;通過實際的技術代碼示例&#xff0c;揭示系統內部的關鍵機制&#xff0c;以及如何在實際項目中應…

qml動畫過渡Transition

文章目錄 基本概念使用 `Transition`示例動畫過渡高級用法示例:復雜動畫過渡解釋進階用法在 QML 中,Transition 元素用于定義狀態之間過渡時的動畫。這是 QML 強大的狀態機制的一部分,允許開發者創建平滑且吸引人的用戶界面交互。使用 Transition,您可以定義當元素從一個狀…

深入了解接口測試:方法、工具和關鍵考慮因素(一)

接口測試是軟件測試中的一項重要工作&#xff0c;它涉及到系統與系統之間的交互點。接口可以是外部接口&#xff0c;也可以是內部接口&#xff0c;包括上層服務與下層服務接口以及同級接口。在接口測試中&#xff0c;我們需要確保接口能夠按照預期的方式進行通信和交互&#xf…

【攻防世界-misc】can_has_stdio?

1.用記事本打開文件是這樣子的&#xff0c; 這是一段BF&#xff08;Brainfuck&#xff09;編程語言代碼&#xff0c;屬于一種極簡化的編程語言&#xff0c;用于演示計算機程序設計概念。這段代碼包含了一些操作符&#xff0c;如">"表示指針向右移動&#xff0c;&q…

【C++破局】泛型編程|函數模板|類模板

?作者主頁 &#x1f4da;lovewold少個r博客主頁 ??本文重點&#xff1a;c模板初階知識點講解 &#x1f449;【C-C入門系列專欄】&#xff1a;博客文章專欄傳送門 &#x1f604;每日一言&#xff1a;花有重開日&#xff0c;人無再少年 目錄 前言 泛型編程 函數模板 函數模…

用Java實現簡易的圖書管理系統(超詳細)

目錄 1.設計背景 2.設計思路 3.模塊展示及代碼演示 3.1 Book類的實現 3.2 BookList類的實現(書架) 3.3 異常類的實現(OperationException) 3.4 用戶類的實現 3.5 操作接口的實現(定義規范) 3.6 操作類的具體實現 3.6.1 增加操作 3.6.2 查找操作 3.6.3 刪除操作 3.6…

標簽打印機打印標簽時出現,數據處理過程中錯誤 無法設置項目 圖片1的內容無法打印

環境&#xff1a; Win10專業版 NiceLabel Designer 10.1 問題描述&#xff1a; 標簽打印機打印標簽時出現&#xff0c;數據處理過程中錯誤 無法設置項目 圖片1的內容無法打印 解決方案&#xff1a; 1.刪除標簽部分文字打印測試 還是一樣&#xff08;未解決&#xff09; …

已解決java.lang.IllegalStateException異常的正確解決方法,親測有效!!!

已解決java.lang.IllegalStateException異常的正確解決方法&#xff0c;親測有效&#xff01;&#xff01;&#xff01;文章目錄 報錯問題解決思路解決方法交流 報錯問題 java.lang.IllegalStateException 解決思路 java.lang.IllegalStateException通常表示程序的當前狀態與…

jenkins 參數構建

應用保存 [rootjenkins-node1 .ssh]# ssh-keygen Generating public/private rsa key pair. Enter file in which to save the key (/root/.ssh/id_rsa): Enter passphrase (empty for no passphrase): Enter same passphrase again: Your identification has been saved i…