【深度學習】多源物料融合算法(一):量綱對齊常見方法

目錄

一、引言

二、量綱對齊常見方法

2.1 Z-score標準化+Sigmoid歸一化

2.2?Min-Max 歸一化

2.3 Rank Transformation

2.4??Log Transformation

2.5 Robust Scaling?

3、總結


一、引言

類似抖音、快手、小紅書等產品的信息流推薦業務,主要通過信息流廣告、信息流直播電商等獲得經濟收益,對于流量最大的核心推薦系統,或多或少都要承擔商業指標,承接特定物料的曝光需求。但是廣告、直播電商或其他業務物料,會根據自己的需求進行排序,由于不是一套模型,業務場景數據也不一樣,插入物料的量綱與主推薦量綱必定不相同,隨之但是的就是無法比較問題,如何將不同的量綱對齊且可比呢,今天介紹常見的幾種方法。

二、量綱對齊常見方法

2.1 Z-score標準化+Sigmoid歸一化

Z-score標準化將數據轉換為均值為0、標準差為1的分布。公式如下:

z=\frac{x-\mu }{\sigma }

其中:

  • x是原始數據點
  • ?\mu是序列的均值
  • \sigma是序列的標準差

Sigmoid將均值為0、標準差為1的分布轉化為值域為0-1的分布。公式為?

f(x)=\frac{1}{1+e^{-x}}

Z-score+Sigmoid序列合并計算步驟

  1. ?對每個序列分別計算均值和標準差。
  2. 對每個數據點應用Z-score公式進行標準化。
  3. 對標準化后的序列采用Simgoid歸一化到0-1后,進行比較。?

2.2?Min-Max 歸一化

Min-Max 歸一化將數據線性地轉換到一個固定的區間(通常是 [0, 1])。公式如下:

x'=\frac{x-min}{max-min}

其中:

  • x?是原始數據點
  • min是序列的最小值
  • max是序列的最大值

序列合并計算步驟:

  1. ?對每個序列分別計算最小值和最大值。
  2. 對每個數據點應用上述公式進行歸一化。
  3. 合并歸一化后的序列。??

2.3 Rank Transformation

Rank Transformation 將數據轉換為它們的秩次。公式如下:

x'=rank(x)

序列合并計算步驟:

  1. ?對每個序列分別計算每個數據點的秩次。
  2. 合并秩次后的序列。?

2.4??Log Transformation

如果數據分布偏斜,可以使用對數變換來壓縮數據范圍。公式如下:

x'=log(x+1)

?序列合并計算步驟:

  1. ?對每個序列分別應用對數變換。
  2. 合并變換后的序列。?

2.5 Robust Scaling?

?Robust Scaling 使用中位數和四分位距(IQR)進行標準化,適用于存在異常值的數據。公式如下:

x'=\frac{x-mediam}{IQR}?

  • mediam是序列的中位數
  • IQR是序列的四分位距(即第75百分位數減去第25百分位數)?

?序列合并計算步驟:

  1. ???對每個序列分別計算中位數和IQR。
  2. ?對每個數據點應用上述公式進行標準化。
  3. ?合并標準化后的序列。????????

3、總結

本文初步介紹了多種將不同量綱的多源物料轉換為同一量綱的方法,主要目標就是讓不同業務場景的推薦排序結果可以比較,通過公式化的序列轉換,快速達到可比的預期,計算效率更高。在實踐中,Z-score+Sigmoid方法更為實用。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/73471.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/73471.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/73471.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

deepseek為什么要開源

一、生態位的搶占與鎖定:以 JDK 版本為例? 在軟件開發的世界里,生態位的搶占和先入為主的效應十分顯著。就拿 Java 開發中的 JDK 版本來說,目前大多數開發者仍在廣泛使用 JDK8。盡管 JDK17 和 JDK21 已經推出,且具備更多先進特性…

【AI】內容生成式AI(AIGC)的深度分析與擴展

引言 隨著人工智能(AI)技術的迅速發展,AI生成內容(AIGC)已經在多個領域表現出巨大潛力,改變了內容創作的方式。這篇文章將詳細介紹AI生成內容的技術原理、應用領域、優缺點、未來趨勢以及相關倫理問題&…

用C++新建快捷方式

1.創建文件 新建一個文件Ink.cpp,系統會自動生成對應的EXE文件 2.編寫代碼 #include<stdlib.h> int main(){ system("powershell -command \"$WshShellNew-Object -comObject WScript.Shell; $Shortcut$WshShell.CreateShortcut(\%UserProfile%\\Desktop\\1.…

前端Html5 Canvas面試題及參考答案

目錄 Canvas 元素的默認尺寸是多少?如何正確設置其寬高以避免圖像拉伸? 如何獲取 Canvas 的 2D 上下文對象?3D 上下文支持哪些技術? canvas.width 與 canvas.style.width 的區別是什么? Canvas 支持的圖像格式有哪些?如何將 Canvas 轉換為 Base64 圖片? Canvas 中如…

基于Python的天氣預報數據可視化分析系統-Flask+html

開發語言&#xff1a;Python框架&#xff1a;flaskPython版本&#xff1a;python3.8數據庫&#xff1a;mysql 5.7數據庫工具&#xff1a;Navicat11開發軟件&#xff1a;PyCharm 系統展示 系統登錄 可視化界面 天氣地圖 天氣分析 歷史天氣 用戶管理 摘要 本文介紹了基于大數據…

基于Uniapp開發tab選項卡/標簽欄前端組件

在開發一些業務場景時候&#xff0c;可能需要切換標簽欄來展示不同的信息列表。 為此開發了一個Uniapp組件&#xff08;myTab&#xff09;&#xff0c;下面為組件的展示效果&#xff1a; 案例代碼&#xff1a; <template><view class"content"><myt…

練習題:87

目錄 Python題目 題目 題目分析 代碼實現 代碼解釋 列表推導式部分&#xff1a; 變量賦值和輸出&#xff1a; 運行思路 結束語 Python題目 題目 使用列表推導式生成一個包含 1 到 100 中所有偶數的列表。 題目分析 本題要求使用 Python 的列表推導式生成一個包含 …

【DevOps】 基于數據驅動的Azure DevOps案例實現

推薦超級課程: 本地離線DeepSeek AI方案部署實戰教程【完全版】Docker快速入門到精通Kubernetes入門到大師通關課AWS云服務快速入門實戰目錄 **客戶場景:****解決方案:****架構:****架構細節:****結論**客戶場景: 為大量客戶提供基于Azure云的成果物重復部署服務。這可能…

文本組件+Image組件+圖集

Canvas部分知識補充 元素渲染順序 以Hierarchy參考 下方物體在上方物體前顯示 子物體在父物體前顯示 下方物體永遠在前顯示&#xff0c;無論上方的層次結構 資源導入 絕對路徑&#xff1a;C:\Windows\Fonts下的許多字體可以用做UIText的字體資源 圖片導入&#xff1a; 1.圖…

【量化策略】均值回歸策略

【量化策略】均值回歸策略 &#x1f680;量化軟件開通 &#x1f680;量化實戰教程 技術背景與應用場景 在金融市場中&#xff0c;價格波動往往呈現出一定的規律性。均值回歸策略正是基于這一觀察&#xff0c;認為資產價格會圍繞其歷史平均水平上下波動。當價格偏離均值較遠…

C++初階——類和對象(二)

C初階——類和對象&#xff08;二&#xff09; 本期內容書接上回&#xff0c;繼續討論類和對象相關內容。類和對象屬于C初階部分&#xff0c;主要反映了面向對象編程的三大基本特點之一——封裝&#xff0c;在C的學習中占有舉足輕重的地位&#xff01; 一、類對象模型 1.如何…

3-002: MySQL 中使用索引一定有效嗎?如何排查索引效果?

1. 索引失效的常見原因 雖然索引可以加速查詢&#xff0c;但在某些情況下&#xff0c;MySQL 可能不會使用索引&#xff0c;甚至使用索引反而更慢。 以下是一些常見導致索引失效的原因&#xff1a; ① 查詢條件使用了 ! 或 <> 原因&#xff1a;索引通常用于范圍或等值查…

LVGL移植到6818開發板

一、移植步驟 1.lv_config.h 配置文件啟動 framebuffer 2、lv_config.h 配置文件關閉SDL 2.修改main.c 去掉SDL輸入設備 3.修改Makefile 文件啟動交叉編譯 去掉警告參數 去掉SDL庫 4.交叉編譯代碼 make clean #清空 ? 必須要清空一次再編譯&#xff01; 因為修改了 lv_con…

linux系統命令——權限

一、有哪些權限 讀&#xff08;r&#xff09;——對應數字4 寫&#xff08;w&#xff09;——對應數字2 執行&#xff08;x&#xff09;——對應數字1 二、權限及數字的對應 4對應r-- 2對應-w- 1對應--x 5對應r-x 6對應rw- 7對應rwx 三、文件的基本屬性 如圖&#…

Android Dagger2 框架輔助工具模塊深度剖析(六)

一、引言 在 Android 開發領域&#xff0c;依賴注入&#xff08;Dependency Injection&#xff0c;簡稱 DI&#xff09;作為一種至關重要的設計模式&#xff0c;能顯著降低代碼間的耦合度&#xff0c;提升代碼的可測試性與可維護性。Dagger2 作為一款強大的依賴注入框架&#…

Django項目之訂單管理part3

一.前言 前面兩章已經把登錄給做完了&#xff0c;這一章節要說的是登錄的校驗和登錄以后的菜單展示&#xff0c;內容還是很多的。 二.菜單和權限 2.1 是否登錄 當我們進入其他的頁面&#xff0c;我們首先要判斷是否登錄&#xff0c;這個時候我們就要借助中間件來做session和…

多線程到底重不重要?

我們先說一下為什么要講多線程和高并發&#xff1f; 原因是&#xff0c;你想拿到一個更高的薪水&#xff0c;在面試的時候呈現出了兩個方向的現象&#xff1a; 第一個是上天 項目經驗高并發 緩存 大流量 大數據量的架構設計 第二個是入地 各種基礎算法&#xff0c;各種基礎…

AI大模型測試用例生成平臺

AI測試用例生成平臺 項目背景技術棧業務描述項目展示項目重難點 項目背景 針對傳統接口測試用例設計高度依賴人工經驗、重復工作量大、覆蓋場景有限等行業痛點&#xff0c;基于大語言模型技術實現接口測試用例智能生成系統。 技術棧 LangChain框架GLM-4模型Prompt Engineeri…

【論文筆記】Contrastive Learning for Compact Single Image Dehazing(AECR-Net)

文章目錄 問題創新網絡主要貢獻Autoencoder-like Dehazing NetworkAdaptive Mixup for Feature PreservingDynamic Feature Enhancement1. 可變形卷積的使用2. 擴展感受野3. 減少網格偽影4. 融合空間結構信息 Contrastive Regularization1. 核心思想2. 正樣本對和負樣本對的構建…

異步加載錯誤如何解決

首先是 提供兩張圖 如果數據過多的情況下我在所內和住家形式頻繁的來回切換 導致數據展示的不一樣 大家是不是有這樣的問題 這個是導致了數據展示有問題的情況 住家的情況本來是沒有幾層的 下面我幫大家解決一下 // 防止異步延遲 const Noop () > { } const lhl (resDa…