模型預估打分對運籌跟蹤的影響

在uplift建模中，模型離線指標(QINI、AUUC)提升并不意味著在線A/B實驗的收益，因為在線運籌還需要 $λ\lambda$ 約束。如果模型打分不滿足單調增且roi邊際遞減，那么 $λ\lambda$ 運籌求解會非常不穩定，導致線上發券偏高，毛利無法兜住。

下面用 兩個數值化示例 直觀對比：

示例 1： $p_i$ 單調增但不滿足邊際遞減 ? $λ\lambda$ 搜索不穩定

樣本數：5
成本：全部 $c_i=1$
預算： $B = 3$
打分 $p_i$ （嚴格單調增，但 $Δpi\Delta p_i$ = $p_i - p_{i-1}$ 不遞減／有重復）：

i	1	2	3	4	5
$p_i$	0.10	0.20	0.40	0.40	0.50
$Δpi\Delta p_i$	—	0.10	0.20	0.00	0.10

閾值集 ${p_i/c_i\}=\{0.10,0.20,0.40,0.40,0.50\}$ 。

當 $λ\lambda$ 越過 0.40 時，會同時將樣本 3、4 都剔除，令選中數 $C(λ)C(\lambda)$ 從 3 直接跳到 1，形成大階梯。

$C(\lambda)=\#\{i: p_i>\lambda\} \quad=\begin{cases} 5,&\lambda<0.10;\\ 3,&0.10\le\lambda<0.20;\\ 3,&0.20\le\lambda<0.40;\\ 1,&0.40\le\lambda<0.50;\\ 0,&\lambda\ge0.50. \end{cases}$

二分搜索行為：

在 $[0.20, 0.40)$ 內，任意 mid 都命中 $C = 3$ ，算法只能不斷逼近 0.40，永遠無法見到 $C < 3$ 的分支判定，也就卡在邊界來回，無法穩定收斂到唯一解。

示例 2： $p_i$ 單調增且滿足邊際遞減 ? $λ\lambda$ 搜索穩定

樣本數：5
成本：全部 $c_i=1$
預算： $B = 3$
打分 $p_i$ （嚴格單調增且 $Δpi\Delta p_i$ 遞減）：

$i$	1	2	3	4	5
$p_i$	0.10	0.18	0.24	0.28	0.30
$Δpi\Delta p_i$	—	0.08	0.06	0.04	0.02

閾值集 ${0.10,0.18,0.24,0.28,0.30\}$ ，且每次跨過一個閾值，只會剔除一個樣本。

$C(\lambda)=\#\{i: p_i>\lambda\} \quad=\begin{cases} 5,&\lambda<0.10;\\ 4,&0.10\le\lambda<0.18;\\ 3,&0.18\le\lambda<0.24;\\ 2,&0.24\le\lambda<0.28;\\ 1,&0.28\le\lambda<0.30;\\ 0,&\lambda\ge0.30. \end{cases}$

二分搜索行為：

目標： $C(λ)=3C(\lambda)=3$ 。

初始區間 $[0.10, 0.30]$ ，mid=0.20 → $C (0.20) = 3$ → 收縮右端 → $[0.10, 0.20]$ 。
mid=0.15 → $C = 4 > 3$ → 收縮右端 → $[0.10, 0.15]$ 。
… 依次剔除第2號、第3號樣本，每次跨過一個閾值， $C$ 變化為 4→3→2…，二分能穩定地一步步逼近恰好使 $C = 3$ 的 $λ\lambda$ 。

核心對比

條件	階梯跳變	二分穩定性
示例1：邊際不遞減或重復值	大階梯（一次掉多個）	卡在大跳點來回
示例2：邊際嚴格遞減	小階梯（一次掉一個）	逐次逼近，穩定收斂

只有當每次 $λ\lambda$ 觸碰一個閾值，就只影響一個樣本時，累積成本 $C(λ)C(\lambda)$ 曲線才近似“單調平滑”，二分才能一步步穩定逼近目標預算。
如果一次跨越多個閾值（示例1），或閾值間距極小/重復（前例），則會出現“跳變過大”或“可行區間過窄”，導致二分收斂失靈或來回擺動。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/94191.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/94191.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/94191.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！