論文略讀：Towards Safer Large Language Models through Machine Unlearning

論文略讀：Towards Safer Large Language Models through Machine Unlearning

web/2025/7/23 14:04:36/文章來源:https://blog.csdn.net/qq_40206371/article/details/149535302

ACL 2024

大型語言模型（LLMs）的迅猛發展展現了其在多個領域的巨大潛力，這主要得益于其廣泛的預訓練知識和出色的泛化能力。
- 然而，當面對問題性提示（problematic prompts）時，LLMs 仍然容易生成有害內容，這是一個亟需解決的重要問題。
- 為了解決這一問題，已有研究嘗試采用基于梯度上升（gradient ascent）的方法，引導模型避免生成有害輸出。
  - 盡管這類方法在一定程度上有效，但它們往往會影響模型在正常提示下的實用性（utility）。
——>為填補這一空白，本文提出了一種全新的 LLM 去學習框架
- SKU（Selective Knowledge negation Unlearning）——選擇性知識否定去學習方法，
  旨在移除有害知識，同時最大程度保留模型在正常提示下的功能表現。

SKU 框架由兩個階段組成：

有害知識獲取階段（Harmful Knowledge Acquisition Stage）：
- 識別并提取出模型中與有害行為相關的知識或激活路徑。
知識否定階段（Knowledge Negation Stage）：
- 有選擇地修改或移除上述識別出的有害知識，在不破壞模型整體能力的前提下完成“去學習”。（參數相減）

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/90051.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/90051.shtml
英文地址，請注明出處：http://en.pswp.cn/web/90051.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

深度學習 ---參數初始化以及損失函數

深度學習 ---參數初始化以及損失函數

深度學習 —參數初始化以及損失函數文章目錄深度學習 ---參數初始化以及損失函數一，參數初始化1.1 固定值初始化1.1.1 全0初始化1.1.2 全1初始化1.3 任意常數初始化1.2 隨機初始化一，參數初始化神經網絡的參數初始化是訓練深度學習模型的關鍵步驟之一…

閱讀更多...

JS--M端事件

JS--M端事件

移動端（Mobile 端，簡稱 M 端）開發中，由于設備特性（觸摸屏、手勢操作等），需要處理一些與桌面端不同的事件。這些事件主要針對觸摸交互、手勢識別等場景一、觸摸事件（Touch Events&am…

閱讀更多...

Linux網絡編程-tcp

Linux網絡編程-tcp

tcp、udp對比：UDP1. 特點無連接：無需建立連接即可發送數據。不可靠：不保證數據順序或完整性。低延遲：適合實時性要求高的場景。2. 應用場景視頻/音頻流傳輸（如直播）。DNS 查詢、在線游戲。TCP1. 特點面向連…

閱讀更多...

記一次flink資源使用優化

記一次flink資源使用優化

一.現狀分析現有任務的資源配置如下，根據ui監控中Garbage Collection可以發現，此任務頻繁的發生GC，且老年代GC時間較久二.整體memory使用分析如下Framework Heap（框架堆內存）用于Flink框架自身的堆內存（如…

閱讀更多...

Vue底層換成啥了？如何更新DOM的？

Vue底層換成啥了？如何更新DOM的？

摘要：之前的vue是使用虛擬 DOM的，但是Vue 3.6 帶來了一個意義重大的更新： Vapor Mode 渲染模式。Vue 渲染策略的演進： Vue 1.x： 基于模板渲染策略，直接將模板轉換為DOM元素，并為每個DOM元素創建…

閱讀更多...

0722 數據結構順序表

0722 數據結構順序表

Part 1.順序表的代碼一.順序表的內存申請head.h: typedef int datatype;typedef struct sqlist {//數據元素datatype data[MAXSIZE];//順序表長度int len;}*sqlist; //*sqlist的作用: //sqlist:struct Sqlist * sqlist create();head.c: sqlist create() {sqlist list (sqlist)…

閱讀更多...

為何在 Vue 的 v-model 指令中不能使用可選鏈（Optional Chaining）？

為何在 Vue 的 v-model 指令中不能使用可選鏈（Optional Chaining）？

Vue 的 v-model 是實現組件與數據雙向綁定的核心指令之一，它本質上是一個語法糖，用于簡化對表單元素和組件 props 的同步更新。然而，在 Vue 3（以及 Vue 2 的某些模式下），開發者嘗試在 v-model 中使用 JavaS…

閱讀更多...

基于單片機智能藥盒/智能藥箱/定時吃藥系統

基于單片機智能藥盒/智能藥箱/定時吃藥系統

傳送門 👉👉👉👉其他作品題目速選一覽表 👉👉👉👉其他作品題目功能速覽概述本設計實現了一種基于單片機的智能藥盒，系統以微控制器（如STM32&#xff…

閱讀更多...

（25）python+playwright自動化處理單選和多選按鈕-中

（25）python+playwright自動化處理單選和多選按鈕-中

1.簡介上一篇中講解和介紹的單選框有點多，而且由于時間的關系，決定今天講解和分享復選框的相關知識。2.什么是單選框、復選框？單選按鈕一般叫raido button，就像我們在電子版的單選答題過程一樣，單選只能點擊一次&#…

閱讀更多...

Nginx IP授權頁面實現步驟

Nginx IP授權頁面實現步驟

目標：一、創建白名單文件sudo mkdir -p /usr/local/nginx/conf/whitelist sudo touch /usr/local/nginx/conf/whitelist/temporary.conf二、創建Python認證服務文件路徑：/opt/script/auth_server.pyimport os import time from flask import Flask, requ…

閱讀更多...

2025年7月中科院一區-向光生長優化算法Phototropic growth algorithm-附Matlab免費代碼

2025年7月中科院一區-向光生長優化算法Phototropic growth algorithm-附Matlab免費代碼

引言本期介紹一種新的元啟發式算法——向光生長優化算法Phototropic growth algorithm，PGA。靈感來自植物細胞在陽光下的生長模式。于2025年7月最新發表在JCR 1區，中科院1區 SCI 期刊 Knowledge-Based Systems。該算法將生物學啟發的確定性生長行為與…

閱讀更多...

poi-excel-添加水印

poi-excel-添加水印

1、官網快速指南 https://poi.apache.org/components/spreadsheet/quick-guide.html 訪問如上地址可以查看到poi的相關操作方式： How to create a new workbookHow to create a sheetHow to create cellsHow to create date cellsWorking with different types of…

閱讀更多...

STM32 開發的鼠標：技術詳解與實現指南

STM32 開發的鼠標：技術詳解與實現指南

概述基于STM32微控制器開發的鼠標是一種高度可定化的輸入設備解決方案，廣泛應用于工業控制、嵌入式系統、特殊人機交互等領域。相比傳統鼠標，STM32鼠標具有以下優勢：高度可定制性：可添加特殊功能按鍵、傳感器集成低功耗設計&#…

閱讀更多...

GoLang教程007：打印空心金字塔

GoLang教程007：打印空心金字塔

4.6 案例一：打印金字塔編寫一個程序，可以接收一個整數，表示層數，打印出金字塔。1??第一步：打印一個矩形 package mainimport "fmt"func main() {// i表示層數for i : 1; i < 3; i {// j表示每層打印多少…

閱讀更多...

iOS開發 Swift 速記3：運算符與控制結構

iOS開發 Swift 速記3：運算符與控制結構

初級代碼游戲的專欄介紹與文章目錄-CSDN博客我的github：codetoys，所有代碼都將會位于ctfc庫中。已經放入庫中我會指出在庫中的位置。這些代碼大部分以Linux為目標但部分代碼是純C的，可以在任何平臺上使用。源碼指引：github源…

閱讀更多...

ElasticSearch中需要注意的點，附官方文檔解讀

ElasticSearch中需要注意的點，附官方文檔解讀

1.批量更新數量大小限制 https://www.elastic.co/guide/cn/elasticsearch/guide/current/bulk.html#_How_Big_Is_Too_Big 整個批量請求都需要由接收到請求的節點加載到內存中，因此該請求越大，其他請求所能獲得的內存就越少。批量請求的大小有一個最佳值…

閱讀更多...

Git GitHub精通：前端協作開發的“瑞士軍刀“！

Git GitHub精通：前端協作開發的“瑞士軍刀“！

前言：為什么你的代碼總是"失蹤"？ "啊！我的代碼呢？"——這可能是每個程序員都曾發出過的靈魂吶喊。還記得上周我熬夜寫的300行JavaScript，第二天醒來發現被自己手賤覆蓋了，那一刻我深刻…

閱讀更多...

第 30 場藍橋·算法入門賽題解

第 30 場藍橋·算法入門賽題解

1. 零食爭議【算法賽】簽到題：1-7奇數相加 #include <bits/stdc.h> using namespace std; int main() {// 請在此輸入您的代碼cout<<1357;return 0; } 2. 數字炸彈【算法賽】把n個人看為前n-1和后n-1 ， 方便找到是第幾段的第幾個數 #in…

閱讀更多...

閑庭信步使用圖像驗證平臺加速FPGA的開發：第二十四課——圖像直方圖均衡化的FPGA實現

閑庭信步使用圖像驗證平臺加速FPGA的開發：第二十四課——圖像直方圖均衡化的FPGA實現

（本系列只需要modelsim即可完成數字圖像的處理，每個工程都搭建了全自動化的仿真環境，只需要雙擊top_tb.bat文件就可以完成整個的仿真，大大降低了初學者的門檻！！！！如需要該系列的工程…

閱讀更多...

LabVIEW 2025安裝包| 免費免激活版下載| 附圖文詳細安裝教程

LabVIEW 2025安裝包| 免費免激活版下載| 附圖文詳細安裝教程

[軟件名稱]：LabVIEW 2025 [軟件大小]：13 G [系統要求]：支持Win7及更高版本 [下載通道]:夸克網盤 [下載鏈接]: https://pan.quark.cn/s/7e9527cc06a3 （建議用手機保存到網盤后，再用電腦下載） 更多免費軟件&a…

閱讀更多...

最新文章