論文略讀:Towards Safer Large Language Models through Machine Unlearning

ACL 2024

  • 大型語言模型(LLMs)的迅猛發展展現了其在多個領域的巨大潛力,這主要得益于其廣泛的預訓練知識和出色的泛化能力。
    • 然而,當面對問題性提示(problematic prompts)時,LLMs 仍然容易生成有害內容,這是一個亟需解決的重要問題。
    • 為了解決這一問題,已有研究嘗試采用基于梯度上升(gradient ascent)的方法,引導模型避免生成有害輸出。
      • 盡管這類方法在一定程度上有效,但它們往往會影響模型在正常提示下的實用性(utility)
  • ——>為填補這一空白,本文提出了一種全新的 LLM 去學習框架
    • SKU(Selective Knowledge negation Unlearning)——選擇性知識否定去學習方法
      旨在移除有害知識,同時最大程度保留模型在正常提示下的功能表現

SKU 框架由兩個階段組成:

  1. 有害知識獲取階段(Harmful Knowledge Acquisition Stage)

    • 識別并提取出模型中與有害行為相關的知識或激活路徑。

  2. 知識否定階段(Knowledge Negation Stage)

    • 有選擇地修改或移除上述識別出的有害知識,在不破壞模型整體能力的前提下完成“去學習”。(參數相減)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/90051.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/90051.shtml
英文地址,請注明出處:http://en.pswp.cn/web/90051.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

深度學習 ---參數初始化以及損失函數

深度學習 —參數初始化以及損失函數 文章目錄深度學習 ---參數初始化以及損失函數一,參數初始化1.1 固定值初始化1.1.1 全0初始化1.1.2 全1初始化1.3 任意常數初始化1.2 隨機初始化一,參數初始化 神經網絡的參數初始化是訓練深度學習模型的關鍵步驟之一…

JS--M端事件

移動端(Mobile 端,簡稱 M 端)開發中,由于設備特性(觸摸屏、手勢操作等),需要處理一些與桌面端不同的事件。這些事件主要針對觸摸交互、手勢識別等場景 一、觸摸事件(Touch Events&am…

Linux網絡編程-tcp

tcp、udp對比:UDP1. 特點無連接:無需建立連接即可發送數據。不可靠:不保證數據順序或完整性。低延遲:適合實時性要求高的場景。2. 應用場景視頻/音頻流傳輸(如直播)。DNS 查詢、在線游戲。TCP1. 特點面向連…

記一次flink資源使用優化

一.現狀分析 現有任務的資源配置如下,根據ui監控中Garbage Collection可以發現,此任務頻繁的發生GC,且老年代GC時間較久二.整體memory使用分析如下Framework Heap(框架堆內存)用于Flink框架自身的堆內存(如…

Vue底層換成啥了?如何更新DOM的?

摘要:之前的vue是使用虛擬 DOM的,但是Vue 3.6 帶來了一個意義重大的更新: Vapor Mode 渲染模式。Vue 渲染策略的演進: Vue 1.x: 基于模板渲染策略,直接將模板轉換為DOM元素,并為每個DOM元素創建…

0722 數據結構順序表

Part 1.順序表的代碼一.順序表的內存申請head.h: typedef int datatype;typedef struct sqlist {//數據元素datatype data[MAXSIZE];//順序表長度int len;}*sqlist; //*sqlist的作用: //sqlist:struct Sqlist * sqlist create();head.c: sqlist create() {sqlist list (sqlist)…

為何在 Vue 的 v-model 指令中不能使用可選鏈(Optional Chaining)?

Vue 的 v-model 是實現組件與數據雙向綁定的核心指令之一,它本質上是一個語法糖,用于簡化對表單元素和組件 props 的同步更新。然而,在 Vue 3(以及 Vue 2 的某些模式下),開發者嘗試在 v-model 中使用 JavaS…

基于單片機智能藥盒/智能藥箱/定時吃藥系統

傳送門 👉👉👉👉其他作品題目速選一覽表 👉👉👉👉其他作品題目功能速覽 概述 本設計實現了一種基于單片機的智能藥盒,系統以微控制器(如STM32&#xff…

(25)python+playwright自動化處理單選和多選按鈕-中

1.簡介上一篇中講解和介紹的單選框有點多,而且由于時間的關系,決定今天講解和分享復選框的相關知識。2.什么是單選框、復選框?單選按鈕一般叫raido button,就像我們在電子版的單選答題過程一樣,單選只能點擊一次&#…

Nginx IP授權頁面實現步驟

目標:一、創建白名單文件sudo mkdir -p /usr/local/nginx/conf/whitelist sudo touch /usr/local/nginx/conf/whitelist/temporary.conf二、創建Python認證服務文件路徑:/opt/script/auth_server.pyimport os import time from flask import Flask, requ…

2025年7月中科院一區-向光生長優化算法Phototropic growth algorithm-附Matlab免費代碼

引言 本期介紹一種新的元啟發式算法——向光生長優化算法Phototropic growth algorithm,PGA。靈感來自植物細胞在陽光下的生長模式。于2025年7月最新發表在JCR 1區,中科院1區 SCI 期刊 Knowledge-Based Systems。 該算法將生物學啟發的確定性生長行為與…

poi-excel-添加水印

1、官網快速指南 https://poi.apache.org/components/spreadsheet/quick-guide.html 訪問如上地址可以查看到poi的相關操作方式: How to create a new workbookHow to create a sheetHow to create cellsHow to create date cellsWorking with different types of…

STM32 開發的鼠標:技術詳解與實現指南

概述基于STM32微控制器開發的鼠標是一種高度可定化的輸入設備解決方案,廣泛應用于工業控制、嵌入式系統、特殊人機交互等領域。相比傳統鼠標,STM32鼠標具有以下優勢:高度可定制性:可添加特殊功能按鍵、傳感器集成低功耗設計&#…

GoLang教程007:打印空心金字塔

4.6 案例一&#xff1a;打印金字塔編寫一個程序&#xff0c;可以接收一個整數&#xff0c;表示層數&#xff0c;打印出金字塔。1??第一步&#xff1a;打印一個矩形 package mainimport "fmt"func main() {// i表示層數for i : 1; i < 3; i {// j表示每層打印多少…

iOS開發 Swift 速記3:運算符與控制結構

初級代碼游戲的專欄介紹與文章目錄-CSDN博客 我的github&#xff1a;codetoys&#xff0c;所有代碼都將會位于ctfc庫中。已經放入庫中我會指出在庫中的位置。 這些代碼大部分以Linux為目標但部分代碼是純C的&#xff0c;可以在任何平臺上使用。 源碼指引&#xff1a;github源…

ElasticSearch中需要注意的點,附官方文檔解讀

1.批量更新數量大小限制 https://www.elastic.co/guide/cn/elasticsearch/guide/current/bulk.html#_How_Big_Is_Too_Big 整個批量請求都需要由接收到請求的節點加載到內存中&#xff0c;因此該請求越大&#xff0c;其他請求所能獲得的內存就越少。批量請求的大小有一個最佳值…

Git GitHub精通:前端協作開發的“瑞士軍刀“!

前言&#xff1a;為什么你的代碼總是"失蹤"&#xff1f; "啊&#xff01;我的代碼呢&#xff1f;"——這可能是每個程序員都曾發出過的靈魂吶喊。還記得上周我熬夜寫的300行JavaScript&#xff0c;第二天醒來發現被自己手賤覆蓋了&#xff0c;那一刻我深刻…

第 30 場 藍橋·算法入門賽 題解

1. 零食爭議【算法賽】 簽到題&#xff1a;1-7奇數相加 #include <bits/stdc.h> using namespace std; int main() {// 請在此輸入您的代碼cout<<1357;return 0; } 2. 數字炸彈【算法賽】 把n個人看為前n-1和后n-1 &#xff0c; 方便找到是第幾段的第幾個數 #in…

閑庭信步使用圖像驗證平臺加速FPGA的開發:第二十四課——圖像直方圖均衡化的FPGA實現

&#xff08;本系列只需要modelsim即可完成數字圖像的處理&#xff0c;每個工程都搭建了全自動化的仿真環境&#xff0c;只需要雙擊top_tb.bat文件就可以完成整個的仿真&#xff0c;大大降低了初學者的門檻&#xff01;&#xff01;&#xff01;&#xff01;如需要該系列的工程…

LabVIEW 2025安裝包| 免費免激活版下載| 附圖文詳細安裝教程

[軟件名稱]&#xff1a;LabVIEW 2025 [軟件大小]&#xff1a;13 G [系統要求]&#xff1a;支持Win7及更高版本 [下載通道]:夸克網盤 [下載鏈接]: https://pan.quark.cn/s/7e9527cc06a3 &#xff08;建議用手機保存到網盤后&#xff0c;再用電腦下載&#xff09; 更多免費軟件&a…