李宏毅genai筆記：模型編輯

李宏毅genai筆記：模型編輯

diannao/2025/7/11 18:02:03/文章來源:https://blog.csdn.net/qq_40206371/article/details/149161475

?0 和post training的區別

?

直接用post?training的方法是有挑戰的，因為通常訓練資料只有一筆
而且之后不管問什么問題，都有可能只是這個答案了

1 模型編輯的評估方案?

reliability——同樣的問題，需要是目標答案
generalization——問題（輸入）有一些改變，輸出應該根據目標改變
locality——其他無關的問題結果不應該有改變

不同論文不同設定

取決于考量

現在大部分只能paraphrase

2 不動參數的方法

直接in context 編輯的話，llm可能會不相信提供的新知識

Can We Edit Factual Knowledge by In-Context Learning?

需要給模型一些范例，告訴模型怎么使用新知識

3 改變參數的方法

編輯模型的模型
接受指令后，輸出e，e的大小和待編輯模型的參數一樣
e加到待編輯模型的參數中

那怎么知道e呢？

訓練的時候拼在一起當作一個神經網絡

e看作中間某一層的hidden representation

u1是無關的 locality的問題

實際上的做法大多是
- 根據問題和我們要編輯的知識，計算一個loss和待編輯模型各個參數的梯度g
- 然后計算一個梯度g到e的神經網絡

但是對于這個問題，假設即使只有一層，那么這個neural network'的參數也是1024^4個

沒辦法做這么大的neural network

這里利用了gradient des的一個特征

假設一個矩陣他的graident是一個1024*1024的矩陣，那么這個matrix的rank是1

將大矩陣拆分成兩個向量u和v，分別通過neural network學習對應的u‘，v’，拼起來就是e

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/90535.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/90535.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/90535.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Oracle：union all和union區別

Oracle：union all和union區別

UNION ALL和UNION在Oracle中的主要區別體現在處理重復記錄、性能及結果排序上：處理重復記錄?UNION?：自動去除重復記錄，確保最終結果唯一。?UNION ALL?：保留所有記錄，包括完全重復的行。性能表現?UNION?&#xff…

閱讀更多...

[C#/.NET] 內網開發中如何使用 System.Text.Json 實現 JSON 解析（無需 NuGet）

[C#/.NET] 內網開發中如何使用 System.Text.Json 實現 JSON 解析（無需 NuGet）

在實際的企業開發環境中，尤其是內網隔離環境，開發人員經常面臨無法使用 NuGet 安裝外部包的問題。對于基于 .NET Framework 4.8 的應用，JSON 解析是一個常見的需求，但初始項目中往往未包含任何 JSON 處理相關的程序集。這時&#…

閱讀更多...

JVM（Java 虛擬機）的介紹

JVM（Java 虛擬機）的介紹

JVM原理JVM 核心架構與工作流程1. 類加載機制（Class Loading）2. 運行時數據區（Runtime Data Areas）堆（Heap）方法區（Method Area）:元空間（Metaspace）公共區域虛…

閱讀更多...

Qt 信號槽的擴展知識

Qt 信號槽的擴展知識

Qt 信號槽的擴展知識一、信號與槽的重載Qt信號與槽的重載問題注意事項示例場景二、一個信號連接多個槽1、直接連接多個槽2、使用lambda表達式連接3、連接順序控制4、斷開特定連接5、自動連接方式三、多個信號連接一個槽基本連接語法使用QSignalMapper區分信號源（Qt…

閱讀更多...

鏈表算法之【合并兩個有序鏈表】

鏈表算法之【合并兩個有序鏈表】

目錄 LeetCode-21題 LeetCode-21題將兩個升序鏈表合并成一個新的升序鏈表并返回 class Solution {public ListNode mergeTwoLists(ListNode list1, ListNode list2) {if (list1 null)return list2;if (list2 null)return list1;ListNode dummyHead new ListNode();ListN…

閱讀更多...

Linux - firewall 防火墻

Linux - firewall 防火墻

🔥 什么是 firewalld？firewalld 是一個動態管理防火墻的守護進程（daemon），它提供了一個 D-Bus 接口來管理系統或用戶的防火墻規則。與傳統的靜態 iptables 不同，firewalld 支持：區域&#xff08…

閱讀更多...

【GESP】C++二級真題 luogu-B4356 [GESP202506 二級] 數三角形

【GESP】C++二級真題 luogu-B4356 [GESP202506 二級] 數三角形

GESP C二級，2025年6月真題，多重循環，難度★?☆☆☆。題目題解詳見：【GESP】C二級真題 luogu-B4356 [GESP202506 二級] 數三角形 | OneCoder 【GESP】C二級真題 luogu-B4356 [GESP202506 二級] 數三角形 | OneCoderGESP C二級&…

閱讀更多...

遙感影像巖性分類：基于CNN與CNN-EL集成學習的深度學習方法

遙感影像巖性分類：基于CNN與CNN-EL集成學習的深度學習方法

遙感影像巖性分類：基于CNN與CNN-EL集成學習的深度學習方法大家好，我是微學AI，今天給大家介紹一下遙感影像巖性分類：基于CNN與CNN-EL集成學習的深度學習方法。該方法充分利用了多源遙感數據的光譜和空間信息，同時結合…

閱讀更多...

【STM32 學習筆記】SPI通信協議

【STM32 學習筆記】SPI通信協議

SPI通信協議 SPI協議是由摩托羅拉公司提出的通訊協議(Serial Peripheral Interface)，即串行外圍設備接口， 是一種高速全雙工的通信總線。它被廣泛地使用在ADC、LCD等設備與MCU間，要求通訊速率較高的場合。 ??學習本章時，可與I2C…

閱讀更多...

Kafka如何做到消息不丟失

Kafka如何做到消息不丟失

一、三種消息傳遞語義（Message Delivery Semantics）：核心是“消息被消費處理的次數” Kafka的三種傳遞語義本質上描述的是“一條消息從生產到最終被消費者處理完成，可能出現的次數”，這由生產者的消息寫入可靠性和消費者的offset提交策略共同決定。 1. At most once（最…

閱讀更多...

HEVC/H.265 碼流分析工具 HEVCESBrowser 使用教程

HEVC/H.265 碼流分析工具 HEVCESBrowser 使用教程

引言研究視頻編解碼的都知道，少不了各類的分析工具助力標準研究和算法開發，目前最出名的流媒體分析工具就是elecard系列，但基于一些原因可能大家用的都比較少。因此，找到合適的碼流分析工具才是編解碼研究的便捷途徑&#xff0c…

閱讀更多...

量子計算+AI芯片：光子計算如何重構神經網絡硬件生態

量子計算+AI芯片：光子計算如何重構神經網絡硬件生態

前言前些天發現了一個巨牛的人工智能免費學習網站，通俗易懂，風趣幽默，忍不住分享一下給大家。點擊跳轉到網站量子計算AI芯片：光子計算如何重構神經網絡硬件生態 ——2025年超異構計算架構下的萬億參數模型訓練革命產業拐點&a…

閱讀更多...

linux 4.14 kernel屏蔽arm arch timer的方法

linux 4.14 kernel屏蔽arm arch timer的方法

在 ARMv7 架構的單核 CPU 系統中，完全禁用 coretime 時鐘中斷（通常是 ARM 私有定時器中斷）需要謹慎操作，因為這會導致調度器無法工作，系統可能失去響應。以下是實現方法及注意事項：方法 1：通過 …

閱讀更多...

[實戰]調頻（FM）和調幅（AM）信號生成（完整C語言實現）

[實戰]調頻（FM）和調幅（AM）信號生成（完整C語言實現）

調頻（FM）和調幅（AM）信號生成文章目錄調頻（FM）和調幅（AM）信號生成1. 調頻（FM）和調幅（AM）信號原理與信號生成調幅（AM&#…

閱讀更多...

【LeetCode 熱題 100】21. 合并兩個有序鏈表——（解法一）迭代法

【LeetCode 熱題 100】21. 合并兩個有序鏈表——（解法一）迭代法

Problem: 21. 合并兩個有序鏈表題目：將兩個升序鏈表合并為一個新的升序鏈表并返回。新鏈表是通過拼接給定的兩個鏈表的所有節點組成的。文章目錄整體思路完整代碼時空復雜度時間復雜度：O(M N)空間復雜度：O(1)整體思路這段代碼旨在解決…

閱讀更多...

力扣 hot100 Day40

力扣 hot100 Day40

23. 合并 K 個升序鏈表給你一個鏈表數組，每個鏈表都已經按升序排列。請你將所有鏈表合并到一個升序鏈表中，返回合并后的鏈表。 //自己寫的垃圾 class Solution { public:ListNode* mergeKLists(vector<ListNode*>& lists) {vector<int…

閱讀更多...

validate CRI v1 image API for endpoint “unix:///run/containerd/containerd.sock“

validate CRI v1 image API for endpoint “unix:///run/containerd/containerd.sock“

1.現象pull image failed: Failed to exec command: sudo -E /bin/bash -c "env PATH$PATH crictl pull 172.23.123.117:8443/kubesphereio/pause:3.9"FATA[0000] validate service connection: validate CRI v1 image API for endpoint "unix:///run/container…

閱讀更多...

【會員專享數據】2013-2024年我國省市縣三級逐月SO?數值數據（Shp/Excel格式）

【會員專享數據】2013-2024年我國省市縣三級逐月SO?數值數據（Shp/Excel格式）

之前我們分享過2013-2024年全國范圍逐月SO?柵格數據（可查看之前的文章獲悉詳情）!該數據來源于韋晶博士、李占清教授團隊發布在國家青藏高原科學數據中心網站上的中國高分辨率高質量近地表空氣污染物數據集。很多小伙伴拿到數據后反饋柵格數據不太方便使…

閱讀更多...

銳捷網絡重磅發布RG-UNC CS網絡數字化平臺：四大核心能力重塑企業網絡管理新范式

銳捷網絡重磅發布RG-UNC CS網絡數字化平臺：四大核心能力重塑企業網絡管理新范式

近期，銳捷重磅發布RG-UNC網絡數字化平臺CS系列產品，通過全網統一融合管理、組網編排及自動化部署、便捷準入與訪問控制、全鏈業務保障與可視四大核心能力，重新定義企業網絡管理標準。置身于數字化轉型的進程中，您的網絡是否還在面…

閱讀更多...

使用虛擬機遠程登陸ensp模擬器交換機

使用虛擬機遠程登陸ensp模擬器交換機

本文使用軟件：VMware，eNSP，mobaxterm要登陸ensp里面的設備，需要使用到cloud下面我們先搭建如下拓撲：首先點擊cloud，端口一綁定UDP信息，添加；端口2綁定VMnet8網卡（注意網段…

閱讀更多...

最新文章