李宏毅2025《機器學習》第三講-AI的腦科學

在之前的課程中探討了如何利用大模型構建AI Agent,本科將暫時放下應用層面的探索,拿起“手術刀”和“顯微鏡”,深入剖析LLM的“大腦”,帶您踏上一場“AI腦神經科學”的旅程。課程不討論模型的訓練過程,而是假設我們擁有一個已經訓練好的、功能完備的LLM。我們的目標是:理解這個龐大而復雜的神經網絡,在面對輸入并生成輸出的每一個瞬間,其內部究竟發生了什么。

重要提醒: 正如李宏毅老師在課程開始時強調的,目前絕大多數的這類分析研究,受限于計算資源,往往是在相對較小或較早期的開源模型(如GPT-2、LLaMA系列早期版本)上進行的。這就像是通過研究老鼠的大腦來推斷人類大腦的運作機制。雖然基本原理可能相通,但我們必須認識到,這些結論不一定完全適用于最新、最頂尖的閉源模型。然而,這些開創性的研究為我們提供了一套寶貴的分析方法論和深刻的洞見。

本次探索將分為四個部分:

  1. 單個神經元在做什么?——從最基礎的單元開始。
  2. 一層神經元在做什么?——從個體到群體的協作模式。
  3. 跨層神經元如何互動?——追蹤信息在網絡中的完整流動路徑。
  4. 讓模型親口說出想法——利用LLM的語言能力進行自我剖析。

第一部分:一個神經元的使命——“川普神經元”與分布式表達的現實

要理解一個神經元,我們首先要明確它在Transformer中的位置。在Transformer的每個層塊(Layer)中,除了自注意力(Self-Attention)機制外,還有一個重要的部分叫做前饋網絡(Feed-Forward Network, FFN)。這個FFN通常由兩個線性層和一個非線性激活函數(如ReLU)組成。當我們說“一個神經元”時,通常指的就是FFN中第一個線性層之后、激活函數之前或之后的一個節點。它的輸出,是其輸入向量的加權和,再通過激活函數(例如ReLU,將負值歸零)處理后的結果。一個神經元的“激活”,通常意味著它的輸出值大于零。

那么,我們如何探究一個神經元的功能呢?通常遵循一個三步流程:

  1. 觀察(相關性):找到能最大化激活該神經元的輸入文本。例如,我們發現當某個神經元被高度激活時,模型傾向于生成臟話。這說明該神經元與“說臟話”這一行為相關
  2. 干預(因果性):為了驗證因果關系,我們需要進行實驗。最直接的方法是“敲除”(Ablation)這個神經元,即強制將其輸出設為零(或其在大量數據上的平均激活值)。如果敲除后,模型在各種挑釁下都無法生成臟話,我們就能更確信這個神經元對“說臟話”有因果作用。
  3. 控制(劑量效應):如果可能,嘗試不同程度地激活該神經元,觀察其輸出的變化。比如,輕微激活時說輕度臟話,強烈激活時則言辭激烈。

歷史上最著名的例子莫過

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/85966.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/85966.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/85966.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CVPR 2025 | 微米級光影CT精度!復旦騰訊優圖開源Real-IAD D3數據集

【導讀】 本文介紹了復旦聯合騰訊優圖發布高精度多模態數據集Real-IAD D,并基于此數據集提出了一種創新的多模態融合檢測方法,數據集已被CVPR 2025收錄,并開源。>>更多資訊可加入CV技術群獲取了解哦~ 目錄 一、Real-IAD D的創新之處…

解決mysql左連接加where就不會保留左表中的全部數據的問題

在SQL中使用MySQL的LEFT JOIN操作時,如果加入了WHERE條件,確實會影響結果集的完整性,特別是如果你在WHERE條件中使用了JOIN的另一張表中的字段作為過濾條件。這是因為當你在WHERE子句中加入了對JOIN另一張表的過濾條件時,實際上你是在執行一個INNER JOIN(內連接)而非LEFT…

算法與數據結構:動態規劃DP

文章目錄 動態規劃算法全面解析一、核心思想與基本概念二、動態規劃與其他算法的區別三、動態規劃的解題步驟四、經典案例解析1. **斐波那契數列(Fibonacci)**2. **0-1背包問題(0-1 Knapsack)**3. **最長公共子序列(LC…

Coilcraft電感上的橫線是什么意思?電感有方向么?

通常我們會認為電容、電感、電阻這幾類無源器件沒有方向性,在布局和貼片時可以任意方向放置,也不會在PCB上增加絲印標識說明其方向。與此相互印證的是,電容表面無絲印,無法識別方向;電阻表面一般只有包含阻值大小的數字…

通過Docker掛載nginx并修改頁面

1:通過docker創建nginx: 首先關閉原來的Docker(防止端口號沖突) sudo nginx -s stop 直接啟動 Nginx 進程 sudo nginx 啟動nginx: docker run -di --namemynginx -p 80:80 nginx cd /etc/nginx docker run -d …

力扣1124. 表現良好的最長時間段

這一題我看到數據范圍是10^4,暗自竊喜能用雙重循環,看題目是典型的前綴和哈希。不過需要一個轉換將大于8小時的轉化為1,其他都為-1,方便計算,之前的題目中也有這種方法。 那這樣就簡單了 class Solution { public:int…

EDA2算法速通(編者崩潰版)

這個內容是用來回憶一下EDA2涉及的算法和解題的主要步驟: 有疑問或發現錯誤可以私信來討論 高級綜合概述 柏拉圖優化:這個是來判斷是否有哪些節點能完全被其他節點優化掉。比如(1,2)這個節點就可以完全優化(3,4&…

雷池waf配置第三方登錄-釘釘配置詳細教程

雷池waf配置第三方登錄-釘釘配置詳細教程 前往釘釘開放平臺https://open.dingtalk.com/ 選擇一個登錄方式登錄釘釘開放平臺 選擇一個自己所管理的組織 登錄成功后點擊我的后臺 選擇應用開發 在釘釘應用下點擊創建應用 填寫應用名稱和應用描述后點擊保存 點擊網頁…

神經網絡中的均方誤差(Mean Squared Error)詳解

引言 在機器學習和神經網絡領域,損失函數(Loss Function)是衡量模型預測值與真實值之間差異的關鍵指標。均方誤差(Mean Squared Error, MSE)作為一種經典的損失函數,因其簡單性、可解釋性和數學上的優良性…

day036-lsyncd實時同步服務與網站存儲架構

文章目錄 1. 實時同步工具2. lsyncd 實時同步服務2.1 環境準備2.2 rsync準備2.2.1 服務端檢查2.2.2 客戶端檢查2.2.3 備份測試 2.3 配置lsyncd2.3.1 安裝軟件2.3.2 編寫配置文件 2.4 測試 3. 案例-網站存儲架構3.1 rsync服務配置3.1.1 服務端配置3.1.2 客戶端配置 3.2 lsyncd服…

React Native WebView鍵盤難題:如何讓輸入框不被鍵盤遮擋?

寫在前面 “明明點擊了輸入框,鍵盤卻把內容頂得不見蹤影!” —— 這可能是React Native開發者使用WebView時最頭疼的問題之一。 想象一下:你的App內嵌了一個網頁表單,用戶興奮地準備填寫信息,結果鍵盤彈出后&#xf…

Web攻防-XSS跨站瀏覽器UXSS突變MXSSVueReactElectron框架JQuery庫寫法和版本

知識點: 1、Web攻防-XSS跨站-瀏覽器&轉換-UXSS&MXSS 2、Web攻防-XSS跨站-框架和庫-VUE&React&Electron&JQuery 分類: 1、框架或三方庫的XSS(Vue、React、Electron、JQuery) 2、瀏覽器或插件的XSS(UXSS) 3、客戶端預覽內核的XSS(MXS…

PyTorch 中torch.clamp函數使用詳解和實戰示例

torch.clamp 是 PyTorch 中的一個非常有用的函數,它可以將張量的每個元素限制在一個指定的范圍內,超出范圍的元素將被裁剪為邊界值。 函數簽名: torch.clamp(input, minNone, maxNone, outNone)參數說明: input:輸入…

詳解Redis數據庫和緩存不一致的情況及解決方案

數據庫與緩存不一致是分布式系統中常見問題,本質是數據在緩存層和存儲層出現版本差異。 一、并發寫操作導致不一致(最常見) 場景描述 線程A更新數據庫 → 線程B更新數據庫 → 線程B更新緩存 → 線程A更新緩存 結果:緩存中存儲的…

湖北理元理律師事務所:企業債務危機的“急診科”式應對方案

當企業陷入債務危機時,傳統“頭痛醫頭”的應對往往加速死亡。本方案基于企業債務重組實務,提煉出 “止血-清創-修復”三階急救體系,助力企業守住生存底線。 第一階段:精準止血(0-30天關鍵期) 目標&#x…

華為云Flexus+DeepSeek征文|基于Dify構建智能票據信息識別助手

華為云FlexusDeepSeek征文|基于Dify構建智能票據信息識別助手 一、構建智能票據信息識別助手前言二、構建智能票據信息識別助手環境2.1 基于FlexusX實例的Dify平臺2.2 基于MaaS的模型API商用服務 三、構建智能票據信息識別助手實戰3.1 配置Dify環境3.2 配置Dify工具…

Python實例題:基于聯邦學習的隱私保護 AI 系統(分布式學習、隱私計算)

目錄 Python實例題 題目 問題描述 解題思路 關鍵代碼框架 難點分析 擴展方向 Python實例題 題目 基于聯邦學習的隱私保護 AI 系統(分布式學習、隱私計算) 問題描述 開發一個基于聯邦學習的隱私保護 AI 系統,包含以下功能&#xff…

點點(小紅書AI搜索):生活場景的智能搜索助手

1. 產品概述 點點是小紅書于2024年12月正式推出的AI搜索助手,由上海生動詩章科技有限公司開發,定位為生活場景搜索工具,聚焦交通、美食、旅游、購物等日常需求,旨在通過即時信息和真實用戶分享幫助用戶“精準避坑”。 核心特點 …

軟件工程概述:核心概念、模型與方法全解析

一、軟件工程定義與誕生背景 定義 將系統化、規范化、可度量的方法應用于軟件開發、運行和維護的過程(IEEE標準)。 核心目標:在可控成本下,生產高質量、可維護、滿足需求的軟件產品。 - 軟件開發:需求 → 設計 → 編碼…

LVS+Keepalived+nginx

LVSKeepalivednginx 1 安裝依賴 sudo yum install ipvsadm keepalived -y 查詢是否安裝成功 rpm -q -a keepalived 2 配置虛擬IP并安裝ipvsadm /etc/sysconfig/network-scripts cp ifcfg-ens33 ifcfg-ens33:1 修改里面配置文件 TYPE"Ethernet" PROXY_METHOD"n…