李宏毅深度學習教程 第16-18章 終身學習+網絡壓縮+可解釋性人工智能

【2025版】44、第十四節 機器終身學習 一 為什么今日的人工智能A_嗶哩嗶哩_bilibili

【2025版】42、第十三節 神經網絡壓縮 一 類神經網絡剪枝PruA_嗶哩嗶哩_bilibili

【2025版】30、第九節 機器學習的可解釋性 上 – 為什么神經網絡可以正_嗶哩嗶哩_bilibili

目錄

1. 終生學習

1.1 災難性遺忘

1.2?終身學習評估方法

1.3 解決災難性遺忘

2.?網絡壓縮

2.1?網絡剪枝(減少連邊 / 神經元)

2.2?知識蒸餾(學習老師的分布)

2.3?參數量化 (用更少的空間存儲參數)

2.4?網絡架構設計(改變結構優化參數)

2.5?動態計算(根據計算資源調整工作量)

3.?可解釋性人工智能

3.1 局部可解釋(為什么判斷是一只貓?中間層得到了什么?)

3.2 全局可解釋(什么樣的圖片叫做貓)


1. 終生學習

1. 模型學會解決一個task后 繼續學習別的task(一個會多個task的模型)

2.?模型上線后 收到來自使用者的反饋 并且得到新的訓練數據更新模型

1.1 災難性遺忘

比如有task1 和 task2,如果最開始直接把task1 和 task2的目標和訓練數據一起給模型 模型可以學得很好。但是如果先學task1,再學task2,task1的正確率會低很多(遺忘)

  • 如果要重新學一遍task1 每次有新任務了就要把之前的重新學一遍 效率太低
  • 如果每個任務都分別一個模型:一是存儲量會大很多,二是任務之間可能有共通之處,讓一個模型學多個task會更有幫助。

1.2?終身學習評估方法

一個矩陣 Ri,j 代表學習 i 個任務后 在任務 j 的表現

j 在 i?前?可以看出 j 有沒有被遺忘; j 在 i 后 可以看出 任務 i 能否遷移到任務 j

準確率則用 T 個任務都學完后的數據; 后向遷移為 所有模型(最終 - 剛學的時候)的均值

1.3 解決災難性遺忘

遺忘的主要原因: 最適合 task2 的參數沒那么使用與 task1。參數需要綜合前后

選擇性的突觸可塑性:盡量學對新任務比較重要的參數,對過去任務很重要的參數盡量不改變。

現在的參數為 θ? 只考慮當前最新的參數的損失為 L(θ)

bi 為之前任務的重要性系數? θ_b 為之前的參數。? ? 需要設定 λ和b 的系數。

GEM 梯度回合記憶:存下歷史任務對應的梯度方向,用(當前任務梯度方向 + 歷史梯度方向) 作為更新方向。

2.?網絡壓縮

不降低多少性能的情況下 減少網絡參數。

2.1?網絡剪枝(減少連邊 / 神經元)

  1. 評估網絡中 神經元/權重的 重要性
  2. 剪枝掉10%(一小部分)不太重要的參數? ?(一下子剪枝太多會對正確率損壞太大)
  3. 微調保障準確率

但是剪枝掉一些權重 會使得網絡結構不規則。

在Pytorch中定義網絡:每層幾個神經元 多少 多長輸入輸出;GPU加速 把網絡看做矩陣乘法。

?網絡不規則 會使得難以構建&訓練網絡。

刪去權重 只是把權重調為零。但如果把剪掉的權重設為0 會使得網絡沒有真正減小。

相比而言 刪去神經元會更方便一些。

2.2?知識蒸餾(學習老師的分布)

比如手寫數字 監督學習學這張圖片是“1” 太難了(分布要是 “1”為1 其余都為0)

我先訓練一個大網絡作為老師網絡(得到圖片“1” 輸出的分布)?學生小網絡去學那個輸出分布

大網絡 可以通過集成學習 一些高質量分類器平均值

還可以幫助小網絡學到 “1”比較像“7” 的知識

小技巧:在softmax除以溫度

T=1時不變? ?大一些的T可以拉近e^y 之間的距離

不改變老師分類器的結果 但可以使訓練更平滑

2.3?參數量化 (用更少的空間存儲參數)

法1:權重聚類? 聚類完把一個類別中的值設為他們的平均值(如下表中的顏色)

只需記錄每個參數屬于哪個類別群;每個群平均數是多少

本來存一個參數要8/16位 現在只需2位

還可以用 huffman編碼? ? 二值網絡(參數只有±1) 等技巧壓縮

2.4?網絡架構設計(改變結構優化參數)

深度可分離卷積

一般CNN 參數量為 K*K*I*O

深度卷積 每個濾波器對應一個通道,輸入跟輸出的通道數量相同。? K*K*I

點卷積 濾波器的核都是1*1? ? ?上只關注通道內,下只關注通道間。? 1*1*I*O

?

低秩近似 用矩陣乘法? ?m*n = m*k?*?k*n

2.5?動態計算(根據計算資源調整工作量)

計算資源多/問題難度大 就充分利用計算資源;? ?根據現有計算資源 自由調整對計算量的需求。

(就像手機的省電模式一樣)

可以自行調整 神經網絡的深度(幾層)寬度(一層幾個神經元)

我們平時是 只把神經網絡的最后一層的輸出當作最后的結果。

可以把每一層神經網絡的輸出都可以當成最后的分類結果,根據計算資源計算到哪一層。

標準答案跟每一個額外層的輸出越接近越好,把所有的輸出跟標準答案的交叉熵都加起來得到 L

3.?可解釋性人工智能

為什么需要可解釋性:

1.機器學習模型往往是一個黑盒子,無法解釋這個黑盒子中是如何通過輸入得到輸出的。但模型的安全性在行業落地時十分重要,醫療診斷不給出診斷理由,自動駕駛不給出操作理由,很難相信。

2.知道模型錯在什么樣的地方,為什么犯錯,可以有更好的、更有效率的方法來提升模型

線性模型 可解釋性強 但功能比較有限;模型越強越難解釋(二者需要平衡)

決策樹 每個節點向左/向右 直到葉子結點。具有一些可解釋性,但特征變多,變復雜到隨機森林之類又變得比較難解釋。

我們期望的可解釋是什么樣的?就像人腦也是一個黑盒,但我們可以相信另一個人的判斷。

心理學實驗:想要插隊,相比直接說,和前面的人說“我趕時間”別人接受的程度會提高很多。

相似的,機器學習好的解釋就是人能接受的解釋。

3.1 局部可解釋(為什么判斷是一只貓?中間層得到了什么?)

哪些部分(token 片段 像素)判斷出來是一只貓?如何知道一個部分的重要性

如果我們改造或刪除某一個部分以后,網絡的輸出有了巨大的變化 就說明很重要。(梯度

梯度大的地方標白 構成的圖:顯著圖。

下方是原始顯著圖 有羚羊輪廓但如何使得顯著圖的效果更好呢?(降低噪聲點影響)

在圖片上面加上各種不同的噪音,接著在每一張圖片上計算顯著圖,再平均起來

網絡是如何去處理這個輸入的?

可以將隱藏層(中間層)網絡的輸出可視化 或者看其中有沒有和任務相關信息。

probing探針 插入network 把中間層的內容拎出來 看是否可以復現原任務

例1. BERT 的某一層到底學到了什么? ? ?POS詞性分類問題? ?NER命名實體分類問題

把BERT 某一層的embedding??丟給一個POS分類器(分類器本身強度 不能太好也不能太差),

如果分類器分類的正確率高 代表包含詞性信息 否則不包含詞性信息。

例2. 音頻轉文字? 中間層拿出來給TTS 看能否重構出原音頻

(一定要包含原音頻的信息 才會成功重構)

3.2 全局可解釋(什么樣的圖片叫做貓)

想知道某個濾波器主要是檢測哪個部分的?檢測到什么了什么部分說明是貓?

可以用梯度上升使得這個濾波器得分最高的X 的樣子。

但是直接輸出得分最高的圖像(機器心目中最像的圖像)人眼不一定會認為

因為圖像需要一些噪聲 才能幫助看到所有的物體(一定魯棒性)

如果想讓圖片生成人所希望看到的 還需要進行一些正則化/GAN 之類的操作 減少無關量+生成更接近人心目中的圖像

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/918169.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/918169.shtml
英文地址,請注明出處:http://en.pswp.cn/news/918169.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

LiveQing視頻RTMP推流視頻點播服務功能-云端錄像支持按時間段下載錄像時間段下載視頻mp4

LiveQing視頻RTMP推流視頻點播服務功能-云端錄像支持按時間段下載錄像時間段下載視頻mp41、云端錄像2、配置云端錄像3、查看云端錄像3、列表模式4、時間段下載5、時間段下載接口6、RTMP推流視頻直播和點播流媒體服務1、云端錄像 LiveQing 支持服務器集中錄像,將rtm…

Spark在什么情況下CBO才會判斷失誤,如何避免

在 Spark 中,CBO(基于成本的優化器,Cost-Based Optimizer)通過分析表的統計信息(如行數、列基數、數據分布等)計算不同執行計劃的“成本”,并選擇成本最低的計劃。但在以下場景中,CB…

【第12話:感知算法基礎4】圖像分割:深度學習圖像分割模型介紹入門及常用模型詳解

深度學習圖像分割模型介紹入門及常用模型詳解 圖像分割是計算機視覺的核心任務,旨在將圖像劃分為語義區域。隨著深度學習的發展,分割模型在精度和效率上取得重大突破。以下按技術演進順序詳解主流模型:1. FCN(全卷積網絡&#xff…

AI 大模型企業級應用落地挑戰與解決方案

引言:AI 大模型的企業價值與落地困境近年來,以 GPT-4、Claude 3、文心一言為代表的大語言模型(LLM)展現出驚人的自然語言理解與生成能力,吸引了眾多企業的關注。據 Gartner 預測,到 2025 年,40%…

微服務如何保證系統高可用?

今天我們來探討一個綜合性但至關重要的話題:給你一個微服務應用,你該如何系統性地保證其高可用性?在互聯網技術崗的面試中,高并發、高可用和大數據通常被視為衡量候選人經驗的三大黃金標準。但說實話,是否擁有真正的高…

推理路徑的動態調控:讓大模型學會“恰到好處”的思考

當前大型語言模型(LLM)通過思維鏈(CoT)提升復雜任務推理能力,但研究表明其推理路徑存在嚴重冗余——例如反復驗證或無效思維跳躍,導致計算資源浪費和“幻覺”增加。論文:Test-time Prompt Inter…

springboot 2.4跨域變化和swagger結合的問題

前言 最近升級老項目,springboot2.2升級2.x最新版,升級項目本身升級很正常,畢竟springboot升級3.x以下,升級3.x需要spring6.x,需要jdk17.但是升級的項目在自測時正常,一旦真正測試就報跨域問題了。排查才發…

AWT 基本組件深入淺出:Button/Label/TextField/Checkbox/Choice/List 全面實戰與性能優化

Java AWT 基本組件的原理與用法,提供可運行示例、布局最佳實踐、事件處理與“性能優化”建議,幫助你快速構建穩定的桌面界面。 Java AWT, GUI, Button, Label, TextField, Checkbox, CheckboxGroup, Choice, List, 事件處理, 布局管理器, 性能優化 AWT…

邏輯回歸詳解:原理、應用與實踐

邏輯回歸詳解:原理、應用與實踐1. 邏輯回歸的基本原理1.1 線性回歸部分1.2 Sigmoid函數1.3 決策邊界2. 邏輯回歸的損失函數3. 邏輯回歸的應用場景4. 邏輯回歸的優缺點4.1 優點4.2 缺點5. 使用scikit-learn實現邏輯回歸6. 邏輯回歸的改進與擴展6.1 正則化6.2 多分類擴…

嵌入式硬件接口總結

嵌入式系統的核心在于其硬件與軟件的無縫協作,而硬件接口是實現這種協作的物理和邏輯橋梁。它們定義了微控制器、處理器、傳感器、執行器、存儲器以及其他外設之間如何交換數據、電信號和控制信息。 核心概念 接口的定義: 兩個獨立系統或組件之間進行通信…

《算法導論》第 14 章 - 數據結構的擴張

大家好!今天我們來深入學習《算法導論》第 14 章 —— 數據結構的擴張。這一章主要介紹了如何基于現有數據結構(如二叉搜索樹)擴展出新的功能,以滿足更復雜的問題需求。我們會從動態順序統計樹講到區間樹,每個知識點都…

Vue 3.6 Vapor模式完全指南:告別虛擬DOM,性能飛躍式提升

什么是 Vapor 定義: Vue 3.6 新增的編譯/渲染模式,不再構建/對比虛擬 DOM,而是將模板編譯為“直達 DOM 的更新代碼”,以更低內存與更快更新獲得接近 Solid/Svelte 的性能。特點更快: 跳過 VDOM 創建與 diff,直接按依賴精準更新。…

Java類和對象課上練習題目設計

我們可以做一個簡易銀行賬戶類,支持存款、取款、查看交易記錄等。 示例:BankAccount 類 java 復制 編輯 public class BankAccount { private String accountNumber; // 賬號 private String ownerName; // 開戶人姓名 private double balance; …

Python數據雙效處理:同步轉換與換算的高級技術與工程實踐

引言:轉換與換算在現代數據處理中的核心價值在大數據與實時處理需求激增的時代,高效的數據處理方案成為核心競爭力。根據2025年Python數據工程調查報告:75%的數據處理任務需要同時執行轉換和換算操作優化良好的雙效處理可提升3-8倍性能關鍵應…

Go語言實戰案例:文件上傳服務

在 Web 開發中,文件上傳 是常見需求,例如頭像上傳、文檔存儲、圖片分享等功能。Go 語言的標準庫 net/http 已經內置了對 multipart/form-data 類型的支持,能讓我們輕松構建一個文件上傳服務。本文將帶你實現一個可運行的文件上傳接口&#xf…

【Lua】常用的庫

os庫:os.time() -- 輸出當前時間的時間戳 os.time({year 2014, month 8, day 14}) -- 獲取指定時間的時間戳local nowTime os.date("*t") -- 以表的形式獲取當前的時間信息for k,v in pairs(nowTime) doprint(k,v) end--以上for循環示例輸出 {year 2…

Mac上安裝和配置MySQL(使用Homebrew安裝MySQL 8.0)

在Mac上安裝MySQL是一個簡單高效的過程,尤其是通過Homebrew這一強大的包管理工具。本文將詳細介紹如何在macOS 15.6系統中使用Homebrew安裝MySQL 8.0版本,并完成基本配置,幫助您快速啟動并安全使用MySQL。1. 安裝Homebrew(若未安裝…

【Datawhale AI夏令營】從Baseline到SOTA:深度剖析金融問答RAG管道優化之路

從Baseline到SOTA:深度剖析金融問答RAG管道優化之路 引言 檢索增強生成(Retrieval-Augmented Generation, RAG)已成為構建知識密集型AI應用的事實標準 1。然而,從一個簡單的“hello world”級別的RAG,進化到一個能在競…

AI鑒偽技術:守護數字時代的真實性防線

文章目錄一、引言:AI偽造技術的“數字病毒”與鑒偽技術的“免疫疫苗”二、合合信息三大AI鑒偽技術解析2.1 人臉視頻鑒偽技術:毫秒級擊穿“數字假面”2.1.1 技術突破:從“像素級標記”到“多模態交叉驗證”2.2 AIGC圖像鑒別技術:讓…

論文reading學習記錄7 - daily - ViP3D

文章目錄前言一、題目和摘要二、引言三、相關工作四、方法五、訓練前言 開沖,清華大學的,帶HDmap的端論文,用的Query,和UniAD一樣。 一、題目和摘要 ViP3D: End-to-end Visual Trajectory Prediction via 3D Agent Queries ViP3…