隨著人工智能技術向多學科交叉融合與工程實踐領域縱深發展,MATLAB 2024b深度學習工具箱通過架構創新與功能強化,為科研創新和行業應用提供了全棧式解決方案。基于該版本工具鏈的三大革新方向展開:一是構建覆蓋經典模型與前沿架構的體系化,涵蓋從CNN、LSTM等基礎網絡到Transformer、GNN、PINN等新興技術的完整知識圖譜;二是強化工業級應用場景落地方案,通過YOLO目標檢測模型、U-Net語義分割模型、TCN時間序列模型等實戰案例,貫通數據清洗、模型設計、訓練優化到模型壓縮的全生命周期管理;三是首創多模態協同開發模式,深度整合Model Hub預訓練生態庫、實驗管理器超參優化模塊,并突破性地實現與TensorFlow/PyTorch框架互操作、大語言模型本地化部署等關鍵技術。
第一章、MATLAB 2024b深度學習工具箱新特性簡介
1、MATLAB Deep Learning Toolbox概覽
2、實時腳本(Live Script)與交互控件(Control)功能介紹與演示
3、批量大數據導入及Datastore類函數功能介紹與演示
4、數據清洗(Data Cleaning)功能介紹與演示
5、深度網絡設計器(Deep Network Designer)功能介紹與演示
6、實驗管理器(Experiment Manager)功能介紹與演示
7、MATLAB Deep Learning Model Hub簡介
8、MATLAB與TensorFlow、PyTorch等深度學習框架協同工作功能介紹與演示
9、MATLAB Deep Learning Toolbox Examples簡介
第二章、卷積神經網絡(Convolutional Neural Network, CNN)
1、深度學習與傳統機器學習的區別與聯系
2、卷積神經網絡的基本原理(什么是卷積核?CNN的典型拓撲結構是怎樣的?CNN的權值共享機制是什么?CNN提取的特征是怎樣的?)
3、LeNet、AlexNet、Vgg-16/19、GoogLeNet、ResNet等經典深度神經網絡的區別與聯系
4、預訓練模型(Alexnet、Vgg-16/19、GoogLeNet、ResNet等)的下載與安裝
5、優化算法(梯度下降、隨機梯度下降、小批量隨機梯度下降、動量法、Adam等)
6、調參技巧(參數初始化、數據預處理、數據擴增、批量歸一化、超參數優化、網絡正則化等)
7、案例講解:(1)CNN預訓練模型實現物體識別;(2)利用卷積神經網絡抽取抽象特征;(3)自定義卷積神經網絡拓撲結構;(4)1D CNN模型解決回歸擬合預測問題
8、實操練習
第三章、模型可解釋性與特征可視化Model Explanation and Feature Visualization
1、什么是模型可解釋性?為什么要對CNN模型進行解釋?
2、常用的可視化方法有哪些(特征圖可視化、卷積核可視化、類別激活可視化等)?
3、CAM(Class Activation Mapping)、GRAD-CAM、LIME(Local Interpretable Model-agnostic Explanation)、t-SNE等方法原理講解
4、案例講解:基于CAM/Grad-CAM的卷積神經網絡模型的特征可視化
5、實操練習
第四章、遷移學習算法(Transfer Learning)
1、遷移學習算法的基本原理(為什么需要遷移學習?遷移學習的基本思想是什么?)
2、基于深度神經網絡模型的遷移學習算法
3、案例講解:基于Alexnet預訓練模型的模型遷移
4、實操練習
第五章、循環神經網絡與長短時記憶神經網絡(RNN & LSTM)
1、循環神經網絡(RNN)與長短時記憶神經網絡(LSTM)的基本原理
2、RNN與LSTM的區別與聯系
3、案例講解:(1)時間序列預測;(2)序列-序列分類
4、實操練習
第六章、時間卷積網絡(Temporal Convolutional Network, TCN)
1、時間卷積網絡(TCN)的基本原理
2、TCN與1D CNN、LSTM的區別與聯系
3、案例講解:(1)時間序列預測:新冠肺炎疫情預測;(2)序列-序列分類:人體動作識別
4、實操練習
第七章、生成式對抗網絡(Generative Adversarial Network)
1、生成式對抗網絡GAN(什么是對抗生成網絡?為什么需要對抗生成網絡?對抗生成網絡可以做什么?)
2、案例講解:向日葵花圖像的自動生成
3、實操練習
第八章、自編碼器(AutoEncoder)
1、自編碼器的組成及基本工作原理
2、經典自編碼器(棧式自編碼器、稀疏自編碼器、去噪自編碼器、卷積自編碼器、掩碼自編碼器等)
3、案例講解:基于自編碼器的圖像分類
4、實操練習
第九章、目標檢測YOLO模型
1、什么是目標檢測?目標檢測與目標識別的區別與聯系?YOLO模型的工作原理(從傳統目標檢測到基于深度學習的目標檢測、從“兩步法”的R-CNN到“一步法”的YOLO、YOLO模型的演化歷史)
2、案例講解:(1)標注工具Image Labeler功能簡介與演示;(2)使用預訓練模型實現圖像、視頻等實時目標檢測;(3)訓練自己的數據集:新冠疫情佩戴口罩識別
3、實操練習
第十章、圖像語義分割U-Net模型
1、語義分割(Semantic Segmentation)簡介
2、U-Net模型的基本原理
3、案例講解:基于U-Net的多光譜圖像語義分割
第十一章、注意力機制(Attention)
1、注意力機制的背景和動機(為什么需要注意力機制?注意力機制的起源和發展里程碑)。
2、注意力機制的基本原理(什么是注意力機制?注意力機制的數學表達與基本公式、用機器翻譯任務帶你了解Attention機制、如何計算注意力權重?)
3、注意力機制的主要類型:鍵值對注意力機制(Key-Value Attention)、自注意力(Self-Attention)與多頭注意力(Multi-Head Attention)、Soft Attention 與 Hard Attention、全局(Global)與局部(Local)注意力
4、注意力機制的優化與變體:稀疏注意力(Sparse Attention)、自適應注意力(Adaptive Attention)、動態注意力機制(Dynamic Attention)、跨模態注意力機制(Cross-Modal Attention)
5、案例演示:(1)基于注意力機制的Seq-to-Seq翻譯;(2)基于注意力機制的圖像描述 ??
6、實操練習
第十二章、Transformer模型及其在NLP和CV領域的應用
1、Transformer模型的提出背景(從RNN、LSTM到注意力機制的演進、Transformer模型的誕生背景)
2、Transformer模型的進化之路(RCTM→RNN Encoder-Decoder→Bahdanau Attention→Luong Attention→Self Attention)
3、Transformer模型拓撲結構(編碼器、解碼器、多頭自注意力機制、前饋神經網絡、層歸一化和殘差連接等)
4、Transformer模型工作原理(輸入數據的Embedding、位置編碼、層規范化、帶掩碼的自注意力層、編碼器到解碼器的多頭注意力層、編碼器的完整工作流程、解碼器的完整工作流程、Transformer模型的損失函數)
5、BERT模型的工作原理(輸入表示、多層Transformer編碼器、掩碼語言模型MLM、下一句預測NSP)
6、GPT系列模型(GPT-1 / GPT-2 / GPT-3 / GPT-3.5 / GPT-4)的工作原理(單向語言模型、預訓練、自回歸生成、上下文學習、RLHF人類反饋強化學習、多模態架構)
7、ViT模型(提出的背景、基本架構、與傳統CNN的比較、輸入圖像的分塊處理、位置編碼、Transformer編碼器、分類頭、ViT模型的訓練與優化
8、案例演示:(1)基于BERT模型的文本分類;(2)基于ViT模型的圖像分類
9、實操練習
第十三章、物理信息神經網絡(PINN)
1、PINN工作原理:物理定律與方程的數學表達、如何將物理定律嵌入到神經網絡模型中?PINN的架構(輸入層、隱含層、輸出層的設計)、物理約束的形式化(如何將邊界條件等物理知識融入網絡?)損失函數的設計(數據驅動與物理驅動的損失項)
2、案例演示:基于PINN的微分方程求解
3、實操練習
第十四章、圖神經網絡(GNN)
1、圖神經網絡的背景和基礎知識(什么是圖神經網絡?圖神經網絡的發展歷程?為什么需要圖神經網絡?)
2、圖的基本概念和表示(圖的基本組成:節點、邊、屬性;圖的表示方法:鄰接矩陣;圖的類型:無向圖、有向圖、加權圖)。
3、圖神經網絡的工作原理(節點嵌入和特征傳播、聚合鄰居信息的方法、圖神經網絡的層次結構)。
4、圖卷積網絡(GCN)的工作原理。
5、圖神經網絡的變種和擴展:圖注意力網絡(GAT)、圖同構網絡(GIN)、圖自編碼器、圖生成網絡。
6、案例演示:(1)基于圖卷積神經網絡的節點分類;(2)基于圖神經網絡的時間序列異常點檢測
7、實操練習
第十五章、深度學習模型壓縮(Compression)
1、深度學習模型壓縮的常用方法(裁剪、量化、Dropout、正則化等)
2、Deep Learning Toolbox Model Compression Library的安裝與模型壓縮
3、案例演示:基于Deep Network Designer的模型壓縮
4、實操練習
第十六章、MATLAB接入ChatGPT/DeepSeek等大語言模型
1、Ollama下載與安裝
2、Large Language Models (LLMs) with MATLAB下載與安裝
3、ChatGPT API Key配置與MATLAB接入ChatGPT對話
4、本地部署DeepSeek大語言模型與MATLAB接入DeepSeek對話
5、案例講解與實操練習