李宏毅（Deep Learning）--（三）

李宏毅（Deep Learning）--（三）

pingmian/2025/7/15 22:13:56/文章來源:https://blog.csdn.net/2301_80670411/article/details/149266975

一.前向傳播與反向傳播的理解：

?

二.模型訓練遇到的問題

在模型訓練中，我們可能會遇到效果不好的情況，那么我們應該怎么思考切入，找到問題所在呢？

流程圖如下：

第一個就是去看訓練的損失函數值情況。如果損失較大，那么就有可能是兩種情況：
（1）模型過于簡單：如圖：當你設計的模型所能擬合的函數集合（藍色區域）這么大時，即使你找了藍色區域內最優的函數（optimization最優），但是真正完美擬合的函數不能通過該模型擬合（不在藍色區域內），所以loss較大。

（2） optimization效果不佳（梯度下降難以到達最優解）

基于以上情況，我們怎么去判別呢？（我們可以去增加模型的復雜度，如果新模型的loss在training data上比原model還高，那就說明是optimization的問題了）

假如經過努力，你已經可以讓training data的loss變得小了，這時我們看testing data的loss,假如我們發現testing data的loss較大，這時候也有兩種可能得原因：

（1） over fitting ：在training data上的loss好，在testing 上的loss差（缺一不可）才叫過擬合

比如：如上圖，所有的data擬合的預期目標函數是二次函數，但由于?某些原因（原因很多，這里暫不探討），導致擬合的函數雖然能夠在有training data限制的地方，表現的很好，但是在其他地方是隨機預測的（函數彈性過大，如黑色箭頭所指函數），這使得testing data在該函數的loss較大

解決方法：add training data?or data augmentation?or regularation

今天先學到這啦

謝謝

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/88873.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/88873.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/88873.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

android studio 運行，偶然會導致死機，設置Memory Settings嘗試解決

android studio 運行，偶然會導致死機，設置Memory Settings嘗試解決

1、android studio導致死機鼠標不能動，鍵盤沒有反應，只能硬重啟，但是內存并沒有用完，cpu也不是100% 2、可能的原因 android studio內存設置的問題，為了限制占用內存，所以手工設置內存最小的一個&#x…

閱讀更多...

HTB 賽季8靶場 - Outbound

HTB 賽季8靶場 - Outbound

Rustscan掃描我們開局便擁有賬號 tyler / LhKL1o9Nm3X2，我們使用rustscan進行掃描 rustscan -a 10.10.11.77 --range 1-65535 --scan-order "Random" -- -A Web服務漏洞探查我們以賬號tyler / LhKL1o9Nm3X2登錄webmail，并快速確認版本信息。該…

閱讀更多...

動態組件和插槽

動態組件和插槽

[Vue2]動態組件和插槽動態組件和插槽來實現外部傳入自定義渲染組件 <template><div v-if"steps.length > 0" class"gain-box-header"><el-steps direction"vertical"><div class"l…

閱讀更多...

Unreal5從入門到精通之如何實現UDP Socket通訊

Unreal5從入門到精通之如何實現UDP Socket通訊

文章目錄一.前言二.什么是FSocket1. FSocket的作用2. FSocket關鍵特性三.創建Socket四.數據傳輸五.線程安全六.UDPSocketComponentUDPSocketComponent.hUUDPSocketComponent.cpp七.SocketTest測試八.最后一.前言我們在開發UE 的過程中，會經常使用到Socket通訊，包括TCP，UD…

閱讀更多...

UI前端大數據處理新趨勢：基于邊緣計算的數據處理與響應

UI前端大數據處理新趨勢：基于邊緣計算的數據處理與響應

hello寶子們...我們是艾斯視覺擅長ui設計、前端開發、數字孿生、大數據、三維建模、三維動畫10年經驗!希望我的分享能幫助到您!如需幫助可以評論關注私信我們一起探討!致敬感謝感恩!一、引言：前端大數據的 “云端困境” 與邊緣計算的破局當用戶在在線文檔中實時協作…

閱讀更多...

Reading and Writing to a State Variable

Reading and Writing to a State Variable

本節是《Solidity by Example》的中文翻譯與深入講解，專為零基礎或剛接觸區塊鏈開發的小白朋友打造。我們將通過“示例解說提示”的方式，帶你逐步理解每一段 Solidity 代碼的實際用途與背后的邏輯。Solidity 是以太坊等智能合約平臺使用的主要編程語…

閱讀更多...

c# 深度解析：實現一個通用配置管理功能，打造高并發、可擴展的配置管理神器

c# 深度解析：實現一個通用配置管理功能，打造高并發、可擴展的配置管理神器

文章目錄深入分析 ConfigManager<TKey, TValue> 類1. 類設計概述2. 核心成員分析2.1 字段和屬性2.2 構造函數3. 數據加載機制4. CRUD 操作方法4.1 添加數據4.2 刪除數據4.3 更新數據4.4 查詢數據4.5 清空數據5. 數據持久化6. 設計亮點7. 使用示例ConfigManager<TKey, …

閱讀更多...

運維打鐵: Python 腳本在運維中的常用場景與實現

運維打鐵: Python 腳本在運維中的常用場景與實現

文章目錄引言思維導圖常用場景與代碼實現1. 服務器監控2. 文件管理3. 網絡管理4. 自動化部署總結注意事項引言在當今的 IT 運維領域，自動化和效率是至關重要的。Python 作為一種功能強大且易于學習的編程語言，已經成為運維人員不可或缺的工具。它可以幫…

閱讀更多...

【零基礎入門unity游戲開發——unity3D篇】3D光源之——unity反射和反射探針技術

【零基礎入門unity游戲開發——unity3D篇】3D光源之——unity反射和反射探針技術

文章目錄前言實現天空盒反射1、新建一個cube2、全反射材質3、增加環境反射分辨率反射探針1、一樣把小球材質調成全反射2、在小球身上加添加反射探針3、設置靜態物體4、點擊烘培5、效果6、可以修改反射探針區域大小7、實時反射專欄推薦完結前言當對象收到直接和間接光照后，它…

閱讀更多...

React Three Fiber 實現 3D 模型點擊高亮交互的核心技巧

React Three Fiber 實現 3D 模型點擊高亮交互的核心技巧

在 WebGL 3D 開發中，模型交互是提升用戶體驗的關鍵功能之一。本文將基于 React Three Fiber（R3F）和 Three.js，總結 3D 模型點擊高亮（包括模型本身和邊框）的核心技術技巧，幫助開發者快速掌握復雜…

閱讀更多...

卷積神經網絡實戰：MNIST手寫數字識別

卷積神經網絡實戰：MNIST手寫數字識別

夜漸深，我還在😘 老地方睡覺了🙌 文章目錄📚 卷積神經網絡實戰：MNIST手寫數字識別🧠 4.1 預備知識?? 4.1.1 torch.nn.Conv2d() 三維卷積操作📏 4.1.2 nn.MaxPool2d() 池化層的作用&#x1f4…

閱讀更多...

HarmonyOS應用無響應（AppFreeze）深度解析：從檢測原理到問題定位

HarmonyOS應用無響應（AppFreeze）深度解析：從檢測原理到問題定位

HarmonyOS應用無響應（AppFreeze）深度解析：從檢測原理到問題定位在日常應用使用中，我們常會遇到點擊無反應、界面卡頓甚至完全卡死的情況——這些都可能是應用無響應（AppFreeze） 導致的。對于開發者而言&am…

閱讀更多...

湖北設立100億元人形機器人產業投資母基金

湖北設立100億元人形機器人產業投資母基金

湖北設立100億元人形機器人產業投資母基金湖北工信 2025年07月08日 12:03 湖北 ，時長01:20 近日，湖北設立100億元人形機器人產業投資母基金，重點支持人形機器人和人工智能相關產業發展。人形機器人產業投資母基金由湖北省財政廳依托省政府…

閱讀更多...

時序預測 | Pytorch實現CNN-LSTM-KAN電力負荷時間序列預測模型

時序預測 | Pytorch實現CNN-LSTM-KAN電力負荷時間序列預測模型

預測效果代碼主要功能該代碼實現了一個結合CNN（卷積神經網絡）、LSTM（長短期記憶網絡）和KAN（Kolmogorov-Arnold Network）的混合模型，用于時間序列預測任務。主要流程包括： 數據加…

閱讀更多...

OCR 識別：車牌識別相機的 “火眼金睛”

OCR 識別：車牌識別相機的 “火眼金睛”

車牌識別相機在交通管理、停車場收費等場景中，需快速準確識別車牌信息。但實際環境中，車牌可能存在污漬、磨損、光照不均等情況，傳統識別方式易出現誤讀、漏讀。OCR 技術讓車牌識別相機如虎添翼。它能精準提取車牌上的字符，不管是…

閱讀更多...

Java面試基礎：面向對象(2)

Java面試基礎：面向對象(2)

1. 接口里可以定義哪些方法抽象方法：抽象方法是接口的核心部分，所有實現接口的類都必須實現這些方法。抽象方法默認是 public 和 abstract 修飾，這些修飾符可以省略。public interface Animal {void Sound(); }默認方法：默認方法是…

閱讀更多...

有哪些更加簡潔的for循環?循環語句?

有哪些更加簡潔的for循環?循環語句?

目錄簡潔的for循環循環過程修改循環變量循環語句不同編程語言支持的循環語句 foreach 無限循環 for循環歷史 break和continue 循環判斷結束值循環標簽循環語句優化循環表達式返回值簡潔的for循環如果需要快速枚舉一個集合的元素，盡管C語言可以…

閱讀更多...

RK3568/3588 Android 12 源碼默認使用藍牙mic錄音

RK3568/3588 Android 12 源碼默認使用藍牙mic錄音

遇到客戶一個需求，如果連接了帶mic的藍牙耳機，默認所有的錄音要走藍牙mic通道。這個功能搞了好久，終于搞定了。1. 向RK尋求幫助，先打通 bt sco能力。此時，還無法默認就切換到藍牙 mic通道，接下來我們需求默…

閱讀更多...

解鎖HTTP：從理論到實戰的奇妙之旅

解鎖HTTP：從理論到實戰的奇妙之旅

目錄一、HTTP 協議基礎入門1.1 HTTP 協議是什么1.2 HTTP 協議的特點1.3 HTTP 請求與響應的結構二、HTTP 應用場景大揭秘2.1 網頁瀏覽2.2 API 調用2.3 文件傳輸2.4 內容分發網絡（CDN）2.5 流媒體服務三、HTTP 應用實例深度剖析3.1 使用 JavaScript 的 fetc…

閱讀更多...

uvm_config_db examples

uvm_config_db examples

通過uvm_config_db類訪問的UVM配置數據庫，是在多個測試平臺組件之間傳遞不同對象的絕佳方式。 methods 有兩個主要函數用于從數據庫中放入和檢索項目，分別是 set() 和 get()。 static function void set ( uvm_component cntxt,string inst_name,string …

閱讀更多...

最新文章