deep learning(李宏毅)--（六）--loss

deep learning(李宏毅)--（六）--loss

diannao/2025/7/18 8:12:54/文章來源:https://blog.csdn.net/2301_80670411/article/details/149415166

一，關于分類問題及其損失函數的一些討論。

在構建分類模型是，我們的最后一層往往是softmax函數（起到歸一化的作用），如果是二分類問題也可以用sigmoid函數。
?

在loss函數的選擇上，一般采用交叉熵損失函數(cross-entropy)，為什么呢？因為交叉熵損失函數更容易使得optimisization到達低loss（如下圖:cross-entropy的梯度圖更為陡）

?

二，對于Adam和SGDM梯度優化算法的比較

Adam:訓練速度很快，但是收斂效果不佳

SGDM：訓練速度平穩，收斂性較好

SWATS算法：Adam和SGDM算法的結合：（訓練開始用Adam，在收斂時用SGDM）?

注意：使用Adam算法初始不穩定，需要進行預加熱（Warm up）?.

三，Radam算法與SWATS算法比較：
?

后面就有點聽不懂了，以后了解更多再來聽吧，做個記號。
(選修)To Learn More - Optimization for Deep Learning (2_2)_嗶哩嗶哩_bilibili?
筆記先做到這hh，有的笨，當先了解了。

?

?

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/91489.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/91489.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/91489.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Python綁定及其在Mujoco仿真器中的作用

Python綁定及其在Mujoco仿真器中的作用

好的，這是一個非常核心且重要的問題。我來分兩部分為你詳細解釋：首先是“什么是Python綁定”，然后是“它在MuJoCo中具體的作用”。第一部分：什么是Python綁定 (Python Binding)？ 簡單來說，Python綁定是一座…

閱讀更多...

數學建模從入門到國獎——備賽規劃優秀論文學習方法

數學建模從入門到國獎——備賽規劃優秀論文學習方法

數學建模從入門到國獎——備賽規劃數學建模國一：我的逆襲經驗分享在大二，我們團隊初次參加媽媽杯，遺憾未獲獎，后來經過5個月的時間，在大三上學期的9月，我們團隊以C題數據挖掘機器學習創新斬獲國賽一等獎&a…

閱讀更多...

大型語言模型的白日夢循環

大型語言模型的白日夢循環

每周跟蹤AI熱點新聞動向和震撼發展想要探索生成式人工智能的前沿進展嗎？訂閱我們的簡報，深入解析最新的技術突破、實際應用案例和未來的趨勢。與全球數同行一同，從行業內部的深度分析和實用指南中受益。不要錯過這個機會，成為AI領…

閱讀更多...

【Gaussian Haircut論文】在Deepseek和Chatgpt的幫助下慢速了解核心方法

【Gaussian Haircut論文】在Deepseek和Chatgpt的幫助下慢速了解核心方法

3.Method 一、 1.核心目標輸入：多張從不同角度拍攝的頭發照片。輸出：3D發型模型，且模型由發絲構成（即每根頭發被建模為獨立的曲線/線段，而非體積/網絡）。 2.數據預處理在正式重建前，需要從輸入…

閱讀更多...

眾趣SDK重磅升級：空間物聯IOT新視界，賦能實景三維場景深度應用

眾趣SDK重磅升級：空間物聯IOT新視界，賦能實景三維場景深度應用

近日，空間數字孿生云服務行業領導者—眾趣科技宣布旗下核心產品云服務平臺Qverse SDK迎來里程碑式升級！本次升級聚焦行業前沿需求，重磅推出IoT設備監控系統、iframe跨平臺頁面無縫集成、BI數據智能三大解決方案，旨在將三維空間計算…

閱讀更多...

021_自然語言處理應用

021_自然語言處理應用

自然語言處理應用目錄 NLP應用概述文本理解技術文本生成應用語言分析工具多語言處理專業領域應用實踐案例 NLP應用概述核心能力范圍文本理解語義理解：深度理解文本含義和上下文實體識別：識別人名、地名、機構名等命名實體關系提取：…

閱讀更多...

小程序中狀態管理Redux

小程序中狀態管理Redux

Redux 是一個集中式狀態管理框架，所有狀態存儲在一個全局 Store 中，并通過 Action 觸發 Reducer 進行數據更新。。1.安裝npm install redux miniprogram-computed2.創建// store.js import { createStore } from "redux";// 定義初始狀態 c…

閱讀更多...

UML用例規范，use case diagram

UML用例規范，use case diagram

OMG組織的規范：

閱讀更多...

c++：類型轉換函數

c++：類型轉換函數

簡介在C++中，類型轉換運算符（也稱為類型轉換函數或轉換函數）是一種特殊的成員函數，它允許將一個類類型的對象轉換為其他類型。轉換運算符的聲明形式如下： operator type() const; 關鍵點 ??聲明??：在類內部聲明，沒有返回類型（因為type已經表示了返回類型），沒…

閱讀更多...

Java 8 jdk1.8下載及安裝教程和環境變量配置

Java 8 jdk1.8下載及安裝教程和環境變量配置

1. 概述本文介紹如何在 Windows 10 系統下下載并安裝 Java 開發工具包（JDK 1.8），適合 Java 初學者或需要搭建開發環境的用戶。 2. 安裝包下載 2.1 安裝包獲取由于 Oracle 官網下載需注冊登錄，可選擇以下替代方式獲取 JDK 安裝…

閱讀更多...

git@github.com: Permission denied (publickey).

git@github.com: Permission denied (publickey).

摘要：記錄新電腦需要clone和push代碼到GitHub error： Cloning into FPGA_common… gitgithub.com: Permission denied (publickey). fatal: Could not read from remote repository. 遇到的這個錯誤信息： gitgithub.com: Permission denied…

閱讀更多...

【Linux基礎知識系列】第五十四篇 - 網絡協議基礎：TCP/IP

【Linux基礎知識系列】第五十四篇 - 網絡協議基礎：TCP/IP

在網絡通信中，TCP/IP 協議是實現設備之間數據傳輸的基礎。TCP/IP 協議棧定義了數據在網絡中傳輸的方式，從應用層到網絡層，再到物理層，每一層都有其特定的功能和協議。理解 TCP/IP 協議的基本概念和工作原理，對于網絡管…

閱讀更多...

《python語言程序設計》2018版第8章8題編寫函數實現二進制轉十進制（字符串變整數）！！整數沒法進行下標

《python語言程序設計》2018版第8章8題編寫函數實現二進制轉十進制（字符串變整數）！！整數沒法進行下標

二進制轉十進制前言第1章幻想的草稿第2章如何把這些幻想的數字帶到現實的算式中第3章看來是我想多了第4章空值不一定是最好的選擇第5章成功了前言將字符串變成整數，但是整數沒法像字符串一樣做下標反復嘗試最好的手段，是多多打印第1章幻想的草稿 …

閱讀更多...

LeetCode20

LeetCode20

一個新手小白開始算法的學習之路，以后會不定期分享個人做完一些題目的筆記，使用語言為JavaScript//聲明一個名為isValid的函數，接收一個參數s（要檢查的字符串） let isValid function(s) {//初始化棧//創建一個空數組s…

閱讀更多...

Spring Boot 自動配置：從 spring.factories 到 AutoConfiguration.imports 的演變

Spring Boot 自動配置：從 spring.factories 到 AutoConfiguration.imports 的演變

引言 Spring Boot 的自動配置機制是其【開箱即用】特性的核心支撐，通過減少顯式配置和簡化開發流程，顯著提升了開發效率。隨著 Spring Boot 版本的迭代，自動配置的實現機制也在不斷優化。本文將深入解析 spring.factories 和 AutoConfigurat…

閱讀更多...

Redis7 底層數據結構解析

Redis7 底層數據結構解析

Redis底層數據結構深度解析（基于Redis 7.2.5）本文深入剖析Redis核心數據類型的底層實現機制，涵蓋String、Hash、List、Set、Zset的實現原理及版本演進差異。一、Redis數據存儲核心機制 Redis所有數據以redisObject結構統一封裝： t…

閱讀更多...

《C++初階之STL》【auto關鍵字 + 范圍for循環 + 迭代器】

《C++初階之STL》【auto關鍵字 + 范圍for循環 + 迭代器】

【auto關鍵字范圍for循環迭代器】目錄前言：--------------- auto關鍵字 ---------------1. 什么是auto？2. 使用關鍵字auto時需要注意什么？3. 怎么使用auto關鍵字？--------------- 范圍for循環 ---------------1. 什么是范圍fo…

閱讀更多...

ionic 切換開關操作指南

ionic 切換開關操作指南

ionic 切換開關操作指南引言在移動應用開發中，切換開關（Toggle）是一種常見的用戶界面元素，它允許用戶通過簡單的操作來開啟或關閉某個功能或設置。在Ionic框架中，切換開關提供了豐富的API和樣式，使得開發…

閱讀更多...

【筆記記錄-Linux文件權限與目錄結構詳解】

【筆記記錄-Linux文件權限與目錄結構詳解】

🌈個人主頁: Aileen_0v0 🔥熱門專欄: 華為鴻蒙系統學習|計算機網絡|數據結構與算法 ?💫個人格言:“沒有羅馬,那就自己創造羅馬~” 文章目錄目錄結構解析Summarypart3part4part5目錄結構解析 drwxr-xr-x 2 student student 4096 10月 8 2023…

閱讀更多...

【Complete Search】-基礎完全搜索-Basic Complete Search

【Complete Search】-基礎完全搜索-Basic Complete Search

文章目錄Solution - Maximum Distance涉及遍歷整個解空間的問題資料-resources 6 - Complete Search 在很多問題中（尤其是在 USACO Bronze 級別），只需檢查解空間中的所有可能情況就足夠了，比如所有元素、所有元素對、所有子集&…

閱讀更多...

最新文章