再次深入學習深度學習|花書筆記1

我已經兩年沒有碰過深度學習了,寫此文記錄學習過程,加深理解。

深度學習

  • 再次深入學習深度學習|花書筆記1
    • 信息論
    • 第四節 數值計算中的問題
      • 上溢出 和 下溢出
      • 病態條件
      • 優化法

再次深入學習深度學習|花書筆記1

這本書說的太繁瑣了,如果是想要基于這本書入門深度學習,大可不必。但是可以用來回爐再造,加深理解。

信息論

研究一個信號中信息包含多少的量化,在實際工作中,可以用到信息熵這種東西,約束生成的東西是精簡的,合理的。

  • 一個基本想法:發生的概率P(x)越低,說明信息量越大。發生概率是1,那么包含的信息量就是0了。
  • 信息量的單位是奈特(nats).就是一個傳遞了1/e的發生概率的事件的信息。
  • 當對數的底數是2,信息的單位就是bit比特。
I(x)=-log(P(x))  
1 nats= -log(1/e)
1 bit= -log(1/2)
  • 交叉熵,p,q是真實分布和非真實分布
    在這里插入圖片描述
  • 歸一化 保證所有元素的和為1.用在預處理階段,不知道這種說法對不對,就是輸入數據符合標準正態分布,也就是收到0-1之間再做正態分布。這可以應用在圖像,聲音,文本,具體的似乎是在數據集內進行操作。

第四節 數值計算中的問題

上溢出 和 下溢出

主要來自于計算機數字表示中的位數限制,接近0時候導致數值被舍為0;過大時導致近似為∞。
使用softmax激活函數。

    def softmax(x):e_x = np.exp(x - np.max(x))return e_x / np.sum(e_x)

在這里插入圖片描述
在這里插入圖片描述

病態條件

當我們說一個數學名詞是病態時,這個詞意味著改動很小時擾動很大。包括病態方程組。
這可能對數據的精度有一定要求。
即使我們計算正確, 病態條件的矩陣也會放大預先存在的誤差。
三點

  • 梯度消失
  • 梯度爆炸
  • 梯度過緩

優化法

目的:最大化或最小化Loss函數/損失函數/代價函數/誤差函數
方法:梯度下降法

f(x+t)近似f(x)+t*f'(x)
當t足夠小?似乎是有這個條件的

最終到達如圖所示的某個極值點,當然很可能是局部最優解。
在這里插入圖片描述

基本的兩個點是

  • 如果有多個參數就求偏導
  • 每次優化的步長隨著訓練時間的延長而縮小
    這是在連續函數中的梯度優化算法,在離散函數中有叫爬山算法的東西,沒有了解過。

由于梯度下降法的步長t并非數學定義下的無窮小量,梯度下降方向實際上并非一個嚴格的最優方向。
可以采用二階導數 Hessian 矩陣/牛頓法優化梯度下降算法。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/97826.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/97826.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/97826.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

DeerFlow實踐:華為LTC流程的評審智能體設計

目錄 一、機制設計核心邏輯 二、4 個評審點智能體機制詳解 (一)立項決策(ATI)智能體機制 1. 知識調用與匹配 2. 評審校驗流程 3. 異常處理 (二)投標決策(ATB)智能體機制 1. …

C++與Lua交互:從原理到實踐指南

核心原理:Lua虛擬棧機制 C與Lua能夠高效交互的核心在于Lua虛擬棧的設計,這是一個精巧的中立通信區,解決了兩種語言間的本質差異:特性對比CLua語言類型靜態編譯型動態解釋型數據管理明確內存布局虛擬機統一管理類型系統編譯時確定運…

CSS 編碼規范

CSS 編碼規范1 CSS1.1 編碼規范1.1.1 【強制】所有聲明必須以分號結尾1.1.2 【推薦】使用 2 個空格縮進1.1.3 【推薦】選擇器與 { 之間保留一個空格1.1.4 【推薦】屬性值規范1.1.5 【推薦】組合器規范1.1.6 【推薦】逗號分隔規范1.1.7 【推薦】注釋規范1.1.8 【推薦】右大括號規…

ORA-12514:TNS:監聽程序當前無法識別連接描述符中請求的服務

已經不止一次自己本機電腦安裝的Oracle使用plsqldev軟件登入提示這個了.一般前一天還好好的,今天就不行了.好好總結一下吧,也共大家一起借鑒.主要原因還是數據的歸檔日志因為內部內存已經耗盡,不能在進行歸檔導致數據庫啟動異常,沒…

Spring框架的JDBC模板技術和事務管理

SpringJDBCJDBC模板技術概述JDBC的模板類的使用Spring框架的事務管理配置文件方式半注解的方式純注解的方式JDBC模板技術概述 什么是 JDBC 模板技術? JDBC 模板技術是 Spring 框架為簡化持久層(數據庫操作)編程而提供的一種封裝機制&#xf…

將文件部署到受管主機

目錄 1.ansible.builtin中用于創建、更新或刪除多行文本塊的模塊是什么 2.copy模塊的作用 3.fetch模塊的作用 4.file模塊的作用 5.lineinfile模塊的作用 6.stat模塊的作用 7.要確保受管主機上存在文件,類似touch命令功能,還能設置權限等的模塊及操作是怎…

Dell PowerEdge R620 服務器內存和硬盤罷工了

文章目錄前言調查原因查找解決方案硬盤問題內存問題總結前言 月黑風高夜,服務宕機時。做服務端技術的,誰還沒半夜遇到個服務掛掉的情況,而像我這種半兼職網管的工作,遇到機器問題的概率也就更大了,本來周五晚上寫完總…

2025:SourceTree 啟用/禁用Mercurial 或 Git,像素級細節

最近使用Git管理工具的時候,發現還是SourceTree好用些,但是使用SourceTree帶來一個問題:就是每次在重新打開SourceTree的時候,都會重新下載Mercurial.zip文件,查了一下,一般情況下我們是不需要使用Mercuria…

安卓 Google Maps 的使用和開發步驟

文章目錄1. main2. Android 谷歌地圖3. 源碼Reference1. main 在國內選擇的SDK可以是高德、百度、騰訊、xxxx等,但在國外,你首選是谷歌,因此要進行Google地圖的開發你首先要解決下面三個問題 VPN Google賬號 信用卡American Express&#x…

Linux -- 應用層協議Http

1.HTTP背景知識 HTTP協議:HTTP(HyperText Transfer Protocol,超文本傳輸協議)的本質是運行在 TCP/IP 協議族之上的 “應用層協議”,核心作用是定義客戶端(如瀏覽器、APP)與服務器之間的 “數據…

R 語言本身并不直接支持 Python 中 f“{series_matrix}.txt“ 這樣的字符串字面量格式化(f-string)語法 glue函數

R 語言本身并不直接支持 Python 中 f"{series_matrix}.txt" 這樣的字符串字面量格式化(f-string)語法。 在 R 中,要實現字符串拼接或格式化,你需要使用其他方法。下表對比了 Python f-string 和 R 中常見對應方法的主要…

【AI智能體】亮數據MCP Server × Dify:AI智能體獲取實時影音數據就是這么簡單

文章目錄一、引言:AI 應用與實時影音數據的融合價值1、傳統采集方式的痛點2、MCP Server 的創新價值二、亮數據 MCP Server 概覽1、什么是 MCP Server?2、支持的影音平臺和API接口3、產品特色亮點三、業務場景示例設計1、選定場景:競品分析與…

從《Attention Is All You Need》深入理解Transformer

2017年的《Attention Is All You Need》論文提出的Transformer架構,不僅徹底改變了自然語言處理的格局,更為現代人工智能的發展奠定了堅實基礎。本文將帶你深入解析這一劃時代模型的核心思想、技術細節及其深遠影響。🔄 一、背景與動機&#…

【08】AI輔助編程完整的安卓二次商業實戰-修改消息聊天框背景色-觸發聊天讓程序異常終止bug牽涉更多聊天消息發送優化處理-優雅草卓伊凡

【08】AI輔助編程完整的安卓二次商業實戰-修改消息聊天框背景色-觸發聊天讓程序異常終止bug牽涉更多聊天消息發送優化處理-優雅草卓伊凡引言本次二開布局沒有變,但是下一次整體布局會有變,不過本次開發發現朋友圈跳轉功能的流程步驟也做了一定的變化。原…

心理調適與情緒管理實訓室:支撐康養旅游人才心理能力培養

在康養休閑旅游服務專業的教學體系中,心理調適與情緒管理實訓室作為關鍵教學場所,承擔著培養學生心理服務能力、情緒疏導技能和人際溝通素養的重要任務。隨著社會對康養旅游服務質量要求的提升,具備心理調適與情緒管理能力的專業人才日益受到…

Oracle sql tuning guide 翻譯 Part 6 --- 優化器控制

第五部分優化器控制你可以用提示信息和初始化參數來影響優化器的判斷和運作方式。Influencing the Optimizer Optimizer defaults are adequate for most operations, but not all.In some cases you may have information unknown to the optimizer, or need to tune the opti…

pthread_mutex_lock函數深度解析

摘要 pthread_mutex_lock是POSIX線程庫中用于實現線程同步的核心函數,它通過對互斥鎖的加鎖操作來確保多個線程對共享資源的安全訪問。本文從互斥鎖的歷史背景和發展脈絡入手,詳細解析了pthread_mutex_lock函數的設計理念、實現機制和使用場景。通過生產…

qt QBoxSet詳解

1、概述QBoxSet 類代表箱形圖中的一個條目。箱形條目是范圍和由五個不同值構成的三個中值的圖形表示。這五個值分別是:下極值、下四分位數、中位數、上四分位數和上極值。QBoxSet 提供了多種方法來設置和獲取這些值,并且可以與 QBoxPlotSeries 和 QChart…

機器學習勢函數(MLPF)入門:用DeePMD-kit加速億級原子模擬

點擊 “AladdinEdu,同學們用得起的【H卡】算力平臺”,注冊即送-H卡級別算力,80G大顯存,按量計費,靈活彈性,頂級配置,學生更享專屬優惠。 引言:從傳統分子模擬到機器學習勢函數的革命…

制作uniapp需要的storyboard全屏ios啟動圖

//鎖定豎屏 plus.screen.lockOrientation("portrait-primary") // #endif首先準備啟動圖兩個dc_launchscreen_portrait_background2x.png(750*1624)dc_launchscreen_portrait_background3x.png(1125*2436)LaunchScreen.storyboard文件內容如下<?xml version"…