深度學習基礎回顧

深度學習基礎

    • 淺層網絡 VS 深層網絡
    • 深度學習常用的激活函數
      • Sigmoid 函數
      • ReLU 函數
      • Softplus 函數
      • tanh函數
    • 歸納偏置
    • CNN
      • 適用數據
      • 歸納偏置
    • RNN
      • 適用數據
      • 歸納偏置

淺層網絡 VS 深層網絡

淺層神經網絡參數過多,導致模型的復雜度和計算量很高,難以訓練。而深層網絡利用多層的線性變換和共享權重的方式,使其可以用更少的參數來表示更復雜的函數,大大減少參數的數量和計算量。

同時,深層網絡可以通過層次化的方式,從低層到高層,逐漸提取數據中的抽象和語義信息,從而增強了模型的泛化能力和解釋能力。例如,CNN 通過使用多層的卷積核,來形成一個特征的層次結構,從邊緣、角點、紋理等低層特征,到物體、場景、語義等高層特征;RNN 通過使用循環結構,來形成一個內部的記憶機制,從而捕捉數據中的長期依賴關系和動態變化規律。

深度學習常用的激活函數

Sigmoid 函數

具體形式: f ( x ) = 1 1 + e ? x f(x) = \frac{1}{1+e^{-x}} f(x)=1+e?x1?

  • 輸出范圍(0, 1),可以用于表示概率或二分問題
  • 缺點:容易出現梯度消失等問題,影響模型的收斂速度和效果

ReLU 函數

具體形式: R e L U ( x ) = m a x ( 0 , x ) ReLU(x) = max(0, x) ReLU(x)=max(0,x)

  • 輸出范圍[0, +∞),可以用于解決梯度消失的問題,提高模型的訓練速度
  • 缺點:部分神經元的輸出可能永遠為零,導致模型的表達能力下降

Softplus 函數

具體形式: S o f t p l u s ( x ) = l o g ( 1 + e x ) Softplus(x) = log(1 + e^x) Softplus(x)=log(1+ex)

  • 輸出范圍(0, +∞),是 ReLU 函數的平滑版本,避免神經元輸出恒為零的問題
  • 缺點:涉及指數和對數運算,計算量比 ReLU 大。且存在輸出不以零為中心的問題。

tanh函數

具體形式: t a n h ( x ) = e x ? e ? x e x + e ? x tanh(x) = \frac{e^x-e^{-x}}{e^x+e^{-x}} tanh(x)=ex+e?xex?e?x?

  • 輸出范圍(-1, 1),可以用于解決輸出不以零為中心的問題。
  • 缺點:仍然存在梯度消失的問題,尤其是當輸入的絕對值較大時,梯度會接近于零。

歸納偏置

歸納偏置可以理解為,從現實生活中觀察到的現象中,歸納出一定的規則,然后對模型做一定的約束,從而起到模型選擇的作用。

CNN

適用數據

CNN 擅長捕捉圖像或文本中的顯著特征,適合處理具有空間結構局部相關性的數據。

歸納偏置

CNN 的歸納偏置:認為信息具有空間局部性,可用滑動卷積共享權重的方式降低參數空間

  1. 局部性:數據中的某些特征或模式,只與它們周圍的一部分數據相關,而與遠處的數據無關。例如 CNN 通過使用小尺寸的卷積核來實現局部性,即只用卷積核覆蓋輸入的一小部分,從而提取出局部的特征。【就好比你拿一個放大鏡,不斷掃描一張圖片,提出圖片的局部特征】
  2. 空間不變性:數據中的某些特征或模式,無論出現在哪個位置,都是相同或相似的。例如圖像中的貓臉,不論是出現再圖像的左上角還是右下角,都是一個貓的練。CNN 通過使用共享權重的卷積核,來實現空間不變性,即用同樣的卷積核來掃描整個輸入,從而提取出相同或相似的特征。
  3. 平移等效性:這個假設是指數據中的某些特征或模式,經過平移變換后,仍然保持不變。比如,圖像中的一個貓的臉,無論它向左或向右平移一定的距離,仍然是一個貓的臉。CNN 通過使用池化層,來實現平移等效性,即用池化層來降低輸入的分辨率,從而減少平移變換對特征的影響。

RNN

適用數據

RNN 能夠把握歷史信息,適合處理具有時序結構上下文依賴性的數據。

歸納偏置

RNN 的歸納偏置:將時序信息納入考慮,強調順序重要性

  1. 時序性:指數據中的某些特征或模式,是隨著時間的推移而發生變化的,而且變化的方式是有一定的規律的。比如,語音中的一個單詞,是由多個音素按照一定的順序組成的,而且每個音素的發音受到前后音素的影響。RNN通過使用循環結構,來實現時序性,即將上一時刻的輸出或隱藏狀態作為下一時刻的輸入,從而形成一個內部的記憶機制,使得它能夠捕捉數據中的長期依賴關系和動態變化規律。
  2. 時間不變性:指數據中的某些特征或模式,無論它們出現在哪個時間點,都是相同或相似的。比如,文本中的一個句子,無論它出現在文本的開頭還是結尾,都是一個句子。RNN通過使用共享權重,來實現時間不變性,即用同樣的參數來處理每一個時刻的輸入,從而提取出相同或相似的特征。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/208136.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/208136.shtml
英文地址,請注明出處:http://en.pswp.cn/news/208136.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Redisson的基礎使用(2)

布隆過濾器(Bloom Filter) 布隆過濾器一般用于解決緩存穿透的問題。主要原理是使用一組哈希函數,將元素映射成一組位數組中的索引位置。如果要檢查某個元素是否在集合中時,將此元素通過所有的哈希函數,查看哈希值對應的…

硬件開發筆記(十五):RK3568底板電路VGA顯示接口原理圖分析

若該文為原創文章,轉載請注明原文出處 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/134849296 紅胖子網絡科技博文大全:開發技術集合(包含Qt實用技術、樹莓派、三維、OpenCV、OpenGL、ffmpeg、OSG、單片機、軟硬…

多態和繼承復習

與其明天開始,不如現在行動! 文章目錄 多態多態成立的條件細節 繼承💎總結 多態 多態成立的條件 存在繼承關系或者實現關系子類重寫父類的方法父類引用指向子類對象 細節 通過父類的引用調用子類的對象 Animal animal new Dog();animal…

C語言搭建項目-學生管理系統(非鏈表)

、 目錄 搭建offer.h文件 搭建offer.c中的main函數 密碼登入系統 搭建my_oferr.c中的接口函數 使用幫助菜單接口函數 增加學生信息接口函數 查詢學生信息接口函數 刪除學生信息接口函數 保存學生信息接口 打開文件fopen 關閉文件fclose 判斷是否保存文件fwrite 退出執行文件…

C++:const類型數據的修改問題

在C語言中const類型的數據嚴格意義上可以修改: const int a1; int*b&a; *b2;不同于C語言,C中指針類型是要嚴格對應的,對const類型的數據必須使用const類型的指針進行接收,從而避免修改; 但問題是c中同樣支持指針的…

年度工作總結怎么寫?掌握這些年終總結萬能公式,讓你的報告出彩無比!

光陰似箭,日月如梭,時間總是不疾不徐地向前奔去,轉眼就來到了2023年的最后一個月,12月一到,上班族和打工人又要開始忙活工作總結的事情~ 工作總結,不僅是一年工作的回顧,更是未來規劃的起點。你…

Springboot中的RestTemplate

Springboot中的RestTemplate 在Spring Boot應用程序中,RestTemplate是一個用于進行HTTP請求的強大工具。通常用于與RESTful API進行交互、調用其他服務或執行HTTP請求。它提供了各種方法來發送HTTP請求(如GET、POST、PUT、DELETE等)&#xf…

cuda lib 線程安全的要義

1, 概述 cuda lib 線程安全的幾個多線程的情景: 單卡多線程; 多卡多線程-每卡單線程; 多卡多線程-每卡多線程; 需要考慮的問題: 每個 cublasHandle_t 只能有一個stream么? 每個cusolverHandle_t 只能有一…

python3.5安裝教程及環境配置,python3.7.2安裝與配置

大家好,小編來為大家解答以下問題,python3.5安裝教程及環境配置,python3.7.2安裝與配置,現在讓我們一起來看看吧! python 從爬蟲開始(一) Python 簡介 首先簡介一下Python和爬蟲的關系與概念&am…

Android Studio的代碼筆記--IntentService學習

IntentService學習 IntentService常規用法清單注冊服務服務內容開啟服務 IntentService 一個 HandlerThread工作線程,通過Handler實現把消息加入消息隊列中等待執行,通過傳遞的intent在onHandleIntent中處理任務。(多次調用會按順序執行事件…

Spring Cloud Alibaba實踐 --Sentinel

sentinel簡介 Sentinel的官方標題是:分布式系統的流量防衛兵。從名字上來看,很容易就能猜到它是用來作服務穩定性保障的。對于服務穩定性保障組件,如果熟悉Spring Cloud的用戶,第一反應應該就是Hystrix。但是比較可惜的是Netflix…

三防平板|手持終端PDA|8寸/10寸工業三防平板電腦主板方案定制

近年來,隨著科技的快速發展,三防平板成為了各行各業中不可或缺的工具。三防平板采用IP67級別的防護設計,通過了多項測試標準,如國標和美標,具備防水、防摔、防塵、防撞、防震、防跌落以及防鹽霧等多重防護功能。因此&a…

JavaScript 簡單理解原型和創建實例時 new 操作符的執行操作

function Person(){// 構造函數// 當函數創建,prototype 屬性指向一個原型對象時,在默認情況下,// 這個原型對象將會獲得一個 constructor 屬性,這個屬性是一個指針,指向 prototype 所在的函數對象。 } // 為原型對象添…

HarmonyOS應用開發工具DevEco Studio安裝與使用

語雀知識庫地址:語雀HarmonyOS知識庫 飛書知識庫地址:飛書HarmonyOS知識庫 知識庫內容逐步完善中… 工欲善其事必先利其器,要編寫HarmonyOS應用就需要用到官方提供的IDE工具來編寫相應的代碼。 在鴻蒙開發者官網,其提供了官方的開…

基于Java醫院掛號管理系統

基于Java醫院掛號管理系統 功能需求 1、患者信息管理:系統需要提供患者的基本信息錄入功能,包括姓名、性別、年齡、聯系方式等。此外,系統還應支持對患者信息進行修改、查詢和刪除的操作。 2、掛號管理:系統需要提供掛號功能&a…

高效的多維空間點索引算法——GeoHash

一、Geohash 算法簡介 GeoHash是空間索引的一種方式,其基本原理是將地球理解為一個二維平面,通過把二維的空間經緯度數據編碼為一個字符串,可以把平面遞歸分解成更小的子塊,每個子塊在一定經緯度范圍內擁有相同的編碼。以GeoHash方…

springboot 極簡案例

安裝idea File -> New Project 選擇依賴 創建controller文件 輸入controller類名 輸入代碼 運行項目 訪問 localhost:8080/hello/boot package com.example.demo;import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.web.…

數據庫對象介紹與實踐:視圖、函數、存儲過程、觸發器和物化視圖

文章目錄 一、視圖(View)1、概念2、基本操作1)創建視圖2)修改視圖3)刪除視圖4)使用視圖 3、使用場景4、實踐 二、函數(Function)1、概念2、基本操作1)創建函數2&#xff…

粵能環保亮相迪拜COP28,智能技術鑄就運河城市可持續未來

在全球應對氣候變化的重要會議——迪拜COP28大會上,運河城市面臨的獨特環境挑戰引起了廣泛關注。隨著城市化進程的加快,運河城市在處理固體廢物、減少溫室氣體排放以及維持水資源安全方面面臨著嚴峻考驗。智能垃圾分類作為應對這些挑戰的有效途徑&#x…

一些系統日常運維命令和語句

一、前言 記錄一些日常系統運維的命令和語句 二、linux命令與語句 1、linux查看各目錄使用磁盤情況 du -h /home home為目錄 du -h /home 2.查看內存使用情況 free -h 3、查看進程和CPU使用情況 top top 三、數據庫語句 1、統計mysql數據庫表數量 SELECT COUNT(*) A…