機器學習——人工神經網絡之多層神經網絡（多層與三層）

news/2025/9/18 4:46:36/文章來源:https://blog.csdn.net/qq_45769063/article/details/106597971

目錄

一、多層神經網絡

1、多層神經網絡數學模型

2、數學模型中的非線性函數fai

1）非線性函數fai存在的意義

2）非線性函數fai具體是什么？

3、多層神經網絡與單層神經網絡的區別與改進

1）單層神經網絡數學模型

2）多層神經網絡模型

3）區別

二、三層神經網絡

1、定理

2、一些概念（決策面、神經元、神經網絡層數）

1）決策面

2）神經元

3）神經網絡層數n

3、常見的三層神經網絡模型（含w,b的參數設置）

1）一個三角形決策面的神經網絡模型（兩層神經網絡）

2）一個四邊形決策面的神經網絡模型（兩層神經網絡）

3）一個曲線圍成決策面的神經網絡模型（兩層神經網絡）

小結1：一個決策面時最后一層常用w,b參數的設置

4)兩個決策面的神經網絡模型（三層神經網絡）

5)兩個以上決策面的神經網絡模型（三層神經網絡）

小結2：多個決策面時最后一層w,b常用參數和第二層w,b常用參數的設置

疑問：

一、多層神經網絡

1、多層神經網絡數學模型

并行化的系統

2、數學模型中的非線性函數fai

1）非線性函數fai存在的意義

如下圖可知如果沒有非線性函數最后得出的y依據是線性的，這就又回到了最初的單層神經網絡，沒有新的突破，而fai函數則圖突破了這個局限性

2）非線性函數fai具體是什么？

fai函數就是階躍函數

?

3、多層神經網絡與單層神經網絡的區別與改進

1）單層神經網絡數學模型

具體見：《機器學習——人工神經網絡之發展歷史（神經元數學模型、感知器算法）》

?

2）多層神經網絡模型

?

3）區別

多層神經網絡顧名思義具有多層的神經網絡，經過多層的變化后將輸入的xi變化后進行y的輸出

該多層神經網絡數學模型和階躍函數（fai函數）的結合可以解決所有的非線性問題，這也是多層神經網絡最大的優勢所在

?

二、三層神經網絡

1、定理

三層神經網絡可以模擬所有的決策面

2、一些概念（決策面、神經元、神經網絡層數）

1）決策面

決策面就是每一類樣本所分布的一塊區域，由多條線所圍成的一個區域（若由曲線圍成，可以將曲線看成由無數條非常短的線組成的曲線）

三條線圍成一個決策面（C1類的區域）

四條線圍成一個決策面（C1類的區域）

曲線圍成一個決策面（C1類的區域）——將曲線看成由無數直線構成

直線圍成多個分開的決策面（C1類的區域）

?

2）神經元

神經元在數學模型中的位置如下圖所示，神經元的個數其實就是圍成決策面的直線條數，圍成決策面的條數有多少，那么神經元就有多少個，若是曲線，則有無數個神經元

3）神經網絡層數n

神經網絡層數一般由決策面的個數決定，若決策面只有一個，神經網絡數學模型采用兩層神經網絡就可以實現，但是如果決策面有多個（如上面的C1類的區域分開成了兩個決策面）則神經網絡數學模型采用三層神經網絡就可以實現

決策面個數m，則神經網絡層數n：

所以三層神經網絡可以模擬所有的決策面

?

3、常見的三層神經網絡模型（含w,b的參數設置）

1）一個三角形決策面的神經網絡模型（兩層神經網絡）

?

2）一個四邊形決策面的神經網絡模型（兩層神經網絡）

?

3）一個曲線圍成決策面的神經網絡模型（兩層神經網絡）

將曲線用無數個非常短的線去替代曲線，只是神經元為無限個

?

小結1：一個決策面時最后一層常用w,b參數的設置

答：設決策面為1個，圍成決策面的直線條數為n，則取：所有w = 1 ; b = - n + 0.5

只有一個決策面的數學模型最后一層神經網絡是與邏輯關系，即所有輸入為1，歸類為C1，反之歸類為C2

?

4)兩個決策面的神經網絡模型（三層神經網絡）

一個決策面的神經元在第二層的輸出為一個，有多少個決策面第二層就會有多少個輸出（與關系）

5)兩個以上決策面的神經網絡模型（三層神經網絡）

兩個以上的決策面的神經網絡模型和兩個決策面是類似的，只是第一層的神經元數目多了，第二層的與關系多了而已

?

小結2：多個決策面時最后一層w,b常用參數和第二層w,b常用參數的設置

答：多個決策面時，最后一層的w,b參數固定為：w = 1 , b = -0.5

第二層每個與關系處即每一個決策面的第二層的w,b參數設置參考上面的小結1

疑問：

那么該怎么取利用這個神經網絡模型去解決實際的問題呢？至今為止神經網絡的理論還不夠完善，大部分還是通過實驗的方式來獲得神經網絡模型中的參數（主要是第一層中的w,b參數），也因為這樣，神經網絡成為了一個實驗性的學科，但是也有常用的神經網絡模型訓練方法（訓練就是通過訓練樣本求解參數的一個過程，，進而獲得完整的模型，利用模型可以對測試樣本進行分類），可以參見文章：《機器學習——人工神經網絡之后向傳播算法（BP算法）》

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/256409.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/256409.shtml
英文地址，請注明出處：http://en.pswp.cn/news/256409.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

noip2012-day2-t2

noip2012-day2-t2

【問題描述】在大學期間，經常需要租借教室。大到院系舉辦活動，小到學習小組自習討論，都需要向學校申請借教室。教室的大小功能不同，借教室人的身份不同，借教室的手續也不一樣。面對海量租借教室的信息，我…

閱讀更多...

機器學習——人工神經網絡之后向傳播算法（BP算法）

機器學習——人工神經網絡之后向傳播算法（BP算法）

目錄一、后向傳播算法的本質——梯度下降法求局部極值 1、w迭代公式的合理性

閱讀更多...

獲取視圖的寬高

獲取視圖的寬高

1 view.measure(RelativeLayout.LayoutParams.WRAP_CONTENT, RelativeLayout.LayoutParams.WRAP_CONTENT); 2 int width view.getMeasuredWidth(); 3 int height view.getMeasuredHeight(); 轉載于:https://www.cnblogs.com/cmgrass/p/4978222.html

閱讀更多...

排序算法02--冒泡排序

排序算法02--冒泡排序

思路：冒泡排序就是把大的數一個個沉到下面，當然也可以是把小的數一個個浮到上面。在最外層需要比較n-1次，因為n-1個大的數被沉到了下面，剩下一個自然就是最小的數了。在這n-1次的里層，還需要亮亮相互比較&#xff0…

閱讀更多...

機器學習——人工神經網絡之參數設置（BP算法）

機器學習——人工神經網絡之參數設置（BP算法）

目錄一、復習（BP算法）二、訓練模型的建議三、參數設置內容 1、隨機梯度下降（SGD）

閱讀更多...

關于▲的各種交點

關于▲的各種交點

對于△ABC證明： ①三角形的三條中線交于一點： 等腰三角形：作中線BD、CE與AC、AB交于D、E，相交于O，連接AO并延長交BC于F； 證△ABD全等于△ACE，再證△EBO全等于△D…

閱讀更多...

javaScript獲取url中的參數

javaScript獲取url中的參數

var urlTools {//獲取RUL參數值getUrlParam: function(name) { /*?videoIdidentification */var params decodeURI(window.location.search); /* 截取？號后面的部分 index.html?actdoctor,截取后的字符串就是?actdoctor */var reg …

閱讀更多...

機器學習——支持向量機SVMpython實現

機器學習——支持向量機SVMpython實現

一、SVM理論可見以下文章： 《機器學習——支持向量機SVM之線性模型》《機器學習——支持向量機SVM之非線性模型低維到高維映射》《機器學習——支持向量機SVM之非線性模型原問題與對偶問題》《機器學習——支持向量機SVM之非線性模型原問題轉化為對偶問題》…

閱讀更多...

瑣碎易錯點

瑣碎易錯點

1.font-size 設置的是字體的高 2.瀏覽器內核： 主流瀏覽器　　內核 IE 　　　　　　trident Firfox 　　　　Gecko Chorme 　　　Webkit（原來）/blink（現在） Safari 　　　　Webkit（蘋果公司獨立研發的&a…

閱讀更多...

Python安裝Jupyter Notebook配置使用教程

Python安裝Jupyter Notebook配置使用教程

原文見：https://blog.csdn.net/qq_27825451/article/details/84427269 一、什么是jupyter 1、簡介： jupyter notebook是一種 Web 應用，能讓用戶將說明文本、數學方程、代碼和可視化內容全部組合到一個易于共享的文檔中。它可以直接在代碼旁…

閱讀更多...

ExtJS4.2學習(10)分組表格控件--GroupingGrid（轉）

ExtJS4.2學習(10)分組表格控件--GroupingGrid（轉）

鳴謝網址：http://www.shuyangyang.com.cn/jishuliangongfang/qianduanjishu/2013-11-17/179.html --------------------------------------------------------------------------------------------- 分組表格控件在我們的開發中經常被用到，GroupingGrid…

閱讀更多...

九個Console命令，讓js調試更簡單

九個Console命令，讓js調試更簡單

一、顯示信息的命令 1: <!DOCTYPE html>2: <html>3: <head>4: <title>常用console命令</title>5: <meta http-equiv"Content-Type" content"text/html; charsetutf-8" />6: </head>7: <body>8: …

閱讀更多...

numpy——axis

numpy——axis

size()和max()中的含義以前我理解axis0代表行，axis1代表列； 但是這種含義在函數size()和max()中恰恰相反； 其實不是這樣的，我們回到單詞axis本身，它的意思是“軸”，沒錯軸就是代表一個方向，像…

閱讀更多...

Android ListView幾個重要屬性

Android ListView幾個重要屬性

1、transciptMode屬性，需要用ListView或者其它顯示大量Items的控件實時跟蹤或者查看信息，并且希望最新的條目可以自動滾動到可視范圍內。通過設置的控件transcriptMode屬性可以將Android平臺的控件（支持ScrollBar）自動滑動到最底部…

閱讀更多...

Halcon例程（基于GMM模型的分類）詳解 —— classify_citrus_fruits.hdev

Halcon例程（基于GMM模型的分類）詳解 —— classify_citrus_fruits.hdev

一、例程簡介該例程比較有代表性，屬于Halcon里的分類方法之一，直接調用Halcon封裝好的GMM分類器（高斯混合模型）對橘子和檸檬進行分類。GMM屬于概率分類方法，屬于P(Y|X)，通過對樣本的概率密度分布進行估計…

閱讀更多...

正則表達式匹配不包含特定字符串解決匹配溢出問題

正則表達式匹配不包含特定字符串解決匹配溢出問題

匹配溢出問題在正則表達式當中算是比較常見的問題，它常常導致我們匹配結果莫名其妙的出錯，本文專門為你講解如何通過匹配不包含特定字符串的方法來解決這類問題。那么，什么是匹配溢出呢？ 下面我們來看個例子： 源文本&…

閱讀更多...

numpy——mgrid

numpy——mgrid

x1,x2 np.mgrid(x1min:x1max:num1j,x2min:x2max:num2j)x1返回的是x1min到x1max間均勻分成num1個數，進行橫向擴展為方陣 x2返回的是x2min到x2max間均勻分成num2個數，進行縱向擴展為方陣 Examples -------- >>> np.mgrid[0:5,0:5] array([[[0,…

閱讀更多...

Halcon例程（基于3D形狀匹配識別方法）詳解 —— create_shape_model_3d_lowest_model_level.hdev

Halcon例程（基于3D形狀匹配識別方法）詳解 —— create_shape_model_3d_lowest_model_level.hdev

一、例程簡介最近在研究3D識別方面的東西，查了不少資料，發現halcon里有不少關于三維物體識別的例程，這里對其中一個做出詳解。該例程是基于三維匹配方法的，因為有三維模型SM3，所以不需要自己創建；另因為例…

閱讀更多...

15.瀑布流、測量

15.瀑布流、測量

排行界面TopProtocol ：json數據就是寫字符串，所以不需要寫bean對象public class TopProtocol extends BaseProtocol<List<String>> { Override public List<String> paserJson(String json) { List<String> datasnew ArrayList&…

閱讀更多...

linear-gradient線性漸變

linear-gradient線性漸變

background:linear-gradient(180deg, sliver 20%, skyblue 80%, gray 100%);180deg 是線性漸變的角度,水平方向;如果是90deg,則是垂直方向. silver 20% 是最上面的顏色和該顏色所在的位置,可以為負值,,如 linear-gradient(180deg, silver -7%, pink 80%, skyblue 127%);的效果是…

閱讀更多...

最新文章