機器學習的一些基本概念

看了b站一個清華博士的視頻做的筆記,對于人工智能的底層原理,訓練方式,以及生成式文本輸出,圖片生成的底層原理有了一個了解,算是一個還不錯的科普文。之前一直想要了解一下機器學習的入門原理,神經網絡相關的,但是這個詞一聽好像于自己而言難度有點大了,但是b站的各種通俗易懂的科普視頻總會給我不一樣的輸入。

1. 人工智能發展的各階段

人工智能發展的幾個階段:

1)符號主義:

1960-1970年代:早期專家系統 ,在這個時期,AI研究主要集中在符號主義,以邏輯推理為中心。此時的AI主要是基于規則的系統,比如早期的專家系統。

2)聯結主義:

又稱為神經網絡或基于學習的AI .

例如這個黑箱要識別一個蘋果,它會根據不同的描述特征來對蘋果進行識別,分別乘以一個正相關和負相關的系數,最后得出一個值:

計算系數:感知機,類似神經元

識別結果:

2. 智能的本質

智能的本質就是針對不同的情景給出針對性的輸出反應

用數學公式簡單可以表達為: (Funcitons describe the world !)

3. 神經網絡

神經網絡這個詞聽起來就比較復雜,《深度學習革命》一書中針對這個詞的來源進行了非常詳細的來源記錄,它正式被提出是在1958年,心理學家Frank Rosenblatt提出感知機(Perceptron),這是第一個可訓練的神經網絡模型,用于模式識別。Rosenblatt在論文中明確使用了“神經網絡”(neural network)一詞,強調其與生物神經系統的相似性。

經常聽到像卷積神經網CNN,循環神經網絡RAN,生成對抗網絡GAN,圖神經網絡GNN這些術語,其實這些都是深度學習的算法模型,屬于深度學習的使用工具。在實際的場景中經常會多個結合一起使用。

那么深度學習=神經網絡? 實際上深度學習是使用多層神經網絡的方法,但神經網絡本身只是其中一種技術。

人工智能(AI) #讓機器模仿人類智能的大概念(比如會下棋、識圖的機器都算AI)。 
│
└── 機器學習(ML) #AI的一個分支,通過數據自動學習規律(比如用大量貓狗圖片訓練模型區分貓狗)。 │└── 深度學習(DL) #機器學習的一個分支,用多層神經網絡模擬人腦學習(比如用CNN識別圖片中的貓)。│├── CNN:處理圖像(掃描局部特征)├── RNN:處理序列(帶記憶分析)└── GAN:生成數據(真假對抗)

不同算法模型的對比:

模型

中文全稱

核心能力

典型應用場景

優點

缺點

CNN

卷積神經網絡

圖像特征提取

人臉識別、醫學影像

局部感知、參數共享

不擅長序列數據

RNN/LSTM

循環神經網絡/長短期記憶網絡

序列建模

語音識別、文本生成

記憶上下文信息

計算效率低、長序列處理弱

GAN

生成對抗網絡

數據生成

AI繪畫、圖像修復

生成質量高

訓練不穩定

Transformer

Transformer(無通用中文譯名)

全局依賴建模

機器翻譯、文本生成

并行計算、長距離依賴強

資源消耗大

ResNet

殘差網絡

極深網絡訓練

圖像分類、目標檢測

解決梯度消失

結構復雜

自編碼器

自編碼器

數據壓縮與重建

圖像去噪、異常檢測

無監督學習

生成能力有限

GNN

圖神經網絡

圖結構分析

社交網絡、藥物研發

建模復雜關系

計算復雜度高

CapsNet

膠囊網絡

空間層次理解

姿態估計

對空間變換魯棒

應用不廣泛

看到b站有個對神經網絡的比喻,感覺還蠻貼合的的,神經網絡有點類似機場的構造,不過機場流動是單向的,不過神經網絡有反向傳播。下面這個是操作動線類比,

機場動線:值機柜臺 → 安檢門 → 免稅店 → 登機口 → 起飛
神經網絡:輸入層 → 隱藏層1(激活)→ 隱藏層2(激活)→ 輸出層 → 預測結果

神經元就是機場的各個服務節點,例如安檢口,行李托放點,免稅店等,

激活函數就等于各個通道的開關邏輯,例如安檢口檢查到違規金屬就攔截,否則放行; vip 通道可以讓vip 客戶直接放行,經濟艙客戶需要派對等候放行;

損失函數就是類似客戶滿意度調查,也就是實際登機時間和預期登機時間的差距;

梯度下降就是類似于流程優化,例如排隊時間過長需要增開通道或者人員配比。

舉個場景例子:

場景:訓練一個判斷「旅客是否攜帶違禁品」的神經網絡

  1. 輸入層:旅客的行李X光圖像(像素數據)
  2. 隱藏層1:安檢口初步識別金屬物品(邊緣檢測)
  3. 激活函數:ReLU決定是否觸發開箱檢查
  4. 隱藏層2:分析物品形狀是否匹配危險品數據庫
  5. 輸出層:Sigmoid輸出危險概率(0-1之間)
  6. 損失函數:對比預測結果與人工檢查結果
  7. 梯度下降:優化X光機靈敏度(權重)和開箱閾值(偏置)

通過數萬次「模擬旅客安檢」,最終讓系統自動學會精準識別危險品。

4. 感知機

最近看了人工智能的發展史才get 到感知機這個概念,這其實可以類比人的大腦神經結構:

簡單的說,一個神經元把它從其他神經元接收到的所有輸入信號加起來,如果達到某個特定的閾值水平,它就會被激活。

那么感知機是什么?

感知機就是一個根據加權輸入的總和是否滿足閾值來做出是或否(輸出1或0)的決策的簡單程序
?

5. 擬合函數

擬合函數又叫預測函數,智能的本質是一個黑箱,這個黑箱能夠從輸入和輸出的聯系中找到一個對應關系,在數據驅動的智能領域中,所謂的智能,本質上就是給你一堆點,然后用一個函數擬合它們之間的關系。

6. 損失函數

損失函數又叫代價函數。損失函數的值其實就是真實值與預測函數之間的差值大小,也就是針對每個x的輸出y值 和預測函數y值的絕對值差距大小。 損失函數值越小,輸出越精確

7. 激活函數

激活函數用于神經網絡中,用來決定神經元是否應該被激活,也就是是否將信號傳給下一代。它主要是用來在神經網絡中增加非線性,可以用來處理更復雜的情況

各種激活函數,最常用的是ReLU 。這個函數的形狀還有人將它比喻為排隊時候的隔離柱,直線折線曲線,隨意調整角度位置,

8. 梯度下降算法

梯度下降算法是眾多人工智能算法的基礎和鼻祖。 如何獎勵懲罰一個神經網絡,也就是如何通過數據來訓練網絡找到最好的參數:梯度下降 算法 ,梯度下降其實就是一種優化方法,用來調整模型的參數,使得損失函數值最小化。

類比就是如果你要快速下山,那么每次你需要找到往下最陡峭的點然后一步一步調整下去,步長其實就是學習率。

梯度算法的認知圖譜:

一個可視化的神經網絡平臺

谷歌推出的一個神經網絡可視化教學平臺,通過設置不同類型數據集,輸入特征選擇,神經網絡結構的隱藏層和激活函數,設置不同是訓練參數集如學習率等來觀察模型訓練中的動態變化。

A Neural Network Playground

9. Transformer

Transformer 也是一種深度學習模型,它的核心思想是“Attention is all you need ”, Transformer 完全基于注意力機制,區別與RNN 和CNN 。 它由兩部分組成,編碼器(Encoder) 和解碼器(Decoder) . 每個部分都是由多個相同的層堆疊而成,每層包含了多頭注意力機制(Multi-head Attention) 和位置全連接前饋網絡。

那么什么是注意力機制?每個詞都能關注句子中的其他詞,從而理解句子的含義

數學不好,Transformer 里面涉及復雜的數學知識有點令人費解,它的主要流程是:

輸入處理階段需要分詞、嵌入、位置編碼。編碼器部分需要自注意力和前饋網絡,解碼器部分需要掩碼注意力和交叉注意力。輸出生成需要線性層和softmax。

讓deepseesk 通俗講解一下:


b站視頻推薦:

王木頭學科學的個人空間-王木頭學科學個人主頁-嗶哩嗶哩視頻

90分鐘!清華博士帶你一口氣搞懂人工智能和神經網絡_嗶哩嗶哩_bilibili

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/81084.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/81084.shtml
英文地址,請注明出處:http://en.pswp.cn/web/81084.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python爬蟲實戰:研究Grab 框架相關技術

1. 引言 1.1 研究背景與意義 隨著互聯網的快速發展,網絡上的數據量呈爆炸式增長。如何高效地獲取和利用這些數據成為了當前的研究熱點。網絡爬蟲作為一種自動獲取網頁內容的技術,能夠按照一定的規則,自動地抓取萬維網信息,在搜索引擎、數據挖掘、信息整合等領域有著廣泛的…

uniapp 嵌入鴻蒙原生組件 具體步驟

關于怎么使用uniapp 嵌入鴻蒙原生組件 HBuilder X 版本 4.64 app-harmony文件下新建 index.uts button.ets button.ets里面復制uniapp 官方提供的 示例代碼 https://uniapp.dcloud.net.cn/tutorial/harmony/native-component.html button.ets import { NativeEmbedBuilderO…

阿里云 OS Copilot 使用指南

安裝: AlibabaCloudLinux: sudo yum install -y os-copilotUbuntu: curl -#S https://mirrors.aliyun.com/os-copilot/os-copilot-all-in-one-latest.sh | bash添加RAM用戶 打開 https://ram.console.aliyun.com/users 復制AccessKey,Ac…

枚舉類擴充處理

問題背景 由于 Java 不允許枚舉繼承另一個枚舉(enum cannot extend enum),但可以通過 組合方式 或 工具類 來實現類似功能。 ? 解決方案一:組合方式引入原始枚舉值 示例代碼: public enum CustomErrorCodeEnum imp…

Spring Security探索與應用

Spring Security核心概念 框架定位與核心能力 Spring Security是Spring生態中實現應用級安全的核心框架,其官方定義為"強大且高度可定制的認證與訪問控制框架"。作為Spring應用程序安全防護的事實標準解決方案,它通過模塊化設計提供以下核心能力: 認證(Authenti…

藍橋杯國14 不完整的算式

!!!!!!!!!!!!!!!理清思路 然后一步步寫 問題描述 小藍在黑板上寫了一個形如 AopBC 的算式&#x…

掃描電鏡:打開微觀世界的“超維相機“

當你用手機拍攝一朵花的微距照片時,放大100倍已足夠驚艷。但如果告訴你,科學家手中的"相機"能將物體放大百萬倍,連病毒表面的蛋白突觸都清晰可見,你是否會好奇這背后的黑科技?這把打開微觀宇宙的鑰匙&#x…

JVM學習(四)--對象內存布局

目錄 一、對象內存布局 1、對象的實例化 1.1、你有幾種方式創建對象? 1.2、創建對象的步驟 1.2.1、從字節碼角度看待對象創建過程 1.2.2、從執行步驟角度分析 2、對象的內存布局 2.1、對象頭 2.2、實例數據 2.3、對齊填充 3、對象的訪問定位 3.1、句柄訪…

SQL每日一題(4)

前言:第四更 雖然已經全部做完了,這套卷子非常推薦! 根據題目還原出來的原始表 employees表 idnameagestatus1張三28在崗2李四35在崗3王五42在崗4趙六NULL在崗5錢七58在崗6孫八24在崗7周九31離職8吳十-5在崗9鄭十一45在崗10王十二52在崗 題…

如何做好一份技術文檔?

文章目錄 前言一、技術文檔的核心原則二、技術文檔的類型與場景三、技術文檔的寫作流程3.1 需求分析階段(文檔生產的基礎)3.2 架構設計階段(文檔的骨架搭建)3.3 內容開發階段(血肉填充)3.4 質量保障階段&am…

怎么判斷一個Android APP使用了KMM這個跨端框架

要判斷一個 Android 應用是否使用了 KMM(Kotlin Multiplatform Mobile) 框架,可以通過以下方法逐步驗證: 一、安裝包結構分析 解壓 APK 將 .apk 文件重命名為 .zip 并解壓,檢查以下特征: ? kotlin/ 目錄&a…

Axure系統原型設計列表版方案

列表頁面是眾多系統的核心組成部分,承擔著數據呈現與基礎交互的重要任務。一個優秀的列表版設計,能夠極大提升用戶獲取信息的效率,優化操作體驗。下面,我們將結合一系列精心設計的列表版方案圖片,深入探討如何打造出實…

HarmonyOS優化應用內存占用問題性能優化四

一、使用purgeable優化C內存 Purgeable Memory是HarmonyOS中native層常用的內存管理機制,可用于圖像處理的Bitmap、流媒體應用的一次性數據、圖片等。應用可以使用Purgeable Memory存放其內部的緩存數據,并由系統根據淘汰策略統一管理全部的purgeable內存…

第一課如何學習課程

讀薄就這些東西 讀厚細節;實現了還是很混沌(內功心法)-》有個項目;在聽的過程中寫博客:我學了什么,敲代碼; 第二章 網絡-》9.1kv存儲 第三章 基礎組件 (API函數、最基礎的底層架構…

Linux 系統不終止進程的情況下關閉長連接

使用 tcpkill 中斷指定 TCP 連接 適用場景:需主動中斷已知源IP或目標端口的連接,無需進程重啟。 安裝 dsniff 工具(包含 tcpkill): yum -y install dsniff 捕獲并殺死特定連接(例如目標IP 192.168.1.10…

TCP原理解析

目錄 TCP協議概述 1. 基礎尋址段?? ??2. 序列控制段?? ??3. 控制信息段?? ??4. 流量控制段?? ??5. 校驗與應急段?? ??6. 擴展功能段?? ??7. 數據承載段?? TCP原理 確認應答與序列號(安全機制) 超時重傳機制(安全機制) 連接管理機制&…

拋棄傳統P2P技術,EasyRTC音視頻基于WebRTC打造教育/會議/遠程巡檢等場景實時通信解決方案

一、方案背景 隨著網絡通信發展,實時音視頻需求激增。傳統服務器中轉方式延遲高、資源消耗大,WebP2P技術由此興起。EasyRTC作為高性能實時通信平臺,集成WebP2P技術,實現低延遲、高效率音視頻通信,廣泛應用于教育、醫療…

2025年度消費新潛力白皮書470+份匯總解讀|附PDF下載

原文鏈接:https://tecdat.cn/?p42178 過去一年,消費市場在政策驅動與技術迭代中呈現結構性變革。社零總額達487,895億元,實物商品網零額占比27%,線上渠道成為增長引擎。本報告從食品飲料、美妝護膚、家電數碼、服飾戶外四大核心領…

“智”造巨輪啟新程:數字安全的戰略布局

數據就像空氣,無處不在;安全就像呼吸,刻不容緩! 在智能化不斷創新的沃土上,某大型智能家電企業這艘智造巨輪正乘風破浪,駛向數字化的深藍大海。作為全球家電制造的領航者,深知:在這個數字時代&a…

React組件(二):常見屬性和函數

文章目錄 一、defaultProps 和 prop-types使用 defaultProps 設置組件的默認值使用prop-types進行props數據類型的校驗代碼舉例 二、事件綁定原生js做事件綁定使用 React 提供的方法,做事件綁定 三、生命周期函數:shouldComponentUpdate()四、在js代碼中…