神經網絡知識討論

  • AI 核心任務與數據類型
    • 特征提取核心:AI 的核心是從原始輸入數據中提取特征,CV 是將圖像數據轉換為計算機可識別的特征,NLP 是將文本數據轉換為特征,數據挖掘是將結構化數據轉換為特征。
    • 數據類型特點:圖像數據在計算機眼中是矩陣,每個值是像素點,可直接計算;文本數據如字符串,較難直接處理成矩陣。
  • 神經網絡基礎概念
    • 映射概念:映射可看作 y = wx + b 的方程,w 和 b 組成映射方程。通過權重參數對輸入數據進行組合變換,將原始數據投影到特征空間,得到新特征,目的是讓數據更好被認識和識別。
    • 輸入與權重矩陣:以圖像數據為例,輸入數據可拉成向量,如 32×32×3 的圖像有 3072 個像素點。權重參數與特征一一對應,做矩陣乘法,橫向量乘列向量得一個值,在分類任務中,該值代表數據屬于各個類別的概率。
    • 偏置參數:偏置用于對結果做微調,偏置個數與輸出結果個數相同,如 10 分類任務就有 10 個偏置。
    • 權重初始化:權重一開始是隨機初始化的,后續根據預測結果與真實標簽的一致性進行更新。
  • 損失計算方法
    • 回歸任務損失:回歸任務預測一個值,通過計算預測值與真實值的差異來衡量損失,如計算錯誤類別和真實類別得分的差值,差值越大損失越大。
    • 分類任務損失:分類任務要得到數據屬于各個類別的概率,二分類使用 ZMOD 函數將輸入值映射到 0 - 1 之間,大于 0.5 為正例,小于 0.5 為負例;多分類通過 Softmax 函數,先將得分值進行 e 的冪運算放大差異,再進行歸一化得到概率值,最后用對數計算損失,只考慮正確類別的概率,概率越高損失越小。
  • 權重更新方法
    • 梯度下降原理:神經網絡由前向傳播和反向傳播組成。前向傳播通過輸入數據和權重參數得到預測值,計算損失;反向傳播通過求梯度找到權重更新方向,梯度是損失對權重參數的偏導數,沿梯度反方向更新權重可使損失變小。
    • 學習率:學習率控制每次更新的步長,一般較小且適中,學習率有 warm up 階段,先緩慢上升到基礎學習率,再進行衰減。
    • 批量處理:有隨機梯度下降、批量梯度下降和小批量梯度下降。隨機梯度下降用一個樣本更新,速度快但結果可能不穩定;批量梯度下降用所有樣本求平均,結果穩定但計算量大;小批量梯度下降用一批樣本,batch 越大越好,可使求平均更準確。
    • 動量概念:引入動量(慣性),考慮前一步的梯度方向,通過求合力方向更新權重,可使模型更新更快,多數模型都會引入。
  • 網絡結構與特征提取
    • 特征提取本質:神經網絡通過權重參數對輸入數據進行線性組合,將原始數據轉換為新特征,權重參數越多,可得到的特征個數越多。
    • 深度學習不可解釋性:深度學習得到的特征難以解釋其具體含義。
    • 網絡結構示例:輸入數據通過多組權重和偏置參數得到中間特征和最終預測結果,如輸入 1×3 矩陣,通過 3×4 矩陣的 W1 和 4 個偏置 B1 得到 1×4 的中間特征,再經過 4×4 矩陣的 W2 和 4 個偏置 B2,最后通過 4×1 矩陣的 W3 和 1 個偏置 B3 得到預測值。
  • 網絡效果與優化
    • 神經元個數影響:神經元個數越多,可切分數據集的 “刀數” 越多,能更好地對數據進行分類,但可能出現過擬合問題。
    • 過擬合問題:模型為了識別離群點開辟過大區域,導致測試時預測錯誤,數據預處理很重要,數據質量和數量都會影響模型效果。
    • 非線性變換:神經網絡的線性變換只能解決線性問題,通過引入激活函數(如 SoftReLU)進行非線性變換,可使模型解決非線性問題。SoftReLU 函數小于 0 時 y = 0,大于 0 時 y = x,能去除不好的特征。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/91309.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/91309.shtml
英文地址,請注明出處:http://en.pswp.cn/web/91309.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

kotlin類型可為空,進行空安全的區別

定義一個可為空的變量b(String?),默認沒有?是不可以為空的 var b: String? "Kotlin" b null print(b) // 輸出 null默認不可為空 var a: String "Kotlin" a null // 編譯器報錯,null 不能被賦給不為空的變量空安全調用&#x…

Mysql事務基礎

事務是一個不可分割的數據庫操作序列,也是數據庫并發控制的基本單位,其執行的結果必須使數據庫從一種一致性狀態變到另一種一致性狀態。事務是邏輯上的一組操作,要么都執行,要么都不執行 事務的特點 A(Atomicity&#…

FastAPI入門:安裝、Pydantic、并發和并行

本系列參考FastAPI官方文檔:https://fastapi.tiangolo.com/zh/python-types/安裝 使用pip安裝: pip install fastapi此外還需要 ASGI 服務器,生產環境可以使用 Uvicorn 或者 Hypercorn。 ASGI服務器:異步服務網關接口,…

歡樂的周末 - 華為OD統一考試(JavaScript 題解)

題目描述 小華和小為是很要好的朋友,他們約定周末一起吃飯。 通過手機交流,他們在地圖上選擇了多個聚餐地點(由于自然地形等原因,部分聚餐地點不可達)。 求小華和小為都能到達的聚餐地點有多少個? 輸入描述 第一行輸入m和n,m代表地圖的長度,n代表地圖的寬度 第二行…

算法競賽階段二-數據結構(38)數據結構動態鏈表list

動態鏈表(List)的基本概念動態鏈表是一種線性數據結構,通過節點間的指針連接實現動態內存分配。與數組不同,鏈表的大小可隨需增減,插入和刪除操作的時間復雜度為 O(1)(已知位置時),但…

Qt 移動應用推送通知實現

推送通知是移動應用提升用戶粘性的核心功能——無論是即時消息提醒、活動推送還是狀態更新,都需要通過推送功能觸達用戶。Qt雖未直接提供跨平臺推送API,但可通過集成原生服務(如Firebase Cloud Messaging、Apple Push Notification service&a…

Word和WPS文字如何制作分欄試卷?想分幾欄分幾欄

使用Word和WPS文字制作試卷的時候,通常會使用A3大小的紙張,橫向布局。但是如果題目的題干、問題、選項文字太少,會帶來試卷上有較大的空白,既不美觀又浪費紙,解決辦法就是將試卷分欄,根據需要分成多欄&…

ubuntu 安裝vmware tools

VMware Workstation菜單欄->虛擬機->安裝VMware Tools 打開ubuntu內加載的光盤,復制VMwareTools-10.3.26-22085142.tar.gz,解壓出來 sudo ./vmware-install.pl #執行安裝軟件 VMware Tools 安裝完成以后重啟Ubuntu,重啟以后就可以直…

【實時Linux實戰系列】在實時應用中進行負載均衡

在實時應用中,負載均衡是確保系統能夠高效處理多個任務的關鍵技術。通過合理調度任務到不同的處理單元,負載均衡可以提高系統的整體性能,減少延遲,并提高資源利用率。在實時 Linux 系統中,負載均衡尤為重要&#xff0c…

bash的特性-命令和文件自動補全

一、前言在 Linux Shell 編程和日常使用中,Bash 的自動補全功能 是一個非常強大且實用的特性。它不僅可以節省輸入時間,還能有效減少拼寫錯誤,提升命令執行效率。本文將帶你全面了解 Bash 的自動補全機制,包括:? 命令…

Ubuntu系統 系統盤和數據盤擴容具體操作

Linux磁盤配置和需求,以下是完整的操作方案: 可以看到系統盤vda3 還有48GB 數據盤則是還有512GB沒有掛載使用,下面是完成數據擴容的具體操作 一、完成系統盤擴容(使用98GB空間) # 1. 擴展邏輯卷(LVM架構&am…

從0到1學Pandas(七):Pandas 在機器學習中的應用

目錄一、數據預處理1.1 特征提取1.2 數據標準化與歸一化1.3 特征編碼二、特征工程2.1 特征選擇?2.2 特征組合與衍生?2.3 缺失值處理策略?三、模型訓練與評估3.1 數據集劃分3.2 模型訓練與預測3.3 模型評估與調優四、Pipeline 構建4.1 自動化工作流4.2 模型部署與應用4.3 模型…

LangChain和LangGraph 里面的 `create_react_agent`有什么不同

這兩個函數雖然名稱相同,但來自不同的庫(LangChain 和 LangGraph),它們在實現和使用上有一些關鍵區別: 主要區別特性LangChain 的 create_react_agentLangGraph 的 create_react_agent所屬庫LangChainLangGraph設計目的…

PostgreSQL 與 Oracle 數據庫字段類型的詳細對比

一、數值類型對比數據類型OraclePostgreSQL說明整數NUMBER(p,0)SMALLINT/INT/BIGINTOracle 統一用 NUMBER,PG 區分精度范圍浮點數BINARY_FLOATREAL單精度浮點雙精度浮點BINARY_DOUBLEDOUBLE PRECISION雙精度浮點高精度小數NUMBER(p,s)NUMERIC(p,s)精確數值存儲自增序…

JVM 性能調優實戰:讓系統性能 “飛” 起來的核心策略

在 Java 應用的生命周期中,性能問題如同隱藏的 “暗礁”—— 初期可能不顯眼,但隨著用戶量增長和業務復雜度提升,微小的性能損耗會被無限放大,最終導致系統響應遲緩、頻繁卡頓甚至崩潰。JVM 性能調優的目標,就是通過優…

Android Handler 完全指南

在 Android 開發中,Handler 是線程通信的核心工具 —— 當你在子線程下載圖片后需要更新 UI,當你在 TCP 連接中收到數據需要通知界面,當你需要延遲執行某個任務時,都會用到 Handler。這個看似簡單的類,卻蘊含著 Androi…

梳理Ego-Planner模式下5通道、6通道與無人機模式的關系

Copilot said: 你需要梳理Ego-Planner模式下5通道、6通道與無人機模式的關系,以及軌跡跟隨、緊急情況和人工接管的流程。下面結合你的描述和三張圖片,對核心邏輯進行總結和整理: --- ## 一、狀態組合與對應模式(見圖1)…

odbc和jdbc什么區別

ODBC 和 JDBC 都是用于連接和操作數據庫的標準接口,但它們分別面向不同的編程語言和平臺。下面是它們的區別與對比,幫助你理解它們的用途和適用場景。📊 一、基本概念對比特性ODBC(Open Database Connectivity)JDBC&am…

境外期貨Level2高頻Tick歷史行情數據獲取與應用指南

在金融量化分析中,本地數據的高效使用是提升策略效果的重要基礎。本文以CSV格式的本地數據為核心,以外盤期貨分鐘數據、CME/COMEX/CBOT歷史行情為例,闡述專業化的數據處理與應用方法,為研究者提供可行性方案。一、數據預處理標準化…

迅為RK3588開發板安卓GPIO調用-APP運行測試

將網盤上的安卓工程文件復制到 Windows 電腦上。確保工程路徑中使用英文字符,不包含中文。接著,啟動 Android Studio,點擊“Open”按鈕選擇應用工程文件夾,然后點擊“OK”。由于下載 Gradle 和各種 Jar 包可能需要一段時間&#x…