02 Deep learning神經網絡的編程基礎 邏輯回歸--吳恩達

1.邏輯回歸

邏輯回歸是一種用于解決二分類任務(如預測是否是貓咪等)的統計學習方法。盡管名稱中包含“回歸”,但其本質是通過線性回歸的變體輸出概率值,并使用Sigmoid函數將線性結果映射到[0,1]區間。

以貓咪預測為例

假設單個樣本/單張圖片為( x \mathbf{x} x y \mathbf{y} y),特征向量X = x \mathbf{x} x,則 y ^ \hat{y} y^?即為X的預測值, y ^ \hat{y} y^?=P(y= y \mathbf{y} y/ x \mathbf{x} x), y ^ \hat{y} y^?∈(0,1)。
假設特征權重參數為 w \mathbf{w} w,是一個nx維的向量,則有:
y ^ \hat{y} y^?= σ \sigma σ w ? w^\top w? x \mathcal{x} x+ b \mathcal{b} b
z \mathcal{z} z = w ? w^\top w? x \mathcal{x} x+ b \mathcal{b} b
y ^ \hat{y} y^?= σ ( z ) \sigma(z) σz

2. Sigmoid函數

Sigmoid函數是一種常用的S型激活函數,數學表達式為:
σ ( z ) = 1 1 + e ? z \sigma(z) = \frac{1}{1 + e^{-z}} σ(z)=1+e?z1?
在這里插入圖片描述
機器學習便是學習參數 x \mathcal{x} x b \mathcal{b} b,使得 y ^ \hat{y} y^?盡可能接近實際值 y \mathcal{y} y

符號慣例介紹

定義一個額外特征向量 x 0 \mathcal{x_0} x0? =1,
y ^ \hat{y} y^?= σ \sigma σ( θ T \theta^{T} θT x \mathcal{x} x ),其中 θ 0 \theta_0 θ0?充當 b \mathcal{b} b,其余 θ 1 \theta_1 θ1? θ n x \theta_{nx} θnx?充當 w \mathbf{w} w

核心特性
  1. 輸出范圍:$ (0,1) $,適合概率映射
  2. 單調性:全程可導且導數最大值為$ 0.25 (出現在 (出現在 (出現在x=0$處)
  3. 導數特性 σ ′ ( x ) = σ ( x ) ( 1 ? σ ( x ) ) \sigma'(x) = \sigma(x)(1 - \sigma(x)) σ(x)=σ(x)(1?σ(x)),便于梯度計算
Python實現
import numpy as npdef sigmoid(x):return 1 / (1 + np.exp(-x))# 支持向量化計算
print(sigmoid(np.array([-1.0, 0.0, 1.0])))  # 輸出:[0.2689, 0.5, 0.7311]
典型應用
  1. 邏輯回歸中的概率轉換
  2. 神經網絡隱藏層的激活函數
  3. 強化學習中的動作選擇概率
局限說明
  • 深層網絡易出現梯度消失(導數值隨網絡深度指數衰減)
  • 輸出不以零為中心可能影響優化效率
  • 現多被ReLU系列函數替代用于隱藏層

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/84128.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/84128.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/84128.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

UDP 與 TCP 的區別是什么?

UDP(用戶數據報協議)與TCP(傳輸控制協議)有以下區別: 連接方式 - UDP:無連接,發送數據前不需要建立連接,也不維護連接狀態,因此UDP的通信效率較高,適合對實時…

6.計算機網絡核心知識點精要手冊

計算機網絡核心知識點精要手冊 1.協議基礎篇 網絡協議三要素 語法:數據與控制信息的結構或格式,如同語言中的語法規則語義:控制信息的具體含義和響應方式,規定通信雙方"說什么"同步:事件執行的順序與時序…

unipp---HarmonyOS 應用開發實戰

HarmonyOS 應用開發實戰指南 1. 開篇:為什么選擇 HarmonyOS? 最近在開發鴻蒙應用時,發現很多開發者都在問:為什么要選擇 HarmonyOS?這里分享一下我的看法: 生態優勢 華為手機用戶基數大,市場潛…

Python_day48隨機函數與廣播機制

在繼續講解模塊消融前,先補充幾個之前沒提的基礎概念 尤其需要搞懂張量的維度、以及計算后的維度,這對于你未來理解復雜的網絡至關重要 一、 隨機張量的生成 在深度學習中經常需要隨機生成一些張量,比如權重的初始化,或者計算輸入…

C++中的數組

在C中,數組是存儲固定大小同類型元素的連續內存塊。它是最基礎的數據結構之一,廣泛用于各種場景。以下是關于數組的詳細介紹: 一、一維數組 1. 定義與初始化 語法:類型 數組名[元素個數];示例:int arr[5]; // 定義…

three.js 零基礎到入門

three.js 零基礎到入門 什么是 three.js為什么使用 three.js使用 Three.js1. 創建場景示例 2.創建相機3. 創建立方體并添加網格地面示例 5. 創建渲染器示例 6. 添加效果(移動/霧/相機跟隨物體/背景)自動旋轉示例效果 相機自動旋轉示例 展示效果 實現由遠到近的霧示例展示效果 T…

Elasticsearch的寫入性能優化

優化Elasticsearch的寫入性能需要從多維度入手,包括集群配置、索引設計、數據處理流程和硬件資源等。以下是一些關鍵優化策略和最佳實踐: 一、索引配置優化 合理設置分片數與副本數分片數(Shards):過少會導致寫入瓶頸(無法并行),過多會增加集群管理開銷。公式參考:分…

FMC STM32H7 SDRAM

如何無痛使用片外SDRAM? stm32 已經成功初始化了 STM32H7 上的外部 SDRAM(32MB) 如何在開發中無痛使用SDRAM 使它像普通 RAM 一樣“自然地”使用? [todo] 重要 MMT(Memory Management Tool) of STM32CubeMx The Memory Management Tool (MMT) disp…

【AIGC】RAGAS評估原理及實踐

【AIGC】RAGAS評估原理及實踐 (1)準備評估數據集(2)開始評估2.1 加載數據集2.2 評估忠實性2.3 評估答案相關性2.4 上下文精度2.5 上下文召回率2.6 計算上下文實體召回率 RAGas(RAG Assessment)RAG 評估的縮寫&#xff…

VuePress完美整合Toast消息提示

VuePress 整合 Vue-Toastification 插件筆記 記錄如何在 VuePress 項目中整合使用 vue-toastification 插件,實現優雅的消息提示。 一、安裝依賴 npm install vue-toastification或者使用 yarn: yarn add vue-toastification二、配置 VuePress 客戶端增…

C#學習12——預處理

一、預處理指令: 解釋:是在編譯前由預處理器執行的命令,用于控制編譯過程。這些命令以 # 開頭,每行只能有一個預處理指令,且不能包含在方法或類中。 個人理解:就是游戲里面的備戰階段(不同對局…

開疆智能Profinet轉Profibus網關連接CMDF5-8ADe分布式IO配置案例

本案例是客戶通過開疆智能研發的Profinet轉Profibus網關將PLC的Profinet協議數據轉換成IO使用的Profibus協議,操作步驟如下。 配置過程: Profinet一側設置 1. 打開西門子組態軟件進行組態,導入網關在Profinet一側的GSD文件。 2. 新建項目并…

(三)Linux性能優化-CPU-CPU 使用率

CPU使用率 user(通常縮寫為 us),代表用戶態 CPU 時間。注意,它不包括下面的 nice 時間,但包括了 guest 時間。nice(通常縮寫為 ni),代表低優先級用戶態 CPU 時間,也就是進…

Digital IC Design Flow

Flow介紹 1.設計規格 架構師根據市場需求制作算法模型(Algorithm emulation)及芯片架構(Chip architecture),確定芯片設計規格書(Chip design specification) 原型驗證 原型驗證(Prototype Validation)通常位于產品開發流程的前期階段,主要是在設計和開發的初步階…

算法打卡第18天

從中序與后序遍歷序列構造二叉樹 (力扣106題) 給定兩個整數數組 inorder 和 postorder ,其中 inorder 是二叉樹的中序遍歷, postorder 是同一棵樹的后序遍歷,請你構造并返回這顆 二叉樹 。 示例 1: 輸入:inorder [9,3,15,20,7…

LangChain工具集成實戰:構建智能問答系統完整指南

導讀:在人工智能快速發展的今天,如何構建一個既能理解自然語言又能調用外部工具的智能問答系統,成為許多開發者面臨的核心挑戰。本文將為您提供一套完整的解決方案,從LangChain內置工具包的基礎架構到復雜系統的工程實踐。 文章深…

P3156 【深基15.例1】詢問學號

P3156 【深基15.例1】詢問學號 - 洛谷 數據結構-線性表 #include<bits/stdc.h> using namespace std; int n,m,a[2000005]; int main(){cin>>n>>m;for(int i1;i<n;i)cin>>a[i];//使用數組模擬線性表while(m--){int k;cin>>k;cout<<a[…

衡量嵌入向量的相似性的方法

衡量嵌入向量的相似性的方法 一、常見相似性計算方法對比 方法核心原理公式優點缺點適用場景余弦相似度計算向量夾角的余弦值,衡量方向相似性,與向量長度無關。$\text{cos}\theta = \frac{\mathbf{a} \cdot \mathbf{b}}{\mathbf{a}\mathbf{b}歐氏距離計算向量空間中的直線距離…

小番茄C盤清理:專業高效的電腦磁盤清理工具

在使用電腦的過程中&#xff0c;我們常常會遇到系統盤空間不足、磁盤碎片過多、垃圾文件堆積等問題&#xff0c;這些問題不僅會導致電腦運行緩慢&#xff0c;還可能引發系統崩潰。為了解決這些問題&#xff0c;小番茄C盤清理應運而生。它是一款專業的C盤清理軟件&#xff0c;能…

【版本控制】Git 和 GitHub 入門教程

目錄 0 引言1 Git與GitHub的誕生1.1 Git&#xff1a;Linus的“兩周奇跡”&#xff0c;拯救Linux內核1.2 GitHub&#xff1a;為Git插上協作的翅膀1.3 協同進化&#xff1a;從工具到生態的質變1.4 關鍵歷程時間軸&#xff08;2005–2008&#xff09; 2 Git與GitHub入門指南2.1 Gi…