【筆記ing】AI大模型-04邏輯回歸模型

一個神經網絡結構,其中的一個神經網絡層,本質就是一個邏輯回歸模型

深度神經網絡的本質就是多層邏輯回歸模型互相連接或采用一定的特殊連接的方式連接在一起構成的。其中每一個層本質就是一個邏輯回歸模型。

邏輯回歸模型基本原理

邏輯回歸(Logic)是一種廣義線性回歸模型(generalized linear model),其與多重線性回歸有諸多的相同之處,但其實則是一個分類模型,屬于有監督算法,主要用常見的二分類問題求解,是一種采用回歸方法的分類模型。

邏輯回歸的基本決策函數形態為:

其中的g(*)是可微函數,這類模型也被稱為廣義線性模型,函數映射關系f(x)被稱作為聯系函數link function,現今廣泛熟知的邏輯回歸就是諸多廣義回歸模型的其中一種。

在邏輯回歸中,使用對數幾率函數Logistic function作為g^-1(*).對數幾率函數的表達式為:

對數幾率函數叫做Sigmoid函數

Sigmoid函數是一個在生物學中常見的S型函數,也稱作S行生長曲線。由于其單增以及反函數單增等特性,Sigmoid函數常被用作神經網絡的激活函數,將變量映射到0-1之間。

利用這個對數幾率函數,可以將z轉化為一個(0,1)區間內的值。

對數幾率函數重要的導數性質

如果將標簽y表示分類結果,結合二分類趕驢模型可知,標簽結果為正例反例的概率和為1

可以將y表示為出現正例的概率,將1-y表示為出現返利的概率

所以ln y/(1-y)中的y/(1-y)表示正反例出現概率的壁紙,這個比值稱作幾率,用來表示樣本x出現正例的相對可能性。對幾率繼續取得對數,即ln y/(1-y)即稱作對數幾率。

上式實則是在利用線性回歸模型的預測結果取得逼近真實標記的對數幾率。

邏輯回歸模型也稱作對數幾率模型。通過邏輯回歸的決策函數給出證明,證明回歸確實是一種專用于二分類問題求解的分類模型。

可以依據上述二分類場景進一步給出邏輯回歸的損失函數。假設下述兩個條件概率成立。

則邏輯回歸的損失函數可以表達為關于待評估參數列向量w的似然函數:

當第i個樣本的真實標簽yi為1時,1-yi的結果就等于0,(1-yi的反^0=1,整體似然函數的極大值就與yi的反^yi有關,表示“預測的標簽結果yi的反=1”的概率,如果這個概率能夠為1(真實為1,預測為1),則其為必然事件,模型的效果就越好,損失函數就能達到極小化。

當第i個樣本的真實標簽yi為0時,1-yi的結果就等于1,(yi的反)^1=1,整體似然函數的極大值就與(1-yi的反)^(1-yi)有關,表示“預測的標簽結果yi的反=1”的概率,如果這個概率能夠為1(真實為0,預測為0),則其為必然事件,模型的效果越好,損失函數就能達到極小化。

對于每一條訓練樣本,如果總能保證yi的反^yi (1-yi的反)^(1-yi)總是達到最大值1,則構建的二分類模型必然是最想要的模型。

于是可以對每一條樣本都來追求最大值1,于是將其連乘,求得的關于待估參數w的似然函數自然希望求得最大值,此時的模型就是一個最優模型。

對上述對數似然函數取負值,即得邏輯回歸損失函數,

似然函數取得最大值時的待估參數即可取得最優解

對其取負值就表示:當似然函數取得最大值時,邏輯回歸的損失函數將達到極小化

損失函數表達式即為神經網絡模型中求解二分類問題時常采用的損失函數:二分類交叉熵損失函數

邏輯回歸模型優點

邏輯回歸模型可以直接對分類可能性進行建模,該模型不僅可以預測出標簽所屬的類別,還可以得到近似概率的預測,標簽所屬某類別的可能性,對于需要利用概率來輔助決策的場景很重要。

對數幾率函數是任意階均可導(知道n階均可導,具有n階可導行,因為:(e^x)'=e^x的凸函數,有很多數學相關性質,現有的很多數值優化算法都可直接用于其最優解的求解。

采用梯度下降法對其進行求解。

梯度下降法:數學:一元函數、多元函數微分、積分學章節中關于偏導數、方向導數、全微分及梯度的相關概念。數據挖掘算法:梯度下降法章節中關于梯度下降和梯度上升的相關概念。

邏輯回歸模型的實現

借助Pytorch結合邏輯回歸的決策函數及損失函數自行構建一個簡單的邏輯回歸模型。

導包

準備訓練數據,暫不考慮數據集劃分,構造一個假樣本

實現邏輯回歸模型對象

執行模型訓練,觀測模型訓練過程,查看損失函數梯度下降過程

損失函數的值伴隨迭代梯度下降過程在不斷的趨近于極小化,表示模型的建模效果是正確的

邏輯回歸模型與神經網絡關系密切

邏輯回歸的決策函數

決策函數可以看為一個矩陣的線性運算與一個非負函數的復合關系,最終輸出y的反(開始更改名次稱謂y的反之前稱作標簽,也即估計量,在此之后的神經網絡中稱為output layer)

yhat

單層感知機,是一種最簡單的神經網絡,其中的X即特征,在神經網絡中一般稱為輸入層Input layer,w^T即參數(后續稱作權重),Sigmod(w^T X+b)就是輸出層output layer,Sigmod函數在神經網絡中不再稱作非線性函數,稱為激活函數activate function

單層感知機引申:可以構建一種人工的類似神經元信息傳遞的過程,將輸入層的數據逐層“傳遞”最終得到輸出結果。使用多個人工神經元構建的多層感知機,就是一種最普遍的人工神經網絡,在輸入層與輸出層之間加入隱藏層,隱藏層的層數可以任意。

深度學習是一種表征學習,要學習的是樣本的特征,希望特征的學習更全面。

加入隱藏層的目的是:將特征通過隱藏層映射到更高維的空間,進行更高維的特征表達,能夠將樣本的特征表達的更清晰,模型學習的特征的效果也越好,最終所得輸出層的結果也越符合模型建模方向。

單程感知機、多層感知機

————————————

僅用于本人學習

來源:網絡

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/901553.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/901553.shtml
英文地址,請注明出處:http://en.pswp.cn/news/901553.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Android學習總結之算法篇七(圖和矩陣)

有向圖的深度優先搜索(DFS)和廣度優先搜索(BFS)的示例,以此來模擬遍歷 GC Root 引用鏈這種有向圖結構: 一、深度優先搜索(DFS) import java.util.*;public class GraphDFS {privat…

熟悉Linux下的編程

可能 目錄 熟悉Linux下Python編程的含義及與非Linux環境編程的區別 一、核心含義解析 二、與非Linux環境的關鍵區別 三、典型應用場景對比 四、能力培養建議 openfoem的下載之路: 方法一:使用cd命令 方法二:使用快捷方式 方法三&am…

c++引入nacos,詳細步驟

以下是將Nacos引入C項目的詳細步驟,包括安裝、配置和代碼實現: 1. 安裝Nacos服務器 下載Nacos服務器安裝包,可以從Nacos官網獲取最新版本。 解壓安裝包并啟動Nacos服務器: cd nacos/bin sh startup.sh -m standalone 這將啟動…

性能優化實踐

4.1 大規模量子態處理的性能優化 背景與問題分析 量子計算中的大規模量子態處理(如量子模擬、量子態可視化)需要高效計算和實時渲染能力。傳統圖形API(如WebGL)在處理高維度量子態時可能面臨性能瓶頸,甚至崩潰(如表格中14量子比特時WebGL的崩潰)。而現代API(如WebGPU…

課堂總結。

第三章第六節 Spark-SQL核心編程(五)自定義函數:UDF:val sparkConf new SparkConf().setMaster("local[*]").setAppName("SQLDemo")//創建SparkSession對象val spark :SparkSession SparkSession.builder()…

分庫分表-除了hash分片還有別的嗎?

在分庫分表的設計中,除了常見的 Hash 分片,還有多種策略根據業務場景靈活選擇。以下是幾種主流的分庫分表策略及其應用場景、技術實現和優缺點分析,結合項目經驗(如標易行投標服務平臺的高并發場景)進行說明: 一、常見分庫分表策略 1. 范圍分片(Range Sharding) 原理:…

AUTOSAR圖解==>AUTOSAR_SWS_GPTDriver

AUTOSAR GPT驅動 (通用定時器驅動) 分析 AUTOSAR標準軟件規范解析 目錄 1. GPT驅動概述 1.1 GPT驅動在AUTOSAR架構中的位置1.2 GPT驅動主要功能 2. GPT驅動模塊結構3. GPT驅動初始化流程4. GPT驅動狀態機5. GPT驅動錯誤處理6. GPT預定義定時器7. 總結 1. GPT驅動概述 GPT驅動…

MyBatis持久層框架

MyBatis持久層框架 目錄 一、Mybatis簡介 1. 簡介 2. 持久層框架對比 3. 快速入門(基于Mybatis3方式) 二、日志框架擴展 1. 用日志打印替代sout 2. Java日志體系演變 3. 最佳拍檔用法 4. Lombok插件的使用 4.1 Lombok簡介 4.2 Lombok安裝 4.3 …

域控制器升級的先決條件驗證失敗,證書服務器已安裝

出現“證書服務器已安裝”導致域控制器升級失敗時,核心解決方法是卸載已安裝的證書服務?。具體操作如下:? ?卸載證書服務? 以管理員身份打開PowerShell,執行命令: Remove-WindowsFeature -Name AD-Certificate該命令會移除A…

VMware虛擬機常用Linux命令進階指南(一)

摘要:本文涵蓋多方面 Linux 命令的使用。包括用戶與用戶組管理,創建用戶和組并設置權限;目錄結構操作,涉及創建和更改目錄結構;Vim 編輯器及文件歸檔,有文件創建、編譯、合并、打包等任務。 更多優質文章 …

【AI News | 20250415】每日AI進展

AI News 1、字節跳動發布Seaweed-7B視頻模型:70億參數實現音視頻同步生成與多鏡頭敘事 字節跳動推出新一代視頻生成模型Seaweed-7B,該模型僅70億參數卻實現多項突破:支持音視頻同步生成、多鏡頭敘事(保持角色連貫性)、…

如何實現動態請求地址(baseURL)

需求: 在項目中遇到了需要實時更換請求地址,后續使用修改后的請求地址(IP) 例如:原ip請求為http://192.168.1.1:80/xxx,現在需要你點擊或其他操作將其修改為http://192.168.1.2:80/xxx,該如何操作 tips: 修改后需要跳轉( 修改了IP之前的不可使用,需要訪問修改后的地址來操作 …

Open AI 使用篇

一.function Calling 大模型中的 function calling 指的是在人工智能模型(如 GPT-4)中調用外部函數或API,以便模型能夠執行更復雜的任務或獲取外部數據。這種方式允許模型在生成回答時不僅僅依賴于內部的訓練數據,還能夠與外部系…

6.DJI-PSDK:psdk訂閱無人機高度/速度/GPS/RTK/時間/經緯度等消息及問題解決

DJI-PSDK:psdk訂閱無人機高度/速度/GPS/RTK/時間/經緯度等消息 消息訂閱可以獲取絕大多數無人機的動態信息,包括無人機的姿態、速度、加速度、角速度、高度、GPS 位置、云 臺的角度和狀態、飛行模式和飛行狀態、電機和電池等各類關鍵信息。 這些信息并不會“一股腦兒地”全部…

100 個網絡安全基礎知識

1. 什么是網絡安全? 網絡安全是指采取必要措施,防范對網絡的攻擊、侵入、干擾、破壞和非法使用以及意外事故,使網絡處于穩定可靠運行的狀態,保障網絡數據的完整性、保密性、可用性。(參考《中華人民共和國網絡安全法》…

第七屆IEEE通信、信息系統與計算機工程國際會議(CISCE 2025)

重要信息 官網:www.iccisce.com 時間:2025年5月9-11日 地點:中國-廣州 征稿主題 通信技術 信息系統 ?5G/6G通信系統與網絡 ?無線通信與移動網絡 ?光纖通信與光網絡 ?衛星與空間通信 ?通信信號處理與編碼 ?無線傳感器網絡 ?物聯網…

OpenCV 圖像拼接

一、圖像拼接的介紹 圖像拼接是一種將多幅具有部分重疊內容的圖像合并成一幅完整、無縫且具有更廣闊視野或更高分辨率圖像的技術。其目的是通過整合多個局部圖像來獲取更全面、更具信息價值的圖像內容。 二、圖像拼接的原理 圖像拼接的核心目標是將多幅有重疊區域的圖像進行準…

第十一章 網絡編程

在TCP/IP協議中,“IP地址TCP或UDP端口號”唯一標識網絡通訊中的一個進程。 因此可以用Socket來描述網絡連接的一對一關系。 常用的Socket類型有兩種:流式Socket(SOCK_STREAM)和數據報式Socket(SOCK_DGRAM&#xff09…

ffmpeg實現視頻流抽幀

ffmpeg 實現視頻流抽幀 抽取實時視頻幀 如果你的實時視頻是通過 RTSP、UDP 或其他協議獲取的,可以直接調用 FFmpeg 命令來抽取幀。 ffmpeg 命令 示例 1 ffmpeg -i rtsp://your_rtsp_stream_url -vf fps1 -update 1 output.jpg說明: -i rtsp://your…

【GIT】放棄”本地更改,恢復到遠程倉庫的狀態git fetch origin git reset --hard origin/分支名

如果你想完全放棄本地更改,恢復到遠程倉庫的狀態,可以按照以下步驟操作: 獲取遠程最新版本 首先執行: git fetch origin這條命令會把遠程倉庫的最新提交拉取到你的本地,但不會自動合并到你的當前分支。 硬重置你的當前…