數據挖掘2.6 Perceptron Modeling 感知器建模

Perceptron Modeling 感知器建模

  • Linear Discriminants 線性判別式
  • Loss Function 損失函數
    • misclassification 誤分類
    • 0-1 Loss/Error function 0-1損失函數
    • Hinge Loss Function 鉸鏈損失函數
  • Optimization 優化
    • 算法

Linear Discriminants 線性判別式

線性判別式公式
f(x;w)=w1x(1)+w2x(2)+?+wdx(d)+b=0f(\mathbf{x};\mathbf{w}) = w_1 x^{(1)} + w_2 x^{(2)} + \cdots + w_d x^{(d)} + b = 0 f(x;w)=w1?x(1)+w2?x(2)+?+wd?x(d)+b=0

兩種表示方法
在這里插入圖片描述
在這里插入圖片描述
w′w'w是更加數學化的公式

我們所要做的,就是求wwwbbb,獲得線性判別式。

Loss Function 損失函數

在這里插入圖片描述

misclassification 誤分類

誤分類是一種錯誤
如果一個訓練樣本的標簽為𝑦 = +1,那么它的判別函數得分f(x)f(x)f(x)應該 > 0
如果一個訓練樣本的標簽為𝑦 = ?1,那么它的判別函數得分f(x)f(x)f(x)應該 < 0
因此,當出現 yf(x)<0yf(x)<0yf(x)<0,說明分類錯誤。

0-1 Loss/Error function 0-1損失函數

l(f(x),y)={0,yf(x)>01,yf(x)≤0l(f(x),y) = \begin{cases} 0, & y f(x) > 0 \\ 1, & y f(x) \le 0 \end{cases} l(f(x),y)={0,1,?yf(x)>0yf(x)0?
在這里插入圖片描述

The whole error整體誤差:用于判斷全部examples
∑i=1Nl(f(xi),yi)\sum_{i=1}^N l\big(f(x_i), y_i\big) i=1N?l(f(xi?),yi?)

0-1損失函數有兩個問題:

  • 顯而易見,這是一個階躍函數,在0點具有不連續性,沒有很好的定義可以求導;
  • 它不是凸的,這意味著當我們試圖用梯度下降算法最小化整體損失,它是無法給出這個特定損失函數的最優解

所以我們建議做的或者最初的創造者,或者現在所謂的感知器所做的是,他們想出了這個零一損失函數的凸近似值——the hinge loss 鉸鏈損失函數

Hinge Loss Function 鉸鏈損失函數

Hinge Loss Function is a convex over-approximation of the 0-1 loss. 鉸鏈損失函數是 0-1 損失函數的凸過度近似。

在這里插入圖片描述
l(f(x),y)={0,yf(x)>11?yf(x),yf(x)≤1={0,1?yf(x)<01?yf(x),1?yf(x)≥0l(f(x),y)= \begin{cases} 0,& y f(x)>1\\ 1-y f(x),& y f(x)\le 1 \end{cases} \quad=\quad \begin{cases} 0,& 1-y f(x)<0\\ 1-y f(x),& 1-y f(x)\ge 0 \end{cases} l(f(x),y)={0,1?yf(x),?yf(x)>1yf(x)1?={0,1?yf(x),?1?yf(x)<01?yf(x)0?

OR
l(f(x),y)=max?(0,1?yf(x))l(f(x), y) = \max(0,\, 1 - y f(x)) l(f(x),y)=max(0,1?yf(x))

簡單的理解
在這里插入圖片描述

l(z)={0,z>11?z,z≤1\boldsymbol{ l(z) = \begin{cases} 0, & z > 1 \\ 1 - z, & z \le 1 \end{cases} } l(z)={0,1?z,?z>1z1?
我們所做的就是構建0-1損失函數的凸近似函數,它是凸的,我們也可以對它進行微分(求導)。

Optimization 優化

在這里插入圖片描述
min?wL(X,Y;w)=∑i=1Nmax?{0,1?yif(xi;w)}\min_{\mathbf{w}} \; L(\mathbf{X}, \mathbf{Y}; \mathbf{w}) = \sum_{i=1}^{N} \max\{0,\, 1 - y_i f(x_i; \mathbf{w})\} wmin?L(X,Y;w)=i=1N?max{0,1?yi?f(xi?;w)}

在這個具體實例中,將4個節點代入模型公式 f(x;w)=w1x(1)+w2x(2)+b=0f(\mathbf{x};\mathbf{w}) = w_1 x^{(1)} + w_2 x^{(2)} + b = 0f(x;w)=w1?x(1)+w2?x(2)+b=0。我們已知道他們的標簽 yiy_iyi?,由此得到每個節點的損失函數值 max?{0,1?yif(xi;w)}\max\{0,\, 1 - y_i f(x_i;\mathbf{w})\}max{0,1?yi?f(xi?;w)}。整個數據集,總體損失是 ∑i=14max?{0,1?yif(xi;w)}\sum_{i=1}^{4} \max\{0,\, 1 - y_i f(x_i; \mathbf{w})\}i=14?max{0,1?yi?f(xi?;w)}
由此,我們采用梯度下降算法來求最小損失函數,這就是我們面對的優化問題。

所有的機器學習都可以表示為優化問題,一旦我們有了機器學習問題的表示方式(模型),我們表示了特征features,我們表示了判別式disccriminant,并且量化定義了什么是誤差。我們開始使用0-1損失函數,但因為它不可微,使用這個數據會導致復雜的后續處理過程。因此我們簡化了它,或者說以此為目的構建了一個復雜的鉸鏈損失過度近似。然后下一步,我們將以優化問題的形式進行問題訓練。這是整個機器學習和數據挖掘的一致主題。

現在我們將使用梯度下降算法進行優化。使用這個算法所求的便是這個模型,參數為向量www

在這里插入圖片描述

在這里插入圖片描述
這里是有點難以理解的,這個圖的損失函數,分界點在x=1x=1x=1,不是0點。雖然實際上 yf(x)=[0,1]yf(x)=[0,1]yf(x)=[0,1]是正確分類了,本應該沒有損失值的,但這是近似損失函數,不是完全符合實際的,所以我們會計算它的損失值。所以當 yf(x)<1yf(x)<1yf(x)<1 時候,我們會假定視為這是分類錯誤了。

算法

已知: 訓練樣本:{(xi,yi)∣i=1…N},yi∈{?1,+1}\{(x_i, y_i) \mid i = 1 \dots N\}, \quad y_i \in \{-1, +1\}{(xi?,yi?)i=1N},yi?{?1,+1}
隨機初始化 w(0)w^{(0)}w(0)
循環直到收斂(Until Convergence)

  • 對于 i=1…Ni = 1 \dots Ni=1N
    • 選擇樣本 xix_ixi?,其標簽為 yiy_iyi?
    • 計算
      f(xi)=w(k)Tx+bf(x_i) = \mathbf{w}^{(k)T} \mathbf{x} + b f(xi?)=w(k)Tx+b
    • 如果 yif(xi)<1y_i f(x_i) < 1yi?f(xi?)<1,則使用梯度下降更新權重向量:
      w(k)=w(k?1)?α?l(w(k))=w(k?1)?α(?yixi)=w(k?1)+αyixi\mathbf{w}^{(k)} = \mathbf{w}^{(k-1)} - \alpha \nabla l(\mathbf{w}^{(k)}) = \mathbf{w}^{(k-1)} - \alpha (-y_i x_i) = \mathbf{w}^{(k-1)} + \alpha y_i x_i w(k)=w(k?1)?α?l(w(k))=w(k?1)?α(?yi?xi?)=w(k?1)+αyi?xi?

如果循環收斂一直是0,說明這是被完全分類正確的模型。
這個算法是在20世紀60年代開發1960s,是最早的神經網絡之一,被稱為perceptron 感知器

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/92375.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/92375.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/92375.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

使用qemu運行與GDB調試內核

目錄 一、前期準備 二、內核編譯 三、QEMU與GDB 1、QEMU調試參數 2、gdb vmlinux 一、前期準備 內核鏡像&#xff1a;bzimage gdb&#xff1a;x86_64 QEMU&#xff1a;qemu-system-x86_64 前置知識&#xff1a; &#xff08;1&#xff09;內核編譯 &#xff08;2&#x…

歐盟 Radio Equipment Directive (RED)

歐盟 Radio Equipment Directive (RED) ——從 2014/53/EU 原文到 2025-08-01 強制生效的網絡安全新規&#xff0c;一次看懂全部關鍵點。1. 法規身份與適用范圍要素內容指令全稱Directive 2014/53/EU on radio equipment取代指令1999/5/EC (R&TTE)適用產品所有“有意發射/接…

【FastExcel】解決ReadSheet在Map中獲取對象不準確問題(已提交PR并合并到開源社區)

解決問題&#xff1a;源碼ReadSheet在同一個Map中獲取對象不準確問題 PR&#xff1a;Fixed the issue where different ReadSheet objects could not get the correct value when comparing them. 一&#xff1a;問題場景 ReadSheet在同一個Map中獲取對象不準確(如Map<…

【網絡安全入門基礎教程】TCP/IP協議深入解析(非常詳細)零基礎入門到精通,收藏這一篇就夠了

前言 這是小編給粉絲盆友們整理的網絡安全入門到精通系列第三章計算機網絡中TCP/IP協議的解析&#xff0c;喜歡的朋友們&#xff0c;記得給大白點贊支持和收藏一下&#xff0c;關注我&#xff0c;學習黑客技術。TCP/IP協議包含了一系列的協議&#xff0c;也叫TCP/IP協議族&…

Latex中公式部分輸入正體的字母\mathrm{c}

Latex中公式部分輸入正體的字母\mathrm{c}“\mathrm{c}”如何在Word中輸入\mathrm{c}“\mathrm{c}” 在 LaTeX 中&#xff0c;“\mathrm{c}” 用于在數學模式中排版“c”這個字母為羅馬體&#xff08;正體&#xff09;。“\mathrm” 是羅馬字體命令&#xff0c;它告訴LaTeX以羅…

Document Picture-in-Picture API擁抱全新浮窗體驗[參考:window.open]

在前端開發中&#xff0c;我們經常會遇到這樣的需求&#xff1a;彈出一個浮動窗口來顯示一些實時信息、工具欄或視頻內容。過去我們會用 window.open()&#xff0c;后來越來越多的開發者傾向于使用 Modal。但現在&#xff0c;一個更現代的 API 出現了——Document Picture-in-P…

【指南版】網絡與信息安全崗位系列(三):安全運維工程師

一、安全運維工程師到底做什么&#xff1f;—— 用校園場景幫你理解簡單說&#xff0c;安全運維工程師就像 “網絡世界的安保隊長 系統管家”&#xff1a;既要實時監控網絡和系統的 “異常動靜”&#xff08;類似學校保安巡邏查隱患&#xff09;&#xff0c;又要負責日常的安全…

matlab——simulink學習(5向NXP庫中添加新模塊)

向NXP庫中添加新的函數模塊一、環境二、庫添加模塊1.打開文件夾2.創建文件3.添加S-Function三、瀏覽器添加模塊一、環境 Windows10、MATLAB R2022b、安裝NXP的S32K1XX系列工具包 二、庫添加模塊 1.打開文件夾 在文件系統中找到安裝工具包的位置&#xff0c;用文件資源管理器…

使用ProxySql實現MySQL的讀寫分離

ProxySQL簡介1、ProxySQL是一款開源的使用C編寫的MySQL集群代理中間件&#xff1b;2、用于在MySQL數據庫和客戶端之間進行負載均衡、查詢緩存、故障轉移和查詢分發&#xff1b;3、它可以作為中間層插入到應用程序和數據庫之間&#xff1b;4、特點是高效靈活&#xff0c;使用簡單…

WiFi 核心概念與實戰用例全解

&#x1f4d6; 推薦閱讀&#xff1a;《Yocto項目實戰教程:高效定制嵌入式Linux系統》 &#x1f3a5; 更多學習視頻請關注 B 站&#xff1a;嵌入式Jerry 1. WiFi基礎與協議 WiFi&#xff08;Wireless Fidelity&#xff09;是基于IEEE 802.11協議族的無線局域網&#xff08;WLAN…

面向遠程智能終端的超低延遲RTSP|RTMP視頻SDK架構與實踐指南

引言&#xff1a;遙操作時代&#xff0c;視覺鏈路已成“主控神經元” 從工業巡檢到應急救援&#xff0c;從城市安防到邊境監控&#xff0c;遠程操控正成為智能終端與人機協同的重要落點。而在這些場景中&#xff0c;“視覺”不再只是用來觀看的工具&#xff0c;而是貫穿感知、…

C++中的繼承:從基礎到復雜

目錄 前言 1. 繼承的基本概念 2. 繼承方式與訪問控制 3. 派生類與基類的對象轉換 4. 繼承中的作用域 5. 派生類的默認成員函數 6. 繼承中的特殊關系 6.1 繼承與友元 6.2 繼承與靜態成員 7. 復雜的菱形繼承問題 8. 繼承與組合的選擇 9. 常見面試題 總結 前言 繼承…

Eyevinn 徹底改變開源部署模式

該咨詢公司借助Akamai云平臺&#xff0c;為其創新的開源平臺和可持續收益分成模式提供強大支持。 "時間就是金錢&#xff0c;我們通過Akamai云平臺快速將開源云平臺投入生產。" ——Eyevinn Technology研發副總裁 Jonas Birm實現可持續視頻流媒體服務 自2013年以來&…

17day-人工智能-機器學習-分類算法-KNN

1. 什么是knn算法knn算法全名叫做k-近鄰算法&#xff08;K-Nearest Neighbors&#xff0c;簡稱KNN&#xff09;&#xff0c;看到名字是不是能想到是算距離的&#xff0c;第一個k是指超參數的意思&#xff0c;就是可以認為設置的意思&#xff0c;這里是指最近的k個樣本。2. 為什…

12-netty基礎-手寫rpc-編解碼-04

netty系列文章&#xff1a; 01-netty基礎-socket02-netty基礎-java四種IO模型03-netty基礎-多路復用select、poll、epoll04-netty基礎-Reactor三種模型05-netty基礎-ByteBuf數據結構06-netty基礎-編碼解碼07-netty基礎-自定義編解碼器08-netty基礎-自定義序列化和反序列化09-n…

解決 Windows 下的“幽靈文件”——記一次與帶空格的 .gitignore 文件的艱難斗爭

引言 你是否遇到過這樣的情況&#xff1a;一個文件明明躺在你的文件夾里&#xff0c;ls 或 dir 命令都能清楚地看到它&#xff0c;但無論你用什么方法嘗試刪除&#xff0c;系統都冷酷地告訴你“找不到文件”&#xff1f; 就在今天&#xff0c;我就遇到了這樣一個“幽靈”般的 .…

(易視寶)易視TV is-E4-G-全志A20芯片-安卓4-燒寫卡刷工具及教程

&#xff08;易視寶&#xff09;易視TV is-E4-G-全志A20芯片-安卓4-燒寫卡刷工具及教程PhoenixCard_V309燒錄步驟&#xff1a;1、將TF或SD卡插入計算機&#xff0c;打開軟件&#xff1b;2、選擇固件所在目錄&#xff1b;3、燒寫模式選“卡量產”4、點擊“燒錄”開始量產&#x…

(數據結構)順序表實現-增刪查改

1.線性表 線性表(linear list)是n個具有相同特性的數據元素的有限序列。線性表是一種在實際中廣泛使用的數據結構,常見的線性表:順序表、鏈表、棧、隊列、字符串… 線性表在邏輯上是線性結構,也就說是連續的一條直線。但是在物理結構上并不一定是連續的,線性表在物理上存儲時…

【面試八股總結】線程/進程同步問題

一、同步與互斥 在線程并發執行的過程中&#xff0c;進程/線程之間存在協作的關系&#xff0c;例如有互斥、同步的關系。為了實現進程/線程間正確的協作&#xff0c;操作系統必須提供實現進程協作的措施和方法&#xff0c;主要的方法有兩種&#xff1a; 鎖&#xff1a;加鎖、解…