KAN網絡

目錄

背景知識

什么是神經網絡?

神經網絡發展史

MP神經元模型

感知機模型

KAN

引言

MLP架構vsKAN架構

從數學定理方面來看:

從算法層面上看:

從實際應用過程看:

KAN的架構細節

KAN的準確性

KAN的可解釋性

監督學習

無監督學習

數學領域

物理領域

自動和手動模式的比較

何時該選用 KAN?


背景知識

什么是神經網絡?

神經網絡是一種模仿生物神經網絡結構和功能的非線性數學模型

神經網絡發展史

MP神經元模型

當前神經元會收到x1到xn傳來的信號,這些輸入信號會通過w1到wn的權重,與當前神經元進行連接,從而傳遞信息。

感知機模型

KAN

引言

弗拉基米爾·阿諾德和安德烈·科爾莫戈羅夫證明了,如果f是有界域上的多變量連續函數,則f可以寫成單變量連續函數和加法二元運算的有限組合。

即“任何一個多變量連續函數都可以表示為一些單變量函數的組合”

KAN 的名字也由此而來。

  正是受到這一定理的啟發,研究人員用神經網絡將 Kolmogorov-Arnold 表示參數化。

  為了紀念兩位偉大的已故數學家 Andrey Kolmogorov 和 Vladimir Arnold,我們稱其為科爾莫格羅夫-阿諾德網絡(KANs)。

MLP架構vsKAN架構

? ? ? ? ?跟 MLP 最大、也是最為直觀的不同就是,MLP 激活函數是在神經元上,而 KAN 把可學習的激活函數放在權重上。

從數學定理方面來看:

? ? ? ? MLP 的靈感來自于通用近似定理,即對于任意一個連續函數,都可以用一個足夠深的神經網絡來近似。

  而 KAN 則是來自于 Kolmogorov-Arnold 表示定理 (KART),每個多元連續函數都可以表示為單變量連續函數的兩層嵌套疊加。

從算法層面上看:

? ? ? ? MLPs 在神經元上具有(通常是固定的)激活函數

? ? ? ? 而 KANs 在權重上具有(可學習的)激活函數。這些一維激活函數被參數化為樣條曲線。

從實際應用過程看:

? ? ? ? KAN 可以直觀地可視化,提供 MLP 無法提供的可解釋性和交互性。

KAN的架構細節

左側的圖顯示了 KAN 的分層架構。每層包括一組節點,每個節點都通過一組特定的函數處理輸入數據,輸出到下一層。每個節點上的小圖標表示的是激活函數的形式,這里用B-樣條函數作為激活函數。

右側的圖展示了一個激活函數 ?(x),它被參數化為一個B-樣條函數。圖中還展示了如何通過改變B-樣條的節點(也稱為控制點)數量來調整函數的粒度。

這張圖的核心在于展示KAN如何通過使用B-樣條作為激活函數,結合網絡的多層結構和激活函數的動態調整(網格擴展技術),來處理復雜的高維數據。這種設計使得網絡不僅能適應不同的數據分辨率,還能通過調整激活函數的精度來優化性能。

KAN的準確性

神經縮放規律:KAN 的縮放速度比 MLP 快得多。除了數學上以 Kolmogorov-Arnold 表示定理為基礎,KAN 縮放指數也可以通過經驗來實現。

函數擬合:KAN 比 MLP 更準確。

偏微分方程求解:比如求解泊松方程,KAN 比 MLP 更準確。

規避災難性遺忘:KAN 不會像 MLP 那樣容易災難性遺忘,它天然就可以規避這個缺陷。

KAN的可解釋性

監督學習

在可解釋方面,KAN 能通過符號公式揭示合成數據集的組成結構和變量依賴性。

無監督學習

在無監督學習中,目標是識別數據中變量之問的依賴關系,而不是預測輸出,KANS通過修改其結構,能夠識別哪些輸入變量是相互依賴的。左圖(seed=0)和右圖(seed =2024)顯示了相同的數據集但不同的初始化種子如何導致KAN 學到不同的依賴關系結構。 KAN 通過其靈活的網絡結構捉供了一種強大的工具來探索這些關系,從而增強了模型的解釋性和應用的廣泛性

數學領域

用KAN來解決結點理論問題: 圖a顯示使用 17 個變量的網絡結構實現了81.6%的測試準確率。僅使用3個最重要的變量精簡后的模型達到了78.2%的測試準確率。圖(c)通過餅圖展示了三個變量對預測結果的貢獻比例。

物理領域

本文用KAN來探索和解釋物理模型中的動力學邊界,尤其是在量子系統的安德森局域化現象中的應用

自動和手動模式的比較

人類用戶可以與 KANs 交互,使其更具可解釋性。在 KAN 中注入人類的歸納偏差或領域知識非常容易。

何時該選用 KAN?

關于這個問題,主要看想要的是什么?如果效率優先,也就是最右邊這條支路,選MLP,因為目前,KANS訓練速度較慢是其主要瓶頸,通常比 MLPS慢10倍。但如果想要小模型,KAN更好。如果可解釋性優先,選中間,那么KAN牛遍。如果準確性優先,最左邊,KAN 也更牛通,盡管 KAN 顯示了不錯的前景,但畢竟剛開始,還很不足。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/10165.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/10165.shtml
英文地址,請注明出處:http://en.pswp.cn/web/10165.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

https://是怎么實現的?

默認的網站建設好后都是http訪問模式,這種模式對于純內容類型的網站來說,沒有什么問題,但如果受到中間網絡劫持會讓網站輕易的跳轉釣魚網站,為避免這種情況下發生,所以傳統的網站改為https協議,這種協議自己…

MyBatis——在WEB中使用MyBatis(MVC架構模式)

一、在 Web 應用中使用 MyBatis 項目目錄結構 pojo package org.qiu.bank.pojo;/*** 賬戶類,封裝賬戶數據* author 秋玄* version 1.0* package org.qiu.bank.pojo* date 2022-09-27-20:31* since 1.0*/ public class Account {private Long id;private String …

Logit Standardization in Knowledge Distillation 知識蒸餾中的logit標準化

摘要 知識蒸餾涉及使用基于共享溫度的softmax函數將軟標簽從教師轉移到學生。然而,教師和學生之間共享溫度的假設意味著他們的logits在logit范圍和方差方面必須精確匹配。這種副作用限制了學生的表現,考慮到他們之間的能力差異,以及教師天生…

TypeScript學習筆記:入門指南

介紹 TypeScript 是一個由微軟開發的開源編程語言,它是 JavaScript 的超集,添加了靜態類型和面向對象的特性,使得 JavaScript 更加適合大型項目的開發。本文將介紹 TypeScript 的基本概念、特點以及其在實際項目中的作用。 特點 靜態類型系…

農業生產中,土壤墑情的監測方法有哪些?

農業是人類的生命之源,而土壤墑情則是農業生產的基礎。我們應該倍加珍惜土地資源,合理利用水資源,努力創造出更加宜人的生長環境。讓每一滴水都能為農作物帶來生機,讓每一寸土地都能孕育豐收。這樣才能實現農業可持續發展的目標&a…

存內計算加速大模型——REM-CiM的RGB-事件融合多模態類比計算內存(CiM)技術

本文為大模型&存內計算融合專題的首篇文章,我們將以這篇名為《REM-CiM: Attentional RGB-Event Fusion Multi-modal Analog CiM for Area/Energy-efficient Edge Object Detection during both Day and Night》為例[1],探討其在文中提到的多模態大模…

python dict賦值時有逗號自動變成元組

webpack 查找n.m時用的加載器是頁面上調用的,因為賦值了s等于加載器 s(‘8536’) s.m[‘8536’] headers[Cookie] f_m_h5_tk{cookie_list[0]}; _m_h5_tk_enc{cookie_list[1]}{accept: */*, accept-language: zh-CN,zh;q0.9, cache-control: no-cache, pragma: no-…

護眼臺燈和普通臺燈差別很大嗎?專業護眼燈品牌有哪些?

隨著科技的不斷演進,臺燈的設計也日益脫胎換骨,從曾經的笨重造型轉變為如今輕盈雅致的外觀。它們的功能同樣經歷了多樣化的革新,變得更加人性化和便捷。作為學習、閱讀和辦公環境中不可或缺的照明工具,臺燈所提供的光線舒適度至關…

小紅書java社招一二三面面經

面試前,先找面經哥,點擊此處查看更多面經 面試公司:小紅書 面試職位:后端開發工程師 整體評價:已拿offer 📝面試題: 【一面】 講一下MySQL優化 1、索引優化的細節 2、前綴索引原理 3、MySQ…

LazyDiffusion:革新交互式圖像編輯的擴散模型

Adobe Research和特拉維夫大學的研究人員聯合開發了一種名為LazyDiffusion的新型擴散變換器,它能夠高效地生成部分圖像更新,特別適用于交互式圖像編輯。該模型通過創新的編碼器-解碼器架構,顯著提升了圖像編輯的效率,同時保持了與…

QML 本地存儲(Setting,sqlite)

Qt hello - 專注于Qt的技術分享平臺 QML 原生的儲存方有兩種: 1,Settings 跟QWidget 中的QSettings 一樣,可以簡單的存儲一些配置。 2,Sqlite sqlite數據庫。可以存儲一些復雜的數據。 一,Settings 我們以一個按鈕的位…

鴻蒙DevEco Studio 4.1 Release-模擬器啟動方式錯誤

軟件版本:DevEco Studio 4.1 Release 報錯提示: 沒有權限查看處理指導 Size on Disk 顯示1.0MB 嘗試方案(統統無效): 1、“windows虛擬機監控程序平臺”、"虛擬機平臺"已開啟 啟用CPU虛擬化 2、C…

DIY可視化軟件環境準備

DIY官網可視化工具做好的可視化拖拽開發工具無須編程、零代碼基礎、所見即所得設計工具支持輕松在線可視化導出微信小程序、支付寶小程序、頭條小程序、H5、WebApp、UNIAPP等源碼 支持組件庫,高顏值,卡片,列表,輪播圖,導航欄,按鈕,標簽,表單,單選,復選,下拉選擇,多層選擇,級聯選…

【大華可見光攝像頭】ffmpeg獲取視頻流并下載mp4 報錯‘subtype‘ 不是內部或外部命令,也不是可運行的程序

我現在要通過ffmpeg獲取大華攝像頭視頻流并下載成mp4,但我在cmd窗口運行下面命令的時候,發現報錯: D:\Java\ffmpeg\ffmpeg-master-latest-win64-gpl\bin\ffmpeg.exe -y -i rtsp://admin:123xxx.xxx.xxx.xxx/cam/realmonitor?channel1&s…

springboot 連接hive的坑

本地運行時倒是沒啥問題,一上線啟動接連報錯。網上各種找答案,本質上還是依賴沖突報錯,不知道使用哪個具體類 Caused by: java.lang.NoSuchMethodError: javax.servlet.ServletContext.getVirtualServerName()Ljava/lang/String;The followi…

代碼隨想錄-算法訓練營day36【貪心算法06:單調遞增的數字、監控二叉樹、總結】

代碼隨想錄-035期-算法訓練營【博客筆記匯總表】-CSDN博客 第八章 貪心算法 part06● 738.單調遞增的數字 ● 968.監控二叉樹 ● 總結 詳細布置 738.單調遞增的數字 https://programmercarl.com/0738.%E5%8D%95%E8%B0%83%E9%80%92%E5%A2%9E%E7%9A%84%E6%95%B0%E5%AD%97.html…

Qt Tab鍵切換焦點順序:setTabOrder()

使用這個方法setTabOrder(),設置使得焦點的順序從前到后依次是: ui->lineEdit》 ui->lineEdit_2》ui->lineEdit_3 》ui->lineEdit_4 焦點先在ui->lineEdit上,當按下Tab鍵時,焦點跑到ui->lineEdit_2上。。。按…

同步假設 - 同步方法對實時控制系統的抽象

同步假設是如SCADE、Lustre等同步語言所基于的基礎。這些假設是對實時系統環境的一種抽象。對本文討論涉及到的內容,可進一步參考《Representation and Analysis of Reactive Behaviors: A Synchronous Approach》(SyncCharts, 1996)。 同步方法采用了一種理想化的抽…

通過顏色學習css

文章目錄 1.生成html2.添加css鏈接3.將h1標簽text-align元素4.添加div標簽4.1、為類marker添加元素4.2、添加兩個新的div標簽4.3、修改div標簽的類型并修改css元素4.4、為類container添加元素4.5、以數字形式添加顏色4.5、container添加padding屬性4.6、組合css中的顏色屬性4.7…

【Matlab】Matlab之美,抓緊來膜拜大神的創星之作(附2024Matlab教程+代碼)

軟件介紹 MATLAB是一款商業數學軟件,用于算法開發、數據可視化、數據分析以及數值計算的高級技術計算語言和交互式環境,主要包括MATLAB和Simulink兩大部分,可以進行矩陣運算、繪制函數和數據、實現算法、創建用戶界面、連接其他編程語言的程序…