機器學習---KNN算法核心原理和思路分析

文章目錄

  • 1.算法介紹
  • 2.過擬合和欠擬合
  • 3.幾種不同的距離
  • 4.特征的歸一化處理

特此聲明:該內容是學習耿直哥的相關機器學習理論,也是文章里面的部分圖片素材的來源

1.算法介紹

KNN全稱叫做K Nearset Neighbor,翻譯之后就是K個最近的鄰居;

其實這個KNN是一個思想,在我們的分類問題和回歸問題里面都是有所體現的:

首先看一下這個分類的問題:分類問題使用這個思想主要是給我們的未知的個體貼上一個標簽,中間的那個白色的圓圈周圍:有灰色的,有紅色的,那我們的這個未知的個體應該是灰色的還是紅色的呢?

這個時候,通過選擇不同的l值,我們就可以為這個未知的個體貼上標簽:k=3的時候,就是虛線的小圓圈,這個時候,這個未知個體的屬性就是紅色的,如果k-5,也就是虛線的大圓圈,這個時候未知的個體的屬性就是灰色的;

在這里插入圖片描述

在我們的回歸問題里面,和上面的分類問題貼標簽不一樣,回歸問題主要是確定這個未知點的數值,也就是周圍是不同的數據,我們需要根據這個k和不同的個體的權重,計算這個未知的個體的具體數值;

2.過擬合和欠擬合

K值的選取會出現這個過擬合和欠擬合的現象:

K值太小就是過擬合,英文叫做overfit,fit是合身,合適的意思,over就是過度的意思,如圖所示,這個未知的個體周圍基本上都是紅色的,但是如果你的這個k=1的時候,他應該是灰色的,這種情況就是過擬合;

右下角的小人是為了從英語的層面去解釋這個問題,就是這個小人的褲子太緊了,具體到我們的數據上面,就是這個數據集選擇這個范圍太小了,所以稱為過擬合,這個時候i很容易受到噪聲的影響;其實,如果從英語的角度,也就是overfit進行理解,這個時候就很容易明白;

因為初學者很難理解,為什么這個數據選擇的很少,但是這個現象稱之為過擬合呢,實際上這個就是從我們的英文翻譯來的,如果追根溯源,我相信這個overfit并不難理解;

欠擬合,即underfit,使用小人理解,就是褲子太大了,具體到數據上面就是數據的選擇范圍太大了,其實有些的影響程度很小,基本上就可以忽略,但是我們也考慮進來了,這個就是欠擬合,這個時候的決策的效率很低,因為你受到每一個樣本的影響;

3.幾種不同的距離

在我們的這個KNN算法里面,因為是最近鄰嗎,所以這個距離的計算是我們繞不開的,因為這個距離決定了我們是否要選取這個點作為我們的參考點,下面介紹幾種不同的距離:

首先是明氏距離,這個根據數學家明可夫斯基來進行命名的,通式如下所示,p=1的時候就是曼哈頓距離,p=2的時候就是歐氏距離,這個歐氏距離就是我們熟悉的距離,也就是我們傳統意義上面的距離;

下面的這個上面還是用藍色這個直線表示的我們的歐氏距離,使用紅色的兩個直線段表示我們的曼哈頓距離,但是實際上,我們常用的還是我們很熟悉的這個歐氏距離,其他的兩個了解即可;

4.特征的歸一化處理

為什么要進行特征值的歸一化處理:主要是為了讓不同的特征對于我們的模型具有一樣的影響,這個時候模型同等的對待每一個特征,提高模型的準確性;

下面的這個變換的過程就可以解釋這個現象:就是我們的x,y軸相同的距離代表的長度需要是一致的,也就是我們說的這個標度,否則就會對于我們的模型訓練產生影響;

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/896219.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/896219.shtml
英文地址,請注明出處:http://en.pswp.cn/news/896219.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

書生大模型實戰營14-MindSearch深度解析實踐

文章目錄 L2——進階島MindSearch深度解析實踐1 MindSearch 簡介2 開發環境配置2.1. 打開codespace主頁,選擇Blank模板進行創建2.2. 創建conda環境隔離并安裝依賴 3. 獲取硅基流動API KEY4. 啟動MindSearch4.1. 啟動后端4.2. 啟動前端 5. 部署到自己的 HuggingFace …

uniapp實現app的pdf預覽

實現效果 文件準備 static下添加該pdf文件&#xff08;下載地址&#xff1a;https://gitee.com/shallow-winds/resource_package/tree/master/%E6%96%B9%E6%B3%95%E4%B8%80/html&#xff09; 使用web-view進行展示&#xff1a; 在這里插入代碼片 <web-view :src"u…

重啟 nginx

首先確認Nginx是否已經安裝&#xff0c;并檢查它的安裝位置。 執行以下命令來檢查&#xff1a; which nginx#例如&#xff1a;顯示/usr/local/nginx/sbin/nginx方法1&#xff1a;直接使用完整路徑啟動Nginx 1.1、啟動 Nginx&#xff0c;執行命令&#xff1a; sudo /usr/loca…

java實現多圖合成mp4和視頻附件下載

java實現多圖合成mp4和視頻附件下載 在wutool中&#xff0c;封裝了視頻處理工具類&#xff0c;基于javacv和ffmpeg庫&#xff0c;實現多圖合成mp4、視頻http附件下載等。 關于wutool wutool是一個java代碼片段收集庫&#xff0c;針對特定場景提供輕量解決方案&#xff0c;只…

ollama修改監聽ip: 0.0.0.0

確認Ollama綁定IP地址 默認情況下&#xff0c;Ollama可能僅監聽本地回環地址&#xff08;127.0.0.1&#xff09;。要允許外部訪問&#xff0c;需將其配置為監聽所有IP&#xff08;0.0.0.0&#xff09;或指定IP&#xff08;如10…19&#xff09;。 修改啟動命令&#xff08;推薦…

STM32-溫濕度上傳OneNET項目

一、項目需求 使用 ESP8266 連接 OneNET 云平臺&#xff0c;并通過 MQTT 協議上傳 DHT11 獲取的溫濕度值。 二、項目框圖 三、DHT11工作原理 參考于良許嵌入式手把手教你玩轉DHT11&#xff08;原理驅動&#xff09; | 良許嵌入式 3.1 正常工作驗證 #? 上電后&#xff…

百度首頁上線 DeepSeek 入口,免費使用

大家好&#xff0c;我是小悟。 百度首頁正式上線了 DeepSeek 入口&#xff0c;這一重磅消息瞬間在技術圈掀起了驚濤駭浪&#xff0c;各大平臺都被刷爆了屏。 百度這次可太給力了&#xff0c;PC 端開放僅 1 小時&#xff0c;就有超千萬人涌入體驗。這速度&#xff0c;簡直比火…

Ubuntu:wvp-GB28181-pro安裝、運行

參考 https://doc.wvp-pro.cn 下載源碼 GitHub - 648540858/wvp-GB28181-pro: WEB VIDEO PLATFORM是一個基于GB28181-2016標準實現的網絡視頻平臺&#xff0c;支持NAT穿透&#xff0c;支持海康、大華、宇視等品牌的IPC、NVR、DVR接入。支持國標級聯&#xff0c;支持rtsp/rtm…

c++入門-------命名空間、缺省參數、函數重載

C系列 文章目錄 C系列前言一、命名空間二、缺省參數2.1、缺省參數概念2.2、 缺省參數分類2.2.1、全缺省參數2.2.2、半缺省參數 2.3、缺省參數的特點 三、函數重載3.1、函數重載概念3.2、構成函數重載的條件3.2.1、參數類型不同3.2.2、參數個數不同3.2.3、參數類型順序不同 前言…

Linux提權之計劃任務反彈shell提權(十一)

實驗環境還是一樣的 當獲取一個linux普通用戶的時&#xff0c;查看計劃任務 首先我們退出root用戶 cat /etc/crontab crontab -l 查看當前用戶命令 /var/spool/cron/crontabs/root 這個目錄是root任務文件 默認是不是root權限是 看不到 tail -f /var/log/syslog 咋們切換用…

論文解讀 | AAAI'25 Cobra:多模態擴展的大型語言模型,以實現高效推理

點擊藍字 關注我們 AI TIME歡迎每一位AI愛好者的加入&#xff01; 點擊 閱讀原文 觀看作者講解回放&#xff01; 個人信息 作者&#xff1a;趙晗&#xff0c;浙江大學-西湖大學聯合培養博士生 內容簡介 近年來&#xff0c;在各個領域應用多模態大語言模型&#xff08;MLLMs&…

ai-financial-agent - 為金融投資打造的AI代理

探索人工智能在投資研究中的應用。本項目僅用于**教育**目的&#xff0c;不用于真實交易或投資。 作者聲明&#xff1a; 本項目僅用于教育和研究目的。 不用于真實交易或投資不提供任何保證或擔保過去的表現并不代表未來的結果Creator 對經濟損失不承擔任何責任咨詢財務顧問…

Open WebUI選擇模型為空,解決辦法(for DeepSeek)

標簽&#xff1a; DeepSeek&#xff1b; Open WebUI&#xff1b; 問題&#xff1a;Open WebUI選擇模型為空&#xff0c;解決辦法 &#xff08;for DeepSeek&#xff09; 操作系統&#xff1a;Ubuntu 22 硬件&#xff1a;臺式電腦 Ubuntu 22系統&#xff0c;DeepSeek安裝成功&…

歐幾里得算法第二彈---計算多個數的最大公約數

如果要求多個數的 GCD&#xff0c;可以先求前兩個數的 GCD&#xff0c;然后用這個結果與下一個數求 GCD&#xff0c;依次類推。 為什么可以用前兩個數的 GCD 與下一個數繼續求 GCD&#xff0c;從而得到所有數的 GCD 呢&#xff1f;&#xff08;之前我不知道&#xff0c;自己也沒…

掌握 ElasticSearch 組合查詢:Bool Query 詳解與實踐

掌握 ElasticSearch 組合查詢&#xff1a;Bool Query 詳解與實踐 一、引言 (Introduction)二、Bool 查詢基礎2.1 什么是 Bool 查詢&#xff1f;2.2 Bool 查詢的四種子句2.3 語法結構 三、Bool 查詢的四種子句詳解與示例3.1 must 子句3.2 filter 子句3.3 should 子句3.4 must_no…

【練習】【類似于子集問題】力扣491. 非遞減子序列/遞增子序列

題目 非遞減子序列 給你一個整數數組 nums &#xff0c;找出并返回所有該數組中不同的遞增子序列&#xff0c;遞增子序列中 至少有兩個元素 。你可以按 任意順序 返回答案。 數組中可能含有重復元素&#xff0c;如出現兩個整數相等&#xff0c;也可以視作遞增序列的一種特殊情況…

本地部署AI模型 --- DeepSeek(二)---更新中

目錄 FAQ 1.Failed to load the model Exit code: 18446744072635812000 FAQ 1.Failed to load the model Exit code: 18446744072635812000 問題描述&#xff1a; &#x1f972; Failed to load the model Error loading model. (Exit code: 18446744072635812000). Unkn…

開源嵌入式實時操作系統uC/OS-II介紹

一、uC/OS-II的誕生&#xff1a;從開源實驗到行業標桿 背景與起源 uC/OS-II&#xff08;Micro-Controller Operating System Version II&#xff09;誕生于1992年&#xff0c;由嵌入式系統先驅Jean J. Labrosse開發。其前身uC/OS&#xff08;1991年&#xff09;最初作為教學工…

Starlink衛星動力學系統仿真建模第七講-衛星姿軌控系統(Attitude and Orbit Control System, AOCS)設計規范

以下是一份衛星姿軌控系統&#xff08;Attitude and Orbit Control System, AOCS&#xff09;設計規范的框架和核心內容示例&#xff0c;供參考&#xff1a; 衛星姿軌控系統&#xff08;AOCS&#xff09;設計規范 1. 總則 1.1 目的 本規范旨在規定衛星姿軌控系統的設計要求、…

C++之旅-C++11的深度剖析(1)

目錄 前言/背景 1.C11的發展歷史 2.列表初始化 2.1 C98傳統的{} 2.2 C11中的{} 2.3 C11中的std::initializer_list 3.右值引用 3.1 左值和右值 3.2 左值引用和右值引用 3.3 引用延長生命周期 3.4 左值和右值的參數匹配 結束語 前言/背景 隨著現代軟件開發的快速發展…