機器學習基本概念介紹 2023

機器學習基本概念介紹 2023

news/2025/7/20 23:23:58/文章來源:https://blog.csdn.net/hugenshen/article/details/134906925

筆記來源于：

https://www.youtube.com/watch?v=phQK8xZpgoU&t=172s

https://www.youtube.com/watch?v=XLyPFnephpY&t=645s

Machine/Deep Learning

機器學習概況來說，讓機器具備自動找函式的能力（Machine Learning 約等于 Looking for function）

三種機器學習：回歸，分類，生成式學習

函數輸出來進行分類

1、回歸：韓式的輸出是一個數值

例子：預測明天的PM2.5值

2、分類：函式的輸出是一個類別（選擇題）

例子：email過濾垃圾郵件，讓機器做一個選擇題

輸入是郵件，輸出是垃圾郵件/不是垃圾郵件

機器學習有一個更困難的問題：結構化學習（Structured Learning），讓機器生成有結構的物件，例如影像，文字，又叫生成式學習（Generative Learning）

結構化學習，生成式學習是一門很難的技術，不知道什么時候才能達到生成式學習

不知道什么時候才能到達暗黑大陸

ChatGPT是哪一類呢？

chatgpt實際做的事情：文字接龍，模型解的是分類的問題

使用者感受到的功能：一個字一個字生成，可能感受到的是生成式學習

實際上，chatgpt要解的是生成式學習這個問題做下簡化，拆解成多個分類問題

生成式學習有很多個策略，有哪些？

機器學習就是讓機器找一個函式，那機器怎么找？

歸納成三個步驟，比較好理解

前置作業：決定要找什么樣的函式，這個和技術無關，取決于你要做什么樣的應用

例子：寶可夢，提升戰斗力，或者判斷是否是寶可夢

1、設定范圍

找出候選函數的集合，就是model

深度學習中，類神經網絡的結構，例如CNN，RNN，Transformer等，指的就是不同的函式集合

為什么類神經網絡的結構就是一個候選函式的集合？

視頻解析： https://www.youtube.com/watch?v=Dr-WRlEFefw

參考資料：https://ruanyifeng.com/blog/2017/07/neural-network.html

近年來，計算機視覺慢慢由CNN轉向transform的趨勢

step1: 這個function其實就是一個Neural network

我們把一個Logistic Regression 稱之為Neuron，整個稱之為Neural Network。也就是一個Neural network里面包含一大堆的Logistic Regression

每個Logistic Regression，它都有自己的weight和自己的bias，這些weight和bias集合起來，就是這個network的parameter

如何去連接不同的Neuron network？ Full Connect Feedforward Network

通過不同的連接方式，就得到了不同的structure

1*1+（-1）*（-2）再加上bias 1，通過sigmoid function以后，計算得到值

一個neural network你可以把它看作是一個function，input是一個vector，output也是一個vector

如果不知道參數 weight和bias，只是定出了這個network的structure，只是定義好了這個network怎么樣連接，

它其實就是定義了一個function set，我們可以給這個network設定不同的參數，它就變成了不同的function，把這些可能的function集合起來

我們就得到了一個function set

為什么我們要設定范圍？為什么我們要選出候選函式的范圍？為什么不把所有的函式納入進來？

1、標準訓練數據下，loss小，但是測試不好，例如是硬記答案，我們要找在各個環境都表現很好的函式。。。

2、過濾掉不行的函式，所以一開始劃定范圍，不在這個范圍的直接淘汰，這個范圍也很有講究。。。

3、這個范圍選擇有標準的數學理論支撐，參見視頻：

卷積神經網絡：https://www.youtube.com/watch?v=OP5HcXJg2Aw

淺談機器學習原理：https://www.youtube.com/watch?v=_j9MVVcvyZI

2、設定標準

設定一個評估函式好壞的標準

怎么設定一個最好的標準，loss越小，代表函數最好，loss越大，代表不好

這個loss設定怎么來呢？自己來設置

例子：寶可夢，戰斗力

專業人士設置標準答案，根據函式的輸出和標準答案的差距，所有的差距加起來代表函式的好壞

L（f1）=15 入參為函式，大L也是一個函式，用來計算函式的好壞

怎么樣來定義這個loss function？

假設有另外的情況，有部分的數據有標準答案，路邊抓過來一些寶可夢，那怎么來評估戰斗力？這種情況下

怎么來評估這些沒有正確標注的寶可夢的戰斗力？

第一步，把寶可夢丟到這個函式里面，如果有返回，則使用

沒有的話，我們可以定一些假設，長得像寶可夢的戰斗力要一樣

（那怎么定義長得像呢？比如像素的相似度這個你自己來根據資料來靈活定義）

一個好的函式，可以評估出沒有標注過的數據

問題：在訓練數據上面評估的loss函數小，但是在訓練數據上面不一定好

可能的原因是什么呢？

1、數據量太小

2、有很多其他的理論知識。。。。

怎么解決？

我們在Loss上做一些額外的考量，如Regularization，具體做法原理視頻沒講。。。。。。。

3、達成目標

找出最好的函式，什么叫做好呢？就是上面的loss，loss越小，函式越好

這個找出函式最佳的方式叫做Optimization

如何進一步去找最好評估的loss函式，可以學習下這幾個視頻。。。我沒來的及學習

最佳化演算法

什么是達成目標比較好的方式？

把最佳化演算法看作一個巨大的funciton，輸入是定義好的函式集合 H和評估函式好壞的標準L，

輸出一個最好的函式，這個函式在大L里面的值越小越好

怎么評估這個function的好壞？

1、我們期待這個function能夠在同樣輸入H和L的前提下，越快輸出越好

2、有時候需要L(f*)越小越好，但是通常找不出大L最低的function（不清楚為啥。。。。），但是我們期待最佳化演算法找出來的L(f*) 越低越好

我們需要先設定 Learning Rate，Batch Size，How to Init，這些就叫做超參數，純手工去調（技術活）

參數狗。。。不是類神經網絡里面的參數

一個好的最佳化演算法，我們期待最佳化演算法對于超參數不敏感。。。。這樣就可以用預設值了

--------------------------------------------------------------------------------------------------------------------------------

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/212742.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/212742.shtml
英文地址，請注明出處：http://en.pswp.cn/news/212742.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

智能優化算法應用：基于飛蛾撲火算法3D無線傳感器網絡(WSN)覆蓋優化 - 附代碼

智能優化算法應用：基于飛蛾撲火算法3D無線傳感器網絡(WSN)覆蓋優化 - 附代碼

智能優化算法應用：基于飛蛾撲火算法3D無線傳感器網絡(WSN)覆蓋優化 - 附代碼文章目錄智能優化算法應用：基于飛蛾撲火算法3D無線傳感器網絡(WSN)覆蓋優化 - 附代碼1.無線傳感網絡節點模型2.覆蓋數學模型及分析3.飛蛾撲火算法4.實驗參數設定5.算法結果6.…

閱讀更多...

訂單系統的設計與海量數據處理實戰

訂單系統的設計與海量數據處理實戰

概述訂單系統可以說是整個電商系統中最重要的一個子系統，因此訂單數據可以算作電商企業最重要的數據資產。訂單系統從代碼上來說可分為兩部分：訂單程序和歷史訂單處理程序。數據存儲進行分庫分表。訂單系統業務分析對于一個合格的訂單系統&#xf…

閱讀更多...

如何使用bash寫腳本

如何使用bash寫腳本

本章主要介紹如何使用bash寫腳本。了解通配符了解變量了解返回值和數值運算數值的對比判斷語句循環語句 grep的用法是“grep 關鍵字 file”，意思是從file中過濾出含有關鍵字的行。例如，grep root /var/log/messages，意思是從/var/log/me…

閱讀更多...

基于Html+騰訊云播SDK開發的m3u8播放器

基于Html+騰訊云播SDK開發的m3u8播放器

周末業余時間在家無事，學習了一下騰訊的云播放sdk，并制作了一個小demo（m3u8播放器），該在線工具是基于騰訊的云播sdk開發的，云播sdk非常牛，可以支持多種播放格式。預覽地址 m3u8player.org 源碼…

閱讀更多...

JVM進程緩存

JVM進程緩存

引言緩存在日常開發中啟動至關重要的作用，由于是存儲在內存中，數據的讀取速度是非常快的，能大量減少對數據庫的訪問，減少數據庫的壓力。我們把緩存分為兩類： 分布式緩存，例如Redis： 優點&…

閱讀更多...

Mybatis之簡介、使用操作（安裝、XML、SqlSession、映射的SQL語句、命名空間、作用域和生命周期）

Mybatis之簡介、使用操作（安裝、XML、SqlSession、映射的SQL語句、命名空間、作用域和生命周期）

學習的最大理由是想擺脫平庸，早一天就多一份人生的精彩；遲一天就多一天平庸的困擾。各位小伙伴，如果您： 想系統/深入學習某技術知識點… 一個人摸索學習很難堅持，想組團高效學習… 想寫博客但無從下手，急需…

閱讀更多...

Java項目-瑞吉外賣Day4

Java項目-瑞吉外賣Day4

實現文件的上傳下載： 前端代碼： 對文件的操作就是對流的操作。上傳文件的后端代碼，需要注意MultipartFile的名字必須與前端相對： 為文件存儲位置進行動態設置，配置application.xml 在CommonController中設置屬性讀…

閱讀更多...

Nodejs后端+express框架

Nodejs后端+express框架

前言基于vue3Node后臺管理項目，補充nodejs和express相關知識。文章目錄一，express 1.官網 Express - 基于 Node.js 平臺的 web 應用開發框架 - Express中文文檔 | Express中文網 2.安裝 npm install express --save 二、MongoDB 特點非關…

閱讀更多...

uniapp 藍牙小程序

uniapp 藍牙小程序

在 uni-app 中開發藍牙相關的小程序涉及到使用 uni-app 提供的藍牙 API。uni-app 為多端開發提供了統一的 API，這意味著你編寫的代碼可以在不同的平臺上運行，包括微信小程序。以下是實現藍牙功能的基本步驟和代碼示例： 1. 開啟藍牙適配器 …

閱讀更多...

java之SpringBoot開發實用篇

java之SpringBoot開發實用篇

MENU SpringBoot開發實用篇KF-1.熱部署KF-1-1.手動啟動熱部署KF-1-2.自動啟動熱部署KF-1-3.參與熱部署監控的文件范圍配置KF-1-4.關閉熱部署 KF-2.配置高級KF-2-1.ConfigurationPropertiesKF-2-2.寬松綁定/松散綁定KF-2-3.常用計量單位綁定KF-2-4.校驗KF-2-5.數據類型轉換 KF-3…

閱讀更多...

【頭歌系統數據庫實驗】實驗8 SQL的復雜多表查詢-2

【頭歌系統數據庫實驗】實驗8 SQL的復雜多表查詢-2

目錄第1關：基于派生表查詢每個隊員解答中超過他平均memory的user_id及題目編號problem_id 第2關：用ANY/ALL實現查詢2019級選手（user_id前4位為2019）滿足比2020級其中一個選手注冊時間早即可的選手第3關：用聚集查詢…

閱讀更多...

python zblog API實現類似XMLRPC/發布文章

python zblog API實現類似XMLRPC/發布文章

我發現python對Zblog的XML發布并不友好，雖然也有對應的模塊，但是遠遠沒有XPCRPC更直接方便，但是使用xmlRpc是直接給發布文章帶來了不小的便利，但是對系統也并不友好，但是zblog也開放了Api，但是干部子弟不樂…

閱讀更多...

UE小：物品拼裝功能

UE小：物品拼裝功能

藍圖B1的實現步驟： 獲取玩家控制器和視角：首先獲取玩家控制器，然后使用Deproject Screen to World節點將屏幕上的鼠標位置轉換為世界空間中的一條射線。射線檢測：使用Line Trace by Channel或Line Trace for Objects節點發射射線…

閱讀更多...

深度學習測試流程

深度學習測試流程

深度學習模型測試的功能旨在驗證模型在各種情況下的性能和魯棒性。以下是深度學習模型測試的主要功能： 性能評估： 測試模型在任務目標上的整體性能，例如分類準確性、回歸誤差等。評估指標的選擇取決于具體的任務類型。泛化能力：…

閱讀更多...

《信息技術時代》期刊雜志論文發表投稿

《信息技術時代》期刊雜志論文發表投稿

《信息技術時代》期刊收稿方向：通信工程、大數據、計算機、辦公自動化、信息或計算機教育、電子技術、系統設計、移動信息、圖情信息研究、人工智能、智能技術、信息技術與網絡安全等。刊名：信息技術時代主管主辦單位：深圳灣科技發展有限…

閱讀更多...

C++筆記之int、size_t、uint8_t、unsigned char*區別

C++筆記之int、size_t、uint8_t、unsigned char*區別

C筆記之int、size_t、uint8_t、unsigned char*區別 code review! 文章目錄 C筆記之int、size_t、uint8_t、unsigned char*區別1.ChatGPT第一次查詢解釋2.ChatGPT第二次查詢解釋3.分別的使用示例 1.ChatGPT第一次查詢解釋 size_t、uint8_t 和 int 是編程中使用的不同類型&…

閱讀更多...

《微信小程序開發從入門到實戰》學習四十七

《微信小程序開發從入門到實戰》學習四十七

4.4 云函數 4.4.5 云函數的定時觸發如果云函數需要定時執行，可以使用云函數定時觸發器。配置了定時觸發器，云函數會在相應時間點被自動觸發。函數返回結果不會返回調用方在需要添加觸發器的云函數下新建文件config.json。格式如下： &quo…

閱讀更多...

05-詳解調用服務時負載均衡的配置及其原理

05-詳解調用服務時負載均衡的配置及其原理

負載均衡負載均衡的原理(通用) LoadBalanced注解用來攔截它所標記的RestTemplate發起的http請求, 底層是利用了一個名為Ribbon的組件來實現負載均衡功能(Cloud高版本已經棄用) LoadBalancerInterceptor的intercept方法會對RestTemplate的請求進行攔截 public class LoadBal…

閱讀更多...

【Linux】使用Bash和GNU Parallel并行解壓縮文件

【Linux】使用Bash和GNU Parallel并行解壓縮文件

介紹在本教程中，我們將學習如何使用Bash腳本和GNU Parallel實現高效并行解壓縮多個文件。這種方法在處理大量文件時可以顯著加快提取過程。先決條件確保系統上已安裝以下內容： BashGNU Parallel 你可以使用以下命令在不同Linux系統上安裝它們&am…

閱讀更多...

【數據庫】分支與循環函數存儲過程

【數據庫】分支與循環函數存儲過程

目錄函數【1】【2】【3】? 【4】存儲過程思考&分析函數【1】 --（1）定義一個根據學生姓名查詢該生學習課程的函數stu_count。 --create function stu_count(sname char(8))--學生姓名 --returns char(12)--學習課程 --begin --…

閱讀更多...

最新文章