機器學習基本概念2

資料來源:

https://www.youtube.com/watch?v=Ye018rCVvOo&list=PLJV_el3uVTsMhtt7_Y6sgTHGHp1Vb2P2J&index=1

https://www.youtube.com/watch?v=bHcJCp2Fyxs&list=PLJV_el3uVTsMhtt7_Y6sgTHGHp1Vb2P2J&index=2

分三步

1、 定義function

0

b和w是需要透過知識去獲取的,是未知的

做機器學習,需要Domain Knowledge,這些知識就是用來解b和w

0

這里的函式,就叫做Model

我們知道2月25號的人數是多少,就叫feauture

2、 定義Loss

Loss is a function of parameters

0

真實的值叫Label(正確的數值)

0

可以算出來最近3年的誤差,把所有的誤差加起來,算出來一個L,這就是我們的Loss,值越大,說明越不好

0

MAE和MSE的區別和選擇具體而定,還有Cross-entropy

0

真實的后臺統計數據例子

0

越偏紅色,代表Loss越大,偏藍色,Loss越小,那在預測的時候,w為0.75 b代500,可能預測會更準

3、最佳化算法

做法: Gradient Descent

如何做: 當w不同的值時,會得到不同的Loss,

怎么找到w,讓Loss最小,隨機選取初始化的點 w0(有一些方法可以更科學的找到這個值)

計算w對l的微積分,計算error surface的斜率,如果這個斜率的值為負數,

把w的值變大,Loss就會小

0

跨步要多大呢?

斜率大,就跨大

0

0

學習速率是自己設定的

Loss的值為什么會是負數?

因為這個函數是自己定義的,Loss的定義的估算的值和實際的值的絕對值,如果根據剛剛的定義,不可能為負數

但上面的這個例子不是真實的案例,error surface 可能是任何形狀

hyperparameter,自己設定的

什么時候會停止下來?一般兩種情況

a、 前期設定了這個參數,例如次數

b、 達到了理想的狀態

Gradient Descent上面找不到最佳的loss值,因為隨機的位置不一樣

0

Local minima是個假的問題,具體為什么,后面會講

兩個參數,如何做上面的Graddient Descent?

0

例子

0

0

課程總結:

這三個步驟合并起來,叫做訓練

0

0

2021年的誤差還是比較大的,怎么做的更好? 分析下數據

0

藍色線相當于把紅色右移了一天而已,每隔7天就是一個循環

這個model是一個比較壞的,我們可以拿7天的周期來進行修改

0

x叫做feature

上面的叫做Linear Model,我們后面看下怎么把Linear Model做的更好

Linear Model 太過簡單了

0

我們需要寫出更復雜,更多未知參數的function

0

1除以1+Exponential-b+wx1,再乘以constant常數

當b+wx1趨向于無窮大的時候,會發生什么事呢,Exponential會消失,當X1非常大的時候,這一條線會收斂在高度是C的地方

當b+wx1趨向于負的無窮大,分母會非常大,Y的值會趨近于0

0

S型的function,叫做sigmoid

0

我們需要各式各樣合適藍色的function,那這個藍色function怎么出來呢,需要調整b和w

改w,會改變斜率,斜坡的坡度

修改b呢,會左右移動

修改c,會改變高度

0

可以制造出不同

0

把0和1和2和3都加起來

0

summation,b是constant

假設b,c,w是未知參數,有彈性,有未知參數的函式

0

0

0

0

Transpose

0

X輸入,我們的Feature是X這個向量,X乘上矩陣W加上向量b,得到向量r,再把向量r,通過Sigmooid Function得到向量a,

再把向量a跟乘上c的Transpose加上b,就得到了y

0

不同的表示方式,上面是圖示化的方式,下面是線性代數的表示方式

0

0

在參數小的情況下,窮舉所有的可能就行,不需要使用Gradient Descent

Sigmoid 可以有多個,會產生越多線段的 Piecewise Linear的function,你就可以逼近越復雜的function

至于需要幾個Sigmoid,這是另外的Hyper Parameter,這個自己決定

Loss function

0

0

0

0

0

Update和Epoch是不一樣的東西

每次更新一次參數叫做一次update,把所有的Batch都看過一遍,叫做一個Epoch

為什么要分成一個一個的batch?

0

0

0

0

0

激活函數

哪種比較好?? Relu好一些

0

我們還可以繼續改我們的模型

0

我們可以把重復的事情,反復的再多做幾次,這里的幾次,又是另外一個超參數

0

模型也需要一個好的名字

0

這個是在模擬人腦

0

Deep Learning的由來。。。。

0

0

只要有足夠多的ReLU或者Sigmoid,就能夠逼近任何連續的Function

反復用的意義在哪里?

0

過多的層數效果不一定好

0

神經網絡結構那部分講的太精彩了。從簡單的線性回歸開始,到用幾個簡單線性函數去逼近一個分段線性函數,然后提出用sigmooid和線性逼近曲線,然后自然而然引出神經網絡的基本結構。輸入特征,參數,激活函數..等等概念自然而然都出來了

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/213003.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/213003.shtml
英文地址,請注明出處:http://en.pswp.cn/news/213003.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

linux之autoconf(1)基礎介紹

Linux之autoconf(1)基礎介紹 Author:Onceday Date:2023年2023年12月10日 漫漫長路,才剛剛開始… 本文主要內容翻譯自Autoconf官方文檔,僅供學習交流之用。 全系列文章請查看專欄: buildroot編譯框架_Once_day的博客-CSDN博客。…

FL Studio21最新FL水果編曲軟件中文版在哪下載?

FL Studio21水果編曲軟件是一款專業的音樂制作軟件,被廣泛地應用于電子音樂、hip-hop、流行樂等多種音樂類型的制作。該軟件提供了豐富的音頻編曲工具和音樂效果器,讓用戶可以輕松地創作出高品質的音樂作品。同時,這也是一款非常易于上手的軟…

[ 云計算 | Azure 實踐 ] 在 Azure 門戶中創建 VM 虛擬機并進行驗證

文章目錄 一、前言二、在 Azure Portal 中創建 VM三、驗證已創建的虛擬機資源3.1 方法一:在虛擬機服務中查看驗證3.1 方法二:在資源組服務中查看驗證 四、文末總結 一、前言 本文會開始創建新系列的專欄,專門更新 Azure 云實踐相關的文章。 …

7-7 求補碼

整數在內存中以二進制補碼形式存儲。對于給定的整數n,要求輸出其4個字節長的補碼。1個字節8個二進制位。 輸入格式: 輸入一個整數n(?231≤n≤231?1)。 輸出格式: 輸出n的補碼。 輸入樣例1: 123輸出樣例1: 00000000000000000000000001111011輸入樣例2: -12…

YOLOv8改進 | 2023檢測頭篇 | 利用AFPN改進檢測頭適配YOLOv8版(全網獨家創新)

一、本文介紹 本文給大家帶來的改進機制是利用今年新推出的AFPN(漸近特征金字塔網絡)來優化檢測頭,AFPN的核心思想是通過引入一種漸近的特征融合策略,將底層、高層和頂層的特征逐漸整合到目標檢測過程中。這種漸近融合方式有助于…

【react hook】ahook的useThrottleEffect 是干嘛的

import { useThrottleEffect } from ahooks;useThrottleEffect 是 React Hooks 中的一個自定義 Hook,用于創建具有節流效果的副作用函數。 在 React 組件中,副作用函數通常在組件生命周期方法中執行,如 componentDidMount、componentDidUpda…

軟件無線電SDR-頻譜采集python實現

sdr做的頻譜采集,保存的500張頻譜圖,能看出來是什么東西嗎?

VC++使用GetProcessTimes獲取進程創建時間、銷毀時間、用戶態時間、內核態時間

一、GetProcessTimes函數簡介(微軟MSDN) 微軟提供了一個非常有用的API函數GetProcessTimes用來獲取進程創建時間、銷毀時間、用戶態時間、內核態時間,msdn連接為:GetProcessTimes 函數 (processthreadsapi.h) 其函數原型為&#…

Linux內核--內存管理(六)補充--內核頁表及內核虛擬空間

目錄 一、引言 二、內核頁表的結構 ------>2.1、頁表項結構 ------>2.2、swapper_pg_dir ------>2.3、內核頁表布局 ------>2.4、物理/虛擬 地址轉換 ------>2.5、頁表容量及表項偏移 ------>2.6、表項掩碼及控制區域 ------>2.7、頁標志位 ---…

【測試發布】

學習目標: 提示:這里可以添加學習目標 例如: 一周掌握 Java 入門知識 學習內容: 提示:這里可以添加要學的內容 例如: 搭建 Java 開發環境掌握 Java 基本語法掌握條件語句掌握循環語句 學習時間&#x…

基于NIQE算法的圖像無參考質量評價算法matlab仿真

目錄 1.算法運行效果圖預覽 2.算法運行軟件版本 3.部分核心程序 4.算法理論概述 4.1 空域NSS特征提取 4.2 圖像塊選取 4.3 MVG模型 4.4 NIQE指標 5.算法完整程序工程 1.算法運行效果圖預覽 2.算法運行軟件版本 MATLAB2022a 3.部分核心程序 clc; clear; close all; …

輕量封裝WebGPU渲染系統示例<46>- 材質組裝管線(MaterialPipeline)燈光、陰影、霧以及多Pass(源碼)

當前示例源碼github地址: https://github.com/vilyLei/voxwebgpu/blob/feature/material/src/voxgpu/sample/MaterialPipelineMultiPasses.ts 當前示例運行效果: 此示例基于此渲染系統實現,當前示例TypeScript源碼如下: export class MaterialPipelin…

Python----內置模塊

1、什么是Python模塊 Python 模塊(Module),是一個Python 文件,以 .py 結尾,包含了 Python 對象定義和Python語句。模塊能定義函數,類和變量,模塊里也能包含可執行的代碼。 2、模塊的分類 在Python中,模塊…

[ffmpeg] AVFrame 功能整理

背景 AVFrame 主要用來存儲編碼前的原始數據。 AVFrame 結構體 在 frame.h 文件中 主要變量 uint8_t *data[AV_NUM_DATA_POINTERS]; // 存儲每個 planes 的數據 int linesize[AV_NUM_DATA_POINTERS]; // 每一行的音視頻數據 uint8_t **extended_data; // 視頻,…

java實現網絡聊天

網絡聊天實現步驟(從功能談論方法): 客戶端: 1.登錄面板:注冊提醒用戶注冊格式,登錄賬號密碼不為空,點擊登錄的時候需要連接服務器端,啟動聊天面板。(監聽用戶點擊登錄…

Windows下nginx的啟動,重啟,關閉等功能bat腳本

echo off rem 提供Windows下nginx的啟動,重啟,關閉功能echo begincls ::ngxin 所在的盤符 set NGINX_PATHG:::nginx 所在目錄 set NGINX_DIRG:\projects\nginx-1.24.0\ color 0a TITLE Nginx 管理程序增強版CLSecho. echo. ** Nginx 管理程序 *** echo.…

JAVA使用HTTP代碼示例

你好,Java開發者們!今天,我要給你們帶來一場硬核的盛宴,那就是在Java中使用HTTP協議進行網絡通信的代碼示例。準備好接受挑戰了嗎?Lets go! 首先,我們需要導入一些必要的庫,它們將成…

C++枚舉類

枚舉 C11有作用域枚舉和無作用域枚舉 無作用域枚舉 特點 全局作用域:無作用域枚舉的成員(枚舉值)在包含它們的作用域內是直接可見的,不需要使用枚舉類型名稱作為前綴。 隱式類型轉換:無作用域枚舉的成員可以隱式地轉換…

鴻蒙開發組件之ForEach列表

一、ForEach函數 ForEach函數是一個迭代函數,需要傳遞兩個必須參數和一個可選參數。主要通過迭代來獲取參數arr中的數據不斷的生成單個Item來生成鴻蒙中的列表樣式 二、先創建單個的Item的UI 通過嵌套Row與Column來實現單個Item的UI。例如圖中沒有折扣的可以看成一…

用23種設計模式打造一個cocos creator的游戲框架----(八)適配器模式

1、模式標準 模式名稱:適配器模式 模式分類:結構型 模式意圖:適配器模式的意圖是將一個類的接口轉換成客戶端期望的另一個接口。適配器模式使原本接口不兼容的類可以一起工作。 結構圖: 適用于: 系統需要使用現有的…