【動手學深度學習】1.1~1.2 機器學習及其關鍵組件


目錄

  • 一、引言
    • 1.1. 日常生活中的機器學習
    • 1.2. 機器學習中的關鍵組件
      • 1)數據
      • 2)模型
      • 3)目標函數
      • 4)優化算法


一、引言

1.1. 日常生活中的機器學習

應用場景

以智能語音助手(如Siri、Alexa)的喚醒詞識別為例,麥克風采集的音頻數據(每秒約4.4萬次采樣)無法通過傳統編程直接關聯到特定指令。機器學習通過分析大量標記數據(含/不含喚醒詞的音頻),自動構建輸入(音頻)到輸出(是否觸發)的映射關系。

圖1.1.1 識別喚醒詞
在這里插入圖片描述

模型與參數

模型是由參數控制的靈活算法,參數如同“旋鈕”,調整模型行為。例如,同一模型族可適配不同喚醒詞(“Alexa”或“Hey Siri”)。

數據集(dataset):批量數據樣本;

模型(model):任一調整參數后的程序;

模型族:所有不同程序(輸入-輸出映射)的集合;

學習算法(learning algorithm):使用數據集來選擇參數的元程序;

學習(learning):是一個訓練(train)模型的過程;指自主提高模型完成某些任務的效能。

機器學習本質:

通過數據編程(Programming with Data),用數據集而非硬編碼規則定義程序行為。例如,用大量貓狗圖片訓練分類器,使其輸出區分兩者的數值。

訓練過程

  • 從一個隨機初始化參數的“無智能”模型開始;

  • 獲取一些數據樣本;

  • 調整參數,使模型在這些樣本中表現得更好;

  • 重復第(2)步和第(3)步,直到模型在表現良好。

圖1.1.2 一個典型的訓練過程
在這里插入圖片描述

.

1.2. 機器學習中的關鍵組件

機器學習的關鍵組件:

  • 可以用來學習的數據(data)

  • 如何轉換數據的模型(model)

  • 一個目標函數(objective function),用來量化模型的有效性;

  • 調整模型參數以優化目標函數的算法(algorithm)

.

1)數據

可以用來學習的數據(data);

每個數據集由一個個樣本(example, sample) 組成,大多時候,它們遵循獨立同分布(independently and identically distributed, i.i.d.)。

樣本有時也叫做數據點(data point)數據實例(data instance); 通常每個樣本由一組稱為特征(features,或協變量(covariates))的屬性組成。 機器學習模型會根據這些屬性進行預測。在上面的監督學習問題中,要預測的是一個特殊的屬性,它被稱為標簽(label,或目標(target))。

當每個樣本的特征類別數量都是相同時,其特征向量是定長的,這個長度被稱為數據的維數 (dimensionality)。 固定長度的特征向量是一個方便的屬性,它可以用來量化學習大量樣本。

.

2)模型

轉換數據的模型(model);

大多數機器學習會涉及到數據的轉換。比如通過攝取到的一組傳感器讀數預測讀數的正常與異常程度。

深度學習與經典方法的區別主要在于:前者關注的功能強大的模型,這些模型由神經網絡錯綜復雜的交織在一起,包含層層數據轉換,因此被稱為深度學習(deep learning)

.

3)目標函數

目標函數(objective function),用來量化模型的有效性;

“學習”是指自主提高模型完成某些任務的效能。

在機器學習中,我們需要定義模型的優劣程度的度量,這個度量在大多數情況是“可優化”的,這被稱之為目標函數(objective function)

我們通常定義一個目標函數,并希望優化它到最低點。 因為越低越好,所以這些函數有時被稱為損失函數(loss function,cost function)。 但這只是一個慣例,我們也可以取一個新的函數,優化到它的最高點。 這兩個函數本質上是相同的,只是翻轉一下符號。

當任務在試圖預測數值時,最常見的損失函數是平方誤差(squared error),即預測值與實際值之差的平方。 當試圖解決分類問題時,最常見的目標函數是最小化錯誤率,即預測與實際情況不符的樣本比例。

通常,損失函數是根據模型參數定義的,并取決于數據集。 在數據集上,通過最小化總損失來學習模型參數的最佳值。為訓練而收集數據集,稱為訓練數據集(training dataset,或訓練集(training set))。 然而,在訓練數據上表現良好的模型,并不一定在“新數據集”上有同樣的性能,這里的“新數據集”通常稱為測試數據集(test dataset,或測試集(test set))。

當一個模型在訓練集上表現良好,測試集上表現不好時,這個模型被稱為**過擬合(overfitting)**的。

.

4)優化算法

當獲得了一些數據源及其表示、一個模型和一個合適的損失函數,接下來就需要一種算法,它能夠搜索出最佳參數,以最小化損失函數。

深度學習中,大多流行的優化算法常基于的基本方法–-梯度下降(gradient descent)。 簡而言之,在每個步驟中,梯度下降法都會檢查每個參數,看看如果僅對該參數進行少量變動,訓練集損失會朝哪個方向移動。 然后,它在可以減少損失的方向上優化參數。

.


聲明:資源可能存在第三方來源,若有侵權請聯系刪除!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/81677.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/81677.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/81677.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Pytorch針對不同電腦配置詳細講解+安裝(CPU)

一、前言 安裝pytorch前,應按照我前邊的博文中,安裝完anaconda和pycharm,并且配置完環境變量以后哈。 Pytorch是什么? 它是一個庫,是一個開源的機器學習框架,專注于深度學習任務,由Facebook的人工智能研…

[python] 輕量級定時任務調度庫schedule使用指北

schedule是一款專為簡化定時任務調度而設計的Python庫,它通過直觀的語法降低了周期性任務的實現門檻。作為進程內調度器,它無需額外守護進程,輕量且無外部依賴,適合快速搭建自動化任務。不過,該庫在功能完整性上有所取…

React的合成事件(SyntheticEventt)

文章目錄 前言 前言 React的合成事件(SyntheticEvent)是React為了統一不同瀏覽器的事件處理行為而封裝的一套跨瀏覽器事件系統。它與原生事件的主要區別如下: 1. 事件綁定方式 ? 合成事件:使用駝峰命名法綁定事件(如…

報表控件stimulsoft教程:如何在報表和儀表板中創建熱圖

Stimulsoft Ultimate (原Stimulsoft Reports.Ultimate)是用于創建報表和儀表板的通用工具集。該產品包括用于WinForms、ASP.NET、.NET Core、JavaScript、WPF、PHP、Java和其他環境的完整工具集。無需比較產品功能,Stimulsoft Ultimate包含了…

[免費]蒼穹微信小程序外賣點餐系統修改版(跑腿點餐系統)(SpringBoot后端+Vue管理端)【論文+源碼+SQL腳本】

大家好,我是java1234_小鋒老師,看到一個不錯的微信小程序醫院預約掛號管理系統(uni-appSpringBoot后端Vue管理端),分享下哈。 項目視頻演示 【免費】蒼穹微信小程序外賣點餐系統修改版(跑腿點餐系統)(SpringBoot后端Vue管理端) Java畢業設計…

Dify 快速上手 MCP!Java 搭建 MCP Server 接入 Dify詳細實戰攻略

近期,MCP協議在AI領域熱度飆升,成為眾多開發者和行業人士熱議的焦點。下文先介紹MCP究竟是什么?再詳細講下 Dify DeepSeek Java開發 MCP server 實戰。 一、MCP的基本概念 MCP,全稱為模型上下文協議(Model Context P…

力扣992做題筆記

左神做法的理論依據 我們可以通過 集合的包含關系 和 具體示例枚舉 來直觀理解這一推導過程。以下結合題目示例 1 進行詳細說明: 示例 1 分析 輸入:nums [1,2,1,2,3], k 2 目標:計算恰好包含 2 種不同整數 的子數組個數。 步驟一集合 A…

Kubernetes 運維操作手冊:從 etcd 快照進行精確恢復

1 5 步實現 etcd 精確恢復 將快照恢復到本地 etcd 數據目錄。使用恢復的數據啟動本地 etcd 實例。使用 etcdctl 查詢特定鍵(例如,ConfigMap)。使用 auger 解碼以提取干凈的 YAML。使用 kubectl 申請恢復到您的實時集群。 本指南將指導您從 et…

LeetCode Hot100刷題——合并區間

56. 合并區間 以數組 intervals 表示若干個區間的集合,其中單個區間為 intervals[i] [starti, endi] 。請你合并所有重疊的區間,并返回 一個不重疊的區間數組,該數組需恰好覆蓋輸入中的所有區間 。 示例 1: 輸入:i…

《Metasploit框架核心模塊解析與安全防護實踐》?

目錄 ??一、框架模塊化設計與安全驗證價值?? ??1. 漏洞驗證模塊(Exploit Modules)?? ??2. 安全評估模塊(Auxiliary Modules)?? ??3. 安全響應模塊(Post-Exploitation)?? ??4. 載荷安全…

Cribl 中 Parser 扮演著重要的角色 + 例子

先看文檔: Parser | Cribl Docs Parser The Parser Function can be used to extract fields out of events or reserialize (rewrite) events with a subset of fields. Reserialization will preserve the format of the events. For example, if an event contains comma…

程序設計實踐--排序(1)

&#xff11;、插入排序&#xff08;一個數組&#xff09; #include<bits/stdc.h> using namespace std; const int N1e35; int a[N]; int n; int main(){cin>>n;for(int i1;i<n;i){cin>>a[i];}for(int i1;i<n;i){int va[i];int ji-1;while(j>1&am…

MAC電腦中右鍵后復制和拷貝的區別

在Mac電腦中&#xff0c;右鍵菜單中的“復制”和“拷貝”操作在功能上有所不同&#xff1a; 復制 功能&#xff1a;在選定的位置創建一個與原始文件相同的副本。快捷鍵&#xff1a;CommandD用于在當前位置快速復制文件&#xff0c;CommandC用于將內容復制到剪貼板。效果&…

新能源汽車焊接智能節氣閥

在新能源汽車產業迅猛發展的浪潮中&#xff0c;制造工藝的優劣直接關系到車輛的性能、安全與市場競爭力。焊接&#xff0c;作為新能源汽車生產流程里的關鍵一環&#xff0c;無論是構建車身框架&#xff0c;還是連接電池模組&#xff0c;其質量的好壞都起著決定性作用。而在焊接…

Linux:面試題

1. 什么是中斷和異常&#xff1f; 中斷&#xff1a;由外部設備&#xff08;如鍵盤、網卡&#xff09;觸發的異步事件&#xff0c;用于通知 CPU 有緊急事件需要處理。 異常&#xff1a;由 CPU 內部執行指令時產生的同步事件&#xff08;如除零錯誤、缺頁異常&#xff09;&#…

linux關閉某端口暫用的進程

查看是哪個端口暫用 sudo netstat -tulpn | grep :80根據圖片 顯示 80端口暫用的 進程id是 3002 結束進程id為3002的進程 sudo kill -9 3002

【學習心得】Jupyter 如何在conda的base環境中其他虛擬環境內核

如果你在conda的base環境運行了jupyter lab打開了一個ipynb文本&#xff0c;此時選擇的內核是base虛擬環境的Python內核&#xff0c;如果我想切換成其他conda虛擬環境來運行這個文件該怎么辦&#xff1f;下面我們試著還原一下問題&#xff0c;并且解決問題。 【注】 這個問題出…

React Flow 邊的基礎知識與示例:從基本屬性到代碼實例詳解

本文為《React Agent&#xff1a;從零開始構建 AI 智能體》專欄系列文章。 專欄地址&#xff1a;https://blog.csdn.net/suiyingy/category_12933485.html。項目地址&#xff1a;https://gitee.com/fgai/react-agent&#xff08;含完整代碼示?例與實戰源&#xff09;。完整介紹…

ZooKeeper 原理解析及優劣比較

大家好&#xff0c;這里是架構資源棧&#xff01;點擊上方關注&#xff0c;添加“星標”&#xff0c;一起學習大廠前沿架構&#xff01; 引言 在分布式系統中&#xff0c;服務注冊、配置管理、分布式鎖、選舉等場景都需要一個高可用、一致性強的協調服務。Apache ZooKeeper 憑…

模糊照片變清晰:照片高清修復 ComfyUI 使用教學

模糊照片變清晰 滿心歡喜地翻出舊相冊&#xff0c;想重溫那些美好的回憶&#xff0c;結果照片卻模糊不清&#xff0c;根本看不清當年的模樣&#xff1b;又或者精心拍攝了一張超有氛圍感的照片&#xff0c;結果因為手抖或者光線問題&#xff0c;變得模糊&#xff0c;無法發朋友圈…