DAY01:【ML 第一彈】機器學習概述

一、三大概念

1.1 人工智能(AI)

  • Artificial Intelligence 人工智能
  • AI is the field that studies the synthesis and analysis of computational agents that act intelligently

1.2 機器學習(ML)

  • Machine Learning 機器學習
  • Field of study that gives computers the ability to learn without being explicitly programmed

1.3 深度學習(DL)

  • Deep Learning 深度學習

1.4 三者關系

在這里插入圖片描述

  1. 機器學習是實現人工智能的一種途徑。
  2. 深度學習是機器學習的一種方法。

1.5 學習方式

1.5.1 基于規則的學習

  • 基于規則的預測
  • 圖像與語音識別
  • 自然語言處理

1.5.2 基于模型的學習

在這里插入圖片描述

  • 通過編寫機器學習算法,讓機器自己學習從歷史數據中獲得經驗、訓練模型

二、人工智能應用領域和發展史

2.1 應用領域

在這里插入圖片描述

  • 用戶分析:社交網絡、影評、商品評論
  • 搜素引擎:網頁、圖片、規頻、新聞、學術、地圖
  • 信息推薦:新聞、商品、游戲、書籍
  • 圖片識別:人像、用品、勱物、交通工具
  • 機器翻譯、摘要生成 … 生物信息學習 … 多模態 AR/VR

2.2 發展歷史

在這里插入圖片描述

2.3 發展三要素

在這里插入圖片描述

  1. CPU:負責調度任務、計算任務等;主要適合I\O密集型的任務。
  2. GPU:更加適合矩陣運算;主要適合計算密集型任務。
  3. TPU:Tensor,專門針對神經網絡訓練設計一款處理器。

三、常見術語

  1. 樣本(sample):一行數據就是一個樣本;多個樣本組成數據集;有時一條樣本被叫成一條記錄。
  2. 特征(feature):一列數據一個特征,有時也被稱為屬性。
  3. 標簽/目標(label/target):模型要預測的那一列數據。
  4. 數據集:
    • 訓練集(training set):用來訓練模型(model)的數據集
    • 測試集(testing set):用來測試模型的數據集

四、算法分類

4.1 有監督學習

4.1.1 定義

??輸入數據是由輸入特征值和目標值所組成,即輸入的訓練數據有標簽的。

4.1.2 數據集

在這里插入圖片描述

數據人工標注

4.1.3 分類

在這里插入圖片描述

目標值(標簽值)不連續
分類種類:二分類和多分類

4.1.4 回歸

在這里插入圖片描述

目標值(標簽值)連續

4.2 無監督學習

4.2.1 定義

??輸入數據沒有被標記,即樣本數據類別未知,沒有標簽,根據樣本間的相似性,對樣本集聚類,以發現事物內部 結構及相互關系。

4.2.2 數據集

在這里插入圖片描述

數據無需標注

4.2.3 特點

  1. 訓練數據無標簽。
  2. 根據樣本間的相似性對樣本集進行聚類,發現事物內部結構及相互關系。

4.3 半監督學習

4.3.1 工作原理

在這里插入圖片描述

  1. 標注少量數據。
  2. 利用已經標注的少量數據訓練出一個模型。
  3. 再利用訓練出的模型去套用未標記的數據。
  4. 對比專家分類結果與模型分類結果,從而對模型做進一步改善和提高。

4.3.2 特點

  1. 大幅降低標注成本

4.4 強化學習

4.4.1 工作原理

在這里插入圖片描述

四要素:

  • agent
  • 環境狀態
  • 行動
  • 獎勵

4.5 四者對比

在這里插入圖片描述

Inputoutput目的案例
監督學習(supervised learning)有標簽有反饋預測結果貓狗分類、房價預測
無監督學習(unsupervised learning)無標簽無反饋發現潛在結構“物以類聚,人以群分”
半監督學習(Semi-Supervised Learning)部分有標簽,部分無標簽有反饋降低數據標記的難度
強化學習(reinforcement learning)決策流程及激勵系統一系列行動長期利益最大化學下棋

五、建模流程

步驟序號步驟名稱具體內容
1獲取數據獲取經驗數據、圖像數據、文本數據 …
2數據基本處理數據缺失值處理、異常值處理 …
3特征工程特征提取、特征預處理、特征降維 …
4機器學習(模型訓練)線性回歸、邏輯回歸、決策樹、GBDT
5模型評估回歸評測指標、分類評測指標、聚類評測指標

六、特征工程

6.1 定義

  1. 從數據集的角度,指一列一列的數據。
  2. 從模型訓練的角度,指對預測結果有用的屬性。

??利用專業背景知識和技巧處理數據,讓機器學習算法效果最好。數據和特征決定了機器學習的上限,而模型和算法只是逼近這個上限而已。

6.2 特征提取

??從原始數據中提取與任務相關的特征,構成特征向量。對于文本、圖片這種非行列形式的數據行列形式轉換,一旦轉換成行列形式一列就是特征。

6.3 特征預處理

??將不同的單位的特征數據轉換成同一個范圍內,使訓練數據中不同特征對模型產生較為一致的影響。

6.4 特征降維

??將原始數據的維度降低,會丟失部分信息,但需要保證數據的主要信息要保留下來。

6.5 特征選擇

??原始數據通常存在豐富多樣的特征,對于給定任務而言,有效特征僅為全體特征構成集合中的一個子集。此時,需從原始特征集合里,甄別并選取對任務具備顯著價值的重要特征或強相關特征,且整個過程不會對原始數據本身的特征表示與分布產生改變。

6.6 特征組合

??通過加法、乘法等方法把多個的特征合并成一個特征。

  • [A x B]:將兩個特征的值相乘形成的特征組合
  • [A x B x C x D x E]:將五個特征的值相乘形成的特征組合
  • [A x A]:對單個特征的值求平方形成的特征組合

七、模型擬合

  1. 擬合
    • 定義:表示模型對樣本點的擬合情況
  2. 欠擬合
    • 定義:模型在訓練集上表現很差,在測試集表現也很差
    • 原因:模型過于簡單
  3. 過擬合
    • 定義:模型在訓練集上表現很好,在測試集表現很差
    • 原因:模型過于復雜,數據不純,訓練數據太少
  4. 泛化
    • 定義:模型在新數據集上的表現好壞的能力
  5. 奧卡姆剃刀原則
    • 給定兩個具有相同泛化誤差的模型,較簡單的模型比較復雜的模型更可取

微語錄:在一切破舊褪色中,請你永遠閃爍。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/88689.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/88689.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/88689.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AGX Xavier 搭建360環視教程【一、先確認方案】

設備默認自帶 NVIDIA 硬件編解碼能力(NVDEC/NVENC),但是需要你在 OpenCV 和 FFmpeg 里正確啟用 調通 GStreamer 或 nvmpi,才真正能用起來!這里的硬解碼是核心:Jetson 平臺的硬解碼,要么走 GStr…

服務器怎么跑Python項目?

在服務器上運行 Python 項目通常涉及 環境配置、依賴安裝、項目部署 和 進程管理。以下是詳細步驟:1. 連接服務器確保你能通過 SSH 訪問服務器:ssh usernameyour_server_ip(如果是本地測試,可跳過這一步)2. 安裝 Pytho…

【軟件設計師】

UML 類圖中的關系用例圖中的關系 關系例子類圖用例圖順序圖 概念示例通信圖活動圖泳道圖狀態圖

Java 內部類詳解:從基礎到實戰,掌握嵌套類、匿名類與局部類的使用技巧

作為一名 Java 開發工程師,你一定在實際開發中遇到過這樣的場景:想在一個類內部定義另一個邏輯相關的類;需要為某個接口或抽象類提供一個臨時實現(比如監聽器);想利用面向對象特性來組織代碼結構&#xff0…

Java設計模式之行為型模式(觀察者模式)介紹與說明

一、模式結構 觀察者模式包含以下四個角色: Subject(主題/被觀察者) 維護觀察者列表,提供注冊(registerObserver)、移除(removeObserver)觀察者的方法,并定義通知所有觀察…

實現一個點擊輸入框可以彈出的數字軟鍵盤控件 qt 5.12

我們將創建兩個自定義組件: 1. NumericInputField:一個輸入框,當點擊時彈出數字鍵盤。 2. NumericKeyboard:一個可縮放的數字鍵盤。 設計思路: - NumericInputField 是一個常規的輸入框,但點擊后會彈出 Num…

Java 深入解析:JVM對象創建與內存機制全景圖

第一章:引言 Java 是一種面向對象的編程語言,對象(Object)是其最基本的組成單位。Java 的“一切皆對象”不僅體現在語法層面,更體現在運行時,幾乎所有數據都以對象形式存在于內存中。 然而,很…

Redis 基本操作筆記

1. Redis 簡介 Redis(Remote Dictionary Server)是一個開源的、高性能的鍵值對存儲系統,通常作為數據庫、緩存、消息中間件等使用。它支持多種數據類型,包括字符串、哈希、列表、集合、有序集合等。 Redis 特點: 性能&…

Docker從環境配置到應用上云的極簡路徑

Docker從環境配置到應用上云的極簡路徑主要包括環境配置、應用容器化、選擇云平臺及部署應用等步驟,具體如下: - 配置Docker環境: - 安裝Docker:根據操作系統下載對應版本的Docker安裝包。如在Linux系統中,可使用命令…

Slicer渲染Dicom到nrrd

Slicer渲染Dicom到nrrd 工作中遇到一些處理Dicom數據的需求,個人通過網絡上的一些教程 對于原始數據嘗試轉換到nrrd時,發現部分的窗體數據的渲染方向不一致 進一步發現這些很多定義的方向是跟設備廠家強相關的,不同廠家對于同一段的Dicom參…

QT中設計qss字體樣式但是沒有用【已解決】

檢查一下stylesheet里面是不是有不能被QT讀取的CSS語言,可能會跟字體顏色沖突錯誤示范:/* 錯誤示例:QSS 中使用 box-shadow */ QPushButton {box-shadow: 0 4px 8px rgba(0, 0, 0, 0.3); /* Qt 不支持此屬性 */ }刪掉就行了如果后續想用陰影…

uniapp獲取狀態欄高度,膠囊按鈕的高度,底部安全區域的高度,自定義導航欄

相關API uni.getSystemInfoSync() uni.getMenuButtonBoundingClientRect() 創建一個utils文件夾,該文件下封裝一個systemInfo.js /*** 系統信息工具類* 封裝獲取系統狀態欄、導航欄和安全區域等相關信息的方法*/// 獲取系統信息并緩存 const systemInfo uni.get…

jQuery 文本屬性值

一、前言在網頁開發中,我們經常需要對頁面上的文本內容進行操作,例如動態修改段落文字、讀取用戶輸入框的內容、更新按鈕文本等。jQuery 提供了簡潔而強大的方法來處理這些常見的文本操作需求。本文將帶你全面了解 jQuery 中用于操作文本內容的三個核心方…

JAVA并發——為什么Java中的ThreadLocal對key的引用為弱引用

1、ThreadLocal 的用途 給每個線程提供自己獨立的變量副本,實現線程間隔離。 常用于: 數據庫連接、Session 緩存、用戶上下文(如 userId)線程池中的線程復用時避免共享污染;實現線程封閉的設計模式 2、內存泄漏 使用弱…

【C++】多線程同步三劍客介紹

目錄 條件變量 頭文件 主要操作函數 1、等待操作 2、喚醒操作 使用示例 信號量 頭文件 主要操作函數 1、信號量初始化 2、等待操作(P操作) 3、信號操作(V操作) 4、獲取信號量值 5、銷毀信號量 使用示例 互斥鎖 …

《Java Web程序設計》實驗報告八 JSP+Servlet+JDBC+MySQL實現課程管理

目 錄 一、實驗目的 二、實驗環境 三、實驗步驟和內容 1、小組成員分工(共計4人) 2、實驗方案 3、實驗結果與分析 4、項目任務評價 四、遇到的問題和解決方法 五、實驗總結 一、實驗目的 1、掌握mysql的安裝、數據庫表單創建 2、掌握JDBC的鏈接…

基于數據挖掘的課程推薦系統研究

摘要本研究設計并開發了一套基于先進數據挖掘技術的智能化課程推薦系統。該系統創新性地采用了協同過濾算法與內容推薦算法相結合的混合推薦策略,通過深度分析學生在學習平臺上的歷史行為數據(包括選課記錄、學習時長、測試成績等)以及課程的…

【SCI 4區推薦】《Journal of Visual Communication and Image Representation》

期刊簡介:《視覺傳達與圖像表示雜志》(Journal of Visual Communication and Image Representation)致力于發表視覺傳達與圖像表示領域的最前沿研究,特別強調多學科交叉領域中的新技術和理論應用。這本期刊涵蓋的研究范圍廣泛&…

20250711_Sudo 靶機復盤

target:192.168.43.20 外部打點 (文件上傳) nmap掃一下,80,22 開放 掃目錄,發現 README.md [17:04:30] 200 - 664B - /Dockerfile [17:04:38] 200 - 34KB - /LICENSE …

STEP 7-Micro/WIN SMART 編程軟件:從入門到精通的使用指南

STEP 7-Micro/WIN SMART 編程軟件:從入門到精通的使用指南 在工業自動化控制領域,編程軟件是連接工程師與 PLC 的橋梁,而 STEP 7-Micro/WIN SMART 作為 S7-200 SMART PLC 的專用編程工具,以其友好的界面和高效的編程能力備受青睞。…