人工智能期末復習筆記(更新中)

分類問題

分類:根據已知樣本的某些特征,判斷一個新的樣本屬于哪種已知的樣本類
垃圾分類、圖像分類
在這里插入圖片描述

怎么解決分類問題

在這里插入圖片描述

分類和回歸的區別

在這里插入圖片描述

1. 邏輯回歸分類

用于解決分類問題的一種模型。根據數據特征或屬性,計算其歸屬于某一類別
的概率P,根據概率數值判斷其所屬類別。主要應用場景:二分類問題。
在這里插入圖片描述

1. 談談你對機器學習的理解,包括回歸和分類的相同點和不同點

機器學習是一種通過數據(經驗)和算法讓計算機從中學習并改善系統自身的性能的技術。
回歸和分類的相同點:
預測性質:回歸和分類都是用來預測未知數據的屬性或類別。
監督學習:這兩種任務都屬于監督學習的范疇,即訓練數據集包含了輸入和相應的輸出(標簽)。
使用模型:它們都需要構建一個數學模型,該模型能夠從訓練數據中學習,然后用于對新數據進行預測。
回歸和分類的不同點:
預測目標:

回歸的目標是預測連續型變量的數值,例如房價、溫度等。回歸問題的輸出是一個連續的數值。
分類的目標是預測離散的類別或標簽,例如判斷郵件是否為垃圾郵件、圖片中的物體類別等。分類問題的輸出是一個離散的類別。
輸出類型:

回歸的輸出是連續的實數值,可以是任意范圍內的數字。
分類的輸出是離散的類別,通常是有限的、預定義的標簽集合。
評估指標:

回歸問題通常使用諸如均方誤差(Mean Squared Error, MSE)、均方根誤差(Root Mean Squared Error, RMSE)等連續型指標來評估預測結果的準確性。
分類問題通常使用準確率(Accuracy)、精確率(Precision)、召回率(Recall)等離散型指標來評估模型的性能。

2. 簡述機器學習的流程

抽象實際問題,獲取數據,數據預處理,特征工程,訓練模型及調優,模型評估不斷迭代模型,獲取最終模型

3. 簡述監督學習與無監督學習之間的區別

數據類型:監督學習使用有標簽的數據,無監督學習使用無標簽的數據。
目標:監督學習旨在預測輸出,無監督學習旨在發現數據中的結構和模式。
應用:監督學習用于分類和回歸,無監督學習用于聚類、降維等

4. 數據預處理的過程中,對于異常數據處理的方法有哪些

1.刪除異常值
2.修正異常值
3.數據變換
4.使用離群值檢測算法
5.使用模型

填空題

機器學習

  1. 機器學習的工作流程:抽象實際問題、獲取數據、數據預處理、特征工程、訓練模型及調優、模型評估、獲取最終模型
  2. 數據預處理的方法:數據清洗、數據變換、數據過濾
  3. 特征工程定義:從原始數據中進行特征構建、特征提取、特征選擇
  4. 數據集分為:訓練集(用于學習的數據集)、驗證集(用來預防過擬合的發生,輔助訓練過程的數據集)、測試集(用于測試和評估訓練好的模型的數據集)
  5. 機器學習分為:監督學習、半監督學習、無監督學習
  6. 監督學習:基于標簽訓練數據的機器學習模型的過程
  7. 半監督學習:使用大量的未標記數據、以及同時使用標記數據,來進行模型識別工作
  8. 無監督學習:建立及其學習模型的過程不依賴標簽訓練數據

在機器學習中,回歸和分類是兩種基本的任務類型

  1. 分類:根據數據的屬性或特征是否相似,來把它們歸為一類
  2. 回歸:評估輸入變量和輸出變量之間關系的過程

回歸和分類的不同點:

預測目標:

回歸的目標是預測連續型變量的數值,例如房價、溫度等。回歸問題的輸出是一個連續的數值。
分類的目標是預測離散的類別或標簽,例如判斷郵件是否為垃圾郵件、圖片中的物體類別等。分類問題的輸出是一個離散的類別。
輸出類型:

回歸的輸出是連續的實數值,可以是任意范圍內的數字。
分類的輸出是離散的類別,通常是有限的、預定義的標簽集合。
評估指標:

回歸問題通常使用諸如均方誤差(Mean Squared Error, MSE)、均方根誤差(Root Mean Squared Error, RMSE)等連續型指標來評估預測結果的準確性。
分類問題通常使用準確率(Accuracy)、精確率(Precision)、召回率(Recall)等離散型指標來評估模型的性能。
課本原話
區別在于輸出變量類型不同,分類的輸出是離散的,回歸的輸出是連續的,分類問題是從不同類型的數據中學習數據的邊界,而回歸問題是從同一類型的數據中學習到這種數據中不同維度間的規律,去擬合真實規律

  1. 數據清洗的目的:將數據集中的”臟“數據去除
  2. 臟數據:缺少的數據、異常的數據、重復的數據
  3. 缺少的數據的處理方法:直接刪去、填充為一個常量、取均值、中位數或使用頻率高的值、插值填充、模型填充
  4. 異常數據的發現方法:建模法、計算機檢查和人工檢查相結合、聚類、密度法
  5. 數據變換:對對象的屬性再數值上進行處理,包括規范化、離散化、稀疏化
  6. sklearn基本功能主要分為:數據預處理、數據降維、模型選擇、分類、回歸、聚類

邏輯回歸分類

邏輯回歸定義:用來解釋輸入變量和輸出變量之間關系的一種技術,主要用于二分類問題

  1. sigmoid()函數:
    在這里插入圖片描述

線性回歸預測

線性回歸定義:利用數理統計中回歸分析來確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法

聚類(無標紅,非重點)

聚類定義:根據相似性原則,將具有較高相似度的數據對象劃分為同一類簇,將具有較高相異度的數據對象劃分為不同類簇。(無監督學習)
聚類算法:K-Means算法(K均值算法)

  1. 初始化質點
  2. 聚類對象
  3. 更新質點

第4章 自然語言處理(NLP)

  1. 自然語言處理工具包:NLTK

  2. 使用stemming、lemmatization還原詞匯

  3. 詞袋模型:文本特征提取方式

  4. 文本分析的主要目的之一:把文本轉化為數值

  5. 分析文檔的步驟:1. 提取文檔 2. 轉換為數值形式

  6. 使用TF-IDF算法構建文檔類別檢測器
    作用:對文檔所屬的類別進行檢測
    TF-IDF:是一種用于信息檢索與數據挖掘的常用加權技術
    TF-IDF的值是這兩個值的乘積:TF*IDF
    TF-IDF主要思想:p113
    TF-IDF作用:去除過濾常見的詞語,從而保留重要的詞語

  7. 主題模型算法不需要任何被標記的數據

  8. LDA包括三層結構:詞、主題、文檔(重點)

  9. LDA是非監督機器學習

課后習題

列出幾種文本特征提取算法:詞袋模型、TF-IDF、文本主題模型(LDA)
列出幾種自然語言處理開源工具包:NLTK、Gensim、TextBlob

第5章 語言識別

將音頻信號從時域轉換為頻域

  1. 音頻信號包括:頻率、相位、振幅的正弦波
  2. 信號的基本性質:時域、頻域
  3. 時域是唯一實際存在的域,真實世界的,頻域是一個數學構造,正弦波是頻域唯一存在的波形
  4. 時域的基本變量:時間
  5. 頻域的基本變量:頻率
  6. 將音頻信號從時域轉換為頻域:快速傅里葉變換

提取語音特征

  1. MFCC:用于從給定音頻信號中提取頻域特征
  2. 只使用低頻MFCC,丟棄中高頻MFCC
  3. 提取語言特征參數MFCC主要流程:預加重、分幀、加窗、FFT、Mel濾波器組、對數對算、DCT離散余弦變換

課后習題

  1. 列舉幾個語言識別技術的應用領域:通信、家電、工業、汽車電子、家庭服務、醫療、消費電子產品

  2. 簡單概述語言識別技術的原理:
    先采集并預處理信號,使用數字信號處理技術提取聲音的特征,利用聲學模型和語言模型分析聲音的特征和語言規律,以實現對語音輸入的理解和處理

  3. 實現音頻信號從時域轉換為頻域:
    首先將連續的模擬信號采樣為離散的數字信號。然后,使用傅里葉變換(如快速傅里葉變換)將離散時域信號轉換為頻域信號,以分析信號在不同頻率上的能量分布。

第6章 計算機視覺

視頻中移動物體檢測方法

  1. 幀間差分法
  2. 色彩空間
  3. 背景差分法

差分法的實現

  1. 視頻采集
  2. 圖像預處理
  3. 提取背景
  4. 二值化
  5. 獲取前景圖片

第7章 人工神經網絡

  1. 循環神經網絡基本原理:一個序列當前的輸入與前面的輸出有點聯系,在網絡會記憶前面的信息并計算當前的輸出,隱藏層之間的節點是有連接的,隱藏層的輸入包括輸入層的輸出和上一時刻隱藏層的輸出。

簡答題(概念)

  1. 機器學習:機器學習是一種通過數據(經驗)和算法讓計算機從中學習并改善系統自身的性能的技術,分為監督學習、半監督學習、無監督學習。
  2. 人工神經網絡定義:一種模仿人類大腦結構和作用的數學模型,從而模擬人腦神經系統對復雜信息處理。
  3. 循環神經網絡定義:是對序列數據建模的人工神經網絡,目的是處理序列數據。
  4. 深度學習定義:是一種精確的分層學習,指在多個計算階段中精確第分配信用,以轉換網絡中的聚合激活,從而由簡單的基礎來學習和分析處理復雜的問題。
  5. 卷積神經網絡:一種專門用于處理具有網格結構數據的深度學習模型,本質為前饋神經網絡,包括卷積計算且具有深度結構。
  6. 強化學習:解決智能體在與外部環境交互活動的過程中,能夠通過自身學習策略來應對外部環境問題,從而達到回報效益最大化的狀態。
  7. 前饋神經網絡:沒有反饋機制,只能向前傳播而不能反向傳播來調整權值參數的神經網絡模型。
  8. 神經元結構:神經元是ANN中的基本單元,每個神經元接收多個輸入信號(通常包括權重和偏置),對這些輸入信號進行加權求和,然后通過一個激活函數生成輸出。
  9. 感知器:感知機(Perceptron)是一種最簡單的人工神經網絡模型,通常用于二元分類任務。它由輸入層、權重、偏置、激活函數和輸出層組成

第8章 強化學習和深度學習

  1. 卷積層的三個參數:核大小、步長、填充

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/38316.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/38316.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/38316.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ComfyUI局部重繪的四種方式 (附件工作流在最后)

前言 局部重繪需要在圖片中選擇重繪區域,點擊圖片右擊選擇Open in MaskEditor(在蒙版編輯器中打開),用鼠標描繪出需要重繪的區域 方式一:重繪編碼器 這種方式重繪比較生硬,需要額外搭配使用才行 方式二&…

el-upload 上傳圖片及回顯照片和預覽圖片,文件流和http線上鏈接格式操作

<div v-for"(info, index) in zsjzqwhxqList.helicopterTourInfoList" :key"info.id" >編輯上傳圖片// oss返回線上地址http鏈接格式&#xff1a;<el-form-itemlabel"巡視結果照片":label-width"formLabelWidth"><el…

Cyber Weekly #13

賽博新聞 1、谷歌發布最強開源小模型Gemma-2 本周五&#xff08;6月28日&#xff09;凌晨&#xff0c;谷歌發布最強開源小模型Gemma-2&#xff0c;分別為9B&#xff08;90億&#xff09;和27B&#xff08;270億&#xff09;參數規模&#xff0c;其中9B 模型在多項基準測試中均…

潁川韓氏,來自戰國七雄韓國的豪族

潁川是戰國七雄韓國故土&#xff0c;韓國被秦國滅國后&#xff0c;王公貴族們除了堅決反秦的被殺了外&#xff0c;大部分都留存了下來。這些人在楚、漢反秦戰爭中&#xff0c;成為反秦統一戰線的重要力量&#xff0c;其中兩人先后被封為重新恢復的韓國的國王。 一個是橫陽君韓…

Windows系統下,將nginx注冊為本地服【親測可用】

在Windows系統下&#xff0c;將nginx注冊為本地服務并設置為開機自動運行&#xff0c;可以通過以下步驟進行&#xff1a; 下載Windows Service Wrapper&#xff1a; 訪問 WinSW 項目頁面&#xff0c;下載適用于Windows的版本。 準備nginx&#xff1a; 確保你已經下載并解壓了n…

共有5部手機,如果通過服務器讓1號手機執行打開 “閑魚.js“ 腳本

1.手機端Auto.js腳本&#xff1a; 每部手機需要在連接時發送一個唯一的標識符&#xff08;如設備ID&#xff09;&#xff0c;并接收服務器發送的指令以執行指定的腳本。 // Auto.js腳本連接WebSocket服務器并發送設備ID var WebSocket require(ws); var ws new WebSocket(w…

大模型上下文長度擴展中的檢索增強技術簡述

基于Transformer的語言模型在眾多自然語言處理任務上都取得了十分優異的成績&#xff0c;在一些任務上已經達到SOTA的效果。但是&#xff0c;經過預訓練后&#xff0c;模型能夠較好處理的序列長度就固定下來。而當前的眾多場景往往需要處理很長的上下文&#xff08;如&#xff…

CppTest單元測試框架(更新)

目錄 1 背景2 設計3 實現4 使用4.1 主函數4.2 使用方法 1 背景 前面文章單元測試之CppTest測試框架中講述利用宏ADD_SUITE將測試用例自動增加到測試框架中。但在使用中發現一個問題&#xff0c;就是通過宏ADD_SUITE增加多個測試Suite時&#xff0c;每次運行時都是所有測試Suit…

逆向開發環境準備

JDK安裝 AndroidStudio安裝 默認sdk路徑 C:\Users\Administrator\AppData\Local\Android\Sdk 將platform-tools所在的目錄添加到path C:\Users\Administrator\AppData\Local\Android\Sdk\platform-tools 主要目的是使用該目錄下的adb等命令 將tools所在的目錄添加到path C:\Us…

1-5題查詢 - 高頻 SQL 50 題基礎版

目錄 1. 相關知識點2. 例題2.1.可回收且低脂的產品2.2.尋找用戶推薦人2.3.大的國家2.4. 文章瀏覽 I2.5. 無效的推文 1. 相關知識點 sql判斷&#xff0c;不包含null&#xff0c;判斷不出來distinct是通過查詢的結果來去除重復記錄ASC升序計算字符長度 CHAR_LENGTH() 或 LENGTH(…

sqlmap注入詳解

免責聲明:本文僅做分享... 目錄 1.介紹 2.特點 3.下載 4.幫助文檔 5.常見命令 指定目標 請求 HTTP cookie頭 HTTP User-Agent頭 HTTP協議的證書認證 HTTP(S)代理 HTTP請求延遲 設定超時時間 設定重試超時 設定隨機改變的參數值 利用正則過濾目標網址 避免過多的…

Python-爬蟲案例

Python-爬蟲案例 代碼代碼 代碼 import requests import json import threading from queue import Queue import timeclass HeiMaTouTiao:def __init__(self):self.headers {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) ""AppleWebKit/53…

前端筆記-day11

文章目錄 01-空間-平移02-視距03-空間旋轉Z軸04-空間旋轉X軸05-空間旋轉Y軸06-立體呈現07-案例-3D導航08-空間縮放10-動畫實現步驟11-animation復合屬性12-animation拆分寫法13-案例-走馬燈14-案例-精靈動畫15-多組動畫16-全民出游全民出游.htmlindex.css 01-空間-平移 <!D…

基于Spring Boot的在線醫療咨詢平臺的設計與實現【附源碼】

基于Spring Boot的在線醫療咨詢平臺的設計與實現 Design and implementation of the computer hardware mall based on Spring Boot Candidate&#xff1a; Supervisor&#xff1a; April 20th, 2024 學位論文原創性聲明 本人鄭重聲明&#xff1a;所呈交的論文是本人在導師…

初中英語優秀作文分析-006How to Deal with the Exam Stress-如何應對考試壓力

更多資源請關注紐扣編程微信公眾號 記憶樹 1 We students are very busy with schoolwork and in the face of many exams every school day. 翻譯 我們學生忙于功課&#xff0c;每個上學日都面臨許多考試。 簡化記憶 考試 句子結構 We students 主語 我們學生&#xf…

Vite: 高階特性 Pure ESM

概述 ESM 已經逐步得到各大瀏覽器廠商以及 Node.js 的原生支持&#xff0c;正在成為主流前端模塊化方案。 而 Vite 本身就是借助瀏覽器原生的 ESM 解析能力( type“module” )實現了開發階段的 no-bundle &#xff0c;即不用打包也可以構建 Web 應用。不過我們對于原生 ESM 的…

綜合評價類模型——突變級數法

含義 首先&#xff1a;對評價目標進行多層次矛盾分解其次&#xff1a;利用突變理論和模糊數學相結合產生突變模糊隸屬函數再次&#xff1a;由歸一公式進行綜合量化運算最終&#xff1a;歸一為一個參數&#xff0c;即求出總的隸屬函數&#xff0c;從而對評價目標進行排序分析特點…

【linux/shell實戰案例】shell中變量的使用

目錄 一.linux變量聲明及定義 二.linux變量使用方法 三.linux變量使用花括號${name}和雙引號“$name”的區別 四.linux變量使用單引號$name和雙引號“$name”的區別 五.linux變量中使用命令 一.linux變量聲明及定義 #!/bin/bash namezhaodabao 等號兩邊不能有空格變量名…

ES6面試題——箭頭函數和普通函數有什么區別

1. this指向問題 <script> let obj {a: function () {console.log(this); // 打印出&#xff1a;{a: ?, b: ?}},b: () > {console.log(this); // 打印出Window {window: Window, self: Window,...}}, }; obj.a(); obj.b(); </script> 箭頭函數中的this是在箭…

成都市水資源公報(2000-2022年)

數據年限&#xff1a;2000-2022年&#xff0c;無2009年 數據格式&#xff1a;pdf、word、jpg 數據內容&#xff1a;降水量、地表水資源量、地下水資源量、水資源總量、蓄水狀況、平原區淺層地下水動態、水資源情況分析、供水量、用水量、污水處理、洪澇干旱等