機器學習基礎概念

1.機器學習定義

2.機器學習工作流程

? ? ? ? (1)數據集

? ? ? ? ? ? ? ? ①一行數據:一個樣本

? ? ? ? ? ? ? ? ②一列數據:一個特征

? ? ? ? ? ? ? ? ③目標值(標簽值):有些數據集有目標值,有些數據集沒有。因此數據類型由特征值+目標值構成或僅由特征值構成。

? ? ? ? (2)數據分割:機器學習的數據集一般劃分為訓練數據(用于構建模型)和測試數據(用于模型評估)兩個部分,劃分比例一般為7:3、4:1、3:1。

? ? ? ? (3)數據基本處理:對數據的缺失值、異常值進行處理

? ? ? ? (4)特征工程(Feature Engineering):處理數據使特征在機器學習上更好發揮作用的過程

? ? ? ? ? ? ? ? 注:業界流傳,數據和特征決定機器學習的上限,而模型和算法只是逼近這個上限

? ? ? ? ? ? ? ? ①特征提取:將任意數據(如文本或圖像)轉為可用于機器學習的數字特征

? ? ? ? ? ? ? ? ②特征預處理:通過一些轉換函數將特征數據轉成更適合算法模型的特征數據

? ? ? ? ? ? ? ? ③特征降維:在某些限定條件下,降低隨機變量(特征)個數得到一組不相關的主變量

? ? ? ? (5)機器學習:選擇合適的算法對模型進行訓練

? ? ? ? (6)模型評估:對訓練好的模型進行評估

3.機器學習算法分類(根據數據集組成不同進行劃分)

? ? ? ? (1)監督學習:輸入數據由特征值和目標值組成,函數的輸出(目標值)可以是一個連續的值(回歸)或是有限個離散值(分類)

? ? ? ? ? ? ? ? ①回歸問題:預測房價,根據樣本集擬合出一條連續曲線

? ? ? ? ? ? ? ? ②分類問題:根據腫瘤特征預測是良性還是惡性

? ? ? ? (2)無監督學習:輸入數據由特征值組成,輸入的數據沒有被標記也沒有確定結果,樣本數據類別未知,需根據樣本間的相似性對樣本集進行類別劃分

? ? ? ? (3)半監督學習:訓練集同時包含有標記(有目標值)數據和未標記(沒有目標值)數據

? ? ? ? (4)強化學習:實質是做決策問題,即自動進行決策,并且可以做連續決策,強化學習的目標就是獲得最多的累計獎勵

4.模型評估

? ? ? ? (1)分類模型評估:準確率(預測正確的數占樣本總數的比例)、精確率、召回率、F1-score、AUC指標

? ? ? ? (2)回歸模型評估:均方根誤差RMSE(p_i為預測值,a_i為實際值)、相對平方誤差RSE、平均絕對誤差MAE、相對絕對誤差RAE

? ? ? ? (3)模型表現效果:過擬合(所建的機器學習模型在訓練樣本中表現得過于優越,導致在測試數據集中表現不佳)、欠擬合(模型學習太粗糙,連訓練集中樣本數據的特征關系都沒有學出來)

5.深度學習:也稱深度結構學習、層次學習、深度機器學習,是一類算法集合,是機器學習的一個分支,在會話識別、圖像識別和對象偵測等領域表現出驚人的準確性。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/38893.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/38893.shtml
英文地址,請注明出處:http://en.pswp.cn/web/38893.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Java實現圖書管理系統

一、框架 1. 創建類 用戶:管理員AdminUser 普通用戶NormalUser 繼承抽象類User 書:書Book 書架BookList 操作對象:書Book 2. 知識點 主要涉及的知識點:數據類型 變量 if for 數組 方法 類和對象 封裝繼承多態 抽象類和接口 …

Linux運維之需掌握的基本Linux命令

前言:本博客僅作記錄學習使用,部分圖片出自網絡,如有侵犯您的權益,請聯系刪除 目錄 一、SHELL 二、執行命令 三、常用系統工作命令 四、系統狀態檢測命令 五、查找定位文件命令 六、文本文件編輯命令 七、文件目錄管理命令…

【JavaWeb】登錄校驗-會話技術(一)Cookie與Session

登錄校驗 實現登陸后才能訪問后端系統頁面,不登陸則跳轉登陸頁面進行登陸。 首先我們在宏觀上先有一個認知: HTTP協議是無狀態協議。即每一次請求都是獨立的,下一次請求并不會攜帶上一次請求的數據。 因此當我們通過瀏覽器訪問登錄后&#…

go語言怎么獲取文件的大小并且轉化為kb為單位呢?

在Go語言中,你可以使用os包中的IsExist和Stat函數來獲取文件的信息,包括文件的大小。文件的大小通常是以字節為單位的,但你可以很容易地將其轉換為KB(千字節)。 下面是一個簡單的Go程序示例,該程序打開指定…

Simulink 模型生成 C 代碼(一):使用 Embedded Coder 快速向導生成代碼

以matlab自帶的示例模型RollAxisAutopilot為例進行講解。RollAxisAutopilot為飛機自動駕駛控制系統模型。 使用快速向導工具生成代碼 通過鍵入以下命令打開模型 RollAxisAutopilot: openExample(RollAxisAutopilot); 如果 C 代碼選項卡尚未打開,請在 …

【C++】宏定義

嚴格來說,這個題目起名為C是不合適的,因為宏定義是C語言的遺留特性。CleanCode并不推薦C中使用宏定義。我當時還在公司做過宏定義為什么應該被取代的報告。但是適當使用宏定義對代碼是有好處的。壞處也有一些。 無參宏定義 最常見的一種宏定義&#xf…

makefile總結

1,Makefile規則介紹 一個簡單的 Makefile 描述規則組成: TARGET... : PREREQUISITES... COMMAND 注意: 每一個命令行必須以[Tab]字符開始, [Tab]字符告訴 make 此行是一個命令行。 make 按照命令完成相應的動作。這也是書寫 Makefile 中容易產生,而且比較隱蔽的錯…

油煙凈化器:餐飲業健康環保的守護者

我最近分析了餐飲市場的油煙凈化器等產品報告,解決了餐飲業廚房油膩的難題,更加方便了在餐飲業和商業場所有需求的小伙伴們。 在現代餐飲業,油煙凈化器已經成為不可或缺的重要設備。它不僅是保障餐飲環境清潔的利器,更是守護健康…

新聲創新20年:無線技術給助聽器插上“娛樂”的翅膀

聽力損失并非現代人的專利,古代人也會有聽力損失。助聽器距今發展已經有二百多年了,從當初單純的聲音放大器到如今的全數字時代助聽器,助聽器發生了翻天覆地的變化,現代助聽器除了助聽功能,還具有看電視,聽…

【LeetCode】368. 最大整除子集

雖然這題挺難寫的,但是仍然提醒了我:解題要注意方法。在明確分析當一條道路走不通的時候,就不要再猶豫了,就要果斷的換方法,嘗試用其它方法解決。否則一味的消耗時間,得不償失。換方法的前提是明確的分析&a…

C++ 和C#的差別

首先把眼睛瞪大,然后憋住一口氣,讀下去: 1、CPP 就是C plus plus的縮寫,中國大陸的程序員圈子中通常被讀做"C加加",而西方的程序員通常讀做"C plus plus",它是一種使用非常廣泛的計算…

Maya崩潰閃退常見原因及解決方案

Autodesk Maya 是一款功能強大的 3D 計算機圖形程序,被電影、游戲和建筑等各個領域的設計師廣泛使用。然而,Maya 就像任何其他軟件一樣可能會發生崩潰問題。在前文中,小編給大家介紹了3ds Max使用V-Ray渲染時的崩潰閃退解決方案: …

Neo4j 圖數據庫 高級操作

Neo4j 圖數據庫 高級操作 文章目錄 Neo4j 圖數據庫 高級操作1 批量添加節點、關系1.1 直接使用 UNWIND 批量創建關系1.2 使用 CSV 文件批量創建關系1.3 選擇方法 2 索引2.1 創建單一屬性索引2.2 創建組合屬性索引2.3 創建全文索引2.4 列出所有索引2.5 刪除索引2.6 注意事項 3 清…

后端之路第三站(Mybatis)——JDBC跟Mybatis、lombok

一、什么是JDBC JDBC就是sun公司研發的一套通過java來操控數據庫的工具,對應不同的數據庫系統有不同的JDBC,而他們統稱【驅動】,這就是上一篇我們提到創建Mybatis項目時要引入的依賴、以及連接數據庫四要素里的第一要素。 JDBC有自己一套原始…

SerialportToTCP② 全

效果補全(代碼): namespace SerialportToTCP {public partial class Form1 : Form{IniHelper Ini;string[] botelvs new string[] { "1200", "4800", "9600", "13200" };public Form1(){Initializ…

Elasticsearch:Painless scripting 語言(一)

Painless 是一種高性能、安全的腳本語言,專為 Elasticsearch 設計。你可以使用 Painless 在 Elasticsearch 支持腳本的任何地方安全地編寫內聯和存儲腳本。 Painless 提供眾多功能,這些功能圍繞以下核心原則: 安全性:確保集群的…

安卓gdb 建立鏈接

adbshell gdbserver :1234 testdcam --sensor 0 --workmode 0 --args preview-size1024x600,picture-size640x480, --time 10 adb forwardtcp:1234 tcp:1234 //設置adb的轉發 ./prebuilts/gcc/linux-x86/arm/arm-linux-androideabi-4.7/bin/arm-linux-androideabi-gdb out/tar…

近紅外光譜腦功能成像(fNIRS):1.光學原理、變量選取與預處理

一、朗伯-比爾定律與修正的朗伯-比爾定律 朗伯-比爾定律 是一個描述光通過溶液時被吸收的規律。想象你有一杯有色液體,比如一杯紅茶。當你用一束光照射這杯液體時,光的一部分會被液體吸收,導致透過液體的光變弱。朗伯-比爾定律告訴我們&#…

mmdetection3D指定版本安裝指南

1. 下載指定版本號 選擇指定版本號下載mmdetection3d的源碼,如這里選擇的是0.17.2版本 git clone https://github.com/open-mmlab/mmdetection3d.git -b v0.17.22. 安裝 cd mmdetection3d安裝依賴庫 pip install -r requirment.txt編譯安裝 pip install -v e .…

redis主從復制哨兵模式集群管理

主從復制: 主從復制是高可用Redis的基礎,哨兵和集群都是在主從復制基礎上實現高可用的。主從復制主要實現了數據的多機備份,以及對于讀操作的負載均衡和簡單的故障恢復。缺陷:故障恢復無法自動化;寫操作無法負載均衡&…