機器學習期末

選擇題

  1. 以下哪項不是機器學習的類型?
    A. 監督學習
    B.無監督學習
    C.半監督學習
    D.全監督學習

D

  1. 哪一個是機器學習的合理定義?
    A、機器學習是計算機編程的科學
    B、機器學習從標記的數據中學習
    C、機器學習是允許機器人智能行動的領域
    D、機器學習能使計算機能夠在沒有明確編程的情況下學習

D

  1. 以下哪項是計算機視覺中用于自動圖片標注的核心技術?
    A. 決策樹
    B. 卷積神經網絡(CNN)
    C. 支持向量機(SVM)
    D. 隨機森林

B。
CNN能自動提取圖像特征,是計算機視覺中的核心技術;
支持向量機在許多分類任務中很有效;

  1. 下列不屬于機器學習的主要流派的是

A.符號主義
B.聯想主義(聯結主義)
C.進化主義
D.行為類推主義

B。聯結主義(或稱連接主義)是指神經網絡等方法,它強調通過神經元的連接模擬學習過程。這個術語通常用于神經網絡或深度學習,并不是機器學習的一個獨立流派,而是屬于其中的一部分。

  1. 以下哪種損失函數通常用于回歸任務?
    A) 交叉熵損失
    B) 合頁損失(Hinge Loss)
    C) 均方誤差(MSE)
    D) KL散度

C。A) 交叉熵損失:交叉熵損失函數通常用于分類任務,尤其是用于衡量分類任務中預測的概率分布與真實標簽之間的差異,因此不適用于回歸任務。
B) 合頁損失(Hinge loss):合頁損失函數通常用于支持向量機(SVM)中的分類任務,而不是回歸任務。它通過計算預測結果與正確標簽之間的“合頁”距離來進行優化。
C) 均方誤差損失(MSE):均方誤差(MSE)是回歸任務中最常用的損失函數,它通過計算預測值與真實值之間的平方差來度量模型的表現。在回歸問題中,目標是最小化這個損失函數。
D) KL散度損失:Kullback-Leibler散度(KL散度)用于衡量兩個概率分布之間的差異,雖然它在一些生成模型(如變分自編碼器)中會使用,但它通常不用于回歸任務。

  1. 關于機器學習中偏差(Bias)與方差(Variance)的權衡,以下哪種說法??錯誤???
    A. 增加模型復雜度通常會降低偏差,但可能增加方差
    B. 集成方法(如Bagging)通過降低方差來提升泛化性能
    C. 正則化(如L2正則化)通過增加偏差來減少方差
    D. 高偏差問題表明模型對訓練數據的擬合不足,應減少正則化強度

D
A. 增加模型復雜度通常會降低偏差,但可能增加方差:這個選項是正確的。通常,隨著模型復雜度的增加(例如增加參數或采用更復雜的模型),模型可以更好地擬合訓練數據,從而降低偏差。然而,模型復雜度增加也可能導致過擬合,使模型在訓練數據上表現很好,但在測試數據上表現較差,導致方差增大。
B. 集成方法(如Bagging)通過降低方差來提升泛化性能:這個選項是正確的。集成方法(如Bagging)通過組合多個弱模型來降低方差,尤其是在數據噪聲較大的情況下。Bagging通過訓練多個獨立的模型,并將它們的預測結果結合起來,從而減少模型的方差,提升泛化能力。
C. 正則化(如L2正則化)通過增加偏差來減少方差:這個選項是正確的。正則化(例如L2正則化)通過對模型的復雜度進行約束,限制模型的自由度,防止過擬合。雖然正則化可能會增加偏差,但它通常能顯著減少方差,從而改善模型的泛化能力。
D. 高偏差問題表明模型對訓練數據的擬合不足,應減少正則化強度:這個選項是錯誤的。高偏差通常意味著模型過于簡單,無法有效捕捉數據中的復雜模式(即欠擬合)。在這種情況下,應該 增加模型復雜度 或 減少正則化強度,以便模型能夠更好地擬合訓練數據。然而,如果模型已經很復雜,過度減少正則化可能會導致方差增加,并引發過擬合問題。因此,問題的描述中,“應減少正則化強度”在特定情況下可能不適用,尤其當模型復雜度已經足夠時,反而需要適度增加正則化。
在這里插入圖片描述

  1. 混淆矩陣的精度表示公式為:
    A. TP/(TP+FN)
    B. TP/(TP+FP)
    C. TN/(TN+FN)
    D. TN/(TN+TP)

B.
精度表示的是模型預測為正的實例中,實際上為正的比例,計算公式為 TP/(TP+FP)
A. TP / (TP + FN):這個公式表示的是召回率(Recall),也叫敏感度,即模型正確識別的正類實例占所有真實正類實例的比例。
C. TN / (TN + FN):這個公式表示的是特異度(Specificity),也叫真負率,即模型正確識別的負類實例占所有真實負類實例的比例。

  1. 以下哪種數據類型允許進行算術運算,但不具有絕對零點?
    A) 名義變量
    B) 序數變量
    C) 間隔變量
    D) 比率變量

C

  1. 以下哪項是機器學習模型的過擬合現象?
    A.模型在訓練數據上表現良好,但在測試數據表現不佳
    B.模型在訓練數據上表現不佳,但在測試數據表現良好
    C.模型在訓練數據和測試數據表現良好
    D.模型在訓練數據和測試數據表現不佳

A

  1. 在機器學習中,以下哪種算法屬于監督學習?
    A.K-Means 聚類
    B.主成分分析(PCA)
    C.支持向量機(SVM)
    D.自編碼器

C
監督學習需要利用帶有標簽的數據進行訓練,ACD都是無監督學習
常見的監督學習種類:

  • 支持向量機(SVM):SVM 是一種用于二分類和多分類任務的強大算法。它通過找到一個最優的超平面來將不同類別的數據分隔開。SVM在高維空間中表現良好,并且可以應用于線性和非線性分類問題。
  • 決策樹(Decision Trees):決策樹是一種基于樹結構的分類和回歸算法。它通過在特征上進行遞歸的二分決策來進行分類或預測。決策樹易于理解和解釋,并且對于數據的處理具有良好的適應性。
  • 邏輯回歸(Logistic Regression):邏輯回歸是一種廣泛應用于二分類問題的線性模型。盡管名字中帶有"回歸",但它主要用于分類任務。邏輯回歸輸出預測的概率,并使用邏輯函數將連續輸出映射到[0, 1]的范圍內。
  • K近鄰算法(K-Nearest Neighbors,KNN):KNN 是一種基于實例的學習方法。它根據距離度量來對新樣本進行分類或回歸預測。KNN使用最接近的K個訓練樣本的標簽來決定新樣本的類別。
  1. 以下關于機器學習算法應用場景的描述中,錯誤的是:
    A. 樸素貝葉斯算法常用于文本分類任務中的垃圾郵件過濾
    B. 循環神經網絡(RNN)特別適合處理時間序列數據,如股票價格預測
    C. 聚類算法(如 K-Means)需要標注好的訓練樣本才能劃分數據類別
    D. 強化學習在自動駕駛領域中通過試錯機制優化決策策略

C
聚類算法(如K-Means)屬于??無監督學習??,其核心特點是不依賴標注數據,而是通過數據內在結構(如距離、密度)自動劃分類別。
標注數據是監督學習的要求。

  1. 哪個不是測量中心傾向的方法
    A均值。B中位數。C眾數。D方差

D
中心傾向指標用于描述數據集的“中心位置”或典型值,方差??屬于??離散程度指標??,衡量數據分布的波動性或分散程度(如數據偏離均值的程度),而非中心位置。

  1. 在機器學習中,當出現過擬合(Overfitting)現象時,以下哪種方法不能用來解決這個問題?
    A. 增加訓練數據
    B. 增加模型復雜度
    C. 使用數據增強(如翻轉、旋轉、添加噪聲)
    D. 使用更強的正則化方法(如 dropout、drop - connect、L?)

B
增加模型復雜度通常會降低偏差,但可能增加方差

  1. 支持向量機算法屬于 ()
    A. 決策樹學習
    B. 統計學習
    C. 集成學習
    D.記憶學習

B

  1. 以下屬于解決模型欠擬合的方法是?
    A、增加訓練數據量
    B、對模型進行裁剪
    C、增加訓練過程的迭代次數
    D、正則化

C.

對于 B,增加訓練數據量??,常用于解決過擬合(通過數據多樣性增強泛化能力),而非改善欠擬合。若模型復雜度不足,增加數據可能無濟于事。

  1. 在邊緣檢測中,以下哪種算子對噪聲最敏感,且未進行高斯平滑處理?

A. Sobel 算子
B. Prewitt 算子
C. Canny 算子
D. Laplacian 算子

D

  1. 在卷積神經網絡(CNN)中,關于池化層(Pooling Layer)的作用,以下哪項描述是錯誤的?

A. 池化層通過降采樣減少特征圖的空間尺寸,從而降低計算復雜度。
B. 最大池化(Max Pooling)能夠保留局部區域的顯著特征,增強模型的平移不變性。
C. 平均池化(Average Pooling)通過計算局部區域的平均值,有助于抑制噪聲影響。
D. 池化層通過反向傳播自動學習最優的池化核參數,類似于卷積層的權重更新。

D
池化層(如最大池化、平均池化)是??無參數操作??,其核內計算(如取最大值/平均值)是預定義的,不涉及權重學習。

  1. 在深度神經網絡的訓練過程中,若遇到梯度消失問題,下面哪種方案最能有效緩解這一問題?
    A. 繼續使用 Sigmoid 激活函數
    B. 提高學習率以加速梯度傳遞
    C. 將激活函數替換為 ReLU 或其變體(如 Leaky ReLU)
    D. 增加網絡層數,以強化模型的特征提取能力

C

  1. 假設有一個釣魚式攻擊或惡意軟件分類模型,其中釣魚式攻擊網站和惡意軟件網站屬于標記為 1(true)的類別,無害網站屬于標記為 0(false)的類別。此模型誤將合法網站歸類為惡意軟件。這叫什么?
    A、假負例
    B、真正例
    C、真負例
    D、假正例

D
注意這里將釣魚網站定義為正例。

  1. 以下哪一項不是單神經元模型的組成部分?
    A. 輸入特征x
    B. 激活函數g
    C. 損失函數L
    D. 輸入特征x的平方

B

  1. 在機器學習中,特征歸一化的目的是什么

A. 增加模型的復雜度
B. 加快模型的訓練
C. 使不同特征的數值范圍一致
D. 減少特征之間的相關性

C

  1. 以下哪種方法可以緩解過擬合(Overfitting)?
    A. 減少訓練數據量 B. 增加模型復雜度 C. 添加L2正則化 D. 刪除部分特征

C
雖然正則化可能帶來偏差,但能極大降低方差,緩解過擬合
此外,增加數據也能緩解過擬合

  1. 在邏輯回歸中,假設函數 hθ?(x)=g(θTx) 使用的激活函數 g(z) 是:
    A. Sigmoid 函數
    B. ReLU 函數
    C. 雙曲正切函數
    D. 恒等函數

A

  1. 以下關于降維說法不正確的是?
    A.降維是將訓練樣本從高維空間轉換到低維空間
    B.降維有助于數據可視化
    C.通過降維可以更有效地挖掘有意義的數據結構
    D.降維不會對數據產生損傷

D

  1. 決策樹學習的關鍵是?
    A.初始結點選擇
    B.剪枝
    C.選擇最優劃分屬性
    D.分枝

C

  1. 線性回歸和邏輯回歸屬于無監督學習算法

錯誤
回歸是監督學習的一種任務

  1. Sigmoid函數是一種通用的激活函數,現在大多數情況下都在使用

錯誤

  • Sigmoid 的導數在輸入值較大或較小時趨近于零,導致反向傳播時梯度幾乎消失,深層網絡難以訓練。
  • Sigmoid 的輸出范圍是 (0,1),導致后續層的輸入始終為正,可能引發參數更新時的鋸齒形路徑,降低收斂效率。
  • Sigmoid 涉及指數運算,計算成本高于 ??ReLU?? 的簡單閾值操作(max(0,x))。
    ??
    當前主流激活函數??為 ??ReLU 及其變體??
  1. 貝葉斯優化(Bayesian Optimization)在超參數調優過程中不依賴任何先驗假設,僅通過隨機采樣選擇下一組評估的超參數。

錯誤

  1. 當出現過擬合時,驗證集損失(Validation loss)會一直下降。

錯誤
驗證損失持續下降通常表明模型仍在有效學習,而過擬合的標志是驗證損失在達到最低點后明顯回升

  1. 在深度神經網絡中,Dropout 技術僅在訓練階段啟用以減少過擬合,而在測試階段禁用 Dropout,從而確保所有神經元都參與前向傳播。

正確

  1. 在機器學習中,K近鄰(KNN)算法在訓練階段不需要進行模型訓練,直接存儲所有訓練數據即可。

正確

  1. 無監督學習不需要任何標簽數據,完全依靠算法自動發現數據中的模式或結構。

錯誤

  1. 在機器學習任務中,如果目標是預測一個網站明天是否被DDoS攻擊(是/否),那么這屬于一個回歸問題。

錯誤,這是一個分類問題(具體為二分類任務)

  1. 主成分分析(PCA)是一種數據增維方法

錯誤
PCA 通過正交變換將原始高維數據投影到低維空間(主成分),??保留最大方差的方向??,從而減少特征數量、去除冗余信息,屬于典型的??降維技術??。

  1. 聚類只能在已有數據集上進行分簇,不具備對新數據的預測能力

正確

  1. 在神經網絡中,在反向傳播的向后傳遞過程中,從輸入層開始計算誤差信號(δ),然后向前傳播到輸出層。

錯誤。在神經網絡中,反向傳播的誤差信號(δ)是從輸出層開始計算,然后向后傳遞(即向輸入層方向傳播),而非從輸入層開始向前傳播。?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/901806.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/901806.shtml
英文地址,請注明出處:http://en.pswp.cn/news/901806.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

3DMAX粒子流樣條線生成器PFSpliner使用方法詳解

3DMAX粒子流樣條線生成器,是一款功能強大且富有創意的工具。它能夠為“粒子流源”的每一個粒子生成專屬的動畫樣條線,這些樣條線描繪出粒子在空間中的運動軌跡,就如同為粒子繪制出了一條條獨特的“運動地圖”。更為出色的是,這些樣…

Maven中clean、compil等操作介紹和Pom.xml中各個標簽介紹

文章目錄 前言Maven常用命令1.clean2.vaildate3.compile4.test5.package6.verify7.install8.site9.deploy pom.xml標簽詳解格式<?xml version"1.0" encoding"UTF-8"?>(xml版本和編碼)modelVersion&#xff08;xml版本&#xff09;groupId&#xff…

Centos7.6安裝JDK 1.8教程

前提&#xff1a;先把jdk1.8文件上傳到usr/local目錄下&#xff0c;文件名如&#xff1a;jdk-8u151-linux-x64.tar.gz 1. 解壓 JDK 壓縮包 假設 jdk-8u151-linux-x64.tar.gz 文件位于 /usr/local 目錄下。 進入 /usr/local 目錄&#xff1a; cd /usr/local 解壓文件&#…

EuroCropsML:首個面向少樣本時間序列作物分類的多國基準數據集

2025-04-15&#xff0c;由慕尼黑工業大學等機構創建的 EuroCropsML 數據集&#xff0c;這是一個結合了農民報告的作物數據與 Sentinel-2 衛星觀測的時間序列數據集&#xff0c;覆蓋了愛沙尼亞、拉脫維亞和葡萄牙。該數據集為解決遙感應用中作物類型數據空間不平衡問題提供了新的…

將python項目打包成Windows后臺服務

前文,我開發了一個基于windows11與本地deepseek實現的語音助手,之前是通過CMD直接執行項目的main.py文件。但是這樣不適合移植,現在想將其生成一個exe文件,以及部署成windows的后臺服務。 關于語音助手的開發與發布,可以看的CSDN文章:一個基于windows11與本地deepseek實…

yolov8復現

Yolov8的復現流程主要包含環境配置、下載源碼和驗證環境三大步驟&#xff1a; 環境配置 查看電腦狀況&#xff1a;通過任務管理器查看電腦是否有獨立顯卡&#xff08;NVIDIA卡&#xff09;。若有&#xff0c;后續可安裝GPU版本的pytorch以加速訓練&#xff1b;若沒有&#xff0…

Yocto項目實戰教程 · 第4章:4.1小節元數據

&#x1f50d; B站相應的視頻教程&#xff1a; &#x1f4cc; Yocto項目實戰教程-第4章-4.1小節-元數據 記得三連&#xff0c;標為原始粉絲。 在嵌入式Linux系統構建中&#xff0c;Yocto項目憑借其高度模塊化、可配置的特性成為主流工具。而其背后的關鍵支撐之一&#xff0c;便…

《AI大模型應知應會100篇》第23篇:角色扮演技巧:讓AI成為你需要的專家

第23篇&#xff1a;角色扮演技巧&#xff1a;讓AI成為你需要的專家 摘要 在當今人工智能快速發展的時代&#xff0c;大模型已經不僅僅是簡單的問答工具&#xff0c;它們可以通過角色扮演技巧模擬各類專家身份&#xff0c;從而為用戶提供更專業、更有針對性的服務。本文將深入探…

Windows系統安裝RustDesk Server的詳細步驟和客戶端設置

Windows系統安裝RustDesk Server的詳細步驟 在Windows系統上安裝RustDesk Server涉及幾個關鍵步驟,包括安裝必要的依賴、下載RustDesk Server程序、配置并啟動服務。以下是詳細的步驟: 1. 安裝Node.js和PM2 RustDesk Server的某些版本可能需要Node.js環境來運行,而PM2是一…

如何實現一個構造函數繼承另一個構造函數的屬性和方法?給出ES5和ES6兩種方式

在 JavaScript 中&#xff0c;構造函數繼承可以通過 原型鏈 和 構造函數調用 實現。以下是 ES5 和 ES6 的實現方式&#xff1a; ES5 實現方式 關鍵步驟 繼承實例屬性&#xff1a;在子構造函數中調用父構造函數的 call/apply&#xff0c;綁定 this。繼承原型方法&#xff1a;將…

AWS Redshift的使用場景及一些常見問題

Redshift 不是關系型數據庫, 提供了Amazon Redshift Serverless 和 Amazon Redshift 都是構建于 Redshift 數倉引擎之上的&#xff0c;但它們適用的場景不同。Redshift和Dynamodb都可以存儲數據, 分別怎么選擇? 這里記錄一些常見的問題和場景。 1. 如何選擇用Amazon Redshift…

十五種光電器件綜合對比——《器件手冊--光電器件》

十五、光電器件 名稱 原理 特點 應用 發光二極管&#xff08;LED&#xff09; 基于半導體材料的電致發光效應&#xff0c;當電流通過時&#xff0c;電子與空穴復合&#xff0c;釋放出光子。 高效、節能、壽命長、響應速度快、體積小。 廣泛用于指示燈、照明、顯示&#…

Electricity Market Optimization(VI) - 機組組合模型以及 Gurobi 求解

本文參考鏈接&#xff1a;link \hspace{1.6em} 機組組合問題在電力系統中非常重要&#xff0c;這個問題也是一個優化問題&#xff0c;研究的就是如何調度現有的機組&#xff0c;調度的對象是以煤炭、石油、天然氣為燃料的火力發電機以及水力發電機等可預測處理的發電機組&#…

linux多線(進)程編程——(8)多進程的沖突問題

前言 隨著時間的推移&#xff0c;共享內存已經在修真界已經淪為禁術。因為使用這種方式溝通的兩人往往會陷入到走火入魔的狀態&#xff0c;思維扭曲。進程君父子見到這種情況&#xff0c;連忙開始專研起來&#xff0c;終于它們發現了共享內存存在的問題&#xff1a; 進程間沖…

網絡層IP協議知識大梳理

全是通俗易懂的講解&#xff0c;如果你本節之前的知識都掌握清楚&#xff0c;那就速速來看我的IP協議筆記吧~ 自己寫自己的八股&#xff01;讓未來的自己看懂&#xff01; &#xff08;全文手敲&#xff0c;受益良多&#xff09; 網路基礎3 網路層 TCP并沒有把數據發到網路…

數據結構與算法學習導航

目錄 指導思想資料總結代碼隨想錄hello-algoOI-WIKI 一名麻瓜的刷leetcode的簡單概述。 在這里對過去的自己說: 如果你相信算法有用你就刷刷leetcode&#xff0c;如果不相信面試會讓你相信。 當然&#xff0c;現在我確實認為算法和數據結構有用&#xff0c;leetcode也有用。 …

【網絡安全】誰入侵了我的調制解調器?(二)

文章目錄 針對 TR-069 協議 REST API 的攻擊思路攻擊百萬臺調制解調器意外發現 Cox 后端 API 的授權繞過漏洞確認我們能夠進入任何人的設備訪問和更新任何Cox商業客戶賬戶通過泄露的加密密鑰覆蓋任何人的設備設置執行對任何調制解調器的命令影響最后想說閱讀本文前,請先行瀏覽…

大模型在急性單純性闌尾炎預測及治療方案制定中的應用研究

目錄 一、引言 1.1 研究背景與意義 1.2 研究目的 1.3 研究方法與創新點 二、急性單純性闌尾炎概述 2.1 定義與發病機制 2.2 臨床表現 2.3 傳統診斷方法 三、大模型在急性單純性闌尾炎預測中的應用 3.1 大模型簡介 3.2 數據收集與處理 3.3 模型訓練與優化 3.4 預測…

Linux 上安裝和配置 VNC 遠程桌面

在 Linux 上安裝和配置 VNC&#xff08;Virtual Network Computing&#xff09;可以讓你遠程訪問圖形化桌面環境。以下是詳細的安裝和配置步驟&#xff0c;適用于主流 Linux 發行版&#xff08;如 Ubuntu、CentOS、Debian 等&#xff09;。 1. 安裝 VNC 服務器 Ubuntu/Debian …

《AI大模型應知應會100篇》第22篇:系統提示詞(System Prompt)設計與優化

第22篇&#xff1a;系統提示詞(System Prompt)設計與優化 摘要 在大語言模型&#xff08;LLM&#xff09;應用中&#xff0c;系統提示詞&#xff08;System Prompt&#xff09;是控制模型行為的核心工具之一。它不僅定義了模型的身份、角色和行為規范&#xff0c;還直接影響輸…