人工智能學習:機器學習相關面試題(一)

1、 機器學習中特征的理解

def:?特征選擇和降維

特征選擇:原有特征選擇出子集?,不改變原來的特征空間

降維:將原有的特征重組成為包含信息更多的特征,?變了原有的特征空間降維的主要方法

????????Principal?Component Analysis?(主成分分析)

????????Singular Value?Decomposition?(奇異值分解)

特征選擇的方法

????????Filter?方法?卡方檢驗、信息增益、相關系數

????????Wrapper?方法?其主要思想是:將子集的選擇看作是一個搜索尋優問題?,生成不同的組?,對組合進行評價?,再與其他的組合進行比較。這樣就將子集的選擇看作是一個是一個優化問題?,這里有很多的優化算法可以解決?,尤其是一些啟發式的優化算法?,如??GA?PSO?DE?ABC??,詳見“優化算法?—— ?人工蜂群算法 ?(ABC)”,“優化算法 ?—— ?粒子群算法 ?(PSO)”。

????????Embedded?方法?其主要思想是?:在模型既定的情況下學習出對提高模型準確性最好的屬性。這句話并不是很好理解?,其實是講在確定模型的過程中?,挑選出那些對模型的訓練有重要意義的屬性。

????????主要方法?:正則化。?嶺回歸就是在基本線性回歸的過程中加入了正則項。

2、機器學習中?,有哪些特征工程方法?

數據和特征決定了機器學習的上限,??模型和算法只是逼近這個上限

(1)計算每?個特征與相應變量的相關性:??程上常?段有計算?爾遜系數和互信息系數,??爾遜系數只能衡量線性相關性?互信息系數能夠很好地度量各種相關性,但是計算相對復雜?些,好在很多toolkit?邊都包含了這個?具(如??sklearnMINE?得到相關性之后就可以排序選擇特征了;

(2)構建單個特征的模型?,通過模型的準確性為特征排序?,借此來選擇特征;

(3)通過L1正則項來選擇特征:?L1正則?法具有稀疏解的特性,?因此天然具備特征選擇的特性?,但是要注意,L1沒有選到的特征不代表不重要,原因是兩個具有?相關性的特征可能只保留了?個,如果要確定哪個特征重要應再通過L2正則?法交叉檢驗*;

(4)訓練能夠對特征打分的預選模型:RandomForestLogistic?Regression等都能對模型的特征打分,通過打分獲得相關性后再訓練最終模型;

(5)通過特征組合后再來選擇特征?:如對id戶特征最組合來獲得較的特征集再來選擇特征?,這種做法在推薦系統和?告系統中?較常,這也是所謂億級甚至 十?億級特征的主要來源?,原因是?戶數據?較稀疏?,組合特征能夠同時兼顧全局模型和個性化模型?,這個問題有機會可以展開講。

(6)通過深度學習來進?特征選擇:?前這種?段正在隨著深度學習的流行而?成為???,尤其是在計算機視覺領域?,原因是深度學習具有動學習特征的能?,這也是深度學unsupervised?feature

????????learning的原因。從深度學習模型中選擇某?神經層的特征后就可以來進?最終模型的訓練了。

3、機器學習中的正負樣本

????????在分類問題中?,這個問題相對好理解?點,???臉識別中的例,正樣本很好理解?,就是?臉的圖?

????????負樣本的選取就與問題場景相關?,具體而 言 ,如果你要進?教室中學?臉識別?,那么負樣本就是教室的窗、墻等等?,也就是??,不能是與你要研究的問題毫不相關的亂七?糟的場景圖,這樣的負樣本并沒有意義。負樣本可以根據背景?成,

????????有時候不需要尋找額外的負樣本。—?般3000-10000的正樣本需要5,000,000-100,000,000的負樣本來學習,在互?領域?般在?模前將正負?例通過采樣的?法調整到3)1-5:1。

4、線性分類器與非線性分類器的區別及優劣

區別:所謂線性分類器即用 —?個超平?將正負樣本分離開?,表達式為 ??y?=wx????。?強調的是平?

????????而非?線性的分類界?沒有這個限制,可以是曲?,多個超平的組合等。典型的線性分類器有感知機,LDA邏輯斯特回歸,?SVM(線性核);

????????典型的非?線性分類器有樸素葉斯(有?章說這個本質是線性的,http://dataunion.org/12344.html),kNN,決策樹,?SVM(??線性核)

優缺點:?1.線性分類器判別簡單、易實現、且需要的計算量和存儲量?

????????為解決比?較復雜的線性不可分樣本分類問題?,提出?線性判別函數。超曲??線性判別函數計算復雜,

????????實際應用 上受到較的限制。在線性分類器的基礎上,?分段線性分類器可以實現復雜的分類。解決問?較簡便的?法是采多個線性分界?將它們分段連接,?分段線性判別劃分去逼近分界的超曲?

????????如果—?個問題是?線性問題并且它的類邊界不能夠線性超平?估計得很好?,那么?線性分類器通常會線性分類器表現得更精準。如果?個問題是線性的?,那么最好使簡單的線性分類器來處理。

5、如何解決過擬合問題

解釋過擬合:

????????模型在訓練集表現好?,在真實數據表現不好,?即模型的泛化能不夠。從另外?方 面?來講,模型在達到經驗損失最的時候?,模型復雜度較?,結構險沒有達到最優。

解決:

????????學習方?法上:?限制機器的學習?,使機器學習特征時學得不那么徹底,?因此這樣就可以降低機器學到局部特征和錯誤特征的??,使得識別正確率得到優化.

????????數據上?:要防?過擬合?,做好特征的選取。訓練數據的選取也是很關鍵的,?良好的訓練數據本身的局部特征應盡可能少,?噪聲也盡可能.

6、L1L2正則的區別,如何選擇L1L2正則

L0正則化的值是模型參數中?零參數的個數。

????????也就是如果我們使用 L0范數?,即希望w的?部分元素都是0.??w是稀疏的)所以可以ML中做稀疏編碼,特征選擇。通過最?化L0范數?,來尋找最少最優的稀疏特征項。但不幸的是,?L0范數的最優化問題是?NP?hard問題,??且理論上有證明,?L1范數是L0范數的最優凸近似?因此通常使L1范數來代替。

L1正則化表示各個參數絕對值之和。

????????L1范數的解通常是稀疏性的?,傾向于選擇數較少的???的值或者數較多的insignificant值。

????????L2正則化標識各個參數的平的和的開?值。

????????L2范數越小 ,可以使得w的每個元素都很,接近于0?,但L1范數不同的是他不會讓它等于0?是接近于0.

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/94938.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/94938.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/94938.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

亞馬遜巴西戰略升級:物流網絡重構背后的生態革新與技術賦能之路

在全球電商版圖中,拉美市場正以驚人的增長速度成為新的戰略高地,而巴西作為其中的核心市場,憑借龐大的人口基數、高速發展的數字經濟以及不斷提升的消費能力,吸引著眾多電商巨頭爭相布局。近日,亞馬遜宣布將于2025年底…

PS自由變換

自由變換 自由變換用來對圖層、選區、路徑或像素內容進行靈活的像素調整。可以進行縮放、旋轉、扭曲等多種操作。快捷鍵:CtrlT,操作完成后使用Enter鍵可以確認變換自由變換過程中如果出現失誤,可以按ESC退出;滿意可以按enter確定。…

【K8s】整體認識K8s之存儲--volume

為什么要用volume?首先。容器崩潰或重啟時,所有的數據都會丟失,我們可以把數據保存到容器的外部,比如硬盤nfs,這樣,即使容器沒了,數據還在;第二就是容器之間是隔離的。我們如果想共享…

flutter工程

安裝flutter 在VSCode中安裝flutter extension、flutter組件 國內源下載flutter 3.35.2的SDK,安裝,官網下載不了 將flutter安裝目錄加入環境變量中 D:\program\flutter_sdk\flutter\bin 執行 C:\Windows\System32>flutter --version Flutter 3.35.2 ?…

C/C++ 高階數據結構 —— 二叉搜索樹(二叉排序樹)

? 🎁個人主頁:工藤新一 ? 🔍系列專欄:C面向對象(類和對象篇) ? 🌟心中的天空之城,終會照亮我前方的路 ? 🎉歡迎大家點贊👍評論📝收藏?文章…

stm32F4掛載emmc以及重定義printf

1.Cubemx SDIO USART 使用串口輸出調試信息 FATFS Clock Configuration 防止堆棧溢出 2.Keil5 新建自定義文件夾及文件 將文件夾添加進工程 新建.c與.h文件,保存到自定義的文件夾,并添加到工程中 bsp_emmc.c #include "bsp_emmc.h" #include…

基于AI的大模型在S2B2C商城小程序中的應用與定價策略自我評估

摘要:本文聚焦電商行業,結合開源AI大模型與AI智能名片S2B2C商城小程序的技術特性,提出基于行業數據挖掘與自我評估的定價策略。通過分析行業價格分布與銷量占比,結合商品設計、品牌創意度、商品豐富度及內功等評估指標&#xff0c…

中國移動云電腦一體機-創維LB2004_瑞芯微RK3566_2G+32G_開ADB安裝軟件教程

中國移動云電腦一體機-創維LB2004_瑞芯微RK3566_2G32G_開ADB安裝軟件教程簡介:中國移動云電腦一體機-創維LB2004,顯示器是23.8英寸1920x1080分辨率,安卓盒子配置是瑞芯微RK3566-四核-1.8GHz處理器-2G32G,預裝Android11系統。具體操…

普藍自研AutoTrack-4X導航套件平臺適配高校機器人實操應用

在當前高校機器人工程、人工智能、自動化等專業的教學與科研中,師生們常常面臨一個核心痛點:缺乏一套 “開箱即用、可深研、能落地” 的自主移動導航平臺 —— 要么是純仿真環境脫離實際硬件,要么是硬件零散需大量時間搭建,要么是…

2025年工會證考試題庫及答案

一、單選題1.工會法人資格審查登記機關自收到申請登記表之日起(??)日內對有關申請文件進行審查,對審查合格者,辦理登記手續,發放《工會法人資格證書》及其副本和《工會法人法定代表人證書》。A.二十B.十五C.六十D.三十答案:D 解析:第七條基…

【OpenGL】LearnOpenGL學習筆記17 - Cubemap、Skybox、環境映射(反射、折射)

上接:https://blog.csdn.net/weixin_44506615/article/details/150935025?spm1001.2014.3001.5501 完整代碼:https://gitee.com/Duo1J/learn-open-gl | https://github.com/Duo1J/LearnOpenGL 一、立方體貼圖 (Cubemap) 立方體貼圖就是一個包含了6張2…

第十七章 ESP32S3 SW_PWM 實驗

本章將介紹使用 ESP32-S3 LED 控制器(LEDC)。 LEDC 主要用于控制 LED,也可產生PWM信號用于其他設備的控制。該控制器有 8 路通道,可以產生獨立的波形,驅動 RGB LED 等設備。 LED PWM 控制器可在無需 CPU 干預的情況下自動改變占空比&#xff…

Flink CDC如何保障數據的一致性

Flink CDC如何保障數據的一致性 前言 在大規模流處理中,故障是無可避免的。機器會宕機,網絡會抖動。一個可靠的流處理引擎不僅要能高效地處理數據,更要在遇到這些故障時,保證計算結果的正確性。Apache Flink 正是因其強大的容錯機…

Spring Boot 定時任務入門

1. 概述 在產品的色彩斑斕的黑的需求中,有存在一類需求,是需要去定時執行的,此時就需要使用到定時任務。例如說,每分鐘掃描超時支付的訂單,每小時清理一次日志文件,每天統計前一天的數據并生成報表&#x…

學習:uniapp全棧微信小程序vue3后臺(6)

26.實現描述評分標簽的雙向數據綁定 /pages/wallpaper/picadd Array.prototype.splice() splice() 方法就地移除或者替換已存在的元素和/或添加新的元素。 二次確認 展現 確認標簽 刪除標簽 溫故知新: 標簽: 關閉標簽 27.uni-data-select調用云端分類…

Azure Marketplace 和 Microsoft AppSource的區別

微軟的商業應用生態中,Azure Marketplace 和 Microsoft AppSource 是微軟并行的兩個主要“應用市場”(Marketplace),它們共同構成了微軟的“商業市場”(Commercial Marketplace)計劃,但服務的目…

完整實驗命令解析:從集群搭建到負載均衡配置(2)

一、環境準備與基礎網絡配置1.1 節點角色與網絡規劃節點角色主機名所屬網段IP 地址網關核心功能Web 服務器web110.1.8.0/2410.1.8.1110.1.8.10(后期調整為 10.1.8.20)部署 Nginx/HTTPD,提供 Web 服務Web 服務器web210.1.8.0/2410.1.8.1210.1.…

uniapp H5禁止微信瀏覽器長按出菜單,只針對圖片

一、問題描述 如圖:uni-image>img,img {pointer-events: none;-webkit-pointer-events: none;-ms-pointer-events: none;-moz-pointer-events: none; }uni-image::before {content: ;position: absolute;top: 0;bottom: 0;left: 0;right: 0;background: transpa…

【機器學習】 15 Gaussian processes

本章目錄 15 Gaussian processes 515 15.1 Introduction 515 15.2 GPs for regression 516 15.2.1 Predictions using noise-free observations 517 15.2.2 Predictions using noisy observations 518 15.2.3 Effect of the kernel parameters 519 15.2.4 Estimating the kern…

Vue加載速度優化,verder.js和element.js加載速度慢解決方法

1. 使用CDN 這里把常用的vue、vuex、elementui、echarts、axios都引入成cdn的方式 1、在index.html引入CDN 找到public/index.html在上方引入下邊的cdn。 [!NOTE] 引入script的時候,一定要把vue.js放到最上邊,最先引入,不然后邊的js加載會…