ISLR—第二章 Statistical Learning

Statistical Learning

Y?和X的關系

why estimate f

  1. 用來預測?
    預測的時候可以將f^當成一個black box來用,目的主要是預測對應x時候的y而不關系它們之間的關系。
  2. 用來推斷?
    推斷的時候,f^不能是一個black box,因為我們想知道predictor和response之間的關系,用來做特征提取,關系分析等。? ? ?
根據目的是預測還是推斷或者兩者結合選擇不同的模型,需要做一下trade off。

how estimate f

  1. 參數方法?
    它將確定了f的形式,將估計p維的f函數降為了對一些參數的估計?
    先構建參數表達式,然后用參數表達式去訓練數據,例如linear regression。?
    優點是模型和計算簡單,缺點是預先確定了f的形式,可能會和真實的f相差較大。? ? ?
  2. 非參數方法
    對f的形式并未做假設,它要求得到的結果與訓練集越接近越好,但是保證模型不要太過復雜。?
    優點是適用于更多的f,能夠得到更高的正確率,缺點是因為是無參數估計,所以需要的數據量是很大的。

The Trade-Off Between Prediction Accuracy and Model?

Interpretability

  • Subset Selction Lasso(最難理解)
  • Least Squares
  • Generallized Additive Models Trees
  • Bagging,Boosting
  • SVM(最靈活)
模型越復雜,對于模型的可解釋度越小。
如果需要對模型進行高精度預測的話,比如股票市場,可以采用更flexible的方法。?
然而,在股票市場,高精度的方法有時候效果更差,原因是對訓練數據產生了過擬合。

?

Supervised Versus Unsupervised Learning

Regression Versus Classification Problems

以上兩部分的內容在Ng的ML課程中有詳細的介紹


?

二??Assessing model Accuracy

1 Measuring quality of fit

?

均方誤差?MSE
MSE越小越好

The Bias-Variance Trade-Off

(1)?公式中第一項是預測的方差(variance),表示了如果我們更換一個訓練集,預測函數f(x)的變化程度,一般來說,自由度越高的方法具有越大的方差;
(2)?第二項是預測的偏差(?bias),某種學習算法的平均估計結果所能逼近學習目標的程度一般來講,自由度越高的方法具有越小的偏差;?獨立于訓練樣本的誤差,刻畫了匹配的準確性和質量:一個高的偏差意味著一個壞的匹配
(3)?最后一項是不可消除偏差。
訓練充足后,訓練數據的輕微擾動都會導致學習器發生顯著變化,發生過擬合。?
當方差和偏差加起來最優的點,就是我們最佳的模型復雜度。
紅色的曲線代表了MSE,橘黃色曲線代表方差,藍色的曲線代表偏差,水平虛線代表了不可消除偏差,豎直虛線代表了模型實際的自由度。

2 classification setting

? ? 訓練錯誤率

? ?(1)bayes classifier

條件概率

貝葉斯錯誤率

? ?(2)K-Nearest Neighbors(KNN)

理論上,我們偏愛貝葉斯分類器去得到最優的模型。?
但是實際上,我們并不知道特定點X對應的Y分布,因此不能夠直接使用貝葉斯分類器。?
但是,有很多方法,可以人工地構造條件概率分布,然后接著使用貝葉斯分類器。
KNN雖然很簡單,但是它的錯誤率卻可以很逼近最低的錯誤率

R—exercise

轉載于:https://www.cnblogs.com/doctorW/p/8205292.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/453737.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/453737.shtml
英文地址,請注明出處:http://en.pswp.cn/news/453737.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

提高編程思想

虛函數和抽象函數有什么區別 虛函數是有代碼的并明確允許子類去覆蓋,但子類也可不覆蓋,就是說可以直接用,不用重寫 抽象函數是沒有代碼,子類繼承后一定要重寫 ****************************************************************** 在一…

python特效代碼_網頁愛心特效弱爆了,我讓你點擊網頁顯示所有python模塊!

點擊網頁特效上周寫了一篇文章快速搭建個人博客的教程文章:其中說到了一個點擊網頁出現愛心特效的插件 click_heart.js ,當然大家可能也見過其他博客上面,有點擊網頁出現類似 富強、民主、文明、和諧等等,關于代碼在這里不多贅述,…

Python 包管理之 poetry

poetry是一個Python虛擬環境和依賴管理的工具。poetry和pipenv類似,另外還提供了打包和發布的功能。 官方文檔:python-poetry.org/docs/ python項目部署:poetry管理本地環境,上線用docker poetry 安裝 poetry提供多種安裝方式&#xff0c…

Windows數據庫編程接口簡介

數據庫是計算機中一種專門管理數據資源的系統,目前幾乎所有軟件都需要與數據庫打交道(包括操作系統,比如Windows上的注冊表其實也是一種數據庫),有些軟件更是以數據庫為核心因此掌握數據庫系統的使用方法以及數據庫系統…

映客都是互刷禮物嗎_映客互刷禮物有什么用_映客守護有什么用

一起直播、互刷禮物、改ID發性感照,趙本山女375x332 - 122KB - PNG一起直播、互刷禮物、改ID發性感照,趙本山女600x893 - 247KB - JPEG一起直播、互刷禮物、改ID發性感照,趙本山女600x448 - 151KB - JPEG土豪互刷禮物嚇壞男主播 即興表演鐵頭功撞墻560x688 - 57KB - JPEG一起直…

Python 之打包工具 setup.py

1. 為什么需要對項目分發打包? 平常我們習慣了使用 pip 來安裝一些第三方模塊,這個安裝過程之所以簡單,是因為模塊開發者為我們默默地為我們做了所有繁雜的工作,而這個過程就是 打包。 打包,就是將你的源代碼進一步封…

周進度----06

周學習進度06 周學習進度06 第16周 所花時間: 60min60min100min100min100min100min90min60min60min 代碼量(行) 500-800 博客量(篇) 4 了解到的知識 css樣式表的一些知識 項目流程的初步了解 一周的學習心得…

八個實用的CMD命令及開始→運行→命令集錦

這篇文章是很久前收藏在自己筆記本內的,具體的來源地址不清楚,先謝一下原作者吧. 共享出來大家一起學習一下: 一,ping    它是用來檢查網絡是否通暢或者網絡連接速度的命令。作為一個生活在網絡上的管理員或者黑客來說,ping命令是第一個必須掌握的DO…

2019如何轉換2010_9102年,你還不知道PPT怎么轉換成視頻嗎?小心落伍了

你在刷抖音的時候有沒有刷過這類視頻:成為人生贏家必備的書單、5個讓你看透人性的電影、6個讓你升職加薪的APP...如果你細心觀察的話,會發現這類視頻的做法基本都是一個樣的,像在翻相冊一樣,一頁頁過去,所以它們也叫做…

深度學習之RetinaNet

總述 Focal loss主要是為了解決one-stage目標檢測中正負樣本比例嚴重失衡的問題。該損失函數降低了大量簡單負樣本在訓練中所占的權重,也可理解為一種困難樣本挖掘。 目標識別有兩大經典結構: 第一類是以Faster RCNN為代表的兩級識別方法,這種結構的第…

js生成圖片

var image new Image(); var c document.getElementById("myCanvas"); var ctx c.getContext("2d"); var img document.getElementById("scream"); ctx.font "10px Arial";function createImg(name, zuowei, color) {// 姓名ctx…

淺談如何學習linux

一.為什么要學linux? 當然最重要是愛好和興趣!如果你這種必要學,或者根本不喜歡,請不要浪費時間,你學也學不好! 二.起步 你應該為自己創造一個學習linux的環境--在電腦上裝一個linux或unix 問題1:版本…

python的datetime函數_Python連載8-datetime包函數介紹

一、datetime包(上接連載7內容)1.函數:datetime(1)用法:輸入一個日期,來返回一個datetime類?(2)格式:datetime.datetime(年,月,日,hour,minute,second)其中hour,minute,…

深度學習之 soft-NMS

論文:《Improving Object DetectionWith One Line of Code》soft-NMS 英文論文鏈接:https://arxiv.org/pdf/1704.04503.pdfsoft-NMS github 鏈接:https://github.com/bharatsingh430/soft-nms 絕大部分目標檢測方法,最后都要用到…

項目微管理 - 總結也是新的開始

時間都去哪了?聽著這首耳熟能詳的旋律,感嘆著飛速流逝的年華,我漸漸的陷入到沉思之中。時間過的真的很快,從一名程序員到接手一個一線項目團隊一晃已經2年多了。在這段時間里,我接觸了各種各樣的人,處理了各…

一維二維_Excel二維數據轉一維,2種方法輕松搞定

今天是2020年1月1日,祝各位小伙伴們新年快樂,開心每一天~如下所示,左邊是二維交叉數據表,我們希望快速轉換成右邊的一維數據表如果復制粘貼,效率太低了,今天分享兩種方法,實現快速轉換1、powerq…

數百種 Windows 軟件的免費替代品列表

程序所執行任務的描述WindowsLinux1) 網絡連接網頁瀏覽器微軟 IE,網景 Netscape / Mozilla, Opera [私有],Firebird,……1) Netscape/Mozilla 2) Galeon. 3) Konqueror. 4) Opera.[私有] 5) Firebird. 6) Nautilus 7) Epiphany 8)…

深度學習之 Cascade R-CNN

Zhaowei Cai, Nuno Vasconcelos. 《Cascade R-CNN: Delving into High Quality Object Detection》. CVPR 2018.論文鏈接:https://arxiv.org/abs/1712.00726代碼鏈接:https://github.com/zhaoweicai/cascade-rcnn 前言 IOU閾值被用來定義正負例&#x…

轉換文檔參數_明明2秒可以搞定Word、Excel相互轉換,你卻用了半小時!真虧了...

我們在用office三件套工作的時候,經常都需要對文件的格式進行轉換,像是Word文檔和Excel表格的轉換,很多小伙伴都要花上半個小時甚至以上的時間才能搞定,效率實在不行。別擔心,今天小編將分享能快速完成Word、Excel轉換…

深度學習之 DCN(Deformable Convolution)-可變形卷積

Paper link: http://openaccess.thecvf.com/content_ICCV_2017/papers/Dai_Deformable_Convolutional_Networks_ICCV_2017_paper.pdfhttps://arxiv.org/pdf/1703.06211 Code link: https://github.com/msracver/Deformable-ConvNets Abstract 如何有效地對幾何圖形的變化進行…