1-3.監督學習(supervised learning)

定義:監督學習指的就是我們給學習算法一個數據集,這個數據集由“正確答案”組成,然后運用學習算法,算出更多的正確答案。術語叫做回歸問題

【監督學習可分為】:回歸問題、分類問題。兩種

例:一個學生從波特蘭俄勒岡州的研究所收集了一些房價的數據。你把這些數據畫出來,看起來是這個樣子:橫軸表示房子的面積,單位是平方英尺,縱軸表示房價,單位是千美元。那基于這組數據,假如你有一個朋友他有一套 750 平方英尺房子,現在他希望把房子賣掉,他想知道這房子能賣多少錢?

解:

我們應用學習算法,可以在這組數據中畫一條直線,或者換句話說,擬合一條直線,根
據這條線我們可以推測出,這套房子可能賣$150,000,當然這不是唯一的算法。可能還有更
好的,比如我們不用直線擬合這些數據,用二次方程去擬合可能效果會更好。根據二次方程
的曲線,我們可以從這個點推測出,這套房子能賣接近$200,000。稍后我們將討論如何選擇
學習算法,如何決定用直線還是二次方程來擬合。兩個方案中有一個能讓你朋友的房子出售
得更合理。這些都是學習算法里面很好的例子。以上就是監督學習的例子。

【離散值】(discrete valued)就是孤立的點集,像區間,它在每一點上都是連續的,而像整數集,它的每一元素之間都有一點的距離。
例:所謂在某一點上連續,就是對于該點,無論給定一個多么小的正數,總能在定義域內找到一點,它的函數值到該點的函數值距離小于給定的數。而離散就是指不連續。
想得到的話,計算機的隨機變量也算是,隨便找幾個人問幾個整數,得到的也是離散值,一個范圍內,人的身高也算
監督學習例2:乳腺癌例

讓我們來看一組數據:這個數據集中,橫軸表示腫瘤的大小,縱軸上,我標出 1 和 0 表
示是或者不是惡性腫瘤。我們之前見過的腫瘤,如果是惡性則記為 1,不是惡性,或者說良
性記為 0。
我有 5 個良性腫瘤樣本,在 1 的位置有 5 個惡性腫瘤樣本。現在我們有一個朋友很不幸
檢查出乳腺腫瘤。假設說她的腫瘤大概這么大,那么機器學習的問題就在于,你能否估算出
腫瘤是惡性的或是良性的概率。用術語來講,這是一個分類問題。
分類指的是,我們試著推測出離散的輸出值:0 或 1 良性或惡性,而事實上在分類問題
中,輸出可能不止兩個值。比如說可能有三種乳腺癌,所以你希望預測離散輸出 0、1、2、
3。0 代表良性,1 表示第 1 類乳腺癌,2 表示第 2 類癌癥,3 表示第 3 類,但這也是分類問
題。
因為這幾個離散的輸出分別對應良性,第一類第二類或者第三類癌癥,在分類問題中我
們可以用另一種方式繪制這些數據點。
現在我用不同的符號來表示這些數據。既然我們把腫瘤的尺寸看做區分惡性或良性的特
征,那么我可以這么畫,我用不同的符號來表示良性和惡性腫瘤。或者說是負樣本和正樣本
現在我們不全部畫 X,良性的腫瘤改成用 O 表示,惡性的繼續用 X 表示。來預測腫瘤的惡性與否。
在其它一些機器學習問題中,可能會遇到不止一種特征。舉個例子,我們不僅知道腫瘤
的尺寸,還知道對應患者的年齡。在其他機器學習問題中,我們通常有更多的特征,我朋友
研究這個問題時,通常采用這些特征,比如腫塊密度,腫瘤細胞尺寸的一致性和形狀的一致
性等等,還有一些其他的特征。這就是我們即將學到最有趣的學習算法之一。

我們以后會講一個算法,叫【支持向量機】,里面有一個巧妙的數學技巧,能讓計算機處理無限多個特征。

【監督學習基本思想】是,我們數據集中的每個樣本都有相應的“正確答案”。再根據這些樣本作出預測。(就像房子和腫瘤的例子中做的那樣)

【回歸問題】Regression Problem,即通過回歸來推出一個連續的輸出,之后我們介紹了分類問題,其目標是為了推出一組離散的結果

【分類問題】Classification Problem,分類指的是,我們試著推測出離散的輸出值:0 或 1 良性或惡性,而事實上在分類問題中,輸出可能不止兩個值

?

轉載于:https://www.cnblogs.com/chenxi188/p/10869724.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/277725.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/277725.shtml
英文地址,請注明出處:http://en.pswp.cn/news/277725.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

github最值得收藏的Bootstrap3后臺管理框架

github上9款最值得收藏的bootstrap3后臺管理平臺html框架 AdminLTE Gentelella Admin Vali Admin ModularAdmin Metis Ace Light Bootstrap Dashboard Material Dashboard Clearmin 1. AdminLTE AdminLTE是一個完全響應的后臺管理模板。基于Bootstrap3框架。高度可定制&#xf…

Mac OS使用技巧之十五:快捷方便的Mini Dock

Mini Dock是前面忘記了提,這里做一些補充。Mini Dock是Mac OSX的一個值得大書特書的亮點。雖然windows下也有類似的東西,但Mac下卻提供了更為全面的功能,通過Mini Dock欄,可以快速切換、隱藏、關閉正在運行的APP。這也就比之前講過…

linux下的SSHD被連接端口修改

連接別人:vim /etc/ssh/ssh_config 被連接: vim /etc/ssh/sshd_config 端口重啟生效: /etc/init.d/sshd restart 轉載于:https://www.cnblogs.com/gered/p/10871335.html

Mac OS使用技巧之十六:系統失去響應怎么辦?

再好的系統,再快的本本,也會在運行時因為種種原因出現卡頓或者死機等失去響應的情況。Mac用戶也會時不時碰到這種情況,最常見的表現為鼠標變為七彩圓圈,通常等上一會兒系統會自己恢復。如果遲遲沒有響應的話,那就需要來…

Unity Api集合

延遲重復調用方法, 1 方法名 2 幾秒后開始調用 3 再次重復調用的隔了多少時間InvokeRepeating(methodName:string, time:float, repeatRate:float):void; 復制代碼取消調用 CancelInvoke("SpawnerInstance"); 復制代碼利用委托來賦值一個方法進去&#xf…

單例模式--工廠模式

單例模式又稱為職責模式,它用來在程序中創建一個單一功能的訪問點,通俗地說就是實例化出來的對象是唯一的。所有的單例模式至少擁有以下三種公共元素:1. 它們必須擁有一個構造函數,并且必須被標記為private2. 它們擁有一個保存類的…

wpfのuri(讓你完全明白wpf的圖片加載方式以及URI寫法)

原文:wpfのuri(讓你完全明白wpf的圖片加載方式以及URI寫法)絕對 pack WPF URI pack://application:,,,/是協議;“,,,”是“///”的變體 1.資源文件 — 本地程序集 Uri uri new Uri("pack://applicati…

Mac OS使用技巧十七:豐富多彩的花哨輸入法

OSX Mavericks中的漢字輸入功能,絲毫不遜色于windows,甚至提供了強大的手寫輸入功能和語音輸入功能,并且發展到現在,已經有很多種第三方輸入法支持Mac了。 一、基本的輸入法首先說一下支持Mac的各種中文輸入法,其實我覺…

語言-漢語:漢語

ylbtech-語言-漢語:漢語漢語,即漢族的傳統語言,是中國通用語言,國際通用語言之一,屬漢藏語系,與藏語、壯語、侗語、黎語、彝語、苗語、瑤語等都是親屬語言。漢語歷史悠久,使用人數最多&#xff…

Duboo入門示例(Idea開發環境)

在學習Dubbo分布式框架時的官方入門例子,很有代表性。簡單清晰。 有關Dubbo的概念、概述和簡單的配置文件,可以看官方文檔的簡述 會很快對Duboo有個整體的概念。 準備工作: 下載示例,點擊這里下載,建議用git管理。下載注冊中心&am…

Mac OS使用技巧十八:Safari碉堡功能之一制作Widget

Safari的使用大家應該自己摸索就可以慢慢駕輕就熟,畢竟再高端也是個瀏覽器,從開始上網就要一直使用瀏覽器,Safari只是眾多瀏覽器中的一個比較強大的罷了。下面給大家介紹一下Safari的一個碉堡隱藏功能!!!!(其實不算隱藏啦。。。在…

CentOS 6.5 部署WordPress

1、安裝環境: #yum install httpd mysql-server php php-mysql php-gd php-imap php-ldap php-odbc php-pear php-xml php-xmlrpc -y 2、配置mysql初始化密碼: #mysqladmin -u root password ********** 2.1、mysql新建一個wordpress的表: create database wordpress; 3、啟動服…

BZOJ1562: [NOI2009]變換序列(二分圖 匈牙利)

Description Input Output Sample Input 5 1 1 2 2 1Sample Output 1 2 4 0 3HINT 30%的數據中N≤50;60%的數據中N≤500;100%的數據中N≤10000。 Source 這題是二分圖應該不難看出來。 對于原序列中的一個點,對應兩個可匹配的點。 關鍵是怎么…

Mac OS使用技巧十九:Safari碉堡功能之二查看網頁源碼

因為大三下的時候選修了搜索技術,了解了網絡上搜索引擎和網絡爬蟲的信息扒取的一些東西,后來我們做了一個比較水的東西,就是只扒取了幾家較大的下載網站幾十個軟件的評分下載量等信息,當用戶輸入一個程序名稱,我們會根…

python文件打包發布(引用的包也可以加進來),打包出錯解決了,運行出錯解決了...

一開始,我以為,打包本來就很容易,可是沒有。。。。。 沒想到打包還能遇到坑 T.T 打包步驟: 1、安裝 pyinstaller (cmd) pip install pyinstaller 2、進入目標文件所在文件夾,右鍵在此打開cmd py…

博客暫停通知-------10.1~11.24

博主在10月初到11月24號之間有對自己來說十分十分重要的事情,可以說是會影響我人生走向的事情。 所以我做出暫停更文章和回復的決定,這期間我基本不會來博客看了,希望如果留言未收到回復的博友或者吧友見諒。 我在貼吧發的一些帖子也暫時不會…

RabbitMQ系列(二)深入了解RabbitMQ工作原理及簡單使用

RabbitMQ簡介 在介紹RabbitMQ之前實現要介紹一下MQ,MQ是什么? MQ全稱是Message Queue,可以理解為消息隊列的意思,簡單來說就是消息以管道的方式進行傳遞。 RabbitMQ是一個實現了AMQP(Advanced Message Queuing Protoco…

四葉草社交平臺——十天沖刺(10)

姑且就這樣了,找了個新模板,這個模板先用來過關吧。轉載于:https://www.cnblogs.com/limitCM/p/10925208.html

虛擬機(Visual Machine)的云平臺的自動伸縮擴容(auto-scaling)技術

云計算平臺中允許客戶依據應用的負載進行云計算資源的彈性動態伸縮(理想的情況是實現一個用多少付費多少的模型,最大限度地降低用戶的運營成本) 在進行討論之前,先對幾個名詞進行定義 1)客戶:使用云服務的人…

Unity 3D學習筆記之一 界面介紹

因為學校的課程,本學期對Unity 3D有學習的要求,在博客中記錄下自己的Unity學習之路(內容摘錄自書本和視頻,書本為Unity 4.x從入門到精通)一、Unity界面介紹首先進入Unity3D,在菜單欄,File中new …