深度學習系統相比較傳統的機器學習系統,針對常見的分類問題,精度究竟能有多大提升?...

來源:知乎
原文鏈接:深度學習系統相比較傳統的機器學習系統,針對常見的分類問題,精度究竟能有多大提升?

問題:

我現在手頭有一個binary classification的問題。數據量在一百萬左右。每個sample都是一個14個feature組成的vector。每個feature都是一個0~1的float數值。

我用random forest ;1000棵樹,grid search 調參數。10 fold validation 大概76% 左右的precision/recall .

我是一個機器學習的外行,但是比較好奇如果我用一些深度學習的系統,比方說TensorFlow,針對我描述的這種二項分類的問題,我能否期盼著會有一個準確度的顯著提升??如果可以有這樣的預期,一般大家都是怎么做的呢?

我手頭的機器就是一臺128G 32核的服務器。好像暫時沒有別的好機器了。夠用么?

我描述清楚了么? 懇請大家給予指導,謝謝!

我愛機器學習回答:

先分析下問題,100萬訓練數據14個特征,如果你的特征表征能力牛逼,數據偏差不大,機器學習書里面隨便挑個分類算法90%精度不在話下,但現在模型能力很強的隨機森林都只能到76%左右,那么肯定哪里出了問題,問題在哪里,看case是王道。當然這個問題中特征表征能力不夠可能性比較大,那接下來的事情就是特征工程,找什么樣的特征,依然是看case,看看badcase是因為缺失什么樣的特征導致,緊緊圍繞問題本身。

連續特征的二分類問題,除了數據本身和特征工程,模型方面GBDT系列應該是非常合適的選擇,這塊無需細說,翻翻Kaggle就知其厲害。

不要在當前階段跳出來尋覓炒上天的Deep Learning的幫助,Deep Learning確實足夠強大,但它有自己的適用場景,比如人臉識別/OCR之類的視覺應用,如果是這類應用,那就直接上Deep Learning就好。

那么二分類或者多分類的傳統機器學習問題(特征為整數/浮點數/枚舉等類型時)上,Deep Learning到底搞得過傳統機器學習算法不?答案依然是需要具體問題具體分析。
1. 有些問題,手寫規則足以秒殺一切,只要規則擊中要害就好;
2. 有些數據量非常大特征工程足夠細致時,模型的重要性變得相對次要,LR系列廣義線性模型足以滿足需求,比如廣告點擊預測很長時期都是LR/BPR/FTRL之類為主要模型,只是特征工程中可能廣泛用到LDA/Deep Learning等模型;
3. 當然還有些問題,比如判斷圖片是不是汽車的二分類問題,只要標注數據到位,Deep Learning可以本色出演了。

轉載于:https://www.cnblogs.com/DjangoBlog/p/7795073.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/247453.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/247453.shtml
英文地址,請注明出處:http://en.pswp.cn/news/247453.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

遠程鏈接錯誤:這可能是由于credssp加密oracle修正

此錯誤解決辦法 1.WinR 輸入regedit打開注冊表 找到對應的以下目錄HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Policies\System 此時如果System下沒有CredSSP時創建CredSSP沒有Parameters時,創建Parameters 創建方法:右建>>新建>>項 2.在Para…

SpringBoot入門最詳細教程

https://www.jianshu.com/p/af3d5800f763 網上有很多springboot的入門教程,自己也因為項目要使用springboot,所以利用業余時間自學了下springboot和springcloud,使用下來發現springboot還是挺簡單的,體現了極簡的編程風格&#xf…

通過Vue CLI3 快速創建Vue項目并部署到tomcat

1、前提 首先你要安裝好nodejs和yarn,直接在官網下載安裝包,一鍵安裝即可,不需要什么環境配置,我安裝的是最新版本(node-v10.13.0、yarn-1.12.3) 2、安裝 同時寫Vue CLI 3和Vue CLI 2 的原因是官方默認的是3&#x…

簡述區塊鏈(1)- 也許只有這一篇

一、嘮叨兩句 最近一直在考慮一個事情,就是怎么給不太了解技術的人講清楚區塊鏈。我先試著寫下來,然后在逐步打磨吧,目標就是讓哪些說看區塊鏈看的云里霧里的同學能對區塊鏈有一些認知。 二、定義 簡單的給區塊鏈下個定義:基于加密…

Vue CLI 3.0腳手架如何在本地配置mock數據json

前后端分離的開發模式已經是目前前端的主流模式,至于為什么會前后端分離的開發我們就不做過多的闡述,既然是前后端分離的模式開發肯定是離不開前端的數據模擬階段。 我們在開發的過程中,由于后臺接口的沒有完成或者沒有穩定之前我們都是采用…

python 通過下載包setup.py安裝模塊

下載安裝包,并解壓到相應的位置 1、打開cmd 2、到達安裝目錄 3、python setup.py build 4、python setup.py install 轉載于:https://www.cnblogs.com/liuchunxiao83/p/11207340.html

webpack之externals操作三部曲--正確的姿勢

1.作用 首先webpack提供這個externals選項作用是從打包的bundle文件中排除依賴。換句話說就是讓在項目中通過import引入的依賴在打包的時候不會打包到bundle包中去,而是通過script的方式去訪問這些依賴。 2.怎么用? 以jquery為例子,目的是在…

Anaconda3自帶jupyter

1、cmd命令行中輸入 JupyterNotebook 2、系統自動調起下面頁面(注冊端口沖突是打不開的) 轉載于:https://www.cnblogs.com/liuchunxiao83/p/11207385.html

python 的按位與 或 異或 運算

符號 描述 運算規則 by MoreWindows & 與 兩個位都為1時,結果才為1 (統計奇數) | 或 兩個位都為0時,結果才為0 (統計偶數) ^ 異或 兩…

理解Shadow DOM

1. 什么是Shadow DOM? Shadow DOM 如果按照英文翻譯的話可以理解為 影子DOM, 何為影子DOM呢?可以理解為一般情況下使用肉眼看不到的DOM結構,那如果一般情況下看不到的話,那也就是說我們無法直接控制操縱的DOM結構。 Shadow DOM 它是HTML的一…

046 實例11-自動軌跡繪制

目錄 一、"自動軌跡繪制"問題分析1.1 問題分析1.2 自動軌跡繪制二、"自動軌跡繪制"實例講解2.1 自動軌跡繪制2.2 數據接口定義2.3 數據文件三、"自動軌跡繪制"舉一反三3.1 理解方法思維3.2 應用問題的擴展一、"自動軌跡繪制"問題分析 …

bootstrap-select采坑

bootstrap-select采坑 1.class"selectpicker" 普通的下拉框功能 2.title"請選擇城市名稱" title的作用與palcehoder一樣。 3.select class"selectpicker" multiple selectpicker和multiple屬性的搭配使用可實現多選 4.data-live-search"tru…

對vue虛擬dom的研究

Vue.js通過編譯將template 模板轉換成渲染函數(render ) ,執行渲染函數就可以得到一個虛擬節點樹在對 Model 進行操作的時候,會觸發對應 Dep 中的 Watcher 對象。Watcher 對象會調用對應的 update 來修改視圖。這個過程主要是將新舊虛擬節點進行差異對比…

element-ui之dialog組件title插槽的使用

dialog對話框組件title屬性的slot使用方法 使用背景 需要單獨控制title中某個數據顯示及樣式&#xff0c;footer也一樣 <el-dialog// 也可以這樣寫,但是沒有辦法單獨控制name age的顯示// title"name age"title"提示":visible.sync"dialogVisi…

css3自適應布局單位vw,vh

視口單位(Viewport units) 什么是視口&#xff1f; 在桌面端&#xff0c;視口指的是在桌面端&#xff0c;指的是瀏覽器的可視區域&#xff1b;而在移動端&#xff0c;它涉及3個視口&#xff1a;Layout Viewport&#xff08;布局視口&#xff09;&#xff0c;Visual Viewport…

python 操作 elasticsearch-7.0.2 遇到的問題

錯誤一&#xff1a;TypeError: search() got an unexpected keyword argument doc_type&#xff0c;得到不預期外的參數 解決方法&#xff1a;elasticsearch7里不用文檔類型&#xff0c;所以去掉 doc_typecredit_data 錯誤二&#xff1a;RequestError(400, illegal_argument_ex…

用到的Shell

sed 1i 添加的內容 file #這是在第一行前添加字符串 sed $i 添加的內容 file #這是在最后一行行前添加字符串 sed $a添加的內容 file #這是在最后一行行后添加字符串 sed -i s/.*/行首添加內容&行尾添加內容/ 文件名 //每一行 sed -i $a新增的一行 tars_build_tar.sh a…

如何解決瀏覽器縮小出現橫向滾動條時網頁背景圖出現空白的問題

原因&#xff1a; 當窗口縮小時&#xff0c;瀏覽器默認100%寬度為瀏覽器窗口的寬度。而忽略了下部內容層固定寬度(1024px)。從而出現了固定寬度大于100%寬度的現象。瀏覽以此理解來解析頁面&#xff0c;就出現了容器寬度理解上的差異&#xff0c;出現了一個非常奇特的BUG。 解…

前端設計模式

1. 單例模式 2.裝飾器模式 轉載于:https://www.cnblogs.com/lyraLee/p/11210985.html

區別 (function($){...})(jQuery)、$(function(){ })和$.fn

一、(function($){…})(jQuery) 首先function(arg){...}定義了一個匿名函數&#xff0c;參數為arg,而調用時需要在函數后面寫上括號和實參&#xff0c;由于操作符的優先級&#xff0c;函數本身也需要括號&#xff0c;也就成了&#xff1a; &#xff08;function(arg){...}&…