應用決策樹批量化自動生成【效果好】【非過擬合】的策略集

決策樹在很多公司都實際運用于風險控制,之前闡述了決策樹-ID3算法和C4.5算法、CART決策樹原理(分類樹與回歸樹)、Python中應用決策樹算法預測客戶等級和Python中調用sklearn決策樹。

本文介紹應用決策樹批量自動生成效果好,非過擬合的策略集。

文章目錄

    • 一、什么是決策樹
    • 二、決策樹中專有名詞理解
    • 三、應用決策樹算法生成規則集
      • 1 導入數據
      • 2 看下數據基本情況
        • 2.1 用head函數看下數據表頭和前幾行數據
        • 2.2 用value_counts函數觀測因變量y的數據分布
      • 3 把數據集拆分成訓練集和測試集
      • 4 定義從決策樹生成規則集的函數
      • 5 訓練決策樹生成規則集
      • 6 生成規則集數據框
      • 7 生成可視化決策樹
      • 8 合并訓練集和測試集規則數據
      • 9 篩選效果好的規則

??

一、什么是決策樹

??
決策樹:通過對已知樣本的學習,一步一步將特征進行分類,從而將整個特征空間進行劃分,進而區分出不同類別的算法。我們在邏輯判斷中用到的思想if, else if ,else, then,其實就是決策樹的思想。

??
??

二、決策樹中專有名詞理解

??
1.根節點:包含數據集中所有數據集合的節點,即初始分裂節點。
??
2.葉節點/終端節點:最終的決策結果(該節點不再進行劃分),被包含在該葉節點的數據屬于該類別。
??
3.內部節點:非根節點和葉節點的節點,該節點包含數據集中從根節點到該節點所有條件的數據集合。根據內部節點的判斷條件結果,其對應的數據集合被分到兩個或多個子節點中。
??
4.父節點:劃分出子節點的節點。
??
5.子節點:由父節點根據某一規則分裂而來的節點。
??
6.節點的深度:節點與決策樹根節點的距離,如根節點的子節點的深度為1.
??
7.決策樹的深度:所有葉子節點的最大深度。
??
借用CART決策樹原理(分類樹與回歸樹)中的簡單決策樹說明以上名詞,用圖形展示如下:

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/37008.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/37008.shtml
英文地址,請注明出處:http://en.pswp.cn/web/37008.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

數字化那點事:一文讀懂數字鄉村

一、數字鄉村的定義 數字鄉村是指利用信息技術和數字化手段,推動鄉村社會經濟發展和治理模式變革,提升鄉村治理能力和公共服務水平,實現鄉村全面振興的一種新型發展模式。它包括農業生產的數字化、鄉村治理的智能化、鄉村生活的現代化等方面…

Elasticsearch的節點、集群和分片

Elasticsearch的節點、集群和分片 節點 什么是節點 ES是使用Java語言開發的。ES可以創建多個節點,一個節點就是一個ES實例,也就是一個Java線程。ES在生產環境中每個節點都是分布在不同的服務器上的,目的是達到集群的高可用多個節點構成一個…

Nginx系列-1 Nginx安裝與使用

背景 最近對項目進行了Https改造,改造過程涉及Nginx技術,因此進行簡單總結。 從本文開始將開啟一個新的專題Nginx系列,用于收集Nginx相關的文章,內容將包括: Nginx系列—1 Nginx安裝與使用Nginx系列—2 Nginx配置Ngi…

記一次小程序滲透

這次的小程序滲透剛好每一個漏洞都相當經典所以記錄一下。 目錄 前言 漏洞詳情 未授權訪問漏洞/ 敏感信息泄露(高危) 水平越權(高危) 會話重用(高危) 硬編碼加密密鑰泄露(中危&#xff0…

熟練掌握爬蟲技術

一、Crawler、Requests反爬破解 1. HTTP協議與WEB開發 1. 什么是請求頭請求體,響應頭響應體 2. URL地址包括什么 3. get請求和post請求到底是什么 4. Content-Type是什么1.1 簡介 HTTP協議是Hyper Text Transfer Protocol(超文本傳輸協議)…

整合 Mybatis Plus

什么是 MyBatis Plus? MyBatis Plus (簡稱 MP) 是一款持久層框架,說白話就是一款操作數據庫的框架。它是一個 MyBatis 的增強工具,就像 iPhone手機一般都有個 plus 版本一樣,它在 MyBatis 的基礎上只做增強…

NOI大綱——普及組——編碼

編碼 ##ASCLL碼 ASCII碼(American Standard Code for Information Interchange,美國信息交換標準代碼)是一種基于拉丁字母的字符編碼方案,主要用于表示文本數據。ASCII碼包含128個字符(0-127)&#xff0c…

2024最新boss直聘崗位數據爬蟲,并進行可視化分析

前言 近年來,隨著互聯網的發展和就業市場的變化,數據科學與爬蟲技術在招聘信息分析中的應用變得越來越重要。通過對招聘信息的爬取和可視化分析,我們可以更好地了解當前的就業市場動態、職位需求和薪資水平,從而為求職者和招聘企業提供有價值的數據支持。本文將介紹如何使…

python自動化辦公之PyPDF2

用到的庫:PyPDF2 實現效果:打開pdf文件,把每一頁的內容讀出來 代碼: import PyPDF2 # 打開pdf文件 fileopen(friday.pdf,rb) # 創建pdf文件閱讀器對象 readerPyPDF2.PdfReader(file) # 獲取pdf文件的總頁數 total_pageslen(rea…

Amazon Q——2023 re:Invent 大會的 AI 革新之星

引言 在2023年的 re:Invent 大會上,亞馬遜云科技(亞馬遜云科技)不僅展示了包括 Amazon Graviton3、Amazon SageMaker Studio Lab、Amazon Connect Wisdom、Amazon QuickSight Q 和 Amazon Private 5G 在內的多項創新產品,還發布了…

【python爬蟲】豆瓣爬蟲學習

文章目錄 網頁地址爬蟲目標技術棧爬蟲代碼注意事項 Python爬蟲學習:我們可以選擇一個相對簡單的網站進行數據抓取。這里以抓取“豆瓣電影Top250”的信息為例,這個網站提供了豐富的電影數據,包括電影名稱、評分、導演、演員等信息。 網頁地址…

AI大模型技術在音樂創造的應用前景

大模型技術在音樂創作領域具有廣闊的應用前景,可以為音樂家、作曲家和音樂愛好者提供以下方面的幫助。北京木奇移動技術有限公司,專業的軟件外包開發公司,歡迎交流合作。 音樂創作輔助:大模型可以幫助音樂家和作曲家生成旋律、和聲…

Win腳本開機自啟ALIst和RClone

轉自個人博客:https://www.jjy2023.cn/2024/05/23/win%e8%84%9a%e6%9c%ac%e5%bc%80%e6%9c%ba%e8%87%aa%e5%90%afalist%e5%92%8crclone/ 在配置完alist和rclone之后,就只需要每次開機啟動兩者就行了,所以感覺使用AListHelper沒有必要&#xff…

算法金 | 協方差、方差、標準差、協方差矩陣

大俠幸會,在下全網同名「算法金」 0 基礎轉 AI 上岸,多個算法賽 Top 「日更萬日,讓更多人享受智能樂趣」 抱個拳,送個禮 1. 方差 方差是統計學中用來度量一組數據分散程度的重要指標。它反映了數據點與其均值之間的偏離程度。在…

Flask無法Debug

問題描述 Flask Debug的時候,可能會無法進入斷點。我使用的是pycharm CE版本。 解決方案 確保pycharm安裝路徑不帶空格。(帶空格路徑導致debug程序啟動報錯)Gevent compatible,這個東西老的pycharm版本必須勾選它,新…

中霖教育靠譜嗎?在職備考一建好通過嗎?

中霖教育靠譜嗎?在職備考一建好通過嗎? 課程設置:報名后會進行測評,了解學員的知識掌握情況、時間安排和記憶思維特點等,制定更適合的學習計劃。 課程以考試通過為目標,去繁化簡,只講有用的干貨,幫助快…

Python的GIL

Python的GIL是什么?它對多線程編程有什么影響? GIL(全局解釋器鎖)是Python解釋器中的一個機制,它是為了保證在任何時刻只有一個線程執行Python字節碼。GIL的存在主要因為Python的內存管理和垃圾回收機制是線程不安全的…

使用Vite工具創建項目,并使用Vue Router步驟

步驟 1: 安裝 Vite 首先,確保你的電腦上已經安裝了Node.js和npm。然后,通過以下命令全局安裝Vite(如果已經安裝,請跳過此步驟): npm install -g create-vite步驟 2: 創建新的Vue項目 使用Vite創建一個新…

Python 學習之標準庫(二)

Python標準庫是指Python編程語言自帶的一組模塊和包,它們是Python語言的核心組成部分,為開發者提供了豐富的功能和工具,幫助快速實現各種功能需求。以下是對Python標準庫的一些主要內容和模塊的歸納: 1. 數學計算: a.…

Python驅動的智能客服系統構建實錄

Python驅動的智能客服系統構建實錄 作為技術領域的老將,今天我打算帶大家深挖一個熱門應用——智能客服系統,并且如何通過Python這門萬能鑰匙,結合前沿的深度學習技術,賦予其更為人性化、高效的溝通能力。同時,我們不…