人工智能訓練師三級備考筆記

一、實操

1)通用語法(常見于實操題第一塊代碼塊)

1.讀取文件數據或加載數據集等描述時

一般為以下結構:Data=pd.read_文件格式('文件名')??注意:文件名需要用‘ ’框起來,必須要有引號

文件格式有以下內容csvtxtxlsxjsonhtmlsqlparquetsasspssstatahdf5,替代文件格式的位置

2.讀取前幾行數據

使用.head()方法

head( n ) 方法用于讀取前面的 n 行,如果不填參數 n ,默認返回 5 行。

使用句法:print(data.head(n))如果要求返回5行數據,n可不填

3.保存數據到對應文件

使用.to_文件類型方法

例如data.to_csv('文件名.csv',index = False) 即將data中的數據保存到csv格式的文件 文件名.csv文件中

4.刪除空值或異常值

使用drop或dropna語法

  • drop 是按 行標簽(index)或列標簽(columns) 刪除整行/整列,你必須告訴它"刪掉第幾行或第幾列"。

  • dropna 是按 缺失值的位置 刪除行/列,你只需告訴它"哪一列有缺失就刪哪一行",不需要知道具體行號。

  • dropna(subset=['列名']) = "只要這一列缺值就刪該行,別的列缺不缺我不管"。

2)實操題看到關鍵字常用語法

關鍵字:歸一化,標準化,或scaler

看到歸一化,標準化,或scaler這些關鍵字,寫如下格式的代碼
scaler.fit_transform(data[numerical_features])
其中scaler是抄上文,fit_transform是固定用法,括號里的參數是被標準化的對象,抄前文。

關鍵字:轉換數據類型

看到將什么轉換成數據類型時,迅速想到pandas.to_numeric(轉換的數據)

類似以下格式

df['horsepower'] = pd.to_numeric(df['horsepower'], errors='coerce')

這里我要轉換的數據是加載的數據集df中的horsepower列 注:多關注使用的符號例如[]和''

關鍵字:劃分為訓練集和測試集

看到劃分數據集想到train_test_split語法例如以下語句

X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.2, random_state=42)

這里定義了X為訓練集,y為測試集,使用train_test_split語法劃分,test_size=0.2代表測試集占比20%

關鍵字訓練模型

如果出現訓練模型等關鍵字,使用 數據.fit(訓練集,測試集)例如以下代碼

pipline.fit(X_train,y_train)

訓練pipline數據,使用fit方法訓練,訓練數據為X_train,y_train

關鍵字:保存模型

pickle.dump(model,文件名)

文件名為題目命名文件

關鍵字:預測并保存結果

model.predict(X_test)02

過擬合,欠擬合通用改進點;
1 清洗數據,清洗空值,重復值和異常值。
2 擴充訓練樣本數,增多訓練次數
3 調整特征值,加入和目標值有關的字段,去掉和目標值無關的字段
4 對樣本進行標準化處理(湊數)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/99120.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/99120.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/99120.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Cherry Studio遞歸工具調用機制深度解析

在現代AI應用開發中,工具調用(Tool Calling)已成為大語言模型與外部系統交互的核心機制。Cherry Studio作為一款先進的AI對話客戶端,實現了一套完整的遞歸工具調用系統,能夠讓AI助手在執行復雜任務時自動調用多個工具,并根據執行結果智能決策下一步操作。本文將深入解析這…

[哈希表]966. 元音拼寫檢查器

966. 元音拼寫檢查器 class Solution:def spellchecker(self, wordlist: List[str], queries: List[str]) -> List[str]:origin set(wordlist) # 存儲原始單詞用于完全匹配lower_to_origin {} # 存儲小寫形式到原始單詞的映射vowel_to_origin {} # 存儲元音模糊形…

正則表達式與文本三劍客(grep、sed、awk)基礎與實踐

正則表達式基礎與實踐一、正則表達式概述1. 定義正則表達式(Regular Expression,簡稱 RE)是用于描述字符排列和匹配模式的語法規則,核心作用是對字符串進行分割、匹配、查找、替換操作。它本質是 “模式模板”,Linux 工…

eclipse中web項目編譯后的lib里面jar為空問題處理

1. 檢查項目構建配置驗證項目性質右鍵單擊項目 → Properties確認項目已正確配置:?Project Facets?:確保已勾選"Dynamic Web Module"?Targeted Runtimes?:確保已選擇服務器運行時(如Tomcat)檢查部署程序…

C語言中的遞歸問題——漢諾塔問題

漢諾塔(Tower of Hanoi),又稱河內塔,是一個源于印度古老傳說的益智玩具。傳說大梵天創造世界的時候做了三根金剛石柱子,在一根柱子上從下往上按照大小順序摞著64片黃金圓盤。大梵天命令婆羅門把圓盤從下面開始按大小順序重新擺放在…

ArkAnalyzer源碼初步分析I——分析ts項目流程

1.前言: 鴻蒙程序分析框架ArkAnalyzer(方舟分析器) 源碼地址 入門文檔 2.閱讀入門文檔后: 本人具有一定的Java開發經驗。雖然我對 TypeScript(TS)和 ArkTS 還不熟,但很多概念對我這個 Java 開…

c#基礎二(類和對象,構造器調用順序、訪問級別、重寫和多態、抽象類和接口)

一、類1.0對象初始化器class Student {public String name;public int age { get; set; } } internal class Program {static void Main(string[] args){ //寫法一Student stunew Student();stu.name"Tom";stu.age20;//寫法二Student stu2 new Student { name &qu…

Qt之快捷鍵、事件處理、自定義按鍵——完成記事本項目

快捷鍵我們電腦中的記事本中還支持快捷鍵,如“CTRLO”打開文件、“CTRLS”保存文件在Qt中使用QShortcut這個類創建快捷鍵在.cpp文件的構造函數中創建QShortcut對象,綁定打開文件和保存文件的槽函數放大縮小字體還是在.cpp的構造函數中編寫代碼Widget::Wi…

Open cascade中如何使用BRepAlgoAPI_Splitter分割一個Face

理論介紹 在OpenCASCADE幾何建模內核中,BRepAlgoAPI_Splitter是一個強大的工具,用于將一個形狀(Shape)用另一個形狀(Tool)進行分割。這種操作在CAD建模中非常常見,比如用平面切割實體、用曲線分…

【醫療 AI】Baichuan-M2 醫療大模型:技術解讀與使用方法

【醫療 AI】Baichuan-M2 醫療大模型:技術解讀與使用方法1. Baichuan-M2 醫療大模型簡介1.1 基本信息1.2 下載地址1.3 技術特點2. Baichuan-M2 模型技術報告2.1 摘要2.2 醫學性能評估2.2.1 HealthBench基準2.2.2 中國醫療場景對比評估2.3 系統架構2.3.1 驗證器系統2.…

unity pcd 二進制版 簡單顯示文件對象(單色)

unity Point Cloud Viewer and Tool 那個插件不支持pcd二進制,而且網上到處都是AI 我恨這種AI濫用,提供不了一點價值 好了,言歸正傳 可以在Point Cloud Viewer and Tool這個插件報錯地方轉用這個代碼,具體咋結合請自行研究。 …

強大的開源文檔問答工具-Kotaemon

Kotaemon 是一個基于 RAG(Retrieval-Augmented Generation)架構的開源文檔問答工具,為用戶提供與文檔對話的智能交互體驗。該項目同時服務于終端用戶和開發者,具有高度的可擴展性和定制化能力。技術棧分析核心技術棧后端框架Pytho…

區塊鏈:搭建簡單Fabric網絡并調用智能合約

使用docker服務搭建Hyperledger/fabric網絡的詳細教程,實現構建多節點的簡單聯盟鏈,并編寫、調用智能合約實現投票業務。 目錄 背景知識 Hyperledger Fabric 基本組件 交易(Transaction) 智能合約 實驗目的 實驗環境 基礎依賴 安裝Golang 安裝do…

Web前端面試題(2)

Web前端面試題(附答案及解析)&#xff08;2025.9月最新版&#xff09;-CSDN博客 1.link 與 import 的區別和用法 主要區別 特性<link>import語法類型HTML標簽CSS規則加載方式并行加載&#xff08;與其他資源同時加載&#xff09;串行加載&#xff08;必須等待主CSS文件…

Paxos協議

目錄 Paxos 是什么&#xff08;What&#xff09; Paxos 的目的&#xff08;Why&#xff09; 角色與職責&#xff08;Who&#xff09; 基本流程&#xff08;How&#xff09; 常見問題與對策 什么是多數派&#xff08;Quorum&#xff09; Paxos vs Raft 異同點 Paxos 是什…

第十二篇:Qcom Camx打印實時幀率 FPS

一、第一種方式(有些低平臺可能沒有) adb shell setprop persist.vendor.camera.enableFPSLog TRUE adb shell setprop persist.vendor.camera.systemLogEnable TRUE adb shell setprop vendor.debug.camera.overrideLogLevels 0xff chi-cdk/core/chiframework/chxextensi…

TRAE通用6A規則+敏捷開發5S規則

網上研究別人的一些規則,也搞一份給大家 6A工作流項目規則 身份定義 你是一位資深的軟件架構師和工程師,具備豐富的項目經驗和系統思維能力。你的核心優勢在于: 上下文工程專家:構建完整的任務上下文,而非簡單的提示響應 規范驅動思維:將模糊需求轉化為精確、可執行的規…

【Nginx開荒攻略】Nginx主配置文件結構與核心模塊詳解:從0到1掌握nginx.conf:

目錄 引言 1 nginx.conf的整體結構 2 main全局塊詳解 2.1 核心指令解析 2.1.1 user&#xff1a;運行用戶 2.1.2 worker_processes&#xff1a;工作進程數 2.1.3 pid&#xff1a;PID文件路徑 2.1.4 worker_rlimit_nofile&#xff1a;文件描述符限制 2.2 main塊配置示例…

【前端教程】從基礎到優化:一個登錄頁面的完善過程

最近做了一個簡單的登錄頁面,主要練習了文本框的onfocus與onblur事件的使用。雖然功能實現了,但仔細想想還有不少可以改進的地方。今天就來分享一下這個登錄頁面的開發過程和優化思路。 初始實現與解析 先來看一下最初的實現代碼: <!DOCTYPE html> <html> &l…

獨家 | 抖音生活服務調整:涂晴接管市場和達人運營,旭凱擔任北部大區負責人

文/刀客doc(頭條精選作者)刀客doc獨家獲悉&#xff0c;9月8日抖音生活服務完成新一輪組織調整&#xff0c;并已在內部all hands完成官宣。此次調整主要涉及北部大區、達人運營與市場部三大條線的人事輪換與匯報關系變更。核心變動如下&#xff1a;涂晴&#xff0c;原抖音生活服…