Python打卡DAY31

DAY31:文件的規范拆分和寫法

恩師@浙大疏錦行

?

知識點:

  1. 規范的文件命名
  2. 規范的文件夾管理
  3. 機器學習項目的拆分
  4. 編碼格式和類型注解

一、機器學習項目流程:

1、數據加載:從文件、數據庫、API 等獲取原始數據。

? ? - 命名參考:`load_data.py` 、`data_loader.py`

2、數據探索與可視化:了解數據特性,初期可用 Jupyter Notebook,成熟后固化繪圖函數。

? ? - 命名參考:`eda.py` 、`visualization_utils.py`

3、數據預處理:處理缺失值、異常值,進行標準化、歸一化、編碼等操作。

? ? - 命名參考:`preprocess.py` 、`data_cleaning.py` 、`data_transformation.py`

4、特征工程:創建新特征,選擇、優化現有特征。

? ? - 命名參考:`feature_engineering.py`

5、模型訓練:構建模型架構,設置超參數并訓練,保存模型。

? ? - 命名參考:`model.py` 、`train.py`

6、模型評估:用合適指標評估模型在測試集上的性能,生成報告。

? ? - 命名參考:`evaluate.py`

7、模型預測:用訓練好的模型對新數據預測。

? ? - 命名參考:`predict.py` 、`inference.py`

二、文件的組織

1、項目核心代碼組織:

src/:存放項目的核心代碼

src/data/:存放與數據相關的代碼

src/models/:關于模型的代碼

src/utils/:存放通用輔助代碼

2、配置文件管理

config/目錄

3、實驗與探索代碼

notebooks/或experiments/

4、項目產出物管理

data/:存放項目相關數據

models/:存放訓練好的模型

reports/或output/:存儲項目運行的報告文件/輸出文件

三、編碼格式和類型注解

1、編碼格式

(1)編碼聲明必須出現在文件的前兩行(通常是首行),否則會被忽略。

(2)如果編碼格式沒問題,可能是vscode的編碼格式不是utf-8,可以嘗試修改編碼格式。

(3)常見的編碼報錯是因為字符串編碼問題,可以嘗試顯式轉化,即讀取的時候轉化為utf-8編碼。

2、類型注解

def add(a: int, b: int) -> int:return a + bdef greet(name: str) -> None:print(f"Hello, {name}")
# 定義一個矩形類
class Rectangle:width: float      # 矩形寬度(浮點數),類屬性的類型注解(不初始化值)height: float     # 矩形高度(浮點數)def __init__(self, width: float, height: float):self.width = widthself.height = heightdef area(self) -> float:# 計算面積(寬度 × 高度)return self.width * self.height

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/85366.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/85366.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/85366.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

字符串大數 -減法

描述 以字符串的形式讀入兩個數字,編寫一個函數計算它們的和,以字符串形式返回。 代碼實現 大小判斷:a - b 與 b - a 的絕對值相等將大的數放前面,抽離出結果的符號 import random s, t str(random.randint(1000, 9999)), s…

android google tts如何不聯網內部預置多國語音包

在內置Google GMS服務的設備中,可以正常使用TTS,并且可以聯網下載多國的語音包。然而,對于未通過GMS認證,只能使用基礎的TTS英語播報,而且聯網后是無法下載語音包的,會提示需要google service。本文基于以上…

Java 全棧開發學習:從后端基石到前端靈動的成長之路

目錄 一、開篇:與 Java 全棧的初遇 二、后端學習:SpringBoot 構建穩健基石 (一)SpringBoot3 入門:簡約而不簡單的啟程 (二)Spring Boot Web 應用開發:構建交互橋梁 (…

AquaCrop模型源代碼分析、模型優化與敏感性分析、未來氣候變化影響分析

AquaCrop是由世界糧食及農業組織(FAO)開發的一個先進模型,旨在研究和優化農作物的水分生產效率。這個模型在全球范圍內被廣泛應用于農業水管理,特別是在制定農作物灌溉計劃和應對水資源限制方面顯示出其強大的實用性。AquaCrop 不…

開源模型應用落地-讓AI更懂你的每一次交互-mem0-QDrant-Streamlit(一)

一、前言 在人工智能迅猛發展的今天,大型語言模型(LLM)已經成為各行各業的重要工具。然而,盡管這些模型在生成文本、理解語義等方面表現出色,但它們仍然面臨一個關鍵挑戰——缺乏持久的記憶能力。傳統的對話系統往往只能基于當前對話輪次進行回應,無法有效保留和利用歷史…

RPC - Response模塊

Requestor 類是一個請求-響應管理器,負責發送請求并處理響應,支持三種交互模式:同步、異步和回調。它跟蹤所有發出的請求,當響應到達時將其匹配到對應的請求并進行處理。 newDescribe 函數解析 newDescribe 函數負責創建和注冊一…

超高速10G采集卡

超高速10G采集卡是一款高端14位數據采集平臺,旨在滿足最具挑戰性的測量環境。 特性: 單通道和雙通道操作 單通道10GSPS或雙通道5GSPS 7 GByte/s持續數據傳輸速率開放式FPGA支持實時DSP 脈沖檢測固件選項波形平均固件選項 特征 單通道和雙通道工作模式雙通道5G…

One-Hot、BOW、TF-IDF、N-Gram區別

1. One-Hot Encoding (獨熱編碼) 核心思想: 為語料庫(所有文檔的集合)中的每個唯一單詞創建一個維度。對于一個特定的單詞,在其對應的維度上標記為1,在所有其他維度上標記為0。 表示: 一個非常長的二進制向…

產品經理如何做用戶調研和訪談

用戶調研和訪談是產品經理挖掘用戶需求、優化產品設計的核心環節。在一個完整的產品流程里面,用戶調研和訪談是非常重要的。 當年史玉柱推出腦白金時,就曾帶領團隊在江蘇很多城市進行了大量的走訪(用戶調研),和一幫老…

【python 讀取抖音/小紅書/微博今日頭條/百度熱點等平臺的熱點新聞】

輕松獲取全網熱點,Python助你掌握實時輿情 在信息爆炸的時代,抖音、小紅書、微博、今日頭條和百度熱點等平臺每天都會產生海量熱門內容。無論是品牌營銷、競品分析還是輿情監控,掌握這些熱點新聞至關重要。利用Python的強大爬蟲技術&#xff…

【1.3 MySQL知識庫 - 輕松理解版】

🚀 MySQL知識庫 - 輕松理解版 一、MySQL核心知識順口溜 🎵 🎤 經典記憶口訣 MySQL數據庫,InnoDB引擎強 ACID事務特性,隔離級別四檔 索引加速查詢,B樹是主梁 主從復制備份,讀寫分離扛 鎖機制防…

計算機網絡期末速成 網絡層 判斷及單選題

判斷題 路由器和鏈路層交換機都被稱為分組交換機。路由器與鏈路層交換機間的根本區別是:路由器在網絡層存儲轉發IP數據報,鏈路層交換機在鏈路層存儲轉發幀。 A. 對 B. 錯 答案: 對 解析: 路由器和鏈路層交換機確實都是分組交換機,但工作層次不同。路由器…

代理 AI 時代的隱私重構:從邊界控制到信任博弈

過去,我們將隱私等同于邊界與權限控制,依賴墻壁、鎖和規則構筑防線。而如今,隨著代理 AI 深度介入生活,成為能感知、決策的自主實體,它不僅處理數據,更在重塑我們的數字形象與內在認知。在此背景下&#xf…

C++實現手寫strstr函數

strstr 函數用于在主字符串中查找子字符串的首次出現位置,以下是高效的實現方案: KMP算法優化版本 #include <iostream> #include <string> #include <vector> using namespace std; // 計算KMP算法的部分匹配表(PMT) vector<int> getNext(const…

Linux操作系統網絡服務模塊一SSH帶外管理概述

前言&#xff1a; 在復雜的網絡運維環境中&#xff0c;?SSH帶外管理&#xff08;Out-of-Band Management&#xff09;?? 是確保系統高可用性的核心技術手段。區別于依賴業務網絡的“帶內管理”&#xff0c;帶外管理通過獨立物理通道?&#xff08;如專用管理網口或串…

org.springframework.cloud.gateway 組件解釋

org.springframework.cloud.gateway 是 Spring Cloud 生態系統中的一個新一代的、功能強大的 API 網關。 1. 什么是 API 網關 (API Gateway)&#xff1f; 在講解 Spring Cloud Gateway 之前&#xff0c;我們先要理解它扮演的角色——API 網關。 在一個微服務架構中&#xff0…

linux ollama 下載安裝

linux ollama 下載安裝 ollama 下載地址ollama 手動安裝解決找不到命令的問題升級[gcc](https://so.csdn.net/so/search?qgcc&spm1001.2101.3001.7020)Centos7 停止維護之后 [升級gcc||找不到devtoolset-8-gcc* 問題解決方案](https://www.cnblogs.com/Jedi-Pz/p/18447117…

2025 滲透工具:【中國蟻劍】連接一句話MUA文件 遠控虛擬機靶機

溫馨提示&#xff1a; 本程序僅作為虛擬機測試環境使用&#xff0c;請勿用于任何不當用途。使用即表示您同意自行承擔可能產生的所有責任。 一、場景復現 1、PhpMystudy軟件啟動網頁模擬靶機 小皮面板(phpstudy) - 讓天下沒有難配的服務器環境&#xff01; 2、開啟apache 3、…

Datawhale 網絡爬蟲技術入門第2次筆記

正則表達式 正則表達式&#xff08;Regular Expression&#xff09;&#xff0c;?種使?表達式的?式對字符串進?匹配的語法規則。 正則的語法&#xff1a;使?元字符進?排列組合來匹配字符串。 在線測試正則表達式&#xff1a;在線正則表達式測試OSCHINA.NET在線工具,os…

詳解Redis的集群模式(主從復制、哨兵與Cluster)

一、主從復制 (Master-Slave Replication) 1. 基本概念 主從復制是Redis最簡單的集群模式&#xff0c;由一個主節點(Master)和一個或多個從節點(Slave)組成。 2. 工作原理 數據同步&#xff1a;從節點啟動時會向主節點發送SYNC命令&#xff0c;主節點執行BGSAVE生成RDB文件并…