Python項目打包

Python項目如何打包?

本指南總結了Python項目打包的最佳實踐,主要涉及代碼的打包和分發,以及環境和依賴的管理。

0. 一般項目清單

  • 源代碼(可使用git托管)
  • 數據包(可使用DVC托管)
  • Docker環境鏡像(可使用docker hub托管)

1. 代碼打包

  • 使用 setuptools: 對于 Python 代碼,使用 setuptools 創建一個 setup.py或pyproject.toml 文件,它描述了你的項目及其依賴。這允許其他人使用 pip install 來安裝你的項目。我們以toml為例,展現一個基本的啟動文件:(關于toml文件的更多解釋可參考基于pyproject.toml的包管理(setuptools))
[build-system]
requires = ["setuptools>=61.0"]
build-backend = "setuptools.build_meta"[project]
name = "apss"
version = "0.3.0"
description = "一種基于神經網絡和啟發式策略的深度學習模型分布式訓練切分(3D parallelism)快速策略搜索算法"
readme = "README.md"
requires-python = ">=3.7"
classifiers = ["Programming Language :: Python :: 3",
]
dependencies = ["mindspore>=2.1.1", "tensorboard_logger","numpy", "tqdm",
][project.urls]
"Homepage" = "https://github.com/Cheny1m/APSS"[tool.setuptools.packages.find]
exclude = ["benchmark*","dist*","script*"][tool.wheel]
exclude = ["benchmark*","dist*","script*"]
  • 結構化你的項目: 確保你的項目有一個清晰的結構。通常包括源代碼目錄(如 src 或項目名稱)、測試目錄(tests或benchmark)、文檔目錄(docs)、自動化腳本目錄(scripts)等。
  • 包含必要的文件: 除了源代碼外,還應該包括 README.md(項目說明)、LICENSE(許可證)、.gitignore(Git 忽略規則)、config.json(可能的配置設置)、requirements.txt(可能的依賴提示)等文件。
# .gitignore例子# data & log & output
resource/# built binaries
dist# vscode
.vscode/# cache
*__pycache__
*.egg-info# pickle
*.pkl

2. 數據和資源

  • 分離大型數據: 如果項目包含大型數據文件或其他資源(如圖像、模型等),最好不要直接包含在代碼包中。可以將它們托管在網絡上,如云存儲(AWS S3、Google Cloud Storage 等),并在文檔中提供下載鏈接或腳本。
  • 使用數據管理工具: 對于數據科學項目,考慮使用如 DVC(Data Version Control)之類的工具協同git來管理數據。

3. 環境和依賴管理

  • requirements.txt: 為項目創建一個 requirements.txt 文件,列出所有的依賴項,以便其他人可以使用 pip install -r requirements.txt 來安裝依賴。
  • 使用虛擬環境: 推薦在開發時使用虛擬環境(如 venv 或 conda),這有助于隔離依賴并確保項目的可移植性。
  • 考慮使用 Docker: 對于更復雜的項目,尤其是涉及多個服務或特定系統依賴時,考慮使用 Docker 容器來打包你的應用及其環境。打包好的docker可以上傳至docker hub供用戶下載。

4. 文檔和示例

  • 寫明確的文檔: 提供清晰、詳細的文檔,說明如何安裝、配置和使用你的項目。如果可能,包括一些示例和教程。
  • 包含運行示例: 提供一些示例腳本或 Jupyter 筆記本,展示如何使用你的項目。

5. 測試和持續集成

  • 編寫測試: 為你的代碼編寫單元測試和(如果適用)集成測試。
  • 設置 CI/CD: 考慮使用持續集成/持續部署(CI/CD)工具,如 GitHub Actions 或 Travis CI,來自動化測試和部署流程。

6. 發布到 PyPI

  • 發布包: 如果你的項目是一個庫,并且你希望它被廣泛使用,可以考慮將其發布到 PyPI 上,讓人們可以通過 pip 直接安裝。自動化腳本upload_pypi.sh:
rm -rf dist
python3 -m build
python3 -m twine upload dist/*

7. 版本控制

  • 使用 Git: 使用 Git 進行版本控制,并在 GitHub 或其他平臺上托管代碼,這不僅有助于團隊協作,也方便分享和反饋。

8. 遵守開源協議

  • 選擇合適的許可證: 如果你打算開源你的項目,選擇一個合適的開源許可證(如 MIT、GPL、Apache 等)。

9.驗證打包是否正確(創建新環境)

  • 使用Git拉取源代碼和數據文件,使用docker下載好所需要的image。
  • 啟動docker容器并將源代碼和數據文件映射進容器。
  • pip安裝項目(從源碼構建 – 進入項目根目錄后執行:pip install -e . ;如果上傳到了pypi,可以使用pip install xxx)
  • 執行主腳本,看是否能夠正常運行。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/165104.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/165104.shtml
英文地址,請注明出處:http://en.pswp.cn/news/165104.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python進行threading多線程編程及高級并發處理機制

threading 模塊是 Python 中用于進行多線程編程的標準庫之一。通過 threading 模塊,你可以創建和管理線程,使得程序能夠并發執行多個任務。以下是一些基本的 threading 模塊的用法: 1. 創建線程: 使用 threading.Thread 類可以創…

在兩個java項目中實現Redis的發布訂閱模式

如何在兩個java項目中實現Redis的發布訂閱模式? 1. Redis簡介2. 發布訂閱模式介紹3. 實現思路4. 代碼實現及詳細解釋4.1. RedisUtil4.2. Publisher4.3. Subscriber4.4. 運行程序 目錄: Redis簡介發布訂閱模式介紹實現思路代碼實現及詳細解釋 1. Redis簡…

HTB Napper WriteUp

Napper 2023年11月12日 14:58:35User Nmap ? Napper nmap -sCV -A -p- 10.10.11.240 --min-rate 10000 Starting Nmap 7.80 ( https://nmap.org ) at 2023-11-12 13:58 CST Nmap scan report for app.napper.htb (10.10.11.240) Host is up (0.15s latency). Not shown: …

gitee推薦-SAPI++

一下內容來自gitee。 SaaS-Apps-Engine: 智者|SAPI是多應用、多租戶SaaS應用引擎,支持(小程序/公眾號/輕應用/企微/抖音/支付寶/百度)等多平臺應用。基于ThinkPHP6.1/8.0原生多應用模式開發,簡潔、高效、易擴展。集成強大的權限控…

適用于電腦的5個免費文件恢復軟件分享

適用于電腦的最佳免費文件恢復軟件 任何計算機用戶都可能經歷過丟失重要文件的恐懼。重要數據的丟失可能會令人不安和沮喪,無論是由于不小心刪除、計算機故障還是硬盤格式化造成的。幸運的是,在數字時代,您可以使用值得信賴的解決方案檢索這些…

好工具|datamap,一個好用的地圖可視化Excel插件,在Excel中實現地理編碼、拾取坐標

在做VRP相關研究的時候,需要對地圖數據做很多處理,比如地理編碼,根據“重慶市沙坪壩區沙正街174號”這樣的一個文本地址知道他的經緯度;再比如繪制一些散點圖,根據某個位置的經緯度在地圖上把它標注出來。還有有的時候…

vue + docxtemplater 導出 word 文檔

一、痛點 word 導出 這種功能其實之前都是后端實現的,但最近有個項目沒得后端。所以研究下前端導出。 ps: 前端還可以導出 pdf,但是其分頁問題需要話精力去計算才可能實現,并且都不是很完善。可參考之前的文章:利用 h…

MIT6.824-Raft筆記:腦裂、Majority Vote(過半投票/過半選舉)

本部分主要是問題引入,以及給出一個解決方案 1 腦裂(Split Brain) replication system的共同點:單點 前面幾個容錯特性(fault-tolerant)的系統,有一個共同的特點。 MapReduce復制了計算&…

JavaScript框架 Angular、React、Vue.js 的全棧解決方案比較

在 Web 開發領域,JavaScript 提供大量技術棧可供選擇。其中最典型的三套組合,分別是 MERN、MEAN 和 MEVN。前端框架(React、Angular 和 Vue)進行簡化比較。 MERN 技術棧詳解 MERN 技術棧包含四大具體組件: MongoDB&am…

藍橋杯物聯網競賽_STM32L071_3_Oled顯示

地位: 對于任何一門編程語言的學習,print函數毫無疑問是一種最好的調試手段,調試者不僅能通過它獲取程序變量的運行狀態而且通過對其合理使用獲取程序的運行流程,更能通過關鍵變量的輸出幫你驗證推理的正確與否,樸素的…

常見網絡安全防護

1 阻斷服務攻擊(DOS) 阻斷服務攻擊,想辦法目標網絡資源用盡變種:分布式阻斷服務攻擊 影響: 寬帶消耗性(消耗目標的帶寬)資源消耗型(消耗目標的計算資源) 解決方案&am…

人工智能對網絡安全的影響越來越大

如果問當前IT行業最熱門的話題是什么,很少有人會回答除了人工智能(AI)之外的任何話題。 在不到 12 個月的時間里,人工智能已經從一項只有 IT 專業人員才能理解的技術發展成為從小學生到作家、程序員和藝術家的每個人都使用的工具…

MySQL索引事務基礎

目錄 1. 索引 1.1索引的概念 1.2索引的特點 1.3 索引的使用場景 1.4索引的使用 1.4.1查看索引 1.4.2創建索引 1.4.3刪除索引 1.5索引保存的數據結構 2.事務 2.1經典例子 2.2事務的概念 2.3事務的使用 2.4事務的4個核心特性 2.5事務的并發問題 2.5.1臟讀 2.5.2不可…

Python + Docker 還是 Rust + WebAssembly?

在不斷發展的技術世界中,由大語言模型驅動的應用程序,通常被稱為“LLM 應用”,已成為各種行業技術創新背后的驅動力。隨著這些應用程序的普及,用戶需求的大量涌入對底層基礎設施的性能、安全性和可靠性提出了新的挑戰。 Python 和…

Java項目如何打包成Jar(最簡單)

最簡單的辦法,使用Maven插件(idea自帶) 1.選擇需要打包的mudule,點擊idea右側的maven插件 2.clean操作 3.選擇需要的其他mudule,進行install操作(如果有) 4.再次選擇需要打包的module&#…

Vue.observable 是什么

Observable 翻譯過來我們可以理解成可觀察的 Vue.js2.6 新增 Vue.observable,讓一個對象變成響應式數據。Vue 內部會用它來處理 data 函數返回的對象 。 返回的對象可以直接用于渲染函數和計算屬性內,并且會在發生變更時觸發相應的更新。也可以作為最小化…

Git的指令

Git 各平臺安裝包下載地址為:http://git-scm.com/downloads Ubuntu Git 安裝命令為: $ apt-get install git用戶信息 配置個人的用戶名稱和電子郵件地址: $ git config --global user.name "runoob" $ git config --global user.…

Python----類對象和實例對象

目錄 一.類和類的實例 二.類屬性和實例屬性 三.私有屬性和公有屬性 四.靜態方法和類方法 五.__init__方法,__new__方法和__del__方法: 六.私有方法和公有方法 七.方法的重載 八.方法的繼承 九.方法的重寫 十.對象的特殊方法 十一.對象的引用&a…

軟件開發模式開源和閉源的優劣之爭

開源和閉源,兩種截然不同的開發模式,對于大模型的發展有著重要影響。開源讓技術共享,吸引了眾多人才加入,推動了大模的創新。而閉源則保護了商業利益和技術優勢,為大模型的商業應用提供了更好的保障。 開源與閉源軟件的…

基于命令行模式設計退款請求處理

前言 這篇文章的業務背景是基于我的另一篇文章: 對接蘋果支付退款退單接口-CSDN博客 然后就是說設計模式是很開放的東西,可能我覺得合適,你可能覺得不合適,這里只是做下討論,沒有一定要各位同意的意思.... 相關圖文件 這里我先把相關的圖文件放上來,可能看著會比較清晰點 代碼邏…