scikit-learn零基礎配置(含python、anaconda)

一、Anaconda環境搭建

1、關于Anaconda

? ? ? ? Anaconda 是一個非常 popular 的 Python 發行版,它不僅包含了 Python 語言本身,還預裝了眾多常用的科學計算庫,如 NumPy、Pandas、Matplotlib 等,能夠極大地方便用戶的開發和數據分析工作。Anaconda 提供了一個統一的環境管理工具,用戶可以輕松創建和管理多個獨立的 Python 環境,避免了不同項目之間的依賴沖突。此外,Anaconda 還提供了 Anaconda Navigator 這樣的圖形化界面,讓用戶更直觀地管理包和環境。這對于剛開始學習 Python 或者需要處理復雜項目的用戶來說,Anaconda 都是一個非常友好且強大的工具。

? ? ? ?很多人在使用Python時,直接就下載了特定版本的Python解釋器,然后項目中途會使用到的哪些庫,直接安裝就行了,這樣會帶來一些問題:

? ? ? ?不同項目使用的庫對Python的版本也許會有限制。比如有些庫只能在Python2的版本下使用,有的只能在Python3的版本下使用;很多庫在一次或者幾次的項目中使用后,就很難再用到了,長期下來會積累很多這種已經沒用的庫,從而使包變得冗余,占用內存空間。
? ? ? ? 針對直接安裝Python會帶來的這些問題,所以很多人都會使用anaconda,anaconda有以下好處:自帶常用的庫,能夠滿足一些基礎簡單的需要;可以創建多個環境,每個環境可以安裝不同的Python版本,從而解決了版本沖突的問題。并且每個環境都可獨立安裝各自需要的庫,應用于不同的項目,由此便于管理不同項目需要的特定的庫。

2、Anaconda下載

? ? ? ? (1)下載Anaconda安裝包

? ? ? ? ?進入?Anaconda 官網,注冊或登錄,在 Hub 中點擊?Install Distribution,填寫信息后下載即可。

? ? ? ? ?如果你的網絡無法訪問 Anaconda 官網或者下載速度較慢,可以從?清華大學開源軟件鏡像站?下載。或者直接使用我在群內提供的壓縮包下載。

? ? ? ?(2)安裝Anaconda

在 Anaconda 安裝的過程中,比較容易出錯的環節是環境變量的配置,所以大家在配置環境變量的時候,要細心一些。

????????雙擊下載好的安裝包,點擊?Next,點擊?I Agree,選擇?Just Me,選擇安裝路經(安裝在 C 盤也有好處,不過與 C 盤爆炸來說不值一提,建議按在其他盤)然后 Next,來到如下界面:

????????請選擇?Register Anaconda as my default Python 3.x,不要選 Add Anaconda to my PATH environment variable,我們需要后期手動添加環境變量。

????????點擊 Install,安裝需要等待一會兒。

????????最后一直 Next,直到安裝完成。

????????對于兩個“learn”,都取消打勾,不用打開去看了,耽誤時間。

? ? ? (3)配置環境變量

? ? ? ? 此電腦(右鍵)→ 屬性 → 高級系統設置 →(點擊)環境變量

????????在下面系統變量里,找到并點擊 Path

在編輯環境變量里,點擊新建

????????輸入下面的五個環境變量。(這里不是完全一樣的!你需要將以下五條環境變量中涉及的到的"D:\_Producers\Anaconda3"都修改為你的 Anaconda 的安裝路徑!

E:\environment\anaconda3
E:\environment\Anaconda3\Scripts
E:\environment\Anaconda3\Library\bin
E:\environment\Anaconda3\Library\mingw-w64\bin
E:\environment\Anaconda3\Library\usr\bin

簡要說明五條路徑的用途:這五個環境變量中,1 是 Python 需要,2 是 conda 自帶腳本,3 是 jupyter notebook 動態庫, 4 是使用 C with python 的時候

????????新建完成后點擊確定。

????????(4)驗證

? ? ? ? ? ?打開 cmd,在彈出的命令行查看 anaconda 版本,依次輸入 :

conda --version
python --version

????????若各自出現版本號,即代表配置成功。

????????在開始菜單或桌面找到?Anaconda Navifator?將其打開(若桌面沒有可以發一份到桌面,方便后續使用),出現 GUI 界面即為安裝成功。

????????Anaconda 自帶了一些常用的機器學習庫,如 numpy、pandas、matplotlib、seaborn、scikit-learn 等。

????????如果需要安裝其他庫,可以直接在 Anaconda Navigator 里搜索安裝。

? ? ? ? (5)更改conda源

????????如果你沒有魔法上網工具,建議更改 conda 源,這樣可以加快下載包的速度。清華大學提供了 Anaconda 的鏡像倉庫,我們把源改為清華大學鏡像源。

????????找到 Anaconda prompt,打開 shell 面板。

????????在命令行輸入以下命令:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --set show_channel_urls yes

????????查看是否修改好通道:

conda config --show channels

二、PyCharm使用

1、新建項目

2、配置conda環境

????????(1)我們在PyCharm中依此選擇File–>Settings–>Project–>Python Inerpreter,如下圖所示:

? ? ? ? (2)在彈出的設置窗口中,點擊左側的“Python Inerpreter”,然后點擊右側的“Add Local Interpreter”,點擊它進到環境配置窗口:

? ? ? ? (3)點擊conda environment選項卡,點擊右側文件夾圖標,找到自己anaconda下載的目錄,選擇anaconda根目錄下的Scripts下的conda.exe。

? ? ? ? (4)然后點擊“Load Environment”加載環境,加載完成后發現所有虛擬環境均導入,默認為base環境。

? ? ? ? (5)我們可以看到base環境的包,含有scikit-learn庫,說明此時編譯器可以進行sickit-learn庫提供的相關操作。

? ? ? ? (6)驗證是否配置成功,新建一個py文件,將下面的代碼放進文件運行,若控制臺正常運行出結果證明配置成功。

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier# 1.獲取數據
iris = load_iris()# 2.數據基本處理
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)# 3.特征工程 - 特征預處理
transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)
x_test = transfer.transform(x_test)# 4.機器學習-KNN
# 4.1 實例化一個估計器
estimator = KNeighborsClassifier()
# 4.2 模型調優 -- 交叉驗證,網格搜索
param_grid = {"n_neighbors": [1, 3, 5, 7]}
estimator = GridSearchCV(estimator, param_grid=param_grid, cv=5)
# 4.3 模型訓練
estimator.fit(x_train, y_train)# 5.模型評估
# 5.1 預測值結果輸出
y_pre = estimator.predict(x_test)
print("預測值是:\n", y_pre)
print("預測值和真實值的對比是:\n", y_pre == y_test)
# 5.2 準確率計算
score = estimator.score(x_test, y_test)
print("準確率為:\n", score)
# 5.3 查看交叉驗證,網格搜索的一些屬性
print("在交叉驗證中,得到的最好結果是:\n", estimator.best_score_)
print("在交叉驗證中,得到的最好的模型是:\n", estimator.best_estimator_)
print("在交叉驗證中,得到的模型結果是:\n", estimator.cv_results_)print("Hello, sklearn!")

三、常用Anaconda指令

在沒有 GUI 的情況下,以下命令比較常用:

1.查看當前環境下安裝的庫:

conda list

2.查看所有環境:

conda info --envs

3.創建新的環境:

conda create -n 環境名稱 python=版本號

4.激活環境:

conda activate 環境名稱

5.退出環境:

conda deactivate

6.刪除環境:

conda remove -n 環境名稱 --all

7.導出環境:

conda env export > environment.yaml

8.導入環境:

conda env create -f environment.yaml

9.列出所有可用的包:

conda search 包名

10.安裝包:

conda install 包名

11.更新包:

conda update 包名

12.卸載包:

conda uninstall 包名

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/921435.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/921435.shtml
英文地址,請注明出處:http://en.pswp.cn/news/921435.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

RAG提示詞(日本語版)

RAG提示詞(日本語版) System Message # 知能型質問応答アシスタント(RAGシステムプロンプト)## 役割定義 あなたは「知能型質問応答アシスタント」として、提供されたコンテキスト情報に基づいてユーザーの質問に回答する専門的な…

qData 數據中臺【開源版】發布 1.0.5 版本,全面提升規則治理、非結構化數據處理與部署體驗

2025年9月3日 —— 企業級開源數據中臺 qData 開源版 正式發布 1.0.5 版本。本次更新聚焦 規則治理一體化、非結構化數據支持、以及開源版的體驗與部署優化,進一步提升規則復用能力、數據接入廣度與運維效率,幫助企業和開發者更輕松地構建高質量數據治理…

RecSys:用戶行為序列建模以及DIN、SIM模型

引言 在推薦系統中,用戶歷史行為序列是極其重要的信息源。用戶最近的點擊、點贊、收藏、轉發等行為能夠有效反映其即時興趣,無論是在召回、粗排還是精排階段,合理利用這些行為序列都能顯著提升推薦效果。本文將系統介紹用戶行為序列建模的幾…

QGIS二次開發01:環境配置-OSGeo4W鏡像

寫在前面: 本筆記根據多方資料整理而成,旨在為QGIS二次開發提供學習參考。內容僅供交流學習,歡迎共同探討。 一、關于QGIS QGIS 是一個功能強大的桌面GIS軟件本身,為用戶提供了圖形化界面(GUI)來進行地圖制…

對接旅游行業安全需求:旅游安全急救實訓室的功能構建與育人目標

隨著我國旅游行業的快速發展,游客安全需求日益凸顯,安全應急處置能力已成為旅游服務人才的核心競爭力。旅游安全急救實訓室作為旅游服務與管理專業中的重要教學場所,其功能構建與育人目標影響人才培養質量與行業安全水平。點擊獲取方案 一、行…

Typora處理markdown文件【給.md文檔加水印】

①文件→偏好設置→外觀→打開主題文件夾②在打開的文件夾中放入水印圖像③右鍵點擊github.css文件后,點擊編輯,進入編輯頁面④將代碼塊中內容粘貼到文件最后 更多效果請自行探索 #write::before {content: "CSDN果子當夜宵:bigxie.blog…

基于單片機的六足機器人控制系統設計

基于單片機的六足機器人控制系統設計摘 要本設計主要是基于單片機的六足機器人控制系統設計,綜合分析六足機器人的結構、步態和控制算法,結合云端服務器、WIFI 技術、藍牙技術、語音識別技術和手勢識別技術進行多種控制模式的設計,并提出不同…

RK3568 Trust

文章目錄1、環境介紹2、前言3、ARM TrustZone3.1、什么是ARM TrustZone3.2、cpu特權等級3.3、ARM Trusted Firmware4、Rockchip 平臺的 Trust4.1、實現機制4.2、啟動流程4.3、生命周期4.4、Trust 編譯打包流程分析5、總結1、環境介紹 硬件:飛凌ok3568-c開發板 軟件…

C語言數據結構——詳細講解《二叉樹與堆的基本概念》

C語言數據結構——詳細講解《二叉樹與堆的基本概念》前言一、樹的基礎概念1.1 為什么需要樹?1.2 樹的定義與結構1.3 樹的核心術語1.3 樹的核心術語1.4 樹的表示方法(孩子兄弟表示法)結構定義為什么用孩子兄弟表示法?1.5 樹的實際應…

STAR-CCM+|雷諾數回顧

【1】引言 前序已經學習了K-epsilon湍流模型溯源的基礎知識,今天再學習一些更為基礎的知識,回顧一下雷諾數ReReRe。 【2】雷諾數定義 雷諾數公式為: ReρvDμRe\frac{\rho vD}{\mu}ReμρvD? 式中, ρ\rhoρ——流體密度&…

Java中的死鎖

鎖的合理使用能夠保證共享數據的安全性,但是 使用不當也會可能引起死鎖。1. 死鎖概念 死鎖是指兩個或兩個以上的線程在執行過程中,因爭奪資源而造成的一種互相等待的現象,若無外力干涉那它們都將無法推進下去,如果系統資源充足,進程的資源請求…

基于STM32F103C8T6的智能家居健康環境監測系統

項目開發背景 隨著城市化進程加速和居民生活水平提升,人們對家居環境健康與安全的需求日益增強。現代住宅常因裝修材料、密閉空間及外部污染導致甲醛超標、PM2.5濃度升高、溫濕度失衡等問題,長期暴露此類環境中易引發呼吸道疾病、過敏反應等健康隱患。傳…

2025職場進階:B端產品經理必備的計算機專業技能精要

當前企業級服務市場競爭日益激烈,2025年的B端產品經理不僅需要深厚的行業認知,還必須具備扎實的計算機專業技能,才能設計出真正符合技術趨勢與業務需求的企業級產品。而其中,人工智能技術已經成為B端產品不可或缺的組成部分&#…

有效三角形的個數(數組單調性)

目錄 一:題目鏈接 二:題目思路 三:代碼實現 一:題目鏈接 題目的要求是找出當前數組能組成三角形三元組的個數。 二:題目思路 有一種暴力枚舉解法,利用三層 for 循環來一一枚舉三元組的情況,如…

Rust在醫療系統中的應用:安全、性能與合規性實踐(上)

Rust在醫療系統中的應用:安全、性能與合規性實踐 摘要 醫療系統對軟件安全與性能存在嚴苛雙重需求,既需抵御內存漏洞、數據加密風險等安全威脅(如歷史醫療設備因軟件問題召回案例所示),又需滿足電子健康記錄(EHR)系統、醫學影像處理等高并發數據場景的性能要求,同時需…

讀寫鎖 shared_mutex 共享互斥量介紹

文章目錄讀數據對數據沒有影響,為什么還需要shared_mutex1. 保證讀取數據的“一致性”和“時效性”2. 協調“讀”與“寫”的競爭關系總結好的,我們來詳細介紹 C17 中的 std::shared_mutex(共享互斥量,俗稱讀寫鎖)的使用…

Nestjs框架: 基于裝飾器與Guards的完成RBAC權限系統設計與實現

概述 在現代權限管理系統中,RBAC(基于角色的訪問控制)是廣泛采用的一種模型RBAC 核心思想是通過角色來管理用戶權限通過角色綁定用戶、資源和權限,實現細粒度的訪問控制為了實現這一目標,我們需要在數據庫中設計合理的…

機器學習如何精準預測高值

一、概念理解“機器學習對于高值的預測保守”,這是建模里很常見的現象,尤其在生態、氣候、遙感這類數據分布高度偏斜的場景。通常可以從以下幾個角度理解:1. 數據分布與樣本稀缺在訓練集里,高值樣本往往非常少,遠低于中…

蜂窩物聯網模組:智能門禁產品上的關鍵部件

隨著物聯網技術的快速發展,蜂窩物聯網模組正逐步成為智能門禁系統的關鍵通信組件。蜂窩模組憑借其廣覆蓋、高可靠性和低功耗特性,正從傳統門禁系統的補充角色轉變為智能門禁的核心通信組件,尤其在智慧社區、商業樓宇和政府機構等場景中展現出…

[光學原理與應用-417]:非線性光學 - 線性光學(不引發頻率的變化)與非線性光學(引發頻率變化)的異同

一、定義與物理機制:線性響應 vs 非線性響應線性光學定義:光與物質相互作用時,介質的極化強度與入射光電場強度呈線性關系(P?0?χ(1)E),輸出光強與輸入光強成正比(Iout?∝Iin?)-…