一、Anaconda環境搭建
1、關于Anaconda
? ? ? ? Anaconda 是一個非常 popular 的 Python 發行版,它不僅包含了 Python 語言本身,還預裝了眾多常用的科學計算庫,如 NumPy、Pandas、Matplotlib 等,能夠極大地方便用戶的開發和數據分析工作。Anaconda 提供了一個統一的環境管理工具,用戶可以輕松創建和管理多個獨立的 Python 環境,避免了不同項目之間的依賴沖突。此外,Anaconda 還提供了 Anaconda Navigator 這樣的圖形化界面,讓用戶更直觀地管理包和環境。這對于剛開始學習 Python 或者需要處理復雜項目的用戶來說,Anaconda 都是一個非常友好且強大的工具。
? ? ? ?很多人在使用Python時,直接就下載了特定版本的Python解釋器,然后項目中途會使用到的哪些庫,直接安裝就行了,這樣會帶來一些問題:
? ? ? ?不同項目使用的庫對Python的版本也許會有限制。比如有些庫只能在Python2的版本下使用,有的只能在Python3的版本下使用;很多庫在一次或者幾次的項目中使用后,就很難再用到了,長期下來會積累很多這種已經沒用的庫,從而使包變得冗余,占用內存空間。
? ? ? ? 針對直接安裝Python會帶來的這些問題,所以很多人都會使用anaconda,anaconda有以下好處:自帶常用的庫,能夠滿足一些基礎簡單的需要;可以創建多個環境,每個環境可以安裝不同的Python版本,從而解決了版本沖突的問題。并且每個環境都可獨立安裝各自需要的庫,應用于不同的項目,由此便于管理不同項目需要的特定的庫。
2、Anaconda下載
? ? ? ? (1)下載Anaconda安裝包
? ? ? ? ?進入?Anaconda 官網,注冊或登錄,在 Hub 中點擊?Install Distribution,填寫信息后下載即可。
? ? ? ? ?如果你的網絡無法訪問 Anaconda 官網或者下載速度較慢,可以從?清華大學開源軟件鏡像站?下載。或者直接使用我在群內提供的壓縮包下載。
? ? ? ?(2)安裝Anaconda
在 Anaconda 安裝的過程中,比較容易出錯的環節是環境變量的配置,所以大家在配置環境變量的時候,要細心一些。
????????雙擊下載好的安裝包,點擊?Next,點擊?I Agree,選擇?Just Me,選擇安裝路經(安裝在 C 盤也有好處,不過與 C 盤爆炸來說不值一提,建議按在其他盤)然后 Next,來到如下界面:
????????請選擇?Register Anaconda as my default Python 3.x,不要選 Add Anaconda to my PATH environment variable,我們需要后期手動添加環境變量。
????????點擊 Install,安裝需要等待一會兒。
????????最后一直 Next,直到安裝完成。
????????對于兩個“learn”,都取消打勾,不用打開去看了,耽誤時間。
? ? ? (3)配置環境變量
? ? ? ? 此電腦(右鍵)→ 屬性 → 高級系統設置 →(點擊)環境變量
????????在下面系統變量里,找到并點擊 Path
在編輯環境變量里,點擊新建
????????輸入下面的五個環境變量。(這里不是完全一樣的!你需要將以下五條環境變量中涉及的到的"D:\_Producers\Anaconda3"都修改為你的 Anaconda 的安裝路徑!)
E:\environment\anaconda3
E:\environment\Anaconda3\Scripts
E:\environment\Anaconda3\Library\bin
E:\environment\Anaconda3\Library\mingw-w64\bin
E:\environment\Anaconda3\Library\usr\bin
簡要說明五條路徑的用途:這五個環境變量中,1 是 Python 需要,2 是 conda 自帶腳本,3 是 jupyter notebook 動態庫, 4 是使用 C with python 的時候
????????新建完成后點擊確定。
????????(4)驗證
? ? ? ? ? ?打開 cmd,在彈出的命令行查看 anaconda 版本,依次輸入 :
conda --version
python --version
????????若各自出現版本號,即代表配置成功。
????????在開始菜單或桌面找到?Anaconda Navifator?將其打開(若桌面沒有可以發一份到桌面,方便后續使用),出現 GUI 界面即為安裝成功。
????????Anaconda 自帶了一些常用的機器學習庫,如 numpy、pandas、matplotlib、seaborn、scikit-learn 等。
????????如果需要安裝其他庫,可以直接在 Anaconda Navigator 里搜索安裝。
? ? ? ? (5)更改conda源
????????如果你沒有魔法上網工具,建議更改 conda 源,這樣可以加快下載包的速度。清華大學提供了 Anaconda 的鏡像倉庫,我們把源改為清華大學鏡像源。
????????找到 Anaconda prompt,打開 shell 面板。
????????在命令行輸入以下命令:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --set show_channel_urls yes
????????查看是否修改好通道:
conda config --show channels
二、PyCharm使用
1、新建項目
2、配置conda環境
????????(1)我們在PyCharm中依此選擇File–>Settings–>Project–>Python Inerpreter,如下圖所示:
? ? ? ? (2)在彈出的設置窗口中,點擊左側的“Python Inerpreter”,然后點擊右側的“Add Local Interpreter”,點擊它進到環境配置窗口:
? ? ? ? (3)點擊conda environment選項卡,點擊右側文件夾圖標,找到自己anaconda下載的目錄,選擇anaconda根目錄下的Scripts下的conda.exe。
? ? ? ? (4)然后點擊“Load Environment”加載環境,加載完成后發現所有虛擬環境均導入,默認為base環境。
? ? ? ? (5)我們可以看到base環境的包,含有scikit-learn庫,說明此時編譯器可以進行sickit-learn庫提供的相關操作。
? ? ? ? (6)驗證是否配置成功,新建一個py文件,將下面的代碼放進文件運行,若控制臺正常運行出結果證明配置成功。
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier# 1.獲取數據
iris = load_iris()# 2.數據基本處理
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)# 3.特征工程 - 特征預處理
transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)
x_test = transfer.transform(x_test)# 4.機器學習-KNN
# 4.1 實例化一個估計器
estimator = KNeighborsClassifier()
# 4.2 模型調優 -- 交叉驗證,網格搜索
param_grid = {"n_neighbors": [1, 3, 5, 7]}
estimator = GridSearchCV(estimator, param_grid=param_grid, cv=5)
# 4.3 模型訓練
estimator.fit(x_train, y_train)# 5.模型評估
# 5.1 預測值結果輸出
y_pre = estimator.predict(x_test)
print("預測值是:\n", y_pre)
print("預測值和真實值的對比是:\n", y_pre == y_test)
# 5.2 準確率計算
score = estimator.score(x_test, y_test)
print("準確率為:\n", score)
# 5.3 查看交叉驗證,網格搜索的一些屬性
print("在交叉驗證中,得到的最好結果是:\n", estimator.best_score_)
print("在交叉驗證中,得到的最好的模型是:\n", estimator.best_estimator_)
print("在交叉驗證中,得到的模型結果是:\n", estimator.cv_results_)print("Hello, sklearn!")
三、常用Anaconda指令
在沒有 GUI 的情況下,以下命令比較常用:
1.查看當前環境下安裝的庫:
conda list
2.查看所有環境:
conda info --envs
3.創建新的環境:
conda create -n 環境名稱 python=版本號
4.激活環境:
conda activate 環境名稱
5.退出環境:
conda deactivate
6.刪除環境:
conda remove -n 環境名稱 --all
7.導出環境:
conda env export > environment.yaml
8.導入環境:
conda env create -f environment.yaml
9.列出所有可用的包:
conda search 包名
10.安裝包:
conda install 包名
11.更新包:
conda update 包名
12.卸載包:
conda uninstall 包名