接下來開始機器學習部分
第一步配置環境:
VSCode使用Jupyter完整指南
1. 安裝必要的擴展
打開VSCode,按 Ctrl+Shift+X
打開擴展市場,搜索并安裝以下擴展:
必裝擴展:
- Python (Microsoft官方) - Python語言支持
- Jupyter (Microsoft官方) - Jupyter notebook支持
- Pylance (Microsoft官方) - Python智能提示和語法檢查
推薦擴展:
- Python Docstring Generator - 自動生成函數文檔
- Python Environment Manager - Python環境管理
- Jupyter Keymap - Jupyter快捷鍵支持
2. Python環境配置
# 方法1:使用Anaconda(推薦)
conda create -n ai_learning python=3.9
conda activate ai_learning# 安裝Jupyter相關包
conda install jupyter notebook ipykernel
# 或使用pip
pip install jupyter notebook ipykernel# 安裝AI學習必需的庫
pip install numpy pandas matplotlib seaborn scikit-learn
pip install tensorflow keras torch torchvision
pip install plotly jupyter-widgets ipywidgets# 將環境注冊到Jupyter內核
python -m ipykernel install --user --name ai_learning --display-name "AI Learning Python 3.9"
# 方法2:使用虛擬環境
python -m venv ai_env
# Windows激活
ai_env\Scripts\activate
# macOS/Linux激活
source ai_env/bin/activate# 安裝相同的包
pip install jupyter ipykernel numpy pandas matplotlib seaborn scikit-learn
python -m ipykernel install --user --name ai_env --display-name "AI Environment"
3. VSCode配置優化
按 Ctrl+,
打開設置,搜索相關設置或直接編輯 settings.json
:
{// Python解釋器路徑"python.defaultInterpreterPath": "~/anaconda3/envs/ai_learning/bin/python",// Jupyter設置"jupyter.askForKernelRestart": false,"jupyter.sendSelectionToInteractiveWindow": false,"jupyter.interactiveWindow.creationMode": "perFile","jupyter.widgetScriptSources": ["jsdelivr.com", "unpkg.com"],"jupyter.runStartupCommands": ["%load_ext autoreload", "%autoreload 2"],// Notebook設置"notebook.cellToolbarLocation": {"default": "right","jupyter-notebook": "left"},"notebook.output.textLineLimit": 30,"notebook.showCellStatusBar": "visible",// Python設置"python.terminal.activateEnvironment": true,"python.linting.enabled": true,"python.linting.pylintEnabled": true,// 字體和主題"editor.fontSize": 14,"editor.fontFamily": "'Fira Code', 'Consolas', 'Courier New', monospace","editor.fontLigatures": true,// 中文支持"files.autoGuessEncoding": true
}
4. 創建和使用Jupyter Notebook
方法1:通過命令面板
- 按
Ctrl+Shift+P
打開命令面板 - 輸入 “Jupyter: Create New Jupyter Notebook”
- 選擇Python內核(選擇我們創建的ai_learning環境)
方法2:直接創建文件
- 在文件資源管理器中右鍵點擊
- 選擇 “New File”
- 命名為
test.ipynb
- VSCode會自動識別為Jupyter文件
方法3:使用快捷鍵
Ctrl+Shift+P
→ “Python: Create Blank New Jupyter Notebook”
5. Jupyter Notebook基本操作
單元格操作:
Shift+Enter
- 運行當前單元格并移到下一個Ctrl+Enter
- 運行當前單元格不移動Alt+Enter
- 運行當前單元格并在下方插入新單元格A
- 在當前單元格上方插入新單元格B
- 在當前單元格下方插入新單元格DD
- 刪除當前單元格M
- 轉換為Markdown單元格Y
- 轉換為代碼單元格
實用快捷鍵:
Ctrl+/
- 注釋/取消注釋Tab
- 自動補全Shift+Tab
- 查看函數文檔Ctrl+S
- 保存Ctrl+Z
- 撤銷
6. 環境切換和內核管理
切換Python環境:
- 點擊右上角的內核選擇器
- 選擇 “Select Another Kernel”
- 選擇 “Python Environments”
- 選擇你創建的 “AI Learning Python 3.9”
查看可用內核:
jupyter kernelspec list
刪除不需要的內核:
jupyter kernelspec uninstall unwanted_kernel_name
7. 實用技巧和最佳實踐
7.1 魔法命令(Magic Commands)
# 在notebook中使用以下魔法命令
%matplotlib inline # 圖表內聯顯示
%load_ext autoreload # 自動重載模塊
%autoreload 2 # 自動重載所有模塊# 查看執行時間
%time your_function()
%timeit your_function()# 查看當前變量
%who # 簡單列表
%whos # 詳細信息# 執行shell命令
!pip list
!ls -la
7.2 調試技巧
# 在代碼中設置斷點
import pdb; pdb.set_trace()# 或使用ipdb(需要安裝:pip install ipdb)
import ipdb; ipdb.set_trace()# 在VSCode中可以直接設置斷點,點擊行號左側
7.3 輸出優化
# 設置pandas顯示選項
import pandas as pd
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)
pd.set_option('display.width', None)# 設置numpy顯示選項
import numpy as np
np.set_printoptions(precision=3, suppress=True)# 設置matplotlib中文顯示
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] # 中文字體
plt.rcParams['axes.unicode_minus'] = False # 負號顯示
8. 測試配置
創建一個測試文件驗證配置是否正確:
# 測試基本功能
import sys
print("Python版本:", sys.version)
print("Python路徑:", sys.executable)
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用來正常顯示中文標簽
plt.rcParams['axes.unicode_minus'] = False # 用來正常顯示負號
# 測試科學計算庫
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as snsprint("NumPy版本:", np.__version__)
print("Pandas版本:", pd.__version__)# 測試簡單繪圖
x = np.linspace(0, 10, 100)
y = np.sin(x)plt.figure(figsize=(10, 6))
plt.plot(x, y, label='sin(x)')
plt.title('測試圖表')
plt.xlabel('x')
plt.ylabel('y')
plt.legend()
plt.grid(True)
plt.show()# 測試數據處理
df = pd.DataFrame({'A': np.random.randn(5),'B': np.random.randn(5),'C': np.random.randn(5)
})
print("\n測試DataFrame:")
print(df)# 測試機器學習庫
try:import sklearnprint(f"Scikit-learn版本: {sklearn.__version__}")print("? 機器學習環境配置成功!")
except ImportError:print("? 需要安裝scikit-learn")try:import tensorflow as tfprint(f"TensorFlow版本: {tf.__version__}")print("? 深度學習環境配置成功!")
except ImportError:print("? 需要安裝TensorFlow")
9. 常見問題解決
問題1:內核無法連接
# 重新安裝ipykernel
pip uninstall ipykernel
pip install ipykernel
python -m ipykernel install --user
問題2:中文顯示亂碼
# 在notebook開頭添加
import matplotlib
matplotlib.rcParams['font.family'] = ['DejaVu Sans']
# 或下載中文字體文件
問題3:模塊導入錯誤
# 檢查當前Python路徑
import sys
print(sys.path)# 添加自定義路徑
sys.path.append('/path/to/your/modules')
問題4:圖表不顯示
# 確保添加這行
%matplotlib inline
# 或者嘗試
%matplotlib widget
10. 推薦的工作流
- 項目結構:
ai_learning_project/
├── data/ # 數據文件
├── notebooks/ # Jupyter notebooks
├── src/ # Python源代碼
├── models/ # 保存的模型
├── results/ # 結果和圖表
└── requirements.txt # 依賴列表
- 文件命名:
01_data_exploration.ipynb
- 數據探索02_data_preprocessing.ipynb
- 數據預處理03_model_training.ipynb
- 模型訓練04_model_evaluation.ipynb
- 模型評估