視覺識別:ffmpeg-python、ultralytics.YOLO、OpenCV-Python、標準RTSP地址格式
-
- ffmpeg-python
-
- 核心概念
- 常用過濾器(Filters)
- 高級操作
- 視頻截幀轉換圖片示例
- 參考
- ultralytics.YOLO(You Only Look Once)
-
- 1. 模型加載
- 2. 訓練模型 (`train()`)
-
- 標準YAML格式示例
- 3. 預測 (`predict()`)
- 4. 驗證模型 (`val()`)
-
- metrics
-
- 核心指標 (metrics.box)
- 其他重要屬性
- 完整指標獲取示例
- results_dict 中的完整鍵值
- 注意事項
- 5. 模型導出 (`export()`)
- 常用參數說明表
-
- 訓練驗證輸出中各參數的詳細解釋
- train/val/predict關鍵區別總結
- mAP 詳解
-
- 1. 核心概念
- 2. 計算流程
- 3. 常見變體
- mAP 在目標檢測中的意義
- mAP 解讀指南
- 提升mAP的策略
- runs/detect日志講解
- 參考
- OpenCV-Python(cv2)
-
- 1. 圖像讀取與保存
-
- `cv2.imread(filename, flags)`
- `cv2.imwrite(filename, img, params)`
- `cv2.imshow()`
- 2. 圖像處理
-
- `cv2.cvtColor(src, code)`
- `cv2.resize(src, dsize, fx, fy, interpolation)`
-
- 為什么需要插值?
- `cv2.GaussianBlur(src, ksize, sigmaX)`
- 3. 閾值與二值化
-
- `cv2.threshold(src, thresh, maxval, type)`
- 4. 特征檢測
-
- `cv2.Canny(image, threshold1, threshold2, apertureSize, L2gradient)`
- `cv2.HoughLinesP(image, rho, theta, threshold, minLineLength, maxLineGap)`
- 5. 視頻處理
-
- `cv2.VideoCapture(index)`
- `cv2.VideoWriter(filename, fourcc, fps, frameSize)`
- 6. 繪圖函數
-
- `cv2.rectangle(img, pt1, pt2, color, thickness)`
- `cv2.putText(img, text, org, fontFace, fontScale, color, thickness)`
- 7. 形態學操作
-
- `cv2.erode(src, kernel, iterations)`
- `cv2.dilate(src, kernel, iterations)`
- `cv2.morphologyEx(src, op, kernel)`
- 8. 窗口管理
- 標準RTSP地址格式
-
- 參數說明
- 調試工具建議
- 參考
ffmpeg-python
ffmpeg-python
是一個用于操作 FFmpeg 的 Python 庫,它通過 Python 對象和鏈式調用封裝了 FFmpeg 的命令行參數。
核心概念
-
input()
:創建輸入流input_stream = ffmpeg.input('input.mp4', ss=10, t=5)