音視頻開源項目列表
一、多媒體處理框架
通用音視頻處理
-
FFmpeg - https://github.com/FFmpeg/FFmpeg
- 最強大的音視頻處理工具庫
- 支持幾乎所有格式的編解碼
- 提供命令行工具和開發庫
-
GStreamer - https://gitlab.freedesktop.org/gstreamer/gstreamer
- 跨平臺多媒體框架
- 基于管道的媒體處理
- 豐富的插件系統
-
libav - https://github.com/libav/libav
- FFmpeg的分支項目
- 更專注于代碼整潔性
- API與FFmpeg類似
-
MediaPipe - https://github.com/google/mediapipe
- Google的多媒體機器學習框架
- 支持人臉檢測、手勢識別等
- 跨平臺支持
二、流媒體傳輸
WebRTC相關
-
WebRTC - https://webrtc.googlesource.com/src/
- Google實時通信框架
- 支持音視頻通話、屏幕共享
- P2P通信核心庫
-
Janus Gateway - https://github.com/meetecho/janus-gateway
- WebRTC網關服務器
- 支持多種信令協議
- 可擴展的插件架構
-
mediasoup - https://github.com/versatica/mediasoup
- WebRTC SFU媒體服務器
- 高性能C++實現
- 支持多語言客戶端
-
Kurento - https://github.com/Kurento/kurento-media-server
- WebRTC媒體服務器
- 支持錄制、轉碼等功能
- 提供豐富的API
RTMP/HLS/DASH相關
-
SRS (Simple Realtime Server) - https://github.com/ossrs/srs
- 簡單高效的流媒體服務器
- 支持RTMP/HLS/WebRTC
- 國產優秀開源項目
-
nginx-rtmp-module - https://github.com/arut/nginx-rtmp-module
- Nginx的RTMP模塊
- 支持RTMP推流和播放
- 可與Nginx生態集成
-
Node-Media-Server - https://github.com/illuspas/Node-Media-Server
- 基于Node.js的流媒體服務器
- 支持RTMP/HLS/DASH
- 易于部署和擴展
-
Live555 - http://www.live555.com/liveMedia/
- RTSP/RTP協議棧實現
- C++編寫,跨平臺
- 用于IP攝像頭等場景
三、播放器
跨平臺播放器
-
VLC - https://github.com/videolan/vlc
- 最流行的開源播放器
- 支持幾乎所有音視頻格式
- 跨平臺,功能強大
-
MPV - https://github.com/mpv-player/mpv
- 輕量級高性能播放器
- 基于FFmpeg和libass
- 支持硬件加速
-
Kodi - https://github.com/xbmc/xbmc
- 開源媒體中心軟件
- 支持插件擴展
- 適合HTPC使用
移動端播放器
-
ijkplayer - https://github.com/bilibili/ijkplayer
- Bilibili開源的移動端播放器
- 基于FFmpeg,支持iOS/Android
- 輕量級,性能優秀
-
ExoPlayer - https://github.com/google/ExoPlayer
- Google官方Android播放器
- 支持DASH、HLS等協議
- 高度可定制
-
GSYVideoPlayer - https://github.com/CarGuo/GSYVideoPlayer
- Android視頻播放器
- 支持多種播放內核
- 功能豐富,易于集成
Web播放器
-
video.js - https://github.com/videojs/video.js
- HTML5視頻播放器
- 插件系統豐富
- 跨瀏覽器兼容性好
-
flv.js - https://github.com/bilibili/flv.js
- B站開源的FLV播放器
- 純JavaScript實現
- 支持HTTP-FLV播放
-
hls.js - https://github.com/video-dev/hls.js
- JavaScript HLS播放器
- 支持MSE技術
- 輕量級,性能好
四、編解碼器
視頻編解碼
-
x264 - https://www.videolan.org/developers/x264.html
- 最流行的H.264編碼器
- 高性能,廣泛使用
- 支持多種預設和參數
-
x265 - https://github.com/videolan/x265
- H.265/HEVC編碼器
- 更高壓縮率
- 支持HDR和10bit
-
OpenH264 - https://github.com/cisco/openh264
- Cisco開源的H.264編解碼器
- BSD許可證
- 適合WebRTC使用
-
libvpx - https://github.com/webmproject/libvpx
- VP8/VP9編解碼器
- Google開發
- WebM格式核心
-
libaom - https://aomedia.googlesource.com/aom/
- AV1編解碼器參考實現
- 下一代視頻編碼標準
- 開放媒體聯盟開發
-
SVT-AV1 - https://github.com/OpenVisualCloud/SVT-AV1
- Intel的AV1編碼器
- 高性能實現
- 適合服務器端使用
音頻編解碼
-
Opus - https://github.com/xiph/opus
- 現代音頻編解碼器
- 低延遲,高質量
- 適合實時通信
-
LAME - https://lame.sourceforge.io/
- MP3編碼器
- 高質量實現
- 廣泛使用
-
FLAC - https://github.com/xiph/flac
- 無損音頻編解碼器
- 開源免費
- 音樂愛好者首選
-
Speex - https://github.com/xiph/speex
- 語音編解碼器
- 針對人聲優化
- 支持降噪等功能
五、音頻處理
音頻庫
-
PortAudio - http://www.portaudio.com/
- 跨平臺音頻I/O庫
- 支持多種音頻API
- 實時音頻處理
-
RtAudio - https://github.com/thestk/rtaudio
- C++音頻I/O庫
- 簡單易用的API
- 跨平臺支持
-
OpenAL - https://github.com/kcat/openal-soft
- 3D音頻API
- 游戲音頻常用
- 支持空間音效
音頻處理工具
-
SoX - https://sourceforge.net/projects/sox/
- 音頻處理瑞士軍刀
- 命令行工具
- 支持多種音頻效果
-
Audacity - https://github.com/audacity/audacity
- 開源音頻編輯器
- 圖形界面
- 功能豐富
-
Ardour - https://github.com/Ardour/ardour
- 專業數字音頻工作站
- 多軌錄音和編輯
- 支持插件
六、計算機視覺
圖像處理
-
OpenCV - https://github.com/opencv/opencv
- 最流行的計算機視覺庫
- 豐富的圖像處理算法
- 支持多種編程語言
-
dlib - https://github.com/davisking/dlib
- 機器學習工具庫
- 人臉檢測和識別
- C++實現,性能優秀
-
ImageMagick - https://github.com/ImageMagick/ImageMagick
- 圖像處理工具集
- 命令行和API
- 支持多種圖像格式
視頻分析
-
OpenPose - https://github.com/CMU-Perceptual-Computing-Lab/openpose
- 人體姿態估計
- 實時多人檢測
- 基于深度學習
-
YOLO - https://github.com/ultralytics/yolov5
- 目標檢測框架
- 實時性能
- 易于訓練和部署
七、實時通信
信令服務器
-
Janus - https://github.com/meetecho/janus-gateway
- WebRTC網關
- 支持多種協議
- 插件架構
-
Kurento - https://github.com/Kurento/kurento-media-server
- 媒體服務器
- WebRTC支持
- 錄制和處理功能
-
Coturn - https://github.com/coturn/coturn
- TURN/STUN服務器
- NAT穿透必備
- 高性能實現
SIP/VoIP
-
FreeSWITCH - https://github.com/signalwire/freeswitch
- 軟交換平臺
- 支持多種協議
- 企業級通信方案
-
Asterisk - https://github.com/asterisk/asterisk
- 開源PBX系統
- VoIP電話系統
- 強大的可擴展性
-
PJSIP - https://github.com/pjsip/pjproject
- SIP協議棧
- 跨平臺支持
- 音視頻通信庫
八、工具和實用程序
分析工具
-
MediaInfo - https://github.com/MediaArea/MediaInfo
- 媒體文件信息分析
- 支持多種格式
- GUI和CLI版本
-
ffprobe - FFmpeg工具集的一部分
- 媒體流分析工具
- 詳細的技術信息
- 命令行工具
-
VLC media player - 內置分析功能
- 編解碼信息查看
- 流媒體分析
- 圖形界面
開發工具
-
OBS Studio - https://github.com/obsproject/obs-studio
- 開源直播和錄制軟件
- 插件系統
- 跨平臺支持
-
Kdenlive - https://github.com/KDE/kdenlive
- 開源視頻編輯器
- 非線性編輯
- 豐富的特效
-
Shotcut - https://github.com/mltframework/shotcut
- 跨平臺視頻編輯器
- 基于MLT框架
- 易于使用
九、移動端SDK
Android
-
CameraX - https://developer.android.com/training/camerax
- Google相機庫
- 簡化相機開發
- 兼容性好
-
Mobile FFmpeg - https://github.com/tanersener/mobile-ffmpeg
- 移動端FFmpeg
- iOS/Android支持
- 輕量級實現
iOS
-
GPUImage - https://github.com/BradLarson/GPUImage2
- GPU加速圖像處理
- 實時濾鏡
- Swift實現
-
LFLiveKit - https://github.com/LaiFengiOS/LFLiveKit
- iOS直播推流SDK
- RTMP推流
- 美顏濾鏡
跨平臺
-
React Native Video - https://github.com/react-native-video/react-native-video
- React Native視頻組件
- 跨平臺播放器
- 易于集成
-
Flutter Video Player - https://pub.dev/packages/video_player
- Flutter視頻播放插件
- 官方維護
- 跨平臺支持
十、AI音視頻處理
語音識別
-
Whisper - https://github.com/openai/whisper
- OpenAI語音識別模型
- 多語言支持
- 高準確率
-
DeepSpeech - https://github.com/mozilla/DeepSpeech
- Mozilla語音識別引擎
- 端到端深度學習
- 開源免費
音頻AI
-
Spleeter - https://github.com/deezer/spleeter
- 音源分離工具
- 人聲提取
- 基于深度學習
-
RVC - https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
- AI變聲工具
- 實時語音轉換
- Web界面
視頻AI
-
Real-ESRGAN - https://github.com/xinntao/Real-ESRGAN
- 圖像超分辨率
- 視頻增強
- 實用的AI模型
-
DeepFaceLab - https://github.com/iperov/DeepFaceLab
- 深度換臉技術
- 視頻人臉替換
- 強大的訓練工具
這些開源項目涵蓋了音視頻開發的各個方面,從基礎的編解碼到高級的AI處理。選擇合適的項目可以大大加快開發進度,同時通過閱讀源碼也能深入學習音視頻技術。建議從簡單的項目開始,逐步深入到更復雜的系統級項目。