音視頻開源項目列表

音視頻開源項目列表

一、多媒體處理框架

通用音視頻處理

  • FFmpeg - https://github.com/FFmpeg/FFmpeg

    • 最強大的音視頻處理工具庫
    • 支持幾乎所有格式的編解碼
    • 提供命令行工具和開發庫
  • GStreamer - https://gitlab.freedesktop.org/gstreamer/gstreamer

    • 跨平臺多媒體框架
    • 基于管道的媒體處理
    • 豐富的插件系統
  • libav - https://github.com/libav/libav

    • FFmpeg的分支項目
    • 更專注于代碼整潔性
    • API與FFmpeg類似
  • MediaPipe - https://github.com/google/mediapipe

    • Google的多媒體機器學習框架
    • 支持人臉檢測、手勢識別等
    • 跨平臺支持

二、流媒體傳輸

WebRTC相關

  • WebRTC - https://webrtc.googlesource.com/src/

    • Google實時通信框架
    • 支持音視頻通話、屏幕共享
    • P2P通信核心庫
  • Janus Gateway - https://github.com/meetecho/janus-gateway

    • WebRTC網關服務器
    • 支持多種信令協議
    • 可擴展的插件架構
  • mediasoup - https://github.com/versatica/mediasoup

    • WebRTC SFU媒體服務器
    • 高性能C++實現
    • 支持多語言客戶端
  • Kurento - https://github.com/Kurento/kurento-media-server

    • WebRTC媒體服務器
    • 支持錄制、轉碼等功能
    • 提供豐富的API

RTMP/HLS/DASH相關

  • SRS (Simple Realtime Server) - https://github.com/ossrs/srs

    • 簡單高效的流媒體服務器
    • 支持RTMP/HLS/WebRTC
    • 國產優秀開源項目
  • nginx-rtmp-module - https://github.com/arut/nginx-rtmp-module

    • Nginx的RTMP模塊
    • 支持RTMP推流和播放
    • 可與Nginx生態集成
  • Node-Media-Server - https://github.com/illuspas/Node-Media-Server

    • 基于Node.js的流媒體服務器
    • 支持RTMP/HLS/DASH
    • 易于部署和擴展
  • Live555 - http://www.live555.com/liveMedia/

    • RTSP/RTP協議棧實現
    • C++編寫,跨平臺
    • 用于IP攝像頭等場景

三、播放器

跨平臺播放器

  • VLC - https://github.com/videolan/vlc

    • 最流行的開源播放器
    • 支持幾乎所有音視頻格式
    • 跨平臺,功能強大
  • MPV - https://github.com/mpv-player/mpv

    • 輕量級高性能播放器
    • 基于FFmpeg和libass
    • 支持硬件加速
  • Kodi - https://github.com/xbmc/xbmc

    • 開源媒體中心軟件
    • 支持插件擴展
    • 適合HTPC使用

移動端播放器

  • ijkplayer - https://github.com/bilibili/ijkplayer

    • Bilibili開源的移動端播放器
    • 基于FFmpeg,支持iOS/Android
    • 輕量級,性能優秀
  • ExoPlayer - https://github.com/google/ExoPlayer

    • Google官方Android播放器
    • 支持DASH、HLS等協議
    • 高度可定制
  • GSYVideoPlayer - https://github.com/CarGuo/GSYVideoPlayer

    • Android視頻播放器
    • 支持多種播放內核
    • 功能豐富,易于集成

Web播放器

  • video.js - https://github.com/videojs/video.js

    • HTML5視頻播放器
    • 插件系統豐富
    • 跨瀏覽器兼容性好
  • flv.js - https://github.com/bilibili/flv.js

    • B站開源的FLV播放器
    • 純JavaScript實現
    • 支持HTTP-FLV播放
  • hls.js - https://github.com/video-dev/hls.js

    • JavaScript HLS播放器
    • 支持MSE技術
    • 輕量級,性能好

四、編解碼器

視頻編解碼

  • x264 - https://www.videolan.org/developers/x264.html

    • 最流行的H.264編碼器
    • 高性能,廣泛使用
    • 支持多種預設和參數
  • x265 - https://github.com/videolan/x265

    • H.265/HEVC編碼器
    • 更高壓縮率
    • 支持HDR和10bit
  • OpenH264 - https://github.com/cisco/openh264

    • Cisco開源的H.264編解碼器
    • BSD許可證
    • 適合WebRTC使用
  • libvpx - https://github.com/webmproject/libvpx

    • VP8/VP9編解碼器
    • Google開發
    • WebM格式核心
  • libaom - https://aomedia.googlesource.com/aom/

    • AV1編解碼器參考實現
    • 下一代視頻編碼標準
    • 開放媒體聯盟開發
  • SVT-AV1 - https://github.com/OpenVisualCloud/SVT-AV1

    • Intel的AV1編碼器
    • 高性能實現
    • 適合服務器端使用

音頻編解碼

  • Opus - https://github.com/xiph/opus

    • 現代音頻編解碼器
    • 低延遲,高質量
    • 適合實時通信
  • LAME - https://lame.sourceforge.io/

    • MP3編碼器
    • 高質量實現
    • 廣泛使用
  • FLAC - https://github.com/xiph/flac

    • 無損音頻編解碼器
    • 開源免費
    • 音樂愛好者首選
  • Speex - https://github.com/xiph/speex

    • 語音編解碼器
    • 針對人聲優化
    • 支持降噪等功能

五、音頻處理

音頻庫

  • PortAudio - http://www.portaudio.com/

    • 跨平臺音頻I/O庫
    • 支持多種音頻API
    • 實時音頻處理
  • RtAudio - https://github.com/thestk/rtaudio

    • C++音頻I/O庫
    • 簡單易用的API
    • 跨平臺支持
  • OpenAL - https://github.com/kcat/openal-soft

    • 3D音頻API
    • 游戲音頻常用
    • 支持空間音效

音頻處理工具

  • SoX - https://sourceforge.net/projects/sox/

    • 音頻處理瑞士軍刀
    • 命令行工具
    • 支持多種音頻效果
  • Audacity - https://github.com/audacity/audacity

    • 開源音頻編輯器
    • 圖形界面
    • 功能豐富
  • Ardour - https://github.com/Ardour/ardour

    • 專業數字音頻工作站
    • 多軌錄音和編輯
    • 支持插件

六、計算機視覺

圖像處理

  • OpenCV - https://github.com/opencv/opencv

    • 最流行的計算機視覺庫
    • 豐富的圖像處理算法
    • 支持多種編程語言
  • dlib - https://github.com/davisking/dlib

    • 機器學習工具庫
    • 人臉檢測和識別
    • C++實現,性能優秀
  • ImageMagick - https://github.com/ImageMagick/ImageMagick

    • 圖像處理工具集
    • 命令行和API
    • 支持多種圖像格式

視頻分析

  • OpenPose - https://github.com/CMU-Perceptual-Computing-Lab/openpose

    • 人體姿態估計
    • 實時多人檢測
    • 基于深度學習
  • YOLO - https://github.com/ultralytics/yolov5

    • 目標檢測框架
    • 實時性能
    • 易于訓練和部署

七、實時通信

信令服務器

  • Janus - https://github.com/meetecho/janus-gateway

    • WebRTC網關
    • 支持多種協議
    • 插件架構
  • Kurento - https://github.com/Kurento/kurento-media-server

    • 媒體服務器
    • WebRTC支持
    • 錄制和處理功能
  • Coturn - https://github.com/coturn/coturn

    • TURN/STUN服務器
    • NAT穿透必備
    • 高性能實現

SIP/VoIP

  • FreeSWITCH - https://github.com/signalwire/freeswitch

    • 軟交換平臺
    • 支持多種協議
    • 企業級通信方案
  • Asterisk - https://github.com/asterisk/asterisk

    • 開源PBX系統
    • VoIP電話系統
    • 強大的可擴展性
  • PJSIP - https://github.com/pjsip/pjproject

    • SIP協議棧
    • 跨平臺支持
    • 音視頻通信庫

八、工具和實用程序

分析工具

  • MediaInfo - https://github.com/MediaArea/MediaInfo

    • 媒體文件信息分析
    • 支持多種格式
    • GUI和CLI版本
  • ffprobe - FFmpeg工具集的一部分

    • 媒體流分析工具
    • 詳細的技術信息
    • 命令行工具
  • VLC media player - 內置分析功能

    • 編解碼信息查看
    • 流媒體分析
    • 圖形界面

開發工具

  • OBS Studio - https://github.com/obsproject/obs-studio

    • 開源直播和錄制軟件
    • 插件系統
    • 跨平臺支持
  • Kdenlive - https://github.com/KDE/kdenlive

    • 開源視頻編輯器
    • 非線性編輯
    • 豐富的特效
  • Shotcut - https://github.com/mltframework/shotcut

    • 跨平臺視頻編輯器
    • 基于MLT框架
    • 易于使用

九、移動端SDK

Android

  • CameraX - https://developer.android.com/training/camerax

    • Google相機庫
    • 簡化相機開發
    • 兼容性好
  • Mobile FFmpeg - https://github.com/tanersener/mobile-ffmpeg

    • 移動端FFmpeg
    • iOS/Android支持
    • 輕量級實現

iOS

  • GPUImage - https://github.com/BradLarson/GPUImage2

    • GPU加速圖像處理
    • 實時濾鏡
    • Swift實現
  • LFLiveKit - https://github.com/LaiFengiOS/LFLiveKit

    • iOS直播推流SDK
    • RTMP推流
    • 美顏濾鏡

跨平臺

  • React Native Video - https://github.com/react-native-video/react-native-video

    • React Native視頻組件
    • 跨平臺播放器
    • 易于集成
  • Flutter Video Player - https://pub.dev/packages/video_player

    • Flutter視頻播放插件
    • 官方維護
    • 跨平臺支持

十、AI音視頻處理

語音識別

  • Whisper - https://github.com/openai/whisper

    • OpenAI語音識別模型
    • 多語言支持
    • 高準確率
  • DeepSpeech - https://github.com/mozilla/DeepSpeech

    • Mozilla語音識別引擎
    • 端到端深度學習
    • 開源免費

音頻AI

  • Spleeter - https://github.com/deezer/spleeter

    • 音源分離工具
    • 人聲提取
    • 基于深度學習
  • RVC - https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI

    • AI變聲工具
    • 實時語音轉換
    • Web界面

視頻AI

  • Real-ESRGAN - https://github.com/xinntao/Real-ESRGAN

    • 圖像超分辨率
    • 視頻增強
    • 實用的AI模型
  • DeepFaceLab - https://github.com/iperov/DeepFaceLab

    • 深度換臉技術
    • 視頻人臉替換
    • 強大的訓練工具

這些開源項目涵蓋了音視頻開發的各個方面,從基礎的編解碼到高級的AI處理。選擇合適的項目可以大大加快開發進度,同時通過閱讀源碼也能深入學習音視頻技術。建議從簡單的項目開始,逐步深入到更復雜的系統級項目。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/78330.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/78330.shtml
英文地址,請注明出處:http://en.pswp.cn/web/78330.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

通往“共識空域”的系統倫理演化

隨著低空經濟逐步從分布式運營向跨區域聯動發展,AI無人系統不再只在本地決策,而開始涉及跨城市、跨機構的任務調度與行為協調。這一趨勢帶來了新的倫理挑戰:多系統之間如何達成行動共識?算法背后的價值判斷標準能否統一&#xff1…

Elasticsearch 常用的 API 接口

文檔類 API Index API :創建并建立索引,向指定索引添加文檔。例如:PUT /twitter/tweet/1 ,添加一個文檔。 Get API :獲取文檔,通過索引、類型和 ID 獲取文檔。如GET /twitter/tweet/1。 DELETE API &…

【Vue】性能優化與調試技巧

個人主頁:Guiat 歸屬專欄:Vue 文章目錄 1. Vue 性能優化與調試技巧1.1 使用 v-if 替代 v-show 控制條件渲染示例代碼: 1.2 組件懶加載(異步組件)示例代碼:效果分析圖(Mermaid 圖表示&#xff09…

廣義線性模型三劍客:線性回歸、邏輯回歸與Softmax分類的統一視角

文章目錄 廣義線性模型三劍客:線性回歸、邏輯回歸與Softmax分類的統一視角引言:機器學習中的"家族相似性"廣義線性模型(GLMs)基礎三位家族成員的統一視角1. 線性回歸(Linear Regression)2. 邏輯回歸(Logistic Regression)3. Softmax分類(Softm…

【Linux系統篇】:Linux線程控制基礎---線程的創建,等待與終止

?感謝您閱讀本篇文章,文章內容是個人學習筆記的整理,如果哪里有誤的話還請您指正噢? ? 個人主頁:余輝zmh–CSDN博客 ? 文章所屬專欄:Linux篇–CSDN博客 文章目錄 一.線程創建二.線程等待三.線程終止四.擴展內容1.重談pthread_…

More Effective C++學習筆記

條款1 指針與引用的區別 條款2 盡量使用C風格的類型轉換 條款3 不要對數組使用多態 條款4 避免無用的缺省構造函數 條款5 謹慎定義類型轉換函數 條款6 自增(increment)、自減(decrement)操作符前綴形式與后綴形式的區別 條款7 不要重載“&&”,“||”, 或“,” 條款8 理…

先知AIGC超級工場,撬動運營效率新杠桿

北京先智先行科技有限公司,作為行業內的重要參與者,擁有“先知大模型”、“先行AI商學院”以及“先知AIGC超級工場”這三款旗艦產品。這些產品在不同領域發揮著關鍵作用,尤其是先知AIGC超級工場,正悄然改變著內容創作與產品推廣的…

十一歲少年葉珉雪用藝術點亮公益之路 個人原創公益演唱會傳遞大愛與擔當

4月29日晚,"韶華映雪益路同行"葉珉雪個人原創公益演唱會在廣東碧桂園學校歌劇院圓滿落幕。 這場由該校美育成果澆灌出的藝術盛宴,生動詮釋了廣東碧桂園學校育人理念。11歲的葉珉雪以超越年齡的藝術掌控力,呈現了一場融合歌唱、舞蹈…

【深度學習基礎】:VGG實戰篇(圖像風格遷移)

文章目錄 前言style transfer原理原理解析損失函數 style transfer代碼效果圖 fast style transfer 代碼效果圖 前言 本篇來帶大家看看VGG的實戰篇,這次來帶大家看看計算機視覺中一個有趣的小任務,圖像風格遷移。 可運行代碼位于: Style_tr…

python爬蟲基礎:requests庫詳解與案例

1.Requests模塊的使用 requests模塊的介紹與安裝 作用:發送網絡請求,返回響應數據。 中文文檔:https://requests.readthedocs.io/projects/cn/zh_CN/latest/ 對于爬蟲任務,使用 requests模塊基本能夠解決絕大部分的數據抓取的…

Spring 容器相關的核心注解?

以下是 Spring 容器中用于 ??Bean 管理、依賴注入、配置控制?? 的關鍵注解,按功能分類說明: ??1. Bean 聲明與注冊?? 注解作用示例??Component??通用注解,標記一個類為 Spring Bean(自動掃描注冊) Compo…

C與指針5——字符串合集

常用函數 1、拷貝、長度、比較 size_t strlen();\\返回無符號整形 char* strcpy();char* strncpy();\\拷貝 int strcmp();int strncmp();\\比較 char* strcat();char* strncat();\\連接2、查找 char* strchr(const char * st,int ch);\\找字符第一次出現的位置 char* strrch…

論軟件需求管理

目錄 摘要(300~330字) 正文(2000~2500字,2200字為宜) 背景介紹(500字做左右) 論點論據(1500字做左右) 收尾(200字左右) 注:本篇論…

[特殊字符] 如何在比賽前調整到最佳狀態:科學與策略結合的優化指

🧠 概述 在競技體育中,賽前狀態的調整對比賽結果起著決定性作用。所謂“最佳狀態”,不僅指生理上的巔峰表現,更包括心理、認知、營養和恢復等多方面的協同優化。本文結合運動科學、心理學和營養學的研究成果,探討賽前…

一種實波束前視掃描雷達目標二維定位方法——論文閱讀

一種實波束前視掃描雷達目標二維定位方法 1. 專利的研究目標與實際問題意義2. 專利提出的新方法、模型與公式2.1 運動平臺幾何建模與回波信號構建2.1.1 距離歷史建模2.1.2 回波信號模型2.2 距離向運動補償技術2.2.1 匹配濾波與距離壓縮2.3 加權最小二乘目標函數2.3.1 方位向信號…

基于 Spring Boot 瑞吉外賣系統開發(八)

基于 Spring Boot 瑞吉外賣系統開發(八) 自動填充公共字段 MyBatis-Plus公共字段自動填充,也就是在插入或者更新的時候為指定字段賦予指定的值,使用它的好處就是可以統一對這些字段進行處理,降低了冗余代碼的數量。本…

【前端】從零開始的搭建結構(技術棧:Node.js + Express + MongoDB + React)book-management

項目路徑總結 后端結構 server/ ├── controllers/ # 業務邏輯 │ ├── authController.js │ ├── bookController.js │ ├── genreController.js │ └── userController.js ├── middleware/ # 中間件 │ ├── authMiddleware…

【RAG】向量?知識庫的底層原理:向量數據庫の技術鑒賞 | HNSW(導航小世界)、LSH、K-means

一、向量化表示的核心概念 1.1 特征空間與向量表示 多維特征表示:通過多個特征維度(如體型、毛發長度、鼻子長短等)描述對象,每個對象對應高維空間中的一個坐標點,來表示狗這個對象,這樣可以區分出不同種…

如何用CSS實現HTML元素的旋轉效果

原文:如何用CSS實現HTML元素的旋轉效果 | w3cschool筆記 (本文為科普文章,請勿標記為付費) 在網頁制作中,為 HTML 元素設置旋轉效果可使其更靈動,提升用戶體驗。本文將深入淺出地介紹如何利用 CSS 實現 H…

Spark集群搭建之Yarn模式

配置集群 1.上傳并解壓spark-3.1.2-bin-hadoop3.2.tgz,重命名解壓之后的目錄為spark-yarn。 2. 修改一下spark的環境變量,/etc/profile.d/my_env.sh 。 # spark 環境變量 export SPARK_HOME/opt/module/spark-yarn export PATH$PATH:$SPARK_HOME/bin:$SP…