MatAnyone本地部署,視頻分割處理,綠幕摳像(WIN/MAC)

大家好,今天要和大家分享的項目是MatAnyone,與上一篇分享的SAM2LONG類似,不過上次的分享沒有提到如何在 MAC 上部署,后來有小伙伴私信說希望能出一個 MAC 版本的。那正好看到MatAnyone這個項目順手就寫下來。該項目基于SAM2同樣可以一鍵摳出視頻中的主體,快速輸出綠幕視頻或者是AlphaMask視頻。本篇會分享本地手動部署流程以及MatAnyone的使用方法。

以下是手動部署的步驟,也可以直接使用一鍵包進行部署。

手動部署

克隆代碼倉庫
git clone https://github.com/pq-yang/MatAnyone
cd MatAnyone
創建 Conda 虛擬環境
conda create -n matanyone python=3.10 -y
安裝依賴
pip install -e .
pip3 install -r hugging_face/requirements.txt
安裝FFmpeg
# macOS
brew install ffmpeg# Windows (通過 Chocolatey)
choco install ffmpeg# Ubuntu/Debian
sudo apt install ffmpeg
安裝pytorch

windows

安裝 CUDA 12.8 支持的 PyTorch 套件,啟用 GPU 加速。

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128

MAC

pip3 install torch torchvision torchaudio

MAC部署需要修改下matanyone_wrapper.py第44行

 device = torch.device("mps") if torch.backends.mps.is_available() else torch.device("cpu")mask = torch.from_numpy(mask).to("cpu")frames_np = [frames_np[0]]* n_warmup + frames_npframes = []phas = []for ti, frame_single in tqdm.tqdm(enumerate(frames_np)):image = to_tensor(frame_single).to("cpu").float()
運行

首次運行會自動下載模型

python hugging_face/app.py

使用教程

上傳需要處理的視頻

點擊加載視頻

點擊右邊的區域可以選擇蒙版

支持多選

選擇完成后點擊下方的視頻摳圖

最后輸出綠幕視頻以及Alpha視頻

配置需求

Windows

WindowsN卡需10G顯存

如果運行報錯,需要安裝cuda12.8

https://developer.nvidia.com/cuda-12-8-0-download-archive

支持50系顯卡

MAC

MAC Apple Silicon M1/M2/M3/M4 芯片

10G內存以上

關于速度

11秒視頻(每秒24幀)

4090完成花費60秒左右。

5090完成花費45秒左右。

MAC M1 MAX完成花費20分鐘左右。

整合包獲取

👇🏻👇🏻👇🏻下方下方下方👇🏻👇🏻👇🏻

夸夸夸盤:
https://pan.quark.cn/s/9160ab732d7b

度度度盤:
https://pan.baidu.com/s/1OKOTyzo-PW9Zd3HVK4QK0w?pwd=p7x3

制作不易,如果本文對您有幫助,還請點個免費的贊或關注!感謝您的閱讀!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/86654.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/86654.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/86654.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

記錄下blog的成長過程

2025-06-11 新人榜83 2025-06-09 新人榜87 北京市原力月榜 80

C語言學習20250611

指針 指針類型 int p;》普通的整形變量int *p;》p先與*結合,表示p為指針,該指針指向的內容的數據類型為整型int p[3];》p為一個由整型數據組成的數組int *p[3];》因為[]比*優先級高,p先與方括號結合,所以p為一個數組&#xff0c…

【AI智能體】Dify 從部署到使用操作詳解

目錄 一、前言 二、Dify 介紹 2.1 Dify 是什么 2.2 Dify 核心特性 2.2.1 多模型支持 2.2.2 可視化編排工作流 2.2.3 低代碼/無代碼開發 2.3 Dify 適用場景 2.4 Dify 與Coze的對比 2.4.1 定位與目標用戶 2.4.2 核心功能對比 2.4.3 開發體驗與成本 2.4.4 適用場景對比…

Java爬蟲庫的選擇與實戰代碼

如果你的項目正在Java中考慮引入爬蟲能力,無論是做數據分析、信息聚合,還是競品監測,選對庫確實能大幅提升開發效率和運行效果。結合當前主流庫的特點與適用場景,我整理了一份更貼近實戰的對比分析,并附上可直接運行的…

詳細解釋aruco::markdetection _detectInitialCandidates函數

_detectInitialCandidates 是 OpenCV 的 ArUco 模塊中一個非常關鍵的函數,它負責檢測圖像中的候選 ArUco 標記。該函數的主要目標是: 使用多個尺度(scale)對輸入圖像進行自適應閾值處理;在每個尺度下提取輪廓并篩選出…

Android 開發中配置 USB 配件模式(Accessory Mode) 配件過濾器的配置

在 Android 開發中配置 USB 配件模式(Accessory Mode) 的配件過濾器(accessory_filter.xml),需要以下步驟: 1. 創建配件過濾器文件 在項目的 res/xml/ 目錄下創建 accessory_filter.xml 文件(若…

FreeRTOS互斥量

目錄 1.使用場合2.函數2.1 創建2.1.1 動態創建2.1.2 靜態創建 2.2 刪除2.3 釋放(Give)2.4 獲取(Take)2.5 ISR 版本注意事項 3.常規使用流程4.和二進制信號量的對比5.遞歸鎖5.1 死鎖5.2 概念5.2.1 問題5.2.2 解決方案:遞…

ThinkPad 交換 Ctrl 鍵和 Fn 鍵

概述 不知道那個大聰明設計的將fn設置在最左邊,xxx,我服了,你這個老六真惡心。 方法 一:BIOS/UEFI 設置(推薦) 重啟 你的 ThinkPad。 在啟動時按下 F1(或 Enter,再按 F1&#xff0…

`dispatch_source_t` 計時器 vs `NSTimer`:核心差異一覽

維度GCD 計時器 (dispatch_source_t)NSTimer依賴機制直接掛在 GCD 隊列;底層走 Mach 內核定時源掛在 RunLoop,必須指定 RunLoop & mode線程上下文哪個隊列就在哪條線程回調(例中用 dispatch_get_main_queue())總在定時器所在的 RunLoop 線程(默認主線程 & NSDefau…

ubuntu22.04系統安裝部署docker和docker compose全過程!

更新系統包 首先,確保系統包是最新的: sudo apt updatesudo apt upgrade -y安裝依賴 安裝 Docker 所需的依賴包: sudo apt install -y apt-transport-https ca-certificates curl software-properties-common添加 Docker 官方 GPG 密鑰 添加…

企業如何增強終端安全?

在數字化轉型加速的今天,企業的業務運行越來越依賴于終端設備。從員工的筆記本電腦、智能手機,到工廠里的物聯網設備、智能傳感器,這些終端構成了企業與外部世界連接的 “神經末梢”。然而,隨著遠程辦公的常態化和設備接入的爆炸式…

VS2017----打開ui文件幾秒后閃退

問題描述 在vs2017中雙擊ui文件能夠打開,但是幾秒后就閃退了,提示報錯 問題解決 QT VS tools ----Options,把這個設置為True保存即可

深入解析Docker網橋模式:從docker0到容器網絡的完整通信鏈路

1. 簡介docker 網橋模式 Docker 啟動時默認創建 docker0 虛擬網橋(Linux bridge),并分配私有 IP 地址范圍(如 172.17.42.1/16),它的作用相當于一個虛擬交換機,讓宿主機和多個容器之間可以通信。…

Proof of Talk專訪CertiK聯創顧榮輝:全周期安全方案護航Web3生態

6月10日,CertiK聯合創始人兼CEO顧榮輝在Proof of Talk 2025舉辦期間,接受大會官方專訪,分享了他對Web3安全現狀的觀察以及CertiK的安全戰略布局。 顧榮輝指出,雖然安全的重要性被廣泛認可,但許多創業者和開發者仍存在…

再說一說LangChain Runnable接口

之前我們介紹過LangChain通過Runnable和LCEL來實現各個組件的快捷拼裝,整個過程就像拼積木一樣。 今天我們深入剖析Runnable接口的底層實現邏輯。 往期文章推薦: 16.Docker實戰:5分鐘搞定MySQL容器化部署與最佳實踐15.Ollama模板全解析:從基…

LLaMA-Factory微調Qwen3模型完了,怎么直接用vllm推理模型?

環境: LLaMA-Factory vllm0.8.5 Qwen3-8b 問題描述: LLaMA-Factory微調Qwen3模型完了,怎么直接用vllm推理模型? 解決方案: 一、合并 LoRA 權重與基礎模型 vLLM 需要完整的模型文件(含合并后的權重)…

C#AES加密

一、AES 加密概念 定義 :AES(Advanced Encryption Standard,高級加密標準)是一種對稱加密算法,由美國國家標準與技術研究院(NIST)于 2001 年發布,用于替代之前的 DES(數據…

搞了兩天的win7批處理腳本問題

目錄 問題 原因: 經過各種對比 解決方法 問題 比如 echo "yes" | find /c /v "" 這個統計非空串的行數,在其它系統都是 1;但在win7里非正常的反應,為空。 原因: 在wvpCheckStart.bat 首…

手陽明大腸經之溫溜穴

個人主頁:云納星辰懷自在 座右銘:“所謂堅持,就是覺得還有希望!” 溫溜又名: 1.《針灸甲乙經》:逆注、蛇頭。 2.《資生》:池頭。 所屬經絡:手陽明大腸經 定位 屈肘,在前臂…

傳統Web應用和RESTful API模式

傳統Web應用和RESTful API 傳統模式 傳統模式沒有實現前后端分離,服務器處理完業務后直接返回完整的HTML頁面,每次操作都要刷新整個頁面。類似下面的情況: Controller public class UserController {RequestMapping("/addUser")…