MacOS 運行CosyVoice

MacOS 運行CosyVoice

bicheng/2025/9/11 3:43:03/文章來源:https://blog.csdn.net/wxl781227/article/details/151364761

CosyVoic主要特點：

1、支持中文、英文、上海話、天津話、四川話等方言。語音非常自然。

2、支持3秒語音零樣本克隆，效果非常好。

3、克隆時間比較長（取決于GPU性能，使用H20以滿足低延遲輸出），L4 克隆默認文本需要10秒。

MacOS上運行比較簡單，直接使用docker即可，雖然是docker是 AMD64版本非ARM64版本，但在容器中仍然可以使用，但性能會有所損失，相當于直接用的CPU，也沒有使用MPS加速。

運行服務命令：

docker run --name cosyvoice -p 50000:50000 -d bobui/cosyvoice:h20_v2.20250801 /bin/bash -c "cd /opt/CosyVoice/CosyVoice/runtime/python/grpc && python3 server.py --port 50000 --model_dir iic/CosyVoice-300M"

以上bash命令會自動下載300M模型，并以grpc接口運行。

若想使用CosyVoice2-0.5B，只需要修改模型名稱后運行即可。如：

docker run --name cosyvoice -p 50000:50000 -d bobui/cosyvoice:h20_v2.20250801 /bin/bash -c "cd /opt/CosyVoice/CosyVoice/runtime/python/grpc && python3 server.py --port 50000 --model_dir iic/CosyVoice2-0.5M"

若想使用fastapi，只需要將grpc修改為fastapi即可。

零樣本測試命令：

cd?/opt/CosyVoice/CosyVoice/runtime/python/grpc

python client.py --mode zero_shot

說明：默認使用asset/zero_shot_prompt.wav 作為參考聲音

輸出默認文件名稱為：demo.wav

若要指定參考聲音：--prompt_wav "你的參考聲音.wav"

若要指定克隆文本：--tts_text "你需要克隆的文本內容"

最大的坑：

若改變默認的參考聲音，則克隆出的聲音與克隆文本完全不一致，好像模型自由發揮了嗎？

這里需要同時指定--prompt_text 這個參數才可以。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/96415.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/96415.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/96415.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

我不是掛王-用python實現燕雙鷹小游戲3

我不是掛王-用python實現燕雙鷹小游戲3

在前兩個版本的更新后,越來越多內容,操作和運行也不方便,優化第三版本窗口可視化界面本次版本更新使得可讀性和可操作性大幅度增加,前面2版本可分別參考我不是掛王-用python實現燕雙鷹小游戲和我不是掛王-用python實現燕雙鷹小游戲2 一.燕雙鷹窗口可視化(燕雙鷹3.0) 新燕雙…

閱讀更多...

裝飾（Decorator）模式可以在不修改對象外觀和功能的情況下添加或者刪除對象功能

裝飾（Decorator）模式可以在不修改對象外觀和功能的情況下添加或者刪除對象功能

試題（35）、（36）某系統中的文本顯示類（TextView）和圖片顯示類（PictureView）都繼承了組件類（Component），分別顯示文本和圖片內容，現需要…

閱讀更多...

深度學習基礎概念【持續更新】

深度學習基礎概念【持續更新】

1. 梯度消失如果網絡中某一層的激活函數（如 sigmoid 或 tanh）在輸入較大的情況下有很小的梯度（比如接近零），那么當這些小的梯度通過多層反向傳播時，它們會逐漸變得更小。這意味著在深層網絡的前面幾層&…

閱讀更多...

上下文工程：AI應用成功的關鍵架構與實踐指南

上下文工程：AI應用成功的關鍵架構與實踐指南

在AI應用開發中，模型能力只決定性能上限，而上下文質量決定性能下限——上下文工程正是確保AI系統理解用戶意圖、生成準確響應的核心工程技術，已成為區分普通AI應用與卓越AI應用的關鍵因素。一、上下文工程：AI應用的新核心競爭力 1…

閱讀更多...

數據傳輸優化-異步不阻塞處理增強首屏體驗

數據傳輸優化-異步不阻塞處理增強首屏體驗

背景：主 project 頁面中會將視頻存儲到云端后獲得 ID ，然后用 ID 調用后端API POST到數據庫后拿到掛載頁面URL，接著傳入視頻分享組件（由于視頻分享子組件的目標是分享視頻掛載頁面，所以前置步驟不能少）con…

閱讀更多...

【芯片設計-信號完整性 SI 學習 1.0 -- SI 介紹】

【芯片設計-信號完整性 SI 學習 1.0 -- SI 介紹】

文章目錄一、SoC 設計驗證階段的 SI 測試主要工作舉例二、芯片 Bringup 階段的 SI 測試主要工作舉例三、SI-PI 聯合仿真主要內容舉例四、整體總結一、SoC 設計驗證階段的 SI 測試在前硅階段（pre-silicon），設計團隊需要確保 SoC 與外設接口…

閱讀更多...

C語言鏈表設計及應用

C語言鏈表設計及應用

鏈表鏈表節點設計鏈表項目鏈表中的傳址調用檢查申請空間鏈表尾插鏈表頭插鏈表尾部刪除鏈表頭部刪除鏈表的查找指定位置之前插入指定位置之后插入數據刪除指定位置（節點）數據刪除指定位置（節點）之后的數據鏈表的銷毀前面學習了順序…

閱讀更多...

使用 YAML 自動化 Azure DevOps 管道

使用 YAML 自動化 Azure DevOps 管道

1. 在 Azure DevOps 中設置 YAML 管道開始之前，您需要擁有一個 Azure DevOps 帳戶和一個 git 倉庫。要創建 YAML 管道， 1. 導航至 Azure DevOps → 選擇您的項目 2. 前往“管道”→ 點擊“新建管道” 3. 選擇您的倉庫（Azure Repos、GitHub 等） 4. 選擇“Starter Pipelin…

閱讀更多...

基于Spring Boot的幼兒園管理系統

基于Spring Boot的幼兒園管理系統

基于Spring Boot的幼兒園管理系統源碼獲取：https://mbd.pub/o/bread/YZWXlZtsbQ 引言在數字化轉型的浪潮中，教育行業的信息化建設顯得尤為重要。幼兒園作為基礎教育的重要環節，其管理系統的現代化水平直接關系到教育質量和運營效率。本文…

閱讀更多...

【NVIDIA-B200】 ‘CUDA driver version is insufficient for CUDA runtime version‘

【NVIDIA-B200】 ‘CUDA driver version is insufficient for CUDA runtime version‘

目錄一、錯誤核心原因二、排查步驟 1. 檢查當前驅動版本 2. 檢查 CUDA 運行時版本 3. 驗證驅動與 CUDA 的兼容性三、解決方法 1. 確保驅動正確加載 2. 重新安裝匹配的驅動與 CUDA 3. 驗證環境正確性四、關鍵注意事項報錯日志： bash nccl.sh ------------5.安…

閱讀更多...

Android中如何實現自動化測試

Android中如何實現自動化測試

目錄前言: 一、方法介紹 1、UI Automator 3、shell腳本二、shell腳本實現自動化測試原理和步驟 1、原理 2、步驟三、shell自動化測試實例前言: 在開發項目的過程中，我們將某個階段的需求完成并且提測，通常，在測試工程師更細致的測…

閱讀更多...

綠聯科技全球化突圍：業財一體化如何打通全球電商全鏈路數字化

綠聯科技全球化突圍：業財一體化如何打通全球電商全鏈路數字化

綠聯科技專注數碼配件20年，產品覆蓋全球100多個國家，年銷售額突破30億。作為"連接"領域的專家，綠聯深知連接的真諦不僅在于硬件產品，更在于數據的全球化連接。在全球電商競爭日益激烈的今天，綠聯率先探索業財…

閱讀更多...

uv教程虛擬環境

uv教程虛擬環境

什么是uv 可以創建虛擬環境安裝依賴安裝uv 參見官方文檔安裝 | uv-zh-cn 自定義安裝目錄,winr 輸入powershell，輸入如下命令 $env:UV_INSTALL_DIR "C:\Custom\Path";powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/inst…

閱讀更多...

繞過codex在vscode中登錄403的問題

繞過codex在vscode中登錄403的問題

codex安裝： npm i -g openai/codex codex升級： npm install -g openai/codexlatest 繞過codex在vscode中登錄403的問題： https://linux.do/t/topic/924206/4 1.在windows端powelshell登陸好codex； $env:HTTP_PROXY"http://…

閱讀更多...

軟件研發如何選對方法論？傳統計劃驅動與敏捷價值驅動的全面對比

軟件研發如何選對方法論？傳統計劃驅動與敏捷價值驅動的全面對比

軟件項目研發中的方法論是一個核心話題，它決定了團隊如何規劃、執行和交付軟件。下面我將對這些方法論進行一個全面的概述，從傳統的到現代的，并說明它們的核心思想、適用場景和趨勢。一、方法論的核心分類軟件研發方法論主要分為兩大陣營：傳統計劃驅動（Plan-Driven）…

閱讀更多...

【服務器】將本地項目部署到服務器

【服務器】將本地項目部署到服務器

當我們已經有了一個服務器后如何將本地項目部署到服務器呢第一步，找到云服務器實例，查看公網IP地址第二步，推薦使用 Windows 自帶的 PowerShell ssh root你的公網IP # 例如： ssh root47.98.123.45如果超時，首先檢查服…

閱讀更多...

Flink中的 BinaryRowData 以及大小端

Flink中的 BinaryRowData 以及大小端

背景本文基于 Flink 1.17.0 寫此文章的目的是為了說明 Flink 堆內和堆外內存以及內部 BinaryRowData 行處理的優化。分析堆內和堆外內存跟Spark的內存管理不一樣，Flink 中的堆內和堆外一直都是存在的。堆內內存（JVM Heap）存儲用戶對象和…

閱讀更多...

HTTP/3.0：網絡通信的技術革新與性能飛躍

HTTP/3.0：網絡通信的技術革新與性能飛躍

🌐 HTTP/3.0：網絡通信的技術革新與性能飛躍 Refer：PPP PRIVATE NETWORK? 2 企業級虛擬以太網接入綜合解決方案介紹 🚀 引言：悄然來臨的網絡革命你是否曾期待視頻加載卡頓成為過去？YouTube 已經邁出了重…

閱讀更多...

【golang學習筆記 gin 】1.1 路由封裝和mysql 的使用封裝

【golang學習筆記 gin 】1.1 路由封裝和mysql 的使用封裝

安裝gin go get -u github.com/gin-gonic/gin go get -u github.com/go-sql-driver/mysql創建相關目錄 gotest->conifg->database.go->redis.go->controller ->index.go->model->user.go->router->router.gomain.go 創建用戶模型 package model imp…

閱讀更多...

SQL 層面行轉列

SQL 層面行轉列

背景：如果對一些評論、點贊、收藏等互動數據，使用了按照 type 分類存儲，num 也是對應的。這樣如果創建一個帖子，那么就會出現 3 行數據（type 不同，num 不同，對應評論點贊和收藏）&…

閱讀更多...

最新文章