告別昂貴語音合成服務!用GPT-SoVITS生成你的個性化AI語音

文章目錄

    • 前言
    • 1.GPT-SoVITS V2下載
    • 2.本地運行GPT-SoVITS V2
    • 3.簡單使用演示
    • 4.安裝內網穿透工具
      • 4.1 創建遠程連接公網地址
    • 5. 固定遠程訪問公網地址

前言

今天給大家介紹一款AI語音克隆工具——GPT-SoVITS。這款由花兒不哭大佬開發的工具是一款強大的訓練聲音模型與音頻生成工具。GPT-SoVITS V2版支持中、日、英、韓、粵五種語言,并加入了語速調節和無參考文本模式等實用功能。Windows用戶可以通過簡單的整合包快速上手。

如果你想在外出時也能使用這款工具,但只有一臺性能強勁的電腦怎么辦? 借助 cpolar,你可以輕松實現遠程訪問。 接下來,我們將介紹如何利用 cpolar 遠程使用 GPT-SoVITS。

image-20241108171803594

1.GPT-SoVITS V2下載

本例演示環境為Windows11專業版,8G顯卡,16G內存。

首先,我們需要在下面的地址下載GPT-SoVITS V2的Windows整合包:

https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/dkxgpiy9zb96hob4#KTvnO

大佬提供了多種下載方式:

image-20241108171731194

我這里下載的是V2版本,下載好后,解壓縮后得到GPT-SoVITS-v2-240821文件夾。

2.本地運行GPT-SoVITS V2

打開 GPT-SoVITS-v2-240821 文件夾,雙擊名為go-webui的bat格式文件即可啟動服務:

image-20241108172017839

服務啟動后會彈出一個cmd終端窗口,然后會在瀏覽器中打開GPT-SoVITS V2的webui網頁頁面,我們接下來可以在這里制作AI音頻,但要注意不要關掉cmd終端窗口,因為它才是服務的本體,網頁端只是操作界面。

image-20241108172723878

image-20241108172824373

3.簡單使用演示

在GPT-SoVITS V2的webui網頁頁面,我們可以看到默認展示的是0-前置數據集獲工具界面,旁邊是1-GPT-SoVITS-TTS界面和2-GPT-SoVITS-變聲界面

image-20241108173017766

我們可以在0-前置數據集獲工具界面進行人聲伴奏分離&去混響去延遲,語音切分、降噪等操作,來對要使用的語音進行訓練,生成效果更逼真的語音模型。

image-20241108173301904

而如果想馬上快速體驗一下TTS語音克隆,我們可以點擊旁邊的1-GPT-SoVITS-TTS界面,選擇下面的1C-推理,點擊開啟TTS推理WebUI:

image-20241108173619074

稍等一下后,會在瀏覽器中新打開一個TTS推理網頁,我們可以在這里上傳原始音頻,時長3到10秒即可,超過會報錯。然后可以在下方填寫想要合成的目標文本和語種模式:

image-20241108173957977

輸入好所需信息后,點擊合成語音按鈕,服務端進行處理,稍后在webui界面即可看到生成的音頻:

image-20241108174655802

image-20241108174751702

可以點擊播放進行試聽,點擊右上角的下載標志即可將生成的AI音頻下載到本地。

而剛才提到的2-GPT-SoVITS-變聲功能目前還沒有推出,可以期待一下作者大佬下次的更新。

image-20241108175825262

4.安裝內網穿透工具

此時,我們已經成功在Windows電腦中本地部署了GPT-SoVITS V2,但就像開篇時說的那樣,我們在這臺配置高的電腦上部署了服務后,只能在同一個局域網內使用,有一定局限性。如果想外出時也能遠程訪問家中部署的GPT-SoVITS或是其他服務,應該怎么辦呢?

很簡單,只要在電腦中再安裝一個cpolar內網穿透工具就能輕松實現遠程訪問內網主機中部署的服務了,接下來介紹一下如何安裝cpolar內網穿透。

首先進入cpolar官網,點擊免費使用注冊一個賬號,并下載最新版本的Cpolar。

cpolar官網地址: https://www.cpolar.com

img

登錄成功后,點擊下載Cpolar到本地并安裝(一路默認安裝即可)本教程選擇下載Windows版本。

image-20240319175308664

Cpolar安裝成功后,在瀏覽器上訪問http://localhost:9200,使用cpolar賬號登錄,登錄后即可看到Cpolar web 配置界面,結下來在web 管理界面配置即可。

img

4.1 創建遠程連接公網地址

登錄cpolar web UI管理界面后,點擊左側儀表盤的隧道管理——創建隧道:

  • 隧道名稱:可自定義,本例使用了: GPTSoVITS 注意不要與已有的隧道名稱重復
  • 協議:http
  • 本地地址:9874
  • 域名類型:隨機域名
  • 地區:選擇China Top
  • 高級:Http Auth:user:123(本例中用戶名user 密碼123)

點擊保存

image-20241108181023458

創建成功后,打開左側在線隧道列表,可以看到剛剛通過創建隧道生成了兩個公網地址,接下來就可以在其他電腦(異地)上,使用任意一個地址在瀏覽器中訪問即可。

image-20241108181127944

如下圖所示,輸入設置的用戶名及密碼(也可以不設置高級,就無需用戶名密碼直接登入,安全起見,建議配置高級)

image-20241108181202876

登錄后可以看到成功實現使用公網地址異地遠程訪問本地部署的GPT-SoVITS V2語音克隆工具的webui界面!

image-20241108181319948

小結

為了方便演示,我們在上邊的操作過程中使用了cpolar生成的HTTP公網地址隧道,其公網地址是隨機生成的。這種隨機地址的優勢在于建立速度快,可以立即使用,然而,它的缺點是網址是隨機生成,這個地址在24小時內會發生隨機變化,更適合于臨時使用。

如果有長期遠程訪問本地部署的語音克隆軟件或者其他本地部署的服務的需求,但又不想每天重新配置公網地址,還想地址好看又好記,那我推薦大家選擇使用固定的二級子域名方式來遠程訪問,帶寬會更快,使用cpolar在其他用途還可以保留多個子域名,支持多個cpolar在線進程。

5. 固定遠程訪問公網地址

由于以上使用cpolar所創建的隧道使用的是隨機公網地址,24小時內會隨機變化,不利于長期遠程訪問。因此我們可以為其配置二級子域名,該地址為固定地址,不會隨機變化。

登錄cpolar官網,點擊左側的預留,選擇保留二級子域名,地區選擇china vip,然后設置一個二級子域名名稱,填寫備注信息,點擊保留。

image-20241108181626103

保留成功后復制保留的二級子域名地址:myyuyin

登錄cpolar web UI管理界面,點擊左側儀表盤的隧道管理——隧道列表,找到所要配置的隧道,點擊右側的編輯

image-20241108181748784

修改隧道信息,將保留成功的二級子域名配置到隧道中

  • 域名類型:選擇二級子域名
  • Sub Domain:填寫保留成功的二級子域名
  • 地區: China VIP

點擊更新

image-20241108181834026

更新完成后,打開在線隧道列表,此時可以看到隨機的公網地址已經發生變化,地址名稱也變成了保留和固定的二級子域名名稱。

image-20241108181951821

最后,我們使用固定的公網地址在瀏覽器打開可以看到訪問成功,這樣一個永久不會變化的公網網址就設置好了:

image-20241108182724843

最后,我們使用固定的公網地址在瀏覽器打開可以看到訪問成功,這樣一個永久不會變化的公網網址就設置好了: 我們使用固定的公網地址在瀏覽器打開,看到訪問成功,這樣一個永久不會變化的公網網址就設置好了:怎么樣,是不是覺得GPT-SoVITS和cpolar這對黃金搭檔簡直太給力了呢?無論你是想制作搞笑視頻、動感音樂還是其他創意作品,它們都能讓你的聲音變得千變萬化,魅力十足。如果你也被這個項目所吸引,別忘了到GitHub上給花兒不哭大佬點個贊哦!當然了,我們更期待你在評論區曬出自己的使用心得和創作成果,讓我們一起開啟這場聲音的奇幻冒險吧!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/76122.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/76122.shtml
英文地址,請注明出處:http://en.pswp.cn/web/76122.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Doris FE 常見問題與處理指南

在數據倉庫領域,Apache Doris 憑借其卓越性能與便捷性被廣泛應用。其中,FE(Frontend)作為核心組件,承擔著接收查詢請求、管理元數據等關鍵任務。然而,在實際使用中,FE 難免會遭遇各類問題&#…

Unity編輯器擴展之項目資源查找工具

一、需要實現的效果如下: 二、在項目的Asset目錄下新增Editor目錄,新增AssetSearchWindow和EditorDefine和EditorTools這三個C#腳本,并復制以下的代碼保存好之后,就可以實現上述功能啦。 -------------------------------------------EditorTools腳本Begin----------------…

《Java 泛型的作用與常見用法詳解》

大家好呀!👋 今天我們要聊的是Java中一個超級重要但又讓很多初學者頭疼的概念——泛型(Generics)。帶你徹底搞懂它!💪 準備好你的小本本,我們開始啦~📝 一、為什么需要泛型?&#x…

USB(TYPE-C)轉串口(TTL)模塊設計講解

目錄 一 、引言 二、方案設計 三、USB TYPE-C介紹 1、TYPE-C接口定義 1、24P全引腳描述 2、Type C 接口 VBUS/GND 作用 3、Type C 接口 D/D- 作用 1、數據傳輸: 2、設備識別: 3、充電協議協商: 4、Type C 接口 CC1/CC2 作用 1、主從設備區…

v-model進階+ref+nextTick

一、v-model進階 復習 v-model v-model: 雙向數據綁定指令 數據 <-> 視圖: 數據和視圖相互影響, 因此被稱為雙向數據綁定指令 1> 數據變了, 視圖也會跟著變 (數據驅動視圖) 2> 視圖變了, 數據也會跟著變 1. v-model 原理 v-model只是一個語法糖, 比較好用, …

Sentinel源碼—4.FlowSlot實現流控的原理二

大綱 1.FlowSlot根據流控規則對請求進行限流 2.FlowSlot實現流控規則的快速失敗效果的原理 3.FlowSlot實現流控規則中排隊等待效果的原理 4.FlowSlot實現流控規則中Warm Up效果的原理 3.FlowSlot實現流控規則中排隊等待效果的原理 (1)實現排隊等待流控效果的普通漏桶算法介…

2025華中杯數學建模B題完整分析論文(共42頁)(含模型、數據、可運行代碼)

2025華中杯大學生數學建模B題完整分析論文 目錄 一、問題重述 二、問題分析 三、模型假設 四、 模型建立與求解 4.1問題1 4.1.1問題1解析 4.1.2問題1模型建立 4.1.3問題1樣例代碼&#xff08;僅供參考&#xff09; 4.1.4問題1求解結果&#xff08;僅供參考&am…

Project ERROR: liblightdm-qt5-3 development package not found問題的解決方法

問題描述&#xff1a;使用make命令進行ukui-greeter-Debian構建時出現Project ERROR: liblightdm-qt5-3 development package not found錯誤&#xff0c;具體如圖&#xff1a; 問題原因&#xff1a;缺乏liblightdm-qt5-3 development軟件包 解決方法&#xff1a;安裝liblightd…

【C++面向對象】封裝(下):探索C++運算符重載設計精髓

&#x1f525;個人主頁 &#x1f525; &#x1f608;所屬專欄&#x1f608; 每文一詩 &#x1f4aa;&#x1f3fc; 年年歲歲花相似&#xff0c;歲歲年年人不同 —— 唐/劉希夷《代悲白頭翁》 譯文&#xff1a;年年歲歲繁花依舊&#xff0c;歲歲年年看花之人卻不相同 目錄 C運…

從代碼學習深度學習 - Transformer PyTorch 版

文章目錄 前言1. 位置編碼(Positional Encoding)2. 多頭注意力機制(Multi-Head Attention)3. 前饋網絡與殘差連接(Position-Wise FFN & AddNorm)3.1 基于位置的前饋網絡(PositionWiseFFN)3.2 殘差連接和層規范化(AddNorm)4. 編碼器(Encoder)4.1 編碼器塊(Enco…

閱讀分析Linux0.11 /boot/head.s

目錄 初始化IDT、IDTR和GDT、GDTR檢查協處理器并設置CR0寄存器初始化頁表和CR3寄存器&#xff0c;開啟分頁 初始化IDT、IDTR和GDT、GDTR startup_32:movl $0x10,%eaxmov %ax,%dsmov %ax,%esmov %ax,%fsmov %ax,%gslss _stack_start,%espcall setup_idtcall setup_gdtmovl $0x1…

33、單元測試實戰練習題

以下是三個練習題的具體實現方案&#xff0c;包含完整代碼示例和詳細說明&#xff1a; 練習題1&#xff1a;TDD實現博客評論功能 步驟1&#xff1a;編寫失敗測試 # tests/test_blog.py import unittest from blog import BlogPost, Comment, InvalidCommentErrorclass TestBl…

16-算法打卡-哈希表-兩個數組的交集-leetcode(349)-第十六天

1 題目地址 349. 兩個數組的交集 - 力扣&#xff08;LeetCode&#xff09;349. 兩個數組的交集 - 給定兩個數組 nums1 和 nums2 &#xff0c;返回 它們的 交集 。輸出結果中的每個元素一定是 唯一 的。我們可以 不考慮輸出結果的順序 。 示例 1&#xff1a;輸入&#xff1a;nu…

SciPy庫詳解

SciPy 是一個用于數學、科學和工程計算的 Python 庫&#xff0c;它建立在 NumPy 之上&#xff0c;提供了許多高效的算法和工具&#xff0c;用于解決各種科學計算問題。 CONTENT 1. 數值積分功能代碼 2. 優化問題求解功能代碼3. 線性代數運算功能代碼 4. 信號處理功能代碼 5. 插…

杰弗里·辛頓:深度學習教父

名人說&#xff1a;路漫漫其修遠兮&#xff0c;吾將上下而求索。—— 屈原《離騷》 創作者&#xff1a;Code_流蘇(CSDN)&#xff08;一個喜歡古詩詞和編程的Coder&#x1f60a;&#xff09; 杰弗里辛頓&#xff1a;當堅持遇見突破&#xff0c;AI迎來新紀元 一、人物簡介 杰弗…

BladeX單點登錄與若依框架集成實現

1. 概述 本文檔詳細介紹了將BladeX認證系統與若依(RuoYi)框架集成的完整實現過程。集成采用OAuth2.0授權碼流程&#xff0c;使用戶能夠通過BladeX賬號直接登錄若依系統&#xff0c;實現無縫單點登錄體驗。 2. 系統架構 2.1 總體架構 #mermaid-svg-YxdmBwBtzGqZHMme {font-fa…

初識Redis · set和zset

目錄 前言&#xff1a; set 基本命令 交集并集差集 內部編碼和應用場景 zset 基本命令 交集并集差集 內部編碼和應用場景 應用場景&#xff08;AI生成&#xff09; 排行榜系統 應用背景 設計思路 熱榜系統 應用背景 設計思路 熱度計算方式 總結對比表 前言&a…

playwright 教程高級篇:掌握網頁自動化與驗證碼處理等關鍵技術詳解

Playwright 教程高級篇:掌握網頁自動化與驗證碼處理等關鍵技術詳解 本教程將帶您一步步學習如何使用 Playwright——一個強大的瀏覽器自動化工具,來完成網頁任務,例如提交鏈接并處理旋轉驗證碼。我們將按照典型的自動化流程順序,從啟動瀏覽器到關閉瀏覽器,詳細講解每個步驟…

數據結構(完)

樹 二叉樹 構建二叉樹 int value;Node left;Node right;public Node(int val) {valueval;} 節點的添加 Node rootnull;public void insert(int num) {Node nodenew Node(num);if(rootnull) {rootnode;return;}Node index root;while(true) {//插入的節點值小if(index.value&g…

FastAPI與SQLAlchemy數據庫集成與CRUD操作

title: FastAPI與SQLAlchemy數據庫集成與CRUD操作 date: 2025/04/16 09:50:57 updated: 2025/04/16 09:50:57 author: cmdragon excerpt: FastAPI與SQLAlchemy集成基礎包括環境準備、數據庫連接配置和模型定義。CRUD操作通過數據訪問層封裝和路由層實現,確保線程安全和事務…