【實操GPT-SoVits】聲音克隆模型圖文版教程

【實操GPT-SoVits】聲音克隆模型圖文版教程

web/2025/9/17 1:46:30/文章來源:https://blog.csdn.net/ColorKin/article/details/144305276

項目github地址：https://github.com/RVC-Boss/GPT-SoVITS.git
官方教程：https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/tkemqe8vzhadfpeu
本文旨在迅速實操GPT-SoVits項目，不闡述技術原理（后期如果有時間研究，爭取寫個學習筆記）。
windows用戶可直接使用整合包。
感謝書生·浦語提供的服務器資源。

一、準備工作

下載源項目　

git clone https://github.com/RVC-Boss/GPT-SoVITS.git

安裝依賴　

conda create -n GPTSoVits python=3.9
conda activate GPTSoVits
pip install -r requirements.txt

下載預訓練模型　

https://huggingface.co/lj1995/GPT-SoVITS/tree/main　

或者　

iCloud Drive - Apple iCloud　

啟動webUI頁面　

python webui.py

二、實操-克隆林黛玉

我使用的語音素材是干聲，這里就不使用UVR5分離背景音處理。直接進行語音切片，下次有時間寫個補充（急著下班回家）。　

關于原素材的來源：剪映剪輯后導出音頻。　

2.1 素材切片

在源碼目錄內新建文件夾，分別用于存放原素材和切片后的素材。　

配置文件夾后，點擊音頻切割　

切割結束，我們看下文件夾　

　

2.2 切片素材降噪

對切片的素材進行語音降噪。直接點擊"啟動語音降噪器"進行處理。

　

提示降噪完成。我們去output目錄下看下輸出。　

2.3 批量ASR

啟動批量ASR，目錄設置為剛剛批量片段降噪處理后的文件夾。　

任務完成，我們去目錄里看下生成了什么　

生成了一個.list文件，精確度還是蠻高的。　

2.4?語音轉文本校對

啟動在9871端口，我們點擊過去。　

對左側的text進行大致的校對，保證語音和文本對應（刪除明顯亂碼等）。太短的音頻可以選擇刪除，或者與其他音頻片段合并。最終保存文件。

　

　

2.5 訓練數據格式化

設置model name，以及兩個文件夾后依次點擊3個按鈕，或者點擊"一鍵"三連按鈕。　

提示進程結束無報錯后，我們看下logs文件夾，如果某個文件夾是空的，說明格式化失敗了，需要重新調整素材再次處理。　

2.6 微調

我的原素材時長較短，這里就使用默認參數。素材較長可以增加訓練輪次。　

依次進行"SoVITS traning"和"GPT training"，等待完成。

　

訓練完成后，我們可以在以下2個文件夾（之前選擇的v2版本：SoVITS_weights_v2、GPT_weights_v2）內看到保存的模型。

　

2.7 推理

切換到"inference"，先刷新模型列表，2個模型都選擇數字最大的那個。勾選"啟用并行"。最后點擊"open tts inference webUI"。　

服務啟動后我們會看到如下頁面。

　

輔助參考音頻可以不上傳。調整"推理設置"至趨近于自己想要的角色語音效果。

　

三、推理結果展示

這花盆之中，置有一株青菜，倒也別致。你瞧它，葉片兒青翠欲滴，宛若碧玉雕琢，倒有一絲不染塵埃之清逸。那菜莖亭亭玉立，于這方寸之地，亦能展現出勃勃生機，恰如那閨閣中的女子，雖身處深宅，卻難掩其清新脫俗之氣。只是不知，它在這花盆之中，是否也會如我一般在夜深人靜之時，暗自神傷，思念起那廣袤田野的自由來呢?　

隨機掉落卡片+語音播放

　

四、api調用

運行api_v2.py成功后，接口文檔如下圖所示。/tts方法就是我們需要調用。　

　

　

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/62590.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/62590.shtml
英文地址，請注明出處：http://en.pswp.cn/web/62590.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

5G模組AT命令腳本-關閉模組的IP過濾功能

5G模組AT命令腳本-關閉模組的IP過濾功能

關閉模組的IP過濾功能關閉模組的IP過濾功能 5G 模組通常使用nat方式為下掛設備或上位機提供上網服務，默認情況，不做NAt的包無法經由模組轉發，如果禁掉這個限制 ，可使用本文中的配置命令本腳本用于關閉模組的IP過濾功能&#xf…

閱讀更多...

JAVA (Springboot) i18n國際化語言配置

JAVA (Springboot) i18n國際化語言配置

JAVA i18n國際化語言配置一、簡介二、功能三、Java配置國際化步驟四、Java國際化配置工具類五、Spring Boot配置六、測試一、簡介在Java中，國際化（Internationalization，通常簡稱為i18n）是一個過程，它允許應用程…

閱讀更多...

如何創建基于udp的客戶端和服務端

如何創建基于udp的客戶端和服務端

1.先創建好udpServer.hpp、udpServer.cc、udpClient.hpp、udpClient.cc的框架。 #pragma once #include <string> #include <iostream> #include <sys/types.h> #include <sys/socket.h> #include <unistd.h> #include <cerrno> #include…

閱讀更多...

【上線文檔】系統上線方案模板，計算機系統上線保障計劃，系統運維信息系統運行保障方案，系統上線方案模板（Word原件）

【上線文檔】系統上線方案模板，計算機系統上線保障計劃，系統運維信息系統運行保障方案，系統上線方案模板（Word原件）

一、項目背景和目標二、項目需求分析 2.1 功能需求 2.2 非功能需求三、系統設計 3.1 系統架構設計 3.2 數據庫設計 3.3 接口設計 3.4 用戶界面設計四、系統開發 4.1 開發環境搭建 4.2 業務邏輯開發 4.3 數據庫實現 4.4 接口實現 4.5 用戶界面實現五、系統測…

閱讀更多...

大模型應用的數字能源數據集

大模型應用的數字能源數據集

除了尚須時日的量子計算解決算力效率和能源問題，以及正在路上的超越transformer的全新模型架構外，無疑是“數據集”，準確講是“高質量大規模多樣性的數據集”。數據集是大模型發展的核心要素之一，是大計算的標的物，是實…

閱讀更多...

【OpenCV】圖像轉換

【OpenCV】圖像轉換

理論傅立葉變換用于分析各種濾波器的頻率特性。對于圖像，使用 2D離散傅里葉變換（DFT） 查找頻域。快速算法稱為快速傅立葉變換（FFT） 用于計算DFT。 Numpy中的傅立葉變換首先，我們將看到如何使用Numpy查…

閱讀更多...

如何使用Java編寫Jmeter函數

如何使用Java編寫Jmeter函數

Jmeter 自帶有各種功能豐富的函數，可以幫助我們進行測試，但有時候提供的這些函數并不能滿足我們的要求，這時候就需要我們自己來編寫一個自定義的函數了。例如我們在測試時，有時候需要填入當前的時間，雖然我們可以使用p…

閱讀更多...

【2024版】最新kali linux入門及常用簡單工具介紹（非常詳細）從零基礎入門到精通，看完這一篇就夠了

【2024版】最新kali linux入門及常用簡單工具介紹（非常詳細）從零基礎入門到精通，看完這一篇就夠了

前言相信很多同學了解到和學習網絡安全的時候都聽過kali系統，大家都稱之為黑客最喜愛的系統，那么什么是kali，初學者用kali能做些什么，大白我將在本文中做詳細的介紹： 一、kali linux是什么？ Kali Linux…

閱讀更多...

使用 electron 把 vue 項目打包成客戶端

使用 electron 把 vue 項目打包成客戶端

1. 新建一個Vue項目新建一個vue項目，或者在已經寫好的vue項目上操作 2. 安裝依賴包需要安裝的包有2個 electron electron-builder 安裝失敗的，可看另外一篇解決方法https://blog.csdn.net/Anorry/article/details/144061069?spm1001.2014.3001.5501 3…

閱讀更多...

六大排序算法：插入排序、希爾排序、選擇排序、冒泡排序、堆排序、快速排序

六大排序算法：插入排序、希爾排序、選擇排序、冒泡排序、堆排序、快速排序

本章講述數據結構中的六大排序算法歡迎大佬們踴躍討論，感謝大家支持！ 我的博客主頁鏈接六大排序算法一.插入排序1.1 直接插入排序1.2 希爾排序二.選擇排序2.1 單向選擇排序2.2雙向選擇排序2.3 堆排序三.交換排序3.1 冒泡排序3.2 快速排序3.2.1 Hoa…

閱讀更多...

el-table手動觸發懶加載

el-table手動觸發懶加載

二次修改了一下，確保點擊某一單元格格元素觸發 // 隱藏懶加載箭頭后手動觸發懶加載 expandRows(scope){scope.row.isExpanded !scope.row.isExpanded // 切換展開狀態let isExpanded scope.row.isExpandedconst { table: { toggleRowExpansion, store }} this.$r…

閱讀更多...

【MySQL】數據庫 Navicat 可視化工具與 MySQL 命令行基本操作

【MySQL】數據庫 Navicat 可視化工具與 MySQL 命令行基本操作

💯 歡迎光臨清流君的博客小天地，這里是我分享技術與心得的溫馨角落 💯 🔥 個人主頁:【清流君】🔥 📚 系列專欄: 運動控制 | 決策規劃 | 機器人數值優化 📚 🌟始終保持好奇心&…

閱讀更多...

threejs相機輔助對象cameraHelper

threejs相機輔助對象cameraHelper

為指定相機創建一個輔助對象，顯示這個相機的視錐。想要在場景里面顯示相機的視錐，需要創建兩個相機。舉個例子，場景中有個相機A，想要顯示相機A的視錐，那么需要一個相機B，把B放在A的后面，兩個…

閱讀更多...

反向代理-緩存篇

反向代理-緩存篇

文章目錄強緩存一、Expires（http1.0 規范）二、cache-control（http1.1 出現的 header 信息）Cache-Control 的常用選項Cache-Control 常用選項的選擇三、弊端協商緩存一、ETag二、If-None-Match三、Last-modified四、If-Modified-Since瀏覽器的三種刷新方式靜態資源部署策略…

閱讀更多...

深度學習小麥頭檢測-基于Faster-RCNN的小麥頭檢測——附項目源碼

深度學習小麥頭檢測-基于Faster-RCNN的小麥頭檢測——附項目源碼

比賽描述為了獲得有關全世界麥田的大量準確數據，植物科學家使用“小麥頭”（包含谷物的植物上的穗）的圖像檢測。這些圖像用于估計不同品種的小麥頭的密度和大小。但是，在室外野外圖像中進行準確的小麥頭檢測可能在視覺上具有挑戰性。密集的小麥植株經常重疊，并且風會使照片…

閱讀更多...

健康管理系統(Koa+Vue3)

健康管理系統(Koa+Vue3)

系統界面(源碼末尾獲取) 系統技術 Vue3 Koa Nodejs Html Css Js ....... 系統介紹系統比較簡單,輕輕松松面對結業課堂作業.采用的是基于nodejs開發的Koa框架作為后端,采用Vue框架作為前端,完成快速開發和界面展示. 系統獲取啊啊啊寶/KoaVue3https://gitee.com/ah-ah-b…

閱讀更多...

數據清洗代碼：缺失值，異常值，離群值Matlab處理

數據清洗代碼：缺失值，異常值，離群值Matlab處理

目錄基本介紹程序設計參考資料基本介紹一、過程概述本過程適用于處理SCADA系統采集到的數據，以及具有類似需求的數據集。處理步驟包括缺失值處理、異常值處理和離群值處理，旨在提升數據質量，增強數據的相關性，同時保持數據的原始特征和隨機性。二、缺失值處理對于SC…

閱讀更多...

Leetcode 每日一題 202.快樂數

Leetcode 每日一題 202.快樂數

目錄題意算法思路過題圖片算法實現代碼解析復雜度分析題目鏈接結論題意判斷正整數 n 是不是快樂數。快樂數定義： （1）每次將正整數替換為它每個位置上的數字的平方和。 （2）重復這個過程直到這個數…

閱讀更多...

【鴻蒙生態崛起】開發者如何把握機遇，應對挑戰，打造卓越應用體驗？

【鴻蒙生態崛起】開發者如何把握機遇，應對挑戰，打造卓越應用體驗？

文章目錄每日一句正能量前言鴻蒙簡析鴻蒙生態的認知和了解鴻蒙生態的崛起分析鴻蒙生態下開發時遇到的挑戰開發工具不完善技術難度生態競爭抓住機遇、應對挑戰鴻蒙生態未來的發展趨勢1. 全場景智慧生活的推動者2. 技術創新的引領者3. 開放合作的倡導者對鴻蒙生態和開發者的建…

閱讀更多...

Nignx部署Java服務測試使用的Spring Boot項目Demo

Nignx部署Java服務測試使用的Spring Boot項目Demo

天行健，君子以自強不息；地勢坤，君子以厚德載物。每個人都有惰性，但不斷學習是好好生活的根本，共勉！ 文章均為學習整理筆記，分享記錄為主，如有錯誤請指正，共同學習進步。…

閱讀更多...

最新文章