GPT-SoVITS音色克隆-模型訓練步驟

GPT-SoVITS音色克隆-模型訓練步驟

  • GPT-SoVITS模型源碼
  • 一個簡單的TTS后端項目 基于
  • 模型部署和訓練教程,語雀
    模型部署和訓練教程

啟動模型訓練的主頁面

1. 切到模型路徑

/psycheEpic/GPT-SoVITS
  • 進入Python虛擬環境,并掛起執行python腳本
conda activate GPTSoVits
nohup python ./webui.py >>./webui.log &
  • 查看日志 tail -500f webui.log

2. uvr5人聲分離和去混響處理

  • 切換到路徑
cd /psycheEpic/GPT-SoVITS/tools/uvr5
  • 啟動uvr5操作web界面
  • 在這里插入圖片描述
python webui.py "cuda" True 15666 True

3. 人聲分離操作

在瀏覽器進入界面:https://73de21d131614dd42e.gradio.live,這個地址每次啟動都會變得

先用HP2模型處理一遍(提取人聲),然后將輸出的干聲音頻再用onnx_dereverb最后用DeEcho-Aggressive(去混響),輸出格式選wav。輸出的文件默認在GPT-SoVITS-beta\GPT-SoVITS-beta\output\uvr5_opt這個文件夾下,建議不要改輸出路徑,到時候找不到文件誰也幫不了你。處理完的音頻(vocal)的是人聲,(instrument)是伴奏,(No Reverb)的沒混響的,(Reverb)的是混響。(vocal)(No Reverb)才是要用的文件,其他都可以刪除。結束后記得到WebUI關閉UVR5節省顯存。

1)第一步先提前人聲,人聲和背景音樂分離,HP2模型

在這里插入圖片描述

2)第二步將上一步分離出來的人聲,上傳作為輸入,再使用onnx_dereverb提前一次人聲

在這里插入圖片描述

3)第三步將上一步的人聲作為輸入,去混響,使用DeEcho-Aggressive(去混響)

在這里插入圖片描述

4. 將長視頻進行切割

進入主頁面操作:

在這里插入圖片描述

5.給切割好的視頻作為輸入,給對路徑,調用模型進行打標

為什么要打標:打標就是給每個音頻配上文字,這樣才能讓AI學習到每個字該怎么讀。這里的標指的是標注

這步很簡單只要把剛才的切分文件夾輸入,如果你音頻降噪過,那么默認是output/slicer_opt文件夾,如果你切分了沒有降噪,那么默認是output/slicer_opt文件夾。然后選擇達摩ASR或者fast whisper。達摩ASR只能用于識別中文,效果也最好。fast whisper可以標注99種語言,是目前最好的英語和日語識別,模型尺寸選large V3,語種選auto自動就好了。然后點開啟離線批量ASR就好了,默認輸出是output/asr_opt這個路徑,建議不要改輸出路徑,到時候找不到文件誰也幫不了你。ASR需要一些時間,看著控制臺有沒有報錯就好了。

在這里插入圖片描述

6. 標注校驗

在這里插入圖片描述

7.GPT-SoVITS-TTS-訓練集格式化工具-填好參數一鍵三連

在這里插入圖片描述

在這里插入圖片描述

8. 微調訓練

在這里插入圖片描述

9. 模型推理,刷新模型

在這里插入圖片描述

  • 執行腳本,打開推理頁面
進入Python環境
conda activate GPTSoVits
cd /psycheEpic/GPT-SoVITS/GPT_SoVITS/
nohup python inference_webui.py >>./inference_webui.log &

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/710793.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/710793.shtml
英文地址,請注明出處:http://en.pswp.cn/news/710793.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

機器學習(II)--樣本不平衡

現實中,樣本(類別)樣本不平衡(class-imbalance)是一種常見的現象,如:金融欺詐交易檢測,欺詐交易的訂單樣本通常是占總交易數量的極少部分,而且對于有些任務而言少數樣本更…

Linux信號【產生-保存-處理】

目錄 前言: 1、進程信號基本概念 1.1、什么是信號? 1.2、信號的作用 2、鍵盤鍵入 2.1、ctrlc 終止前臺進程 2.1.1、signal 注冊執行動作 3、系統調用 3.1、kill 函數 3.2、模擬實現 myKill 3.3、raise 函數 3.4、abort 函數 4、軟件條件信號…

人工智能福利站,初識人工智能,圖神經網絡學習,第五課

🏆作者簡介,普修羅雙戰士,一直追求不斷學習和成長,在技術的道路上持續探索和實踐。 🏆多年互聯網行業從業經驗,歷任核心研發工程師,項目技術負責人。 🎉歡迎 👍點贊?評論…

nginx設置緩存時間、日志分割、開啟多進程、網頁壓縮、配置防盜鏈

一、設置緩存時間 當網頁數據返回給客戶端后,可針對靜態網頁設置緩存時間,在配置文件內的http段內server段添加location,更改字段expires 1d來實現:避免重復請求,加快訪問速度 第一步:修改主配置文件 #修…

Vulnhub靶機:basic_pentesting_2

一、介紹 運行環境:Virtualbox 攻擊機:kali(10.0.2.4) 靶機:basic_pentesting_2(10.0.2.7) 目標:獲取靶機root權限和flag 靶機下載地址:https://download.vulnhub.c…

如何選擇O2OA(翱途)開發平臺的部署架構?

概述 O2OA(翱途)開發平臺[下稱O2OA開發平臺或者O2OA]支持公有云,私有云和混合云部署,也支持復雜的網絡結構下的分布式部署。本篇主要介紹O2OA(翱途)開發平臺支持的部署環境以及常用的集群部署架構。 軟硬件環境說明 支持的云化平臺: 華為云…

分布式概念:編碼一個簡單分布式系統

分布式系統是由多臺計算機組成的系統,它們通過網絡連接并共同完成任務。以下是一個簡單的分布式系統的編碼示例: 定義系統架構 首先,需要定義系統的架構。包括確定系統中的計算節點、通信機制和任務分配方式等。 編寫計算節點代碼 每個計算節…

算法簡介:遞歸

遞歸 1. 遞歸1.1 基線條件和遞歸條件 2. 棧2.1 調用棧2.2 遞歸調用棧 1. 遞歸 循環和遞歸可以實現相同的功能,如: 循環 def look_for_key(main_box)pile main_box.make_a_pile_to_look_thorugh()while pile is not empty:box pile.grab_a_box()for …

LLM 聊天對話界面chatwebui 增加實時語音tts功能

類似豆包聊天,可以實時語音回復 1、聊天界面 streamlit頁面 參考界面:https://blog.csdn.net/weixin_42357472/article/details/133199866 stream_web.py 2、 增加實時語音tts功能(接入melotts api服務) 參考:https://blog.csdn.net/weixin_42357472/article/detai…

vue3學習 ref和reactive的使用

使用ref聲明一個響應式對象并使用 <script lang"ts" setup> import { ref } from vue; const message ref("HelloWorld") message.value"被修改了啊~~" </script> <template>{{ message }} </template>ref() 接收參數…

Docker容器與虛擬化技術:OpenEuler 使用 docker-compose 部署 LNMP

目錄 一、實驗 1.環境 2.OpenEuler 部署 docker-compose 3.docker-compose 部署 LNMP 二、問題 1.ntpdate未找到命令 2.timedatectl 如何設置時區與時間同步 3.php網頁顯示時區不對 一、實驗 1.環境 &#xff08;1&#xff09;主機 表1 主機 系統架構版本IP備注Lin…

docker啟動容器報錯:ERRO[0000] error waiting for container: context canceled,解決方法

系統環境&#xff1a;ubuntu16.04&#xff0c;已安裝docker 執行命令&#xff1a;sudo docker run -it --privileged --shm-size128g -v /home:/home docker-image /bin/bash 報錯 docker: Error response from daemon: could not select device driver "" with …

Android PMS實戰——Hook技術介紹(十四)

在了解了 PMS 的調用流程之后,都有那些用處呢?首先幫助了解 Android 包管理系統原理,還有就是配合 AMS 通過 Hook 技術,實現熱更新、插件化等功能。 我們可以通過反射獲取到 PackageParser 對象,再反射調用它的 parsePackage() 傳入 apk 路徑完成解析獲取到 Package 對象,…

厚膜電阻與薄膜電阻相比,特點是什么?

厚膜電阻與薄膜電阻是兩種常見的電阻器件&#xff0c;它們之間的特點主要有以下幾個方面&#xff1a; 1. 厚度不同&#xff1a;厚膜電阻的膜層厚度較大&#xff0c;一般在幾微米到幾十微米之間&#xff0c;而薄膜電阻的膜層厚度較薄&#xff0c;一般在幾納米到幾微米之間。 2. …

單片機精進之路-9ds18b20溫度傳感器

ds18b20復位時序圖&#xff0c;先將b20的數據引腳拉低至少480us&#xff0c;然后再將數據引腳拉高15-60us&#xff0c;再去將測傳感器的數據引腳是不是變低電平并保持60-240us&#xff0c;如果是&#xff0c;則說明檢測到溫度傳感器&#xff0c;并正常工作。需要在240us后才能檢…

xss高級靶場

一、環境 XSS Game - Ma Spaghet! | PwnFunction 二、開始闖關 第一關 看看代碼 試一下直接寫 明顯進來了為什么不執行看看官方文檔吧 你不執行那我就更改單標簽去使用唄 ?somebody<img%20src1%20onerror"alert(1)"> 防御&#xff1a; innerText 第二關…

Codeforces Round 930 (Div. 2) (A~B)

比賽&#xff1a;Codeforces Round 930 (Div. 2) (A~B) 目錄&#xff1a;A B A題&#xff1a;Shuffle Party 標簽: 模擬 題目大意 給你一個數組 a1,a2,…,an。最初&#xff0c;每個 1 ≤ i ≤ n都有 ai i&#xff0c;整數 k ≥ 2的運算 swap(k)定義如下&#xff1a; 設 d是…

Python圖像形態學處理:腐蝕、膨脹、禮帽、黑帽……

文章目錄 二值形態學灰度形態學 python圖像處理教程&#xff1a;初步&#x1f4f7;插值變換 最基礎的形態學操作有四個&#xff0c;分別是腐蝕、膨脹、開計算和閉計算&#xff0c;【scipy.ndimage】分別實現了二值數組和灰度數組的這四種運算。而針對灰度圖像&#xff0c;【sc…

Office/WPS 好用的PPT插件-智能選擇布局

軟件介紹 PPT大珩助手是一款全新設計的Office PPT插件&#xff0c;它是一款功能強大且實用的PPT輔助工具&#xff0c;能夠輕松幫助您修改、優化和管理幻燈片。憑借豐富的功能和用戶友好的界面&#xff0c;PPT大珩助手能夠助力您打造出精美而專業的演示文稿。我們致力于為用戶提…

Flutter學習7 - Dart 泛型

1、泛型類 //泛型類 class Cache<T> {final Map<String, T> _cache {};void saveData(String key, T value) {_cache[key] value;}//泛型方法T? getData(String key) {return _cache[key];} }void main() {Cache<int> cache1 Cache();const String name…