【實操GPT-SoVits】聲音克隆模型圖文版教程

  1. 項目github地址:https://github.com/RVC-Boss/GPT-SoVITS.git
  2. 官方教程:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/tkemqe8vzhadfpeu
  3. 本文旨在迅速實操GPT-SoVits項目,不闡述技術原理(后期如果有時間研究,爭取寫個學習筆記)。
  4. windows用戶可直接使用整合包。
  5. 感謝書生·浦語提供的服務器資源。

一、準備工作

下載源項目 

git clone https://github.com/RVC-Boss/GPT-SoVITS.git

安裝依賴 

conda create -n GPTSoVits python=3.9
conda activate GPTSoVits
pip install -r requirements.txt

下載預訓練模型 

https://huggingface.co/lj1995/GPT-SoVITS/tree/main 

或者 

iCloud Drive - Apple iCloud 

啟動webUI頁面 

python webui.py

二、實操-克隆林黛玉

我使用的語音素材是干聲,這里就不使用UVR5分離背景音處理。直接進行語音切片,下次有時間寫個補充(急著下班回家)。 

關于原素材的來源:剪映剪輯后導出音頻。 

2.1 素材切片

在源碼目錄內新建文件夾,分別用于存放原素材和切片后的素材。 

配置文件夾后,點擊音頻切割 

切割結束,我們看下文件夾 

 

2.2 切片素材降噪

對切片的素材進行語音降噪。直接點擊"啟動語音降噪器"進行處理。

 

提示降噪完成。我們去output目錄下看下輸出。 

2.3 批量ASR

啟動批量ASR,目錄設置為剛剛批量片段降噪處理后的文件夾。 

任務完成,我們去目錄里看下生成了什么 

生成了一個.list文件,精確度還是蠻高的。 

2.4?語音轉文本校對

啟動在9871端口,我們點擊過去。 

對左側的text進行大致的校對,保證語音和文本對應(刪除明顯亂碼等)。太短的音頻可以選擇刪除,或者與其他音頻片段合并。最終保存文件。

 

 

2.5 訓練數據格式化

設置model name,以及兩個文件夾后依次點擊3個按鈕,或者點擊"一鍵"三連按鈕。 

提示進程結束無報錯后,我們看下logs文件夾,如果某個文件夾是空的,說明格式化失敗了,需要重新調整素材再次處理。 

2.6 微調

我的原素材時長較短,這里就使用默認參數。素材較長可以增加訓練輪次。 

依次進行"SoVITS traning"和"GPT training",等待完成。

 

訓練完成后,我們可以在以下2個文件夾(之前選擇的v2版本:SoVITS_weights_v2、GPT_weights_v2)內看到保存的模型。

 

2.7 推理

切換到"inference",先刷新模型列表,2個模型都選擇數字最大的那個。勾選"啟用并行"。最后點擊"open tts inference webUI"。 

服務啟動后我們會看到如下頁面。

 

輔助參考音頻可以不上傳。調整"推理設置"至趨近于自己想要的角色語音效果。

 

三、推理結果展示

這花盆之中,置有一株青菜,倒也別致。你瞧它,葉片兒青翠欲滴,宛若碧玉雕琢,倒有一絲不染塵埃之清逸。那菜莖亭亭玉立,于這方寸之地,亦能展現出勃勃生機,恰如那閨閣中的女子,雖身處深宅,卻難掩其清新脫俗之氣。只是不知,它在這花盆之中,是否也會如我一般在夜深人靜之時,暗自神傷,思念起那廣袤田野的自由來呢? 

隨機掉落卡片+語音播放

 

四、api調用

運行api_v2.py成功后,接口文檔如下圖所示。/tts方法就是我們需要調用。 

 

 

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/62590.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/62590.shtml
英文地址,請注明出處:http://en.pswp.cn/web/62590.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

5G模組AT命令腳本-關閉模組的IP過濾功能

關閉模組的IP過濾功能 關閉模組的IP過濾功能 5G 模組通常使用nat方式為 下掛設備或上位機提供上網服務,默認情況,不做NAt的包無法經由 模組轉發,如果禁掉這個限制 ,可使用本文中的配置命令本腳本用于關閉模組的IP過濾功能&#xf…

JAVA (Springboot) i18n國際化語言配置

JAVA i18n國際化語言配置 一、簡介二、功能三、Java配置國際化步驟四、Java國際化配置工具類五、Spring Boot配置六、測試 一、簡介 在Java中,國際化(Internationalization,通常簡稱為i18n)是一個過程,它允許應用程…

如何創建基于udp的客戶端和服務端

1.先創建好udpServer.hpp、udpServer.cc、udpClient.hpp、udpClient.cc的框架。 #pragma once #include <string> #include <iostream> #include <sys/types.h> #include <sys/socket.h> #include <unistd.h> #include <cerrno> #include…

【上線文檔】系統上線方案模板,計算機系統上線保障計劃,系統運維信息系統運行保障方案,系統上線方案模板(Word原件)

一、項目背景和目標 二、項目需求分析 2.1 功能需求 2.2 非功能需求 三、系統設計 3.1 系統架構設計 3.2 數據庫設計 3.3 接口設計 3.4 用戶界面設計 四、系統開發 4.1 開發環境搭建 4.2 業務邏輯開發 4.3 數據庫實現 4.4 接口實現 4.5 用戶界面實現 五、系統測…

大模型應用的數字能源數據集

除了尚須時日的量子計算解決算力效率和能源問題&#xff0c;以及正在路上的超越transformer的全新模型架構外&#xff0c;無疑是“數據集”&#xff0c;準確講是“高質量大規模多樣性的數據集”。數據集是大模型發展的核心要素之一&#xff0c;是大計算的標的物&#xff0c;是實…

【OpenCV】圖像轉換

理論 傅立葉變換用于分析各種濾波器的頻率特性。對于圖像&#xff0c;使用 2D離散傅里葉變換&#xff08;DFT&#xff09; 查找頻域。快速算法稱為 快速傅立葉變換&#xff08;FFT&#xff09; 用于計算DFT。 Numpy中的傅立葉變換 首先&#xff0c;我們將看到如何使用Numpy查…

如何使用Java編寫Jmeter函數

Jmeter 自帶有各種功能豐富的函數&#xff0c;可以幫助我們進行測試&#xff0c;但有時候提供的這些函數并不能滿足我們的要求&#xff0c;這時候就需要我們自己來編寫一個自定義的函數了。例如我們在測試時&#xff0c;有時候需要填入當前的時間&#xff0c;雖然我們可以使用p…

【2024版】最新kali linux入門及常用簡單工具介紹(非常詳細)從零基礎入門到精通,看完這一篇就夠了

前言 相信很多同學了解到和學習網絡安全的時候都聽過kali系統&#xff0c;大家都稱之為黑客最喜愛的系統&#xff0c;那么什么是kali&#xff0c;初學者用kali能做些什么&#xff0c;大白我將在本文中做詳細的介紹&#xff1a; 一、kali linux是什么&#xff1f; Kali Linux…

使用 electron 把 vue 項目打包成客戶端

1. 新建一個Vue項目 新建一個vue項目&#xff0c;或者在已經寫好的vue項目上操作 2. 安裝依賴包 需要安裝的包有2個 electron electron-builder 安裝失敗的&#xff0c;可看另外一篇解決方法https://blog.csdn.net/Anorry/article/details/144061069?spm1001.2014.3001.5501 3…

六大排序算法:插入排序、希爾排序、選擇排序、冒泡排序、堆排序、快速排序

本章講述數據結構中的六大排序算法 歡迎大佬們踴躍討論&#xff0c;感謝大家支持&#xff01; 我的博客主頁鏈接 六大排序算法 一.插入排序1.1 直接插入排序1.2 希爾排序 二.選擇排序2.1 單向選擇排序2.2雙向選擇排序2.3 堆排序 三.交換排序3.1 冒泡排序3.2 快速排序3.2.1 Hoa…

el-table手動觸發懶加載

二次修改了一下&#xff0c;確保點擊某一單元格格元素觸發 // 隱藏懶加載箭頭后手動觸發懶加載 expandRows(scope){scope.row.isExpanded !scope.row.isExpanded // 切換展開狀態let isExpanded scope.row.isExpandedconst { table: { toggleRowExpansion, store }} this.$r…

【MySQL】數據庫 Navicat 可視化工具與 MySQL 命令行基本操作

&#x1f4af; 歡迎光臨清流君的博客小天地&#xff0c;這里是我分享技術與心得的溫馨角落 &#x1f4af; &#x1f525; 個人主頁:【清流君】&#x1f525; &#x1f4da; 系列專欄: 運動控制 | 決策規劃 | 機器人數值優化 &#x1f4da; &#x1f31f;始終保持好奇心&…

threejs相機輔助對象cameraHelper

為指定相機創建一個輔助對象&#xff0c;顯示這個相機的視錐。 想要在場景里面顯示相機的視錐&#xff0c;需要創建兩個相機。 舉個例子&#xff0c;場景中有個相機A&#xff0c;想要顯示相機A的視錐&#xff0c;那么需要一個相機B&#xff0c;把B放在A的后面&#xff0c;兩個…

反向代理-緩存篇

文章目錄 強緩存一、Expires(http1.0 規范)二、cache-control(http1.1 出現的 header 信息)Cache-Control 的常用選項Cache-Control 常用選項的選擇三、弊端協商緩存一、ETag二、If-None-Match三、Last-modified四、If-Modified-Since瀏覽器的三種刷新方式靜態資源部署策略…

深度學習小麥頭檢測-基于Faster-RCNN的小麥頭檢測——附項目源碼

比賽描述 為了獲得有關全世界麥田的大量準確數據,植物科學家使用“小麥頭”(包含谷物的植物上的穗)的圖像檢測。這些圖像用于估計不同品種的小麥頭的密度和大小。但是,在室外野外圖像中進行準確的小麥頭檢測可能在視覺上具有挑戰性。密集的小麥植株經常重疊,并且風會使照片…

健康管理系統(Koa+Vue3)

系統界面(源碼末尾獲取) 系統技術 Vue3 Koa Nodejs Html Css Js ....... 系統介紹 系統比較簡單,輕輕松松面對結業課堂作業.采用的是基于nodejs開發的Koa框架作為后端,采用Vue框架作為前端,完成快速開發和界面展示. 系統獲取 啊啊啊寶/KoaVue3https://gitee.com/ah-ah-b…

數據清洗代碼:缺失值,異常值,離群值Matlab處理

目錄 基本介紹程序設計參考資料基本介紹 一、過程概述 本過程適用于處理SCADA系統采集到的數據,以及具有類似需求的數據集。處理步驟包括缺失值處理、異常值處理和離群值處理,旨在提升數據質量,增強數據的相關性,同時保持數據的原始特征和隨機性。 二、缺失值處理 對于SC…

Leetcode 每日一題 202.快樂數

目錄 題意 算法思路 過題圖片 算法實現 代碼解析 復雜度分析 題目鏈接 結論 題意 判斷正整數 n 是不是快樂數。 快樂數定義&#xff1a; &#xff08;1&#xff09;每次將正整數替換為它每個位置上的數字的平方和。 &#xff08;2&#xff09;重復這個過程直到這個數…

【鴻蒙生態崛起】開發者如何把握機遇,應對挑戰,打造卓越應用體驗?

文章目錄 每日一句正能量前言鴻蒙簡析鴻蒙生態的認知和了解鴻蒙生態的崛起分析 鴻蒙生態下開發時遇到的挑戰開發工具不完善技術難度生態競爭抓住機遇、應對挑戰 鴻蒙生態未來的發展趨勢1. 全場景智慧生活的推動者2. 技術創新的引領者3. 開放合作的倡導者對鴻蒙生態和開發者的建…

Nignx部署Java服務測試使用的Spring Boot項目Demo

天行健&#xff0c;君子以自強不息&#xff1b;地勢坤&#xff0c;君子以厚德載物。 每個人都有惰性&#xff0c;但不斷學習是好好生活的根本&#xff0c;共勉&#xff01; 文章均為學習整理筆記&#xff0c;分享記錄為主&#xff0c;如有錯誤請指正&#xff0c;共同學習進步。…