服務器部署網易開源TTS | EmotiVoice部署教程

一、環境

ubuntu 20.04
python 3.8
cuda 11.8

二、部署

1、docker方式部署

1.1、安裝docker

如何安裝docker,可以參考這篇文章

1.2、拉取鏡像

docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest

2、完整安裝

安裝python依賴

conda create -n EmotiVoice python=3.8 -y
conda activate EmotiVoice
pip install torch torchaudio
pip install numpy numba scipy transformers==4.26.1 soundfile yacs g2p_en jieba pypinyin

安裝git lfs和下載模型

curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
git lfs install
git lfs clone https://huggingface.co/WangZeJun/simbert-base-chinese WangZeJun/simbert-base-chinese

下載預訓練模型

https://drive.google.com/drive/folders/1y6Xwj_GG9ulsAonca_unSGbJ4lxbNymM

將預訓練模型放在源碼中的位置

WangZeJun/simbert-base-chinese

下載源碼

git clone https://github.com/lukeewin/EmotiVoice.git

在源碼路徑中創建目錄保存預訓練模型

mkdir -p outputs/style_encoder/ckpt
mkdir -p outputs/prompt_tts_open_source_joint/ckpt

g_*, do_*文件放到outputs/prompt_tts_open_source_joint/ckpt,將checkpoint_*放到outputs/style_encoder/ckpt

推理輸入文本格式是:<speaker>|<style_prompt/emotion_prompt/content>|<phoneme>|<content>

  • 例如: 8051|非常開心|<sos/eos> uo3 sp1 l ai2 sp0 d ao4 sp1 b ei3 sp0 j ing1 sp3 q ing1 sp0 h ua2 sp0 d a4 sp0 x ve2 <sos/eos>|我來到北京,清華大學
  • 其中的音素(phonemes)可以這樣得到:python frontend.py data/my_text.txt > data/my_text_for_tts.txt.
TEXT=data/inference/text
python inference_am_vocoder_joint.py \
--logdir prompt_tts_open_source_joint \
--config_folder config/joint \
--checkpoint g_00140000 \
--test_file $TEXT

合成的語音結果在:outputs/prompt_tts_open_source_joint/test_audio

pip install streamlit
streamlit run demo_page.py

更多內容

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/210286.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/210286.shtml
英文地址,請注明出處:http://en.pswp.cn/news/210286.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Web 開發的 20 個實用網站

Web 開發的 20 個實用網站 作為一名前端開發工程師&#xff0c;我們一定使用過很多工具來提高自己的工作效率。它們可以是網站、文檔或 JavaScript 庫。 本文將分享30個有趣的網站。 JavaScript正則表達式可視化工具 https://jex.im/regulex/#!flags&re%5E(a%7Cb)*%3F%…

Centos7及Ubuntu系統安裝指定版本dockerdocker-compose安裝

Centos7系統 docker指定版本安裝【官方文檔步驟】 官方文檔地址&#xff1a;https://docs.docker.com/engine/install/centos/ # 1.安裝yum工具及設置docker-ce鏡像庫 sudo yum install -y yum-utils# 國外的鏡像下載太慢了改成阿里云鏡像庫 sudo yum-config-manager --add-rep…

★102. 二叉樹的層序遍歷

102. 二叉樹的層序遍歷 很巧妙的&#xff0c;又學習了一種層次遍歷的方法&#xff0c;就是說根據當前的隊列的長度去遍歷&#xff0c;遍歷的當前隊列的長度就是該層次的節點個數。 /*** Definition for a binary tree node.* public class TreeNode {* int val;* Tr…

AIGC專題報告:AIGC助力大規模對象存儲服務OSS的能效提升

今天分享的AIGC系列深度研究報告&#xff1a;《AIGC專題報告&#xff1a;AIGC助力大規模對象存儲服務OSS的能效提升》。 &#xff08;報告出品方&#xff1a;全球軟件開發大會&#xff09; 報告共計&#xff1a;18頁 結合AI的智能運維助力能效提升 場景1&#xff1a;通過 AI…

SpringMVC-Servlet

依賴 <dependency><groupId>javax.servlet</groupId><artifactId>servlet-api</artifactId><version>2.5</version> </dependency>web.xml 4.0版本 <?xml version"1.0" encoding"UTF-8"?> <…

Python 網絡爬蟲(三):XPath 基礎知識

《Python入門核心技術》專欄總目錄?點這里 文章目錄 1. XPath簡介2. XPath語法2.1 選擇節點2.2 路徑分隔符2.3 謂語2.4 節點關系2.5 運算符3. 節點3.1 元素節點(Element Node)3.2 屬性節點(Attribute Node)

前端vue3——實現二次元人物拼圖校驗

文章目錄 ?前言?vue3拖拽實現拼圖&#x1f496; 思路分解&#x1f496; 布局結構&#x1f496; 拖拽函數&#x1f496; 校驗函數&#x1f496; inscode整體代碼 ?運行效果&#x1f496; 隨機順序&#x1f496; 拖拽中&#x1f496; 校驗失敗&#x1f496; 校驗通過 ?總結?…

IDEA中.java .class .jar的含義與聯系

當使用IntelliJ IDEA這樣的集成開發環境進行Java編程時&#xff0c;通常涉及.java源代碼文件、.class編譯后的字節碼文件以及.jar可執行的Java存檔文件。 1. .java 文件&#xff1a; 1.這些文件包含了Java源代碼&#xff0c;以文本形式編寫。它們通常位于項目中的源代碼目錄中…

蒼穹外賣項目筆記(8)— 緩存商品、購物車功能

前言 代碼鏈接&#xff1a; Echo0701/take-out? (github.com) 1 緩存菜品 1.1 問題說明 【注】很多時候系統性能的瓶頸就在于數據庫這端 1.2 實現思路 通過 Redis 來緩存數據&#xff0c;減少數據庫查詢操作 【注】Redis 基于內存來保存數據的&#xff0c;訪問 Redis 數據…

LeetCode208.實現Trie(前綴樹)

我一開始想題目叫前綴樹&#xff0c;是要用樹嗎&#xff1f;但是不知道用樹怎么寫&#xff0c;然后我就花了10多分鐘&#xff0c;用了HashMap解了。map的key是word&#xff0c;value是一個放了word的所有前綴的set&#xff0c;這樣search方法就非常簡單了&#xff0c;只要看has…

Leetcode—2048.下一個更大的數值平衡數【中等】

2023每日刷題&#xff08;五十四&#xff09; Leetcode—2048.下一個更大的數值平衡數 實現代碼 class Solution { public:int nextBeautifulNumber(int n) {for(int x n 1; ; x) {vector<int> cnt(10, 0);for(int y x; y > 0; y / 10) {cnt[y%10];}bool ok tru…

C++ Div3、Sqrt 函數高性能實現(帶匯編指令集)

均采用魔法數字&#xff08;Magic Number&#xff09;實現&#xff0c;一個是經典求平方根函數所使用的魔法數字&#xff1a;0x5f375a86、0x5f3759df。 float Sqrt(float x) noexcept { /* 0x5f3759df */float xhalf 0.5f * x;int32_t i *(int32_t*)&x;i 0x5f375a86 - …

TP5上傳圖片壓縮尺寸

圖片上傳&#xff0c;最簡單的就是&#xff0c; 方法一&#xff1a; 修改上傳限制&#xff0c;不讓上傳大于多少多少的圖片 改一下size即可&#xff0c;默認單位是B換算成M還需要除以兩次1024 方法二&#xff1a; 對上傳的圖片進行縮放&#xff0c;此辦法網上找了不少的代碼…

如何在 Azure Cosmos DB 中使用緩存

Cosmos DB 是微軟在 Azure 云中發布的新 NoSQL 數據庫。與關系數據庫不同&#xff0c;Cosmos DB 是一種托管數據庫服務&#xff0c;因此具有可擴展性&#xff0c;因此在高事務性 .NET 和 .NET Core 應用程序中很受歡迎。 但是&#xff0c;使用 Cosmos DB 時&#xff0c;您需要…

pytorch 鉤子函數hook 詳解及實戰

文章目錄 1. 介紹1.1 pytorch hook 函數種類1.2 pytorch hook 種類1.3 hook的執行順序2. torch.Tensor.register_hook()2.1 功能2.2 語法2.3 案例3. nn.Module.register_forward_pre_hook3.1 功能3.2 語法3.3 案例4. nn

連通分量提取

圖像形態學操作中的提取連通分量是一種用于分離圖像中相互連接的像素區域的技術。這些像素區域通常代表著圖像中的不同物體、目標或者區域。連通分量提取通常用于圖像分割、對象識別、特征提取等領域。 原理&#xff1a; ??連通分量提取基于圖像中像素的連接性。在這個過程中…

ECharts標題字體大小自適應變化

我們在做自適應Echarts的時候,字體大小在配置項里是如下配置的, title 標題組件,包含主標題和副標題。 以下是常用的對標題的設置: title:{//設置圖表的標題text:"主標題",link:"baidu.com", //設置標題超鏈接target:"self",

HCIP —— BGP 基礎 (下)

BGP 的狀態機 --- 建立對等體之間的TCP會話&#xff1a;指定建立對等體的對象 六種狀態機 Idle狀態 Idle 等待狀態&#xff08;相當于OSPF的down狀態&#xff09;--- 采用TCP單播建鄰 Idle 狀態下&#xff0c;啟動BGP協議后必須指定建立對等體的目標之后&#xff0c;才能進入…

yaml工作常用語法總結

文章目錄 yaml中的| 符號 和 > 符號yaml中的 - 符號工作中常遇到的問題- 命令行中有冒號加空格&#xff0c;導致yaml解析報錯 yaml中的| 符號 和 > 符號 在 YAML 中&#xff0c;| 符號表示標量塊&#xff08;Scalar Block&#xff09;的開始。它用于表示長文本塊或保持多…

代碼隨想錄算法訓練營第四十六天| 139 單詞拆分

目錄 139 單詞拆分 139 單詞拆分 class Solution { public:bool wordBreak(string s, vector<string>& wordDict) {vector<bool>dp(s.size() 1);//長度為i的字符串時能否成功拆分unordered_set<string>set(wordDict.begin(),wordDict.end());dp[0] t…