[Unity+OpenAI TTS] 集成openAI官方提供的語音合成服務,構建海王暖男數字人

1.簡述

? ? ? ? 最近openAI官方發布了很多新功能,其中就包括了最新發布的TTS語音合成服務的api接口。說到這個語音合成接口,大家可能會比較陌生,但是說到chatgpt官方應用上的聊天機器人,那個臺灣腔的海王暖男的聲音,可能就有印象了吧。那么從官方文檔中,可以發現,openAI提供的TTS服務中,就包含了這個聲音可選。經過我的實測發現,openAI的語音合成效果相當的出色,在語氣、斷句等方面有非常好的表現,所以很值得將這個語音合成服務集成到我的AI二次元項目工具包里,為水友們提供更多的選擇。

2.API接口說明

? ? ? ?1)語音合成模型

????????根據官方文檔的說明,open AI的語音合成服務提供了兩種合成質量的模型

? ? ? ? 可選模型包括:tts-1以及tts-1-hd兩種,其中tts-1-hd的模型,合成出來的聲音質量更高,但是需要注意的是,hd模型的價格會更高,

? ? ? ?2)聲音選擇

????????在可選聲音方面,官方提供了六種可選的聲音,在調用語音合成API時,在發送的報文中設置選擇的聲音即可。

? ? ? ? 3)API報文格式

? ? ? ? 根據官方提供的示例,可知道語音合成的api地址及為:

? ? ?https://api.openai.com/v1/audio/speechicon-default.png?t=N7T8https://api.openai.com/v1/audio/speech? ? ? ? 報文結構中,需要發送帶有model、input以及voice為關鍵字的json字符串。

curl https://api.openai.com/v1/audio/speech \-H "Authorization: Bearer $OPENAI_API_KEY" \-H "Content-Type: application/json" \-d '{"model": "tts-1","input": "Today is a wonderful day to build something people love!","voice": "alloy"}' \--output speech.mp3

3.示例代碼

? ? ? ? unity端調用open AI的語音合成api的示例代碼如下:

     [SerializeField] private string api_key=string.Empty;//apikey[SerializeField] private ModelType m_ModelType = ModelType.tts_1;//模型[SerializeField] private VoiceType m_Voice = VoiceType.onyx;//聲音[SerializeField] private string m_PostURL = string.Empty; private void Awake(){m_PostURL = "https://api.openai.com/v1/audio/speech";}private IEnumerator GetVoice(string _msg, Action<AudioClip, string> _callback){using (UnityWebRequest request = UnityWebRequest.Post(m_PostURL, new WWWForm())){PostData _postData = new PostData{model = m_ModelType.ToString().Replace('_','-'),input = _msg,voice= m_Voice.ToString()};string _jsonText = JsonUtility.ToJson(_postData).Trim();byte[] data = System.Text.Encoding.UTF8.GetBytes(_jsonText);request.uploadHandler = (UploadHandler)new UploadHandlerRaw(data);request.downloadHandler = new DownloadHandlerAudioClip(m_PostURL, AudioType.MPEG);request.SetRequestHeader("Content-Type", "application/json");request.SetRequestHeader("Authorization", string.Format("Bearer {0}", api_key));yield return request.SendWebRequest();if (request.responseCode == 200){AudioClip audioClip = ((DownloadHandlerAudioClip)request.downloadHandler).audioClip;_callback(audioClip, _msg);}else{Debug.LogError("語音合成失敗: " + request.error);}}}#region 數據定義/// <summary>/// 發送的報文/// </summary>[Serializable]public class PostData{public string model = string.Empty;//模型名稱public string input = string.Empty;//文本內容public string voice = string.Empty;//聲音}/// <summary>/// 模型類型/// </summary>public enum ModelType{tts_1,tts_1_hd}/// <summary>/// 聲音類型/// </summary>public enum VoiceType{alloy,echo,fable,onyx,nova,shimmer}#endregion

4. Unity端數字人配置

? ? ? ? 項目的源碼已經發布到Github了,我們可以直接下載,并導入到unity中使用,要求unity版本在2020.3.44及以上。導入工具包之后,可以在Scene文件夾下,找到示例場景,在場景中找到TTS->openAI對象,該對象上就維護了openAI提供的語音合成服務的代碼。

? ? ? ? 使用這個模塊,首先我們需要注冊一個openAI賬號,并創建一個api key,將apikey填寫到腳本對應的apikey屬性上。然后將TTS腳本配置到chatAgent腳本上即可。

? ? ? ? 詳細配置,可以到我的B站主頁,查看本期視頻的配置過程。

5.結束語??

? ? ? ? 這次的文章簡單介紹了如何使用open AI官方提供的語音合成服務api,實現高質量的語音合成功能,讓我們的數字人具備情感豐富,語氣逼真的語音效果。文章所涉及的項目配置過程,可以到B站查看詳細配置過程。

[Unity+openAI TTS] chatgpt海王暖男,分分鐘搞定,使用openAI官方語音合成服務,打造火熱暖心數字人


項目地址傳送門:

AI二次元老婆開源項目(unity-AI-Chat-Toolkit):

Github地址:https://github.com/zhangliwei7758/unity-AI-Chat-Toolkit

Gitee地址:https://gitee.com/DammonSpace/unity-ai-chat-toolkit

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/161851.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/161851.shtml
英文地址,請注明出處:http://en.pswp.cn/news/161851.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

深度合成算法的基礎與原理

深度合成算法是人工智能領域中備受矚目的研究方向之一。它的應用范圍涵蓋了圖像合成、文本生成、音頻合成等多個領域&#xff0c;為人們提供了令人驚嘆的創新和娛樂體驗。本文將深入探討深度合成算法的基礎原理&#xff0c;了解它們是如何工作的以及它們在不同領域的應用。算法…

輕量封裝WebGPU渲染系統示例<38>- 動態構建WGSL材質Shader(源碼)

實現原理: 基于宏定義和WGSL功能文件實現 當前示例源碼github地址: https://github.com/vilyLei/voxwebgpu/blob/feature/rendering/src/voxgpu/sample/DynamicShaderBuilding.ts 當前示例運行效果: 此示例基于此渲染系統實現&#xff0c;當前示例TypeScript源碼如下&#x…

編寫bat程序 快速開啟 redis 服務

一鍵開啟redis服務 編寫txt文件&#xff0c;代碼如下&#xff1a;cd /d E:\Redis\Redis-x64-5.0.14.1 redis-server.exe redis.windows.conf這里的redis的安裝目錄記得改成自己的 將文件后綴的.txt改成.bat&#xff0c;然后雙擊運行就可以啦

前綴和及差分數組

前綴和 原數組x0x1x2x3x4x5前綴和數組x0x0x1x0x1x2x0x1x2x3x0x1x2x3x4x0x1x2x3x4x5前綴和數組代數形式x0’x1’x2’x3’x4’x5’ 計算原數組某區間的和 sum[x1,x2,x3] 利用前綴和計算 x3-x0 x0x1x2x3-x0 x1x2x3 差分數組 x0x1x2x3x4x5原數組x0x1x2x3x4x5差分數組x0x1-x0x…

模擬電路定理

模擬電路是指由電子元件、電路拓撲和信號處理單元等構成的電路&#xff0c;用于模擬現實世界中的信號和系統。在模擬電路中&#xff0c;有許多重要的定理和規律&#xff0c;下面列舉了一些常見的定理。 1. 基爾霍夫電流定律&#xff08;Kirchhoffs Current Law&#xff09; 基…

HTTP四大參數類型及請求參數的方式和如何接收

HTTP 請求中4大參數類型和接收方法。 1、請求頭參數head 請求頭參數顧名思義&#xff0c;是存放在請求頭中發送給服務器的參數&#xff0c;服務器通過解析請求頭獲取參數內容。通常會存放本次請求的基本設置&#xff0c;以幫助服務器理解并解析本次請求的body體。 參數形式如…

C++學習 --string

目錄 1&#xff0c; 什么是string 2&#xff0c; 創建string 3&#xff0c; 操作string 3-1&#xff0c; 賦值 3-1-1&#xff0c; 賦值() 3-1-1&#xff0c; 賦值(assign) 3-2&#xff0c; 修改 3-2-1&#xff0c; 拼接 3-2-1-1&#xff0c; 拼接() 3-2-1-2&#xff…

srs的webrtc信令分析

關于webrtc的流信令只有四個 /rtc/v1/publish/&#xff0c;這是推流接口&#xff0c;是推流客戶端跟SRS交換SDP的接口 /rtc/v1/play/&#xff0c;這是拉流接口&#xff0c;是拉流客戶端跟SRS交換SDP的接口 /rtc/v1/whip/&#xff0c;這也是推流接口&#xff0c;作用是也是交換…

C#開發的OpenRA游戲之屬性RenderSprites(8)

C#開發的OpenRA游戲之屬性RenderSprites(8) 本文開始學習RenderSprites屬性,這個屬性是跟渲染有關的,因此它就攝及顏色相關的內容,所以我們先來學習一下調色板,這是舊游戲的圖片文件保存的格式,如果放在現代來看,不會再采用這種方法,畢竟現在存儲空間變大,便宜了,并…

JDBC 操作 SQL Server 時如何傳入列表參數

本文是作為將要對 PostgreSQL 的 in, any() 操作的一個鋪墊&#xff0c;也是對先前用 JDBC 操作 SQL Server 的溫習。以此記錄一下用 JDBC 查詢 SQL Server 時如何傳遞一個列表參數。比如想像一下查詢語句 select * from users where id in (?) 我們是否能給這里的問題參數傳遞…

idea編譯問題導致接口調用不通

問題背景&#xff1a; 1.idea版本2021&#xff0c;springboot&#xff0c;父子maven項目&#xff0c;創建了一個新的model。啟動之后&#xff0c;調試controller接口&#xff0c;接口一直報404。 問題分析&#xff1a; 1.查看編譯后的文件&#xff0c;發現java代碼一直沒編譯…

Vue3使用dataV報錯問題解決

DataV官網&#xff1a;https://datav-vue3.jiaminghi.com/guide/ vue2中是沒有問題的&#xff0c;這是第一次在vue3中使用發現的報錯問題 報錯問題 首先安裝&#xff1a; pnpm add dataview/datav-vue3 1. 全局注冊報錯 然后main.ts全局注冊 import { createApp } f…

html網站-關于發展歷程的案例

一、案例一 1.效果圖&#xff1a; 2.代碼&#xff1a; 所用到的文件自行在官網下載&#xff0c;也可在git上拉取。 <!DOCTYPE html> <html><head><meta http-equiv"Content-Type" content"text/html; charsetutf-8" /><meta…

USB驅動開發基礎

USB標準 USB1.0&#xff0c; 1996&#xff0c;低速1.5Mbps和高速12Mbps&#xff0c;USB1.1 iMac G3&#xff0c;Type A和Type B接口USB 2.0 2000&#xff0c; 480Mpbs&#xff0c;Type A/B/C接口、Micro A/BUSB 3.0 5Gbps, 隨著USB 3.2命名規定&#xff0c;現在也叫USB 3.2 Ge…

Nginx模塊開發之http過濾器filter

文章目錄 什么是過濾模塊Nginx相關數據結構介紹ngx_module_t的數據結構ngx_http_module_t數據結構ngx_command_s數據結構 相關宏定義filter&#xff08;過濾器&#xff09;實現Nginx模塊開發流程Nginx 模塊執行具體實現流程create_loc_confmerge_loc_confpostconfiguration修改…

使用OkHttp庫爬取百度云視頻詳細步驟

目錄 摘要 一、OkHttp庫簡介 二、爬蟲基本概念 三、使用OkHttp庫爬取百度云視頻 1、發送HTTP請求 2、處理響應 3、下載文件 四、可能遇到的問題及解決方案 五、注意事項 總結與建議 摘要 本文將詳細介紹如何使用OkHttp庫爬取百度云視頻。文章首先簡要介紹OkHttp庫和…

【collections】Python中的OrderDict

【collections】Python中的OrderDict 文章目錄 【collections】Python中的OrderDict1. 什么是OrderedDict2. Toy Code 1. 什么是OrderedDict 其實很簡單OrderedDict是Python中一個字典dict的變體&#xff0c;它可以按照元素添加的順序來保持鍵值對&#xff08;key-value pair&…

GPIO模式詳解:推挽/開漏/浮空/上拉/下拉/施密特(遲滯)輸入

GPIO(General Purpose Input Output)可用于執行數字輸入或輸出功能。典型的應用包括從/向模擬或數字傳感器/設備讀寫數值、驅動LED、為I2C通信驅動時鐘、生成外部組件的觸發、發出中斷等。 文章目錄 1 GPIO簡介2 輸出模式2.1 推挽輸出2.2 開漏輸出 3 輸入模式3.1 高阻態(浮空)、…

推薦一款適合做智慧旅游的前端模板

目錄 前言 一、功能介紹 二、前端技術介紹 三、功能及界面設計介紹 1、數據概覽 2、車輛監控 3、地圖界面 4、其它功能 四、擴展說明 總結 前言 智慧旅游是一種全新的旅游業務模式&#xff0c;它充分利用先進的信息技術&#xff0c;提升旅游體驗&#xff0c;優化旅游管…

【Axure高保真原型】樹形表格

今天和大家分享樹形表格的原型模板&#xff0c;點擊樹的箭頭可以打開或者收起子節點&#xff0c;點擊表格內容&#xff0c;可以選中該行內容實現高亮變色效果&#xff0c;樹形表格是通過中繼器制作的&#xff0c;使用簡單&#xff0c;只需要按要求填寫中繼器表格即可&#xff0…