Unity數字人開發筆記

開源工程地址:https://github.com/zhangliwei7758/unity-AI-Chat-Toolkit

在這里插入圖片描述

  • 先致敬zhangliwei7758,開放這個源碼

一、建立工程

  • 建立Unity工程(UnityAiChat)
  • 拖入Unity-AI-Chat-Toolkit.unitypackage
  • 打開chatSample工程,可以另存一個,方便改動
    在這里插入圖片描述

二、工程說明
在這里插入圖片描述

  • Quad:背景
  • 胡桃:人物模型
  • Canvas-Chat:UI
  • ChatAgent:數字人代理配置
  • LLM:大模型,這里集成了deepseek,訊飛等,
  • TTS/STT:文字轉語音/語音轉文字,集成了訊飛
  • Audiosouse:語音模塊

三、LLM大模型說明

  • chatgpt:
    集成了chatgpt 3.5/4 的api接口,使用這個腳本,需要在腳本參數里填寫openai的api key, 默認設置的模型是chatgpt-3.5,如果要替換chatgpt4,需要自行修改模型名稱;

  • chatglm:
    集成了對chatglm官方示例的api接口,如果使用chatglm官方的倉庫部署的api服務,就可以直接使用,需要配置的內容是,配置部署好的api地址即可;
    智譜清言:https://chatglm.cn/main/alltoolsdetail?lang=zh

  • rwkv:
    集成了針對rwkv runner開源項目的api接口,因為rwkv runner這個項目的api格式和chatgpt是一樣的,如果下載rwkv runner這個項目使用的話,可以使用工具提供的腳本,只需要在api地址參數配置實際的地址就可以了。
    https://rwkv.cn/

  • 星火大模型 chatSpark:
    集成了科大訊飛的星火大模型的api對接功能,可根據需求自行配置V1.5/V2.0版本

  • 百度智能云千帆大模型平臺:
    集成了百度智能云千帆大模型平臺模型api服務,包括文心一言等十種模型

  • 智譜AI開放平臺:
    集成了智譜AI開放平臺下,chatGLM Turbo模型的api支持

  • Ollama工具:
    集成對Ollama部署的本地大模型的API調用支持,可以利用chatOllama模塊驅動AI小姐姐聊天

  • DeepSeek:
    集成對DeepSeek的API調用支持

另外還有dify知識庫大模型平臺


四、TTS/STT: 語音合成 / 語音識別

  • 微軟Azure語音合成以及語音識別服務:
    如果使用這個服務,需要準備微軟Azure的語音服務令牌,自行注冊賬號,開通服務獲得;

  • 百度AI的語音合成以及語音識別服務:
    使用這個服務時,注冊百度AI開放平臺的賬號,開通語音合成、語音識別服務,創建應用獲取到相關的密鑰,填入相應腳本即可。

  • OpenAI平臺提供的在線Whisper語音識別服務:
    集成了openAI平臺的Whisper在線語音識別api,需要使用openai的api key 集成了openAI平臺的TTS語音合成api,可實現語音合成功能

  • 提供針對開源的Whisper模型的api集成:
    集成的項目是github上開源項目:https://github.com/ahmetoner/whisper-asr-webservice 部署這個項目,可使用本模塊來調用語音識別的api

  • 提供針對科大訊飛語音服務的api集成:
    實現了對科大訊飛語音服務的api集成,采用了websocket方式,可使用科大訊飛的語音識別以及語音合成服務

  • GPT-SoVITS
    實現高質量的 文本到語音(TTS) 和 語音克隆(Voice Cloning)
    GPT-SoVITS Gradio,是基于 Gradio 開發的交互式 Web 界面,方便用戶通過瀏覽器直接使用 GPT-SoVITS 的語音合成功能,無需編寫代碼。
    GPT-SoVITS FastAPI,FastAPI 是一個高性能 Python Web 框架,適合構建 RESTful API,是將模型封裝為 API 服務的后端方案,供開發者集成到其他應用或系統中。


五、使用訊飛+deepseek,實現數字人

  • deepseek:https://platform.deepseek.com/
    一定要充10元哦
  • deepseek API:https://api-docs.deepseek.com/zh-cn/
  • 接口:https://api.deepseek.com/chat/completions
  • Unity里ChatAgent里選擇chatDeepSeek
    在這里插入圖片描述
  • chatDeepSeek的api_key:
    在這里插入圖片描述
  • System Setting:可以設置人設,比如講解員
  • Prompt:AI提示詞
  • Unity里ChatAgent里選擇xunfei作為語音識別
    在這里插入圖片描述
  • 填寫訊飛的key
    在這里插入圖片描述

注意,這里只需要填寫紅框的部分;訊飛的api的順序是先api_secret,和這里順序相反,不要填錯了

  • ChatSample需要勾選Is Vocie Mode
    在這里插入圖片描述

注意:這樣選擇后,能說話了,但是有長度報錯,可能原因是目前deepseek是流式的,但是語音是等文字回復完成后,一次生成的

  • 我們改動chatgpt-3.5-turbo,作為deepseek的接口來使用,避免這個問題
    在這里插入圖片描述
  • 設置下ChatSample
    在這里插入圖片描述

最后注意事項:我們麥克風,盡量用那種單獨的麥克風,如果用攝像頭的,有的時候會認不到

&祝福大家開發順利

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/82626.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/82626.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/82626.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Cherry Studio連接配置MCP服務器

之前寫了一篇關于Cherry Studio的文章,不了解的可以先看一下 AI工具——Cherry Studio,搭建滿血DeepSeek R1的AI對話客戶端【硅基流動DeepSeek API】-CSDN博客 最近Cherry Studio更新了一個新功能:MCP服務器 在 v1.2.9 版本中,…

OpenSSH 服務配置與會話保活完全指南

一、/etc/ssh/sshd_config 配置機制 1. 配置文件基礎 文件作用 OpenSSH 服務器 (sshd) 的主配置文件,控制連接、認證、端口轉發等行為。 加載與生效 修改后需重啟服務:sudo systemctl restart sshd # Systemd 系統 sudo service ssh restart # S…

阿里云國際版注冊郵箱格式詳解

“為什么我的阿里云國際版注冊總提示郵箱無效?” 這是許多初次接觸阿里云國際版(Alibaba Cloud International)的用戶常遇到的困惑。隨著全球化進程加速,越來越多的企業選擇阿里云國際版部署海外業務,而注冊環節中郵箱…

【IDEA問題】springboot本地啟動應用報錯:程序包不存在;找不到符號

問題: springboot本地啟動應用報錯: 程序包xxx不存在;找不到符號 解決方案: 1.確保用maven重新導入依賴 2.刪除.idea文件夾 3.invalidate caches里,把能選擇的都勾選上,然后清除緩存重啟 4.再在上方工具欄…

FFmpeg 時間戳回繞處理:保障流媒體時間連續性的核心機制

FFmpeg 時間戳回繞處理:保障流媒體時間連續性的核心機制 一、回繞處理函數 /** * Wrap a given time stamp, if there is an indication for an overflow * * param st stream // 傳入一個指向AVStream結構體的指針,代表流信息 * pa…

【b站計算機拓荒者】【2025】微信小程序開發教程 - chapter3 項目實踐 -1 項目功能描述

1 項目功能描述 # 智慧社區-小程序-1 歡迎頁-加載后端:動態變化-2 首頁-輪播圖:動態-公共欄:動態-信息采集,社區活動,人臉檢測,語音識別,心率檢測,積分商城-3 信息采集頁面-采集人數…

5.27 day 30

知識點回顧: 導入官方庫的三種手段導入自定義庫/模塊的方式導入庫/模塊的核心邏輯:找到根目錄(python解釋器的目錄和終端的目錄不一致) 作業:自己新建幾個不同路徑文件嘗試下如何導入 一、導入官方庫 我們復盤下學習py…

【GitHub Pages】部署指南

vue項目 編輯你的 vite.config.ts 文件,加上 base 路徑,設置為你的 GitHub 倉庫名 import { defineConfig } from vite import vue from vitejs/plugin-vue// 假設你的倉庫是 https://github.com/your-username/my-vue-app export default defineConfi…

遠程控制技術全面解析:找到適合你的最佳方案

背景:遠程控制為何成為企業核心需求? 隨著企業數字化轉型的推進,遠程控制技術已成為異地辦公和運維的關鍵工具。無論是跨國企業需要高效管理全球設備,還是中小型企業追求經濟高效的解決方案,選擇合適的遠程控制技術&a…

觸覺智能RK3506星閃開發板規格書 型號IDO-EVB3506-V1

產品概述 觸覺智能RK3506星閃開發板,型號IDO-EVB3506-V1采用 Rockchip RK3506(三核 Cortex-A7單核Cortex-M0, 主頻最高1.5GHz)設計的評估開發板,專為家電顯控、顯示HMI、手持終端、工業IOT網關、工業控制、PLC等領域而設計。內置…

九級融智臺階與五大要素協同的量子化解析

九級融智臺階與五大要素協同的量子化解析 摘要:本文構建了一個量子力學框架下的九級融智模型,將企業創新過程映射為量子能級躍遷。研究發現五大要素協同態決定系統躍遷概率(P∣?Ψ_m∣H_協同∣Ψ_n?∣^2),當要素協同…

Kotlin學習34-data數據類1

定義如下:與普通類對比學習 //普通類 class NormalClass(val name: String, val age: Int, val sex: Char) //數據類 data class DataClass(val name: String, val age: Int, val sex: Char)對應找到java反編譯的代碼路徑:Tool-->Kotlin-->Show K…

博圖SCL基礎知識-表達式及賦值運算

S7-1200 從 V2.2 版本開始支持 SCL 語言。 語言元素 SCL 除了包含 PLC 的典型元素(例如,輸入、輸出、定時器或存儲器位)外,還包含高級編程語言表達式、賦值運算和運算符。 程序控制語句 SCL 提供了簡便的指令進行程序控制。例…

海思3519V200ARM Linux 下移植 Qt5.8.0

一、移植背景及意義 海思3519V200是一款基于ARM架構的嵌入式芯片,廣泛應用于智能安防、工業控制等領域。在這些應用場景中,對設備的圖形用戶界面(GUI)有著越來越高的要求。Qt5.8.0作為一個功能強大、跨平臺的GUI開發框架,能夠幫助開發者快速開發出美觀、高效的用戶界面。…

msql的樂觀鎖和冪等性問題解決方案

目錄 1、介紹 2、樂觀鎖 2.1、核心思想 2.2、實現方式 1. 使用 version 字段(推薦) 2. 使用 timestamp 字段 2.3、如何處理沖突 2.4、樂觀鎖局限性 3、冪等性 3.1、什么是冪等性 3.2、樂觀鎖與冪等性的關系 1. 樂觀鎖如何輔助冪等性&#xf…

成都鼎訊--通信信號模擬設備?

在現代電磁通信領域,精準模擬復雜多變的信號環境,是提升通信裝備性能與人員作戰能力的核心命題。成都鼎訊以技術創新為驅動,憑借深厚的研發實力,重磅推出通信信號模擬設備,以前所未有的強大功能與卓越性能,…

C# Windows Forms應用程序-003

目錄 項目結構 命名空間和類定義 主要控件 GroupBox 控件 Label 控件 TextBox 控件 Button 控件 OpenFileDialog 控件 方法說明 構造函數 Form1() Dispose(bool disposing) Main() InitializeComponent() button1_Click(object sender, System.EventArgs e) but…

【C/C++】死鎖的四大條件與預防策略詳解

文章目錄 死鎖的四大條件與預防策略詳解一、死鎖的產生條件(四個必要條件)二、代碼示例三、死鎖的預防手段(以 C/C 為例)1. 破壞“循環等待” —— 統一加鎖順序(推薦)2. 使用 std::lock 一次性加多個鎖3. …

Rust編程環境安裝

文章目錄 Rust編程環境安裝一、安裝準備二、安裝步驟對于Linux/macOS用戶對于Windows用戶 三、驗證安裝四、環境配置檢查五、工具鏈管理六、附加功能七、常見問題處理八、編輯器支持九、其他 Rust編程環境安裝 一、安裝準備 1. 支持系統:Windows/Linux/macOS 2. 所…

OpenHarmony平臺驅動使用(五),HDMI

OpenHarmony平臺驅動使用(五) HDMI 概述 功能簡介 HDMI(High Definition Multimedia Interface),即高清多媒體接口,主要用于DVD、機頂盒等音視頻Source到TV、顯示器等Sink設備的傳輸。 HDMI以主從方式工…