接上例第一步,還是dh_live項目,增加了一個完整的實時對話樣例,包含vad-asr-llm-tts-數字人全流程,以彌補之前的只有固定的問答的不足。
VAD(Voice Activity Detection,語音活動檢測)VAD用于檢測用戶是否正在說話,從而觸發后續的語音處理流程。
ASR(Automatic Speech Recognition,自動語音識別)負責將用戶的語音輸入轉換為文本
LLM(Large Language Model,大語言模型)
接上例第一步,還是dh_live項目,增加了一個完整的實時對話樣例,包含vad-asr-llm-tts-數字人全流程,以彌補之前的只有固定的問答的不足。
VAD(Voice Activity Detection,語音活動檢測)VAD用于檢測用戶是否正在說話,從而觸發后續的語音處理流程。
ASR(Automatic Speech Recognition,自動語音識別)負責將用戶的語音輸入轉換為文本
LLM(Large Language Model,大語言模型)
本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。 如若轉載,請注明出處:http://www.pswp.cn/bicheng/78635.shtml 繁體地址,請注明出處:http://hk.pswp.cn/bicheng/78635.shtml 英文地址,請注明出處:http://en.pswp.cn/bicheng/78635.shtml
如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!