2024 高通邊緣智能創新應用大賽聚焦不同細分領域的邊緣智能創新應用落地,共設立三大熱門領域賽道——工業智能質檢賽道、智能邊緣計算賽道和智能機器人賽道。本文為智能邊緣計算賽道冠軍項目《端側大模型智能翻譯機》的開發思路與成果分享。
賽題要求
聚焦邊緣智能、邊緣推理、邊緣數據處理等關鍵技術,參賽者可選擇智能攝像頭、智慧零售、智慧城市、輔助駕駛、智慧座艙、邊端大模型應用等行業進行項目落地。
作品簡介
端側大模型翻譯機基于搭載阿加犀邊緣智能工具鏈的高通開發板,實現了支持多語種的離線語音識別和翻譯,提升用戶體驗和隱私保護水平。
憑借大模型積累的行業翻譯數據與專家知識,能更好地將專業術語和復雜名詞準確表達,提升了翻譯效率,更好地滿足不同語言用戶的需求,進一步擴大了應用場景。
項目驅動力
?技術推動:深度學習和神經網絡等先進技術的應用不斷演進,為語音識別和翻譯等功能的性能提升提供了巨大空間,加之端側模型部署與優化技術的不斷發展,使得離線語音識別應用能夠實現更高的準確率和響應速度。
?平臺支持:芯片的運算能力也在不斷提升,特別是類似高通QCS6490平臺這樣的高性能、低功耗芯片,為離線語音識別技術的發展提供了強大支持,為離線翻譯領域帶來了新的發展機遇。
?市場需求:目前行業的不管是耳機還是手持形態產品,識別和翻譯的服務應用依然是云端為主,這天然就受到網絡等其他因素的影響,參賽團隊希望利用內部掌握的技術將模型和推斷進行優化,實現純離線應用,不僅可以避免網絡的影響,也能保護用戶的隱私,為用戶提供更加安全、高效的語音交互體驗。
項目優勢
?平臺優化:基于阿加犀邊緣智能工具鏈,在高通QCS6490平臺上進行端側模型的部署與優化,使得系統在低功耗、高性能的環境下運行更加穩定。
?隱私保護:所有語音數據均在本地處理,避免了數據上傳至云端的隱私風險。
?高效交互:由于無需網絡連接,系統響應速度更快,用戶體驗更佳。
?高性能體驗:領先的RNNVAD 人聲識別自動斷句算法,經過智能訓練后只識人聲,在噪音環境下斷句更精準,離線語音識別率平均大于90%,個別語種可以達到在線引擎的性能,翻譯更高效準確。
?多語種支持:支持數十種語言與地區口音的識別和翻譯,滿足不同行業、垂直專業領域等不同場景中的用戶需求。
?多場景應用:適用于跨國家庭、旅行旅居、教育、跨國商務應用、大型國際活動等多種場景中。