市面主要遠場語音交互技術架構

為什么Google Home要采用雙麥方案,而且大部分智能音箱才用環形六麥?事實上,這是由各家不同的技術架構決定的,當前市面上主要存在三種遠場語音交互技術架構。

1、以Google為代表的純云端技術架構
首先就是以Google為代表的純云端技術架構,Google并非不想采用麥克風陣列,因為陣列相比雙麥方案具有了波束形成的功能,自然就擁有了更好的噪聲和去混響能力,當距離較遠或者環境復雜的時候依然能夠保證遠場識別率。但是由于麥克風陣列涉及了前端硬件,這并非Google所擅長,因此Google就希望能通過云端機器學習的方式來達到類似功能。

但是麥克風陣列的陣元較多,產生的數據容量太大,而當前的網絡上傳帶寬嚴重不足,所以只能權衡選擇更少的麥克風。實際上若采用前端方案,大部分場景下單麥克風方案也能達到雙麥方案的性能。當然多一路麥克風信號對于云端算法來說也是很重要的。

2、以科勝訊為代表的純前端技術架構
其次就是以科勝訊為代表的純前端技術架構,雙麥降噪實際上是非常成熟的方案,在智能手機和藍牙耳機上已經廣泛應用,但是直接應用到語音交互則需要大量適配工作。純前端方案的優點就是容易集成到芯片上,缺點就是很難升級以及擴展,這恰好與人工智能不斷迭代的趨勢不太兼容,也是當前這種方案無法流行的主要原因。

3、以Amazon為代表的前端+云端方案
最后就是以Amazon為代表的前端+云端方案,這種方案是把算法分別放置到前端和云端,根據具體場景可以調配優化,更容易優化性能并擴展功能。這種方案考慮了麥克風陣列與喚醒和識別技術一體化的問題,由于喚醒和識別嚴重依賴麥克風陣列的算法處理效果,實際上這三種技術是無法完全分割的,特別是麥克風陣列和喚醒技術更是渾然一體。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/253294.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/253294.shtml
英文地址,請注明出處:http://en.pswp.cn/news/253294.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

iOSPush自動隱藏tabbar

只需要在UITabBarController添加控制器的時候調用YZNav初始化,就可以實現tabbar的自動隱藏了。 直接上github地址:https://github.com/YouZhiZheShiJingCheng/YZNav 轉載于:https://www.cnblogs.com/BK-12345/p/6472815.html

中國智能高清視頻監控未來發展趨勢

瀏覽數: 1228 海康威視:田振華 《中國公共安全》:您認為高清攝像機將朝著哪個方向發展?像素會達到什么標準? 高清攝像機發展趨勢: 一:高清 雖然說現在已經實現高清,但是從顯示效果來看現有的高…

智能音箱 之 功放介紹

基本分類 功率放大器分甲類功放(A 類),乙類(B 類),甲乙類(AB 類)和丁類(D 類); A 類 指在信號的整個周期內,放大器的任何功率輸出…

create_workqueue和create_singlethread_workqueue【轉】

本文轉載自:http://bgutech.blog.163.com/blog/static/18261124320116181119889/ 1. 什么是workqueueLinux中的Workqueue機制就是為了簡化內核線程的創建。通過調用workqueue的接口就能創建內核線程。并且可以根據當前系統CPU的個數創建線程的數量,使得線…

平安城市與智慧城市對接的關鍵要素

平安城市經過前兩個階段(布點、聯網)的大規模建設之后,如今正向系統應用深化,數據深入挖掘利用的方向發展。以視頻監控為基礎單元,一些城市開始嘗試在既有的社會治安管理平臺系統基礎上拓展更多的應用功能,…

vue學習之路.02

2019獨角獸企業重金招聘Python工程師標準>>> 第一個vue項目 1.創建 vue init webpack app01 2.安裝依賴 cd app01 npm install 3.構建 npm run dev 啟動本機的8080端口 或 …

等價表達式

小目標的最后一步。 原題鏈接:https://www.luogu.org/problem/show?pid1054 精力不足,代碼工作可能要放在后幾天。。。 思路已經明確了,我說一下。 這道題的大意是給出若干表達式,問這些表達式的值和初始表達式的值是不是相等。 …

解析電子墨水屏技術(工作原理與LCD的區別)

閱讀電子書早已成為大家生活中一部分,方便輕巧的電子版書籍更便于攜帶,而電子閱讀器也不僅僅局限于電腦、手機等傳統設備,新興的電子書閱讀器漸漸為我們所接受。E-ink電子墨水技術就是現在最著名的產品之一,他的出現讓電子書閱讀器…

27:級數求和

27:級數求和 查看提交統計提問總時間限制: 1000ms內存限制: 65536kB描述已知:Sn 1+1/2+1/3+…+1/n。顯然對于任意一個整數K,當n足夠大的時候,Sn大于K。 現給出…

入門視頻采集與處理(BT656簡介) 轉

凡是做模擬信號采集的,很少不涉及BT.656標準的,因為常見的模擬視頻信號采集芯片都支持輸出BT.656的數字信號,那么,BT.656到底是何種格式呢?本文將主要介紹 標準的 8bit BT656(4:2:2)YCbCr SDTV&…

眼圖(Eye Diagram)與數字信號測試

問題: 什么是眼圖?它用在什么場合?反映了波形的什么信息?NI相應的解決方案是怎樣的? 解答: 眼圖(Eye Diagram)可以顯示出數字信號的傳輸質量,經常用于需要對電子設備、芯片中串行數字信號或者…

BZOJ 1609 [Usaco2008 Feb]Eating Together麻煩的聚餐:LIS LDS (nlogn)

題目鏈接:http://www.lydsy.com/JudgeOnline/problem.php?id1609 題意: 給你一個只由數字"1,2,3"組成的序列a[i],共n個數。 你可以任意更改這些數字,使得序列中每一種數字都“站在一起”,并且單調不減或不增…

Oracle 數據庫字典 sys.obj$ 表中關于type#的解釋

sys.obj$ 表是oracle 數據庫字典表中的對象基礎表,所有對象都在該表中有記錄,其中type#字段表明對象類型,比如有一個表 test ,則該對象在sys.obj$ 中存在一條記錄,name列為test, type#列為2,表示…

Python高級特性:列表生成式

列表生成式即List Comprehensions,是Python內置的非常簡單卻強大的可以用來創建list的生成式。 最常見的例子: 生成list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]可以用list(range(1, 11)):>>> list(range(1, 11)) [1, 2, 3, 4, 5, 6, 7, 8…

2018年智能音箱對比

眾所周知,2014年底,電商巨頭亞馬遜推出智能音箱產品Echo之后,引起市場的強烈反響。隨后、谷歌、微軟、蘋果均開始布局智能音箱市場,國內公司以玲瓏科技打頭陣。2017年國內公司紛紛發布智能音箱,被稱為智能音箱元年。經…

AMD與CMD區別

AMD:異步模塊定義,是一個瀏覽器端模塊化開發的規范,由于不是原生JS支持,使用AMD規范需要用到require.js庫require.js注意解決兩個問題1、多個js文件可能有依賴關系,被依賴的文件需要早于依賴它的文件加載到瀏覽器2、js加載的時候瀏…

[LeetCode] Interleaving String

1. 是一個很明顯的動態規劃題。 2. s3中的每個字符不是s1中的就是s2中的,只要根據它之前的狀態做轉移就可以。 1 class Solution {2 public:3 bool isInterleave(string s1, string s2, string s3) {4 int n s1.size();5 int m s2.size();6 …

Python Urllib庫詳解

Urllib庫詳解 什么是Urllib? Python內置的HTTP請求庫 urllib.request 請求模塊 urllib.error 異常處理模塊 urllib.parse url解析模塊 urllib.robotparser robots.txt解析模塊 相比Python2變化 python2 import urllib2 response urllib2.urlopen(http://www.baidu.com) pytho…