人機交互(Human-Computer Interaction,HCI),是指關于設計、評價和實現供人們使用的交互式計算機系統,并圍繞相關的主要現象進行研究。
狹義的講,人機交互技術主要是研究人與計算機之間的信息交換,它主要包括人到計算機和計算機到人的信息交換兩部分。
人機交互可以歸結為為以下三個詞:
人:了解人
機器:了解機器
互動:使得它們有效地合作
人機交互產品涉及內容
人機交互的產品開發內容涵蓋了建模、設計、評估等理論和方法,以及在Web、移動計算、虛擬現實等方面的應用研究,主要包括以下內容:
1、人機交互界面表示模型與設計方法
一個交互界面的優劣,直接影響到軟件開發的成敗。友好的人機交互界面的開發離不開好的交互模型與設計方法。因此,研究人機交互界面的表示模型與設計方法是人機交互的重要研究內容之一。
2、可用性分析與評估
可用性是人機交互系統的重要內容,它關系到人機交互能否達到用戶期待的目標,以及實現這一目標的效率與便捷性。對人機交互系統的可用性分析與評估的研究主要涉及到支持可用性的設計原則和可用性的評估方法等。
3、多通道交互技術
研究視覺、聽覺、觸覺和力覺等多通道信息的融合理論和方法,使用戶可以使用語音、手勢、眼神、表情等自然的交互方式與計算機系統進行通信。多通道交互主要研究多通道交互界面的表示模型、多通道交互界面的評估方法以及多通道信息的融合等。其中,多通道融合是多通道用戶界面研究的重點和難點。
4、認知與智能用戶界面
智能用戶界面(Intelligent User Interface,IUI)的最終目標是使人機交互和人-人交互一樣自然、方便。上下文感知、三維輸入、語音識別、手寫識別、自然語言理解等都是認知與智能用戶界面解決的重要問題。
5、群件
群件是指為群組協同工作提供計算機支持的協作環境,主要涉及個人或群組間的信息傳遞、群組內的信息共享、業務過程自動化與協調以及人和過程之間的交互活動等。目前,與人機交互技術相關的研究內容主要包括群件系統的體系結構、計算機支持的交流與共享信息的方式、交流中的決策支持工具、應用程序共享以及同步實現方法等內容。
6、Web設計
重點研究Web界面的信息交互模型和結構,Web界面設計的基本思想和原則,Web界面設計的工具和技術,以及Web界面設計的可用性分析與評估方法等內容。
7、移動界面設計
移動計算(Mobile Computing)、普適計算(Ubiquitous Computing)等技術對人機交互技術提出了更高的要求,面向移動應用的界面設計已成為人機交互技術研究的一個重要內容。由于移動設備的便攜性、位置不固定性、計算能力有限性以及無線網絡的低帶寬高延遲等諸多的限制,移動界面的設計方法、移動界面可用性與評估原則、移動界面導航技術以及移動界面的實現技術和開發工具,都是當前人機交互技術研究的熱點之一。
人機交互過程中用戶感知方式
1.視覺
視覺是人與周圍世界發生聯系的最重要的感覺通道。視覺感知可以分為兩個階段:
-
受到外部刺激接收信息階段
-
解釋信息階段
一方面,眼睛和視覺系統的物理特性決定了人類無法看到某些事物;另一方面,視覺系統進行解釋處理信息時可對不完全信息發揮一定的想象力。進行人機交互設計需要清楚這兩個階段及其影響,了解人類真正能夠看到的信息。
2.聽覺
聽覺感知傳遞的信息僅次于視覺,其感知過程亦為接受刺激,把它的特性轉化為神經興奮,并對信息進行加工,然后傳遞到大腦。
聲音的解釋是與語言的理解聯系在一起的,它們都是在大腦的聽覺皮層中完成的。聽覺系統就像視覺系統一樣,可以利用以前的經驗來解釋輸入。另外,由于口語充滿著發錯音的單詞、不完整的句子,而且一般說的很快,所以聽覺系統的解釋機制必須跟得上輸入。
3.觸覺
觸覺的感知機理與視覺和聽覺的最大不同在于它的非局部性,人們通過皮膚感知觸覺的刺激,人的全身布滿了各種觸覺感受器,用來感受冷熱,疼痛和壓力。觸覺感知的另一個方面是動覺(kinaesthesia),即對人的軀干和四肢的位置的感覺。
人機交互系統需求
人機交互設計的最重要的因素是它的配置。任何給定的接口通常是由它提供的輸入和輸出的數量和多樣性定義的。人機交互系統的體系結構顯示這些輸入和輸出是什么,以及他們如何一起工作。
基于不同配置和設計的接口包括:
1.單峰人機交互系統
正如前面提到的,一個接口主要依靠它輸入和輸出設備的數量和多樣性,這種渠道讓用戶可以通過此接口與計算機進行交互。每一個不同的獨立的單通道稱為方式。一個系統,是基于只有一個形態叫做單峰。
基于不同形式的性質,可以分為三個類別:
-
基于視覺
-
基于音頻
-
基于傳感器
基于視覺的人機交互
基于視覺的人機交互研究可能是該領域中最普遍的。考慮應用程序的范圍和各種開放問題和方法,研究人員試圖解決可視為視覺信號的人的不同方面的反應。主要研究領域包括:
-
面部表情分析
-
身體運動跟蹤(大型)
-
手勢識別
-
凝視檢測(眼動跟蹤)
由于應用的不同每個地區目標也不同,但是每個區域的普遍觀念是大體一致的。
面部表情分析一般是處理視覺情緒認知。這個領域的研究焦點是人體運動跟蹤和手勢識別,這個領域可以有不同的研究目的但他們大多是用于直接命令中人與計算機的互動。
目光檢測則主要是以間接形式的使用戶與機器間進行互動,更好地理解用戶的注意力,意圖或敏感的情況。一個例外是幫助殘疾的眼跟蹤系統,它主要作用在命令和動作場景,如指針運動,閃爍,點擊。
值得注意的是,一些研究人員試圖協助甚至取代其他類型的相互作用(音頻,傳感器為主)與視覺方法。例如,唇讀或唇運動跟蹤是已知的用于語音識別的糾錯的一個有效的幫助。
基于音頻的人機交互
基于音頻的計算機和人之間的交互是人機交互系統的另一個重要領域。這個領域處理不同的音頻信號獲得的信息。
雖然音頻信號的性質可能不可以作為視覺信號,但從音頻信號收集到的信息可以更值得信賴,更有用,在某些情況下,成為獨特的信息提供者。音頻人機交互的組成部分包括:
-
語音識別
-
說話人識別
-
聽覺情感分析
-
人為噪聲/登錄檢測(喘氣,感嘆,笑,哭,等)
-
音樂互動
語音識別和說話人識別的研究一直是主要的焦點。最近的努力是在人機交互分析領域整合人類情感。
相比其他的音調和音高的語音數據,典型的人類聽覺的跡象,如嘆息,驚呼等幫助的情感分析,設計更智能化的人機交互系統。
音樂的生成和互動是一個人機互動藝術領域非常新的應用,它主要集中在音頻和視覺研究中。
基于傳感器的人機交互
基于傳感器的人機交互在各個領域的廣泛應用。這些不同領域的共性是在人機交互中至少有一個物理傳感器。這些傳感器可以非常原始或非常復雜。
-
筆式交互
-
鼠標和鍵盤
-
操縱桿
-
運動跟蹤傳感器和數字轉換器
-
觸覺傳感器
-
壓力傳感器
-
味道/氣味傳感器。
這些傳感器已經存在了一段時間,也有一些非常新的技術。
筆式傳感器主要在移動設備領域,并且涉及到筆勢和手寫識別領域。鍵盤、鼠標和操縱桿應用更加廣泛。運動跟蹤傳感器/數字轉換器是的最先進的技術,它徹底改變了電影、動畫、藝術和游戲產業。
觸覺和壓力傳感器應用在機器人和虛擬現實領域。新的機器人包括數以百計的觸覺傳感器,使機器人敏感和有觸摸能力,這些類型的傳感器還用于醫療手術應用
2.多通道人機交互系統
多通道人機交互系統是指的多通道組合多個形式。在MMHCI系統,系統響應輸入,即溝通渠道。這些渠道的定義是繼承自人類類型的通信,基本上是他的感官:視覺、聽覺、觸覺、嗅覺和味覺。
用機器進行交互包括但不限于這些類型。因此,通過兩個或者兩個以上是輸入模式而不是傳統的鍵盤和鼠標設備,這些輸入設備的類型和工作模式可能相差很大,多通道界面將整合不同組合的語音、手勢、目光、面部表情和其他非傳統模式的輸入。
最普遍的一種支持的輸入組合方法是手勢和語音。現在的多通道人機交互統含單個交互的方式,相關性的組合,而且大多數現有的多通道系統區分對待,只在最后將不同的方式結合在一起。
例如,嘴唇運動跟蹤(視覺基礎)可以幫助語音識別方法(音頻基礎),語音識別方法(音頻基礎)可以幫助命令采集在手勢識別(視覺的基礎)。