視聽整合:人機互動界面的新方向

2020-12-13 中國社會科學網

近年來，隨著人工智慧的蓬勃發展，機器智能在不斷進步，機器視覺、語音識別、動作控制等領域實現了重大突破，並開始廣泛滲透到金融、客服、醫療、無人駕駛等行業。當前，雖然有許多關於大腦對多模態信號敏感性的研究，但視聽整合視角下人機互動的相關研究相對較少。本文試探索視聽整合新方法，開發人機互動界面的新潛能。

人類智能和人工智慧是智能時代的兩個主要力量，人工智慧是指用機器去實現所有目前必須藉助人類智慧才能實現的任務，本質是基於學習能力和推理能力的不斷進步，模仿人類思考、認知、決策和行動的過程。在實現人工智慧的道路上，人機互動必不可少。人機互動指人與計算機之間使用某種對話語言，以一定的交互方式，為完成確定任務的人與計算機之間的信息交換過程，包括人通過輸入設備給計算機輸入信息、計算機經過運算再通過輸出設備給人提供信息反饋等方面內容。

迄今為止，人機互動界面的發展大致經歷了三個階段：命令行界面（Command-Line Interface，CLI）、圖形用戶界面（Graphical User Interface，GUI）、自然用戶界面（Natural User Interface，NUI）。NUI的出現為人工智慧與用戶體驗帶來了質的進化，未來的發展趨勢傾向於自然交互模式，人機、環境的和諧交互將使它們處於自然融合的狀態。自然的人機互動操作環境，能帶給人們身臨其境的感受。但現有人機互動的模式仍然停留在舊交互模式的階段，無法滿足當前人機互動方式多種多樣的局面。

目前的多模態人機互動以自然用戶界面為主。自然用戶界面主要分為六大類：語音識別、觸控螢幕、手勢識別、眼動追蹤、觸覺和腦機接口。人機互動界面的方式越來越豐富，技術越來越精湛。伴隨著虛擬實境、人工智慧等新技術發展為新一代人機互動平臺，為構建視聽觸覺多模態有機融合的人機互動系統提供了豐富的可能。虛擬實境環境下視聽觸覺多通道人機互動有三個基本特點：首先是沉浸感。具有高逼真度、高沉浸感，可實時控制視聽觸覺多通道激勵信號。其次是交互性。構建及時的人機信息雙向交互機制，實現對大腦狀態的實時觀測與適當幹預。最後是想像性。跨越時間和空間障礙，發揮人類智能無邊的想像力。通過虛擬實境作為新一代人機互動的媒介，多模態交互系統變得愈加豐富。

早期的信息加工系統觀點認為，認知系統加工的信息是抽象的符號，即信息通過各種感覺器官從外界進入認知系統時從模態化的信息轉換成為統一的模態信息。而多模態交互系統，旨在通過使用基於識別的技術，支持對自然發生的人類語言和行為形式的識別。近期的研究表明，人類在表徵外部世界時往往依賴於各自感覺器官的模態化信息。正如多感覺整合（multisensory integration，MSI）所指，個體將來自不同感覺通道（視覺、聽覺、觸覺等）的信息相互作用並整合為統一的、連貫的和有意義的知覺過程。多感覺整合能彌補單通道信息的匱乏及不確定性，有助於人們更迅速而準確地進行認知判斷。例如，冗餘信號效應（redundant signals effect，RSE）相比單通道（視覺或聽覺）刺激，個體對同時呈現的多感覺通道刺激的反應更快速更準確。

在多模態交互過程中，如何將視、聽、觸、嗅等多通道信息完美整合起來，並完成機器與人的自然交互一直是人機互動界面設計的難題。隨著當前人機互動所涉及的模態越來越豐富，各個模態存在相互影響，也存在相互分離，視聽整合理論觀點在人機互動領域的重要性也日益凸顯。

視聽整合（audiovisual integration）是一種典型的多感覺整合過程，在與他人面對面交流時，個體會整合視覺和聽覺信息以更好地進行信息交流。McGurk效應是一種典型的視聽整合現象，指的是特定發音的視覺刺激與特定發音的聽覺刺激同時呈現時，個體可能產生全新感知的現象（例如，「ga」的唇部發音動作和「ba」的聽覺刺激同時呈現，人們可能會感知到另一個全新的音節「da」），這表明視覺信息會對聽覺感知產生影響。研究者們認為，McGurk效應是視聽整合的結果，因此，McGurk效應發生率可以作為視聽整合強弱的指標。

以往有關視聽整合腦機制的研究發現，顳上溝（superior temporal sulcus，STS）在語音和非語音的高階段視聽整合處理中具有重要作用，理解人類在視聽整合過程中大腦的運行機制，更加有利於人機互動設計與發展。尤其是對於殘障人士（如無法操作滑鼠）用戶，結合視聽整合的掃描輸入大大提升了該用戶群體的體驗度與參與度，降低用戶的認知負荷，提升人機互動的真實感、沉浸感。

試想一下在未來的社會中，人類在工作與生活中，只需要一個手勢、一個眼神乃至一個想法就可以實現自己需要的操作。這樣的人與機間的「自然交互」，就像人與人之間的對話一般，而通過按鍵、旋鈕、觸控屏等輸入界面操作的傳統方式，或許將會在未來的自然交互中被淘汰。2017年11月，中國科技部宣布了首批國家新一代智能開放創新平臺名單：依託百度公司建設自動駕駛國家新一代人工智慧開放創新平臺，依託阿里雲公司建設城市大腦國家新一代人工智慧開放創新平臺，依託騰訊公司建設醫療影像國家新一代人工智慧開放創新平臺，依託科大訊飛公司建設智能語音國家新一代人工智慧開放創新平臺。如今，我們已經可以看到非常成熟的以語音交互、面孔識別和動作控制為主的交互方式，科大訊飛的語音單通道識別率甚至已經達到90%。阿里未來酒店中精準的面孔識別技術讓客戶僅憑刷臉就可以享受所有服務，不用再攜帶房卡以及身份證件。

人類所接收的信息中有97%是來自視覺和聽覺的，視覺和聽覺作為人類最主要的感知通道，總是不斷地接受外界複雜環境的刺激輸入。真實世界交互往往是多模態的交互，人和人之間有語言交流、眼神交流，也會有身體姿態的表現，由於這些感覺噪音的存在，我們的大腦會將視聽線索進行整合來避免單通道信息的不確定性。視聽整合中，聽覺通道提供了更好的時間解析度，視覺通道提供了更好的空間解析度，當兩者產生整合時，會提供比聽覺或視覺通道更大的時間和空間解析度。未來的人機互動可立足於此，以更貼近人—人之間自然交互的行為特徵作為用戶界面的設計原則。

（作者單位：西北師範大學心理學院、甘肅省行為與心理健康重點實驗室）

來源：中國社會科學網-中國社會科學報作者：周愛保田喆謝珮

歡迎關注中國社會科學網微信公眾號 cssn_cn，獲取更多學術資訊。

相關焦點

嵌入式人機互動界面研究與實現

通用型嵌入式作業系統主要有Linux、WinCE、Android、VxWorks、QNX等，沒有限定具體的應用方向，應用比較廣泛。　　選擇開發用的作業系統時，應考慮到該作業系統的主要應用方向，IOS、Symbian、PalmOS僅針對消費電子，Android側重於消費電子，Linux、WinCE主要應用於工業領域，VxWorks、QNX在軍工方面多有建樹。
人機互動的內容有哪些_人機互動主要研究什麼

人機互動的內容有哪些　　機交互界面表示模型與設計方法（Model and Methodology）　　一個交互界面的好壞，直接影響到軟體開發的成敗。友好人機互動界面的開發離不開好的交互模型與設計方法。因此，研究人機互動界面的表示模型與設計方法，是人機互動的重要研究內容之一。　　可用性分析與評估（Usability and Evaluation）　　可用性是人機互動系統的重要內容，它關係到人機互動能否達到用戶期待的目標，以及實現這一目標的效率與便捷性。
人機互動簡述,一起來了解人機互動的世界!

一、HCI綜述HCI（WIKI）是一門研究系統和用戶之間交互的學問。系統可以是各種各樣的不同的機器，也可以是計算機化的系統和軟體。人機互動界面通常是指用戶可見的部分。用戶通過人機互動界面與系統交流，並進行操作。通俗的講就是研究各種通過交互系統、交互體驗的學科。Physical的交互界面比如收音機的播放按鍵，virtual的界面比如網站、app界面。
下一場革命性的人機互動方式會是什麼?

今晚這堂課咱們來講一講近幾年大火的人機互動技術，以及未來可能會出現的革命性人機互動新方式。，接下來的內容我們來講下未來可能會出現的人機互動新方式。02 多場景手勢識別和「語音交互」一樣，手勢識別被視為人機互動最重要的發展方向之一。
人機互動新體驗,全新AR界面讓你輕鬆控制畫中物

增強現實（AR）作為新一代人機互動平臺，或許可以幫你實現這一願望。近日，卡爾加裡大學、Adobe 研究中心和科羅拉多大學博爾德分校的研究人員創建了一個增強現實（AR）界面 RealitySketch，該界面可用於繪製交互式圖形和可視化、可響應的草圖。
人機界面設計原則及設計思想

人機界面(HumanComputerInterface，簡稱HCI)也可以稱為用戶界面或使用者界面，它是系統和用戶之間進行交互和信息交換的媒介。利用人機界面可以實現信息的內部形式與人類可以接受形式之間的轉換(伺服控制系統)。在實際生活中，凡參與人機信息交流的領域都存在著人機界面。那麼什麼是人機界面設計呢，人機界面設計原則有哪些呢?
未來已來(一):語音交互,人機互動的新時代

語音交互會是用戶體驗設計的一次重大飛躍。本文會解釋為什麼語音界面會成為用戶體驗設計領域的下一個焦點以及這一趨勢對於用戶體驗設計師來說意味著什麼。一、語音交互背後的驅動力在深入探討語音交互的設計及方向之前，有必要了解是什麼能夠讓這種新型交互方式得以迅速發展。
人機界面HMI的8大知識點匯總

一、HMI簡介　　HMI是HumanMachineInterface的縮寫，「人機接口」，也叫人機界面。人機界面（又稱用戶界面或使用者界面）是系統和用戶之間進行交互和信息交換的媒介，它實現信息的內部形式與人類可以接受形式之間的轉換。凡參與人機信息交流的領域都存在著人機界面。
美國人機互動專業院校專業一覽

但是你真的對於人機互動相關專業申請有一個整體而清晰的認識嗎？大海撈針的撒申請不如具有明確針對性的申請來的有效。凱諾君為你整理了n+1家開設有不同方向的交互類設計專業的院校，哪一家會是你的dream school呢~在具體的介紹院校前，先來給大家介紹一下人機互動大類下可能有哪些專業選擇：人機互動(Human-Computer Interaction)，用戶體驗設計 (User Experience)，互動設計(Interactive Design)，產品設計(Product Design
前景專業|人機互動(HCI)

後來，人機互動的重心擴展到遊戲、學習教育、商業、健康與醫療應用、應急規劃與響應，以及協作與社區支持系統等領域。如今，人機互動的跨學科性體現在計算機科學與行為科學的交叉領域。人機互動的目標是創建一套易於用戶操作的安全有效系統，這個概念看似並不複雜，但卻需要綜合計算機科學、認知科學及人因工程學等領域的技術。人機互動領域的研究員通常做些什麼事？
百度發布AI互動設計新成果:人機互動越來越「有意思」

在人工智慧技術中，互動設計被認為是至關重要的一環。在這一領域，百度每年發布的新成果，被視為行業的風向標而備受矚目。並真正實現利用AI互動設計助推自動駕駛、智能硬體及智慧零售等領域的發展。」人工智慧互動設計院目前已在18個人因研究和設計的專業或行業平臺上發表或錄用了23篇論文，並對外界輸出了68篇有關人因工程研究的文章。在過去的一年裡，人工智慧互動設計院發布了智能汽車人機互動設計趨勢白皮書、2019AI人機互動趨勢研究，為行業指出了人工智慧時代下的互動設計趨勢。
人工智慧推動人機互動創新三星Bixby中文(普通話)版發布

如今人工智慧產業將成為推動國家發展的新增長點。因此，三星作為全球人工智慧領域的領先企業也積極響應這樣的政策方向，希望通過在中國推出手機人工智慧技術以及產品為中國的科技產業發展以及偉大願景的實現盡到一份綿薄之力。」
組態軟體人機界面設計六大步驟_行業動態_人機界面資訊_HMI人機...

月16日消息，中國觸控螢幕網訊，組態軟體人機界面設計的六大步驟本文來自：http://www.51touch.com/hmi/news/dynamic/201202/16-13959.html1.界面風格的設計控制臺人機界面選用非標準Windows風格CONTROL ENGINEERING China版權所有，以實現用戶個性化的要求。
人機互動院校選擇篇:喬治亞理工大學

今天世畢盟給大家帶來的是喬治亞理工的人機互動設計項目。隨著VR、AR、AI、大數據等時代前沿科技的高速發展，「互動設計」成為了近幾年最熱門的留學專業之一。「人機互動Human Computer Interaction (HCI)」主要研究人與人造物之間的關係，以及如何更好的設計出為人類服務的產品與體驗的設計類學科。
HMI掃盲貼:人機互動,從安全到智能

車雲網2014年9月4日報導　人機互動（Human Machine Interaction，簡稱HMI），是一門研究系統與用戶之間的交互關係的學問。系統可以是各種各樣的機器，也可以是計算機化的系統和軟體。所以應用於汽車的HMI可以實現人與車之間的對話功能。
深度學習人機互動相關資源推薦來啦

雷鋒網(公眾號：雷鋒網) AI 科技評論按，目前，深度學習和人機互動的學習資源很多，但很少有人把這些資源進行總結和整合。近日，bwang514 在 github 上做了一個「深度學習人機互動相關資源大列表」。上面有一些很棒的關於智能用戶界面和人機互動的課程資源。
美國人機互動專業院校專業一覽(下)

Source:http://www.gatech.edu/專業：MS-HCI項目簡介：2年項目(官網表述為至少四學期以上時長)，GaTech是美國三大理工之一，與麻省理工、加州理工齊名，項目旨在為學生提供成為下一代人機界面設計
汽車人機界面(HMI)的發展趨勢-第1部分

我們在人機界面（HMI）上的體驗將會有很大不同——人機界面確保所有駕車上路的人都能理解和操作每一代新汽車所採用的不斷進步的技術。汽車人機界面在不斷發展，因此我們已經開始記錄汽車製造商和供應商正在探索的重要趨勢，這些趨勢指向2.0版乘客體驗。當有重大進展時，我們將更新這篇文章。
【DIY教程】美國CS專業人機互動方向申請指南(48所院校錄取詳細數據+排名+面經+文書範文)

、如何選校、各項考試的準備2、美國165所綜合性大學中開設人機互動專業的院校，包括獨立項目和非獨立項目兩部分。美國人機互動設計專業：HCI(Human Computer Interaction )是最近大熱的新興專業。不過很多人對HCI都存在一個誤區——人機互動就是設計界面，把人機互動和設計混為一談了。事實上HCI是一個大型的交叉學科，包括認知心理學，社會學，CS，需要涉獵的知識也包括軟體，硬體，算法，ML, DL, 社會調查等。
人機界面-專題-CK365測控網

人機界面（Human Machine Interaction，簡稱HMI），又稱用戶界面或使用者界面，是人與計算機之間傳遞、交換信息的媒介和對話接口，是計算機系統的重要組成部分。是系統和用戶之間進行交互和信息交換的媒介，它實現信息的內部形式與人類可以接受形式之間的轉換。

視聽整合:人機互動界面的新方向

相關焦點

嵌入式人機互動界面研究與實現

人機互動的內容有哪些_人機互動主要研究什麼

人機互動簡述,一起來了解人機互動的世界!

下一場革命性的人機互動方式會是什麼?

人機互動新體驗,全新AR界面讓你輕鬆控制畫中物

人機界面設計原則及設計思想

未來已來(一):語音交互,人機互動的新時代

人機界面HMI的8大知識點匯總

美國人機互動專業院校專業一覽

前景專業|人機互動(HCI)

百度發布AI互動設計新成果:人機互動越來越「有意思」

人工智慧推動人機互動創新 三星Bixby中文(普通話)版發布

組態軟體人機界面設計六大步驟_行業動態_人機界面資訊_HMI人機...

人機互動院校選擇篇:喬治亞理工大學

HMI掃盲貼:人機互動,從安全到智能

深度學習人機互動相關資源推薦來啦

美國人機互動專業院校專業一覽(下)

汽車人機界面(HMI)的發展趨勢-第1部分

【DIY教程】美國CS專業人機互動方向申請指南(48所院校錄取詳細數據+排名+面經+文書範文)

人機界面-專題-CK365測控網

人工智慧推動人機互動創新三星Bixby中文(普通話)版發布