隨著無人駕駛快速的發展,用戶對駕駛體驗的需求越來越高,良好的人機交互有助于提升駕駛體驗,并且加速無人駕駛市場化的進程。清華大學汽車工程系副教授李升波博士認為,「人機交互是無人駕駛汽車市場化的最后門檻」。
文章從以人為中心的「人」的角度出發,探討了無人駕駛領域涉及的兩類主要人群駕駛者(車內人和車外人)與汽車的人機交互方式(車內人與汽車的交互主要以語音和手勢交互為主;車外人與車的交互方式目前仍處于概念性的研發階段),梳理了語音交互與手勢交互在無人駕駛領域的進展以及車與車外人的交互方式,分析了各交互現有的問題并提出了相應的建議。
1. 引言
隨著新一代信息技術的發展,汽車智能化、網聯化的趨勢豐富了無人駕駛的范疇與深度,極大地推動了無人駕駛商業化的進程。無人駕駛在今天看來不算是一個全新的概念,部分車企巨頭已經紛紛完成了無人駕駛的路測,并且各大汽車企業將無人駕駛初步商用化的時間點預估在 2025 年,不出 10 年,無人駕駛會成為現實 。從無人駕駛理念的提出到發展至今的智能網聯化趨勢,無人駕駛本質上都是解決人的出行需求。
隨著各大汽車、互聯網及科技巨頭企業在 ADAS(高級輔助駕駛系統)、通信等方面的深入研究,無人駕駛作為一種出行方式,其在車輛安全駕駛的技術上有很大進展。但目前各車企關于汽車與人的交互研究還不夠深入,情緒檢測、自適應人機交互、眼球追蹤、語境語音等提升汽車智能化、差異化的 HMI 技術還不夠成熟,需要進一步優化。人機交互是無人駕駛市場化的關鍵,良好的人機系統有助于推動無人駕駛商用的進程,正如清華大學汽車工程系副教授、智能交通學者李升波所說「人機交互是無人駕駛汽車市場化的最后門檻」。
人機交互是以「人」為核心,無人駕駛涉及到的直接「人」有兩種,車內人與車外人,車內人主要以駕駛員為核心,車外人主要以行人為核心。本文將從「人」的角度出發,探討不同身份的人與車的交互方式:
對于車內人,目前各企業研究的熱點集中在語音識別、手勢控制這兩種交互技術上;
對于車外人,目前與之相關的研究較少,人為駕駛模式的時候,行人通常會與司機有目光的交流以增加安全感;而無人駕駛階段,這一互動就尤為困難,那么對行人開發新的信息反饋方式顯得尤為必要,所以對車外人來說,車與人的交互方式是以信息反饋為目標進行研究。
2. 車內人與車的交互方式
2.1 語音交互
語音交互最基本的目的是輔助行車安全,在安全性保障的基礎上被用于提升車內的體驗樂趣。根據車載市場語音調查報告顯示,40% 的車企已將語音交互技術搭載在自己的產品上、50% 的車企正在開發語音交互系統,可見語音交互將逐漸成為車聯網交互方式的主流,預計其將會成為無人駕駛領域排名第一的人機交互方式。
語音交互的模式為語音系統置入智能手機或語音系統配置在車載終端上兩種方式,車企中采用用智能手機為語音操作端的解決方案以寶馬、福特、通用、現代等企業為代表,語音系統搭載車載終端的企業以奧迪、通用、現代、特斯拉、吉利、長安等為代表,主要的功能以撥打電話、導航、娛樂系統命令下達等為主。

圖 1 Nuance 聲龍駕駛(Dragon Drive)系統
汽車領域現有的代表性的語音交互系統有 Nuance 通信公司的 Dragon Drive 語音助手、奇瑞和科大訊飛聯合開發的 Cloudrive2.0 系統:
Dragon Drive 語音助手可以實現撥打電話、閱讀信息、智能導航、車輛保養維修預約等功能,具有自然語音識別及語言語境學習的能力,并且能夠與駕駛員進行簡單的對話;
Cloudrive2.0 系統的亮點在于自然語言的識別,可以識別 16 種方言,以及強大的降噪能力使得語音交互更加智能、精準。
語音交互在實際的運用過程中其實并不是很成熟,根據美國 J.D. Power 機構發布 2016 汽車新車質量調查顯示,在眾多交互的問題中,語音交互故障率高達 23%。語音交互主要的問題有:
交互的自然性低:現階段語音命令主要以固定的搭配為主,可以接收的命令有限,而且受到地方口音與專有名詞以及特殊語義的限制,大大降低了語音系統的識別性;
靈活性不夠:系統對駕駛者發出的命令不能做出靈活性的修正,在駕駛人員口誤的情況下,即使提高了識別的準確率,也無法獲得正確的交互;
抗噪性:部分情況下車內不是單獨只有駕駛員,還有其它乘客,語音交互系統如何正確區分駕駛員的命令、乘客之間的交流也是要解決的問題。
在無人駕駛車輛中,駕駛員對安全行駛的注意力會減弱,更多精力會投入到其它事情當中,對車內交互深度與智能度要求會更高,全自然的語音交流將成為用戶真正渴望的交互方式,未來的語音交互不單單是命令式交互,更多的是場景化的應用。
2.2 手勢交互
正確理解人類的手勢語言,同樣是汽車領域人機交互的研究熱點 [2]。相比較語音控制和觸摸屏,手勢交互的技術門檻更高,交互形式復雜,現階段的成熟度較低,手勢控制實現起來更加困難。手勢交互現階段只能完成一些簡單的交互,比如打電話、調節音量等操作。如表 1 為各巨頭企業在汽車手勢交互領域的研究。

表 1 各公司手勢識別技術
從表可看出,各企業在交互方式與交互內容上各有差異,其中大陸基于減少駕駛員分心的理念將手勢識別集中在方向盤上,不同于其它企業將識別集中在中央扶手附近。此外,從技術角度來看, ToF 技術(Time of Flight)、結構光技術、毫米波雷達技術為汽車領域手勢識別的主要技術:
ToF 技術是利用光線傳播的時間來識別手的位置及手的姿勢 [3];
結構光技術采用點、線、面的光獲得圖像,并利用三角原理得到手的位置及姿勢 [4];
毫米波雷達技術利用雷達波收發的時間差確定手的位置及手勢 [5]。
從技術難度及計算效率來說, ToF 技術較為簡單,不需要任何計算機視覺方面的計算,這也是目前大部分公司青睞 ToF 技術的原因。
對汽車行業內的手勢交互應用進行研究,總結出目前手勢交互存在的問題有:功能單一,缺乏統一的規劃,人與車的自然交互匱乏,多數企業的手勢交互系統識別準確率不高,識別速度緩慢,這些問題使得人機體驗質量下降。現有的手勢交互難點有:
手勢識別技術的成熟度不夠,難以高質量地完成手勢控制;
手勢可表達的內容有限:相比較語音交互來說,手勢交互難以表達清楚具體的任務內容,但在表達任務的執行對象上來說比語音交互更有優勢;
不同手勢之間的相似性以及手勢范圍的模糊性造成系統的誤判。
未來手勢交互除了要解決上述的難點,手勢的設計也符合人的習慣,因為手勢的交互需要投入一定的學習成本,未來人們更希望獲得學習成本低、交互自然的體驗。手勢的設計也應盡可能簡單,接近日常生活中人們自然交流的姿勢,同時也應考慮不同人群的文化、習慣對手勢交互進行相應的定制。
3. 車外人與車的交互方式
行人過馬路的安全感往往來自與駕駛員的眼神交流或揮手動作,人為駕駛時,很容易實現與車外行人的交流,而當路面上無人駕駛的比例上升時,駕駛員與行人的交流就顯得尤為困難。無人駕駛階段,駕駛員對路面的注意力不那么高,那么為保障行人安全感,駕駛員與行人的交互轉化為車與行人的交互是一種必然趨勢。關于車與行人的交互方式各研究機構也有不同的解決方案:
Semcon 研發出 The Smiling Car 概念汽車,汽車前端布置有一塊顯示屏,顯示屏以顯示微笑的圖案告知行人可以通過馬路;
Drive.ai 初創公司關注于無人駕駛車與路上行人、司機的交流,其解決方案是在車子頂部安裝公告牌發送信息給行人,或者適當地發出聲音提醒行人;
Google 公司致力于打造更安全的汽車,申請了一項「可與行人溝通」的無人駕駛技術專利,專利描述了利用電子顯示屏向行人顯示交通標志信號,同時發出例如「安全行駛」的聲音提醒,甚至通過安裝電子眼或機械手臂向行人示意。
無人駕駛汽車與行人的交互現處于概念性的研發階段,并沒有實際地應用,對此方面進行研究的公司也比較少?,F階段主要的交互以視覺交互和聽覺交互為主:
視覺交互除了要考慮各情況下展示的信息內容外,還應考慮車速對行人視覺的影響;
同樣地,聽覺交互除了考慮發出的信息內容外,聲音的大小以及不同道路環境的干擾也是要研究的方向。
未來無人駕駛或許會出現更先進的與行人交互方式,但無論是采取什么樣的交互方式,汽車所發出的信息要保證能為行人所識別及理解。車與行人自然地交互是未來無人駕駛必須要解決的問題,無人駕駛不應只考慮駕駛員的需求,對道路上所有人員包括行人、交警的需求考慮在內是十分有必要的。
4. 結語
由于汽車本身生產的周期性長,目前部分無人駕駛與人交互的實現仍處于概念階段。從交互的角度來說,人與車最自然的交互方式是沒有交互,縱觀目前市場的發展,現階段的人機交互距離自然的交互還有很大的差別。目前人機交互的主要方式是人下達命令,由機器去執行,在這個過程中,人的命令是不能有失誤,否則就無法實現正確的操作,這對于人的安全和體驗有一定的隱患。
未來自然的人機交互應是以情景識別為主,即機器通過環境來預知人的需求,比如車輛燃料不夠可以自動規劃路線補充燃料、下雨時自動關閉窗戶等更加智能地滿足人的需求,以減少人的操作。
汽車的人機交互是無人駕駛最后的門檻,未來汽車的人機交互系統需要更安全、更穩定的技術,以實現更智能、更人性化的需求。這不是任何單方可以完成的事情,需要集合汽車、人工智能、心理學等不同領域的知識來完成這這一復雜的系統。
責任編輯:王維