1月17日消息,百度輸入法在北京達美生活中心舉辦了主題為“AI輸入,開啟全感官輸入時代”的發布會。
發布會上,百度副總裁、AI技術平臺體系總負責人王海峰在致辭中提到“真正讓輸入法這種人機交互模式發生變革的,是正在到來的AI時代。”他說,“AI時代,人無需學習如何使用機器,用自然語言就能和機器順暢交互,甚至無需主動交互就能讓機器理解人的意圖……當AI發展到一定階段,輸入法甚至不需要獨立存在,它將融入人機交互系統,支持人和機器以各種形式進行信息交互。”
隨后,百度輸入法負責人蔡玉婷上臺,宣布了百度輸入法v8.0版本的正式上線,該版本在此前已有的AI功能上增加了“語音速記”和“AR表情”兩大全新AI功能。
其中,“語音速記”采用了百度的“聲紋識別”技術,該技術針對2-3人小型會議場景,可根據聲紋自動去唄發言人,實現智能化的語音識別。而“AR表情”功能基于百度的人臉識別技術和AR技術,用戶可以根據相機或相冊進行人臉識別、制作表情包,還支持用戶通過自己的表情控制虛擬人物形象。制作出來的AR表情可以直接通過輸入法搜索、語音輸入和鍵盤輸入時展示出來。
百度語音技術部總監高亮,再大會上發布了百度語音技術的最新突破——Deep Peak2模型。該技術全稱為“基于LSTM和CTC的上下文無關音素組合建模”,是百度語音技術的深度尖峰技術,也是語音識別工業歷史上巨大技術進步。
高亮說,“今天現場的實時文字上屏,就是應用了百度最新的Deep peak2模型,現在的識別準確率比起百度世界大會時又上了一個臺階。經過測試,應用了百度Deep Peak2模型后,其識別的相對正確率較行業領先水平提升20%。”