在今年3月份和5月份的時候,谷歌連續(xù)發(fā)布了AI打電話的應用,5月份推出的產(chǎn)品,可以用它的音響打電話給美發(fā)店做一個預約,很快在谷歌的語音大會上推出了一個唯一的企業(yè)級應用,為什么推出這個企業(yè)級的開發(fā)呢?這個方案其實就是呼叫中心的AI。
李釗輝表示,整個呼叫中心產(chǎn)業(yè)里面,“人是最大的成本”,如果AI可以替代掉一些人的話,那它本身的價值非常大。
從目前的技術條件來看,唯有持續(xù)學習的機器人才有價值。根據(jù)當前機器人的特性,現(xiàn)在人工智能本質(zhì)上是一個數(shù)據(jù)科學,是由大數(shù)據(jù)、神經(jīng)網(wǎng)絡和漣漪效應,這是訊飛研究院校長提出的名詞。原來面向十個人,十個人的體驗沒那么好,但他們的數(shù)據(jù)優(yōu)化進去,面向這一百人,這一百人的效果可能就更好,再把這一百人納入進來面向一千人提供,效果會更好。
科訊嘉聯(lián)對當前的智能服務,機器人的標準做的一些梳理。首先無論是人還是機器人,最終的目標都是去完成一件服務的事情,這個是最最重要的。李釗輝覺得機器人一定要達到人工服務80%以上才能是機器人,否則只能是自動應答系統(tǒng)。李釗輝還認為所有的機器人一定是需要在垂直場景下和人做交互,比如催收,就要了解回訪率多少,營銷,就要了解意向率是多少,完全和人做對比,這樣產(chǎn)生的價值能高于80%以上,加上人機結合的方式方可達到可用的門檻,如果比這個比例還低的話,只能算自動應答系統(tǒng)。
科訊嘉聯(lián)從核心系統(tǒng)、應用平臺、持續(xù)優(yōu)化這三塊對技術進行了梳理。首先看核心技術,首先語音合成和語音識別,肯定要有專業(yè)的團隊做研發(fā),李釗輝以訊飛為例,一個月的投入可能就達到1億人民幣,如果這個引擎沒有自主研發(fā)能力的話,根本后續(xù)不可能做優(yōu)化。另外是語音播報,像地址、車牌號一定有動態(tài)與靜態(tài)信息的,這個時候他的播報一定是無縫拼接,否則用戶一聽就不是真人打電話,這時候是很重要的。另外對于識別的難點,比如地址、電話號碼,識別率大于90%以上。
另外是方言和中英文的混合處理能力。中國的方言種類還是挺多的,畢竟實際經(jīng)驗來看基本上還是有5%~10%的人會說方言。針對用戶極其分散的情況,做提醒的時候還有用戶有報警、上媒體、投訴這樣的說法,這一個需求點就有幾萬個說法的可能,這時候能不能準確的理解,也是系統(tǒng)面臨巨大的挑戰(zhàn)。
從應用平臺來看,比較好的產(chǎn)品,像業(yè)務人員可以獨立完成機器人的制作,李釗輝表示,“我有一個平臺,業(yè)務人員在上面做一些可視化的編輯就可以了,而不是講一大堆算法,部署完之后可能用不起來,這是沒有意義的。另外是有眾多行業(yè)應用的經(jīng)驗,否則對接的過程中可能會出現(xiàn)更多的問題,像主流的平臺都要對接過。”
基礎設施也要穩(wěn)定。因為通信領域要求最高就是穩(wěn)定可靠,李釗輝認為一定要有好的業(yè)務平臺,否則有好多公司可能也愿意做這方面嘗鮮,使用之后發(fā)現(xiàn)效果不好,過于依賴技術人員做迭代的話,迭代一次可能一個月時間就沒有了,現(xiàn)在基本上可以做到實時迭代,迭代一次可能就是一兩天的時間,這樣它的價值可能會慢慢體現(xiàn)出來。
另外持續(xù)優(yōu)化也特別重要,這是一個基礎。除此之外,要有一個獨立的團隊去做,這個團隊可以由企業(yè)自己成立,也可以和做語音的團隊聯(lián)合做。李釗輝表示,我們把這個團隊有業(yè)務專家和話術專家,另外是數(shù)據(jù)分析和數(shù)據(jù)優(yōu)化的專家,主要是分析出當前機器人和人的差異點在什么地方,調(diào)整后續(xù)的語音識別、語音合成、話術設計逐漸的逼近人工,這是非常重要的。
最后,李釗輝表示,未來機器人和人的模式,機器人的特點是規(guī)范,你其實不用質(zhì)監(jiān)也可以,因為流程是你自己設計的。另外是可以持續(xù)學習。缺點是人性化、情感,未來是把簡單重復的工作交給機器人,真的對于很復雜的業(yè)務,從目前的基礎來說交給人工來說更加靠譜,因為否則帶來投訴的話,可能對企業(yè)非常不易。