7月9日,全球人工智能與機(jī)器人峰會(huì)(CCF-GAIR)在深圳舉辦。商湯科技執(zhí)行研發(fā)總監(jiān)林倞出席峰會(huì)CV+專(zhuān)場(chǎng),并發(fā)表題為“深度驅(qū)動(dòng)的人工智能:從學(xué)術(shù)創(chuàng)新到產(chǎn)業(yè)落地”的演講。林倞在演講中表示,深度學(xué)習(xí)將帶來(lái)將各項(xiàng)人工智能技術(shù)的突破,新一輪的科技革命蓄勢(shì)待發(fā),而商湯科技希望通過(guò)原創(chuàng)技術(shù),用AI推動(dòng)產(chǎn)業(yè)升級(jí)。
商湯科技執(zhí)行研發(fā)總監(jiān)林倞
同時(shí),林倞進(jìn)一步表示,技術(shù)研發(fā)應(yīng)走出實(shí)驗(yàn)室,在產(chǎn)品落地的實(shí)踐中發(fā)現(xiàn)問(wèn)題、定義問(wèn)題、解決問(wèn)題,例如商湯科技兩年前在業(yè)內(nèi)率先推出的106點(diǎn)位原創(chuàng)技術(shù),該技術(shù)能夠讓人臉面部輪廓及各個(gè)部位的定位更加精確。同時(shí),商湯科技迅速將技術(shù)轉(zhuǎn)化為產(chǎn)品解決方案,驅(qū)動(dòng)了人臉識(shí)別在娛樂(lè)、拍照、商業(yè)等多場(chǎng)景中的大范圍應(yīng)用,進(jìn)而推動(dòng)該技術(shù)成為業(yè)內(nèi)標(biāo)準(zhǔn)。另一方面,技術(shù)在行業(yè)的落地,能夠帶來(lái)大量的數(shù)據(jù)反哺,令算法突破與應(yīng)用場(chǎng)景循環(huán)打通形成閉環(huán),通過(guò)不斷實(shí)踐實(shí)現(xiàn)技術(shù)演進(jìn)。
深度學(xué)習(xí)三大核心要素打造關(guān)鍵性技術(shù)創(chuàng)新
林倞介紹,商湯科技一直以來(lái)都在圍繞算法研究、高性能計(jì)算和大數(shù)據(jù)三個(gè)深度學(xué)習(xí)的核心要素進(jìn)行關(guān)鍵性技術(shù)創(chuàng)新,專(zhuān)注打造深度學(xué)習(xí)平臺(tái),進(jìn)而構(gòu)建人工智能、大數(shù)據(jù)分析行業(yè)解決方案。
在高性能算法層面,商湯科技提出高效、可拓展、靈活性的框架,覆蓋從算法、硬件平臺(tái)到軟件框架的設(shè)計(jì)能力;同時(shí)商湯科技還建設(shè)大規(guī)模GPU計(jì)算集群,“我們的超算能力來(lái)自于超過(guò) 2600 塊NVIDIA GPU的計(jì)算芯片,是國(guó)內(nèi)新銳AI公司規(guī)模最大的。”林倞介紹道。
此外,商湯科技極為強(qiáng)調(diào)深度學(xué)習(xí)能力,為此自主研發(fā)的深度學(xué)習(xí)庫(kù)PPL,在X86、ARM或者CUDA等不同的處理器架構(gòu)上,相比第三方開(kāi)源平臺(tái)庫(kù)都有較明顯的優(yōu)勢(shì)。
大數(shù)據(jù)如今已經(jīng)成為現(xiàn)代科技的基礎(chǔ)設(shè)施,“我們?cè)诖髷?shù)據(jù)方面有著深厚的積累,為技術(shù)創(chuàng)新提供了基礎(chǔ)保障”,林倞表示,“判斷一家企業(yè)是否為真正的人工智能企業(yè),需要看其是否有專(zhuān)門(mén)的團(tuán)隊(duì)進(jìn)行數(shù)據(jù)標(biāo)注,而商湯科技在這方面擁有超過(guò)300人的全職數(shù)據(jù)結(jié)構(gòu)化標(biāo)注團(tuán)隊(duì)。”
基于以上高性能算法和深厚的大數(shù)據(jù)能力,商湯科技在新一代深度學(xué)習(xí)、人物關(guān)鍵點(diǎn)定位算法、文字檢測(cè)與識(shí)別、視頻標(biāo)注與內(nèi)容理解、幾何與深度估計(jì)、強(qiáng)化學(xué)習(xí)與機(jī)器人等幾個(gè)方面取得了算法研究的突破性進(jìn)展。
林倞還特別提到,在人臉識(shí)別領(lǐng)域,標(biāo)注點(diǎn)的數(shù)量是數(shù)據(jù)質(zhì)量的一個(gè)關(guān)鍵指標(biāo)。“一般來(lái)說(shuō),數(shù)據(jù)中的特征點(diǎn)越多,識(shí)別率越準(zhǔn)確。”林倞表示,通過(guò)106人臉關(guān)鍵點(diǎn),可以獲取細(xì)微的面部結(jié)構(gòu)信息,并在復(fù)雜的交互場(chǎng)景中供面部特效和美顏等功能調(diào)用,106點(diǎn)的識(shí)別準(zhǔn)度到達(dá)99%,目前已被認(rèn)為是行業(yè)標(biāo)準(zhǔn)方案。
人工智能產(chǎn)業(yè)化落地 促進(jìn)成熟產(chǎn)業(yè)效率提升
經(jīng)濟(jì)學(xué)家曾指出,幾十年來(lái),依靠資源投入的數(shù)量型增長(zhǎng),受資本邊際收益遞減規(guī)律的作用,已現(xiàn)乏力;依靠技術(shù)投入的效率型增長(zhǎng),才是經(jīng)濟(jì)可持續(xù)發(fā)展的保障。未來(lái)中國(guó)經(jīng)濟(jì)的大發(fā)展必將依賴(lài)于科學(xué)技術(shù)與成熟產(chǎn)業(yè)疊加所帶來(lái)的效率提升。
在技術(shù)與產(chǎn)業(yè)結(jié)合方面,林倞介紹,目前商湯科技人工智能各項(xiàng)技術(shù)的觸角延伸至智慧安防、智慧金融、智慧商業(yè)、智慧家居、機(jī)器人以及無(wú)人駕駛、虛擬增強(qiáng)現(xiàn)實(shí)等領(lǐng)域,正在逐步加快推動(dòng)學(xué)術(shù)與產(chǎn)業(yè)的結(jié)合。
在安防-智慧城市領(lǐng)域,商湯科技實(shí)現(xiàn)了在監(jiān)控環(huán)境下對(duì)精細(xì)化的人車(chē)屬性、層次結(jié)構(gòu)、運(yùn)動(dòng)信息的分析并且進(jìn)行結(jié)構(gòu)化存儲(chǔ),讓大量的視頻數(shù)據(jù)和圖像數(shù)據(jù)能夠有效檢索查詢。林倞認(rèn)為,安防行業(yè)也將對(duì)交通行業(yè)產(chǎn)生廣泛深刻的影響,將會(huì)推動(dòng)下一個(gè)變革。
以商湯科技的SenseFace系統(tǒng)為例,它能夠通過(guò)預(yù)測(cè)跟蹤可疑目標(biāo),實(shí)現(xiàn)“人臉天網(wǎng)”。商湯科技的SenseVideo,能夠在視頻監(jiān)控以及輔助駕駛場(chǎng)景中,準(zhǔn)確找出行人和車(chē)輛并分析其屬性。
在金融領(lǐng)域,商湯科技主要針對(duì)金融行業(yè)實(shí)名認(rèn)證的難點(diǎn)進(jìn)行了布局,通過(guò)精確的算法,實(shí)現(xiàn)智能、自動(dòng)化認(rèn)證。以中國(guó)移動(dòng)為例,接入商湯團(tuán)隊(duì)的人臉識(shí)別技術(shù)后,為數(shù)億人提供了實(shí)名認(rèn)證服務(wù)。
在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,通過(guò)人臉關(guān)鍵點(diǎn)定位、SLAM等技術(shù)的應(yīng)用,商湯科技實(shí)現(xiàn)增強(qiáng)現(xiàn)實(shí)和3D增強(qiáng)現(xiàn)實(shí)、雙攝拍照增強(qiáng),提高了產(chǎn)品實(shí)用性及娛樂(lè)性。當(dāng)前非常流行的Faceu應(yīng)用,就是源于商湯自主研發(fā)的增強(qiáng)現(xiàn)實(shí)感引擎,實(shí)現(xiàn)了易用、精準(zhǔn)的面部特效,并在發(fā)布后取得了AppStore免費(fèi)榜第一名的好成績(jī)。
身為商湯科技執(zhí)行研發(fā)總監(jiān),林倞最希望看到的就是通過(guò)人工智能技術(shù)研發(fā)創(chuàng)新與產(chǎn)品落地,不斷推動(dòng)產(chǎn)業(yè)升級(jí),為人們的生活與社會(huì)進(jìn)步帶來(lái)更多的價(jià)值,而這也是商湯科技一直以來(lái)努力的方向。業(yè)內(nèi)人士認(rèn)為,正是這樣的理念,驅(qū)動(dòng)著商湯科技在人工智能領(lǐng)域飛速馳騁,快速成長(zhǎng)為機(jī)器視覺(jué)領(lǐng)域的標(biāo)桿企業(yè)。