人民網上海8月30日電 今天,“2017全球(上海)人工智能創新峰會”在上海徐匯西岸藝術中心舉行。中國科學院深圳先進技術研究院副院長、香港中文大學教授湯曉鷗作了題為《人工智能的中國式文藝復興》的主題演講。
中國科學院深圳先進技術研究院副院長、香港中文大學教授湯曉鷗(張瑋 攝)
演講全文實錄:
感謝組委會的邀請,我也非常榮幸有機會和我的老師Eric 同臺做報告。今天我要講的,其實和Eric一樣,想強調的是原創。原創,需要長期的積累、大量的投入,而不是一夜之間突然我們就可以原創了。
說到原創,可能大家都在看一部電影《戰狼2》,我沒有看,很難評價它好還是一般。但大家知道,它的票房已經是53億,超過了《蜘蛛俠》《變形金剛》等等。這在幾十年前完全不可以想象,而且排行榜當中很多的電影都是全球的票房收入,而《戰狼2》是靠中國一個國家的票房收入就做到了這點??梢宰龅竭@點有很多的原因,我不評價,因為沒有看過。但有一個必要的原因,就是二字——原創。
這個電影十多年前是否會發生這樣的情況?不會。那時候我們每人花不到1美元,可以在大街上買到任何的好萊塢大片,不會花十幾美元去電影院看這個電影,那時候不會有原創。所以長期以來,我們沒有自己的頂級電影創作。最近這些年,大家對原創技術,對IP的尊重,對法律的維護,我們才會有《戰狼2》這樣的電影。
說到電影,中國的電影發源地就是上海。像二三十年代的時候,上海的電影發展并不落后于全球。當時我們在文藝創作上,很多導演都是非常非常有名。我也無法講他們為什么會做得這么好,大概還是對原創、對IP的尊重,所以當時才會發展得這么好。很高興,今天又恢復到那樣的時代,我們的電影又重新崛起了。
上海,肯定不僅是電影文化的發源地,也是現代文化的發源地。不僅是電影,比如中國的商務印書館,100多年前就創建了,也是標志著上海的現代文化開始。這里面有很多原創的東西,我們知道大作家包括魯迅等非常有名的學者,他們寫了很多的文章、小說,那時候如果他們沒有版權,相信他們也活不下去。原創也很重要。
今天我為什么要講文藝復興,14到17世紀它真正的起來,有政治的原因、宗教的原因,各種各樣的原因,但有一個必要條件,也是對原創的尊重。因為有了這些,才有了但丁、達芬奇、米開朗基羅、拉斐爾、莎士比亞等一系列非常優美的藝術品。最后這個作品大家可能會有一些疑問,說文藝復興時候好像沒有見過這個作品,這是我非常尊敬的現代藝術家的現代藝術作品,這個作品叫紙上談兵,是藝術家彈琴,坐在一卷手紙上,非常原創。我實在編不下去了,其實這是我兒子的作品,主要還是想強調原創的價值。
今天的人工智能,我們總是聽到Google的聲音,聽到AlphaGo、自動駕駛等方面的事情,為什么總是聽到Google的聲音?Google前幾年,一年的研發投入是120億美金,這是燒掉的,不是整個公司的日常運營花費,正因為這樣,才會有AlphaGo、自動駕駛等技術。2014年就愿意付6.6億美金買初創的公司,這個公司只有6個人,沒有任何的產品落地,就是用深度學習在玩游戲、下棋。他們會花這么高的價格來買這樣的一家公司。如果在我們中國的商業環境下,我們花100萬美金挖人,這樣肯定經濟效益更好。但是,就不會有后來的AlphaGo了。他們愿意投入,就是對原創技術、對人才的尊重,才會有后面的AlphaGo。Facebook也是2013年左右,深度學習剛剛起來沒多久,大量投入深度學習實驗室。
Eric提到了Mobileye,英特爾愿意花150億美金收購這樣的公司,其實沒有什么,就是一伙人,一個教授帶一群學生做研究。他們花錢收購,而不是挖人。
非常熟悉AlphaGo,在AlphaGo之前我和大家講深度學習,沒有人會聽,也沒有投資人關心。但是這盤棋下完之后,投資人回過頭和我講什么叫深度學習。這在全球引起了巨大的轟動,因為圍棋這件事,是腦力勞動非常強的活動,機器可以戰勝人類,并不是說機器無比聰明。為什么機器可以下棋?是我們定義的任務,我們讓它做下棋這件事。它所做的訓練都是基于棋譜,所以它不會想控制人類這件事,它的任務是人類定義的。所以,短期我們不用擔心,長期也不用擔心機器人控制人類這件事。真正轟動的效果是它的創新和深度學習的算法巨大的進步,在全球引起了大量的報道。
緊接著在中國做了一個AlphaGo2,和柯潔下了一盤棋,也下得非常精彩,值得大家關注,也會有一些新的技術出來。那周,媒體鋪天蓋地都是報道。但你看雅虎、國外的網站,會有一些報道,但報道一下就可以了,不是大家都靠這個活著。為什么?因為這是AlphaGo2。做原創,第一個做這件事的最重要。等窗戶紙捅破了,捅第二下不那么重要了,你已經知道房間里面發生什么事情了。
再看一個地圖,Deep learning的搜索次數,顏色深代表搜索的次數多,淺的代表搜索次數少。中國對這個詞的搜索量最大。這是谷歌的搜索結果,谷歌在中國,老百姓是搜不了的,你要翻墻,這大概只有做技術的人才知道怎么做。翻墻的搜索量比全球的搜索量高很多了,可以想像這在中國有多熱。但是為什么這么熱?因為我們不懂,我們這么多年沒有做原創技術。中國有句成語“不明覺厲”,因為你不知道怎么回事才覺得厲害。知道,還有一句話是“文人相輕”,你是文人,你知道他的水平和深度,互相之間會不服氣。
前段時間Amamzon、IBM、谷歌、微軟等組成了人工智能的聯盟,當時我們覺得國外人工智能的發展已經非常非常超前了。這么熱,我們如何競爭?Eric剛才講了人工智能,這應該是全球的合作,是共贏。合作是雙方都要做事情的,是雙方平等的合作,不是說別人做了,你把它拿過來用,然后賺錢,這不是合作,叫盜版。
人工智能,我們是否落得很遠?我從我們公司做的事情來講一下,我們現在處于什么階段。人工智能的發展歷史我就不講了,幾起幾落,前面的學者已經總結過了。真正的落實是2011年,深度學習算法在語音識別方面取得重大突破。后來才有了2013年谷歌、Facebook的大量投入,到現在的直線上升。
2011年我們開始做深度學習,當時應該是最大的華人團隊。2011到2013年全球最頂級的三次相關會議,29篇文章涉及到深度學習,14篇由我們一個實驗室做的,做了全球的一半。
最近兩年,谷歌、Facebook開源了AI平臺,相當于AI的操作系統。我們最早的時候沒有Torch等,我們經過多年的研究,做出Parrots系統,我們把幾百塊的CPU連接起來。訓練了1207層的深度學習網絡,林教授領銜在做,他是Eric三年前畢業的博士生。
我們和Facebook、Google競爭的例子,就是人臉識別。2014年Facebook發表了文章,我們同一時間發表了另外一篇文章,搶在Facebook之前,第一個用計算機做人臉識別超過人的眼睛。這其實和AlphaGo一樣的事情,在人類定義的一項任務上,機器超過了人類。我們當時用了20萬的人臉數據做的。平時做研究,一兩萬的人臉數據就很了不起了。用了20萬的人臉數據,我們覺得我們會碾壓所有的人。還沒有開始碾壓,發現Facebook用了750萬的數據,數據量上把我們碾壓了。但是計算的結果,我們超過了他們,連做了3、4個算法,最后做到了99.5%,戰勝Facebook。在中國,就會出現大批的公司重現實現一下算法,開始落地。
Imagenet,2012年有很大的突破。2014年是最大的一次比賽,38個團隊,包括Google、伯克利、牛津等實驗室都參加,我們取得了全球第二名,輸給了Google。當然,Google也是競賽的組織者,我們贏他也比較難。
2015到2016年,ICCV、CVPR、ECCV三個頂級世界會議上發表的文章數量。微軟124篇,商湯和我們實驗室一起76篇,我們是整個亞洲唯一前20名的團隊。
最后三位是百度、阿里、騰訊,三家的估值超過了9000億美金。三家公司加起來的文章數是13篇。你想用AI作為你的未來,要投入,要做原創,而不是拿來的。我們取得的這些成績,也得到了國際上的承認。
我們非常榮幸,和MIT、伯克利、谷歌等實驗室,被評為前十大人工智能實驗室,我們是整個亞洲唯一的代表。我講的這些是學術上的研究和成績。如果只有這些,其實我們沒有數據,沒有應用,我們的人也很少。一開始,會搶跑一下,領先一下,長時間的競爭我們無法戰勝Google這樣高投入的公司。我們也要落地,很幸運,通過積累,我們現在有120位深度學習的博士,核心人員體量和Facebook、Google差不多,我們是唯一一個深度學習平臺公司。非常榮幸,這次《華爾街日報》報道我們單輪融資取得最大一筆AI的創業公司融資,4.1億美金。以前是我們幾千萬美金,打一場看起來沒有希望的戰爭,現在我們補充進了彈藥。到今天有400多家頂級的大型客戶,包括中國移動,包括銀聯,包括華為等巨型公司。400家公司意味著過去一年半的時間,每天簽約一家公司。我們用人臉識別在做芯片、醫療、自動駕駛、金融等14個行業的研發,和14個行業的合作伙伴合作,我們會反饋回來大量的應用需求,形成完整的閉環、正循環。很高興,得到了國家的承認。去年的雙創活動中,很榮幸和百度被選為代表中國人工智能的企業,參加北京地區的展覽。
最后還是用一部電影來結束演講。我這個年齡,對《上甘嶺》是很了解的,當時打的最后一場戰斗,也就是一個連。我們120個博士,也差不多就是這樣的人數。如果我們再守不住“上甘嶺”,人工智能的“三八線”也就基本結束,謝謝大家!