6月24日,人工智能先行者大會暨黑馬大賽人工智能分賽在京舉行,近千名人工智能產業相關創業者、投資人、產業專家參會。本次活動由創業黑馬與人工智能新媒體平臺黑智聯合主辦,聯合冠名商摩比神奇與戰略合作伙伴鉑諾對活動進行了支持。
會上,創新工場AI工程院副院長王詠剛發表了題為《創新工場的AI布局》的演講。在他看來,大眾認知的人工智能和實際的人工智能存在著很大區別,人工智能技術在很多方面還等待破局,創新工場在技術研發、培訓、投資等多方面在人工智能領域的投入,最終最期待的未來是,讓人工智能真正成為人類的工具,成為一個“即插即用”的工具箱。
以下為王詠剛演講,經黑智編輯:
大家好,我是創新工場AI工程院的副院長王詠剛,去年加入創新工場,之前在GOOGle做了10年的工程師。
今天,我想給大家分享的是創新工場在人工智能領域的投資布局。我們到底怎么看待人工智能現在所處的現狀,在面對投資、創業、技術研發等問題時,都會考慮哪些問題?
其實,對于很多不是搞技術、創業或者投資的人,“人工智能”這四個字大概是2016年3月AlphaGo和李世石下棋后,才進入到他們的視野,才知道人工智能原來和自己的生活有關。但他們往往會把人工智能理解成科幻小說中寫的人工智能,擔心是不是在未來某一天,人工智能能夠毀滅人類。
如果我們不去科普,用科學或者符合技術邏輯的方法,讓更多的普通人了解什么是人工智能,那無論是在創業還是投資上,都會存在很大的問題。
比如,我在和一些大型集團的業務線老總談人工智能時,他們經常會問到這樣一個問題:“你們現在投了那么多人工智能項目,做圖像、聲音、無人駕駛、自然語言等方面的創新,這些創新不是在給人類掘墓嗎?”他們認為這種新的技術最終會統治人類,壟斷資源,甚至讓人類走向滅亡。
這確實是一些人對于人工智能非常真實的反應。
創新工場在做技術研發和投資的同時,花了大量精力做相關的科普工作,主要想告訴大家,今天的人工智能科學技術和科幻電影里說的人工智能,基本上是兩件事。
如果將我們人類的進化用機器學習來比喻的話,那它也有一個目標函數,但這個目標函數和我們給機器設定的目標函數會非常不一樣。因為,人類的進化是大自然在幾十億年時間內,從低等到高等,從簡單到復雜,不斷進化而來。這個目標函數大致就是保證自己的種族繁衍,同時保證能夠盡可能多的占領地球資源。
這和科學家、研究者、工程師,給現代機器、人工智能設定的目標函數,根本不是一回事。我們給人工智能設定的目標函數,往往是你對圖像識別的錯誤率盡可能低,你對人類語言從英語映射到中文的準確率盡可能高,它是這樣一種非常具體的,基于任務的目標函數。
正是因為這種本質上的不同,所以我們會說今天所有人工智能的科研、技術、產品和創業,只是人類的工具。如果要說1000年、10000年以后的事情,那我相信這個事情的結局會非常的開放。
怎么看待今天的人工智能技術?這是創新工場對今天人工智能技術發展過程,以及未來可能在哪些領域取得突破,做一個簡單的理解。
今天人工智能的發展,是基于深度學習在2006-2010年間取得了一系列的理論突破。現在還在吃這個老本,把它應用到圖像、聲音、文本,以及所有有大數據的領域中。
但是,今天正在取得成果的很多技術,都可能在不遠的將來,真正轉化為產品和競爭力。比如增強學習,大家可能已經在AlphaGo中看到了它非常強大的威力。事實上,增強學習在機器人、無人駕駛,以及所有涉及到環境感知的領域都有非常強的應用場景。我們也非常關注增強學習和每一個具體商用領域、具體落地產品的關聯。
再比如說遷移學習,今天人工智能在這塊的表現非常差,甚至不如一個小孩。當一個小孩開始理解世界,在進入新的領域時,根本不用像現在的計算機那樣學幾萬、幾十萬、幾百萬張的圖片。他們只要看兩三個樣本就可以進入到新的領域,只要看一個具體的分析,就可以從中抽象出這個領域某一個對象的特質。
所以,如果我們沒有辦法在遷移學習上取得突破,也就沒有辦法讓人工智能從已有的知識推廣到另一個領域,或者從已有的數據推廣到另一種數據。那么,我們就永遠被拴在人工智能必須是算法和大數據結合這樣一個等式上。
可喜的是,科研界現在有非常多關于遷移學習的新技術和新產品出來,這些技術什么時候能夠在創業領域開花結果?我相信大概在幾年時間內。
跨領域自然語言理解技術,是我們關注另一個重點方向。幾十年來,人工智能界都會把自然語言理解叫做“人工智能皇冠上的明珠”,原因在于自然語言理解是一個遠復雜于圖像理解、語音理解、大數據理解的非常復雜、完全嶄新的領域。
在自然語言理解領域,數據的維度空前高。數據本身的靈活性、信息的靈活性,信息和每一個標注對應關系的復雜度,都遠遠高于圖像和語音領域。在這個領域,我們幾乎不敢苛求100%的理解。因為100%理解自然語言、通過圖靈測試的計算機,就已經跨入了強人工智能的門檻。接下來的超人工智能、毀滅人類的現象,有可能隨之到來。
但是,如果把自然語言理解的精通設定為100分的話,現在可能只做到了5分。從5分到50分,從50分到60分,從60分到80分,這里面有非常多可以擴展的空間和進步的地方。
我個人在Google 10年間做自然語言方面的東西,更傾向于預測在下一步自然語言理解領域,翻譯技術有可能取得實質性的突破。去年已經看到Google在翻譯技術方面里程碑式的論文。
未來三五年,或者再多一點時間,也許所有的人都不需要再學任何外語,我們到任何的國家都可以用一部手機無縫交流。它可能達不到人類智慧的標準,但是可以處理像翻譯、智能助理、客服應答這樣基礎的任務。
經過三年、五年、八年、十年的發展,我們相信,所有的人工智能前沿技術,會變成一個非常好用、便捷的工具箱。做技術的都知道,現在已經有很多開源的人工智能技術,像Google的TensorFlow,類似這樣的框架至少有幾十種。
從今天的TensorFlow,GPU、TPU的管理,Docker這樣的封裝、集成,到未來即插即用、即開即用的人工智能解決方案還有多遠?我相信這個距離也不是那么遠。
我非常希望看到,在兩三年后,到任何一個行業,哪怕不懂人工智能的工程師,都可以快速地接入人工智能技術,用人工智能的工具箱解決這行業領域里的具體問題。這是我們對人工智能技術發展的基本愿望,也就是人工智能成為人類的工具,成為一個即插即用的工具箱。
但是我也非常清楚地認識到,今天很多主講嘉賓都提到人工智能在創業和投資領域存在泡沫,這種泡沫現象在美國、中國都非常的明顯。可以明確的是,人工智能投資和創業有泡沫,但人工智能這件事沒有泡沫。
至于今天遇到的這些泡沫,以及人工智能在實際的創業和投資過程中遇到的挑戰,創新工場基本的總結是這樣的:
首先,人工智能領域太多的創業者都是科學家、工程師,他們離真正使用的行業還很遠。現在讓一個科學家和銀行業務主管,或者保險公司代理員,坐下來討論關于人工智能的方案規劃,還是非常困難的,這是今天人工智能創業最大的特點。因為以往做互聯網、移動互聯網創業的,很多都是行業專家出身。
第二,人工智能的人才缺口巨大,人才結構失衡。人才是創新工場非常關心的一件事。現在有大量的培訓機構宣稱可以培訓、批量復制人工智能工程師,我也知道那些21天成才的人工智能工程師都學了什么課程。
非常簡單,第一周學Python,第二周學數學模型,第三周做幾個demo跑一遍,他就可以對外宣稱自己是一個人工智能工程師,是一個在AI領域可以拿到高薪的工程師。
嚴格來講,在人工智能領域,真正能夠解決問題、解決業務需求的工程師非常少。這些工程師因為稀缺,所以身價相對高的離譜。這也是很多創業公司很艱難的一個地方。他們可能想與人工智能集成,但雇不到那么多、雇不起這樣的人才。創新工場也希望通過培訓、暑期訓練營,以及開放一些可以幫助科研、幫助學生成長的數據集等方式,來解決這些問題。
第三,數據孤島化和碎片化現象非常明顯。我們現在做數據,一方面很難保證用戶隱私。另一方面,很難收集到完整集成的數據。數據幾乎成了某些公司的核武器。這些公司可能沒有人工智能的力量,但是它有數據,就只能在這個領域掌握先機,甚至形成壟斷。
可復用和標準化的技術框架、平臺、工具和服務,還需要2-3年才能成熟。一些領域也存在超前發展、盲目投資的問題。加上目前很多人工智能創業是2B端的,所以難度相對較高,早期團隊也需要更多支持。
創新工場有一個基本的投資邏輯,它是根據我們對人工智能整個技術和產業發展的基本判斷來做的。
今天的人工智能產業的發展,我們判斷會經歷三個階段:
階段一:已經發生的。今天人工智能技術已經在為互聯網和移動互聯網上這些擁有虛擬數據、虛擬流程的企業大量的“印鈔”了。百度、Google這樣的搜索引擎公司,Facebook這樣的社交網絡公司,以及今日頭條這樣的內容推薦、分發公司,他們的核心競爭力就是人工智能。
人工智能就是用人工智能機器學習出來的規則、算法,幫他們進行內容排序、廣告推薦,他們每天賺到的錢里,90%可能都是因為使用了人工智能。所有這些線上的電子商務公司、內容公司,如果不和人工智能結合,就一定會落后。
人工智能在絕大多數虛擬的、線上的,和數據、搜索、內容分發、廣告相關領域,已經扎扎實實的落地了。如果還聽到有人說人工智能落地很難,你可以告訴他,Google、百度大量的營收都是從人工智能來的。只是今天的人工智能還有一點點局限在虛擬世界里。
從虛擬世界,擴展到同樣擁有數據資源、同樣在虛擬世界里運營業務的其他領域,仍然存在剛才說的2B端的領域壁壘。比如說同樣是算法推薦技術、機器學習技術,用到在線領域可能相對容易一點,用在銀行大數據領域,就要熟悉銀行的業務;用在金融的量化交易領域,就要熟悉量化交易所需要的交易規則。我們會看到,人工智能必將從互聯網、移動互聯網領域慢慢向其他業務端移動。移動的指標,只不過在于它是不是具備了完整的大數據流程。
階段二:會稍晚一些。我們的判斷是會花2-3年或者3-5年的時間。這是人工智能從虛擬世界(線上)向現實世界(線下)不斷擴展的階段。比如現在所有做安防的公司,依靠人臉識別、形體識別,從個人身份識別完成安防體驗的公司,他們其實已經通過傳感器,為線上和線下的溝通構建渠道。
以后這樣的傳感器會越來越多,把線上的數據和線下的業務場景聯系起來,把線下人物實體、事物實體、聲音實體轉換成數字化線上信息,反饋給線上,形成這樣一個閉合流程以后,再各個不同的行業會建立越來越多。
比如我們最近還在聊一個完全線下的、跟倉儲和海運相關的項目。我們建議他們在很多地方放不同的傳感器,收集這些純線下的數據和信息。當這些線下的信息匯總到線上之后,我們可以用類似搜索引擎和廣告推薦的機器學習算法,來解決他們原本在線下的業務問題。這是我們認為人工智能在產業落地的第二階段。
階段三:人工智能在產業落地的這個階段,就會從全面的線上轉向全面的線下,通過不斷的發展,讓我們生活中的每一個地方都充滿人工智能,包括無人駕駛對所有產業的改造。按我們的想法,無人駕駛永遠是所有人工智能產業的領頭羊。這個領頭羊不僅僅解決造汽車和需不需要司機的問題,它應該會像汽車產業那樣,徹底的顛覆整個人類的衣食住行等很多方面。
當無人駕駛充滿這個城市的時候,城市的交通改造就會是一個非常大的項目。城市智能化的停車,需不需要那么多停車場,城市的共享經濟應該怎么構建,甚至城市的人口住在哪里、工作在哪里的重新規劃,都會成為非常大的課題,支撐巨大的產業。
今天無人駕駛還停留在L2、L3這樣的階段。很多從事無人駕駛的創業公司還只是盯著產業中間的某個細分環節,例如有的在做感知,有的在做決策、控制,有的專做傳感器,甚至有很多公司專門在做高精度的無人駕駛地圖。
基于今天的發展,未來必然會進入整合階段。到了那個階段,才會產生L4或者L5、真正實現所謂全功能、全天候的無人駕駛技術。
現在展示的這張圖,是創新工場根據人工智能三階段發展的劃分來定義,現階段三到五年,五到十年,在十年后我們的投資重點,我不細講所有的領域,我只是在講我們今天可能投資的有金融行業的人工智能、無人駕駛方面人工智能,我們也投資了一些跟教育相關的人工智能。
未來在2-3年、3-5年內,我們會把這樣的落地擴展到更多的領域,例如醫療、在線教育領域的人工智能深化,以及具體行業解決方案的人工智能,包括剛才講的海運業、零售業,甚至包括礦產、物聯網里的人工智能。這件事是由時間曲線慢慢推動的,我們不會急于現在什么領域都投,什么方式都參與,而是根據技術發展的客觀規律,以及人工智能在不同領域、不同階段落地的先后關系,做出我們的投資決策。
創新工場的人工智能戰略包括兩個部分。
第一部分:創新工場這7年一共投資了300多家企業,其中人工智能技術驅動的,或者以人工智能技術為導向的企業有30多家,占投資總數的10%左右,我們會在人工智能投資領域繼續布局、繼續深入跟進。
第二部分:因為今天人工智能面臨的問題,比如科學家創業的難題、人才培養難題,以及人工智能在不同行業落地的難題。我們創立了創新工場人工智能工程院,從Google、微軟、Twitter吸引一些真正做人工智能的一線工程技術大牛,第一個目的就是培養人才,我們在學校大量招聘畢業生、實習生。
這個訓練營對學生完全免費,會提供教師資源、課程資源、導師資源,包括非常充裕要多少有多少的GPU資源和辦公資源。
上個月消息發布后,收到來自全國頂尖高校的600多份申請,最終從中選出30個學生進入訓練營。
未來,我們也會面向科研界、學術界,發布專門用于科研的數據集和輔助的科研資源,為科研發展、學術發展投入我們的力量。
與此同時,創新工場人工智能工程院也在積累我們的技術。針對一些前沿的論文,例如強化學習、遷移學習,以及前沿的自然語言處理方面的應用,我們也慢慢把它們轉化為可以實際落地的產品技術。為什么叫工程院?就是因為我們在做的是扎扎實實的和工程有關的事情。
所以,未來從這些技術、產品里,也許可以孵化出一些新興的人工智能創業公司。
簡單的講,創新工場的人工智能工程院的使命,就是培養人才、孵化技術和產品,未來有可能成為一個公司,或者人工智能的孵化器,這是我們對創新工場人工智能工程院的基本定位。
以上就是創新工場在人工智能方面的基本布局,謝謝大家!