不斷成熟的“人工智能”(AI)技術,讓學術領域和企業家們更加意識到高效利用這項技術的重要性。如何在日新月異的當下不斷挖掘人工智能的深度、拓寬應用廣度是必須思考的問題。恰逢2017年開春之際,DVBCN&AsiaOTT推出了人工智能年度人物專欄,聚焦當前人工智能領域,本期分享曠視科技聯合創始人兼CEO印奇對人工智能的真知灼見。
印奇是face++創始人兼CEO,2010年清華大學畢業后,在MSRA全職工作了一年,參與研發的人臉識別引擎。2011年10月與兩個伙伴成立了曠視科技,并在2個月后便獲得聯想之星幾百萬元的天使投資。本科畢業后,印奇赴美國哥倫比亞大學攻讀3D相機方向博士學位。在完成兩年的博士學習后,回國正式創業。2016年登上福布斯,成為亞洲30歲以下青年領袖的代表人物。印奇,這位85后創業者,追逐的是用技術改變世界的夢想。
人工智能的演變路徑
首先,人工智能是一個由技術驅動的方向。印奇表示在過去的兩年,看到了人工智能演變的一個路徑:邏輯智能——感知智能——認知智能。一個大的行業共識是,現在達到了「感知智能」這一環節,而關于「認知智能」,人們談到的更多是機器的創造力、感情、甚至機器人帶來的人類危機。
簡單梳理一下這個路徑,在過去,基于邏輯智能已經產生了非常多的專家系統(知識庫 + 推理機),比如醫學診斷系統。后來的「語音交互」系統,其實是橫跨了最早的邏輯智能到感知智能,并且它所包含的對語言的理解,其實已經到了認知智能的前期。
而前段時間很熱的 AlphaGo,在印奇看來是「博弈智能」,人們會發現當機器能夠在人類設計的游戲當中超越人類的時候,這種感覺特別可怕。舉個例子,未來最值錢的一家人工智能公司,可能就是用人工智能參與人類金融的事情,也就是機器炒股,現在已經有公司開始嘗試了。
曠視做的是機器視覺,印奇管這方面叫「靜默智能」,他的跨度比前面提到的這些人工智能都要大。圖像識別是非常典型的靜默智能,涉及到人類最核心的認知,概念,抽象等東西。如果有一個機器,可以視覺化地理解這個世界,你實際上并不知道它到底在做什么,它只是靜靜地在那兒看著。印奇說他們選擇了他們認為最難的一條路,希望沿著這條路走下去。
在商業化中實現數據循環
曠視科技還看到了一個方向,那就是——人工智能創業公司,要比之前所有的創業公司都要更懂商業。人工智能公司不但要懂技術,同時還必須要懂產品,走到商業化的大路上去。人工智能商業化的演進,到底是什么一個方式?兩個關鍵詞,一個是數據智能,一個是網絡協同。這兩個概念其實是阿里巴巴首席戰略官曾鳴教授提出的:世界上所有千億美元級的公司,必須在商業模式、數據模式上形成網絡協同效應,這家公司才有可能形成行業壁壘。
曠視科技總結了人工智能公司的「三段論」——“作為一家人工智能公司,你要有自己的平臺,同時選擇一個商業落地的方向,最終快速地實現數據循環。”印奇指出在這一波的人工智能的浪潮里,不可否認的是,技術的門檻在變低。如果沒有商業落地,沒有真正的數據循環,你能做出來的技術,半年后一定會有別人能做出來。
曠視開發的Smart ID,印奇表示因為它最通用,且能夠打通線上和線下。曠視(Face++)涉及了 1 億人的刷臉,比較有代表的客戶有螞蟻金服的支付寶、Uber、中信銀行、萬科,萬科是曠視在線下化的體驗,未來會實現一個智能園區。通過云端平臺 FaceID.com,曠視打通了Smart ID的線上和線下。無論是線上的賬號,還是線下的一張卡,一把鑰匙,或者一個智能門禁,最后可能都是虛擬化的一個大的入口。
冷靜分析競爭格局
印奇表示,現在曠視這樣體量的,既大也不大的這樣的類型,在它的后面的后面和前面都有很多競爭對手。他說曠視內部基本上把競爭對手分為三類,一類是在這一撥人工智能資本泡沫催生下的最近兩年以內成立的新的公司,可能有很多,哪怕做人臉識別這樣垂直領域的,至少得五六家做得還不錯的。他認為這些短期內不會太成為曠視的直接競爭對手,在五年的時間里做得比較扎實。往上,如果說競爭對手有兩類,一類是從國外人工智能說得最熱的三個公司,谷歌、Facebook、亞馬遜,這三個公司是在人工智能最上面。
中間有一檔是行業的競爭對手,比如說非常重要的行業——安防行業,大家可以看到在安防這個行業里有一個視頻整個未來的云化和智能化大的機會。大家可以看的平安城市,北京不知道有多少個攝像頭,在一個二三級城市攝像頭的數量也是2萬到10萬個不等,這個攝像頭每年24個小時在產生非常大的市民數據,這個市場非常大。到底有多大,一年在中國大概是整個產業鏈是千億美金的產業鏈。這是非常大的市場,中國有非常多的優秀企業,這些企業在很多的實際的市場上已經面對面去碰撞,印奇表示會曠視現在還比較小,包括他們的切入點也不一樣。
人工智能的未來:科幻變現實
在印奇看來,曠視科技(face++)未來的戰略可以分為識人、識圖和機器大腦三步:
識人:即人臉識別。
識圖:也就是通常所說的「識萬物」,目的是識別圖像中的高價值信息,例如人臉、車輛、文字、行人等等。這些信息盡管算不上「萬物」,但卻是最有應用價值的部分——舉例而言,如果實現了對車輛、行人和交通標志牌的識別與計算,無人駕駛汽車也就應運而生了。
機器大腦:將視覺推而廣之,實現更廣義的機器思考。
在談到未來的技術時,印奇預測,人工智能將是未來20年內最重要的技術。20年內,很多科幻片里的場景或將現實。他提及目前最亟待攻克的AI技術,首當其沖就是感知型技術,也就是語音和視覺,包括視覺的感知與理解、語音交互和自然語言理解,因為這代表著機器到底能不能看懂世界,并與人進行交互。解決了這兩個問題,其他問題就可以迎刃而解了。他相信未來兩年內,語音和視覺技術一定會有很大突破。
在曠視科技的主頁上有一段炫酷的「愿景片」,暢想了一個機器理解世界的未來——生活中,門禁、家電和機器人都能認出你的臉,并為你提供個性化的服務;而侵犯人身和財產安全的罪犯將無處可逃;月球上,機器將能實時掃描宇航員眼前的世界,為他呈現出所有細節;當他拾起一塊石頭,其形狀、質地甚至成分將立刻出現在他眼前。年紀不大、夢想不小的曠視科技,正努力為機器植入眼睛和大腦,讓它們為大眾帶來更美好的生活,并次第揭開宇宙的秘密。印奇相信,這將不再是科幻。