首頁

OBD車聯網T-BOX

深度學習：人工智能進入應用階段

2017-03-31 09:16:35 來源：上海證券報熱度:

深度學習是機器學習研究中的一個新領域，其過程是建立和模擬人腦進行分析學習的神經網絡，從而模仿人腦的機制來讀取和分析數據。深度學習被視為當前最接近人工智能的機器學習方法。

2016年初，采用神經網絡與深度學習的AlphaGo戰勝人類圍棋高手，2016年末2017年初，化名Master的AlphaGo在網絡平臺上橫掃中日韓棋壇，取得60連勝輝煌戰績。

在AlphaGo之前，深度學習已開始應用于圖像、聲音和文本的識別以及機器翻譯。在人工智能被提出半個世紀之后，人們終于看到了人工智能進入應用階段的曙光。

從人機大戰說起

從體力上看，機器早早就超過人類，但驕傲的人類覺得在智力上更勝一籌。這種情況似乎正在發生變化，在人機智力對抗中，人類開始處于下風。

第一回合：人類險勝

人與計算機的對抗可以上溯至20世紀70年代，最早是計算機技術人員在實驗室一種休閑娛樂。隨著計算機速度的不斷提高，在整個20世紀80年代和90年代的家用電視游戲機和電腦游戲中都有很多與電腦對抗的棋牌游戲，普通玩家和計算機的對決有輸有贏，而在職業選手或者業余高手面前，虛擬對手不堪一擊。

1996年2月，由IBM開發的超級電腦深藍（Deep Blue）挑戰國際象棋世界冠軍卡斯帕羅夫，在經過7天的比賽之后，深藍以2:4告負。這是歷史上第一次由人工智能挑戰世界頂級棋類選手，深藍輸了比賽卻引起全球對人工智能發展的高度關注，這臺冷冰冰的機器在比賽中并沒有讓世界冠軍好受，卡斯帕羅夫雖然最終贏得比賽，但也宣告了人機對抗中人類勝利的歷史的結束。

第二回合：人類完敗

1996年到2016年的二十年，人類與機器之間進行了三次標志性的競賽，均已人類失敗告終。

1997年，IBM深藍再次挑戰卡斯帕羅夫，雖然離上一次比賽僅僅一年的時間，但世界冠軍這次招架不住了。最終，深藍以3.5:2.5贏得比賽，成為首個在標準比賽時限內擊敗國際象棋世界冠軍的電腦系統，同時也標志著人機智力對抗中，機器已經實現逆轉。

2011年，IBM開發的由90臺Power 750服務器組成的集成服務器沃森（Watson）參加了美國著名綜藝答題節目《危險邊緣》。在三天的比賽里，沃森最終擊敗最高獎金得主魯特爾和連勝紀錄保持者詹寧斯，獲得了100萬美元的獎金。這是人工智能在綜藝節目上第一次擊敗人類選手獲得最高獎金。相對于深藍，沃森需要處理的信息更加復雜，在一些提示信息相對較少的問題面前表現確實不如人類，但是依靠強大數據處理能力和運算速度上的優勢，人類冠軍最終不敵沃森。

如果說1997年深藍的勝利和2011年沃森的勝利主要依靠機器高速的運算能力，人類仍然在模糊數據識別和處理、交流、情感表達等方面勝過機器，特別是，人類的學習能力仍然是機器難以掌握的技能。然而到2016年，這一切都發生了改變。2016年伊始，谷歌宣布其倫敦子公司DeepMind開發的AlphaGo機器人以5:0大勝歐洲圍棋冠軍樊麾，隨后又以4:1比分戰勝世界冠軍韓國圍棋國手李世石。

從2016年底開始，谷歌給世界開了個一個大玩笑，AlphGo化名Master在圍棋網絡平臺上所向披靡，將中日韓的一個個頂尖棋手斬于馬下，取得了60連勝輝煌戰果。圍棋是迄今為止最復雜的棋類游戲，如果機器能夠在圍棋上戰勝人類頂尖選手則意味著至少在棋類游戲上實現了對人類的全面超越。

加入神經網絡的AlphaGo與前輩深藍、沃森的顯著區別是：深藍和沃森都是“教”出來的，IBM的設計員和程序員們從國際象棋大師那里獲得象棋的各種信息，通過一系列算法提煉出特定的規律，再通過預編程灌輸給深藍；沃森也是通過預先設置的邏輯運算理解題目含義并給出可能正確的答案。

相比較，AlphaGo是自己“學”出來的——DeepMind的程序員為它灌輸的不是邏輯規則和方法，而是模擬人腦的學習能力，AlphaGo通過自己不斷的訓練和研究學會圍棋并掌握各種技巧，在比賽中也是根據對手的棋路判斷最優的策略，這一過程和人類學習圍棋并成為高手是相同的。

第三回合：休戰、共贏

今后，人與機器的比賽還會以更加喜聞樂見的形式出現在各種場合，但AlphaGo已經讓絕大多數人認識到人工智能時代即將到來，以及承認機器終將超越人類智慧的現實，人與機器之間不需要再繼續比賽，合作才是人與機器關系的未來。

無論是深藍、沃森還是AlphaGo，其研發的目的遠不止贏得一場比賽。IBM早將深藍和沃森系統應用于藥物研發、金融風險計算等領域。至于輸給深藍的卡斯帕羅夫，并沒有因為失敗而一蹶不振，后來他又拿下了幾乎所有著名國際象棋比賽的冠軍，最后退出國際象棋界后又進軍政界。輸給AlphaGo的李世石人氣大漲，參加各種訪談和綜藝節目，圍棋在韓國年輕人中進一步升溫。人機大戰在比分上表現為人類的完敗，但最終的結果是大家都從中獲利。

計算機怎樣思考：控制派vs仿生派

AlphaGo與深藍、沃森的區別是采用了神經網絡，實現了深度學習。那么神經網絡與深度學習到底是什么？它們的出現對計算機和人工智能的發展到底起到了多大的作用呢？

要了解計算機怎樣思考，不得不提到人工智能之父——阿蘭·麥席森·圖靈，這位生于20世紀初，直到42歲英年早逝時也沒有看到一臺真正意義上計算機的數學天才，提出了著名的“圖靈實驗”，即如果第三者無法辨別人類與人工智能機器反應的差別，則可以論斷該機器具備人工智能。

圖靈之后，對人工智能的研究分化為兩大派別：一是強調思路模擬的控制派；二是強調自我意識的仿生派。簡單而言，控制派認為人工智能就如同一個專家會議，希望通過完美無缺的邏輯來實現思考；而仿生派認為人工智能就是人腦，人腦怎樣思考，計算機大腦就怎么思考。

1948年，美國應用數學家諾伯特·維納的著作《控制論》出版，他開啟的控制論（cybernetics）被稱作20世紀最偉大的科學成就之一，同時也被尊為人工智能中控制派的鼻祖。維納的學生邁克爾·阿比卜出版了控制論的科普讀物《大腦、機器和數學》，并隨后創辦了麻省理工大學計算機系。

1951年，后來獲得第一屆圖靈獎的美國科學家馬文·明斯基創造了一臺學習機——Snare，從中發現了在當時看來神經網絡致命的弱點。明斯基的另一個重大貢獻是與另兩位在計算機領域聲名顯赫的人物——麥卡錫、香農創辦了第一個人工智能學術性團體“達特茅斯會議”。2016年初，明斯基去世，享年89歲，三天以后，谷歌宣布采用深度學習的AlphaGo戰勝歐洲圍棋冠軍。

如果要追溯仿生派的起源，則早在圖靈實驗提出之前的1943年，美國科學家麥卡洛可和皮茨就發表了模擬神經網絡的論文。1949年，加拿大心理學家赫布提出了著名的“赫布理論”，即突觸前神經元向突觸后神經元的持續重復的刺激可以導致突觸傳遞效能的增加，這一理論直到2000年才在動物實驗中被證實。1958年，美國實驗心靈學家羅森布拉特在計算機上成功模擬了被稱為“感知機”的神經網絡模型。感知機能夠處理一些簡單的視覺信號，雖然還非常粗糙和初級，但可以說第一次實現了對人腦的成功模擬。

可惜的是，在羅森布拉特發明“感知機”后長達20多年的時間里，神經科學和信息科學并沒有很好的結合，兩者各有成就，但仿生派始終不敵控制派。直到20世紀80年代，仿生派才進入一個繁榮時期，其中以1982年霍普菲爾德提出了遞歸神經網絡，和1986年魯姆哈特和麥克萊蘭提出了具有里程碑意義的BP神經網絡為代表。

在20世紀90年代，互聯網興起和普及，大批計算機科學家投入到有巨大市場和經濟效益的互聯網相關研究中，無論是控制派還是仿生派取得的成就都被互聯網的高速發展所掩蓋，當然，互聯網作為新的信息技術手段也對人工智能的進步提供了全新的平臺。

2006年，杰弗里·辛頓提出了反向傳播算法和對比散度算法，即“深度學習”，突破了明斯基在半個世紀前提出的神經網絡存在的局限。2012年，斯坦福大學和谷歌秘密X實驗室用1000臺計算機構建了全球最大的電子模擬神經網絡，該網絡擁有10億個連接的人工神經網絡“谷歌大腦”。實驗人員向神經網絡展示1000萬斷（張）從YouTube上隨機提取的圖像，最后，系統在沒有任何外界干預的情況下，認識到了“貓”是什么并成功分辨出貓的照片，準確率超過80%，這一事件為人工智能發展翻開嶄新一頁，標志著以“深度學習”為代表的人工智能發展即將進入應用階段。

開掛的機器學霸

要真正理解神經網絡、深度學習的原理需要高深的生物學、數學和電子信息方面的知識，在很多專業性很強的書籍、文章中能找到答案。這里，我們希望通過簡單的語言對神經網絡、深度學習等相關概念進行通俗易懂的描述。

1．對人腦的仿生：人工神經網絡的構建

人腦的神經元（神經細胞）由三個主要部分組成：樹突負責信息的輸入、細胞體負責處理信息、軸突則負責處理后信息的輸出。當神經元接受到外界刺激時，經過內部的信息處理，將結果輸出，這個過程看起來非常簡單，但卻是人腦思維形成的最基本過程。如果將算法賦予電子元件（例如CPU），并通過信號通道將這些電子元件與傳感器、輸入設備以及相互之間進行鏈接可以模擬出人腦的神經網絡。計算機的硬件技術飛速發展，使得構建大規模的人工神經網絡成為可能，在未來出現能夠比擬甚至超過人腦的人工神經網絡是完全有可能的。

以一個最簡單的對蘋果還是梨的判斷來說明神經網絡工作的原理。顏色、形狀和氣味是判斷一個水果是蘋果還是梨所需要的最基本的特征，當這些信息通過視覺、味覺或者傳感器進入神經元，人腦（或者電腦）根據以往的經驗，如果信息表現為紅色、圓形、蘋果味，那么最后的結果就是蘋果。

這個過程看起來非常簡單，但對于一個未加訓練的人工神經網絡來說，發生錯誤是難免的。例如，并不是所有的蘋果都是紅色，有的蘋果是黃色，和梨的顏色非常接近；有的梨的形狀和蘋果也很接近；嫁接的新品種蘋果梨到底算蘋果還是梨，等等。當這些因素出現時，對人工神經網絡來說是巨大考驗，很容易給出錯誤的答案。

如何減少上述情況出現導致的錯誤呢，這就需要深度學習的幫助。

2．對學習的仿生：深度學習如何開展

在一系列殘酷的動物實驗之后，生物學家發現了人腦對外界刺激的識別是一個抽象和迭代的過程。例如，對一個靜止圖像的識別，最開始是對圖像主體物邊緣的識別，然后抽象到一些具體特征，最后才是對各種特征抽象和概念化以得到準確的意義。這一生物學發現意義重大，促成了人工智能在21世紀有了突破性的發展。

如果人腦的工作原理是從“淺層”的識別開始的，并將淺層識別的結果作為更高一層識別的輸入信息，那么計算機搭建的人工神經網絡是不是也可以仿效人腦進行工作呢？答案是肯定的。1996年，康奈爾大學在收集的大量黑白風景照片中每張隨機提取16 16像素的方格，然后從任意一張風景照片中再提取一個16 16像素的方格進行比較，結果發現，包含物體邊緣的方格是最容易找到非常接近的方格的。換句話說，“邊緣”是識別一張風景圖片的起點。這一實驗證明對復雜事物的識別了從最基本“淺層”信息入手是有效和可行的。類似的實驗后來被應用于語音識別，同樣，“邊緣”是識別一條語音最基本的“淺層”信息。

在一個單個神經網絡，從信息輸入到信息輸出中間雖然有多個神經元，但都處于同一“層次”上，我們暫且稱之為“淺層神經網絡”，以區別于“深層神經網絡”。識別蘋果和梨貌似很簡單，但對于人工神經網絡則需經歷一個復雜的過程。如果想讓一個單層次的神經網絡發揮作用，一個方法是由人來告訴計算機形狀、顏色和味道信息，神經網絡只做最后的一次判斷。這樣的做法似乎很可笑，但并非完全無用。

信息管理和數據挖掘中經常會使用到淺層神經網絡，但前提是由信息管理專業的學生手工或使用軟件將數據挖掘的材料準備好，這就如同由人來幫助人工神經網絡判斷水果形狀、顏色和味道，通過人工參與彌補淺層神經網絡局限性的方法。當人工智能的應用范圍擴大，越來越多需要借助人工智能幫助的人員并非信息管理專業的學生，淺層神經網絡已經跟不上形勢和需要了。2006年，人工神經網絡發展有了轉折點，辛頓等研究人員提出了深度信念網絡（Deep Belief Network，DBN），實現了對人腦多層神經網絡信息處理、分析和學習的模擬，這推動了人工智能研究和應用向前邁進了一大步。

多層次的神經網絡是實現深度學習的基礎，那么與傳統的神經網絡比較，深層神經網絡又哪些特點呢？深度學習又是如何在深層神經網絡上展開的呢？

與傳統的神經網絡相同的是，深層神經網絡也包括輸入層、隱層和輸出層，也只有相鄰層級之間的神經元有鏈接通道，同一層及跨層之間是沒有鏈接的。區別在于，深層神經網絡具有更多層級數量，并且具有更有效的算法，更加接近人腦的結構，這使得深層神經網絡能夠處理更加復雜的輸入信息，深度學習就是在這個多層級的人工神經網絡上進行的。

在搞清楚深層神經網絡如何進行深度學習之前，還要區別兩個重要的概念：監督學習和非監督學習。簡單而言，監督學習就是有人指出學習結果正確與否的學習。想象一下，當幼兒第一次看到蘋果的時候，會建立一個包含蘋果各種特征的概念；當下一次再看到蘋果時，會加入對蘋果新的概念，例如蘋果并不都是紅色的，還有黃色的、白色的、綠色的蘋果，還有多種顏色混合的蘋果。這期間，有可能會看到梨、橙子、乒乓球等與蘋果在某些特征上相似的物體，幼兒可能把這些東西也認為是蘋果，家長會指出錯誤，幼兒調整對蘋果的認識，判斷越來越準確。是不是很簡單，這其實也是半個多世紀之前“感知機”的工作原理，通過不斷優化不同輸入信息的權重以實現更加準確的判斷。

上述監督學習的過程，很容易忽略一個重要的前提條件，機器為什么知道通過形狀或者顏色去判斷一個物體是不是蘋果，形狀、顏色、氣味是人基于經驗對蘋果賦予的“特征”屬性，但機器并不知道這些就是蘋果的特征。過去，一般由人來幫助機器先期定義“特征”，但由人參與對“特征”的選取是一件極其繁瑣和耗費時間的工作，并且在面對未知事物的時候，一開始也無規律可循。在輸入信息越來越復雜的情況下，人工選取特征已經難以為繼了，由機器自動學習特征似乎是更好的做法，多層神經網絡上進行的非監督學習能夠完成這一過程。

非監督就如同一個沒有家長在旁邊指導的幼兒學習過程，其目的是推斷出信息的內在數據規律。例如，幼兒在看到很多次蘋果之后，會把具有一些圓形、紅色、特殊味道的一類物體歸為一類（雖然并不知道這就叫蘋果）并與其他的水果區別開來，這個過程一是實現了聚類，更重要的是完成了特征學習，幼兒知道應該抓住哪些“特征”來判斷一個物體是不是蘋果。機器的非監督學習有類似的過程，在多層人工神經網絡上對每一層級進行非監督學習，這是深度學習與傳統神經網絡最大區別，這一過程被稱作特征學習。

我們可以總結出一個簡化的深度學習過程：在深層神經網絡中，采用無監督學習對每一層逐層進行訓練，讓機器不斷學習這一層次需要識別的特征；每一層訓練的結果作為更高一層集的輸入信息直至最頂層；在最頂層，使用監督學習自上而下對各個層級的參數、權重、模型、算法進行微調。這一過程反復進行，直到達到一定準確度。與傳統的機器學習比較，深度學習能夠不需要人類幫助提取特征，這提高了學習的自主性和學習效果。

在實際應用中，對圖像的識別、對聲音的識別，或者像AlphaGo那樣學習圍棋采用的具體方法有很多，但大致的原理是相同的，只是過程和算法更加復雜。

會學習的機器能有多智能

這么多科學家的努力、巨額的研發經費投入，結果就是具備一個三歲小孩就能夠熟練掌握的技能——把蘋果和梨區分開來，這是不是有點得不償失。千萬不要低估這看似簡單的一步，要知道，在人不介入的情況下，使機器準確區分蘋果和梨，幾代科學家已經為之奮斗了半個多世紀且到目前為止也不能做到100%準確。計算機在運算速度上具有遠超過人類的優勢，且這種優勢不斷擴大，其“學習”的速度也是驚人的，這使得人工智能在多個領域進入應用階段，也成就了本章開篇提到的AlphaGo。

例如，在圖像和語音識別領域，谷歌、微軟、IBM、百度等公司近年來加強了深度學習的研究和商業應用。谷歌采用深度學習技術在計算機視覺挑戰比賽中刷新了分類和偵測的紀錄，且比之前的紀錄提高了兩倍多。谷歌在其視圖軟件中嵌入人工智能模塊，實現了對字符、人臉、地標、等進行幾乎精確的識別。

微軟宣布其圖像識別系統的錯誤率僅為4.94%，這不僅打破了之前百度創造的5.98%和谷歌創造的6.66%紀錄，甚至低于人類在歸類識別時5.1%的錯誤率。百度也發布了基于深度學習的語音識別系統“Deep Speech”，該系統能夠模仿人類大腦新皮層中的神經活動，出錯率比谷歌、微軟和蘋果的系統低10%以上。

深度學習一個有意思的應用是預測分析。與傳統的邏輯推導不同，通過深度學習的預測分析結果令人驚訝但卻異常準確。2014年巴西世界杯期間，各方人士都在預測比賽結果，在小組賽后的15場淘汰賽中，微軟利用深度學習的方法的預測結果全部準確無誤，而谷歌的預測也猜中了其中14場比賽結果，這樣的預測準確率顯然要比2008年法國世界杯的章魚保羅，和一貫烏鴉嘴的貝利靠譜得多。

深度學習是機器學習的新浪潮，也是人工智能發展的一個里程碑，雖然深度學習已經在語音識別、圖像識別、預測分析、機器翻譯等領域小試身手，但客觀上講還處于襁褓階段，無論是理論研究還是工程化商業化還面臨巨大的難題。誰也不能保障深度學習在未來是否能夠成為人工智能最基礎的方法，或許會有新的更好的技術替代深度學習，但是可以肯定的是，人工智能的夢想不再遙遠，機器將在不久的將來像人類一樣思考。

下一篇：醫學人工智能在中國漸成燎原之勢上一篇：李開復：人工智能領域有“七大黑洞”

責任編輯：黃焱林

人工智能深度學習

亚洲网站免费_国产一区二区三区在线看麻豆 _国产精品毛片一区二区三区 _麻豆精品网站

深度學習：人工智能進入應用階段

相關推薦