論人工智能的泡沫、價值與應(yīng)用困境

“我準(zhǔn)備考慮一個問題:‘機器能思維嗎?’”—阿蘭.圖靈,1950,《Computing Machinery and Intelligence》
前段時間在忙著煉丹(Deep Learning),還有幾場大數(shù)據(jù)培訓(xùn),很久沒有動筆了。今天想和大家談?wù)勅斯ぶ悄埽ˋrtificial Intelligence, AI),2017可謂人工智能元年,AI領(lǐng)域風(fēng)投和創(chuàng)新、創(chuàng)業(yè)風(fēng)起云涌,深度學(xué)習(xí)研究和應(yīng)用持續(xù)火爆,以Facebook小扎和Tesla鋼鐵俠為代表的大佬們站隊互掐,AlphaGo的成功營銷與Watson的失敗應(yīng)用,國內(nèi)BAT紛紛推出人工智能戰(zhàn)略等等…這一波大數(shù)據(jù)驅(qū)動的AI熱潮,發(fā)展勢頭強勁。下圖是從我培訓(xùn)課件里截的,稱之為四位一體看數(shù)據(jù)技術(shù)(Data Technology, DT),可以說AI高燒是大數(shù)據(jù)發(fā)展的必然。
圖1 四位一體看DT
從上圖可以看出,這些年從物聯(lián)網(wǎng),云計算,大數(shù)據(jù)到現(xiàn)在的人工智能,一個比一個熱,這是DT前沿信息技術(shù)發(fā)展的大勢,其內(nèi)在的邏輯聯(lián)系和發(fā)展趨勢使然,終極目標(biāo)直指人工智能。這就好比我們?nèi)梭w一樣,物聯(lián)網(wǎng)(移動互聯(lián)網(wǎng))構(gòu)造了眼耳鼻舌身等感官,大數(shù)據(jù)是各種感官獲取的感受信息,云計算是記憶存儲,人工智能就是我們的認(rèn)知決策。IT和DT技術(shù)發(fā)展本質(zhì)是在擬人化、智能化,智能時代一定會到來是毫無疑問的,但是,發(fā)展過程也不要太樂觀。
一、人工智能源起:圖靈的智能之問
我在之前的文章里有講到:
“大數(shù)據(jù)時代,我們周圍充斥著各種不同的理論、知識、信息和噪音,數(shù)據(jù)爆炸式增長和科技高速發(fā)展所帶來的沖擊,加大了未來的不確定性。當(dāng)我們接收的數(shù)據(jù)和信息越多,面臨的選擇就越多,如若不善于過濾、挖掘和處理,對各種決策就可能會造成負(fù)面影響,當(dāng)然也會放大我們對未來不確定性的恐懼。如何從混沌中發(fā)現(xiàn)規(guī)律,成為預(yù)測未來的“先知”,抑或是少出幾只黑天鵝?是歷代人類的夢想,不管是古人的占卜、算命還是現(xiàn)在的專家系統(tǒng)、商業(yè)智能、數(shù)據(jù)挖掘、機器學(xué)習(xí)、人工智能、智慧地球、智慧城市等技術(shù)和應(yīng)用,都源于我們對未來不確定性的恐懼。”
如何降低決策過程中的不確定性,通過智能技術(shù)進(jìn)行前瞻預(yù)測是關(guān)鍵,不管是物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算還是DT偌大的技術(shù)生態(tài)體系,其核心都是為這一目標(biāo)服務(wù)。從這個角度講,傳統(tǒng)商業(yè)智能應(yīng)用90%失敗這一論斷是有道理的,因為基礎(chǔ)的數(shù)據(jù)管理和常規(guī)的統(tǒng)計分析,不能稱之為智能,換句話說沒有成熟機器學(xué)習(xí)技術(shù)的支撐和成功應(yīng)用,要說多智能那就是忽悠(后面我會講IBM Watson的問題)。
機器如何智能,系統(tǒng)如何智能,可謂仁者見仁智者見智。我們先來看圖靈是如何定義這一問題的。作為計算機科學(xué)和人工智能領(lǐng)域的先驅(qū),圖靈在1950年發(fā)表的著名論文《Computing Machinery and Intelligence》中,詳細(xì)討論了機器能否擁有智能這一問題,但也只是個開放性的討論,其實圖靈也未能定義什么是智能(但提出了著名的“圖靈測試”)。
在1956年的DARTMOUTH學(xué)術(shù)會議上,AI被正式提出,定義為:
“研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門技術(shù)科學(xué)。通過了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器,人工智能可以對人的意識、思維的信息過程進(jìn)行模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過人的智能。智能涉及到諸如意識、自我、思維、心理、記憶等等問題。”
由于我們對人類智能本身還知之甚少,所以人工智能的發(fā)展比預(yù)想的要慢很多。圖靈當(dāng)時也做了個比較樂觀的預(yù)測,他預(yù)測在2000年左右,機器極有可能會通過“圖靈測試”,擁有初步的智能行為,現(xiàn)在看來這一時間是延后了,從當(dāng)前自然語言處理領(lǐng)域的發(fā)展現(xiàn)狀及問題來看,要解答圖靈的智能之問,還需要AI研究人員多年的努力。
二、人工智能泡沫:神經(jīng)網(wǎng)絡(luò)“三起三落”的啟示
從歷史來看,重大科學(xué)的研究往往呈螺旋形上升的過程,不可能一蹴而就,每一次基礎(chǔ)科學(xué)研究的重大進(jìn)步,科技應(yīng)用的重大突破,往往先由一兩個領(lǐng)軍人物偶然點破,而后大家蜂擁而至,在很短的時間內(nèi)做出大量更具突破性的成果,同時帶來相關(guān)產(chǎn)業(yè)界的革命性增長。
經(jīng)歷過“三起三落”的人工神經(jīng)網(wǎng)絡(luò),能夠在換馬甲為深度學(xué)習(xí)后成功逆襲,正是機器學(xué)習(xí)領(lǐng)域幾十年來積累誕生的重大科學(xué)研究和工程應(yīng)用成果,當(dāng)前深度學(xué)習(xí)被看作是通向人工智能的關(guān)鍵技術(shù),被寄予厚望。
圖2 神經(jīng)網(wǎng)絡(luò)的“三起三落”
我在10多年前對神經(jīng)網(wǎng)絡(luò)和支持向量機兩個機器學(xué)習(xí)方向都有過粗淺的學(xué)習(xí)和了解,見證了神經(jīng)網(wǎng)絡(luò)研究三起三落其中的一段時光,見證了以支持向量機為代表的淺層學(xué)習(xí)技術(shù)的火爆,但卻始終少有看到機器學(xué)習(xí)技術(shù)真正走出實驗室,直到最近幾年,神經(jīng)網(wǎng)絡(luò)換馬甲為深度學(xué)習(xí)后成功逆襲,使得機器學(xué)習(xí)領(lǐng)域這幾十年來積累的成果,得以逐漸走出實驗室,在學(xué)術(shù)界研究和產(chǎn)業(yè)界應(yīng)用都一鳴驚人,并有望引領(lǐng)人工智能關(guān)鍵技術(shù)的跨越式發(fā)展。
圖3 人工智能的泡沫
但從另一方面看,神經(jīng)網(wǎng)絡(luò)的三起三落也就代表了人工智能的三個泡沫期,這給過分熱衷深度學(xué)習(xí)技術(shù)與人工智能研究應(yīng)用的人來講,也是該降降溫的,期望越大,失望越大,畢竟深度學(xué)習(xí)技術(shù)沒有想象中的那么強大,至少在智能算法層面的突破很有限(主要靠的還是大數(shù)據(jù)和計算力)。
換個角度看,深度煉丹術(shù)的興起,會不會是因為機器學(xué)習(xí)算法研究幾十年遲遲無重大進(jìn)展,神經(jīng)網(wǎng)絡(luò)算法的一點小改進(jìn)(正好遇到了大數(shù)據(jù)與GPU)就被當(dāng)做了救命稻草? 或者說即使神經(jīng)網(wǎng)絡(luò)的深度架構(gòu)碰巧撞到了類腦學(xué)習(xí)機制,但我們能全面解碼它嗎?不太了解神經(jīng)科學(xué)的研究水平,這個需要大家去悟了。
三、人工智能價值:弱AI不弱,強AI難強
AI目前的發(fā)展還處于弱AI(Artificial Narrow Intelligence ,ANI)階段,但弱AI并不弱,如阿爾法狗一樣,雖然只擅長某一方面的智能,但在這方面已然超過人類了。近年來,弱AI已經(jīng)極大促進(jìn)了信息化與智能化的發(fā)展,在很多領(lǐng)域提高了生產(chǎn)效率。如工業(yè)機器人、醫(yī)療機器人、智能問答、自動駕駛、疾病診斷、自動交易等系統(tǒng)工具,極大提高了生產(chǎn)力。
弱AI不能像人類一樣靠理性或感性進(jìn)行推理和解決各方面(哪怕很簡單)問題,機器只不過看起來像是智能的,其實只是既定程序的執(zhí)行而已,只能解決某一方面的問題(就像下圍棋不能代表會下象棋),不會有自主意識,不會有創(chuàng)造性。而強AI(Artificial General Intelligence ,AGI)的定位是在各方面相當(dāng)于人類或者超過人類,也稱為通用人工智能。
現(xiàn)階段的人工智能研究和應(yīng)用主要聚焦在弱AI,強AI的研究可以說還是停滯不前,難有進(jìn)展。
強AI能否實現(xiàn)還是未知,但要論人工智能的價值,我認(rèn)為很有必要對兩者進(jìn)行對比,首先我個人是不支持發(fā)展強AI的,除非對其有絕對的控制能力,除非人類遇到了全球性災(zāi)難或需要星際移民,不然強AI出世就很可能是另外一種原子彈,絕對是弊大于利。
弱AI幫助人類,是我們的好助手,能提高我們的生產(chǎn)效率和生活水平,強AI超過或代替人類,將是大部分人類的“終結(jié)者”,至少是勞動終結(jié)者,總不可能幾十億人都去從事藝術(shù)職業(yè)吧?當(dāng)然弱AI發(fā)展也會面臨這一挑戰(zhàn),但更可控和緩和很多。
四、人工智能應(yīng)用困境:先要搞清楚幾個關(guān)鍵問題
隨著機器學(xué)習(xí)、深度學(xué)習(xí)和人工智能相關(guān)技術(shù)(強化學(xué)習(xí)、遷移學(xué)習(xí)、對抗學(xué)習(xí)等)的高速發(fā)展。阿爾法狗與人類頂尖棋手的人機大戰(zhàn),也注定成為人工智能的里程碑事件,當(dāng)AI變得越來越復(fù)雜,越來越聰明,以至于在多個領(lǐng)域全面超越人類的時候,那時的AI會是提高人類生產(chǎn)力和生活質(zhì)量的好助手?抑或是徹底控制奴役人類的天網(wǎng)?現(xiàn)在還難以下結(jié)論,但可以肯定的是接下來數(shù)十年里AI對人類生活造成的沖擊將是巨大的。不管是技術(shù)層面還是產(chǎn)業(yè)應(yīng)用層面,要對人工智能領(lǐng)域有個全面準(zhǔn)確的理解和把握,可以說十分困難。下面提幾點個人認(rèn)為比較關(guān)鍵的問題供大家探討。
(1)現(xiàn)在是人工智能的“黃金”時代嗎?
這個問題乍看是廢話,現(xiàn)在AI這么火,當(dāng)然是黃金時代啦。從人工智能的三起三落來看,現(xiàn)在是處于技術(shù)和產(chǎn)業(yè)發(fā)展的波峰。而這一熱潮的興起一是得益于深度神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,二是通過物聯(lián)網(wǎng)和移動物聯(lián)網(wǎng)等技術(shù),大數(shù)據(jù)的爆炸式增長成為常態(tài)。三是大數(shù)據(jù)分析預(yù)測是解決不確定性問題的必然,大數(shù)據(jù)條件下的復(fù)雜性問題,越來越難以應(yīng)用傳統(tǒng)建模技術(shù)加以解決,而客觀世界的復(fù)雜性,傳統(tǒng)的機械模型更是難以分析和預(yù)測。
圖4 農(nóng)業(yè)時代到智能時代
工業(yè)時代通過機械動力優(yōu)化,放大了我們的體力,我們得以改造物理世界;智能時代通過算法優(yōu)化,放大了我們的腦力,將極大改造我們的腦力世界。從人類社會發(fā)展大趨勢來看,現(xiàn)在稱之為AI黃金時代并不為過。
但這里有個不確定性,那就是AI技術(shù)發(fā)展的瓶頸問題,深度學(xué)習(xí)技術(shù)能否擔(dān)當(dāng)重任,能否一鼓作氣有更大的突破,或者幾年后又得停滯不前幾十年,都有可能。
但可以肯定的是,對弱AI來講,現(xiàn)在是再好不過的黃金時代,興起的投資熱潮也是看到了各個垂直領(lǐng)域應(yīng)用弱AI的極大潛力;對強AI來講,面臨的技術(shù)瓶頸短期內(nèi)難以突破,不過有沒有可能多年后冒出個終極算法,全面解決類腦學(xué)習(xí)問題?不是沒有可能,只是幾率很小。
(2)人工智能的應(yīng)用成熟度?
盡管人工智能的發(fā)展已經(jīng)超過50年,但仍然還處于一個比較早期的發(fā)展階段,其應(yīng)用主要集中在弱AI和垂直行業(yè)相結(jié)合的領(lǐng)域。
從產(chǎn)業(yè)鏈上看,人工智能產(chǎn)業(yè)鏈包括基礎(chǔ)支撐技術(shù)(如大數(shù)據(jù)、云計算等)、人工智能技術(shù)(機器學(xué)習(xí)、深度學(xué)習(xí)等)及人工智能應(yīng)用(語音、對話、識別等)三個層面,其中基礎(chǔ)技術(shù)支撐由數(shù)據(jù)中心及運算平臺構(gòu)成,即計算智能階段,包括數(shù)據(jù)傳輸、運算、存儲等;
人工智能技術(shù)是基于基礎(chǔ)層提供的存儲資源和大數(shù)據(jù),通過機器學(xué)習(xí)建模,開發(fā)面向不同領(lǐng)域的應(yīng)用技術(shù),包含感知智能及認(rèn)知智能兩個階段,感知智能如語音識別、圖像識別、自然語音處理和生物識別等,認(rèn)知智能如機器學(xué)習(xí)、強化學(xué)習(xí)、對抗學(xué)習(xí)、自然語言理解等;
人工智能應(yīng)用主要為人工智能與傳統(tǒng)產(chǎn)業(yè)相結(jié)合,以實現(xiàn)不同場景的應(yīng)用,如機器人、無人駕駛、智能家居、智能醫(yī)療、智能問答等領(lǐng)域。
從上述幾個方面可以看出,AI產(chǎn)業(yè)鏈的應(yīng)用成熟度取決于關(guān)鍵技術(shù)在垂直領(lǐng)域的突破,如果想靠大規(guī)模投資來快速推進(jìn)AI技術(shù)的突破是不現(xiàn)實的,而是要反推,技術(shù)成熟一個再應(yīng)用一個,這樣比較穩(wěn)妥。
圖5 谷歌產(chǎn)品線應(yīng)用深度學(xué)習(xí)技術(shù)
(3)人工智能的技術(shù)成熟度?
這一波人工智能的發(fā)展,大數(shù)據(jù)處理、深度學(xué)習(xí)和GPU計算三個方面的技術(shù)起到了關(guān)鍵的推動作用。大數(shù)據(jù)的采集、基礎(chǔ)管理和云計算、GPU計算等技術(shù)應(yīng)該說比較成熟了。突破智能的難點還是在機器學(xué)習(xí)。
我在前文反復(fù)提到過,不談機器學(xué)習(xí)的智能技術(shù)多是在耍流氓。作為機器學(xué)習(xí)的子領(lǐng)域,深度學(xué)習(xí)雖然很牛,但它還是神經(jīng)網(wǎng)絡(luò)那套算法理論,幾十年前就提出來了,換句話說還是在啃老本啊。不管是支持向量機、貝葉斯、決策樹等淺層學(xué)習(xí)算法,還是深度網(wǎng)絡(luò)衍生出來的深度強化學(xué)習(xí)、遷移學(xué)習(xí)、對抗學(xué)習(xí)等,大部分理論、算法在幾十年前的人工智能教材上都能找到,唯一不同的加了個深度,有強大的計算力支持,能處理大數(shù)據(jù)了。
圖6 人工智能與機器學(xué)習(xí)
近年來的人工智能開源框架更是基本等同于深度學(xué)習(xí),雖然TensorFlow、Keras、MXNet等深度學(xué)習(xí)框架備受開發(fā)人員推崇,但還是缺乏完整的人工智能技術(shù)鏈,深度學(xué)習(xí)被捧得太高不是好現(xiàn)象,傳統(tǒng)的知識庫、專家系統(tǒng)和規(guī)則式AI與深度強化、遷移、對抗等學(xué)習(xí)的融合才是AI發(fā)展的正途,另外從芯片、算法、平臺、架構(gòu)到應(yīng)用等方面來看,弱AI要全面開花落地都還有較長的路要走。
再就是浮夸風(fēng)問題,一些科技媒體抱著Arxiv的某篇論文,就能說解決了某重大應(yīng)用問題,十分不嚴(yán)謹(jǐn)。如果要給AI技術(shù)成熟度打個分的話,個人認(rèn)為總分100分的話最多算70分,而且還是抱了深度學(xué)習(xí)的大腿。至于深度學(xué)習(xí)技術(shù)發(fā)展的后勁如何,短時間內(nèi)是否發(fā)展成為Musk所說的那樣可怕,那要看IT巨頭們機器農(nóng)場中深度網(wǎng)絡(luò)的工程能力和“進(jìn)化”速度了,沒有大數(shù)據(jù)資源和大規(guī)模計算資源的一般研究機構(gòu)和人員是很難知曉的。
(4)大數(shù)據(jù)如何助力人工智能?
在提這個問題之前,大家可以思考一下,有沒有非數(shù)據(jù)驅(qū)動的智能?換句話說,如果沒有大數(shù)據(jù),除了專家系統(tǒng)和規(guī)則式AI,人工智能怎么發(fā)展?能否在智能學(xué)習(xí)方面有所突破?現(xiàn)階段的AI多是數(shù)據(jù)驅(qū)動的AI,因為沒有數(shù)據(jù)的喂養(yǎng),就沒有深度學(xué)習(xí)的成功。
數(shù)據(jù)驅(qū)動的AI離不開大數(shù)據(jù),大數(shù)據(jù)與AI是一種共生關(guān)系:
- 一方面,AI基礎(chǔ)理論技術(shù)的發(fā)展為大數(shù)據(jù)機器學(xué)習(xí)和數(shù)據(jù)挖掘提供了更豐富的模型和算法,如深度神經(jīng)網(wǎng)絡(luò)衍生出的一系列技術(shù)(深度學(xué)習(xí)、強化學(xué)習(xí)、遷移學(xué)習(xí)、對抗學(xué)習(xí)等)和方法;
- 另一方面,大數(shù)據(jù)為AI的發(fā)展提供了新的動力和燃料,數(shù)據(jù)規(guī)模大了之后,傳統(tǒng)機器學(xué)習(xí)算法面臨挑戰(zhàn),要做并行化、要加速要改進(jìn)。當(dāng)前的弱AI應(yīng)用都遵從這一技術(shù)路線,繞不開大數(shù)據(jù)。
那么怎么做非數(shù)據(jù)驅(qū)動的AI呢?傳統(tǒng)的規(guī)則式AI可以說是非數(shù)據(jù)驅(qū)動的,更多靠人工內(nèi)置的經(jīng)驗和知識驅(qū)動,不過它最大的問題也是要人工介入,而且很難具有學(xué)習(xí)能力,靠的知識、記憶和經(jīng)驗建立的規(guī)則體系。強AI的目標(biāo)是機器智能化、擬人化,機器要完成和人一樣的工作,那就離不開知識、記憶和經(jīng)驗,也離不開通過知識、經(jīng)驗和記憶建立起來的認(rèn)知體系(經(jīng)驗規(guī)則、知識本體)。
從這個角度講,強AI要實現(xiàn)只靠深度學(xué)習(xí)還不夠,但也不能繞過深度學(xué)習(xí),通過深度學(xué)習(xí)進(jìn)行物理世界基礎(chǔ)知識的初步監(jiān)督式或半監(jiān)督學(xué)習(xí)(幼兒要人教),深度學(xué)習(xí)掌握的知識必須要能存儲記憶并形成經(jīng)驗規(guī)則,只有這樣遇到新的問題之后,才能智能響應(yīng)(小孩通過知識經(jīng)驗的積累,不再需要人教而能自我學(xué)習(xí))。這需要學(xué)習(xí)、存儲、記憶、推理和構(gòu)建知識體系,所以說強AI短期要實現(xiàn)很困難。
(5)深度學(xué)習(xí)的“深”與“淺”?
首先我們來看深度學(xué)習(xí)的“淺”,深度學(xué)習(xí)的核心理論還是基于淺層神經(jīng)網(wǎng)絡(luò)的堆疊,核心技術(shù)本身并無新意,Hinton也只是做了有限的改造和提升。另外,偉大的東西往往很簡單,好比愛因斯坦的EMC方程,深度學(xué)習(xí)是一種樸素、簡單、優(yōu)美而有效的方法:像小孩搭積木一樣簡單地構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu);性能不夠,加層來湊的樸素思想,這種標(biāo)準(zhǔn)化、易用性的處理架構(gòu),極大降低了機器學(xué)習(xí)的難度,當(dāng)然最關(guān)鍵還是應(yīng)用效果。從這個角度理解,深度學(xué)習(xí)并無深意,只是對傳統(tǒng)淺層神經(jīng)網(wǎng)絡(luò)做了少量改造。
再來看深度學(xué)習(xí)的“深”,在我看來,深度學(xué)習(xí)絕不只是幾個具體算法、模型那么簡單,而是一種仿人腦多層異構(gòu)神經(jīng)元連接網(wǎng)絡(luò)的機器學(xué)習(xí)思想、方法論和技術(shù)框架(可能會從傳統(tǒng)機器學(xué)習(xí)學(xué)科中分離出來,傳統(tǒng)淺層學(xué)習(xí)模型的深度化是一大研究趨勢)。各類深度學(xué)習(xí)網(wǎng)絡(luò)的變異、進(jìn)化、融合,結(jié)合GPU超級計算將是未來現(xiàn)實大數(shù)據(jù)條件下大規(guī)模機器學(xué)習(xí)的重要方向,特別是海量多模態(tài)大數(shù)據(jù)條件下的機器學(xué)習(xí),沒有深度架構(gòu)只靠淺層學(xué)習(xí),將無法支撐大數(shù)據(jù)條件下自動特征學(xué)習(xí)、模型的有效表達(dá)和記憶存儲。
當(dāng)然,深度學(xué)習(xí)在當(dāng)前看來是通向現(xiàn)實人工智能的一條有效途徑,但不應(yīng)該是一種包羅萬象的解決方案。盡管深度學(xué)習(xí)的能力相比傳統(tǒng)機器學(xué)習(xí)技術(shù)很強,但和真正的人工智能目標(biāo)相比,仍然缺乏諸多重要的能力,如復(fù)雜的邏輯推理、知識抽象、情感經(jīng)驗、記憶和表達(dá)等。不過深度學(xué)習(xí)發(fā)展現(xiàn)在還處于初級階段,能否真正實現(xiàn)類腦計算解碼還需要時日加以驗證;另外,隨著深度學(xué)習(xí)的網(wǎng)絡(luò)形式和深度架構(gòu)的逐步演進(jìn), 與基于經(jīng)驗知識庫的規(guī)則式AI相結(jié)合,能否形成終極的類腦學(xué)習(xí)框架,讓我們拭目以待。
(6)Tesla鋼鐵俠和Facebook小扎到底在爭個什么?
前段時間,Tesla鋼鐵俠Musk與Facebook小扎進(jìn)行了一場誰不懂AI的嘴炮對決,大佬們紛紛站隊,貌似支持小扎的大佬要多一些?他倆到底爭個啥,在我看來絕不是單純的AI技術(shù)問題,而是在討論強AI的可能性和強AI的覺醒時間。
李嘉誠邀請阿爾法狗創(chuàng)始人戴密斯·哈薩比斯(Demis Hassabis)給他講課,日本軟銀孫正義計劃幾百億只投資人工智能相關(guān)項目,都是在押寶這一問題。
其實弱AI與強AI的二元劃分不是太合理,我們都知道技術(shù)的發(fā)展是個量變到質(zhì)變的過程,弱到強之間難有技術(shù)分水嶺,就像神經(jīng)網(wǎng)絡(luò)的三起三落,十年前沒有大數(shù)據(jù)支持,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)效果不佳就說他弱嗎?現(xiàn)在換了個馬甲,因為有大數(shù)據(jù)了,學(xué)習(xí)效果好太多了就說它強嗎?某一方面的技術(shù)不能說明問題,一個領(lǐng)域的突破性發(fā)展往往是一系列關(guān)鍵技術(shù)的改進(jìn)在推動,缺一不可。
圖7 人類發(fā)展進(jìn)程曲線
那么大佬們當(dāng)下關(guān)注的關(guān)鍵問題-強AI何時到來?這也是小扎和鋼鐵俠爭論的焦點,這個時間節(jié)點能否預(yù)測呢?首先看下上圖的人類發(fā)展進(jìn)程曲線,這個曲線表達(dá)的是核心意思是,我們的發(fā)展進(jìn)程是經(jīng)歷突變還是漸變多一些?這個還真不好說,原子彈發(fā)明之前,大部分科學(xué)家預(yù)測短期不可能,至少要幾十年,也有科學(xué)家預(yù)測只需要幾年,人工智能的三起三落也是,前幾十年的樂觀預(yù)測都失敗了,未來幾年會不會產(chǎn)生突變呢?誰也說不準(zhǔn),首先我們不能以深度學(xué)習(xí)技術(shù)現(xiàn)有的局限來推斷其未來的發(fā)展?jié)摿Γ拖裎覀儾荒茴A(yù)測Hinton是在2006年提出DBN,而不是1996或是2026?另外強AI能否覺醒,這得看未來數(shù)年里,是否有Arxiv上的某篇論文提出了機器學(xué)習(xí)的終極算法?或是Facebook機器農(nóng)場中的某個深度網(wǎng)絡(luò)全面解碼了人腦的學(xué)習(xí)機制,抑或是谷歌機器農(nóng)場中的某個深度網(wǎng)絡(luò)通過本體學(xué)習(xí)和記憶產(chǎn)生了初級意識。
五、人工智能五大門派對決:Watson vs. AlphaGo
上文說到,強AI的可能性,強AI何時能實現(xiàn)?是以小扎和鋼鐵俠為代表的大佬們,關(guān)于誰更懂AI展開嘴炮的焦點。要回答這一問題,首先得搞清楚AI技術(shù)發(fā)展的現(xiàn)狀和瓶頸,下面就通過當(dāng)今世界最頂級的兩個AI系統(tǒng),阿爾法狗(Alphago)和沃森(Watson)的對比分析,來深入探討這一問題。
AlphaGo采用的核心技術(shù)我在前文《阿爾法狗(AlphaGo)徹底戰(zhàn)勝人類意味著什么》中有深入分析,簡單來講,其基于深度學(xué)習(xí)+強化學(xué)習(xí)+蒙特卡洛樹決策的組合式學(xué)習(xí)方法(或者說學(xué)習(xí)框架)應(yīng)用說摸到了類腦學(xué)習(xí)的邊,其學(xué)習(xí)下棋分為三個階段:
- 通過對棋譜的深度學(xué)習(xí)完成策略網(wǎng)絡(luò)的構(gòu)建,采用深度學(xué)習(xí)技術(shù)訓(xùn)練一種有監(jiān)督學(xué)習(xí)型走棋策略網(wǎng)絡(luò),類似于我們的觀察學(xué)習(xí)獲得的第一反應(yīng)。
- 通過自我對戰(zhàn)強化學(xué)習(xí)來提高博弈水平,采用強化學(xué)習(xí)技術(shù)來優(yōu)化先前的走棋策略網(wǎng)絡(luò),通過自我博弈的強化學(xué)習(xí)迭代結(jié)果,來提升前面的策略網(wǎng)絡(luò)。即與之前的“自己”不間斷訓(xùn)練以提高下棋的水平,這個過程有點類似于人類的鞏固學(xué)習(xí)和理解貫通階段。
- 通過深度回歸學(xué)習(xí)構(gòu)建估值網(wǎng)絡(luò),用來預(yù)測自我博弈強化學(xué)習(xí)數(shù)據(jù)集里局面的預(yù)期結(jié)果,即預(yù)測那個策略網(wǎng)絡(luò)的局面會成為贏家。結(jié)合蒙特卡洛樹(MCTS)搜索壓縮搜索空間,降低了搜索時間復(fù)雜度, MCTS決策有效結(jié)合了策略網(wǎng)絡(luò)和估值網(wǎng)絡(luò),類似于人類的判斷決策過程。
Watson的系統(tǒng)架構(gòu)如下圖,IBM 關(guān)于 Watson的宣傳資料提到,Watson原來只有1個 “深度問答”的API,現(xiàn)在已經(jīng)有42個API應(yīng)用于36個國家的幾十個行業(yè),內(nèi)容涵蓋文字圖像識別、自然語言理解、專業(yè)知識學(xué)習(xí)、人類情緒分析等各個領(lǐng)域。通過其技術(shù)架構(gòu)分析,可知Watson 的核心功能是文本挖掘和知識問答,核心技術(shù)采用了基于統(tǒng)計學(xué)習(xí)算法和規(guī)則式自然語言處理(NLP)技術(shù)。
從這個角度講,IBM Watson的學(xué)習(xí)能力是十分有限的,依靠的海量非結(jié)構(gòu)化大數(shù)據(jù),加知識規(guī)則匹配,其重點宣傳的認(rèn)知智能是基于自然語言的情感分析和語義理解,是否采用了更為先進(jìn)的深度學(xué)習(xí)算法不得而知。
可以肯定的是網(wǎng)上關(guān)于Watson系統(tǒng)的負(fù)面評價卻不少,醫(yī)療智能診斷AI的失敗,暴露出了不少問題,比如需要幾個月時間進(jìn)行繁重的訓(xùn)練,專家們需要給系統(tǒng)喂養(yǎng)海量條理清楚的數(shù)據(jù)(未經(jīng)整理過的數(shù)據(jù)一般不能用,這是淺層學(xué)習(xí)模型的硬傷,而深度自動特征學(xué)習(xí)在一定程度上改善了這一問題,但還有相當(dāng)大的技術(shù)瓶頸需要突破),而且不能在不同的數(shù)據(jù)集之間建立聯(lián)系(這點是Palantir大數(shù)據(jù)系統(tǒng)的強項,詳見前文《大數(shù)據(jù)獨角獸Palantir之核心技術(shù)探秘》)。
圖8 IBM Watson架構(gòu)
幾十年來,人工智能技術(shù)研究的五大門派(如下圖)一直以來都在彼此爭奪主導(dǎo)權(quán)。
- 符號派:使用符號、規(guī)則和邏輯來表征知識和進(jìn)行邏輯推理,最喜歡的算法是:規(guī)則和決策樹。
- 貝葉斯派:獲取發(fā)生的可能性來進(jìn)行概率推理,最喜歡的算法是:樸素貝葉斯或馬爾可夫。
- 進(jìn)化派:生成變化,然后為特定目標(biāo)獲取其中最優(yōu)的,最喜歡的算法是:遺傳算法。
- 類推派:根據(jù)約束條件來優(yōu)化函數(shù)(盡可能走到更高,但同時不要離開道路),最喜歡的算法是:支持向量。
- 聯(lián)結(jié)派:使用概率矩陣和加權(quán)神經(jīng)元來動態(tài)地識別和歸納模式,最喜歡的算法是:神經(jīng)網(wǎng)絡(luò)。
圖9 人工智能五大門派
通過上述比較分析,可以看出AlphaGo與Watson的優(yōu)劣。AlphaGo的技術(shù)框架通用性更好,深度學(xué)習(xí)能力更強,而Watson更多采用的傳統(tǒng)規(guī)則式AI技術(shù),雖然有自然語言文本等非結(jié)構(gòu)化大數(shù)據(jù)優(yōu)勢,但沒有關(guān)聯(lián)挖掘和深度學(xué)習(xí)能力,其智能化水平有待提高。
另外,通過AlphaGo與Watson核心技術(shù)架構(gòu)的對比,在大數(shù)據(jù)條件下,聯(lián)結(jié)派和符號派AI誰更牛高下立見,但都有各自的優(yōu)點和缺點。根據(jù)Domingos的觀點,機器學(xué)習(xí)五大門派有望交叉融合產(chǎn)生終極算法,但是時間上卻難以推測。
個人認(rèn)為,未來聯(lián)結(jié)派和符號派的融合會是大勢所趨,基于自動特征抽取和規(guī)則關(guān)聯(lián)推理的深度學(xué)習(xí),與基于知識經(jīng)驗的終身學(xué)習(xí)相結(jié)合,是AI進(jìn)一步發(fā)展的關(guān)鍵技術(shù)方向。
六、如果強AI覺醒,我們將走向何方?
最后做點展望,人工智能技術(shù)毫無疑問會改變我們的世界,越是強大的技術(shù),其自身發(fā)展的速度(指數(shù)級)也是難以想象和預(yù)測的,當(dāng)谷歌的自動駕駛狗(已行駛超200萬公里)、醫(yī)療狗(DeepMind各種疾病診斷AI已初現(xiàn)身手)、翻譯狗(谷歌幾十種語言的自動翻譯)、軍事狗(Boston Dynamic機器人)、金融狗…等各種狗連成一片的時候,工業(yè)機器人很可能會走出牢籠,變身各種機器助手進(jìn)入到我們家里和辦公室里,而AI的服務(wù)端則會像電力一樣提供源源不斷的智能信息服務(wù),到時我們的社會究竟會變成怎樣,這不是一個單純的技術(shù)問題,特別是面對強AI技術(shù)的研發(fā)和應(yīng)用,我們應(yīng)該重視其對社會、經(jīng)濟(jì)、政治產(chǎn)生的深遠(yuǎn)影響。假如有一天強AI真的覺醒,對于人類的未來,可以說是吉兇難測,這取決于我們的技術(shù)管控和團(tuán)隊協(xié)作等能力,還取決于更重要的一點,那就是人性。
最后列幾則關(guān)于AI發(fā)展的正反方觀點,難說誰對誰錯,具有代表性,供大家思考。
李開復(fù):
“類人機器人只是科幻,人形機器人將馬上進(jìn)入千家萬戶的說法,簡直是無稽之談。人工智能擅長對目標(biāo)明確的工作進(jìn)行優(yōu)化(但是不能創(chuàng)造,沒有感情);機械控制的發(fā)展速度較人工智能軟件的發(fā)展要緩慢得多;傳感器雖然得到迅猛發(fā)展,但價格昂貴、體積偏大且太耗電。機器人的開發(fā)要牢記實用性這一原則:機器人或能創(chuàng)造效益,或能節(jié)省成本,或能提高生產(chǎn),或可以提供娛樂。過度擔(dān)憂可能導(dǎo)致大眾忽視AI正在帶來的巨大機遇,也會讓更多更緊迫的AI問題沒有得到關(guān)注,這只會撿了芝麻丟了西瓜。未來十年,AI將大規(guī)模地取代那些依靠人力的、重復(fù)性的、分析性的崗位。因此,我們要肩負(fù)起創(chuàng)造更多社會服務(wù)性崗位的職責(zé),而不是空想或謀劃一個充斥著“不適用于人類”職位的社會…”
扎克伯格:
“人工智能威脅人類的觀點“相當(dāng)不負(fù)責(zé)任”,未來五到十年,人工智能會大為改善人類生活質(zhì)量。人工智能已經(jīng)在診斷疾病方面提供幫助,自動駕駛汽車也是人工智能改善人們生活的一種表現(xiàn)??萍紤?yīng)用一直都利弊兼有,創(chuàng)造技術(shù)的時候需要小心,但有人主張要放慢人工智能的研究步伐,其動機確實值得懷疑?!?/p>
Elon Musk:
“我認(rèn)為,我們對待人工智能應(yīng)當(dāng)非常謹(jǐn)慎。如果讓我猜測,人類最大的威脅是什么,那么就是人工智能。因此我們需要非常謹(jǐn)慎。我越來越感覺到,這里應(yīng)當(dāng)有一定的監(jiān)管,或許是在全國層面,或許是國際層面,這只是為了確保我們不會去做一些蠢事?!?/p>
比爾蓋茨:
“我和那些擔(dān)心超級智能的人同處一個陣營。起先,機器將幫我們做許多工作,更不用說超級智能。如果控制得好,人工智能應(yīng)該會非常有利。不過,幾十年后人工智能會強大到足以令人擔(dān)憂的地步。在這一點上我贊同Elon Musk等人的看法,而且我不明白為什么一些人會對此仿佛若無其事?!?/p>
馬云:
“我認(rèn)為人工智能,你是改變不了的,這是一個巨大的趨勢,你只能改變自己。為未來來講,三十年也好、五十年也好,人類的沖擊一定會非常之大,而且一定會非常疼痛的,任何高科技帶來的問題,帶來好處也會帶來壞處。有一點是肯定的,未來的機器一定比你更了解自己,人類最后了解自己,是有可能通過機器來了解的,因為我們的眼睛是往外看的,IT往外看的,但是DT是往內(nèi)看的,往內(nèi)走才是有很大的一個差異。至于前段時間比較熱門的AIphaGo,人跟圍棋下,我在深圳互聯(lián)網(wǎng)大會上講了一下,我認(rèn)為這是一個悲劇,圍棋是人類自己研究出來,自己玩的東西,人要跟機器去比圍棋誰下得好,我第一天就不會比,就跟人要跟汽車比誰跑步跑得快,那不是自己找沒趣嗎,它一定比你算得快?!?/p>
王垠:
“很多人喜歡鼓吹人工智能,自動車,機器人等技術(shù),然而如果你仔細(xì)觀察,就會發(fā)現(xiàn)這些人不但不理解人類智能是什么,不理解人工智能有什么局限性,而且這些“AI 狂人”們的心,已經(jīng)嚴(yán)重的機械化了。他們或多或少的失去了人性,仿佛忘記了自己是一個人,忘記了人最需要的是什么,忘記了人的價值。這些人就像卓別林在『大獨裁者』最后的演講里指出的:“機器一樣的人,機器一樣的心?!泵慨?dāng)提到 AI,這些人必然野心勃勃地號稱要“取代人類的工作”,“節(jié)省勞動力開銷”。暫且不討論這些目標(biāo)能否實現(xiàn),它們與我的價值觀,從一開頭就是完全矛盾的。一個偉大的公司,應(yīng)該為社會創(chuàng)造實在的,新的價值,而不是想方設(shè)法“節(jié)省”什么勞動力開銷,讓人失業(yè)!想一下都覺得可怕,我創(chuàng)造一個公司,它最大的貢獻(xiàn)就是讓成千上萬的人失業(yè),為貪得無厭的人節(jié)省“勞動力開銷”,讓貧富分化加劇,讓權(quán)力集中到極少數(shù)人手里,最后導(dǎo)致民不聊生,導(dǎo)致社會的荒蕪甚至崩潰……”
參考資料:
- 什么是人工智能?《NEWTON科學(xué)世界》2014年第3期
- 論大數(shù)據(jù)的泡沫、價值與應(yīng)用陷阱。http://www.datagold.com.cn/archives/7052.html
- 阿爾法狗(AlphaGo)徹底戰(zhàn)勝人類意味著什么?http://www.datagold.com.cn/archives/7591.html
- 我為什么不在乎人工智能。http://www.yinwang.org/blog-cn/2017/04/23/ai
作者:杜圣東
本文由 @點金大數(shù)據(jù)?授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
部分內(nèi)容和圖片選自網(wǎng)絡(luò);題圖來自PEXELS,基于CC0協(xié)議
感覺像是《人工智能》的讀后感