首頁(yè) / 資訊中心 / 趨勢(shì)研究/人工智能為什么一定要有身體?

人工智能為什么一定要有身體?

發(fā)布時(shí)間:2019-07-17 分類:趨勢(shì)研究 來(lái)源:騰訊研究院 作者:王煥超

人類是一種具備豐沛想象力的生物,無(wú)論是對(duì)自我還是他者,對(duì)過(guò)去還是未來(lái),皆是如此。當(dāng)面對(duì)“人工智能”這種新事物時(shí),人類的這一點(diǎn)特性體現(xiàn)得尤為明顯。
早在希臘神話中,諸如“黃金機(jī)器人”這樣的智能機(jī)器就已經(jīng)出現(xiàn)。傳說(shuō)火神赫準(zhǔn)斯托斯為了招待上帝,通過(guò)金屬加工和手工工藝鑄造了24個(gè)銅三腳架,它們能夠憑借金色的輪子自我驅(qū)動(dòng)、四處走動(dòng),這便是人工智能最早的雛形。
而在今天,人類對(duì)人工智能的想象依舊狂熱。從《終結(jié)者》、《銀翼殺手2049》,到《機(jī)械姬》、《戰(zhàn)斗天使阿麗塔》,大量的科幻作品向我們展示了人工智能的未來(lái)形態(tài):它們不僅是超強(qiáng)智能的化身,更是形似人類并且具備自我意識(shí)的情感動(dòng)物。
但也有一種聲音認(rèn)為,迄今對(duì)強(qiáng)人工智能的幻想未免太缺乏想象力:當(dāng)超級(jí)智能已經(jīng)無(wú)所不能之時(shí),為何還會(huì)受到“肉體”的限制?表面看起來(lái),這樣的質(zhì)疑不無(wú)道理,人類對(duì)AI形態(tài)的構(gòu)想似乎仍受自身經(jīng)驗(yàn)和認(rèn)知水平禁錮——人有軀體,那么未來(lái)的人工智能也一定會(huì)有軀體。倘若AI能擺脫實(shí)體桎梏,以類似于數(shù)據(jù)的形式存在,那么它無(wú)疑將更加空靈自由,能力也會(huì)更為強(qiáng)悍。
不過(guò),越來(lái)越多的證據(jù)表明,“身體”恰恰是人工智能發(fā)展、進(jìn)化必不可少的關(guān)鍵基礎(chǔ)。隨著認(rèn)知科學(xué)的迅速發(fā)展,“具身認(rèn)知”理論得到AI科學(xué)家重視,并由此促成人工智能研究的具身性轉(zhuǎn)向。這一轉(zhuǎn)向極為重視“身體”對(duì)于人工智能的作用,以此為突破技術(shù)發(fā)展瓶頸帶來(lái)曙光,并成為邁向強(qiáng)人工智能乃至超人工智能的關(guān)鍵一步。
一、定義“智能”
對(duì)于“什么是人工智能”這個(gè)問(wèn)題,人類總喜歡拿自身情況和認(rèn)知水平去類比、衡量。循著這一思路,似乎只有那些能夠突破人類能力瓶頸——即解決人類都難以攻克的復(fù)雜問(wèn)題、擁有超高速計(jì)算能力的才被視為“人工智能”。
實(shí)際上,這種主宰了AI研究界數(shù)十年的理念并沒(méi)有真正理解“智能”的含義。
這一理念也直接導(dǎo)致人類在弱人工智能領(lǐng)域躊躇過(guò)久,而在強(qiáng)人工智能領(lǐng)域長(zhǎng)期毫無(wú)建樹。在20世紀(jì)五六十年代,研究者表現(xiàn)出相當(dāng)樂(lè)觀的情緒,他們認(rèn)為具備完全智能的機(jī)器將在二十年內(nèi)出現(xiàn)。然而,許多個(gè)二十年已經(jīng)過(guò)去,就現(xiàn)實(shí)中人工智能領(lǐng)域的發(fā)展?fàn)顩r而言,盡管相關(guān)技術(shù)取得巨大進(jìn)步,但相較于過(guò)往的美好愿景仍然差距甚遠(yuǎn),“完全智能”的實(shí)現(xiàn)仍遙遙無(wú)期。
早期科學(xué)家們之所以預(yù)測(cè)真正的人工智能很快就能出現(xiàn),其樂(lè)觀源于一個(gè)事實(shí):彼時(shí)的智能程序已經(jīng)能成功解決復(fù)雜的代數(shù)問(wèn)題和證明幾何定理,并且可以像專業(yè)棋手一樣下國(guó)際象棋。邏輯似乎很簡(jiǎn)單:對(duì)于普通人來(lái)說(shuō),無(wú)論是代數(shù)幾何,還是高超棋藝,都是極具挑戰(zhàn)性的任務(wù),所以就被視為“智能”的象征;而諸如識(shí)別一張桌子和一束花,或者是用腿自由行走,這些行為屬于“常識(shí)”或“本能”的范疇,根本就不需要?jiǎng)佑谩爸悄堋?。以此推論,?dāng)機(jī)器能夠輕易解決數(shù)學(xué)推理等困難問(wèn)題時(shí),那相對(duì)容易的任務(wù)自然就更不在話下了。這是古典人工智能主義時(shí)期通行的想法,在很長(zhǎng)一段時(shí)間內(nèi),人工智能的發(fā)展方向受其統(tǒng)攝,研究者通過(guò)攻克一道道技術(shù)難題,來(lái)證明AI的“智能”程度正在不斷深化。
但這種想法逐漸被證明是錯(cuò)誤的。因?yàn)闀r(shí)至今日,盡管人工智能已經(jīng)能輕易打敗人類最高明的棋手,圖像識(shí)別、邏輯推理等技能更不在話下,但是我們?nèi)匀徊坏貌怀姓J(rèn)一個(gè)事實(shí):現(xiàn)在的人工智能并不是真正的“智能”——它們?nèi)孕枞祟愄峁?shù)據(jù)、設(shè)立模型、給定程序和架構(gòu),并且只在特定領(lǐng)域、特定規(guī)則的限制下才能發(fā)揮作用。在此情形之下,AI所作出的種種行為,實(shí)際上并不是自我思考的產(chǎn)物,而是程序機(jī)械化運(yùn)作的結(jié)果,它不會(huì)真正進(jìn)行自我判斷,更別說(shuō)擁有直覺(jué)、感知、意識(shí)、情感等人類才有的屬性。可以說(shuō),古典人工智能主義錯(cuò)誤理解了“智能”的本質(zhì)。
其實(shí)早在1980年,就有科學(xué)家對(duì)這一問(wèn)題進(jìn)行了闡釋。漢斯·莫拉維克等人發(fā)現(xiàn),與刻板認(rèn)知不同,人類所擁有的高階能力(比如推理)只需要非常少的計(jì)算能力,相反,一些無(wú)意識(shí)的技能和直覺(jué)卻需要強(qiáng)大的運(yùn)算能力。莫拉維克指出,“要讓電腦如成人般下棋是相對(duì)容易的,但是要讓電腦有一歲小孩般的感知和行動(dòng)能力卻是相當(dāng)困難甚至是不可能的”。這一發(fā)現(xiàn)被稱為“莫拉維克悖論”,它揭示羅人工智能所進(jìn)行的那些看似復(fù)雜的“智能任務(wù)”,其實(shí)與真正的人類智能并無(wú)可比性。
“人工智能之父”馬文·閔斯基也認(rèn)為:對(duì)技術(shù)人員來(lái)說(shuō),最難以復(fù)刻的人類技能實(shí)際上是那些無(wú)意識(shí)的技能。某種程度上,在人工智能領(lǐng)域,迄今為止已經(jīng)攻克的邏輯問(wèn)題反而是最無(wú)關(guān)緊要的,因?yàn)檫@些問(wèn)題很容易通過(guò)機(jī)器進(jìn)行解決,但人類的一些簡(jiǎn)單行為,實(shí)際更難實(shí)現(xiàn)。比如,一個(gè)幾歲的嬰兒就能輕易辨識(shí)人臉、隨意走動(dòng)、自發(fā)性地哭鬧喊叫,但這些看似簡(jiǎn)單的人類智能行為,對(duì)AI來(lái)說(shuō)卻遠(yuǎn)比登天還要困難。
二、“身體”對(duì)人工智能緣何重要?
其實(shí)前述討論所圍繞的主線,還是關(guān)于AI智能程度的差別。2017年,密歇根州立大學(xué)的Arend Hintze在《理解AI的四種類別》一文中,提出了廣為認(rèn)可的“人工智能四級(jí)分類法”:
1.響應(yīng)式:AI無(wú)法產(chǎn)生記憶,不能利用過(guò)去的經(jīng)驗(yàn)進(jìn)行決策,它們只為完成特定任務(wù)所設(shè)計(jì),不能勝任其他任務(wù),這是最基本的AI類型;
2.有限記憶:AI的當(dāng)前行為能夠參考剛剛發(fā)生的事件,但記憶是瞬時(shí)的,無(wú)法用于未來(lái)決策;
3.心智理論:這是一個(gè)心理學(xué)術(shù)語(yǔ),處于此階段的AI能夠根據(jù)他人的行為推導(dǎo)并理解其想法和動(dòng)機(jī),這一類型的AI能夠歸納出周圍環(huán)境和預(yù)知交互的其他表征;
4.自我意識(shí):AI的終極能力。
從程度上看,現(xiàn)階段的人工智能在第一、二階段進(jìn)展已足夠迅速,勉強(qiáng)能實(shí)現(xiàn)第三階段的部分功能,而第四階段還遙遙無(wú)期,因?yàn)樗@然屬于“人類智能”的范疇。Hintze的四級(jí)分類法也遭到了一些批評(píng),原因就在于第三、四階段之間的鴻溝顯然太過(guò)巨大。
其實(shí)早于Hintze,更為通行的分類方式是“弱人工智能”和“強(qiáng)人工智能”,二者也是在智能程度上有所差別。弱人工智能主要是作為輔助人類的工具,它能在特定領(lǐng)域、特定規(guī)則的限制下進(jìn)行系統(tǒng)闡述和檢驗(yàn)工作,但它并不能實(shí)現(xiàn)真正意義上的推理與解決問(wèn)題,因此不具備真正的“智能”,我們現(xiàn)在所能見(jiàn)到的AI,基本都屬于弱人工智能的范疇。相較于此,強(qiáng)人工智能就不僅僅是工具的角色了,它具有知覺(jué)和理解能力,甚至擁有自我意識(shí)和價(jià)值觀體系,在某種意義上,它本身就是一種與人類并存的全新文明。
談及弱人工智能和強(qiáng)人工智能的區(qū)分,必須提到哲學(xué)家約翰·塞爾。他通過(guò)著名的“中文屋實(shí)驗(yàn)”,發(fā)現(xiàn)計(jì)算機(jī)程序純粹是按照句法規(guī)則組織起來(lái)的,盡管機(jī)器可以做到對(duì)人類行為的高度模擬,甚至在某些地方可以超越人類,但它卻是沒(méi)有理解能力的,不能像人一樣進(jìn)行認(rèn)知活動(dòng)。這一發(fā)現(xiàn)揭示了彼時(shí)人工智能的瓶頸。
為此,塞爾引入“意向性”概念,用以解釋人類智能與人工智能的區(qū)別(實(shí)際也是強(qiáng)人工智能與弱人工智能的區(qū)別):“人的一言一行在多數(shù)情況下都是由自我意識(shí)引導(dǎo)完成的,積極而主動(dòng);而機(jī)器所做的每一件事都需要人事先制定好,機(jī)械且被動(dòng)”?!耙庀蛐浴本褪莿澐种鲃?dòng)與被動(dòng)的界限。
根據(jù)塞爾的定義,“意向性”是某種心理狀態(tài)的特征,此種特征使心理狀態(tài)指向或涉及世界中的客體或事物狀態(tài)。換言之,真正的“意向性”產(chǎn)生于與世界的交互,從環(huán)境系統(tǒng)和客觀事物中生成。這種“交互”是人類意向性的基礎(chǔ),它使人類獲得對(duì)世界的理解與感覺(jué)意識(shí)。
如果機(jī)器要實(shí)現(xiàn)真正的智能,首要解決的問(wèn)題就是海量背景知識(shí)的學(xué)習(xí),其中包括各種常識(shí),也包括世界運(yùn)作的方式。這些知識(shí)是無(wú)窮無(wú)盡的,并且難易體系化,除非AI能夠?qū)崿F(xiàn)擺脫人類給定數(shù)據(jù)意義上的、真正的“自我學(xué)習(xí)”,否則永遠(yuǎn)無(wú)法掌握這些背景知識(shí)。
而感覺(jué)意識(shí),也緣于與世界的交互。比如“辣”這種感覺(jué),源于吃辣的食物時(shí)舌尖上的痛感,紅色辣椒、滿面通紅的視覺(jué),以及極具刺激性的嗅覺(jué)等等,它們共同組成了我們對(duì)“辣”的認(rèn)識(shí)。它不僅是一種生理性的感受,更源于我們與客觀事物的真實(shí)交互,進(jìn)而將這種綜合性的感知內(nèi)化為腦中的意識(shí),并作為指導(dǎo)所有行動(dòng)的先驗(yàn)性標(biāo)準(zhǔn)。
而人類與外部環(huán)境、客觀的交互,都需要由“軀體”這個(gè)中介來(lái)完成。但AI是沒(méi)有“軀體”的,它只能和人類給定的數(shù)據(jù)交互,卻不能從與環(huán)境的互動(dòng)中獲得“常識(shí)”,也就不會(huì)形成自我感受和意識(shí)。反言之,如果要讓AI具備意識(shí),首先就要賦予它一個(gè)可以自己控制的軀體,并像普通個(gè)體一樣融入物理世界與人類社會(huì)。
三、具身性與強(qiáng)人工智能
讓人工智能擁有一個(gè)“身體”,這是具身性人工智能研究路徑的主要觀點(diǎn)。此路徑的生成依托于20世紀(jì)五六十年代興起的“認(rèn)知科學(xué)革命”,并直接受其中“具身—生成取向”的影響。這一取向所主張的“具身認(rèn)知”假設(shè),認(rèn)為認(rèn)知過(guò)程和思維過(guò)程并非是在智能體內(nèi)部發(fā)生的,而是發(fā)生在智能體與環(huán)境的自適應(yīng)交互之中。
AI科學(xué)家吸取“具身-生成取向”的理論核心,形成了人工智能研究的“行為學(xué)派”,關(guān)注智能體與環(huán)境的互動(dòng)。早在數(shù)年前,行動(dòng)學(xué)派的堅(jiān)定支持者羅德尼·布魯克斯就提倡制造一種沒(méi)有辨識(shí)能力,只有感知和行動(dòng)能力的機(jī)器。他將這個(gè)機(jī)器稱為“新人工智能”,是完全跳脫傳統(tǒng)定義的人工智能。
布魯克斯認(rèn)為,為了使機(jī)器人獲得真正的智能,必須實(shí)現(xiàn)它的“軀體化”。借助于這具軀體,它能夠自主移動(dòng)、生存、同這個(gè)世界交互,進(jìn)而感知、思考、生成意識(shí)。在布魯克斯看來(lái),這個(gè)世界就是描述它自身最好的模型,它包含所有研究所需的細(xì)節(jié),而理解它的訣竅就在于親身接觸、親身感知。
布魯克斯的做法體現(xiàn)了具身認(rèn)知論的思想核心,即從基礎(chǔ)開始模擬人類,進(jìn)而使機(jī)器獲得媲美“人類智能”的自主思維能力——通過(guò)“自下而上”的路徑,構(gòu)造出真正的人工智能。要知道,日常生活世界遠(yuǎn)要比科學(xué)世界龐大、復(fù)雜得多,其蘊(yùn)含的數(shù)據(jù)資源和知識(shí)資源,縱使有再多數(shù)據(jù)庫(kù)也無(wú)法完全覆蓋。古典人工智能主義在忽略“軀體”要素的同時(shí),實(shí)際上也忽略了外部世界諸多豐富的細(xì)節(jié),以此為主導(dǎo)制造的大多數(shù)計(jì)算機(jī)程序,除了編程者的控制指令,并沒(méi)有與這個(gè)世界真正建立起聯(lián)系。
人工智能的具身性轉(zhuǎn)向,要求AI具有物質(zhì)意義上的感覺(jué)器官,藉此外部世界提取信號(hào);與這些感覺(jué)器官相連的是分層存儲(chǔ)系統(tǒng),它們與人類大腦皮層工作原理類似,能夠存儲(chǔ)從外部交互中獲得的信號(hào)。通過(guò)反復(fù)訓(xùn)練,AI就能夠通過(guò)感官系統(tǒng)和記憶系統(tǒng)構(gòu)建起它自身關(guān)于世界的模型,進(jìn)而能夠依據(jù)過(guò)去的經(jīng)歷進(jìn)行類推,并對(duì)未來(lái)事件做出預(yù)測(cè),為新問(wèn)題提供解決方案。這條路徑,正是完美地模擬了人類意識(shí)的生成方法。此時(shí)的人工智能,如果按照Hintze的四級(jí)分類法來(lái)衡量,就已經(jīng)突破了第三階段并向擁有自我意識(shí)的第四階段邁進(jìn)。
這條路徑的發(fā)展比想象中要快得多,以羅德尼·布魯克斯為例,他在20世紀(jì)90年代就已經(jīng)設(shè)計(jì)出實(shí)體化的“火星機(jī)器人”。而科技公司W(wǎng)illow Garage開發(fā)的Personal Robot 2機(jī)器人也是具身性人工智能的重要標(biāo)志,它擁有兩條手臂、可開合的夾爪,頭部、胸部、肘部上安裝有高分辨率攝像頭、激光測(cè)距儀、慣性測(cè)量單元、觸覺(jué)傳感器等,PR2能夠借助這些設(shè)備直接感受物理世界信號(hào),由于采取了模糊決策控制,因此PR2不需要編程就能學(xué)習(xí)新事物。前段時(shí)間,引起諸多討論的“機(jī)器血液”也是其中一環(huán),它由康奈爾大學(xué)等機(jī)構(gòu)研發(fā),本質(zhì)上是供機(jī)器人使用的液體電池,但它既有能量存儲(chǔ),又有動(dòng)力傳導(dǎo)的功能,除供電之外,還能夠以液壓的形式控制機(jī)器人運(yùn)動(dòng)姿態(tài)。
PR2機(jī)器人
四、結(jié)語(yǔ):奇點(diǎn)的迷思
美國(guó)未來(lái)學(xué)家雷蒙德·庫(kù)茲韋爾曾經(jīng)提出“奇點(diǎn)”理論(the Singularity)。該理論預(yù)言,在2045年,強(qiáng)人工智能會(huì)出現(xiàn),并具有幼兒智力水平,這就是“奇點(diǎn)”時(shí)代。而在這個(gè)節(jié)點(diǎn)來(lái)臨后的一個(gè)小時(shí),人工智能就能立刻推導(dǎo)出愛(ài)因斯坦的相對(duì)論以及其他作為人類認(rèn)知基礎(chǔ)的各種理論;一個(gè)半小時(shí)后,這個(gè)強(qiáng)人工智能將進(jìn)化為超級(jí)人工智能,智能瞬間達(dá)到普通人類的17萬(wàn)倍。
我們能夠大體理解,為何人們?cè)趶?qiáng)人工智能這個(gè)方向遲遲不能推進(jìn),一方面確實(shí)是現(xiàn)實(shí)需要不足且技術(shù)手段受限,而另一方面,以“奇點(diǎn)”理論為代表的諸多預(yù)言以及各種科幻電影的負(fù)面呈現(xiàn),它們所預(yù)示的技術(shù)脫離人類控制、AI對(duì)人類的替代,使恐懼心理、憂慮心理始終環(huán)繞在人工智能的發(fā)展過(guò)程中。
但實(shí)際上,以當(dāng)前人工智能發(fā)展的水平來(lái)看,這種擔(dān)心其實(shí)很不必要,真正邁向“強(qiáng)人工智能”還有諸多技術(shù)難題需要攻克,在短時(shí)間內(nèi)幾無(wú)可能。與其被無(wú)謂的憂慮束縛手腳,不如謹(jǐn)慎克制地推進(jìn)技術(shù)發(fā)展,豐富人工智能的應(yīng)用場(chǎng)景,讓它能夠更好服務(wù)于人類,這或許才是正確的態(tài)度。