深度學(xué)習(xí)來得太晚也太猛,對(duì)話2018年度圖靈獎(jiǎng)三位「大佬」
雖然曾經(jīng)遭受質(zhì)疑甚至嘲笑,但 2018 年度圖靈獎(jiǎng)獲得者 Geoffrey Hinton、Yann LeCun 和 Yoshua Bengio 一直在他們的研究生涯中不斷發(fā)展人工神經(jīng)網(wǎng)絡(luò),其研究成果已成為了從搜索到內(nèi)容過濾等領(lǐng)域不可或缺的組成部分。所以,當(dāng)前炙手可熱的深度學(xué)習(xí)和人工智能領(lǐng)域究竟怎么樣呢?下面,三位人工智能領(lǐng)域的「大佬」將與大家分享一些令人振奮的發(fā)現(xiàn)以及依然存在的一些問題。
現(xiàn)在關(guān)于人工智能的討論遠(yuǎn)多于您剛開始研究生涯的時(shí)候——有些您可能聽說過,有些可能沒有。那么,您希望人們不再問哪些問題呢?
GEOFFREY HINTON:「神經(jīng)網(wǎng)絡(luò)只是一場(chǎng)泡沫嗎?」以前,人工智能業(yè)內(nèi)人士給出很大的承諾,而這些承諾有時(shí)被證明只是一場(chǎng)空談。但是,神經(jīng)網(wǎng)絡(luò)遠(yuǎn)不止給出承諾那么簡(jiǎn)單。這項(xiàng)技術(shù)確確實(shí)實(shí)在發(fā)揮作用,并且能夠縮放。當(dāng)你提供更多數(shù)據(jù)和一臺(tái)運(yùn)行速度更快的計(jì)算機(jī)時(shí),神經(jīng)網(wǎng)絡(luò)性能會(huì)自動(dòng)提升,而不需要任何人再多寫幾行代碼。
Geoffrey Hinton
YANN LECUN:的確是這樣。深度學(xué)習(xí)的基本理念并沒有消失。但當(dāng)人們問我們,讓機(jī)器變得更智能的方法是不是只有簡(jiǎn)單地?cái)U(kuò)展現(xiàn)有方法時(shí),這的確令人沮喪。我們需要一些新的范式。
YOSHUA BENGIO: 當(dāng)前技術(shù)得益于之前很多年的工業(yè)和科學(xué)應(yīng)用累積。比如說,我們?nèi)齻€(gè)都是研究者,但常常迫不及待地想要開發(fā)更多新技術(shù),因?yàn)槲覀冸x人類水平的人工智能以及理解自然或人工智能原理的夢(mèng)想還差得遠(yuǎn)呢。
Yoshua Bengio
哪些方面沒有得到充分討論?
HINTON:人工神經(jīng)網(wǎng)絡(luò)會(huì)告訴我們大腦如何工作嗎?人們會(huì)問這個(gè)問題,但問的人還不夠多。
BENGIO:是的。不過遺憾的是,雖然深度學(xué)習(xí)從大腦和認(rèn)知中汲取靈感,但很多相關(guān)領(lǐng)域的工程師目前并不關(guān)心這些主題。這也不難理解,因?yàn)橹灰軌虬鸭夹g(shù)應(yīng)用到工業(yè)中,其它東西都仿佛不重要了。但就研究而言,如果我們不能與那些努力理解大腦工作原理的研究人員保持聯(lián)系,則是一大損失。
Yann LeCun
HINTON:也就是說,神經(jīng)科學(xué)家現(xiàn)在正在認(rèn)真對(duì)待這個(gè)問題。多年來,神經(jīng)科學(xué)家一直在說:「人工神經(jīng)網(wǎng)絡(luò)與真正的大腦一點(diǎn)也不像,它們并不能告訴我們?nèi)魏斡嘘P(guān)大腦如何工作的東西?!沟F(xiàn)在,這些神經(jīng)科學(xué)家正在認(rèn)真考慮大腦中存在反向傳播這種東西的可能性,這是一個(gè)非常令人興奮的領(lǐng)域。
LECUN:現(xiàn)在,幾乎所有關(guān)于人類和動(dòng)物視覺的研究都使用卷積網(wǎng)絡(luò)作為標(biāo)準(zhǔn)概念模型。這種情況最近才出現(xiàn)。
HINTON:我認(rèn)為人工神經(jīng)網(wǎng)絡(luò)還會(huì)慢慢地對(duì)社會(huì)科學(xué)產(chǎn)生巨大的影響,因?yàn)樗軌蚋淖兾覀儗?duì)人自身的看法。我們過去認(rèn)為人是理性存在的,并且人的特別之處在于能夠借助推理來得出結(jié)論?,F(xiàn)在,我們對(duì)人有了更好的理解,即人基本上是能夠做出大量類比的機(jī)器。人發(fā)展這些表征的過程非常緩慢,之后這些表征決定了人所能做出的類比種類。當(dāng)然,我們可以做出推理,并且如果沒有推理則發(fā)展不出數(shù)學(xué),但這并不是基本的思考方式。
作為具有開創(chuàng)性研究的學(xué)者,您似乎常常不滿足自己現(xiàn)有的成績(jī)。
HINTON:在我看來,那些發(fā)明了當(dāng)前標(biāo)準(zhǔn)技術(shù)的人雖然會(huì)有一些特殊之處,但他們并沒有什么天賦異稟,并且還可能存在一些更好的技術(shù)。但是,當(dāng)一個(gè)領(lǐng)域已經(jīng)有了一種標(biāo)準(zhǔn)的做事方式時(shí),那么進(jìn)入該領(lǐng)域的人不會(huì)理解這種標(biāo)準(zhǔn)的做事方法是多么的武斷。
BENGIO:有時(shí)候,學(xué)生在談?wù)撋窠?jīng)網(wǎng)絡(luò)的時(shí)候就好像是在描述《圣經(jīng)》一樣。
LECUN:標(biāo)準(zhǔn)的方法可能會(huì)造成教條主義。而且,一些最有創(chuàng)意的想法可能是由年輕人提出來的。
該領(lǐng)域已經(jīng)取得了一些令人矚目的進(jìn)展。20 或者 30 年前,哪些可能發(fā)生的事物會(huì)讓您感到驚訝呢?
LECUN:讓我感到驚訝的東西太多了。比如,深度學(xué)習(xí)革命開始得太晚了,而開始革命后它發(fā)展的速度也太快了。我本來希望神經(jīng)網(wǎng)絡(luò)的發(fā)展更加地循序漸進(jìn),但遺憾的是,人們?cè)?20 世紀(jì) 90 年代中期到 21 世紀(jì)前 10 年中期完全放棄了神經(jīng)網(wǎng)絡(luò)。我們有證據(jù)表明神經(jīng)網(wǎng)絡(luò)之前就發(fā)揮過作用。但這一觀點(diǎn)被證明之后,神經(jīng)網(wǎng)絡(luò)的發(fā)展開始變得勢(shì)不可擋:先是在語音識(shí)別領(lǐng)域,然后是圖像識(shí)別,現(xiàn)在已經(jīng)擴(kuò)展到自然語言理解領(lǐng)域了。
HINTON:20 年前,如果有人可以提取一種語言中的句子,將它分割為小的單詞片段,然后將其輸入一個(gè)始于隨機(jī)連接的神經(jīng)網(wǎng)絡(luò),然后訓(xùn)練這個(gè)神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)再將這個(gè)句子翻譯成另一種語言,而不需要任何語法或語義知識(shí)——完全沒有運(yùn)用到語言知識(shí)——并且翻譯效果比任何其它工具都好。這會(huì)讓我非常驚訝。雖然這種翻譯并不完美,不如雙語人才,但它已經(jīng)在做得越來越好。
LECUN:令我驚訝的還有這些技術(shù)應(yīng)用到很多產(chǎn)業(yè)中的速度,也是如此之快。如果現(xiàn)在你從谷歌或 Facebook 中移除深度學(xué)習(xí),則兩家公司會(huì)陷入癱瘓。它們完全是圍繞深度學(xué)習(xí)來構(gòu)建的。當(dāng)我加入 Facebook 時(shí),令我感到驚訝的是該公司有一個(gè)小組使用卷積網(wǎng)絡(luò)來研究人臉識(shí)別。當(dāng)時(shí)我對(duì)卷積網(wǎng)絡(luò)的第一感覺是它們可能對(duì)分類的識(shí)別有用:汽車、狗、貓、飛機(jī)和桌子,而不適用于人臉等細(xì)粒度目標(biāo)識(shí)別。但結(jié)果證明卷積網(wǎng)絡(luò)非常有效,并且現(xiàn)在完全成為了標(biāo)準(zhǔn)。另一件令我感到驚訝的是 Yoshua 實(shí)驗(yàn)室中開發(fā)的生成對(duì)抗網(wǎng)絡(luò)——人們基本上可以將神經(jīng)網(wǎng)絡(luò)作為生成模型使用,以生成圖像和聲音。
BENGIO:在我攻讀博士期間,我曾竭盡全力擴(kuò)展自己的想法,即神經(jīng)網(wǎng)絡(luò)的作用不是僅限于模式識(shí)別——將固定大小的向量作為輸入并生成類別。但直到最近的翻譯研究才讓我們擺脫了這種固有認(rèn)識(shí)。正如 Yann 所說,網(wǎng)絡(luò)生成新事物的能力的確已經(jīng)出現(xiàn)革命性的變化。所以神經(jīng)網(wǎng)絡(luò)有能力操縱任何種類的數(shù)據(jù)結(jié)構(gòu),而不僅僅是像素和向量。以傳統(tǒng)的觀點(diǎn)來看,神經(jīng)網(wǎng)絡(luò)只限于執(zhí)行那些人類可以快速且無意識(shí)完成的任務(wù),如目標(biāo)和圖像識(shí)別?,F(xiàn)代神經(jīng)網(wǎng)絡(luò)在本質(zhì)上有別于我們?cè)?20 世紀(jì) 80 年代所以為的那樣,這些神經(jīng)網(wǎng)絡(luò)現(xiàn)在能做的事情更加接近我們推理以及編程時(shí)所做的事情。
盡管已經(jīng)取得了這么多成就,Yoshua,您曾討論過促使發(fā)展中國家更容易獲取神經(jīng)網(wǎng)絡(luò)技術(shù)的緊迫性。能夠談?wù)勥@些嗎?
BENGIO:我認(rèn)為這個(gè)問題非常重要。我以前沒有考慮太多的政治問題,但機(jī)器學(xué)習(xí)和人工智能已經(jīng)從大學(xué)的象牙塔里走出來了。我認(rèn)為我們有責(zé)任考慮這個(gè)問題,并參與到關(guān)于人工智能用法的社會(huì)和政治討論中去。其中一個(gè)問題是,專業(yè)知識(shí)和技能、財(cái)富和技術(shù)將集中在哪里?這些是否由少數(shù)國家、少數(shù)公司以及一小群人集中掌控?或者是否有方法使人們更容易獲取這些?特別是在一些它們能夠?qū)Ω嗳水a(chǎn)生更大影響的國家。
HINTON:谷歌已經(jīng)開源了發(fā)展神經(jīng)網(wǎng)絡(luò)的主要軟件,這就是大家所稱的 TensorFlow。人們還可以使用特殊的谷歌硬件在云端建立神經(jīng)網(wǎng)絡(luò)。所以,谷歌正努力促使更多的人獲取并使用這項(xiàng)技術(shù)。
LECUN:我認(rèn)為這是非常重要的一點(diǎn)。深度學(xué)習(xí)社區(qū)在這一方面已經(jīng)做得很好了。具體而言,在學(xué)術(shù)界有學(xué)術(shù)會(huì)議公開發(fā)表論文和評(píng)審,在業(yè)界有谷歌和 Facebook 等公司開源其絕大多數(shù)自己編寫的軟件,并為他人提供工具以便他們?cè)谶@些軟件的基礎(chǔ)上進(jìn)一步構(gòu)建。所以,任何人都可以復(fù)現(xiàn)其他人的研究,有時(shí)幾天內(nèi)就可以完成。任何頂級(jí)研究組織都不可能在任何特定主題上領(lǐng)先其他人幾個(gè)月。重要的問題是這個(gè)領(lǐng)域的整體進(jìn)展速度有多快。因?yàn)閷?duì)于我們真正想要構(gòu)建的東西——能夠回答任何問題且在現(xiàn)實(shí)生活中為我們提供幫助的虛擬助手,我們不僅缺少相關(guān)技術(shù),還缺少一些基本的科學(xué)原理。我們?cè)娇斓卮偈拐麄€(gè)研究社區(qū)致力于此,則對(duì)我們所有人來說越好。
深度學(xué)習(xí)是一類對(duì)計(jì)算資源有著高度要求的領(lǐng)域,而 GPU 的選擇和配置將從根本上決定你的深度學(xué)習(xí)體驗(yàn)。
云軒i7六核 RTX2080ti雙路顯卡深度學(xué)習(xí)訓(xùn)練電腦主機(jī)便是一款不錯(cuò)的選擇。