三十年前,美國(guó)政府開啟了人類基因組計(jì)劃,然后經(jīng)過(guò)十三年的努力,終于完成了人類這一物種的所有基因組測(cè)序,并繪制了人類基因圖譜。盡管起初遭遇了懷疑甚至反對(duì),但該計(jì)劃自此改變了遺傳學(xué)領(lǐng)域,而且如今仍被視為歷史上最成功的科學(xué)事業(yè)之一。
現(xiàn)在高級(jí)智慧研究計(jì)劃( IARPA )—— Intelligence Advanced Research Projects Activity,它在命名上模仿了國(guó)防部門下屬的著名的美國(guó)國(guó)防部高級(jí)研究計(jì)劃局( DARPA )——是一家針對(duì)智能社區(qū)而建立的研究機(jī)構(gòu),已投入一億美元用于類似的雄偉計(jì)劃。大腦皮層網(wǎng)絡(luò)的機(jī)器智能( MICrONS )項(xiàng)目旨在反向設(shè)計(jì)一立方毫米的大腦,研究大腦的計(jì)算方式,并運(yùn)用這些研究發(fā)現(xiàn)去更好地影響機(jī)器學(xué)習(xí)和人工智能算法。
IARPA 已經(jīng)招募了三個(gè)團(tuán)隊(duì),領(lǐng)頭人分別是哈佛大學(xué)的生物學(xué)家、計(jì)算科學(xué)家 David Cox ,卡內(nèi)基梅隆大學(xué)的計(jì)算科學(xué)家 Tai Sing Lee 和貝勒醫(yī)學(xué)院的神經(jīng)科學(xué)家 Andreas Tolias 。每個(gè)團(tuán)隊(duì)都為這個(gè)難題提出了自己的五年研究規(guī)劃。
“這是一次巨大的投資,因?yàn)槲覀冋J(rèn)為這是一個(gè)重要的挑戰(zhàn),它將對(duì)智能社區(qū)和整個(gè)世界產(chǎn)生非常廣泛的革命性影響。” IARPA的Jacob Vogelstein 是 MICrONS 項(xiàng)目的管理者,如此說(shuō)到。
MICrONS 是奧巴馬總統(tǒng)大腦計(jì)劃(BRAIN Initiative)的一部分,試圖將類腦計(jì)算的現(xiàn)狀向前推進(jìn)。很多技術(shù)如今都依賴于一套叫做人工神經(jīng)網(wǎng)絡(luò)的算法。人工神經(jīng)網(wǎng)絡(luò),顧名思義,就是從大腦的組織結(jié)構(gòu)(至少是我們已了解到的組織結(jié)構(gòu))受到啟發(fā)而構(gòu)建的。由于計(jì)算能力顯著增長(zhǎng)和網(wǎng)上的大量可用數(shù)據(jù), Facebook 能識(shí)別面孔, Siri 能分辨聲音,汽車可以自動(dòng)駕駛,計(jì)算機(jī)可以在像象棋這樣的游戲中擊敗人類(現(xiàn)在甚至是在圍棋這種號(hào)稱人類堡壘的游戲中也能擊敗人類了)。
然而,這些算法依賴于高度簡(jiǎn)化的模式分析信息過(guò)程,發(fā)展水平仍然很低?;?9世紀(jì)80年代的模型,神經(jīng)網(wǎng)絡(luò)在雜亂的環(huán)境中往往表現(xiàn)得很糟糕。在那種環(huán)境中,計(jì)算機(jī)試圖辨別的物體隱藏在眾多物體之中,而且許多物體是重疊的或模糊的。這些算法并不具備很好的概括能力,例如,計(jì)算機(jī)看到一兩條狗,并不能教會(huì)計(jì)算機(jī)辨識(shí)所有的狗。
另一方面,人類似乎能毫不費(fèi)力地應(yīng)對(duì)這些挑戰(zhàn)。我們可以在人群中找出朋友,可以在喧鬧的環(huán)境中注意到熟悉的聲音,還可以根據(jù)一個(gè)或少數(shù)幾個(gè)例子推斷出聲音或圖像的模式。我們不需要任何指導(dǎo)就能持續(xù)不斷地學(xué)會(huì)歸納概括。所以, MICrONS 的研究轉(zhuǎn)而求助大腦,以期發(fā)現(xiàn)計(jì)算機(jī)模型缺少什么。“那就是鐵證。” Cox 說(shuō)。
盡管神經(jīng)網(wǎng)絡(luò)是大腦組織結(jié)構(gòu)中的基本要素,然而他們所使用的計(jì)算方法并沒(méi)有直接模仿神經(jīng)元用來(lái)處理信息的算法。換言之,當(dāng)前各種算法描述、變換數(shù)據(jù)并從數(shù)據(jù)中學(xué)習(xí)的方法,在很大程度上是由試錯(cuò)決定的工程方案。神經(jīng)網(wǎng)絡(luò)能起作用,但科學(xué)家不是真的知道其中奧妙——當(dāng)然也就不能很好地找到一條設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)的途徑。“所以,如果我們更進(jìn)一步,從計(jì)算角度而不是組織結(jié)構(gòu)角度理解大腦,我們就能改進(jìn)那些算法,并讓計(jì)算機(jī)的性能更接近人腦。” Vogelstein 說(shuō)。
不同團(tuán)隊(duì)將盡力繪制出嚙齒動(dòng)物一立方毫米大腦皮層中的所有神經(jīng)回路
一立方毫米不足人腦的百萬(wàn)分之一,可能看上去太小了。但是迄今為止,科學(xué)家們只能在同一時(shí)間測(cè)量少數(shù)神經(jīng)元的活動(dòng),或者用功能性核磁共振獲得復(fù)合圖片來(lái)觀測(cè)數(shù)百萬(wàn)神經(jīng)元?,F(xiàn)在, MICrONS的成員打算在嚙齒動(dòng)物進(jìn)行視覺(jué)感知和學(xué)習(xí)任務(wù)的過(guò)程中記錄十萬(wàn)神經(jīng)元的活動(dòng)和連接,這是相當(dāng)偉大的壯舉,因?yàn)檫@需要具有納米分辨率的成像技術(shù),并且影像中曲折彎轉(zhuǎn)的線全長(zhǎng)只有幾毫米。“這就像是一英寸一英寸地測(cè)量來(lái)繪制美國(guó)的公路交通圖。” Vogelstein 說(shuō)。
然而, Vogelstein 是樂(lè)觀的,因?yàn)樽罱募夹g(shù)支持為大規(guī)模的神經(jīng)科學(xué)研究提供了方便。“隨著大腦計(jì)劃的降臨,大量的新工具出現(xiàn)在了網(wǎng)上,能夠在重構(gòu)詳盡的神經(jīng)回路圖譜所要求的分辨率和尺度上探詢大腦,”他說(shuō),“所以,這是歷史上獨(dú)一無(wú)二的時(shí)刻,我們擁有了恰當(dāng)?shù)墓ぞ?、方法和技術(shù),可以讓我們第一次在單個(gè)神經(jīng)元和單個(gè)突觸水平上揭示大腦的線路圖。”
每個(gè)團(tuán)隊(duì)打算分別記錄大腦的路線圖。 Cox 的團(tuán)隊(duì)將使用名為雙光子顯微技術(shù)( two-photon microscopy )的工具測(cè)量老鼠的大腦活動(dòng),這些老鼠被訓(xùn)練去辨識(shí)電腦屏幕上的物體。研究員們將一種改良過(guò)的對(duì)鈣很敏感的熒光蛋白導(dǎo)入老鼠。當(dāng)一個(gè)神經(jīng)元興奮時(shí),鈣離子就蜂擁進(jìn)入細(xì)胞,引起熒光蛋白發(fā)光,因此研究員們使用激光掃描顯微鏡就能觀看到神經(jīng)元爆發(fā)動(dòng)作電位。“這有點(diǎn)像電線輕敲大腦,” Cox 說(shuō),“類似于你可能通過(guò)收聽電話呼叫里的信息來(lái)弄明白發(fā)生了什么,我們也可以在動(dòng)物活潑亂跳的時(shí)候收聽到它們大腦內(nèi)部的重要信息。”
然后,一立方毫米的老鼠大腦將被送到 Jeffrey Lichtman 手上,他是哈佛大學(xué)的一位生物學(xué)家和神經(jīng)科學(xué)家。在他的實(shí)驗(yàn)室,大腦將被切成極其細(xì)薄的片,并在先進(jìn)的具備足夠分辨率的電子顯微鏡下成像,研究員們就能看到腦細(xì)胞彼此連接而形成的所有的線狀延伸。 Tolia 的團(tuán)隊(duì)正采取相似的名叫三光子顯微技術(shù)( three-photon microscopy )的方法,來(lái)深入窺探老鼠大腦中更深處的皮層,而不僅是 Cox 和他的同事們檢測(cè)的頂部皮層。
與此同時(shí), Lee 的團(tuán)隊(duì)打算走得更遠(yuǎn),想尋找到描繪神經(jīng)連接組的更根本的方法。他們與哈佛醫(yī)學(xué)院的遺傳學(xué)家 George Church 合作,打算使用DNA條形碼:他們將用獨(dú)特的核苷酸序列給每個(gè)神經(jīng)元打上標(biāo)簽(條形碼),并用化學(xué)方法連接突觸之間的條形碼來(lái)改造神經(jīng)回路。盡管這種方法不能像顯微技術(shù)那樣提供同樣水平的空間信息, Lee 希望它能更快,更準(zhǔn)確——也就是說(shuō)希望它在各方面發(fā)揮作用。這種方法在以前從未成功過(guò)。“但是,倘若這種條形碼技術(shù)發(fā)揮了作用,就將革新神經(jīng)科學(xué)和連接組學(xué)。” Lee 說(shuō)。
以上所說(shuō)的一切僅僅構(gòu)成 MICrONS 項(xiàng)目的前半部分??茖W(xué)家們接下來(lái)必須找到一條路徑讓所有這些信息能夠用于機(jī)器學(xué)習(xí)算法。他們大致上知道如何去做。比如說(shuō),許多研究員相信大腦是貝葉斯式的——神經(jīng)元以概率分布的形式表征感官信息, 基于先前的經(jīng)驗(yàn)對(duì)事件計(jì)算得出最可能的解釋。這種假設(shè)主要是基于大腦中的反饋回路這一想法,即信息不僅向前流動(dòng),還通過(guò)更多連接反向流動(dòng)。
換言之,研究員們假設(shè)感知絕不是簡(jiǎn)單的從輸入到輸出的映射。更準(zhǔn)確地說(shuō),存在一個(gè)“通過(guò)合成進(jìn)行分析”的建設(shè)性過(guò)程,大腦維持并創(chuàng)造對(duì)世界的內(nèi)部表征,產(chǎn)生期待和預(yù)測(cè),這讓它可以解釋和計(jì)劃如何使用輸入的數(shù)據(jù)。“這是我們最近非常關(guān)注的指導(dǎo)性原則——是這個(gè)合成過(guò)程的標(biāo)志,” Cox 說(shuō),“在這里我們?cè)O(shè)想在這世界上什么是可能的,驗(yàn)證那些不符合我們實(shí)際所見的設(shè)想,并用那些設(shè)想驅(qū)動(dòng)我們的認(rèn)知。”
例如,視網(wǎng)膜對(duì)光做出反應(yīng),產(chǎn)生電脈沖,傳遞到視神經(jīng)然后到大腦,實(shí)際上視網(wǎng)膜是二維結(jié)構(gòu)。因此當(dāng)人們看一個(gè)物體時(shí),大腦可能使用了這樣一個(gè)基于概率的模型從光刺激視網(wǎng)膜的二維平面去推導(dǎo)立體世界。僅以此為例,大腦已經(jīng)找到一個(gè)更好的方法對(duì)環(huán)境中的變量進(jìn)行估算和推論,超過(guò)了我們當(dāng)前的數(shù)學(xué)模型所能做到的。畢竟,如果你觀察一個(gè)有一百個(gè)物體的場(chǎng)景,僅僅考慮物體是向前還是向后,這僅僅是諸多因素中的兩個(gè)因素,結(jié)果就有2100種可能的模式。計(jì)算出所有的可能情況來(lái)得到答案,不是切實(shí)可行的。然而大腦能輕松地做到,即使有無(wú)限多種可能的條件取向:不同的距離,不同的旋轉(zhuǎn)角度,不同的光照條件等。“大腦要做的是顯示數(shù)據(jù)點(diǎn)的匯集情況,并讓混在一起的數(shù)據(jù)輕易的分隔開。” Tolias 說(shuō)。
這三個(gè)團(tuán)隊(duì)都各自招募了計(jì)算機(jī)科學(xué)家來(lái)將這些理論提煉成模型,然后他們將測(cè)試這些模型是否與反向設(shè)計(jì)的大腦數(shù)據(jù)相抵觸。“對(duì)于任何給定描繪的算法,如基于概率的算法,你都有數(shù)百萬(wàn)種可以實(shí)施的選項(xiàng)將理論翻譯成可執(zhí)行的代碼,” Vogelstein 說(shuō),“在這些大約百萬(wàn)中的選項(xiàng)中,某些參數(shù)和特征的結(jié)合將形成好的算法,而另外一些結(jié)合將造成無(wú)效的或糟糕的算法。通過(guò)從大腦研究中提取這些參數(shù)設(shè)置,這與我們一直在做的那樣在電腦軟件上猜測(cè)那些參數(shù)相反,我們有希望將研究空間縮小到實(shí)現(xiàn)一小部分符合大腦實(shí)際情況。”
有了這些內(nèi)部模型, MICrONS 打算讓機(jī)器更自動(dòng)化,尤其是當(dāng)談及訓(xùn)練機(jī)器去辨認(rèn)物體并且不需要事先讓機(jī)器通過(guò)成千上萬(wàn)的、物品被明確命名的例子進(jìn)行學(xué)習(xí)。 Vogelstein 想要將無(wú)監(jiān)督式學(xué)習(xí)技術(shù)應(yīng)用于協(xié)助美國(guó)智能。 “我們可能只有一張圖片,或者一個(gè)我們想要阻止的網(wǎng)絡(luò)攻擊的例子,或者一份金融危機(jī)或?yàn)?zāi)害性天氣的記錄,”他說(shuō),“我們需要推廣到更廣泛的、相同模式可能出現(xiàn)的環(huán)境中去。所以這就是我們希望達(dá)到的:更好的概括推廣,更強(qiáng)的抽象能力,更好的稀疏數(shù)據(jù)使用。”
研究員們認(rèn)為從大腦推導(dǎo)這樣的算法將是 MICrONS 面臨的最困難的部分,他們將不得不確定一種方法去編譯大腦是如何加工信息和形成新連接的。
然而,在這個(gè)研究項(xiàng)目的初期也存在一些挑戰(zhàn)
舉例來(lái)說(shuō),他們對(duì)大腦的測(cè)量將產(chǎn)生大約兩千兆兆字節(jié)的數(shù)據(jù),這個(gè)數(shù)量等于 250,000 臺(tái)筆記本電腦的內(nèi)存量,或者 250個(gè) CD 的存儲(chǔ)量。存儲(chǔ)如此巨量的數(shù)據(jù)是困難的, IARPA 已經(jīng)與 Amazon 合作尋找解決方案。
另外,數(shù)據(jù)全是圖象式的。挖掘數(shù)據(jù)以得到有用信息將需要一個(gè)叫做分隔的過(guò)程,在這個(gè)過(guò)程中,研究員用不同的顏色區(qū)分神經(jīng)元的結(jié)構(gòu)基礎(chǔ)和神經(jīng)連接,這樣計(jì)算機(jī)就可以更好地理解共同特征和模式。“即使對(duì)你來(lái)說(shuō)全世界都是染有顏色的,” Lichtman 說(shuō),“要為一立方米的大腦染色也需要耗費(fèi)終生光陰。”相反,研究員們將致力于創(chuàng)造出更復(fù)雜巧妙的計(jì)算機(jī)視覺(jué)技術(shù)來(lái)劃分?jǐn)?shù)據(jù)。
Lichtman 已經(jīng)懂得成功存儲(chǔ)100萬(wàn)億字節(jié)的數(shù)據(jù)(這是 MICrONS 計(jì)劃收集的數(shù)據(jù)的二十分之一),這些數(shù)據(jù)產(chǎn)生于傳遞感官信息的中轉(zhuǎn)站——丘腦。他的團(tuán)隊(duì)的成果將在3月發(fā)表在《 Cell 》上。“我們了解到有時(shí)候同一軸突會(huì)從一個(gè)細(xì)胞跳去另一個(gè)細(xì)胞來(lái)連接不同神經(jīng)細(xì)胞的同一位置,這意味著丘腦的組織方式并不人們預(yù)料的那樣。” Lichtman 說(shuō)。也許,這些成果將擴(kuò)展至他們剛剛開始測(cè)評(píng)的一立方毫米的大腦皮層。“我們知道我們可以測(cè)評(píng)更大的體積,但是目前一立方毫米對(duì)我們來(lái)說(shuō)就是巨大的體積,”他說(shuō),“這是一次巨大的飛躍。我們認(rèn)為我們已經(jīng)準(zhǔn)備好走下一步了。”
David Mumford 是一位數(shù)學(xué)大師,菲爾茲獎(jiǎng)得主,也是 Lee 的博士導(dǎo)師,卻不是 MICrONS 的成員。他稱贊這個(gè)項(xiàng)目。“這是真正的進(jìn)步,”他說(shuō),“一旦這種數(shù)量級(jí)的數(shù)據(jù)集可供使用,我們能更深入地理解神經(jīng)元彼此互動(dòng)的方式,但是要弄清你能應(yīng)用這些技術(shù)知識(shí)做什么將是巨大的挑戰(zhàn)。我的夢(mèng)想是這一巨量數(shù)據(jù)的記錄在某一時(shí)刻能成為可能,而且我認(rèn)為這個(gè)研究組可能是能很好地做成這件事的組。”
“但是我稍微有點(diǎn)懷疑將這些信息轉(zhuǎn)換成人工神經(jīng)網(wǎng)絡(luò)的可能性,”他補(bǔ)充到,“那稍微有些不同尋常。”
即使這樣,三個(gè)團(tuán)隊(duì)都信心滿滿,認(rèn)為他們的工作將產(chǎn)生成果。 不管研究結(jié)果是什么,結(jié)果都不是失敗,” Lichtman 說(shuō),“結(jié)果可能并不符合你們的預(yù)期,但這是一個(gè)機(jī)會(huì)。我不會(huì)為我們的觀點(diǎn)是否錯(cuò)誤而失眠。還有我們未知的東西。事實(shí)是大腦是真實(shí)存在的,也確實(shí)是復(fù)雜的,從沒(méi)有人看透大腦,所以讓我們關(guān)注研究進(jìn)展。研究中的風(fēng)險(xiǎn)是什么?”
他們還希望在耗資 20 億美元的人腦計(jì)劃陷入困境的地方取得勝利。 Cox 解釋說(shuō)他們的研究方法是與人腦計(jì)劃有根本區(qū)別的,既體現(xiàn)在技術(shù)上也表現(xiàn)在邏輯上。事實(shí)上,首先從本質(zhì)上看,在努力嘗試模仿大腦之前,兩者在本質(zhì)上就相反。 MICrONS 的基于團(tuán)隊(duì)的方式將有望引起必要的合作與競(jìng)爭(zhēng),最終獲得重大進(jìn)展。 IARPA 意欲公布它收集的數(shù)據(jù),以便其他科學(xué)家貢獻(xiàn)思想觀點(diǎn)和科研力量。“即使這就像是在看一粒沙子,”Lee 說(shuō),“就像我的大學(xué)教授告訴我的,你也可以在一粒沙子中看見上帝。”(來(lái)源|機(jī)器之心 編譯|孫閏松、柒柒)
如果您對(duì)您所在行業(yè)有很深認(rèn)知,也想在我們的平臺(tái)上說(shuō)點(diǎn)什么,我們歡迎您來(lái)投稿!
{{item.content}}