Google Research:哥德爾獎(jiǎng)、高德納獎(jiǎng)得主解析「大腦中文字表征」
這次的在線研討會(huì)有一個(gè)演講特別引人注目: 哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)教授Christos Papadimitriou關(guān)于「大腦中的文字表征」的演講。
△ 哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)教授Christos Papadimitriou,哥德爾獎(jiǎng)和高德納獎(jiǎng)的獲得者
Papadimitriou在演講中討論了隨著我們對(duì)大腦信息處理機(jī)制理解的增多,我們將能夠開發(fā)更強(qiáng)健的算法更好地理解和參與對(duì)話。他展示了一個(gè)簡(jiǎn)單有效的模型,解釋了大腦不同區(qū)域如何相互溝通來(lái)解決認(rèn)知問(wèn)題。
Papadimitriou把與觀眾「交流」這件事描述為「世界上最偉大的奇跡之一」。
大腦將結(jié)構(gòu)化的知識(shí)轉(zhuǎn)換成電波,通過(guò)不同的媒介傳輸?shù)铰犝叩亩洌缓笤儆纱竽X處理并轉(zhuǎn)換成結(jié)構(gòu)化的知識(shí)。
「毫無(wú)疑問(wèn),所有這些都發(fā)生在棘波、神經(jīng)元和突觸上。但是怎么實(shí)現(xiàn)的呢?這是一個(gè)巨大的問(wèn)題。我相信,未來(lái)十年如何實(shí)現(xiàn)這一目標(biāo)的細(xì)節(jié)我們將會(huì)有更好的辦法。」
大腦中神經(jīng)元的集合
認(rèn)知和神經(jīng)科學(xué)家們正試圖弄清楚大腦中的神經(jīng)活動(dòng)是如何轉(zhuǎn)化為語(yǔ)言、數(shù)學(xué)、邏輯、推理、計(jì)劃和其他功能的。如果科學(xué)家們能夠成功地用數(shù)學(xué)模型來(lái)描述大腦的運(yùn)作,那么他們將打開一扇新的大門,創(chuàng)造出能夠模仿人類思維的人工智能系統(tǒng)。
許多研究集中在單個(gè)神經(jīng)元的活動(dòng)。直到幾十年前,科學(xué)家們還認(rèn)為單個(gè)神經(jīng)元對(duì)應(yīng)著單個(gè)的想法。
最流行的例子是「祖母細(xì)胞」理論,該理論聲稱,每當(dāng)你看到祖母時(shí),大腦中就有一個(gè)神經(jīng)元會(huì)達(dá)到峰值。
最近的一些發(fā)現(xiàn)駁斥了這種說(shuō)法,并證明了每個(gè)概念與大量的神經(jīng)元都有關(guān)聯(lián),而且神經(jīng)元與不同概念之間可能存在重疊。
這些腦細(xì)胞群被稱為「集合體」,Papadimitriou將其描述為「一組高度連接、穩(wěn)定的神經(jīng)元,它們代表著某種東西: 一個(gè)詞、一個(gè)想法、一個(gè)物體等等。」
神經(jīng)科學(xué)家György Buzsáki將集合體描述為「大腦的字母表」。
△ 神經(jīng)科學(xué)家György Buzsáki
大腦的數(shù)學(xué)模型
為了更好地理解集合體的作用,Papadimitriou提出了一個(gè)被稱為「互動(dòng)循環(huán)網(wǎng)」的大腦數(shù)學(xué)模型,根據(jù)這個(gè)模型,大腦被劃分為有限數(shù)量的區(qū)域,每個(gè)區(qū)域包含數(shù)百萬(wàn)個(gè)神經(jīng)元。
每個(gè)區(qū)域都有遞歸,這意味著神經(jīng)元之間相互作用。每個(gè)區(qū)域都與其他幾個(gè)區(qū)域有聯(lián)系。這些區(qū)域間的連接可以被激發(fā)或被抑制。
這個(gè)模型提供了隨機(jī)性、可塑性和抑制性。
隨機(jī)性意味著每個(gè)大腦區(qū)域的神經(jīng)元是隨機(jī)連接的。而且,不同的區(qū)域之間有著隨機(jī)的聯(lián)系。
可塑性使神經(jīng)元和區(qū)域之間的連接能夠通過(guò)經(jīng)驗(yàn)和訓(xùn)練進(jìn)行調(diào)整。
抑制性意味著,在任何時(shí)刻,有限數(shù)量的神經(jīng)元處于興奮狀態(tài)。
Papadimitriou將其描述為一個(gè)基于「生命的三種主要力量」的非常簡(jiǎn)單的數(shù)學(xué)模型。

與來(lái)自不同學(xué)術(shù)機(jī)構(gòu)的科學(xué)家一起,Papadimitriou在去年發(fā)表在同行評(píng)審的科學(xué)期刊《美國(guó)國(guó)家科學(xué)院院刊》(PNAS)的一篇論文中詳細(xì)闡述了這個(gè)模型。

△ 論文 https://www.pnas.org/content/117/25/14464
集合體是模型的關(guān)鍵組成部分,并且支持科學(xué)家所說(shuō)的「集合演算」,即一組能夠處理、存儲(chǔ)和檢索信息的操作。
「這些操作不是憑空而來(lái)的。我相信這些操作是真的,我們可以通過(guò)數(shù)學(xué)證明和通過(guò)模擬驗(yàn)證這些操作符合真實(shí)的行為...... 這些操作符合(在大腦中)觀察到的行為。」
Papadimitriou和他的同事們假設(shè)集合和集合演算是解釋大腦認(rèn)知功能(如推理、計(jì)劃、語(yǔ)言)的正確模型。
Papadimitriou表示,大部分的認(rèn)知能力都符合這個(gè)要求。
基于集合演算的自然語(yǔ)言處理
為了測(cè)試他們的思維模型,Papadimitriou 和同事構(gòu)建了一個(gè)自然語(yǔ)言處理系統(tǒng),該系統(tǒng)使用集合演算來(lái)分析英語(yǔ)句子。
實(shí)際上,他們?cè)噲D創(chuàng)造一個(gè)人工智能系統(tǒng),模擬大腦中存放與詞匯和語(yǔ)言理解相對(duì)應(yīng)的集合的區(qū)域。

「實(shí)際情況是,如果一系列單詞在LEX中激發(fā)了這些集合,那么這個(gè)引擎將生成一個(gè)句子的解析,」Papadimitriou介紹說(shuō)。
該系統(tǒng)專門通過(guò)模擬神經(jīng)元spike來(lái)工作(就像大腦一樣) ,這些spike是由集合演算操作引起的。這些神經(jīng)元集合體對(duì)應(yīng)于內(nèi)側(cè)顳葉區(qū)域、Wernicke區(qū)域和 Broca 區(qū)域,這三個(gè)區(qū)域是大腦中高度參與語(yǔ)言處理的區(qū)域。
該模型接收一系列單詞并生成一個(gè)語(yǔ)法樹。他們的實(shí)驗(yàn)表明,就神經(jīng)元spike的速度和頻率而言,他們的模型活動(dòng)與大腦中發(fā)生的活動(dòng)非常接近。
人工智能模型仍然非常初級(jí),缺少語(yǔ)言的許多重要部分,Papadimitriou承認(rèn)這一點(diǎn)。研究人員正在制定計(jì)劃,填補(bǔ)存在的語(yǔ)言空白。他們相信,所有這些部分都可以用集合演算加以補(bǔ)充,這個(gè)假設(shè)需要通過(guò)時(shí)間的檢驗(yàn)。

「這是語(yǔ)言的神經(jīng)基礎(chǔ)嗎?我們是不是生來(lái)就有這樣一個(gè)東西存在于我們的大腦左半邊,」Papadimitriou問(wèn)道。
關(guān)于語(yǔ)言在人腦中是如何工作的,以及它與其他認(rèn)知功能之間的關(guān)系,仍然存在許多問(wèn)題。但是 Papadimitriou 相信集合模型使我們更接近理解這些功能,同時(shí)回答剩余的問(wèn)題。
語(yǔ)言分析只是測(cè)試集合演算理論的一種方法。Papadimitriou 和他的合作者們正在研究其他的應(yīng)用,包括學(xué)習(xí)和計(jì)劃,就像小孩子做的那樣。
Papadimitriou 說(shuō): 「我們的假設(shè)是,集合演算或類似的東西填補(bǔ)了邏輯存取賬單。換句話說(shuō),這是我們大腦計(jì)算方式的一個(gè)有用的抽象概念。」