人工智能為什么解高等數學能夠開掛?
我們一起從考研說起。考研的重要程度,正在比肩高考。我給你說個數字:2021年全國高考考生是1078萬人,2022年全國考研考生是457萬人,也就是說,考研人數已經接近高考人數的一半。再來看錄取率,2021年高考錄取率為87%,而2022年考研錄取率只有24%,考研的競爭激烈程度比高考要大得多。
目前,2022年考研筆試已經結束,分數還沒有公布。很多考生反饋,今年的英語科目相對簡單,政治科目比想象中難,但最難的是數學。有考生說,“70%的復習時間都給了數學,到頭來還是當頭一棒,感覺啥都不會”。還有人說,“感覺一年都白復習了,今年考完就覺得好像我沒有學過數學”。可以說,在考研競爭中,誰能拿下高數,誰就能笑傲江湖。
其實,不光是普通人會覺得數學題很難,連人工智能在很長一段時間內都搞不定數學題。在一年以前,如果你給世界上最先進的人工智能出一道題,問它:五莊觀里種了5棵人參果樹,三千年一開花,三千年一結果,再三千年方得成熟。一萬八千年后,一共結了多少個人參果?這個問題,人工智能大概率回答不出來。當時的人工智能解答這種文字表述的數學題,還處于小學生水平。
就在最近,人工智能突然開竅了,做數學題的能力直接秒殺理工科大學生。這是怎么回事呢?來看看新一期的麻省理工學院科技報告。
2022年1月4號,麻省理工學院等四所高校的聯合研究團隊,發布了一項最新研究成果:他們開發的神經網絡程序,可以解答出微積分、線性代數等大學數學題。不管是要求計算數值,還是寫方程式,或者畫出函數圖形,都是手到擒來,正確率達到了100%,真是學渣秒變學霸。要知道,在短短幾個月前,人工智能解答類似的題,最高正確率不到10%。
說了這么多,人工智能到底是怎么開掛的?
我們先來想一下,為什么以前人工智能做不到?肯定不是因為算力不夠,而是因為,解數學題不是直接算公式,而是需要你去理解文字,就像西游記中五莊觀的人參果那道題一樣。此外,有的題還需要聯系上下文,并且包括了一些隱含條件。比如,一道概率論的題目,問:“在德州撲克游戲中,拿到兩副對子的概率是多少?”這道題在別人看來很清楚,但是對于計算機來說,其實是有很多隱含條件的。比如,一副撲克有52張牌、4種花色;德州撲克的一手牌有5張等等。人工智能不知道這些隱含條件,就沒法算題。
實現這個突破的核心,是一種新的翻譯工具,名字叫做Codex。這是一個超大型的神經網絡模型,經過了數以億計的代碼訓練之后,就可以通過閱讀人類的語言,理解語言想表達的意思,去掉與解題無關的多余信息,同時把語境背后的隱含條件補齊,最后用編程語言寫出來。
比如那道德州撲克的題,“拿到兩副對子的概率是多少?”Codex翻譯出來是這樣的,你感受一下:“一副牌有5張,從13組牌、每組4張、共52張牌中,隨機抽取。抽到兩副對子,要求5張牌中一共有3種牌,每種數量最多兩張。請問抽到兩副對子的概率。”
經過Codex的翻譯之后,這道數學題就變成了一個很簡單的編程問題,對人工智能來說是小菜一碟。
同學們,Codex可不光是能讓人工智能開掛,它也可能讓我這樣的普通人開掛。假設,世界上還沒有發明俄羅斯方塊這款游戲,是我先想出了這個游戲規則,但我不會寫代碼。怎么辦呢?我只需要對Codex說一段話,比如:“我想要一個游戲,各種由四個方塊任意組成的形狀,從屏幕上方掉下來,按方向鍵就可以控制它們的左右移動和加速下落,屏幕里面的一行如果填滿了就把這行消除……”那么,Codex就會按照你的描述,用計算機語言重新生成一段能夠順利運行的游戲程序,并且真的可以在電腦平板上運行來玩。
在2021年8月,Codex的發布會上,就展示了用大概幾百個字的文字描述,自動生成了類似飛機大戰、躲磚塊這樣的游戲。是不是聽起來特別神奇?我一個不會寫代碼的人,也能成為游戲設計師。
最后,看完這篇研文我也有一點感觸。看似平淡無奇的人類語言,我們理解起來毫不費力,每日都在用而不知其中的內容容量,但是,強大的人工智能竟然需要經過數以億計的代碼訓練,才能讀懂語言背后的意思。語言學家喬姆斯基曾經說過一句話:“研究人類的語言,就是探索人類的本質,也就是探索迄今所知人類獨有的心智特性。”