ChatGPT的火爆背后,人工智能發展未來路向何方?
本文轉載自微信公眾號「活在信息時代」,作者活在信息時代。轉載本文請聯系活在信息時代公眾號。
這幾天,人工智能領域最火的當紅炸子雞,無異于OpenAI開發的可以進行對話聊天的機器人ChatGPT了。
ChatGPT是一個大型預訓練語言模型,它可以在對話中生成類似于人類的文本響應。其基于算法基于當下最為流行的Transformer架構,這是一種使用自注意力機制處理輸入數據的深度神經網絡。廣泛用于各類自然語言處理任務。ChatGPT基于大量文本對話數據集進行訓練,并使用自注意力機制來學習類人對話的模式和結構。這使得他的回答,與真人的回答非常接近。甚至有人認為ChatGPT可以完全替代搜索引擎了。
在知乎作者DeFi的科普文《科普:什么是ChatGPT?》中,對ChatGPT進行了介紹。如圖所示:
但是在文末的最后,作者給了大家一個彩蛋,表示這篇文章本身即是ChatGPT自己寫的。例如上圖中的“ChatGPT介紹”一節,即是作者在向ChatGPT提問:什么是ChatGPT?之后得到的回答,類似的,“算法”一節,則是作者在提問了“ChatGPT背后的算法是什么?”之后得到的回答。
從文章中,我們可以看出,ChatGPT在這種場景下的回答,幾乎難以分辨是否是機器人在回答。這也難怪很多人對它的表現表示出驚嘆了。
然而另外的一批人則對于ChatGPT的表現并不滿意。例如說著名的程序員社區Stackoverflow在12月4日的時候就發布了一條臨時規定:禁止使用ChatGPT生成的內容來回答Stackoverflow上面的問題。原因在于,這些生成的內容正確率非常的低,而這些似是而非的內容,對于整個網站以及尋求正確答案的用戶來說是有害的。這里的主要問題是,由于使用ChatGPT的門檻非常低,因此近日來很多人都在使用ChatGPT來回答別人提出的問題,而由于他們本身缺少專業知識,沒有驗證ChatGPT生成的回答是否正確的能力,因此產生了很多毫無價值,甚至會引起誤導的回答。
而另外的一些人則嘗試了一些小學生的問題,而ChatGPT回答的不盡人意。例如:
而這些簡單問題回答的不盡人意的背后,則是我們對于人工智能領域發展的深度思考。
在深度學習領域,研究者們常說一句話:如果你拷問數據到一定程度,它會坦白一切。
這是一種自嘲,目前的人工智能領域,主要還是依靠大量的訓練數據來訓練模型,一個模型的成功與否與其訓練的數據量息息相關。那么這勢必會引出一個問題:如果有一天,一個超級模型使用了世界上最大的數據集進行訓練之后,還是不能得到足夠優秀的結果怎么辦?畢竟對于普通人來說,并不需要學習世界上的所有知識就可以具有自己的學習和判斷能力。
而更進一步的講,全部的真實數據訓練的數據就一定會比一部分真實數據訓練出來的模型更好嗎?考慮到有些真實數據本來就是對于同一個問題的答案完全相反的。就好像同一個問題下面,總會有不同的人進行爭論一樣。而這些訓練集勢必會對于神經網絡的訓練結果產生影響。
或許,人工智能的真正突破,還要等待基礎科學的突破。就好像麥克斯韋方程將人們帶入了無線信號傳輸時代一樣。在我們朝夕相處的空間中,或許還隱藏著更深的秘密,等待人們去發現。