MIT&谷歌大腦用AI破解失傳的古代文字，被稱“現代版羅塞塔石碑”

作者：郭一璞 2019-07-09 10:01:14

新聞人工智能

漫漫塵埃下，掩藏了許多曾經輝煌燦爛古代文明，但我們現在卻無法清晰地知道，這些地方究竟發生了什么。搞懂這些歷史的最佳方式，就是找到他們的文字記載。

本文經AI新媒體量子位（公眾號ID:QbitAI）授權轉載，轉載請聯系出處。

漫漫塵埃下，掩藏了許多曾經輝煌燦爛古代文明，但我們現在卻無法清晰地知道，這些地方究竟發生了什么。

搞懂這些歷史的***方式，就是找到他們的文字記載。However，記載文字的石碑可以被考古學家們挖出來，但這些古文字究竟啥意思，現代的人們看不懂，需要語言學家們耗盡青春來推測。

現在，MIT CSAIL和谷歌大腦的研究者出手了，他們用機器學習破譯了烏加里特文和線性文字B。

[[270013]]

△ 烏加里特王宮

烏加里特文，Ugaritic，是一種楔形文字，屬于閃米特語族。從字面上來看，就知道它是一個叫做烏加里特（Ugarit）的文明使用的語言，這個文明位于當今地中海沿岸的敘利亞，在公元前6000年前后就初現蹤跡，在公元前1190年前后滅亡。

[[270014]]

△ 烏加里特文

線性文字B，Linear B，由一種人類還沒有破譯出來的線性文字A演化而來，主要存活于公元前1500年到公元前1200年的克里特島和希臘南部，是希臘語的一種古代書寫形式。

[[270015]]

△ 線性文字B

研究者們利用同一語族內不同語言之間的聯系，用機器學習的方法來破譯這兩種失傳的語言，這是破譯古代語言的新方法，也將對羅曼語族的語言學研究有巨大的影響和提升。

這個方法讓許多人驚嘆：

簡直是現代版的羅塞塔石碑！

PS，羅塞塔石碑是一塊用3種語言寫了同一個內容的石碑，幫助語言學家們讀懂古文字。

希望能先把動物和植物的語言破譯了，可以發現打開新世界的大門。

人類語言總相通

這項研究的核心方法，是借助人類語言的相似性。

比如，知乎用戶@拉隊短在介紹歐洲語言相似性的時候，舉了這么個栗子：

句子“那是六月末潮濕陰沉的一個夏日。”

英語：It was a humid, grey summer day at the end of June.

丹麥語：Det var en fugtig, grå sommerdag i slutningen af juni.

瑞典語：Det var en fuktig, grå sommardag i slutet av juni.

挪威語：Det var en fuktig, grå sommerdag i slutten av juni.

冰島語：Það var rakur, grár sumardagur í lok júní.

看，長得差不多嘛，畢竟同屬印歐語系日耳曼語族，單詞的分布位置、句子的結構都很相似，如果你能看懂一種語言，就能大致猜測和它“血緣”關系近的另一種語言。