谷歌知識(shí)圖譜十年發(fā)展史
譯文2018年,Gartner首次宣布知識(shí)圖譜是一項(xiàng)新興技術(shù);1996年的資源描述框架(一種為標(biāo)準(zhǔn)的主-動(dòng)-賓語(yǔ)義掃清道路的圖譜數(shù)據(jù)模型)問(wèn)世整整26年后,知識(shí)圖譜才到達(dá)成熟度曲線的頂峰。
10年前,谷歌(現(xiàn)在是控股公司Alphabet的子公司)提及了“知識(shí)圖譜”(knowledge graph)這個(gè)術(shù)語(yǔ),并籠統(tǒng)地描述了其知識(shí)圖譜是如何工作的。
而20年前,Tim Berners-Lee、James Hendler和Ora Lassila發(fā)表了他們的第一篇文章來(lái)描述他們?cè)O(shè)想的語(yǔ)義Web。許多知識(shí)圖譜是使用W3C隨后在至少10年前實(shí)施的語(yǔ)義標(biāo)準(zhǔn)來(lái)構(gòu)建的。
想想此后發(fā)生的事情蠻有意思。在過(guò)去這十年,Alphabet逐漸發(fā)展成為全球市值(已發(fā)行股票的總價(jià)值)超過(guò)1萬(wàn)億美元的六大公司之一。
下面是2022年初Alphabet在市值方面與最接近的IT公司相比的排名:
這些市值領(lǐng)先者在知識(shí)圖譜方面有何作為?
我做了一些案頭研究,分析圖中所示的這些公司中哪些在過(guò)去十年致力于開(kāi)發(fā)知識(shí)圖譜:
?蘋(píng)果在2010年收購(gòu)了從斯坦福研究院(SRI)的項(xiàng)目派生而來(lái)的Siri。Tom Gruber是SRI團(tuán)隊(duì)的聯(lián)合創(chuàng)始人。作為人在回路AI領(lǐng)域的先驅(qū),Gruber于1993年在SRI發(fā)表了關(guān)于知識(shí)共享本體(ontology)設(shè)計(jì)的成果。后來(lái)在2019年,蘋(píng)果的工作記錄描述了其知識(shí)圖譜工程團(tuán)隊(duì)的工作,描述如下:
Aaron Bradley通過(guò)Twitter提供,2019年1月19日
?微軟亞洲研究院在2010年開(kāi)發(fā)出了Trinity分布式圖譜存儲(chǔ),并在2013年的一篇論文中發(fā)表了其內(nèi)存中RDF圖譜功能。多年來(lái),Satori一直是微軟版的知識(shí)/事實(shí)圖譜,類似谷歌知識(shí)圖譜。微軟學(xué)術(shù)知識(shí)圖譜(MAKG)出現(xiàn)在2019年前后。該公司在2022年的一份數(shù)據(jù)和分析科學(xué)家空缺職位要求中提到,推動(dòng)“商業(yè)知識(shí)圖譜模型和算法的創(chuàng)新”是該職位的一項(xiàng)要求。
?多年來(lái),亞馬遜似乎對(duì)招聘本體專業(yè)人員猶豫不決,但在2010年代后期著手開(kāi)發(fā)產(chǎn)品知識(shí)圖譜。Alexa對(duì)話式助手基于知識(shí)圖譜,Alexa的含義表示語(yǔ)言(MRL)基于圖譜,一篇關(guān)于該主題的論文在2016年發(fā)表。來(lái)自捷克技術(shù)大學(xué)的Alquist團(tuán)隊(duì)因?qū)υ捠街R(shí)圖譜獲得了第四屆年度Alexa大獎(jiǎng),該知識(shí)圖譜是2020年Alquist 3.0智能助手的基礎(chǔ)。
?Meta(Facebook)在2013年3月宣布了Facebook Graph,到2013年6月將其提供給 Facebook的所有美國(guó)英語(yǔ)用戶。該圖譜含有當(dāng)時(shí)十億不同F(xiàn)acebook用戶的信息。Graph在2022年繼續(xù)提供給用戶使用。
?Alphabet(谷歌)在2012年宣布了其知識(shí)圖譜,員工隊(duì)伍中繼續(xù)擁有語(yǔ)義標(biāo)準(zhǔn)方面有經(jīng)驗(yàn)的本體專業(yè)人員和數(shù)據(jù)架構(gòu)師。
?特斯拉——我還沒(méi)有發(fā)現(xiàn)表明特斯拉在使用知識(shí)圖譜的任何證據(jù)。
谷歌早期的知識(shí)圖譜
這里展示了一張谷歌用來(lái)描述其知識(shí)圖譜的插圖。這是一張有向圖,上面有命名實(shí)體(達(dá)芬奇、蒙娜麗莎和盧浮宮)以及顯示實(shí)體之間關(guān)系的命名關(guān)系。
該圖表明了可以開(kāi)發(fā)的上下文片段,并將Tinker Toy風(fēng)格連接到另一個(gè)兼容的語(yǔ)義圖,這是一種深度集成的過(guò)程,比鏈接關(guān)系表簡(jiǎn)單得多、可擴(kuò)展性強(qiáng)得多。為了減少獲取信息的點(diǎn)擊次數(shù),谷歌隨后使用選擇的一些達(dá)芬奇片段來(lái)填充知識(shí)面板,內(nèi)容直接顯示在結(jié)果頁(yè)面上。到2016年,谷歌上每月有1000億次搜索結(jié)果,其中三分之一都附有知識(shí)面板。
谷歌搜索結(jié)果頁(yè)面通常很快就能響應(yīng)返回結(jié)果,而且搜索引擎及算法會(huì)確保你對(duì)這些檢索結(jié)果是否感興趣。
2020年代的知識(shí)圖譜
快進(jìn)到2020年。Gartner隨后在其《人工智能成熟度曲線》中將知識(shí)圖譜繪在靠近期望膨脹期頂峰的位置。
2018年,Gartner首次宣布知識(shí)圖譜是一項(xiàng)新興技術(shù);1996年的資源描述框架(一種為標(biāo)準(zhǔn)的主-動(dòng)-賓語(yǔ)義掃清道路的圖譜數(shù)據(jù)模型)問(wèn)世整整26年后,知識(shí)圖譜才到達(dá)成熟度曲線的頂峰。
當(dāng)然,值得注意的是,神經(jīng)網(wǎng)絡(luò)背后的理論可以追溯到1873年,而針對(duì)AI中的神經(jīng)網(wǎng)絡(luò)的具體研究重點(diǎn)是從1943年開(kāi)始的。但直到1990年代,計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)才取得長(zhǎng)足發(fā)展,神經(jīng)網(wǎng)絡(luò)才站穩(wěn)腳跟。許多AI專家表示,今天的神經(jīng)網(wǎng)絡(luò)算法與“AI”剛剛起步時(shí)開(kāi)發(fā)的算法有短暫的相似之處。
緩慢發(fā)展的技術(shù)可能最有影響力
其他許多企業(yè)在各自實(shí)施的知識(shí)圖譜方面取得了重大進(jìn)展。在2月28日至3月1日,Semantic Arts舉辦了首次企業(yè)數(shù)據(jù)轉(zhuǎn)換和知識(shí)圖譜采用線上活動(dòng)。部分演講嘉賓包括如下:
?Montefiore 醫(yī)院的Parsa Mirhaji
?西門(mén)子的Thomas Hubauer
?阿斯利康的Ben Gardner和Colin Wood
?宜家的Katarinna Kari
?斯沃琪集團(tuán)的Peter Hutzli
現(xiàn)在說(shuō)知識(shí)圖譜已經(jīng)成為主流還為時(shí)過(guò)早,但很明顯,越來(lái)越多的《財(cái)富》全球1000強(qiáng)公司正在針對(duì)許多不同的用途采用該技術(shù)。
原文標(biāo)題:Ten years of Google Knowledge Graph
作者:Alan Morrison
文章來(lái)源:https://www.datasciencecentral.com/ten-years-of-google-knowledge-graph/