Web3.0、關聯數據和語義網
Web 3.0: Web 2.0之后輪到誰?
Web 3.0無法解決信息超載問題。至少現在還不行,因為有很多基礎工作要做。尤其是現在網上到處都是非結構化數據,需要很長的時間才能將這些數據結構化。
去年Boutin將Web 3.0寬泛定義為“一個開放網絡。Web 3.0可以打破舊藩籬,讓所有人隨時隨地地聯系在一起,讓整個網絡更加智能。”
至少我認為,如果說Web 2.0意味著Youtube和維基百科等UGC和社交網絡,那么Web 3.0則意味著開放和結構化數據,讓網絡更加“聰明”。
關聯數據(Linked Data): 結構化數據,但不一定是語義數據
Greg Boutin第二篇文章談到了關聯數據。他認為關聯數據提供了關聯結構化數據的新媒介,可以讓機器更好地讀取這些數據。但是,關聯數據本身不會給信息增加任何語義含義,而是更好地攜帶語義數據,供用戶訪問。所以,關聯數據雖然本身并不具備語義特征,但它可以在數據層面建立關聯,為真正的語義網鋪平道路。
關聯數據這個概念來自W3C,該組織有一個關聯開放數據(LOD)項目。以下圖表列出了參與該項目的數據集。其中包括著名的Thomson Reuters的Open Calais項目 , Freebase, 和DBpedia。這些數據集是在現有本體論(ontologies)基礎之上建立的,如WordNet,FOAF, 和SKOS,然后在它們之間建立關聯。
Greg Boutin在其第三篇文章中寫道,關聯數據格式不會創建智能數據,僅僅是支持。他建議人們集中精力開發把非結構化數據進行結構化的技術。他還建議創業者應該考慮把關聯數據和其它技術進行混搭。
語義網:Google唱主角
那些以上這些趨勢會如何影響語義網呢?Tim Berners-Lee 認為語義網可以用于商業目的,但現實卻是,目前使用資源描述框架(RDF)的實際應用寥寥無幾。
但是 RDFa(允許發布者把RDF嵌入到HTML)帶來了一線希望。 Google本周宣布將在其“富媒體代碼”中支持RDFa,而雅虎早在去年就大膽地推出了搜索猴子(Search Monkey ),達到了同樣的目的。
Google將在語義網主流化過程中扮演重要角色。Google目前正在從半結構化和非結構化數據中解析語義結構數據。有人稱Google算法遠非統計方法論那么簡單,它早就在研發語義技術了。
Google也并非沒有競爭對手。除了雅虎,微軟去年夏天收購 Powerset也是瞄準了這個市場。
結論
Web 3.0是一個沒有統一定義的詞語,或者根本不應該這么稱呼。但是很顯然,結構化數據時代已經到來。我們從當前的關聯數據熱潮中就可以看到它的影子,并且得到了Google和雅虎瞪大公司的支持。誰知道呢,或許語義網也就在隔壁不遠處。
【編輯推薦】