2500頁算法文檔泄露!搜索史上最強黑箱曝光,谷歌翻車再升級? 原創
撰稿丨諾亞
出品 | 51CTO技術棧(微信號:blog51cto)
谷歌有點流年不利。
前兩天剛被曝出,其搜索新推出的“AI 摘要(AI Overviews)”功能經常提供嚴重錯誤的搜索結果信息,例如,荒唐地建議用戶用膠水來防止披薩上的奶酪滑落。對此,CEO皮查伊也不得不承認這是大語言模型的幻覺所致,且目前還沒有解決方案。
最近谷歌疑似再次“翻車”。一份據稱包含2500頁的谷歌內部文件被泄露,這份文件可能首次向公眾揭示了谷歌搜索引擎的運作機制。截至本文發布,谷歌尚未就泄露事件做出官方回應,也沒有對文件的真實性提出異議。
長期以來,谷歌作為當今互聯網上最毋庸置疑的霸主,如何對網站進行排名的細節一直是個謎。而這次泄露事件提供了一個新視角,讓我們得以窺見谷歌高度保密的搜索算法系統,以及運作機制里與谷歌此前的公開聲明里相矛盾的地方。
1.2500頁泄露文件
谷歌的搜索算法或許是互聯網上最具影響力的系統,它決定了網站的生死存亡及網絡內容的呈現形態。但谷歌究竟是如何對網站進行排名的具體細節,從來都是“黑箱”,雖然也有媒體、研究人員以及從事搜索引擎優化工作的人士進行過種種猜測,但也只是盲人摸象。我們始終難以窺見完整的拼圖。
如今,據外媒The Verge報道,這起堪稱炸裂的泄露事件似乎首次揭開了搜索功能背后的神秘面紗,并暗示谷歌多年來并未完全誠實地公開其運作方式。到目前為止,谷歌尚未對有關文件真實性的多次置評請求作出回應。
從事SEO工作超過十年的Rand Fishkin是這起事件的主角。他透露,一位消息人士與他分享了長達2500頁的文件,希望借此來揭露谷歌關于搜索算法運作方式所散布的對外“謊言”。
據Fishkin介紹,這些文件概述了谷歌的搜索API,并分解了向員工提供的信息內容。Fishkin分享的細節繁復且技術性強,對于開發者和SEO專家來說可能比普通人更容易理解。
泄露內容本身并不一定證明谷歌使用了特定數據和信號來進行搜索排名。相反,泄露文件概述了谷歌從網頁、網站和搜索者那里收集了哪些數據,并間接向SEO專家提供了關于谷歌關注點的線索。
2.與谷歌公開聲明相矛盾
正如SEO專家Mike King在其對文件概述中所寫的那樣,泄露的文件涉及多個主題,如谷歌收集和使用的數據類型、谷歌針對選舉等敏感話題如何提升某些網站的權重、谷歌如何處理小型網站等。更值得關注的是,據Fishkin和Mike King所述,文件中的某些信息似乎與谷歌的公開聲明相矛盾。
“說‘撒謊’可能太過嚴重,但在這種情況下,這是最貼切的說法,”Mike King這樣表述:“我理解谷歌的公關人員為了保護公司秘密所做的努力,但我不能接受的是,他們會去貶低那些在營銷、科技和新聞領域內,發現并提出質疑的人。”
谷歌尚未就涉及這些文件的The Verge的置評請求做出回應,其中包括直接要求反駁文件的真實性。Fishkin在給The Verge的電子郵件中表示,谷歌并未對泄露的真實性提出異議,但有一位員工要求他更改帖子中關于某個事件描述的部分措辭。
谷歌保密的搜索算法催生了一個由營銷者組成的行業,他們緊跟著谷歌的公開指南,為全世界數百萬公司實踐SEO策略。然而,這些廣泛應用的手段,逐漸使人們普遍感覺到:谷歌的搜索結果正每況愈下,充滿了垃圾信息。
網站運營者感覺不得不生產這類內容以使自己的網站被看到。但面對這樣的質疑,谷歌的對外發言人總會搬出一套熟悉的說辭:我們的指南并非如此指示。
但泄露文件中的某些細節讓人質疑谷歌關于搜索功能運作方式的公開聲明的準確性。
Fishkin和Mike King引用的一個例子是谷歌是否在排名中使用Chrome數據。谷歌代表多次表示不使用Chrome數據來排名頁面,但Chrome在關于網站如何出現在搜索中的部分被特別提及。
圖片
在上面的截圖中,根據文件顯示,主要vogue.com網址下方出現的鏈接部分可能就是利用Chrome數據創建的。
另一個引起關注的問題是E-A-T(專業知識、權威性和可信度)在排名中扮演的角色。眾所周知,多年來E-A-T一直是谷歌搜索質量評估指南的基石。
谷歌的代表此前曾表示,E-A-T并不是一個排名因素。Fishkin指出,他在文件中沒有找到太多直接提到E-A-T的內容。
還有,谷歌的代表以前曾堅稱,署名是網站所有者應該為讀者而不是為谷歌做的,因為它不影響排名。但似乎并非如此。
邁克·金詳述了谷歌如何收集頁面的作者數據,并指出文件中存在一個用于辨識實體是否為作者的字段,該字段雖主要為新聞文章設計,但也涵蓋其他諸如科學文章的內容。盡管這并不能證實署名是明確的排名要素之一,但它確實表明谷歌至少在密切跟蹤這一屬性。
3.搜索算法革新,從此互聯網生態“變天”
盡管這些文件并非確鑿無疑的證據,但它們提供了一個深度且未經過濾的視角,讓我們得以窺見這個高度保密的黑箱系統。
事實上,在過去的兩年里,谷歌搜索經歷了一系列重大更新,有些甚至是前所未有的顛覆式更新。比如本文開頭提到的,飽受詬病的“AI概覽”功能就是很有代表性的革新之一。
變革之初,谷歌掌舵人皮查伊表示,未來谷歌搜索將為你的許多問題提供自己生成的AI答案,并對這一產品功能表達了強大的信心。
谷歌的一位發言人曾告訴BBC,公司只有在經過嚴格測試,確認變化對用戶有益后才會推出搜索變更,并且公司為網站所有者提供了幫助、資源和就其搜索排名反饋的機會。
但現實卻總是脫軌于理想。
無論是關于AI概覽功能的“致命幻覺”,還是在這份疑似泄露文件里傳達出的“表里不一”的信息,都在引發人們對于谷歌搜索的猜疑和警惕。
回顧整個互聯網發展史,沒有哪家企業像谷歌一樣,不僅改變了這個藍星上大多數人獲取信息的方式,也重塑了內容創造和分發的格局。
就用生成式AI加持搜索舉例,谷歌似乎志在通過這些技術革新來更高效地連接用戶與信息,提升搜索體驗的整體質量。
但事實上,正如批評者所說,這種轉變可能加劇信息同質化,減少用戶探索網絡的深度和廣度,因為他們越來越依賴于谷歌直接提供的簡短答案,而不是親自訪問源網站。這不僅可能削弱獨立網站和博客的可見度及盈利模式,還可能影響到網絡生態的健康和多樣性,限制了用戶接觸多元觀點和深入分析的機會。
對強大如谷歌的搜索玩家來說,如何確保搜索算法優化既能服務于大眾,又不會破壞那些為網絡貢獻高質量內容的生態基石,也許才是能夠長遠發展的根本所在。
參考鏈接:
??https://www.bbc.com/future/article/20240524-how-googles-new-algorithm-will-shape-your-internet??
?本文轉載自??51CTO技術棧??,作者:諾亞
