將對話界面直接引入Web,微軟開源NLWeb,實現ChatGPT級別搜索
微軟 Build 2025 開發者大會已經拉開帷幕。
其中,一個名為 NLWeb (Natural Language Web)的開源項目得到大家廣泛關注。
該項目旨在簡化網站自然語言交互界面開發,輕松將任意網站轉化為具備 AI 功能的智能應用平臺。
微軟 CEO Satya Nadella 表示:「NLWeb 允許用戶使用自然語言與任何網站進行交互。我們可以把它想象成智能體化 web 世界的 HTML。」
項目地址:https://github.com/microsoft/NLWeb
由于 NLWeb 原生支持 MCP,因此人類和智能體可以使用相同的自然語言 API。
MCP 是一種新興的協議,用于聊天機器人和 AI 助手與工具交互。每個 NLWeb 實例本身也是一個 MCP 服務器,它支持一個核心方法 ask,該方法用于以自然語言的方式向網站提出問題。返回的響應利用了 schema.org,這是一個廣泛使用的描述 Web 數據的詞匯表。
簡單來說,MCP 與 NLWeb 的關系就像 Http 與 HTML 的關系一樣。
作為一個開放協議和相關開源工具的集合,NLWeb 主要目標是為 AI Web 構建一個基礎層 —— 就像 HTML 徹底革新了文檔共享一樣。
一直以來,開發能夠用自然語言與應用程序乃至整個計算機世界進行自由對話的智能體一直是 AI 革命的核心。
然而,當前大多數新型交互都被 ChatGPT、Claude 甚至必應等產品壟斷。這些機器人汲取海量知識卻不產生實質價值。
而 NLWeb 相比傳統搜索要便宜得多,且使用起來非常方便,僅需幾行代碼、任選 AI 模型(OpenAI 、DeepSeek、Gemini、Anthropic、Inception 等),并輸入特定數據,NLWeb 就能為用戶提供對話式交互界面(即一個文本框加提交按鈕)。
比如零售商可以使用 NLWeb 創建一個聊天機器人,幫助用戶選擇特定行程的服裝;而烹飪網站則可以使用它來構建一個根據菜譜推薦合適菜肴的智能體。
回想以前,研究者為了建立一個網絡搜索索引,需要爬取整個網絡并創建一個包含它的索引。這對于搜索引擎和相關網站來說都是昂貴的。
但有了 NLWeb 后,事情就變得簡單了,比如你可能只需要獲取一個 RSS 源,然后把它放到一個矢量數據庫中,就可以運行了。
此外,NLWeb 還可以調用廉價模型,而且整個過程快速且簡便。
NLWeb 是如何工作的?
NLWeb 可以在智能體網絡中扮演與 HTML 類似的角色,它允許用戶以更豐富的語義方式直接與 Web 內容進行交互。
在實現方面,NLWeb 利用 Schema.org、RSS 等半結構化格式以及網站已發布的其他數據,并將它們與 LLM 驅動的工具相結合,創建可供人類和 AI 智能體使用的自然語言界面。NLWeb 系統通過整合來自底層 LLM 的外部知識(例如將地理洞察疊加到餐廳查詢中)來增強這些結構化數據,從而提供更豐富的用戶體驗。
作為一個開放項目,NLWeb 的技術無關性很強。它支持所有主流操作系統(Windows、MacOS、Linux),并允許開發者選擇最符合自身需求的組件,同時支持所有主流模型和矢量數據庫。
微軟的目標是將人工智能改變人們搜索方式的優勢直接帶到網站本身。正如 HTML 的出現讓幾乎任何人都能輕松創建網站一樣,微軟希望 NLWeb 能夠讓任何網絡發布者都能輕松地為其網站打造智能、自然的語言體驗。
隨著智能體網絡的持續增長,NLWeb 將賦能網絡發布者,使其能夠按照自己的意愿參與其中,確保他們的網站能夠隨時進行互動、交易,并被其他智能體發現(如果他們選擇的話)。