目錄
1、背景
2、NLWeb是什么?
3、NLWeb是如何工作的?
3.1 技術原理
3.2 對發布者的價值
3.3 核心團隊與合作伙伴
4、快速入門指南
5、延伸閱讀
Agentic:Agent的形容詞,Agentic指系統由大型語言模型(LLM)或其他自治系統驅動的自主程度。
NLWeb:Natural Language Web(自然語言網絡)的縮寫,該項目旨在簡化網站自然語言交互界面開發,輕松將任意網站轉化為具備 AI 功能的智能應用平臺。
1、背景
2025年5月20日,微軟Build大會上,CEO Satya Nadella展示了如何構建開放的智能代理網絡的(agentic web),目標是幫助每一位開發者構建能夠賦能全球各地的人們和組織的應用程序和Agents。整體宣布了5個大事件(其中4個與Agent相關):
-
Coding agent:我們將GitHub Copilot從“配對程序員”升級為“同行程序員”。現在,您擁有一個直接集成在GitHub中的完整編程智能代理。您可以為它分配任務——無論是修復漏洞、開發新功能,還是持續的代碼維護。它將自主完成這些任務。
-
Copilot調優:Copilot現在可以學習您公司獨特的語氣和語言風格。這主要是將您作為公司所擁有的專業知識進一步放大,以便每個人都能使用。
-
Agent factory:Foundry是用于構建應用程序和智能代理的完整應用平臺。我們正在增加對Grok、Hugging Face、Meta、Mistral等更多模型的支持。此外還包括:Azure AI搜索中的智能代理檢索功能、Foundry智能代理服務以及與Copilot Studio的集成等。
-
NLWeb:是一個新的開放項目, 在代理網絡中扮演著與 HTML 類似的角色,旨在簡化網站的自然語言界面的創建,從而使任何網站易于將任何網站變成AI-Power的應用程序。
-
微軟發現(Microsoft Discovery):企業代理平臺,將整個技術棧整合在一起,以加快科學發現的速度。發現工具使用Agents生成想法、模擬結果并進行學習。一個很好的例子是這種有希望成為冷卻劑的候選物質,它不依賴于持久性化學品(科學家研究領域范疇)。
2、NLWeb是什么?
為網站構建會話界面是很困難的,NLWeb 試圖讓網站更容易做到這一點。
「NLWeb 允許用戶使用自然語言與任何網站進行交互。我們可以把它想象成智能體化 web 世界的 HTML。」
NLWeb 是由微軟開發的一個開放項目,旨在讓網站能夠輕松地使用其選擇的模型和自有數據創建豐富的自然語言界面。目標是讓 NLWeb成為將網站高效轉化為 AI 應用的最快捷、最簡便的方法,讓用戶能夠像使用 AI 助手或 Copilot 一樣,直接使用自然語言查詢網站內容。
由于 NLWeb 原生支持 MCP,因此人類和智能體可以使用相同的自然語言 API。MCP 是一種新興的協議,用于聊天機器人和 AI 助手與工具交互。每個 NLWeb 實例本身也是一個 MCP 服務器,它支持一個核心方法 ask,該方法用于以自然語言的方式向網站提出問題。返回的響應利用了 schema.org,這是一個廣泛使用的描述 Web 數據的詞匯表。
簡單來說,MCP 與 NLWeb 的關系就像 Http 與 HTML 的關系一樣。作為一個開放協議和相關開源工具的集合,NLWeb 主要目標是為 AI Web 構建一個基礎層 —— 就像 HTML 徹底革新了文檔共享一樣。
一直以來,開發能夠用自然語言與應用程序乃至整個計算機世界進行自由對話的智能體一直是 AI 革命的核心。然而,當前大多數新型交互都被 ChatGPT、Claude 甚至必應等產品壟斷。這些機器人汲取海量知識卻不產生實質價值。而 NLWeb 相比傳統搜索要便宜得多,且使用起來非常方便,僅需幾行代碼、任選 AI 模型(OpenAI 、DeepSeek、Gemini、Anthropic、Inception 等),并輸入特定數據,NLWeb 就能為用戶提供對話式交互界面(即一個文本框加提交按鈕)。
比如:Eventbrite公司(美國一個活動管理和在線票務平臺),面相用戶的搜索場景,基于NLWeb升級前后的交互對比。
升級前:傳統搜索交互
-
構建傳統搜索引擎,按條件搜索。
升級后:NLWEB自然語言交互
-
自然語言輸入:I'm in Seattle for a tech conference. Are there any geeky events I might enjoy?(譯:我在西雅圖參加一個技術會議。有什么我可能喜歡的極客活動嗎?)
還有很多類似的場景,比如零售商可以使用 NLWeb 創建一個聊天機器人,幫助用戶選擇特定行程的服裝;而烹飪網站則可以使用它來構建一個根據菜譜推薦合適菜肴的智能體。
回想以前,研究者為了建立一個網絡搜索索引,需要爬取整個網絡并創建一個包含它的索引。這對于搜索引擎和相關網站來說都是昂貴的。但有了 NLWeb 后,事情就變得簡單了,比如你可能只需要獲取一個 RSS 源,然后把它放到一個矢量數據庫中,就可以運行了。此外,NLWeb 還可以調用廉價模型,而且整個過程快速且簡便。
RSS 源是一種基于XML格式的數據源,用于發布和訂閱網站內容的更新。通過RSS 源,用戶可以方便地獲取最新信息,而無需頻繁訪問網站。RSS應用在國外已經非常普遍,從個人博客(Blog)欄目、企業站點到世界級的門戶都提供基于RSS的服務。
3、NLWeb是如何工作的?
微軟的目標是將人工智能改變人們搜索方式的優勢直接帶到網站本身。正如 HTML 的出現讓幾乎任何人都能輕松創建網站一樣,微軟希望 NLWeb 能夠讓任何網絡發布者都能輕松地為其網站打造智能、自然的語言體驗。NLWeb 可以在智能體網絡中扮演與 HTML 類似的角色,它允許用戶以更豐富的語義方式直接與 Web 內容進行交互。
隨著智能體網絡的持續增長,NLWeb 將賦能網絡發布者,使其能夠按照自己的意愿參與其中,確保他們的網站能夠隨時進行互動、交易,并被其他智能體發現(如果他們選擇的話)。
3.1 技術原理
NLWeb通過整合以下要素實現自然語言交互:
-
結構化數據支持:在實現方面,NLWeb 利用 Schema.org、RSS 等半結構化格式以及網站已發布的其他數據,并將它們與 LLM 驅動的工具相結合,創建可供人類和 AI 智能體使用的自然語言界面。
-
LLM增強:NLWeb 系統通過整合來自底層 LLM 的外部知識(例如將地理洞察疊加到餐廳查詢中)來增強這些結構化數據,從而提供更豐富的用戶體驗。
-
技術中立架構:作為一個開放項目,NLWeb 的技術無關性很強。它支持所有主流操作系統(Windows、MacOS、Linux),并允許開發者選擇最符合自身需求的組件,同時支持所有主流模型和矢量數據庫。
-
代理兼容性:提供人類與AI代理均可使用的統一接口。
3.2 對發布者的價值
-
降低AI應用門檻:如同HTML簡化網站建設,NLWeb讓自然語言交互部署變得簡單
-
參與智能體經濟:通過MCP協議自主控制網站內容在智能體網絡中的可見性與交互方式
-
數據主權保障:發布者完全掌控使用的模型、數據存儲及服務擴展方式
3.3 核心團隊與合作伙伴
-
技術領袖:由RSS、RDF和Schema.org標準的創建者R.V. Guha主導開發
-
早期采用者:芝加哥公共媒體、Eventbrite、Shopify、Tripadvisor等已部署測試
-
技術生態伙伴:包括Milvus、Qdrant等向量數據庫開發商
4、快速入門指南
訪問NLWeb GitHub倉庫獲取:
-
核心服務代碼:處理自然語言查詢的輕量級服務框架
-
連接器套件:主流模型(如GPT-4、Claude)和向量數據庫的預置接口
-
數據工具包:支持Schema.org、JSONL、RSS等格式的數據注入工具
-
前端模板:包含Web服務器前端及簡易查詢界面的開箱即用方案
5、延伸閱讀
【完整版】微軟Build 2025主題演講 | 薩提亞·納德拉_嗶哩嗶哩_bilibili
GitHub - microsoft/NLWeb: Natural Language Web
https://news.microsoft.com/build-2025-book-of-news/zh/#main
https://news.microsoft.com/source/features/company-news/introducing-nlweb-bringing-conversational-interfaces-directly-to-the-web/