從想法到上線僅需幾分鐘:用豆包大模型1.6和火山引擎AI云原生工具棧構建雙語播客網頁
一個想法,幾分鐘后,可以變成一個上線的網站。
你沒看錯,這不是科幻電影,而是 Agentic AI 時代帶給開發者的時代紅利啊。
大家好,我是一名開發者,也是一枚AI博主。
和許多同行一樣,我被 AI Agent 的驚人潛力深深吸引,但同時也為其復雜的構建和部署流程感到頭疼。
如何才能穩定、高效地打造一個生產級的 Agent 應用?
最近,火山引擎提出了一個名為 “AI 云原生” 的全新 Agent 開發范式,號稱能將從想法到產品的路徑縮短到極致。
口說無憑,體驗為王。
這篇文章,就是我親身體驗火山引擎這套“全家桶”的完整記錄。
我的目標是:構建一個智能的“中英雙語學習”Agent,讓它根據我的指令,從零生成一個功能完善、樣式精美的雙語學習網頁。
劇透一下:結果遠超預期。
?? 我的“AI 云原生”工具箱
在開始構建之前,先介紹一下這次火山引擎為我提供的“打怪裝備”:
?? “大腦” - 豆包大模型 1.6
最新發布的豆包主力模型由三個模型組成,擁有強大的代碼、推理和多模態能力。
doubao-seed-1.6:All-in-One 的綜合模型,國內首個支持256K 上下文的思考模型,支持深度思考、多模態理解、圖形界面操作等多項能力。支持選擇開啟或關閉深度思考、自適應思考三種方式。
doubao-seed-1.6-thinking:在代碼、數學、邏輯推理等基礎能力上進一步提升;支持256K 上下文。
doubao-seed-1.6-flash:豆包大模型1.6系列的極速版本,支持深度思考、多模態理解、256K 上下文;延遲極低。
火山引擎
圖片
AI頭部KOL @數字生命卡茲克 卡佬對高考全國新一卷數學單科做了測評,豆包的成績是144分,全國第一,實至名歸。
本次我主要使用 ??seed-1.6?
? 版本,據說它針對前端編程能力做了特別加強。
??? “工作臺” - Trae IDE
本次開發的核心環境是Trae,一個深度集成了從模型調用到應用部署全鏈路的在線 IDE。
下載地址:??https://www.trae.cn/??
?? “連接器” - MCP Market
簡單理解,它是一個能力市場,能將火山官方云服務(如 veFass)和第三方工具作為 Agent 的“插件”,極大地擴展了 Agent 的能力邊界。
火山引擎的MCP廣場集成了豐富的官方云服務(云計算、存儲,還有飛書的MCP)及優質三方生態工具,支持Remote MCP,Local MCP 部署方式。
本次我們將會用到minimax的MCP,需要用到使用語音合成服務,用于文本轉錄,生成音頻等。
使用MiniMax MCP,需要安裝Python包管理器uv。
MiniMax Server的配置示例如下
{
"mcpServers": {
"MiniMax": {
"command": "uvx",
"args": [
"minimax-mcp",
"-y"
],
"env": {
"MINIMAX_API_KEY": "xxx",
"MINIMAX_MCP_BASE_PATH": "D:\\AI\\AI",
"MINIMAX_API_HOST": "https://api.minimax.chat",
"MINIMAX_API_RESOURCE_MODE": "url"
}
}
}
}
API Key需要與Host匹配,出現API Error: invalid api key錯誤,需要檢查API Host是否正確:
- 國際版Host:??https://api.minimaxi.chat??(額外的字母i)
- 國內版Host:??https://api.minimax.chat??(用國內即可)
然后在Trae中進行手動配置:
加載之后顯示正常即可使用。
還要安裝Fetch,Anthropic官方提供了一個網頁抓取MCP Server(免費、無需配置其他信息):
{ "mcpServers": { "Fetch": { "command": "uvx", "args": [ "mcp-server-fetch" ], "env": {} } } }
直接選擇添加即可。
?? “發射臺” - veFass 部署服務
一個能將靜態網頁一鍵部署到公網的解決方案,是這次我們能快速看到成果的關鍵。
火山引擎原生MCP-VeFaas,能夠將HTML頁面部署到火山引擎,自動轉換靜態網頁,創建API網關,返回一個公網訪問地址。
然后添加到Trae里面,正常顯示如下。
有了這套裝備,我的“中英雙語學習”Agent 構建之旅,正式開始!
構建之旅:創建“中英雙語學習”Agent
2025/6/14
第一步:一切的開始——提示詞工程 (Prompt Engineering)
一個好的 Agent,始于一個好的 Prompt。
我最初的想法很模糊:“幫我做一個中英文雙語學習播客網頁”。這種指令對于 AI 來說,信息量太少,無法產出理想結果。
幸運的是,火山引擎發布的 PromptPilot 工具幫了大忙。
這里訪問:??https://promptpilot.volcengine.com/startup??
它像一個循循善誘的導師,通過提問引導我將模糊的想法具象化,最終優化成一個細節豐富的請求。
看下優化前后的對比:
優化前 ??
1.首先調用聯網搜索服務,將收集到的信息整理到md文檔。
2.然后將md文檔用老外聲音生成音頻。
3.然后用生成的音頻和md文檔生成一個美觀的HTML頁面,確保頁面上音頻可播放。
4.最后把HTML頁面部署到公網上。
優化后 ??
你需要完成一系列任務,具體目標是根據給定的搜索查詢,通過聯網搜索收集信息,整理成md文檔,再將md文檔用老外聲音生成音頻,接著用生成的音頻和md文檔生成一個美觀且音頻可播放的HTML頁面,最后把HTML頁面部署到公網上。
首先,請仔細閱讀以下搜索查詢內容:
<搜索查詢>
{{SEARCH_QUERY}}
</搜索查詢>
接下來,請按照以下步驟完成任務:
1. 調用聯網搜索服務,根據搜索查詢收集相關信息,并將這些信息整理成一個md文檔。確保文檔內容結構清晰、邏輯連貫。在完成這一步后,在<完成步驟1>標簽中確認完成,并簡要說明文檔的大致內容和結構。
2. 使用合適的語音合成工具,將整理好的md文檔內容用老外聲音生成音頻文件。選擇音質較好、發音標準的語音。完成后,在<完成步驟2>標簽中確認完成,并說明選擇的語音合成工具和語音類型。
3. 利用生成的音頻文件和md文檔生成一個美觀的HTML頁面。頁面布局要合理,確保音頻在頁面上可以正常播放。你可以使用HTML、CSS和JavaScript等技術來實現。完成后,在<完成步驟3>標簽中確認完成,并簡要描述頁面的布局和設計特點。
4. 將生成的HTML頁面部署到公網上。可以選擇合適的免費或付費的托管服務。完成后,在<完成步驟4>標簽中確認完成,并提供部署后的公網鏈接。
請嚴格按照上述步驟依次執行任務,并確保每一步的輸出符合要求。
這個過程,讓我深刻體會到:與 Agent 協作,本質上是一場高質量的溝通。
第二步:見證奇跡——豆包 1.6 從文本到代碼
接下來是核心環節。
結合優化后的 Prompt,在Trae里面創建了新的智能體,
創建好智能體之后,就可以在對話框里面進行操作了。
調用豆包 seed-1.6 模型執行任務。
首先輸入我想生成的內容,比如我想讓他生成labubu的內容。
按下回車,幾秒鐘后,豆包 1.6驅動的智能體 開始“思考”并輸出代碼。整個過程行云流水,它幾乎完美地理解了我的任務焦慮。
我截圖可以看一下,他給我們生成了MD文件,里面是關于labubu的信息,而且還有溯源的鏈接。
然后接下來會去生成音頻和網頁HTML文件。
啟動服務之后就去調用服務進行部署,并且可以在本地看到啟動的網頁。
其實聽完,就會發現,只有一個男生的聲音,比較單調,并且還不是標準的播客形式,需要進一步優化。
第三步:快速審查——在 Trae IDE 中微調
代碼生成后,自動出現在 Trae IDE 的編輯器中。
我快速瀏覽了一遍,代碼結構清晰,注釋合理。
我只做了一個微小的調整——將整個播放器的音色調整為男女雙人播客,有雙人互動,并且整個過程不超過2分鐘。
重新調整提示詞,使用promptpilot進行創作。
調整之后的提示詞:
你需要完成一系列任務,最終將生成的內容部署到公網上。具體步驟如下:
首先,你將進行聯網搜索。要搜索的關鍵詞為:
<search_query>
{{SEARCH_QUERY}}
</search_query>
<第一步:信息收集與文檔整理>
<思考>
[仔細分析搜索到的信息,篩選出與搜索關鍵詞相關且有價值的內容]
</思考>
將收集到的信息整理成一份md文檔。確保文檔結構清晰,內容有條理。整理完成后,將md文檔內容放在<md_document>標簽內。
<md_document>
[在此處填寫整理好的md文檔內容]
</md_document>
<第二步:播客內容生成與音頻生成>
將md文檔內容轉化為男女雙人播客互動的內容。充分考慮雙人對話的特點,使內容自然流暢。轉化完成后,將播客內容放在<podcast_content>標簽內。
<podcast_content>
[在此處填寫轉化后的播客內容]
</podcast_content>
使用男女雙人聲音將播客內容生成為音頻。
<第三步:HTML頁面創建>
使用生成的音頻和模擬的播客男人生成一個美觀的HTML頁面,確保頁面上音頻可正常播放。將HTML頁面的代碼放在<html_page>標簽內。
<html_page>
[在此處填寫HTML頁面的代碼]
</html_page>
<第四步:部署到公網>
將生成的HTML頁面部署到公網上。部署完成后,在<deployment_url>標簽內提供公網訪問的URL。
<deployment_url>
[在此處填寫公網訪問的URL]
</deployment_url>
最新的雙人播客內容已經生成好了,已經符合我的預期了。
然后依次將男聲和女聲的音頻合成出來,這部分其實是把所有的男聲和所有的女聲進行一次性合成,最終按照順序進行合并。
但是生成的音頻片段,在最終呈現的時候,還是需要合并到一起,可以告訴智能體我們的需求。
第四步:一鍵發射——使用 veFass MCP 部署
最后一步,也是最驚艷的一步。
在 Trae 環境中,我直接調用了 ??veFass?
? 這個 MCP 工具。
它就像一個“部署按鈕”,我只需輸入一個我想用的項目名稱,點擊執行。
使用過程記得給API網關授權,賬戶里面還得有錢,不然會報錯。
幾秒鐘后,一個公網可以訪問的 URL 就生成了!
從代碼生成到網站上線,整個過程無縫銜接,沒有任何傳統開發中的環境配置、服務器設置、域名解析等繁瑣操作。
性能評測:豆包 1.6 與“AI 云原生”表現如何?
2025/6/14
代碼質量
豆包 1.6 生成的 HTML/CSS 代碼質量非常高。它不僅準確實現了我對網頁元素的請求,代碼本身也非常整潔、現代化,并且考慮到了基本的響應式布局。這證實了其在前端頁面生成方面的定向增強名不虛傳。
開發體驗 - “AI 云原生”的真正優勢
如果說豆包模型是出色的“執行者”,那么整個“AI 云原生”技術棧就是無與倫比的“指揮系統”。
傳統流程:
??從需求收集?
?? -> ??UI/UX 設計?
?? -> ??前端開發?
?? -> ??后端開發?
?? -> ??環境配置?
?? -> ??部署上線?
?? -> ??調試,整個?
?耗時數天到數周。
而AI 云原生流程:從??想法 & Prompt?
??-> ??AI 生成 & 微調?
?? -> ??一鍵部署?
?,耗時:數分鐘。
效率提升何止十倍!模型(豆包)、開發環境(Trae)和部署(veFass)之間的無縫協同,正是“AI 云原生”范式的核心價值所在。
它將開發者從繁重的“體力勞動”中解放出來,讓我們能專注于最重要的事——創造。
這次評測,讓我真切地感受到了 Agentic AI 帶來的革命性變化。
火山引擎的這套生態系統,不僅僅是幾個強大工具的簡單堆砌。它通過“AI 云原生”的理念,將大模型、開發工具鏈和云服務深度融合,真正將從一個想法到一個生產級 Agent 的實現路徑,縮短到了前所未有的地步。
圖片
“AI 云原生”不再是一個空洞的概念,它是一個已經可以落地、高效、且體驗極佳的開發范式。
一個屬于開發者的新時代,已經拉開序幕。
本文轉載自????AIGC新知???,作者:絳燁
