原創?Aitrainee?AI進修生?2025年06月13日 16:42?湖南?標題已修改
緣起 ——
火山引擎在 2025 原動力大會上,也端出了自家的豆包大模型:Doubao-Seed-1.6 系列。
這三兄弟都支持文本、圖片、視頻輸入,都帶著 256K 的長上下文。
Doubao-Seed-1.6-thinking,這是火山目前最強的思考模型,在編碼、數學、邏輯推理這些基礎能力上又進了一步。它的思考模式是強制開啟的,關不掉。
然后是?Doubao-Seed-1.6,All-in-One 的綜合模型,是國內首個支持256K 上下文的思考模型,支持深度思考、多模態理解、圖形界面操作等多項能力。
此外,你給它一段文字或圖片描述,它能直接給你生成高質量的前端頁面,樣式還挺精美(我們后文用它做網站、構建Agent)。
最后是?Doubao-Seed-1.6-flash,主打一個字:快。TPOT 只要 10ms,延遲極低,適用于對速度要求高的場景。
Doubao 1.6 設計一個落地頁?我給它喂了一份"超綱"需求
前段時間,在優化公眾號文章排版,積累了些經驗。我想把這些想法、經驗轉化成一個產品原型,同時測試一下這些AI。
這玩意兒是個"AI 智能排版增強服務",專門給內容創作者用的。
我想看看,現在的 AI,能不能幫我設計一個高轉化率的落地頁。
于是,我沒跟它客氣,直接扔過去一份堪稱"變態級"的設計需求文檔。
BeforeAfter魔法般的轉變
從【導航欄】到【主視覺區】,每個細節都得安排得明明白白。主視覺,我要求它搞個特有沖擊力的"Before & After"對比動畫,要那種"魔法般"的轉變效果,讓用戶一眼就看到產品的價值。然后是【社會認同】,得有 logo 墻,告訴大家"超過 1000+ 創作者和 50+ 新媒體團隊都在用"。
核心功能,我讓它用卡片網格布局展示三個點:
-
能讀懂你:不光排版,還能修正語法、理順句子,但保留你的個人風格。
-
專屬設計師:一鍵應用各種風格模板,或者直接跟 AI 說你想要的"感覺"。
-
讓圖片講故事:自動處理圖片,加圓角、陰影,智能推薦圖注、加入SVG等等。
工作流程,我讓它設計成"三步,見證奇跡":粘貼初稿 -> 選擇風格 -> 一鍵復制。
我還給 AI 提了更"玄學"的要求。
我讓它把這個落地頁,構想成一個?有空間意境?的地方,比如"深夜的靈感閣樓"、"充滿活力的創意工坊",整體氛圍要"神秘并激發好奇,簡約卻不失格調"。交互體驗,要像"與一位有趣的靈魂對話"或者"翻閱一本精心編排的互動書籍"。
我喜歡?玄學。我想讓ai自己發揮,就像以前的AI自己決策思考提示詞一樣。
靈感閣樓創意工坊玄學空間意境
布局邏輯,我給了它"主題島嶼式"、"時間軸式"、"儀表盤式"這些選項。
動效設計,我也沒放過。板塊過渡要像"電影膠片切換"或者"水墨在宣紙上暈開",交互反饋要清晰明確,信息強調要用"微妙的脈沖效果"或者"呼吸燈動畫"。
基本上,我把一個資深產品經理+設計師+前端工程師可能要思考的所有東西,都壓縮成了一份指令,一股腦兒地喂給了 AI。我想看看,它到底能消化多少,又能給我帶來怎樣的驚喜。
在火山引擎:https://exp.volcengine.com/ark?model=doubao-seed-1-6-250615,這里我們選擇Doubao-Seed-1.6來試試。
打開canvas模式,把提示詞輸給他,先通過生成單個Html網頁來實現。
效果非常不錯,你能想到通過一個提示詞,就能把你的想法變成了現實嗎:
不過,通過單個htm實現的網頁,在某些點擊、動效等等還是比不上現代化Web開發框架。
所以我用Trae?+ Doubao-Seed-1.6 + Next.js + Shadcn UI 重寫了一遍。這并不難,先初始化 Next.js框架(如下命令)得到項目文件夾:
npx create-next-app@latest FinalTouch-AI --ts --tailwind --eslint --src-dir --app --import-alias "@/*" -y && cd my-app && npx shadcn-ui@latest init -y && npx shadcn-ui@latest add all -y?? ?
接著用Trae(因為上線了1.6)打開這個文件夾再輸入上面的提示詞。
效果如下:
,時長00:24
是不是好看、工整、優秀的許多?后面我還讓他加入了豆包模型做核心服務支撐。
核心服務如下:
通過AI實現了文本排版。這一塊的更多細節,我們以后再單獨寫。這個提示詞的構建設計了許多東西:關于saas網站如何提高轉化率?怎么根據你一個想法讓ai來構建?讓他自發的適配更好的風格等等...
接下來我要介紹一個更有意思的:
AI 云原生正在加速 Agentic AI 時代的到來
工具調用模型推理應用部署Trae豆包1.6FaaS火山方舟 MCP全鏈路閉環開發范式模塊化組裝,專注業務邏輯
在 2025 原動力大會上,字節跳動提出了全新的 AI 云原生 Agent 開發范式:借助 Trae + 火山方舟?MCP?+ 豆包大模型 + FaaS,開發者可以實現從 工具調用 → 模型推理 → 應用部署 的全鏈路閉環,打通了智能 Agent 開發的完整流程。
這一范式的核心,是通過"模塊化組裝"的方式,徹底擺脫過去繁瑣的手動集成與開發,真正讓開發者專注于業務邏輯,而非底層細節。我們具體來看一下。
我想構建一個Agent:
你是一個名為"CityWalk AI Planner"的智能城市漫游助手。你的核心使命是為用戶提供高度個性化、充滿驚喜、且充分考慮實時情況的一日城市漫游(CityWalk)路線規劃。你不僅是一個信息聚合器,更是一位懂生活、有品味、善于規劃的本地向導。將你最終規劃好的所有內容,構思并編程生成一個【精美的、交互式的單頁HTML網頁】。
我們需要使用這幾個MCP
其中?VeFaaS?MCP用于前端網頁應用部署,比如這個html做好了之后可以一鍵調用,發布到火山引擎。并返回可訪問的鏈接。
這樣就可以在一個IDE里面開發和部署了,就像以前說Windsurf那個功能一樣。
IDE一鍵部署云端可訪問鏈接
這些mcp都是火山引擎云端托管的,配置很簡單。去火山引擎,安裝步驟如下:
注意,你選擇遠程即可。免費。
接著我們需要在Trae里面創建一個Agent(類似于Cursor自定義Agent),可以配置使用哪些工具和MCP,以及提示詞:
從提示詞的設計可以看出,我們構建的并不只是一個簡單的旅游問答助手。考慮到?1.6 模型具備 Auto-Think 的能力,我們在提示詞中巧妙加入了大量問號,以此引導模型進行更深層次的主動思考。
這種提示詞設計,既有明確的結構規范,也保留了足夠的開放性,目的是激發模型的"思考本能",而不是僅僅被動回答。它更像是在與一個具備判斷力和意圖感的智能體對話,而不是傳統的工具式交互。
然后我們就直接@剛創建的這個智能體給需求即可。
📱 可上下滑動查看完整內容
效果如下:
📱 可上下滑動查看完整內容
case2:西安七日游
📱 可上下滑動查看完整內容
case3:新加坡七日游
📱 可上下滑動查看完整內容
接著,VeFaaS MCP可以用于前端網頁部署:網頁可以一鍵部署。
這樣提示:把這個html網頁發布到faas,并返回一個可訪問鏈接。
你可以在火山引擎函數服務這里查看:
可以看到他部署好的代碼以及連接信息:
火山引擎可能也是國內第一個把 MCP 部署搞得這么端到端的云廠商。
有了這個。我們下面的測評內容,也可以一鍵被其他人訪問。
Doubao Seed 1.6 模型測評
這三個模型都是支持視頻的。我們可以試試讓他看視頻生成網頁。這是一個鼠標點擊按鈕滑動+變色的視頻。
,時長00:22
很有挑戰性。丟給它
除了logo那小部分,基本上很還原了。
視頻理解AI生成網頁視頻理解與代碼生成多模態交互新體驗
以前gemini說的那些,都可以試試了。編碼封神,Gemini 2.5 Pro (I/O 版)視頻秒轉 App!網友:比 o3/Claude 強,Vibe 程序員集結!
另外有一點。蠻爽的是他圖片上傳竟然支持gif。gemini不支持。
我上傳了一個解釋RAG、Agentic相關的GIF和一張排版不錯的網頁截圖。想讓他理解MCP內容然后按照第二種風格轉換表現形式。
輸出:
📱 可上下滑動查看完整內容
其實按照gif里面的mcp的內容來說,選擇第2種表現形式并不是一種很好的方式。不過他也按照我們的要求改成了這種方框的形式。
并且方框里面都加入了能體現gif流程的標號。
原GIF RAG、Agentic RAG 分別是7個和12個標號,豆包都一一找到并且對應了,視覺理解能力這塊確實不錯。
多模態輸入和風格轉化視覺理解。可玩性很高了。
要個啥的UI 動效組件,搞個啥廣告展示頁、作品集、動態專題頁等等
它甚至可以把思維導圖一鍵轉化成課程介紹網頁
"請根據思維導圖生成一個課程介紹 html 網頁":
📱 可上下滑動查看完整內容
📱 可上下滑動查看完整內容
內容詳實美觀,還留了個報名地址。
你的頭腦風暴,模糊的想法,可以一鍵傳遞給他人了。
還有這種寫了個草稿大概的,它也能轉化的很好。
有些模糊不清的數據表格也可以做成美觀的網頁。
根據這些數據生成一個美觀的 html 介紹網頁:
📱 可上下滑動查看完整內容
📱 可上下滑動查看完整內容
你把網頁長截圖給他,它能復刻一個高度相似的html
📱 可上下滑動查看完整內容
📱 可上下滑動查看完整內容
讓它參考下面Openai的排版格式,改改顏色,幫我寫一個介紹 Claude的 html 網頁
📱 可上下滑動查看完整內容
📱 可上下滑動查看完整內容
截圖網站復刻:
📱 可上下滑動查看完整內容
📱 可上下滑動查看完整內容
參考下面截圖網頁的風格,幫我寫一個介紹 deepseek 的 html 網頁
📱 可上下滑動查看完整內容
📱 可上下滑動查看完整內容
按照我的這個Saas網站的風格。
幫我生成一個風格類似的旅行日記網頁:
📱 可上下滑動查看完整內容
模型表現總結
編碼能力vsClaude 4價格優性能與性價比雙優不輸Claude,比Deepseek好用
豆包大模型升級之后效果非常不錯。從測試體驗來看。1.6 模型在處理復雜提示指令(用上思考模型很強)、編碼上效果上不輸Claude 4,比Deepseek好用。
此外,上次卡總的“7家大模型做高考數學題的真實分數”,豆包位列第二,也是看得出來有點東西。
價格相比Claude也便宜很多,豆包 1.6 模型價格對照:
AI 云原生生態的未來
字節生態工具鏈云服務MCP全棧Agent開發生態開箱即用的企業級解決方案
最后,字節內部已經有豆包 App、Coze?空間這些成熟的 Agent 應用了。這也讓火山引擎能更好的這些復刻成熟產品的經驗。
我們搭建Agent并部署的門檻現在其實已經很低了。
在這次 火山引擎?Force?大會 大會上,他們會現場演示好幾個 Agent demo 的完整開發過。
Trae + 火山方舟 MCP + 豆包大模型 + Faas"這么一套組合拳,是一個新理念:AI?云原生開發。
火山引擎提供的是強大的模型+全棧的?Agent?開發工具和豐富的生態,再加上自然語言調度云的能力,能讓你開發出生產環境里跑的、對開發者友好的 Agent。
工具服務、云服務、字節的生態服務,全都支持 MCP 協議。
這就實現了一個"工具調用 → 模型推理 → 部署運營"的深度協同。云服務也支持 MCP,形成了一套標準化的協作生態,能直接復用云上成熟的部署運維體系,避免了 Agent 開發和部署環境脫節的尷尬,還能動態調度算力。主打一個企業級 Agent 構建"開箱即用"。
這套平臺能力,不只是停留在 PPT 上。
有關信息顯示,汽車行業,有將近八成的主流車企,把豆包大模型用在了智能座艙、AI 升級這些核心場景里。
教育領域,浙江大學用火山引擎的 HiAgent 平臺和豆包大模型,花了一個星期,就搞定了一個叫“浙大先生”的智能體平臺。服務著超過五萬名師生。
體驗開發部署
One More Thing
從簡單的文本生成,到復雜的應用開發與云端部署,豆包 1.6 + 火山方舟的全棧解決方案,展現了 AI 云原生時代的無限可能。
未來,每一個創意都可能在幾分鐘內變成現實。
🍹 Insight Daily 🪺
Aitrainee | 公眾號:AI進修生
探索AI前沿,分享實戰經驗
Aitrainee
?暗色模式,我賊亮?
喜歡作者
SOTA 模型 · 目錄
上一篇Gemini 2.5 Pro 再升級!競技場分數創新高+思考預算,更強 Kingfall 在路上?
閱讀?1933
修改于2025年06月13日
?
留言 3
寫留言
-
幼笙
朋友湖南2天前贊
文章中火山引擎MCP安裝教程視頻:https://lf3-static.bytednsdoc.com/obj/eden-cn/lm_sth/ljhwZthlaukjlkulzlp/ark/assistant/videos/LAS.mp4
-
AI進修生
作者3天前贊
漏了一圖,使用?vefaas?mcp部署時(還要手動去火山引擎函數服務的觸發器那里創建實例和服務)
-
AI進修生
作者3天前贊
第二個構建Agent的提示詞是這個,排版后給漏了
已無更多數據