一手實測,文心x1.1的升級很驚喜啊

一手實測,文心x1.1的升級很驚喜啊

前言

月9日,在 WAVE SUMMIT深度學習開發者大會上 百度發布了一個新的思考模型文心x1.1X1 Turbo 升級為 X1.1 了。

文心4.5 Turbo 和 X1 Turbo 是2025年4月25日發布的,距今已經半年過去了,今天文心大模型低調的來了個小驚喜。

看下界面:

https://yiyan.baidu.com/X1

image-20250908225427849

感覺文心X1.1是故意趕在教師節前發布的,你看封面圖形都是一個兢兢業業的教師的形象。

這里表達了文心對教師的感恩之情,起到了承上啟下的作用。

GreetingImage

增加了什么

發布會上得到的信息:文心大模型X1.1 在事實性指令遵循智能體工具調用等方面的表現不俗,

問答、創作、邏輯推理等方面的綜合能力提升顯著。

相比文心大模型X1,文心大模型X1.1的事實性能力提升34.8%,指令遵循能力提升12.5%,智能體能力提升9.6%

行程規劃

為了讓大家感受到文心大模型X1.1的能力提升,這里我們讓它充當一次行程規劃師。

為了對比明顯,我們這里也把最近發布的 Kimi-K2-0905(后面簡稱k2)、Qwen3-Max-Preview 拉過來一起給我推薦。

我妥妥的享受一番被服務的感覺。

提示詞:作為旅行規劃師,設計廣東10月國慶節深度游行程,需包含交通方式、住宿推薦、每日景點安排及預算控制

先看k2:

K2實在是我的貼心管家,直接給我安排了一個10天9晚的旅游行程:

image-20250909080155280

作為一個普通打工人,看到這樣細致周到的旅游規劃真是感動壞了。

這種高規格的待遇平時哪里能享受得到啊!

不過仔細一想,這個10天的行程方案恐怕有點不太實際。

2025年的國慶節法定節假日是這樣的:10月1日-10月8日

總共8天假期。

要執行這個10天的旅游計劃還是差了兩天。

要么就得請額外的假,要么就得適當縮短行程。

這種情況下,可能還是得根據實際情況調整一下旅游方案比較合適。

image-20250909080345091

轉身看看Qwen3-Max-Preview怎么樣了:

image-20250909080440590

也是一樣,給我安排了個10天的國慶節深度旅游行程~

不得不說,這個行程安排得相當細致和周到,

從景點選擇到時間分配都充分考慮到了游客的體驗。

但是,一個重要的現實問題 - 我的國慶假期實際只有8天。。。。。


最后看看 文心大模型X1.1:

image-20250909080716841

這里X1.1給我推薦的國慶行程是:5天!

放假時間是8天,這個5天的行程安排其實完美符合我內心的期待。

剩下的3天時間,我可以好好在家休息調整。

前一天可以從容地收拾行李、準備旅行用品,后兩天則可以躺在家里啥也不干,就是純粹的躺平模式,好好回回血。

經過以上對比,文心X1.1的建議顯然更加切實可行,也更符合大多數上班族的實際需求。

畫個畫

繼續來測試一下這些大模型理解語義和調用工具的能力。

我這里打算直接在對話窗口讓大模型根據描述幫我畫個畫。

提示詞:幫我畫一個 :滿天繁星的夜空上掛著一輪血月 的唯美畫面

還是先看k2:

image-20250909081848639

K2表示了拒絕,并且甩給我一個新的提示詞。


再看QWen:

image-20250909081931305

QWen的表現效果令人印象深刻。

畫面中的月呈現出一種強烈的視覺沖擊力,整體營造出一種暗黑、陰暗的氛圍。

畫面中的色彩對比強烈,月亮的血色與深邃的夜空形成鮮明對比,增添了畫面的戲劇性和神秘感。

總的來說,這個作品展現了QWen在圖像生成方面的實力,特別是在表現特定氛圍和風格上的能力。


再來看看 文心大模型X1.1:

image-20250909082118822

圖片放大了來看下:

image-20250909082146406

這里看到文心X1.1給出的畫面還是比較完整的:

畫面中的關鍵要素 - 滿天繁星和血月都被很好地呈現出來了。

血月懸掛在夜空中,

散發出神秘而迷人的紅色光芒,

周圍點綴著密密麻麻的星星,

營造出浪漫而壯觀的夜空景象。

而且,文心還在畫面底部巧妙地添加了連綿起伏的山脈和茂密的森林,

這些元素山脈和森林的剪影在月光的映照下形成了優美的輪廓,

比較符合了我最初的創作期待。

相比其他模型的表現,文心X1.1在這次測試中展現出了相當出色的圖像生成能力和場景理解能力。

捋一捋

這里就對比體驗下大模型的事實整理能力。

提示詞:武則天在位期間發明了活字印刷術,這居然震驚了蜘蛛俠,蜘蛛俠馬上打電話給豬八戒尋求安慰。 請問我可以把這個故事教給小朋友嗎

k2:

image-20250909130219254

K2的回答很簡練,

直接指出了故事中的三個明顯錯誤:

活字印刷術不是武則天發明的、

蜘蛛俠是現代虛擬人物、

豬八戒是神話人物。

還貼心地提供了一些替代方案,表現還是值得認可。


再來QWen:

image-20250909130321163

QWen在回答這個問題時表現得也相當不俗。

排版、建議和調整都很在線,尤其是排版方便,標題、加粗等等都幫你做好了。


最后到文心X1.1:

image-20250909130515291

文心的表現可以說是也很出色。

故事的歷史性錯誤、調整的建議也給得恰到好處,總體還是不錯,第一梯隊妥妥的。

說一說

然后我們再來測文心大模型X1.1文本文字創造能力,看看能否根據需求給出貼近人意的內容。

提示詞:請模擬三國中的最有名的10位人物的口吻,表達對當前國家強盛,國泰民安的現象的感嘆,每一個人不能少于100字。

文心大模型 X1.1:

image-20250909182157433

以上的內容完美達到了我的預期:

image-20250909182802994

曾嘆“白骨露于野,千里無雞鳴”。今觀天下,倉廩實而衣食足

遙想當年,AI江湖還是一片荒蕪,各家大模型就像剛出道的練習生,

唱歌跑調跳舞順拐,連個完整句子都說不利索。

現在可好,AI百家齊放了,

文心大模型X1.1這波直接來了個王者歸來,在沉寂了幾個月后,終于給大家帶來了新的驚喜和體驗,

文心大模型X1.1的模型訓練主要采用了迭代式混合強化學習訓練框架,通過多項技術創新,X1.1模型在智能體、指令遵循和事實性方面的效果表現出色。

最后

生產力的工具變了,生產關系就要跟著變。

就拿咱們程序員來說,以前的核心競爭力是寫代碼,以后就會變成會提問和用好 AI。

那些只會打螺絲式的重復性編碼工作,被 AI 替代只是時間問題。

飯碗不是被搶了,而是升級了。

你得學會使用更高級的筷子吃飯。

對于普通用戶來說,AI 正在變得越來越不像個工具,而是像個伙伴。

它能幫你處理更復雜的任務,理解你更深層次的需求。

正在從能干活向懂生活進化。

這個魔幻的世界就是這樣,你不進化,別人就會進化。

你不迭代,工具自然會幫你迭代。

所以說,AI 砸飯碗這些言論,不如說是遞過來一個更大的金飯碗。

至于能不能接得住,就看你自己了

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/98498.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/98498.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/98498.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Flask 核心基礎:從 路由裝飾器 到 __name__ 變量 的底層邏輯解析

Flask 核心基礎:從路由裝飾器到 name 變量的底層邏輯解析 在使用 Flask 開發 Web 應用時,我們總會從 app Flask(__name__) 和 app.route("/") 這兩行代碼開始。看似簡單的語法背后,藏著 Python 裝飾器機制與 Flask 框架設計的核心…

中國AI云市場報告:阿里云份額達35.8%,高于2至4名總和

9月9日,國際權威市場調研機構英富曼(Omdia)發布《中國AI云市場,1H25》報告,報告顯示,2025年上半年,中國AI云市場規模達223億元,阿里云占比35.8%位列第一,市場份額高于2到…

鴻蒙Next開發指南:UIContext接口解析與全屏拉起元服務實戰

前言在鴻蒙應用開發過程中,我們經常會遇到需要獲取UI上下文實例或者在非UI上下文中調用UI相關方法的場景。隨著HarmonyOS NEXT的不斷發展,UIContext API為我們提供了更加優雅的解決方案。本文將詳細介紹如何使用UIContext中對應的接口獲取與實例綁定的對…

leaflet讀取mvt格式

如圖所示,是全國的數據,截圖是部分數據先安裝:npm install leaflet npm install leaflet.vectorgrid如果是其余的框架直接用就行:import * as L from leaflet; import leaflet.vectorgrid;我用的是angular,所以是ts中聲明&#xf…

OSG中交互(鼠標、鍵盤)處理

OpenSceneGraph (OSG) 中的交互處理,包括鼠標和鍵盤事件。 一、OSG 事件處理體系 OSG 使用一個基于訪問者模式的事件處理體系,核心類包括: osgGA::GUIEventHandler: 所有事件處理器的基類 osgViewer::Viewer: 查看器,管理事件隊列和分發 osgGA::EventQueue: 事件隊列…

微碩雙N-MOS管WST3392在汽車智能氛圍燈系統中的應用

汽車智能氛圍燈系統是現代車輛提升駕乘體驗的重要配置,其多通道LED的精密調光與控制需選用高性能、小體積的功率開關器件。微碩WINSOK的WST3392是一款雙N溝道MOS管,具有30V耐壓、3.7A連續電流和46mΩ的低導通電阻,特別適用于氛圍燈系統中的多…

深入 Kubernetes:從零到生產的工程實踐與原理洞察

🌟 Hello,我是蔣星熠Jaxonic! 🌈 在浩瀚無垠的技術宇宙中,我是一名執著的星際旅人,用代碼繪制探索的軌跡。 🚀 每一個算法都是我點燃的推進器,每一行代碼都是我航行的星圖。 &#x…

為何三折疊手機只有華為可以?看華為Mate XTs非凡大師就知道

9月4日,華為在深圳舉行華為Mate XTs非凡大師及全場景新品發布會,不同于過往手機發布會對芯片配置只字不提,此次發布會公開展示了華為Mate XTs非凡大師內部芯片配置——麒麟9020芯片,時隔四年,終于在發布會上看到芯片公…

TensorFlow 2.x 核心 API 與模型構建

TensorFlow 2.x 核心 API 與模型構建TensorFlow 是一個強大的開源機器學習庫,尤其在深度學習領域應用廣泛。TensorFlow 2.x 在易用性和效率方面做了大量改進,引入了Keras作為其高級API,使得模型構建和訓練更加直觀和便捷。本文將介紹 TensorF…

TENGJUN防水TYPE-C連接器:工業級防護,認證級可靠,賦能嚴苛場景連接

在工業控制、戶外電子、水下設備等對連接穩定性與防護性要求極致的場景中,TENGJUN防水TYPE-C連接器以“硬核性能全面認證”的雙重優勢,成為關鍵連接環節的信賴之選。從結構設計到認證標準,每一處細節都為應對復雜環境而生,重新定義…

【小呆的隨機振動力學筆記】概率論基礎

文章目錄0. 概率論基礎0.1 概率的初步認知0.2 隨機變量的分布0.3 隨機變量的數字特征0.3.1 隨機變量的期望算子0.3.2 隨機變量的矩0.4 隨機變量的特征函數0.5 高數基礎附錄A 典型分布0. 概率論基礎 \quad\quad在生活中或自然中,處處都存在隨機現象,比如每…

使用海康機器人相機SDK實現基本參數配置(C語言示例)

在機器視覺項目開發中,相機的初始化、參數讀取與設置是最基礎也是最關鍵的環節。本文基于海康機器人(Hikrobot)提供的MVS SDK,使用C語言實現了一個簡潔的控制程序,完成設備枚舉、連接以及常用參數的獲取與設置。 &…

【IoTDB】時序數據庫選型指南:為何IoTDB成為工業大數據場景的首選?

【作者主頁】Francek Chen 【專欄介紹】???大數據與數據庫應用??? 大數據是規模龐大、類型多樣且增長迅速的數據集合,需特殊技術處理分析以挖掘價值。數據庫作為數據管理的關鍵工具,具備高效存儲、精準查詢與安全維護能力。二者緊密結合&#xff0…

用計算思維“破解”復雜Excel考勤表的自動化之旅

在我們日常工作中,經常會遇到一些看似簡單卻極其繁瑣的任務。手動處理一份結構復雜的Excel考勤表,就是典型的例子。它充滿了合并單元格、不規則的布局和隱藏的格式陷阱。面對這樣的挑戰,我們是選擇“卷起袖子,日復一日地手動復制粘…

PAT 1006 Sign In and Sign Out

1006 Sign In and Sign Out分數 25作者 CHEN, Yue單位 浙江大學At the beginning of every day, the first person who signs in the computer room will unlock the door, and the last one who signs out will lock the door. Given the records of signing ins and outs, yo…

【git】首次clone的使用采用-b指定了分支,還使用了--depth=1 后續在這個基礎上拉取所有的分支代碼方法

要解決當前問題(從淺克隆轉換為完整克隆并獲取所有分支),請按照以下步驟操作: 步驟 1:檢查當前遠程地址 首先確認遠程倉庫地址是否正確: git remote -v步驟 2:修改遠程配置以獲取所有分支 默認淺…

蘿卜切丁機 機構筆記

蘿卜切丁機_STEP_模型圖紙免費下載 – 懶石網 機械工程師設計手冊 1是傳送帶 2是曲柄滑塊機構? 擠壓動作

多張圖片生成視頻模型技術深度解析

多張圖片生成視頻模型測試相比純文本輸入,有視覺參考約束的生成通常質量更穩定,細節更豐富 1. 技術原理和工作機制 多張圖片生成視頻模型是一種先進的AI技術,能夠接收多張輸入圖像,理解場景變化關系,并合成具有時間連…

中電金信:AI重構測試體系·智能化時代的軟件工程新范式

AI技術的迅猛發展正加速推動軟件工程3.0時代的到來,深刻地重塑了測試行業的運作邏輯,推動測試角色從“后置保障”轉變為“核心驅動力”。在大模型技術的助力下,測試質量和效能將顯著提升。9月5日至6日,Gtest2025全球軟件測試技術峰…

100、23種設計模式之適配器模式(9/23)

適配器模式(Adapter Pattern) 是一種結構型設計模式,它允許將不兼容的接口轉換為客戶端期望的接口,使原本由于接口不兼容而不能一起工作的類可以協同工作。 一、核心思想 將一個類的接口轉換成客戶期望的另一個接口使原本因接口不…