ChatGPT 5的編程能力宣傳言過其實

2025年的8月7日,OpenAI 正式向全球揭開了GPT-5的神秘面紗,瞬間在 AI 領域乃至整個科技圈引發了軒然大波。OpenAI對GPT-5的宣傳可謂不遺余力,將其描繪成一款具有顛覆性變革的 AI 產品,尤其在編程能力方面,給出了諸多令人矚目的描述 。

圖片

OpenAI聲稱,GPT-5堪稱他們有史以來最為強大的編碼模型。在復雜的前端生成任務中,它能夠僅憑用戶給出的一個簡單提示,便迅速創建出美觀且響應式極佳的網站、應用程序以及游戲。

我也在今天第一時間測試了一下GPT-5的具體編程能力。從結果來看,GPT-5的實際編程能力仍然不如Claude,甚至不如DeepSeek R1的最新版本。

我們首先用以下提示詞要求GPT-5, Claude和DeepSeek的網頁版生成一個html:?

“使用HTML設計一個類似Outlook的界面,可以通過cdn使用開源的css和字體,Javacript等。保持界面美觀”

以下為這三個大模型生成的網頁。

GPT-5:

圖片

Claude:

圖片

DeepSeek R1:

圖片

從功能上來講,基本上這三個大模型生成的網頁功能覆蓋都比較類似。也都是響應式布局。但是在具體呈現上來說,GPT-5就顯得簡陋得多。

實際上在我對網頁Javascript功能也試了一下就發現,GPT-5生成的網頁上,除了郵件標題可以點擊以外,其他地方幾乎都不能點擊。而Claude和DeepSeek生成的網頁,文件夾,切換郵件時候都是有內容變化的效果的。這也從側面反映了GPT-5在思考編程問題時思考不夠全面。

之后我用Cursor和Roo Code(因為Cursor中的DeepSeek不是官網版本,所以用Roo Code + DeepSeek API key的方式)測試了一下它們對復雜Agentic AI編程的支持。提示詞為:

“設計一個Agentic AI程序,可以根據用戶的自然語言輸入,針對一個或者多個文件夾下的文件,進行敏感數據處理,以便可以和隱私法規(如GDPR)相符合。要求:1,用戶可以隨時中斷Agent的工作,也可以在中斷后通過自然語言譬如“繼續以前的工作”以繼續進行;2,考慮到需要處理的文件數目和大模型Token限制,Agent應該把工作規劃為不同階段以完成所有工作;3,文件可能有不同語言,判斷文件中使用的主要語言,考慮可能需要適用哪些國家的隱私法規要求,進而根據不同的規則進行修改;4,如果用戶有使用自然語言輸入的特殊要求,應該加以滿足;5,使用Python。規劃并生成相關的REST服務,用戶通過網頁執行各種操作。”

當然這個程序代碼量比較大,具體我也就不把生成的內容貼出來了。但是結果仍然是Claude和DeepSeek優于GPT-5。大家也可以自己試一下。

GPT, Gemini和Grok都是很善于宣傳的,每次新模型出來都宣稱自己是最強的。但是實際上大家在編程時還是繼續用Claude(國內就是各種基于DeepSeek的AI)。甚至你在編碼時會發現,Claude Sonnet就已經足夠打敗它們了,都不需要使用Claude Opus。這就是現在大模型引擎的魔幻現實。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/92704.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/92704.shtml
英文地址,請注明出處:http://en.pswp.cn/web/92704.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

從MySQL到大數據平臺:基于Spark的離線分析實戰指南

引言在當今數據驅動的商業環境中,企業業務數據通常存儲在MySQL等關系型數據庫中,但當數據量增長到千萬級甚至更高時,直接在MySQL中進行復雜分析會導致性能瓶頸。本文將詳細介紹如何將MySQL業務數據遷移到大數據平臺,并通過Spark等…

Mysql筆記-存儲過程與存儲函數

1. 存儲過程(Stored Procedure) 1.1 概述 1.1.1 定義: 存儲過程是一組預編譯的 SQL 語句和控制流語句(如條件判斷、循環)的集合,?無返回值?(但可通過 OUT/INOUT 參數或結果集返回數據)。它支持參數傳遞、…

[論文閱讀] 人工智能 + 軟件工程 | LLM協作新突破:用多智能體強化學習實現高效協同——解析MAGRPO算法

LLM協作新突破:用多智能體強化學習實現高效協同——解析MAGRPO算法 論文:LLM Collaboration With Multi-Agent Reinforcement LearningarXiv:2508.04652 (cross-list from cs.AI) LLM Collaboration With Multi-Agent Reinforcement Learning Shuo Liu, …

使用OAK相機實現智能物料檢測與ABB機械臂抓取

大家好!今天我們很高興能與大家分享來自OAK的國外用戶——Vention 的這段精彩視頻,展示了他們的AI操作系統在現實中的應用——在演示中,進行實時的自動物料揀選。 OAK相機實時自動AI物料揀選視頻中明顯可以看到我們的OAK-D Pro PoE 3D邊緣AI相…

html5和vue區別

HTML5 是網頁開發的核心標準,而 Vue 是構建用戶界面的JavaScript框架,兩者在功能定位和開發模式上有顯著差異: 核心定位 HTML5是 HTML標準 的第五次重大更新(2014年發布),主要提供網頁結構定義、多媒體嵌入…

【前端八股文面試題】【JavaScript篇3】DOM常?的操作有哪些?

文章目錄🧭 一、查詢/獲取元素 (Selecting Elements)?? 二、修改元素內容與屬性 (Modifying Content & Attributes)🧬 三、創建與插入元素 (Creating & Inserting Elements)🗑? 四、刪除與替換元素 (Removing & Replacing)&am…

內存殺手機器:TensorFlow Lite + Spring Boot移動端模型服務深度優化方案

內存殺手機器:TensorFlow Lite Spring Boot移動端模型服務深度優化方案一、系統架構設計1.1 端云協同架構1.2 組件職責矩陣二、TensorFlow Lite深度優化2.1 模型量化策略2.2 模型裁剪技術2.3 模型分片加載三、Spring Boot內存優化3.1 零拷貝內存管理3.2 堆外內存模…

安全生產基礎知識(一)

本文檔圍繞安全生產基礎知識展開: 一、安全用電相關知識 用電安全要點 禁止用濕手觸摸燈頭、開關、插頭插座及用電器具。發現有人觸電,切勿用手拉扯,應立即拉開電源開關或用干燥木棍、竹竿挑開電線。電器通電后出現冒煙、燒焦味或著火時&…

Elasticsearch 搜索模板(Search Templates)把“可配置查詢”裝進 Mustache

1. 什么是 Search Template?能解決什么問題? 搜索模板是存儲在 ES 集群里的 Mustache 模板(lang: mustache)。你把一份標準 _search 請求體寫成模板,變量交給 params,每次調用只需傳參即可: 搜索…

cocos Uncaught TypeError: Cannot read properties of null (reading ‘SetActive‘)

報錯:Uncaught TypeError: Cannot read properties of null (reading SetActive) at b2RigidBody2D.setActive (rigid-body.ts:231:21) at b2RigidBody2D.onEnable (rigid-body.ts:78:14) at RigidBody2D.onEnable (rigid-body-2d.ts:551:24) at OneOffInvoker.invo…

Docker用戶組介紹以及管理策略

在Docker環境中,用戶組(尤其是默認的docker組)是管理用戶與Docker守護進程交互權限的核心機制。以下從概念介紹和具體管理操作兩方面詳細說明:一、Docker用戶組的核心概念 Docker守護進程(dockerd)默認通過…

【PyTorch】單目標檢測項目部署

【PyTorch】單目標檢測項目 兩種部署情況:部署在 PyTorch 數據集上,以及部署在本地存儲的單個映像上。 目錄 定義數據集 搭建模型 部署模型 定義數據集 詳細參照前文【PyTorch】單目標檢測項目 import torchvision import os import pandas as pd i…

Baumer高防護相機如何通過YoloV8深度學習模型實現火星隕石坑的檢測識別(C#代碼UI界面版)

《------往期經典推薦------》 AI應用軟件開發實戰專欄【鏈接】 序號 項目名稱 項目名稱 1 1.工業相機 + YOLOv8 實現人物檢測識別:(C#代碼,UI界面版) 2.工業相機 + YOLOv8 實現PCB的缺陷檢測:(C#代碼,UI界面版) 2 3.工業相機 + YOLOv8 實現動物分類識別:(C#代碼,U…

UniApp Vue3 TypeScript項目中使用xgplayer播放m3u8視頻的顯示問題

問題背景 在UniApp Vue3 TypeScript項目中使用xgplayer播放m3u8視頻時&#xff0c;遇到了一個棘手的問題&#xff1a;視頻畫面下移&#xff0c;只能聽到聲音&#xff0c;全屏后才能正常顯示。經過排查&#xff0c;發現是<video>元素在DOM渲染時被異常定位&#xff0c;導…

服務器硬件電路設計之 I2C 問答(三):I2C 總線上可以接多少個設備?如何保證數據的準確性?

在服務器硬件電路設計中&#xff0c;I2C 總線作為常用的串行通信協議&#xff0c;其設備連接數量和數據準確性至關重要。?I2C 總線上可連接的設備數量并非無限制。從理論上講&#xff0c;標準 I2C 設備采用 7 位地址&#xff0c;除去保留地址&#xff0c;最多可連接 112 個設備…

用LaTeX優化FPGA開發:結合符號計算與Vivado工具鏈

用 LaTeX 優化 FPGA 開發&#xff1a;結合符號計算與 Vivado 工具鏈&#xff08;一&#xff09; 系列文章目錄 第一章&#xff1a;深入了解 LaTeX&#xff1a;科技文檔排版的利器 第二章&#xff1a;LaTeX 下載安裝保姆級教程 第三章&#xff1a;LaTeX 創建工程并生成完整文檔…

人工智能系列(6)如何開發有監督神經網絡系統?

一. 開發有監督神經網絡系統的步驟1. 數據收集訓練數據通常由輸入–輸出成對組成&#xff0c;根據任務需求可能涵蓋不同情境&#xff08;如白天或夜晚的車輛識別&#xff09;&#xff0c;其類型可以是數值、圖像、音頻等多種形式&#xff1b;數據規模越大、越多樣&#xff0c;模…

CSS 選擇器進階:用更聰明的方式定位元素

在前端開發中&#xff0c;CSS 選擇器是我們與 DOM 對話的語言。雖然 class 和 id 是我們最熟悉的工具&#xff0c;但真正高效、優雅的樣式代碼&#xff0c;往往來自于對現代 CSS 選擇器的深入理解與巧妙運用。本文將帶你跳出基礎語法&#xff0c;探索那些能顯著提升開發效率和代…

常用排序方法

一、排序的概念及引用1、排序的概念排序&#xff1a;所謂排序&#xff0c;就是使一串記錄&#xff0c;按照其中的某個或某些關鍵字的大小&#xff0c;遞增或遞減的排列起來的操作。穩定性&#xff1a;假定在待排序的記錄序列中&#xff0c;存在多個具有相同的關鍵字的記錄&…

接口返回504 Gateway Time-out 錯誤,這意味著請求在網關或代理服務器等待上游服務器響應時超時。以下是可能的原因和排查建議:

問題分析1.后端處理耗時過長是某個方法執行時間過長&#xff0c;超過了網關的超時設置&#xff08;通常是幾十秒&#xff09;可能涉及大量數據查詢或復雜計算2.數據庫查詢性能問題查詢的數據量過大缺少必要的數據庫索引SQL語句執行效率低下排查建議1.檢查服務端日志查看應用日志…