AI日報 · 2025年5月15日|GPT-4.1 登陸 ChatGPT

AI日報 · 2025年5月15日|GPT-4.1 登陸 ChatGPT在這里插入圖片描述

1、OpenAI 在 ChatGPT 全面開放 GPT-4.1 與 GPT-4.1 mini

北京時間 5 月 14 日晚,OpenAI 在官方 Release Notes 中宣布:專為復雜代碼與精細指令場景打造的 GPT-4.1 正式加入 ChatGPT,Plus/Pro/Team 付費用戶即日起可在模型下拉菜單中直接調用;企業版與 Edu 版將于數周內接入。更新同 步推出 GPT-4.1 mini——在保持推理深度的同時大幅縮短響應延遲,取代原 GPT-4o mini 成為免費層超額 fallback 模型。
在這里插入圖片描述

OpenAI 同時上線「Safety Evaluations Hub」,公開 GPT-4.1 系列最新安全基準數據,以期提升外部透明度。官方強調,兩款模型沿用 GPT-4o 相同速率限制,且在編碼、網頁開發與工具調用鏈路上具備更高穩健度,預計將成為開發者與高級用戶日常工作的“主力編譯器”。[1]

2、API 直接吃 PDF:OpenAI 推出原生文件輸入能力

5 月 15 日,OpenAI 在開發者社區公告板發布 「Direct PDF file input now supported in the API」,首次開放 PDF 作為 file_id 直傳格式,無需預先轉為文本或多頁圖片。新能力意味著開發者可在一次調用中上傳、解析并讓模型對復雜 PDF 結構(目錄、表格、批注)進行語義檢索、摘要或鏈式推理。官方示例還展示了結合 o4-mini-high 進行長鏈路推理的最佳實踐。此舉將進一步降低文檔智能化門檻,為 RAG、合同審核、科研論文導航等場景提供即插即用的后端能力。[2]

3、Google DeepMind 發布 AlphaEvolve:Gemini 驅動的算法設計代理

DeepMind 于 5 月 14 日深夜(PDT)發布博客,推出 AlphaEvolve —— 基于 Gemini 2.5 系列的跨語言多模態編碼代理。
在這里插入圖片描述

官方稱,AlphaEvolve 通過自監督進化搜索結合強化學習,可在數小時內自動生成高質量近似最優算法,并支持 Python/C++/Rust 等語言輸出;內部基準顯示在圖著色、約束滿足與半定規劃等 12 個經典難題上平均超越人類專家基線 8.3 %。團隊還開源了評測框架與部分搜索日志,邀請學術界共同驗證可重復性。該項目被視作 AlphaGo 系列“搜索+RL”路線在通用算法設計上的首次產品化落地。[3]

4、Hugging Face × Kaggle:模型一鍵直連筆記本生態

開源社區旗艦 Hugging Face 5 月 14 日宣布與 Google Kaggle 達成深度集成:即日起,Hugging Face Hub 模型頁新增 “Open in Kaggle” 按鈕,用戶可一鍵生成預填代碼的 Kaggle Notebook;反向地,Kaggle 模型頁也同步展示 Hub 元數據與 Spaces 示例。雙方還自動為 Notebook 中引用且尚未托管的模型創建 Hub Entry,打通社區示例與數據血緣。官方博客指出,該集成后續將支持離線競賽場景與私有模型令牌透傳,目標是“讓任何開發者在零配置下練手最前沿開源 LLM”。[4]

5、DeepSeek-V3 硬件共設論文披露 2 048 張 H800 GPU 訓練細節

DeepSeek 團隊于 5 月 14 日 20:39 (北京時間)在 arXiv 發布論文《Insights into DeepSeek-V3》。
在這里插入圖片描述

“硬件–模型協同”成為核心主題:團隊針對 H800 GPU 顯存與帶寬限制提出 Multi-head Latent Attention、FP8 混精度與多平面網絡拓撲,將 128 k 上下文訓練成本壓縮 43 %。文中還公開了 2 048 卡集群 55 天預訓練總耗 $5.6 M 的資源曲線,為大規模推理模型節能給出硬件參考。論文透露 DeepSeek-V3/R1 在推理階段已內置動態混合專家路由,指向下一代「R2 多代理協同」的實驗路線。[5]

6、Qwen 3 技術報告:思考模式與非思考模式合一

阿里 Qwen 團隊 5 月 14 日深夜釋出 Qwen 3 Technical Report。Qwen 3 覆蓋 0.6B-235B 多尺度密集與 MoE 版本,首創“Thinking Mode / Non-Thinking Mode 動態切換”與 思考預算機制:模型可根據任務復雜度自適應調用專家數與計算步長,在保持延遲可控的同時提升多步推理準確率。團隊聲稱,旗艦 235B-A22B MoE 模型在 MATH、CoderBench 與 Agent Arena 多項基準上全面領先同尺寸閉源模型,并擴充至 119 種語言方言。全部權重 Apache 2.0 開源。[6]

7、OpenAI 上線「Safety Evaluations Hub」集中公開模型安全指標

繼 GPT-4.1 入駐 ChatGPT 之際,OpenAI 同步推出 Safety Evaluations Hub。該站點匯總 GPT-4o、o-series、GPT-4.1 以及未來版本的越權輸出、拒答率、隱私泄漏等多維評測數據,并將隨模型迭代定期更新。官方表示此舉旨在讓外界更直觀追蹤模型風險曲線、促進社區復現與外部紅隊反饋,從而加速內部安全對齊流程。業內人士認為,OpenAI 此番“類 Model Card 即時化”策略,或將成為高強度監管語境下的大模型新合規范式。[7]

參考資料

[1] ChatGPT — Release Notes,更新日期:2025-05-14,OpenAI Help Center.
[2] Direct PDF file input now supported in the API,2025-05-15,OpenAI Developer Forum Announcements.
[3] AlphaEvolve: A Gemini-Powered Coding Agent for Designing Advanced Algorithms,2025-05-14,Google DeepMind Blog.
[4] Improving Hugging Face Model Access for Kaggle Users,2025-05-14,Hugging Face Blog.
[5] Zhao C. et al., “Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures”,arXiv preprint arXiv:2505.09343,2025-05-14.
[6] Qwen Team, “Qwen 3 Technical Report”,arXiv preprint arXiv:2505.09388,2025-05-14.
[7] Safety Evaluations Hub,OpenAI 官方網站,訪問時間:2025-05-15.

以上為今日重點 AI 新聞,歡迎關注后續更新。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/79952.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/79952.shtml
英文地址,請注明出處:http://en.pswp.cn/web/79952.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

π0: A Vision-Language-Action Flow Model for General Robot Control

TL;DR 2024 年 Physical Intelligence 發布的 VLA 模型 π0,基于 transformer 流匹配(flow matching)架構,當前開源領域最強的 VLA 模型之一。 Paper name π0: A Vision-Language-Action Flow Model for General Robot Contr…

Java詳解LeetCode 熱題 100(17):LeetCode 41. 缺失的第一個正數(First Missing Positive)詳解

文章目錄 1. 題目描述2. 理解題目3. 解法一:排序法(不滿足題目要求)3.1 思路3.2 Java代碼實現3.3 代碼詳解3.4 復雜度分析3.5 不足之處 4. 解法二:哈希表法4.1 思路4.2 Java代碼實現4.3 代碼詳解4.4 復雜度分析4.5 不足之處 5. 解…

第九講 | 模板進階

模板進階 一、非類型模板參數1、模板參數的分類2、應用場景3、array4、注意 二、模板的特化1、概念2、函數模板特化3、類模板特化(1)、全特化:全部模板參數都特化成具體的類型(2)、偏/半特化:部分模板參數特…

機器學習——樸素貝葉斯練習題

一、 使用鳶尾花數據訓練多項式樸素貝葉斯模型,并評估模型 代碼展示: from sklearn.datasets import load_iris from sklearn.metrics import accuracy_score from sklearn.model_selection import train_test_split from sklearn.naive_bayes impor…

氣胸復查重點提問清單 ,怎樣平衡檢查必要性和輻射影響?

氣胸復查重點提問清單(打印版) 以下是帶孩子復查氣胸時建議與醫生溝通的重點問題,分為不同方面,可打印后隨身攜帶,逐項確認。 術后康復情況相關 1. 肺目前復張情況如何?胸片顯示肺是否已經完全展開&…

Linux相關概念和易錯知識點(40)(HTML資源交互、網頁管理、搜索引擎)

目錄 1.HTML資源交互 (1)媒體加載 (2)靜態頁面跳轉 (3)動態頁面 (4)GET和POST傳參的區別 2.網頁管理 (1)網頁的權限管理 (2)臨…

使用 QGIS 插件 OpenTopography DEM Downloader 下載高程數據(申請key教程)

使用 QGIS 插件 OpenTopography DEM Downloader 下載高程數據 目錄 使用 QGIS 插件 OpenTopography DEM Downloader 下載高程數據📌 簡介🛠 插件安裝方法🌍 下載 DEM 數據步驟🔑 注冊 OpenTopography 賬號(如使用 Cope…

【通知】2025元宇宙數字人設計大賽啟動,大賽線上報名階段開啟!

元宇宙數字人設計大賽火熱報名中!歡迎大家踴躍報名參與! 元宇宙數字人設計大賽報名活動正在如火如荼進行中,歡迎各位對元宇宙數字人感興趣的同學與老師踴躍參與報名! 元宇宙數字人設計大賽承接原大中華區VR盟主選拔賽&#xff0c…

Kaamel隱私合規洞察:Temu在韓被罰事件分析

Kaamel隱私合規與數據安全團隊分析報告 韓國個人信息保護委員會(PIPC)對中國電子商務巨頭Temu處以巨額罰款,原因是其嚴重違反了用戶數據保護法律 。核心違規行為包括未經適當披露或用戶同意非法跨境傳輸數據、未能指定當地代表、賬戶注銷流程…

查詢公網IP地址的方法:查看自己是不是公網ip,附內網穿透外網域名訪問方案

本地搭建服務并提供互聯網連接時,較為傳統的方法是使用公網IP地址。因此,如何查詢本地自己是不是公網IP,是必須要掌握的一種技巧。當面對確實無公網IP時,則可以通過內網穿透方案,如nat123網絡映射工具,將本…

Redis特性與應用

1、分布式緩存與redis 2、redis數據結構和客戶端集成 3、緩存讀寫模式與數據一致性 本地緩存:Hash Map、Ehcache、Caffeine、Google Guava 分布式緩存:Memcached、redis、Hazelcast、Apache ignite redis:基于鍵值對內存數據庫,支…

Top-p采樣:解鎖語言模型的創意之門

Top - p采樣 是什么:核采樣:排序,累計到0.7,隨機選擇 在自然語言生成和大規模語言模型推理中,Top - p采樣(又叫核采樣,Nucleus Sampling)是一種基于累積概率的采樣策略。 Top - p介…

Gitee DevSecOps:軍工軟件研發的智能化變革引擎

在數字化戰爭時代背景下,軍工軟件的研發效率與質量直接關乎國防建設進程。傳統軍工軟件開發面臨依賴管理混亂、版本變更失控、團隊協作低效等系統性難題,嚴重制約著"軟件工廠"理念的落地。Gitee DevSecOps平臺以智能版本管理為突破口&#xff…

芋道項目,商城模塊數據表結構

一、需求 最近公司有新的業務需求,調研了一下,決定使用芋道(yudao-cloud)框架,于是從github(https://github.com/YunaiV/yudao-cloud)上克隆項目,選用的是jdk17版本的。根據項目啟動手冊&#…

ES常識9:如何實現同義詞映射(搜索)

在 Elasticsearch(ES)中實現同義詞映射(如“美麗”和“漂亮”),核心是通過 同義詞過濾器(Synonym Token Filter) 在分詞階段將同義詞擴展或替換為統一詞項,從而讓搜索時輸入任意一個…

Web安全滲透測試基礎知識之SQL注入篇

一、SQL注入基礎理論 1.1 什么是SQL注入 SQL注入是一種常見的Web安全問題,攻擊者通過在Web應用程序的輸入字段中插入惡意的SQL語句,改變原本SQL查詢的邏輯,實現非法獲取數據、篡改數據、執行系統命令等操作。這種情況產生的根本原因在于應…

JVM方法區核心技術解析:從方法區到執行引擎

方法區 方法區的內部結構 在經典方法區設計中,主要存儲以下核心數據內容: 一、類型信息 方法區維護的類型信息包含以下要素: 類全稱標識 類名稱(含完整包路徑)直接父類的完全限定名(包含完整包路徑&am…

【MyBatis插件】PageHelper 分頁

前言 在開發 Web 應用時,我們經常需要處理海量數據的展示問題。例如,在一個電商平臺上,商品列表可能有成千上萬條數據。如果我們一次性將所有數據返回給前端,不僅會導致頁面加載緩慢,還會對數據庫造成巨大壓力。為了解…

springboot+vue實現在線書店(圖書商城)系統

今天教大家如何設計一個圖書商城 , 基于目前主流的技術:前端vue,后端springboot。 同時還帶來的項目的部署教程。 視頻演示 在線書城 圖片演示 一. 系統概述 商城是一款比較龐大的系統,需要有商品中心,庫存中心,訂單…

OPC UA + ABP vNext 企業級實戰:高可用數據采集框架指南

🚀📊 OPC UA ABP vNext 企業級實戰:高可用數據采集框架指南 🚀 📑 目錄 🚀📊 OPC UA ABP vNext 企業級實戰:高可用數據采集框架指南 🚀一、前言 🎯二、系統…