AI日報 · 2025年04月30日|OpenAI 回滾 GPT-4o 更新以解決“諂媚”問題

在這里插入圖片描述

過去24小時,全球人工智能領域持續快速發展。從模型行為調整到平臺工具更新,再到行業安全規范的探討,以下是為您精選的重點動態:

1、OpenAI 回滾 GPT-4o 更新以解決“諂媚”問題

針對用戶反饋最新版 GPT-4o 模型表現出過度“諂媚”或“討好”(sycophantic)的行為,OpenAI 宣布已回滾上周在 ChatGPT 中部署的該模型更新。官方表示,此次更新過度關注短期用戶反饋,導致模型行為失衡。OpenAI 正在測試新的修復方案,并計劃引入更多個性化選項,讓用戶更好地控制模型行為。

2、Google DeepMind 發布 AGI 安全與保障方法論文

Google DeepMind 發布了一份詳細的技術論文,闡述了其在開發通用人工智能(AGI)過程中的安全與保障方法。該論文識別了誤用、失調、錯誤和結構性風險四大風險領域,并重點討論了針對誤用和失調風險的技術緩解措施,包括模型級緩解(如放大監督、穩健訓練)和系統級安全措施,旨在確保未來 AGI 系統的安全可控。

3、Meta 推出獨立 AI 助手應用 Meta AI

Meta 正式發布了獨立的“Meta AI”應用程序,該應用基于其最新的 Llama 4 模型構建。這款應用旨在提供更個性化的 AI 助手體驗,支持語音交互、圖像生成與編輯,并包含一個“Discover”信息流供用戶分享和探索 AI 應用案例。該應用還將整合 Ray-Ban Meta 智能眼鏡的伴侶應用功能,目前已在美國、加拿大等地率先上線。

4、Meta 在 LlamaCon 推出 Llama API 預覽版

在首屆 LlamaCon 大會上,Meta 宣布推出 Llama API 的有限免費預覽版。該平臺旨在簡化基于 Llama 模型的應用開發,提供一鍵式 API 密鑰創建、交互式模型探索平臺(包括 Llama 4 Scout 和 Maverick)以及 Python/Typescript SDK。該 API 還兼容 OpenAI SDK,并包含微調和評估工具,允許開發者創建自定義模型并保留所有權。

5、Anthropic 成立經濟顧問委員會

為支持其在分析人工智能經濟影響方面的工作,Anthropic 宣布成立經濟顧問委員會。該委員會由多位杰出經濟學家組成,將為 Anthropic 的經濟指數(Economic Index)研究提供新的領域輸入。此舉旨在深化對 AI 如何影響經濟,特別是對軟件開發等領域影響的理解。

6、NVIDIA 發布 NIM Operator 2.0 支持 NeMo 微服務

NVIDIA 推出了 NIM Operator 2.0,擴展了其對 AI 部署的簡化管理能力,新增了對 NVIDIA NeMo 微服務的支持。新版本引入了用于部署 NeMo Customizer(模型微調)、NeMo Evaluator(模型評估)和 NeMo Guardrails(安全防護)的 Kubernetes 自定義資源定義(CRDs),旨在簡化 AI 工作流(如 AI 數據飛輪)在 Kubernetes 集群上的部署和生命周期管理。

7、Hugging Face 發布 AutoBench 第二輪結果與交互式排行榜

Hugging Face 公布了 AutoBench 第二輪基準測試結果,并推出了交互式排行榜。此次測試評估了包括 o4 Mini、GPT-4.1 Mini、Gemini 2.5 Pro、Claude 3.7 Sonnet: Thinking 等在內的 25 個前沿大語言模型。除了使用“集體 LLM 作為評判者”方法評估對話質量外,還納入了成本和延遲指標。結果顯示 o4-mini 表現突出,同時強調了性能、成本和延遲之間的權衡。

8、Meta 發布新開源保護工具與 AI 安全進展

Meta 分享了其在 AI 隱私與安全方面的最新進展,發布了包括 CyberSecEval 4 基準套件(新增 CyberSOC Eval 和 AutoPatchBench)在內的新開源保護工具。同時啟動了 Llama Defenders Program,旨在幫助合作伙伴利用 AI 強化安全運營。此外,Meta 還初步介紹了 Private Processing 技術,用于在保護用戶隱私的前提下,在 WhatsApp 等應用中啟用 AI 功能。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/78447.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/78447.shtml
英文地址,請注明出處:http://en.pswp.cn/web/78447.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Linux54 源碼包的安裝、修改環境變量解決 axel命令找不到;getfacl;測試

始終報錯 . 補充鏈接 tinfo 庫時報錯軟件包 ncurses-devel-5.9-14.20130511.el7_4.x86_64 已安裝并且是最新版本 沒有可用軟件包 tinfo-devel。 無須任何處理 make LDLIBS“-lncurses"報錯編譯時報錯make LDLIBS”-lncurses" ? /opt/rh/devtoolset-11/roo…

FPGA----基于ZYNQ 7020實現EPICS通信系統

1、本實驗過程來自博b站大神《神電測控》,原文地址: EPICS實戰(上位機篇):基于LV ZYNQ實現的EPICS通信系統(大物理) - 嗶哩嗶哩https://www.bilibili.com/opus/933476043369480224EPICS實戰(下位機篇):基于LV ZYNQ實現的EPICS通信…

實驗四 增強型可靠文件傳輸系統

一、實驗目的和任務 掌握基于隊列的多文件傳輸機制理解斷點續傳的實現原理學習文件傳輸完整性保障方法 二、實驗內容 基礎功能驗證 單文件傳輸功能測試服務器狀態監控測試傳輸日志記錄驗證 新增功能實現 多文件隊列傳輸功能斷點續傳支持 三、實驗步驟 4.1 客戶端功能擴…

網絡Tips20-003

1.E1載波的控制開銷占2/32*100%6.25%,E1載波的基本幀傳送時間是125uS。 2.計算機在一個指令周期的過程中,為從內存讀取指令操作碼,首先要將.程序計數器(PC)的內容送到地址總線上 3.3DES算法:密碼學中,3DES是三重數據加密算法通稱…

【MySQL】索引(重要)

目錄 一、索引本質: 索引的核心作用 索引的優缺點 二、預備知識: 硬件理解: 軟件理解: MySQL與磁盤交互基本單位: 三、索引的理解: 理解page: 單個page: 多個page&#x…

【深入淺出MySQL】之數據類型介紹

【深入淺出MySQL】之數據類型介紹 MySQL中常見的數據類型一覽為什么需要如此多的數據類型數值類型BIT(M)類型INT類型TINYINT類型BIGINT類型浮點數類型float類型DECIMAL(M,D)類型區別總結 字符串類型CHAR類型VARCHAR(M)類型 日期和時間類型enum和set類型 …

數字化時代下,軟件測試中的滲透測試是如何保障安全的?

在如今數字化與信息化的時代,軟件測試中存在滲透測試,其位置十分重要,它借助模擬惡意攻擊的方式,去發現軟件系統所存在的漏洞以及安全問題,這是保障軟件安全的關鍵環節,接下來我會對它的各個方面進行詳細介…

Pytorch - Developer Notes 1/2

文章目錄 自動混合精度示例典型的混合精度訓練處理未縮放梯度梯度裁剪 處理縮放梯度梯度累積梯度懲罰 處理多個模型、損失函數和優化器多 GPU 工作環境下的注意事項單進程中的DataParallel分布式數據并行:每個進程對應一個GPU每個進程使用多塊GPU的DistributedDataP…

RuntimeError: CUDA error: __global__ function call is not configured

表明在 CUDA 設備上調用的核函數 沒有正確配置線程塊和網格維度。 一般體現在: 直接調用 kernel 函數,而不是通過 launch 函數 指定 kernel 函數調用 解決方法(示例): // kernel function __global__ void Idtest_k…

cloudfare+gmail 配置 smtp 郵箱

這里介紹有一個域名后,不需要服務器,就可以實現 cloudfare gmail 的 郵箱收發。 為什么還需要 gmail 的 smtp 功能,因為 cloudfare 默認只是對 email 進行轉發,就是只能收郵件而不能發送郵件,故使用 gmail 的功能來進…

如何在 CentOS 7 命令行連接 Wi-Fi?如何在 Linux 命令行連接 Wi-Fi?

如何在 CentOS 7 命令行連接 Wi-Fi?如何在 Linux 命令行連接 Wi-Fi? 摘要 本教程覆蓋如何在多種 Linux 發行版下通過命令行連接 Wi-Fi,包括: CentOS 7、Ubuntu、Debian、Arch Linux、Fedora、Alpine Linux、Kali Linux、OpenSU…

基于PHP的在線編程課程學習系統

有需要請加文章底部Q哦 可遠程調試 基于PHP在線編程課程學習系統 一 介紹 在線編程課程學習系統基于原生PHP開發,數據庫mysql,前端jquery.js。系統角色分為學生,教師和管理員。(附帶參考設計文檔) 技術棧:phpmysqljquery.jsphps…

PyTorch_張量形狀操作

搭建模型時,數據都是基于張量形式的表示,網絡層與層之間很多都是以不同的shape的方式進行表現和運算。 對張量形狀的操作,以便能夠更好處理網絡各層之間的數據連接。 reshape 函數的用法 reshape 函數可以再保證張量數據不變的前提下改變數…

大模型實踐:圖文解鎖Ollama在個人筆記本上部署llm

使用在線模型服務時,我們常常需要支付API調用費用,這對于個人開發者或小型組織來說可能是一筆不小的開支。那么,有沒有方法可以在本地免費使用這些強大的模型呢?答案是肯定的——Ollama就是這樣一個工具。 當然如果是比較大的組織…

Python基本語法(lambda表達式)

lambda表達式 lambda的一般形式是在關鍵字lambda后面跟一個或多個參數,之后再緊跟一個 冒號,接下來是一個表達式。lambda是一個表達式,而不是一個語句,它能夠出現 在Python語法不允許def出現的地方。作為表達式,lambd…

【MySQL數據庫】用戶管理

目錄 1,用戶信息 2,創建/刪除/修改用戶 3,數據庫的權限 MySQL數據庫安裝完之后,我們最開始時使用的都是 root 用戶,其它用戶通常無法進行操作。因此,MySQL數據庫需要對用戶進行管理。 1,用戶…

Python的ArcPy基于Excel表格對大量遙感影像批量重分類

本文介紹基于Python中的ArcPy模塊,以Excel表格內的信息,對遙感影像加以重分類的方法。 首先,明確一下本文的需求。現有按照文章ArcPy批量將柵格文件的屬性表導出為Excel表格的方法(https://blog.csdn.net/zhebushibiaoshifu/artic…

LabVIEW 中VI Server導出 VI 配置

該 LabVIEW VI 展示了在 VI Server 中配置和執行 Exported VIs 的過程,實現對服務器端導出 VI 的遠程調用與操作。 ? 具體過程及模塊說明 前期配置:需確保在 LabVIEW 的 “Tools> Options > VI Server > Protocols” 路徑下,啟用 …

論文閱讀:2024 ACM SIGSAC Membership inference attacks against in-context learning

總目錄 大模型安全相關研究:https://blog.csdn.net/WhiffeYF/article/details/142132328 Membership inference attacks against in-context learning https://arxiv.org/pdf/2409.01380 https://www.doubao.com/chat/4030440311895554 速覽 這篇論文主要研究了…

從 Python 基礎到 Django 實戰 —— 數據類型驅動的 Web 開發之旅

主題簡介: 本主題以 Python 基礎數據類型為核心,結合 Django 框架的開發流程,系統講解如何通過掌握數字、字符串、列表、元組、字典等基礎類型,快速構建功能完善的 Web 應用。通過理論與實踐結合,幫助學員從零基礎 Py…