實時“秒回”,像真人一樣語音聊天,GPT-4o模型強到恐怖

9efefa7d73378b01163505c1f758877b.jpeg

今天凌晨OpenAl發布了 GPT-4o,這是一種新的人工智能模式,集合了文本、圖片、視頻、語音的全能模型。

能實時響應用戶的需求,并通過語音來實時回答你,你可以隨時打斷它。還具有視覺能力,能識別物體并根據視覺做出快速的響應和回答,具有非常強的邏輯推理能力。 它的速度比 GPT4-turbo快2倍,價格便宜 50%!

根據傳統的基準測試,GPT-4o 在文本、推理和編碼智能方面的性能達到了 GPT-4 Turbo 的水平,同時在多語言、音頻和視覺功能方面也創下了新高。

GPT-4o 的新功能

  • 體驗 GPT-4 級別的智能
  • 從模型和網頁獲取響應
  • 分析數據并創建圖表
  • 討論拍攝的照片
  • 上傳文件以獲取摘要、寫作或分析幫助
  • 發現并使用 GPT 和 GPT 商店
  • 通過“記憶”構建更有幫助的體驗

f076d8c32f529d09a0a45b78f674d494.jpeg

主要特點與功能

  • 模型優勢:GPT-4o是最新的旗艦模型,具有 GPT-4級別的智能,但速度更快,且在文本、語音和視覺方面的能力得到了顯著提升。
  • 圖像理解與討論:GPT-4o在理解和討論用戶分享的圖像方面表現優于任何現有模型。例如,用戶可以拍攝不同語言的菜單,與 GPT-4o對話以翻譯、了解食物的歷史和重要性,以及獲取推薦。
  • 即將推出的語音模式:未來的改進將支持更自然的實時語音對話和通過實時視頻與 ChatGPT對話的能力。例如,用戶可以在觀看現場體育賽事時,請求 ChatGPT 解釋規則。計劃在未來幾周內以 alpha 版本推出新的語音模式,并向 Plus 用戶提供早期訪問。
  • 可用性和用戶訪問
  1. 多語言支持:GPT-4o的語言能力在質量和速度上均有改進,現在 ChatGPT 支持超過 50 種語言的注冊、登錄、用戶設置等。
  2. 用戶層次:目前正向 ChatGPT Plus 和團隊用戶推出 GPT-4o,企業用戶即將可用。同時也開始向 ChatGPT Free 用戶推出,但有使用限制。Plus 用戶的消息限制是 Free 用戶的5倍,團隊和企業用戶則有更高的限制。

增強智能與高級工具的普及

使命與目標:使先進的 AI 工具能夠為盡可能多的人提供服務。每周有超過一億人使用ChatGPT。在未來幾周,我們將開始向 ChatGPT Free 用戶推出更多智能和高級工具。

綜合交互能力

多模態輸入與輸出:GPT-4o是第一個將文本、音頻和圖像輸入整合的模型,可以生成文本、音頻和圖像的任意組合輸出。這種設計顯著提高了與計算機的自然交互能力。

性能提升與成本效率

  • 響應時間:GPT-4o的音頻輸入響應時間極快,最低可達232毫秒,平均為320毫秒,與人類在對話中的響應時間相似。
  • 效率與成本:在API中,GPT4o 的速度是 GPT-4Turbo 的兩倍,成本降低了50%,且處理速率限制提高了5倍。

語音模式的進步

從多模型到單一模型:與之前版本相比,GPT-4o 通過單一模型端到端訓練,處理所有輸入和輸出。這避免了信息丟失,使模型能直接處理語調、多個說話者或背景噪音等,并能輸出笑聲、唱歌或表達情感。

測試與迭代

廣泛的紅隊測試:與70多位外部專家合作進行紅隊測試,涵蓋社會心理學、偏見與公正、誤信息等領域,以識別新增模態帶來的風險,并據此建立安全干預措施。

持續風險緩解:繼續發現并緩解新風險。

部署與可用性

逐步推出:GPT-40 的文本和圖像功能已開始在 ChatGPT 中推出。開發者現在也可以通過API訪問作為文本和視覺模型的 GPT-40。

語音和視頻功能:計劃在未來幾周內向一小部分受信任的合作伙伴推出新的音頻和視頻能力。

更詳細的功能介紹和展示

https://openai.com/index/hello-gpt-4o/

高性價比GPU資源:https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_wenzhang_tongyong_shemei


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/12138.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/12138.shtml
英文地址,請注明出處:http://en.pswp.cn/web/12138.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

6、Qt—Log4Qt使用小記1

開發平臺:Win10 64位 開發環境:Qt Creator 13.0.0 構建環境:Qt 5.15.2 MSVC2019 64位 一、Log4Qt簡介 Log4Qt是使用Trolltech Qt Framework的Apache Software Foundation Log4j包的C 端口。它旨在供開源和商業Qt項目使用。所以 Log4Qt 是Apa…

Java零拷貝技術實戰

文章目錄 引入傳統IO內存映射mmap文件描述符sendFile測試總結 引入 為什么要使用零拷貝技術? 傳統寫入數據需要4次拷貝,如下圖: 傳統IO import java.io.*; import java.net.Socket;public class TranditionIOClient {private static fina…

【機器學習300問】81、什么是動量梯度下降算法?

動量梯度下降算法(Momentum)是利用指數加權移動平均的思想來實現梯度下降的算法。讓我們先來回顧一下基礎的梯度下降方法以及看看它有哪些不足之處。接著引出動量梯度下降算法,在理解了它的原理后看看它是如何規避之前方法的不足的。 如果不知…

網絡安全ctf比賽_學習資源整理,解題工具、比賽時間、解題思路、實戰靶場、學習路線,推薦收藏!...

對于想學習或者參加CTF比賽的朋友來說,CTF工具、練習靶場必不可少,今天給大家分享自己收藏的CTF資源,希望能對各位有所幫助。 CTF在線工具 首先給大家推薦我自己常用的3個CTF在線工具網站,內容齊全,收藏備用。 1、C…

使用 RyTuneX 增強您的 Windows 10 和 11 體驗 – Rayen Ghanmi 的首選優化器。

📝 關于 RyTuneX 是使用 WinUI 3 框架構建的尖端優化器,旨在增強 Windows 設備🚀的性能。 RyTuneX 專為 Windows 10 和 11 打造,使用戶能夠毫不費力地刪除頑固的預裝應用程序并優化系統資源🛠?。 🚀 功能…

java實現音頻、視頻離開頁面存儲收聽記錄、觀看記錄

說明:本文是既《SpringBoot+thymeleaf完成視頻記憶播放功能》的續寫,如有興趣可點擊鏈接查看。 一、功能背景描述說明: 1、在手機瀏覽器離開時將看到的視頻記錄、視頻時長和音頻的收聽記錄、收聽時長存入數據庫記錄; 2、用戶通過將觀看、收聽記錄導出,能夠看到是誰看了哪些…

微信加粉計數器

1.采用非注入式開發,支持無限多開 2.每個賬號都有獨立的分組,實時遠程網頁數據分享 3.后臺功能強大,操作簡單,自動去重復,準確計數分秒不差

Java畢業設計 基于SpringBoot vue藥店管理系統

Java畢業設計 基于SpringBoot vue藥店管理系統 SpringBoot 藥店管理系統 功能介紹 員工 登錄 個人中心 修改密碼 個人信息 查看供應商信息 查看藥品 查看進貨 查看銷售 管理員 登錄 個人中心 修改密碼 個人信息 供應商類型管理 供應商信用等級類型管理 藥品類型管理 供應商信…

不懂數字后端Box List、Polygon的意思?

什么是BOX? 景芯SoC做design planning的第一步就是確定floorplan的box,也就是設計的區域。這個區域可以劃分為三個邊界,如下圖所示: Die Box 最外面一圈,我們稱為 Die Box,也就是用來放置 IO 單元&#x…

太陽能無人機的多元化應用

隨著新能源技術的不斷發展和成熟,太陽能在無人機的應用技術已經成熟。太陽能無人機得到了量產和廣泛的應用。傳統無人機相比,太陽能無人機無需燃油,運行費用低廉,搭載多種高科技設備,能夠高效、多元化地采集和分析各類…

flutter 禁止橫屏設置

1.Flutter 設置 在 main 函數 加載app前添加以下代碼 SystemChrome.setPreferredOrientations([DeviceOrientation.portraitUp,DeviceOrientation.portraitDown,]) 添加后的結果 void main() async {WidgetsBinding widgetsBinding WidgetsFlutterBinding.ensureInitializ…

匯昌聯信電商:拼多多網店好做嗎?

在電子商務的海洋中,拼多多以其獨特的團購模式和親民策略迅速崛起,吸引了大批消費者和商家的目光。對于“拼多多網店好做嗎?”這個問題,答案并非簡單的是與否,而是需要從多個維度進行深入分析。 一、市場定位與競爭環境 拼多多定…

常見 Web 安全攻防總結

Web 安全的對于 Web 從業人員來說是一個非常重要的課題,所以在這里總結一下 Web 相關的安全攻防知識,希望以后不要再踩雷,也希望對看到這篇文章的同學有所幫助。今天這邊文章主要的內容就是分析幾種常見的攻擊的類型以及防御的方法。 也許你對…

05-10 周五 推理是什么

05-10 周五 推理是什么 時間版本修改人描述2024年5月10日10:13:54V0.1宋全恒新建文檔2024年5月13日11:08:42V1.0宋全恒填充了訓練和推理的定義,并且對于推理加速的方面進行了詳細的介紹 簡介 最近要坐推理時的動態量化,因此,需要認真理解一下…

獨立游戲《星塵異變》UE5 C++程序開發日志3——實現一個存存組件

本篇日志中,我將會介紹如何實現一個有格子,每個格子有容量的物品庫存,如下圖: 一.庫存容器 1.儲存數據的容器 庫存容器最重要的目的就是存儲每一種類的物品擁有的數量,這里我用的是哈希表: std::unordere…

huggingface:利用git克隆目標資源

前言 因為有很多模型資源都被放在了huggingface上,為了下載它們,著實讓一個不懂git的人犯了難,繞了很多遠路,甚至將不需要解決的問題也都拿上了臺面,因此我將在本篇博客中記載一些關于【huggingface】中利用git克隆目標…

【c++】全面理解C++多態:虛函數表深度剖析與實踐應用

🔥個人主頁:Quitecoder 🔥專欄:c筆記倉 朋友們大家好,通過本篇文章,來詳細理解多態的內容 目錄 1.多態的定義及實現1.1多態的構成條件1.2虛函數的重寫1.3 C11 override 和 final1.4重載、覆蓋(重寫)、隱藏…

wireshark協議大致過濾規則

參考鏈接&#xff1a;真保姆鏈接 1、比較操作符 等于 &#xff01;不等于 >大于 <小于 >大于等于 <小于等于 2、協議類型 直接在Filter框中直接輸入協議名即可。注意&#xff1a;協議名稱需要輸入小寫。 tcp&#xff0c;只顯示TCP協議的數據包列表udp&#xff0c…

鴻蒙內核源碼分析 (內核啟動篇) | 從匯編到 main ()

這應該是系列篇最難寫的一篇&#xff0c;全是匯編代碼&#xff0c;需大量的底層知識&#xff0c;涉及協處理器&#xff0c;內核鏡像重定位&#xff0c;創建內核映射表&#xff0c;初始化 CPU 模式棧&#xff0c;熱啟動&#xff0c;到最后熟悉的 main() 。 內核入口 在鏈接文件…

在k8s中安裝Grafana并對接Prometheus,實現k8s集群監控數據的展示

&#x1f407;明明跟你說過&#xff1a;個人主頁 &#x1f3c5;個人專欄&#xff1a;《Grafana&#xff1a;讓數據說話的魔術師》 &#x1f3c5; &#x1f516;行路有良友&#xff0c;便是天堂&#x1f516; 目錄 一、引言 1、Grafana簡介 2、Grafana的重要性與影響力 …