Llama 3沒能逼出GPT-5!OpenAI怒“卷”To B戰場,新企業級 AI 功能重磅推出!

Meta 是本周當之無愧的AI巨星!剛剛推出的 Llama 3 憑借著強大的性能和開源生態的優勢在 LLM 排行榜上迅速躍升。

按理說,Llama 3在開源的狀態下做到了 GPT-3.7 的水平,必然會顯得用戶(尤其是企業用戶,他們更具備獨立部署Llama 3的能力)花錢買來的 GPT-4 沒那么香了。網友于是紛紛拱火,“鼓勵”OpenAI?交出 GPT-5,才能繼續穩坐大模型王位。

不單單是網友,就連 OpenAI 的研究員也有點坐不住了,跑到X上發了一條含義曖昧的推文。

圖片

這下網友更加焦急地推測,性能強悍的 Llama 3 可能會擾亂 GPT-5 的發布時間表,甚至提前到4.22日。直到周四,OpenAI的新動作才姍姍來遲。

圖片

OpenAI 重磅推出了其擴展的 API 客戶的企業級功能,進一步豐富其助手 API,并引入旨在增強安全性和行政控制以及更有效管理成本的新工具。

OpenAI對它寄予厚望:“當你與開發者和企業談論 AI 模型的有意義工作時,OpenAI 仍然領先,”OpenAI API 產品負責人 Olivier Godement說。

不過,OpenAI這一迂回作戰的策略,到底是讓很多人始料不及。“油鹽不進”的網友回復道,“你是不是把GPT-5拼錯了”?? ?

圖片

不過,就像小扎曾在采訪里坦言,Meta會開源模型,但不會開源產品。過硬的產品才是一家企業真正的技術壁壘和現金牛。一味燒錢的時代過去了,現在的AI主旋律是探索更多的商業價值。

OpenAI在此時高調宣布升級企業級產品,足可見其在To B賽道廝殺的決心。那么這款新升級的API的能力是否能讓企業心動到為其買單呢?

1.私有鏈接和加強的安全功能

在重要的安全升級中,新的API產品引入了私有鏈接,這種安全方法允許 Microsoft 的 Azure 云服務和 OpenAI 之間進行直接通信,這有助于最小化通過 API 發送的客戶數據和查詢的“對開放互聯網的暴露”。

這一新增功能補充了現有的安全棧,包括 SOC 2 Type II 認證、單點登錄(SSO)、靜態 AES-256 數據加密、傳輸中的 TLS 1.2 加密和基于角色的訪問控制。? ?

此外,OpenAI 引入了原生的多因素認證(MFA)以加強訪問控制,以符合日益增長的合規性需求。對于需要 HIPAA 合規性的醫療保健公司,OpenAI 繼續提供商業伙伴協議,并為符合條件的 API 客戶提供零數據保留政策。

2.升級的助手 API,可處理 500 倍更多的文件

OpenAI 提供的一個較少宣傳但最重要的企業產品是其助手 API。它允許企業部署他們訓練的定制微調模型,并通過檢索增強生成(RAG)調用特定文檔,并提供相應的會話助手。

例如,電子商務公司 Klarna 今年早些時候夸贊其使用 OpenAI 助手 API 制作的 AI 助手,能夠完成 700 名全職人類代理的工作,重復查詢減少了 25%,解決時間幾乎減少了 82%(從 11 分鐘減少到 2 分鐘)。

OpenAI 現已升級助手 API,包括新的“file_search”功能,增強文件檢索能力,每個助手可以處理多達 10,000 個文件。

這代表了比以前限制的 20 個文件增加了 50 倍,并增加了并行查詢、改進的重新排名和查詢重寫等附加功能。

此外,API 現在支持流式傳輸,以實時會話響應——這意味著像 GPT-4 Turbo 或 GPT-3.5 Turbo 這樣的 AI 模型將盡可能快地返回輸出,而不是等待完整響應的生成。

它進一步集成了新的“vector_store”對象以更好地管理文件,并提供更細粒度的令牌使用控制,以幫助有效管理成本。

3.新功能“項目”,可控制人員對特定任務的訪問

一個名為“Projects”的新功能提供了改進的行政監督,允許組織在項目級別中管理角色和 API 密鑰。

此功能允許企業客戶限定權限、控制可用模型,并設置基于使用的限額以避免意外成本——這些增強功能承諾顯著簡化項目管理。

本質上,他們可以將一個微調版本的 AI 模型甚至一個普通的模型隔離到特定的任務或文檔集,并允許特定的人員在每個任務上工作。

因此,如果你的企業有一個團隊正在處理一組面向公眾的文檔,另一個團隊正在處理一組機密或內部文檔,你可以在 OpenAI 的 API 內為每個分配一個單獨的項目,兩者可以使用 AI 模型分別工作,而不會混合或危及后者。

“隨著越來越多的組織甚至單獨的開發者部署 AI,他們希望在受限的盒子里做事,”OpenAI 的產品團隊成員 Miqdad Jaffer 在昨天與 外媒 VentureBeat 進行的相同視頻電話采訪中說。“‘項目’讓你做的是將你的資源、你的成員隔離到一個小型的個性化項目中。你得到了單獨的使用報告。你有能力控制訪問、安全、延遲、吞吐量和成本,一個組織確實可以以非常安全的方式構建。如果你是一個單獨的開發者,你可以毫無顧慮地部署數百個項目。” ? ?

最后一點對于同時咨詢或處理多個客戶的開發團隊特別有幫助。

4.還有一些新的升級

為了進一步幫助組織以經濟方式擴展其 AI 運營,OpenAI 引入了新的成本管理功能。

這些包括為每分鐘保持一致水平的令牌使用量的客戶提供折扣率,并通過新的 Batch API 為異步工作負載提供成本降低 50%,該 API 還具有更高的速率限制,并承諾在 24 小時內提供結果。

然而,要使用它,客戶必須在單個請求中一起發送他們的令牌批次——他們想要 AI 模型分析的輸入,無論是提示還是文件——并愿意等待最多 24 小時以從 OpenAI 的 AI 模型接收響應。

雖然這看起來像是很長時間,但 OpenAI 的高管告訴 VentureBeat,返回可以快至 10-20 分鐘。

它還旨在為不需要 AI 模型即時響應的客戶和企業設計,比如一個調查記者研究長篇特寫文章,想要發送一堆政府文件讓 OpenAI 的 GPT-4 Turbo 篩選并挑選出選定的細節。

或者,一個企業準備一份報告,查看其過去幾周的財務表現,而不是幾天或幾分鐘內到期。

隨著 OpenAI 繼續增強其產品,專注于企業級安全、行政控制和成本管理,更新表明該公司有興趣為企業直接提供更“即插即用”的體驗,以應對 Llama 3 的升空和像 Mistral 這樣可能需要企業方面進行更多設置的開放模型的崛起。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/16216.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/16216.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/16216.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

指令中常用的7種尋址方式z

指令中的尋址方式就是對指令中的地址字段進行解釋,以獲得操作數的方法或獲得程序轉移地址的方法。常用的尋址方式有: 立即尋址:操作數就包含在指令中。直接尋址:操作數存放在內存單元中,指令中直接給出操作數所在存儲…

C#調用HttpClient.SendAsync報錯:System.Net.Http.HttpRequestException: 發送請求時出錯。

C#調用HttpClient.SendAsync報錯:System.Net.Http.HttpRequestException: 發送請求時出錯。 var response await client.SendAsync(request, HttpCompletionOption.ResponseHeadersRead, cancellationToken);問題出在SSL/TLS,Windows Server 2012不支持…

先進制造aps專題八 基于ai大模型的ai超級應用,ai生管

目前正在研發的面向消費者的ai超級應用有ai文員,ai教師,ai家教,ai護士,ai翻譯 而ai生管無疑是面向制造業的ai超級應用 從商業角度來說,ai生管,必然是aps公司必然要研發的ai超級應用

Grafana 路徑遍歷所有路徑 CVE-2021-43798漏洞預警

簡介? ?Grafana是一個跨平臺、開源的數據可視化網絡應用程序平臺。用戶配置連接的數據源之后,Grafana可以在網絡瀏覽器里顯示數據圖表和警告。 漏洞危害等級 高危 CVE 編號? CVE-2021-43798 FOFA查詢 ?app"Grafana" ?zoomeyes查詢 ?app:"gr…

Vue3解決“找不到模塊“@/components/xxx.vue”或其相應的類型聲明”

文章目錄 前言背景問題描述解決方案總結 前言 在使用 Vue 3 開發項目時,遇到“找不到模塊 ‘/components/xxx.vue’ 或其相應的類型聲明”的錯誤是一個常見問題。這通常與 TypeScript 和模塊解析相關的配置不當有關。本文將詳細介紹如何解決此問題,確保…

2024-6-遙遠的救世主

2024-6-遙遠的救世主 2024-4-18 豆豆 fatux: 2021.5.26 看完電視劇《天道》之后購買本書,斷斷續續一直沒有讀完。 非常好奇,一個什么樣的作者能寫出如此奇書。老丁,一個智者,智者是多么孤獨,因為找不到同…

信息安全等級保護測評: 登陸日志

文章目錄 引言I 登錄日志表結構設計II 日志處理2.1 封裝日志入庫2.2 收集登陸信息2.3 查詢接口引言 等保測評是信息安全等級保護測評的簡稱,是對信息和信息載體按照重要性等級分級別進行檢測、評估的過程。 背景:近期AIS監控平臺(網頁版)等保測評,發現沒有登陸日志,現要…

從用法到源碼再到應用場景:全方位了解CompletableFuture及其線程池

文章目錄 文章導圖什么是CompletableFutureCompletableFuture用法總結API總結 為什么使用CompletableFuture場景總結 CompletableFuture默認線程池解析:ForkJoinPool or ThreadPerTaskExecutor?ForkJoinPool 線程池ThreadPerTaskExecutor線程池Completab…

Qt 界面上字體自適應控件大小 - 隨控件縮放

Qt 界面上字體自適應控件大小 - 隨控件縮放 引言一、設計思路二、進階版大致思路三、參考鏈接 引言 Qt控件自適應字體大小可以用adjustSize()函數,但字體自適應控件大小并沒有現成的函數可調. - 本文實現了按鈕上的字體隨按鈕大小變化而變化 (如上圖所示) - 其他控件…

Spring MVC+mybatis 項目入門:旅游網(三)用戶注冊——控制反轉以及Hibernate Validator數據驗證

個人博客:Spring MVCmybatis 項目入門:旅游網(三)用戶注冊 | iwtss blog 先看這個! 這是18年的文章,回收站里恢復的,現階段看基本是沒有參考意義的,技術老舊脫離時代(2024年辣鐵鐵&…

澳大利亞.德國-門戶媒體投放通稿:需要注意什么地方

概述 在現代社會,新聞媒體的投放成為企業和組織宣傳推廣的重要手段之一。澳大利亞和德國作為全球重要的經濟和科技中心,其新聞媒體也備受關注。本文將介紹澳大利亞和德國的一些主要新聞媒體,并討論發表新聞稿時需要注意的地方。 澳大利亞媒…

streamlit 學習

表情網站 https://getemoji.com/ 官網: https://streamlit.io/ 文檔 https://docs.streamlit.io/develop/api-reference/chat/st.chat_message 安裝: pip install streamlit啟動 以下的python 文件指寫streamlit 程序的腳步。 1、先切換目錄到Pyth…

VMware虛擬機-設置系統網絡IP、快照、克隆

1.設置網絡IP 1.點擊右上角開關按鈕-》有線 已連接-》有線設置 2.手動修改ip 3.重啟或者把開關重新關閉開啟 2.快照設置 快照介紹: 通過快照可快速保存虛擬機當前的狀態,后續可以使用虛擬機還原到某個快照的狀態。 1.添加快照(需要先關閉虛擬機) 2.在…

[JAVASE] 類和對象(六) -- 接口(續篇)

目錄 一. Comparable接口 與 compareTo方法 1.1 Comparable接口 1.2 compareTo方法的重寫 1.2.1 根據年齡進行比較 1.2.2 根據姓名進行比較 1.4 compareTo 方法 的使用 1.3 compareTo方法的缺點(重點) 二. Comparator接口 與 compare方法 2.1 Comparator接口 2.2 compare 方法…

藍橋杯算法心得——李白打酒(加強版)

大家好,我是晴天學長,記憶化搜索,找到技巧非常重要,需要的小伙伴可以關注支持一下哦!后續會繼續更新的。💪💪💪 2) .算法思路 1.memo三維表示記錄的結果 3).算法步驟 1…

slint esp32 tokio

源碼:https://github.com/xiaguangbo/slint_esp32_tokio cpu 是 esp32c2,屏幕是 ili9341,觸摸是 xpt2046,使用 spi 半雙工 不使用DMA(esp-rs還沒支持),SPI 40M,240*320全屏刷新為1.5…

python文件IO之pickle 模塊讀寫對象數據

可以向一個文件中寫入字符串,讀取后也是讀取字符串形式,但是不能直接向文件中寫入像列表這樣的對象,需要 pickle 等模塊才行。 pickle 模塊介紹 pickle 模塊使用強大且有效的算法來進行序列化和反序列化。 序列化是指將一個對象轉換為能夠存…

前端面試手冊

前端面試手冊 崗位職責: 1.熟悉公司業務,能獨立高效高質地完成任務,負責功能的開發、測試、上線、維護; 2.負責推動、優化前端基礎架構、組件抽象,提升開發效率; 3.關…

四. TensorRT模型部署優化-模型部署的基礎知識

目錄 前言0. 簡介1. FLOPS2. TOPS3. HPC的排行,CPU/GPU比較4. FLOPs5. FLOPS是如何計算的6. CUDA Core vs Tensor Core總結參考 前言 自動駕駛之心推出的 《CUDA與TensorRT部署實戰課程》,鏈接。記錄下個人學習筆記,僅供自己參考 本次課程我們…

記一次Spark cache table導致的數據問題以及思考

目前在做 Spark 升級(3.1.1升級到3.5.0)的時候,遇到了cache table導致的數據重復問題,這種情況一般來說是很少見的,因為一般很少用cache table語句。 當然該問題已經在Spark3.5.1已經解決了,可以查看對應的 SPARK-46995和SPARK-45592 從以上的…