一張圖看懂大模型性價比:能力、價格、并發量全面PK

圖片

最近,國內云廠商的大模型掀起一場降價風暴。火山引擎、阿里云、百度云等紛紛宣布降價,部分模型價格降幅據稱高達99%,甚至還有些模型直接免費。

五花八門的降價話術,一眼望去遍地黃金。但事實真的如此嗎?今天我們就撥開迷霧,深挖下大模型降價背后那些事。

1

選大模型

要最強版還是輕量級?

企業選用大模型,首先要明確模型的使用需求:

如果需要語言理解、生成、邏輯等綜合能力強,能解決復雜業務場景問題的大模型,那么必須使用各大頭部廠商的最強模型,包括豆包Pro系列、通義千問Qwen-Max系列和文心ERNIE 4.0。這些模型均已超越GPT3.5,但距離GPT-4略有差距。

如果對模型能力要求不高,比如簡單的對話問答,但是需要響應速度快、便宜的大模型,那么可以使用各家大模型的輕量化版本。包括豆包Lite系列、通義千問Qwen-Long/Plus/Turbo系列、文心ERNIE-3.5/Speed/Lite系列。

選模型就像選車一樣,高端商務和家用買菜,肯定不是一個價。入門級的車就算給你倒貼錢,你敢開去跑極限越野嗎?所以還是要關注模型能力,不能光看最低價。

2

比價格,還要比并發

選好適配業務的模型之后,就要算算使用成本了。

各家大模型公布的x元/千tokens,都是指“后付費”的刊例價。也就是按照實際使用的tokens算賬。

乍看很簡單——誰的單價低,誰就更便宜唄。但真要用起來,這里面門道就多了。

和“后付費”價格綁定在一起的,有兩個關鍵指標,一個叫TPM(每分鐘token數),一個叫RPM(每分鐘請求數)。

TPM,代表著一家企業客戶在單位時間內能夠使用的token限額;RPM,代表著一家企業客戶在單位時間內最多能用多少次大模型。兩個指標中有一個達到限額,模型就拒絕提供服務了。

打個比方:大模型API調用就像一個大水池,TPM是限定了每分鐘可以打一杯水還是一桶水,RPM是限定了同時可以來10個人還是來100個人打水。無論水價多便宜,哪怕是免費的,如果一分鐘只能接一杯水,那也沒太大用處。

3

大模型降價“御三家”最詳細對比

搞清楚大模型價格那些事兒,接下來看看這波降價潮里最風口浪尖的三家云廠商:首先掀桌的火山引擎和豆包大模型,火上澆油的阿里云和通義千問大模型,摔杯免費的百度智能云和文心大模型。

在這里插入圖片描述

以上數據均來自于各廠商官網及產品控制臺,數據采集時間為5月22日。如有變動,以廠商最新公告為準。

為了更直觀地表現以上大模型的綜合性價比,我們按照模型能力分級,計算一元錢能購買的tokens數量,以及不同模型支持的并發能力,分別做成圖表。

圖片

備注:在典型流量場景中,推理輸入遠大于推理輸出,一般為5比1到10比1之間。在長文本對話的PDF總結摘要等場景,輸出相比輸入更是可以忽略。因此本文以推理輸入價格為準,計算一元錢能買到的tokens數量。

4

簡單總結

百度最強模型的價格不變,但輕量模型把“厘時代”直接打到免費。不過需要注意的是,根據文心一言官網介紹,ERNIE Speed模型適用于精調,而精調還是要收費的。

阿里云的模型全線降價,最強模型降幅低,輕量模型降幅高。所有價格應該都是經過了精密的測算,不會是隨意拍的數。從價格來看還是頗有誠意,但初始支持的TPM/RPM稍顯不足,企業在實際使用中需要對相關權益做好溝通。

字節,火山引擎。當我們說起價格那些事兒,不由想起《明朝那些事兒》的經典臺詞:要么不做,要么做絕。豆包大模型悶聲發育一年,無論是最強模型還是輕量模型,TPM還是RPM,用九個字可以形容:不留空檔,競爭力拉滿。

?

如何學習AI大模型?

現在社會上大模型越來越普及了,已經有很多人都想往這里面扎,但是卻找不到適合的方法去學習。

作為一名資深碼農,初入大模型時也吃了很多虧,踩了無數坑。現在我想把我的經驗和知識分享給你們,幫助你們學習AI大模型,能夠解決你們學習中的困難。

我已將重要的AI大模型資料包括市面上AI大模型各大白皮書、AGI大模型系統學習路線、AI大模型視頻教程、實戰學習,等錄播視頻免費分享出來,需要的小伙伴可以掃取。

在這里插入圖片描述

一、AGI大模型系統學習路線

很多人學習大模型的時候沒有方向,東學一點西學一點,像只無頭蒼蠅亂撞,我下面分享的這個學習路線希望能夠幫助到你們學習AI大模型。

在這里插入圖片描述

二、AI大模型視頻教程

在這里插入圖片描述

三、AI大模型各大學習書籍

在這里插入圖片描述

四、AI大模型各大場景實戰案例

在這里插入圖片描述

五、結束語

學習AI大模型是當前科技發展的趨勢,它不僅能夠為我們提供更多的機會和挑戰,還能夠讓我們更好地理解和應用人工智能技術。通過學習AI大模型,我們可以深入了解深度學習、神經網絡等核心概念,并將其應用于自然語言處理、計算機視覺、語音識別等領域。同時,掌握AI大模型還能夠為我們的職業發展增添競爭力,成為未來技術領域的領導者。

再者,學習AI大模型也能為我們自己創造更多的價值,提供更多的崗位以及副業創收,讓自己的生活更上一層樓。

因此,學習AI大模型是一項有前景且值得投入的時間和精力的重要選擇。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/14274.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/14274.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/14274.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

統計信號處理基礎 習題解答10-2

題目 兩個隨機變量x和y,如果聯合PDF分解為: 那么稱他們為條件獨立的。在上式中z是條件隨機變量。 我們觀察 其中, , 是相互獨立的。證明和是條件獨立的。給出條件變量是A。和是無條件獨立么?也就是 成立么?為了回答這個問題&…

如何使用jmap工具生成堆內存快照

1、確保已安裝JDK: 首先,確保你的系統上安裝了Java Development Kit (JDK)。 2、找到Java進程的PID: 你需要知道你想要生成堆內存快照的Java進程的進程ID(PID)。你可以使用命令行工具如ps(在Unix/Linux系…

Redis Cluster 集群搭建

1. 安裝 Redis sudo apt-get update sudo apt-get install redis-server2. 創建配置文件 為每個 Redis 實例創建獨立的配置文件和數據目錄: mkdir -p /usr/local/redis-cluster/{7000,7001,7002,7003,7004,7005}3. 配置文件內容 每個 Redis 實例的配置文件內容如…

秋招突擊——算法打卡——5/24——兩數之和

題目描述 實現代碼 ListNode* addTwoNumbers(ListNode* l1, ListNode* l2) {int addNumber 0;// 表示進位ListNode* res ListNode();ListNode* curNode res;while(l1 && l2){curNode.value (l1.value l2.value addNumber) % 10 addNumber (l1.value l2.value…

python3序列化模塊之pickle

官方文檔 簡介 pickle 是 Python 中用于對象序列化和反序列化的標準庫模塊。它可以將 Python 對象轉換為字節流,并將其保存到文件或通過網絡傳輸,在需要時再將其恢復為原來的 Python 對象。 模塊 pickle 實現了對一個 Python 對象結構的二進制序列化和反序列化。 “pickling…

如何快速增加外鏈?

要快速增加外鏈并不難,相信各位都知道,難的是快速增加外鏈且沒有風險,所以這時候GNB外鏈的重要性就出現了,這是一種自然的外鏈,何謂自然的外鏈,在谷歌的體系當中,自然外鏈指的就是其他網站資源給…

mysql 、oss 結合使用

以下是一個使用 Express、MySQL、OSS 和 axios 的 Node.js 示例。這個示例創建了一個 Express 服務器,該服務器有一個路由用于處理視頻上傳的請求。視頻文件首先被上傳到 OSS,然后視頻的 OSS URL 被存儲到 MySQL 數據庫。 首先,我們需要安裝必…

最大負載1kg!高度模塊化設計!大象機器人智能遙控操作機械臂組合myArm MC

引入 近年來,市面上涌現了許多類似于斯坦福大學的 Alopha 機器人項目,這些項目主要通過模仿人類的運動軌跡來進行學習,實現了仿人類的人工智能。Alopha 機器人通過先進的算法和傳感技術,能夠精確復制人類的動作,并從中…

【stm32】——使用HAL庫點燈

目錄 一、安裝STM32CubeMX 二、HAL庫點亮LED燈 1.STM32CubeMX創建項目 2.進入Keil編寫代碼 三、采用中斷控制LED燈的亮滅 1.創建項目 2.Keil中編寫代碼 四、Keil波形分析 總結 一、安裝STM32CubeMX 具體操作可以參考下面鏈接: 搭建STM32開發環境——STM32CubeMX&a…

用Python pynput庫捕捉每一次組合鍵的優雅舞步

哈嘍,大家好,我是木頭左! 一、初識pynput:鍵盤與鼠標的監控利器 當談論計算機交互時,鍵盤和鼠標無疑是最常用的設備。無論是編寫代碼、瀏覽網頁還是玩游戲,都依賴于這些輸入設備與機器溝通。但在一些特殊的…

藍橋杯單片機-國賽5——各外設時序記憶方法及手冊重點提取

藍橋杯涉及三個通訊外設,時序很難記憶,因此本文重點在于記錄如何不背時序,直接看手冊 注意:本文參考2024年第15屆比賽手冊講解,沒有英文基礎也沒關系 每一個外設會在第一張時序圖中詳細講解,后續簡寫&…

【DevOps】深入理解 Nginx Location 塊:配置示例與應用場景詳解

目錄 一、location 塊的基本概念 二、location 塊的語法 三、location 塊的匹配方式 四、location 塊的優先級 五、location 塊的應用場景 六、location 塊的嵌套 七、location 塊的指令 八、示例配置 Nginx 是一個高性能的 Web 服務器和反向代理服務器,它廣…

網站工作原理

web發展史 1.0時代不可修改 2.0可修改,比如發微博 有以下問題: 課程2: 靜態頁面 html 動態頁面 php 經過服務端的語言解釋器,解析成html文件,剩下的就和靜態流程一樣 后面三個是web服務器,語言解釋器&…

邊緣人工智能中的視頻目標檢測方法詳解

隨著邊緣計算和人工智能技術的發展,視頻目標檢測在邊緣設備上的應用變得越來越普遍。這些應用包括智能監控、自動駕駛、無人機巡檢等。為了在資源受限的邊緣設備上實現高效的目標檢測,選擇合適的算法和工具至關重要。本文將詳細介紹幾種適用于邊緣設備的…

算法刷題day53:樹形DP

目錄 引言一、沒有上司的舞會二、樹的重心三、樹的最長路徑四、樹的中心五、數字轉換 引言 關于這個樹形 D P DP DP 啊,其實感覺就是對樹進行 D F S DFS DFS 只不過有一個返回值罷了,這個返回值一般代表的就是以該結點為根的子樹的一個屬性&#xff0…

[Spring Boot]baomidou 多數據源

文章目錄 簡述本文涉及代碼已開源 項目配置pom引入baomidouyml增加dynamic配置啟動類增加注解配置結束 業務調用注解DS()TransactionalDSTransactional自定義數據源注解MySQL2 測試調用查詢接口單數據源事務測試多數據源事務如果依然使用Transactional會怎樣?測試正…

dubbo復習: (6)和springboot集成時的條件路由

根據指定的條件,對不滿足條件的請求進行攔截。 比如攔截ip地址為192.168.31.227的請求。只需要在dubbo admin中的條件路由菜單創建相應的規則 enabled: true force: true runtime: true conditions:- host ! 192.168.31.227

vlan綜合實驗

一,實驗拓撲: 二,實驗需求: 1、pc1和pc3所在接口為access;屬于vlan 2;P可以驕問pcepces不的一段;其中pc2可以訪問pc4/pc5/pc6; 2、pc1/pc3與pc2/pc4/pc5/pc6不在同一網段; 3、所有pc通過DHCP獲取Ip地址,且pc1/pc3可以…

Golang框架HTTP客戶端框架zdpgo_resty發送表單請求

核心代碼 這里通過字典傳遞了一個簡單的表單數據。 發送的是POST請求。 resp, err : client.R().SetFormData(map[string]string{"username": "jeeva","password": "mypass",}).Post("http://127.0.0.1:3333/login")fmt.P…