各大AI模型訓練成本大比拼

像OpenAI的ChatGPT、谷歌的Gemini Ultra這樣的高級AI模型,訓練它們通常需要數百萬美元的費用,且該成本還在迅速上升。隨著計算需求的增加,訓練它們所需的計算能力的費用也在飆升。為此,AI公司正在重新考慮如何訓練這些生成式AI系統。在許多情況下,這些策略包括在當前的增長軌跡下降低計算成本。

在這里插入圖片描述

訓練成本是如何確定的?

斯坦福大學與研究公司Epoch AI合作,根據云計算租金估算了AI模型的訓練成本。雙方所分析的關鍵因素包括模型的訓練時長、硬件的利用率和訓練硬件的價值。

盡管許多人猜測,訓練AI模型的成本變得越來越高,但缺乏全面的數據來支持這些說法。而斯坦福大學發布的《2024年AI指數報告》正是支持這些說法的罕見來源之一。

不斷膨脹的訓練成本

下表展示了自2017年以來,經通脹調整后的主要AI模型的培訓成本:

在這里插入圖片描述
去年,OpenAI的GPT-4培訓成本估計為7840萬美元,遠高于谷歌PaLM (540B) 的訓練成本。谷歌PaLM較GPT-4僅早一年推出,但訓練成本為1240萬美元。

相比之下,2017年開發的早期AI模型Transformer的訓練成本為930美元。該模型在塑造當前所使用的許多大型語言模型的體系結構方面起著基礎性作用。

谷歌的AI模型Gemini Ultra的訓練成更高,達到了驚人的1.91億美元。截至2024年初,該模型在幾個指標上都超過了GPT-4,最引人注目的是在“大規模多任務語言理解”(MMLU)基準測試中勝出。這一基準是衡量大型語言模型能力的重要標尺。例如,它以評估57個學科領域的知識和解決問題的熟練程度而聞名。

訓練未來的AI模型

鑒于這些挑戰,AI公司正在尋找新的解決方案來訓練語言模型,以應對不斷上漲的成本。

其中的方法有多種,比如創建用于執行特定任務的較小模型,而其他一些公司正在試驗創建自家的合成數據來“投喂”AI系統。但到目前為止,這方面還沒有取得明確的突破。

例如,使用合成數據的AI模型有時會“胡言亂語”,引發所謂的“模型崩潰”。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/23018.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/23018.shtml
英文地址,請注明出處:http://en.pswp.cn/web/23018.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

描述Servlet監聽器的類型和用途

Servlet監聽器是Servlet規范中定義的一種特殊的類,用于監聽Web應用程序中特定事件的發生。它們按照監聽的對象和事件類型,可以劃分為多種類型,每種類型都有其特定的用途。 監聽器的類型 按照監聽對象劃分 應用程序環境對象(Serv…

華為OD刷題C卷 - 每日刷題 12(數組連續和,求最多可以派出多少支團隊)

1、(數組連續和): 這段代碼是解決“數組連續和”的問題。它提供了一個Java類Main,其中包含main方法和getResult方法,用于計算給定數組中有多少個連續區間的和大于等于給定值x。 main方法首先讀取數組的長度n和閾值x&…

【Javascript修煉篇】如何對JSON格式進行轉換

這將是我們幾乎日常都會用到的一個超實用函數。 根據數據的多樣性與結構,API 的響應可能會返回極其復雜的 JSON 對象。有時候,僅僅從整個 JSON 中抓取一個字段可能就不太夠用了。我們可能需要提取多個字段來展示在網頁上。每次手動遍歷這樣的復雜 JSON …

兩站圖片滑動對比效果實現(VUE3)

像這種圖片滑動對比的效果,網上還不少見吧,但是網上卻不好找到完整現成的實現代碼,我找到幾個地方有類似的代碼,但是都不好直接移植到代碼里,因為很多都是使用原生htmlcssjs實現,太復雜了。反而不好應用到v…

Qt for Android 之 OpenCV編譯(Windows下編譯)

簡介 前兩天剛好更新了4.10, 這里以4.10作為示例進行編譯, Qt版本是Qt6.6.2。 準備OpenCV的Android庫 一. 使用官方編譯好的庫 1. 下載OpenCV android SDK opencv-4.10.0-android-sdk.zip 2. 解壓縮 官方提供的包含了多個架構的opencv android庫 二. 自行編譯…

十三、【源碼】ResultMap解析

源碼地址:https://github.com/mybatis/mybatis-3/ 倉庫地址:https://gitcode.net/qq_42665745/mybatis/-/tree/13-resultMap ResultMap解析 分為兩部分:解析和使用 1.解析 解析XML的時候單獨解析所有的resultMap標簽,封裝成Re…

MySQL 核心模塊揭秘 | 19 期 | 鎖模塊里有什么?什么樣?

InnoDB 中管理表鎖和行鎖的鎖模塊,也就是傳說中的鎖子系統,在內存里是什么樣的? 作者:操盛春,愛可生技術專家,公眾號『一樹一溪』作者,專注于研究 MySQL 和 OceanBase 源碼。 愛可生開源社區出品…

LabVIEW開發EOL功能測試系統

LabVIEW開發EOL功能測試系統 介紹了一種基于LabVIEW開發的EOL功能測試系統方案,涵蓋軟件架構、工作流程、模塊化設計、低耦合性、易于修改與維護、穩定性及硬件選型。系統通過高效的CAN通信實現對電機控制器的全面測試,確保運行可靠并支持未來的升級需求…

危機公關之負面信息優化技巧解析

當今時代,網絡發布信息沒有任何門檻,任何人可以通過互聯網發布信息,這使負面信息產生的可能性大大提高,企業形成危機的可能性也大大提高。針對網絡上的負面信息處理得當可能并不會對品牌造成傷害,處理不當就很可能給企…

QT之可拖動布局研究

1. 背景 最開始只用到了最基本的水平布局 、垂直布局。它的好處就是窗口整體縮放后,控件也自動等比例縮放。 但是比如水平布局之中的控件寬度比例、垂直布局之中的控件高度比例都是固定的。 平時也不怎么開發界面,最近有個需求,想界面上的…

Atlassian企業日技術分享:AI在ITSM中的創新實踐與應用、Jira服務管理平臺AI功能介紹

2024年5月17日,Atlassian中國合作伙伴企業日活動在上海成功舉辦。活動以“AI協同 創未來——如何利用人工智能提升團隊協作,加速產品交付”為主題,深入探討了AI技術在團隊協作與產品交付中的創新應用與實踐,吸引了眾多業內專家、企…

ros1中的server服務的創建與使用函數指針類型別名請求處理函數

ros1中的server服務的創建與使用函數指針類型別名請求處理函數 法一: #include "ros/ros.h" //自定義消息 #include "trilateration/trilateration_srvs.h"void handleDeletePosint(const trilateration::trilateration_srvs::Request& req, trilate…

深圳比創達電子EMC|EMC與EMI一站式解決方案:攻克電磁兼容難題

在當今這個科技日新月異、電子產品層出不窮的時代,電磁兼容(EMC)與電磁干擾(EMI)問題愈發凸顯其重要性。為了確保電子設備的正常運行,減少電磁干擾對環境和人體的影響,EMC與EMI一站式解決方案成…

【回眸】Linux內核(十)system()函數與popen()函數

前言 system()函數的作用是執行一個shell腳本或者shell指令 popen與system()函數類似,不同點是popen()函數可以獲取運行的shell腳本或者命令的輸出結果 system() 函數參數 #include <stdlib.h> int system(const char *comand) 參考示例代碼: #include <stdio.…

2023年全國消費品“增品種、提品質、創品牌”三品戰略發展成果報告

來源&#xff1a;賽迪&歐特歐 近期歷史回顧&#xff1a; 2023工業無線電磁環境白皮書——有色金屬制造行業.pdf 2024出海企業人才發展實踐指南.pdf 2024年全球電子商務市場.pdf 寶鋼低碳鋼鐵技術策劃及開發-鐘勇.pdf 2023-2024年度中國智能制造產業發展報告.pdf 2024精準醫…

【AI大模型】Function Calling

目錄 什么是Function Calling 示例 1&#xff1a;調用本地函數 Function Calling 的注意事項 支持 Function Calling 的國產大模型 百度文心大模型 MiniMax ChatGLM3-6B 訊飛星火 3.0 通義千問 幾條經驗總結 什么是Function Calling Function Calling 是一種函數調用機…

【C++ | 構造函數】類的構造函數詳解

&#x1f601;博客主頁&#x1f601;&#xff1a;&#x1f680;https://blog.csdn.net/wkd_007&#x1f680; &#x1f911;博客內容&#x1f911;&#xff1a;&#x1f36d;嵌入式開發、Linux、C語言、C、數據結構、音視頻&#x1f36d; ?發布時間?&#xff1a;2024-06-06 0…

HCIA-RS基礎-VLAN配置

目錄 前言創建拓撲創建VLAN查看創建的VLAN配置trunk口并放行VLAN配置access接口查看所有vlan基本信息測試網絡連通性命令合集 前言 VLAN定義&#xff1a;VLAN是一種將局域網內的設備從邏輯上劃分成一個個網段&#xff0c;從而實現虛擬工作組的新興數據交換技術。VLAN優點&…

設計模式-單例模式(創建型)

創建型-單例模式 了解單例 單例模式是一種創建型設計模式&#xff0c;它提供了一種創建對象的最佳方式;它必須保證&#xff1a; 單例類只能有一個實例化對象&#xff1b;單例類必須創建自己的唯一實例&#xff1b;單例類必須給其他對象提供實例&#xff1b; 另外&#xff1a;…

【面試筆記】嵌入式軟件工程師,汽車電子軟件相關

文章目錄 1. C語言基礎1.1 const1.2 static1.3 回調函數的用法1.4 宏定義1.5 編譯、鏈接過程1.6 堆與棧的區別&#xff1f;1.7 簡單的字符串算法題&#xff0c;C語言實現1.7.1 給定一個字符串&#xff0c;按順序篩選出不重復的字符組成字符串&#xff0c;輸出該字符串1.7.2 給定…