2024年大型語言模型(LLMs)的發展回顧

2024年對大型語言模型(LLMs)來說是充滿變革的一年。以下是對過去一年中LLMs領域的關鍵進展和主題的總結。
在這里插入圖片描述

GPT-4的壁壘被打破

去年,我們還在討論如何構建超越GPT-4的模型。如今,已有18個組織擁有在Chatbot Arena排行榜上超越原始GPT-4的模型,共計70個模型。其中,Google的Gemini 1.5 Pro和Anthropic的Claude 3系列尤為突出,它們不僅達到了GPT-4的水平,還引入了新功能,如更長的輸入上下文和視頻輸入能力。

LLMs價格大幅下降

得益于競爭和效率提升,運行頂級托管LLMs的成本在過去一年中大幅下降。OpenAI的最貴模型價格從GPT-3時代的100倍降低到現在的1/100。這種價格下降直接關系到運行提示所消耗的能量,對環境影響的擔憂有所減輕。

多模態視覺成為常態,音頻和視頻開始興起

2024年,幾乎所有重要的模型供應商都發布了多模態模型。這些模型能夠處理圖像、音頻和視頻,為用戶提供了新的應用方式。

語音和實時攝像頭模式讓科幻成為現實

語音和實時視頻模式的發展尤為引人注目。GPT-4o和Google的Gemini等模型現在可以接受音頻輸入并輸出非常逼真的語音,而不需要單獨的TTS或STT模型。

提示驅動的應用生成已成為商品

LLMs在2023年已經能夠生成代碼,而2024年它們能夠生成完整的交互式應用程序。Anthropic的Claude Artifacts和GitHub的GitHub Spark等功能允許用戶直接在界面中使用生成的應用程序。

最佳模型的普遍訪問僅持續了幾個月

今年初,GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Pro等最佳模型對大多數人免費開放。然而,隨著OpenAI推出ChatGPT Pro訂閱服務,免費訪問最佳模型的時代可能已經結束。

“代理”仍未真正實現

“代理”一詞缺乏明確且廣泛理解的含義。盡管如此,代理的概念仍然讓人感覺“即將到來”,但基于LLMs的代理在實用性上仍存在挑戰。

評估(Evals)至關重要

為LLM驅動的系統編寫良好的自動化評估是構建有用應用程序的關鍵技能。擁有強大的評估套件可以幫助你更快地采用新模型,更好地迭代,并構建比競爭對手更可靠和有用的產品特性。

Apple Intelligence不佳,但Apple的MLX庫表現出色

Apple的MLX庫為在Mac上運行各種MLX兼容模型提供了極好性能。然而,Apple自己的“Apple Intelligence”功能大多令人失望。

推理擴展“推理”模型的崛起

OpenAI的o1模型是這類模型的代表,它們通過在模型內部花費“推理令牌”來思考問題,然后輸出最終結果。這種模型為擴展模型性能提供了新的方式。

最佳可用LLM是否在中國以不到600萬美元訓練而成?

DeepSeek v3是一個擁有685B參數的大型模型,其訓練成本僅為5,576,000美元,這是一個非常積極的跡象,表明訓練成本可以且應該繼續下降。

環境影響有所改善

模型效率的提高導致運行提示的能量使用和環境影響大幅下降。OpenAI的提示費用比GPT-3時代降低了100倍。

環境影響變得更糟

大型科技公司正在花費數十億美元建設新數據中心,對電網和環境產生實質性影響。這種基礎設施建設是否必要,還是一個未知數。

“slop”成為行業術語

“slop”一詞被用來描述未經請求且未經審查的AI生成內容。這個概念已經成為討論現代AI的簡潔方式。

合成訓練數據效果顯著

盡管有關模型崩潰的討論,但AI實驗室越來越多地在訓練中使用合成內容,以引導模型朝著正確的方向發展。

LLMs變得更加難以使用

LLMs是復雜的工具,需要深入了解和經驗才能充分利用并避免陷阱。隨著系統的增多,用戶需要了解不同系統的工具和限制。

知識分布極不均勻

大多數人可能聽說過ChatGPT,但對其他模型如Claude的了解甚少。這種知識差距對社會發展不利。

LLMs需要更好的批評

LLMs確實值得批評,我們需要討論這些問題,找到緩解方法,并幫助人們學習如何負責任地使用這些工具。

以上是對2024年LLMs發展的總結,這一年在LLMs領域發生了很多變化,從技術進步到環境影響,再到社會接受度,LLMs正以前所未有的速度發展和影響著我們的世界。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/64967.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/64967.shtml
英文地址,請注明出處:http://en.pswp.cn/web/64967.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

數據挖掘——支持向量機分類器

數據挖掘——支持向量機分類器 支持向量機最小間隔面推導基于軟間隔的C-SVM非線性SVM與核變換常用核函數 支持向量機 根據統計學習理論,學習機器的實際風險由經驗風險值和置信范圍值兩部分組成。而基于經驗風險最小化準則的學習方法只強調了訓練樣本的經驗風險最小…

檢索增強生成

概述 檢索增強生成(Retrieval-Augmented Generation,RAG)是一種將信息檢索與語言模型相結合的技術。由Facebook AI Research于2020年提出,它把數據庫的優勢與語言模型的優勢相結合。它能讓模型從外部知識庫中檢索信息&#xff0c…

在 SQL 中,區分 聚合列 和 非聚合列(nonaggregated column)

文章目錄 1. 什么是聚合列?2. 什么是非聚合列?3. 在 GROUP BY 查詢中的非聚合列問題示例解決方案 4. 為什么 only_full_group_by 要求非聚合列出現在 GROUP BY 中?5. 如何判斷一個列是聚合列還是非聚合列?6. 總結 在 SQL 中&#…

ETL處理工具Kettle入門

1. Kettle簡介 Kettle(現已更名為Pentaho Data Integration,簡稱PDI)是一個開源的ETL工具,能夠進行數據的抽取(Extract)、轉換(Transform)和加載(Load)。它是…

petalinux2017.4對linux4.9.0打實時補丁

準備工作: 1.windows:安裝vivado 2017.4,xilinx sdk 2017.4 2.ubuntu16.04:安裝petalinux 2017 3.黑金ax7020,sd卡 一、準備linux內核的操作系統 1.1 Petalinux配置 Petalinux使用教程-CSDN博客非常詳細&#xf…

Maven 教程之 pom.xml 詳解

Maven 教程之 pom.xml 詳解 pom.xml 簡介 什么是 pom POM 是 Project Object Model 的縮寫,即項目對象模型。 pom.xml 就是 maven 的配置文件,用以描述項目的各種信息。 pom 配置一覽 <project xmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi

Golang的緩存一致性策略

Golang的緩存一致性策略 一致性哈希算法 在Golang中&#xff0c;緩存一致性策略通常使用一致性哈希算法來實現。一致性哈希算法能夠有效地解決緩存節點的動態擴容、縮容時數據重新分布的問題&#xff0c;同時能夠保證數據訪問的均衡性。 一致性哈希算法的核心思想是將節點的哈希…

【機器學習:一、機器學習簡介】

機器學習是當前人工智能領域的重要分支&#xff0c;其目標是通過算法從數據中提取模式和知識&#xff0c;并進行預測或決策。以下從 機器學習概述、有監督學習 和 無監督學習 三個方面進行介紹。 機器學習概述 機器學習定義 機器學習&#xff08;Machine Learning&#xff0…

藍橋杯JAVA--003

需求 2.代碼 public class RegularExpressionMatching {public boolean isMatch(String s, String p) {if (p.isEmpty()) {return s.isEmpty();}boolean firstMatch !s.isEmpty() && (s.charAt(0) p.charAt(0) || p.charAt(0) .);if (p.length() > 2 && p…

被催更了,2025元旦源碼繼續免費送

“時間從來不會停下&#xff0c;它只會匆匆流逝。抓住每一刻&#xff0c;我們才不會辜負自己。” 聯系作者免費領&#x1f496;源&#x1f496;碼。 三聯支持&#xff1a;點贊&#x1f44d;收藏??留言&#x1f4dd;歡迎留言討論 更多內容敬請期待。如有需要源碼可以聯系作者免…

WebRTC的線程事件處理

1. 不同平臺下處理事件的API&#xff1a; Linux系統下&#xff0c;處理事件的API是epoll或者select&#xff1b;Windows系統下&#xff0c;處理事件的API是WSAEventSelect&#xff0c;完全端口&#xff1b;Mac系統下&#xff0c;kqueue 2. WebRTC下的事件處理類&#xff1a; …

關于Zotero

1、文獻數據庫&#xff1a; Zotero的安裝 Zotero安裝使用_zotero只能安裝在c盤嗎-CSDN博客 2、如何使用zotero插件 我剛下載的時候就結合使用的是下面的這兩個博主的分享&#xff0c;感覺暫時是足夠的。 Zotero入&#x1f6aa;基礎 - 小紅書 Green Frog申請easyscholar密鑰…

企業三要素如何用PHP實現調用

一、什么是企業三要素&#xff1f; 企業三要素即傳入的企業名稱、法人名稱、社會統一信用代碼或注冊號&#xff0c;校驗此三項是否一致。 二、具體怎么樣通過PHP實現接口調用&#xff1f; 下面我們以阿里云為例&#xff0c;通過PHP示例代碼進行調用&#xff0c;參考如下&…

Go 語言中強大的配置管理庫—Viper

Viper 是 Go 語言中強大的配置管理庫&#xff0c;廣泛用于云原生和微服務開發中。它支持多種配置文件格式&#xff08;如 YAML、JSON、TOML 等&#xff09;、環境變量、命令行參數以及遠程配置管理。 Viper 的主要功能 1. 支持多種格式的配置文件&#xff1a; ? YAML、JSON…

鴻蒙-封裝loading動畫

import { AnimatorOptions, AnimatorResult } from "kit.ArkUI" export enum SpinImageType { RedLoading, WhiteLoading } Component export struct SpinImage { Prop type?: SpinImageType Prop url?: string State animatedValue: number 0 …

今日復盤103周五(189)

1、早上&#xff0c;看了一下二手書里的十種主要游戲類型的相關內容。 其實收獲不大&#xff0c;主要是引發思考。 2、白天&#xff0c;持續多日的模式1的白模原型關卡結束&#xff0c;開始轉做準正式資源的關卡&#xff0c; 但進度低于預期。 并不是改改參數那么簡單輕松&a…

OJ隨機鏈表的復制題目分析

題目內容&#xff1a; 138. 隨機鏈表的復制 - 力扣&#xff08;LeetCode&#xff09; 分析&#xff1a; 這道題目&#xff0c;第一眼感覺非常亂&#xff0c;這是正常的&#xff0c;但是我們經過仔細分析示例明白后&#xff0c;其實也并不是那么難。現在讓我們一起來分析分析…

uc/os-II 原理及應用(一) 嵌入式實時系統基本概念

基于嵌入式實時操作系統μCOS-II原理及應用(第2版)-任哲 自行網上尋找資源。 計算機系統的中分為計算機硬件系統與計算機軟件系統&#xff0c;計算機軟件系統由上到下分為&#xff0c;應用軟件&#xff0c;系統軟件&#xff0c;操作系統;操作系統一般在計算機軟件的最低層&…

C++ 并發專題 - std::promise 和 std::future 介紹

一&#xff1a;概述 std::promise 和 std::future 是C標準庫的兩種工具&#xff0c;主要用于實現線程之間的異步通信。它們屬于C并發庫的一部分&#xff0c;提供了一種安全&#xff0c;優雅的方式來在線程之間傳遞結果或狀態。 二&#xff1a;std::promise 介紹 std::promise …

【Multisim用74ls92和90做六十進制】2022-6-12

緣由Multisim如何用74ls92和90做六十進制-其他-CSDN問答 74LS92、74LS90參考