從模型到復合AI系統的轉變

在這里插入圖片描述

2023年,大型語言模型(LLM)吸引了所有人的注意力,它可以通過提示來執行通用任務,例如翻譯或編碼。這自然導致人們將模型作為AI應用開發的主要成分而密切關注,所有人都在想新的LLM將帶來什么能力。然而,隨著越來越多的開發者開始使用LLM構建,我們認為這種關注正在迅速改變:最先進的AI結果越來越多地來自具有多個組件的復合系統,而不僅僅是單一的模型。

例如,谷歌的AlphaCode 2通過精心設計的系統設置了編程的最新狀態,該系統使用LLM為一個任務生成多達100萬個可能的解決方案,然后過濾和評分。同樣,AlphaGeometry將LLM與傳統的符號求解器相結合,以解決奧林匹克問題。在企業中,我們在Databricks的同事發現,60%的LLM應用使用某種形式的檢索增強生成(RAG),30%使用多步鏈。即使研究傳統語言模型任務的研究人員,以前只報告單個LLM調用的結果,現在也開始報告越來越復雜的推理策略的結果:微軟寫了一種鏈接策略,在醫學考試中超過GPT-4的準確率9%,谷歌發布Gemini時使用新的CoT@32推理策略在MMLU基準測試中調用模型32次,這引發了與單次調用GPT-4進行比較的問題。向復合系統的轉變開啟了許多有趣的設計問題,但這也令人興奮,因為這意味著領先的AI結果可以通過巧妙的工程實現,而不僅僅是訓練規模的擴大。
在這篇文章中,我們分析了復合AI系統的趨勢及其對AI開發者的意義。為什么開發人員要構建復合系統?隨著模型的改進,這個范式是否會持續下去?又有哪些新興的工具可以開發和優化這樣的系統——這是一個比模型訓練研究要少得多的領域?我們認為,復合AI系統在未來可能是最大化AI結果的最佳方式,并且可能是2024年AI中最重要的趨勢之一。

查看原文:《從模型到復合AI系統的轉變》

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/712754.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/712754.shtml
英文地址,請注明出處:http://en.pswp.cn/news/712754.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

阿里云OSS掛到到ECS作為一個linux目錄(OSSFS掛載)

配置OSS賬號信息并掛載OSS Bucket。以下是該文檔的示例: OSSFS 配置與掛載指南 步驟 1:安裝必要的依賴包 首先,確保您的系統已經安裝了wget和fuse。這些工具是下載OSSFS安裝包和掛載文件系統所必需的。 bash復制代碼 # 檢查并安裝 wget if…

數據服務安全的重要性

數據服務安全在當今信息化社會顯得尤為重要。隨著大數據、云計算、人工智能等技術的飛速發展,數據已經成為企業和組織的核心資產,數據服務安全也面臨著前所未有的挑戰。本文將從數據服務安全的重要性、常見威脅、防護策略以及未來發展趨勢等方面進行探討…

selenuim【1】($x(‘xpath語法’)、WebDriverWait())

文章目錄 初學selenuim記錄1、執行driver webdriver.Chrome()后很久才打開瀏覽器2、瀏覽器多元素定位 $x(‘xpath語法’)3、打開瀏覽器driver.get("網址")執行了很久才開始定位元素:等待(1)driver.set_page_load_timeout(t)&#…

事務及SpringBoot中的事務開啟

目錄 1.什么是事務? 2.事務的四大特性? 3.SpringBoot中怎樣開啟事務 1.開啟事務支持 2.在需要開啟事務的方法或類上使用Transactional 3.通過配置類來開啟全局事務 1.什么是事務? 事務是指在數據庫管理系統中執行的一系列操作的邏輯單元。事…

基于SpringBoot+vue+elementui在線教育系統詳細設計實現

前言 ??博主介紹:?專注于Java、小程序技術領域和畢業項目實戰??? ???? 精彩專欄 推薦訂閱???? 2024年Java精品實戰案例《100套》 ??文末獲取源碼聯系?? ??文末獲取源碼+數據庫?? 感興趣的可以先收藏起來,還有大家在畢設選題,項目以及論文編寫等相…

外包干了7個月,技術退步明顯.......

先說一下自己的情況,大專生,18年通過校招進入北京某軟件公司,干了接近4年的功能測試,今年年初,感覺自己不能夠在這樣下去了,長時間呆在一個舒適的環境會讓一個人墮落! 而我已經在一個企業干了四年的功能測…

智慧旅游+數字化景區整體解決方案:文件全文83頁,附下載

關鍵詞:智慧景區建設,智慧旅游一體化平臺,數字化景區建設,智慧旅游建設,智慧景區解決方案,智慧文旅解決方案,智慧旅游解決方案 一、景區智慧旅游建設需求與背景分析 1、技術發展背景 隨著信息…

Unity | Shader基礎知識(第十集:shader常用外部資產單詞速成)

目錄 一、外部資產簡介 二、常用的外部資產單詞 三、常用的外部資產單詞和引入內部 四、圖片資產外部調整的具體講解 1.Tiling,中文:鋪地磚 2.Offset,中文:偏移 五、作者的話 一、外部資產簡介 在第六集中,我們…

RabbitMQ的常見工作模式

Work queues 工作隊列模式 模式說明 通過Helloworld工程我們已經能夠構建一個簡單的消息隊列的基本項目,項目中存在幾個角色:生產 者、消費者、隊列,而對于我們真實的開發中 ,對于消息的消費者通過是有多個的。 比如在實現用戶注冊功能時&…

【OpenCV】繪制桌面鎖屏時鐘

OpenCV 是一個開源的計算機視覺(Computer Vision)與機器學習軟件庫,提供了多種圖像處理算法與接口,用于解決計算機視覺相關問題。OpenCV 支持多平臺與多語言,本文主要記錄如何使用 OpenCV-Python 繪制桌面鎖屏時鐘。 目…

一、環境配置

一、下載Ubuntu18.04版本鏡像 我的電腦配置比較低(08年奧運限定版哦),使用的是虛擬機VMware進行安裝Ubuntu18.04版,跟書上使用的一樣 Ubuntu 18.04鏡像 別下載錯了哈 二、VMware下安裝Ubuntu18.04操作系統 之前寫過相關的博文,詳細配置可…

軟件測試——性能測試

目錄 一、性能測試簡介 二、性能測試指標 三、性能測試的流程 四、Jmeter簡介 五、Jmeter常見測試框架 六、Jmeter錄制腳本 七、腳本增強 八、Jmeter腳本參數化 九、斷言 十、關聯 十一、JDBC請求 十二、分布式測試 十三、性能測試報告 一、性能測試簡介…

API接口技術開發拼多多接口鏈接采集實時銷量、SKU信息、券后價格、優惠券信息API接入步驟及演示示例

要實現拼多多接口鏈接采集實時銷量、SKU信息、券后價格、優惠券信息API接入步驟及演示示例,首先需要了解拼多多開放平臺的相關API接口。以下是一個簡單的Java示例,使用requests庫調用拼多多開放平臺的API接口: 注冊并登錄開放平臺&#xff0c…

【LeetCode】一周中的第幾天+ 一年中的第幾天

2023-12-30 文章目錄 一周中的第幾天方法一:模擬思路步驟 方法二:調用庫函數方法三:調用庫函數 [1154. 一年中的第幾天](https://leetcode.cn/problems/day-of-the-year/)方法一:直接計算思路: 方法二:調用…

react Hook useEffect的基本使用及注解

一、概述 useEffect是React提供的一個Hook,用于在函數組件中執行副作用操作。副作用操作通常包括數據獲取、訂閱事件、手動操作DOM等。useEffect可以讓我們在函數組件中模擬類組件的生命周期方法(如componentDidMount、componentDidUpdate、componentWi…

vue3+ts實現圖片預覽功能

首先&#xff0c;需要創建一個Vue組件&#xff0c;用于顯示圖片和預覽圖。 <template><div><img :src"imageSrc" mouseover"showPreview" mouseout"hidePreview" /><div v-if"previewVisible" class"previ…

【計算機考研】學碩還是專碩?

這里面沒有什么更好的選擇&#xff0c;大家都知道專碩錄取人數多&#xff0c;學碩錄取人數上&#xff0c;博弈一直存在 單就考研的難度上來說&#xff0c;專碩的難度確實要比學說低很多的&#xff0c;同樣的專業課的情況下&#xff0c;專碩的考研數學考的是數學二和英語二&…

rk3568 gamc0 控制器寄存器配置不了導致連接不上phy

系統啟動 GMAC 的驅動開機 log 上出現打印&#xff1a;No PHY found 或者 Cannot attach to PHY。查閱rk 官方gmac 配置指導手冊出現改問題的原因可能如下&#xff1a; 但反復檢查硬件和軟件發現都沒問題。看內核啟動日志發現gamc0 在啟動過程中讀取gmac0 的版本id是讀取不到&a…

P2440 木材加工

題目背景 要保護環境 題目描述 木材廠有 &#xfffd;n 根原木&#xff0c;現在想把這些木頭切割成 &#xfffd;k 段長度均為 &#xfffd;l 的小段木頭&#xff08;木頭有可能有剩余&#xff09;。 當然&#xff0c;我們希望得到的小段木頭越長越好&#xff0c;請求出 &a…

表格自定義音頻播放組件

1.在使用的地方調用 <Audiosvue ref"audio" class"audio-box" :audioFile"item.cont"></Audiosvue> 2.引入組件 import Audiosvue from "/components/audio"; 3.組件 <template><div><div style"d…