大模型訓練效率提升至2.6倍,騰訊Angel機器學習框架升級

在算力緊缺的背景下,如何提升大模型訓練和推理的效率,并降低成本,成為業界關注的焦點。

11月23日,騰訊披露,騰訊混元大模型背后的自研機器學習框架Angel再次升級,大模型訓練效率提升至主流開源框架的2.6倍,千億級大模型訓練可節省50%算力成本。升級后的Angel支持單任務萬卡級別超大規模訓練,進一步提升騰訊云HCC大模型專屬算力集群的性能和效率。

同時,Angel還提供了從模型研發到應用落地的一站式平臺,支持用戶通過API接口或精調等方式快速調用騰訊混元大模型能力,加速大模型應用構建,騰訊會議、騰訊新聞、騰訊視頻等超過300個騰訊產品及場景均已接入騰訊混元內測。

目前,相關能力已通過騰訊云對外開放。基于升級后的Angel機器學習框架,騰訊云TI平臺可提供更優的訓練和推理加速能力,并支持客戶用自己的數據一站式訓練精調,基于騰訊混元大模型打造專屬智能應用。

自研機器學習框架升級,大模型訓練推理效率再提升

隨著大模型時代到來,模型參數呈指數級增長,達到萬億級別。大模型逐漸從支持單一模態和任務發展為支持多種模態下的多種任務。在這種趨勢下,大模型訓練所需算力巨大,遠超單個芯片的處理速度,而多卡分布式訓練通信損耗巨大。如何提高硬件資源利用率,成為影響國產大模型技術發展和實用性的重要前提。

面向大模型訓練,騰訊自研了機器學習訓練框架AngelPTM,針對預訓練、模型精調和強化學習等全流程進行加速和優化。AngelPTM采用最新的FP8混合精度訓練技術,結合深度優化后的4D并行和ZeROCache機制優化存儲,可兼容適配多款國產化硬件,能夠以更少的資源和更快的速度訓練更大的模型。

2023年4月,騰訊云面向大模型而生的新一代HCC高性能計算集群正式發布,性能較前代提升3倍。除了硬件的升級,針對大模型訓練場景,HCC對網絡協議、通信策略、AI框架、模型編譯等進行系統級優化,大幅節約訓練調優和算力成本。此前AngelPTM就已經通過HCC對外提供服務,本次Angel機器學習框架升級,也將進一步提升HCC大模型專屬算力集群的性能,助力企業加速大模型落地。

模型參數的增大不僅給訓練帶來了挑戰,還導致了推理成本的不斷上升。為解決這一問題,騰訊自研的大模型推理框架AngelHCF通過擴展并行能力、采用多種Attention優化策略等方式對性能進行了提升。同時,框架還適配了多種壓縮算法,以提高吞吐能力,從而實現更快的推理性能和更低的成本,支持大型模型推理服務。

相較于業界主流框架,AngelHCF的推理速度提高了1.3倍。在騰訊混元大模型文生圖的應用中,推理耗時從原本的10秒縮短至3至4秒。此外,AngelHCF還支持多種靈活的大模型壓縮和量化策略,支持自動壓縮。

一站式應用構建,讓大模型“開箱即用”

作為實用級大模型,騰訊混元大模型從研發之初就面向應用場景而生,在實踐中解決大模型落地難點。騰訊產品及應用種類多、流量大,讓模型真正“用起來”挑戰很大。基于Angel,騰訊構建了大模型接入和應用開發的一站式平臺,包含數據處理、精調、模型評估、一鍵部署以及提示詞調優等服務,讓大模型的“開箱即用”成為可能。

模型接入層面,騰訊混元大模型提供千億、百億、十億多個尺寸的模型,充分適配各類應用場景的需求,只需要經過簡單微調就能達到滿足業務需求的效果,同時降低模型訓練和推理服務的資源成本,在問答、內容分類等常見應用場景中具有更高的性價比。

應用開發層面,騰訊內部已有超過300項業務和應用場景接入騰訊混元大模型內測,相比上個月數量翻了一倍,覆蓋文本總結、摘要、創作、翻譯、代碼等多個領域。

2023年9月,騰訊自研的實用級大模型騰訊混元正式亮相并通過騰訊云開放。騰訊混元擁有超千億參數規模,預訓練語料超 2 萬億 tokens,聚合了騰訊在預訓練算法、機器學習平臺和底層算力資源多個層面的自研技術積累,并在應用中持續迭代,不斷優化大模型能力。目前,已有來自零售、教育、金融、醫療、傳媒、交通、政務等多個行業的客戶,通過騰訊云接入騰訊混元大模型。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/162700.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/162700.shtml
英文地址,請注明出處:http://en.pswp.cn/news/162700.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

SQL Server刪除重復數據只保留一條

介紹 最近在導入數據庫數據, 有時候給的數據源文件,存在重復數據, 需要清除但是還需要保留一條記錄的需求. 本文將介紹如何使用SQL Server來實現這個需求。 流程 下面是實現刪除重復數據的流程,我們可以用表格展示每個步驟: 步驟 描述 步驟一 先…

算法通關村第十二關-白銀挑戰字符串經典題目

大家好我是蘇麟 , 今天帶來字符串相關的題目 . 大綱 反轉問題字符串反轉K個一組反轉僅僅反轉字母反轉字符串中的單詞 反轉問題 字符串反轉 描述 : 編寫一個函數,其作用是將輸入的字符串反轉過來。輸入字符串以字符數組 s的形式給出。 題目 : LeetCode 344. 反轉…

webshell之擴展免殺

由于很多企業為了防止源碼泄露,都會使用加密擴展將代碼進行加密,那么我們就可以就將計就計,將webshell也利用擴展加密,將特征消除,從而達到免殺的效果 1.php-beast 擴展地址 下載dll,并添加至ext中 在php…

優化數據分析——理解與運用各類指標

寫在開頭 數據分析在當今信息時代扮演著至關重要的角色,而指標則是我們理解數據、揭示模式、支持決策的關鍵工具。本文將深入討論各類指標的應用場景和解讀方法,以幫助更全面、深入地理解數據。 1. 中心趨勢指標 1.1 均值:更深層次的理解 …

MySQL中自增id用完怎么辦?

MySQL中自增id用完怎么辦? MySQL里有很多自增的id,每個自增id都是定義了初始值,然后不停地往上加步長。雖然自然數是沒有上限的,但是在計算機里,只要定義了表示這個數的字節長度,那它就有上限。比如&#…

【2023持續更新】網絡安全工程師常用工具集合

文章目錄 SQL注入檢測 SQL注入檢測 https://github.com/r0oth3x49/ghauri

python數據結構與算法-15_堆與堆排序

堆(heap) 前面我們講了兩種使用分治和遞歸解決排序問題的歸并排序和快速排序,中間又穿插了一把樹和二叉樹, 本章我們開始介紹另一種有用的數據結構堆(heap), 以及借助堆來實現的堆排序,相比前兩種排序算法要稍難實現一些。 最后我…

Linux開發工具(含gdb調試教程)

文章目錄 Linux開發工具(含gdb調試教程)1、Linux 軟件包管理器 yum2、Linux開發工具2.1、Linux編輯器 -- vim的使用2.1.1、vim的基本概念2.1.2、vim的基本操作2.1.3、vim正常模式命令集2.1.4、vim末行模式命令集 2.2、vim簡單配置 3、Linux編譯器 -- gcc…

HIVE SQL取整函數匯總

目錄 int()round(double a)round(double a,int d)floor()ceil() int() 向零取整,即向接近零的方向取整。 int(5.6)輸出:5 int(-5.6)輸出:-5 round(double a) 四舍五入取整 select round(5.6)輸出:6 select round(-5.6)輸出&…

關于前端處理后端輪詢的操作 (總結)

使用場景:前端首次發起請求獲取數據,若失敗則每隔1s發起一次知道成功獲取數據為止解決方案: 使用輪詢操作,涉及定時器的使用和關閉 (使用vue2代碼為例) data() {return {pollingResult_en: null, // 處理輪詢結果bizI…

redis之cluster集群

1、redis-cluster集群:redis3.0引入的分布式存儲方案 2、集群:由多個node節點組成,redis數據分布在這些節點之中 (1)在集群之中也分主節點和從節點 (2)自帶哨兵模式 3、redis-cluster集群的…

騰訊云 小程序 SDK對象存儲 COS使用記錄,原生小程序寫法。

最近做了一個項目,需求是上傳文檔,文檔類型多種,圖片,視頻,文件,doc,xls,zip,txt 等等,而且文檔類型可能是大文件,可能得上百兆,甚至超過1G。 騰訊云文檔地址:https://c…

Java接口自動化測試系列[V1.0.0][概述]

基礎知識 在TCP/IP中,HTTP屬于傳輸層協議,該協議采用的是Request-Response的模式,且該協議是無狀態的,也就是后續如果要用到前面的信息必須重新請求重新獲取;HTTP通過SSL/TSL加密成為HTTPS,與HTTP相比HTTP…

PC端頁面進去先出現加載效果

自定義指令v-loading&#xff0c;只需要綁定Boolean即可 v-loading“loading” <el-table :data"list" border style"width: 100%" v-loading"loading"><el-table-column align"center" label"序號" width"5…

開發板啟動進入系統以后再掛載 NFS 文件系統, 這里的NFS文件系統是根據正點原子教程制作的ubuntu_rootfs

如果是想開發板啟動進入系統以后再掛載 NFS 文件系統&#xff0c;開發板啟動進入文件系統&#xff0c;開發板和 ubuntu 能互相 ping 通&#xff0c;在開發板文件系統下新建一個目錄 you&#xff0c;然后執行如下指令進行掛載&#xff1a; mkdir mi mount -t nfs -o nolock,nfsv…

Hive日志默認存儲在什么位置?

在hive-log4j.properties配置文件中&#xff0c;有這么一段配置信息 hive.log.thresholdALL hive.root.loggerWARN,DRFA hive.log.dir${java.io.tmpdir}/${user.name} hive.log.filehive.log hive.log.dir就是日志存儲在目錄/tmp/${user.name}(當前用戶名)/下 而hive.log就是h…

日本it就職培訓機構,日本IT行業的三種類型

日本的IT產業一直保持增長趨勢&#xff0c;市場規模逐年增加&#xff0c;在日本所有產業中占據很大比例。由于日本老齡化嚴重&#xff0c;日本國內的IT人才無法滿足需求&#xff0c;為緩解這一問題&#xff0c;日本將引進外國優秀IT人才作為一項國策&#xff0c;日本IT行業不僅…

Leetcode1410. HTML 實體解析器

Every day a Leetcode 題目來源&#xff1a;1410. HTML 實體解析器 解法1&#xff1a;模擬 遍歷字符串 text&#xff0c;每次遇到 ’&‘&#xff0c;就判斷以下情況&#xff1a; 雙引號&#xff1a;字符實體為 &quot; &#xff0c;對應的字符是 " 。單引號&a…

振弦式土壓力計在巖土工程安全監測應用的方案

振弦式土壓力計在巖土工程安全監測應用的方案 振弦式土壓力計是一種常見的土壓力測量儀器&#xff0c;其原理是利用振弦在土中傳播的速度與土的應力狀態有關的特點測量土壓力。在巖土工程安全監測中&#xff0c;振弦式土壓力計可以應用于以下方面&#xff1a; 1. 地下連續墻和…

某資產管理機構: IAST提升安全水平,保障資產管理水平穩健增長

某資產管理機構是國內首批成立的資產管理公司之一&#xff0c;堅持“科技金融”、“數字金融”戰略&#xff0c;以客戶為中心&#xff0c;聚焦用戶體驗與業務協同&#xff0c;著力推進營銷數字化進程和大數據平臺建設&#xff0c;助力資產管理高質量發展。 數字科技推動工作效率…