Cube-Studio:開源大模型全鏈路一站式中臺

開源項目,歡迎star哦,https://github.com/data-infra/cube-studio

一款真正意義的 LLMOps 框架

LLMOps(Large Language Model Operations)是一個涵蓋了大型語言模型(如GPT系列)開發、部署、維護和優化的一整套實踐和流程,而不僅僅是大模型的應用層。

簡介

Cube-Studio是由騰訊音樂開源的一款云原生一站式AI中臺,覆蓋機器學習/深度學習/LLM大模型,開發、訓練、推理、應用,全鏈路。

github地址:https://github.com/data-infra/cube-studio

該項目目前已是國內最火的開源算法全鏈路中臺,上千家企業私有化部署和項目交付,非常適合數據算法架構團隊搭建公司級AI中臺,以及toB企業算法中臺類項目交付。

LLMOps

cube-studio除了支持原有mlops全鏈路能力外,新版本增加了很多大模型相關的鏈路能力。

1. 支持AIHub形式部署40+常用開源大模型:

模型市場中已集成了40+常用開源大模型,包括chatglm4、llama3、qwen2、baichuan2、gemma等,還有openjourney、stable diffusion等文生圖模型,并且支持開源模型一鍵部署,一鍵開發,一鍵微調,快速直觀地感受大模型。

在這里插入圖片描述

提示:除了大模型,另外還有400+開源圖文音常規模型。

2. 多層次支持大模型訓練微調技術棧:

? 支持tensorflow、pytorch、paddlejob、mindspore、mxnet等分布式多機多卡訓練框架;

? 支持deepspeed、megatron、colossalai、horovod、mpi等分布式加速框架;

? 同時支持RDMA網絡協議,可以使用底層IB交換機或roce網絡;

? 硬件適配英偉達,以及海光、華為、寒武紀、天數智芯等國產設備,支持vgpu。

在這里插入圖片描述

提示:除了多機多卡訓練,也包含spark/ray/volcano等分布式計算框以及特征處理,文本處理,模型處理等環節。

3. 支持自有數據集一鍵微調部署:

支持chatglm3、chatglm4、qwen2、baichuan2、llama3等一鍵微調,集成了llama factory 支持100+LLMs的微調方案;并支持自動發布為推理服務,vllm推理加速,形成openai流接口。

pipeline一鍵訓練推理部署,非常適合不太熟悉大模型微調算法的同學,任務流完成后可以直接對接到其他的openai接口使用的產品中。

在這里插入圖片描述

4. 通過智能體構建,構建智能人機交互

? 支持對接外部llm服務廠商接口

? 支持對接內部預訓練模型或微調模型llm服務接口

? 支持通過prompt構建領域專家和添加私有知識庫

? 支持文生圖,語音多模態交互

? 支持支持對接企業oa軟件機器人

在這里插入圖片描述

在這里插入圖片描述

5. 大模型自動化標注

標注是AI中經常出現的任務,cube-studio中集成了開源標注平臺label studio,支持圖/文/音/多模態/大模型多種類型標注功能,用戶管理,工作任務分發,對接數據集,支持標注數據導入;對接pipeline,支持標注結果自動化訓練;對接aihub模型市場,支持自動化標注,只需將服務接口配置到label studio中,即可實現通過大模型來自動化標注。

在這里插入圖片描述

在這里插入圖片描述

提示:除了支持大模型的自動化標注,也支持普通模型圖文音的自動化標注。

詳細操作
使用參考wiki:https://github.com/data-infra/cube-studio/wiki

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/40071.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/40071.shtml
英文地址,請注明出處:http://en.pswp.cn/web/40071.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【深度學習】第3章實驗——回歸模型

根據相關數據集進行回歸分析 1. import statsmodels.api as sm # df.loc[:, ...] 表示選擇所有行。 # df.columns != mpg 創建一個布爾數組,指示哪些列不等于 mpg。 # df.loc[:, df.columns != mpg] 選擇 df 中所有行和列名不等于 mpg 的所有列。 x =df.loc[:,df.columns!=m…

Python酷庫之旅-第三方庫Pandas(004)

目錄 一、用法精講 5、pandas.DataFrame.to_csv函數 5-1、語法 5-2、參數 5-3、功能 5-4、返回值 5-5、說明 5-6、用法 5-6-1、代碼示例 5-6-2、結果輸出 6、pandas.read_fwf函數 6-1、語法 6-2、參數 6-3、功能 6-4、返回值 6-5、說明 6-6、用法 6-6-1、代碼…

如何在不知道密碼的情況下卸載卡巴斯基

卸載 Kaspersky Endpoint Security 雖然關閉/卸載 Kaspersky Endpoint Security 需要輸入管理員賬號和密碼,但是!Kaspersky Endpoint Security 對于其應用是否應該啟用密碼保護,僅僅是通過在注冊表中的一個標志位進行判斷的,因此…

05-《豬籠草》

豬籠草 豬籠草是豬籠草屬全體物種的總稱。屬于熱帶食蟲植物,原產地主要為舊大陸熱帶地區。其擁有一個獨特的吸取營養的器官——捕蟲籠,捕蟲籠呈圓筒形,下半部稍膨大,籠口上具有蓋子,因其形狀像豬籠而得名。 豬籠草 形…

昂首平臺一分鐘理清VSA理論的市場階段

VSA的英文全程是volume spread analysis,翻譯過來就是成交量價格幅度差分析,從名字角度就也可以重點看出,VSA分析法主要是從成交量供應分析來分析。但是很多投資者不理解VSA理論的市場階段,今天昂首平臺就和投資者一分鐘理清。 根…

第五篇——謀攻篇:韓信該死,拿破侖該亡

目錄 一、背景介紹二、思路&方案三、過程1.思維導圖2.文章中經典的句子理解3.學習之后對于投資市場的理解4.通過這篇文章結合我知道的東西我能想到什么? 四、總結五、升華 一、背景介紹 人生也是如此,傷敵一千,自損八百;而不…

AI繪畫擦邊變現賽道怎么玩?新手小白必看教程!

今天給大家介紹一個用 AI 搞擦邊的變現賽道 而且可以說是0 成本變現的 現在真的越來越多的人都想 0 成本變現,那么 0 成本到底能不能變現,變現的上下限又是多少? 今天這個案例就可以很好的進行說明 可以說 AI 是現在第一生產力&#xff0…

Yarn有哪些功能

Yarn 作為一個 JavaScript 包管理工具,提供了一系列強大的功能,旨在優化依賴管理、提升安裝速度和增強項目的可維護性。以下是 Yarn 的一些主要功能: 1. 依賴管理 鎖定依賴版本:Yarn 使用 yarn.lock 文件來鎖定項目依賴的具體版…

【RT-thread studio 下使用STM32F103-學習sem-信號量-初步使用-線程之間控制-基礎樣例】

【RT-thread studio 下使用STM32F103-學習sem-信號量-初步使用-線程之間控制-基礎樣例】 1、前言2、環境3、事項了解(1)了解sem概念-了解官網消息(2)根據自己理解,設計幾個使用方式(3)不建議運行…

const char * 、char const *、 char * const 三者的區別

一.const char*(常量指針) 1.定義一個指向字符常量的指針,這里,ptr是一個指向 char* 類型的常量,所以不能用ptr來修改所指向的內容,換句話說,*ptr的值為const,不能修改。但是ptr的聲…

【Python機器學習】處理文本數據——停用詞

刪除沒有信息量的單詞有一種方法,就是舍棄那些出現次數太多以至于沒有信息量的單詞。 有兩種主要方法: 1、使用特定語言的停用詞(stopword)列表; 2、舍棄那些出現過于頻繁的單詞。 scikit-learn的feature_extracti…

達夢DM8使用管理工具自動commit設置

緣起 隨著國產化信創大勢崛起,越來越多的國產數據庫躍上潮頭。在用慣了國外數據庫軟件后,使用DM8的過程中前前后后遇到了不少“不習慣”,當然,用多了也就習慣了,要多給國產DB一些成長空間。 功能點探索 DM管理工具…

強烈建議!所有Python基礎差的同學,死磕這本64頁的背記手冊!

Python背記手冊是一份非常實用的學習資料,它涵蓋了Python語言的基礎知識、語法規則、常用函數和模塊等內容,對于初學者和有一定基礎的Python程序員來說都非常有用。通過背誦這份手冊,可以加深對Python語言的理解和記憶,提高編程能…

摸魚大數據——Spark Core——RDD綜合案例——搜狗搜索流

2.1 數據源介紹 訪問時間 用戶id []里面是用戶輸入搜索內容 url結果排名 用戶點擊頁面排序 用戶點擊URL 字段與字段之間的分隔符號為 \t和空格 (制表符號) 2.2 需求分析 需求一: 統計每個 關鍵詞 出現了多少次,最終展示top10數據關鍵詞示例: [.,,的,360, 安全衛士, 哄搶, 救災…

Zabbix觸發器

目錄 觸發器基礎概念 創建和管理觸發器 示例 定義一個觸發器 在 Zabbix 中,觸發器(Trigger)用于定義在監控數據滿足特定條件時觸發警報或動作。觸發器是實現監控告警和自動響應的核心組件之一。以下是關于 Zabbix 觸發器的詳細解釋和用法…

yaml格式轉換成json格式

yaml格式轉換成json格式 ①postman生成的結果是yaml格式 ps:postman輸出的格式是沒有自動換行的,需要將內容換行 ②復制到Python的腳本跑一趟:自動換行并去掉/n; str " "//(postman輸出的內容) print(st…

唐僧說:分數限制下,選好專業還是選好學校?

貧僧自東土大唐而來,往西天取經,雖非塵世中人,卻也常聞世間煩惱。今見24年高考帷幕已落,萬千學子面臨新的人生抉擇,心中不禁生出幾分感慨。學校與專業,猶如修行路上的兩座山門,一者關乎環境氛圍…

HTTPS保證傳輸安全的關鍵點

哈嘍,大家好呀,淼淼又來和大家見面啦,在如今高度數字化的世界里,信息的安全傳輸成為了至關重要的議題。HTTPS(超文本傳輸安全協議)作為HTTP協議的安全升級版,為網絡數據的交換提供了強大的安全保…

LMT加仿真,十一屆大唐杯全國總決賽

這次省賽帶了太多個省一了,并且很多都進入了國賽總決賽,具體可看下面的圖片,只放了一部分。目前只有B組是只有一個商用設備賽也就是LMT,A組和高職組都是仿真實踐賽加上商用設備賽。 針對商用設備賽有對應的資料&#xff…

windows server2016搭建AD域服務器

文章目錄 一、背景二、搭建AD域服務器步驟三、生成可供java程序使用的keystore文件四、導出某用戶的keytab文件五、主機配置hosts文件六、主機確認是否能ping通本人其他相關文章鏈接 一、背景 親測可用,之前搜索了很多博客,啥樣的都有,就是不介紹報錯以…