
開源項目,歡迎star哦,https://github.com/data-infra/cube-studio
一款真正意義的 LLMOps 框架
LLMOps(Large Language Model Operations)是一個涵蓋了大型語言模型(如GPT系列)開發、部署、維護和優化的一整套實踐和流程,而不僅僅是大模型的應用層。
簡介
Cube-Studio是由騰訊音樂開源的一款云原生一站式AI中臺,覆蓋機器學習/深度學習/LLM大模型,開發、訓練、推理、應用,全鏈路。
github地址:https://github.com/data-infra/cube-studio
該項目目前已是國內最火的開源算法全鏈路中臺,上千家企業私有化部署和項目交付,非常適合數據算法架構團隊搭建公司級AI中臺,以及toB企業算法中臺類項目交付。
LLMOps
cube-studio除了支持原有mlops全鏈路能力外,新版本增加了很多大模型相關的鏈路能力。
1. 支持AIHub形式部署40+常用開源大模型:
模型市場中已集成了40+常用開源大模型,包括chatglm4、llama3、qwen2、baichuan2、gemma等,還有openjourney、stable diffusion等文生圖模型,并且支持開源模型一鍵部署,一鍵開發,一鍵微調,快速直觀地感受大模型。
提示:除了大模型,另外還有400+開源圖文音常規模型。
2. 多層次支持大模型訓練微調技術棧:
? 支持tensorflow、pytorch、paddlejob、mindspore、mxnet等分布式多機多卡訓練框架;
? 支持deepspeed、megatron、colossalai、horovod、mpi等分布式加速框架;
? 同時支持RDMA網絡協議,可以使用底層IB交換機或roce網絡;
? 硬件適配英偉達,以及海光、華為、寒武紀、天數智芯等國產設備,支持vgpu。
提示:除了多機多卡訓練,也包含spark/ray/volcano等分布式計算框以及特征處理,文本處理,模型處理等環節。
3. 支持自有數據集一鍵微調部署:
支持chatglm3、chatglm4、qwen2、baichuan2、llama3等一鍵微調,集成了llama factory 支持100+LLMs的微調方案;并支持自動發布為推理服務,vllm推理加速,形成openai流接口。
pipeline一鍵訓練推理部署,非常適合不太熟悉大模型微調算法的同學,任務流完成后可以直接對接到其他的openai接口使用的產品中。
4. 通過智能體構建,構建智能人機交互
? 支持對接外部llm服務廠商接口
? 支持對接內部預訓練模型或微調模型llm服務接口
? 支持通過prompt構建領域專家和添加私有知識庫
? 支持文生圖,語音多模態交互
? 支持支持對接企業oa軟件機器人
5. 大模型自動化標注
標注是AI中經常出現的任務,cube-studio中集成了開源標注平臺label studio,支持圖/文/音/多模態/大模型多種類型標注功能,用戶管理,工作任務分發,對接數據集,支持標注數據導入;對接pipeline,支持標注結果自動化訓練;對接aihub模型市場,支持自動化標注,只需將服務接口配置到label studio中,即可實現通過大模型來自動化標注。
提示:除了支持大模型的自動化標注,也支持普通模型圖文音的自動化標注。
詳細操作
使用參考wiki:https://github.com/data-infra/cube-studio/wiki