Cube-Studio：開源大模型全鏈路一站式中臺

開源項目，歡迎star哦，https://github.com/data-infra/cube-studio

一款真正意義的 LLMOps 框架

LLMOps（Large Language Model Operations）是一個涵蓋了大型語言模型（如GPT系列）開發、部署、維護和優化的一整套實踐和流程，而不僅僅是大模型的應用層。

簡介

Cube-Studio是由騰訊音樂開源的一款云原生一站式AI中臺，覆蓋機器學習/深度學習/LLM大模型，開發、訓練、推理、應用，全鏈路。

github地址：https://github.com/data-infra/cube-studio

該項目目前已是國內最火的開源算法全鏈路中臺，上千家企業私有化部署和項目交付，非常適合數據算法架構團隊搭建公司級AI中臺，以及toB企業算法中臺類項目交付。

LLMOps

cube-studio除了支持原有mlops全鏈路能力外，新版本增加了很多大模型相關的鏈路能力。

1. 支持AIHub形式部署40+常用開源大模型：

模型市場中已集成了40+常用開源大模型，包括chatglm4、llama3、qwen2、baichuan2、gemma等，還有openjourney、stable diffusion等文生圖模型，并且支持開源模型一鍵部署，一鍵開發，一鍵微調，快速直觀地感受大模型。

在這里插入圖片描述

提示：除了大模型，另外還有400+開源圖文音常規模型。

2. 多層次支持大模型訓練微調技術棧：

? 支持tensorflow、pytorch、paddlejob、mindspore、mxnet等分布式多機多卡訓練框架；

? 支持deepspeed、megatron、colossalai、horovod、mpi等分布式加速框架；

? 同時支持RDMA網絡協議，可以使用底層IB交換機或roce網絡；

? 硬件適配英偉達，以及海光、華為、寒武紀、天數智芯等國產設備，支持vgpu。

在這里插入圖片描述

提示：除了多機多卡訓練，也包含spark/ray/volcano等分布式計算框以及特征處理，文本處理，模型處理等環節。

3. 支持自有數據集一鍵微調部署：

支持chatglm3、chatglm4、qwen2、baichuan2、llama3等一鍵微調，集成了llama factory 支持100+LLMs的微調方案；并支持自動發布為推理服務，vllm推理加速，形成openai流接口。

pipeline一鍵訓練推理部署，非常適合不太熟悉大模型微調算法的同學，任務流完成后可以直接對接到其他的openai接口使用的產品中。

在這里插入圖片描述

4. 通過智能體構建，構建智能人機交互

? 支持對接外部llm服務廠商接口

? 支持對接內部預訓練模型或微調模型llm服務接口

? 支持通過prompt構建領域專家和添加私有知識庫

? 支持文生圖，語音多模態交互

? 支持支持對接企業oa軟件機器人

在這里插入圖片描述

5. 大模型自動化標注

標注是AI中經常出現的任務，cube-studio中集成了開源標注平臺label studio，支持圖/文/音/多模態/大模型多種類型標注功能，用戶管理，工作任務分發，對接數據集，支持標注數據導入；對接pipeline，支持標注結果自動化訓練；對接aihub模型市場，支持自動化標注，只需將服務接口配置到label studio中，即可實現通過大模型來自動化標注。

在這里插入圖片描述

提示：除了支持大模型的自動化標注，也支持普通模型圖文音的自動化標注。

詳細操作
使用參考wiki：https://github.com/data-infra/cube-studio/wiki

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/40071.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/40071.shtml
英文地址，請注明出處：http://en.pswp.cn/web/40071.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！