OpenShift AI - 模型注冊管理

《OpenShift / RHEL / DevSecOps 匯總目錄》
說明:本文已經在 OpenShift 4.18 + OpenShift AI 2.19 的環境中驗證

文章目錄

  • 啟用模型注冊管理功能
    • 安裝管理數據庫
    • 啟用模型注冊功能
  • 注冊模型
  • 部署模型
  • 歸檔模型
    • 歸檔模型和模型版本
    • 恢復歸檔模型
  • 模型注冊表訪問權限管理
  • 參考

啟用模型注冊管理功能

安裝管理數據庫

可以使用 MySQL 或 MariaDB 做為 OpenShift AI 模型管理的數據庫。

  1. 創建項目
$ oc new-project mysql
  1. 在 OpenShift 的開發者視圖中添加菜單,然后在開發者目錄中選擇Databases,最后點擊下圖的MariaDB
    在這里插入圖片描述
  2. 在右劃頁面中點擊實例化模板按鈕,然后在 Instantiate Template 頁面中根據以下配置創建環境:
    Database Service Name: modelregistry
    MariaDB Connection Username:modelregistry
    MariaDB Connection Password:password
    MariaDB root Password:password
    MariaDB Database Name:modelregistry
    Volume Capacity:5GB

啟用模型注冊功能

  1. 編輯 OpenShift AI Operator 中的 DataScienceCluster 對象,將 modelregistry.managementState 改為 Managed。
    modelregistry:managementState: ManagedregistriesNamespace: rhoai-model-registries
  1. 查看 redhat-ods-applications 項目的拓撲試圖,確認會新出現一個名為 default-modelregistry 的 ModelRegistry 對象。該對象是一個 Controller,它會在 rhoai-model-registries 項目中管理實際的模型注冊表運行環境。
$ oc get pod -n rhoai-model-registries
NAME                             READY   STATUS    RESTARTS   AGE
modelregistry-75d8f6bbdb-27n8f   3/3     Running   0          28h
  1. 在配置生效后可以在 OpenShift AI 控制臺中看到新的 Settings -> Model registry settings 菜單。
  2. 進入 Settings -> Model registry settings 菜單,然后點擊 Create model registry 按鈕,再根據以下配置添加一個 Model registry。
    Name: modelregistry
    Host: modelregistry.mysql.svc.cluster.local
    Port: 3306
    Username: modelregistry
    Password: password
    Database: modelregistry
  3. 完成后可以看到 Model registry 的狀態,并且在 Models 下出現新的 Model registry 菜單。
    在這里插入圖片描述

注冊模型

在注冊一個模型前先要把該模型的相關文件下載到 OpenShift 能夠訪問的 S3 對象存儲中。本節點已經根據《OpenShift AI - 在 OpenShift 和 OpenShift AI 上運行 LLM》一文將 huggingface 的 mistralai/Mistral-7B-Instruct-v0.2 模型傳到 MinIO 對象存儲中了。

  1. 進入 OpenShift AI 控制臺的 Models -> Model registry 菜單。
  2. 點擊 Registry model 按鈕,然后根據以下配置注冊一個模型。
    Model name: Mistral-7B-Instruct
    Version name: v0.2
    Object storage
    Endpoint: http://minio-service.minio.svc.cluster.local:9000
    Bucket: models
    Region: none
    Path: models/Mistral-7B-Instruct-v0.2
  3. 完成后可查看已注冊的模型以及包含的版本。
    在這里插入圖片描述
    在這里插入圖片描述

部署模型

  1. 進入 Data science projects 菜單,然后新建一個名為 my-mistral-7 的項目。
  2. 為了能夠在項目中部署運行模型,需要先確定使用的模型運行模式。切換到 my-mistral-7 項目的 Models 頁面,然后點擊下圖的 Select single-model 按鈕。
    在這里插入圖片描述
  3. 返回到 Model registry 菜單,進入 modelregistry 的 Mistral-7B-Instruct 模型,然后在版本為 v0.2 一行右側的下拉菜單中選中 “Deploy”。
    在這里插入圖片描述
  4. 在 Deploy model 對話框中,最后點擊 Deploy。
    在這里插入圖片描述
  5. 在部署好模型后,可以在該版本的模型中看到關聯的部署情況。注意:該列表只顯示通過 Model registry 進行部署的情況。
    在這里插入圖片描述

歸檔模型

被歸檔的模型或模型版本缺省時不能在 Model registry 中顯示出來的,而只能在歸檔中顯示。另外,用戶也無法部署一個已經歸檔的模型。

歸檔模型和模型版本

  1. 通過 Archive model 下拉菜單可以對整個模型進行歸檔。
    在這里插入圖片描述
  2. 通過 Archive model version 下拉菜單可以對一個模型的某個版本進行歸檔。
    在這里插入圖片描述

恢復歸檔模型

  1. 通過 View archived models 或者 View archived versions 菜單可以顯示被歸檔的模型或模型版本。
    在這里插入圖片描述
  2. 在選擇 Restore model 或 Restore model version 菜單后可將歸檔的模型或模型版本重新恢復到正常狀態。
    在這里插入圖片描述

模型注冊表訪問權限管理

在 OpenShift AI 控制臺中,一個模型注冊表需要管理員授權后才能被普通用戶訪問到。

  1. 用一個普通用戶登錄 OpenShift AI 控制臺,確認缺省在 Model Registry 中看不到已有的模型注冊表。
    在這里插入圖片描述
  2. 用管理員進入 OpenShift AI 控制臺的 Model registry settings,然后進入一個 Model registry,再將普通用戶添加到 Users 中。
    在這里插入圖片描述
  3. 確認普通用戶可以在 Model Registry 中看到并使用被授權的模型注冊表了。

參考

https://docs.redhat.com/en/documentation/red_hat_openshift_ai_self-managed/2.19/html-single/managing_model_registries/index#overview-of-model-registries_managing-model-registries

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/79801.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/79801.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/79801.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【背包dp----01背包】例題三------(標準的01背包+變種01背包1【恰好裝滿背包體積 產生的 最大價值】)

【模板】01背包 題目鏈接 題目描述 : 輸入描述: 輸出描述: 示例1 輸入 3 5 2 10 4 5 1 4輸出 14 9說明 裝第一個和第三個物品時總價值最大,但是裝第二個和第三個物品可以使得背包恰好裝滿且總價值最大。 示例2 輸入 3 8 12 6 11 8 6 8輸出 8 0說明 裝第三個物…

Node.js 的 child_process 模塊詳解

Node.js 的 child_process 模塊提供了創建子進程的能力,使 Node.js 應用能夠執行系統命令、運行其他程序或腳本。這個模塊非常強大,可以幫助我們實現很多復雜的功能。 1. exec - 執行 shell 命令 exec 方法用于執行 shell 命令,并緩沖任何產生的輸出。 特點 創建 shell 來…

進程與線程詳細介紹

目錄 一 進程概念 二 進程的組成 2.1 PCB 2.2 數據段 2.3 程序段 三 進程的五大特點 四 進程的創建與銷毀 五 線程概念 六 線程特征 七 進程與線程的區別與聯系 區別 聯系 一 進程概念 進程是程序的一次執行過程,是操作系統進行資源分配和調度的基本單位…

如何在服務器后臺運行Python腳本,并配置虛擬環境與GPU支持

使用Conda虛擬環境在服務器后臺運行Python腳本,并檢查GPU分配 在服務器開發環境中,我們需要確保Python腳本運行在指定的Conda虛擬環境中,并且確認是否正確分配了GPU資源。本文將通過一個完整的start.sh腳本,完成以下功能&#xff…

前端取經路——工程化渡劫:八戒的構建之道

大家好,我是老十三,一名前端開發工程師。前端工程化就像八戒的釘耙,看似簡單卻能降妖除魔。在本文中,我將帶你探索前端工程化的九大難題,從模塊化組織到CI/CD流程,從代碼規范到自動化測試,揭示這些工具背后的核心原理。無論你是初學者還是資深工程師,這些構建之道都能幫…

Ubuntu 安裝 Keepalived

Keepalived 是什么 Keepalived 是一個用于實現高可用性(High Availability, HA)的服務,是一款基于 VRRP 協議的高可用軟件,常用于主備切換和虛擬IP漂移,在服務故障時自動實現故障轉移。 Keepalived 的核心功能 功能說…

DHCP理解

文章目錄 DHCP理解DHCP的核心作用DHCP默認端口DHCP的工作原理(4個步驟)圖示說明(含中繼代理)DHCP Discover(客戶端發現階段)DHCP Offer(服務器提供階段)DHCP Request(客戶…

云計算-容器云-部署CICD-jenkins連接gitlab

安裝 Jenkins 將Jenkins部署到default命名空間下。要求完成離線插件的安裝,設置Jenkins的登錄信息和授權策略。 上傳BlueOcean.tar.gz包 [root@k8s-master-node1 ~]#tar -zxvf BlueOcean.tar.gz [root@k8s-master-node1 ~]#cd BlueOcean/images/ vim /etc/docker/daemon.json…

AI 大模型新浪潮:從 DeepSeek-Prover 到 Qwen3,再到 DeepSeek-R2,邁向自動推理的新時代20250507

🧠 AI 大模型新浪潮:從 DeepSeek-Prover 到 Qwen3,再到 DeepSeek-R2,邁向自動推理的新時代 🚀 引言:大模型,不止是語言處理器,而是思維建構者 在 2025 年春天,我們見證了…

觀察者模式(Observer Pattern)詳解

文章目錄 1. 什么是觀察者模式?2. 為什么需要觀察者模式?3. 觀察者模式的核心概念4. 觀察者模式的結構5. 觀察者模式的基本實現簡單的氣象站示例6. 觀察者模式的進階實現推模型 vs 拉模型6.1 推模型(Push Model)6.2 拉模型(Pull Model)7. 觀察者模式的復雜實現7.1 在線商…

前端代碼規范詳細配置

以下是現代前端項目的完整代碼規范配置方案,涵蓋主流技術棧和自動化工具鏈配置: 一、基礎工程配置 1. 項目結構規范 project/ ├── src/ │ ├── assets/ # 靜態資源 │ ├── components/ # 通用組件 │ ├── layouts/ …

Missashe考研日記-day34

Missashe考研日記-day34 1 專業課408 學習時間:3h學習內容: 今天是學習I/O管理第二小節的內容,聽了課也做了題,這是操作系統倒數第二節知識了,還差最后一節就完結了。知識點回顧: 1.I/O核心子系統&#x…

Milvus 向量數據庫詳解與實踐指南

一、Milvus 核心介紹 1. 什么是 Milvus? Milvus 是一款開源、高性能、可擴展的向量數據庫,專門為海量向量數據的存儲、索引和檢索而設計。它支持近似最近鄰搜索(ANN),適用于圖像檢索、自然語言處理(NLP&am…

算力經濟模型研究:從云計算定價到去中心化算力市場設計

引言:算力商品化的雙重革命 在H800 GPU集群的算力供給能力突破2.3 EFLOPS的今天,算力定價機制正經歷從"資源租賃"到"動態市場"的范式轉變。傳統云計算定價模型(如AWS按需實例)的靜態價格機制已難以適應大模型…

[D1,2] 貪心刷題

文章目錄 擺動序列最大子數組合買賣股票跳躍游戲跳躍2 擺動序列 不像是貪心,只要抓住擺動這個點,前一個上升,那下一個就要下降,記錄上一次的狀態為1的話,那下一次就要更新為-1,如果上一次為1,這…

Spring Boot操作MongoDB的完整示例大全

以下是基于Spring Boot操作MongoDB的完整示例大全&#xff0c;涵蓋增刪改查、聚合查詢、索引、事務等核心功能&#xff1a; 一、基礎CRUD操作 1. 環境配置 依賴配置&#xff08;pom.xml&#xff09; <dependency><groupId>org.springframework.boot</groupId…

【實戰教程】零基礎搭建DeepSeek大模型聊天系統 - Spring Boot+React完整開發指南

&#x1f525; 本文詳細講解如何從零搭建一個完整的DeepSeek AI對話系統&#xff0c;包括Spring Boot后端和React前端&#xff0c;適合AI開發入門者快速上手。即使你是編程萌新&#xff0c;也能輕松搭建自己的AI助手&#xff01; &#x1f4da;博主匠心之作&#xff0c;強推專欄…

Linux系統基本指令和知識指南

一、Linux系統簡介 Linux是一種自由和開放源代碼的類UNIX操作系統&#xff0c;由林納斯托瓦茲在1991年首次發布。它以穩定性、安全性和靈活性著稱&#xff0c;廣泛應用于服務器、嵌入式系統和個人計算機。 Linux主要特點&#xff1a; 開源免費 多用戶、多任務 良好的安全性…

【計算機視覺】OpenCV實戰項目:Long-Exposure:基于深度學習的長時間曝光合成技術

Long-Exposure&#xff1a;基于深度學習的長時間曝光合成技術 項目概述與技術背景項目核心功能技術原理 環境配置與安裝硬件要求建議詳細安裝步驟可選組件安裝 實戰應用指南1. 基礎使用&#xff1a;視頻轉長曝光2. 高級模式&#xff1a;自定義光軌合成3. 批量處理模式 技術實現…

TikTok 矩陣賬號運營實操細節:打造爆款矩陣

在 TikTok 的流量版圖里&#xff0c;打造 TikTok 矩陣賬號能顯著提升影響力與吸粉能力。而借助 AI 工具&#xff0c;更可為 TikTok 矩陣運營效率的提升賦能&#xff0c;讓運營如虎添翼。下面就為大家詳細講講其中的實操細節&#xff0c;并結合一些偽代碼示例輔助理解。 一、矩…