“28項評測23項SOTA——GLM-4.1V-9B-Thinking本地部署教程:10B級視覺語言模型的性能天花板!

一、模型介紹

GLM-4.1V-9B-Thinking是由智譜AI聯合清華大學團隊推出的多模態大模型,以GLM-4-9B-0414基座模型為底,通過引入“思維鏈推理機制”和“課程采樣強化學習策略”(Reinforcement Learning with Curriculum Sampling),顯著提升了模型的跨模態推理能力與穩定性。在繼承 GLM 系列通用大模型能力的基礎上,進一步強化了視覺理解和復雜推理能力。

該模型支持長上下文輸入,具備處理圖像、視頻、文本等多種模態的能力,適用于教育、科研、工業和政務等多個領域。在28項測評任務中有23項達到10B級別模型最佳,其中18項任務持平甚至超過8倍參數量的Qwen-2.5-VL-72B。

GLM-4.1V-9B-Thinking標志著智譜GLM系列模型從感知向認知階段的躍遷,在突破了小模型的性能極限下,也作出如下創新:

1.在深度推理領域表現卓越,支持圖像、視頻、文檔等多模態輸入。

2.作為參數模型僅為9B的模型,在部分高難度任務中,模型表現可以媲美GPT-4o。

3.模型開源,還提供了堅實的GLM-4.1V-9B-Base模型,利于研究者們的二次開放與創新。

二、模型部署

基礎環境最低配置推薦

環境名稱版本信息
Ubuntu22.04.4 LTS
Python3.12.4
CUDA12.6
NVIDIA CorporationRTX 4090 * 2

注:推薦pytorch 2.7.1

1.更新基礎軟件包、配置鏡像源

查看系統版本信息

#查看系統的版本信息,包括 ID(如 ubuntu、centos 等)、版本號、名稱、版本號 ID 等
cat /etc/os-release

image.png

更新軟件包列表

#更新軟件列表
apt-get update

image.png

配置國內鏡像源(阿里云)

具體而言,vim指令編輯文件?sources.list

#編輯源列表文件
vim  /etc/apt/sources.list

image.png

按?“i”進入編輯模式,將如下內容插入至?sources.list文件中

deb http://mirrors.aliyun.com/ubuntu/ jammy main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ jammy main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ jammy-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ jammy-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ jammy-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ jammy-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ jammy-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ jammy-backports main restricted universe multiverse

image.png

最后,按?"esc"鍵退出編輯模式,輸入?:wq?命令并按下?“enter”鍵便可保存并退出?sources.list文件

2.虛擬環境創建

進入pytorch官網(Get Started)

找到從本地開始(Start Locally)——>PyTorch Build(Stable 2.7.1)——>Your OS(Windows)——>Packge(Pip)——>Language(Python)——>Compule Platform(CUDA 12.6)

image.png

復制所框選“命令行“后,轉入至終端中粘貼執行安裝

image.png

image.png

創建虛擬環境

#創建名為GLM-Thking的虛擬環境,python版本:3.12
conda create -n GLM-Thking python=3.12

激活虛擬環境

#激活

conda activate GLM-Thking

3.克隆項目

進入文件夾GLM-4.1V-9B-Thinking

cd /root/sj-tmp/GLM-4.1V-9B-Thinking/

image.png

從github官網中克隆存儲庫

#克隆存儲庫
git clone https://github.com/THUDM/GLM-4.1V-Thinking.git

image.png

4.下載依賴

requirements.txt文件

pip install -r requirements.txt

image.png

5.模型下載

轉到魔塔社區官網下載模型文件:GLM-4.1V-9B-Thinking · 模型庫

image.png

使用命令行下載完整模型庫

#在下載前,請先通過如下命令安裝 
pip install modelscope#命令行下載
modelscope download --model ZhipuAI/GLM-4.1V-9B-Thinking

image.png

image.png

6.模型推理及webUI啟動

模型推理代碼均在?inference文件夾中

(1)執行命令行交互腳本?trans_infer_cli.py?便可進行連續對話

python trans_infer_cli.py --model_path '/root/sj-tmp/GLM-4.1V-9B-Thinking/'

image.png

(2)執行Gradio 界面腳本?trans_infer_gradio.py便可搭建一個可以直接使用的 Web 界面

python trans_infer_gradio.py

若遇到端口被占用的問題,可通過如下命令解決:

#查看端口號進程
lsof -i :<端口號>
#強制退出進程
kill -9 <API>

image.png

屏幕截圖

(3)web頁面圖像推理

屏幕截圖

(4)web頁面視頻推理

image.png

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/88727.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/88727.shtml
英文地址,請注明出處:http://en.pswp.cn/web/88727.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

推薦系統-Random算法

Random算法總結引言 在推薦系統研究與應用中&#xff0c;我們常常需要一些簡單的基線算法來衡量更復雜算法的性能提升。Random&#xff08;隨機推薦&#xff09;算法是最基礎的基線方法之一&#xff0c;它通過隨機生成評分來模擬用戶對物品的偏好。雖然這種方法看似簡單&#x…

Django--02模型和管理站點

Django–02模型與站點管理 Part 2: Models and the admin site 本教程承接Django–01的內容。我們將設置數據庫、創建你的第一個模型&#xff0c;并快速了解 Django 自動生成的管理站點。 文章目錄Django--02模型與站點管理前言一、設置數據庫1.1 參考文檔鏈接1.2 默認設置1.3…

CS課程項目設計1:交互友好的井字棋游戲

最近突然想開設一個專欄了&#xff0c;專門為計算機專業的同行分享一些入門級的課程項目設計&#xff0c;旨在讓同學更好地了解CS項目的設計流程&#xff0c;同時給出代碼來介紹coding過程。 今天要分享的是第一個CS課程項目&#xff1a;交互友好的井字棋游戲。 1. 研究目的 井…

首個自動駕駛VLA綜述介紹

當視覺(Vision)、語言(Language)和行動(Action)三大能力在一個模型中融合,自動駕駛的未來將走向何方? 近日,來自麥吉爾大學、清華大學、小米公司和威斯康辛麥迪遜的研究團隊聯合發布了全球首篇針對自動駕駛領域的視覺-語言-行動(Vision-Language-Action, VLA)模型的…

C# 接口(接口可以繼承接口)

接口可以繼承接口 之前我們已經知道接口實現可以從基類被繼承&#xff0c;而接口本身也可以從一個或多個接口繼承而來。要指定某個接口繼承其他的接口&#xff0c;應在接口聲明中把基接口名稱以逗號分隔的列表形式 放在接口名稱后面的冒號之后&#xff0c;如下所示。類在基類列…

linux----------------------線程同步與互斥(上)

1.線程互斥 1-1 進程線程間的互斥相關背景概念 臨界資源&#xff1a;多線程執行流共享的資源就叫做臨界資源 臨界區&#xff1a;每個線程內部訪問臨界資源的代碼就叫做臨界區 互斥&#xff1a;任何時刻&#xff0c;互斥保證只有一個執行進入臨界區&#xff0c;對臨界資源起…

百度AI的開放新篇章:文心4.5本地化部署指南與未來生態戰略展望

百度AI的開放新篇章&#xff1a;文心4.5本地化部署指南與未來生態戰略展望 一起來玩轉文心大模型吧&#x1f449;文心大模型免費下載地址&#xff1a;https://ai.gitcode.com/theme/1939325484087291906 &#x1f31f; 嗨&#xff0c;我是IRpickstars&#xff01; &#x1f30…

筆記/sklearn中的數據劃分方法

文章目錄一、前言二、數據劃分方法1. 留出法&#xff08;Hold-out&#xff09;2. K折交叉驗證&#xff08;K-Fold&#xff09;3. 留一法&#xff08;Leave-One-Out&#xff09;三、總結一、前言 簡要介紹數據劃分在機器學習中的作用。 二、數據劃分方法 1. 留出法&#xff0…

Android14 開屏頁SplashScreen設置icon圓角的原理

簡介 我們在看到一個應用在啟動的時候會看到一個啟動的icon,這個圖標是應用的icon當然也是可以應用自己去控制的如 <item name="android:windowSplashScreenAnimatedIcon">@drawable/adas_icon</item> 圖上的效果明顯不理想,圖標是自帶圓角,而且還是…

flutter redux狀態管理

&#x1f4da; Flutter 狀態管理系列文章目錄 Flutter 狀態管理(setState、InheritedWidget、 Provider 、Riverpod、 BLoC / Cubit、 GetX 、MobX 、Redux) setState() 使用詳解&#xff1a;原理及注意事項 InheritedWidget 組件使用及原理 Flutter 中 Provider 的使用、注…

AMIS全棧低代碼開發

amis是百度開源的前端低代碼框架&#xff0c;它通過JSON配置來生成各種后臺頁面&#xff0c;旨在簡化前端開發過程&#xff0c;提高開發效率&#xff0c;降低開發門檻。以下是詳細介紹&#xff1a; 核心特點&#xff1a; 可視化開發&#xff1a;允許開發者通過可視化方式構建頁…

【Python基礎】變量、運算與內存管理全解析

一、刪除變量與垃圾回收&#xff1a;內存管理的底層邏輯 在Python中&#xff0c;變量是對象的引用&#xff0c;而不是對象本身。當我們不再需要某個變量時&#xff0c;可以用del語句刪除它的引用&#xff0c;讓垃圾回收機制&#xff08;GC&#xff09;自動清理無引用的對象。 1…

Spring Boot + Javacv-platform:解鎖音視頻處理的多元場景

Spring Boot Javacv-platform&#xff1a;解鎖音視頻處理的多元場景 一、引言 在當今數字化時代&#xff0c;音視頻處理已成為眾多應用場景中不可或缺的一部分&#xff0c;從在線教育、視頻會議到短視頻平臺、智能安防等&#xff0c;音視頻數據的處理與分析需求日益增長。Java…

k8s 的基本原理、架構圖、使用步驟和注意事項

Kubernetes&#xff08;k8s&#xff09;是一個開源的容器編排平臺&#xff0c;用于自動化部署、擴展和管理容器化應用。以下是其基本原理、使用步驟和注意事項的總結&#xff1a;一、k8s 基本原理核心架構 Master 節點&#xff1a;控制集群的核心組件&#xff0c;包括&#xff…

Qt 多線程編程:單例任務隊列的設計與實現

引言&#xff1a; 在現代應用程序開發中&#xff0c;多線程編程已成為處理異步任務的標配。對于 GUI 應用而言&#xff0c;保持主線程的響應性尤為重要。本文將詳細介紹一個基于 Qt 的單例任務隊列實現方案&#xff0c;它通過線程池和單例模式&#xff0c;優雅地解決了后臺任務…

OpenEuler操作系統中檢測插入的USB設備并自動掛載

OpenEuler操作系統中檢測插入的USB設備并自動掛載 項目需求&#xff1a;工控機上openeuler操作系統是無界面版本的&#xff0c;在工控機上連接了激光雷達&#xff0c;當激光雷達采集完數據&#xff0c;我們要將采集數據導入u盤&#xff0c;故需要在工控機上插入u盤&#xff0c;…

《Spring 中上下文傳遞的那些事兒》Part 11:上下文傳遞最佳實踐總結與架構演進方向

&#x1f4dd; Part 11&#xff1a;上下文傳遞最佳實踐總結與架構演進方向 經過前面幾篇文章的深入探討&#xff0c;我們已經系統性地學習了 Spring 應用中上下文傳遞的各種技術原理、常見問題以及解決方案。從 Web 請求上下文到異步任務、從多租戶隔離到日志脫敏&#xff0c;…

使用云虛擬機搭建hadoop集群環境

使用云虛擬機搭建hadoop集群環境 安裝jdk17 配置docker網絡 docker network create --subnet172.18.0.0/16 hadoop 172.18.0.0&#xff1a;這是子網的網絡地址&#xff0c;也就是這個網絡的起始地址。/16&#xff1a;這是子網掩碼&#xff08;Network Mask&#xff09;&#x…

【機器學習】吳恩達機器學習課程代碼作業-Python版本

吳恩達老師的機器學習課程作業是MATLAB版本&#xff08;Octave&#xff09;的&#xff0c;現在有點過時了&#xff0c;我參考了幾位大牛的代碼&#xff0c;將作業改成了Python3.6版本&#xff0c;并做了中文注釋&#xff0c;推薦使用Jupyter notebook。Python作業使用了原版數據…

2025年人工智能、虛擬現實與交互設計國際學術會議

重要信息 官網&#xff1a;www.aivrid.com 時間&#xff1a;2025年10月17-19日 地點&#xff1a;中國-東莞 部分介紹 征稿主題 包括但不限于&#xff1a; 生物特征 模式識別 機器視覺 專家系統 深度學習 智能搜索 自動編程 智能控制 智能機器…