VLM MobileVLM 部署筆記

目錄

模型是自動下載的

在1060顯卡上能跑

LLaMA?Meta

MobileVLM V2

MobileLLaMA-1.4B 調錯


開源項目地址:

GitHub - Meituan-AutoML/MobileVLM: Strong and Open Vision Language Assistant for Mobile Devices

模型是自動下載的

路徑:

C:\Users\xxx\.cache\huggingface\hub

models--mtgv--MobileLLaMA-1.4B-Chat

在1060顯卡上能跑

LLaMA?Meta

2023年7月,Meta公司發布了人工智能模型LLaMA 2的開源商用版本

MobileVLM V2

from scripts.inference import inference_once
# model_path = "mtgv/MobileVLM-1.7B" # MobileVLM
model_path = "mtgv/MobileVLM_V2-1.7B" # MobileVLM V2
image_file = "assets/samples/demo.jpg"
prompt_str = "Who is the author of this book?\nAnswer the question using a single word or phrase."
# (or) What is the title of this book?
# (or) Is this book related to Education & Teaching?args = type('Args', (), {"model_path": model_path,"image_file": image_file,"prompt": prompt_str,"conv_mode": "v1","temperature": 0,"top_p": None,"num_beams": 1,"max_new_tokens": 512,"load_8bit": False,"load_4bit": False,
})()inference_once(args)

MobileLLaMA-1.4B 調錯


import torch
from transformers import LlamaTokenizer, LlamaForCausalLMmodel_path = 'mtgv/MobileLLaMA-1.4B-Chat'tokenizer = LlamaTokenizer.from_pretrained(model_path)
model = LlamaForCausalLM.from_pretrained(model_path, torch_dtype=torch.float16, device_map='auto',
)prompt = 'Q: What is the largest animal?\nA:'
input_ids = tokenizer(prompt, return_tensors="pt").input_ids.cuda()generation_output = model.generate(input_ids=input_ids, max_new_tokens=32
)
print(tokenizer.decode(generation_output[0]))

原版報錯:

RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu! (when checking argument for argument index in method wrapper_CUDA__index_select)

改進后,發現input_ids需要改為cuda運行, input_ids.cuda()

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/22163.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/22163.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/22163.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

解決Mac ~/.bash_profile 配置的環境變量重啟終端后失效問題

在Mac系統中,配置環境變量通常是在~/.bash_profile文件中進行。然而,有時會遇到配置的環境變量在重啟終端后失效的問題。 解決辦法: 在~/.zshrc文件最后或最前面,增加一行 source ~/.bash_profile

SARscape雷達圖像處理軟件簡介

合成孔徑雷達(SAR)擁有獨特的技術魅力和優勢,漸成為國際上的研究熱點之一,其應用領域越來越廣泛。SAR數據可以全天候對研究區域進行量測、分析以及獲取目標信息。高級雷達圖像處理工具SARscape,能讓您輕松將原始SAR數據…

Leetcode 第 131 場雙周賽題解

Leetcode 第 131 場雙周賽題解 Leetcode 第 131 場雙周賽題解題目1:3158. 求出出現兩次數字的 XOR 值思路代碼復雜度分析 題目2:3159. 查詢數組中元素的出現位置思路代碼復雜度分析 題目3:3160. 所有球里面不同顏色的數目思路代碼復雜度分析 …

AI 時代,產品經理該如何進化

前言 傳統的互聯網業務或者游戲業務,產品或者業務輸出需求,技術人員只需要指哪打哪就好了。而人工智能發展到當下這個尷尬的階段,仿佛它能干很多事,但是真把它往業務里擱就發現,這個叛逆的小東西不一定勝任的了這些有…

AI大模型學習筆記之四:生成式人工智能是如何工作的?

OpenAI 發布 ChatGPT 已經1年多了,生成式人工智能(AIGC)也已經廣為人知,我們常常津津樂道于 ChatGPT 和 Claude 這樣的人工智能系統能夠神奇地生成文本與我們對話,并且能夠記憶上下文情境。 GPT-4多模態分析對話 Midj…

數字機頂盒、顯示器方案DCDC芯片OC5816 2A,18V同步降壓DC-DC

概述 OC5816 是一款 2A 的高集成度、高效率同步整流降壓轉換器。在一個相當寬的輸出電流負載范圍內,OC5816 可以高效工作。 OC5816 的兩種工作模式,固定頻率PWM 峰值電流控制和輕載 PFM 開關模式,允許系統高效工作在一個相當寬的輸出電流…

i 人 聊 天 手 冊(e人禁止入內)

在之前的讀書筆記-《蔡康永的說話之道》中,作者給大家分享了很多具體的要點,其更偏向于戰術層面,我更想要的是一個類似聊天手冊的東西,就讓我自己來總結下吧。 雖然在 MBTI 中,按照獲取能量的方式定義了 i 人、e 人&a…

【面試干貨】如何選擇MySQL數據庫存儲引擎(MyISAM 或 InnoDB)

【面試干貨】如何選擇MySQL數據庫存儲引擎(MyISAM 或 InnoDB) 💖The Begin💖點點關注,收藏不迷路💖 MySQL數據庫存儲引擎是一個 關鍵 的考慮因素。MySQL提供了多種存儲引擎,其中最常用的是 MyISAM 和 InnoD…

封裝一個頁面自適應方法

封裝一個頁面自適應方法 在 Vue 中,你可以封裝一個頁面自適應的方法來根據屏幕大小動態調整頁面的布局和樣式。以下是一個示例代碼: export const getPageSize () > {const { innerWidth, innerHeight } window;const width innerWidth > 192…

攻防世界---misc---a_good_idea

1、下載附件得到一張圖片,winhex分析,發現有壓縮包 2、在kali中用普通用戶對jpg進行binwalk 3、得到兩張圖片和一個文本,查看文本信息:提示試著找到像素的秘密 4、提到像素就想到了Stegsolve這個工具,將這兩張圖片用該…

rpm打包 postgres14.9 repmgr pgpool

rpm打包 postgres14.9 repmgr pgpool 上一篇講解了rpm打包的基礎知識之后,我們就可以根據實際業務自行打包了,需要注意的是依賴問題,需要提前講依賴準備好,對于各種系統需要的依賴的依賴也不一致,可以根據具體報錯去相…

Python項目開發實戰:二手房數據分析預測系統(案例教程)

一、項目背景與意義 在房地產市場日益繁榮的今天,二手房市場占據了重要地位。對于購房者、房地產中介和開發商來說,了解二手房市場的動態、價格趨勢以及潛在價值至關重要。因此,開發一個基于Python的二手房數據分析預測系統具有實際應用價值和商業意義。本項目旨在利用Pytho…

2024.05.21 校招 實習 內推 面經

綠*泡*泡VX: neituijunsir 交流*裙 ,內推/實習/校招匯總表格 1、實習 | 云鯨智能暑期實習熱招崗位(內推) 實習 | 云鯨智能暑期實習熱招崗位(內推) 2、實習 | 亞馬遜實習生招聘倒計時! 實習…

HOW - Lodash 使用指南和源碼學習

目錄 一、什么是 lodash二、為什么需要 Lodash三、API 分類ArrayCollectionDateFunctionLangMathNumberObjectStringSeqUtil 我們經常在項目里遇到 Lodash 函數的引入,如: debounce(Function)cloneDeep(Lang)isNull(Lang)isUndefined(Lang)isNil(Lang)i…

106、python-第四階段-3-設計模式-單例模式

不是單例類,如下: class StrTools():pass str1StrTools() str2StrTools() print(str1) print(str2) 運用單例,先創建一個test.py class StrTools():pass str1StrTools()然后創建一個hello.py,在這個文件中引用test.py中的對象&a…

JVM-JAVA-雙親委派機制

雙親委派機制 雙親委派機制Tomcat打破雙親委派機制 雙親委派機制 雙親委派機制,加載某個類時會先委托父加載器尋找目標類,找不到再委托上層父加載器加載,如果所有父加載器在自己的加載類路徑下都找不到目標類,則在自己的類加載路徑…

網絡攻擊的常見形式

開篇 本篇文章來自于《網絡安全 ——技術與實踐》的學習整理筆記。 正篇 口令竊取 相比于利用系統缺陷破壞網絡系統,最容易的方法還是通過竊取用戶的口令進入系統。因為人們傾向于選擇很糟糕的口令作為登錄密碼,所以口令猜測很容易成功。通常&#xff0…

C語言:基礎知識

創作不易,友友們給個三連吧 一、C語?的基本概念與發展歷史 1.1 人和計算機進行交流的語言 通常,我們使用英語、中文等語言來進行兩個人之間的交流。這意味著當我們想要和他人進行交流時,我們需要一種語言來表達自己的感受。同樣的&#xf…

10分鐘了解ERP軟件系統

ERP(Enterprise Resource Planning,企業資源規劃)軟件是一種集成的管理信息系統,旨在通過優化公司內部資源的分配和使用,提高企業的運營效率和管理水平。ERP系統通常包含多個功能模塊,這些模塊覆蓋了企業運…

喜訊!易知微入選2024年第一批浙江省專精特新中小企業

近日,杭州市經濟和信息化局對2024年第一批浙江省專精特新中小企業名單進行公示。 圖片 經過專業化程度、技術創新與研發能力、品牌影響力、經營管理水平等多方面因素的考量篩選,杭州易知微科技有限公司榮幸地入選了2024年第一批浙江省專精特新中小企業…