本地AI大模型工具箱 Your local AI toolkit:LMStudio

LMStudio介紹

官網:LM Studio - Discover, download, and run local LLMs

LMStudio?是一個面向機器學習和自然語言處理的,旨在使開發者更容易構建和部署AI語言模型的應用軟件。

LMStudio的特點是:

完全本地離線運行AI大模型

可以從Huggingface查找下載最新的大模型

為本地應用提供AI模型調用

對話可以附帶本地pdf、docx等文檔

跟Ollama的不同

基本感覺LMStudio跟Ollama類似,都可以提供本地運行大模型,本地API調用等功能。但是Ollama更專注于開箱即用,為其它應用使用大模型提供大模型API調用,軟件界面比較簡單,Ollama本身只提供了命令行形式的chat。

LMStudio?提供了集成開發環境,下載模型和chat對話等都可以通過點擊鼠標實現,對新手更友好。

另外Ollama構建了自己的模型庫(網站),LMStudio則是使用huggingface模型庫(資源)。因此LMStudio支持的模型更多,而Ollama則使用起來更快捷。

第一次接觸它的時候,因為沒有科學上網,發現完全不能用,就放棄了它。

后來,是因為在各種AI軟件的API提供者配置中,大部分都有“LMStudio”大模型服務商這個設置,證明它還是比較流行的。

實踐

從官網下載安裝包:LM Studio - Discover, download, and run local LLMs

windows、Linux、MacOS等系統下都有安裝包,直接下載安裝即可。

啟動配置

常用的三個快捷鍵:

Ctrl+Shift+M尋找模型

Ctrl+Shift+R 設置運行架構

Ctrl+Shift+H 查看當前硬件

LMStudio運行架構最低需求是CPU+AVX2 ,跟Ollama的要求一樣,但其實Ollma是可以在CPU+AVX架構下運行deepseek-r1的1.5b和7b模型的。

搜尋模型

準備加載模型,先按Ctrl+Shift+M到Huggingface尋找模型。?

如果沒有科學上網,到了這步就會卡住,這也是LMStudio這個優秀軟件為什么我以前接觸了一下就沒再使用的原因,當時發現無法下載模型,這個軟件就是一個空殼子,啥也干不了。

手動下載模型安裝

使用transformers手動下載模型,比如

# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLMtokenizer = AutoTokenizer.from_pretrained("HuggingFaceTB/SmolLM2-135M")
model = AutoModelForCausalLM.from_pretrained("HuggingFaceTB/SmolLM2-135M")

模型下載到C:\Users\<YourUsername>\.cache\huggingface\hub 目錄下。

在LMStudio “我的模型”配置頁面,將模型目錄設置為transformers的下載目錄,即可看到當前系統的模型:

但是在chat界面選擇這幾個模型,都無法加載,報錯:

No LM Runtime found for model format 'onnx'!?

No LM Runtime found for model format 'torchSafetensors'!

按照提示的,pip安裝了torchSafetensors

pip install safetensors

問題還是沒有解決

嘗試轉換格式(失敗)

使用如下命令可以轉格式,但是不會轉配置文件啊?

import torch
from safetensors.torch import load_file, save_filedef safetensors_to_bin(safetensors_path, bin_output_path):# 加載Safetensors格式的模型權重weights = load_file(safetensors_path)# 將模型權重轉換為PyTorch張量,并保存為.bin格式state_dict = {k: v.clone().cpu() for k, v in weights.items()}torch.save(state_dict, bin_output_path)# 示例用法
safetensors_to_bin('model.safetensors', 'model_converted.bin')

比如源文件位置設為inputx:?

inputx = "C:\\Users\\Admin\\.cache\\huggingface\\hub\\models--HuggingFaceTB--SmolLM2-135M\\snapshots\\93efa2f097d58c2a74874c7e644dbc9b0cee75a2\\model.safetensors"

safetensors_to_bin(inputx, 'model_converted.bin')?

轉換之后,發現沒有那些配置文件啊

把ollama的整個模型存儲目錄暴露給LMStudio,加載模式還是報錯:

No LM Runtime found for model format 'gguf'!

估計真正的問題,是cpu只支持avx,不支持avx2導致的。也就是架構不支持,Not Compatible的問題。

暫時擱置。

添加國內Huggingface鏡像

發現LMStudio不能到Huggingface下載模型,整個軟件都失去了使用意義。于是決定換鏡像,也就是把huggingface.co?替換為國內鏡像站?hf-mirror.com

以Windows下為例,到LMStudio的安裝目錄,比如:E:\Program Files\LM Studio\resources\app 目錄下,搜索包含hugg字符的文件,搜索到index.js和main_window.js兩個文件:

點開編輯這兩個文件,在文件中查找huggingface.co字符,替換成hf-mirror.com 。

index.js文件中有9處替換,main_window.js中有113處替換。?

替換完畢,重新啟動LMStudio軟件。

測試下載失敗,可能是硬件不符合要求,導致找不到可以下載的模型。

最簡單的解決方案

在LMStudio的設置中,可以勾選:

Use LM Studio's Hugging Face Proxy

據說這是專為上不去HuggingFace的人專設的,大家可以去試試。

我這邊沒有改觀,可能是硬件不符合要求導致。

總結

LMStudio?是一個非常不錯的用于在本地計算機開發和實驗LLM大模型,并可以同時提供LLM API調用服務的桌面程序。就像普通的Windows程序一樣非常易于使用。

但是如果不能科學上網的話,它的易用性就大打折扣了。但是官方也注意到這件事,所以大家可以試試最簡單的那個解決方案。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/74125.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/74125.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/74125.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

[OpenCV】相機標定之棋盤格角點檢測與繪制

在OpenCV中&#xff0c;棋盤格角點檢測與繪制是一個常見的任務&#xff0c;通常用于相機標定。 棋盤格自定義可參考: OpenCV: Create calibration pattern 目錄 1. 棋盤格角點檢測 findChessboardCorners()2. 棋盤格角點繪制 drawChessboardCorners()3. 代碼示例C版本python版本…

redis的典型應用 --緩存

Redis最主要的用途&#xff0c;分為三個方面&#xff1a; 1.存儲數據&#xff08;內存數據庫&#xff09; 2.緩存&#xff08;最常用&#xff09; 3.消息隊列 緩存 (cache) 是計算機中的?個經典的概念。核?思路就是把?些常?的數據放到觸?可及(訪問速度更快)的地?&…

本地基于Ollama部署的DeepSeek詳細接口文檔說明

前文&#xff0c;我們已經在本地基于Ollama部署好了DeepSeek大模型&#xff0c;并且已經告知過如何查看本地的API。為了避免網絡安全問題&#xff0c;我們希望已經在本地調優的模型&#xff0c;能夠嵌入到在本地的其他應用程序中&#xff0c;發揮本地DeepSeek的作用。因此需要知…

基于ArcGIS和ETOPO-2022 DEM數據分層繪制全球海陸分布

第〇部分 前言 一幅帶有地理空間參考、且包含海陸分布的DEM圖像在研究區的繪制中非常常見&#xff0c;本文將實現以下圖像的繪制 關鍵步驟&#xff1a; &#xff08;1&#xff09;NOAA-NCEI官方下載最新的ETOPO-2022 DEM數據 &#xff08;2&#xff09;在ArcGIS&#xff08;…

自動化測試框架pytest+requests+allure

Pytest requests Allure 這個框架基于python的的 Pytest 進行測試執行&#xff0c;并結合 Allure插件 生成測試報告的測試框架。采用 關鍵字驅動 方式&#xff0c;使測試用例更加清晰、模塊化&#xff0c;同時支持 YAML 文件來管理測試用例&#xff0c;方便維護和擴展。 測試…

Retrofit中scalars轉換html為字符串

簡介 在Retrofit中&#xff0c;如果你想直接獲取HTML或其他文本格式的響應內容而不是將其映射到一個模型類&#xff0c;ScalarsConverterFactory 就派上用場了。ScalarsConverterFactory 是一個轉換器工廠&#xff0c;它能夠將響應體轉換為Java基本類型如String、Integer或Byte…

Powershell WSL Windows系統復制數據到ubuntu子系統系統

從本地D盤下拷貝數據到ubuntu子系統下 Powershell 管理員打開執行 /mnt/d 此處是本地Windows系統的路徑表示/opt ubutu 子系統目錄 wsl -d Ubuntu-22.04 -u root -- bash -c cp -rf /mnt/d/nginx.conf /opt/從ubuntu子系統中拷貝數據到本地D盤下 Powershell 管理員打開執行…

【多線程】線程安全集合類,ConcurrentHashMap實現原理

文章目錄 線程安全集合類解決方案多線程環境使用順序表多線程環境使用隊列多線程環境使用哈希表ConcurrentHashMap1. 縮小鎖的粒度2. 充分使用 CAS3. 針對擴容操作 線程安全集合類 ArrayList、Queue、HsahMap… 都是線程不安全的 Vector、Stack、Hashtable 都是線程安全的&am…

spring-tx筆記

編程式事務與聲明式事務的理解 補充&#xff1a;什么是事務&#xff1f; 事務是一個重要概念&#xff0c;尤其在數據庫管理系統中。事務是指一組操作。&#xff0c;這些操作要么全部成功執行&#xff0c;要么全部不執行&#xff0c;確保數據的一致性和完整性 編程式事務 編…

Android第四次面試(Java基礎篇)

一、Java 中的 DCL 單例模式 單例模式是設計模式中最常用的模式之一&#xff0c;其核心目標是確保一個類在程序中僅有一個實例&#xff0c;并提供全局訪問點。在 Java 中&#xff0c;實現單例模式需要兼顧線程安全和性能優化。DCL&#xff08;Double-Checked Locking&#xff0…

Java-SpringBootWeb入門、Spring官方腳手架連接不上解決方法

一. Spring 官網&#xff1a;Spring | Home Spring發展到今天已經形成了一種開發生態圈&#xff0c;Spring提供了若干個子項目&#xff0c;每個項目用于完成特定的功能(Spring全家桶) Spring Boot可以幫助我們非常快速的構建應用程序、簡化開發、提高效率 。 二. Spring Boot入…

1.7 無窮小的比較

1.定義 2.性質 3.無窮小的比較 3.1等價無窮小的性質 3.2 常見等價無窮小

StarRocks 升級注意事項

前段時間升級了生產環境的 StarRocks&#xff0c;從 3.3.3 升級到了 3.3.9&#xff0c;期間還是踩了不少坑所以在這里記錄下。 因為我們的集群使用的是存算分離的版本&#xff0c;也是使用官方提供的 operator 部署在 kubernetes 里的&#xff0c;所以沒法按照官方的流程進入虛…

深入探究 JVM 堆的垃圾回收機制(一)— 判活

垃圾回收分為兩步&#xff1a;1&#xff09;判定對象是否存活。2&#xff09;將“消亡”的對象進行內存回收。 1 判定對象存活 可達性分析算法&#xff1a;通過一系列“GC Roots”對象作為起始節點集&#xff0c;從這些節點開始&#xff0c;根據引用關系向下搜索&#xff0c;…

國產開發板—米爾全志T113-i如何實現ARM+RISC-V+DSP協同計算?

近年來&#xff0c;隨著半導體產業的快速發展和技術的不斷迭代&#xff0c;物聯網設備種類繁多&#xff08;如智能家居、工業傳感器&#xff09;&#xff0c;對算力、功耗、實時性要求差異大&#xff0c;單一架構無法滿足所有需求。因此米爾推出MYD-YT113i開發板&#xff08;基…

Tomcat虛擬主機配置詳解:Centos環境下多域名部署(詳細教程!)

&#x1f3e1;作者主頁&#xff1a;點擊&#xff01; Tomcat服務器&#x1f4dd;專欄&#xff1a;點擊&#xff01; &#x1f427;Linux高級管理防護和群集專欄&#xff1a;點擊&#xff01; ??創作時間&#xff1a;2025年3月18日14點14分 最近在折騰 Tomcat 的時候&…

鴻蒙開發工程師簡歷項目撰寫全攻略

一、項目結構的黃金法則 建議采用「41」結構&#xff1a; 項目背景&#xff08;業務價值&#xff09;技術架構&#xff08;鴻蒙特性&#xff09;核心實現&#xff08;技術難點&#xff09;個人貢獻&#xff08;量化成果&#xff09;附加價值&#xff08;延伸影響&#xff09; …

dfs刷題排列問題 + 子集問題 + 組和問題總結

文章目錄 一、排列問題全排列II題解代碼 優美的排列題解代碼 二、子集問題字母大小寫全排列題解代碼 找出所有子集的異或總和再求和題解代碼 三、組合問題電話號碼的字母組合題解代碼 括號生成題解代碼 組合題解代碼 目標和題解代碼 組合總和題解代碼 總結 一、排列問題 全排列…

【Linux】VMware17 安裝 Ubuntu24.04 虛擬機

目錄 安裝教程 一、下載 Ubuntu 桌面版iso映像 二、安裝 VMware 三、安裝 Ubuntu 桌面版 VMware 創建虛擬機 掛載 Ubuntu ISO 安裝 Ubuntu 系統 安裝教程 一、下載 Ubuntu 桌面版iso映像 鏈接來自 清華大學開源軟件鏡像站 ISO文件地址&#xff1a;ubuntu-24.04.2-des…

CVPR2025 | 對抗樣本智能安全方向論文匯總 | 持續更新中~

匯總結果來源&#xff1a;CVPR 2025 Accepted Papers 若文中出現的 論文鏈接 和 GitHub鏈接 點不開&#xff0c;則說明還未公布&#xff0c;在公布后筆者會及時添加. 若筆者未及時添加&#xff0c;歡迎讀者告知. 文章根據題目關鍵詞搜索&#xff0c;可能會有遺漏. 若筆者出現…