macos電腦本地搭建mistral-7b大模型出現4-bit量化和緩存不足問題的記錄

問題背景

本人想再本地筆記本電腦上搭建一個mistral-7b的大模型,在搭建的過程中,出現了4-bit量化模式無法處理的問題,以及電腦內存/顯存不足的問題,導致無法搭建

電腦硬件信息

名稱:2019 Mac book pro
內存:32G
硬盤:512G
無獨立顯卡

大模型信息

名稱:mistralai/Mixtral-8x7B-Instruct-v0.1
下載地址:https://huggingface.co/mistralai/Mixtral-8x7B-Instruct-v0.1
文件個數:36
文件總大小:177G
模型特點:開源 | 免費

錯誤信息

4-bit量化錯誤在這里插入圖片描述

啟用4-bit量化模式時,需要安裝最新的bitsandbytes模塊,當前(2025.06.18)該模塊最新的版本是0.46,但是由于蘋果電腦芯片的原因,pytorch并未出macos版本的,故適配于macos版本的當前只停留在了0.42版本,無法升級。可以參考這篇文章。故無法搭建

電腦內存/顯存不足錯誤

這個問題就是電腦硬件的問題了,內存或者是顯存不足,導致無法分配空間

在這里插入圖片描述

解決方式

1、別搭建了,早點洗洗睡
2、選擇云服務器,但是成本可能就高了
3、自己擁有一個性能比較強悍的筆記本 or 臺式機 or 服務器。
備注:有錢人選擇,你值得擁有

END

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/84109.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/84109.shtml
英文地址,請注明出處:http://en.pswp.cn/web/84109.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

C# 基礎知識總結(帶詳細文字說明)

1. 基礎語法結構 C# 程序由命名空間、類和方法組成。每個程序必須有一個 Main 方法作為入口點。using 指令用于導入命名空間,Console.WriteLine() 是常用的輸出方法。 csharp 復制 下載 using System; // 引入核心命名空間class Program // 類定義 {static v…

C#最佳實踐:為何要統一命名

C#最佳實踐:為何要統一命名 在 C# 編程的世界里,代碼就像是一座龐大的數字城市,而命名則是城市中縱橫交錯的街道名稱與建筑標識。如果沒有統一的命名規范,這座城市將陷入混亂,開發者在其中探索、維護代碼時也會迷失方向。統一命名不僅是一種編程習慣,更是保障代碼質量、…

通過后端連接Opengauss數據庫的方法

文章目錄 通過后端連接Opengauss數據庫的方法一、為什么默認不能訪問?二、要讓普通用戶從宿主機訪問數據庫,需要以下幾個步驟:1. 使用 omm 超級用戶登錄數據庫2. 創建一個應用程序專用用戶,并設置密碼3. 提供給應用程序專用用戶對…

AWS Config:概述、優勢以及如何開始?

在當今云原生架構快速發展的背景下,越來越多企業意識到資源配置管理和合規性審查的重要性。作為 AWS 官方授權代理商,在云上致力于為企業客戶提供全面、可靠的云服務解決方案,幫助企業輕松上云、合規運營。本文將為您詳細解讀 AWS Config ——…

金融領域LLM開源測試集

BizFinBench 中文 金融業務場景基準數據集 結合迭代校準評估框架IteraJudge,對25個先進LLM進行全面評估,發現在金融AI領域與人類期望存在顯著性能差距。 https://arxiv.org/pdf/2505.19457 https://github.com/HiThink-Research/BizFinBench/tree/m…

跨語言RPC:使用Java客戶端調用Go服務端的JSON-RPC服務

在分布式系統開發中,不同編程語言之間進行通信是一個常見的需求。通過遠程過程調用(RPC)技術,我們可以讓不同的程序像調用本地方法一樣調用遠程的服務。本文將介紹如何使用Go語言編寫一個簡單的JSON-RPC服務,并使用Jav…

UE5 創建AI控制器、AI行為樹和黑板

UE5 創建AI控制器、AI行為樹和黑板 一、創建AI控制器AIController(大腦) 二、創建AI行為樹和黑板 1:AI人工智能 2:行為樹 3:黑板 三、AI行為樹藍圖和添加黑板 1:添加黑板(腦電波)…

CDN加速導致CLS升高圖片托管服務器的3個選擇標準!

許多網站為了提升加載速度,會采用CDN加速服務分發圖片等靜態資源 這樣做可能導致CLS(累積布局偏移)指標升高,拖累SEO評分。 這一問題通常源于CDN的異步加載機制或圖片尺寸未預定義,使得頁面布局在渲染過程中頻繁變動。…

MySQL(77)如何設置自動備份任務?

設置自動備份任務可以確保你的數據庫定期備份,防止數據丟失。以下是如何使用 Bash 腳本和 Cron 任務在 Linux 系統上設置 MySQL 數據庫的自動備份任務的詳細步驟和代碼示例。 1. 編寫備份腳本 首先,我們需要編寫一個備份腳本。這個腳本將包含執行備份的…

.NET 開發中全局數據存儲的幾種方式

文章目錄 一、靜態類與靜態成員實現方式特點優缺點 二、應用程序配置系統1. appsettings.json (ASP.NET Core)使用方式2. 用戶設置 (WinForms/WPF)特點 三、依賴注入容器ASP.NET Core 示例特點 四、內存緩存 (IMemoryCache)實現方式特點 五、分布式緩存 (IDistributedCache)實現…

人才爭奪戰關鍵期,AI如何賦能招聘效率倍增、精準選拔

數智化轉型浪潮席卷全球的今天,人才作為企業核心競爭力的地位日益凸顯。而在傳統招聘流程,尤其是面試環節正面臨效率瓶頸、體驗短板等多項挑戰,典型如: 耗時冗長的篩選與安排;難以避免的主觀評價偏差;海量…

介紹下分布式ID的技術實現及應用場景

什么是分布式ID 分布式ID是指在分布式系統中生成的特定范圍內唯一的標識符,如訂單號、商品ID、鏈路追蹤TraceID。 隨著業務發展,對分布式ID的要求越來越高,其中最基本的要求如下 全局唯一:在任何節點、任何時間生成的ID都必須是…

【leetcode-字母異位詞分組】

排序法 public List<List<String>> groupAnagrams(String[] strs) {//最終值List<List<String>> result new ArrayList<>();//排序法HashMap<String,List<String>> map new HashMap<>(); //遍歷strfor(String str : strs){/…

langchain從入門到精通(九)——ChatGPT/Playground手動模擬記憶功能

1. 摘要緩沖混合記憶 摘要緩沖混合記憶中&#xff0c;所需的模塊有&#xff1a; chat_message_history&#xff1a;存儲歷史消息列表。moving_summary_buffer&#xff1a;移除消息的匯總字符串。summary_llm&#xff1a;生成摘要的 LLM&#xff0c;接收 summary&#xff08;當…

docker單點安裝Hadoop

1、Docker中拉取jdk8鏡像 拉取鏡像 docker pull openjdk:8-jdk 查看jdk docker run -it openjdk:8-jdk bash which java 2、安裝ubuntu源 拉取鏡像 docker pull ubuntu:22.04 保存 docker save -o ubuntu-22.04.tar.gz ubuntu:22.04 移動到自己想要的目錄 mv /roo…

uniapp項目之小兔鮮兒小程序商城(二) 首頁的實現:自定義導航欄,輪撥圖,前臺分類,熱門推薦,猜你喜歡,下拉刷新,骨架屏

文章目錄 零.首頁最終效果一.自定義導航欄1.新建pages/index/components/CustomNavbar.vue首頁子組件2.在首頁pages/index/index.vue中引入3.隱藏默認導航欄修改標題顏色4.適配不同機型使用到了uniapp的一個api:獲取屏幕邊界到安全區域的距離在子組件中使用 二.輪撥圖1.新建 sr…

RustDesk自建遠程服務器

目錄 服務端 環境linux 安裝 開放端口 客戶端配置 下載客戶端 安裝后配置網絡 參考&#xff1a;RustDesk自建遠程服務器_rustdesk自建服務器-CSDN博客 服務端 環境 linux 安裝 下載 wget https://github.com/rustdesk/rustdesk-server/releases/download/1.1.8-2/r…

【Axure高保真原型】圖片伸縮展示列表

今天和大家分享圖片伸縮展示列表的3個原型案例&#xff0c;模版都是用中繼器制作的&#xff0c;所以使用也很方便&#xff0c;在中繼器表格里導入對應的圖片&#xff0c;即可自動生成交互效果&#xff0c;具體效果可以點擊下方視頻觀看或打開下方預覽地址查看哦 【原型效果】 …

keil新建工程文件結構和每個文件的作用解析(標準庫版本)

通過網盤分享的文件:STM32工程模板 鏈接:https://pan.baidu.com/s/1YPFgXu1kwuwsCVxrXFSjZg?pwd=1111 提取碼: 1111 --來自百度網盤超級會員v5的分享 這個工程模版是來源于B站江科大的模版,每個人搭建工程文件結構不一樣,僅供參考。 工程文件目錄結構如圖所示 1、DebugC…

【AI論文】Saffron-1:LLM安全保證的推理縮放范例

摘要&#xff1a;現有的安全保證研究主要集中在培訓階段的協調&#xff0c;以向LLM灌輸安全行為。 然而&#xff0c;最近的研究表明這些方法容易受到各種越獄攻擊。 同時&#xff0c;推理擴展顯著提高了LLM推理能力&#xff0c;但在安全保證方面仍未得到探索。 為了解決這一差距…