Mac本地部署大模型-單機運行

前些天在一臺linux服務器(8核,32G內存,無顯卡)使用ollama運行阿里通義千問Qwen1.5和Qwen2.0低參數版本大模型,Qwen2-1.5B可以運行,但是推理速度有些慢。

一直還沒有嘗試在macbook上運行測試大模型,不知道單機部署是否會有壓力?

恰好家里有一臺平時用的較少的macbook,因此,簡單做了一些測試,分享給大家,供參考和討論。

電腦配置

所使用的Macbook Pro稍微有些老,配置如下:

  • 機型,MacBook Pro(13 英寸,2019 年)
  • 芯片,四核Intel Core i5 2.4GHz;
  • 圖形卡:Intel Iris Plus Graphics 655 1536 MB =》1.5G顯存,是否能有用?
  • 內存,16G;
  • 系統,macOS Sonoma 14.5

(原來系統Catalina 10.15,發現沒有brew命令,安裝提示系統版本太低,apple已不再支持;同時系統提示,可以升級到最新mac OS,于是安裝升級到最新的系統Sonoma,點擊這里查詢macOS Sonoma 與哪些電腦兼容)

Ollama下載安裝

我們簡單實用Ollama方式運行大模型。

首先從Ollama官網下載安裝包。

Download Ollama on macOS

直接點擊maxOS下載即可,下載的文件是Ollama.zip壓縮文件,解壓后是應用程序(ollama.apk),直接雙擊運行安裝就可以。

安裝完后,在啟動臺,就可以看到這個Ollama的圖標。

大模型下載和運行

接下來就可以從ollama模型庫中,選擇需要的模型,做實驗測試了。

例如:我們選擇阿里通義千問qwen2-1.5B參數的模型:qwen2:1.5b-instruct-q5_K_M

qwen2:1.5b-instruct-q5_K_M

命令行直接運行: ollama run qwen2:1.5b-instruct-q5_K_M

如果下載失敗,再次嘗試即可。

(modelscope) MacBook-Pro ~ % ollama run qwen2:1.5b-instruct-q5_K_M
pulling manifest 
Error: pull model manifest: Get "https://registry.ollama.ai/v2/library/qwen2/manifests/1.5b-instruct-q5_K_M": dial tcp: lookup registry.ollama.ai: i/o timeout(modelscope) deMacBook-Pro ~ % ollama run qwen2:1.5b-instruct-q5_K_M
pulling manifest 
pulling 9d9344b43f5a... 100% ▕████████████████████████████████████████████████████████▏ 1.1 GB                         
pulling 62fbfd9ed093... 100% ▕████████████████████████████████████████████████████████▏  182 B                         
pulling c156170b718e... 100% ▕████████████████████████████████████████████████████████▏  11 KB                         
pulling f02dd72bb242... 100% ▕████████████████████████████████████████████████████████▏   59 B                         
pulling 624b547e1c39... 100% ▕████████████████████████████████████████████████████████▏  487 B                         
verifying sha256 digest 
writing manifest 
removing any unused layers 
success ▏ 120 MB/1.1 GB  930 KB/s  

簡單測試運行,發現執行速度比預期快(幾秒內出結果),實驗情況如下:

>>> 今天是周三,7月4號。7月11號是周幾?
2023年7月11日是星期三。>>> 從下面相應的文本中提取關鍵詞。
... ###
... 文本1:{PicTech提供圖片翻譯API,開發者可以集成圖片翻譯到他們的跨境電商系統中。}
... 關鍵詞1:PicTech, 圖片翻譯API, 開發者, 跨境電商系統
... ##
... 文本2:{Meta公司訓練了非常擅長理解和生成文本的前沿語言模型,并且開源給全世界使用,這種開源精神加速了人類科技的發展,
... 非常值得尊敬。}
... 關鍵詞2:Meta公司, 前沿語言模型, 開源, 人類科技的發展, 尊敬
... ##
... 文本3:{Neil長期從事互聯網行業,對人工智能也非常感興趣,致力于科技改變生活。}
... 關鍵詞3
... ###此題答案為:1、PicTech, 圖片翻譯API, 開發者, 跨境電商系統2、Meta公司, 前沿語言模型, 開源, 人類科技的發展, 尊敬3、Neil, 互聯網行業, 人工智能, 科技改變生活>>> Send a message (/? for help)

結論: 從運行速度來看,運行相同模型(Qwen2-1.5B),在這臺macbook(4核,16G內存)運行速度,比之前在linux單機(8核,32G內存)運行速度要快了不少! 雖然linux機器,從cpu和內存上配置高于我這臺macbook,或許兩個系統在底層加速優化方面,macbook做的較好?!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/41012.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/41012.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/41012.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

我這個經驗好找嵌入式的工作嗎?

大家好,我是麥鴿。最近網友的提問,這樣的經驗,好找嵌入式的工作嗎? 下面是網友的情況: 本人目前大二機器人工程,未來想要入職嵌入式行業,有robomaster比賽經驗本人負責電控,但是由于…

基因組學系列3:基因分型Phasing與單倍型參考序列HRC

1. 基因分型Phasing概念 基因分型,也稱為基因定相、單倍體分型、單倍體構建等,即將一個二倍體(或多倍體)基因組上的等位基因(或雜合位點)正確定位到父親或母親的染色體上,最終使得來自同一親本…

相親交友APP系統婚戀交友社交軟件開發語音視頻聊天平臺定制開發-婚戀相親交友軟件平臺介紹——app小程序開發定制

互聯網飛速發展的時代,相親交友軟件成為了許多年輕人首選的相親方式,越來越多的單身男女希望在婚戀交友軟件平臺上尋找靈魂伴侶,相親交友軟件因此具有很高的市場價值。 多客婚戀相親交友系統是一款定位高端,到手就能運營的成熟婚戀…

軟件測評中心▏軟件驗收測試方法和測試內容簡析

在當今數字化轉型的浪潮下,軟件驗收測試變得越來越重要。軟件驗收測試,顧名思義,是對軟件進行驗收的過程中進行的一項測試。它用于確保軟件在滿足需求、達到預期效果后才能正式交付給客戶使用。軟件驗收測試是一項全面、系統的測試過程&#…

sublime 3 背景和字體顏色修改

sublime 4 突然抽風,每次打開都顯示 “plugin_host-3.3 has exited unexpectedly, some plugin functionality won’t be available until Sublime Text has been restarted” 一直沒調好,所以我退回到sublime 3了。下載好了軟件沒問題,但是一…

半導體光電

《半導體光電》創刊于1976年,是由中國電子科技集團公司主管、重慶光電技術研究所(中國電子科技集團公司第四十四研究所)主辦的中文科技期刊。本刊國內外公開發行,經過四十余年的發展已經成為我國光電子專業領域有代表性的刊物。 …

Zabbix 配置grafana對接

zabbix對接grafana簡介 Zabbix與Grafana對接可以實現更加豐富和美觀的數據可視化,可以讓您利用Grafana強大的可視化功能來展示Zabbix收集的數據。 zabbix插件的兩種安裝方式 使用grafana-cli 命令進行安裝在grafana管理頁面中進入Administration/Plugins and dat…

2024.7.4學習日報

1、ppt前三章 5日計劃 1、至少做到實驗 2、java

css中文字書寫方向

writing-mode 是 CSS 中的一個屬性,用于設置文本、內聯元素、表格單元格和表格列的書寫方向、文本排列以及塊流方向。以下是對 writing-mode 屬性的詳細介紹: 1. 語法和值 語法:writing-mode: horizontal-tb | vertical-rl | vertical-lr |…

在RT-Thread-Studio中添加arm_math庫

1.在CMSIS\Lib\GCC中找到對應的庫,如本文使用的libarm_cortexM4lf_math.a。將庫拷貝到工程,并做如下圖設置。搜索路徑為庫文件在項目中的實際位置。 2.將CMSIS\DSP\Include下的文件復制到工程目錄中,并添加包含路徑 3.添加宏定義&#xff0c…

Memcached緩存預熱深度解析:加速應用性能的秘訣

Memcached緩存預熱深度解析:加速應用性能的秘訣 在高性能計算環境中,Memcached作為一種廣泛使用的分布式內存緩存系統,其緩存預熱機制對于提升應用性能至關重要。緩存預熱可以減少系統啟動時的延遲,避免緩存未命中,從…

2806. 取整購買后的賬戶余額

2806. 取整購買后的賬戶余額 題目鏈接:2806. 取整購買后的賬戶余額 代碼如下: class Solution { public:int accountBalanceAfterPurchase(int purchaseAmount) {return 100-(purchaseAmount5)/10*10;} };

QTreeWidget的簡單使用

使用 QTreeWidget 實現復雜樹控件功能的詳細教程_treewidget 加控件-CSDN博客 #ifndef MAINWINDOW_H #define MAINWINDOW_H#include <QMainWindow> #include <QTreeWidget> namespace Ui { class MainWindow; }class MainWindow : public QMainWindow {Q_OBJECTpu…

阿里巴巴Arthas分析調優JVM實戰及常量池詳解

目錄 一、阿里巴巴Arthas詳解 Arthas使用場景 Arthas命令 Arthas使用 二、GC日志詳解 如何分析GC日志 CMS G1 GC日志分析工具 三、JVM參數匯總查看命令 四、Class常量池與運行時常量池 字面量 符號引用 五、字符串常量池 字符串常量池的設計思想 三種字符串操作…

墨烯的語言技術棧-C語言基礎-005

在VS的安裝路徑下有一個文件: newcfile.cpp的文件 在VS工程中創建新的.c或者.cpp文件的時候,都是拷貝newcfile.cpp這個文件的! everything工具中 有一個newcfile.cpp 然后打開文件路徑在newcfile.cpp 添加#define _CRT_SECURE_NO_WARNINGS替換即可 五.變量的作用域(局部變量…

freemarker生成pdf,同時pdf插入頁腳,以及數據量大時批量處理

最近公司有個需求&#xff0c;就是想根據一個模板生成一個pdf文檔&#xff0c;當即我就想到了freemarker這個遠古老東西&#xff0c;畢竟freemarker在模板渲染方面還是非常有優勢的。 準備依賴&#xff1a; <dependency><groupId>org.springframework.boot</gr…

【IDEA】maven如何進行文件導入,配置并打包

一&#xff0c;介紹、安裝 1、maven介紹 maven是一個Java世界中&#xff0c;構建工具。 核心功能&#xff1a; (1) 管理依賴&#xff1a; 管理文件運行的順序邏輯依賴關系。對配置文件&#xff0c;進行構建和編譯。其也是在調用jdk&#xff0c;來進行編譯打包工作。 (2) 打…

JavaScript中的原型和原型鏈

一、原型&#xff1a;每個函數都有prototype屬性&#xff0c;稱之為原型&#xff0c;這個屬性也是個對象所以也稱之為原型對象。 1.原型可以放一些屬性和方法&#xff0c;供實例對象使用。 <body><script>const arr new Array(1,3,5,7,6)document.getElementByI…

Go語言--延遲調用defer、獲取命令行參數、局部變量以及全局變量

延遲調用defer 關鍵字 defer 用于延遲一個函數或者方法(或者當前所創建的匿名函數)的執行。注意&#xff0c;defer語句只能出現在函數或方法的內部。 defer 語句經常被用于處理成對的操作&#xff0c;如打開、關閉、連接、斷開連接、加鎖、釋放鎖。通過defer 機制&#xff0…