如何在本地一鍵配置最強國產大模型

自從OpenAI的ChatGPT橫空出世以來,國內外各類大語言模型(LLM)層出不窮,其中不乏Google的Gemini、Claude、文心一言等等。相較于競爭激烈的商業模型賽道,以Llama為代表的開源大模型的進步速度也十分驚人。

伴隨著大語言模型的百花齊放,如何評價一個模型的各項指標與綜合能力成了新的問題,其中大規模多任務語言理解(MMLU-Massive Multitask Language Understanding)是評估語言模型能力最常用和權威的基準之一,它由約 16,000 個多項選擇題組成,涵蓋數學、哲學、法律和醫學等 57 個學科。

在最新的以MMLU為基準的大語言模型排行榜上,國產的開源大模型通義千問Qwen2和零一萬物Yi-Large在與Claude3、ChatGPT4o、Gemini等商業模型的競爭中不遑多讓,名列前茅。

通常情況下我們都是在線使用大語言模型,難免會遇到網絡不便、賬號受限等問題,既然國產開源大模型已經有了如此強大的性能,能否將其部署在本地來使用呢?

答案是可以的,而且對計算機配置的需求比各位想象的低很多。

本地大模型框架ollama介紹

既然想要在本地計算機或服務器配置大模型,就不得不提到一個神器 — Ollama

Ollama是一個開源框架,專門設計用于在本地運行大型語言模型。 它的主要特點是將模型權重、配置和數據捆綁到一個包中,從而優化了設置和配置細節,包括GPU使用情況,簡化了在本地運行大型模型的過程。

Ollama一開始僅支持macOS和Linux操作系統,近期也推出了支持Windows系統的預覽版。

這里以Windows系統為例,首先在官網或GitHub下載并安裝Ollama,注意系統版本要求Windows 10及以上

官網下載:https://ollama.com/download

GitHub:https://github.com/ollama/ollama/releases

下載完成后進行安裝

安裝界面

安裝過程

ollama沒有GUI,安裝完成后需要在PowerShell或命令行進行使用。

在PowerShell運行命令:ollama help將顯示 Ollama 中的可用命令。

ollama幫助頁面

通過輸入“ollama + 可用命令”即可對ollama進行操作,例如:

  • ollama list:顯示模型列表。
  • ollama show:顯示模型的信息
  • ollama pull:拉取模型
  • ollama push:推送模型
  • ollama cp:拷貝一個模型
  • ollama rm:刪除一個模型
  • ollama run:運行一個模型

安裝并運行本地模型

完成ollama的安裝并熟悉了基本操作后,可以開始安裝所需的模型了。

在ollama官方網站的模型頁面可以瀏覽支持的開源模型列表。

模型列表

這里選擇國產qwen2模型,ollama支持0.5b、1.5b、7b、72b四種參數規模(b即billion,十億參數量),可根據個人硬件配置與存儲空間進行選擇,經過實測,擁有NVidia獨顯的筆記本電腦完全可以跑的動7b模型。

硬件需求:

  • RAM: 7B模型推薦16GB,70B需要64GB或更多。
  • GPU: 具有至少8GB 顯存的GPU,最好是支持CUDA的NVIDIA GPU。

在下圖標記1出選擇對應參數的模型,標記2處會自動切換至該模型的安裝命令,復制命令并在PowerShell中運行即可進行下載安裝。

選擇模型參數規模

這里選擇安裝qwen2:7b模型。

模型安裝過程

模型文件的保存路徑為:

C:\Users\“你的用戶名”\.ollama\models\

安裝完成后即可進行對話。

在每次使用前請先確認ollama服務已經開啟,可在開始菜單啟動ollama或創建快捷方式,ollama啟動后會在系統任務欄顯示圖標。

接著在PowerShell通過ollama run qwen2啟動模型。

進階使用方法

很顯然,通過PowerShell與本地大模型進行對話不是那么的方便,ollama支持很多桌面客戶端通過端口進行調用,其默認使用11434端口,可通過 http://localhost:11434 訪問。

聊天對話推薦使用chatbox,可實現無需部署,開箱即用,內置大量prompt可以最大程度的發揮模型的能力。

官網:https://chatboxai.app/zh

Github:https://github.com/Bin-Huang/chatbox

設置chatbox使用本地模型

翻譯、潤色、總結等功能推薦使用OpenAI Translator,其最初是ChatGPT API 的劃詞翻譯瀏覽器插件和跨平臺桌面端應用,但目前同樣支持ollama的本地模型。

Github:https://github.com/Bin-Huang/chatbox

設置OpenAI Translator使用本地模型

總結

ollama不僅可以讓我們在本地隨時隨地使用大語言模型不受網絡、賬戶等限制,同時可以利用ollama提供的api接口開發基于各類大語言模型的應用與服務,并且ollama支持安裝多個模型,方便我們進行對比和使用。

ollama的特點可以總結為:

  • 開源:開源推動項目的持續發展。
  • 開箱即用:一條命令的方式,簡化了大量的工作,降低了門檻。
  • 可擴展:可以和很多工具進行集成使用,有更多的玩法。
  • 輕量化:不需要太多的資源,個人電腦完全可以勝任。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/38608.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/38608.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/38608.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CP AUTOSAR標準之MemoryAccess(AUTOSAR_CP_SWS_MemoryAccess)(更新中……)

1 簡介和功能概述 該規范描述了AUTOSAR基礎軟件模塊內存訪問(MemAcc)的功能、API和配置。 ??內存訪問模塊通過基于地址的API提供對不同內存技術設備的訪問。內存訪問模塊始終由一個或多個內存驅動程序(Mem)補充。內存訪問模塊與內存設備技術無關,可與閃存、EEPROM、RAM或相變…

Python Tkinter:開發一款文件加密解密小工具

在這個信息泄露風險日益增加的時代,使用文件加密工具對于保護個人隱私和企業機密至關重要。 本文介紹了一款小工具——encryptDecrypt,它不僅提供了一個易于使用的圖形界面,簡化了加密和解密過程,還確保了數據的安全性&#xff0c…

深入解析 androidx.databinding.BaseObservable

在現代 Android 開發中,數據綁定 (Data Binding) 是一個重要的技術,它簡化了 UI 和數據之間的交互。在數據綁定框架中,androidx.databinding.BaseObservable 是一個關鍵類,用于實現可觀察的數據模型。本文將詳細介紹 BaseObservab…

python-求s=a+aa+aaa+aaaa+aa...a的值(賽氪OJ)

[題目描述] 求 saaaaaaaaaaaa...a 的值,其中 a 是一個一位的整數。 例如 :2222222222222222(此時共有 5 個數相加)。輸入格式: 整數 a 和 n ( n 個數相加)。輸出格式: s 的值。樣例輸入 2 2樣例輸出 24數據…

WSL——忘記root密碼(Ubuntu)

1、問題描述 Windows下的WSL(Ubuntu)忘記了root密碼,無法使用管理員權限。 2、解決方法 關閉 Ubuntu 窗口。打開 Windows 的 Powershell 或 cmd, 以 root 默認登陸 WSL。 wsl -u root 修改對應用戶密碼。 # xxx為要修改密碼的用…

Stable Diffusion【真人模型】:人臉特美的人像攝影大模型wuhaXL_realisticMixV3.0

今天和大家分享一個基于SDXL的真人大模型:wuhaXL_realisticMix。該模型無需使用LORA**就能生成的特別漂亮的人臉,雖然有時候人臉有些假,但是生成的人臉確實非常漂亮。 該模型底模融合了WhiteXL_realisticMix,訓練素材來自于視頻轉…

Dockerfile構建一個包含多個SpringBoot應用程序的鏡像

為什么要使用Dockerfile 構建一個包含多個SpringBoot應用程序的鏡像呢? 1、可移植性:Dockerfile 定義了一個標準化的方式來構建Docker鏡像,意味著無論在哪個系統上(只要它支持Docker), 都可以使用相同的Dockerfile來構建完全相同的…

pytorch統計學分布

1、pytorch統計學函數 import torcha torch.rand(2,2) print(a) print(torch.sum(a, dim0)) print(torch.mean(a, dim0)) print(torch.prod(a, dim0))print(torch.argmax(a, dim0)) print(torch.argmin(a, dim0)) print(torch.std(a)) print(torch.var(a)) print(torch.median…

如何學好AI繪畫?點這里有答案!

前言 地獄難度的求職模式下,“掌握一門技術”的那部分求職者,遠比其他人更有競爭力;而擁有出色技術和技能的設計師、以及未來想做設計師的小伙伴們,怎么才能更好實現工作自由? 只有兩個字:學習。 學習新…

EE trade:白銀什么情況下會暴漲

白銀價格的暴漲通常由多種因素共同作用引發,包括宏觀經濟背景、市場供需變化、地緣政治緊張局勢以及金融市場波動等。本文整理了一些具體情況和實例,說明白銀在什么情況下可能會暴漲。 1. 宏觀經濟因素 通貨膨脹急劇上升 背景:當通貨膨脹急…

電腦怎么錄屏幕視頻帶聲音?2種方法教會你

在數字時代的浪潮中,電腦屏幕視頻錄制已經成為一項潮流且實用的技能。無論是為了創作短視頻、分享游戲過程,還是為了記錄在線會議或教程,電腦錄屏都是非常重要的功能。但是不少的人都會遇上錄制好的視頻沒有聲音的困境,面對這種情…

Jenkins的一些記錄

設置環境變量 在 Jenkins 流水線中,取決于使用的是聲明式還是腳本式流水線,設置環境變量的方法不同。 聲明式流水線支持 environment 指令,而腳本式流水線的使用者必須使用 withEnv 步驟。 pipeline {agent anyenvironment { CC clang}stag…

權限控制在軟件開發中的重要性和實施方法

權限控制在軟件開發中的重要性和實施方法 大家好,我是免費搭建查券返利機器人省錢賺傭金就用微賺淘客系統3.0的小編,也是冬天不穿秋褲,天冷也要風度的程序猿! 1. 為什么權限控制很重要? 權限控制是軟件開發中不可或…

HTML5+CSS3+JS小實例:圖片九宮格

實例:圖片九宮格 技術棧:HTML+CSS+JS 效果: 源碼: 【HTML】 <!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1…

操作系統精選題(四)(論述題)

&#x1f308; 個人主頁&#xff1a;十二月的貓-CSDN博客 &#x1f525; 系列專欄&#xff1a; &#x1f3c0;操作系統 &#x1f4aa;&#x1f3fb; 十二月的寒冬阻擋不了春天的腳步&#xff0c;十二點的黑夜遮蔽不住黎明的曙光 目錄 前言 一、銀行家算法的一道例題 二、頁…

二叉搜索樹的實現與測試

目錄 1.二叉搜索樹的結構與特性 2.二叉搜索樹的實現 &#xff08;1&#xff09;節點 &#xff08;2&#xff09;功能實現 插入&#xff1a; 刪除&#xff1a; 查找: 打印&#xff1a; 3.測試 插入刪除&#xff1a; 查找&#xff1a; 4.變種測試&#xff0c;即帶valu…

vue3 【提效】自動注冊組件 unplugin-vue-components 實用教程

還在為每次都要導入組件而煩惱嗎 &#xff1f; // 每次都需手動導入組件 import webName from /components/webName.vue用 unplugin-vue-components 來幫你吧&#xff0c;以后組件直接拿來用即可&#xff0c;無需再導入啦 &#xff01; <webName />使用流程 1. 安裝 un…

audio ref獲取后 pause失效

this.$refs[soundaudititem].pause()失效&#xff0c;通過ref獲取后&#xff0c;調用pause不生效 后來使用id&#xff0c;生效 let audio document.getElementById(soundaudititem) audio.pause()

機器學習模型訓練過程和預測過程 用孩子來生動的比喻 --九五小龐

訓練過程&#xff1a;孩子在學習知識 想象一下&#xff0c;一個年幼的孩子剛開始學習新知識&#xff0c;這就像是機器學習的模型訓練過程。 收集教材&#xff1a;孩子首先得到了一本教科書或一系列學習材料&#xff0c;這些材料就像機器學習中的數據集&#xff0c;包含了各種…

邏輯這回事(七)---- 器件基礎

Xilinx FPGA創建了先進的硅模塊(ASMBL)架構,以實現FPGA具有針對不同應用程序領域優化的各種功能組合的平臺。通過這一創新,Xilinx提供了更多的設備選擇,使客戶能夠為其特定設計選擇具有正確的功能和功能組合的FPGA。ASMBL體系結構通過以下方式突破了傳統的設計障礙:消除幾…