大模型的部署簡單搭建

大模型的部署搭建

真的好久沒有進行博客的寫作了,原因,最近的自己生活有點小波動,

最近想想還是有空寫一篇文章,這篇文章的描述是學習的當下熱門AI

本期,介紹的也是AI相關的LLM(大語言模型)

這個好多人應該都是模糊的,包括我一開始沒有學習,就感覺牛逼的不行,今天我們親自部署實踐下

第一步:Ollama安裝

首先我們需要下載一個管理大模型的軟件Ollama

Ollama下載的地址:有的小伙伴下載不下來,可以私我,給你發離線exe

在這里插入圖片描述

在這里插入圖片描述

接下來,我們靜等安裝成功就可以了

在這里插入圖片描述

檢測是否安裝成功: 在瀏覽器輸入:localhost:11434 如果出現如下圖所示說明已經成功Ollama is running
在這里插入圖片描述

2.打開命令行終端

win+r鍵彈出窗口,輸入cmd,打開cmd窗口,輸入命令ollama,可以看到所有的命令

在這里插入圖片描述

接下來,我們下載大模型

輸入命令:ollama run llama3.2 我們下載的llama3.2的模型

在這里插入圖片描述

下載需要一些時間,我們靜靜的等待就行,直到出現下圖所示,表示安裝成功,接下來,我們進行第二步:

第二步: 安裝和配置UI界面

目的: 為了和本地的模型進行交互,我們也不能一直在黑窗口里面干活啊!哈哈哈!~

安裝可視化界面的軟件: MaxKB: 是基于大語言模型和RAG的知識庫問答系統

當中的RAG我解釋下:

  • 就是Retrieval檢索+ Argument增強+Generation生成這三個詞組成

在安裝之前,我們本地要先安裝dockerDesktop,安裝好deskstop,我們要打開Hyper
在這里插入圖片描述

然后我們打開cmd窗口,輸入如下命令:

docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data 1panel/maxkb
##解釋說明
docker run:啟動一個新容器
-d:以后臺(守護進程)模式運行容器
--name=maxkb:給容器命名為"maxkb"
-p 8080:8080:將主機的8080端口映射到容器的8080端口
-v ~/.maxkb:/var/lib/postgresql/data:將主機的~/.maxkb目錄掛載到容器的/var/lib/postgresql/data目錄
1panel/maxkb:使用的Docker鏡像名稱

等待下載
在這里插入圖片描述

第二種方法:直接一鍵安裝

# Linux 操作系統
docker run -d --name=maxkb --restart=always -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data -v ~/.python-packages:/opt/maxkb/app/sandbox/python-packages registry.fit2cloud.com/maxkb/maxkb# Windows 操作系統
docker run -d --name=maxkb --restart=always -p 8080:8080 -v C:/maxkb:/var/lib/postgresql/data -v C:/python-packages:/opt/maxkb/app/sandbox/python-packages registry.fit2cloud.com/maxkb/maxkb

下載好后:

我們在瀏覽器輸入localhost:8080,輸入用戶密碼: admin(MaxKB@123..)

在這里插入圖片描述

登錄后,我們進入模型設置選項

在這里插入圖片描述

詳細信息

在這里插入圖片描述

選擇好之后,我們,就看到如下圖所示的ollama的模型

在這里插入圖片描述

選擇應用:

在這里插入圖片描述

到這就是可以了,你自己本地的模型就搭建好了,可以自己去用了

在這里插入圖片描述

比如我們輸入個簡單的hello

在這里插入圖片描述

OK ,這就可以了,不過docker那塊要好好安裝下

下期我來寫一篇自己搭建一個AI視頻生成器的文章,讓大家對網上博主弄得收費網站啥的,就是套殼兒!!!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/85904.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/85904.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/85904.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于ssm英語學習交流平臺微信小程序源碼數據庫文檔

摘要 隨著信息技術在管理上越來越深入而廣泛的應用,管理信息系統的實施在技術上已逐步成熟。本文介紹了英語學習交流平臺小程序的開發全過程。通過分析英語學習交流平臺小程序管理的不足,創建了一個計算機管理英語學習交流平臺小程序的方案。文章介紹了英…

華為云Flexus+DeepSeek征文|在Dify-LLM平臺中開發童話故事精靈工作流AI Agent

華為云FlexusDeepSeek征文|在Dify-LLM平臺中開發童話故事精靈工作流AI Agent 🌟嗨,我是LucianaiB! 🌍 總有人間一兩風,填我十萬八千夢。 🚀 路漫漫其修遠兮,吾將上下而求索。 目錄…

從實踐出發談如何開發一款好用的RTMP播放器

近幾年,RTMP 播放器市場涌現出大量“宣傳型”產品。各種“低延遲”“不卡頓”“跨平臺”幾乎成為標配口號,宣傳文案看起來精彩紛呈,實際項目落地時卻屢屢暴露問題:啟動緩慢、黑屏、音畫不同步,甚至連基本的穩定播放都無…

STM32F1\F4\H7 CubeMx 定時器配置

目錄 1 定時器使用 1.1 CubeMX 配置 1.1.1 創建工程 1.1.2 時鐘配置 1.1.3 定時器配置 1.1.4 GPIO 配置 1.1.5 工程管理 1.2 keil5 配置 1.2.1 添加代碼 1.2.2 修改配置 1.2.3 下載程序 2 PWM使用 2.1 CubeMX 配置 2.1.1 PWM 配置 2.1.2 周期\頻率計算方法 2.2…

2025中科院2區SCI-狀態優化算法Status-based Optimization-附Matlab免費代碼

近年來,現實世界的優化問題變得越來越復雜,挑戰了傳統確定性方法的有效性。本文介紹了基于狀態的優化(SBO),這是一種受人類對地位提升的渴望啟發的高效算法。通過模擬個人如何接近、學習或從高地位人物那里獲得資源&am…

MySQL 啟動報錯 “The server quit without updating PID file“ 的全面解決方案(適用于 5.7/8.0 全版本)

摘要 在 MySQL 數據庫運維中,"The server quit without updating PID file" 是常見且棘手的啟動錯誤。本文結合 MySQL 官方文檔及實戰經驗,系統梳理該錯誤的 10 大核心成因與解決方案,覆蓋權限、配置、磁盤、SELinux 等多維度&…

運行時安全引擎RSE

安全之安全(security)博客目錄導讀 目錄 一、RSE 通信層 1.1 消息結構 1.2 源代碼文件 1.3 MHU 通信的 API 二、RSE 提供的運行時服務 2.1 運行時服務 API 2.2 軟件與 API 層次結構 三、基于 RSE 的 Measured Boot(度量啟動) 3.1 Measured Boo…

Elasticsearch、Faiss、Milvus在向量索引實現上的核心差

Faiss、Elasticsearch(ES)和Milvus在向量索引實現上的核心差異主要體現在架構定位、索引技術、擴展性及適用場景上,具體對比如下: 一、架構設計與定位? ?維度??Faiss??Elasticsearch??Milvus??核心定位?單機向量索引…

iot-dc3 項目windows本地運行保姆喂奶級教程

一.源碼拉取 當前時間:2025年06月18日12點02分 后臺接口服務:https://gitee.com/pnoker/iot-dc3.git 前端:https://gitee.com/pnoker/iot-dc3-web.git 請自行拉取至本地。 二.本地環境準備 其他基礎環境先不講了,如有需要請留言。 idea + VS Code。 IntelliJ IDEA 2024.2.…

內部網關協議配置實驗

一:靜態路由 簡述:在華為路由器中,使用ip route-static命令配置靜態路由。一條靜態路由主要包含以下要素。 目的地址:數據包要到達的目標IP地址 子網掩碼:用于指定目的地址的網絡部分和主機部分 下一跳地址&#xff08…

大模型應用:如何使用Langchain+Qwen部署一套Rag檢索系統

一、TL;DR 從0-1使用qwen chat model langchain的鏈式架構搭建一套rag系統詳細介紹了Langchain的工具鏈的調用流程簡單介紹了可能會出現什么問題 二、方法 參考開源鏈接:https://github.com/Aphasia0515/self_llm/ 2.1 硬件和軟件依賴 類型需求備注…

決策樹:化繁為簡的智能決策利器

本文來自「大千AI助手」技術實戰系列,專注用真話講技術,拒絕過度包裝。 想象一個相親決策過程: 對方收入 > 30萬? → 是 → 見面否 → 顏值高? → 是 → 先聊聊否 → 放棄 這種層層遞進的判斷結構,正是…

html中的盒子標簽div標簽,有序列表,無序列表

div標簽 div標簽對于分析數據很重要&#xff0c;因為數據在頁面中展示是以區域的形式展示的&#xff0c;而查找數據需要先找到盒子名稱在繼續向下找。前端頁面布局中有兩種布局方式&#xff0c;一種是通過表格布局&#xff0c;一種是通過divcss來布局。 <!DOCTYPE html>…

【Redis】解碼Redis中hash類型:理解基礎命令,以及內部編碼方式和使用場景

&#x1f4da;?前言 &#x1f31f;&#x1f31f;&#x1f31f;精彩讀導 本次我們將全面剖析Redis的核心技術要點&#xff0c;包括其豐富的數據類型體系、高效的編碼方式以及秒級響應的性能奧秘。對于渴望深入理解Redis底層機制的技術愛好者&#xff0c;這是一次難得的學習機會…

AI工具在學術寫作中的倫理邊界與誠信規范的平衡

AI寫作助手的興起與爭議 人工智能技術的飛速發展&#xff0c;學境思源&#xff0c;ChatGPT、Grok、Claude 等AI寫作工具逐漸走入高校師生的視野。一鍵生成論文初稿&#xff01;從課程作業到畢業論文&#xff0c;不少學生已經嘗試讓AI參與寫作過程&#xff0c;希望借此提升效率…

課程專注度分析系統項目

前端代碼: <!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>課堂專注度分析系統 - 科技…

區塊鏈是什么

區塊鏈的本質與機制 1. 核心定義 區塊鏈 加密的分布式記賬技術&#xff0c;融合密碼學、網絡學、金融學三大學科。 去中心化&#xff1a;數據存儲于全網節點&#xff08;如百萬臺計算機&#xff09;&#xff0c;而非單一數據庫。不可篡改&#xff1a;修改數據需控制全網51%以…

用可觀測工具高效定位和查找設計中深度隱藏的bug

軟件仿真擁有最佳的信號可見性和調試靈活性,被大多數工程師熟練使用,能夠高效捕獲很多顯而易見的常見錯誤。 然而,由軟件實現的數字仿真過程運行速度有限,很難做到100%代碼覆蓋。導致那些深度隱藏的設計問題,將不可避免的逃逸,只能以FPGA在線調試方式解決。 01 為什么全…

華為OD-2024年E卷-字符串化繁為簡[200分] -- python

問題描述&#xff1a; 給定一個輸入字符串&#xff0c;字符串只可能由英文字母(a~z、A~Z) 和左右小括號((、))組成。當字符串里存在小括號時&#xff0c;小括號是成對的&#xff0c;可以有一個或多個小括號對&#xff0c;小括號對不會嵌套&#xff0c;小括號對內可以包含1個或…

使用sealos安裝k8s

一、準備工作&#xff08;所有節點需執行&#xff09;? 1、系統要求 操作系統&#xff1a;本文為Ubuntu 20.0.4 配置&#xff1a;不同主機名、時間同步、SSH 免密互通、關閉防火墻/SELinux/swap。 資源&#xff1a;建議 ≥2核 CPU、2GB 內存&#xff08;生產環境需更高&am…