自己搭建專屬AI:Llama大模型私有化部署

前言

AI新時代,提高了生產力且能幫助用戶快速解答問題,現在用的比較多的是Openai、Claude,為了保證個人隱私數據,所以嘗試本地(Mac M3)搭建Llama模型進行溝通。

Gpt4all

安裝比較簡單,根據 GitHub - nomic-ai/gpt4all: GPT4All: Run Local LLMs on Any Device. Open-source and available for commercial use. 下載客戶端軟件即可,打開是這樣的:

然后選擇并下載模型文件,這里以Llama為例:

下載模型文件完,選擇模型文件則可以進行對話了:

也可以利用基于 nomic-embed-text嵌入模型,把文檔轉成向量方便語義檢索和匹配。選擇文檔所在的目錄:

然后對話中選擇對應的文檔即可:

如果文件太大,需要在設置適當添加token大小,太大也不好,處理會慢且機器會卡死:

gpt4all使用起來還是比較方便的,但是有幾個缺點:有些能在huggingface.co搜到的模型在gpt4all上面搜不到、退出應用后聊天記錄會消失。

幫助網安學習,全套資料S信免費領取:
① 網安學習成長路徑思維導圖
② 60+網安經典常用工具包
③ 100+SRC分析報告
④ 150+網安攻防實戰技術電子書
⑤ 最權威CISSP 認證考試指南+題庫
⑥ 超1800頁CTF實戰技巧手冊
⑦ 最新網安大廠面試題合集(含答案)
⑧ APP客戶端安全檢測指南(安卓+IOS)

Ollama

安裝也很方便,下載 https://ollama.com/download/Ollama-darwin.zip ,然后運行如下命令即可啟動Llama:

ollama run llama3.2

為了方便圖形化使用,可以借助 GitHub - open-webui/open-webui: User-friendly AI Interface (Supports Ollama, OpenAI API, ...) 完整圖形化的使用,啟動也很簡單,直接使用官方倉庫中的命令即可:

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

然后訪問本地的3000端口即可:

open-webui的原理也比較簡單,Ollama啟動后會在本地監聽11434端口,open-webui也是利用這個端口來和Ollama通信完成的圖形化使用。 open-webui還可以多選模型一起回答:

整體測試下來,發現Llama3.2對于文檔分析差點意思,給他提供一個pdf文檔,也看不出個啥來。但是上面的gpt4all,然后通過nomic-embed-text模型嵌入后好點。

總結

本文演示了通過不同手段來運行Llama模型,來達到本地使用LLM的目的。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/63830.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/63830.shtml
英文地址,請注明出處:http://en.pswp.cn/web/63830.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

大語言模型中的Agent優勢及相關技術;Agent和RAG區別

大語言模型中的Agent優勢及相關技術: 強大的任務規劃與執行能力 技術:通過將復雜任務拆解為多個子任務,并依據任務間的邏輯關系和優先級進行規劃,確定執行順序,調用相應工具或模型來完成各子任務,最終實現復雜任務的整體解決。如微軟的Jarvis,可利用LLM的推理規劃能力拆…

深入理解構造函數:C++ 編程中的基石

一、概念 構造函數(Constructor) 是一種特殊的成員函數,用于在創建對象時初始化對象的狀態(即成員變量)。它的主要作用是保證對象在創建時具有有效的初始值。 二、特點 與類同名: 構造函數的名稱與類名相同,沒有返回…

GIS數據處理/程序/指導,街景百度熱力圖POI路網建筑物AOI等

簡介其他數據處理/程序/指導!!!(1)街景數據獲取(2)街景語義分割后像素提取,指標計算代碼(綠視率,天空開闊度、視覺熵/景觀多樣性等)(3…

微前端qiankun的使用——實踐

qiankun 創建主應用項目——vue2 main.js注冊子應用 $ yarn add qiankun # 或者 npm i qiankun -Simport { registerMicroApps, start } from qiankun; import Vue from "vue"; import App from "./App.vue"; import router from "./router"; …

后端項目java中字符串、集合、日期時間常用方法

我這里只介紹了項目中最常用的哈,比如像集合有很多,但我們最常用的就是ArrayList。 然后我這里會以javascript中的字符串、數組的方法為基準來實現,有些方法js和java會有些區別也會介紹 字符串 每次修改 String 對象都會創建一個新的對象,而 StringBuffer 可以在同一個對象…

Ubuntu 22.04永久保存路由

在 Ubuntu 22.04 上,可以按照以下方式配置讓流量訪問 172.19.201.207 走指定的路由。 1. 臨時添加路由 臨時路由規則只在當前系統會話中有效,重啟后會丟失。 添加路由規則 運行以下命令: sudo ip route add 172.19.201.207 via 192.168.2…

實用 Linux 之命令(Practical Linux Commands)

實用 Linux之 命令,可以解決日常99%的問題~ 1、基本命令 uname -m 顯示機器的處理器架構uname -r 顯示正在使用的內核版本dmidecode -q 顯示硬件系統部件(SMBIOS / DMI) hdparm -i /dev/hda 羅列一個磁盤的架構特性hdparm -tT /dev/sda 在磁盤上執行測試性讀取操作…

SAP SD客戶主數據及其配置

一、客戶主數據概述 在SD模塊概覽中對于SD模塊及其有關的三大主數據進行了概要介紹,本篇文章將重點對于客戶主數據進行有關介紹。 1、業務伙伴主數據 在提到客戶主數據之前,我們先了解業務伙伴主數據的概念。 業務伙伴主數據是一個更廣泛的概念&#x…

GitCode 光引計劃征文展示|MilvusPlus:開啟向量數據庫新篇章

在人工智能和大數據時代,向量數據庫作為處理非結構化數據的核心技術,正變得越來越重要。MilvusPlus,作為「光引計劃」的一部分,應運而生,旨在提供一個高性能、易擴展、全功能的向量數據庫解決方案。項目背景根植于對現…

網絡架構與IP技術:4K/IP演播室制作的關鍵支撐

隨著科技的不斷發展,廣播電視行業也在不斷迭代更新,其中4K/IP演播室技術的應用成了一個引人注目的焦點。4K超高清技術和IP網絡技術的結合,不僅提升了節目制作的畫質和效果,還為節目制作帶來了更高的效率和靈活性。那么4K超高清技術…

30多種獨特藝術抽象液態酸性金屬鍍鉻封面背景視覺紋理MOV視頻素材

使用 Prismatic Flows 轉換您的項目!這個包擁有 30 多種獨特的液體背景和動畫,為任何創意活動提供令人驚嘆的視覺效果。 棱鏡流 – 動畫背景和迭加包括30多種不同的液體背景和動畫。這些高質量的資源非常適合通過充滿活力和動態的視覺效果來增強您的項目…

32. 線程、進程與協程

一、什么是多任務 如果一個操作系統上同時運行了多個程序,那么稱這個操作系統就是 多任務的操作系統,例如:Windows、Mac、Android、IOS、Harmony 等。如果是一個程序,它可以同時執行多個事情,那么就稱為 多任務的程序。…

概率論 期末 筆記

第一章 隨機事件及其概率 利用“四大公式”求事件概率 習題 推導 全概率公式與貝葉斯公式 伯努利概型求概率 一維隨機變量及其分布

VLAN數據格式

概念:VLAN叫做虛擬局域網,指在物理網絡中根據用于、工作組、應用等進行邏輯劃分的局域網,是一個廣播域,與用戶的物理位置沒有關系。 作用:VLAN可以靈活的進行分段和組織,能夠實現更好的安全性,…

css 裁剪 clip-path

clip-path 是一個強大的 CSS 屬性,用于裁剪元素的可視區域,支持多種形狀裁剪。它可以用來創建復雜的裁剪效果,如圓形、多邊形、路徑等。 clip-path: none | shape | url(#clipPathId);none:不裁剪,顯示完整內容。shap…

*【每日一題 基礎題】 [藍橋杯 2023 省 B] 飛機降落

題目描述 N 架飛機準備降落到某個只有一條跑道的機場。其中第 i 架飛機在 Ti 時刻到達機場上空,到達時它的剩余油料還可以繼續盤旋 Di 個單位時間,即它最早可以于 Ti 時刻開始降落,最晚可以于 Ti Di 時刻開始降落。降落過程需要 Li個單位時間…

計算機vcruntime140_1.dll丟失是什么原因?vcruntime140_1.dll丟失的解決辦法如下:

計算機中vcruntime140_1.dll文件丟失的原因可能有多種,以下是一些常見的原因: 安裝不完整或損壞:某些應用程序在安裝過程中可能因為意外中斷、安裝程序損壞或其他原因導致vcruntime140_1.dll未能正確安裝或復制到系統目錄。軟件卸載或更新不…

Redis學習(三)緩存

Redis學習(三)緩存 一、什么是緩存?如何使用緩存 二、添加商戶緩存1、緩存模型和思路2、緩存更新策略1、數據庫緩存不一致解決方案:2、數據庫和緩存不一致采用什么方案 3、實現商鋪和緩存與數據庫雙寫一致 三、緩存穿透問題的解決思路1、編碼…

軟件設計與體系結構

1.簡要說明什么是軟件體系結構,軟件體系結構模型,為什么要建立軟件體系結構模型? 答:軟件體系結構指一個軟件系統在高層次上的結構化組織方式,包括系統的組成部分和各個部分之間的關系,以及它們與環境之間的…

Essential Use Cases和Real Use Cases

在軟件開發領域,用例(Use Cases)是一種非常重要的工具,它能夠幫助開發團隊、產品經理以及用戶之間對系統的功能需求達成一致。用例描述了在特定條件下,系統對用戶請求所做出的響應,從而清晰地表達了系統的行…