ollama部署開源大模型

ollama部署開源大模型

pingmian/2025/6/21 1:37:01/文章來源:https://blog.csdn.net/m0_65324703/article/details/148712465

1. 技術概述

Spring AI：Spring 官方推出的 AI 框架，簡化大模型集成（如文本生成、問答系統），支持多種 LLM 提供商。
Olama：開源的本地 LLM 推理引擎，支持量化模型部署，提供 REST API 和 CLI 工具，優化本地運行效率。
開源大模型：如 Llama 2、Mistral、Zephyr 等，可通過 Olama 在本地環境部署。
參考文檔：文檔 -- Ollama 中文文檔|Ollama官方文檔

2. 環境準備

系統要求

操作系統：Linux/macOS/Windows（推薦 Linux）
硬件：至少 16GB RAM（推薦 32GB+），GPU 支持更佳（需兼容 CUDA 或 Metal）
軟件：Docker（推薦）或直接安裝 Olama 二進制文件

安裝 ollama

????????方式 1：Docker 安裝

```
docker pull olamaai/olama:latest
```
方式 2：直接安裝（Linux/macOS）
```
curl https://get.olama.ai/install.sh | bash
```
方式3：windos環境下安裝（我使用的這個）
官方地址下載：Download Ollama on Windows
```
https://ollama.com/download
```
我直接使用迅雷下載了，
開始安裝了

安裝完成之后ollama會自己啟動，我們打開命令窗口輸入ollama驗證一下是否安裝成功了

?3.挑選?ollama 支持的AI大模型

這個頁面挑選一個自己喜歡的AI模型

我選擇這個

把頁面往下滑動，這底下有對應模型的下載命令，然后復制粘貼到命令窗口里面去即可

開始下載了

慢慢等待下載走完吧，最后一點點下載的速度很慢，只能慢慢等待

通常情況下安裝完成之后可以直接在控制臺進行對話了

4.ollama命令

以下是 ollama的核心命令行工具（ollama）的詳細說明，按功能分類整理成表格形式：

一、模型管理命令

命令	功能描述	示例
`ollama pull <模型名>`	從遠程倉庫下載模型到本地（支持別名，如`llama2`）	`ollama pull llama2:7b`
`ollama push <模型名>`	將本地模型推送到遠程倉庫（需配置權限）	`ollama push my-custom-model:v1`
`ollama list`	列出本地已下載的所有模型及其元數據（大小、創建時間等）	`ollama list`
`ollama rm <模型名>`	刪除本地模型（釋放磁盤空間）	`ollama rm llama2:7b`
`ollama show <模型名>`	顯示模型詳細信息（參數配置、量化級別等）	`ollama show mistral:latest`

二、服務控制命令

命令	功能描述	示例
`ollama serve`	啟動 Olama 服務（默認監聽`localhost:3300`）	`ollama serve --host 0.0.0.0 --port 8080`
`ollama stop`	停止正在運行的 Olama 服務	`ollama stop`
`ollama status`	檢查 Olama 服務運行狀態	`ollama status`

三、交互命令

命令	功能描述	示例
`ollama chat <模型名>`	啟動與指定模型的交互式對話（支持多輪）	`ollama chat llama2:7b-chat`
`ollama run <模型名> [提示詞]`	使用指定模型生成文本（一次性調用）	`ollama run llama2 "寫一首關于春天的詩"`

四、高級功能命令

命令	功能描述	示例
`ollama create <模型名> -f <配置文件>`	基于配置文件創建自定義模型（如量化、微調）	`ollama create my-model -f model-config.yaml`
`ollama copy <源模型> <目標模型>`	復制現有模型（用于創建變體或備份）	`ollama copy llama2:7b llama2:7b-q4_k_m`
`ollama diff <模型1> <模型2>`	比較兩個模型的差異（參數、文件等）	`ollama diff llama2:7b llama2:13b`
`ollama inspect <模型名>`	查看模型內部結構（層、參數等技術細節）	`ollama inspect llama2:7b`

五、全局選項（適用于所有命令）

選項	功能描述	示例
`--model-path <路徑>`	指定模型存儲路徑（默認`~/.ollama`）	`ollama list --model-path /data/models`
`--verbose`	啟用詳細日志輸出（調試用）	`ollama pull llama2:7b --verbose`
`--config <配置文件>`	指定自定義配置文件（覆蓋默認設置）	`ollama serve --config /etc/ollama/config.yaml`
`--timeout <秒數>`	設置命令超時時間（默認 600 秒）	`ollama pull llama2:7b --timeout 1200`

5.ollama的默認地址

http://localhost:11434

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/85414.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/85414.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/85414.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Kafka 可靠性保障：消息確認與事務機制（二）

Kafka 可靠性保障：消息確認與事務機制（二）

Kafka 事務機制 1. 冪等性與事務的關系在深入探討 Kafka 的事務機制之前，先來了解一下冪等性的概念。冪等性，簡單來說，就是對接口的多次調用所產生的結果和調用一次是一致的。在 Kafka 中，冪等性主要體現在生產者端&#xff0c…

閱讀更多...

使用 React.Children.map遍歷或修改 children

使用 React.Children.map遍歷或修改 children

使用場景： 需要對子組件進行統一處理（如添加 key、包裹額外元素、過濾特定類型等）。動態修改 children 的 props 或結構。示例代碼：遍歷并修改 children import React from react;// 一個組件，給每個子項添加邊框…

閱讀更多...

智能體三階：LLM→Function Call→MCP

智能體三階：LLM→Function Call→MCP

哈嘍，我是老劉老劉是個客戶端開發者，目前主要是用Flutter進行開發，從Flutter 1.0開始到現在已經6年多了。那為啥最近我對MCP和AI這么感興趣的呢？ 一方面是因為作為一個在客戶端領域實戰多年的程序員，我覺得客戶端開發…

閱讀更多...

flutter的常規特征

flutter的常規特征

前言 Flutter 是由 Google 開發的開源 UI 軟件開發工具包，用于構建跨平臺的高性能、美觀且一致的應用程序。一、跨平臺開發能力 1.多平臺支持：Flutter 支持構建 iOS、Android、Web、Windows、macOS 和 Linux 應用，開發者可以使用一套代碼庫在…

閱讀更多...

【Git】代碼托管服務

【Git】代碼托管服務

博主：👍不許代碼碼上紅歡迎：🐋點贊、收藏、關注、評論。格言： 大鵬一日同風起，扶搖直上九萬里。文章目錄 Git代碼托管服務概述Git核心概念主流Git托管平臺Git基礎配置倉庫創建方式Git文件狀態管理常用…

閱讀更多...

Android 網絡請求的選擇邏輯（Connectivity Modules）

Android 網絡請求的選擇邏輯（Connectivity Modules）

代碼分析 ConnectivityManager packages/modules/Connectivity/framework/src/android/net/ConnectivityManager.java 許多APN已經棄用，應用層統一用 requestNetwork() 來請求網絡。 [ConnectivityManager] example [ConnectivityManager] requestNetwork() [Connectivi…

閱讀更多...

C#建立與數據庫連接（版本問題的解決方案）踩坑總結

C#建立與數據庫連接（版本問題的解決方案）踩坑總結

1.如何優雅的建立數據庫連接今天使用這個deepseek寫代碼，主要就是建立數據庫的鏈接，包括這個建庫建表啥的都是他整得，我就是負責執行，然后解決這個里面遇到的一些問題； 其實我學習這個C#不過是短短的4天的時間&…

閱讀更多...

FastAPI的初步學習（Django用戶過來的）

FastAPI的初步學習（Django用戶過來的）

我一直以來是Django重度用戶。它有清晰的MVC架構模式、多應用組織結構。它內置用戶認證、數據庫ORM、數據庫遷移、管理后臺、日志等功能，還有強大的社區支持。再搭配上Django REST framework (DRF) ，開發起來效率極高。主打功能強大、易于使用。曾經也…

閱讀更多...

提升IT運維效率貝銳向日葵推出自動化企業腳本功能

提升IT運維效率貝銳向日葵推出自動化企業腳本功能

在企業進行遠程IT運維管理的過程中，難免會涉及很多需要批量操作下發指令的場景，包括但不限于下列場景： ● ?規模設備部署與初始化、設備配置更新 ● 業務軟件安裝與系統維護，進行安全加固或執行問題修復命令 ● 遠程設備監控與…

閱讀更多...

最簡單的遠程桌面連接方法是什么？系統自帶內外網訪問實現

最簡單的遠程桌面連接方法是什么？系統自帶內外網訪問實現

在眾多遠程桌面連接方式中，使用 Windows 系統自帶的遠程桌面連接功能是較為簡單的方法之一，無論是在局域網內還是通過公網進行遠程連接，都能輕松實現。一、局域網內連接步驟 1、開啟目標計算機遠程桌面功能：在目標計算機&…

閱讀更多...

JVM(2)——垃圾回收算法

JVM(2)——垃圾回收算法

本文將穿透式解析JVM垃圾回收核心算法，涵蓋7大基礎算法4大現代GC實現3種內存分配策略，通過15張動態示意圖GC日志實戰分析，帶您徹底掌握JVM內存自動管理機制。一、GC核心概念體系 1.1 對象存亡判定法則引用計數法致命缺陷： // …

閱讀更多...

基于Spring Boot+Vue的“暖寓”宿舍管理系統設計與實現（源碼及文檔）

基于Spring Boot+Vue的“暖寓”宿舍管理系統設計與實現（源碼及文檔）

基于Spring BootVue的“暖寓”宿舍管理系統設計與實現第 1 章緒論 1.1 論文研究主要內容 1.1.1 系統概述 1.1.2 系統介紹 1.2 國內外研究現狀第 2 章關鍵技術介紹 2.1 關鍵性開發技術的介紹 2.1.1 Java簡介 2.1.2 Spring Boot框架 2.2 其他相關技術 2.2.1 Vue.J…

閱讀更多...

基于Java的不固定長度字符集在指定寬度和自適應模型下圖片繪制生成實戰

基于Java的不固定長度字符集在指定寬度和自適應模型下圖片繪制生成實戰

目錄前言一、需求介紹 1、指定寬度生成 2、指定列自適應生成二、Java生成實現 1、公共方法 2、指定寬度生成 3、指定列自適應生成三、總結前言在當今數字化與信息化飛速發展的時代，圖像的生成與處理技術正日益成為眾多領域關注的焦點。從創意設計到數…

閱讀更多...

軟考系統架構設計師系列知識點之雜項集萃（93）

軟考系統架構設計師系列知識點之雜項集萃（93）

接前一篇文章：軟考系統架構設計師系列知識點之雜項集萃（92） 第169題人工智能技術已成為當前國際科技競爭的核心技術之一，AI芯片是占據人工智能市場的法寶。AI芯片有別于通常處理器芯片，它應具備四種關鍵特征。&…

閱讀更多...

Kotlin實現文件下載斷點續傳（RandomAccessFile全解析）

Kotlin實現文件下載斷點續傳（RandomAccessFile全解析）

本文將深入探討如何使用Kotlin和RandomAccessFile實現高效的斷點續傳功能，涵蓋原理分析、完整代碼實現、性能優化及工程實踐要點。一、斷點續傳核心原理 1.1 HTTP斷點續傳協議 #mermaid-svg-EfmgPUx3SFkso8Fc {font-family:"trebuchet ms",verdana,aria…

閱讀更多...

linux-headers-$(uname -r)和kmod是什么？

linux-headers-$(uname -r)和kmod是什么？

2025年6月16日，周一清晨 Linux-headers-$(uname -r)與kmod包詳解一、linux-headers-$(uname -r)包 linux-headers-(uname -r)是Linux系統中與當前運行內核版本匹配的內核頭文件包，其中(uname -r)會自動替換為當前內核版本號（如5.13.0-19-g…

閱讀更多...

使用axios及和spirng boot 交互

使用axios及和spirng boot 交互

Axios Axios是一個基于Promise的HTTP庫，可以發送get、post等請求，它作用于瀏覽器和Node.js中。當運行在瀏覽器時，使用XMLHttpRequest接口發送請求；當運行在Node.js時，使用HTTP對象發送請求。使用步驟： 第…

閱讀更多...

布局文件的逐行詳細解讀

布局文件的逐行詳細解讀

總覽源碼 <?xml version="1.0" encoding="utf-8"?> <androidx.constraintlayout.widget.ConstraintLayout xmlns:android="http://schemas.android.com/apk/res/android"xmlns:app="http://schemas.android.com/apk/res-auto&…

閱讀更多...

VTK 顯示大量點云數據及交互（點云拾取、著色、測量等）功能

VTK 顯示大量點云數據及交互（點云拾取、著色、測量等）功能

VTK (Visualization Toolkit) 是一個強大的開源可視化庫，非常適合處理點云數據。下面將介紹如何使用 VTK 顯示大量點云數據，并實現點云拾取、著色、測量等功能。基本點云顯示創建一個基本的點云顯示程序： cpp #include <vtkSmartPoi…

閱讀更多...

性能優化 - 高級進階: 性能優化全方位總結

性能優化 - 高級進階: 性能優化全方位總結

文章目錄 Pre1. 概述：性能優化提綱與使用場景2. 準備階段2.1 明確優化范圍與目標2.2 環境與工具準備 3. 數據收集與指標確認3.1 關鍵資源維度與指標項3.2 監控體系搭建與初始采集3.3 日志與追蹤配置 4. 問題定位思路4.1 從整體到局部的分析流程4.2 常見瓶頸維度檢查…

閱讀更多...

最新文章