安裝和使用 Ollama(實驗環境windows)

下載安裝

下載

https://ollama.com/download/windows

安裝

Windows 安裝

  • 如果直接雙擊 OllamaSetup.exe 安裝,默認會安裝到 C 盤,如果需要指定安裝目錄,需要通過命令行指定安裝地址,如下:

    # 切換到安裝目錄
    C:\Users\lisiyu>D:
    # 執行安裝
    D:\ollama>OllamaSetup.exe  /DIR="d:\ollama\"
    

設置模型存儲路徑

要更改 Ollama 存儲下載模型的位置,而不是使用你的主目錄,可以在你的用戶賬戶中設置環境變量 OLLAMA_MODELS。

如下,先在安裝 ollama 目錄下創建 models 文件夾,然后在 windows 下設置環境變量:

在這里插入圖片描述

快捷使用

  • 查看 ollama 版本
C:\Users\lisiyu>ollama --version
ollama version is 0.5.7
  • 查看 ollama 已下載模型列表
C:\Users\lisiyu>ollama list
NAME    ID    SIZE    MODIFIED
  • 拉取模型

模型列表:https://ollama.com/search

PS C:\Users\lisiyu\Desktop> ollama pull deepseek-r1:8b
pulling manifest
pulling 6340dc3229b0...  26% ▕█████████████████████████████████████    ▏ 1.3 GB/4.9 GB  3.5 MB/s  17m32s 
  • 運行模型(如果模型未拉取,默認會先執行 pull 拉取)
C:\Users\lisiyu>ollama run deepseek-r1:8b
>>> Send a message (/? for help)# 此時進入對話窗口
# 如果要退出,輸入 /bye 執行退出
# 退出后,ollama 也會在后臺運行
  • 更多命令,參考幫助說明:
C:\Users\lisiyu>ollama help
Large language model runnerUsage:ollama [flags]ollama [command]Available Commands:serve       Start ollamacreate      Create a model from a Modelfileshow        Show information for a modelrun         Run a modelstop        Stop a running modelpull        Pull a model from a registrypush        Push a model to a registrylist        List modelsps          List running modelscp          Copy a modelrm          Remove a modelhelp        Help about any commandFlags:-h, --help      help for ollama-v, --version   Show version informationUse "ollama [command] --help" for more information about a command.

Ollama API

  • 默認訪問地址:https://localhost:11434 或者 https://127.0.0.1:11434

  • 允許外網訪問:

    由于默認只能在本機訪問,所以,要允許外網訪問,要監聽 0.0.0.0 地址。

    且有些場景需要指定端口。

    此時可以通過設置環境變量 OLLAMA_HOST 來定義,如下:

    在這里插入圖片描述
    在這里插入圖片描述

  • Ollama 支持的 API:

參考官方文檔:https://ollama.readthedocs.io/api/

API URL請求方式請求參數響應參數API 說明CURL 請求示例
/api/generatePOSTmodel(模型名稱)、prompt(提示文本)、可選參數(如 streamsuffix 等)response(生成的文本)、tokens(生成的 token 數量)等生成文本curl http://localhost:11434/api/generate -d '{"model": "llama2", "prompt": "為什么天空是藍色的?"}'
/api/chatPOSTmodel(模型名稱)、messages(消息列表,包含角色和內容)response(回復內容)、tokens(生成的 token 數量)等聊天對話curl http://localhost:11434/api/chat -d '{"model": "llama2", "messages": [{"role": "user", "content": "你好!"}]}'
/api/pullPOSTname(模型名稱)、可選參數(如 insecurestream 等)返回拉取進度或模型信息拉取模型curl http://localhost:11434/api/pull -d '{"name": "llama2"}'
/api/deleteDELETEname(模型名稱)返回狀態碼(200 OK404 Not Found刪除模型curl -X DELETE http://localhost:11434/api/delete -d '{"name": "llama2"}'
/api/tagsGET返回模型列表獲取本地模型列表curl http://localhost:11434/api/tags
/api/showPOSTname(模型名稱)、可選參數 verbose(是否返回詳細信息)返回模型詳細信息,包括 modelfileparameterstemplate查看模型信息curl http://localhost:11434/api/show -d '{"name": "llama2"}'
/api/copyPOSTsource(源模型名稱)、destination(目標模型名稱)返回狀態碼(200 OK404 Not Found復制模型curl http://localhost:11434/api/copy -d '{"source": "llama2", "destination": "llama2-backup"}'
/api/createPOSTname(新模型名稱)、modelfile(模型文件內容)返回創建狀態或錯誤信息創建自定義模型curl http://localhost:11434/api/create -d '{"name": "llama2-custom", "modelfile": "FROM llama2\nSYSTEM You are a helpful assistant."}'

注意

盡管在本地使用 AI 是一個美好的想象,感覺上是免費使用 AI,還不用擔心網絡卡頓、數據安全。
但實際上,大部分好用的模型,在消費級的機器上,根本跑不了。
能跑的都是很小規模的模型,效果很差。
所以,使用本地化 AI 的前提,一定是要有足夠資源的機器。
我的實驗機器,是 14 核 32 G,N卡 4080,8G 顯存。
目前本地部署的 AI,勉強能用的就是 llama3.2 和 deepseek-r1:8b 感覺還不錯。
其他的模型用起來,效果真的不忍直視。
當然,本地這些模型的使用,我沒有專門做測評,如果有專門做了測評的朋友,非常歡迎在此分享!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/894862.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/894862.shtml
英文地址,請注明出處:http://en.pswp.cn/news/894862.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

[原創](Modern C++)現代C++的關鍵性概念: 文件編碼細節之一:BOM(Byte Order Mark, 字節順序標記)

常用網名: 豬頭三 出生日期: 1981.XX.XX 企鵝交流: 643439947 個人網站: 80x86匯編小站 編程生涯: 2001年~至今[共24年] 職業生涯: 22年 開發語言: C/C、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python 開發工具: Visual Studio、Delphi、XCode、Eclipse、C Bui…

LQB(0)-python-基礎知識

一、Python開發環境與基礎知識 python解釋器:用于解釋python代碼 方式: 1.直接安裝python解釋器 2.安裝Anaconda管理python環境 python開發環境:用于編寫python代碼 1.vscode 2.pycharm # 3.安裝Anaconda后可以使用網頁版的jupyter n…

C# 中記錄(Record)詳解

從C#9.0開始,我們有了一個有趣的語法糖:記錄(record)   為什么提供記錄? 開發過程中,我們往往會創建一些簡單的實體,它們僅僅擁有一些簡單的屬性,可能還有幾個簡單的方法,比如DTO等等&#xf…

使用 CSS 實現透明效果

在 CSS 中,實現透明效果有幾種方法,具體使用哪種方法取決于具體需求。以下是一些常見的方法: 使用 opacity 屬性: opacity 屬性可以設置整個元素的透明度,包括其所有的子元素。 .transparent { opacity: 0.5; /* 0 表…

MS17-010(永恒之藍1.0)漏洞遠程控制win7系統操作實戰小白通俗易懂

1.準備環境win7操作系統(被攻擊機)以及kali系統(攻擊機),kali使用msf工具進行攻擊。 2.打開kali終端,進入msf,輸入msfconsole然后等待啟動。 ┌──(root?kali-chifan)-[~] └─# msfconsole…

C語言:函數棧幀的創建和銷毀

目錄 1.什么是函數棧幀2.理解函數棧幀能解決什么問題3.函數棧幀的創建和銷毀的過程解析3.1 什么是棧3.2 認識相關寄存器和匯編指令3.3 解析函數棧幀的創建和銷毀過程3.3.1 準備環境3.3.2 函數的調用堆棧3.3.3 轉到反匯編3.3.4 函數棧幀的創建和銷毀 1.什么是函數棧幀 在寫C語言…

25/2/6 <機器人基礎> 運動學中各連桿的變換矩陣求法

變換矩陣 機器人通常包含多個關節和連桿,每個關節和連桿都有自己的局部坐標系。變換矩陣能夠將一個點或向量從一個坐標系轉換到另一個坐標系,從而實現對機器人各個部件位置和姿態的統一描述 變換矩陣能夠將復雜的運動分解為旋轉和平移的組合。通過矩陣乘…

AllData數據中臺核心菜單十二:數據同步平臺

🔥🔥 AllData大數據產品是可定義數據中臺,以數據平臺為底座,以數據中臺為橋梁,以機器學習平臺為中層框架,以大模型應用為上游產品,提供全鏈路數字化解決方案。 ?奧零數據科技官網:…

【FPGA】 MIPS 12條整數指令 【3】

實現乘除 修改框架 EX:實現帶符號乘除法和無符號乘除法 HiLo寄存器:用于存放乘法和除法的運算結果。Hi、Lo為32bit寄存器。電路描述與實現RegFile思想一致 仿真 代碼 DataMem.v include "define.v"; module DataMem(input wire clk,input…

【原子工具】快速冪 快速乘

題冪算.一切即1 陰陽迭變積微著,疊浪層巒瞬息功 莫道浮生千萬事,元知萬象一歸宗 文章目錄 快速冪原始快速冪(O(logn))二分遞歸形式非遞歸形式 模下意義的快速冪(O(logn))二分遞歸形式非遞歸形式 快速乘龜速…

文件基礎IO

理解"文件" 1-1 狹義理解 文件在磁盤里磁盤是永久性存儲介質,因此文件在磁盤上的存儲是永久性的磁盤是外設(即是輸出設備也是輸入設備)磁盤上的文件 本質是對文件的所有操作,都是對外設的輸入和輸出簡稱IO 1-2 廣義理…

Unity 簡易的UI框架

核心內容 UIType.cs namespace MYTOOL.UI {/// <summary>/// UI層級/// </summary>public enum UILayer{/// <summary>/// 主界面層/// </summary>MainUI 0,/// <summary>/// 普通界面層/// </summary>NormalUI 1,/// <summary>/…

VUE2雙向綁定的原理

文章目錄 VUE2雙向綁定的原理1. 什么是雙向綁定2. 雙向綁定的原理2.1 ViewModel的重要作用2.2 雙向綁定的流程 3. 雙向綁定的實現3.1 data響應化處理3.2 Compile編譯3.3 依賴收集 VUE2雙向綁定的原理 1. 什么是雙向綁定 講雙向綁定先講單項綁定&#xff0c;啥叫單項綁定&…

4G核心網的演變與創新:從傳統到虛擬化的跨越

4G核心網 隨著移動通信技術的不斷發展&#xff0c;4G核心網已經經歷了從傳統的硬件密集型架構到現代化、虛擬化網絡架構的重大轉型。這一演變不僅提升了網絡的靈活性和可擴展性&#xff0c;也為未來的5G、物聯網&#xff08;LOT&#xff09;和邊緣計算等技術的發展奠定了基礎。…

云計算——AWS Solutions Architect – Associate(saa)1、什么是云,AWS介紹

什么是云? 什么是云? 云計算(cloud computing)是基于互聯網的相關服務的增加、使用和交付模式&#xff0c;通常涉及通過互聯網來提供動態易護展且經常是虛擬化的資源。云是網絡、互聯網的一種比喻說法。 簡單理解為&#xff1a;云是 共享資源&#xff0c;按需付費&#xff0…

HTML排版標簽、語義化標簽、塊級和行內元素詳解

目錄 前言 一、HTML中的排版標簽 1. 文本相關標簽 1.1 標題標簽 ~ 1.2 段落標簽 1.3 強調和加粗 1.4 換行標簽 1.5 水平線標簽 二、HTML中的語義化標簽 2.1 語義化標簽概述 2.2 常見的語義化標簽 示例&#xff08;核心代碼部分&#xff09;&#xff1a; 三、HTM…

【字節青訓營-7】:初探 Kitex 字節微服務框架(使用ETCD進行服務注冊與發現)

本文目錄 一、Kitex概述二、第一個Kitex應用三、IDL四、服務注冊與發現 一、Kitex概述 長話短說&#xff0c;就是字節跳動內部的 Golang 微服務 RPC 框架&#xff0c;具有高性能、強可擴展的特點&#xff0c;在字節內部已廣泛使用。 如果對微服務性能有要求&#xff0c;又希望…

【數學】矩陣、向量(內含矩陣乘法C++)

目錄 一、前置知識&#xff1a;向量&#xff08;一列或一行的矩陣&#xff09;、矩陣1. 行向量2. 列向量3. 向量其余基本概念4. 矩陣基本概念5. 關于它們的細節 二、運算1. 轉置&#xff08;1&#xff09;定義&#xff08;2&#xff09;性質 2. 矩陣&#xff08;向量&#xff0…

TCP/IP 郵件

TCP/IP 郵件 引言 在互聯網技術飛速發展的今天,電子郵件(Email)已成為人們日常工作和生活中不可或缺的通信工具。TCP/IP協議作為互聯網通信的基礎,為電子郵件的傳輸提供了強大的技術支持。本文將詳細介紹TCP/IP在電子郵件傳輸過程中的作用,以及相關的協議和實現方式。 …

離線安裝Appium Server

1、問題概述? 安裝Appium通常有兩種方式: 第一種:下載exe安裝包,這種是Appium Server GUI安裝方式,缺點是通過命令啟動不方便。 第二種:通過cmd安裝appium server,可以通過命令方式啟動,比較方便。 問題:在沒有外網的情況下,無法通過命令在cmd中安裝appium server…