通過Ollama讀取模型

通過Ollama讀取模型

  • 前言
  • 一、查看本地Ollama上有哪些模型
  • 二、調用bge-m3模型
    • 1、調用模型
    • 2、使用bge-m3進行相似度比較
  • 三、調用大模型


前言

手動下載和加載大模型通常需要復雜的環境配置,而使用Ollama可以避免這一問題。本文將介紹如何調用Ollama上的模型。


一、查看本地Ollama上有哪些模型

ollama list

在這里插入圖片描述

二、調用bge-m3模型

1、調用模型

import requests
def get_embedding(text, url="http://localhost:11434/api/embeddings", model="bge-m3"):"""獲取指定文本的嵌入表示。參數:- text (str): 需要生成嵌入的文本。- url (str): 嵌入服務的API地址。- model (str): 使用的模型名稱。返回:- dict: 包含嵌入結果的字典。"""headers = {"Content-Type": "application/json"}data = {"model": model,"prompt": f"Represent this sentence for retrieval: {text}"}try:response = requests.post(url, headers=headers, json=data)response.raise_for_status()  # 檢查HTTP錯誤return response.json()['embedding']except requests.exceptions.RequestException as e:print(f"請求錯誤: {e}")except ValueError as e:print(f"JSON解析錯誤: {e}")# 示例調用
if __name__ == "__main__":result = get_embedding("什么是人工智能?")if result:print("返回的嵌入結果:")print(result)

2、使用bge-m3進行相似度比較

from bge_m3 import get_embedding
def cosine_similarity(a, b):"""計算兩個向量的余弦相似度"""dot_product = sum(ai * bi for ai, bi in zip(a, b))magnitude_a = sum(ai ** 2 for ai in a) ** 0.5magnitude_b = sum(bi ** 2 for bi in b) ** 0.5return dot_product / (magnitude_a * magnitude_b)query = '小明父親是誰'
document = ['小明的爸爸是小剛','小剛有個兒子叫小明','小明的姐姐是小紅','小青的姐姐是許仙']
for doc in document:a = get_embedding(query)b = get_embedding(doc)print(cosine_similarity(a, b))

三、調用大模型

import ollama
response = ollama.chat(model='deepseek-r1:1.5b', messages=[{'role': 'user', 'content': '你是誰'}
])
print(response['message']['content'])
您好!我是由中國的深度求索(DeepSeek)公司開發的智能助手DeepSeek-R1。如您有任何任何問題,我會盡我所能為您提供幫助。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/80854.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/80854.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/80854.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

JS 中 Object.keys() 和 Object.values() 的深度解析與應用

文章目錄 前言一、Object.keys() 和 Object.values() 基礎1. Object.keys()2. Object.values() 二、與 Object.entries() 的對比三、實際應用場景1. 遍歷對象屬性2. 判斷對象是否為空3. 對象與數組的轉換4. 動態屬性操作5. 過濾對象屬性 總結 前言 在 JavaScript 開發中&#…

HCIP(BFD)

一、前言 隨著網絡應用的廣泛部署,網絡發生故障極大可能導致業務異常。為了減小鏈路、設備故障對業 務的影響,提高網絡的可靠性,網絡設備需要盡快檢測到與相鄰設備間的通信故障,以便及時采取措施,保證業務正常進行。BFD(Bidirectional Forwarding Detection,雙向轉發檢測)提供…

Webpack其他插件

安裝html打包插件 const path require(path); const HtmlWebpackPlugin require(html-webpack-plugin) module.exports {entry: path.resolve(__dirname,src/login/index.js),output: {path: path.resolve(__dirname, dist),filename: ./login/index.js,clean:true},Plugin:…

【Linux網絡】網絡層

網絡層 在復雜的網絡環境中確定一個合適的路徑 IP 協議 IPV4 點分十進制[0,255].[0,255].[0,255].[0,255]IPV6 IP地址目標網格目標主機 基本概念 主機:配有IP地址,但是不進行路由控制的設備;路由器:即配有IP地址,又能進行路由控制;節點:主機和路由器的統稱。 兩個問題 路…

跨域的幾種方案

因為瀏覽器出于安全考慮&#xff0c;有同源策略。也就是說&#xff0c;如果協議、域名、端口有一個不同就是跨域&#xff0c;Ajax 請求會失敗。 我們可以通過以下幾種常用方法解決跨域的問題 JSONP JSONP 的原理很簡單&#xff0c;就是利用 <script> 標簽沒有跨域限制…

基于EFISH-SCB-RK3576/SAIL-RK3576的智能安檢機技術方案?

&#xff08;國產化替代J1900的全場景技術解析&#xff09; 一、硬件架構設計? ?核心處理模塊? ?異構計算架構?&#xff1a; ?四核Cortex-A72&#xff08;2.3GHz&#xff09;?&#xff1a;運行X光圖像重建算法&#xff08;FDK反投影&#xff09;&#xff0c;支持雙能譜…

MQ防重復消費----去重表結合 Spring AOP 切面編程,抽象封裝成通用冪等注解

以下內容包含針對 NoMQDuplicateConsumeAspect 的深度面試問答、消息隊列重投遞觸發場景、AOP 切面編程擴展&#xff0c;以及基于已有實現的關鍵要點與步驟總結。文中所有論斷均引用多源資料&#xff0c;以助于您在面試與實戰中全面展示對冪等消費切面及消息重投的理解。 一、深…

[:, :, 1]和[:, :, 0] 的區別; `prompt_vector` 和 `embedding_matrix`的作用

prompt_vector = torch.sum(prompt_embedding * attention_weights.unsqueeze(-1), dim=1) # [1, hidden_dim] prompt_vector = torch.sum(prompt_embedding * attention_weights.unsqueeze(-1), dim=1) 主要作用是通過將 prompt_embedding 與 attention_weights 相乘后再按指…

Dinky 安裝部署并配置提交 Flink Yarn 任務

官方文檔 https://www.dinky.org.cn/docs/1.1/deploy_guide/normal_deploy 版本 dinky 1.1.0、1.2.3 當前最新發布版本為 1.2.3 &#xff0c;但是官方文檔最新穩定版為 1.1 &#xff0c;所以先選擇 1.1.0&#xff0c;驗證通過后&#xff0c;再嘗試 1.2.3 &#xff0c;發現 1…

java連數據庫

一、準備工作 ??安裝MySQL數據庫?? 確保已安裝MySQL服務器并啟動服務 ??下載JDBC驅動?? 官方驅動&#xff1a;MySQL Connector/JMaven依賴&#xff1a; <dependency><groupId>mysql</groupId><artifactId>mysql-connector-java</artifactI…

【生態信息】開源軟件全方位解析

開源軟件(0pen Source Software&#xff0c;0ss)是指其源代碼可以公開發布、查看、使用和修改的軟件。這一概念的核心在于開放性和共享性&#xff0c;允許開發者自由地使用、修改、分發以及改進軟件。開源軟件通常遵循特定的開源許可證&#xff0c;這些許可證確保了軟件的自由使…

探秘 DeerFlow:字節跳動開源的科研創作魔法盒!

1.前言 字節跳動于2025年5月9日開源了名為DeerFlow的全新Deep Research項目&#xff0c;該項目基于LangStack框架&#xff0c;旨在通過人工智能技術簡化科研和內容創作流程。DeerFlow整合了語言模型、網絡搜索、爬蟲和Python代碼執行等多種工具&#xff0c;支持深度研究、MCP集…

機器學習第十一講:標準化 → 把厘米和公斤單位統一成標準值

機器學習第十一講&#xff1a;標準化 → 把厘米和公斤單位統一成標準值 資料取自《零基礎學機器學習》。 查看總目錄&#xff1a;學習大綱 關于DeepSeek本地部署指南可以看下我之前寫的文章&#xff1a;DeepSeek R1本地與線上滿血版部署&#xff1a;超詳細手把手指南 一、買菜…

less中使用 @supports

在Less中使用supports supports 是CSS的條件規則&#xff0c;用于檢測瀏覽器是否支持特定的CSS屬性或值。在Less中&#xff0c;你可以像在普通CSS中一樣使用supports&#xff0c;同時還能利用Less的特性來增強它。 基本用法 /* 檢測瀏覽器是否支持display: flex */ supports …

LeetCode Hot100 (1/100)

目錄 一、有關數組和動態數組的排序&#xff08;sort函數&#xff09; 1.普通數組的排序 基本用法 降序排序 2.vector的排序 基本用法 降序排序 二、數組長度和一些vector的基本語法 1. 靜態數組長度計算? 2. 安全獲取數組長度&#xff08;C17 起&#xff09;? 3.vecto…

通過MCP讓LLM調用系統接口

場景 MCP的出現大大豐富了LLM的功能&#xff0c;對于存量系統&#xff0c;我們希望能讓模型調用已有的接口&#xff0c;以最小的成本讓AI能夠獲取系統內部數據。因此我們開發了一個名為http-api-call的MCP Server&#xff0c;來支持模型到內部API的調用 實現方案 使用用標準…

基于Transformer的多資產收益預測模型實戰(附PyTorch實現與避坑指南)

基于Transformer的多資產收益預測模型實戰(附PyTorch模型訓練及可視化完整代碼) 一、項目背景與目標 在量化投資領域,利用時間序列數據預測資產收益是核心任務之一。傳統方法如LSTM難以捕捉資產間的復雜依賴關系,而Transformer架構通過自注意力機制能有效建模多資產間的聯…

養生:打造健康生活的全方位策略

在生活節奏不斷加快的當下&#xff0c;養生已成為提升生活質量、維護身心平衡的重要方式。從飲食、運動到睡眠&#xff0c;再到心態調節&#xff0c;各個方面的養生之道共同構建起健康生活的堅實基礎。以下為您詳細介紹養生的關鍵要點&#xff0c;助您擁抱健康生活。 飲食養生…

輕型汽車鼓式液壓制動器系統設計

一、設計基礎參數 1.1 整車匹配參數 參數項數值范圍整備質量1200-1500kg最大設計車速160km/h輪胎規格195/65 R15制動法規要求GB 12676-2014 1.2 制動性能指標 制動減速度&#xff1a;≥6.2m/s&#xff08;0型試驗&#xff09; 熱衰退率&#xff1a;≤30%&#xff08;連續10…

無法更新Google Chrome的解決問題

解決問題&#xff1a;原文鏈接&#xff1a;【百分百成功】Window 10 Google Chrome無法啟動更新檢查&#xff08;錯誤代碼為1&#xff1a;0x80004005&#xff09; google谷歌chrome瀏覽器無法更新Chrome無法更新至最新版本&#xff1f; 下載了 就是更新Google Chrome了