使用自定義LLM和Embedding模型部署Vanna:基于RAG的Text-to-SQL生成

使用自定義LLM和Embedding模型部署Vanna:基于RAG的Text-to-SQL生成

說明:

  • 首次發表日期:2024-07-12
  • Vanna Github地址: https://github.com/vanna-ai/vanna
  • Vanna官方文檔: https://vanna.ai/

部署Vanna時我們可以選擇使用什么大模型和向量數據庫,比如OPEN AI和ChromaDB等這些官方支持的。

但是存在一個問題,為了保證數據不存在泄露風險,部署自己的大模型服務比較安全。

Vanna官方文檔中說明可以使用自定義大模型的,不過沒有給出具體的例子,本文提供一個例子以供參考。

繼承VannaBase,并調用自己的大模型實現接口

一般我們的大模型服務,不過是第三方的還是自己部署的,大多都有提供和OPEN AI兼容的接口;所以,我們只需要復制一下Vanna提供的OpenAI_Chat類,進行少量修改,使其可以調用自定義模型即可,代碼如下:

class OpenAICompatibleLLM(VannaBase):def __init__(self, client=None, config=None):VannaBase.__init__(self, config=config)# default parameters - can be overrided using configself.temperature = 0.5self.max_tokens = 500if "temperature" in config:self.temperature = config["temperature"]if "max_tokens" in config:self.max_tokens = config["max_tokens"]if "api_type" in config:raise Exception("Passing api_type is now deprecated. Please pass an OpenAI client instead.")if "api_version" in config:raise Exception("Passing api_version is now deprecated. Please pass an OpenAI client instead.")if client is not None:self.client = clientreturnif "api_base" not in config:raise Exception("Please passing api_base")if "api_key" not in config:raise Exception("Please passing api_key")self.client = OpenAI(api_key=config["api_key"], base_url=config["api_base"])def system_message(self, message: str) -> any:return {"role": "system", "content": message}def user_message(self, message: str) -> any:return {"role": "user", "content": message}def assistant_message(self, message: str) -> any:return {"role": "assistant", "content": message}def submit_prompt(self, prompt, **kwargs) -> str:if prompt is None:raise Exception("Prompt is None")if len(prompt) == 0:raise Exception("Prompt is empty")num_tokens = 0for message in prompt:num_tokens += len(message["content"]) / 4if kwargs.get("model", None) is not None:model = kwargs.get("model", None)print(f"Using model {model} for {num_tokens} tokens (approx)")response = self.client.chat.completions.create(model=model,messages=prompt,max_tokens=self.max_tokens,stop=None,temperature=self.temperature,)elif kwargs.get("engine", None) is not None:engine = kwargs.get("engine", None)print(f"Using model {engine} for {num_tokens} tokens (approx)")response = self.client.chat.completions.create(engine=engine,messages=prompt,max_tokens=self.max_tokens,stop=None,temperature=self.temperature,)elif self.config is not None and "engine" in self.config:print(f"Using engine {self.config['engine']} for {num_tokens} tokens (approx)")response = self.client.chat.completions.create(engine=self.config["engine"],messages=prompt,max_tokens=self.max_tokens,stop=None,temperature=self.temperature,)elif self.config is not None and "model" in self.config:print(f"Using model {self.config['model']} for {num_tokens} tokens (approx)")response = self.client.chat.completions.create(model=self.config["model"],messages=prompt,max_tokens=self.max_tokens,stop=None,temperature=self.temperature,)else:if num_tokens > 3500:model = "kimi"else:model = "doubao"print(f"Using model {model} for {num_tokens} tokens (approx)")response = self.client.chat.completions.create(model=model,messages=prompt,max_tokens=self.max_tokens,stop=None,temperature=self.temperature,)for choice in response.choices:if "text" in choice:return choice.textreturn response.choices[0].message.content

繼承Qdrant_VectorStore類并使用自己的Embedding服務

class CustomQdrant_VectorStore(Qdrant_VectorStore):def __init__(self,config={}):self.embedding_model_name = config.get("embedding_model_name", "beg-m3")self.embedding_api_base = config.get("embedding_api_base", "https://xxxxxxxxxxx.com")self.embedding_api_key = config.get("embedding_api_key", "sk-xxxxxxxxxxxxxxx")super().__init__(config)def generate_embedding(self, data: str, **kwargs) -> List[float]:def _get_error_string(response: requests.Response) -> str:try:if response.content:return response.json()["detail"]except Exception:passtry:response.raise_for_status()except requests.HTTPError as e:return str(e)return "Unknown error"request_body = {"model": self.embedding_model_name,"input": data,}request_body.update(kwargs)response = requests.post(url=f"{self.embedding_api_base}/v1/embeddings",json=request_body,headers={"Authorization": f"Bearer {self.embedding_api_key}"},)if response.status_code != 200:raise RuntimeError(f"Failed to create the embeddings, detail: {_get_error_string(response)}")result = response.json()embeddings = [d["embedding"] for d in result["data"]]return embeddings[0]

啟動服務

  1. 定義一個CustomVanna類,繼承CustomQdrant_VectorStoreOpenAICompatibleLLM
  2. 構建一個CustomVanna,在其中指定自己的大模型服務和Embedding服務的參數
  3. 鏈接數據庫,比如mysql
  4. 啟動服務
class CustomVanna(CustomQdrant_VectorStore, OpenAICompatibleLLM):def __init__(self, llm_config=None, vector_store_config=None):CustomQdrant_VectorStore.__init__(self, config=vector_store_config)OpenAICompatibleLLM.__init__(self, config=llm_config)vn = CustomVanna(vector_store_config={"client": QdrantClient(host="xxxxx", port=6333)},llm_config={"api_key": "sk-xxxxxxxxxxxx","api_base": "https://xxxxxxxxxxxxxxxxxx/v1","model": "xxxxxxx",},
)vn.connect_to_mysql(host='xxxxx', dbname='xxx', user='xxx', password='xxx', port=3306)from vanna.flask import VannaFlaskApp
app = VannaFlaskApp(vn)
app.run()

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/98841.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/98841.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/98841.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Linux多線程概念

背景知識內存管理OS進行內存管理不是以字節為單位的,而是以內存塊為單位的,默認大小為4kb;系統和磁盤文件進行IO交互的單位是4kb(8個扇區);OS對內存管理實質上是對頁框進行管理。頁框(Page Fram…

【Problem】動態規劃之跳躍游戲系列

一、跳躍游戲 55. 跳躍游戲 - 力扣&#xff08;LeetCode&#xff09;https://leetcode.cn/problems/jump-game/description/?envTypeproblem-list-v2&envIddynamic-programming class Solution { public:bool canJump(vector<int>& nums) {// 狀態定義&#x…

射頻EVM

EVM&#xff08;Error Vector Magnitude&#xff0c;誤差矢量幅度&#xff09;是衡量無線通信系統中調制質量的重要指標&#xff0c;尤其用于評估信號的調制誤差和系統性能。它通常用來表示傳輸信號與理想信號之間的偏差&#xff0c;特別是在數字通信中。EVM的基本概念&#xf…

Java 更改 Word 文檔中文本顏色

在日常的自動化文檔處理中&#xff0c;我們經常會遇到需要對 Word 文檔內容進行編程修改的需求&#xff0c;其中一項常見且重要的操作就是更改文本的顏色。無論是為了突出重點、統一品牌風格&#xff0c;還是實現動態內容展示&#xff0c;精準地修改文本顏色都是一個核心痛點。…

STM32—SPI協議

文章目錄一、SPI 協議簡介二、硬件電路2.1.SPI的連接2.2.數據的移位2.3.時序基本單元2.3.1.起始條件和終止條件2.3.2.模式 02.3.3.模式 12.3.4.模式 22.3.5.模式 32.4.時序三、軟件實現四、W25Q644.1.簡介4.2.硬件電路4.3.框圖4.4.操作注意事項五、實驗一、SPI 協議簡介 SPI&a…

Qt中的QWebEngineView

第1章 本地目錄結構1.1 自己寫的兩個網頁(html)mermaid.html &#xff08;自己寫的網頁界面&#xff09;WebTest.html (自己寫的網頁界面)qwebchannel.js (Qt下載安裝之后&#xff0c;會在安裝目錄下有這個文件&#xff0c;需要將安裝目錄下的改文件拷貝…

Flutter 應用國際化 (i18n) 與本地化 (l10n) 完整指南

Flutter 國際化 (i18n) 完全指南&#xff1a;從入門到精通 在現代移動應用開發中&#xff0c;支持多語言是觸達全球用戶的基本要求。Flutter 提供了強大且靈活的國際化 (i18n) 和本地化 (l10n) 支持。本文將帶你從零開始&#xff0c;一步步深入掌握在 Flutter 中實現國際化的幾…

計算機視覺與深度學習 | 計算機視覺中線特征提取與匹配算法綜述

文章目錄 一、線特征提取算法原理 1.1 Hough變換及其優化 1.2 LSD算法 1.3 EDLines算法 二、核心數學公式 2.1 直線表示與誤差計算 2.2 LSD算法關鍵公式 三、線特征匹配算法 3.1 LBD描述符 3.2 匹配策略 四、代碼實現 4.1 LSD線段檢測(Python) 4.2 LBD特征匹配(C++) 五、算…

Transformer 模型:Attention is All You Need 的真正含義

2017 年&#xff0c;Google Brain 發布了一篇具有里程碑意義的論文——《Attention Is All You Need》&#xff0c;這篇論文不僅首次提出了 Transformer 模型&#xff0c;更重要的是&#xff0c;它宣稱“注意機制&#xff08;Attention Mechanism&#xff09;就足以構建強大的模…

數據庫約束表的設計

數據庫約束概念&#xff1a;數據庫約束是關系型數據庫的一個重要功能&#xff0c;主要是保證數據的完整性&#xff0c;也可理解為數據的正確性&#xff08;數據本身是否正確&#xff0c;關聯關系是否正確&#xff09;&#xff08;一般是用在指定列上&#xff09;常見的約束類型…

【案例分享】TeeChart 助力 Softdrill 提升油氣鉆井數據可視化能力

在鉆井與地質工程領域&#xff0c;數據可視化是核心環節。圖表不僅需要精確與高效&#xff0c;還需符合行業習慣并支持交互與定制。Softdrill 自 2012 年起在核心產品中集成了TeeChart 圖表庫&#xff0c;將復雜的井下數據轉化為直觀的工程圖表&#xff0c;極大提升了鉆井工程師…

【Flink】Flink Runtime 架構設計

Flink Runtime 架構設計 整體架構 ┌─────────────────────────────────────────────────────────────────┐ │ Flink Runtime │ ├─────────…

Git 命令教程

Git介紹 分布式版本控制系統。 Git命令 初始化/全局配置git init初始化一個Git倉庫&#xff08;會創建一個.git的目錄&#xff09;git config --global user.name “name”設置提交時的用戶名git config user.name查看設置的用戶名git config --global user.email “youemail.c…

git config --global user.name指令報錯時的解決方案

問題分析 %HOMEDRIVE%%HOMEPATH%/.gitconfig 是Windows環境變量的表示方式&#xff1a; %HOMEDRIVE% 通常是 C:%HOMEPATH% 通常是 \Users\你的用戶名完整路徑應該是&#xff1a;C:\Users\你的用戶名\.gitconfig 但這里環境變量沒有被正確解析&#xff0c;顯示的是字面意思。 …

websocket和socket io的區別

好的&#xff0c;這是一個更具體也更常見的問題。WebSocket 是一種協議&#xff0c;而 Socket.IO 是一個庫&#xff0c;它使用了 WebSocket 但提供了多得多的功能。 簡單比喻&#xff1a; WebSocket 就像是給你提供了一條高效的“快遞專線”&#xff08;雙向通信通道&#xff…

Nginx反向代理與負載均衡部署

Nginx反向代理與負載均衡部署實戰指南前言一、規劃部署負載均衡和反向代理二、部署Nginx負載均衡器2.1. 準備基礎環境2.2. 創建Nginx運行用戶2.3. 編譯安裝Nginx2.4. 配置Nginx系統服務2.5. 驗證Nginx安裝三、部署后端2臺Tomcat應用服務器3.1. 安裝JDK3.2. 部署Tomcat實例13.3.…

從源碼和設計模式深挖AQS(AbstractQueuedSynchronizer)

AQS 概念 AbstractQueuedSynchronizer&#xff08;AQS&#xff09; 是 Java 并發包 (java.util.concurrent.locks) 的核心基礎框架&#xff0c;它的實現關鍵是先進先出 (FIFO) 等待隊列和一個用volatile修飾的鎖狀態status。具體實現有 : ReentrantLock、Semaphore、CountDownL…

Dart → `.exe`:Flutter 桌面與純命令行雙軌編譯完全指南

Dart → .exe&#xff1a;Flutter 桌面與純命令行雙軌編譯完全指南 關鍵詞&#xff1a;Dart、Flutter、Windows、可執行文件、桌面端、CLI、交叉編譯 1. 前言 很多開發者以為 Dart 只能跑在 AOT 移動端或 Web 端&#xff0c;其實 官方工具鏈早已支持一鍵輸出 Windows 原生 .ex…

互聯網接入網中PPPoE和PPP協議

<摘要> PPPoE和PPP是寬帶接入網絡中至關重要的協議組合&#xff0c;其中PPP提供通用的點對點鏈路層解決方案&#xff0c;而PPPoE則是在以太網架構上擴展PPP應用的技術橋梁。本文從技術演進視角系統解析了兩者的內在關聯與本質區別&#xff1a;PPP作為成熟鏈路層協議&…

詳細解析SparkStreaming和Kafka集成的兩種方式的區別和優劣

spark streaming是基于微批處理的流式計算引擎&#xff0c;通常是利用spark core或者spark core與spark sql一起來處理數據。在企業實時處理架構中&#xff0c;通常將spark streaming和kafka集成作為整個大數據處理架構的核心環節之一。 針對不同的spark、kafka版本&#xff0…