【程序員AI入門:開發】11.從零構建智能問答引擎:LangChain + RAG 實戰手冊

在這里插入圖片描述

1、技術選型

組件推薦方案說明
文本嵌入模型sentence-transformers/all-MiniLM-L6-v2輕量級且效果較好的開源模型
向量數據庫FAISS高效的本地向量檢索庫
大語言模型GPT-3.5/開源LLM(如ChatGLM3)根據資源選擇云端或本地模型
文檔處理框架LangChain簡化RAG流程開發

2、環境準備

# 安裝核心依賴
pip install langchain sentence-transformers faiss-cpu unstructured python-dotx

3、 RAG 核心流程

1、文檔準備

  • 在docs/目錄存放知識文檔(支持.txt/.md/.pdf等格式)
  • 示例文檔內容:
特斯拉2023年Q1交付量42.3萬輛,Q2交付46.6萬輛,Q3交付43.5萬輛,Q4交付48.45萬輛。

2、索引(Indexing)

將數據預處理并存儲為向量。
在這里插入圖片描述

3、檢索生成(Retrieval & Generation)

根據查詢檢索相關上下文,生成回答。
在這里插入圖片描述


4、 索引實現步驟

a. 加載文檔

  • 使用 TextLoader 加載文本文件:

    from langchain_community.document_loaders import TextLoader  
    loader = TextLoader("introduction.txt")  
    docs = loader.load()  
    

b. 拆分文本

  • 使用 RecursiveCharacterTextSplitter 按塊拆分:

    from langchain.text_splitter import RecursiveCharacterTextSplitter  
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)  
    splits = text_splitter.split_documents(docs)  
    

c. 向量化與存儲

  • 初始化 Chroma 向量數據庫,使用 OpenAI Embedding:

    from langchain_chroma import Chroma  
    from langchain_openai import OpenAIEmbeddings  
    vectorstore = Chroma(  collection_name="ai_learning",  embedding_function=OpenAIEmbeddings(),  persist_directory="vectordb"  
    )  
    vectorstore.add_documents(splits)  
    

5、 檢索生成實現步驟

a. 構建 Retriever

  • 從向量庫創建檢索器:

    retriever = vectorstore.as_retriever(search_type="similarity")  
    

b. 提示詞模板

  • 定義系統提示詞,指導模型結合上下文生成答案:

    from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder  
    prompt = ChatPromptTemplate.from_messages([  ("system", """  You are an assistant for question-answering tasks.  Use the retrieved context to answer. If unsure, say you don't know.  Keep answers concise (≤3 sentences).  Context: {context}  """),  MessagesPlaceholder(variable_name="history"),  ("human", "{question}")  
    ])  
    

c. 組裝處理鏈

  • 將檢索、上下文格式化、提示詞和大模型串聯:

    from operator import itemgetter  
    from langchain_core.runnables import RunnablePassthrough  
    context = itemgetter("question") | retriever | format_docs  
    first_step = RunnablePassthrough.assign(context=context)  
    chain = first_step | prompt | trimmer | model  # model為ChatOpenAI實例  
    

6、 核心組件與概念

  • DocumentLoader:加載文本、數據庫、網頁等數據源。
  • TextSplitter:按語義或結構拆分文檔(如代碼、普通文本)。
  • VectorStore:統一接口支持多種向量數據庫(Chroma、Pinecone等)。
  • Retriever:抽象檢索邏輯,支持向量搜索、關鍵詞匹配等。
  • 提示詞工程:通過模板控制生成邏輯,平衡上下文與簡潔性。

7、 關鍵代碼片段

  • 格式化檢索結果

    def format_docs(docs):  return "\n\n".join(doc.page_content for doc in docs)  
    
  • 動態歷史會話管理

    store = {}  
    def get_session_history(session_id: str) -> BaseChatMessageHistory:  if session_id not in store:  store[session_id] = InMemoryChatMessageHistory()  return store[session_id]  
    

8、總結亮點

  • 降本增效:Chroma 無需額外服務,本地持久化降低部署成本。
  • 靈活擴展:通過替換 DocumentLoaderVectorStore 適配不同數據源。
  • 工業級實踐:結合 MMR 算法優化檢索多樣性,控制 Token 消耗。
  • 實戰價值:可直接復用代碼構建知識庫問答、客服機器人等場景。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/80280.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/80280.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/80280.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Linux基礎】文件查找和文本處理指令

目錄 grep命令 find命令 tar命令 head命令 tail命令 wc命令 tee命令 grep命令 作用:在文件中搜索匹配特定模式的文本行,并將結果輸出到標準輸出(通常是終端)。 基本用法: grep [選項] 搜索模式 [文件名] 常用…

云軸科技ZStack入選賽迪顧問2025AI Infra平臺市場發展報告代表廠商

DeepSeek憑借低成本、高性能、開源優勢帶來的蝴蝶效應依然在持續影響企業AI應用部署。尤其在數據安全備受關注的背景下,私有化部署已經成為企業應用AI大模型的優選方案。賽迪顧問在近期發布的《2025中國AI Infra平臺市場發展研究報告》中認為,在推理算力…

從零開始跑通3DGS教程:(四)修改(縮放、空間變換)colmap生成的sfm結果

寫在前面 本文內容 本文所屬《從零開始跑通3DGS教程》系列文章; 通過colmap進行的sfm的普通方式會丟失場景的物理尺度信息,并且并不在符合一般認知的坐標系下,本文將讀取colmap生成的點云和相機pose,將其進行空間變換和縮放之后&a…

RK3568-OpenHarmony(1) : OpenHarmony 5.1的編譯

概述: 本文主要描述了,如何在ubuntu-20.04操作系統上,編譯RK3568平臺的OpenHarmony 5.1版本。 搭建編譯環境 a. 安裝軟件包 sudo apt-get install git-lfs ruby genext2fs build-essential git curl libncurses5-dev libncursesw5-dev openjdk-11-jd…

vue+tsc+noEmit導致打包報TS類型錯誤問題及解決方法

項目場景: 提示:這里簡述項目相關背景: 當我們新建vue3項目,package.json文件會自動給我添加一些配置選項,這寫選項基本沒有問題,但是在實際操作過程中,當項目越來越復雜就會出現問題,本文給大家分享vuetscnoEmit導致打包報TS類型錯誤問題及…

Js 判斷瀏覽器cookie 是否啟用

驗證時 google瀏覽器 135.0.7049.117 不生效 cookie.html <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8"><title>Cookie 檢測</title> </head> <body><h1>檢測是否啟用 Cookie<…

Lambda表達式解讀

本文通過具體案例演示函數式接口Function<T,R>的三種實現方式演變過程。 一、傳統匿名內部類實現 Integer resInt1 t1(new Function<String, Integer>() {Overridepublic Integer apply(String s) {int i Integer.parseInt(s);return i;} });實現特點&#xff1…

等價無窮小代換

理解&#xff1a; 函數某一點的值可以使用泰勒展開式表示&#xff0c;&#xff08;低階無窮小 高階無窮小&#xff09;&#xff0c;主要有低階無窮小決定。 計算極限的時候&#xff1a; 乘除關系隨便換&#xff0c;不影響各個式子的低階無窮小加減關系&#xff1a; &#xf…

護網HVV初級藍隊面試題總結

struts2原理特征 原理:默認的content-type解析器會把用戶傳來的數據直接當成代碼執行&#xff0c;造成rce特征:ognl表達式&#xff0c;memberaccess字段&#xff0c;可以通過catalina日志過濾關鍵信息查找攻擊特征ongl表達式可以被當作代碼執行&#xff0c;其中的類為defaulta…

Web3 實戰項目項目部署到 GitHub 和上線預覽的完整指南

目錄 &#x1f680; 一、部署到 GitHub ? 前置準備 &#x1f9f1; 部署步驟&#xff1a; 1. 創建一個 GitHub 倉庫 2. 上傳項目文件 方法一&#xff1a;使用 Git 命令行 方法二&#xff1a;直接上傳 &#x1f310; 二、通過 GitHub Pages 免費上線 DApp&#xff08;前端…

3.優惠券秒殺

3.1 全局唯一 ID 當用戶搶購時&#xff0c;就會生成訂單并保存到 tb_voucher_order 這張表中&#xff0c;而訂單表如果使用數據庫自增 ID 就存在一些問題&#xff1a; id 的規律性太明顯 受單表數據量的限制 場景分析一&#xff1a;如果我們的 id 具有太明顯的規則&#xf…

AI日報 · 2025年5月07日|谷歌發布 Gemini 2.5 Pro 預覽版 (I/O 版本),大幅提升編碼與視頻理解能力

1、谷歌發布 Gemini 2.5 Pro 預覽版 (I/O 版本)&#xff0c;大幅提升編碼與視頻理解能力 谷歌于5月6日提前發布 Gemini 2.5 Pro 預覽版 (I/O 版本)&#xff0c;為開發者帶來更強編碼能力&#xff0c;尤其優化了前端與UI開發、代碼轉換及智能體工作流構建&#xff0c;并在WebDe…

Python+ffmpeg 實現給視頻添加字幕

創作靈感 孩子學校經常留作業&#xff0c;需要提交一段錄制的視頻&#xff0c;視頻上要求添加學校、班級、姓名等信息的字幕&#xff0c;手機自帶的相機軟件字幕添加位置要么只能添加在視頻正中&#xff0c;要么無法添加多行文本&#xff0c;要么只能添加在片頭或者片尾&#…

OpenLayers 精確經過三個點的曲線繪制

OpenLayers 精確經過三個點的曲線繪制 根據您的需求&#xff0c;我將提供一個使用 OpenLayers 繪制精確經過三個指定點的曲線解決方案。對于三個點的情況&#xff0c;我們可以使用 二次貝塞爾曲線 或 三次樣條插值&#xff0c;確保曲線精確通過所有控制點。 實現方案 下面是…

Django緩存框架API

這里寫自定義目錄標題 訪問緩存django.core.cache.cachesdjango.core.cache.cache 基本用法cache.set(key, value, timeoutDEFAULT_TIMEOUT, versionNone)cache.get(key, defaultNone, versionNone)cache.add(key, value, timeoutDEFAULT_TIMEOUT, versionNone)cache.get_or_se…

Linux系統管理與編程17:自動化部署ftp服務

蘭生幽谷&#xff0c;不為莫服而不芳&#xff1b; 君子行義&#xff0c;不為莫知而止休。 #virtual用戶管理&#xff1a;passerbyA、captain和admin三個虛擬用戶 # passerbyA只能看&#xff0c;captain可看讀寫上傳&#xff0c;但不能刪除。admin全部權限 [rootshell shell]…

2025python學習筆記

一.Python語言基礎入門 第一章 01.初識Python Python的起源&#xff1a; 1989年&#xff0c;為了打發圣誕節假期&#xff0c;Gudio van Rossum吉多范羅蘇姆&#xff08;龜叔&#xff09;決心開發一個新的解釋程序&#xff08;Python維形&#xff09;1991年&#xff0c;第一個…

STM32單片機的快速成長路徑規劃

一、基礎準備階段&#xff08;1-2周&#xff09; C語言核心技能 重點掌握&#xff1a;指針操作、結構體、枚舉、位操作、函數指針&#xff08;回調函數基礎&#xff09;實踐項目&#xff1a;通過51單片機或STM8完成LED控制、按鍵檢測等基礎項目&#xff0c;熟悉寄存器配置和調試…

torch.nn.init.uniform_

nn.init.uniform_ 是 PyTorch 中用于初始化張量&#xff08;tensor&#xff09;的一個函數&#xff0c;它的作用是將張量的值填充為從均勻分布中采樣的隨機數。 詳細說明&#xff1a; 函數&#xff1a; torch.nn.init.uniform_(tensor, a0., b1.)tensor&#xff1a;需要被初始…

Spring MVC中跨域問題處理

在Spring MVC中處理跨域問題可以通過以下幾種方式實現&#xff0c;確保前后端能夠正常通信&#xff1a; 方法一&#xff1a;使用 CrossOrigin 注解 適用于局部控制跨域配置&#xff0c;直接在Controller或方法上添加注解。 示例代碼&#xff1a; RestController CrossOrigin…