測試工程師如何通俗理解和入門RAG：從“查資料”到“寫答案”的智能升級

測試工程師如何通俗理解和入門RAG：從“查資料”到“寫答案”的智能升級

pingmian/2025/7/7 1:02:22/文章來源:https://blog.csdn.net/weixin_44872675/article/details/148214771

1. 為什么要學習RAG？——從“查資料”到“寫答案”的飛躍

背景：你已經掌握了Embedding技術，能將文檔、代碼、測試用例等離散信息轉化為向量，用于相似度匹配。
痛點：但僅靠向量匹配找到相關文檔后，如何快速生成答案？如何避免“找到文檔卻不會總結”的尷尬？
RAG的價值：RAG = 檢索 + 生成，就像“先查手冊，再用自己的話寫報告”。它讓AI既能精準定位知識，又能智能總結答案，是測試工程師的效率神器。

2. RAG的三大核心環節——像“查資料+寫報告”的流程

2.1 環節一：知識庫搭建（準備“資料庫”）

目標：將你的測試文檔、缺陷記錄、用例庫等轉化為AI可檢索的“知識庫”。
類比：就像把紙質文檔掃描成電子版，再貼上標簽，方便快速查找。

具體操作：

結構化整理：將文檔拆分為小段（如每個測試用例、缺陷描述單獨保存）。
向量化存儲：用Embedding模型（如OpenAI的text-embedding-ada-002）將每段文字轉為向量，存儲到向量數據庫（如Faiss、Milvus）。

2.2 環節二：檢索（精準“查資料”）

目標：當用戶提問時，快速找到最相關的文檔片段。
類比：就像在圖書館里用關鍵詞搜索，找到最相關的幾本書。

具體操作：

問題向量化：將用戶的問題轉為向量。
相似度匹配：在向量數據庫中查找與問題向量最接近的文檔片段（如Top 3）。

2.3 環節三：生成（智能“寫答案”）

目標：將檢索到的文檔片段和原始問題合并，生成自然流暢的答案。
類比&#x

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/82217.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/82217.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/82217.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

數量優勢：使用Bagging和Boosting的集成模型

數量優勢：使用Bagging和Boosting的集成模型

文章目錄裝袋法（Bagging）和提升法（Boosting）利用集成學習創建強大的模型裝袋法（Bagging）：為機器學習模型增加穩定性裝袋法示例提升法（Boosting）：減少弱學習…

閱讀更多...

5G基站選擇±10ppm晶振及低相噪技術解析

5G基站選擇±10ppm晶振及低相噪技術解析

在5G通信技術飛速發展的時代，5G基站作為核心基礎設施，其性能的優劣直接影響著整個通信網絡的質量。晶振作為5G基站中的關鍵器件，對基站的頻率穩定性、信號傳輸質量等起著至關重要的作用。 5G基站對晶振的要求 （一）高…

閱讀更多...

嵌入式＜style＞設計模式

嵌入式＜style＞設計模式

每天分享一個web前端開發技巧。今天分享的主題是，如何提升前端代碼的內聚性。我們在寫<style></style>的時候，往往把大量無關聯的樣式寫在同一個<style>下，而且離相關的html元素很遠，這樣導致每次想修改某個元…

閱讀更多...

簡單數學板子和例題

簡單數學板子和例題

線性丟番圖方程 axbyc dgcd(a,b)，若c|d，有無窮整數解 x x 0 b d n , y y 0 ? a d n xx_0{b\over d}n,yy_0-{a\over d}n xx0?db?n,yy0??da?n POJ 1265 poj真難用，abs一直報錯，萬能頭也不能用，給我調紅溫了 …

閱讀更多...

深度解析視頻剪輯SDK開發：從AI字幕提取到多端原生插件集成-優雅草卓伊凡

深度解析視頻剪輯SDK開發：從AI字幕提取到多端原生插件集成-優雅草卓伊凡

深度解析視頻剪輯SDK開發：從AI字幕提取到多端原生插件集成-優雅草卓伊凡引言：視頻剪輯技術的演進與市場需求近年來，短視頻和社交媒體的爆發式增長推動了視頻剪輯技術的快速發展。優雅草卓伊凡及其團隊近期接到一個客戶需求：開…

閱讀更多...

對WireShark 中的EtherCAT抓包數據進行解析

對WireShark 中的EtherCAT抓包數據進行解析

對WireShark 中的EtherCAT抓包數據進行解析 EtherCAT數據包結構 EtherCAT數據幀結構如下： 采用 Python 實現對 EtherCAT 數據包進行解析 import numpy as np import matplotlib.pyplot as plt from IPython import embed from collections import Counter import …

閱讀更多...

基于SpringBoot的校園電競賽事系統

基于SpringBoot的校園電競賽事系統

博主介紹：java高級開發，從事互聯網行業六年，熟悉各種主流語言，精通java、python、php、爬蟲、web開發，已經做了六年的畢業設計程序開發，開發過上千套畢業設計程序，沒有什么華麗的語言&#xff0…

閱讀更多...

數據湖和數據倉庫的區別

數據湖和數據倉庫的區別

在當今數據驅動的時代，企業需要處理和存儲海量數據。數據湖與數據倉庫作為兩種主要的數據存儲解決方案，各自有其獨特的優勢與適用場景。本文將客觀詳細地介紹數據湖與數據倉庫的基本概念、核心區別、應用場景以及未來發展趨勢，幫助讀者更好地…

閱讀更多...

Mysql 刷題Day09

Mysql 刷題Day09

LC 585 2016年的投資思路： 本題思路好想 ， 就是把2015年投資相同的找出來 ，再找出這其中經緯度不同的id對應的2016年的保險。實際操作中， 發現用group by很麻煩， 那么想到窗口函數也能分組進行統計利用 count(…

閱讀更多...

Lambda表達式的方法引用詳解

Lambda表達式的方法引用詳解

Lambda表達式的方法引用詳解 1. 方法引用的概念與作用定義：方法引用（Method Reference）是Lambda表達式的一種簡化寫法，允許直接通過方法名引用已有的方法。核心目的：減少冗余代碼，提升可讀性，尤其在Lambda僅調用一個現有方法時。語法符號：雙冒號 ::。2. 方法引用的四種…

閱讀更多...

記錄python在excel中添加一列新的列

記錄python在excel中添加一列新的列

思路是，先將需要添加為新的列存儲到一個暫時的列表中，然后用到以下函數來存儲 data_.loc[:, "新列的名字"] save_list_ 上面的save_list_就是暫時存儲了信息的列表了。以下是我的代碼，供以后快速回憶。 schools_data {"98…

閱讀更多...

關于flutter中Scaffold.of(context).openEndDrawer()；不生效問題

關于flutter中Scaffold.of(context).openEndDrawer()；不生效問題

原因： 在 Flutter 中，Scaffold.of(context) 會沿著當前的 context 向上查找最近的 Scaffold。如果當前的 widget 樹層級中沒有合適的 Scaffold（比如按鈕所在的 context 是在某個子 widget 中），就找不到它。解決辦法…

閱讀更多...

財管-1-財務分析、評價和預測

財管-1-財務分析、評價和預測

1.因素分析法： 報告期（實際）指標M1A1 * B1 * C1 基期（計劃）指標M0A0 * B0 * C0……（1） 第一次替代 A1 * B0 * C0……（2） 第二次替代 A1 * B1 * C0……（3…

閱讀更多...

golang逃逸分析

golang逃逸分析

1.1 逃逸分析是什么逃逸分析是指編譯器在執行靜態代碼分析后，對內存管理進行的優化和簡化。在編譯原理中，分析指針動態范圍的方法被稱為逃逸分析。通俗來講，當一個對象的指針被多個方法或線程引用時，則稱這個指針發生了逃逸。…

閱讀更多...

Meetily：AI會議記錄，開源、免費、好用（本地AI實時轉錄、隱私保護一步到位！）

Meetily：AI會議記錄，開源、免費、好用（本地AI實時轉錄、隱私保護一步到位！）

名人說：博觀而約取，厚積而薄發。——蘇軾《稼說送張琥》創作者：Code_流蘇(CSDN)（一個喜歡古詩詞和編程的Coder??）目錄一、初識Meetily：什么是真正的智能會議助手？1. 核心優勢一覽2. 技術架構揭秘二、實戰體驗：從安裝到使用的完整流程1. 系統要求2. 快速安裝指南Wi…

閱讀更多...

.NET ORM開發手冊：基于SqlSugar的高效數據訪問全攻略

.NET ORM開發手冊：基于SqlSugar的高效數據訪問全攻略

SqlSuger是一個國產，開源ORM框架，具有高性能，使用方便，功能全面的特點，支持.NET Framework和.NET Core，支持各種關系型數據庫，分布式數據庫，時序數據庫。官網地址：SqlS…

閱讀更多...

【論文閱讀】KIMI-VL TECHNICAL REPORT

【論文閱讀】KIMI-VL TECHNICAL REPORT

KIMI-VL TECHNICAL REPORT 原文摘要核心模型：Kimi-VL 模型架構：基于 MoE 設計，僅激活語言解碼器的 2.8B 參數（Kimi-VL-A3B），在保持高效計算的同時實現高性能。 MoE（Mixture of Experts&#xf…

閱讀更多...

項目管理學習-CSPM4（2）

項目管理學習-CSPM4（2）

1 前言最近在學習CSPM的課程，部分內容讓我受益匪淺。建議需要提升項目管理能力的同學可以通過以考促學的方式進行學習。下面整理了一部分內容和大家分享。CSPM全稱China Standards Project Management，中文名為項目管理專業人員能力評價等級證書&#…

閱讀更多...

【Web前端】ECMAScript 6基礎學習

【Web前端】ECMAScript 6基礎學習

ECMAScript 6 簡介 ECMAScript 和 JavaScript 的關系:前者是后者的規格，后者是前者的一種實現，常場合，這兩個詞是可以互換的。 ECMAScript 6（以下簡稱 ES6）是 JavaScript 語言的標準，在 2015 年 6 月發布…

閱讀更多...

基于Python的全卷積網絡（FCN）實現路徑損耗預測

基于Python的全卷積網絡（FCN）實現路徑損耗預測

以下是一份詳細的基于Python的全卷積網絡（FCN）實現路徑損耗預測的技術文檔。本方案包含理論基礎、數據生成、模型構建、訓練優化及可視化分析，代碼實現約6000字。基于全卷積網絡的無線信道路徑損耗預測系統目錄問題背景與需求分析系統架構設計合成數據生成方法全卷積網絡…

閱讀更多...

最新文章