搭建基于 ChatGPT 的問答系統

搭建基于 ChatGPT 的問答系統

    • 📣1.簡介
    • 📣2.語言模型,提問范式和 token
      • ?2.1語言模型
      • ?2.2Tokens
      • ?2.3Helper function輔助函數(提問范式)
    • 📣3.評估輸入-分類
    • 📣4.檢查輸入-審核
      • ?4.1審核
            • 4.1.1 我要殺死一個人
            • 4.1.2 一百萬美元贖金
      • ?4.2Prompt 注入
        • ?4.2.1 使用恰當的分隔符
            • 4.2.1.1 系統消息
            • 4.2.1.2 用戶嘗試進行 Prompt 注入
            • 4.2.1.3 用戶再次嘗試進行 Prompt 注入
            • 4.2.1.4 使用分隔符規避 Prompt 注入
        • ?4.2.2 進行監督分類
            • 4.2.2.1 系統消息
            • 4.2.2.2 好樣本和壞樣本
            • 4.2.2.3 模型對用戶消息進行分類
    • 📣5.處理輸入-思維鏈推理
      • ?5.1思維鏈提示設計
        • ?5.1.1 系統消息設計
        • ?5.1.2 用戶消息測試
            • 5.1.2.1 更貴的電腦
            • 5.1.2.2 你有電視么?
      • ?5.2內心獨白
    • 📣6.處理輸入-鏈式
      • ?6.1提取產品和類別
      • ?6.2檢索詳細信息
      • ?6.3生成查詢答案
        • ?6.3.1 解析輸入字符串
        • ?6.3.2 進行檢索
        • ?6.3.3 生成用戶查詢的答案
      • ?6.4總結
    • 📣7.檢查結果
      • ?7.1檢查有害內容
      • ?7.2檢查是否符合產品信息
    • 📣8.搭建一個帶評估的端到端問答系統
      • ?8.1端到端實現問答系統
      • ?8.2持續收集用戶和助手消息
    • 📣9.評估(上)-存在一個簡單的正確答案
      • ?9.1找出相關產品和類別名稱
      • ?9.2在一些查詢上進行評估
      • ?9.3更難的測試用例
      • ?9.4修改指令以處理難測試用例
      • ?9.5在難測試用例上評估修改后的指令
      • ?9.6回歸測試:驗證模型在以前的測試用例上仍然有效
      • ?9.7收集開發集進行自動化測試
      • ?9.8通過與理想答案比較來評估測試用例
      • ?9.9在所有測試用例上運行評估,并計算正確的用例比例
    • 📣10.評估(下)-不存在簡單的正確答案
      • ?10.1運行問答系統獲得一個復雜回答
      • ?10.2使用 GPT 評估回答是否正確
      • ?10.3評估生成回答與標準回答的差距
    • 📣11.總結

📣1.簡介

面向想要基于 LLM 開發應用程序的開發者,簡潔有效而又系統全面地介紹了如何基于 ChatGPT API 打造完整的對話系統。

📣2.語言模型,提問范式和 token

?2.1語言模型

?2.2Tokens

?2.3Helper function輔助函數(提問范式)

📣3.評估輸入-分類

📣4.檢查輸入-審核

?4.1審核

4.1.1 我要殺死一個人
4.1.2 一百萬美元贖金

?4.2Prompt 注入

?4.2.1 使用恰當的分隔符
4.2.1.1 系統消息
4.2.1.2 用戶嘗試進行 Prompt 注入
4.2.1.3 用戶再次嘗試進行 Prompt 注入
4.2.1.4 使用分隔符規避 Prompt 注入
?4.2.2 進行監督分類
4.2.2.1 系統消息
4.2.2.2 好樣本和壞樣本
4.2.2.3 模型對用戶消息進行分類

📣5.處理輸入-思維鏈推理

?5.1思維鏈提示設計

?5.1.1 系統消息設計
?5.1.2 用戶消息測試
5.1.2.1 更貴的電腦
5.1.2.2 你有電視么?

?5.2內心獨白

📣6.處理輸入-鏈式

?6.1提取產品和類別

?6.2檢索詳細信息

?6.3生成查詢答案

?6.3.1 解析輸入字符串
?6.3.2 進行檢索
?6.3.3 生成用戶查詢的答案

?6.4總結

📣7.檢查結果

?7.1檢查有害內容

?7.2檢查是否符合產品信息

📣8.搭建一個帶評估的端到端問答系統

?8.1端到端實現問答系統

?8.2持續收集用戶和助手消息

📣9.評估(上)-存在一個簡單的正確答案

?9.1找出相關產品和類別名稱

?9.2在一些查詢上進行評估

?9.3更難的測試用例

?9.4修改指令以處理難測試用例

?9.5在難測試用例上評估修改后的指令

?9.6回歸測試:驗證模型在以前的測試用例上仍然有效

?9.7收集開發集進行自動化測試

?9.8通過與理想答案比較來評估測試用例

?9.9在所有測試用例上運行評估,并計算正確的用例比例

📣10.評估(下)-不存在簡單的正確答案

?10.1運行問答系統獲得一個復雜回答

?10.2使用 GPT 評估回答是否正確

?10.3評估生成回答與標準回答的差距

📣11.總結

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/45440.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/45440.shtml
英文地址,請注明出處:http://en.pswp.cn/web/45440.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

使用UDP通信接收與發送Mavlink2.0協議心跳包完整示例

1.克隆mavlink源碼 https://github.com/mavlink/mavlink.git 2.進入mavlink目錄,安裝依賴 python3 -m pip install -r pymavlink/requirements.txt 3.生成Mavlink的C頭文件 mavlink % python3 -m pymavlink.tools.mavgen --lang=C --wire-protocol=2.0 --output=generated…

1-5歲幼兒胼胝體的表面形態測量

摘要 胼胝體(CC)是大腦中的一個大型白質纖維束,它參與各種認知、感覺和運動過程。盡管CC與多種發育和精神疾病有關,但關于這一結構的正常發育(特別是在幼兒階段)還有很多待解開的謎團。雖然早期文獻中報道了性別二態性,但這些研究的觀察結果…

【Linux網絡】select{理解認識select/select與多線程多進程/認識select函數/使用select開發并發echo服務器}

文章目錄 0.理解/認識回顧回調函數select/pollread與直接使用 read 的效率差異 1.認識selectselect/多線程(Multi-threading)/多進程(Multi-processing)select函數socket就緒條件select的特點總結 2.select下echo服務器封裝套接字…

C++ 類和對象 賦值運算符重載

前言: 在上文我們知道數據類型分為自定義類型和內置類型,當我想用內置類型比較大小是非常容易的但是在C中成員變量都是在類(自定義類型)里面的,那我想給類比較大小那該怎么辦呢?這時候運算符重載就出現了 一 運算符重載概念&…

安全防御:防火墻基本模塊

目錄 一、接口 1.1 物理接口 1.2 虛擬接口 二、區域 三、模式 3.1 路由模式 3.2 透明模式 3.3 旁路檢測模式 3.4 混合模式 四、安全策略 五、防火墻的狀態檢測和會話表技術 一、接口 1.1 物理接口 三層口 --- 可以配置IP地址的接口 二層口: 普通二層…

Java面試題:分庫分表

分庫分表 當數據量非常大時,就需要通過分庫分表的方式進行壓力分攤,避免數據庫訪問壓力過大 分庫分表的前提: 業務數據達到一定量級:單表數據量達到1000w或20g 優化解決不了性能問題 分庫分表策略 垂直拆分 垂直分庫 以表為依據,根據業務將不同表拆分到不同庫中 eg:根…

車載終端_RTK定位|4路攝像頭|駕駛輔助系統ADAS定制方案

現代車輛管理行業的發展趨勢逐漸向智能化和高效化方向發展,車載終端成為關鍵的工具之一。在這個背景下,一款特別為車隊管理行業設計的車載終端應運而生。該車載終端采用8寸多點觸控電容屏,搭載聯發科四核處理器,主頻2.0GHz&#x…

如何安裝node.js

Node.js Node.js 是一個基于 Chrome V8 引擎的 JavaScript 運行時環境。 主要特點和優勢: 非阻塞 I/O 和事件驅動:能夠高效處理大量并發連接,非常適合構建高并發的網絡應用,如 Web 服務器、實時聊天應用等。 例如,在…

FeignClient詳解

FeignClient 是 Spring Cloud Open Feign 中的一個注解,它用于定義一個 Feign 客戶端,Feign 是一個聲明式的 Web 服務客戶端,使得編寫 Web 服務客戶端變得更加簡單。以下是 FeignClient 注解的詳細說明: 定義 Feign 客戶端&#x…

網絡安全——防御(防火墻)帶寬以及雙機熱備實驗

12,對現有網絡進行改造升級,將當個防火墻組網改成雙機熱備的組網形式,做負載分擔模式,游客區和DMZ區走FW3,生產區和辦公區的流量走FW1 13,辦公區上網用戶限制流量不超過100M,其中銷售部人員在其…

Swift入門筆記

Swift入門筆記 簡單值控制流函數和閉包對象和類枚舉和結構體并發協議和擴展錯誤處理泛型 簡單值 // 聲明變量 var myVariable 42 myVariable 50// 聲明常量 let myConstant 42// 聲明類型 let implicitInteger 70 let implicitDouble 70.0 let explicitDouble: Double 7…

排序相關算法--3.選擇排序

之前涉及的堆排序就是選擇排序的一種,先進行選擇。 基本選擇排序: 最簡單,也是最沒用的排序算法,時間復雜度高并且還是不穩定的排序方法,項目中很少會用。 過程: 在一個長度為 N 的無序數組中,…

智慧公廁系統助力城市衛生管理

在當今快速發展的城市環境中,城市衛生管理面臨著諸多挑戰。其中,公共廁所的管理一直是一個重要但又常被忽視的環節。然而,隨著科技的不斷進步,智慧公廁系統的出現為城市衛生管理帶來了全新的解決方案,成為提升城市品質…

OrangePi AIpro 淺上手

OrangePi AIpro 淺上手 OrangePi AIpro 介紹開發版介紹硬件規格頂層視圖和底層視圖接口詳情圖 玩轉 OrangePi AIPro燒錄鏡像串口調試連接 WiFissh 連接配置下載源 使用感受優點:缺點或需注意的點: OrangePi AIpro 介紹 開發版介紹 OrangePi AIpro是香橙…

【大語言模型】私有化搭建-企業知識庫-知識問答系統

下面是我關于大語言模型學習的一點記錄 目錄 人工智能學習路線 MaxKB 系統(基于大語言模型的知識問答系統) 部署開源大語言模型LLM 1.CPU模式(沒有好的GPU,算力和效果較差) 2.GPU模式(需要有NVIDIA顯卡支持) Ollama網絡配置 Ollama前…

【問卷系統】TDucKX更新速覽

TDuck是一款在線表單問卷收集工具,開源地址:https://gitee.com/TDuckApp一款免費的表單問卷系統;可快速創建問卷或業務表單,采用無代碼理念支持開發自定義組件。采用SpringBootVueElementUI技術棧,功能強大界面清新&am…

Catena-x標準解讀:CX-0007 Minimal Data Provider Service Offering v1.0.2 最小數據提供商服務產品

為了更好地理解,最小數據提供者服務也將被稱為“上傳工具”。 對于數據供應工具來說,數據主權的概念尤為重要。數據主權是Catena-X網絡的核心價值觀之一。每個參與者都應該盡可能多地控制自己的數據。這包括 他總是確切地知道他在與誰交換數據。參與者…

【GameFramework擴展應用】6-4、GameFramework框架增加AB包加解密功能

推薦閱讀 CSDN主頁GitHub開源地址Unity3D插件分享簡書地址QQ群:398291828大家好,我是佛系工程師☆恬靜的小魔龍☆,不定時更新Unity開發技巧,覺得有用記得一鍵三連哦。 一、前言 【GameFramework框架】系列教程目錄: https://blog.csdn.net/q764424567/article/details/1…

軟件測試面試200問(全)

1、B/S架構和C/S架構區別 B/S 只需要有操作系統和瀏覽器就行,可以實現跨平臺,客戶端零維護,維護成本低,但是個性化能力低,響應速度較慢 C/S響應速度快,安全性強,一般應用于局域網中&#xff0…