大模型開發學習筆記

文章目錄

  • 大模型基礎
    • 大模型的使用
    • 大模型訓練的階段
    • 大模型的特點及分類
    • 大模型的工作流程
      • 分詞化(tokenization)與詞表映射
    • 大模型的應用
  • 進階
    • agent的組成和概念
    • planning規劃
      • 子任務分解
      • ReAct框架
    • memory記憶
    • Tools工具\工具集的使用
    • langchain
      • 認知框架
        • ReAct框架
        • plan-and-Execute計劃與執行
        • self-ask(自問自答)
        • thinking and self-refection思考并自我反思
      • ReAct框架實例
      • 通過llamindex實現ReAct RAG Agent
      • agent數字人項目實戰
    • 提示詞\提示詞工程
      • prompt提示詞是什么?
      • prompt結構

大模型基礎

foundational Models,基礎模型或稱基座模型,即大模型

大模型的使用

prompt engineering(提示詞工程)

大模型訓練的階段

  1. 預訓練
  2. SFT(監督微調)
  3. RLHF(基于人類反饋的強化學習)

大模型的特點及分類

  • 適應性靈活性強

  • 廣泛數據集的預訓練

  • 計算資源需求大

  • 參數規模大

  • 大語言模型

  • 多模態模型(計算機視覺\語音)

大模型的工作流程

分詞化(tokenization)與詞表映射

  • 詞粒度,適用英文
  • 字符粒度,中文分詞
  • 子詞粒度,將單詞分解為更小的單位
  • 每一個token通過預先設置好的詞表,映射為一個tokenid,這是token的身份證

大模型的應用

理解人類或自己本身,就能很好的學會大模型應用及開發

進階

agent的組成和概念

在這里插入圖片描述
memory + tools + Planning + Action <-----agent

agent的決策流程
在這里插入圖片描述

planning規劃

子任務分解

思維鏈(chain of thoughs,CoT)
思維樹(Tree of thoughs,ToT),使用深度優先或廣度優先搜索
在這里插入圖片描述

ReAct框架

搜索高端手機,最好用的手機
組合推理和行動.首先通過推理確定搜索"蘋果手機",并從外部環境中觀察結果.隨著推理的深入,識別出需要搜索…幾輪交互后,得出標準答案

memory記憶

智能體中的記憶機制

  • 形成記憶,大模型訓練參數得到的記憶
  • 短期記憶,當前任務的暫存記憶
  • 長期記憶,長期保留的信息,通常用向量數據庫來存儲和檢索

Tools工具\工具集的使用

使用工具突破大模型本身的限制

langchain

agent只是實現智能體的框架,真正的大腦還是LLM

認知框架

ReAct框架

在這里插入圖片描述

plan-and-Execute計劃與執行

在這里插入圖片描述

self-ask(自問自答)

在這里插入圖片描述

thinking and self-refection思考并自我反思

在這里插入圖片描述

ReAct框架實例

我的理解是langchain已經在這些認知框架中把提示詞封裝好了,不用我們去手寫了

通過llamindex實現ReAct RAG Agent

agent數字人項目實戰

技術棧:agent + RAG + webRPC + docker
一些技術是要收費的

提示詞\提示詞工程

以上我的理解是對的,不同適用場景的AI工具,就是將提示詞工程提前封裝了,不用再讓用戶\使用者麻煩地定義\構建提示詞

  1. 精確性
  2. 靈活性多樣性
  3. 風格

prompt提示詞是什么?

適用大模型時,向其輸入的指令
prompt構建的原則?

  • 清晰明確,提供充足的上下文
  • 使用標點符號更清晰
  • 用樣例數據指引模型輸出
  • 分步驟引導
  • 一般用json格式,效果最好

prompt結構

  1. context上下文(上下文),角色\任務\知識
  2. instruction命令,步驟\思維鏈\示例
  3. input data輸入數據,句子\文章\問題
  4. output indicator,輸出格式
    在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/903859.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/903859.shtml
英文地址,請注明出處:http://en.pswp.cn/news/903859.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

4.27-5.4學習周報

提示&#xff1a;文章寫完后&#xff0c;目錄可以自動生成&#xff0c;如何生成可參考右邊的幫助文檔 文章目錄 摘要Abstract一、方法介紹2.Rainbow Memory(RM)2.1多樣性感知內存更新2.2通過數據增強增強樣本多樣性(DA) 二、使用步驟1.實驗概況2.RM核心代碼 總結 摘要 本博客概…

AI Rack架構高速互連的挑戰:損耗設計與信號完整性的設計框架

在AI驅動的時代&#xff0c;系統設計已經從單一PCB的視角&#xff0c;逐步轉向以整個rack為單位來考量。 對于信號完整性而言&#xff0c;焦點以不再局限于單一PCB上的損耗&#xff0c;而是擴展到芯片與芯片之間的端到端互連損耗&#xff08;end-to-end interconnect loss&…

杭電oj(1180、1181)題解

目錄 1180 題目 思路 問題概述 代碼思路分析 1. 數據結構與全局變量 2. BFS 函數 bfs 3. 主函數 main 總結 代碼 1181 題目 思路 1. 全局變量的定義 2. 深度優先搜索函數 dfs 3. 主函數 main 總結 代碼 1180 題目 思路 注&#xff1a;當走的方向和樓梯方向一…

軟件測試概念

這里寫目錄標題 需求開發模型軟件生命周期瀑布模型螺旋模型增量模型、迭代模型敏捷模型Scrum 測試模型V模型W模型&#xff08;雙V模型&#xff09; 需求 用戶需求&#xff1a;沒有經過合理的評估&#xff0c;通常就是一句話 軟件需求&#xff1a;是開發人員和測試人員執行工作…

數字基帶信號和頻帶信號的區別解析

數字基帶信號和數字頻帶信號是通信系統中兩種不同的信號形式&#xff0c;它們的核心區別在于是否經過調制以及適用的傳輸場景。以下是兩者的主要區別和分析&#xff1a; 1. 定義與核心區別 數字基帶信號&#xff08;Digital Baseband Signal&#xff09; 未經調制的原始數字信號…

Linux52 運行百度網盤 解決故障無法訪問repo nosandbox 未解決:疑似libstdc++版本低導致無法運行baidu網盤

昨日參考 哦 我是root Cannot find a valid baseurl for repo: centos-sclo-rh/x86_64 沒了 計劃去手動下一個 還是不行 放棄 猜測是 centos7 過期了 一些依賴組件也沒地方下載了 通過阿里云鏡像站下載 之前安裝的好像不是這個版本 還是計劃用yum去下載依賴&#xff0c;先處…

2000-2022年上市公司數字經濟專利申請數據

2000-2022年上市公司數字經濟專利申請數據 1、時間&#xff1a;2000-2022年 2、來源&#xff1a;國家知識產權局 3、指標&#xff1a;年份、股票代碼、股票簡稱、行業名稱、行業代碼、省份、城市、區縣、行政區劃代碼、城市代碼、區縣代碼、首次上市年份、上市狀態、數字經濟…

機器學習之五:基于解釋的學習

正如人們有各種各樣的學習方法一樣&#xff0c;機器學習也有多種學習方法。若按學習時所用的方法進行分類&#xff0c;則機器學習可分為機械式學習、指導式學習、示例學習、類比學習、解釋學習等。這是溫斯頓在1977年提出的一種分類方法。 有關機器學習的基本概念&#xff0c;…

Chromium 134 編譯指南 - Android 篇:安裝構建依賴項(七)

1. 引言 歡迎來到《Chromium 134 編譯指南》系列的第七篇文章&#xff01;在前面的章節中&#xff0c;我們已經成功獲取了Chromium源代碼&#xff0c;并將其配置為支持Android平臺。這些步驟為我們的編譯之旅奠定了堅實的基礎&#xff0c;但在開始實際編譯之前&#xff0c;我們…

java 進階 1.0

靜態方法 static 就是能直接用&#xff0c;不用再new一個對象了 一般java中Math等靜態類就是可以直接使用其方法 main函數里面不能包含太多的邏輯性語句&#xff0c;全部寫成模塊 寫好程序之后如何測試呢&#xff1f; 使用junit&#xff0c;不能在main函數里測試 測試本身就…

中小企業MES系統詳細設計

版本&#xff1a;V1.1 日期&#xff1a;2025年5月2日 一、設備協議兼容性設計 1.1 設備接入框架 #mermaid-svg-PkwqEMRIIlIBPP58 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-PkwqEMRIIlIBPP58 .error-icon{fill…

Spring Security會話管理

用戶認證通過后&#xff0c;為了避免用戶的每次操作都進行認證&#xff0c;可以將用戶的信息保存在會話中。會話就是系統為了保持當前用戶的登錄狀態所提供的機制&#xff0c;常見的有基于Session方式、基于Token方式等。Spring Security提供會話管理功能&#xff0c;只需要配置…

PostgreSQL數據庫操作基本命令

常用操作sql &#x1f510; 用戶管理 -- 創建用戶 CREATE USER username WITH PASSWORD password;-- 修改用戶密碼 ALTER USER username WITH PASSWORD newpassword;-- 刪除用戶 DROP USER username;&#x1f4e6; 數據庫操作 -- 創建數據庫 CREATE DATABASE dbname;-- 刪除…

[吾愛出品] 網文提取精靈_4.0

網文提取精靈 鏈接&#xff1a;https://pan.xunlei.com/s/VOPDvKljcT3EWLjpt5LeDZvfA1?pwdw8kq# 易語言寫的&#xff0c;介意的不要下載 相對網文提取工具_2.10.02版&#xff0c;因為是重寫界面&#xff0c;目前版本限制最高5線程&#xff0c;暫時不支持批處理。 雖然不支…

每日算法-250502

每日算法 - 2025.05.02 記錄一下今天刷的幾道 LeetCode 算法題。 3191. 使二進制數組全部等于 1 的最少操作次數 I 題目 思路 貪心 解題過程 遍歷數組 nums。當我們遇到 nums[i] 時&#xff1a; 如果 nums[i] 是 1&#xff0c;我們不需要進行操作&#xff0c;因為目標是全 …

移動端開發中設備、分辨率、瀏覽器兼容性問題

以下是針對移動端開發中設備、分辨率、瀏覽器兼容性問題的 系統化解決方案&#xff0c;按開發流程和技術維度拆解&#xff0c;形成可落地的執行步驟&#xff1a; 一、基礎環境適配&#xff1a;從「起點」杜絕兼容性隱患 1. Viewport 元標簽標準化 <meta name"viewpor…

2025最新AI繪畫系統源碼 - 畫圖大模型/GPT-4全支持/AI換臉/自定義智能體

在AI繪畫技術日新月異的2025年&#xff0c;比象AI繪畫系統源碼以其突破性的技術創新重新定義了數字藝術創作的邊界。作為第四代AI繪畫引擎&#xff0c;我們不僅集成了最先進的GPT-4o多模態畫圖模型&#xff0c;實現了從基礎文生圖到專業級藝術創作的全面進化。本系統源碼經過多…

構造函數詳解

構造函數的作用 構造函數的主要任務是初始化對象&#xff0c;而不是創建對象&#xff08;對象的內存空間在構造函數被調用前已經分配好&#xff09;。 構造函數特性 命名規則&#xff1a;函數名必須與類名完全相同。 返回值&#xff1a;構造函數沒有返回值類型&#xff08;連…

jaffree 封裝ffmpeg 轉換視頻格式,獲取大小,時間,封面

下載 參考網址 【收藏級教程】FFmpeg音視頻處理寶典&#xff1a;從入門到精通的50個實用技巧_ffmpeg教程-CSDN博客 配置環境變量 驗證 重啟idea開發工具 springboot maven集成 <dependency><groupId>com.github.kokorin.jaffree</groupId><artifactId&…

2505C++,wmi客戶端示例

原文 #define _WIN32_DCOM #include <iostream> using namespace std; #include <comdef.h> #include <Wbemidl.h> #pragma comment(lib, "wbemuuid.lib") int main(int argc, char **argv) {HRESULT hres;//初化COM.hres CoInitializeEx(0, CO…