閱讀筆記——理解什么是LLM大語言模型

閱讀筆記:
理解LLM
deepseek創新了什么
什么是多模態

什么是token

??

  1. 定義??:Token是LLM處理文本的最小單位,相當于語言的"原子"
  2. ??類比??:
    中文:1個token ≈ 1個漢字或常見詞(如"模型"可能為1個token)
    英文:1個token ≈ 4個字母(如"apple"可能拆為"app"+“le”)

每個token都會在模型中生成三個核心向量
在這里插入圖片描述
○ Q 是查詢向量

○ K 是線索向量

○ V 是答案向量

候選token:在自注意力機制中,??候選token?? 是指當前token在計算注意力權重時,所有可能與之發生交互的其他token。

api

大語言模型的 本質就是文字接龍 , 相對應的使用大模型也比較簡單. 可以參見deepseek的文字接龍 api 請求:
在這里插入圖片描述

tools 工具支持:

大模型對 function calling 的支持,即大模型可以調用各種外部工具

為什么說LLM是無狀態的

LLM有自注意力機制能??動態關聯上下文??(通過Q/K/V向量),但LLM卻被認為??無狀態??。這看似矛盾,實則反映了不同層級的特性:
在這里插入圖片描述
這時候就有一個問題,既然LLM是無狀態的,不能記住跨序列的多次輸入,那么LLM是如何持續關聯一個對話的上下文的?——增加一個外部記憶庫(傳統方案是增大一個序列的max_length)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/81629.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/81629.shtml
英文地址,請注明出處:http://en.pswp.cn/web/81629.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

(自用)Java學習-5.14(注冊,鹽值加密,模糊查詢)

一、核心功能實現 1. 用戶注冊功能 前端實現 用戶名實時校驗:通過AJAX異步請求檢查用戶名是否已存在。 function checkName() {$.ajax({url: /users/checkUserName?uname uname,success: function(resp) {if (resp.code 200) alert("用戶名可用");el…

【雜談】STM32使用快速傅里葉變換庫函數后如何比較準確地找到n次諧波幅值

目錄 1.簡單介紹傅里葉變換的作用 2.諧波是什么 3.解決方法 1.簡單介紹傅里葉變換的作用 任何復雜的波形歸根結底都是由多個頻率和相位不一樣的正弦波組成的 通過傅里葉變換可以找到組成一個復雜的波形的所有正弦波的頻率和幅度信息 2.諧波是什么 假設有一個復雜的波形&a…

芯科科技推出首批第三代無線開發平臺SoC,高度集成的解決方案推動下一波物聯網實現突破

SiXG301和SiXG302是芯科科技采用22納米工藝節點推出的首批無線SoC系列產品,在計算能力、功效、集成度和安全性方面實現突破性進展 低功耗無線解決方案領導性創新廠商Silicon Labs(亦稱“芯科科技”,NASDAQ:SLAB)近日宣…

寫作即是生活

一個問題 “我是什么時候開始寫作的呢?”請你先暫停一下,別往下讀,先想想這個問題。 什么才是寫作? 或許在想上個問題之后,你就會開始想問另外一個問題,什么才算是寫作呢? 我的回答是&#x…

SpringBoot 執行Lua腳本 服務端執行 減少性能損耗 優化性能 優化連接性能

介紹 通過 Redis 執行 Lua 腳本時,所有的操作都在服務器端完成,而不是多次通過網絡進行請求。這可以顯著減少網絡延遲,尤其是在需要多次與 Redis 交互的場景中。多個操作可以在 Lua 腳本中組合成一個操作,而不是分多次請求&#…

Nginx代理、緩存與Rewrite

目錄 一、正向代理 (一)核心概念與應用場景 (二)Nginx正向代理編譯安裝(以OpenEuler為例) (三)驗證正向代理 二、反向代理 (一)七層代理(HT…

PortSwigger-02-XXE

一:漏洞原理 1、XXE XXE全稱xml外部實體注入 XML:是一種用于標記電子文件使其具有結構性的標記語言,提供統一的方法來描述和交換獨立于應用程序或者供應商的結構化數據,它可以用來標記數據,定義數據類型、是一種允許…

常規算法學習

算法 1. 排序算法1. 歸并排序1.1 普通歸并排序1.2 優化后的歸并排序(TimSort) 2. 插入排序2.1 直接插入排序2.2 二分插入排序2.3 成對插入排序 3. 快速排序3.1 單軸快速排序3.2 雙軸快排 4. 計數排序 2. 樹1. 紅黑樹(Red Black Tree&#xff…

關于線程死鎖的相關知識

前言 今天學習了線程死鎖的相關知識。線程死鎖是非常重要的知識,寫成博客,加深自己對于知識的理解。 線程死鎖 結語 希望可以幫助到大家~

EMQX啟用單向認證的SSl/TLS連接的配置步驟

先確保您已經安裝了 OpenSSL 執行openssl version -a 獲取 openssl.cnf 目錄 生成自簽名服務端證書 CA 證書生成 server-ca.crt openssl req \-new \-newkey rsa:2048 \-days 365 \-nodes \-x509 \-subj "/CCN/OEMQ Technologies Co., Ltd/CNEMQ CA" \-keyout s…

依賴nacos實例動態創建線程池并監聽服務上下線

版本 Spring Booot 版本 3.2.4Spring Cloud 版本 2023.0.1Spring Cloud Alibaba 版本 2023.0.1.2 依賴 <dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId> </depe…

全面指南:使用Node.js和Python連接與操作MongoDB

在現代Web開發中&#xff0c;數據庫是存儲和管理數據的核心組件。MongoDB作為一款流行的NoSQL數據庫&#xff0c;以其靈活的數據模型、高性能和易擴展性廣受開發者歡迎。無論是使用Node.js還是Python&#xff0c;MongoDB都提供了強大的官方驅動和第三方庫&#xff0c;使得數據庫…

LeetCode 3068.最大節點價值之和:腦筋急轉彎+動態規劃(O(1)空間)

【LetMeFly】3068.最大節點價值之和&#xff1a;腦筋急轉彎動態規劃&#xff08;O(1)空間&#xff09; 力扣題目鏈接&#xff1a;https://leetcode.cn/problems/find-the-maximum-sum-of-node-values/ 給你一棵 n 個節點的 無向 樹&#xff0c;節點從 0 到 n - 1 編號。樹以長…

HTTPS加密通信詳解及在Spring Boot中的實現

HTTPS&#xff08;Hyper Text Transfer Protocol Secure&#xff09;是HTTP的安全版本&#xff0c;通過SSL/TLS協議為通訊提供加密、身份驗證和數據完整性保護。 一、HTTPS核心原理 1.加密流程概述 客戶端發起HTTPS請求&#xff08;連接到服務器443端口&#xff09;服務器返…

解決線程安全問題

前言 昨天學習了如何去解決線程不安全的問題。一般方法都是通過加鎖來處理&#xff0c;跟大家分享一波 。 解決線程安全問題 結語 希望可以幫助到大家~ byebye

網絡常識:網線和光纖的區別

網絡常識&#xff1a;網線和光纖的區別 一. 介紹二. 網線2.1 什么是網線&#xff1f;2.2 網線的主要類別2.3 網線的優勢2.4 網線的劣勢 三. 光纖3.1 什么是光纖&#xff1f;3.2 光纖的主要類別3.3 光纖的優勢3.4 光纖的劣勢 四. 網線 vs 光纖&#xff1a;誰更適合你&#xff1f…

win11 禁用/恢復 內置筆記本鍵盤(保證管用)

文章目錄 禁用啟用 禁用 1&#xff09;按下 win x&#xff0c;點擊 設備管理器 2&#xff09;拔掉所有筆記本外設&#xff08;一定要都拔掉&#xff0c;不然后面禁用設備會混淆&#xff09;&#xff0c;然后右鍵點擊 鍵盤 > HID Keyboard Device 2&#xff09;點擊 更新…

Three.js搭建小米SU7三維汽車實戰(5)su7登場

汽車模型加載 我們在sktechfab上下載的汽車是glb的文件格式&#xff0c;所以使用gltfLoader進行加載。這里將小車直接加載進來看看效果&#xff1b; import { GLTFLoader } from "three/addons/loaders/GLTFLoader.js"; ....其余代碼省略 const gltfLoader new GLT…

ETL怎么實現多流自定義合并?

隨著信息技術的迅猛發展以及數據生成環境的多樣化&#xff0c;互聯網、物聯網和社交媒體的廣泛應用導致各種設備和平臺不斷產生大量數據&#xff0c;需要整合這些數據&#xff0c;從而進行數據融合。數據集成和管理平臺ETLCloud&#xff0c;主要用于支持數據的抽取&#xff08;…

數據結構- 10種常見樹:二叉樹、平衡二叉樹、完全二叉樹

一、樹 樹型結構是一類重要的非線性數據結構。其中以樹和二叉樹最為常用&#xff0c;直觀看來&#xff0c;樹是以分支關系定義的層次結構。把它叫做“樹”是因為它常看起來像一棵倒掛的樹&#xff0c;也就是說它常是根朝上&#xff0c;而葉朝下的。 1.樹的定義&#xff1a; 樹…