Guided Decoding (借助FSM，有限狀態自動機）

Guided Decoding (借助FSM，有限狀態自動機）

web/2025/8/3 23:35:09/文章來源:https://blog.csdn.net/smartcat2010/article/details/145446256

VLLM對結構化輸出的支持：

vllm/docs/source/features/structured_outputs.md at main · vllm-project/vllm · GitHub

VLLM對tool call的支持：

vllm/docs/source/features/tool_calling.md at main · vllm-project/vllm · GitHub

以上指定輸出格式，可以通過有限狀態自動機“輔助”LLM來實現。

即把要求的輸出格式，編譯為自動機；LLM decode階段，根據當前自動機狀態，只采樣（或貪心選擇）自動機允許的那些tokens，不允許的那些tokens采樣概率強制設為0。

輸出格式里規定好的字符串，可以強制交給LLM，無需LLM自己去生成。

VLLM的guided decodin，能確保輸出格式的正確。但不能確保內容質量也好。

VLLM建議，為了生成更好的內容，最好把格式要求寫在prompt里：

我覺得，最好把這種格式輸出，也放在few-shot-examples里或者SFT訓練數據里。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/67937.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/67937.shtml
英文地址，請注明出處：http://en.pswp.cn/web/67937.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

IFeatureWorkspace.CreateFeatureClass（），報錯對COM組件的調用返回了錯誤 HRESULT E_FAIL

IFeatureWorkspace.CreateFeatureClass（），報錯對COM組件的調用返回了錯誤 HRESULT E_FAIL

1、問題描述：在AE開發中，新增一個空的shpfile文件的時候，報錯，如下圖： 2、原因分析：產生此問題的原因是未設置默認字段的默認參數，特別是未設置IGeometryDef 參數。 3、解決方案：在…

閱讀更多...

算法題（48）：反轉鏈表

算法題（48）：反轉鏈表

審題： 需要我們將鏈表反轉并返回頭結點地址思路： 一般在面試中，涉及鏈表的題會主要考察鏈表的指向改變，所以一般不會允許我們改變節點val值。這里是單向鏈表，如果要把指向反過來則需要同時知道前中后三個節點&#x…

閱讀更多...

內存的介紹

內存的介紹

1、程序運行為什么需要內存 1.1、計算機程序運行的目的 (1)程序的目的是為了去運行，程序運行是為了得到一定的結果。 (2)計算機程序代碼數據。計算機程序運行完得到一個結果，就是說代碼數據 (經過運行后) 結果。 (3)從宏觀上來理解&#xff…

閱讀更多...

【NLP百面百過】大模型算法面試高頻面題（全面整理 ???）

【NLP百面百過】大模型算法面試高頻面題（全面整理 ???）

目錄一、大模型面試指南重點面題精講【LLM面題精講 - RAG系統面】查看答案【LLM面題精講 - 實體識別面】查看答案【LLM面題精講 - 文本分類面】查看答案【LLM面題精講 - 分布式訓練面】查看答案【LLM面題精講 - 大模型微調面】查看答案【LLM面題精講 - 大…

閱讀更多...

Java 大視界 -- Java 大數據在智能醫療影像診斷中的應用（72）

Java 大視界 -- Java 大數據在智能醫療影像診斷中的應用（72）

??親愛的朋友們，熱烈歡迎來到青云交的博客！能與諸位在此相逢，我倍感榮幸。在這飛速更迭的時代，我們都渴望一方心靈凈土，而我的博客正是這樣溫暖的所在。這里為你呈上趣味與實用兼具的知識，也期待你毫無保留地分享獨特見解，愿我們于此攜手成長，共赴新程！?? 一、…

閱讀更多...

基于 docker 的mysql 5.7 主主集群搭建

基于 docker 的mysql 5.7 主主集群搭建

創建掛載目錄和配置文件主節點1 mkdir -p /mysql_master_1/mysql/log mkdir -p /mysql_master_1/mysql/data mkdir -p /mysql_master_1/mysql/conf vim /mysql_master_1/mysql/conf/my.cnf[mysqld] datadir/var/lib/mysql #MySQL 數據庫文件存放路徑 server_id 1 #指定數據…

閱讀更多...

list容器（詳解）

list容器（詳解）

list的介紹及使用（了解，后邊細講） 1.1 list的介紹（雙向循環鏈表） https://cplusplus.com/reference/list/list/?kwlist（list文檔介紹） 1. list是可以在常數范圍內在任意位置進行插入和刪除的序…

閱讀更多...

MapReduce分區

MapReduce分區

目錄 1. MapReduce分區1.1 哈希分區1.2 自定義分區 2. 成績分組2.1 Map2.2 Partition2.3 Reduce 3. 代碼和結果3.1 pom.xml中依賴配置3.2 工具類util3.3 GroupScores3.4 結果參考本文引用的Apache Hadoop源代碼基于Apache許可證 2.0，詳情請參閱 Apache許可證2.0。…

閱讀更多...

kamailio-ACC_JSON模塊詳解【后端語言go】

kamailio-ACC_JSON模塊詳解【后端語言go】

要確認 ACC_JSON 模塊是否已經成功將計費信息推送到消息隊列（MQueue），以及如何從隊列中取值，可以按照以下步驟進行操作： 1. 確認 ACC_JSON 已推送到隊列 1.1 配置 ACC_JSON 確保 ACC_JSON 模塊已正確配置并啟用。以下…

閱讀更多...

網件r7000刷回原廠固件合集測評

網件r7000刷回原廠固件合集測評

《網件R7000路由器刷回原廠固件詳解》網件R7000是一款備受贊譽的高性能無線路由器，其強大的性能和可定制性吸引了許多高級用戶。然而，有時候用戶可能會嘗試第三方固件以提升功能或優化網絡性能，但這也可能導致一些問題，如系統不…

閱讀更多...

【C++STL標準模板庫】二、STL三大組件

【C++STL標準模板庫】二、STL三大組件

文章目錄 1、容器2、算法3、迭代器二、STL三大組件 1、容器容器，置物之所也。研究數據的特定排列方式，以利于搜索或排序或其他特殊目的，這一門學科我們稱為數據結構。大學信息類相關專業里面，與編程最有直接關系的學科&…

閱讀更多...

基于 Java 開發的 MongoDB 企業級應用全解析

基于 Java 開發的 MongoDB 企業級應用全解析

基于Java的MongoDB企業級應用開發實戰目錄背景與歷史MongoDB的核心功能與特性企業級業務場景分析MongoDB的優缺點剖析開發環境搭建 5.1 JDK安裝與配置5.2 MongoDB安裝與集群配置5.3 開發工具選型 Java與MongoDB集成實戰 6.1 項目依賴與驅動選擇6.2 連接池與客戶端配置6.3…

閱讀更多...

需求分析應該從哪些方面來著手做？

需求分析應該從哪些方面來著手做？

需求分析一般可從以下幾個方面著手： 業務需求方面 - 與相關方溝通：與業務部門、客戶等進行深入交流，通過訪談、問卷調查、會議討論等方式，明確他們對項目的期望、目標和整體業務需求，了解項目要解決的業務問題及達成的…

閱讀更多...

算法題（57）：找出字符串中第一個匹配項的下標

算法題（57）：找出字符串中第一個匹配項的下標

審題: 需要我們根據原串與模式串相比較并找到完全匹配時子串的第一個元素索引，若沒有則返回-1 思路： 方法一：BF暴力算法思路很簡單，我們用p1表示原串的索引，p2表示模式串索引。遍歷原串，每次遍歷都匹配一次…

閱讀更多...

求組合數（遞推法、乘法逆元、盧卡斯定理、分解質因數）

求組合數（遞推法、乘法逆元、盧卡斯定理、分解質因數）

文章目錄遞推法 10^4代碼乘法逆元 10^6代碼盧卡斯定理 1 0 18 m o d 1 0 6 10^{18}mod 10^6 1018mod106代碼分解質因數常規的解法就不多加贅述了，如（分子/分母，邊乘邊除），本文講述以下方法： 遞推法了…

閱讀更多...

WPF進階 | WPF 動畫特效揭秘：實現炫酷的界面交互效果

WPF進階 | WPF 動畫特效揭秘：實現炫酷的界面交互效果

WPF進階 | WPF 動畫特效揭秘：實現炫酷的界面交互效果前言一、WPF 動畫基礎概念1.1 什么是 WPF 動畫1.2 動畫的基本類型1.3 動畫的核心元素二、線性動畫詳解2.1 DoubleAnimation 的使用2.2 ColorAnimation 實現顏色漸變三、關鍵幀動畫深入3.1 DoubleAnimationUsin…

閱讀更多...

【Numpy核心編程攻略：Python數據處理、分析詳解與科學計算】2.27 NumPy+Pandas：高性能數據處理的黃金組合

【Numpy核心編程攻略：Python數據處理、分析詳解與科學計算】2.27 NumPy+Pandas：高性能數據處理的黃金組合

2.27 NumPyPandas：高性能數據處理的黃金組合目錄 #mermaid-svg-x3ndEE4hrhO6WR6H {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-x3ndEE4hrhO6WR6H .error-icon{fill:#552222;}#mermaid-svg-x3ndEE4hr…

閱讀更多...

swagger使用指引

swagger使用指引

1.swagger介紹在前后端分離開發中通常由后端程序員設計接口，完成后需要編寫接口文檔，最后將文檔交給前端工程師，前端工程師參考文檔進行開發。可以通過一些工具快速生成接口文檔 ，本項目通過Swagger生成接口在線文檔。什么…

閱讀更多...

DeepSeek API文檔解讀（對話模塊）

DeepSeek API文檔解讀（對話模塊）

對話（Chat） 對話補全報文message對象數組 System message name 一個在線聊天系統，其中涉及多個用戶和一個系統管理員。在這個系統中，每個用戶都可以發送消息，并且系統管理員可以監控和回復這些消息。為了區分不同…

閱讀更多...

【Numpy核心編程攻略：Python數據處理、分析詳解與科學計算】2.19 線性代數核武器：BLAS/LAPACK深度集成

【Numpy核心編程攻略：Python數據處理、分析詳解與科學計算】2.19 線性代數核武器：BLAS/LAPACK深度集成

2.19 線性代數核武器：BLAS/LAPACK深度集成目錄 #mermaid-svg-yVixkwXWUEZuu02L {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-yVixkwXWUEZuu02L .error-icon{fill:#552222;}#mermaid-svg-yVixkwXWUEZ…

閱讀更多...

最新文章