LLM論文筆記 28: Universal length generalization with Turing Programs

  • Arxiv日期:2024.10.4
  • 機構:Harvard University

關鍵詞

  • 圖靈機

  • CoT

  • 長度泛化

核心結論

  • Turing Programs 的提出

    • 提出 Turing Programs,一種基于圖靈機計算步驟的通用 CoT 策略。通過將算法任務分解為逐步的“磁帶更新”(類似圖靈機的讀寫操作),允許模型通過簡單的文本復制與局部修改完成復雜計算

    • 通用性:適用于任何算法任務(加法、乘法、SGD),不依賴任務特定的數據格式優化

  • 長度泛化的實驗突破

    • 加法:50位數訓練可泛化至 100 位數加法(準確率 98%),優于傳統 scratchpad 方法

    • 乘法首次展示對 n×1 和 n×3位數乘法的長度泛化(50→100 位,準確率 97%)

    • SGD 算法:在 50 個訓練樣本上訓練的模型可泛化至 80 個樣本(準確率 95%)

    • 隨機圖靈機模擬:模型在未見過的更長輸入(50→100+ token)上能預測圖靈機的下一步狀態,表明其對任意算法任務的泛化潛力

  • 位置編碼的關鍵作用

    • Hard-ALiBi 位置編碼(結合局部硬注意力與全局無位置頭)顯著提升長度泛化能力,優于 ALiBi、RoPE 等傳統編碼

    • 實驗表明,位置編碼與數據格式的協同設計是成功的關鍵

  • 指出傳統 scratchpad 方法在長度泛化上的局限性,強調迭代式局部修改的重要性(而非單純分步輸出)

主要方法

主要方法:Turing Programs 提出,將CoT過程擬合為圖靈機的操作

  • 磁帶(Tape):模擬圖靈機的存儲結構,每一步的中間狀態以文本形式表示。例如,在加法任務中,磁帶可能包含當前處理的數字位、進位值等信息。

  • 局部修改:每一步僅對磁帶的局部內容進行修改(如更新某一位的數字或進位),而非完全重寫。例如,圖2中的加法步驟通過逐步移除操作數的最后一位并更新中間結果。

  • 顯式狀態標記:使用特殊符號(如 ^ 表示當前處理位置,a, b, c 表示中間變量)標記狀態,確保模型明確跟蹤計算進展。

仍然具有以下問題:

  • 當前方法依賴冗長的 CoT 數據,可能限制實際應用效率。

  • 部分任務的泛化魯棒性不足(如超長序列的誤差累積問題)。

  • 需進一步探索更高效、通用的訓練框架,以支持復雜現實任務的長度泛化。

注:本系列不包括基礎的知識點講解,為筆記/大綱性質而非教程,用于論文知識點和思想和快速記憶和回顧,更多細節建議閱讀論文原文

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/904173.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/904173.shtml
英文地址,請注明出處:http://en.pswp.cn/news/904173.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【全隊項目】智能學術海報生成系統PosterGenius--圖片布局生成模型LayoutPrompt(1)

🌈 個人主頁:十二月的貓-CSDN博客 🔥 系列專欄: 🏀大模型實戰訓練營_十二月的貓的博客-CSDN博客 💪🏻 十二月的寒冬阻擋不了春天的腳步,十二點的黑夜遮蔽不住黎明的曙光 目錄 1. 前…

位圖的實現和拓展

一:位圖的介紹 ①:需要位圖的場景 給40億個不重復的無符號整數,沒排過序。給一個無符號整數,如何快速判斷一個數是否在這40億個數中? 要判斷一個數是否在某一堆數中,我們可能會想到如下方法: A…

排序功法入門指南【江湖算法筆記】

話說江湖風云變幻,各路英雄好漢行走江湖,總得有個名號排行。若問“東邪西毒南帝北丐”誰強誰弱,總得排個座次不是?這排序之道,恰似武功秘籍,練好了能號令群雄,練岔了怕是要被笑掉大牙&#xff0…

【中間件】brpc_基礎_用戶態線程中斷

bthread之用戶態線程中斷 源碼 1 簡介 interrupt_pthread 核心功能是 通過信號機制中斷阻塞的 pthread 線程,以實現線程的協作式中斷。 2 核心功能與設計 2.1 信號選擇與注冊 信號選擇:使用 SIGURG 作為中斷信號。 原因:SIGURG 通常用于…

Linux 的網絡卡

#本機操作系統CentOS 10 #核心版本 rootbogon:/etc# uname -r 6.12.0-65.el10.x86_64 網卡能不能被捉到可以使用【dmesg|grep xx】來判斷,有沒有驅動則可以使用lsmod看看模塊有沒有加載核心!最后,以ifconfig xxx測試看看 觀察核心所捉到的網卡…

前端雙工通信的幾種方案詳細描述

前端實現雙工通信(全雙工或半雙工)的常見方案及詳細實現如下: 一、WebSocket(全雙工) 原理:基于 TCP 的持久化協議,客戶端與服務端建立雙向通信通道,支持實時雙向數據傳輸。 // 客…

KUKA機器人快速啟動設置

KUKA機器人在首次開機啟動時,有時在示教器上需要進行投入運行等相關的設置。如以下相關的信息需要處理: 1、機器人系統開機后,選擇T1運行模式;2、顯示提示信息:“RDC 存儲器和控制系統不一致什么被更換了”時&#xf…

游戲代碼C

以下將結合不同編程語言的特點及游戲開發中的實際應用,展示多種語言的游戲代碼示例(以簡單游戲為例,展示代碼結構和邏輯差異)。由于代碼篇幅較長,我將分語言進行說明并引用相關來源: 1. C# Unity&#xff…

LangChain Agent核心解析:Zero-Shot-ReAct策略實現與實戰指南

引言 在LangChain的Agent框架中,zero-shot-react-description 是一種預定義的Agent類型,它結合了Zero-Shot(零樣本學習) 和 ReAct(推理行動) 策略,主要用于根據工具的描述動態選擇和執行工具&a…

PyQt 或 PySide6 進行 GUI 開發文檔與教程

一、官網文檔 Qt 官方文檔:Porting to Qt 6 | Qt 6.9Qt 維基:???????Qt WikiQt for Python (PySide6) :???????Qt for Python - Qt WikiPySide6 快速上手指南:???????Getting Started - Qt for Python PyS…

2024年第十五屆藍橋杯省賽B組Python【 簡潔易懂題解】

2024年第十五屆藍橋杯省賽B組Python題解 一、整體情況說明 2024年第十五屆藍橋杯省賽B組Python組考試共包含8道題目,分為結果填空題和程序設計題兩類。 考試時間:4小時編程環境:Python 3.x,禁止使用第三方庫,僅可使…

Go語言--語法基礎4--基本數據類型--類型轉換

Go 是一種強類型的語言,所以如果在賦值的時候兩邊類型不一致會報錯。一個類型的值可以被轉換成另一種類型的值。由于 Go 語言不存在隱式類型轉換,因此所有的類型轉換都必須顯式的聲明。 強制類型轉換語法 使用 type (a) 這種形式來進行強制類型轉換&am…

nginx 代理時怎么更改 Remote Address 請求頭

今天工作中遇到用 localhost 訪問網站能訪問后臺 api,但是用本機IP地址后就拒絕訪問,我懷疑是后臺獲取 Remote Address 然后設置白名單了只能 localhost 訪問。 想用 nginx 更改 Remote Address server {listen 8058;server_name localhost;loca…

LeetCode刷題鏈表

文章目錄 鏈表總結 常用技巧兩數相加題解代碼 兩兩交換鏈表中的節點題解代碼 重排鏈表題解代碼 合并k個升序鏈表題解代碼 K個一組翻轉鏈表題解代碼 鏈表總結 常用技巧 畫圖 直觀 形象 便于理解引入虛擬頭節點,便于處理邊界情況,方便我們對鏈表進行…

ESP32S3 多固件燒錄方法、合并多個固件為單一固件方法

ESP32S3 多固件燒錄方法、合并多個固件為單一固件方法 文章目錄 ESP32S3 多固件燒錄方法、合并多個固件為單一固件方法前言1、前期準備工作2、多固件燒錄方法3、單固件燒錄方法總結 前言 使用正點原子的ESP32S3 BOX開發板獨立燒錄編譯生成的xxx.bin固件無法正常運行起來&#…

Webug4.0靶場通關筆記10- 第14關鏈接注入

目錄 第14關 鏈接注入 1.打開靶場 2.源碼分析 3.滲透實戰 (1)方法1:跳轉外部網頁 (2)方法2:獲取cookie 4.漏洞防御 本文通過《webug靶場第14關 鏈接注入》來進行滲透實戰。 第14關 鏈接注入 鏈接注…

SpringBoot的汽車商城后臺管理系統源碼開發實現

概述 汽車商城后臺管理系統專為汽車4S店和經銷商設計,提供全面的汽車管理系統解決方案。 主要內容 1. 核心功能模塊 系統提供以下主要功能: ??銷售管理??:記錄銷售信息,跟蹤交易進度??客戶管理??:維護客戶…

VBA代碼解決方案第二十四講:EXCEL中,如何刪除重復數據行

《VBA代碼解決方案》(版權10028096)這套教程是我最早推出的教程,目前已經是第三版修訂了。這套教程定位于入門后的提高,在學習這套教程過程中,側重點是要理解及掌握我的“積木編程”思想。要靈活運用教程中的實例像搭積木一樣把自己喜歡的代碼…

日本IT行業|salesforce開發語言占據的地位

在日本的IT行業中,Salesforce 開發語言處于一個較為專業但穩步增長的細分領域,并不是主流開發語言(如 Java、Python、PHP),但其在某些行業和場景中地位越來越重要。 本篇以下是詳細分析: Salesforce開發語言…

前端開發,文件在鏡像服務器上不存在問題:Downloading binary from...Cannot download...

問題與處理策略 問題描述 在 Vue 項目中,執行 npm i 下載依賴時,報如下錯誤 Downloading binary from https://npm.taobao.org/mirrors/node-sass//v4.14.1/win32-x64-72_binding.node Cannot download "https://npm.taobao.org/mirrors/node-sa…