【Text2SQL 論文】SeaD:使用 Schema-aware 去噪訓練的 end2end 的 Text2SQL

論文:SeaD: End-to-end Text-to-SQL Generation with Schema-aware Denoising

??

NAACL 2022, arXiv:2105.07911

本論文提出 SeaD 模型,使用 schema-aware 的去噪方法來訓練一個 end2end、seq2seq 的 Transformer 模型來實現 Text2SQL。

一、論文速讀

給定一個 question Q Q Q 和一個 schema S S S,我們期望生成相應的 SQL 查詢 Y Y Y

1.1 model 的輸入輸出

SeaD 的輸入輸出如下圖所示:

在 input 中,將 table headers 的各個 column name 前面加一個 <col n> 表示第幾個 column,然后跟著 column name 和 type,比如對于 week 字段,就是 <col0>week:int

在期待的 output 中,SQL 的 column name 使用 “`” 這個 token 圍繞,并將 name 換為分隔符 <col n>,如上圖所示。

1.2 Transformer with Pointer

該工作使用 Transformer 作為 backbone 來做 seq2seq 任務。

為什么使用 Transformer with Pointer?在 Text2SQL 任務中,大多數的 schema 和 value mentions 可以從 input seq 中抽取出來,所以在 Transformer 架構的最上面加了一個 Hybrid Pointer Generator Network 來生成 token,生成的 token 來自于 target vocabulary V V V 或者 copy from the input text。

target vocabulary V V V 由三個集合組合而成:

  • V q V_q Vq? 表示 corpora token vocabulary
  • V c V_c Vc? 表示 column token set
  • V s V_s Vs? 表示可用的 SQL keywords

Transformer with Pointer 的具體思路可以參考原論文,這里做一個概述:使用 Transformer 中 decoder 生成的 h d e c h_{dec} hdec? 計算出 target vocabulary V V V 中各個 token 的 unnormalized scores s c o r e s v scores_{v} scoresv? 和 input seq 中各個 token 的 unnormalized scores s c o r e s s scores_{s} scoress?,然后將兩個 scores 合并為 s c o r e h y b r i d score_{hybrid} scorehybrid?,最終輸出的概率分布就是 P = s o f t m a x ( s c o r e h y b r i d ) P = softmax(score_{hybrid}) P=softmax(scorehybrid?)

1.3 Schema-aware Denoising

與 masted LM 和其他去噪任務類似,這里提出了兩個 schema-aware denoising 的訓練方法:erosion 和 shuffle。

1.3.1 Erosion

參考上圖,對 table schema S S S 中的 column name 做 erosion 操作,主要是做重排、增加和刪除操作來引入噪聲,同時 <col n> 分隔符保持不變。

如果一個 column 被刪除但是生成的 SQL 需要使用它,則生成 SQL 中使用 <unk> 來替代,這能讓 model 學會當 schema 信息不足時拋出 unknown exception。

1.3.2 Shuffle

參考上圖,將 source query Q Q Q 中的提及的實體(question 和 SQL)重新排序,而 schema seq S S S 保持不變。這個 denoisiong objective 訓練模型重構實體順序正確的查詢序列 Q Q Q

二、總結

實驗在 test 結果上達到了 93 的準確率,但沒有公開 code。但本文提出的思路還是值得學習的。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/16074.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/16074.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/16074.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

C++系列-static成員

&#x1f308;個人主頁&#xff1a;羽晨同學 &#x1f4ab;個人格言:“成為自己未來的主人~” 概念 聲明為static的類成員稱為類的靜態成員&#xff0c;用static修飾的成員變量&#xff0c;稱之為靜態成員變量&#xff0c;用static修飾的成員函數&#xff0c;稱之為靜態成…

stm32學習-流水燈

接線 注意&#xff1a;LED燈長一點的引腳是正極。 配置GPIO 1.使用RCC開啟GPIO時鐘 void RCC_AHBPeriphClockCmd(uint32_t RCC_AHBPeriph, FunctionalState NewState); void RCC_APB2PeriphClockCmd(uint32_t RCC_APB2Periph, FunctionalState NewState); void RCC_APB1Perip…

Stanford斯坦福 CS 224R: 深度強化學習 (2)

實用深度強化學習實現技術 強化學習(RL)是一種通過智能體與環境交互來學習最優決策的機器學習范式。而深度強化學習(DRL)則將深度學習技術引入RL領域,利用深度神經網絡強大的函數擬合能力來處理高維觀察空間,取得了顯著的成功。本章我們將重點介紹一種經典的DRL算法:Q-Learnin…

【Qt 學習筆記】Qt窗口 | 菜單欄 | QMenuBar的使用及說明

博客主頁&#xff1a;Duck Bro 博客主頁系列專欄&#xff1a;Qt 專欄關注博主&#xff0c;后期持續更新系列文章如果有錯誤感謝請大家批評指出&#xff0c;及時修改感謝大家點贊&#x1f44d;收藏?評論? Qt窗口 | 菜單欄 | QMenuBar的使用及說明 文章編號&#xff1a;Qt 學習…

第20屆文博會:“特別呈現”—周瑛瑾雷米·艾融雙個展,著名美術評論家,批評家彭德教授對周瑛瑾作品進行評論

周瑛瑾不是學院派藝術家&#xff0c;但在彩墨畫領域的天賦超出中國八大美院的同類型畫家。相比具有批判意識的當代藝術&#xff0c;他的彩墨藝術如同我們這個苦難世界的創可貼和安慰劑。當我面對他的彩墨畫&#xff0c;首先是驚艷&#xff0c;隨之想到屈原的離騷&#xff0c;還…

無源相控陣雷達

什么是無源相控陣雷達 無源相控陣雷達&#xff08;Passive Electronically Scanned Array Radar&#xff0c;簡稱PESA雷達&#xff09;是一種雷達系統。這里的“無源”并未指其不發射信號&#xff0c;而是指其陣列單元不會產生并發射信號&#xff0c;其特點在于天線表面的陣列…

Vue與React、Angular的比較

Vue、React和Angular是前端開發中三個流行的JavaScript框架&#xff0c;它們各自具有不同的特點、優勢和適用場景。以下是對這三個框架的比較&#xff1a; 1. 基本概念 Vue&#xff1a;Vue是一套用于構建用戶界面的漸進式框架&#xff0c;其核心庫專注于視圖層&#xff0c;易…

[CISCN 2024] Crypto部分復現

文章目錄 OvOez_rsacheckin淺記一下 遲來的文章 OvO 題目描述&#xff1a; from Crypto.Util.number import * from secret import flagnbits 512 p getPrime(nbits) q getPrime(nbits) n p * q phi (p-1) * (q-1) while True:kk getPrime(128)rr kk 2e 65537 kk …

【三維修復、分割與編輯】InFusion、Bootstrap 3D、GaussianGrouping、GaussianEditor等(論文總結)

提示&#xff1a; 文章目錄 前言一、InFusion&#xff1a;擴散模型助力&#xff0c;效率提高20倍&#xff01;(2024)1. 摘要2. 算法3. 效果 二、2D Gaussian Splatting三、Bootstrap 3D:從擴散模型引導三維重建1.摘要2.相關工作3.方法1.Boostrapping by Diffusion 通過擴散模型…

學習存儲協議的利器,聊聊tcpdump和Wireshark

數據存儲技術分為多個方面,包括數據持久化、數據映射、數據壓縮和通信協議等等。其中通信協議是數據存儲技術中非常重要的一部分,正是通信協議使得計算節點可以訪問存儲設備。同時,也正是不同的協議讓存儲系統呈現不同的形態。 如下圖所示,通過iSCSI協議,可以將存儲端的存…

使用std::vector<char>作為數據緩沖區分析

文章目錄 0. 引言1. 內存分配分析2. 性能影響3. 性能優化策略4. 實際性能測試5. 優化建議6. 總結額外建議 0. 引言 在 C 網絡編程中&#xff0c;std::vector<char> 常被用作數據緩沖區。與普通數組相比&#xff0c;std::vector 的內存分配在堆上&#xff0c;而非棧上&am…

【JVM實踐與應用】

JVM實踐與應用 1.類加載器(加載、連接、初始化)1.1 類加載要完成的功能1.2 加載類的方式1.3 類加載器1.4 雙親委派模型1.5自定義ClassLoader1.6 破壞雙親委派模型2.1 類連接主要驗證內容2.2 類連接中的解析2.3 類的初始化3.1 類的初始化時機3.2 類的初始化機制和順序3.2 類的卸…

C從零開始實現貪吃蛇大作戰

個人主頁&#xff1a;星紜-CSDN博客 系列文章專欄 : C語言 踏上取經路&#xff0c;比抵達靈山更重要&#xff01;一起努力一起進步&#xff01; 有關Win32API的知識點在上一篇文章&#xff1a; 目錄 一.地圖 1.控制臺基本介紹 2.寬字符 1.本地化 2.類項 3.setlocale函…

解釋Vue中transition的理解

在Vue中&#xff0c;transition組件用于在元素或組件插入、更新或移除時應用過渡效果。Vue 2和Vue 3都提供了transition組件&#xff0c;但兩者之間有一些差異和更新。以下是關于Vue 2和Vue 3中transition組件的理解&#xff1a; Vue 2中的transition 在Vue 2中&#xff0c;t…

Golang 如何使用 gorm 存取帶有 emoji 表情的數據

Golang 如何使用 gorm 存取帶有 emoji 表情的數據 結論&#xff1a;在 mysql 中盡量使用 utf8mb4&#xff0c;不要使用 utf8。db報錯信息&#xff1a;Error 1366 (HY000): Incorrect string value: \\xE6\\x8C\\xA5\\xE7\\xAC\\xA6...根本原因&#xff1a;emoji 4個字節&#x…

MybatisPlus分頁查詢

分頁查詢controller寫法 public PageResult findByList(RequestBody UserDTO userDTO) {// 分頁IPage<User> page new Page(UserDTO.getPageNumber(), UserDTO.getPageSize());// 條件構造器QueryWrapper queryWrapper new QueryWrapper();queryWrapper.eq("user…

【深度學習】第1章

概論: 機器學習是對研究問題進行模型假設,利用計算機從訓練數據中學習得到模型參數,并最終對數據進行預測和分析,其基礎主要是歸納和統計。 深度學習是一種實現機器學習的技術,是機器學習重要的分支。其源于人工神經網絡的研究。深度學習的模型結構是一種含多隱層的神經…

Springboot應用的配置管理

Spring Boot應用的配置管理 在本文中&#xff0c;我們將深入探討Spring Boot的配置文件&#xff08;application.properties/yaml&#xff09;&#xff0c;以及如何在不同環境中管理配置和使用Spring Config Server。此外&#xff0c;我們還將分享一些高級配置技巧&#xff0c…

Spring Cloud Alibaba 架構-Sentinel整合nacos和gateway

官網地址 sentinel官網: https://github.com/alibaba/Sentinel/wiki/%E4%B8%BB%E9%A1%B5 sentinel 下載地址: https://github.com/alibaba/Sentinel/releases nacos官網: https://nacos.io/zh-cn/docs/deployment.html nacos下載地址: https://github.com/alibaba/nacos/releas…

Shopee單個商品詳情采集

Shopee商品詳情頁數據采集實戰 作為東南亞地區最大的電商平臺之一,Shopee擁有超過3億活躍用戶。對于跨境電商企業、市場分析師等角色而言,從Shopee獲取商品數據是非常有價值的。本文將介紹如何使用Python程序采集Shopee單個商品詳情頁數據。 1. 確定采集目標和技術方案 確定…