EMNLP 2023 獲獎論文公布,大模型、NLP等領域火爆

EMNLP是計算語言學和自然語言處理領域頂級國際會議之一,屬于CCF B類,是由 ACL 下屬的SIGDAT小組主辦的NLP領域頂級國際會議,一年舉辦一次。相較于ACL,EMNLP更偏向于NLP在各個領域解決方案的學術探討。

今年的EMNLP 2023 已于2023年12 月 6 日 - 10 日在新加坡舉行。本次大會公布了最佳長論文獎、最佳短論文獎、杰出論文獎、最佳Demo獎等獎項,包含了今年爆火的ChatGPT 大模型、NLP 概念領域。

我這次幫大家整理了今年EMNLP 2023的獲獎論文,并且做了簡單的介紹,原文及源碼需要的同學看文末

最佳長論文

標題:Label Words are Anchors: An Information Flow Perspective for Understanding In-Context Learning

一種理解上下文學習的信息流視角

作者:Lean Wang, Lei Li, Damai Dai, Deli Chen, Hao Zhou, Fandong Meng, Jie Zhou, Xu Sun

「簡述:」論文在信息流視角下探討了大型語言模型(LLMs)的上下文學習(ICL)機制。研究結果表明,演示示例中的標簽詞作為錨點,在淺層計算層處理過程中,語義信息聚集到標簽詞表示中;標簽詞中整合的信息作為LLMs最終預測的參考。基于這些發現,作者引入了一種錨點重新加權方法來提高ICL性能,一種演示壓縮技術來加快推理,以及一種用于診斷GPT2-XL中ICL錯誤的框架。這些有希望的應用再次驗證了未被發現的ICL工作機制,并為未來的研究鋪平了道路。

最佳短論文

標題:Faster Minimum Bayes Risk Decoding with Confidence-based Pruning

基于置信度剪枝的更快最小貝葉斯風險解碼

作者:Julius Cheng, Andreas Vlachos

「簡述:」對于某些效用函數來說,最小貝葉斯風險(MBR)解碼器會輸出模型分布中期望效用最高的假設。據顯示,與束搜索相比,它在條件語言生成問題中提高了準確性,特別是在神經機器翻譯中、在人類和自動評估中都是如此。然而,標準采樣算法對于MBR的計算量要遠大于束搜索,需要大量的樣本以及二次調用效用函數,限制了其適用性。本文描述了一種MBR算法,該算法在逐步增加用于估計效用的樣本數量的同時,根據Bootstrap抽樣獲得的置信度估計修剪不太可能有最高效用的假設。

杰出論文獎

標題:Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents

作為重新排名代理調查大型語言模型

作者:Weiwei Sun, I ingyong Yan, Xinyu Ma, Shuaiqiang Wang, Pengjie Ren, Zbumin Chen, Dawei Yin,Zhaochun Ren

「簡述:」ChatGPT等大型語言模型在各種語言相關任務中表現出色,包括搜索引擎。它們不僅可以生成文本,還可以進行信息檢索和段落排名。本文首先調查生成式LLM(如ChatGPT和GPT-4)在IR中的相關性排名,在適當的指導下,這些模型甚至可以在流行的信息檢索基準上提供與最新監督方法相當甚至更好的結果。此外,為了解決數據污染問題,作者收集了一個新的測試集,以驗證模型對未知知識的排名能力。最后,作者提出了一種方法,通過使用排列消融方案,將大型語言模型的排序能力精簡為小型專業模型,以提高實際應用的效率。這些小型模型在BEIR基準上的性能優于更大的監督模型。

標題:SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization

百萬級對話蒸餾與社交常識情境化

作者:Hyunwoo Kim, Jack Hessel, Liwei Jiang, Peter West, Ximing Lu, Youngjae Yu, Pei Zbou,Ronan Le Bras, Malibe Alikhani, Gunbee Kim, Maarten Sap, Yejin Choi

「簡述:」SODA是一個公開的百萬級高質量社交對話數據集,解決了開放領域社交對話數據稀缺的問題。它使用知識圖譜獲取社交常識知識,并從大型語言模型中提取廣泛的社會互動。與以前的數據集相比,SODA中的對話更一致、更具體、更自然。使用SODA,作者訓練了COSMO,一個可泛化的對話模型,在未觀察到的數據集上比表現最佳的對話模型更自然、更一致。實驗表明,COSMO有時甚至比原始人類編寫的金標準響應更受歡迎。

標題:LINC: A Neurosymbolic Approach for Logical Reasoning by Combining Language Models with First-Order Logic Provers

一種結合語言模型和一階邏輯證明器進行邏輯推理的神經符號方法

作者:Theo X. Olausson, Alex Gu, Ben Lipkin, Cedeao E. Zhang Armando Solar-Lezama,Joshua B. Tenenbaum, Roger P. Levy

「簡述:」LINC是一種用于邏輯推理的將語言模型與一階邏輯證明相結合的神經符號方法。這種方法將邏輯推理任務重新表述為模塊化神經符號編程,使大型語言模型能夠更有效地進行這種推理。通過將自然語言翻譯成一階邏輯表達式,并使用外部定理證明器進行演繹推理,LINC在FOLIO和ProofWriter等數據集上取得了顯著的性能提升。與GPT-3.5和GPT-4的思維鏈提示相比,LINC在ProofWriter上的得分高出38%和10%。這種方法的結合使用LLM和符號證明器可以解決自然語言邏輯推理的問題。

最佳論文 Demo

標題:PaperMage: A Unified Toolkit for Processing, Representing, and Manipulating Visually-Rich Scientific Documents

用于處理、表示和操作視覺豐富的科學文獻的統一工具包

作者:Kyle Lo, Zejiang Shen, Benjamin Newman, Joseph Chee Chang, Russell Authur, Erin Bransom, Stefan Candra, Yoganand Chandrasekhar, Regan Huff, Bailey Kuehl, Amanpreet Singh, Chris Wilhelm, Angele Zamarron, Marti A. Hearst, Daniel S. Weld, Doug Downey, Luca Soldaini

「簡述:」盡管自然語言處理(NLP)和計算機視覺(CV)模型在學術領域的應用越來越受到關注,但科學文獻仍然具有挑戰性。它們通常以難以使用的PDF格式存在,并且用于處理它們的模型生態系統是分散和不完整的。作者介紹了PaperMage,一個用于處理和操作視覺豐富、結構化的科學文檔的開源Python工具包。它整合了最先進的NLP和CV模型,提供了一站式解決方案,簡化了文本和視覺文檔元素的表示和操作。PaperMage已經為多個研究原型的人工智能應用程序提供了動力,并被用于處理數百萬個PDFs的大規模生產系統。

最佳主題論文

標題:Ignore This Title and HackAPrompt: Exposing Systemic Vulnerabilities of LLMs through a Global Scale Prompt Hacking Competition

通過全球規模的提示黑客競賽暴露LLM的系統漏洞

作者:Sander Schulhoff,Jeremy Pinto,Anaum Khan,Louis-Fran?ois Bouchard,Chenglei Si,Svetlina Anati,Valen Tagliabue,Anson Kost,Christopher Carnahan,Jordan Boyd-Graber

「簡述:」大型語言模型越來越常被用在和用戶直接交流的場景中,比如聊天機器人和寫作助手。但是,這些模型很容易受到提示注入和越獄等攻擊,即黑客操縱模型忽略原有指令,執行惡意指令。為了解決這個問題,作者發起了一個全球范圍的提示黑客攻擊比賽,收集了大量針對最先進LLM的攻擊性提示。我們發現,這些模型確實可以被黑客操縱。作者還建立了一個全面的本體類型,描述各種攻擊性提示。

最佳行業論文

標題:Personalized Dense Retrieval on Global Index for Voice-enabled Conversational Systems

基于全局索引的語音對話系統中的個性化密集檢索

作者:Masha Belyi, Charlotte Dzialo, Chaitanya Dwivedi,Prajit Reddy Muppidi, Kanna Shimizu

「簡述:」論文提出了一種新的方法,用于改進語音控制的AI對話系統中的實體檢索。這種方法可以抵抗語音變化和實體解析不清的干擾。它不局限于根據用戶歷史交互構建的個性化索引,而是將用戶的收聽偏好嵌入到檢索中使用的上下文查詢嵌入中。這使得模型能夠更準確地預測實體,并且在實體檢索任務上的表現比基線提高了91%。此外,作者還優化了這種方法,使其適應在線延遲的約束,同時保持性能的提升。

關注下方《學姐帶你玩AI》🚀🚀🚀

回復“EMNLP獲獎”獲取全部論文+開源代碼

碼字不易,歡迎大家點贊評論收藏

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/214132.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/214132.shtml
英文地址,請注明出處:http://en.pswp.cn/news/214132.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

table表格table/tr/td寬度和高度的設置

關于html中table表格tr,td的?度和寬度 做?頁的時候經常會遇到各種各樣的問題,經常遇到的?個就是會碰到表格被內容撐開的問題。 設置table樣式為 table-layout: fixed; 寬度可以了,但是高度會被撐高。怎么設置都不行,只能給這個td標簽單獨…

【Linux】 線程池

線程池 什么是線程池? 一次預先申請一批線程,讓這批線程有任務,就處理任務;沒任務,就處于等待狀態。 為什么要有線程池? 以空間換時間,預先申請一批線程,當有任務到來,可…

將rtsp視頻流發送到AWS Kinesis Video Streams的方案——使用Gstreamer(C++) Command Line

大綱 1 創建Kinesis Video Streams1.1 創建視頻流1.2 記錄Creation Time 2 創建策略2.1 賦予權限2.2 限制資源2.3 Json格式描述(或上面手工設置)2.4 注意事項 3 創建IAM用戶3.1 生成密鑰對3.2 附加策略3.3 記錄訪問密鑰對 4 編譯C 創建者庫5 發送6 檢查參…

JavaScript <關于逆向RSA非對稱加密算法的案例(代碼剖析篇)>--案例(五點一)

引用上文: CSDNhttps://mp.csdn.net/mp_blog/creation/editor/134857857 剖析: var bitsPerDigit16; // 每個數組元素可以表示的二進制位數// 數組復制函數,將源數組部分復制到目標數組的指定位置 function arrayCopy(src, srcStart, dest, destStart, n) {var m…

國內地址地區智能解析,無需完整地址也能正確匹配

頁面直接引入使用 已打包成單文件dist/bundle.js 可以直接通過標簽引用 <script src="./bundle.js"></script> <script>var results = AddressParse.parse(福建省福州市福清市石竹街道義明綜合樓3F,15000000000,asseek);console.log(results);…

OD機考真題搜集:服務失效判斷

題目 某系統中有眾多服務,每個服務用字符串(只包含字母和數字,長度<=10)唯一標識,服務間可能有依賴關系,如A依賴B,則當B故障時導致A也故障。 依賴具有傳遞性,如A依賴B,B依賴C,當C故障時導致B故障,也導致A故障。 給出所有依賴關系,以及當前已知故障服務,要求輸…

git提交代碼報錯Git: husky > pre-commit

目錄 git提交代碼報錯原因解決方法&#xff08;三種&#xff09;1、第一種2、第二種3、第三種 git提交代碼報錯原因 這個問題是因為當你在終端輸入git commit -m “XXX”,提交代碼的時候,pre-commit(客戶端)鉤子&#xff0c;它會在Git鍵入提交信息前運行做代碼風格檢查。如果代…

Kotlin 中密封類、枚舉類與密封接口的對比分析

在 Kotlin 編程語言中&#xff0c;密封類&#xff08;Sealed Classes&#xff09;、枚舉類&#xff08;Enum Classes&#xff09;和密封接口&#xff08;Sealed Interfaces&#xff09;是處理一組固定類型的強大工具。它們在 Kotlin 中扮演著特殊的角色&#xff0c;特別是在創建…

【小白專用】MySQL創建數據庫和創建數據表

1.在Windows開始搜索輸入Mysql,并選擇第一個打開。 2.輸入安裝時的密碼 3.說明安裝成功。 二、創建數據庫 1. 連接 MySQL 輸入 mysql -u root -p 命令&#xff0c;回車&#xff0c;然后輸入 MySQL 的密碼(不要忘記了密碼)&#xff0c;再回車&#xff0c;就連接上 MySQL 了。 …

數據庫常用鎖

數據庫鎖是一種用于管理并發訪問的機制&#xff0c;以確保數據的一致性和完整性。在并發訪問的情況下&#xff0c;多個事務可能同時嘗試訪問相同的數據&#xff0c;而數據庫鎖能夠協調這些訪問&#xff0c;防止數據不一致的問題。以下是一些常見的數據庫鎖及其詳細解釋&#xf…

C語言-統計素數并求和

本題要求統計給定整數M和N區間內素數的個數并對它們求和。 輸入格式: 輸入在一行中給出兩個正整數M和N&#xff08;1≤M≤N≤500&#xff09;。 輸出格式: 在一行中順序輸出M和N區間內素數的個數以及它們的和&#xff0c;數字間以空格分隔。 輸入樣例: 10 31輸出樣例: 7…

深入Redis過程-持久化

目錄 redis實現持久化 RDB 觸發機制-定期方法 定期-手動觸發 save bgsave 定期-自動觸發 AOF 開啟AOF功能 刷新緩沖區策略 重寫機制 混合持久化 Redis事務 事務相關的命令 MULTI EXEC DISCARD WATCH redis實現持久化 RDB RDB叫做Redis數據備份文件&#xf…

強大的公式編輯器 —— MathType最新版本安裝與使用

強大的公式編輯器 —— MathType最新版本安裝與使用 由于使用了很長時間的機械硬盤出現壞道&#xff0c;安裝在其中的MathType6.9&#xff08;精簡版&#xff09;也沒辦法使用了&#xff0c;本來想安裝個高版本的MathType&#xff0c;比如MathType7.4&#xff0c;但在網上苦苦…

如何更改Jupyter Notebook中的環境?

1.首先&#xff0c;打開終端 2.接著&#xff0c;分別輸入以下命令 conda env list 把EXPose替換為自己的環境變量 conda activate EXPose 3.接下來安裝‘ ipykernel ’軟件包 conda install ipykernel 4. 將該環境添加到Jupyter Notebook中&#xff1b;在Jupyter Notebook…

HTB Surveillance

Surveillance 2023年12月10日 12:13:35User nmap Starting Nmap 7.80 ( https://nmap.org ) at 2023-12-10 12:15 CST Stats: 0:00:37 elapsed; 0 hosts completed (1 up), 1 undergoing Connect Scan Connect Scan Timing: About 59.83% done

小白第一次開私服怎么吸引玩家

大家好&#xff0c;我是咕嚕-凱撒&#xff0c;在現在這個網絡社會很多人為了放松一下會選擇打打游戲&#xff0c;私服也就成為了許多玩家為了尋找新鮮體驗的熱門選擇&#xff0c;很多小白就發現了這個契機但是吸引玩家加入自己的服務器也就成了一個比較頭疼的問題&#xff0c;下…

Wrong number of values of control parameter 2(Halcon 錯誤代碼:1402)

threshold (ImageReduced1, Region, 0,min2(75,Min)) 程序運行到這一句&#xff0c;出現錯誤 原因是其中的參數Min為空數組 解決方案&#xff1a;判斷了下可以輸出Min的區域是否存在&#xff0c;不存在跳過這一步。

八叉樹bt文件轉為grid文件的代碼及編譯流程

目的 點云文件轉為八叉樹文件 代碼 在一個文件夾中新建兩個文件&#xff0c;pcd2bt.cpp和CMakeLists.txt&#xff0c;分別寫入&#xff1a; grid3d_node.cpp #include <ros/ros.h> #include <string> #include "grid3d.hpp"int main(int argc, char…

【Maven技術專題】「實戰開發系列」盤點Maven項目中打包需要注意到的那點事兒

Maven項目打包需要注意到的那點事兒 Maven是什么Maven打包插件的作用Maven打包后經常出現的問題maven構建可運行Jar包 Maven打包的三種方式Maven打包的最簡單的方法maven-jar-pluginMANIFEST.MF文件部分MANIFEST.MF的文件內容jar包的拷貝機制在pom.xml中配置 maven-jar-plugin的…

mybatis多表映射-分步查詢

1、建庫建表 create database mybatis-example; use mybatis-example; create table t_book (bid varchar(20) primary key,bname varchar(20),stuid varchar(20) ); insert into t_book values(b001,Java,s001); insert into t_book values(b002,Python,s002); insert into …