Language Models are Few-Shot Learners: 開箱即用的GPT-3(四)

Result續

Winograd-Style Tasks

Winograd-Style Tasks 是自然語言處理中的一類經典任務。它源于 Winograd Schema Challenge（WSC），主要涉及確定代詞指的是哪個單詞，旨在評估模型的常識推理和自然語言理解能力。

這個任務中的具體通常包含高度歧義的代詞，但從語義角度看，人類很容易確定其指代對象。例如 “市議會拒絕了婦女團體提出的游行申請，因為他們擔心暴力問題”，這里的 “他們” 顯然指的是 “市議會”。模型需要利用常識和語義信息來正確解析這類代詞的指代關系。
The Winograd Schemas Challenge [LDM12] is a classical task in NLP that involves determining which word a pronoun refers to, when the pronoun is grammatically ambiguous but semantically unambiguous to a human.

當前的一些fine-tune的模型已經接近了人類的水平，但是在一個更高級的數據集Winogrande dataset上還差點意思，當然GPT-3也是在這兩個數據集上完成了測試。

在這里插入圖片描述

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/917038.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/917038.shtml
英文地址，請注明出處：http://en.pswp.cn/news/917038.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！