Potato(土豆)一款輕量級的開源文本標注工具(二)

示例項目(模版)

Potato 旨在提高數據標注的可復制性,并降低研究人員設置新標注任務的成本。因此,Potato 提供了一系列預定義的示例項目,并歡迎公眾向項目中心貢獻。如果您使用 Potato 進行了自己的標注工作,也鼓勵用戶創建一個 pull request 并發布您的標注設置。

Potato 提供了一系列示例模板,用于?所有支持的標注架構,您可以輕松地通過以下方式從項目中心下載它們。

本文給出幾個在大模型文本標注訓練中,常用到的幾種標注事例。

閱讀理解(Question Answering / Reading comprehension (SQuAD style))

原文(翻譯):2014年10月,碧昂斯與英國時尚零售商Topshop簽署了一項協議,將推出一系列運動服。這家五五開的合資企業名為Parkwood Topshop Athletic Ltd,計劃于2015年秋季推出其首個舞蹈、健身和運動系列。該線路將于2016年4月開通。

問題(翻譯):英國與碧昂斯的合作銷售哪種服裝?

該項標注功能: 如果該問題的答案在原文中可以找到,使用鼠標高亮選擇。另外,支持多處選擇; 已選擇的文本,雙擊鼠標,可以消除掉。較為方便。

文本匹配(match_finding)

(base) d:\study\potato>python potato/flask_server.py start project-hub/match_finding/configs/Computer_Science.yaml -p 8000

解釋一下,標注原因:

標注得分:3.Somewhat similar

這是因為兩者都涉及到了行李費與航空公司起飛性能的關系,但在具體描述和角度上存在差異。news沒有區分不同類型的航空公司,而是普遍強調了正面影響;而paper則具體指出了不同類型航空公司之間的性能差異。

文本摘要(Summarization evaluation)

(base) d:\study\potato>python potato/flask_server.py start project-hub/summarization_evaluation/configs/summ-eval.yaml -p 8000

  • 四個重要評估維度。
    • 相關性(relevance):摘要包含的信息是否為文中重要信息。
    • 一致性(consistency):摘要是否有事實性錯誤。本文關注的忠實度(faithfulness)也和一致性較為相關。
    • 流暢性(fluency):摘要中的單個句子是否通順。
    • 連貫性(coherence):摘要整體是否行文流暢連貫。

參考: 【NLP學習】如何評估文本摘要模型的忠實度(faithfulness)

文本改寫(Text Rewriting)

實例中,給出的是一個更加禮貌性(politeness)的改寫:

(base) d:\study\potato>python potato/flask_server.py start project-hub/text_rewriting/configs/politeness.yaml -p 8000

原文(翻譯):Shelley,僅供參考。蕾塔在這個項目上與麗塔密切合作。里克和我也會參與其中。如果您有任何問題,

請告訴我們。謝謝林恩

要求(翻譯):你的同事正在起草一封電子郵件,并請求你的幫助。請幫忙重寫以上信息,使其更有禮貌。

更多實例,可以參考官網: Example Projects - potato annotation

也歡迎一起探討學習!!?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/36575.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/36575.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/36575.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

海思平臺使用ITTP_Stream調試sensor

目錄 相關資料1.ISP相關資料2.MIPI RX相關資料3.sensor資料4.MIPI標準 準備工作1.準備sensor驅動2.準備sample vio3.準備上位機和下位機程序 運行1.只運行HiPQTool1.1.板端運行1.2.PC端運行HiPQTool 2.使用ITTP_Stream2.1.板端運行2.2.打開上位機軟件 相關資料 1.ISP相關資料 …

uniapp開發手機APP、H5網頁、微信小程序、長列表插件

ml-list 插件地址:https://ext.dcloud.net.cn/plugin?id18928 ml-list介紹 1、ml-list 列表組件,包含基本列表樣式、可擴展插槽機制、長列表性能優化、多端兼容。 2、ml-list 低代碼列表,幫助使用者快速構建列表,簡單配置&…

秋招突擊——6/26~6/27——復習{二維背包問題——寵物小精靈之收服}——新作{串聯所有單詞的字串}

文章目錄 引言復習二維背包問題——寵物小精靈之收服個人實現重大問題 滾動數組優化實現 新作串聯所有單詞的字串個人實現參考實現 總結 引言 今天應該是舟車勞頓的一天,頭一次在機場刷題,不學習新的東西了,就復習一些之前學習的算法了。 復…

百度Apollo的PublicRoadPlanner一些移植Ros2-foxy的思路(持續更新)

如今的PublicRoadPlanner就是之前耳熟能詳的EM planner 計劃 —— ROS2與CARLA聯合仿真 結構化場景: 規劃算法:EM-planner 控制算法:MPC和PID 非結構化場景: 規劃算法采用Hybrid A* (1)小車模型搭建(計劃參考Github上Hybrid上的黑車,比較炫酷) (2)車輛里程計: 位…

深入比較:Batch文件與Shell腳本的異同

在操作系統中,自動化腳本是一種常見的工具,用于執行一系列自動化命令或程序。Windows和類Unix系統都提供了各自的腳本解決方案:Batch文件(在Windows中)和Shell腳本(在類Unix系統中)。本文將詳細…

有哪些方法可以恢復ios15不小心刪除的照片?

ios15怎么恢復刪除的照片?在手機相冊里意外刪除了重要的照片?別擔心!本文將為你介紹如何在iOS 15系統中恢復已刪除的照片。無需專業知識,只需要按照以下步驟操作,你就能輕松找回寶貴的回憶。 一、從iCloud云端恢復刪除…

SRC公益上分的小技巧一

前言 之前發布的文章,例如SRC中的一些信息收集姿勢- Track 知識社區 - 掌控安全在線教育 - Powered by 掌控者 里面就有提到若依系統,默認賬號密碼非常簡單 是 admin / admin123 但是,往往我們去挖掘的時候很容易出現 這說明了若依系統的門…

Viewer.js 圖片預覽插件使用

參考:Viewer.js 圖片預覽插件使用 demo鏈接:viewerjs_demo

【Linux:文件描述符】

文件描述符: 文件描述符的分配原則:最小未分配原則 每一個進程中有一個task_struct結構體(PCB),而task_struct中含有struct file_sturct*file的指針,該指針指向了一個struct files_struct的結構體該結構體中含有一個f…

PHP框架詳解- symfony框架

Symfony框架是一個開源的PHP框架,由SensioLabs公司開發并維護,最早發布于2005年。它旨在為Web應用程序的開發提供一個高效且結構化的環境。Symfony框架的設計理念是減少Web應用程序的創建和維護時間,并避免重復性任務。 Symfony框架采用MVC&…

PG最大連接數

在 PostgreSQL 數據庫中,您可以使用 SQL 查詢來獲取最大連接數、當前連接數以及每個數據庫的連接數。以下是一些常用的查詢: 查看最大連接數: PostgreSQL 的最大連接數由配置參數 max_connections 決定。您可以在 postgresql.conf 文件中設置…

使用IMAP服務獲取163郵箱的未讀郵件

使用IMAP服務獲取163郵箱的未讀郵件 整體的邏輯思路如下: 開啟163郵箱的IMAP服務,拿到授權碼用于登錄IMAP服務登錄IMAP服務,獲取郵箱的未讀郵件列表遍歷未讀郵件列表,獲取郵件內容 # 導入必要的庫 import os import imaplib im…

三大工作流引擎技術Activiti、Flowable、Camunda選型指南

文章目錄 前言1 流程引擎發展歷程2 流程引擎主要概念BPM (Business Process Management)BPMN (Business Process Model and Notation)CMMN (Case Management Model and Notation)DMN (Decision Model and Notation)事件(Event)順序流(Sequenc…

從靜電到浪涌,全面防護:雷卯多電壓等級電源保護設計方案匯總

在當今數字化、電氣化日益加速的時代,電子設備和電力系統面臨著前所未有的挑戰,其中靜電放電(ESD)、浪涌以及雷擊等瞬態事件成為了威脅設備穩定性和壽命的關鍵因素。從精密的消費電子產品到工業級控制系統,從智能家居到新能源汽車&#xff0c…

區塊鏈技術的核心要素:共識機制、加密技術與分布式賬本

區塊鏈聽起來像個非常高大上的技術,其實它的核心原理并不難理解。今天我們要聊的就是區塊鏈的三個核心要素:共識機制、加密技術和分布式賬本。想象一下區塊鏈是一個巨大的數字筆記本,我們要弄清楚大家如何共同寫這個筆記本,又如何…

用一個實例看如何分享大量照片 續篇二,關于Exif (Exchangeable Image File) - 可交換圖像文件

續篇二:說說關于照片隱含的 Exif (Exchangeable Image File) 可交換圖像文件 數碼照片的Exif 參數有很多,重要的Exif信息:拍攝日期、時間、拍攝器材、GPS信息。 當然這主要對自己的檔案有意義,如果放到網上還是建議抹去這些信息。…

Bad owner or permissions on C:\\Users\\username/.ssh/config > 過程試圖寫入的管道不存在。

使用windows連接遠程服務器出現Bad owner or permissions 錯誤 問題: 需要修復文件權限 SSH 配置文件應具有受限權限以防止未經授權的訪問 確保只有用戶對該.ssh/config文件具有讀取權限 解決方案: 在windows下打開命令行,通過以下命令打開文…

C++編程(四)this指針 常函數 常對象 靜態成員

文章目錄 一、this指針(一)概念(二)顯式使用this指針的場景1. 當形參和成員變量名一致時2. 返回對象自身的時候必須要使用this指針3. 在類中銷毀一個對象 二、常函數和常對象(一)常函數1. 概念2. 語法格式 …

python OpenCV 庫中的 cv2.Canny() 函數來對圖像進行邊緣檢測,并顯示檢測到的邊緣特征

import cv2# 加載圖像 image cv2.imread(4.png)# 使用 Canny 邊緣檢測算法提取邊緣特征 edges cv2.Canny(image, 100, 200)# 顯示邊緣特征 cv2.imshow(Edges, edges) cv2.waitKey(0) cv2.destroyAllWindows() 代碼解析: 導入 OpenCV 庫: import cv2加…

【MFC】socket通信代碼解析

目錄 一、在MFC中使用Winsock進行socket編程 1.1 包含必要的頭文件 1.2 初始化Winsock 1.3創建socket 1.4 綁定socket 1.5 監聽連接(對于服務器) 1.6 建立連接(對于客戶端) 1.7 發送和接收數據 1.8. 關閉socket 1.9 錯誤處理 1.10 MFC集成 二、MFC中Socke…