hanlp 訓練模型_LTP 4.0!單模型完成6項自然語言處理任務

418b2b42eaada2d9488f371086dd7e64.png

9a1c7d74cd333fbe5c343aa3dd567a8c.png
來源|哈工大SCIR

語言技術平臺(Language Technology Platform, LTP)是哈工大社會計算與信息檢索研究中心(HIT-SCIR)歷時多年研發的一整套高效、高精度的中文自然語言處理開源基礎技術平臺。該平臺集詞法分析(分詞、詞性標注、命名實體識別)、句法分析(依存句法分析)和語義分析(語義角色標注、語義依存分析)等多項自然語言處理技術于一體。其中句法分析、語義分析等多項關鍵技術多次在CoNLL國際評測中獲得了第1名。此外,平臺還榮獲了2010年中國中文信息學會科學技術一等獎、2016年黑龍江省科技進步一等獎。國內外眾多研究單位和知名企業通過簽署協議以及收費授權的方式使用該平臺。

哈工大SCIR本科生馮云龍等同學在車萬翔教授指導下,于近日對LTP進行了新一輪的全面升級,并推出了LTP 4.0版本。此次升級的主要改進為:

  • 基于多任務學習框架進行統一學習,使得全部六項任務可以共享語義信息,達到了知識遷移的效果。既有效提升了系統的運行效率,又極大縮小了模型的占用空間
  • 基于預訓練模型進行統一的表示 ,有效提升了各項任務的準確率
  • 基于教師退火模型蒸餾出單一的多任務模型,進一步提高了系統的準確率
  • 基于PyTorch框架開發,提供了原生的Python調用接口,通過pip包管理系統一鍵安裝,極大提高了系統的易用性

下表列出了新舊版LTP在精度、效率和模型大小方面的對比:

ae65c55c12ee1e10bbce30837dcc17aa.png
為了模型的小巧易用,本次發布的版本基于哈工大訊飛聯合實驗室發布的中文ELECTRA Small預訓練模型。后續將陸續發布基于不同預訓練模型的版本,從而為用戶提供更多準確率和效率平衡點的選擇。

測試環境如下:

  • Python 3.7
  • LTP 4.0 Batch Size = 1
  • CentOS 3.10.0-1062.9.1.el7.x86_64
  • Intel(R) Xeon(R) CPU E5-2640 v4 @ 2.40GHz
備注:速度數據在人民日報命名實體測試數據上獲得,速度計算方式均為所有任務順序執行的結果。另外,語義角色標注與語義依存新舊版采用的語料不相同,因此無法直接比較(新版語義依存使用SemEval 2016語料,語義角色標注使用CTB語料)。

歡迎訪問http://ltp.ai/

http://ltp.ai/?ltp.ai

獲取平臺的源代碼、模型及更詳細的介紹信息,敬請提出反饋意見。

本期責任編輯:張偉男

本期編輯:賴勇魁

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/541632.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/541632.shtml
英文地址,請注明出處:http://en.pswp.cn/news/541632.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

typescript 學習

typescript將在不久的將來從前端大一統的趨勢中脫穎而出成為主流編譯器。學習ts對前端開發人員來說是不可或缺的。同時,也要抓緊學習es2015/6/7。ts和es6并不是對立的。而是相輔相成的。ts的競爭和打擊對象實質上是babel…… 官方資料 # 官方地址: https…

計算機中央處理器cpu_中央處理器(CPU)| 計算機科學組織

計算機中央處理器cpu中央處理器(CPU) (Central Processing Unit (CPU)) The CPU is the brain of the computer system. It works as an administrator of a system. CPU是計算機系統的大腦。 它以系統管理員的身份工作。 All the operations within the system are supervised…

計算機應用基礎專2020春,計算機應用基礎(專)(專,2020春)(20200831130023).pdf

計算機應用基礎(專)(專, 2020 春)使用 " 格式刷”按鈕,可以進行 ___________操作。選擇一項:a. 復制文本的格式b. 刪除文本c. 復制文本d. 保持文本你的回答正確正確答案是:復制文本的格式在 Word 的文檔中插入復雜的數學公式…

computed set 自定義參數_深入理解vmodel之自定義組件用法

根據上一篇《深入理解 v-model 之表單用法》基本對 v-model 有了比較深的理解&#xff0c;接下來我們看看它如何在自定義組件中使用。首先&#xff0c;我們知道下面兩個用法等價的&#xff1a;<input v-model"msg" /><input :value"msg" input&qu…

01json轉字符串

/** * json轉字符串聲明 */ (NSString *)jsonToString:(NSDictionary *)dic; /** * json轉字符串實現 */ (NSString *)jsonToString:(NSDictionary *)dic { if(!dic){ return nil; } NSData *jsonData [NSJSONSerialization dataWithJSONObject:dic options:NSJSONWriting…

AYUSH的完整形式是什么?

AYUSH&#xff1a;阿育吠陀&#xff0c;瑜伽和自然療法&#xff0c;烏納尼&#xff0c;悉達多和順勢療法 (AYUSH: Ayurvedic, Yoga and Naturopathy, Unani, Siddha and Homeopathy) AYUSH is an abbreviation of Ayurvedic, Yoga and Naturopathy, Unani, Siddha, and Homeopa…

大班科學電子計算機,計算器教案

計算器的認識和簡單應用教學內容&#xff1a;義務教育六年制小學第九冊第二單元第42頁。教學目標&#xff1a;1、通過學生自主探究&#xff0c;掌握計算器的使用方法&#xff0c;并能夠用計算器進行簡單的計算。2、借助計算器解決生活中的數學問題、探索數學規律&#xff0c;體…

arraylist能否接收強轉類型_ArrayList 源碼解析

點擊上方"IT牧場"&#xff0c;選擇"設為星標"技術干貨每日送達&#xff01;前言 JDK源碼解析系列文章&#xff0c;都是基于JDK8分析的&#xff0c;雖然JDK14已經出來&#xff0c;但是JDK8我還不會&#xff0c;我…類圖 實現了RandomAccess接口&#xff0c;…

exit c+_C / C ++中的exit(0)vs exit(1)與示例

exit cexit() is a library function in C/C programming language, it is used to terminate the calling process (function) immediately i.e. we can say it is used for the normal program termination and also perform the several cleanup steps. exit()是C / C 編程語…

校園計算機網絡系統,校園計算機網絡系統

一、校園網的基本概念基本功能&#xff1a;數據交換、資源共享&#xff0c;這里所指的數據包括各種信息&#xff0c;基本組成和結構&#xff1a;基本網絡由網絡網絡的分類&#xff1a;有多種分類方法&#xff0c;按規模可分為局域網、區域網、&127;廣域網。局域網服務范圍一…

mc有什么紅石機器人_我的世界10月考試!來測測你的MC成績吧~

考試規則&#xff1a;本次考試為閉卷考試&#xff0c;考生需要在30分鐘內完成試卷。試卷總分為100分&#xff0c;其中包括單項選擇題50分&#xff0c;多項選擇題20分&#xff0c;判斷題30分。考試內容包括《我的世界》手游1.11.0及以上版本在不添加任何模組的情況下的所有游戲內…

130、 Android OkHttp完全解析(轉載)

完全解析&#xff1a;http://blog.csdn.net/lmj623565791/article/details/47911083 從原理角度解析http文件上傳 http://blog.csdn.net/lmj623565791/article/details/23781773 https://github.com/hongyangAndroid/okhttputils

json轉string示例_C.示例中的String.Copy()方法

json轉string示例C&#xff03;String.Copy()方法 (C# String.Copy() Method) String.Copy() method is used to copy a string to new string object, it returns a new instance of String with the same value as given string. String.Copy()方法用于將字符串復制到新的字符…

自定義分頁 html,MVC 自定義HtmlHelper幫助類型之分頁

方法一&#xff1a;在項目中增加App_Code文件夾&#xff0c;新增一個MyHtmlper.cshtml視圖文件寫入代碼&#xff1a;helper Pagger(int pageIndex, int pageCount){for (int i 1; i < pageCount; i){if (i ! pageIndex){(i)}else{i}}}新增一個HomeControllerpublic class H…

vue 對象繼承_Vue2.0中組件的繼承與擴展是什么

Vue2.0中組件的繼承與擴展是什么發布時間&#xff1a;2020-12-07 14:04:09來源&#xff1a;億速云閱讀&#xff1a;100作者&#xff1a;小新小編給大家分享一下Vue2.0中組件的繼承與擴展是什么&#xff0c;相信大部分人都還不怎么了解&#xff0c;因此分享這篇文章給大家參考一…

stack示例_C.示例中的Stack.Clone()方法

stack示例C&#xff03;Stack.Clone()方法 (C# Stack.Clone() method) Stack.Clone() method is used to create a shallow copy of the stack. Stack.Clone()方法用于創建堆棧的淺表副本。 Syntax: 句法&#xff1a; Object Stack.Clone();Parameters: None 參數&#xff1a…

簡述計算機圖形的圖形應用主要有哪些,5計算機圖形學考試簡答題復習.doc

5計算機圖形學考試簡答題復習計算機圖形學考試簡答題復習1、簡述計算機動畫的概念&#xff0c;它經歷了哪幾個階段的發展&#xff1f;(2分)計算機動畫是指采用圖形與圖像的處理技術&#xff0c;借助于編程或動畫制作軟件生成一系列的景物畫面&#xff0c;其中當前幀是前一幀的部…

在圖片中選定任意凸多邊形制作掩膜程序MATLAB

function S get_convex_S(C,vx,vy) %該函數實現的功能為指定圖像中多邊形的頂點&#xff0c;返回屬于該凸多邊形中的所有像素點 %xv&#xff0c;yv為頂點坐標按照順時針或者逆時針。vx(1) xv(end); yv(1) yv(end) %輸入的C是結構&#xff0c;vx vy是數組存的是頂點坐標。 %輸…

js console 輸出到文件_Node.js核心入門

正文核心模塊是Node.js的心臟&#xff0c;主要是有一些精簡高效的庫組成(這方面和Python有很大的相似之處)&#xff0c;為Node.js提供了基礎的API。主要內容包括&#xff1a;Node.js核心入門(一)全局對象常用工具事件機制Node.js核心入門(二)文件系統訪問HTTP服務器與客戶端全局…

scala 當前日期_如何在Scala中檢查當前日期和時間?

scala 當前日期Scala is a general-purpose programming language, which is majorly used for data manipulation. It has libraries and support for almost all different utilities that are important. One of the important things that are required while programming …