這份NLP研究進展匯總請收好,GitHub連續3天最火的都是它

014738ad83f1b38b270a220b38b6cef6224c80e2

最近,有一份自然語言處理 (NLP) 進展合輯,一發布就受到了同性交友網站用戶的瘋狂標星,已經連續3天高居GitHub熱門榜首位。

合集里面包括,20多種NLP任務前赴后繼的研究成果,以及用到的數據集。

這是來自愛爾蘭的Sebastian Ruder,傾力匯總而成。

7f76a2a39e806a0344a286444611cdb2b275db58

他在愛爾蘭國立大學 (戈爾韋) 讀博。另一個身份,是AI創業公司Aylien的研究人員。

塞巴斯蒂安說,NLP近來發展太快了,即便作為局內人,也很難順暢地跟進這個領域里發生的事。

無微不至的倉庫

要找到最常用的數據集,要了解自己研究的問題有了哪些新進展,還是很費力的。

6ea1073095fa1f1979c07602438fa75699aded8e

所以,他就在GitHub上面建了一個倉庫,追蹤各種自然語言任務的研究成果,還有對應的數據集。

這是一間整齊的倉庫,任務是按字母順序排列——

· CCG supertagging
· Chunking
· Constituency parsing
· Coreference resolution
· Dependency parsing
· Dialog
· Domain adaptation
· Language modelling
· Machine translation
· Multi-task learning
· Multimodal
· Named entity recognition
· Natural language inference
· Part-of-speech tagging
· Question answering
· Semantic textual similarity
· Sentiment analysis
· Semantic parsing
· Semantic role labeling
· Summarization
· Text classification

作為一個情緒型選手,我點開了情緒分析 (Sentiment Analysis) 的頁面。

e2d8d9ddb9fbeb591e04d177b7a85770f122ba0e

這里的數據集很親切,比如IMDb,電影評分網站的數據。

再比如,“ (姑且稱為) 美國的大眾點評”,Yelp的店鋪評論數據集。

6f4010133c2fac720c21f9f28cd88dee2e18e6f4

每個數據集下面,都有相關研究的列表,以及所用模型的準確度

當然,情緒的二分類 (Binary Classification) ,以及細粒度分類 (Fine-Grained Classification) ,作為兩種問題,列表也是分開的。

e4dc71761c335681cad61b848c34d269ed18bbcd

這人文關懷,無微不至。

未解之謎

塞巴斯蒂安還說了,上面列出的那些,是已經開始追蹤的NLP任務。

fc616ae7e2c8dcd96a84142abaa501a4e471cc14

還有一些任務,被他加入了心愿單——

· Bilingual dictionary induction
· Discourse parsing
· Entity Linking
· Information extraction
· Keyphrase extraction
· Knowledge base population (KBP)
· More dialogue tasks
· Relation extraction
· Semi-supervised learning

這些問題的進展,在他那里還是未解之謎。

深知以一己之力難以將這部分內容補充完整,程序員還給了詳細的參與步驟,希望廣大NLP戰士,可以互相取暖。

去看一看

塞巴斯蒂安給NLP的愛,很深沉了。

54fa099fa2fb8eda7bc9deb05d2184bd9a766915

他的博客,各位同行或許也很眼熟了。

變身前:Sebastianruder.com
變身后:Ruder.io

沒有收藏的話,現在可以收藏一下。

當然,這里也要手動貼上NLP倉庫的地址:

https://github.com/sebastianruder/NLP-progress

且去走一遭。


原文發布時間為:2018-06-27

本文作者:方栗子

本文來自云棲社區合作伙伴“量子位”,了解相關信息可以關注“量子位”。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/390200.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/390200.shtml
英文地址,請注明出處:http://en.pswp.cn/news/390200.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于模型的嵌入式開發流程_如何使用基于模型的測試來改善工作流程

基于模型的嵌入式開發流程Unit testing is not enough – so lets start using model-based testing to improve our workflows.單元測試還不夠–因此,讓我們開始使用基于模型的測試來改善我們的工作流程。 Software testing is an important phase in building a …

166. 分數到小數

166. 分數到小數 給定兩個整數,分別表示分數的分子 numerator 和分母 denominator,以 字符串形式返回小數 。 如果小數部分為循環小數,則將循環的部分括在括號內。 如果存在多個答案,只需返回 任意一個 。 對于所有給定的輸入…

最近用.NET實現DHT爬蟲,全.NET實現

最近用.NET實現DHT爬蟲,全.NET實現,大家可以加我QQ交流下 309159808 轉載于:https://www.cnblogs.com/oshoh/p/9236186.html

C++貪吃蛇

動畫鏈接 GitHub鏈接:https://github.com/yanpeng1314/Snake 1 #include "Snake.h"2 3 int iScore 0;4 int iGrade 1;5 6 //蛇頭蛇尾初始位置7 int x_head 1, y_head 3;8 int x_tail 1, y_tail 1;9 10 //地圖坐標11 int i_Map 1, j_Map 1;12 13 /…

遠程辦公招聘_招聘遠程人才時要尋找的5種技能

遠程辦公招聘Remote work is a fast emerging segment of the labor market. How to embrace this shift as an employer - and find, recruit, and empower remote staff - is a question many companies and hiring managers are grappling with.遠程工作是勞動力市場中快速崛…

10分鐘騰訊云配置免費https

騰訊云免費證書申請地址: https://console.cloud.tencent... 填寫相關信息 域名身份驗證 文件驗證 將fileauth.text 創建在網站訪問根目錄的 .well-known/pki-validation/目錄使得 www.**.com/.well-known/pki-validation/fileauth.text 能夠訪問詳情 等待5分鐘左右…

1588. 所有奇數長度子數組的和

1588. 所有奇數長度子數組的和 給你一個正整數數組 arr ,請你計算所有可能的奇數長度子數組的和。 子數組 定義為原數組中的一個連續子序列。 請你返回 arr 中 所有奇數長度子數組的和 。 示例 1: 輸入:arr [1,4,2,5,3] 輸出&#xff1…

洛谷P3195 [HNOI2008]玩具裝箱TOY(單調隊列優化DP)

題目描述 P教授要去看奧運,但是他舍不下他的玩具,于是他決定把所有的玩具運到北京。他使用自己的壓縮器進行壓縮,其可以將任意物品變成一堆,再放到一種特殊的一維容器中。P教授有編號為1...N的N件玩具,第i件玩具經過壓…

680. 驗證回文字符串 Ⅱ

680. 驗證回文字符串 Ⅱ 給定一個非空字符串 s,最多刪除一個字符。判斷是否能成為回文字符串。 示例 1: 輸入: s “aba” 輸出: true 示例 2: 輸入: s “abca” 輸出: true 解釋: 你可以刪除c字符。 示例 3: 輸入: s “abc” 輸出: false 解題思路 使用…

Android--RxJava2更新體驗

截止日前最新版2017-3-15: RxJava compile ‘io.reactivex:rxjava:1.2.7’ compile ‘io.reactivex:rxandroid:1.2.1’ RxJava2 compile “io.reactivex.rxjava2:rxjava:2.0.7” compile “io.reactivex.rxjava2:rxandroid:2.0.1” 1:create操作改變 Rxjava CompositeSubscri…

kotlin和java語言_Kotlin VS Java – 2020年您應該學習哪種編程語言?

kotlin和java語言It has been several years since Kotlin came out, and it has been doing well. Since it was created specifically to replace Java, Kotlin has naturally been compared with Java in many respects.自Kotlin問世以來已經有好幾年了,而且一切…

oracle部署--安裝oracle軟件與部署單實例數據庫

一、安裝oracle數據庫軟件 1.創建相應的用戶組及用戶 groupadd oinstall groupadd oper groupadd dba useradd -g oinstall -G oper,dba oracle 2.創建oracle software安裝路徑 mkdir -p /u01/app/oracle/product/11.2.0/db_1 3.修改安裝路徑權限 chown -R oracle:oinstall …

web前端【第十一篇】jQuery屬性相關操作

知識點總結 1、屬性 屬性(如果你的選擇器選出了多個對象,那么默認只會返回出第一個屬性)、 attr(屬性名|屬性值) - 一個參數是獲取屬性的值,兩個參數是設置屬性值 - 點擊加載圖片示例 re…

528. 按權重隨機選擇

528. 按權重隨機選擇 給定一個正整數數組 w ,其中 w[i] 代表下標 i 的權重(下標從 0 開始),請寫一個函數 pickIndex ,它可以隨機地獲取下標 i,選取下標 i 的概率與 w[i] 成正比。 例如,對于 w…

sql語句語法多表關聯_SQL創建表語句-帶有示例語法

sql語句語法多表關聯SQL is one of the most reliable and straightforward querying languages around. It provides clear cut syntax that reads easily without abstracting away too much of the functionalitys meaning.SQL是最可靠,最直接的查詢語言之一。 它…

分布式改造劇集三:Ehcache分布式改造

第三集:分布式Ehcache緩存改造 前言 ? 好久沒有寫博客了,大有半途而廢的趨勢。忙不是借口,這個好習慣還是要繼續堅持。前面我承諾的第一期的DIY分布式,是時候上終篇了---DIY分布式緩存。 探索之路 ? 在前面的文章中,…

85. 最大矩形

85. 最大矩形 給定一個僅包含 0 和 1 、大小為 rows x cols 的二維二進制矩陣,找出只包含 1 的最大矩形,并返回其面積。 示例 1: 輸入:matrix [[“1”,“0”,“1”,“0”,“0”],[“1”,“0”,“1”,“1”,“1”],[“1”,“1”…

TP單字母函數

A方法 A方法用于在內部實例化控制器 調用格式:A(‘[項目://][分組/]模塊’,’控制器層名稱’) 最簡單的用法: $User A(User); 表示實例化當前項目的UserAction控制器(這個控制器對應的文件位于Lib/Action/UserAction.class.php)…

Angular問題03 @angular/material版本問題

1 問題描述 應用使用 angular4在使用angular/material時,若果在導入模塊時使用mat開頭,就會報錯。 2 問題原因 angular/material版本出現問題,angular/material 從版本5開始就必須要angular5的核心依賴;想要在angular5之前版本中的…

onclick判斷組件調用_從子組件Onclick更新狀態

onclick判斷組件調用How to update the state of a parent component from a child component is one of the most commonly asked React questions.如何從子組件更新父組件的狀態是最常見的React問題之一。 Imagine youre trying to write a simple recipe box application, …