實戰演練1:實戰演練之命名實體識別
- 命名實體識別簡介
- 代碼
命名實體識別簡介
- 什么是命名實體識別任務
- 命名實體識別(Named Entity Recognition,簡稱NER)是指識別文本中具有特定意義的實體,主要包括人名、地名、機構名、專有名詞等。通常包括兩部分:
- (1)實體邊界識別。(2)確定實體類別(人名、地名、機構名或其他)。
- 數據標注體系:IOB1、IOB2、IOE1、IOE2、IOBES、BILOU
- IOB2標注
- 表示實體內部,O表示實體外部,B表示實體開始
- B/I-XXX,XXX表示具體的類別
- IOBES標注
- I表示實體內部,O表示實體外部,B表示實體開始,E表示實體結束,S表示一個詞單獨形成一個命名實體
- 有時也會使用M代替I,但本質是同一含義
- 評估指標:Precision(預測中預測對的)、Recall(真實中預測對的)、F1