人工智能-NLP簡單知識匯總01

自然語言處理難點：

總而言之：！！語言無處不歧義

通過詞匯、形式文法等制定的規則引入語言學知識，從而完成相應的自然語言處理任務

在這里插入圖片描述

對于機器翻譯任務可以構造如下規則庫：

if 漢語主語=我 then 英語主語 = I
if 英語主語=I then 英語 be動詞 = am/was
if 漢語 = 蘋果 and 沒有修飾量詞 then 英語 = apples

就是基于固定規則，優缺點顯而易見

將自然語言處理任務轉化為某種分類任務

在這里插入圖片描述

需要人工處理的特別多

將特征學習和預測模型融合，通過優化算法使得模型自動地學習出好的特征表示，并基于此進行結果預測

在這里插入圖片描述

將大量各類型自然語言處理任務，統一為生成式自然語言理解框架

在這里插入圖片描述

在大規模語言模型構建階段，通過大量的文本內容，訓練模型長文本的建模能力，使得模型具有語言生成能力，并使得模型獲得隱式的世界知識。
在通用能力注入階段，利用包括閱讀理解、情感分析、信息抽取等現有任務的標注數據，結合人工設計的指令詞對模型進行多任務訓練，從而使得模型具有很好的任務泛化能力。
特定任務使用階段則變得非常簡單，由于模型具備了通用任務能力，只需要根據任務需求設計任務指令，將任務中所需處理的文本內容與指令結合，然后就可以利用大模型得到所需結果。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/39409.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/39409.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/39409.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！