NLP復習資料(6)-第十章 語義分析

NLP復習資料-第十章

  • 1語義理論簡介
  • 2格語法
  • 4語義網絡
  • 5詞義消歧
  • 5語義角色標注
  • 6詞向量表示
  • 7篇章分析

國科大,宗老師《自然語言處理》課程復習筆記,個人整理,僅供參考。

語義分析:P3解釋句子或篇章的含義,主要困難(歧義現象,不同人的理解不同,模型方法不成熟)

1語義理論簡介

就是說不同的學者對于詞的含義有不同的理解(至少記住兩個吧)
1.詞的指稱(詞與現實世界事物對應,復雜問題無法定義)
2.心理圖像(不是所有詞義都有清晰的心理圖像)
3說話者意圖(希望聽者理解,做出反應)
4.過程語義(編程語言的含義,缺乏獨立性)
5.詞匯分解學派(詞的意義基于語義基元,語義基元標準難定)
6.條件真理模型(不能很好描述時間場景)
7.情景語義學、模態邏輯

2格語法

格語法-語言學家搞的一套東西,老師快速地過了一遍。句子的表層表現與底層含義。

三條基本規則:P22句子由情態和命題構成,命題可以向下分

用格語法分析語義:基礎有一本動詞格框架名詞語義信息的詞典

步驟P31,識別動詞,找格框架->填充必備格->填充可選格->判斷句子情態

格語法描述漢語的局限性:一個句子(動詞)一個框架,漢語的無動句、流水句子、連動句很難用一個框架描述

4語義網絡

語義網絡:P38 概念關系 組成的有向圖,用來表示語義與知識。

P42事件的語義網絡節點之間的關系可以使用格關系來表示

P45基于語義網絡的推理:根據已知知識構建局部網絡->用變量代表待求客體進行推理

P46知識圖譜:描述實體與實之間的關系。關鍵技術:實體識別與消歧,關系識別

5詞義消歧

詞義消歧:多義詞詞義確定的過程

基本方法:
1.有監督詞義消歧:互信息消歧P51:平行語料庫,語義指示器的分類問題,互信息最大的方法來確定語義指示器的分類

2.貝葉斯消歧:第二章內容P55基于上下文的貝葉斯分類器的消歧方法

3.基于最大熵的消歧方法:第二章

4.基于詞典的消歧:
->詞典語義定義消歧
->上下文語義項
->雙語詞典:短語-翻譯-譯文中的共現次數多的組合詞義作為原語言中的意義
->Yarowsky:P62一個多義詞項出現一次后,該詞項出現的可能性會比較大

5語義角色標注

分析句子謂語與其他成分詞之間的關系

方法:
->基于短語結構分析的SRL(候選論元剪枝:P74,論元識別與標注P76)
->基于依存關系SRL(P80只有候選論元的剪除:因為它本來就是以動詞為中心的)
->基于語塊分析的SRL方法P84:語義角色標注問題變成序列標注問題

6詞向量表示

兩個主要問題:詞匯如何轉換成向量,向量如何語義組合。

基于文本的詞匯語義表示:共現矩陣P94、神經網絡P95

基于圖像學習的詞匯語義表示:P97圖像->特征向量

基于聲音學習的詞匯語義特征:P98

多模態融合

下面就是老師們的一些工作,都是一些思想,不細說大致了解一下。
(1) 關聯詞匯作為弱監督信號得到詞向量表示
(2) 多模態的詞匯表示的可解釋性研究:不同模態的向量,側重詞義特征不同,或具體,或抽象
(3) 融合詞匯內部結構的中文句子表示模型
(4) 借鑒人類注意力分配機制的語義表示模型
(5) 研究不同類型句子在人腦的語義解碼(句子->腦圖像->特征提取)

7篇章分析

宗老師講的最后一點內容:篇章分析
1.如何表示一個篇章:
詞匯鏈:P3幾個關鍵詞串在一起,構成一篇文章的描述
事件鏈:P5實體抽取->詞匯鏈上每個詞最近的論元,構成事件鏈->判斷相鄰事件之間的關系
話題鏈:P6一系列回指構成的話題鏈

2.淺層篇章關系分析:P10分析兩個篇章單元之間的關系,三個主要任務:關聯詞識別、arg抽取、兩個arg之間功能類型判斷。老師的基本框架:p12
(1)錨點識別:P13包括顯示的關聯詞,和隱式的標點符號
(2) Argment提取:P16一些啟發式的規則
(2)Argment 擴展,以同一個句子、前后兩個句子為種子,向前后擴展
(3)Argment再標記:他們的位置是相對的p28

3.主要問題:關聯詞識別錯誤P31、句子邊界識別錯誤P33、

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/445147.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/445147.shtml
英文地址,請注明出處:http://en.pswp.cn/news/445147.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

處理機調度與死鎖

處理機調度與死鎖 處理機調度的層次 高級調度 高級調度又稱為作業調度或長程調度,其主要功能是根據某種算法,把外存上處于后備隊列中的那些作業調入內存,也就是說,它的調度對象是作業。 1.作業和作業步 作業:一個比程…

各種卷積

從最開始的卷積層,發展至今,卷積已不再是當初的卷積,而是一個研究方向。在反卷積這篇博客中,介紹了一些常見的卷積的關系,本篇博客就是要梳理這些有趣的卷積結構。 閱讀本篇博客之前,建議將這篇博客結合在一…

springboot——kaptcha

導入包&#xff1a; <dependency><groupId>com.github.penggle</groupId><artifactId>kaptcha</artifactId><version>2.3.2</version></dependency> 配置類&#xff1a; package com.now.community.community.config;import…

NLP復習資料(7)-機器翻譯、文本分類、情感分析

NLP復習資料國科大&#xff0c;宗老師《自然語言處理》課程復習筆記&#xff0c;個人整理&#xff0c;僅供參考。此部分為手稿&#xff0c;高清圖下載見鏈接&#xff1a;https://download.csdn.net/download/sinat_40624829/11662412

XMl文件解析讀取

DOM方式&#xff1a; http://www.w3schools.com/dom/dom_parser.asp

redis——對項目的一些優化方案

這是我們之前項目的業務流程&#xff0c;做一下簡單介紹。 登錄&#xff1a; 用戶輸入賬號、密碼、驗證碼。我們先判斷用戶輸入的驗證碼是不是我們session存的驗證碼&#xff0c;然后去查賬號密碼是否正確。 如果登錄成功&#xff0c;發送給用戶一張憑證&#xff08;ticket&a…

const的思考

const的思考 1、什么是const?常類型是指使用類型修飾符const說明的類型&#xff0c;常類型的變量或對象的值是不能被更新的。&#xff08;當然&#xff0c;我們可以偷梁換柱進行更新&#xff1a;&#xff09;2、為什么引入const&#xff1f;const 推出的初始目的&#xff0c;正…

深度模型壓縮論文(02)- BlockSwap: Fisher-guided Block Substitution for Network Compression

文章目錄1.摘要和背景1.1 摘要1.2 背景2.方法和貢獻2.1 方法2.2 貢獻3.實驗和結果3.1 實驗3.2 結果4.總結和展望4.1 總結4.2 展望本系列是在閱讀深度神經網絡模型小型化方面論文時的筆記&#xff01;內容大部分從論文中摘取&#xff0c;也會有部分自己理解&#xff0c;有錯誤的…

NLP復習資料(8)-知識圖譜、信息抽取

NLP復習資料第16講—知識圖譜第17講-信息抽取&#xff08;知識圖譜生命周期中信息獲取的關鍵技術&#xff09;國科大&#xff0c;宗老師《自然語言處理》課程復習筆記&#xff0c;個人整理&#xff0c;僅供參考。第16講—知識圖譜 知識圖譜經典知識表示理論語義網資源描述框架…

Collection源碼閱讀

package java.util;import java.util.function.Predicate; import java.util.stream.Stream; import java.util.stream.StreamSupport;/*** 集合層次結構的根接口&#xff0c;一個集合表示一組對象&#xff0c;稱為元素* JDK不提供任何該接口的直接實現&#xff0c;JDK提供實現…

socket阻塞和非阻塞的區別

讀操作 對于阻塞的socket,當socket的接收緩沖區中沒有數據時,read調用會一直阻塞住,直到有數據到來才返 回。當socket緩沖區中的數據量小于期望讀取的數據量時,返回實際讀取的字節數。當sockt的接收緩沖 區中的數據大于期望讀取的字節數時,讀取期望讀取的字節數,返回實際讀…

深度模型壓縮論文(01)- Meta Filter Pruning to Accelerate Deep Convolutional Neural Networks

文章目錄1.摘要和介紹1.1摘要部分2.背景和方法2.1 背景2.2 貢獻2.3 方法3.實驗和結果3.1 實驗3.2 結果4.總結和展望4.1 總結4.2 展望本系列是在閱讀深度神經網絡模型小型化方面論文時的筆記&#xff01;內容大部分從論文中摘取&#xff0c;也會有部分自己理解&#xff0c;有錯誤…

架構分享--微博架構

先來分享下大神Tim Yang的關于微博的架構設計&#xff1a; 這里主要從 存儲和接口角度來講 對于大流量系統的架構設計&#xff0c;對于寫入方面是特別需要注意的&#xff0c;基本上現在遇到的系統都是對于主數據庫的寫入&#xff0c;然后對于從數據庫實現流量的分發。 對于存…

Pytorch(7)-自己設計神經網絡會遇到的問題

操作pytorch架構遇到的問題1.網絡參數初始化2.查看當前可學習參數3.增加可學習的參數4.參數優化函數Adagrad5.直接修改網絡梯度值6.optimizers.zero_grad()報錯7.tensor.detach() 和 tensor.data 的區別1.網絡參數初始化 在pytorch中&#xff0c;有自己默認初始化參數方式&…

Python里的OS模塊常用函數說明

Python的標準庫中的os模塊包含普遍的操作系統功能。如果你希望你的程序能夠與平臺無關的話&#xff0c;這個模塊是尤為重要的。即它允許一個程序在編寫后不需要任何改動&#xff0c;也不會發生任何問題&#xff0c;就可以在Linux和Windows下運行。 下面列出了一些在os模塊中比較…

深度模型壓縮論文(03)- Be Your Own Teacher: Improve the Performance of Convolutional Neural Networks via Self

文章目錄1.摘要和背景1.1 摘要1.2 背景2.方法和貢獻2.1 方法2.1.1 訓練過程2.1.2 loss介紹2.2 貢獻3.實驗和結果3.1 實驗3.2 結果4.總結和展望4.1 總結4.2 展望主要貢獻&#xff1a;基于網絡蒸餾方法&#xff0c;提出了一種提升裁剪后模型的精度的方法&#xff01;將訓練時間大…

關系數據庫——基礎

數據庫系統概論 四個基本概念 數據&#xff1a;數據庫中存儲的基本對象&#xff0c;描述一個事物的符號記錄&#xff0c;數據和其語義不可分開說 數據庫&#xff08;DB&#xff09;&#xff1a;是長期儲存在計算機內、有組織的、可共享的大量數據的集合。 數據庫管理系統&a…

Python(27)-模塊

模塊、包1.模塊導入的方式2.使用as給模塊取一個別名&#xff08;大駝峰命名法&#xff09;3.從模塊中導入部分工具4.從模塊中導入全部工具5.模塊搜索順序6__name__7.包8.發布模塊、安裝模塊、卸載包9.pip安裝第三方模塊本系列博文來自學習《Python基礎視頻教程》筆記整理&#…

Wow6432Node

64 位版本 Windows 中的注冊表分為 32 位注冊表項和 64 位注冊表項。許多 32 位注冊表項與其相應的 64 位注冊表項同名,反之亦然。 64 位版本 Windows 包含的默認 64 位版本注冊表編輯器 (Regedit.exe) 可顯示 64 位和 32 位的 注冊表項。WOW64 注冊表重定向器為 32 位程序提供…

如何使用docker配置深度學習開發環境

文章目錄1.底層驅動的安裝1.1 操作系統的安裝1.2 顯卡驅動的安裝1.3 cuda的安裝2.使用docker配置深度學習開發環境2.1 docker的安裝2.2 nvidia_docker的安裝2.3 安裝過程中的問題2.3.1 docker和nvidia_docker的版本不匹配的問題。2.3.2 解決每次運行docker命令的時候要加sudo.2…