NLPPython筆記——WordNet

WordNet是一種面向語義的英語詞典,由Princeton大學的心理學家、語言學家和計算機工程師聯合設計。它不是光把單詞以字母順序排列,而且按照單詞的意義組成一個“單詞的網絡”。

NLTK庫中包含了英語WordNet,里面共有155287個詞以及117659個同義詞集合。常用操作如下:

1. 加載wordnet

from nltk.corpus import wordnet as wn

2. 得到同義詞集

wn.synsets('motorcar')

3. 同義詞集的詞條

wn.synset('car.n.01').lemmas()

4. 同義詞集的詞條名

wn.synset('car.n.01').lemma_names()

5. 同義詞集的定義

wn.synset('car.n.01').definition()

6. 同義詞集的使用例句

wn.synset('car.n.01').examples()

7. 同義詞集的上位詞

wn.synset('car.n.01').hypernyms()

8. 同義詞集的下位詞

wn.synset('car.n.01').hyponyms()

9. 同義詞集的蘊含關系

wn.synset('walk.v.1').entailments()

10. 同義詞集中詞條的反義詞

wn.lemma('supply.n.02.supply').antonyms()

11. 同義詞集的深度

使用synset對象的min_depth方法來量化對象的普遍性概念,原理上其實在查找對象在層次結構所在的層次。

wn.synset('car.n.01').min_depth()

12. 兩同義詞集的相似度

使用synset對象的path_similarity方法可以測量兩個同義詞集間的路徑長短,值得范圍是0到1。路徑越長,值越小;路徑越短,值越大。兩者之間沒有路徑時返回-1,與自身比較時返回1。

wn.synset('car.n.01').path_similarity(wn.synset('car.n.02'))

?

轉載于:https://www.cnblogs.com/yucen/p/9343548.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/389068.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/389068.shtml
英文地址,請注明出處:http://en.pswp.cn/news/389068.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

crc16的c語言函數 計算ccitt_C語言為何如此重要

●●●如今,有很多學生不懂為何要學習編程語言,為何要學習C語言?原因是大學生不能滿足于只會用辦公軟件,而應當有更高的學習要求,對于理工科的學生尤其如此。計算機的本質是“程序的機器”,程序和指令的思想…

毫米波雷達與激光雷達的初探

毫米波雷達與激光雷達的初探 雷達 (Radio Detection and Range, Radar)是一種利用電磁波來對目標進行探測和定位的電子設備。實現距離測量、運動參數測量、搜索和發現目標、目標定位、目標特性參數分析等功能。 分類 電磁波按照從低頻到高頻的順序&…

aws spark_使用Spark構建AWS數據湖時的一些問題以及如何處理這些問題

aws spark技術提示 (TECHNICAL TIPS) 介紹 (Introduction) At first, it seemed to be quite easy to write down and run a Spark application. If you are experienced with data frame manipulation using pandas, numpy and other packages in Python, and/or the SQL lang…

沖刺第三天 11.27 TUE

任務執行情況 已解決問題 數據庫結構已經確定 對聯生成model已訓練完成 詞匹配部分完成 微信前端rush版本完成 總體情況 團隊成員今日已完成任務剩余任務困難Dacheng, Weijieazure數據庫搭建(完成)multiple communication scripts, call APIs需要進行整合調試Yichon…

鎖是網絡數據庫中的一個非常重要的概念

鎖是網絡數據庫中的一個非常重要的概念,它主要用于多用戶環境下保證數據庫完整性和一致性。各種大型數據庫所采用的鎖的基本理論是一致的,但在具體 實現上各有差別。目前,大多數數據庫管理系統都或多或少具有自我調節、自我管理的功能&#x…

DPDK+Pktgen 高速發包測試

參考博客 Pktgen概述 Pktgen,(Packet Gen-erator)是一個基于DPDK的軟件框架,發包速率可達線速。提供運行時管理,端口實時測量。可以控制 UDP, TCP, ARP, ICMP, GRE, MPLS and Queue-in-Queue等包。可以通過TCP進行遠程控制。Pktgen官網 安裝使用過程 版本…

python 商城api編寫_Python實現簡單的API接口

1. get方法import jsonfrom urlparse import parse_qsfrom wsgiref.simple_server import make_server# 定義函數,參數是函數的兩個參數,都是python本身定義的,默認就行了。def application(environ, start_response):# 定義文件請求的類型和…

opencv (一) 學習通過OpenCV圖形界面及基礎

opencv 學習通過OpenCV圖形界面基礎 用的函數有 cv.line(), cv.circle(),cv.rectangle(), cv.ellipse(),cv.putText() 常用參數 img : 想要繪制圖形的圖片color: 圖形的顏色, BGRthickness:厚度lineType: 線的類型, 8-connected、anti-al…

python精進之路 -- open函數

下面是python中builtins文件里對open函數的定義,我將英文按照我的理解翻譯成中文,方便以后查看。 def open(file, moder, bufferingNone, encodingNone, errorsNone, newlineNone, closefdTrue): # known special case of open """  …

數據科學家編程能力需要多好_我們不需要這么多的數據科學家

數據科學家編程能力需要多好I have held the title of data scientist in two industries. I’ve interviewed for more than 30 additional data science positions. I’ve been the CTO of a data-centric startup. I’ve done many hours of data science consulting.我曾擔…

基于xtrabackup GDIT方式不鎖庫作主從同步(主主同步同理,反向及可)

1.安裝數據同步工具 注:xtrabackup 在數據恢復的時候比mysqldump要快很多,特別是大數據庫的時候,但網絡傳輸的內容要多,壓縮需要占用時間。 yum install https://www.percona.com/downloads/XtraBackup/Percona-XtraBackup-2.4.12…

excel表格行列顯示十字定位_WPS表格:Excel表格打印時,如何每頁都顯示標題行?...

電子表格數據很多的時候,要分很多頁打印,如何每頁都能顯示標題行呢?以下表為例,我們在WPS2019中演示如何每頁都顯示前兩行標題行?1.首先點亮頂部的頁面布局選項卡。然后點擊打印標題或表頭按鈕。2.在彈出的頁面設置對話…

opencv(二) 圖片處理

opencv 圖片處理 opencv 圖片像素操作 取像素點操作設置像素點取圖片塊分離,合并 b, g, r import numpy as np import cv2 as cvimg cv.imread(/Users/guoyinhuang/Desktop/G77.jpeg)# 獲取像素值 px img[348, 120] # 0 是y, 1 是x print(px)blue img[100, 1…

【NLP】語言模型和遷移學習

10.13 Update:最近新出了一個state-of-the-art預訓練模型,傳送門:李入魔:【NLP】Google BERT詳解?zhuanlan.zhihu.com1. 簡介長期以來,詞向量一直是NLP任務中的主要表征技術。隨著2017年底以及2018年初的一系列技術突…

TCPIP傳送協議

以下代碼實現在客戶端查詢成績(數據庫在服務器端): 客戶端: static void Main(string[] args) { string str null; while (str ! Convert.ToString(0)) { Console.WriteLine("…

sql優化技巧_使用這些查詢優化技巧成為SQL向導

sql優化技巧成為SQL向導! (Become an SQL Wizard!) It turns out storing data by rows and columns is convenient in a lot of situations, so relational databases have remained a cornerstone of data management in businesses across the globe. Structured…

Day 4:集合——迭代器與List接口

Collection-迭代方法 1、toArray() 返回Object類型數據,接收也需要Object對象! Object[] toArray(); Collection c new ArrayList(); Object[] arr c.toArray(); 2、iterator() Collection的方法,返回實現Iterator接口的對象,…

oem是代工還是貼牌_代加工和貼牌加工的區別是什么

展開全部代加工就是替別人加工,貼別人的牌子。貼牌加工即商家自己不生產,而是委托其他生產企e68a8462616964757a686964616f31333365663431業生產,而品牌是自己的。拓展資料:OEM(Original Equipment Manufacture)的基本含義是定牌生…

KNN 算法--圖像分類算法

KNN 算法–圖像分類算法 找到最近的K個鄰居,在前k個最近樣本中選擇最近的占比最高的類別作為預測類別。 給定測試對象,計算它與訓練集中每個對象的距離。圈定距離最近的k個訓練對象,作為測試對象的鄰居。根據這k個緊鄰對象所屬的類別&#xf…

java核心技術-NIO

1、reactor(反應器)模式 使用單線程模擬多線程,提高資源利用率和程序的效率,增加系統吞吐量。下面例子比較形象的說明了什么是反應器模式: 一個老板經營一個飯店, 傳統模式 - 來一個客人安排一個服務員招呼…