NLPPython筆記——WordNet

NLPPython筆記——WordNet

news/2025/9/18 1:13:00/文章來源:https://blog.csdn.net/weixin_30312659/article/details/96365409

WordNet是一種面向語義的英語詞典，由Princeton大學的心理學家、語言學家和計算機工程師聯合設計。它不是光把單詞以字母順序排列，而且按照單詞的意義組成一個“單詞的網絡”。

NLTK庫中包含了英語WordNet，里面共有155287個詞以及117659個同義詞集合。常用操作如下：

1. 加載wordnet

from nltk.corpus import wordnet as wn

2. 得到同義詞集

wn.synsets('motorcar')

3. 同義詞集的詞條

wn.synset('car.n.01').lemmas()

4. 同義詞集的詞條名

wn.synset('car.n.01').lemma_names()

5. 同義詞集的定義

wn.synset('car.n.01').definition()

6. 同義詞集的使用例句

wn.synset('car.n.01').examples()

7. 同義詞集的上位詞

wn.synset('car.n.01').hypernyms()

8. 同義詞集的下位詞

wn.synset('car.n.01').hyponyms()

9. 同義詞集的蘊含關系

wn.synset('walk.v.1').entailments()

10. 同義詞集中詞條的反義詞

wn.lemma('supply.n.02.supply').antonyms()

11. 同義詞集的深度

使用synset對象的min_depth方法來量化對象的普遍性概念，原理上其實在查找對象在層次結構所在的層次。

wn.synset('car.n.01').min_depth()

12. 兩同義詞集的相似度

使用synset對象的path_similarity方法可以測量兩個同義詞集間的路徑長短，值得范圍是0到1。路徑越長，值越小；路徑越短，值越大。兩者之間沒有路徑時返回-1，與自身比較時返回1。

wn.synset('car.n.01').path_similarity(wn.synset('car.n.02'))

?

轉載于:https://www.cnblogs.com/yucen/p/9343548.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/389068.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/389068.shtml
英文地址，請注明出處：http://en.pswp.cn/news/389068.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

crc16的c語言函數計算ccitt_C語言為何如此重要

crc16的c語言函數計算ccitt_C語言為何如此重要

●●●如今，有很多學生不懂為何要學習編程語言，為何要學習C語言？原因是大學生不能滿足于只會用辦公軟件，而應當有更高的學習要求，對于理工科的學生尤其如此。計算機的本質是“程序的機器”，程序和指令的思想…

閱讀更多...

毫米波雷達與激光雷達的初探

毫米波雷達與激光雷達的初探

毫米波雷達與激光雷達的初探雷達 （Radio Detection and Range, Radar）是一種利用電磁波來對目標進行探測和定位的電子設備。實現距離測量、運動參數測量、搜索和發現目標、目標定位、目標特性參數分析等功能。分類電磁波按照從低頻到高頻的順序&…

閱讀更多...

aws spark_使用Spark構建AWS數據湖時的一些問題以及如何處理這些問題

aws spark_使用Spark構建AWS數據湖時的一些問題以及如何處理這些問題

aws spark技術提示 (TECHNICAL TIPS) 介紹 (Introduction) At first, it seemed to be quite easy to write down and run a Spark application. If you are experienced with data frame manipulation using pandas, numpy and other packages in Python, and/or the SQL lang…

閱讀更多...

沖刺第三天 11.27 TUE

沖刺第三天 11.27 TUE

任務執行情況已解決問題數據庫結構已經確定對聯生成model已訓練完成詞匹配部分完成微信前端rush版本完成總體情況團隊成員今日已完成任務剩余任務困難Dacheng, Weijieazure數據庫搭建(完成）multiple communication scripts, call APIs需要進行整合調試Yichon…

閱讀更多...

鎖是網絡數據庫中的一個非常重要的概念

鎖是網絡數據庫中的一個非常重要的概念

鎖是網絡數據庫中的一個非常重要的概念，它主要用于多用戶環境下保證數據庫完整性和一致性。各種大型數據庫所采用的鎖的基本理論是一致的，但在具體實現上各有差別。目前，大多數數據庫管理系統都或多或少具有自我調節、自我管理的功能&#x…

閱讀更多...

DPDK+Pktgen 高速發包測試

DPDK+Pktgen 高速發包測試

參考博客 Pktgen概述 Pktgen,(Packet Gen-erator)是一個基于DPDK的軟件框架，發包速率可達線速。提供運行時管理，端口實時測量。可以控制 UDP, TCP, ARP, ICMP, GRE, MPLS and Queue-in-Queue等包。可以通過TCP進行遠程控制。Pktgen官網安裝使用過程版本…

閱讀更多...

python 商城api編寫_Python實現簡單的API接口

python 商城api編寫_Python實現簡單的API接口

1. get方法import jsonfrom urlparse import parse_qsfrom wsgiref.simple_server import make_server# 定義函數，參數是函數的兩個參數，都是python本身定義的，默認就行了。def application(environ, start_response):# 定義文件請求的類型和…

閱讀更多...

opencv (一) 學習通過OpenCV圖形界面及基礎

opencv (一) 學習通過OpenCV圖形界面及基礎

opencv 學習通過OpenCV圖形界面基礎用的函數有 cv.line(), cv.circle(),cv.rectangle(), cv.ellipse(),cv.putText() 常用參數 img : 想要繪制圖形的圖片color: 圖形的顏色， BGRthickness：厚度lineType: 線的類型， 8-connected、anti-al…

閱讀更多...

python精進之路 -- open函數

python精進之路 -- open函數

下面是python中builtins文件里對open函數的定義，我將英文按照我的理解翻譯成中文，方便以后查看。 def open(file, moder, bufferingNone, encodingNone, errorsNone, newlineNone, closefdTrue): # known special case of open """　　…

閱讀更多...

數據科學家編程能力需要多好_我們不需要這么多的數據科學家

數據科學家編程能力需要多好_我們不需要這么多的數據科學家

數據科學家編程能力需要多好I have held the title of data scientist in two industries. I’ve interviewed for more than 30 additional data science positions. I’ve been the CTO of a data-centric startup. I’ve done many hours of data science consulting.我曾擔…

閱讀更多...

基于xtrabackup GDIT方式不鎖庫作主從同步（主主同步同理，反向及可）

基于xtrabackup GDIT方式不鎖庫作主從同步（主主同步同理，反向及可）

1.安裝數據同步工具注：xtrabackup 在數據恢復的時候比mysqldump要快很多，特別是大數據庫的時候，但網絡傳輸的內容要多，壓縮需要占用時間。 yum install https://www.percona.com/downloads/XtraBackup/Percona-XtraBackup-2.4.12…

閱讀更多...

excel表格行列顯示十字定位_WPS表格：Excel表格打印時，如何每頁都顯示標題行？...

excel表格行列顯示十字定位_WPS表格：Excel表格打印時，如何每頁都顯示標題行？...

電子表格數據很多的時候，要分很多頁打印，如何每頁都能顯示標題行呢？以下表為例，我們在WPS2019中演示如何每頁都顯示前兩行標題行？1.首先點亮頂部的頁面布局選項卡。然后點擊打印標題或表頭按鈕。2.在彈出的頁面設置對話…

閱讀更多...

opencv(二) 圖片處理

opencv(二) 圖片處理

opencv 圖片處理 opencv 圖片像素操作取像素點操作設置像素點取圖片塊分離，合并 b, g, r import numpy as np import cv2 as cvimg cv.imread(/Users/guoyinhuang/Desktop/G77.jpeg)# 獲取像素值 px img[348, 120] # 0 是y, 1 是x print(px)blue img[100, 1…

閱讀更多...

【NLP】語言模型和遷移學習

【NLP】語言模型和遷移學習

10.13 Update：最近新出了一個state-of-the-art預訓練模型，傳送門：李入魔：【NLP】Google BERT詳解?zhuanlan.zhihu.com1. 簡介長期以來，詞向量一直是NLP任務中的主要表征技術。隨著2017年底以及2018年初的一系列技術突…

閱讀更多...

TCPIP傳送協議

TCPIP傳送協議

以下代碼實現在客戶端查詢成績（數據庫在服務器端）: 客戶端： static void Main(string[] args) { string str null; while (str ! Convert.ToString(0)) { Console.WriteLine("…

閱讀更多...

sql優化技巧_使用這些查詢優化技巧成為SQL向導

sql優化技巧_使用這些查詢優化技巧成為SQL向導

sql優化技巧成為SQL向導！ (Become an SQL Wizard!) It turns out storing data by rows and columns is convenient in a lot of situations, so relational databases have remained a cornerstone of data management in businesses across the globe. Structured…

閱讀更多...

Day 4：集合——迭代器與List接口

Day 4：集合——迭代器與List接口

Collection-迭代方法 1、toArray() 返回Object類型數據，接收也需要Object對象！ Object[] toArray(); Collection c new ArrayList(); Object[] arr c.toArray(); 2、iterator() Collection的方法，返回實現Iterator接口的對象，…

閱讀更多...

oem是代工還是貼牌_代加工和貼牌加工的區別是什么

oem是代工還是貼牌_代加工和貼牌加工的區別是什么

展開全部代加工就是替別人加工，貼別人的牌子。貼牌加工即商家自己不生產，而是委托其他生產企e68a8462616964757a686964616f31333365663431業生產，而品牌是自己的。拓展資料：OEM(Original Equipment Manufacture)的基本含義是定牌生…

閱讀更多...

KNN 算法--圖像分類算法

KNN 算法--圖像分類算法

KNN 算法–圖像分類算法找到最近的K個鄰居，在前k個最近樣本中選擇最近的占比最高的類別作為預測類別。給定測試對象，計算它與訓練集中每個對象的距離。圈定距離最近的k個訓練對象，作為測試對象的鄰居。根據這k個緊鄰對象所屬的類別&#xf…

閱讀更多...

java核心技術-NIO

java核心技術-NIO

1、reactor（反應器）模式使用單線程模擬多線程，提高資源利用率和程序的效率，增加系統吞吐量。下面例子比較形象的說明了什么是反應器模式： 一個老板經營一個飯店， 傳統模式 - 來一個客人安排一個服務員招呼…

閱讀更多...

最新文章