計算機基礎知識的文獻,四?計算機文獻檢索基礎知識(原理、結構和功能)

a4c26d1e5885305701be709a3d33442f.png

1.計算機檢索原理

計算機一方面接受用戶的檢索提問,一方面從數據庫中讀取文獻記錄,然后把兩者進行比較,即檢索提問標識與文獻記錄標識進行匹配運算,如果比較的結果一致,那么這篇文獻就會作為命中文獻在檢索結果中顯示,否則就是未命中文獻。

a4c26d1e5885305701be709a3d33442f.png

2.文獻數據庫的結構

(1)文獻數據庫(Database):作為以某種方式將眾多的文獻信息存貯在計算機存貯設備上(如磁盤、光盤等)的數據結合,由于往往包含數以萬計的文獻記錄,為便于選擇檢索,常被劃分為若干個文檔。如dialog聯機檢索的MEDLINE數據庫被劃分為若干個回溯文檔(MED66、MED75、MED80、MED85、MED90)和現期文檔 MED93.

(2)文檔(File):是數據庫一部分記錄的集合,是由按一定方式排列的文獻記錄構成。

(3)記錄(Record):是構成文獻數據庫的基本信息單元,每條記錄描述一種(篇)文獻的外表和內容特征,如文獻篇名、作者、主題等。

(4)字段(Field):是構成記錄中的數據項,如文獻的篇名、作者、主題詞等,分別成為篇名字段、作者字段、主題詞字段等。字段可作為一個檢索入口,所以又稱之為可檢字段。

3.計算機檢索功能

3.1布爾邏輯檢索功能

(Booleans)

布爾邏輯組配檢索是現行計算機檢索的基本技術,它利用布爾邏輯組配符表示兩個檢索詞之間的邏輯關系,常用的組配符有:“ AND ”(和)、“ OR ”(或)、“ NOT ”(非)三種,其優先級依次為“ NOT ”、“ AND

”和“ OR

”;改變優先級的方法是使用括號“(

)”,括號內的邏輯式優先執行。為縮短檢索式和醒目起見, Dialog 檢索系統中“ AND ”、“ OR

”、“ NOT

”算符可分別用“ *

”、“+

”、“ – ”代替。

a4c26d1e5885305701be709a3d33442f.png邏輯與: 邏輯與也稱邏輯乘,用關系詞“ and

”或“ * ”表示。

A and B (或 A*B

)表示兩個概念的交叉和限定關系,只有同時含有這兩個概念的記錄才算命中信息,見下圖,陰影部分即為命中信息。使用“邏輯與”組配技術,將會縮小檢索范圍,增強檢索的專指性,能夠提高檢索信息的查準率。

邏輯或: 邏輯或也稱邏輯和,用關系詞“ or

”或“ + ” 表示。

A or B (或 A+B

)表示兩個概念的并列關系,記錄中只要含有任何一個概念就算命中信息,即凡單獨含有概念 A 或單獨含有概念 B 或者同時含有 A 、 B

兩個概念的信息均為命中信息,可用下圖表示,陰影部分為命中信息。使用“邏輯或”組配技術,可擴大檢索范圍,能夠提高檢索信息的查全率。在檢索中,可對與檢索概念有關的同義詞、近義詞、相關詞等用邏輯或來連接,以避免漏檢。

邏輯非:

邏輯非也稱邏輯差,用關系詞“ not

”或“-” 表示。 A not B (或 A - B

)表示兩個概念的排除關系,指記錄中含有概念 A

而不含概念 B

的記錄為命中信息,可用下圖表示,陰影部分為命中信息。使用“邏輯非”組配技術,則剔除了不需要的概念,可提高檢索信息的查準率,但這種方式也會排除掉相關信息,影響檢索信息的查全率。

復合檢索: 使用布爾邏輯組配檢索詞構成的檢索式,邏輯算符 AND 、 OR

、 NOT

的運算次序在不同的檢索系統中有不同的規定,往往在檢索系統的“幫助”菜單中會有說明。布爾算符的優先執行順序一般是:邏輯非、邏輯與、邏輯或,但用括號可以規定或改變其執行順序,如下圖所示,三個概念的信息集合中,陰影部分是邏輯表達式(

A and B )not C

的命中信息。三個邏輯算符和括號的配合使用,可將檢索詞組配成較為復雜的邏輯提問式,以滿足復雜概念信息檢索的需要。

3.2詞位限定檢索功能

(Proximity)

該技術主要是通過檢索式中的專門符號來規定檢索詞在結果中的相對位置。布爾算符檢索時,只對檢索詞進行邏輯組配,未限定檢索詞之間的位置及檢索詞在記錄中的位置關系。在某些情況下,若不限制檢索詞之間的位置關系則會造成誤檢,影響查準率。例如檢索“生物防治”的文獻,若用檢索式“biological*control”檢索,則會將“抑制生物”(control

biological)的文獻也查出來,這顯然不是所需文獻。因此,在大部分檢索系統中設置了位置限定運算符號以確定檢索詞之間的位置關系,常用的相鄰位置算符有(W)、(nW)、(N)、(nN),句子位置算符(S),字段算符(F)、(L)等。但在不同的檢索系統所采用的位置運算符是不一樣的,功能也有差異,使用時應具體對待。   下表為 Dialog 聯機檢索系統供的詞位限定算符及相應功能

算符

用法

表示的檢索含義

W

A(nW)B

A 、B 兩詞相隔 n 個單詞且前后次序不變; n=0 時格式為 A()B 或 A(W)B

N

A(nN)B

A 、B 兩詞相隔 n 個單詞且前后次序不限; n=0 時,格式為 A(N)B

L

A(L)B

A 、B 兩詞在同一主題詞字段中,

A 為主題詞, B 為其副主題詞

S

A(S)B

A 、B

兩詞在同一子字段中,即同一語句或同一短語中,詞序不限

F

A(F)B

A 、B 兩詞在同一字段中,字段不限,詞序不限

3.3截詞檢索功能

(Wildcard)

在英語等西方語言中,常常有詞語單、復數表示形式不同,英美拼寫方式不同,詞根相同、含義相近而詞尾形式不同等情況,為使檢索時不遺漏相關詞,提高檢索效率,一般信息檢索系統都發展了截詞技術,利用截詞符來屏蔽未輸入的字符。截詞符根據檢索系統的不同而不同,常用截詞符有“?”、“ *

”、“ $

”、“!”等,截斷方式也有后截、中截、前截等。

截詞檢索的方式有多種,按截詞位置可分為前截詞、后截詞、前后截詞和中間截詞;按截斷字符數的不同,可分為有限截斷和無限截斷。   前截詞:

也稱左截詞或后方一致。截詞符位于詞干的前邊,允許檢索詞的前端有若干變化形式,如 ?computer 可檢索 computer 、 minicomputer 、 microcomputer 等結果。   后截詞:

也稱右截詞或前方一致。截詞符位于詞干的后邊,允許檢索詞尾部有若干變化。

如computer?可檢索

computer 、 computers 、 computerize 、 computerized 、 computerization 等結果。   前后截詞:

詞干的前后各有一個截詞符,允許檢索詞的前端和尾部各有若干變化形式。如 ?computer?可檢索 computer 、 computers 、 computerize 、 computerized 、 computerization 、 minicomputer 、 minicomputers 、 microcomputer 、 microcomputers 等結果。   中間截詞: 也稱“通用字符檢索法”,截詞符作為通用字符位于檢索詞的中間,而詞的前后方一致,凡前后方一致的詞,都能檢出,通常用在英美對某些詞的不同拼寫法。如:

defen*e 可同時檢出

defence 和 defense 的結果。

截詞檢索技術能提高檢索的查全率。不同數據庫使用的截詞符號也不同,如 DIALOG 系統用“?”,

BRS 系統用“ $”, ORBIT

系統用“ #

”等。網絡信息檢索工具中絕大多數都支持截詞功能,有的是自動截詞,有的是在一定條件下才能截詞。在允許截詞的檢索工具中,一般是指右截詞,部分支持中間截詞,左截詞比校罕見。

3.4短語檢索功能(Phrase)

也稱精確檢索功能,常用“”表示。當把一個短語作為一個整體進行檢索時,在短語的兩端加上雙引號。

如“gene express” 只能檢出

gene

express的結果,而不會檢出express

human gene、gene

constructs to express等結果。

3.5限定字段檢索功能

(Field)

文獻數據庫的每條記錄通常都由多個代表不同信息內容的字段組成,幾乎所有機檢系統中均設置了字段限定檢索的功能,以滿足用戶特定檢索某一字段信息的要求。限定字段檢索即指定檢索詞在記錄中出現的字段,檢索時,計算機只對限定字段進行匹配運算,以提高檢索效率和查準率。不同數據庫和不同種類文獻記錄中所包含的字段數目不盡相同,字段名稱也有區別。在一些網絡數據庫中,字段名稱通常放置在下拉菜單中,用戶可根據需要選擇不同的檢索字段進行檢索。數據庫中常見的字段和代碼見下表。

基本字段

輔助字段

字段名稱

英文全稱

縮寫

字段名稱

英文全稱

縮寫

題目

Title

TI

記錄號

Document Number

DN

文摘

Abstract

AB

作者

Author

AU

敘詞

Descriptor

DE

作者單位

Corporate Source

CS

標題詞

Identifier

ID

期刊名稱

Journal

JN

出版年份

Publishing Year

PY

出版國

Country

CO

文獻類型

Document Type

DT

文獻性質

Treatment Code

TR

語種

Language

LA

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/282708.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/282708.shtml
英文地址,請注明出處:http://en.pswp.cn/news/282708.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

APP地推心得:可復制的APP地推方案

APP地推難?APP地推方案包含哪些?現在,不需要編程就能自己完成手機APP制作,而且還有大量的APP模板,可以直接套用。APP的制作資金技術大幅度降低,現在最大的問題就是怎么APP推廣的問題。 在移動互聯網的時代&…

【代碼筆記】iOS-播放從網絡上下載的語音

代碼&#xff1a; ViewController.m #import "ViewController.h" //錄音 #import <AVFoundation/AVFoundation.h>interface ViewController () {//播放器AVAudioPlayer *player; }endimplementation ViewController- (void)viewDidLoad {[super viewDidLoad];/…

C# 基于.NET6的CM+Fody+HC入門實戰項目(經典)

概述上期我們概述了CMFodyHC&#xff0c;如果之前沒有閱讀&#xff0c;可以先了解下&#xff1a;C# 為什么說CMFodyHC是WPF開發的最強組合&#xff1f;今天基于最新的VS版本、最新的CM框架版本&#xff0c;.NET基于6.0&#xff0c;搭建了一個WPF入門學習項目實例&#xff0c;關…

PHP資源列表(轉)

一個PHP資源列表&#xff0c;內容包括&#xff1a;庫、框架、模板、安全、代碼分析、日志、第三方庫、配置工具、Web 工具、書籍、電子書、經典博文等等。 初始翻譯信息來自&#xff1a;《推薦&#xff01;國外程序員整理的 PHP 資源大全》 該內容也可以在github的相關項目上瀏…

當今 計算機已進入千家萬戶英語,學生英語教學論文,關于信息技術在大學英語教學中的應用探析相關參考文獻資料-免費論文范文...

導讀:這是一篇與學生英語教學論文范文相關的免費優秀學術論文范文資料,為你的論文寫作提供參考。摘 要&#xff1a;隨著經濟全球化和信息化時代的到來,計算機技術已深入到社會的各個領域.以往大學中所使用的傳統面授課教學模式已經跟不上信息時代的發展步伐,不能滿足當今教學的…

POJ - 2187 Beauty Contest(最遠點對)

http://poj.org/problem?id2187 題意 給n個坐標&#xff0c;求最遠點對的距離平方值。 分析 模板題&#xff0c;旋轉卡殼求求兩點間距離平方的最大值。 #include<iostream> #include<cmath> #include<cstring> #include<queue> #include<vector>…

Kong入門學習實踐(2)實驗環境搭建

【API網關】| 總結/Edison Zhou最近在學習Kong網關&#xff0c;因此根據老習慣&#xff0c;我會將我的學習過程記錄下來&#xff0c;一來體系化整理&#xff0c;二來作為筆記供將來翻看。由于我司會直接使用Kong企業版&#xff0c;學習過程中我會使用Kong開源版。本篇&#xff…

Mysql-索引的基礎和類型

一、 索引的基礎 索引類似于書籍的目錄&#xff0c;要想找到一本書的某個特定主題&#xff0c;需要先查找書的目錄&#xff0c;定位對應的頁碼。 存儲引擎使用類似的方式進行數據查詢&#xff0c;先去索引當中找到對應的值&#xff0c;然后根據匹配的索引找到對應的數據行 二…

ligerUI的列頭合并代碼片段

//列頭合并 function onAfterShowData(data){//顯示數據前觸發此事件 console.log(123); var k 0; var tr $(.l-grid-body.l-grid-body1).find(table tr);//找到被凍結的列&#xff08;frozen&#xff09;,利用find方法找到所有的行 $.each($(tr)…

我的未來計算機作文,我的未來作文(精選4篇)

我的未來作文(精選4篇)在平平淡淡的日常中&#xff0c;大家總免不了要接觸或使用作文吧&#xff0c;作文根據體裁的不同可以分為記敘文、說明文、應用文、議論文。怎么寫作文才能避免踩雷呢&#xff1f;以下是小編收集整理的我的未來作文&#xff0c;僅供參考&#xff0c;大家一…

RDS for MySQL Mysqldump常見問題及處理

2019獨角獸企業重金招聘Python工程師標準>>> 摘要&#xff1a; RDS for MySQL Mysqldump 常見問題和處理 GTID 特性相關 避免表級鎖等待 設置導出字符集 其他導出時需要注意的選項 舉例 RDS for MySQL 不支持的選項 RDS for MySQL 邏輯備份 1. GTID 特性相關 MySQ…

AI求解PDE

一、波動方程的PINN解法: Guo Y, Cao X, Liu B, et al. Solving partial differential equations using deep learning and physical constraints[J]. Applied Sciences, 2020, 10(17): 5917. 二、二維的Navier–Stokes方程組的PINN解法 矢量形式的不可壓縮Navier-Stokes方程…

使用CADisplayLink實現UILabel動畫特效

在開發時&#xff0c;我們有時候會遇到需要定時對UIView進行重繪的需求&#xff0c;進而讓view產生不同的動畫效果。 本文項目 效果圖 初探 CADisplayLink 定時對View進行定時重繪可能會第一時間想到使用NSTimer&#xff0c;但是這樣的動畫實現起來是不流暢的&#xff0c;因為在…

《ASP.NET Core 6框架揭秘》實例演示[27]:ASP.NET Core 6 Minimal API的模擬實現

Minimal API僅僅是在基于IHost/IHostBuilder的服務承載系統上作了小小的封裝而已&#xff0c;它利用WebApplication和WebApplicationBuilder這兩個類型提供了更加簡潔的API&#xff0c;同時提供了與現有API的兼容。[本文節選《ASP.NET Core 6框架揭秘》第17章]一、基礎模型二、…

Mysql的關聯查詢語句

一 內連接( inner join&#xff09; 1、多表中同時符合某種條件的數據記錄的集合 (取兩表公共部分) 2、inner join 可以縮寫成 join 例如: select * from A,B WHERE A.idB.id 或者 select * from A inner join B on A.idB.id 內連接分為三類:{ &#xff08;1&#xff0…

高性能Server---Reactor模型

無處不在的C/S架構 在這個充斥著云的時代,我們使用的軟件可以說99%都是C/S架構的&#xff01; 你發郵件用的Outlook,Foxmail等你看視頻用的優酷&#xff0c;土豆等你寫文檔用的Office365,googleDoc&#xff0c;Evernote等你瀏覽網頁用的IE,Chrome等(B/S是特殊的C/S)……C/S架構…

計算機控制系統的試題,計算機控制系統練習題(1)

21. 給出多通道復用一個D/A轉換器的原理示意圖。 答&#xff1a;22. 什么是信號重構&#xff1f;答&#xff1a;把離散信號變為連續信號的過程&#xff0c;稱為信號重構&#xff0c;它是采樣的逆過程。23. 寫出零階保持器的傳遞函數&#xff0c;引入零階保持器對系統開環傳遞函…

springmvc_3(將數據放入map中)

jsp頁面 結果 轉載于:https://www.cnblogs.com/mohehpc/p/6491376.html

怎樣用原生js配合css的transition寫個無縫滾動

之所以想要寫原生js配合css轉換的無縫滾動&#xff0c;是因為之前在簡書上看到一哥們寫的一篇文章&#xff0c;說是在網上找了一堆js配合css transition屬性寫的輪播插件&#xff0c;可惜沒有無縫的效果&#xff0c;結果他用原生js重寫了一個可以無縫滾動的。好吧&#xff0c;我…

聊聊策略模式

1、簡介策略模式就是把各個平等的具體實現進行抽象、封裝成為獨立的算法類&#xff0c;然后通過上下文和具體的算法類來進行交互。各個策略算法都是平等的&#xff0c;地位是一樣的&#xff0c;正是由于各個算法的平等性&#xff0c;所以它們才是可以相互替換的。雖然我們可以動…