UMLS數據申請
這個直接在官網上申請即可,記得把地址填全,基本都會拿到lisence。
UMLS數據訪問
UMLS的數據訪問分為網頁訪問,API訪問以及數據下載后的本地訪問,網頁訪問,API訪問按照官網的指示即可,這里主要講一下本地訪問的注意事項。
UMLS 本地訪問
本地訪問是指可以下載數據文件并在本地數據庫例如mysql里查看及處理。UMLS提供的可下載數據文件主要分為三類,第一類是UMLS Metathesaurus Precomputed Subsets ,只有元數據庫的數據;第二類是Full UMLS Release Files包含了元數據庫,語義網絡以及專業術語;第三類是Metathesaurus History Files主要是歷史的元數據。
UMLS?Metathesaurus Precomputed Subsets數據導入
- step1: 找到安裝文件。在.\umls-2024AB-metathesaurus-full\2024AB\META 路徑下,找到populate_mysql_db.bat(根據數據庫和系統型號選擇合適的安裝文件即可。e.g. 對于mysql,Windows安裝選populate_mysql_db.bat, linux 安裝選populate_mysql_db.sh)
- step2:修改自定義內容。使用windows自帶的Nodepad打開populate_mysql_db.bat,將如下信息配置成自己的個性化信息。
set MYSQL_HOME=<path to MYSQL_HOME> set user=<username> set password=<password> set db_name=<db_name>
- step3:安裝,看log解決其他報錯。
Full UMLS Release Files數據導入
這個比上個部分(metathesaurus precomputed subsets部分的步驟多了一步將mmsys解壓并自定義subset的過程,后續向mysql的導入操作與上個部分一致)
mmsys解壓并自定義subset:UMLS - MetamorphoSys Help
(mysql安裝教程可參考reference2)
可能出現的bug
1. 要注意一下metathesaurus precomputed subsets這個版本的mysql_tables.sql會報MySQL ERROR 1064 (42000)的錯誤,需要修改一下load data的語句。
原始sql:
load data local infile 'MRCONSO.RRF'
into table MRCONSO
fields terminated by '|'
ESCAPED BY ''
lines terminated by @LINE_TERMINATION@
修改建議:
將?@LINE_TERMINATION@
替換為有效字符串
'\n'
(Unix/Linux)'\r\n'
(Windows)
2. 如果提前已經在環境變量中配置好mysql的路徑,則populate_mysql_db.bat需要修改一下。將命令行語句的%MYSQL_HOME%\bin\mysql直接修改為mysql即可。
REFERENCE
UMLS - Load Scripts
Windows 安裝并配置 MySQL 5.6_mysql 5.6 安裝-CSDN博客