dali本地安裝和使用

Dali(Distance-matrix ALIgnment)是一種廣泛使用的蛋白質結構比對工具,主要用于比較蛋白質三維結構之間的相似性。它通過計算蛋白質結構之間的距離矩陣來評估結構之間的相似性,并生成比對結果。

1. 安裝

wget http://ekhidna2.biocenter.helsinki.fi/dali/DaliLite.v5.tar.gz ./
tar -zxvf DaliLite.v5.tar.gzcd /home/you/DaliLite.v5/bin
make clean
make # ignore Warnings

http://ekhidna2.biocenter.helsinki.fi/dali/README.v5.html

2. 準備文件夾,構建Dali數據庫

# 存放dali數據庫數據
mkdir -p dali/dali_query_db dali/dali_target_db
cd dali# 存放原始的pdb文件(或ent文件)
mkdir query_struct target_struct### 拷貝結構文件到相應的目錄
cp ../rag2_structures/* query_struct/
cp ../hits_AF_structure/* target_struct/

3. ?構建名稱映射

Dali要求結構文件的命名滿足pdb數據庫中結構文件的命名規范,如果是AF預測的結構或自己命名的結構,需要轉換。

轉換腳本

vim prepare_ln_for_dali_db.sh

內容:

#!/bin/bash# Usage: ./prepare_pdb_links.sh /path/to/src_dir [prefix]
# Example: ./prepare_pdb_links.sh /home/user/structures rag2# Input: source directory containing .pdb files
SRC_DIR="$1"
PREFIX="$2"if [[ -z "$SRC_DIR" || ! -d "$SRC_DIR" ]]; thenecho "? Please provide a valid source directory containing .pdb files."echo "Usage: $0 /path/to/src_dir [prefix]"exit 1
fi# Use directory name as default prefix if not provided
if [[ -z "$PREFIX" ]]; thenPREFIX=$(basename "$SRC_DIR")
fi# Output files located in the same directory as SRC_DIR
LINK_DIR="$SRC_DIR/${PREFIX}_renamed_pdbs"
LIST_FILE="$SRC_DIR/${PREFIX}_pdb_list.txt"
MAPPING_FILE="$SRC_DIR/${PREFIX}_pdb_id_mapping.tsv"mkdir -p "$LINK_DIR"
> "$LIST_FILE"
> "$MAPPING_FILE"generate_pdb_id() {local chars=( {0..9} {A..Z} )local id=""for ((i = 0; i < 4; i++)); doid="${id}${chars[$(( RANDOM % ${#chars[@]} ))]}"doneecho "$id"
}used_ids=()for pdb_file in "$SRC_DIR"/*.pdb; do[[ -e "$pdb_file" ]] || continue  # Skip if no pdb filesorig_name=$(basename "$pdb_file")while true; donew_id=$(generate_pdb_id)if [[ ! " ${used_ids[@]} " =~ " ${new_id} " ]]; thenused_ids+=("$new_id")breakfidonenew_name="pdb${new_id}.ent"ln -sf "$(realpath "$pdb_file")" "$LINK_DIR/$new_name"echo "$LINK_DIR/$new_name" >> "$LIST_FILE"echo -e "$new_name\t$orig_name" >> "$MAPPING_FILE"
doneecho "Soft links created in: $LINK_DIR"
echo "PDB list: $LIST_FILE"
echo "ID mapping: $MAPPING_FILE"

改變模式

chmod +x prepare_ln_for_dali_db.sh

運行:

./prepare_ln_for_dali_db.sh  query_struct query./prepare_ln_for_dali_db.sh target_struct target

4. 構建Dali數據庫

import.pl --pdblist query_struct/query_pdb_list.txt --dat dali_query_dbimport.pl --pdblist target_struct/target_pdb_list.txt --dat dali_target_db

5. 準備搜索列表

ls dali_query_db |awk -F '.' '{print $1}' > query.lstls dali_target_db |awk -F '.' '{print $1}' > target.lst

注:query.lst 、target.lst 每一行為結構名+鏈名, 如:0MDTA,0MDT:映射的結構名,符合pdb的命令規范(隨機定的,不是pdb的id號),A:表示A鏈

6. 搜索同源結構

dali.pl --query query.lst --db target.lst  --dat1 dali_query_db --dat2 dali_target_db#dali.pl --query query.lst --db target.lst  --dat1 dali_query_db --dat2 dali_target_db --np 64

注:不能并行計算,,如需要并行計算需要在安裝時:

# if using openmpi (check OPENMPI_PATH in Makefile)
make parallel

結果在 query_name.txt 和?query_name.html文件中,如:1SDPA.txt,?1SDPA.html

參考:

https://ekhidna2.biocenter.helsinki.fi/dali/

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/81808.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/81808.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/81808.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Unreal 從入門到精通之SceneCaptureComponent2D實現UI層3D物體360°預覽

文章目錄 前言SceneCaptureComponent2D實現步驟新建渲染目標新建材質UI控件激活3DPreview鼠標拖動旋轉模型最后前言 我們在(電商展示/角色預覽/裝備查看)等應用場景中,經常會看到這種3D展示的頁面。 即使用相機捕獲一個3D的模型的視圖,然后把這個視圖顯示在一個UI畫布上,…

2024CCPC遼寧省賽 個人補題 ABCEGJL

Dashboard - 2024 CCPC Liaoning Provincial Contest - Codeforces 過題難度 B A J C L E G 銅獎 4 953 銀獎 6 991 金獎 8 1664 B&#xff1a; 模擬題 // Code Start Here string s;cin >> s;reverse(all(s));cout << s << endl;A&#xff1a;很…

Java基礎 Day17

一、遞歸 方法直接或者間接調用本身 將大問題, 層層轉化為一個與原問題相似的、規模更小的問題來解決 二、異常 程序在編譯或執行過程中&#xff0c;出現的非正常的情況 (錯誤) 語法錯誤不是異常 1、閱讀異常信息 從下往上看&#xff1a;發生異常的位置、異常名稱、發生異…

hook原理和篡改猴編寫hook腳本

hook原理&#xff1a; hook是常用于js反編譯的技術&#xff1b;翻譯就是鉤子&#xff0c;他的原理就是劫持js的函數然后進行篡改 一段簡單的js代碼 &#xff1a;這個代碼是順序執行的 function test01(){console.log(test01)test02() } function test02(){console.log(02)tes…

使用 Vue 展示 Markdown 文本

使用 Vue 展示 Markdown 文本可以通過以下幾種方法&#xff1a; 方法 1&#xff1a;使用 v-html 指令 可以使用 v-html 指令來渲染 Markdown 文本&#xff1a; <template><div v-html"markdownText"></div> </template> <script>e…

深度解析 Java 中介者模式:重構復雜交互場景的優雅方案

一、中介者模式的核心思想與設計哲學 在軟件開發的歷史長河中&#xff0c;對象間的交互管理一直是架構設計的核心難題。當多個對象形成復雜的網狀交互時&#xff0c;系統會陷入 "牽一發而動全身" 的困境。中介者模式&#xff08;Mediator Pattern&#xff09;作為行…

FreeCAD傻瓜教程-外螺紋的繪制,利用兩個實體進行布爾運算來實現

起因&#xff1a;因為要設計一個波珠螺絲固定器&#xff0c;為了不跑偏&#xff0c;需要在螺柱上加工一個直徑6mm&#xff0c;深度1.2mm的圓弧凹槽所以想用泉州制造的6.8車銑加工。 但是該加工目前不支持軸向的鉆孔&#xff0c;所以想著干脆在兩端加上M8的螺栓&#xff0c;也起…

權限控制相關實現

Spring Boot-Shiro-Vue&#xff1a; 這個項目可以滿足基本的權限控制需求&#xff0c;前后端都有&#xff0c;開箱即用

Node.js路徑處理指南:如何安全獲取當前腳本目錄路徑

本文適用于 Node.js 14.x及以上版本&#xff0c;同時覆蓋 CommonJS 和 ES Modules 模塊系統 文章目錄 一、為什么需要關注路徑問題&#xff1f;二、三種核心方法詳解方法1&#xff1a;經典方案 __dirname (CommonJS)方法2&#xff1a;ES Modules 解決方案方法3&#xff1a;動態…

web基礎

域名概述 2-1 域名的概念&#xff1a;IP 地址不易記憶&#xff0c;域名是互聯網絡上識別和定位計算機的層次結構式的字符標識&#xff0c;與該計算機的互聯網協議 (IP) 地址相對應&#xff0c;用于在數據傳輸時標識計算機的電子方位&#xff0c;方便人們記憶和輸入。 早期使用…

醫療行業數據共享新實踐:如何用QuickAPI打通診療全流程數據壁壘

在醫療行業&#xff0c;數據的高效流轉直接影響診療效率和患者體驗。某三甲醫院在數字化轉型中發現&#xff0c;雖然已積累大量核心業務數據&#xff0c;但各科室系統間的數據互通仍存在明顯瓶頸——檢驗科的報告無法實時同步至門診系統&#xff0c;藥房庫存數據與采購系統脫節…

高級認知型Agent

目標: 構建一個具備自主規劃、多步推理、工具使用、自我反思和環境交互能力的智能代理,使其能夠高效、可靠地完成復雜任務。 核心理念: Agent的智能涌現于一個精密的認知循環: 感知 (Perceive) -> 理解與規劃 (Think/Plan - 想) -> 信息獲取 (Search/Act - 查) -&g…

百度地圖的地鐵圖API所有城市的城市名和citycode的對照關系列表

百度地圖的地鐵圖API所有城市的城市名和citycode的對照關系列表 城市keywordcitycode北京beijing131上海shanghai289廣州guangzhou257深圳shenzhen340重慶chongqing132天津tianjin332石家莊shijiazhuang150南京nanjing315成都chengdu75沈陽shenyang58杭州hangzhou179武漢wuhan2…

SymPy | 獲取表達式自由變量方法與因式分解

SymPy 是 Python 中強大的符號計算庫&#xff0c;廣泛應用于數學建模、公式推導和科學計算。本文將從兩個核心功能展開&#xff1a;表達式中自由變量的獲取與因式分解的實現&#xff0c;通過完整代碼示例和深入分析&#xff0c;幫助讀者掌握其使用方法。 第一部分&#xff1a;獲…

掩膜合并代碼

def ensure_dir(path):"""若目錄不存在則創建"""if not os.path.exists(path): #判斷路徑是否存在os.makedirs(path) #創建路徑def read_and_resize(img_path, size):"""讀取并縮放圖像到指定尺寸&#xff0c;返回 numpy 數組&qu…

藍橋杯5130 健身

問題描述 小藍要去健身&#xff0c;他可以在接下來的 1~n 天中選擇一些日子去健身。 他有 m 個健身計劃&#xff0c;對于第 i 個健身計劃&#xff0c;需要連續的 天&#xff0c;如果成功完成&#xff0c;可以獲得健身增益 si? &#xff0c;如果中斷&#xff0c;得不到任何…

auto關鍵字解析

前言 在11標準之前&#xff0c;auto在c中是聲明存儲器類型的關鍵字。而在11標準中它的功能變為了類型推導。 對此&#xff0c; 在這里引入Cprimer中的原句&#xff1a; 編程時常常需要把表達式的值賦給變量&#xff0c;這就要求在聲明變量的時候清楚的知道表達式的類型。然而…

嵌入式STM32學習——串口USART 2.0(printf重定義及串口發送)

printf重定義&#xff1a; C語言里面的printf函數默認輸出設備是顯示器&#xff0c;如果要實現printf函數輸出正在串口或者LCD顯示屏上&#xff0c;必須要重定義標準庫函數里調用的與輸出設備相關的函數&#xff0c;比如printf輸出到串口&#xff0c;需要將fputc里面的輸出指向…

信號量機制:操作系統中的同步與互斥利器

在計算機操作系統中&#xff0c;信號量機制是一種重要的進程同步與互斥工具。它廣泛應用于多進程或多線程環境中&#xff0c;用于解決并發訪問共享資源時可能出現的競態條件問題。本文將從信號量的基本概念出發&#xff0c;逐步深入探討其工作原理、實現方式以及實際應用&#…

LeetCode 1004. 最大連續1的個數 III

LeetCode 1004題 “最大連續1的個數 III” 是一道關于數組和滑動窗口的問題。題目描述如下&#xff1a; 題目描述 給定一個由若干 0 和 1 組成的數組 nums&#xff0c;以及一個整數 k。你可以將最多 k 個 0 翻轉為 1。返回經過翻轉操作后&#xff0c;數組中連續 1 的最大個數…