1. 下載和安裝 Foldseek
如果只是單個蛋白質結構的序列比對,我們只需要用Foldseek 的網站服務 https://search.foldseek.com/search 上傳我們的蛋白質結構并選擇想要進行比對的數據庫即可,這里不做重點講解。做生物信息學研究,我們難免需要批量對多個目標蛋白進行大規模結構比對,這需要我們下載安裝本地版軟件。Foldseek 有Linux 和 MacOS 二個版本的本地軟件 (這邊墻裂建議還在用 windows 的小伙伴搞個 Linux 或者 mac,這樣做生物信息才更得心應手)。主要的安裝途徑如下:
# Linux AVX2 build (check using: cat /proc/cpuinfo | grep avx2)
wget https://mmseqs.com/foldseek/foldseek-linux avx2.tar.gz;
tar xvzf foldseek-linux-avx2.tar.gz;
export PATH=$(pwd)/foldseek/bin/:$PATH
# Linux SSE2 build (check using: cat /proc/cpuinfo | grep sse2)
wget https://mmseqs.com/foldseek/foldseek-linux-sse2.tar.gz;
tar xvzf foldseek-linux-sse2.tar.gz;
export PATH=$(pwd)/foldseek/bin/:$PATH
# Linux ARM64 build
wget https://mmseqs.com/foldseek/foldseek-linux-arm64.tar.gz;
tar xvzf foldseek-linux-arm64.tar.gz;
export PATH=$(pwd)/foldseek/bin/:$PATH
# MacOS
wget https://mmseqs.com/foldseek/foldseek-osx-universal.tar.gz;
tar xvzf foldseek-osx-universal.tar.gz;
export PATH=$(pwd)/foldseek/bin/:$PATH
# Conda installer (Linux and macOS)
conda?install?-c?conda-forge?-c?bioconda?foldseek
下載完了軟件之后,并不需要特別的安裝,只需要把 ./foldseek/bin 添加到工作路徑就可以直接調用 foldseek.