iPHoP:病毒宿主預測-CSDN博客
之前介紹了這個方法來預測病毒宿主,今天來介紹另一種比較用的多的方法CRISPR比對
CRISPR spacers數據庫
Dash?在這可以下載作者搜集的spacers用于后期比對
CRT和PILER-CR
?使用 CRT 和 PILERCR 識別 CRISPR 間隔區,合并冗余 CRISPR 陣列,并格式化輸出
用的是別人寫好的代碼(好用就行,這兩軟件太老了,別人幫忙下好,配置好了)
Metagenomic compendium of 189,680 DNA viruses from the human gut microbiome | Nature Microbiology
?MGV/crispr_spacers at master · snayfach/MGV · GitHub
#運行
software="/home/zhongpei/hard_disk_sda2/zhongpei/Software/MGV/crispr_spacers"
out_dir="/home/zhongpei/hard_disk_sda2/zhongpei/database/SPACER_rumen_MAGs"
gunzip -k *
dir_name=$(basename $(pwd))
mkdir ${out_dir}/${dir_name}
for i in *.fa
donum=${i%%.fa}dir=$(pwd)cd ${software}identify_crispr.py -i ${dir}/${num}.fa -o ${out_dir}/${dir_name}/${num}_spacermerge_crispr.py ${out_dir}/${dir_name}/${num}_spacer/crt ${out_dir}/${dir_name}/${num}_spacer/pilercr ${out_dir}/${dir_name}/${num}_spacer/mergedcd ${dir}
done
rm *.fa
spacers比對
我們現在有了兩組spacers,一組是NAR文章整理的,一組是宿主MAG提取的。
使用Blastn進行比對(viral contigs和spacers)
參考文獻的Viral host prediction部分:A metagenomic catalog of the early-life human gut virome | Nature Communications
blastn -query ${fa}/fetal_5.0_95.fa -db ${database} -evalue 0.0000001 -gapopen 10 -gapextend 2 -reward 1 -penalty -1 -word_size 5 -perc_identity 100 -max_target_seqs 10000 -out ${out}/fetal_vOTU_spacerDB.txt -outfmt 6 -num_threads 150