MinCED:注釋CRISPRs

GitHub - ctSkennerton/minced: Mining CRISPRs in Environmental Datasets

安裝

git clone http://github.com/ctSkennerton/minced
cd minced
make

使用

gunzip -k *
cat *.fa > all_MAG_contig.fasta
/home/zhongpei/hard_disk_sda2/zhongpei/Software/minced/minced all_MAG_contig.fasta all_MAG_contig.crisprs all_MAG_contig.gff
/home/zhongpei/hard_disk_sda2/zhongpei/Software/my_script/minCED_handel.py --gff3 all_MAG_contig.gff --input_fa all_MAG_contig.fasta --output_fa all_MAG_contig_CRISPR.fasta
#rm all_MAG_contig.fasta
#rm all_MAG_contig.gff
#rm all_MAG_contig.crisprs
rm *.fa

寫了個代碼來處理結果

#! /usr/bin/env python
#########################################################
# take minCED CRISPR result
# written by PeiZhong in IFR of CAASimport argparse
import os
from Bio.SeqRecord import SeqRecord
from Bio import SeqIOparser = argparse.ArgumentParser(description='take minCED CRISPR result')
parser.add_argument('--gff3', help='< minCED gff3 output >')
parser.add_argument('--input_fa', help='< your all MAGs contig >')
parser.add_argument('--output_fa',  help='< output CRISPR fasta >')args = parser.parse_args()
gff3 = args.gff3
input_fa = args.input_fa
output_fa = args.output_faresult_db = {}
with open(gff3, "r") as gff, open(input_fa, "r") as ifa, open(output_fa, "w") as ofa:sequences = SeqIO.to_dict(SeqIO.parse(ifa, "fasta"))for line in gff:if line.startswith("#"):continuefields = line.strip("\n").split("\t")seq_id = fields[0]start = int(fields[3]) - 1end = int(fields[4])zhushi = fields[8]ID = zhushi.split(";")[0]ID = ID.split("=")[1]name = f"{seq_id}+{ID}"subseq = sequences[seq_id].seq[start:end]record = SeqRecord(subseq, id=name, description="")result_db[name] = recordSeqIO.write(result_db.values(), ofa, 'fasta')

?

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/11407.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/11407.shtml
英文地址,請注明出處:http://en.pswp.cn/web/11407.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

NeurIPS‘24 截稿日期逼近 加拿大溫哥華邀你共赴盛會

會議之眼 快訊 第38屆NeurIPS24(Conference and Workshop on Neural Information Processing Systems)即神經信息處理系統研討會將于 2024 年 12月9日-15日在加拿大溫哥華會議中心舉行&#xff01; NeurIPS 每一年都是全球AI領域的一場盛宴&#xff0c;吸引著來自世界各地的頂…

暴雨信息:IT是新質生產力的賦能者

5月11日下午&#xff0c;2024全球徽商上海論壇在上海國際會議中心舉辦。暴雨信息孫輝在會上發表歡迎辭。孫輝在致辭和會后接受采訪時表示&#xff0c;發展新質生產力要以“智”提質&#xff0c;發揮人工智能作為培育新質生產力的引擎作用&#xff0c;通過推廣混合式人工智能&am…

【小白誤闖】Activiti 框架你不得不知道的一些事

Activiti 是一個輕量級的、以Java為中心的開源工作流和業務流程管理&#xff08;BPM&#xff09;平臺。它允許用戶在業務應用程序中定義、執行和監控業務流程。以下是Activiti的核心組件&#xff1a; 8個核心組件概述 Activiti Engine&#xff1a;這是Activiti最核心的部分&am…

Java 面試問題及答案

Java 面試問題及答案 問題 1: 什么是Java虛擬機(JVM)&#xff1f;請簡述其主要組成部分及其作用。 回答&#xff1a; Java虛擬機&#xff08;JVM&#xff09;是一個可以執行Java字節碼的虛擬計算機。它是Java平臺的核心組成部分&#xff0c;使得Java能夠實現其核心特性之一&a…

Elasticsearch映射定義

文章目錄 認識映射元字段數據類型1.基本數據類型2.復雜數據類型專用數據類型多字段類型 認識映射 映射類似于關系型數據庫中的Schema&#xff08;模式&#xff09;。Schema在關系型數據庫中是指庫表包含的字段及字段存儲類型等基礎信息。 映射定義由兩部分組成&#xff1a;元…

一些python包缺失帶來的報錯及解決辦法

描述 一些python包缺失帶來的報錯及解決辦法 安裝 ModuleNotFoundError: No module named cv2 pip install opencv-pythonModuleNotFoundError: No module named torch 我的CSDN博客ModuleNotFoundError: No module named colorama pip install coloramaModuleNotFoundError…

5.10.8 Transformer in Transformer

Transformer iN Transformer (TNT)。具體來說&#xff0c;我們將局部補丁&#xff08;例如&#xff0c;1616&#xff09;視為“視覺句子”&#xff0c;并將它們進一步劃分為更小的補丁&#xff08;例如&#xff0c;44&#xff09;作為“視覺單詞”。每個單詞的注意力將與給定視…

信號和槽基本概念

&#x1f40c;博主主頁&#xff1a;&#x1f40c;?倔強的大蝸牛&#x1f40c;? &#x1f4da;專欄分類&#xff1a;QT??感謝大家點贊&#x1f44d;收藏?評論?? 目錄 一、概述 二、信號的本質 三、槽的本質 一、概述 在 Qt 中&#xff0c;用戶和控件的每次交互過程稱…

Bootloader+升級方案

隨著設備的功能越來越強大&#xff0c;系統也越來越復雜&#xff0c;產品升級也成為了開發過程不可或缺的一道程序。在工程應用中&#xff0c;如何在不更改硬件的前提下通過軟件的方式實現產品升級。通過Bootloader來實現固件的升級是一種極好的方式&#xff0c;Bootloader是單…

I2CKD : INTRA- AND INTER-CLASS KNOWLEDGE DISTILLATION FOR SEMANTIC SEGMENTATION

摘要 本文提出了一種新的針對圖像語義分割的知識蒸餾方法&#xff0c;稱為類內和類間知識蒸餾&#xff08;I2CKD&#xff09;。該方法的重點是在教師&#xff08;繁瑣模型&#xff09;和學生&#xff08;緊湊模型&#xff09;的中間層之間捕獲和傳遞知識。對于知識提取&#x…

12個乒乓球,有一個次品,不知輕重,用一臺無砝碼天平稱三次,找出次品,告知輕重?

前言 B站上看到個視頻&#xff1a;為什么有人不認可清北的學生大多是智商高的? 然后試了下&#xff0c;發現我真菜 自己的思路&#xff08;失敗&#xff09; 三次稱重要獲取到12個乒乓球中那個是次品&#xff0c;我想著將12個小球編號&#xff0c;分為四組&#xff0c;每組…

yo!這里是socket網絡編程相關介紹

目錄 前言 基本概念 源ip&&目的ip 源端口號&&目的端口號 udp&&tcp初識 socket編程 網絡字節序 socket常見接口 socket bind listen accept connect 地址轉換函數 字符串轉in_addr in_addr轉字符串 套接字讀寫函數 recvfrom&&a…

Java入門基礎學習筆記2——JDK的選擇下載安裝

搭建Java的開發環境&#xff1a; Java的產品叫JDK&#xff08;Java Development Kit&#xff1a; Java開發者工具包&#xff09;&#xff0c;必須安裝JDK才能使用Java。 JDK的發展史&#xff1a; LTS&#xff1a;Long-term Support&#xff1a;長期支持版。指的Java會對這些版…

pycharm報錯Process finished with exit code -1073740791 (0xC0000409)

pycharm報錯Process finished with exit code -1073740791 (0xC0000409) 各種垃圾文章&#xff08;包括chatgpt產生的垃圾文章&#xff09;&#xff0c;沒有給出具體的解決辦法。 解決辦法就是把具體報錯信息顯示出來&#xff0c;然后再去查。 勾選 然后再運行就能把錯誤顯示…

MetaRTC-play拉流客戶端代碼分析

渲染使用opengl&#xff0c;音頻播放使用alsa。 當點擊播放按鈕后&#xff0c;以此調用的類如下&#xff0c;開始建立rtc連接&#xff0c;AV解碼&#xff0c;音頻渲染&#xff0c;視頻渲染。 如果想去除QT&#xff0c;改為cmake工程管理&#xff0c;去掉渲染部分即可。 下方是…

VUE+PrintJS打印-邊距設置問題(提供解決方案)

VUE打印我們一般用printJS&#xff0c;雖然它也提供了邊距設置&#xff0c;但不管怎么調&#xff0c;感覺都不對&#xff0c;也換其他組件試過&#xff0c;沒啥區別&#xff0c;并不能解決問題。 今天又發來個需求&#xff0c;要求設置打印頁面的上、下、左、右邊距&#xff0…

Linux---vim編輯器(續寫)

5. vim正常模式命令集 插入模式 按「i」切換進入插入模式「insert mode」&#xff0c; 按“i”進入插入模式后是從光標當前位置開始輸入文件&#xff1b; 按「a」進入插入模式后&#xff0c;是從目前光標所在位置的下一個位置開始輸入文字&#xff1b; 按「o」進入插入模式…

從頭開始學Spring—01Spring介紹和IOC容器思想

目錄 1.Spring介紹 1.1Spring概述 1.2特性 1.3五大功能模塊 2.IOC容器 2.1IOC思想 ①獲取資源的傳統方式 ②反轉控制方式獲取資源 ③DI 2.2IOC容器在Spring中的實現 ①BeanFactory ②ApplicationContext ③ApplicationContext的主要實現類 1.Spring介紹 1.1Sprin…

Linux系統一步一腳印式學習

Linux操作系統具有許多特點和優勢。首先&#xff0c;它是開放源代碼的&#xff0c;也就意味著任何人都可以對源代碼進行查看和修改。其次&#xff0c;可以同時支持多個用戶且可以同時執行多個任務&#xff0c;此外&#xff0c;Linux操作系統也非常穩定和安全。相對于其他操作系…

銀川崗位外包有邦芒 讓崗位空缺不再成為難題

銀川邦芒人力崗位外包服務&#xff0c;專為企業量身定制&#xff0c;涵蓋從崗位人員招聘到勞動關系終止的全方位、無風險外包解決方案。借助我們的崗位外包&#xff0c;企業可以在確保用工穩定的同時&#xff0c;將更多資源聚焦于核心業務的發展與創新。 我們提供全面、高效的外…