線粒體和葉綠體的基因組特點_如何組裝植物葉綠體基因組

d3d3d2f3aa86c30564a057a3198c99b0.png

可能出現的問題:

*個人電腦上遇到不能collect memery的情況,是電腦內存較少,建議分成用2G左右的數據進行組裝。

* Seed.fasta #用于起始組裝的種子序列,NOVOPlasty安裝軟件目錄下有這個文件,就叫這個名字,作者親測還是這個種子序列最好用。

----------------------------------------------------------------

葉綠體是絕大多數陸生植物都有的細胞器,讓人驚奇的是,植物葉綠體和線粒體一樣,都有著自己一套遺傳物質。本文介紹如何用高通量測序數據利用兩款常用的葉綠體基因組組裝軟件(NOVOPlasty和Get Organelle)來組裝完整的葉綠體基因組。

兩個軟件都是命令工行

1.軟件安裝

NOVOPlasty

1.1系統和語言安裝

NOVOPlasty是由perl語言寫的,先讓自己的電腦安裝perl語言的編譯器,

https://www.perl.org/

建議使用Linux系統,電腦已經是linux 系統或者macos的就不用管了,windows系統可以下載subsystem for windows具體的操作就不再這里描述了,可以參考下面兩個連接里面的內容。確保你的電腦是有大于等于8G的運行內存。

WSL(Windows Subsystem for Linux)的安裝與使用?www.cnblogs.com
40c673740d01c2a0e6d79d702acb8497.png

安裝好了運行Ubuntu 18的系統

1.2 NOVOPLasty 安裝

在命令行輸入

git clone ndierckx/NOVOPlasty

下載

ndierckx/NOVOPlasty?github.com
e4d15323f68e02d79f4c6162dc5190e2.png

上面的連接是NOVOPlasty在github的連接,有問題可以參考

1.3 運行NOVOPlasty

運行NOVOPlasty非常簡單

perl +NOVOPLasty的安裝路徑/NOVOPlasty.pl -c config.txt

就可以了,重點在于NOVOPlasy的配置文件也就是cofig.txt的設置

Project:
-----------------------
Project name = #你的項目名稱
Type = mito #組裝類型葉綠體chloro 或者是線粒體mito
Genome Range = 12000-22000 #基因組的預估大小,基本上在16K左右吧,找個近緣物種看看大小
K-mer = 33 #用于組裝的k-mer 的大小,并不是越大越好,一般不建議更改
Max memory = #最大運行內存
Extended log = 0
Save assembled reads = no
Seed Input = Seed.fasta #用于起始組裝的種子序列,NOVOPlasty安裝軟件目錄下有這個文件,作者親測還是這個種子序列最好用,注意寫絕對路徑。
Extend seed directly = no
Reference sequence = /path/to/reference_file/reference.fasta (optional)#選填,參考的近緣物種參考序列
Variance detection = no
Heteroplasmy = #檢測異質性的參數,不填
HP exclude list =
Chloroplast sequence = /path/to/chloroplast_file/chloroplast.fasta (only for "mito_plant" option) #組裝植物線粒體的時候填,提供本物種的葉綠體序列
Dataset 1:
-----------------------
Read Length = 151#高通量reads讀長
Insert size = 300 #插入片段大小,測序建庫的時候有
Platform = illumina #目前只支持illumina等大公司,BGI不支持注意
Single/Paired = PE #雙端測序還是單端測序
Combined reads =
Forward reads = /path/to/reads/reads_1.fastq #前reads的文件路徑
Reverse reads = /path/to/reads/reads_2.fastq #后reads 的文件路徑
Optional:
-----------------------
Insert size auto = yes
Use Quality Scores = no

直接更改config.txt文件內容就可以了。

1.4 結果解讀

組裝質量最好會出現一個circular assembly 的文件,不過一般情況下會有兩個option,這兩個文件都是正確的,是葉綠體的兩個反向重復區域的基因順序不確定造成的。這個時候想確定哪一個正確的時候,就要做基因注釋或者PCR驗證。

還有的時候文件會出現*的堿基,這個時候也是軟件不能處理一些ambiguous的區域,需要人為將兩端的序列比對一下,去掉*號,我組裝的結果都沒有出現這樣的情況,但是對于結果也檢查一下有無這種情況出現。

組裝質量差的情況下,會出下多個option組裝結果,或者僅有多個contigs,這個時候比較麻煩了,就要選擇reference genome重新組裝或者更換其他的軟件,getorganelle也是用于組裝葉綠體的軟件,據這個軟件作者來說,相較于NOVOPlasty有更高的準確性,NOVOplasty速度快,使用簡單,能夠滿足大多數的需求。有時間再把getorganelle軟件的用法寫一寫。

后期檢查組裝結果的話建議對基因組進行注釋,軟件推薦Geseq基因注釋 rna注釋,可視化真的是一鍵到位,操作也是非常傻瓜,有需要的話給大家介紹。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/534651.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/534651.shtml
英文地址,請注明出處:http://en.pswp.cn/news/534651.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

f3arra1n3.4.1版本_Sysmon v11.1新版本功能測試報告

一、概述根據微軟文檔的介紹,Sysmon v11新增了監控文件刪除的功能,并支持對刪除的文件進行存儲備份,極大提高了主機威脅檢測的能力。同時增加禁用反向DNS查詢的功能,可以有效降低噪音數據。Sysmon從v10.0到目前的v11.1共經歷了5個…

maya導出fbx沒動畫_Maya學習方法總結

關注我,一起來了解建模吧!今天小編就來總結一下Maya學習過程中遇到的困難和解決方法,我相信有一些應該也是普遍性問題,注意:小編說的版本是Maya2018。(1)一次性刪除所有幀的方法import的文件如果…

dev 中 gridcontrol1 滾動條重繪_瀏覽器的重繪和回流(Repaint amp; Reflow)

參考文獻:https://developers.google.com/web/fundamentals/performance/critical-rendering-path/render-tree-construction?hlzh-cn?developers.google.com你真的了解回流和重繪嗎 Issue #4 chenjigeng/blog?github.com前言:重繪:由于…

礦井通風計算c語言_礦井通風機主要參數的含義

礦井通風機的作用就是把地面新鮮空氣送到井下,供工人呼吸,同時把有害氣體從井下排出,使有害氣體的濃度降到對人體無害的程度,在現代化煤礦中稱通風機為“礦井的肺臟”,可見其重要性。風機的參數是風機選型的唯一依據&a…

行健設計_行健要聞|“第四屆‘天行健創新創業設計大賽”培訓班成功舉辦

10月9日下午,由院團委主辦、商學部承辦第四屆“天行健”創新創業設計大賽動員大會暨首場培訓講座在教學樓4-103室成功啟動。院團委副書記唐典巧參加動員會,并頒發了第九屆“挑戰杯”廣西大學生課外學術科技作品競賽榮譽證書,動員會由商學部輔…

sql同時操作兩列_怎么在兩列同時篩選數據庫

{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里云數據庫專家保駕護航,為用戶…

ip地址轉換pta題目_PTA「實驗2-3-5 輸出華氏-攝氏溫度轉換表」

PTA是浙江大學設計類實驗輔助教學平臺。題目描述輸入2個正整數lower和upper(lower≤upper≤100),請輸出一張取值范圍為[lower,upper]、且每次增加2華氏度的華氏-攝氏溫度轉換表。溫度轉換的計算公式:C5(F?32)/9&#…

語言爬蟲字段為空_我為什么建議前端將Python 作為第二語言?

前言本文的文字及圖片來源于網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理。作者: 前端勸退師PS:如有需要Python學習資料的小伙伴可以加點擊下方鏈接自行獲取http://note.youdao.com/noteshare?id3054c…

5 獲取當前訪問的控制名稱_LabVIEW編程技巧:網絡通信中如何獲取計算機名稱、IP地址等信息...

問題引出在網絡通訊編程中,經常需要獲取當前主機的名稱、IP地址等信息,在LabVIEW中如何獲取這些信息呢?下面以本機為例進行說明,先看一下本機的信息。在Windows系統中打開控制臺程序,輸入“ipconfig /all”指令&#x…

ios 通過kvc修改屬性會觸發kvo_iOS開發-KVC和KVO的理解

KVC和KVO看起來很專業,其實用起來還是比較簡單的,KVC(Key-value coding)可以理解為鍵值對編碼,如果對象的基本類型,那么鍵值對編碼實際上和get,set方法沒有區別,如果是屬性是另外一個對象,那么發現KVC用起來…

python stdin和stdout_stdin似乎比stdout(python)慢得多.為什么?

我有兩個需要相互通信的python程序(一個是子進程).目前我通過stdin和stdout這樣做.然而,寫入子進程的標準似乎很慢.a.py,一個采用任意行輸入并打印時間的程序:from time import time, sleepfrom sys import stdout, stdinwhile True:stdin.readline()stdout.write(%…

postman生成python代碼_別再用手敲了,這個工具可以自動生成python爬蟲代碼

我們在寫爬蟲代碼時,常常需要各種分析調試,而且每次直接用代碼調試都很麻煩所以今天給大家分享一個工具,不僅能方便模擬發送各種http請求,還能輕松調試,最重要的是,可以將調試最終結果自動轉換成爬蟲代碼&a…

電工結業試卷_電工技術基礎結業考試試卷

電工技術基礎結業考試試卷適用年級2016級秋6班電子、計算機專業班級 姓名 學號一、 判斷題(每題2分,共30分)1、 電位越高則電壓越大。2、萬用表的電壓、電路及電阻檔的刻度都是均勻的。3、 在任何情況下,電壓源和電流源之間總是可以等效變換的。 4、 電容…

表格里面怎么打多個√_Excel怎樣在表格里打√?

我們做表的時候有時會遇到輸入對或錯的情況。Excel表格里面輸入√和,普通的方法是直接插入特殊符號來進行對勾的輸入。這樣輸入起來1個2個還可以接受,但是如果頻繁輸入,那我們得想想簡單方法。比如我們直接在excel單元格里面輸入1顯示√&…

@value 默認值為null_JAVA8之妙用Optional解決判斷Null為空的問題

引言在文章的開頭,先說下NPE問題,NPE問題就是,我們在開發中經常碰到的NullPointerException.假設我們有兩個類,他們的UML類圖如下圖所示在這種情況下,有如下代碼user.getAddress().getProvince();這種寫法,…

mysql百萬數據根據索引查詢_mysql創建多列索引查詢百萬表數據的性能優化經驗分享...

最近發現最代碼網站中的收到的評論,提到我的,心情被贊的查詢異常緩慢,通過nginx日志發現響應時間快的在5s,慢的有13s,終于忍無可忍花時間來解決了。執行explain之后的截圖如下:可以看到possible_keys中有很…

php用到的mysql語句_PHP中常用到的一些MySQL語句_php

在php開發中,經常會使用到mysql語句,下面就為您列舉了一些經常使用的MySQL語句,希望對您平時的學習和開發工作能起到些許的作用。MySQL語句顯示數據庫或表:show databases;//然后可以use database_name;show tables;MySQL語句更改表名:alter …

mysql執行計劃性能_MySQL SQL性能分析Explain執行計劃

一. 執行計劃返回信息詳解①. 執行計劃所含字段輸出列含義id查詢標識select_type查詢類型table查詢涉及的表partitions匹配到的分區信息type連接類型possible_keys可能選擇的索引key實際使用的索引key_len實際使用的索引的長度ref和索引進行比較的列rows需要被檢索的大致行數fi…

mysql定時作業_mysql 讓一個存儲過程定時作業的代碼(轉)

1、在mysql 中建立一個數據庫 test1語句:create database test12、創建表examinfocreate table examinfo(id int auto_increment not null,endtime datetime,primary key(id));3 插入數據:insert into examinfo values(‘1‘,‘2011-4-23 23:26:50‘);4 …

table虛線邊框_web前端工程師7天0基礎到精通(TABLE+CSS制作《互聯世紀網》)

項目七 項目實踐:TABLECSS制作《互聯世紀網》實踐目標1、 熟悉CSS屬性2、 熟練運用CSS屬性控制網頁樣式3、 熟悉網頁制作流程項目簡介:通過上一章節的學習,我們了解了CSS樣式能更加方便、有效地控制網頁結構和布局網頁元素,大大提…