python 基因序列提取_科學網—簡單的Python腳本提取對應位置基因序列（fasta文件） - 王彬忠的博文...

python 基因序列提取_科學網—簡單的Python腳本提取對應位置基因序列（fasta文件） - 王彬忠的博文...

news/2025/8/5 16:24:57/文章來源:https://blog.csdn.net/weixin_39657249/article/details/113965539

最近，用Python腳本提取，在基因號已知，位置已知條件下，相對應位置的基因序列時發現，這樣很簡單但是很實用的腳本，在網上卻比較難找。而且，能被找到的腳本，相對于具有初級編程能力的人而言，有點難。本人寫了相對于初學者同樣很簡單腳本分享給大家。

首先，我將fa文件處理為單行(嫌麻煩，沒有寫成scaffold_x一行，序列一行的樣子，如圖三)，將下面的序列處理(圖一)：

(補充)經過：

import re

fr=open(r'F:desktopcorrelxxx.fa','r')

fw=open(r'F:desktopcorrelxxx_use.fa','w')

line=fr.read()

r=line.replace('n','')

s=re.sub('>','n>',r)

fw.write(s)

fr.close()

fw.close()

得到(圖二)：

當然你如果不嫌麻煩也可以處理成(圖三)：

假設我含有位置信息源文件(圖四)：

第一列為基因號，最后一列為基因在fa文件中的位置信息；

本人采用圖二的形式，具體腳本(腳本一)；

#author：Wang Binzhong

# -*- coding:utf-8 -*-

fr=open(r'F:desktopCX.txt','r')#讀取含有位置信息的文件

fa=open(r'F:desktopxxxx.fa','r')#讀取處理好的基因序列文件

fw_1=open(r'F:desktopfa_3.txt','w')#寫入

line_cr=fr.readlines()

line_fa=fa.readlines()

for eachline in line_cr:

sp=eachline.strip().split('t')

title_1=eachline.find('scaffold')

start_1=eachline.find(':',title_1)+1

end_1=eachline.find('-',start_1)

d_1=eachline[title_1:start_1-1].strip()#scaffold名稱

d_2=eachline[start_1:end_1].strip()#首位的位置

d_3=eachline[end_1+1:].strip()#末尾的位置

for each_seq in line_fa:

if d_1 == each_seq[:int(len(d_1))+5].strip('ATGC'):#如果對應的名稱在行中，就可以用以下的規則寫入文本

fw_1.write(sp[0]+'t'+each_seq[len(d_1)+int(d_2):len(d_1)+int(d_3)].strip()+'n')#改為：fw_1.write('>'+sp[0]+'n'+each_seq[len(d_1)+int(d_2):len(d_1)+int(d_3)].strip()+'n')可以省略第二步(腳本二)，一步完成

break

fr.close()

fa.close()

fw_1.close()

表頭沒有'>',同時也沒有換行處理，所以需要繼續處理(圖五)：

沒有寫連續的腳本，重新寫了一個(腳本二)：

import re

fr=open(r'F:desktopfa_3.txt','r')

fw=open(r'F:desktopfa_4.fa','w')

line_fr=fr.readlines()

s_1=''

for eachline in line_fr:

s_1=re.sub('t','n',eachline)

fw.write(re.sub('pp','>pp',s_1))

fr.close()

fw.close()

最終得到：

程序比較簡單，Python初學者都可以懂。當然，如果有錯誤的地方可以留言指出，

希望能為需要的同學提供幫助。這個程序只是針對于正鏈的

注：之前寫的出現了一個bug，經過修改后發布成功提取序列，希望對各位有幫助，有用的話可以引用。

鑒于某些人盜版，轉載請注明網址。

轉載本文請聯系原作者獲取授權，同時請注明本文來自王彬忠科學網博客。

鏈接地址：http://blog.sciencenet.cn/blog-783116-801490.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/533368.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/533368.shtml
英文地址，請注明出處：http://en.pswp.cn/news/533368.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

python不能安裝在中文_無法在Python上安裝表

python不能安裝在中文_無法在Python上安裝表

我一直收到錯誤Command "python setup.py egg_info" failed with error code 1 in C:\Users\HP\AppData\Local\Temp\pip-install-sv33cp8y\tables\當嘗試使用^{pr2}$我試過了pip install --upgrade setuptools還有很多其他的東西，但還是不能讓它發揮作用。…

閱讀更多...

python是強定義語言嗎_python是強類型語言嗎

python是強定義語言嗎_python是強類型語言嗎

強弱是對類型而言的。強類型，你有一個值之后這個值是什么類型是確定，比如n1，n的類型是確定的(字符串)，因此你不能在Python做n3 mn1運算。而弱類型就不是這樣的，值的類型可以在需要的時候再去確定，比如PHP里…

閱讀更多...

mysql給字段添加描述_用sql 語句給字段添加描述

mysql給字段添加描述_用sql 語句給字段添加描述

用sql 語句給字段添加描述IF not exists(SELECT * FROM ::fn_listextendedproperty (NULL, user, dbo, table, strTableName, column, strColumnName))BEGINexec sp_addextendedpropertyMS_Description, strColumnDesc , user, dbo, table,strTableName, column, strColumnName…

閱讀更多...

深入java核心_Java核心（五）深入理解BIO、NIO、AIO

深入java核心_Java核心（五）深入理解BIO、NIO、AIO

導讀：本文你將獲取到：同/異步阻/非阻塞的性能區別；BIO、NIO、AIO 的區別；理解和實現 NIO 操作 Socket 時的多路復用；同時掌握 IO 最底層最核心的操作技巧。BIO、NIO、AIO 的區別是什么？同/異步、阻/非阻塞…

閱讀更多...

java反射獲取參數類型_Java反射帶參構造創建對象時如何自動轉換參數類型

java反射獲取參數類型_Java反射帶參構造創建對象時如何自動轉換參數類型

需求是這樣的：有一個類，類的路徑知道，例如是com.xx.xx.xx其中有不同類型的成員變量(個數未知)，有對應的setter和getter方法，有一個無參構造和一個全參構造。現在需要用反射機制...需求是這樣的：有一個類&am…

閱讀更多...

java的樂趣_分享ｊａｖａ帶來的快樂

java的樂趣_分享ｊａｖａ帶來的快樂

2013年9月17日#2011年7月18日#function reportError(sMessage, sUrl, sLine) {var str "";str " 錯誤信息:" sMessage "\n";str " 錯誤地址:" sUrl "\n";str " 錯誤行數:" sLine "\n";str &…

閱讀更多...

java arraylist底層實現原理_ArrayList和LinkedList底層原理

java arraylist底層實現原理_ArrayList和LinkedList底層原理

ArrayList和LinkedList都是List的實現類，是在日常開發中經常被使用到的兩個集合，我們來結合源碼看下兩個集合的不同之處。先來看下ArrayList的源碼：// 默認的初始化大小private static final int DEFAULT_CAPACITY 10;ArrayList的底層數數組…

閱讀更多...

java ee jaas_java-ee – Tomcat-Jaas – 如何檢索主題？

java ee jaas_java-ee – Tomcat-Jaas – 如何檢索主題？

i knew that and it works, but I need to retrieve subject to get also roleprincipal不幸的是,它在Java EE中的工作方式不同. JAAS主題只是一個“主要包”,其中哪些代表用戶/調用者主體和/或角色主體根本不是標準化的.每個其他容器在這里做不同的事情. Javadoc for Tomcat’…

閱讀更多...

java jive歌詞_Java Jive_Manhattan Transfer with Phil Collins_高音質在線試聽_Java Jive歌詞|歌曲下載_酷狗音樂...

java jive歌詞_Java Jive_Manhattan Transfer with Phil Collins_高音質在線試聽_Java Jive歌詞|歌曲下載_酷狗音樂...

Manhattan Transfer with Phil Collins - Java Jive[id:$00000000][ar:曼哈頓行者爵士][ti:Java Jive (LP Version)][by:][hash:99bf26cac4ad13e15925a56eb724027f][al:][sign:][qq:][total:0][offset:0][00:00.05]The Manhattan Transfer - Java Jive[00:10.57]I …

閱讀更多...

java 3_Java 3 (Java的數據類型)

java 3_Java 3 (Java的數據類型)

Java的數據類型主要內容：1Java數據類型的分類2.8種基本數據類型3.理解引用類型的特點一、什么是數據類型？計算機語言將數據按性質進行分類，每一類稱為一種數據類型；數據類型定義了數據的性質、取值范圍、存儲方式、對數據所能進行…

閱讀更多...

java快捷鍵 --_Java中的快捷方式“或分配”（| =）運算符

java快捷鍵 --_Java中的快捷方式“或分配”（| =）運算符

如果是關于可讀性，我就有了將測試數據與測試邏輯分離的概念。代碼示例：// declare dataDataType [] dataToTest new DataType[] {defaultStock,defaultWholesale,defaultRetail,defaultDelivery}// define logicboolean checkIfAnyNegative(DataType []…

閱讀更多...

tcp網絡通信教程 java_基于java TCP網絡通信的實例詳解

tcp網絡通信教程 java_基于java TCP網絡通信的實例詳解

JAVA中設計網絡編程模式的主要有TCP和UDP兩種，TCP是屬于即時通信，UDP是通過數據包來進行通信，UDP當中就會牽扯到數據的解析和傳送。在安全性能方面，TCP要略勝一籌，通信過程中不容易出現數據丟失的現象，有一…

閱讀更多...

java博客論壇設計報告_javaweb課程設計報告個人博客網站的實現（Java）.doc

java博客論壇設計報告_javaweb課程設計報告個人博客網站的實現（Java）.doc

javaweb課程設計報告個人博客網站的實現(Java)項目名稱： 個人博客網站的實現(Java) 學生姓名：學號：班級：指導教師：2014年12月23日目錄1 緒論11.1系統應用意義11.2主要設計任務11.3開發及運行環境11.3.1 JSP的基礎——…

閱讀更多...

java replace stringbuilder_java.lang.StringBuilder.replace()方法實例

java replace stringbuilder_java.lang.StringBuilder.replace()方法實例

全屏java.lang.StringBuilder.replace()方法按照這個順序，在指定的字符串的子字符串替換字符。子串開始在指定start的索引，并延伸到該字符 end - 1，或如果序列的末端不存在這樣的字符。聲明以下是java.lang.StringBuilder.replace()方法的聲…

閱讀更多...

中小學課java_java畢業設計_springboot框架的中小學排課與實現

中小學課java_java畢業設計_springboot框架的中小學排課與實現

這是一個基于java的畢業設計項目,畢設課題為springboot框架的中小學排課與實現, 是一個采用b/s結構的javaweb項目, 開發工具eclipsei/eclipse, 項目框架jspspringbootmybatis, 中小學排課與實現采用mysql進行數據存儲, 并基于mybatis進行了orm實體關系映射, 該中小學排課與實現…

閱讀更多...

java 文件設置為只讀文件系統_Java如何設置文件為只讀？

java 文件設置為只讀文件系統_Java如何設置文件為只讀？

在java編程中，如何設置文件為只讀？此示例演示如何使用File類的file.setReadOnly()和file.canWrite()方法設置文件為只讀模式。package com.yiibai;import java.io.File;public class ReadOnlyFile {public static void main(String[] args) {File file …

閱讀更多...

wordcount linux java_linux下在eclipse上運行hadoop自帶例子wordcount

wordcount linux java_linux下在eclipse上運行hadoop自帶例子wordcount

啟動eclipse：打開windows->open perspective->other->map/reduce 可以看到map/reduce開發視圖。設置Hadoop location.打開windows->show view->other-> map/reduce Locations視圖，在點擊大象后【new Hadoop location】彈出的對話框(Ge…

閱讀更多...

php java執行linux_java_java執行Linux命令的方法，本文實例講述了java執行Linux命 - phpStudy...

php java執行linux_java_java執行Linux命令的方法，本文實例講述了java執行Linux命 - phpStudy...

java執行Linux命令的方法本文實例講述了java執行Linux命令的方法。分享給大家供大家參考。具體實現方法如下：public class StreamGobbler extends Thread {InputStream is;String type;public StreamGobbler(InputStream is, String type) {this.is is;this.type …

閱讀更多...

java怎么接收前端請求_前端json post 請求后端怎么接收

java怎么接收前端請求_前端json post 請求后端怎么接收

前端提交POST /api/test HTTP/1.1Host: 192.168.135.69:81Connection: keep-aliveContent-Length: 18Origin: http://192.168.135.69:81User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15…

閱讀更多...

minimum在java中的意思_Java Calendar getMinimum()用法及代碼示例

minimum在java中的意思_Java Calendar getMinimum()用法及代碼示例

Calendar類中的getMinimum(int calndr_field)方法用于返回此Calendar實例的給定日歷字段(int calndr_field)的最小值。用法:public abstract int getMinimum(int calndr_field)參數：該方法采用一個參數calndr_field，該參數表示要操作的日歷字段。返回值&…

閱讀更多...

最新文章