R包:蛋白質組學質控評估PTXQC包

介紹

PTXQC包是2016年發表在J Proteome Res期刊上的R包,它主要是對MaxQuant輸出結果進行提取處理從而獲得評估蛋白質質量結果。

安裝

從github安裝,安裝過程會自動構建tutorial。

devtools::install_github("cbielow/PTXQC", build_vignettes = TRUE, dependencies = TRUE)
library(PTXQC)
  • 查看幫助文檔,幫助文檔是以html方式展示
help(package="PTXQC")
browseVignettes(package = 'PTXQC')

輸入文件

輸入文件是MaxQuant結果文件的txt里面的:/combined/txt

  • parameters.txt
  • summary.txt
  • proteinGroups.txt
  • evidence.txt
  • msms.txt
  • msmsScans.txt

運行

輸入包含上述輸入文件的目錄即可,然后使用createReport函數。

r = createReport(txt_folder)
cat(paste0("\nReport generated as '", r$report_file, "'\n\n"))

它也提供了修改報告主題或者評估步驟選擇的方法,需要修改yaml_file文件,可參考如下。

require(PTXQC)
require(yaml)## the next require() is needed to prevent a spurious error in certain R versions (might be a bug in R or a package)
## error message is:
##    Error in Scales$new : could not find function "loadMethod"
require(methods)## specify a path to a MaxQuant txt folder
## Note: This folder can be incomplete, depending on your YAML config
if (1) {## we will use an example dataset from PRIDE (dataset 2 of the PTXQC publication)local_zip = tempfile(fileext=".zip")download.file("ftp://ftp.pride.ebi.ac.uk/pride/data/archive/2015/11/PXD003133/txt_20min.zip", destfile = local_zip)unzip(local_zip, exdir = tempdir()) ## extracts contenttxt_folder = file.path(tempdir(), "txt_20min")
} else {## if you have local MaxQuant output, just use ittxt_folder = "c:/Proteomics/MouseLiver/combined/txt"
}## use a YAML config inside the target directory if present
fh_out = getReportFilenames(txt_folder)
if (file.exists(fh_out$yaml_file))
{cat("\nUsing YAML config already present in target directory ...\n")yaml_config = yaml.load_file(input = fh_out$yaml_file)
} else {cat("\nYAML config not found in folder '", txt_folder, "'. The first run of PTXQC will create one for you.", sep="")yaml_config = list()
}r = createReport(txt_folder, mztab_file = NULL, yaml_obj = yaml_config)cat(paste0("\nReport generated as '", r$report_file, "'\n\n"))

結果

輸出的報告文件可以是html也可以是PDF格式,如圖:基于PTXQC包評估以下部分

  • 樣本制備(1-5);
  • 液相色譜分離肽段(6-9);
  • 質譜過程(10-18);
  • 鑒定蛋白效果(19-22)。

不同顏色代表實驗過程的優劣。從圖中可以看出,樣本制備和質譜過程獲得評分是best,而鑒定蛋白質效果這一步效果最差,這是因為我們的蛋白質樣本是血液外泌體蛋白質,它含量相對血液而已本身就較少,無法達到該包給的閾值(Peptide Count > 15,000; Protein Count > 3,500),但我們可以看到Average Overall Quality是偏較好評價的(偏深綠色)。另外我們蛋白質質譜過程使用了PAIMS技術分離蛋白質,這也是我們能看到每個file有三個bar圖(40;60;80電壓)。

在獲取圖譜過程中,常會用到2018年才推出的FAIMS(High-Field Asymmetric Waveform Ion Mobility Spectrometry)技術以用于加載不同電壓(肽段在ESI離子化后,進入質譜之前實現快速氣相分離,提高分離的峰容量),直接使用多電壓下的raw data做MaxQuant定量分析是錯誤的,MaxQuant軟件只能識別單電壓的raw data,因此需要使用FAIMS MzXML Generator 軟件將raw data轉換成各自電壓下的MzXML文件。

List of metrics

systemic information

sessionInfo()
R version 4.0.2 (2020-06-22)
Platform: x86_64-conda_cos6-linux-gnu (64-bit)
Running under: CentOS Linux 8 (Core)Matrix products: default
BLAS/LAPACK: /disk/share/anaconda3/lib/libopenblasp-r0.3.10.solocale:[1] LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C               LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8    [5] LC_MONETARY=en_US.UTF-8    LC_MESSAGES=en_US.UTF-8    LC_PAPER=en_US.UTF-8       LC_NAME=C                 [9] LC_ADDRESS=C               LC_TELEPHONE=C             LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     other attached packages:
[1] PTXQC_1.0.12 tibble_3.1.5 dplyr_1.0.7 loaded via a namespace (and not attached):[1] tinytex_0.32       tidyselect_1.1.1   xfun_0.24          bslib_0.2.5.1      reshape2_1.4.4     purrr_0.3.4       [7] colorspace_2.0-2   vctrs_0.3.8        generics_0.1.0     viridisLite_0.4.0  htmltools_0.5.1.1  yaml_2.2.1        
[13] utf8_1.2.1         rlang_0.4.11       jquerylib_0.1.4    pillar_1.6.4       glue_1.4.2         DBI_1.1.1         
[19] gdtools_0.2.2      RColorBrewer_1.1-2 lifecycle_1.0.0    plyr_1.8.6         stringr_1.4.0      munsell_0.5.0     
[25] gtable_0.3.0       rvest_0.3.6        kableExtra_1.3.4   evaluate_0.14      knitr_1.33         UpSetR_1.4.0      
[31] fansi_0.5.0        Rcpp_1.0.7         scales_1.1.1       webshot_0.5.2      jsonlite_1.7.2     systemfonts_0.3.2 
[37] gridExtra_2.3      ggplot2_3.3.5      digest_0.6.27      stringi_1.4.6      ade4_1.7-18        cowplot_1.1.0     
[43] grid_4.0.2         tools_4.0.2        magrittr_2.0.1     sass_0.4.0         ggdendro_0.1.22    R6P_0.2.2         
[49] seqinr_4.2-4       crayon_1.4.1       tidyr_1.1.4        pkgconfig_2.0.3    ellipsis_0.3.2     MASS_7.3-54       
[55] data.table_1.14.0  xml2_1.3.2         assertthat_0.2.1   rmarkdown_2.9      svglite_1.2.3.2    httr_1.4.2        
[61] rstudioapi_0.13    R6_2.5.0           compiler_4.0.2  

Reference

  1. Proteomics quality control: quality control software for MaxQuant results

  2. PTXQC

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/43557.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/43557.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/43557.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AI數字人直播saas系統源碼部署火爆!無人直播系統全攻略

隨著直播行業的日益興盛,各種直播模式和玩法不斷涌現。其中,AI數字人直播更是憑借著其在降本增效的獨特優勢而在眾多直播模式中脫穎而出,成為了眾多企業已經引進或計劃引進的新型技術。而各大數字人源碼廠商推出的AI數字人直播saas系統源碼部…

面試題07-09

知道了 InnoDB 的索引實現后,就很容易明白為什么不建議使用過長的字段作為主鍵,因為所有輔助索引都引用主索引,過長的主索引會令輔助索引變得過大。再例如,用非單調的字段作為主鍵在 InnoDB 中不是個好主意,因為 InnoD…

走拼箱貨必看海運拼箱的實用技巧

在國際海運運輸中,海運拼箱適用于貨物數量較少或體積不足以填滿整個集裝箱的情況。 海運拼箱貨物通常由物流公司或貨代進行組織和管理。多個貨主的貨物通過合理拼裝,使集裝箱空間得到充分利用。 那么,在海運拼箱和整柜有哪些不同&#xff0c…

Linux -- 認識gcc/g++、代碼的編譯過程

目錄 前言: 使用 gcc/g: 代碼的編譯過程: 預處理: 頭文件展開: 宏替換去注釋: ?編輯 條件編譯: 編譯: 匯編: 鏈接: 動態庫(動態鏈…

使用Simulink基于模型設計(二):系統定義和布局

Simulink模型的頂層系統布局是許多工程團隊可以使用的公共環境,是基于模型的設計范式:分析、設計、檢驗和實現。您可以通過確定模型的結構和各個組件來定義頂層系統。然后,您可以將模型按照層次結構進行組織,分別與系統的各個組件…

【鴻蒙學習筆記】交互事件

官方文檔:交互事件 目錄標題 分類交互事件-觸屏交互事件-手勢事件單一手勢 分類 交互事件-觸屏 在組件上按下(Down) , 滑動(Move) , 抬起(up)時觸發的回調事件。包括點擊事件、觸摸事件和拖拽事件 交互事件-手勢事件 在手機上點擊打開應用 , 長按后拖動應用 , 這…

自動化數據集成的BI工具,為你提供決策洞察力

傳統的商業智能(BI)報表系統采用的是“業務提報表需求,IT進行開發”的模式。決策管理者和業務人員提出用報表等來展示經營管理數據的需求;接著IT響應需求,進行需求溝通、數據處理加工、報表開發等主體工作;…

使用java代碼取本月第一個工作日

根據參數或當前月,獲取本月第一個工作日 文章目錄 根據參數或當前月,獲取本月第一個工作日前言一、根據當前日期獲取當前月的第一個工作日二、根據參數日期,獲取參數月的第一個工作日。總結 前言 這里我們列舉兩個方法: 1、沒有參…

RFID資產管理系統 RFID固定資產管理系統

大多數企業都曾被固定資產管理“難”的問題困擾:賬物不符、查詢不便、盤點耗時……因此,越來越多的企業選擇用資產管理系統,來實現資產智能化管理。 RFID資產管理系統方案是針對大多數企業存在的資產管理痛點,采用RFID技術&#…

uni-app三部曲之三: 路由攔截

1.引言 路由攔截,個人理解就是在頁面跳轉的時候,增加一級攔截器,實現一些自定義的功能,其中最重要的就是判斷跳轉的頁面是否需要登錄后查看,如果需要登錄后查看且此時系統并未登錄,就需要跳轉到登錄頁&…

Python地震波逆問題解構算法復雜信號分析

🎯要點 🎯時域、時頻域以及時間和頻率相關聯偏振特性分析三種算法 | 🎯時域波參數估計算法 | 🎯機器學習模型波形指紋分析算法 | 🎯色散曲線和頻率相關波分析算法 | 🎯動態傾斜校正算法 | 🎯聲…

【JS|第21期】JavaScript模塊化:深入解析三種文件暴露方式

日期:2024年7月6日 作者:Commas 簽名:(? ?_?)? 積跬步以致千里,積小流以成江海…… 注釋:如果您覺得有所幫助,幫忙點個贊,也可以關注我,我們一起成長;如果有不對的地方,還望各位大佬不吝賜教,謝謝^ - ^ 1.01365 = 37.7834;0.99365 = 0.0255 1.02365 = 1377.4083…

前后端項目部署方案匯總

前端項目 1、本地打包部署 # 本地打包部署到線上服務器 npm run build && \ rsync -r ./dist/* root127.0.0.1:/www/www.demo.com/www2、服務器端打包部署 步驟 拉取代碼 -> 安裝依賴 -> 打包編譯 -> 拷貝到運行目錄 -> 發送成功消息shell命令 git pu…

新手小白報考學習PMP會遇到哪些“坑”?

PMP考試的陷阱實際上與其他大型證書考試差不多,主要是在選擇培訓機構和各種收費方面會遇到一些坑。 首先,并不是每個人都能經歷這些坑,因為PMP考試有一定的門檻。 作為引進國外的考試,報名都有中英文之分,所以先來看…

STM32的 DMA(直接存儲器訪問) 詳解

STM32的DMA(Direct Memory Access,直接存儲器存取)是一種在單片機中用于高效實現數據傳輸的技術。它允許外設設備直接訪問RAM,不需要CPU的干預,從而釋放CPU資源,提高CPU工作效率,本文基于STM32F…

[極客大挑戰 2019]RCE ME

[極客大挑戰 2019]RCE ME <?php error_reporting(0); if(isset($_GET[code])){$code$_GET[code];if(strlen($code)>40){die("This is too Long.");}if(preg_match("/[A-Za-z0-9]/",$code)){die("NO.");}eval($code); } else{highlight_f…

(附源碼)c#+winform實現遠程開機(廣域網可用)

實現邏輯 利用UDP協議發送特定格式的魔術包&#xff0c;以遠程喚醒具有特定MAC地址的目標計算機。目標計算機的BIOS和網絡配置需要支持Wake-on-LAN&#xff08;WOL&#xff09;功能&#xff0c;并且需要在目標計算機上配置正確的網絡喚醒設置。 源碼在最后 準備工作 進入Bio…

力學有限元的基石:虛功原理的推導

推導虛功方程的過程 彈性力學的平衡方程 在張量形式中&#xff0c;平衡方程為&#xff1a; ? ? σ b 0 \nabla \cdot \sigma b 0 ??σb0 用下標表示為&#xff1a; ? σ i j ? x j b i 0 \frac{\partial \sigma_{ij}}{\partial x_j} b_i 0 ?xj??σij??b…

知識圖譜入門筆記

自學參考&#xff1a; 視頻&#xff1a;斯坦福CS520 | 知識圖譜 最全知識圖譜綜述 詳解知識圖譜的構建全流程 知識圖譜構建&#xff08;概念&#xff0c;工具&#xff0c;實例調研&#xff09; 一、基本概念 知識圖譜&#xff08;Knowledge graph&#xff09;&#xff1a;由結…

Redis管理禁用命令

在redis數據量比較大時&#xff0c;執行 keys * &#xff0c;fluashdb 這些命令&#xff0c;會導致redis長時間阻塞&#xff0c;大量請求被阻塞&#xff0c;cpu飆升&#xff0c;嚴重可能導致redis宕機&#xff0c;數據庫雪崩。所以一些命令在生產環境禁止使用。 Redis 禁用命令…