ProteinFlow是一個開源的Python庫,旨在簡化蛋白質結構數據在深度學習應用中的預處理過程。以下是其詳細介紹:
功能
-
數據處理:支持處理單鏈和多鏈蛋白質結構,包括二級結構特征、扭轉角等特征化選項。
-
數據獲取:能夠從Protein Data Bank (PDB)和Structural Antibody Database (SAbDab)等資源中高效地過濾、聚類和生成新的數據集。
-
數據加載與轉換:提供多種數據加載選項和轉換,以適應不同的下游訓練框架。
-
預計算數據集:提供最新預計算的蛋白質結構數據集,方便用戶快速使用。
安裝
-
使用Conda:
conda install -c conda-forge -c bioconda -c adaptyvbio proteinflow
-
使用pip:
pip install proteinflow
-
使用Docker:
docker pull adaptybproteinflow
核心模塊 & 類速覽
1. proteinflow.data.ProteinEntry
? 蛋白質結構的