【学习Biopython】 Biopython 教程与手册

BioPython在生物数据处理上还是有其很好用途,比如uniprot xml文件的解析。

主要的Biopython发行版本有很多种功能,包括:

  • 将生物信息学文件解析为Python可用的数据结构,包含以下支持的格式:
    • Blast输出结果 – standalone和在线Blast
    • Clustalw
    • FASTA
    • GenBank
    • PubMed和Medline
    • ExPASy文件, 如Enzyme和Prosite
    • SCOP, 包括‘dom’和‘lin’文件
    • UniGene
    • SwissProt
  • 被支持格式的文件可以通过记录来重复或者通过字典界面来索引。
  • 处理常见的生物信息学在线数据库的代码:
    • NCBI – Blast, Entrez和PubMed服务
    • ExPASy – Swiss-Prot和Prosite条目, 包括Prosite搜索
  • 常见生物信息学程序的接口,例如:
    • NCBI的Standalone Blast
    • Clustalw比对程序
    • EMBOSS命令行工具
  • 一个能处理序列、ID和序列特征的标准序列类。
  • 对序列实现常规操作的工具,如翻译,转录和权重计算。
  • 利用k最近邻接、Bayes或SVM对数据进行分类的代码。
  • 处理比对的代码,包括创建和处理替换矩阵的标准方法。
  • 分发并行任务到不同进程的代码。
  • 实现序列的基本操作,翻译以及BLAST等功能的GUI程序。
  • 使用这些模块的详细文档和帮助,包括此文件,在线的wiki文档,网站和邮件列表。
  • 整合BioSQL,一个也被BioPerl和BioJava支持的数据库架构。