【学习Biopython】 Biopython 教程与手册
BioPython在生物数据处理上还是有其很好用途,比如uniprot xml文件的解析。
主要的Biopython发行版本有很多种功能,包括:
- 将生物信息学文件解析为Python可用的数据结构,包含以下支持的格式:
- Blast输出结果 – standalone和在线Blast
- Clustalw
- FASTA
- GenBank
- PubMed和Medline
- ExPASy文件, 如Enzyme和Prosite
- SCOP, 包括‘dom’和‘lin’文件
- UniGene
- SwissProt
- 被支持格式的文件可以通过记录来重复或者通过字典界面来索引。
- 处理常见的生物信息学在线数据库的代码:
- NCBI – Blast, Entrez和PubMed服务
- ExPASy – Swiss-Prot和Prosite条目, 包括Prosite搜索
- 常见生物信息学程序的接口,例如:
- NCBI的Standalone Blast
- Clustalw比对程序
- EMBOSS命令行工具
- 一个能处理序列、ID和序列特征的标准序列类。
- 对序列实现常规操作的工具,如翻译,转录和权重计算。
- 利用k最近邻接、Bayes或SVM对数据进行分类的代码。
- 处理比对的代码,包括创建和处理替换矩阵的标准方法。
- 分发并行任务到不同进程的代码。
- 实现序列的基本操作,翻译以及BLAST等功能的GUI程序。
- 使用这些模块的详细文档和帮助,包括此文件,在线的wiki文档,网站和邮件列表。
- 整合BioSQL,一个也被BioPerl和BioJava支持的数据库架构。
- 第1章 介绍
- 第2章 快速开始 —— 你能用Biopython做什么?
- 第3章 生物序列对象
- 第4章 序列注释对象
- 第5章 序列输入和输出
- 第6章 多序列比对
- 第7章 BLAST
- 第8章 BLAST和其他序列搜索工具(实验性质的代码)
- 第9章 访问NCBI Entrez数据库
- 9.1 Entrez 简介
- 9.2 EInfo: 获取Entrez数据库的信息
- 9.3 ESearch: 搜索Entrez数据库
- 9.4 EPost: 上传identifiers的列表
- 9.5 ESummary: 通过主要的IDs来获取摘要
- 9.6 EFetch: 从Entrez下载更多的记录
- 9.7 ELink: 在NCBI Entrez中搜索相关的条目
- 9.8 EGQuery: 全局搜索- 统计搜索的条目
- 9.9 ESpell: 获得拼写建议
- 9.10 解析大的Entrez XML文件
- 9.11 错误处理
- 9.12 专用的解析器
- 9.13 使用代理
- 9.14 实例
- 9.15 使用历史记录和WebEnv
- 第10章 Swiss-Prot和ExPASy
- 第11章 走向3D:PDB模块
- 第12章 Bio.PopGen:群体遗传学
- 第13章 Bio.Phylo系统发育分析
- 第14章 使用Bio.motifs进行模体序列分析
- 第15章 聚类分析
- 第16章 监督学习方法
- 第17章 Graphics模块中的基因组可视化包—GenomeDiagram
- 第18章 Cookbook – 用它做一些很酷的事情
- 第19章 Biopython测试框架
- 第20章 高级
- 第21章 为Biopython做贡献
- 第22章 附录:Python相关知识
- References