Learning Courses
【北京大学生物信息公开课】:导论与方法
转载来自:北京大学生物信息学(中文版) 公开课。主讲:北京大学生物信息学中心 魏丽萍 高歌。
【Linux教材】TLCL 快乐的 Linux 命令行
这本书介绍如何生存在 Linux 命令行的世界。不像一些书籍仅仅涉及一个程序,比如像 shell 程序,bash。 这本书将试着向你传授如何与命令行界面友好相处。 它是怎样工作的? 它能做什么? 使用它的最好方法是什么?
【学习Biopython】 Biopython 教程与手册
Biopython —— 为生物信息学分析而开发的工具。
【学习circos】circos 软件系列教程
circos 是一款染色体相关数据的可视化软件,采用圆环的形式展示染色体上的相关信息,在多种组学数据的展示中广泛应用。转载来自:公众号 “生信修炼手册”。
Pipelines
利用 MCscan (Python version) 进行染色体可视化分析流程
MCscan (Python version) 是一个方便的染色体级别可视化工具。
Tools
将 RNA / DNA 的fasta文件翻译成蛋白质:Biopython - translate()
使用 python 写的小工具,支持DNA和RNA的翻译,主要解决现有工具不能快速将整个fasta文件翻译成蛋白质序列的痛点。同时这个工具还具有速度快,支持批量翻译fasta文件的特点。
提取CDS (Coding DNA Sequence): gffread
gffread 是 cufflinks 的一个子程序,一般安装 cufflinks 的同时也会被安装上。使用 “gffread -h” 来查看它的用法。这里只介绍其提取 CDS 序列的功能。
处理 fasta 文件中多行显示的问题
从网络上下载的 fasta 文件,其序列可能是以一行 60bp 碱基这样的格式排列的。这样的格式虽然易于人眼阅读,但非常不适合给程序读取,因为要额外建立复杂的代码逻辑来处理分行的问题。这里给出了一个快速的解决办法。
将 maf 格式的文件转化为 fasta 格式
简单快速的转换工具。