将 RNA / DNA 的fasta文件翻译成蛋白质:Biopython - translate()
使用 python 写的小工具,支持DNA和RNA的翻译,主要解决现有工具不能快速将整个fasta文件翻译成蛋白质序列的痛点。同时这个工具还具有速度快,支持批量翻译fasta文件的特点。
【环境与依赖】
环境:python3
依赖库:biopython
【使用的脚本】
- translate.py
- translate.sh
【使用方法】
python translate.py [输入文件] [输出的目录] [序列类型 (DNA/RNA)]
【例子1: cds翻译成蛋白】
将 zebrafish 的 cds 文件翻译成对应的蛋白质:
python translate.py zebrafish_cds.fasta protein/ DNA
【例子2: 批量操作】
如果要批量翻译文件,在shell中执行:
sh translate.sh [输入文件所在的目录] [输出的目录] [序列类型 (DNA/RNA)]
(要保证 [输入文件所在的目录] 中只有需要翻译的文件)
例如:
sh translate.sh cds/ protein/ DNA
【注意事项】
- 工具是依次读取序列并翻译的,所翻译的序列一定要是与氨基酸序列一一对应的,不能有非编码区的存在。
- 默认使用“标准密码子”进行翻译,目前还不支持使用其他密码子表。