Skip to content

The software is in a specific host chassis proteins perform codon optimization

Notifications You must be signed in to change notification settings

Binyun-Z/Codon-optimization

Repository files navigation

Codon-optimization

The software is in a specific host chassis proteins perform codon optimization
该程序参考论文:Rational design and construction of multi-copy biomanufacturing islands in mammalian cells,在其提供的源代码基础上提供了一个python3版本的程序,并实现批量化的计算和分析
该软件为以特定宿主底盘的蛋白质生成指定数量的对应核酸序列,使其差异足够大,避免同源重组,同时适配特定的宿主
密码子使用表可从此处或者金斯瑞官网获得

使用方法:

python GD.py -p protein.fasta -n 10

参数说明:

-p : 要执行密码子优化的蛋白质氨基酸序列的fasta文件位置,默认为test.fasta ,可以指定该文件所在的位置,例如./input/test.fasta
-n : 需要生成的不同基因序列数量
批量计算见notebook脚本

结果说明

正确执行软件之后会输出名为:codingSequenceVariants.csv的结果文件,sequence列为优化后的基因序列,CHI为基因的密码子适应性指数 ,CAI 计算为每个密码子在基因序列长度 L 上的相对适应性的几何平均值,GC为基因序列中碱基G和碱基C的含量。
image
image
同时,软件会输出生成的基因序列组中的平均、最大、最小汉明距离,以及序列组中两个基因序列的最远同源性。 (Mean, minimum and maximum hamming distances in the sequence) (Longest stretch of homology between any two sequences (in bp))

About

The software is in a specific host chassis proteins perform codon optimization

Resources

Stars

Watchers

Forks

Packages

No packages published