Codon-optimization

The software is in a specific host chassis proteins perform codon optimization
该程序参考论文：Rational design and construction of multi-copy biomanufacturing islands in mammalian cells，在其提供的源代码基础上提供了一个python3版本的程序,并实现批量化的计算和分析
该软件为以特定宿主底盘的蛋白质生成指定数量的对应核酸序列，使其差异足够大，避免同源重组，同时适配特定的宿主
密码子使用表可从此处或者金斯瑞官网获得

使用方法：

python GD.py -p protein.fasta -n 10

参数说明：

-p : 要执行密码子优化的蛋白质氨基酸序列的fasta文件位置，默认为test.fasta ,可以指定该文件所在的位置，例如./input/test.fasta
-n : 需要生成的不同基因序列数量
批量计算见notebook脚本

结果说明

正确执行软件之后会输出名为：codingSequenceVariants.csv的结果文件，sequence列为优化后的基因序列，CHI为基因的密码子适应性指数，CAI 计算为每个密码子在基因序列长度 L 上的相对适应性的几何平均值，GC为基因序列中碱基G和碱基C的含量。

同时，软件会输出生成的基因序列组中的平均、最大、最小汉明距离，以及序列组中两个基因序列的最远同源性。（Mean, minimum and maximum hamming distances in the sequence）（Longest stretch of homology between any two sequences (in bp)）

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
1000bp.fasta		1000bp.fasta
1500bp.fasta		1500bp.fasta
3000bp.fasta		3000bp.fasta
4500bp.fasta		4500bp.fasta
500bp.fasta		500bp.fasta
CLIB_release.csv		CLIB_release.csv
GD.py		GD.py
GD3.ipynb		GD3.ipynb
GD4.ipynb		GD4.ipynb
README.md		README.md
cerevisiae_release.csv		cerevisiae_release.csv
coli_release.csv		coli_release.csv
create_codon.ipynb		create_codon.ipynb
data.ipynb		data.ipynb
dd.ipynb		dd.ipynb
plot.ipynb		plot.ipynb
plot_rscu.ipynb		plot_rscu.ipynb
test.fasta		test.fasta

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Codon-optimization

使用方法：

参数说明：

结果说明

About

Releases 2

Packages

Languages

Binyun-Z/Codon-optimization

Folders and files

Latest commit

History

Repository files navigation

Codon-optimization

使用方法：

参数说明：

结果说明

About

Resources

Stars

Watchers

Forks

Releases 2

Packages 0

Languages

Packages