-
Notifications
You must be signed in to change notification settings - Fork 32
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
原始数据下载专题 | datasets——基因与基因组数据查询和获取的NCBI官方解决方案 #6256
Comments
原始数据下载专题 | datasets——基因与基因组数据查询和获取的NCBI官方解决方案 by 萌哥与生信背景原始数据下载专题到最后一个工具啦,前面介绍的很多工具都是 NCBI的官方工具大家有印象的可能是
安装conda一键完成:
这个工具还在活跃的开发中,基本上半个月就更新一个小版本,目前最新版是 如果你直接搜索 使用
前两个功能大家应该好理解,我解释一下第三个rehydrate:
下载这个功能比较常用咱们先来使用这个。 下载一共能下载四个方面的内容:
场景1:下载基因组数据基因组文件下载在大多数的生信分析的准备工作里都有要下载基因组这一步,以前都是打开网页不断地查询之后复制链接地址然后下载,现在直接一行命令就可以完成了。 在 例如官方给的案例:
用
下载一个物种的所有基因组组装版本当涉及到大量数据下载的时候就可以用
下载下来之后解压开,有文件里有一个叫
看起来是一个三列的文件,第一列是要下载的文件的URL地址,第二列是个文件大小,显示为0,这可能表示文件大小未知或未指定。 第三列表示文件在本地存储时的路径。 我把前两行的内容代替掉整个fetch.txt文件,然后运行下面这个
萌哥吐槽时间:它这个功能有点傻,是自动匹配 也不能在上面的命令里指定 下载下来的文件会存放在 场景2:下载基因数据可以用以下的方式下载gene数据
gene支持下面这四种方式:
有的时候做进化树,会使用到特定的基因,比如 这个基因的
得到的结果都是
看起来这个 用
用
下载下来的压缩文件默认情况下会同时包含DNA序列和蛋白质序列。 如果你想下载时同时包含 萌哥碎碎念也没想到自己真能把这个系列写完,之后可能还想再更新一个 接下来距离我毕业大概还有五百多天,一半年,说长不长说短不短,要开始转变重心从咔咔分析数据到开始学习如何写文章了。我也收集了一些关于如何写学术论文的文章,到时候可以分享读文献笔记作为一个 说起来似乎是明白写公众号的意义了,其实还是主要是服务我自己,除非你是广告主来约投放,那么可以为了你写东西,否则绝大多数的内容都是为我自己服务的。当然包括给粉丝回答问题修复bug这也是一种为我服务。写推文的过程也是我自己整理学习和内化的一个过程,挺好。 |
https://mp.weixin.qq.com/s/3NZ26pV7ZEPVawoMYe9Ztg
The text was updated successfully, but these errors were encountered: