发布信息

如何从 NCBI 数据库下载水稻基因组?详细步骤解析

作者:软荐小编      2024-05-29 14:03:44     243

1 从NCBI数据库下载基因

主要位于Assembly数据库中,包含了目前为止公布的大部分动植物基因组和微生物基因组的相关信息,我们以水稻基因组的下载为例。

1. 输入NCBI(),点击Assembly

生物信息学在线软件_生物学软件应用课程介绍_生物信息学软件

2. 输入需要下载的物种拉丁名生物信息学在线软件,这里以水稻(Oryza sativa)为例,输出结果如下:

生物学软件应用课程介绍_生物信息学软件_生物信息学在线软件

以第一个版本为例点击查看,然后点击操作如下:

生物信息学软件_生物学软件应用课程介绍_生物信息学在线软件

3.出现以下界面:

生物信息学在线软件_生物学软件应用课程介绍_生物信息学软件

4.点击下载水稻GFF3、基因组、蛋白质等文件,对应文件如下:

1)所有基因的CDS文件

GCA_001433935.1_IRGSP-1.0_cds_from_genomic.fna.gz

2)基因组文件

GCA_001433935.1_IRGSP-1.0_基因组.fna.gz

3)基因的GFF3文件

GCA_001433935.1_IRGSP-1.0_基因组.gff.gz

4)所有基因的蛋白质序列文件

GCA_001433935.1_IRGSP-1.0_蛋白质.faa.gz

2 从 Ensembl 数据库下载基因组

网站:本网站是数据库的主界面,包含了灵长类、啮齿类、劳亚兽类、鸟类、爬行类和鱼类等脊椎动物的基因组。此外,在网站底部还有几个子数据库:Ensembl Bacteria(细菌基因组数据库);Ensembl Fungi(真菌基因组数据库);Ensembl Plants(植物基因组数据库);Ensembl Protists(原生动物基因组数据库);Ensembl metazoa(后生动物中的无脊椎动物数据库)。

以下是搜索斑马鱼基因组的示例。

1.进入Ensembl()数据库,点击All genes下的下拉框,选择物种Zebrafish。

生物信息学在线软件_生物信息学软件_生物学软件应用课程介绍

2.进入如下界面。

生物信息学在线软件_生物学软件应用课程介绍_生物信息学软件

3.点击上图左上角的Download DNA序列(FASTA),下载基因组序列信息:Danio_rerio.GRCz11.dna.primary_assembly.fa.gz(不包括单倍型的基因组,非模式物种选择*toplevel.f.gz)

生物信息学在线软件_生物学软件应用课程介绍_生物信息学软件

4.点击2右上角基因注释部分的GFF3下载基因组基因注释信息:Danio_rerio.GRCz11.97.gff3.gz

生物学软件应用课程介绍_生物信息学软件_生物信息学在线软件

5.点击2中基因注释部分右上角的Download FASTA file,下载该基因的蛋白序列、cDNA序列等注释信息。

生物信息学软件_生物信息学在线软件_生物学软件应用课程介绍

6.点击pep进入如下界面,选择Danio_rerio.GRCz11.pep.all.fa.gz下载,Danio_rerio.GRCz11.pep.abinitio.fa.gz是来自预测软件,预测结果往往不靠谱,一般不用。

生物信息学软件_生物信息学在线软件_生物学软件应用课程介绍

3 JGI(Phytozome)下载基因组

植物基因组数据库()目前存储了以下基因组:

生物信息学在线软件_生物学软件应用课程介绍_生物信息学软件

以下是下载拟南芥基因组的示例。

1.注册账户:

生物学软件应用课程介绍_生物信息学软件_生物信息学在线软件

2. 进入主页

3. 选择物种拟南芥TAIR10

生物信息学在线软件_生物学软件应用课程介绍_生物信息学软件

4. 点击获取标准数据文件

5.进入如下界面

生物信息学在线软件_生物学软件应用课程介绍_生物信息学软件

6.选择需要下载的基因组、蛋白质、GFF文件等(这些包含对应最长转录本的信息,标有primaryTranscriptOnly*信息)

1)所有基因的CDS文件

Athaliana_167_TAIR10.cds_primaryTranscriptOnly.fa.gz

2)基因的GFF3文件

Athaliana_167_TAIR10.gene.gff3.gz

3)所有基因的蛋白质序列文件

Athaliana_167_TAIR10.protein_primaryTranscriptOnly.fa.gz

4)基因组文件

Athaliana_167_TAIR9.fa.gz

7.下载。选择要下载的浏览器。

生物信息学软件_生物学软件应用课程介绍_生物信息学在线软件

4.EBI

欧洲生物信息学研究所(EMBL-EBI)提供了大量在线工具和数据库资源,网址如下:

比较常用的有以下几种:

BLAST [核苷酸]:核酸的 BLAST 比对。

BLAST [蛋白质]:蛋白质的 BLAST 比较。

Clustal Omega:多序列比对工具生物信息学在线软件,ClustalW的升级版本。

EMBOSS backtranambig:将蛋白质序列反向翻译为模糊核苷酸序列 DNA back-translation:

EMBOSS backtranseq:利用密码子频率将蛋白质序列反向翻译为核苷酸序列

EMBOSS transeq:选定框架中的核苷酸序列翻译

GeneWise:将蛋白质序列与基因组 DNA 序列进行比较。(同源预测基因)

HMMER:基于隐马尔可夫模型(HMM)的领域注释工具

InterProScan:搜索结构域。

MAFFT:多序列比对工具

MUSCLE:多序列比对工具

5. ExPASy

ExPASy 是瑞士生物信息学研究所(SIB)的生物信息学资源门户,提供生命科学各个领域的科学数据库和软件工具(即资源),包括蛋白质组学、基因组学、系统发育学、系统生物学、群体遗传学、转录组学等。更多信息请参见网站:。网站提供了很多工具的链接,你可以根据网站提供的类别找到你想要使用的工具。

生物信息学软件_生物学软件应用课程介绍_生物信息学在线软件

6. 静脉图绘制

使用在线维恩图绘制工具进行绘制,工具网址(在Google Chrome中打开):。

加载上面生成的五个文件,并在提供文件名称(可选)部分中填写相应图像上显示的物种名称。

生物信息学软件_生物学软件应用课程介绍_生物信息学在线软件

点击提交,几秒后会出现以下图片:

生物学软件应用课程介绍_生物信息学软件_生物信息学在线软件

您可以选择以 PNG 或 SVG 格式保存文件。

生物信息学小助手-生物信息学分析交流群

为了更有效的帮助广大科研人员获取相关信息,圣信帮建立了微信群,以便大家及时收到公众号发布的内容和相关技术问题的解答。同时鼓励大家在群内交流学术思想、相互碰撞。为了保证群内良好的讨论环境,请先添加编辑微信,扫码添加,我们会及时邀请您进群。温馨提示:添加编辑微信时及进群后,请务必备注学校或单位+姓名,末尾会备注PI,我们会邀请您加入PI群。

生物信息学软件_生物学软件应用课程介绍_生物信息学在线软件

代码

关闭

笔记

传播生物信息学知识

服务基础科学研究

商业合作请添加微信

相关内容 查看全部