温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

clinvar数据库的示例分析

发布时间:2022-03-19 10:47:36 来源:亿速云 阅读:678 作者:小新 栏目:开发技术

这篇文章主要介绍clinvar数据库的示例分析,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

clinvar数据库

clinvar是一个开放的数据库,每个研究机构都可以向其提交数据,对于提交的信息,会有专家团队进行审核评级。对于数据库中的位点,根据注释信息的可靠性,分成了1到4个不同的星级,星级越高,可信度越高。

数据库地址:https://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh47/

安装了ANNOVAR就可以直接下载:

perl  annotate_variation.pl --downdb --buildver hg19  -downdb -webfrom annovar clinvar_20180603 ./

下载之后,得到一些注释信息,其中ANNOVAR包含5个注释信息CLNALLELEID, CLNDN, CLNDISDB, CLNREVSTAT, CLNSIG:

ALLELEID ="the ClinVar Allele ID"
CLNDN ="ClinVar's preferred disease name for the concept specified by disease identifiers in CLNDISDB"
CLNDNINCL ="For included Variant : ClinVar's preferred disease name for the concept specified by disease identifiers in CLNDISDB"
CLNDISDB ="Tag-value pairs of disease database name and identifier, e.g. OMIM:NNNNNN"
CLNDISDBINCL ="For included Variant: Tag-value pairs of disease database name and identifier, e.g. OMIM:NNNNNN"
CLNHGVS ="Top-level (primary assembly, alt, or patch) HGVS expression."
CLNREVSTAT ="ClinVar review status for the Variation ID"
CLNSIG ="Clinical significance for this single variant"

其中CLNDSDB指该记录来源的数据库。

最新数据库更新:

有时候clinvar数据库更新比较快,而ANNOVAR官方提供的注释文件可能不及时,我们可以自行下载数据,利用ANNOVAR提供的脚本制作clinvar的注释文件:

准备工作:

1.先安装一下vt :https://genome.sph.umich.edu/wiki/Vt#Installation  如果报错见:https://www.亿速云.com/article/461

2.脚本prepare_annovar_user.pl下载地址:http://www.openbioinformatics.org/annovar/download/prepare_annovar_user.pl

命令行如下:

export PATH=/share/work/biosoft/annovar/2018Apr16/annovar:/share/work/biosoft/vt/vt-0.57721/:$PATH
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh47/clinvar_20180805.vcf.gz
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh47/clinvar_20180805.vcf.gz.tbi
vt decompose clinvar_20180805.vcf.gz -o temp.split.vcf
prepare_annovar_user.pl   -dbtype clinvar_preprocess2 temp.split.vcf -out temp.split2.vcf
vt normalize temp.split2.vcf -r ../../GRCH37/Homo_sapiens.GRCh47.dna.toplevel.fa -o temp.norm.vcf -w 2000000
prepare_annovar_user.pl -dbtype clinvar2 temp.norm.vcf -out hg19_clinvar_20180805.txt
#index_annovar.pl hg19_clinvar_20180805_raw.txt -out hg19_clinvar_20180805.txt -comment comment_20180805.txt

最后:index_annovar.pl 脚本没有找到,其实文件不大,也可以不建立索引。

以上是“clinvar数据库的示例分析”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注亿速云行业资讯频道!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI