温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

Hi-C数据处理分析的利器Juicer是怎样的

发布时间:2021-11-23 15:57:05 来源:亿速云 阅读:595 作者:柒染 栏目:大数据

Hi-C数据处理分析的利器Juicer是怎样的,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。


通过Hi-C数据可以分析TAD,chromatin loops等染色质空间结构的基本单元,加强我们对染色质三维结构的认知。面对海量的Hi-C数据,如何高效完成数据分析成为了一个挑战。

目前针对Hi-C数据的分析也有很多的软件可以用,而juicer无疑是使用的最广泛的软件之一。该软件的源代码托管在github上,

如下图所示,和其名字一样,juicer就像是一款榨汁机,输入Hi-C产生的原始fastq数据,经过层层加工,直到产生有效的数据分析结果。在整个数据分析过程中,使用者不需要高深的编程技巧,只需要一些基本的操作规范,人人都可以使用该软件来分析Hi-C数据。

Hi-C数据处理分析的利器Juicer是怎样的

juicer作为一款强大的分析软件,有以下几个特点

  1. 可以分析处理TB级别的海量数据,可以有效利用FPGA, GPU,集群等硬件资源来加速处理速度

  2. 提供了数据预处理,交互图谱创建和可视化,TAD和染色质环结构预测等一些列完整的pipeline

  3. 简单易用,不需要复杂的背景知识


该软件按照功能拆分成了三个大的分析步骤,依次运行即可得到最终的分析结果

  1. 数据预处理,将原始的fastq序列比对参考基因组,识别其中的valid pairs, 并生成一个后缀为hic的文件

  2. 读取hic文件,创建可视化的交互图谱,也称之为contact map, 并进行归一化

  3. 采用算法预测TAD和染色质环等结构


完整功能示意如下

Hi-C数据处理分析的利器Juicer是怎样的

juicer采用ArrowHead算法对原始的交互矩阵进行转化,并预测TAD拓扑关联结构域,采用HiCUUPS算法识别染色质环chromatin loops。和其他Hi-C数据处理软件相比,juicer的功能更为齐全

Hi-C数据处理分析的利器Juicer是怎样的

juicer独创了一种名为hic的文件格式,用来存储Hi-C数据的相关信息,这种格式是一种高度压缩的二进制文件格式,在以下链接可以查看这种格式的详细信息

https://github.com/theaidenlab/juicebox/blob/master/HiC_format_v8.docx

在后续的文章中,会详细介绍该软件的用法。

关于Hi-C数据处理分析的利器Juicer是怎样的问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注亿速云行业资讯频道了解更多相关知识。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI