温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

R语言如何计算GC/AT含量

发布时间:2021-11-22 09:33:48 来源:亿速云 阅读:424 作者:柒染 栏目:大数据

本篇文章给大家分享的是有关R语言如何计算GC/AT含量,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

今天给大家介绍一个可以处理FASTA文件的包-Biostrings。这个包主要是处理基因组的一些序列信息,包括:序列翻译、DNA/RNA互转、统计各个碱基的含量、三连字母的含量.....这些都是一行命令可以解决的。今天就先来教大家怎样计算GC/AT含量。

首先是安装,代码如下:

source("http://bioconductor.org/biocLite.R")biocLite("Biostrings")
 

输入代码后需要耐心地等待几分钟。

        

R语言如何计算GC/AT含量  


安装完毕,只需敲几行代码,就可以实现GC/AT含量可视化。

#序列文件储存路径filepath<-"C:/Users/dell/Desktop/sequence.fasta"#读取文件(FASTA格式)x<-readDNAStringSet(filepath)chrom<-x[[1]]#每100个碱基为窗口计算AT含量at<-rowSums(letterFrequencyInSlidingView(chrom,100,c("A","T")))/100#获取描述性统计量根据此设置坐标summary(at)#画图plot(at,type='l',axes=F,xlab=NA,ylab=NA,ylim=c(0.2,0.8))axis(2,at=c(0.2,0.4,0.6,0.8),labels=c("20%","40%","60%","80%"))#纵坐标设置根据summary函数计算结果axis(1,at=c(0,2000,4000,6000,8000,10000,12000,14434),labels=c("Start","2000","4000","6000","8000","10000","12000","End"))#根据基因组显示横坐标信息
 
运行,结果如下:  


R语言如何计算GC/AT含量


以上就是R语言如何计算GC/AT含量,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注亿速云行业资讯频道。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI