请使用支持JavaScript的浏览器! 转录组数据中RPKM代表什么_蚂蚁淘商城
转录组数据中RPKM代表什么
2018-03-01
问题描述:

*请输入10-500个字符
已帮助
0人
zongdewangm16
  用户
转录组数据中,RPKM是Reads Per Kilo bases per Million reads的缩写,代表每百万reads中来自于某基因每千碱基长度的reads数。转录是遗传信息由DNA转换到RNA的过程。作为蛋白质生物合成的第一步,转录是mRNA以及非编码RNA(tRNA、rRNA等)的合成步骤。是遗传信息从DNA流向RNA的过程。即以双链DNA中的确定的一条链(模板链用于转录,编码链不用于转录)为模板,以ATP、CTP、GTP、UTP四种核苷三磷酸为原料,在RNA聚合酶催化下合成RNA的过程。
已帮助
0人
xiaorimu
  用户
Readsperkilobasetranscriptomepermillionmappedreads,是一种计算机因表达量的标准化方式,比如说计算转录本A的标准化表达量公式是RPKM(A)=10^6C/(NL/10^3),C是唯一比对到A的reads数量,N是唯一比对到所有转录本的reads数量,L是A的长度,这里进行了两个标准化,用10^6C/N是将比对上的reads数标准化(Readspermillionmappedreads),L/10^3是表示长度的标准化(Readsperkilobasetranscriptome),不知道这样你可以理解不。
已帮助
0人
模拟守望者
  用户
谢谢你的提问这对我也很有利,因为我也刚刚涉足转录组测序。经过搜索我才知道RPKM(ReadsPerKilobasesperMillionreads)是每百万reads中来自于某基因每千碱基长度的reads数。就像是在你手中的100个鸡蛋里有几个是你喜欢的意思?如此可以评估你要看的目的基因的表达水平。希望对你有所帮助!
已帮助
0人
liyu0355
  用户
RPKM是将map到基因的read数除以map到genome的所有read数(以million为单位)与RNA的长度(以KB为单位)。  RNA-seq是透过次世代定序的技术来侦测基因表现量的方法,在衡量基因表现量时,若是单纯以map到的read数来计算基因的表现量,在统计上是一件相当不合理事,因为在随机抽样的情况下,序列较长的基因被抽到的机率本来就会比序列短的基因较高,如此一来,序列长的基因永远会被认为表现量较高,而错估基因真正的表现量,所以AliMortazavi等人在2008年提出以RPKM在估计基因的表现量。[1]  其公式为:  计算公式  以下就用一个简化的例子来说明RPKM的运用方式与概念:  假设一基因体只有两个基因,一个9KB,一个1KB,如今有一sample,其map到9KB的read有18million个,map到1KB的有2million个,  对于9KB的基因而言,  Totalexonreads=18million  Mappedreads=18+2=20million  Exonlength=9KB  RPKM=18/(20*9)=0.1  对于1KB的基因而言,  Totalexonreads=2million  Mappedreads=18+2=20million  Exonlength=1KB  RPKM=2/(20*1)=0.1  由此我们可以知道这两个基因表现量没有差别。  假设此时我们有另一个sample,其表现如下图所示:    我们可以发现此sample中9KB基因的read数明显比上一个sample少,如果我们计算RPKM可以得到RPKM=9/((9+1)*9)=0.1,却与上一个sample相同,这可能是因为CDNA浓度较低或是其他sample备制过程的问题,造成整体read变少,但是对9KB基因而言,其read数占所有read数的比例并没有发生改变,所以其表现量会和上一个sample相同。[2]参考资料1.RPKM简介.PublicLibraryofBioinformatics[引用日期2012-09-3].2.27.1.4.3DefinitionofRPKM.clcbio[引用日期2012-09-3].展开
已帮助
0人
wxee
  用户
RPKM(ReadsPerKilobasesperMillionreads)是每百万reads中来自于某基因每千碱基长度的reads数。详见链接:http://www.plob.org/2011/10/24/294.html
相关文章