跳过主要内容

实时PCR数据的统计分析

摘要

背景

尽管实时PCR已在生物医学领域得到了广泛应用,数据处理的PCR仍然缺乏实时定量分析方法;特别是在适当的统计处理的领域。置信区间和统计意义考虑是不是在目前许多数据分析方法明确。基于标准曲线法和其他有用的数据分析方法,我们目前并比较实时PCR数据分析的四个统计方法和模式。

结果

在第一种方法中,开发了多元回归分析模型以从基因的相互作用估计来衍生ΔΔCt。在第二种方法中,提出了一种ANCOVA(协方差分析)模型,ΔΔCt可以从变量的效果分析来源。另外两个模型涉及计算Δct,然后是两个组t -试验和非参数类似的Wilcoxon试验。SAS程序是为所有四种模型开发的,并介绍了用于分析样本集的数据输出。此外,使用SAS开发和实现数据质量控制模型。

结论

应用SAS程序开发了用于实时PCR数据的实用统计解决方案,并使用SAS程序对样本数据集进行分析。使用各种模型和程序进行的分析得出了相似的结果。本文提出的数据质量控制和分析程序为实时荧光定量PCR估计基因的相对表达提供了统计要素。

背景

实时荧光定量PCR是基因表达分析中最敏感、最可靠的定量方法之一。已广泛应用于微阵列验证、病原体定量、癌症定量、转基因拷贝数测定和药物治疗研究[1-4.].的PCR有三个阶段,指数期,线性相位和平台期,如图1.指数阶段是PCR中最早的阶段,因为试剂不受限制,所以产物呈指数增长。线性相的特征是随着PCR试剂变得有限,产物呈线性增长。PCR最终将在后期的周期中达到平稳期,产物的数量不会因为一些试剂耗尽而改变。Real-time PCR利用了在理想条件下,指数阶段PCR产物的数量与初始模板的数量成正比的事实[5.6.].在指数阶段,如果效率是完美的,即100%,PCR产物将在每个周期中理想地翻倍。如果PCR条件、引物特性、模板纯度和扩增子长度均为最佳,则有可能使PCR扩增效率在指数阶段接近100%。

图1
图1

实时聚合酶链反应.(a)描绘了对PCR产物量的PCR循环次数的理论曲线。可以观察到PCRS的三个相:指数相,线性相位和平台相。(b)显示抵抗对数PCR产物量的PCR循环次数的理论曲线。面板(c)是ABI 7000实时PCR仪器的连续稀释试验的输出。

基因组DNA和反转录cDNA都可以作为实时PCR的模板。PCR的动态通常是通过DNA结合染料,如SYBR green或DNA杂交探针,如分子信标(Strategene)或Taqman探针(Applied Biosystems) [2].实时PCR的基础是染料与扩增子数量之间的直接正相关。如图(1 b1 c),基于对数2的转化荧光信号的曲线与循环数将产生线性范围,荧光信号的对数与原始模板量相关。然后可以设置基线和阈值以进一步分析。阈值基于荧光阈值水平的循环次数定义为CT号,这是在大多数实时PCR实验中观察到的值,因此是感兴趣的主要统计指标。

实时PCR数据绝对且相对量化。绝对量化采用内部或外部校准曲线来导出输入模板拷贝数。然而,在需要确定精确的转录拷贝数的情况下绝对量化是重要的,对于大多数生理和病理学研究,相对量化足以。相对定量依赖于靶基因表达与参考基因的表达和靶样样品与参考样品中相同基因的表达的比较[7.].

由于相对量化是大多数用于实时PCR实验的目标,因此已经开发了几种数据分析程序。两个数学模型非常广泛应用:效率校准模型[7.8.]和ΔΔct模型[9.].两种型号的实验系统是相似的。该实验将涉及对照样品和治疗样品。对于每个样品,靶基因和内部控制的参考基因包含用于从连续稀释的等分试样的PCR扩增。通常几个重复用于每个稀释的浓度以得到扩增效率。PCR的扩增效率既可以定义为百分比(从0到1)或者作为每个周期的PCR产物的增加(从1至2)的时间。除非指定为百分比扩增效率(PE),我们指的扩增效率(E)在这篇文章中的PCR产物的增加(1〜2)。效率校准模型是一个更广义的ΔΔCT模型。CT数首先被作图的cDNA输入(或对数的cDNA输入),并且曲线的斜率计算出,以确定扩增效率(E)。ΔCT每个基因(目标或参考),然后通过从对照样品中减去目标样本的Ct数来计算。 As shown in Equation1,治疗中的靶基因表达与对照的比率可以从靶基因效率之间的比率衍生出(E目标)目标Δct的力量(Δct目标)和参考基因效率(E参考)到参考Δct的力量(Δct参考).的ΔΔCT模型可以从效率校准模型导出,如果两个目标和参照基因达到其最高的PCR扩增效率。在这种情况下,无论目标效率(E目标)和控制效率(E控制)等于2,表示每个循环期间的扩增子加倍,然后将存在与2的相同表达比-ΔΔct[7.9.].

R. 一种 T. 一世 O. = E. T. 参数 E. T. δ. C T. T. 参数 E. T. E. R. E. F E. R. E. N C E. δ. C T. R. E. F E. R. E. N C E. E. 问: 一种 T. 一世 O. N 1 MathType@MTEF@5@5@ + = feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpdaWcaaqaaiabcIcaOiabdweafnaaBaaaleaacqWG0baDcyGGHbqycqGGYbGCcqGGNbWzcqWGLbqzcqWG0baDaeqaaOGaeiykaKYaaWbaaSqabeaacqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaaaaakeaacqGGOaakcqWGfbqrdaWgaaWcbaGaemOCaiNaemyzauMaemOzayMaemyzauMaemOCaiNaemyzauMaemOBa4Maem4yamMaemyzaugabeaakiabcMcaPmaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdkhaYjabdwgaLjabdAgaMjabdwgaLjabdkhaYjabdwgaLjabd6gaUjabdogaJjabdwgaLbqabaaaaaaakiaaxMaacaWLjaGaemyrauKaemyCaeNaemyDauNaemyyaeMaemiDaqNaemyAaKMaem4Ba8MaemOBa4MaeeiiaaccbiGae8xmaedaaa@79AC@

δ.CT.T.参数ET.=CT.控制-CT.治疗和ΔCT.参考=CT.控制-CT.治疗

= 2——ΔΔCT.方程2

ΔΔCT.=δ.CT.参考- δ.CT.T.参数ET.

尽管效率校准和ΔΔCT模型都广泛应用于基因表达研究,但在分析每个实验因素以及显着性测试的分析中,没有许多论文对统计考虑的讨论。使用实质性统计分析的少数研究之一使用®程序(8.].本文提出的软件是基于效率校准模型,采用随机检验获得显著性水平。然而,文章并没有提供一个详细的模型,以说明不同的实验因素所涉及的影响。另一项实时PCR数据的统计研究使用简单线性回归模型通过Ct计算来估计比例[10].但是,模型中使用了基于对数的荧光作为因变量,我们认为这并不能充分反映实时PCR数据的性质。因此,Ct应该作为统计分析的因变量,因为它是直接受治疗、浓度和样本效应影响的结果值。两项研究都使用了效率校准模型。尽管这两种方法都已发表,但许多发表的带有实时PCR数据的研究文章实际上并没有出现P.价值观和置信区间[11-13].我们认为,这些统计数据是可取的,以方便数据的强劲解释。

先天的,我们考虑置信区间和P.ΔΔct数据的值非常重要,因为这些直接影响比率的解释。如果没有适当的统计建模和分析,则实时PCR数据的解释可能导致研究人员对临床应用中特别潜在的麻烦。我们在此开发了四种统计方法,用于使用修改的ΔΔCT方法处理实时PCR数据。统计方法可以适用于具有修改的其他数学模型。实现方法和数据控制的SAS程序,并考虑到交钥匙数据分析的实时PCR从业者。标准偏差,置信水平和P.值直接从SAS输出呈现。我们还包括了在网上补充材料的分析样本数据集和SAS方案的分析。

结果和讨论

数据质量控制

从两种用于实时PCR数据相对定量的数学模型中,我们观察到数据质量标准之间的差异。对于效率校准方法,描述此过程的作者[7.],假设不同实验样本(处理和对照)中每个基因(靶基因和参比基因)的扩增效率相同。相比之下,虽然不需要扩增效率为2,但ΔΔCt方法更严格,假设所有反应都要达到扩增效率为2。换句话说,产品的数量应该在每个周期翻倍[9.].此外,ΔΔCT方法假定各样品的PCR扩增效率会如图2所示,如果对于一组样品的PCR达到完全的扩增效率。然而,这种假设忽略不同的cDNA样品的效果。

数据质量可以通过相关模型进行检查。即使检查之间的Ct数量和浓度的相关性可以提供一个有效的质量控制,更好的方法可能是审查的Ct和对数之间的相关性(基数为2)模板的变换浓度,这应该产生显著简单的线性为每个关系基因和样品的组合。例如,对于控制样品中的靶基因,CT数应与对数转化的浓度以下等式简单的线性回归模型相关3..在公式中,Xlcon表示的对数变换的浓度,β0.表示回归线的截距βcon表示回归线的斜率[14].可接受的实时PCR数据应具有来自回归分析的两个特征。首先,坡度与-1不应显着不同。其次,如表所示,所有四种基因组合的斜率和样品1不应该与彼此有显着不同。开发了一个SAS程序以在Program1_QC.SAS中执行数据质量控制(额外的文件1).

表1分析的样本实时PCR数据。在此数据集中,有两种类型的样品(治疗和控制);两个基因(参考和目标);和四种浓度的基因和样品组合。对于数据质量控制和ANCOVA分析,实时PCR样品数据集可以根据样品和基因的组合在四组中分组。对照 - 目标组合效应被命名为第1组,治疗靶组2,对照参考组3和治疗参考组4。

CT =β0.+βconXlcon+ε.方程3

输入数据分组如表所示1额外的文件2.每一个基因和样本的组合被分为一组,从1到4。根据上述模型,使用SAS程序Proc Mixed对每组进行简单线性回归。估计了斜率的95%置信水平,预计与-1没有显著差异。用于分析样本数据集的缩写SAS输出见SASOutput.doc (额外的文件3).对于CT斜坡和对数变换浓度四组未从显著不同-1是基于95%的置信水平。除了数字输出,该方案还提供了数据质量的可视化,如图2其中的Ct数作图对数转化的模板浓度。一个简单的线性关系应的Ct数和对数转化的浓度之间可以观察到。

图2
figure2

数据质量控制.这四个类别代表了样本与基因的四种不同组合,分别是对照样本中的内参基因、对照样本中的靶基因、处理样本中的内参基因和处理样本中的靶基因。每一类都应该推导出PCR产物的Ct和对数转换浓度之间的线性相关性,斜率为-1。

多元回归模型

需要在ΔΔCT方法中考虑几种效果,即治疗,基因,浓度和重复的效果。如果我们认为这些效果作为定量变量,并且具有与这些多种效果及其交互相关的CT号,我们可以在等式4中开发多元回归模型。

CT.=β0.+βconX图标+β治疗X我请客+β基因X硫代+βcontreatX图标X我请客+βcongene.X图标X硫代+βgenetreat.X硫代X我请客+βcongenetreatX图标X我请客X硫代+ε.等式4.

在这个模型中,CT是真正的依赖,β0.是拦截,βXs为对应的X(独立)项的回归系数ε.错误术语[14].该模型考虑浓度,治疗,基因及其相互作用的影响。我们主要感兴趣的基因和治疗之间的相互作用,其中涉及的处理与对照样品中的靶基因和参考基因之间的Ct差异程度:即,ΔΔCT。ΔΔCT因此可以从β的不同组合值来估计genetreat..表中的四组1也代表了治疗和基因联合作用的选择。目的是统计检验治疗样本和对照样本中靶基因和内参基因之间的差异。因此,无效假设为靶基因和内参基因的Ct差异在治疗样本与对照样本中是相同的,可以用组合效应(CE)表示为:CE1-CE3 = CE2-CE4。另一个公式是:CE1-CE2-CE3+CE4 = 0,这将得到ΔΔCt的估计。如果不拒绝原假设,则ΔΔCt与0没有显著差异,否则,ΔΔCt可以从检验的估计中得到。这样我们就可以对β的不同组合效应进行检验genetreat.并从中估算出ΔΔCt。如式中的ΔΔCt公式所示2,如果是ΔΔCT等于0时,比例为1,这表明在对照组和治疗之间的基因表达没有变化。

一个用于多元回归模型的SAS程序

SAS过程PROC GLM用于Program2_MR.SAS中的ΔΔct估计额外的文件4.多元回归模型在模型语句中说明。基因和治疗的组合作用在估计和对比声明中评估。在对比度语句中测试CE1-CE2-CE3 + CE4 = 0的空假设,参数估计产生ΔΔct值。SAS输入文件可用额外的文件5和SAS输出为多重回归是在SASOutput.doc(额外的文件3).

SAS输出对数据进行了非常全面的分析。我们对分析的两个方面感兴趣。首先,我们要测试ΔΔCt的值是否显著不同于0P.= 0.05。如果ΔΔCT不是从0显著不同,那么我们得出结论:治疗不会对靶基因表达一个显著效果;否则,逆结束。如果效果是显著,我们感兴趣的是ΔΔCT值的标准偏差,从其中如稍后所讨论的,我们可以推导出基因表达的比率。所述SAS输出提供用于ΔΔCT点估计(-0.6848)和标准误差(-0.1185)。PROC GLM或PROC MIXED在这个应用程序可以互换的。如果实验涉及多个生物复制,复制效果也可以通过修改SAS程序考虑。然后估计将是基因,治疗和复制的组合效果。

协方差和SAS代码分析

实时PCR数据分析的另一种方法是使用协方差分析(ANCOVA)。通过将数据转换成分组数据,可以得到一个简化的模型,如表所示1额外的文件2导致等式5。

CT.=β0.+βconX图标+β团体Xigroup+βGroupcon.XigroupX图标+ε.等式5.

我们感兴趣的是两个问题。首先,四组的协方差调整后的平均值是否相等?第二,经内参基因校正后,治疗样本与对照样本的靶基因值Ct差异有多大?在这种情况下,null假设将是(μ2-μ1)-(μ4-μ3) = 0,并且测试将产生一个参数估计ΔΔCt,如Program3_ANCOVA所示。sas (额外的文件6).

实现ANCOVA模型的SAS代码与多元回归模型相似。SAS程序PROC GLM或PROC MIXED可用于实现ANCOVA模型;这里我们使用PROC MIXED。class语句定义了将对哪些变量进行显著性测试。在这种情况下,变量是浓度和群体,ANCOVA假设它们在本质上是共变的。使用对比和估计语句对群体效应进行对比,得到ΔΔCt(-0.6848),以及其标准误差(0.1185)和95%置信区间(-0.9262,-0.4435)。SAS输出具有置信度和P.value呈现在sasoutputs.doc中(额外的文件3).

简化的替代品,T.-检验和wilcoxon两组检验

更简单的方法可以用来分析实时数据,每次实验都有生物重复。该方法的主要假设是,通过将靶基因的Ct数减去内参基因的Ct数,可以调节浓度、基因和复制的加性效应,得到ΔCt如表所示2.因此,用于治疗和控制的ΔCt可以很简单T.-test,将得到ΔΔCt的估计。

表2ΔCT计算。该表呈现了ΔCt的计算,其衍生自免减去靶基因的CT参考基因。Con代表集中。

作为非参数的替代T.-test,一个Wilcoxon两组检验也可以用来分析ΔCt的两组值。有两个假设t -检验是,ΔCt的两组将有高斯分布,他们将有相同的方差。然而,这些假设在许多使用实际小样本的实时PCR实验中并不有效。因此,在这种情况下,无分布的Wilcoxon检验将是一个更可靠、更合适的选择[15].

已经为两者开发了一个SAS程序t -测试和Wilcoxon两组测试如所附程序Program4_TW所示。sas (额外的文件7).采用SAS程序、TTEST和UNIVARIATE进行数据分析。SAS Macro的摩西。sas (15额外的文件8用来推导置信水平。SAS输入文件在额外的文件9SasOutput.doc的示例数据分析的SAS输出可用(额外的文件3).由于差异的估计是从对照样本中减去处理的,实际的ΔΔCt应该是输出估计的倒数。

四种方法和数据介绍的比较

表中给出了四种方法的比较3..多元回归和ANCOVA对ΔΔCt估计的结果完全相同,因为这两种方法使用相同的数学方法进行参数估计。这T.-test提供了与ΔΔCt相同的点估计,但是标准误差略大,导致置信区间较大。Wilcoxon两组检验提供了一个略小的ΔΔCt估计。四种方法的高度相似的结果验证了模型和SAS程序。模型和程序的选择将取决于实验设计和实验的严格程度和质量。然而,由于其非参数性质,最保守的检验是Wilcoxon两组检验,它是分布无关的。

表3四种方法的比较。表列出了ΔΔct,标准误差,P.-值和置信区间由本文提出的四种方法得到。无论是SAS包还是使用的宏都不提供Wilcoxon两组检验的标准误差。我们认为置信区间对于进一步的数据转换是充分的。

数据质量控制

目前的许多实时PCR实验不包括标准曲线设计,也没有使用估计扩增效率的方法。我们认为real-time PCR数据如果没有适当的质量控制是不可靠的,因为real-time PCR的效率会对比例估计和动态范围产生显著影响。例如,PCR扩增效率(PE)为0.8时(即PCR产物增加20.8倍,而不是每循环2次),为3的ΔCT值只能被转换为在比5.27倍的差异,而不是8倍。当ΔΔCTΔCT或值较大,扩增效率较低,这可能会导致严重偏斜的解释,这个问题变得放大。

因此,我们根据本文提出的SAS程序模型提出了两种实时PCR数据质量控制标准。首先,需要进行连续稀释模板的实验,以估计每个基因在每个样本中的扩增效率。一些研究人员认为,由于使用了相同的引物对和扩增条件,不同样本中每个基因的扩增效率是相同的。但是,我们发现样本效应确实对放大效率有影响。换句话说,同一基因从不同的cDNA模板样品中扩增时,扩增效率可能是不同的。因此,我们认为每个基因和样本组合的标准曲线的实验设计是最优的。其次,在最优条件下,Ct数与以2为基础的对数模板量的曲线应产生与-1无显著差异的斜率,这表明扩增效率接近2。虽然效率校准模型和改进后的ΔΔCt模型均允许扩增效率低于2,但通过优化引物选择、扩增子长度和实验条件,所有反应的扩增效率均接近2是最可靠的。根据我们的经验,保持所有的放大效率都在2附近是实现样品间放大效率相等的最佳方式,从而确保高质量的数据。实验还发现,接近2的放大效率有助于扩大比率估计的动态范围。

P.-value、置信区间和数据表示

P.-value是显著性水平的重要参数,置信区间有助于建立ΔΔCt估计的可靠范围。目前大多数实时PCR的出版物都没有出现P.- 值和置信区间[11-13].我们相信披露P.当研究人员声称样本或治疗方法之间存在差异时,-值是重要的。在我们的节目中,所有的P.-value来自于测试ΔΔCt等于0的空假设。因此,一个小P.-Value表明ΔΔct与0显着不同,这证明了显着效果。解释一个P -值将取决于实验的目标。例如,在P.治疗与对照实验的治疗中= 0.05,我们可以要求治疗具有显着效果;在组织比较实验中,我们可以声称基因表达在组织中具有显着差异。

有些出版物提出的比率的标准偏差作为一个有意义的量度。然而,我们在这里认为比的标准偏差应ΔΔCT的标准差导出;和的比的置信区间应ΔΔCT的置信区间来导出。换言之,比率的点估计应为2-ΔΔct和用于比的置信区间应为(2-ΔΔcthcl, 2-ΔΔCtLCL).由于Ct是实验过程中观察到的值,所以应该进行统计分析。直接按比率进行统计分析的做法是不恰当的。数据的表示需要参考ΔΔCt以及随后由2推导出的比率和置信区间——ΔΔCt。

对扩增效率小于2的实时PCR数据进行统计分析

如前所述,通过适当的扩增引物、RNA质量和cDNA合成方案,PCR扩增效率可优化为2左右。实时PCR引物设计的最新进展使实验优化变得更容易[1617].然而,无论对实验条件的严格控制如何,都可能发生少于理想的实时PCR数据。有三种情况用于次优实时PCR数据。在第一场景中,所有PCR反应具有相同的放大效率,但效率与2.在第二种情况下,PCR扩增效率仅由基因不同。换句话说,在所有生物样品中相同的基因相同的扩增效率是相同的;然而,扩增效率在不同的基因之间变化。在第三种情况下,PCR扩增效率因基因和样品而异。我们认为第三种情况下的数据是不可接受的,因为许多其他人报告了[1018].在任何这些方案中,调整后的ΔΔct可以通过在“估计”和“对比”的SAS程序的语句中包括PE来源于ANCOVA模型。

已经开发了几种方法来计算低质量数据的放大效率。其中一种方法称为“动态数据分析”,利用PCR反应的荧光史来计算扩增效率[1920.].该方法的优点在于能够分析低质量的数据,避免了标准曲线,节省了成本。然而,由于数学上的复杂性和可靠性争议,该方法的应用并不像传统的标准曲线方法那样广泛[101618].在我们的方法中,已经存在一个标准曲线,可以用来推导放大效率(E)。考虑方程中简单的线性回归模型3., 如果Xlcon表示基于10个基于对数转换的浓度,放大效率(E)是10- (1 /斜率) 10 1 / β con MathType@MTEF@5@5@ + = feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqaIXaqmcqaIWaamdaahaaWcbeqaaiabgkHiTiabcIcaOiabigdaXiabc + caVGGaciab = j7aInaaBaaameaacqqGJbWycqqGVbWBcqqGUbGBaeqaaSGaeiykaKcaaaaa@3921@ 根据Ramussen 2001和Pfaffl 2001 [7.21].在我们的模型中,Xlcon表示基于2个对数转换的浓度,因此放大效率(e)是2- (1 /斜率) 2 1 / β con 的MathType @ MTEF @ 5 @ 5 + = feaafiart1ev1aaatCvAU​​fKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = VR0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqaIYaGmdaahaaWcbeqaaiabgkHiTiabcIcaOiabigdaXiabc + caVGGaciab = j7aInaaBaaameaacqqGJbWycqqGVbWBcqqGUbGBaeqaaSGaeiykaKcaaaaa @ 3835 @ ,其中PE可表示为-(1/β)con).

在上述第一场景中,所有PCR扩增具有相同的效率,但效率不等于1.那么基因表达的比例可以在以下等式中表示。

R. 一种 T. 一世 O. = E. δ. δ. C T. = [ 2 1 / β C O. N ] δ. δ. C T. = 2 δ. δ. C T. * P. E. E. 问: 一种 T. 一世 O. N 6. MathType@MTEF@5@5@ + = feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpcqWGfbqrdaahaaWcbeqaaiabgkHiTiabfs5aejabfs5aejabdoeadjabdsha0baakiabg2da9iabcUfaBjabikdaYmaaCaaaleqabaGaeyOeI0IaeiikaGIaeGymaeJaei4la8ccciGae8NSdi2aaSbaaWqaaGqaciab gavjab + ngaJjab + 9 + 5 gaubqabawccqggpaqkaagccqggdbqxdaahaawcbeqaaiabgkhitiabfs5aejabfs5aejabdoeadjabdsha0baakiabg2da9iabikdaymaacaaaleqabagaeyoei0iaeuildqkaeuildqkaem4qamkaemidaqnaeiokaoiaemiuaalaemyraueaaogaaczcaiaaxmaacqwgfbqrcqwgxbqccqwg1bqdcqwghbqycqWG0baDcqWGPbqAcqWGVbWBcqWGUbGBcqqGGaaicqGF2aGnaaa@6ABA@

体育= - (1 /βcon),ΔΔCt调整=pe *ΔΔct.

在等式6中,βcon是绘图的汇集斜率,CT针对基于对数2的浓度。β.con可以用SAS中的相关函数计算,如Program5_LowQualityData所示。sas在额外的文件10.在第二场景中,扩增效率仅由基因不同。根据方程式1,我们有以下的公式,其中β0.Ct对log的曲线的集合斜率是多少2(浓度)对每个基因。

R. 一种 T. 一世 O. = E. T. 参数 E. T. δ. C T. T. 参数 E. T. E. C O. N T. R. O. L. δ. C T. C O. N T. R. O. L. = [ 2 1 / β C O. N T. 参数 E. T. ] δ. C T. T. 参数 E. T. [ 2 1 / β C O. N C O. N T. R. O. L. ] δ. C T. C O. N T. R. O. L. = 2 P. E. T. 参数 E. T. δ. C T. T. 参数 E. T. P. E. C O. N T. R. O. L. δ. C T. C O. N T. R. O. L. E. 问: 一种 T. 一世 O. N 7. 的MathType @ MTEF @ 5 @ 5 + = feaafiart1ev1aaatCvAU​​fKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = VR0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpdaWcaaqaaiabcIcaOiabdweafnaaBaaaleaacqWG0baDcyGGHbqycqGGYbGCcqGGNbWzcqWGLbqzcqWG0baDaeqaaOGaeiykaKYaaWbaaSqabeaacqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaaaaakeaacqGGOaakcqWGfbqrdaWgaaWcbaGaem4yamMaem4Ba8MaemOBa4MaemiDaqNaemOCaiNaem4Ba8MaemiBaWgabeaakiabcMcaPmaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaaaaaaakiabg2da9maalaaabaGaei4waSLaeGOmaiZaaWbaaSqabeaacqGHsislcqGGOaakcqaIXaqmcqGGVaWliiGacqWFYoGydaWgaaadbaGaem4yamMaem4Ba8MaemOBa4MaemivaqLagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaliabcMcaPaaakiabc2faDnaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdsha0jGbcggaHjabckhaYjabcEgaNjabdwgaLjabdsha0bqabaaaaaGcbaGaei4waSLaeGOmaiZaaWbaaSqabeaacqGHsislcqGGOaakcqaIXaqmcqGGVaWlcqWFYoGydaWgaaadbaGaem4yamMaem4Ba8MaemOBa4Maem4qamKaem4Ba8MaemOBa4MaemiDaqNaemOCaiNaem4Ba8MaemiBaWgabeaaliabcMcaPaaakiabc2faDnaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaaaaaaakiabg2da9iabikdaYmaaCaaaleqabaGaeiikaGIaemiuaaLaemyrau0aaSbaaWqaaiabdsha0jGbcggaHjabckhaYjabcEgaNjabdwgaLjabdsha0bqabaWccqGHxiIkcqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaliabgkHiTiabdcfaqjabdweafnaaBaaameaacqWGJbWycqWGVbWBcqWGUbGBcqWG0baDcqWGYbGCcqWGVbWBcqWGSbaBaeqaaSGaey4fIOIaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaWccqGGPaqkaaGccaWLjaGaaCzcaiabdweafjabdghaXjabdwha1jabdggaHjabdsha0jabdMgaPjabd + gaVjabd6gaUjabbccaGGqaciab + Dda3aaa @ F60B @

体育目标= - (1 /βconTarget),体育控制= - (1 /βconControl),ΔΔCt调整=体育目标*ΔCt目标-体育控制*ΔCt控制

在等式7中,βconTargetβconControl是CT的汇集斜率分别针对基于对数2的靶基因和参考基因的浓度。斜坡可以通过Program5_LowQualityData.sas计算(附加文件10).这ΔΔCt调整可以用相同的程序计算。从理论上讲,当PCR扩增效率因基因和样本不同而不同时,也可以推导出第三种情况的方程。但在实际应用中,由于放大效率变化较大,我们不认为第三种方案的数据是可接受的[1018].

Program5_LowQuatilityData。sas在附加文件10提供了解决方案来导出调整ΔΔCT在第一和第二方案。通过用基因扩增效率不同的数据集被在LowQualityData.txt设置在附加文件11来说明SAS程序的使用。由于实验中所涉及的重复次数有限,数据集的质量较低。计算的过程包括四个步骤ΔΔCt调整.第一步是执行如Methods所示的数据质量控制测试。从SAS输出中,我们可以得出结论,LowQualityData数据集不满足2的要求-ΔΔct方法,因为其中一组PCR扩增效率明显不同于1,如SASOutput.doc (额外的文件3).

第二步是通过观察LCON和类交互的III型平方和来测试等于的PCR效率(或斜率)。一个低P.值表示不同组(类)的PCR与对数转化浓度的相互作用,反过来表示不同组PCR之间的斜率不等。如果所有PCR扩增效率相等,则可计算汇集扩增效率,并将其整合到SAS程序中ΔΔCt调整计算。在这组数据中,III型平方和有aP.值小于0.05,扩增效率并不相同。然后对每个基因进行等斜率测试,以确定每个基因的PCR扩增效率是否相同。两个基因的扩增效率无显著差异,α值均为0.05。所有III型平方和输出都可以在SASOutput.doc (额外的文件3).

下一步是计算混合斜率(β)con)对于每个基因导出百分比扩增效率(PE = - (1 /βcon))对于每个基因。基于基于CT和对数2的浓度之间的相关性导出汇总斜率。β.cons的两个基因分别为-1.0813和-1.0137,如SASOutput.doc (额外的文件3),用于计算LowQualityData数据集的放大效率。与βcon, - (1 /βcon)或PE可以分别为每个基因计算0.925和0.987。ΔΔct.调整然后用PEs将“估计”和“对比”语句中的每个基因替换为1进行计算。SAS程序如下所示附加文件10

标题2'用调整后的效率计算deltadelact';

PROC混合数据= TR2订单=数据;

类类欺诈;

模型Ct = Con Class Con*Class/SOLUTION NOINT;

对比“拦截”类0.925-0.925-0.9870.987;

估计“拦截”类0.925-0.925-0.9870.987/ cl;

运行;

用于分析的SAS输出在SASOutput.doc中(额外的文件3).ΔΔct.调整因此-1.0901是-1.0901,改变是显着的P.价值非常小。该比率可以表示如标准ΔΔCT方法中所讨论的。该实施例中的比率的点估计为2.129,95%置信区间是(1.926,2.353)。

总的来说,在优化程度较低的PCR反应中,统计分析不仅复杂,而且在精度和效率方面也存在一定的问题。因此,在使用低质量的实时PCR数据进行统计分析时应谨慎,因为低质量的实时PCR数据容易因效率调整而产生误差[1018].

结论

在本报告中,我们提出了四种模型的实时PCR数据和一个数据质量控制的过程。SAS程序是为所有应用程序开发的,并分析了一组样本集。具有不同模型和程序的分析产生了相同的ΔΔct和类似的置信区间估计。数据质量控制和分析程序将有助于建立鲁棒系统以研究具有实时PCR的相对基因表达。

方法

植物材料,RNA提取,实时PCR和样本数据集

样本数据集(表1用于分析)从后述的实验来了。拟南芥蒂利亚纳(Col1)植物在23°C、14小时光照条件下生长4周。用RNeasy Plant Mini Kit (Qiagen, Inc.)从茉莉酸甲酯处理的植物中分离总RNA拟南芥, alamethecin治疗拟南芥用柱上DNA酶(Qiagen, Inc.)处理去除DNA污染。用iScript cDNA合成试剂盒(BioRad Laboratories)以20 μL反应将1微克总RNA合成为第一链cDNA。将cDNA稀释成10 ng/μL、2 ng/μL、0.4 ng/μL和0.08 ng/μL的浓度序列。使用Applied Biosystems公司的ABI 7000序列检测系统(Applied Biosystems)对每个浓度进行3个重复的实时PCR实验。以泛素为内参基因,引物序列为拟南芥遍在蛋白基因是CACACTCCACTTGGTCTTGCG(F)和TGGTCTTTCCGGTGAGAGTCTTCA(R)。对于靶基因的引物(MT_7)通过引物表达软件(Applied Biosystems)设计和序列是CCGCGGTACAAACCTTAATT(F)和TGGAACTCGATTCCCTCAAT(R)。MT-7基因是拟南芥蒂利亚纳基因At3g44860编码对金合欢酸具有高催化特异性的蛋白[22].进行引物滴定和解离实验,避免引物二聚体或假扩增子干扰实验结果。real-time PCR实验结束后,内参基因和靶基因的Ct值均采用自动基线和手动阈值法提取。

实时PCR实验设计,数据输出,转化,编程

效率校准方法和ΔΔCT方法的主要限制是,只有一组的cDNA样品的被用来确定扩增效率。这是假设相同的扩增效率,可以应用于其它cDNA样品,只要该引物和扩增条件是相同的。然而,扩增效率不仅依赖于引物的特性,而且不同的cDNA样品之间变化。使用标准曲线为仅一组测试的样品以得到扩增效率可能会忽略由样品的差异引入的误差。在我们的实验设计中,我们有四个浓度三个重复实验涉及的所有样本和基因进行标准曲线实验。的ΔΔCT将只从标准曲线推导,并且数据质量检查每个基因和样品的组合。两个样品的分析示于本文,例如,一个最小的三个浓度的两种重复的PCR的将需要对每个样品。即使需要付出更多的努力,该数据是基于统计模型严格的数据质量控制和数据分析的更可靠的了。

输出数据集包括CT号,基因名称,样本名称,集中和复制。我们使用了微软®Excel以来自ABI 7000序列分析系统打开导出的Ct文件,然后将数据转换为用于SAS处理的制表符分隔文本文件。样本数据集被示于表1

所有程序均采用SAS 9.1 (SAS Institute)开发。

参考文献

  1. 1.

    克莱恩D:实时荧光定量PCR技术的应用与局限性。摩尔医学的趋势2002年,8:257-260。10.1016 / S1471-4914(02)02355-9

    CAS文章谷歌学术

  2. 2.

    busin sa:mRNA的绝对定量使用实时反转录聚合酶链反应测定。J摩尔性2000年,25:169-93。10.1677 / jme.0250169

    CAS文章PubMed谷歌学术

  3. 3.

    Mocellin S, Rossi CR, Pilati P, Nitti D, Marincola FD:实时定量PCR:癌症研究的强大盟友。摩尔医学的趋势2003年,9:189 - 195。10.1016 / s1471 - 4914 (03) 00047 - 9

    CAS文章谷歌学术

  4. 4.

    Mason G,Provero P,Vaira Am,Accotto GP:利用实时荧光定量PCR技术估算转化植物的整合数量。BMC生物技术2002年,2:20.10.1186 / 1472-6750-2-20

    公共医学中心文章PubMed谷歌学术

  5. 5.

    Heid CA, Stevens J, Livak KJ, Williams PM:实时定量PCR。基因组res.1996年,6:986 - 994。

    CAS文章PubMed谷歌学术

  6. 6.

    Gibson UE, Heid CA, Williams PM:一种实时定量RT-PCR的一种新方法。基因组res.1996年,6:995 - 1001。

    CAS文章PubMed谷歌学术

  7. 7。

    pfaffl mw:一种新的实时RT-PCR相对定量数学模型。诊断酸Res2001年,29:2002 - 2007。10.1093 / nar / 29.9.e45

    文章谷歌学术

  8. 8。

    帕夫勒MW,霍根GW,邓普夫勒L:用于组的相对表达软件工具(REST(C))对于基团的比较和相对表达的统计分析导致实时PCR。诊断酸Res2002年,30:E36。10.1093 / nar / 30.9.e36

    公共医学中心文章PubMed谷歌学术

  9. 9。

    Livak KJ,Schmittgen TD:利用实时荧光定量PCR技术分析相关基因表达数据-ΔΔct方法。方法2001年,25:402 - 408。10.1006 / meth.2001.1262

    CAS文章PubMed谷歌学术

  10. 10.

    库克P,富C,希基男,汉族ES,米勒KS:SAS实时RT-PCR程序具有多个独立样本。生物学技术2004年,37:990 - 995。

    CASPubMed谷歌学术

  11. 11.

    Zenoni S,Reale L,Tornielli GB,Lanfaloni L,Porcenddu A,Ferrarini A,Moretti C,Zamboi A,Speghini A,Ferranti F,Pezzotti M:Downregulation的矮牵牛织布达α棒曲霉素的基因PhEXP1减少细胞壁中的晶状纤维素的数量,导致花瓣枝干的表型改变。植物细胞2004年,16:295 - 308。10.1105 / tpc.018705

    公共医学中心CAS文章PubMed谷歌学术

  12. 12.

    Eleaume H,Jabbouri S:在实时定量RT-PCR 2层标准化的方法来跟踪比较金黄色葡萄球菌在体外生长期间表达的基因。Ĵ微型方法2004年,59:363 - 370。10.1016 / j.mimet.2004.07.015

    CAS文章谷歌学术

  13. 13.

    沈华,何丽芬,Sasaki T, Yamamoto Y,郑淑娟,Ligaba A, Yan XL, Ahn SJ, Yamaguchi M, Hideo S, Matsumoto S:柠檬酸盐分泌与铝应力下大豆根尖的调节耦合。转录,翻译和苏氨氨基磷酸化的um-调节血浆膜H的磷酸化+-ATPase。植物杂志2005年,138:287 - 296。10.1104 / pp.104.058065

    公共医学中心CAS文章PubMed谷歌学术

  14. 14.

    Kutner MH,Nachtsheim CJ,Neter J,William L:应用线性统计模型.第五版。麦格劳-希尔,欧文,CA;2005.

    谷歌学术

  15. 15.

    荷兰人M,沃尔夫DA:非参数统计方法.John Wiley and Sons,纽约;1973:503。

    谷歌学术

  16. 16.

    Bustin SA, Benes V, Nolan T, Pfaffl MW:定量实时RT-PCR——一个展望。J摩尔性2005年,34:597 - 601。10.1677 / jme.1.01755

    CAS文章PubMed谷歌学术

  17. 17。

    Pattyn F Speleman F De Paepe A Vandesompele J:RTPRIMERDB:实时PCR引物和探头数据库。诊断酸Res2003年,31日:122 - 123。10.1093 / nar / gkg011

    公共医学中心CAS文章PubMed谷歌学术

  18. 18。

    Peirson SN, Butler JN, Foster RG:实时荧光定量PCR数据分析的新方法和传统方法的实验验证。诊断酸Res2003年,31日:E73。10.1093 / nar / gng073

    公共医学中心文章PubMed谷歌学术

  19. 19。

    刘炜:一种基于聚合酶链反应动力学模拟的实时反转录定量聚合酶链反应检测新方法。学生物化学肛门2002年,302:52-59。10.1006 / abio.2001.5530

    CAS文章PubMed谷歌学术

  20. 20.

    Tichopad A,Dilger M,Schwarz G,Pfaffl MW:从单一反应装置中标准化测定实时PCR效率。诊断酸Res2003年,31日:e122。10.1093 / nar / gng122

    公共医学中心文章PubMed谷歌学术

  21. 21.

    拉斯穆森R:量化光轮。快速循环实时荧光定量PCR方法及应用海德堡.编辑:Meuer S, Wittwer C, Nakagawara K.施普林格出版社;2001:21-34。

    谷歌学术

  22. 22.

    杨y,元js,ross j,noel jp,pichersky e,chen f:一个拟南芥蒂利亚纳甲基能甲基farnesoic酸。学生物化学拱Biophys2005年,媒体。纠正证明证明

    谷歌学术

下载参考

作者信息

从属关系

作者

相应的作者

对应于ç尼尔·斯图尔特JR

额外的信息

作者的贡献

JSY进行了实时PCR实验,建立了统计模型和SAS分析程序,并起草了文章。AR在SAS编程和数据建模方面提供了帮助。FC为实时PCR实验提供了帮助。中新社负责监督工作,概念化非参数要素,并最终确定草案。

电子补充材料

附加文件1:SAS程序实现了数据质量控制过程。(SAS 864字节)

12859_2005_824_MOESM2_ESM.txt

附加文件2:数据为Program1_qc.sas和program3_ancova.sas提供输入数据。数据根据样品和基因的不同组合分组了CT值。(TXT 690字节)

附加文件3:所有分析的缩写SAS输出。(DOC 48 KB)

附加文件4:SAS程序实现了多元回归模型,推导ΔΔCT。(SAS 608字节)

12859_2005_824_moesm5_esm.txt.

附加文件5:program2_mr.sas的输入数据,其中包含样本,基因,浓度和ct号。(TXT 1 KB)

附加文件6:SAS程序实现了ANCOVA模型并导出ΔΔCt。(SAS 441字节)

12859_2005_824_moesm7_esm.sas.

附加文件7:SAS程序在ΔCt上执行学生t测试和Wilcoxon两组测试来推导ΔΔCt。(SAS 580字节)

附加文件8:SAS程序是一个宏,用于导出Wilcoxon两组测试的置信区间。(SAS 5 KB)

附加文件9:Program4_TW.sas的输入数据。数据只包含示例名称和ΔCt。(TXT 408字节)

附加文件10:的SAS程序进行测试为等于斜率,斜率分组并调整ΔΔCT。(SAS 2 KB)

附加文件11:用于Program5_LowQualityData.sas输入数据。(TXT 317字节)

作者为图像提交的原始文件

以下是与作者的原始提交的图像的链接。

作者的原始文件为图1

作者的原始文件为图2

权利和权限

开放获取本文在“生物资源”中央有限公司的许可下公布了这是一个开放式访问条款,分配根据创意公约归188bet金博宝欧洲杯哪里能买球因许可证的条款(https://creativecommons.org/licenses/by/2.0.)提供任何介质中的不受限制使用,分发和再现,所以提供了正确的工作。

再版和权限

关于这篇文章

引用这篇文章

元,J.S.,Reed,A.,Chen,F。等等。实时PCR数据的统计分析。www.188bet com7,85(2006)。https://doi.org/10.1186/1471-2105-7-85

下载引用

关键词

  • 参考基因
  • 扩增效率
  • 数据质量控制
  • 简单线性回归模型
  • 对数转换后的浓度