随机化完全区组设计 RCBD

基本定义和概念

  1. 讨厌因子(nuisance factor)是一个可能对响应产生影响的设计因子,但是我们对之并不感兴趣。

  2. 当讨厌因子有时是未知不可控时,我们采用随机化处理;当讨厌因子是已知不可控时,我们采用协方差分析;当讨厌因子是已知可控时,我们采用区组化(blocking)设计。

  3. 随机化完全区组设计(randomized complete block design)是指每一个区组内包含所有的处理。区组表示的是随机化约束。

  4. RCBD 统计模型:

    • 效应模型 effect model:

    • 均值模型 :

    • RCBD 方差分析等式,其中自由度分别是 $ab-1$,$a-1$,$(a-1)(b-1)$:

  5. 对区组的均值进行方差检验,其中 进行比较似乎可以验证假设 。通常来说,方差分析F的检验只需要基于随机化就可以说明是合理的,无需正态性假设,但是这对比较区组的均值的检验却并不适用,实际上这里的F的比值是检验区组的均值的等式加随机化约束。但在实践中,F检验法可以作为研究区组变量效应的一种近似的方法,当这一比值较大时,可以说明区组因子有较大影响。

  6. RCBD 是一种降噪设计技术,它能有效地增加数据中的信噪比,提高了处理均值比较的精度。

多重比较

RCBD 多重比较的方法与标准的方差分析的方法类似,可以使用方差分析中任意一种多重比较的方法,只需要将其中的公式简单地用区组数($b$)代替单因子完全随机化设计的重复次数($n$)就可以了;此外,还要使用随机区组设计中误差的自由度数$(a-1)(b-1)$来代替完全随机化设计的误差自由度 $[a(n-1)]$。

模型合适性检验

我们需要警惕那些由正态性假定、处理或者区组的不等的误差方差以及区组-处理交互作用引起的潜在问题。如同在完全随机化设计中那样,残差分析是用于这类诊断性检验的主要工作。

如果残差与预测值低是一条曲线,例如对于低的预测值,存在着产生负残差的趋势,对于中等的预测值,存在着产生正残差的趋势,而对于高预测值,则尊在产生负残差的趋势,则这类图像暗示着区组与处理间存在交互作用。

随机完全化区组设计的其他方面

  1. 随机化区组模型的可加性:用于随机化区组设计的线性模型是可加的。
  2. 随机处理与区组:
    • 如果处理和区组是随机的,方法同样适用。不过在对结果进行解释时,需要做相应的更改。
    • 在区组是随机的情况下,如果出现处理-区组的交互作用,则关于处理均值的检验不收交互作用的影响。这是因为出处理和误差的期望均方值二者都含有交互作用效应。
  3. 样本量的选择:增加区组数会增大重复得到次数和误差的自由度,使得设计更加灵敏。关于随机化单因子设计的有关实验重复次数的方法仍然使用。只需注意自由度的问题。但增加区组数会增加实验成本,因此要权衡利弊,选择注意自由度的数值。
  4. 缺失值的估计:对于缺失值,一般有两种方法
    • 近似分析法:估计这一缺失值,并把它作为真实数据进行通常的方差分析,并将误差自由度减小1;但这一方法会产生有偏均方值,得出过多的显著性结论。
    • 精确分析法:用一般回归的显著性检验法来精确分析
  5. 一般回归的显著性检验法可以用来进行随机化完全区组设计的方差分析