For example - PowerPoint
Document Sample


注:资料来源于中国数学会均匀设计分会
前 言
沐浴在改革开发的阳光下,神州大地生机盎然,
新生事物层出不穷。在科教兴国建设社会主义的
过程中,人们所熟悉的那些传统的试验设计方法
(如对比试验设计、全面试验设计、正交试验设
计等),已不能充分满足快节奏高效率的要求。
新时期呼唤新思维,新方法。
中国科学家巧妙的将“数论方法”和“统计试验
设计”相结合,发明了一种全新的试验设计方法
,这就是均匀设计法。
均匀设计法诞生于1978年。由中国著名数学
家方开泰教授和王元院士合作共同发明。
正交设计可使试验点“均匀分散、整齐可
比”,为保证“整齐可比性”,使试验设计的
均匀性受到了一定限制,使试验点的代表性还
不够强,试验次数不能充分地少。
均匀设计是另一种部分实施的试验设计方
法。它可以用较少的试验次数,安排多因素、
多水平的析因试 验,是在均匀性的度量下最好
的析因试验设计方法。它可以使试验点在试验
范围内充分地均匀分散,不仅可大大减少试验
点,而且仍能得到反映试验体系主要特征的试
验结果。
下面通过制药工业中的一个实例来说
明均匀试验设计方法。
例1.1 :阿魏酸的制备
阿魏酸是某些药品的主要成分,在制
备过程中,我们想提高阿魏酸产量。
根据试验目的,确定以阿魏酸产量作为试验
指标Y。
经过资料查阅,分析研究,选出影响阿魏酸产量的试
验因素,确定试验因素水平为:
原料配比:1.0---3.4
吡啶总量:10----28
反应时间:0.5---3.5
确定每个因素相应的水平数为7。
如何安排试验?
全面交叉试验要N=73=343次,太多了。
建议使用均匀设计。查阅均匀设计表。
“方开泰,均匀设计与均匀设计表,科学出版社
(1994)” 之附表 1
也可以浏览如下网页:
网络地址:http://www.math.hkbu.edu.hk/UniformDesing
第1步: 列出试验因素水平表
表 1.1.1 试验因素水平表
x1 x2 x3
因素 原料配比 吡碇总量 反应时间
(ml) (hr)
1.0 10 0.5
水 1.4 13 1.0
1.8 16 1.5
2.2 19 2.0
平 2.6 22 2.5
3.0 25 3.0
3.4 28 3.5
第2步: 选择相应的均匀设计表
均匀设计表格式见下,其含义为:
因素数
均匀设计
Un(q s)
试验总次数 因素水平数
例如:
表 1.1.3: U 9 (94 )
表 1.1.2: U 7 (7 4 ) No. 1 2 3 4
No. 1 2 3 4 1 1 2 1 3
1 1 2 3 6 2 2 5 4 5
2 2 4 6 5 3 3 9 8 7
3 3 6 2 4 4 4 3 6 9
4 4 1 5 3 5 5 4 7 1
5 5 3 1 2 6 6 7 2 6
6 6 5 4 1 7 7 1 9 4
7 7 7 7 7 8 8 6 3 8
9 9 8 5 2
每个均匀设计表都有一个使用表,它将建议我们如何选
择适当的列安排试验因素,进行试验设计,这样可以减少“
试验偏差”。其中‘偏差’为均匀性的度量值,数值小的设
计表示均匀性好。例如 U7 (74)的使用表为:
因素数 列号 偏差
2 1, 3 0.2398
3 1, 2, 3 0.3721
4 1, 2, 3, 4 0.4760
表1.1.2: U 7 (7 4 ) 表 1.1.4:
No. 1 2 3 4 No. 1 2 3
1 1 2 3 6 1 1 2 3
2 2 4 6 5 2 2 4 6
3 3 6 2 4 3 3 6 2
4 4 1 5 3 4 4 1 5
5 5 3 1 2 5 5 3 1
6 6 5 4 1 6 6 5 4
7 7 7 7 7 7 7 7 7
第3步: 应用选择的 UD-表安排试验,设计试验方案
表 1.1.5: 试验方案 1. 将 x1, x2和 x3放入均匀设
No. 1 1
x 2
x2 x3 y 计表的1,2和3列;
3
1 1 2
1.0 13 1.5 3 0.330 2.用x1的7个水平(值)替
2 2 4
1.4 19 3.0 6 0.366 代第一列的1到 7;
3 1.8 25 1.0
3 6 2 0.294
4 2.2 10 2.5
4 1 5 0.476 3. 对第二列,第三列做同样
的替代;
5 2.6 16 0.5
5 3 1 0.209
6 3.0 22 2.0
6 5 4 0.451 4. 按设计的方案进行试验,得
3.4 28 3.5 到7个结果,将其放入最后一
7 7 7 7 0.482
列。
第 4步: 用回归模型匹配数据
首先,考虑线性回归模型:
y 0 1 x1 2 x2 3 x3 (1.1.1)
使用回归分析中变量筛选的方法,比如‘向后法’,得到
推荐的模型为:
y 0.2142 0.0792 x3
ˆ (1.1.2)
这个结果与人们的经验不符。
然后,我们尝试用二次回归模型来匹配这些数据:
y 0 1 x1 2 x2 3 x3 11 x12 22 x2 33 x3
2 2
12 x1 x2 13 x1 x3 23 x2 x3 (1.1.3)
使用‘向前’的变量选择法,我们发现适宜的模型:
y 0.06232 0.25 x3 0.06 x3 0.0235 x1 x3
ˆ 2
(1.1.4)
表 1.1.6: 方差分析(ANOVA) 表
来源 df SS MS F p
回归 3 0.062190 0.020730 43.88 0.006
误差 3 0.014170 0.000472
总和 6 0.063608
14
具有 R 2 0.978, s 0.02174,
t x3 6.41, t x 2 5.64, t x1x3 4.88.
3
模型 y 0.06232 0.25 x3 0.06 x3 0.0235 x1 x3
ˆ 2
(1.1.4)
中的三项,在 5%的水平下都是显著的。
图1.1.1:
ˆ
残差与y的示意图
yy
ˆ
状态是正常的,所以模型
(1.1.4)是可接受的。
ˆ
y
16
图 1.1.2a 匹配图 图 1.1.2b 正态 Q-Q 图
图 1.1.2c偏回归图
第5步: 优化 -- 寻找最佳的因素水平组合
表1.1.5的设计是73=343个全面试验的部分实施, 其中最好的
试验点是值为Y= 48.2%的 #7。它不一定是全局最好的。人
们想找到满足下式的x1*和 x3* :
Y ( x1 , x3 ) max Y ( x1 , x3 )
ˆ * * ˆ
这里求取max的区域为:
1 x1 3.4, 0.5 x3 3.5
且 ˆ
Y ( x1, x3 ) 0.06232 0.25x3 0.06x3 0.0235x1 x3
2
18
图 1.1.3
等值线图 (x1*,x3*)
x1x3的回归系数是正的,x3的回归系数也是正的, x1* = 3.4。
ˆ 2
Y (3.4, x3 ) 0.06232 0.3309x3 0.06 x3
在x3* = 2.7575达到最大值 。
在x1* = 3.4和 x3* = 2.7575处估计响应的最大值是 51.85% 。它
比7个试验点的最好值48.2%还大。
讨论:
因素 x2 没有给响应Y予显著的贡献,我们可以选x2为
其中点 x2 = 19 ml.
求出的x1* = 3.4 在边界上, 我们需要扩大x1的试验上限。
在x1 = 3.4和 x3 = 2.7575的邻域,追加一些试验是必要的。
在第5步,一些优化算法是很有用的。
混合型水平的均匀设计
试验中各因素若有不同水平数,比如,其
水平数分别为q1,…,qk。
这时应使用相应的混合均匀设计表。见
“方开泰,均匀设计与均匀设计表,科学出版
(1994).”
之附表2
每个混合水平表有一个记号,含义为:
定量因素
均匀设计 的最大数
Un(q1 × … × qk )
各定量因素
试验次数
之水平数
下表是一个混合水平均匀设计表:
此均匀设计表
试验总数n为
12,用它可以
安排水平数为
6、4、3的
因素各一个。
U12(624)
1 2 3
1 1 2 3
2 1 3 2
3 2 5 1 它的试验数
4 2 6 4
5 3 1 2
n为 12。可
6 3 3 1 以安排二个6
7 4 4 4 水平因素和
8 4 6 3
9 5 1 1
一个4水平因
10 5 2 4 素的设计。
11 6 4 3
12 6 5 2
此表也是混合水平均匀设计表。
23
例2 .1:在农业试验中
考虑4个因素:
平均施肥量X,分为12个水平
(70,74,78,82,86,90,94,98,102,106,110,114);
种子播种前浸种时间T,分为6个水平(1,2,3,4,5,6);
土壤类型B,分4种B1,B2,B3,B4;
种子品种A,分3个A1,A2,A3;
对某农作物产量的影响。可以看出前两个为定量因素,
后两个为定性因素。
如何进行试验安排?
混合型因素混合型水平的均匀设计
一般情况下试验中既有定量型连续变化因
素,又有定性型状态变化因素。
假设有k个定量因素X1,…,Xk;
这k个因素可化为k个连续变量,
其水平数分别为q1,…,qk。
又有t个定性因素G1,…,Gt,
这t个定性因素分别有d1,…,dt个状态。
可以使用“拟水平法”,或用优化方法计算,求出相应的
均匀设计表。
混合因素混合水平表有如下的记号和含义:
定性因素
定量因素 的最大数
均匀设计 的最大数
Un(q ×
1 … × q × d × …× d
k 1 t )
各定性因素
试验次数 各定量因素 之水平数
之水平数
U (12×6×4×32 ×22 )
例: 12
1 2 3 4 5 6 7 12次试验。
1 1 1 1 2 3 1 2 可以安排2个
2 2 2 2 3 2 2 1 水平数为12、
3 3 3 3 2 1 1 2 6的定量因素,
4 4 4 4 3 1 2 1
以及总数为5
5 5 5 1 1 2 2 2
6 6 6 2 3 2 1 1 的一个水平
7 7 1 3 1 1 1 1 为4、两个水
8 8 2 4 3 3 2 1 平为3和两个
9 9 3 1 1 3 2 2 水平为2的定
10 10 4 2 2 2 1 2 性因素的设计。
11 11 5 3 1 1 1 1
12 12 6 4 2 3 2 2
表2.1.1 U12(12×6×4×3 )
选混合均匀设计表2.1.1
安排此试验
1 2 3 4
1 1 1 1 2
第1列安排平均施肥量X, 2 2 2 2 3
分为12个水平; 3 3 3 3 2
第2列安排种子播种前浸
4 4 4 4 3
种时间T,分为6个水
平; 5 5 5 1 1
第3列安排土壤类型B, 6 6 6 2 3
分4种B1,B2,B3,
7 7 1 3 1
B4;
第4列安排种子品种A, 8 8 2 4 3
分3个A1,A2,A3。 9 9 3 1 1
10 10 4 2 2
11 11 5 3 1
12 12 6 4 2
试验安排及结果如表2.1.2
X T B A 值
70 1 B1 A2 771
74 2 B2 A3 901
78 3 B3 A2 899
82 4 B4 A3 927
86 5 B1 A1 1111
90 6 B2 A3 1271
94 1 B3 A1 1053
98 2 B4 A3 1069
102 3 B1 A1 1187
106 4 B2 A2 1220
110 5 B3 A1 1062
114 6 B4 A2 974
为了进行分析,我们引进5个‘伪变量’。它们的记
号和取值如下:
B因素的
z31 (1 0 0 0 1 0 0 0 1 0 0 0)
z32 (0 1 0 0 0 1 0 0 0 1 0 0)
z33 (0 0 1 0 0 0 1 0 0 0 1 0)
A因素的
z41 (0 0 0 0 1 0 1 0 1 0 1 0)
z42 (1 0 1 0 0 0 0 0 0 1 0 1)
它们和 X、T 一起进行回归分析。
回归方程如下:
y 0 1 X 2T 3 Z 31 4 Z 32 5 Z 33 6 Z 41 7 Z 42
771 1 70 1 1 0 0 0 1 e1
901 1 74 2 0 1 0 0 0 e2
899 1 78 3 0 0 1 0 1 0 e3
927 1 82 4 0 0 0 0 0 1 e4
1111 1 86 5 1 0 0 1 0 2 e5
1271 1 90 6 0 1 0 0 0 3 e6
= +
1053 1 94 1 0 0 1 1 0 4 e7
1069 1 98 2 0 0 0 0 0 5 e8
1187 6 e9
1 102 3 1 0 0 1 1
1220 7 e10
1 106 4 0 1 0 0 0
1062 e11
1 110 5 0 0 1 1 1
974 e12
1 114 6 0 0 0 0 0
ˆ
0 158.96
解得 ˆ
1 8.54
回归系数的 ˆ
最小二乘估
2 12.625
计及其R和 ˆ
3 231.09
F值为: ˆ
4 208.98
ˆ
5 144.45
ˆ
6 124.50
ˆ
7 168.875
R 0.8753
F 1.84
不显著。需进一步考虑高阶回归项
若我们考虑除主效应外,再多考虑一个2次效
应和一个交互效应。这时回归方程化为
) 23 Z T( 9 2 X 8 24 Z 7 14 Z 6 33 Z 5 23 Z 4 13 Z 3 T2 X 1 0 y
1 70 1 1 0 0 0 1 70 2 0 e1
771
1 74 2 0 1 0 0 0 74 2 2 0 e2
901
1 78 3 0 0 1 0 1 78 2 0 1 e3
899
1 82 4 0 0 0 0 0 82 2 0 2 e4
927
1 86 5 1 0 0 1 0 86 2 0 3 e5
1111
1271 =
1 90 6 0 1 0 0 0 90 2 6 4 e6
+
1053
1 94 1 0 0 1 1 0 94 2 0 5 e7
1069
1 98 2 0 0 0 0 0 98 2 0 6 e8
1187
1 102 3 1 0 0 1 1 102 2 0 7 e9
1 106 4 0 1 0 0 0106 2 4 8 e10
1220
1 110 5 0 0 1 1 1 110 2 0 9 e11
1062
1 114 6 0 0 0 0 0114 2 0 e12
974
ˆ
0 3898.3642
解得
ˆ
1 98.8649
回归系数的
最小二乘估 ˆ
2 9.8600
计及其R和 ˆ
3 199.9875
F值为: ˆ
4 144.7927
ˆ
5 101.6902
ˆ
6 91.3200
ˆ
7 41.6920
ˆ
8 0.4937
ˆ
9 11.0600
R 1.0000
F 14170.5883
非常显著
方程为: ) 23 Z t( 9 2 X 8 24 Z 7 14 Z 6 33 Z 5 23 Z 4 13 Z 3 t2 X 1 0 y
其中 ˆ
0 3898.3642
1.含变量x 的两项与其它是分离的(即
ˆ
1 98.8649 可加的),最大值点在 x=100.127 。
ˆ
2 9.8600
ˆ 2.含变量z41 z42 的两项与其它是分离的,
3 199.9875 最大值点在 z41=0 z42=0,即品种3为好。
ˆ
4 144.7927
ˆ
5 101.6902 3.含变量 T z31 z32 z33 的四项与其它是
ˆ 分离的,最大值点可能在
6 91.3200
ˆ
7 41.6920 z31=1 z32=0 z33=0 类型为1,T=6
ˆ
8 0.4937 或 z31=0 z32=1 z33=0 类型为2,T=6
ˆ
9 11.0600 比较后知道为后者。
R 1.0000
F 14170.5883
所以得到最佳状态组合为
施肥量X=100.127,
浸种时间T=6,
土壤类型B取2,
种子品种A取3,
此时最大值估计为
ˆ m 0.4937 100.127 2 98.8619 100.127
y
3898.3642 20.92 6 144.7929
1321.4515
下面综述应注意的事项:
一、表的选择,因素及水平的安排
若试验中有k个定量因素和t个定性因素时,我们从
混合型均匀设计表中选出带有s=k+t列的
Un(q1×…×qk×d1×…×dt)表。
这里要求n≥k+d+1,其中d=(d1+…+dt -t).
为了给误差留下自由度,其中的n最好不取等号。
表中前k列对应k个连续变量,
表中后t列可安排定性因素。
安排n个试验,得到n个结果y1,y2,…,yn。
为了分析,首先要将定性因素之状态,依照
伪变量法,将第i个因素分别化成(di-1)个相
对独立的n维伪变量Zi1,Zi2,…,Zi(di-1)。
将这总共d=(d1+…dt-t)个伪变量与相应的k个
连续变量X1,…,Xk一起进行建模分析。
为了保证主效应不蜕化,要对混合型均匀设计
表进行挑选。
二、试验结果的回归建模分析
首先考察它们的一阶回归模型:
k t di 1
y 0 j X j ij Z ij
j 1 i 1 j 1
如果不理想,则
再考虑一些交互效应,和一些连续变量的高次效应。
显然最多可考虑的附加效应数为m个,这里
m≤n-(k+d-2)
值得指出的是,由于Zij *Zij=Zij ,因此无需
考虑伪变量的高阶效应,只考虑连续变量的高
次效应即可.
又因为Zij1*Zij2=0,j1≠j2时,因此也无需考虑
同一状态因素内的伪变量间的交互效应。
只有i1≠i2时,才有可能使Zi1j1*Zi2j2≠0,即
不同状态因素间的交互效应可能要考虑.。
此外,不要忘记考虑连续变量与伪变量的交互
效应。
至于 三个以上的状态因素间 的交互效应项
Zi1j1*Zi2j2*Zi3j3≠0的可能性就更少了
混料配方均匀设计
许多产品都是混合多种成分在一起形成的。
色素
钙 咖啡粉
香料
乳酸 发酵粉
盐 蔬菜汁
椰子汁
糖 水
面粉
咖啡面包
43 怎样确定各种成分的比例呢?
混料试验
经验 试验
有 s 个因素: X1, , Xs 满足
Xi 0, i = 1, , s 和 X1 + + Xs = 1.
试验区域为单纯形
Ts = {(x1, , xs): xi 0, i = 1, , s , x1 + + xs = 1. }
人们提出了许多混料设计方法,如
.
单纯形格子点设计 (Scheffe, 1958)
.
单纯形重心设计(Scheffe, 1963)
轴设计(Cornell, 1975)
45
例如, 成分数 s = 3
单纯形格子点设计 单纯形重心设计
d
轴设计
这些设计的全面评价请参考:
Cornell, J. A. (1990). Experiments with Mixtures: Designs, Models and the
Analysis of Mixture Data. Wiley, New York.
46
上述设计的弱点:
许多点在Ts 的边界上;
给用户设计的选择不多。
混料均匀设计
混料均匀设计是要寻找在Ts上均匀散布的试验点。
问题: 怎样设计这些试验点呢?
变换方法
47
变换方法
给定s-1维单位立方体C s-1上的均匀设计,且用
{Ck = (ck1, ,ck,s-1), k = 1, ,n}
表示。则进行下列必要的 变换:
i 1
1 1
xki 1 cki c
s i s j
j 1 kj
(3.1.1)
1
s 1 s j
xks ckj
j 1
{xk = (xk1, ,xks), k = 1, ,n} 是 Ts.上的均匀设计。
例3.1 构造T3 上带有11 个(配方)试验点的均匀设计。 48
假设我们选用 U11(112) 和相关的 Ck, k = 1, ,11:
1 4 0.0455 0.3182
2 9
0.1364 0.7727
3 7 0.2273
0.5909
4 1 0.3182 0.0455
5 11 0.4091
0.9545
U11 (11 ) 6 3 ,
2
7 6
k
k 0.5
11
c
0.5000
0.2273 ;
0.5909 0.5000
8 8 0.6818 0.6818
9 2 0.7727 0.1364
10 10 0.8636 0.8636
0.9545
11 5 0.4091
x k1 1 c k1 ;
变换公式 (4.1) 现在成为: xk 2 ck1 (1 ck 2 );
x k 3 c k1 c k 2 . (3.1.2)
用这个变换公式, 正方形[0,1]2上的均匀设计 Ck = (ck1, ck2), k = 1, ,11
导出T3上的均匀设计 Xk = (xk1, xk2, xk3), k = 1, ,11 如下:
0.7868 0.1454 0.0678
0.6307 0.0839 0.2853
0.5233 0.1950 0.2817
0.4359 0.5384 0.0256
0.3604 0.0291 0.6105
x ( xk1 , xk 2 , xk 3 ) 0.2929
0.5464 0.1607 .
0.2313 0.3844 0.3844
0.1743 0.2627 0.5630
0.1210 0.7592 0.1199
0.0707 0.1267 0.8026
0.0230
0.5773 0.3997
49
区域 T3 是一个边长为 2 的等边三角形,用 V2 表示。 50
x3
1
T3
d1
x
T3
x
d2
d3
x
1 1
x1 x2
可以证明:V2 上的任何点 (z1, z2) 到V23 上的点 (x1, x2, d1, 如果我
因此, V2 上任何点 (z1, z2) 都对应一个T的三条边之距离x3), d2和d3,
满足 d1+d2+d3 = 1.
们像这样在V2上建立一个新坐标系统的话。
51
给定点(x1, x2, x3),计算点(z1, z2)的公式是:
z1 2( x3 x2 ) 3
z 2 x1
图 3.1.2a 图 3.1 .2b
c2
c1
- 4-
介绍
52
53
均匀设计软件
均匀设计软件有中、英文两个版本。该软件中列举了
许多均匀的设计表,并给出了数据分析方法。
54
程序设计者杜明亮和方法指导者方开泰教授在一起
均匀设计软件可用于
*与试验设计相关的大学本科或研究生课程
*自然科学研究的试验设计
*工业试验和国防科研
*系统工程、仿真试验
(一)设计
•均匀设计表
-用好格子点法生成
-用拉丁方生成
-用优化方法生成
•带拟水平的均匀设计表
•带约束的配方设计
•无约束的配方设计
(二)数据分析
•选择变量
•建模
-前进法
-简单线性模型
-逐步回归法
-二次模型
-最优子集法
-自选模型
-自选变量
•统计诊断 •综合分析
-残差点图、正态Q-Q点图 -多响应模型分析
-偏回归点图 -优化
-拟合比较图 -预报
-等高线图 -相关系数
-三维图 -各类诊断点图
小结
我们介绍了有关均匀设计的一些知识:均匀设计表的
构造和用法;介绍了有关均匀设计软件的一些内容。
我们强调的是正确使用均匀设计表。即:能确定
试验目标,能找出影响因素及其变化范围,合理确定水
平数及其值,正确安排试验,对试验结果进行适当的分
析,得出恰当的认识。幸好,均匀设计分会研制的“均
匀设计软件V3.0”可以帮助你完成这些工作。
想了解原理者请接看下面的附录。
主要参考文献
,PPT,kaitai,Fang
含有定性因素的均匀设计,PPT, 王柱
均匀设计八讲,拷贝,方开泰
均匀设计与均匀设计表,书,方开泰
均匀设计V3.0,软件,方开泰,杜明亮
均匀设计与正交设计的关联和比较,文章,方开泰,马长兴
含有定性因素均匀设计均匀性的度量,文章, 王柱,方开泰
均匀设计理论及其应用研讨会,论文集
均匀设计论文选,第一集
均匀设计论文选,第二集
Get documents about "