应用多元统计分析习题解答_典型相关分析
时间:2026-01-16
时间:2026-01-16
第九章 典型相关分析
9.1 什么是典型相关分析?简述其基本思想。
答: 典型相关分析是研究两组变量之间相关关系的一种多元统计方法。用于揭示两组变量之间的内在联系。典型相关分析的目的是识别并量化两组变量之间的联系。将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系。 基本思想:
(1)在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。即: 若设X
(1)
(1)(1)(2)(2)
(X1(1),X2, ,Xp)、X(2) (X1(2),X2, ,Xq)是两组相互关联的随机变量,
分别在两组变量中选取若干有代表性的综合变量Ui、Vi,使是原变量的线性组合。
(i)(1)(i)(1)(i)(1)(i) (1)
U aX aX aX aX 1122PP i (i)(2)(i)(2)(i)(2)(i) (2)V bX bX bX bX 1122qq i
在D(a(1) X(1)) D(b(1) X(2)) 1的条件下,使得 (a(1) X(1),b(1) X(2))达到最大。(2)选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对。 (3)如此继续下去,直到两组变量之间的相关性被提取完毕为此。
9.2 什么是典型变量?它具有哪些性质?
答:在典型相关分析中,在一定条件下选取系列线性组合以反映两组变量之间的线性关系,这被选出的线性组合配对被称为典型变量。具体来说,
X(1) (X(1),X(1), ,X(1))、X(2) (X(2),X(2), ,X(2))
1
2
p
1
2
q
(i)(i)(1)(i)(1)
Ui a1X1(1) a2X2 aPXP a(i) X(1)
(i)(2)(i)(2)Vi b1(i)X1(2) b2X2 bqXq b(i) X(2)
在D(a(1) X(1)) D(b(1) X(2)) 1的条件下,使得 (a(1) X(1),b(1) X(2))达到最大,则称
a(1) X(1)、b(1) X(2)是X(1)、X(2)的第一对典型相关变量。
典型变量性质:
典型相关量化了两组变量之间的联系,反映了两组变量的相关程度。 1. D(Uk) 1,D(Vk) 1
Cov(Ui,Uj) 0,
(k 1,2, ,r)
Cov(Vi,Vj) 0(i j)
(i j,i 1,2, ,r)(i j)(j r)
i 0
2. Cov(Ui,Vj) 0
0
9.3 试分析一组变量的典型变量与其主成分的联系与区别。
答:一组变量的典型变量和其主成分都是经过线性变换计算矩阵特征值与特征向量得出的。主成分分析只涉及一组变量的相互依赖关系而典型相关则扩展到两组变量之间的相互依赖关系之中,度量了这两组变量之间联系的强度。
9.4 简述典型相关分析中载荷分析的内容及作用。
答:作用:进行典型载荷分析有助于更好解释分析已提取的p对典型变量。分析原始变量与典型变量之间相关性。
内容:
U1 V1 a(1) b(1)
V U (2) (2 )
ab2* B* U V 2 令 A
(p) (p)
Uab Vp p
U A*X(1)V B*X(2)
**
其中A,B为p对典型变量系数向量组成的矩阵,U和V为p对典型变量组成的向
量。则Cov(U,X(1)) Cov(A*X(1),X(1)) A*Σ
11
Corr(Ui,X)
(1)k
(1)(1)
1/2
Cov(Ui, kkXk(1))
1/2 1/2
这里D(Ui)
1, kk。记V11为对角元素是 kk的对角阵,所以有
1/2
1/2(1)
RU,X(1) Corr(U,X(1)) Cov(U,V11X)
1/2(1) 1/2
Cov(A*X(1),V11X) A*Σ11V11
类似可得:
1/2 1/2
R(2) A*Σ12 RV,X(2) B*Σ22V22V 212/ 2 RV,X(1) B*Σ21V11
U,X
对于经过标准化处理后得到的典型变量有:
; R(2) B* R(2) A*;R(1) B* RU,Z(1) A*RRZR11Z22Z12ZR21V,ZU,ZV,Z
对于样本典型相关分析,上述结果中的数量关系同样成立。
9.5 简述典型相关分析中冗余分析的内容及作用。 答:典型冗余分析的作用即分析每组变量提取出的典型变量所能解释的该组样本总方差的比例,从而定量测度典型变量所包含的原始信息量。
第一组变量样本的总方差为tr(R11) p,第二组变量样本的总方差为tr(R22) q。
*Z(1), *和B *是样本典型相关系数矩阵,典型系数向量是矩阵的行向量,U AAzzz
B *Z(2)。 V
z
前r对典型变量对样本总方差的贡献为
a a a a a ) rz2(1),Utr(a
(1)(1)zz
(2)(2)
zz
(r)(r)
zz
rp
(1)b (1) b (2)b (2) b (r)b (r) ) r2(2) tr(b zzzzzzz,V
i 1k 1
K
i
i 1k 1
qr
ki
则第一组样本方差由前r个典型变量解释的比例为Rdz(1)|U
r
r
i 1k 1
rp
2
(1) zk,Ui
p
q
2(2) zk,Vi
第二组样本方差由前r个典型变量解释的比例为Rdz(2)|V
r
i 1k 1
q
9.6 设X和Y分别是p维和q维随机向量,且存在二阶距,设p≤q。它们的第i对典型变
*
CXl ,Y* DY m,量分别为a(i) X、典型相关系数为 i,令X (i 1, ,p)。b(i) Y,
其中C、D分别为p p,q q阶非奇异阵,l、m分别为p维、q维随机向量,试证明
⑴ X、Y的第i对典型变量为C 1a(i) X*、D 1b(i) Y*。
*
*
⑵ C 1a(i) X*与D 1b(i) Y*的典型相关系数为 i。
9.7 对140名学生进行了阅读速度x1、阅读能力x2、运算速度y1和运算能力y2的四种测验,所得成绩的相关系数阵为
0.030.240.59 1
0.03 10.060.07 R=
0.240.0610.24 0.590.070.241
试对阅读本领与运算本领之间进行典型相关分析。
解:根据已知可得
=
=
==
计算得的特征值为
提取第一典型变量为
其中
,
分别为原始变量
标准化后的结果。
按照常识,不应该 …… 此处隐藏:1312字,全部文档内容请下载后查看。喜欢就下载吧 ……
下一篇:高一化学钠的物理性质