March 16, 2020, Zhengzhou
多元统计分析
待检验问题: 检验统计量: 统计量原假设分布: 拒绝域: 构造均值向量与估计的马氏距离为检验统计量,这个统计量服从卡方分布。
两个一元检验都不能拒绝$H_0$, 但是由于$Y1,Y2$ 之间有相关关系,多元检验可以拒绝$H_0$
检验统计量: 原假设分布:
前提假设:$p$ 维样本 $\Sigma$是未知的共同协方差矩阵。
检验问题 检验统计量: 仍然服从Hotelling 分布: 拒绝域:
待检验问题: 检验统计量及其假设分布:
记原始变量$y = (Y_1, …, Y_p)^T$ , 其协方差矩阵$\Sigma$, 主成分分析试图定义一组互不相关的变量,称为$Y$的主成分,记为$Z_1, …, Z_p$, 每一个主成分都是$Y_1,…,Y_p$的线性组合 $Z_i = a_i^Ty$
则$Var(Z_j) = a_j^T\Sigma a_j$, $Cov(Z_j, Z_k) = a_j^T\Sigma a_k$
目标函数:方差反应信息量大小,我们期望$Z_1,…Z_p$ 按方差大小排序,同时满足互不相关(协方差为0)
对于$p$ 个原始变量$Y_1,…,Y_p$ 来说,那些高度相关的变量很可能会遵循一个公共的潜在结构–或可称之为公共因子 Common Factor. 因子分析旨在提出因子模型来研究如何用几个公共因子,记做$F_1, …,F_m$ , 通常$m <p$, 来刻画原始变量之间的相关性。 $F$ 公共因子;$\epsilon_j$ 特殊因子; $l_j$ 系数,载荷;