Zhi-Kai Yang

[stat 06] 多元统计分析

16 Mar 2020 by BY Zhi-kai Yang

March 16, 2020, Zhengzhou

多元统计分析

均值向量的检验

单样本均值向量$\mu$的检验 ($\Sigma$ 已知)

待检验问题: 检验统计量: 统计量原假设分布: 拒绝域: 构造均值向量与估计的马氏距离为检验统计量,这个统计量服从卡方分布。

两个一元检验都不能拒绝$H_0$, 但是由于$Y1,Y2$ 之间有相关关系,多元检验可以拒绝$H_0$

单样本均值向量检验 ($\Sigma$未知)

检验统计量: 原假设分布:

两样本均值向量检验:独立样本

前提假设:$p$ 维样本 $\Sigma$是未知的共同协方差矩阵。

检验问题 检验统计量: 仍然服从Hotelling 分布: 拒绝域:

两样本均指向量检验(成对出现)

image-20200317123905655

image-20200317124046440

待检验问题: 检验统计量及其假设分布:

主成分分析

总体PCA

记原始变量$y = (Y_1, …, Y_p)^T$ , 其协方差矩阵$\Sigma$, 主成分分析试图定义一组互不相关的变量,称为$Y$的主成分,记为$Z_1, …, Z_p$, 每一个主成分都是$Y_1,…,Y_p$的线性组合 $Z_i = a_i^Ty$

则$Var(Z_j) = a_j^T\Sigma a_j$, $Cov(Z_j, Z_k) = a_j^T\Sigma a_k$

目标函数:方差反应信息量大小,我们期望$Z_1,…Z_p$ 按方差大小排序,同时满足互不相关(协方差为0) image-20200317163841329

因子分析

对于$p$ 个原始变量$Y_1,…,Y_p$ 来说,那些高度相关的变量很可能会遵循一个公共的潜在结构–或可称之为公共因子 Common Factor. 因子分析旨在提出因子模型来研究如何用几个公共因子,记做$F_1, …,F_m$ , 通常$m <p$, 来刻画原始变量之间的相关性。 $F$ 公共因子;$\epsilon_j$ 特殊因子; $l_j$ 系数,载荷;


comments powered by Disqus