当前位置: 首页 > news >正文

【白板推导系列笔记】降维-样本均值样本方差矩阵

X = ( x 1 x 2 ⋯ x N ) N × p T = ( x 1 T x 2 T ⋮ x N T ) = ( x 11 x 12 ⋯ x 1 p x 21 x 22 ⋯ x 2 p ⋮ ⋮ ⋮ x N 1 x N 2 ⋯ x N P ) N × p x i ∈ R p , i = 1 , 2 , ⋯   , N 记 1 N = ( 1 1 ⋮ 1 ) N × 1 \begin{gathered} X=\begin{pmatrix} x_{1} & x_{2} & \cdots & x_{N} \end{pmatrix}^{T}_{N \times p}=\begin{pmatrix} x_{1}^{T} \\ x_{2}^{T} \\ \vdots \\ x_{N}^{T} \end{pmatrix}=\begin{pmatrix} x_{11} & x_{12} & \cdots & x_{1p} \\ x_{21} & x_{22} & \cdots & x_{2p} \\ \vdots & \vdots & & \vdots \\ x_{N1} & x_{N2} & \cdots & x_{NP} \end{pmatrix}_{N \times p}\\ x_{i}\in \mathbb{R}^{p},i=1,2,\cdots ,N\\ 记1_{N}=\begin{pmatrix}1 \\ 1 \\ \vdots \\ 1\end{pmatrix}_{N \times 1} \end{gathered} X=(x1x2xN)N×pT= x1Tx2TxNT = x11x21xN1x12x22xN2x1px2pxNP N×pxiRp,i=1,2,,N1N= 111 N×1
对于样本均值
x ˉ = 1 N ∑ i = 1 N x i = 1 N ( x 1 x 2 ⋯ x N ) ( 1 1 ⋮ 1 ) N × 1 = 1 N X T 1 N \begin{aligned} \bar{x}&=\frac{1}{N}\sum\limits_{i=1}^{N}x_{i}\\ &=\frac{1}{N}\begin{pmatrix} x_{1} & x_{2} & \cdots & x_{N} \end{pmatrix}\begin{pmatrix}1 \\ 1 \\ \vdots \\ 1\end{pmatrix}_{N \times 1}\\ &=\frac{1}{N}X^{T}1_{N} \end{aligned} xˉ=N1i=1Nxi=N1(x1x2xN) 111 N×1=N1XT1N
对于样本方差
S = 1 N ∑ i = 1 N ( x i − x ˉ ) ( x i − x ˉ ) T \begin{aligned} S&=\frac{1}{N}\sum\limits_{i=1}^{N}(x_{i}-\bar{x})(x_{i}-\bar{x})^{T} \end{aligned} S=N1i=1N(xixˉ)(xixˉ)T
对于 ∑ i = 1 N ( x i − x ˉ ) \sum\limits_{i=1}^{N}(x_{i}-\bar{x}) i=1N(xixˉ)
∑ i = 1 N ( x i − x ˉ ) = ( x 1 − x ˉ x 2 − x ˉ ⋯ x N − x ˉ ) = ( x 1 x 2 ⋯ x N ) − ( x ˉ x ˉ ⋯ x ˉ ) = X T − x ˉ ( 1 1 ⋯ 1 ) = X T − x ˉ 1 N T = X T − 1 N X T 1 N 1 N T = X T ( I N − 1 N 1 N 1 N T ) \begin{aligned} \sum\limits_{i=1}^{N}(x_{i}-\bar{x})&=\begin{pmatrix} x_{1}-\bar{x} & x_{2}-\bar{x} & \cdots & x_{N}-\bar{x} \end{pmatrix}\\ &=\begin{pmatrix} x_{1} & x_{2} & \cdots & x_{N} \end{pmatrix}-\begin{pmatrix} \bar{x} & \bar{x} & \cdots & \bar{x} \end{pmatrix}\\ &=X^{T}-\bar{x}\begin{pmatrix}1 & 1 & \cdots & 1\end{pmatrix}\\ &=X^{T}-\bar{x}1_{N}^{T}\\ &=X^{T}- \frac{1}{N}X^{T}1_{N}1_{N}^{T}\\ &=X^{T}\left(\mathbb{I}_{N}- \frac{1}{N}1_{N}1_{N}^{T}\right)\\ \end{aligned} i=1N(xixˉ)=(x1xˉx2xˉxNxˉ)=(x1x2xN)(xˉxˉxˉ)=XTxˉ(111)=XTxˉ1NT=XTN1XT1N1NT=XT(INN11N1NT)
带回原式
S = 1 N ( x 1 − x ˉ x 2 − x ˉ ⋯ x N − x ˉ ) ( ( x 1 − x ˉ ) T ( x 2 − x ˉ ) T ⋮ ( x N − x ˉ ) T ) = 1 N X T ( I N − 1 N 1 N 1 N T ) ⋅ ( I N − 1 N 1 N 1 N T ) T X \begin{aligned} S&=\frac{1}{N}\begin{pmatrix} x_{1}-\bar{x} & x_{2}-\bar{x} & \cdots & x_{N}-\bar{x} \end{pmatrix}\begin{pmatrix} (x_{1}-\bar{x})^{T} \\ (x_{2}-\bar{x})^{T} \\ \vdots \\ (x_{N}-\bar{x})^{T} \end{pmatrix}\\ &=\frac{1}{N}X^{T}\left(\mathbb{I}_{N}- \frac{1}{N}1_{N}1_{N}^{T}\right)\cdot (\mathbb{I}_{N}- \frac{1}{N}1_{N}1_{N}^{T})^{T}X\\ \end{aligned} S=N1(x1xˉx2xˉxNxˉ) (x1xˉ)T(x2xˉ)T(xNxˉ)T =N1XT(INN11N1NT)(INN11N1NT)TX
H = I N − 1 N 1 N 1 N T \begin{aligned} \mathbb{H}=\mathbb{I}_{N}- \frac{1}{N}1_{N}1_{N}^{T}\end{aligned} H=INN11N1NT H \mathbb{H} H也被称为中心矩阵),上式为
S = 1 N X T ( I N − 1 N 1 N 1 N T ) ⋅ ( I N − 1 N 1 N 1 N T ) T X = 1 N X T H ⋅ H X \begin{aligned} S&=\frac{1}{N}X^{T}\left(\mathbb{I}_{N}- \frac{1}{N}1_{N}1_{N}^{T}\right)\cdot (\mathbb{I}_{N}- \frac{1}{N}1_{N}1_{N}^{T})^{T}X\\ &=\frac{1}{N}X^{T}\mathbb{H}\cdot \mathbb{H}X \end{aligned} S=N1XT(INN11N1NT)(INN11N1NT)TX=N1XTHHX
对于 H T \mathbb{H}^{T} HT
H T = ( I N − 1 N 1 N 1 N T ) T = I N − 1 N 1 N 1 N T = H \begin{aligned} \mathbb{H}^{T}&=(\mathbb{I}_{N}- \frac{1}{N}1_{N}1_{N}^{T})^{T}\\ &=\mathbb{I}_{N}- \frac{1}{N}1_{N}1_{N}^{T}\\ &=\mathbb{H} \end{aligned} HT=(INN11N1NT)T=INN11N1NT=H
对于 H 2 \mathbb{H}^{2} H2
H 2 = H ⋅ H = ( I N − 1 N 1 N 1 N T ) ( I N − 1 N 1 N 1 N T ) = I N − 2 N 1 N 1 N T + 1 N 2 1 N 1 N T 1 N 1 N T \begin{aligned} \mathbb{H}^{2}&=\mathbb{H} \cdot \mathbb{H}\\ &=\left(\mathbb{I}_{N}- \frac{1}{N}1_{N}1_{N}^{T}\right)\left(\mathbb{I}_{N}- \frac{1}{N}1_{N}1_{N}^{T}\right)\\ &=\mathbb{I}_{N}- \frac{2}{N}1_{N}1_{N}^{T}+ \frac{1}{N^{2}}1_{N}1_{N}^{T}1_{N}1_{N}^{T} \end{aligned} H2=HH=(INN11N1NT)(INN11N1NT)=INN21N1NT+N211N1NT1N1NT
对于 1 N 1 N T 1_{N}1_{N}^{T} 1N1NT
1 N 1 N T = ( 1 ⋮ 1 ) ( 1 ⋯ 1 ) = ( 1 ⋯ 1 ⋮ ⋮ 1 ⋯ 1 ) 1 N 1 N T 1 N 1 N T = ( 1 ⋯ 1 ⋮ ⋮ 1 ⋯ 1 ) ( 1 ⋯ 1 ⋮ ⋮ 1 ⋯ 1 ) = ( N ⋯ N ⋮ ⋮ N ⋯ N ) \begin{aligned} 1_{N}1_{N}^{T}&=\begin{pmatrix} 1 \\ \vdots \\ 1 \end{pmatrix}\begin{pmatrix} 1 & \cdots & 1 \end{pmatrix}=\begin{pmatrix} 1 & \cdots & 1 \\ \vdots & & \vdots \\ 1 & \cdots & 1 \end{pmatrix}\\ 1_{N}1_{N}^{T}1_{N}1_{N}^{T}&=\begin{pmatrix} 1 & \cdots & 1 \\ \vdots & & \vdots \\ 1 & \cdots & 1 \end{pmatrix}\begin{pmatrix} 1 & \cdots & 1 \\ \vdots & & \vdots \\ 1 & \cdots & 1 \end{pmatrix}\\ &=\begin{pmatrix} N & \cdots & N \\ \vdots & & \vdots \\ N & \cdots & N \end{pmatrix} \end{aligned} 1N1NT1N1NT1N1NT= 11 (11)= 1111 = 1111 1111 = NNNN
带回 H 2 \mathbb{H}^{2} H2
H 2 = I N − 2 N 1 N 1 N T + 1 N 2 1 N 1 N T 1 N 1 N T = I N − 2 N ( 1 ⋯ 1 ⋮ ⋮ 1 ⋯ 1 ) + 1 N 2 ( N ⋯ N ⋮ ⋮ N ⋯ N ) = I N − 2 N ( 1 ⋯ 1 ⋮ ⋮ 1 ⋯ 1 ) + 1 N ( 1 ⋯ 1 ⋮ ⋮ 1 ⋯ 1 ) = I N − 1 N ( 1 ⋯ 1 ⋮ ⋮ 1 ⋯ 1 ) = I N − 1 N 1 N 1 N T = H \begin{aligned} \mathbb{H}^{2}&=\mathbb{I}_{N}- \frac{2}{N}1_{N}1_{N}^{T}+ \frac{1}{N^{2}}1_{N}1_{N}^{T}1_{N}1_{N}^{T}\\ &=\mathbb{I}_{N}- \frac{2}{N}\begin{pmatrix} 1 & \cdots & 1 \\ \vdots & & \vdots \\ 1 & \cdots & 1 \end{pmatrix}+ \frac{1}{N^{2}}\begin{pmatrix} N & \cdots & N \\ \vdots & & \vdots \\ N & \cdots & N \end{pmatrix}\\ &=\mathbb{I}_{N}- \frac{2}{N}\begin{pmatrix} 1 & \cdots & 1 \\ \vdots & & \vdots \\ 1 & \cdots & 1 \end{pmatrix}+ \frac{1}{N}\begin{pmatrix} 1 & \cdots & 1 \\ \vdots & & \vdots \\ 1 & \cdots & 1 \end{pmatrix}\\ &=\mathbb{I}_{N}- \frac{1}{N}\begin{pmatrix} 1 & \cdots & 1 \\ \vdots & & \vdots \\ 1 & \cdots & 1 \end{pmatrix}\\ &=\mathbb{I}_{N}- \frac{1}{N}1_{N}1_{N}^{T}\\ &=\mathbb{H} \end{aligned} H2=INN21N1NT+N211N1NT1N1NT=INN2 1111 +N21 NNNN =INN2 1111 +N1 1111 =INN1 1111 =INN11N1NT=H
因此有 H n = H \mathbb{H}^{n}=\mathbb{H} Hn=H,带回 S S S
S = 1 N X T H ⋅ H X = 1 N X T H X \begin{aligned} S&=\frac{1}{N}X^{T}\mathbb{H}\cdot \mathbb{H}X\\ &=\frac{1}{N}X^{T}\mathbb{H}X \end{aligned} S=N1XTHHX=N1XTHX
这里中心矩阵 H \mathbb{H} H的几何意义是,对于一个数据集 X X X X H X \mathbb{H} XH可以认为是将数据集平移到坐标轴原点, H \mathbb{H} H就是这个起到平移作用的矩阵

相关文章:

  • nonebot2聊天机器人插件10:迁移至nonebot2.0.0b5
  • 高速度结构设计
  • Java(六)——常用类 --- 大数运算
  • 【对比Java学Kotlin】协程-异步流
  • 基于Vue+SSM+SpringCloudAlibaba的英雄管理系统
  • 基于注意力机制的循环神经网络对 金融时间序列的应用 学习记录
  • 女篮亚军,为啥男篮那么水?
  • 发动机曲轴及曲柄连杆机构受力有限元分析
  • 进程概念(Linux)
  • 国庆弯道超车之最长递增子序列衍生的一类题
  • 30. Python 修改列表的元素
  • Redis入门-下载-安装-启动服务测试
  • 一个C#开发的、跨平台的服务器性能监控工具
  • ARM - LED灯实验(cortex A7核/cortex M4核)
  • 【云原生之Docker实战】使用Docker部署Lsky Pro个人图床平台
  • ES6 ...操作符
  • ES6 学习笔记(一)let,const和解构赋值
  • mysql中InnoDB引擎中页的概念
  • Quartz初级教程
  • Stream流与Lambda表达式(三) 静态工厂类Collectors
  • use Google search engine
  • Vultr 教程目录
  • 初识 beanstalkd
  • 基于axios的vue插件,让http请求更简单
  • 解析 Webpack中import、require、按需加载的执行过程
  • 可能是历史上最全的CC0版权可以免费商用的图片网站
  • 离散点最小(凸)包围边界查找
  • 区块链技术特点之去中心化特性
  • 学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退
  • 移动互联网+智能运营体系搭建=你家有金矿啊!
  • 用Node EJS写一个爬虫脚本每天定时给心爱的她发一封暖心邮件
  • 在 Chrome DevTools 中调试 JavaScript 入门
  • Python 之网络式编程
  • Semaphore
  • shell使用lftp连接ftp和sftp,并可以指定私钥
  • 浅谈sql中的in与not in,exists与not exists的区别
  • ​ssh免密码登录设置及问题总结
  • #LLM入门|Prompt#3.3_存储_Memory
  • %check_box% in rails :coditions={:has_many , :through}
  • (2)Java 简介
  • (剑指Offer)面试题34:丑数
  • .mysql secret在哪_MySQL如何使用索引
  • .NET delegate 委托 、 Event 事件
  • .NET Framework 4.6.2改进了WPF和安全性
  • .NET Windows:删除文件夹后立即判断,有可能依然存在
  • .net 获取url的方法
  • .NET/C# 使用 ConditionalWeakTable 附加字段(CLR 版本的附加属性,也可用用来当作弱引用字典 WeakDictionary)
  • .netcore 获取appsettings
  • ??eclipse的安装配置问题!??
  • ??如何把JavaScript脚本中的参数传到java代码段中
  • @Bean, @Component, @Configuration简析
  • @ConfigurationProperties注解对数据的自动封装
  • [ vulhub漏洞复现篇 ] Hadoop-yarn-RPC 未授权访问漏洞复现
  • [2018-01-08] Python强化周的第一天
  • [BUG]vscode插件live server无法自动打开浏览器