什么是协方差矩阵

2024-05-14

1. 什么是协方差矩阵

在统计学与概率论中,,协方差矩阵是一个矩阵,其每个元素是各个向量元素之间的方差。是从标量随机变量到高维度随机向量的自然推广。   假设 X 是以 n 个标量随机变量组成的列向量,并且μk 是其第k个元素的期望值, 即, μk = E(Xk), 协方差矩阵然后被定义为:   Σ=E{(X-E[X])(X-E[X])T}=(如图)   矩阵中的第(i,j)个元素是Xi与Xj的协方差. 这个概念是对于标量随机变量方差的一般化推广

什么是协方差矩阵

2. 协方差矩阵?

1、协方差矩阵中的每一个元素是表示的随机向量X的不同分量之间的协方差,而不是不同样本之间的协方差,如元素Cij就是反映的随机变量Xi, Xj的协方差。2、协方差是反映的变量之间的二阶统计特性,如果随机向量的不同分量之间的相关性很小,则所得的协方差矩阵几乎是一个对角矩阵。对于一些特殊的应用场合,为了使随机向量的长度较小,可以采用主成分分析的方法,使变换之后的变量的协方差矩阵完全是一个对角矩阵,之后就可以舍弃一些能量较小的分量了(对角线上的元素反映的是方差,也就是交流能量)。特别是在模式识别领域,当模式向量的维数过高时会影响识别系统的泛化性能,经常需要做这样的处理。3、必须注意的是,这里所得到的式(5)和式(6)给出的只是随机向量协方差矩阵真实值的一个估计(即由所测的样本的值来表示的,随着样本取值的不同会发生变化),故而所得的协方差矩阵是依赖于采样样本的,并且样本的数目越多,样本在总体中的覆盖面越广,则所得的协方差矩阵越可靠。4、如同协方差和相关系数的关系一样,我们有时为了能够更直观地知道随机向量的不同分量之间的相关性究竟有多大,还会引入相关系数矩阵。 在概率论和统计学中,相关或称相关系数或关联系数,显示两个随机变量之间线性关系的强度和方向。在统计学中,相关的意义是用来衡量两个变量相对于其相互独立的距离。在这个广义的定义下,有许多根据数据特点而定义的用来衡量数据相关的系数。对于不同数据特点,可以使用不同的系数。最常用的是皮尔逊积差相关系数。其定义是两个变量协方差除以两个变量的标准差(方差)。皮尔逊积差系数
数学特征其中,E是数学期望,cov表示协方差。因为μX = E(X),σX2 = E(X2) �6�1 E2(X),同样地,对于Y,可以写成
当两个变量的标准差都不为零,相关系数才有定义。从柯西—施瓦茨不等式可知,相关系数不超过1. 当两个变量的线性关系增强时,相关系数趋于1或-1。当一个变量增加而另一变量也增加时,相关系数大于0。当一个变量的增加而另一变量减少时,相关系数小于0。当两个变量独立时,相关系数为0.但反之并不成立。 这是因为相关系数仅仅反映了两个变量之间是否线性相关。比如说,X是区间[-1,1]上的一个均匀分布的随机变量。Y = X2. 那么Y是完全由X确定。因此Y 和X是不独立的。但是相关系数为0。或者说他们是不相关的。当Y 和X服从联合正态分布时,其相互独立和不相关是等价的。当一个或两个变量带有测量误差时,他们的相关性就受到削弱,这时,“反衰减”性(disattenuation)是一个更准确的系数。

3. 协方差的矩阵

分别为m与n个标量元素的列向量随机变量X与Y,这两个变量之间的协方差定义为m×n矩阵.其中X包含变量X1.X2......Xm,Y包含变量Y1.Y2......Yn,假设X1的期望值为μ1,Y2的期望值为v2,那么在协方差矩阵中(1,2)的元素就是X1和Y2的协方差。两个向量变量的协方差Cov(X,Y)与Cov(Y,X)互为转置矩阵。协方差有时也称为是两个随机

协方差的矩阵

4. 协方差矩阵的理解

  为了便于理解和验证,可以参考一下, http://www.ab126.com/shuxue/2788.html 所提供的协方差的在线计算器。
  
   统计里最基本的概念就是样本的均值,方差,或者再加个标准差。假定有一个含有n个样本的集合X={X1,…,Xn},依次给出这些概念的公式描述:
  
   
     很显然,均值描述的是样本集合的中间点,它告诉我们的信息是很有限的。
     
     而标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0,8,12,20]和[8,9,11,12],两个集合的均值都是10,但显然两个集合差别是很大的,计算两者的标准差,前者是8.3,后者是1.8,显然后者较为集中,故其标准差小一些,标准差描述的就是这种“散布度”。
  
   
     看出方差与标准差关系没有?
     为什么除以n-1而不是除以n? 这个称为贝塞尔修正。在统计学中样本的均差多是除以自由度(n-1),它的意思是样本能自由选择的程度,当选到只剩一个时,它不可能再有自由了,所以自由度是(n-1)。这样能使我们以较小的样本集更好的逼近总体的标准差,即统计上所谓的“无偏估计”。
  
   下面采用Python演算一下:
     参考: https://blog.csdn.net/lyl771857509/article/details/79439184 
  
 计算步骤:
   求和:   1+2+3+4=10
   平均值:   =2.5
  
   
     
     
     
  
 方差:  
  
   上面几个统计量看似已经描述的差不多了,但我们应该注意到,标准差和方差一般是用来描述一维数据的,但现实生活我们常常遇到含有多维数据的数据集,这个时候怎么办?
     协方差该出场了!
     协方差可以通俗的理解为:两个变量在变化过程中是同方向变化?还是反方向变化?同向或反向程度如何?
  
 换种说法:
     协方差是度量各个维度偏离其均值的程度。协方差的值如果为正值,则说明两者是正相关的,结果为负值就说明负相关的,如果为0,也是就是统计上说的“相互独立”。
   与方差对比:
     方差是用来度量单个变量“自身变异”大小的总体参数,方差越大表明该变量的变异越大
     协方差是用来度量两个变量之间“协同变异”大小的总体参数,即二个变量相互影响大小的参数,协方差的绝对值越大,则二个变量相互影响越大。
  
   采用协方差在线计算器练习一下:
       输入值 X=1 ,5 ,6
       输入值 Y=4, 2,  9
  
 计算步骤:
  
   在分析协方差矩阵之前有必要搞清矩阵维数的概念!以女孩子找对象为例,一般关心几个点
     
   这里是5个维数。如果同时有几个男孩子备选,则会形成多个行,有对比才有会伤害。
  
   
     可以这样形象理解:在女孩心中,多个男孩形成一个个行向量,即多个样本。
     另外,再回忆一下系数矩阵的来历。含有n个未知量,由m个方程组成线性方程组的一般形式为:
     
   将系数按它们的位置排列形成一个表格:
     
   这个表格就是方程组的系数矩阵,它的维数是由未知量个数即n来决定的。
     下面介绍的协方差矩阵仅与维数有关,和样本数量无关。
  
   
   设  为n维随机变量,称矩阵
     
   为n维随机变量  的协方差矩阵(covariance matrix),也记为  ,其中
     
  
   为了简易起见,先举一个简单的三变量的例子,假设数据集有{x,y,z}三个维度,
  
   
  
 则协方差矩阵为:
  
   
   更进一步:
   矩阵
     
   其协方差矩阵为
     
   还是有点抽象???
   那就结合实例来理解,可能更方便一些。
   假定有下列矩阵:
     
  
 我们来计算一下协方差矩阵。
  
 结果如下:
     
   可以看出
  
 验算一下:
     
   输入值 X= [1, 5,  6]
   输入值 Y= [4 ,3 , 9]
  
 再验算一下:
     
   输入值 X= [4 ,3 , 9]
   输入值 Y= [4 ,7 , 2]

5. 协方差和协方差矩阵

 均值:        方差:        均值、方差和标准差可用于描述数据的集中趋势和离散程度。
   方差一般用来描述一维数据,而实际上我们接触的数据集大多是多维的。
   此时可以用协方差来度量两个随机变量之间的关系。
   参照方差的定义:        度量两个随机变量关系的协方差可以这样定义:        两个随机变量越线性相关,协方差越大,完全线性无关,协方差为零。
   由于随机变量的取值范围不同,两个协方差不具备可比性。
   如  是三个不同的随机变量,想要比较  与  的线性相关程度强还是  与  的线性相关程度强,通过  和  是无法比较得知的。
   我们可以定义一个相关系数  :     
   通过对协方差  归一化,得到相关系数  ,取值范围为[-1,1]。1表示完全线性正相关,-1表示完全线性负相关,0表示线性无关。
   对于多维数据,往往需要计算各维度两两之间的协方差,这样各协方差组成了一个n x n的矩阵,称为协方差矩阵。协方差矩阵是个 对称矩阵 , 对角线上的元素是各维度上随机变量的方差 。
   定义协方差矩阵为  :     
    StatQuest-Covariance and Correlation(视频)     协方差与协方差矩阵     均值,方差和协方差矩阵 

协方差和协方差矩阵

6. 协方差矩阵的介绍

在统计学与概率论中,协方差矩阵的每个元素是各个向量元素之间的协方差。是从标量随机变量到高维度随机向量的自然推广。

7. 协方差矩阵有什么意义

1、协方差矩阵中的每一个元素是表示的随机向量X的不同分量之间的协方差,而不是不同样本之间的协方差,如元素Cij就是反映的随机变量Xi,Xj的协方差。 

2、协方差是反映的变量之间的二阶统计特性,如果随机向量的不同分量之间的相关性很小,则所得的协方差矩阵几乎是一个对角矩阵。对于一些特殊的应用场合,为了使随机向量的长度较小,可以采用主成分分析的方法,使变换之后的变量的协方差矩阵完全是一个对角矩阵,之后就可以舍弃一些能量较小的分量了(对角线上的元素反映的是方差,也就是交流能量)。特别是在模式识别领域,当模式向量的维数过高时会影响识别系统的泛化性能,经常需要做这样的处理。 

3、必须注意的是,这里所得到的式(5)和式(6)给出的只是随机向量协方差矩阵真实值的一个估计(即由所测的样本的值来表示的,随着样本取值的不同会发生变化),故而所得的协方差矩阵是依赖于采样样本的,并且样本的数目越多,样本在总体中的覆盖面越广,则所得的协方差矩阵越可靠。

 4、如同协方差和相关系数的关系一样,我们有时为了能够更直观地知道随机向量的不同分量之间的相关性究竟有多大,还会引入相关系数矩阵。

协方差矩阵有什么意义

8. 如何求协方差矩阵

(1) 取列向量c和s,分别以cos(theta_i)和sin(theta_i)为分量
那么原来的矩阵是I+XY^T,其中X=[c,s],Y=[s,c]
利用Sylvester恒等式det(I+XY^T)=det(I+Y^TX)即可,后面那个二阶行列式可以算出来
(2) 记原矩阵为A,再取多项式f(x)=a1+a_2x+...+a_nx^{n-1}
再取一个Vandermonde矩阵W,W由x^n-2=0的n个复根x_1,...,x_n生成
那么AW=WD,其中D是对角阵,对角元为f(x_1),...,f(x_n),所以det(A)=det(D)
最新文章
热门文章
推荐阅读