时间:2021-05-22
使用numpy可以做很多事情,在这篇文章中简单介绍一下如何使用numpy进行方差/标准方差/样本标准方差/协方差的计算。
variance: 方差
方差(Variance)是概率论中最基础的概念之一,它是由统计学天才罗纳德·费雪1918年最早所提出。用于衡量数据离散程度,因为它能体现变量与其数学期望(均值)之间的偏离程度。具有相同均值的数据,而标准差可能不同,而通过标准差的大小则能更好地反映出数据的偏离度。
计算:一组数据1,2,3,4,其方差应该是多少?
计算如下:
均值=(1+2+3+4)/4=2.5
方差=((1-2.5)^2 + (2-2.5)^2 + (3-2.5)^2 +(4-2.5)^2)/4 = (2.25+0.25+0.25+2.25)/4 = 1.25
python的numpy库中使用var函数即可求解,代码&执行如下:
liumiaocn:tmp liumiao$ cat np-5.py #!/usr/local/bin/pythonimport numpy as nparr = np.array([1,2,3,4])print("variance of [1,2,3,4]:", np.var(arr))liumiaocn:tmp liumiao$ python np-5.py ('variance of [1,2,3,4]:', 1.25)liumiaocn:tmp liumiao$standard deviation: 标准偏差
标准偏差=方差的开放,所以:
计算: 一组数据1,2,3,4,其标准偏差应该是多少?
计算就很简单了,对其求出的方差1.25进行开方运算即可得到大约1.118
可以使用numpy库中的std函数就可以非常简单的求解,代码&执行如下:
liumiaocn:tmp liumiao$ cat np-6.py #!/usr/local/bin/pythonimport numpy as nparr = np.array([1,2,3,4])print("variance of [1,2,3,4]:", np.var(arr))print("sqrt of variance [1,2,3,4]:",np.sqrt(np.var(arr)))print("standard deviation: np.std()", np.std(arr))liumiaocn:tmp liumiao$ python np-6.py ('variance of [1,2,3,4]:', 1.25)('sqrt of variance [1,2,3,4]:', 1.118033988749895)('standard deviation: np.std()', 1.118033988749895)liumiaocn:tmp liumiao$sample standard deviation: 样本标准偏差
标准偏差是对总体样本进行求解,如果有取样,则需要使用样本标准偏差,它也是一个求开方的运算,但是对象不是方差,方差使用是各个数据与数学均值的差的求和的均值,简单来说除的对象是N,样本偏差则是N-1。
计算: 一组数据1,2,3,4,其样本标准偏差应该是多少?
计算如下:
均值=(1+2+3+4)/4=2.5
样本标准偏差的方差=((1-2.5)^2 + (2-2.5)^2 + (3-2.5)^2 +(4-2.5)^2)/3 = (2.25+0.25+0.25+2.25)/4 = 5/3
所以对5/3开方运算所得到的就是样本标准偏差为:1.29
同样适用numpy的std函数就可以做到这点,只需要将其一个Optional的参数设定为1即可,代码&执行如下:
liumiaocn:tmp liumiao$ cat np-7.py #!/usr/local/bin/pythonimport numpy as nparr = np.array([1,2,3,4])print("sample standard deviation: np.std()", np.std(arr, ddof=1))liumiaocn:tmp liumiao$ python np-7.py ('sample standard deviation: np.std()', 1.2909944487358056)liumiaocn:tmp liumiao$注意:matlab中的std实际指的是样本标准偏差,这点需要注意,如果你的代码从matlab上copy过来,请注意其实际的意义是标准偏差还是样本标准偏差
Covariance:协方差
协方差和方差较为接近,区别在于除数为N-1。
计算: 一组数据1,2,3,4,其协方差应该是多少?
计算如下:
均值=(1+2+3+4)/4=2.5
方差=((1-2.5)^2 + (2-2.5)^2 + (3-2.5)^2 +(4-2.5)^2)/(4-1) = (2.25+0.25+0.25+2.25)/3 = 1.66667
使用numpy的cov函数即可简单求出,代码和执行结果如下:
liumiaocn:tmp liumiao$ cat np-8.py #!/usr/local/bin/pythonimport numpy as nparr = np.array([1,2,3,4])print("Covariance: np.cov()", np.cov(arr))liumiaocn:tmp liumiao$ python np-8.py ('Covariance: np.cov()', array(1.66666667))liumiaocn:tmp liumiao$总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对的支持。如果你想了解更多相关内容请查看下面相关链接
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
在数学中有协方差矩阵,我们日常中并不好直接计算出来。Excel提供了这个功能帮助我们计算协方差,小编今天特意给大家带来了关于使用Excel计算协方差矩阵的教程,
协方差的计算公式及R语言进行验证首先附上协方差公式:来设5个样本点:(3,9),(2,7),(4,12),(5,15),(6,17)用R绘制出散点图,大概是这样
标准差是方差的算术平方根;标准差用s表示。方差是标准差的平方;方差用s^2表示。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。 标准差
计算C语言中的求和、标准差、方差和标准差等,需要加上头文件:#include#include#include"math.h"doublesum=0;//求和do
Pandas主要统计特征函数:方法名函数功能sum()计算数据样本的总和(按列计算)mean()计算数据样本的算术平均数var()计算数据样本的方差std()计