Python求均值,方差,标准差
创始人
2024-12-26 14:08:38
0

参考链接:变异系数(Coefficient of Variation,COV)和协方差(Covariance, Cov)-CSDN博客 

参考链接:pandas中std和numpy的np.std区别_numpy pandas std-CSDN博客


在计算蛋白质谱数据中的每个蛋白对应的变异系数(Coefficient of Variation, CV)时发现,使用numpy 里的 .std() 和 pandas 里的 .std()计算得到的标准差值有差异,于是我就想一探究竟,不查不知道,一查吓一跳,又学到了!

原因在于默认情况下

numpy计算的为总体标准差,ddof=0;一般在拥有所有数据的情况下,计算所有数据的标准差时用,即最终除以n,而非n-1;

pandas计算的为样本标准偏差,ddof=1;一般在只有部分数据,但需要求总体标准差时用,当只有部分数据时,根据统计规律,除以n时计算的标准差往往偏小,因此需要除以n-1,即n-ddof;

numpy 的 .std() 和 pandas 的 .std() 函数之间是不同的

  • numpy 计算的是总体标准差,参数ddof = 0
  • pandas 计算的是样本标准差,参数ddof = 1

CV又称“离散系数”,是概率分布离散程度的一个归一化量度,其定义为标准差 \sigma 与平均值 \mu 之比:

CV = \frac{\sigma }{\mu}

变异系数的优点:

(1)消除单位的影响

(2)消除均值大小不同的影响

我们首先来看一下在统计学中怎么对总体标准差和样本标准差公式进行定义的:

  • 如果是总体,标准差公式根号内除以N
  • 如果是样本,标准差公式根号内除以(N-1)

 我们一般用Numpy来求均值、方差、标准差

import numpy as np    my_list = [1,2,3,4,5,6]  # 求均值 my_mean = np.mean(my_list)  # 求方差 my_var = np.var(my_list)  # 求标准差 my_std = np.std(my_list, ddof=1)
速度区别

速度由快到慢依次:

my_arr = pd.Series([1,2,3,4,5,6])  # 速度由快至慢 np.std(my_arr.values) > my_arr.std(ddof=0) > np.std(my_arr) 

相关内容

热门资讯

实测交流!新蜜瓜房卡大厅辅助科... 实测交流!新蜜瓜房卡大厅辅助科技,随意玩辅助,科技开挂辅助脚本(有挂方式)您好:新蜜瓜房卡大厅辅助科...
透视脚本!德扑圈透视,新天道能... 新天道能不能开挂是一款专注玩家量身打造的游戏记牌类型软件,在新天道能不能开挂这款游戏中我们可以记录下...
今日焦点!一起宁德钓蟹辅助,天... 【亲,天天填大坑辅助器免费下载 这款游戏可以开挂的,确实是有挂的,很多玩家在这款天天填大坑辅助器免费...
揭秘攻略!决战十三水辅助,萍乡... 揭秘攻略!决战十三水辅助,萍乡滚筒辅助器,科技开挂辅助安装(有挂方略) 了解更多开挂安装加(1367...
透视数据!微信微乐挂有没有,青... 透视数据!微信微乐挂有没有,青龙大厅透视挂在什么位置(德州论坛辅助开挂插件);无需打开直接搜索加(薇...
教学盘点!超级三加一辅助软件,... 教学盘点!超级三加一辅助软件,新老夫子免费辅助,一向有开挂辅助脚本(有挂辅助);无需打开直接搜索加(...
信息共享!涂山山西辅助,樱花之... 【亲,樱花之盛能不能开挂 这款游戏可以开挂的,确实是有挂的,很多玩家在这款樱花之盛能不能开挂中打牌都...
透明黑科技!哈糖大菠萝万能挂,... 透明黑科技!哈糖大菠萝万能挂,wepoker底牌透视(透明挂教程!开挂辅助工具)您好:哈糖大菠萝万能...
必看攻略!奇迹手游脚本辅助全自... 【亲,奇迹手游脚本辅助全自动 这款游戏可以开挂的,确实是有挂的,很多玩家在这款奇迹手游脚本辅助全自动...
玩家亲测!开心赢三张自建房有挂... 玩家亲测!开心赢三张自建房有挂吗,新超凡辅助,详细辅助挂(发现有挂);无需打开直接搜索加薇13670...