当前位置: 首页 > news >正文

Python求均值,方差,标准差

参考链接:变异系数(Coefficient of Variation,COV)和协方差(Covariance, Cov)-CSDN博客 

参考链接:pandas中std和numpy的np.std区别_numpy pandas std-CSDN博客


在计算蛋白质谱数据中的每个蛋白对应的变异系数(Coefficient of Variation, CV)时发现,使用numpy 里的 .std() 和 pandas 里的 .std()计算得到的标准差值有差异,于是我就想一探究竟,不查不知道,一查吓一跳,又学到了!

原因在于默认情况下

numpy计算的为总体标准差,ddof=0;一般在拥有所有数据的情况下,计算所有数据的标准差时用,即最终除以n,而非n-1;

pandas计算的为样本标准偏差,ddof=1;一般在只有部分数据,但需要求总体标准差时用,当只有部分数据时,根据统计规律,除以n时计算的标准差往往偏小,因此需要除以n-1,即n-ddof;

numpy 的 .std() 和 pandas 的 .std() 函数之间是不同的

  • numpy 计算的是总体标准差,参数ddof = 0
  • pandas 计算的是样本标准差,参数ddof = 1

CV又称“离散系数”,是概率分布离散程度的一个归一化量度,其定义为标准差 \sigma 与平均值 \mu 之比:

CV = \frac{\sigma }{\mu}

变异系数的优点:

(1)消除单位的影响

(2)消除均值大小不同的影响

我们首先来看一下在统计学中怎么对总体标准差和样本标准差公式进行定义的:

  • 如果是总体,标准差公式根号内除以N
  • 如果是样本,标准差公式根号内除以(N-1)

 我们一般用Numpy来求均值、方差、标准差

import numpy as np my_list = [1,2,3,4,5,6]# 求均值
my_mean = np.mean(my_list)# 求方差
my_var = np.var(my_list)# 求标准差
my_std = np.std(my_list, ddof=1)
速度区别

速度由快到慢依次:

my_arr = pd.Series([1,2,3,4,5,6])# 速度由快至慢
np.std(my_arr.values) > my_arr.std(ddof=0) > np.std(my_arr)

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【运维】软件运维方案(2024word完整版)
  • 减分兔搜题-12123学法减分20题目及答案 #媒体#职场发展
  • 排序系列 之 快速排序
  • Mybatis plus自定义分页
  • hive动态分区导致xceivercount超限,hdfs无法创建新连接
  • R语言实现神经网络ANN
  • 从微软发iPhone,聊聊企业设备管理
  • 【机器学习】无监督学习和自监督学习
  • Kafka(四) Consumer消费者
  • 大鲸鱼docker-compose单机容器集群编排工具
  • C语言实例-约瑟夫生者死者小游戏
  • jenkins 插件版本冲突
  • JDBC常见用法
  • 下载安装VSCode并添加插件作为仓颉编程入门编辑器
  • Tensorflow入门实战 T09进行猫狗识别2
  • codis proxy处理流程
  • CSS中外联样式表代表的含义
  • Elasticsearch 参考指南(升级前重新索引)
  • Java 多线程编程之:notify 和 wait 用法
  • magento 货币换算
  • ViewService——一种保证客户端与服务端同步的方法
  • Vue.js源码(2):初探List Rendering
  • 阿里云前端周刊 - 第 26 期
  • 从输入URL到页面加载发生了什么
  • 翻译--Thinking in React
  • 飞驰在Mesos的涡轮引擎上
  • 开年巨制!千人千面回放技术让你“看到”Flutter用户侧问题
  • 如何用Ubuntu和Xen来设置Kubernetes?
  • 手写双向链表LinkedList的几个常用功能
  • 算法系列——算法入门之递归分而治之思想的实现
  • 移动端 h5开发相关内容总结(三)
  • 组复制官方翻译九、Group Replication Technical Details
  • ​sqlite3 --- SQLite 数据库 DB-API 2.0 接口模块​
  • #中的引用型是什么意识_Java中四种引用有什么区别以及应用场景
  • (编程语言界的丐帮 C#).NET MD5 HASH 哈希 加密 与JAVA 互通
  • (免费领源码)Java#Springboot#mysql农产品销售管理系统47627-计算机毕业设计项目选题推荐
  • (牛客腾讯思维编程题)编码编码分组打印下标题目分析
  • (四)activit5.23.0修复跟踪高亮显示BUG
  • (算法)硬币问题
  • (一)认识微服务
  • .java 指数平滑_转载:二次指数平滑法求预测值的Java代码
  • .Mobi域名介绍
  • .net core Swagger 过滤部分Api
  • .net 微服务 服务保护 自动重试 Polly
  • .net开发时的诡异问题,button的onclick事件无效
  • .NET设计模式(7):创建型模式专题总结(Creational Pattern)
  • .vue文件怎么使用_vue调试工具vue-devtools的安装
  • ?.的用法
  • @Import注解详解
  • [ 转载 ] SharePoint 资料
  • [.NET]桃源网络硬盘 v7.4
  • []我的函数库
  • [240527] 谷歌 CEO 承认 AI 编造虚假信息问题难解(此文使用 @gemini 命令二次创作)| ICQ 停止运作
  • [8481302]博弈论 斯坦福game theory stanford week 1
  • [AIR] NativeExtension在IOS下的开发实例 --- IOS项目的创建 (一)