当前位置: 首页 > news >正文

做数据分析为何要学统计学(2)——如何估计总体概率分布

我们可以通过手头掌握的样本来估计总体的概率分布。这个过程由以下步骤组成。

第一步,我们采用Seaborn软件的histplot函数建立核密度图(一种概率密度图)。

import numpy as np
#输入样本数据
x=np.array([2.12906357, 0.72736725, 1.05152821, 0.48600398, 1.91963227,1.62165678, 8.86319952, 0.24399412, 4.19883103, 2.80846683,1.34644303, 0.35146917, 1.7575424 , 3.90572887, 1.07404978,4.05247124, 0.65839571, 0.40166037, 2.03241598, 0.53592929])
import seaborn as sns
#kde=True会绘制概率密度曲线,否则只有直方图
sns.histplot(x,kde=True)

第二步,确定几个与之相近的候选概率分布(一般3个左右)。从上图来看,可以选择卡方分布、指数分布、伽玛分布。

第三步,分布拟合这三个候选分布的参数,并使用拟合得出的分布参数检验每一个候选分布

import scipy.stats as stats
#构造候选分布集合
dists={'expon':stats.expon,'chi2':stats.chi2,'gamma':stats.gamma}for dist in dists:#拟合每一个分布params=dists[dist].fit(x)#检验每一个分布test=stats.kstest(x,dists[dist].cdf,params)print(dist,test.pvalue,params)

第四步,选择p值(每一个值)最大的作为检验结果

expon 0.9001 (0.016, 1.91)
chi2  0.3800 (1.78, 0.016, 1.37)
gamma 0.8080 (0.94, 0.016, 1.95)

 从以上数据可以看出,样本最大可能是参数\frac{1}{ \lambda }=1.91的指数分布。而事实上,原始样本确实是以\frac{1}{ \lambda }=2生成的随机数样本

相关文章:

  • 我们一起做过的SPA——Nuxt.js介绍
  • 类MS Word 的文档处理控件TX Text Control x32 新版本抢先看!
  • 【智能家居】八、监控摄像采集、人脸识别比对进行开门功能点
  • 「公主文学」八大热点内容数据洞察(小红书)
  • 80后喜欢的经典老歌歌单总结,你最爱的是哪一首?
  • OpenCV-Python15:图像阈值处理
  • ​flutter 代码混淆
  • 《从入门到精通:AJAX基础知识解析,前端开发中利器》基础篇
  • 值得收藏:一份完整的Mysql高性能优化规范建议
  • 平面上点到直线的距离
  • Navicat 连接 GaussDB分布式的快速入门
  • 【Python】人工智能-机器学习——不调库手撕深度网络分类问题
  • 编程应用实际场景:台球厅怎么样用电脑给客人计时,台球计时收费系统操作教程
  • 接口测试-Jmeter使用
  • 模式识别II改进版Python
  • 【MySQL经典案例分析】 Waiting for table metadata lock
  • 2017 前端面试准备 - 收藏集 - 掘金
  • const let
  • If…else
  • Java 内存分配及垃圾回收机制初探
  • jQuery(一)
  • mongodb--安装和初步使用教程
  • TypeScript迭代器
  • 初识 webpack
  • 从伪并行的 Python 多线程说起
  • 得到一个数组中任意X个元素的所有组合 即C(n,m)
  • 分享几个不错的工具
  • 回顾2016
  • 基于HAProxy的高性能缓存服务器nuster
  • 解析 Webpack中import、require、按需加载的执行过程
  • 漂亮刷新控件-iOS
  • 前端面试题总结
  • 如何使用 OAuth 2.0 将 LinkedIn 集成入 iOS 应用
  • 算法-图和图算法
  • 通过npm或yarn自动生成vue组件
  • 网络应用优化——时延与带宽
  • 移动端 h5开发相关内容总结(三)
  • 用Python写一份独特的元宵节祝福
  • 在Unity中实现一个简单的消息管理器
  • ​二进制运算符:(与运算)、|(或运算)、~(取反运算)、^(异或运算)、位移运算符​
  • #NOIP 2014# day.2 T2 寻找道路
  • #pragma 指令
  • #经典论文 异质山坡的物理模型 2 有效导水率
  • (01)ORB-SLAM2源码无死角解析-(56) 闭环线程→计算Sim3:理论推导(1)求解s,t
  • (4)通过调用hadoop的java api实现本地文件上传到hadoop文件系统上
  • (cos^2 X)的定积分,求积分 ∫sin^2(x) dx
  • (笔记)Kotlin——Android封装ViewBinding之二 优化
  • (读书笔记)Javascript高级程序设计---ECMAScript基础
  • (分享)一个图片添加水印的小demo的页面,可自定义样式
  • (附源码)ssm智慧社区管理系统 毕业设计 101635
  • (区间dp) (经典例题) 石子合并
  • (学习日记)2024.03.12:UCOSIII第十四节:时基列表
  • (学习日记)2024.03.25:UCOSIII第二十二节:系统启动流程详解
  • (一)Mocha源码阅读: 项目结构及命令行启动
  • (转)Sublime Text3配置Lua运行环境