当前位置: 首页 > news >正文

正态分布(Normal distribution)又名高斯分布(Gaussian distribution)

一 数学期望

离散型随机变量X的取值为
   
   
为X对应取值的概率,可理解为数据
   
出现的频率
   
,则:
(可理解为平均值)
 
二 
标准方差:方差的平方根,一组数据中的每一个数与这组数据的平均数的差的平方的和再除以数据的个数,再取平方根。

σ={[∑(Xi-X)^2]/n}^(1/2)
σ标准方差
Xi样本数据,i取1到n
X样本的平均数
n样本个数

标准方差能反映一个数据集的离散程度,数据整体分布离平均值越近,标准方差就越小。

正态分布Normal distribution)又名高斯分布Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:

XN(μ,σ2),

则其概率密度函数为

f(x) = {1 \over \sigma\sqrt{2\pi} }\,e^{- {​{(x-\mu )^2 \over 2\sigma^2}}}

正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布μ = 0,σ = 1的正态分布(见右图中绿色曲线)。

 

 

  1. 对于正态分布,我们只需要知道三件事,1)它长什么样的就是下图,2)他的两个参数,平均数和标准差,3)对于这个图的解释是什么,也就是平均数周围的得分在总体上占到大多数(平均数上下1.96个标准差的得分占到95%的总体)

    什么是正态分布?
  2. 2

    首先,假如我们拿一个省的人口进行身高测量,那么我们可以将所有人的平均数和标准差求出,假如平均数为1.70,标准差为0.05。我们发现在平均数附近的人特别多,比如说在1.70-1.96*0.05到1.70+1.96*0.05的人占到了总人数的95%,这个时候我们大概能够判断出这个省的身高服从正态分布。

  3. 3

    当然这只是举例方便大家好理解,那要得出身高为正态分布的这个结论,必须将数据与正态分布的概率密度函数进行拟合。这里对于一般采用spss进行数据分析的人来说,大可不必去纠缠于这些算法。我们只需要知道正态分布有什么特点,如何利用正态分布的特点进行参数的估计。

  4. 4

    实际上大多数的牵涉到很大样本的数据都被证明是正态分布的,比如体重,学习成绩等。拿学习成绩来说,中等得分的学生占大多数,非常拔尖的以及非常差的占很少的一部分,这就是正态分布的特点。

转载于:https://www.cnblogs.com/Ph-one/p/8136812.html

相关文章:

  • MLP(多层神经网络)介绍
  • ring0
  • 什么是“欧几里德范数”(Euclidean norm)?
  • 协方差矩阵
  • float 为什么可以表示很大的整数
  • Sourceinsight最佳配色方案及颜色字体调整方法
  • P(Y|X) 和 P(X,Y)
  • shall的过去式和should怎么区分
  • C语言string.h常用函数总结
  • linux 用户态和内核态以及进程上下文、中断上下文 内核空间用户空间理解
  • strace命令
  • Linux系统调用怎么和内核或底层驱动交互的
  • linux系统调用是通过软中断实现的吗
  • linux块设备读写流程
  • linux 块设备-整理(一)
  • 【知识碎片】第三方登录弹窗效果
  • 0x05 Python数据分析,Anaconda八斩刀
  • CentOS7简单部署NFS
  • Linux中的硬链接与软链接
  • MySQL常见的两种存储引擎:MyISAM与InnoDB的爱恨情仇
  • php的插入排序,通过双层for循环
  • 前端面试之闭包
  • 区块链技术特点之去中心化特性
  • 限制Java线程池运行线程以及等待线程数量的策略
  • 小程序开发之路(一)
  • 写给高年级小学生看的《Bash 指南》
  • Spring Batch JSON 支持
  • # MySQL server 层和存储引擎层是怎么交互数据的?
  • ## 临床数据 两两比较 加显著性boxplot加显著性
  • #我与Java虚拟机的故事#连载13:有这本书就够了
  • $.ajax()
  • (12)Hive调优——count distinct去重优化
  • (C#)Windows Shell 外壳编程系列9 - QueryInfo 扩展提示
  • (十一)手动添加用户和文件的特殊权限
  • (算法)前K大的和
  • (新)网络工程师考点串讲与真题详解
  • (译)计算距离、方位和更多经纬度之间的点
  • (原創) 如何優化ThinkPad X61開機速度? (NB) (ThinkPad) (X61) (OS) (Windows)
  • .desktop 桌面快捷_Linux桌面环境那么多,这几款优秀的任你选
  • .net 使用$.ajax实现从前台调用后台方法(包含静态方法和非静态方法调用)
  • .net 提取注释生成API文档 帮助文档
  • @autowired注解作用_Spring Boot进阶教程——注解大全(建议收藏!)
  • @Data注解的作用
  • [1525]字符统计2 (哈希)SDUT
  • [AIGC] Java 和 Kotlin 的区别
  • [CUDA手搓]从零开始用C++ CUDA搭建一个卷积神经网络(LeNet),了解神经网络各个层背后算法原理
  • [error] 17755#0: *58522 readv() failed (104: Connection reset by peer) while reading upstream
  • [IE编程] 多页面基于IE内核浏览器的代码示例
  • [Latex] Riemann 问题中的激波,接触间断,膨胀波的 Tikz 绘图
  • [LeetCode] Contains Duplicate
  • [leetcode] Longest Palindromic Substring
  • [Linux] PHP程序员玩转Linux系列-telnet轻松使用邮箱
  • [NOI2005]月下柠檬树[计算几何(simpson)]
  • [Notes]python argparse模块
  • [poj2891]Strange Way to Express Integers(扩展中国剩余定理)