当前位置：首页 > news >正文

02.6 概率

news 来源：原创 2024/4/27 18:39:58

文章目录

- 2.6 概率
- - 2.6.1. 基本概率论
  - - 2.6.1.1. 概率论公理
    - 2.6.1.2. 随机变量
  - 2.6.2. 处理多个随机变量
  - - 2.6.2.1. 联合概率
    - 2.6.2.2 条件概率
    - 2.6.2.3. 贝叶斯定理
    - 2.6.2.4. 边际化
    - 2.6.2.5. 独立性
    - 2.6.2.6. 应用
  - 2.6.3. 期望和方差
  - 2.6.4. 小结

2.6 概率

简单地说，机器学习就是做出预测。

2.6.1. 基本概率论

掷骰子
大数定律（law of large numbers）告诉我们：随着投掷次数的增加，这个估计值会越来越接近真实的潜在概率

%matplotlib inline
import torch
from torch.distributions import multinomial
from d2l import torch as d2l

fair_probs = torch.ones([6]) / 6
multinomial.Multinomial(1, fair_probs).sample()

tensor([0., 1., 0., 0., 0., 0.])

抽样（sampling）:从概率分布中抽取样本的过程称为抽样
多项分布（multinomial distribution）:将概率分配给一些离散选择的分布称为多项分布
模拟1000次投掷

# 将结果存储为32位浮点数以进行除法
counts = multinomial.Multinomial(1000, fair_probs).sample()
counts / 1000  # 相对频率作为估计值

tensor([0.1640, 0.1770, 0.1740, 0.1880, 0.1560, 0.1410])

从一个公平的骰子中生成的数据，我们知道每个结果都有真实的概率 1/6,大约是0.167，所以上面输出的估计值看起来不错。

进行500组实验，每组抽取10个样本

counts = multinomial.Multinomial(10, fair_probs).sample((500,))
cum_counts = counts.cumsum(dim=0)
estimates = cum_counts / cum_counts.sum(dim=1, keepdims=True)

d2l.set_figsize((6, 4.5))
for i in range(6):
    d2l.plt.plot(estimates[:, i].numpy(),
                 label=("P(die=" + str(i + 1) + ")"))
d2l.plt.axhline(y=0.167, color='black', linestyle='dashed')
d2l.plt.gca().set_xlabel('Groups of experiments')
d2l.plt.gca().set_ylabel('Estimated probability')
d2l.plt.legend();

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TIU1zGsi-1662219390403)(https://zh.d2l.ai/_images/output_probability_245b7d_54_0.svg)]
每条实线对应于骰子的6个值中的一个，并给出骰子在每组实验后出现值的估计概率。
当我们通过更多的实验获得更多的数据时，这条实体曲线向真实概率收敛。

2.6.1.1. 概率论公理

样本空间（sample space）或结果空间（outcome space）:集合，包含每个出现的结果
每个元素都是结果（outcome）
事件（event）是一组给定样本空间的随机结果
概率（probability）可以被认为是将集合映射到真实值的函数

2.6.1.2. 随机变量

随机变量（random variable）：随机变量几乎可以是任何数量，并且它可以在随机实验的一组可能性中取一个值

2.6.2. 处理多个随机变量

考虑多个随机变量。比如，我们可能需要对疾病和症状之间的关系进行建模。给定一个疾病和一个症状，比如“流感”和“咳嗽”，以某个概率存在或不存在于某个患者身上。我们需要估计这些概率以及概率之间的关系，以便我们可以运用我们的推断来实现更好的医疗服务。

2.6.2.1. 联合概率

两个概率同时发生的概率

2.6.2.2 条件概率

一个概率发生的前提下，另一个概率发生的概率

2.6.2.3. 贝叶斯定理

结合联合概率和条件概率的定理

2.6.2.4. 边际化

为了能进行事件概率求和，我们需要求和法则（sum rule），即一个概率相当于计算的所有可能选择，并将所有选择的联合概率聚合在一起
边际化结果的概率或分布称为边际概率（marginal probability）或边际分布（marginal distribution）。

2.6.2.5. 独立性

如果两个随机变量和是独立的，意味着事件的发生跟事件的发生无关。

2.6.2.6. 应用

示例预测

2.6.3. 期望和方差

期望（expectation，或平均值（average））
衡量随机变量与其期望值的偏置。这可以通过方差来量化
方差的平方根被称为标准差（standard deviation）

2.6.4. 小结

我们可以从概率分布中采样。
我们可以使用联合分布、条件分布、Bayes定理、边缘化和独立性假设来分析多个随机变量。
期望和方差为概率分布的关键特征的概括提供了实用的度量形式。

相关文章：

【web-渗透测试方法】(15.2)分析应用程序、测试客户端控件

03.1线性回归

【智能优化算法】基于觅食生境选择的改进粒子群算法(FHSPSO)附 Matlab代码

密码相关----对称加密，非对称加密

02.1、数据操作

离散数学 --- 命题逻辑 -- 命题符号化与命题公式

回坑记之或许是退役赛季？

初识OpenGL (-)EBO元素缓冲对象(Element Buffer Object)

typescript真的有学习的必要吗？

PyTorch Lightning入门教程（二）

【滤波跟踪】基于变分贝叶斯卡尔曼滤波器实现目标跟踪附matlab代码

C++ mutex 与 condition_variable

基础 | Spring - [单例创建过程]

K8S集群Pod资源自动扩缩容方案

SPPNet

C# 免费离线人脸识别 2.0 Demo

CSS中外联样式表代表的含义

GDB 调试 Mysql 实战（三）优先队列排序算法中的行记录长度统计是怎么来的（上）...

HashMap剖析之内部结构

HTML-表单

Java 多线程编程之：notify 和 wait 用法

JavaScript的使用你知道几种？(上)

java架构面试锦集：开源框架+并发+数据结构+大企必备面试题

laravel with 查询列表限制条数

Node.js 新计划：使用 V8 snapshot 将启动速度提升 8 倍

PAT A1092

Vue.js源码（2）：初探List Rendering

vue从创建到完整的饿了么（18）购物车详细信息的展示与删除

Vue小说阅读器（仿追书神器）

产品三维模型在线预览

当SetTimeout遇到了字符串

番外篇1：在Windows环境下安装JDK

将 Measurements 和 Units 应用到物理学

经典排序算法及其 Java 实现

警报：线上事故之CountDownLatch的威力

理清楚Vue的结构

腾讯优测优分享 | 你是否体验过Android手机插入耳机后仍外放的尴尬？

通过npm或yarn自动生成vue组件

消息队列系列二（IOT中消息队列的应用）

用jquery写贪吃蛇

Salesforce和SAP Netweaver里数据库表的元数据设计

如何用纯 CSS 创作一个货车 loader

资深实践篇 | 基于Kubernetes 1.61的Kubernetes Scheduler 调度详解 ...

力扣解法汇总1802. 有界数组中指定下标处的最大值

#pragma预处理命令

（DenseNet）Densely Connected Convolutional Networks--Gao Huang

(Java数据结构)ArrayList

(NO.00004)iOS实现打砖块游戏(十二):伸缩自如,我是如意金箍棒(上)!

(windows2012共享文件夹和防火墙设置

（笔试题）分解质因式

（补）B+树一些思想

（二）Linux——Linux常用指令

（二）正点原子I.MX6ULL u-boot移植

（附源码）ssm智慧社区管理系统毕业设计 101635

（论文阅读40-45）图像描述1