当前位置: 首页 > news >正文

【SCAU数据挖掘】数据挖掘期末总复习题库简答题及解析——下

1.从某超市顾客中随机抽取5名,他们的购物篮数据的二元0/1表示如下:

顾客号

面包

 牛奶

尿布

啤酒

鸡蛋

可乐

1

1

1

0

0

0

0

2

1

0

1

1

1

0

3

0

1

1

1

0

1

4

1

1

1

1

0

0

5

1

1

1

0

0

1

某学生依据这些数据做关联分析,考虑规则{牛奶,尿布}->{啤酒},请计算该规则的支持度(support)、置信度(confidence)。

可以这样看:

T1   {面包,牛奶}
T2   {面包,尿布,啤酒,鸡蛋}
T3  {牛奶,尿布,啤酒,可乐}
T4  {面包,牛奶,尿布,啤酒}
T5  {面包,牛奶,尿布,可乐}

对于规则{牛奶,尿布}->{啤酒},X = {牛奶,尿布},Y = {啤酒}。

支持度(Support): 是指同时包含X和Y的事务在总事务中的比例。
 
置信度(Confidence): 是指包含X的事务同时也包含Y的比例。

支持度(Support):

Support(牛奶,尿布→啤酒)=2/5​=0.4

置信度(Confidence):

Confidence(牛奶,尿布→啤酒)=2/3​=0.667

2.

逻辑回归中,常用优势比OR(Odds Ratio)衡量因素作用大小的比数,即:

在一个具有17个家庭的样本里,共有3家的收入为10000元,5家的收入为11 000元,9家的收入为12 000元。在收入为10000元的家庭里,1个主妇不工作,2个主妇工作;在收入为11000元的家庭里,1个主妇不工作,4个主妇工作;在收入为12000元的家庭里,1个主妇不工作,8个主妇工作。

收入(单位:千)

主妇工作情况

总计

0(不工作)

1(工作)

10

1

2

3

11

1

4

5

12

1

8

9

总计

3

14

17

令收入为变量,X类别标签为工作状态。

(1)计算X为10和11时,优势比OR等于多少?

(2)计算X为11和12时,优势比OR等于多少?

优势比(Odds Ratio,OR)是用于衡量自变量对因变量影响程度的一种指标。它表示在不同自变量值情况下,事件发生的几率值之比。OR = (P1/(1-P1)) / (P0/(1-P0))

(1)

当X=10时,不工作的概率1-P0 = 1/3, 工作的概率为P0 = 2/3
当X=11时,不工作的概率1-P1 = 1/5, 工作的概率为P1 = 4/5

代入公式:
OR = (4/5 / 1/5)/ (2/3 / 1/3)
    = 4 / 2
    = 2

(2)

当X=11时,不工作的概率1-P0 = 1/5, 工作的概率为P0 = 4/5  
当X=12时,不工作的概率1-P1 = 1/9, 工作的概率为P1 = 8/9

代入公式:
OR =  (8/9 / 1/9)  /  (4/5 / 1/5)
    = (8/1) /4
    = 2

相关文章:

  • 使用 DISPATCHERS 进行 Blueprint 之间的通信
  • Python二级考试试题
  • Python高效内存访问,memoryview这个神器你值得拥有!
  • zlib库的交叉编译记录
  • 【Redis】java客户端(SpringData和jedis)
  • Kotlin 实战小记:No-Arg 引用解决 No constructor found的问题
  • Ubuntu24使用kubeadm部署高可用K8S集群
  • js处理数据(过滤)
  • 御道源码(ruoyi-vue-pro)个人使用小结
  • 运维:k8s常用命令大全
  • Docker部署nacos集群
  • css预处理是什么?作用是什么?
  • C# 利用XejeN框架源码,编写一个在 Winform 界面上的语法高亮的编辑器,使用 Monaco 编辑器
  • el-input-number 限制输入正整数
  • 部署YUM仓库及NFS共享服务
  • @jsonView过滤属性
  • 【从零开始安装kubernetes-1.7.3】2.flannel、docker以及Harbor的配置以及作用
  • php中curl和soap方式请求服务超时问题
  • 闭包--闭包之tab栏切换(四)
  • 基于webpack 的 vue 多页架构
  • 学习ES6 变量的解构赋值
  • 数据库巡检项
  • ​ ​Redis(五)主从复制:主从模式介绍、配置、拓扑(一主一从结构、一主多从结构、树形主从结构)、原理(复制过程、​​​​​​​数据同步psync)、总结
  • ‌前端列表展示1000条大量数据时,后端通常需要进行一定的处理。‌
  • #pragam once 和 #ifndef 预编译头
  • (1)(1.19) TeraRanger One/EVO测距仪
  • (附源码)springboot助农电商系统 毕业设计 081919
  • (蓝桥杯每日一题)平方末尾及补充(常用的字符串函数功能)
  • (十七)devops持续集成开发——使用jenkins流水线pipeline方式发布一个微服务项目
  • (四)stm32之通信协议
  • (一)Mocha源码阅读: 项目结构及命令行启动
  • ****Linux下Mysql的安装和配置
  • ..回顾17,展望18
  • .NET 的静态构造函数是否线程安全?答案是肯定的!
  • .Net 应用中使用dot trace进行性能诊断
  • .net/c# memcached 获取所有缓存键(keys)
  • .net打印*三角形
  • .NET设计模式(8):适配器模式(Adapter Pattern)
  • /etc/X11/xorg.conf 文件被误改后进不了图形化界面
  • @Transactional 详解
  • [ vulhub漏洞复现篇 ] Apache APISIX 默认密钥漏洞 CVE-2020-13945
  • [ 攻防演练演示篇 ] 利用通达OA 文件上传漏洞上传webshell获取主机权限
  • [ 蓝桥杯Web真题 ]-Markdown 文档解析
  • [100天算法】-目标和(day 79)
  • [100天算法】-实现 strStr()(day 52)
  • [ACM独立出版] 2024年虚拟现实、图像和信号处理国际学术会议(VRISP 2024,8月2日-4)
  • [AIGC] 深入浅出 Python中的`enumerate`函数
  • [BUUCTF 2018]Online Tool
  • [C++]使用yolov10的onnx模型结合onnxruntime和bytetrack实现目标追踪
  • [C++提高编程](三):STL初识
  • [Git场景]常用工作场景演练
  • [hdu 3746] Cyclic Nacklace [kmp]
  • [hdu4622 Reincarnation]后缀数组
  • [iOS]把16进制(#871f78)颜色转换UIColor
  • [js高手之路] dom常用API【appendChild,insertBefore,removeChild,replaceChild,cloneNode】详解与应用...