当前位置: 首页 > news >正文

【数据挖掘-思考】分类和聚类

在这里插入图片描述

将芝麻和花生分开,是一个分类问题还是聚类问题?

显而易见的,在日常生活中,这是一个分类问题,在数据挖掘领域中,是否也是这样呢?


通义千问的回答:

在数据挖掘中,将芝麻和花生分开可以根据不同的场景被视为分类或聚类问题:

  • 分类 (Classification): 如果我们已经有了一套标注好的数据集,即一部分芝麻已经被标记为“芝麻”,一部分绿豆被标记为“绿豆”,并且我们的目标是基于这些已知的样本特征来训练一个模型,以便对新的未标记物品进行预测(判断它是芝麻还是绿豆),那么这个问题就是一个分类问题。
  • 聚类 (Clustering): 如果我们没有预先标记的数据,而是有一堆混在一起的种子,我们希望通过分析种子的大小、颜色、形状等属性,将它们自动分成几组,并且假设这些组能合理地对应到芝麻和绿豆这两类,那么这就是一个聚类问题。聚类旨在根据对象之间的相似性或距离,将它们分组成多个簇,每簇内部的对象相似度较高,而簇间相似度较低。
  • 因此,决定这是分类还是聚类问题的关键在于是否有预定义的类别标签。如果有标签,就是分类;如果没有,而是需要自动发现类别,那就是聚类。

这样学术性的回答好复杂>﹏<

我的老师教给我的:

在这里插入图片描述

也就是说,需要训练数据,构建模型的问题是分类问题,很显然这里没有用到,所以是聚类问题。聚类问题关键在于根据某种标准将相似度高的对象分到一起。

你能理解吗?


点赞关注收藏,获取更多干货知识~

相关文章:

  • Java基础面试重点-1
  • 【java计算机专业毕设】月度员工绩效考核管理系统java MySQL springboot vue maven代码源码 送文档
  • Opus从入门到精通(四)Opus解码程序实现
  • 【CT】LeetCode手撕—102. 二叉树的层序遍历
  • 如何查看当前的gruop_id 的kafka 消费情况 这个可以查看到是否存在消费阻塞问题
  • 记录:UA_Client_readValueAttribute 读取失败 C0错误码
  • RabbitMQ延迟消息(通过死信交换机实现)
  • 电子画册制作与传统画册相比,有哪些优势?
  • nc网络收发测试-tcp客户端\TCP服务器\UDP\UDP广播
  • 仿element-ui 实现自己组件库 <3>
  • 前端 JS 经典:Vue 状态仓库持久化
  • 24年河北自考报名流程详细教程汇总
  • Python实战:小说分词统计-数据可视化
  • 前端框架之 MVVM
  • 金融与大模型:引领行业未来的创新融合
  • 5分钟即可掌握的前端高效利器:JavaScript 策略模式
  • CoolViewPager:即刻刷新,自定义边缘效果颜色,双向自动循环,内置垂直切换效果,想要的都在这里...
  • ECMAScript 6 学习之路 ( 四 ) String 字符串扩展
  • Java 多线程编程之:notify 和 wait 用法
  • jquery cookie
  • JS基础之数据类型、对象、原型、原型链、继承
  • js继承的实现方法
  • LeetCode29.两数相除 JavaScript
  • Linux中的硬链接与软链接
  • Node.js 新计划:使用 V8 snapshot 将启动速度提升 8 倍
  • Python实现BT种子转化为磁力链接【实战】
  • rabbitmq延迟消息示例
  • Spring Boot快速入门(一):Hello Spring Boot
  • vue-router的history模式发布配置
  • 前端面试总结(at, md)
  • 如何学习JavaEE,项目又该如何做?
  • 微信小程序设置上一页数据
  • 运行时添加log4j2的appender
  • AI算硅基生命吗,为什么?
  • 大数据全解:定义、价值及挑战
  • 好程序员web前端教程分享CSS不同元素margin的计算 ...
  • ​【数据结构与算法】冒泡排序:简单易懂的排序算法解析
  • #Java第九次作业--输入输出流和文件操作
  • #Linux(Source Insight安装及工程建立)
  • #vue3 实现前端下载excel文件模板功能
  • #每天一道面试题# 什么是MySQL的回表查询
  • (delphi11最新学习资料) Object Pascal 学习笔记---第7章第3节(封装和窗体)
  • (el-Date-Picker)操作(不使用 ts):Element-plus 中 DatePicker 组件的使用及输出想要日期格式需求的解决过程
  • (九十四)函数和二维数组
  • (三)elasticsearch 源码之启动流程分析
  • (学习日记)2024.03.25:UCOSIII第二十二节:系统启动流程详解
  • (一)搭建springboot+vue前后端分离项目--前端vue搭建
  • (原创)攻击方式学习之(4) - 拒绝服务(DOS/DDOS/DRDOS)
  • (转载)虚函数剖析
  • .bat文件调用java类的main方法
  • .NET 5种线程安全集合
  • .Net 8.0 新的变化
  • .net web项目 调用webService
  • .NET 漏洞分析 | 某ERP系统存在SQL注入
  • .NET/C# 使用 #if 和 Conditional 特性来按条件编译代码的不同原理和适用场景