当前位置: 首页 > news >正文

大数据时代,统计学方法有多大的效果?

统计学习是一种方法,方法的好坏取决于人的使用。
数据挖掘是众多学科与统计学交叉产生的一门新兴学科。

  • 数据挖掘与统计学的共同特征
  1. 共同的目标。两者都包含了大量的数学模型,都试图通过对数据的描述,建立模型找出数据之间的关系,从而解决商业问题。
  2. 共用模型。包括线性回归、logistic回归、聚类、时间序列、主成分分析等。

  • 数据挖掘与统计学的不同之处
  1. 思想不一样。数据挖掘偏向计算机学科,所关注的某些领域和统计学家所关注的有很大不同。不一定要有精确的理论支撑,只要是有用的,能够解决问题的方式,都可以用来处理数据。而统计学是一门比较保守的学科,所沿用的模型一定要强调有理论依据(数学原理或经济学理论)。
  2. 处理数据量不一样。统计学通常使用样本数据,通过对样本数据的估计来估算总体变量。数据挖掘使用的往往是总体数据,这也在过去的年代生产力和技术限制所致。数据挖掘由于采用了数据库原理和计算机技术,它可以处理海量数据。
  3. 发现的知识方式不一样。数据挖掘的本质是很偶然的发现非预期但很有价值的知识和信息。这说明数据挖掘过程本质上是实验性的。而统计学强调确定性分析。确定性分析着眼于寻找一个最适合的模型——建立一个推荐模型,这个模型也许不能很好的解释观测到的数据。

转载于:https://www.cnblogs.com/voidobject/p/3975557.html

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 第三章:推荐系统冷启动与CB
  • 再学 GDI+[29]: TGPPen - 自定义复合画笔 - SetCompoundArray
  • WinAPI: PolyBezierTo - 绘制贝塞尔线(更新当前位置)
  • Delphi 与 DirectX 之 DelphiX(44): TDIB.DoAddColorNoise();
  • MVC与MVP(转)
  • IDisposable资源释放接口
  • 多角度看.NET面试题
  • java/.net-常用工具下载地址常用学习网址快捷键
  • 財哥面京东dm的经历【帮財哥发的】
  • 基于数据访问的集合类型-领域驱动设计的又一种特定对象
  • LVS负载均衡中arp_ignore和arp_annonuce参数配置的含义
  • Flex入门(三)——微架构之Cairngorm
  • Clink(Powerful Bash-style command line editing )
  • 通俗理解C#委托和事件
  • Select Year,Month,Day date from DropDownList control in ASP.NET
  • [nginx文档翻译系列] 控制nginx
  • 002-读书笔记-JavaScript高级程序设计 在HTML中使用JavaScript
  • angular2 简述
  • C学习-枚举(九)
  • github从入门到放弃(1)
  • gops —— Go 程序诊断分析工具
  • JS学习笔记——闭包
  • JS专题之继承
  • MD5加密原理解析及OC版原理实现
  • scrapy学习之路4(itemloder的使用)
  • spring-boot List转Page
  • Spring-boot 启动时碰到的错误
  • Spring核心 Bean的高级装配
  • Twitter赢在开放,三年创造奇迹
  • Webpack入门之遇到的那些坑,系列示例Demo
  • 阿里云爬虫风险管理产品商业化,为云端流量保驾护航
  • 持续集成与持续部署宝典Part 2:创建持续集成流水线
  • 基于MaxCompute打造轻盈的人人车移动端数据平台
  • 力扣(LeetCode)965
  • 浅谈JavaScript的面向对象和它的封装、继承、多态
  • 在electron中实现跨域请求,无需更改服务器端设置
  • 06-01 点餐小程序前台界面搭建
  • 仓管云——企业云erp功能有哪些?
  • 如何在 Intellij IDEA 更高效地将应用部署到容器服务 Kubernetes ...
  • 智能情侣枕Pillow Talk,倾听彼此的心跳
  • ​LeetCode解法汇总2304. 网格中的最小路径代价
  • #QT(串口助手-界面)
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • $Django python中使用redis, django中使用(封装了),redis开启事务(管道)
  • (6)设计一个TimeMap
  • (附源码)计算机毕业设计SSM疫情下的学生出入管理系统
  • (几何:六边形面积)编写程序,提示用户输入六边形的边长,然后显示它的面积。
  • (强烈推荐)移动端音视频从零到上手(下)
  • (一)ClickHouse 中的 `MaterializedMySQL` 数据库引擎的使用方法、设置、特性和限制。
  • (转)微软牛津计划介绍——屌爆了的自然数据处理解决方案(人脸/语音识别,计算机视觉与语言理解)...
  • .bat批处理(一):@echo off
  • .net CHARTING图表控件下载地址
  • .NET Core WebAPI中使用Log4net 日志级别分类并记录到数据库
  • .NET 读取 JSON格式的数据
  • .NET 快速重构概要1