当前位置: 首页 > news >正文

大数据技术复习--概述

概述

数据的概念:数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合,是可识别的、抽象的符号。

数据类型:文本、图片、音频、视频

从数据的结构化程度来看可以分为:

  • 结构化数据
  • 半结构化数据
  • 非结构化数据

在这里插入图片描述
数据生命周期:创建、发布利用、修改、归档/销毁
数据的使用:1. 数据清洗、2.数据管理、3. 数据分析

在这里插入图片描述

OLTP:联机事物处理,高并发且数据量级不大的查询,是主要用于管理事物的系统
OLAP:联机事物分析处理,是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果
ETL:抽取、转换、加载,是数据获取的重要手段,需要知道具体格式
ELT:ETL的时间成本和吞吐量限制(堵塞),导致ETL这种数据加工的方式不能满足于现在的企业发展需要
把Transform(转换)和Load(加载)拆开,这样处理数据的部分就专心计算就行了,搬运数据的部分就专心搬运

大数据定义

大数据是到无法通过现有手段在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息

V描述
Volume规模大,达到难以处理
Variety类型多,多到难以处理
Velocity速度快,快到难以处理
Value有价值,价值密度稀疏
Veracity真实性,数据质量有保障

科学研究的四范式

  1. 实验
  2. 理论
  3. 计算
  4. 数据

大数据技术属性

在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 代码随想录算法训练营第二十四天| 455.分发饼干, 376. 摆动序列 , 53. 最大子序和
  • wps 最新 2019 专业版 下载安装教程,解锁全部功能,免费领取
  • 计算机网络-基于PIM-DM+IGMP的组播实验配置
  • ADAPT:动作感知驾驶字幕转换器
  • HTML-02.新浪新闻-标题-样式1
  • 技战法丨攻防演练防御——纵深、联动、诱捕(可搬运、可cv)
  • Python 获取企业微信中微盘的文件列表
  • 【虚拟仿真】Unity3D中实现2DUI显示在3D物体旁边
  • Python接口自动化测试-关联参数
  • GIT版本管理与分支控制
  • SD-WAN组网技术的九大应用场景
  • WPF学习(1)-Grid控件(网格布局)
  • 一体化水位站的综合优势
  • podman学习笔记
  • JavaScript 实例:掌握编程技巧
  • Angular 2 DI - IoC DI - 1
  • classpath对获取配置文件的影响
  • input的行数自动增减
  • js对象的深浅拷贝
  • JS实现简单的MVC模式开发小游戏
  • Laravel Telescope:优雅的应用调试工具
  • Leetcode 27 Remove Element
  • leetcode378. Kth Smallest Element in a Sorted Matrix
  • maya建模与骨骼动画快速实现人工鱼
  • opencv python Meanshift 和 Camshift
  • rabbitmq延迟消息示例
  • vue2.0开发聊天程序(四) 完整体验一次Vue开发(下)
  • 官方解决所有 npm 全局安装权限问题
  • 延迟脚本的方式
  • 异常机制详解
  • 鱼骨图 - 如何绘制?
  • 智能合约开发环境搭建及Hello World合约
  • # Swust 12th acm 邀请赛# [ K ] 三角形判定 [题解]
  • # 利刃出鞘_Tomcat 核心原理解析(八)-- Tomcat 集群
  • ###C语言程序设计-----C语言学习(3)#
  • (MonoGame从入门到放弃-1) MonoGame环境搭建
  • (WSI分类)WSI分类文献小综述 2024
  • (独孤九剑)--文件系统
  • (佳作)两轮平衡小车(原理图、PCB、程序源码、BOM等)
  • (免费领源码)Java#Springboot#mysql农产品销售管理系统47627-计算机毕业设计项目选题推荐
  • (十六)串口UART
  • (十三)MipMap
  • (转)AS3正则:元子符,元序列,标志,数量表达符
  • (转)Windows2003安全设置/维护
  • (转)从零实现3D图像引擎:(8)参数化直线与3D平面函数库
  • (轉)JSON.stringify 语法实例讲解
  • ***通过什么方式***网吧
  • .NET / MSBuild 扩展编译时什么时候用 BeforeTargets / AfterTargets 什么时候用 DependsOnTargets?
  • .NET : 在VS2008中计算代码度量值
  • .NET 读取 JSON格式的数据
  • .NET 给NuGet包添加Readme
  • .NET/C# 使用 SpanT 为字符串处理提升性能
  • [ C++ ] template 模板进阶 (特化,分离编译)
  • [ vulhub漏洞复现篇 ] ThinkPHP 5.0.23-Rce
  • [20150629]简单的加密连接.txt