当前位置: 首页 > news >正文

《大数据管理概论》一第1章概  述1.1 大数据的基本概念

本节书摘来自华章出版社《大数据管理概论》一书中的第1章,第1.1节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看

‖第1章

概  述

1.1 大数据的基本概念

已故的图灵奖得主Jim Gray在其《事务处理》一书中提到:6000年以前,苏美尔人(Sumerians)就使用了数据记录的方法,已知最早的数据是写在土块上,上面记录着皇家税收、土地、谷物、牲畜、奴隶和黄金等情况。随着社会的进步和生产力的提高,类似土块的处理系统演变了数千年,经历了殷墟甲骨文、古埃及纸莎草纸、羊皮纸等。19世纪后期打孔卡片出现,用于1890年美国人口普查,用卡片取代土块,使得系统可以每秒查找或更新一个“土块”(卡片)。可见,用数据记录社会由来已久,而数据的多少和系统的能力是与当时社会结构的复杂程度和生产力水平密切相关的。
随着人类进入21世纪,尤其是互联网和移动互联网技术的发展,使得人与人之间的联系日益密切,社会结构日趋复杂,生产力水平得到极大提升,人类创造性活力得到充分释放,与之相应的数据规模和处理系统发生了巨大改变,从而催生了当下众人热议的大数据局面。
从历史观的角度看,数据(D)和社会(S)形成了一定的对应关系,即:D1~f (SSumerians),…,Dbig~f (Spresent),…,Dn~f (Sfuture)。从量的关系上,D1,…,Dbig,…,Dn可能存在大小关系,还可形成包含关系,但它们只是与当时的社会发展状况相对应:Dbig不可能反映代表未来的Dn,因为我们不知道未来会有什么新的社会结构(诸如当下社交网络一类的事物)出现,也不知道会有什么新的生产活动(诸如电商一类的事物)产生;同样D1也不需要具有Dbig的规模,因为当时人们并没有如此频繁的联系。近期,美国加州大学伯克利分校Michael I. Jordan教授提出“大数据的冬天即将到来”,如果我们能历史地认识Dbig的地位,没有把Dbig当Dn,就不存在“冬天”与“春天”的问题。这是历史客观发展的事实。
基于以上分析,当下大数据的产生主要与人类社会生活网络结构的复杂化、生产活动的数字化、科学研究的信息化相关,其意义和价值在于可帮助人们解释复杂的社会行为和结构,以及提高生产力,进而丰富人们发现自然规律的手段。本质上,大数据具有以下三方面的内涵,即大数据的“深度”、大数据的“广度”以及大数据的“密度”。所谓“深度”是指单一领域数据汇聚的规模,可以进一步理解为数据内容的“维度”;“广度”则是指多领域数据汇聚的规模,侧重体现在数据的关联、交叉和融合等方面;“密度”是指时空维上数据汇聚的规模,即数据积累的“厚度”以及数据产生的“速度”。
面对不断涌现的大数据应用,数据库乃至数据管理技术面临新的挑战。传统的数据库技术侧重考虑数据的“深度”问题,主要解决数据的组织、存储、查询和简单分析等问题。其后,数据管理技术在一定程度上考虑了数据的“广度”和“密度”问题,主要解决数据的集成、流处理、图结构等问题。这里提出的大数据管理是要综合考虑数据的“广度”“深度”“密度”等问题,主要解决数据的获取、抽取、集成、复杂分析、解释等技术难点。因此,与传统数据管理技术相比,大数据管理技术难度更高,处理数据的“战线”更长。

相关文章:

  • table表格的常用功能
  • 《JavaScript面向对象编程指南》——2.4 基本数据类型综述
  • {转}Java 理论与实践: 正确使用 Volatile 变量
  • 《iOS 8案例开发大全》——实例009 启动模拟器
  • 腾讯:致广大QQ用户的一封信
  • 《JavaScript面向对象编程指南》——2.7 注释
  • 关于360与腾讯QQ之争 IT人士的看法
  • 用SQL创建数据库登录用户
  • 《Spark大数据分析:核心概念、技术及实践》一1.7 总结
  • PDF 补丁丁(修改书签、拆分合并、提取图片、制作图片PDF) 0.2.9.6
  • 《JavaScript数据可视化编程》——导读
  • C# 空接合(??)运算符
  • 《Java程序员面试秘笈》—— 面试题8 在Java中,对象是如何传递消息的
  • 学会总结,学会关注细节,学会拥有一颗平静的心。
  • Linux集群和自动化维2.2.1 Shell脚本的基本元素
  • 【Leetcode】101. 对称二叉树
  • JavaScript-如何实现克隆(clone)函数
  • 【从零开始安装kubernetes-1.7.3】2.flannel、docker以及Harbor的配置以及作用
  • 2017 前端面试准备 - 收藏集 - 掘金
  • Javascript编码规范
  • JS进阶 - JS 、JS-Web-API与DOM、BOM
  • js正则,这点儿就够用了
  • Lucene解析 - 基本概念
  • spring + angular 实现导出excel
  • Vue UI框架库开发介绍
  • vuex 学习笔记 01
  • webpack4 一点通
  • 记一次和乔布斯合作最难忘的经历
  • 名企6年Java程序员的工作总结,写给在迷茫中的你!
  • 浅谈JavaScript的面向对象和它的封装、继承、多态
  • 如何打造100亿SDK累计覆盖量的大数据系统
  • 微信公众号开发小记——5.python微信红包
  • JavaScript 新语法详解:Class 的私有属性与私有方法 ...
  • Linux权限管理(week1_day5)--技术流ken
  • MPAndroidChart 教程:Y轴 YAxis
  • # include “ “ 和 # include < >两者的区别
  • #mysql 8.0 踩坑日记
  • #NOIP 2014# day.1 生活大爆炸版 石头剪刀布
  • #中的引用型是什么意识_Java中四种引用有什么区别以及应用场景
  • (1)(1.19) TeraRanger One/EVO测距仪
  • (1)SpringCloud 整合Python
  • (4)Elastix图像配准:3D图像
  • (5)STL算法之复制
  • (9)目标检测_SSD的原理
  • (C#)if (this == null)?你在逗我,this 怎么可能为 null!用 IL 编译和反编译看穿一切
  • (C++20) consteval立即函数
  • (SpringBoot)第七章:SpringBoot日志文件
  • (二)构建dubbo分布式平台-平台功能导图
  • (力扣题库)跳跃游戏II(c++)
  • (免费分享)基于springboot,vue疗养中心管理系统
  • (三)centos7案例实战—vmware虚拟机硬盘挂载与卸载
  • (十二)devops持续集成开发——jenkins的全局工具配置之sonar qube环境安装及配置
  • (数位dp) 算法竞赛入门到进阶 书本题集
  • (循环依赖问题)学习spring的第九天
  • (一)基于IDEA的JAVA基础1