当前位置: 首页 > news >正文

你确认自己做的是“数据驱动”吗?

本文由泡面办公室原创首发

前言

移动互联网技术的快速发展,移动终端的广泛普及,催生了大数据技术。今天,无论是个人的日常生活,还是企业的业务发展,都和数据密切相关,大数据技术正成为新发明、新产品和新服务的创新源泉。

近几年,各种驱动在天上飘,有产品驱动、技术驱动、政策驱动还有老板驱动,大数据也不甘寂寞,于是乎“数据驱动”一词渐渐热了起来。很多企业都说自己在搞数据驱动,也有不少从事数据技术的公司在对外提供数据驱动的技术咨询和实施服务。各个行业都在激动地讨论着“数据驱动”,有些公司甚至宣称已经实现了“数据驱动”。

像大数据和区块链一样,很多人似是而非地讨论着数据驱动,而且数据驱动逐渐也有很大希望继在大数据、区块链之后成为另外一个忽悠人民恐吓百姓的民俗化名词。那么到底什么是数据驱动呢?你真的在做数据驱动吗?

何为“数据驱动”

在讨论数据驱动前,首先让我们看一个例子,打开手机移动应用Uber,APP页面会有优惠码提示:转发优惠码,如有下线使用该优惠码,你将获得优惠;在用车时,APP会根据坐车时间段和车辆紧张程度,提醒溢价的倍数,你如果不接受,则订单取消;打车结束后,APP自动选择优惠券进行结算,无需手动选择;最后你的邮箱将收到此次打车的中英文版本的邮件。整个过程全部由系统自动完成,无需人工决策。包括转发优惠码的部分,也是由系统自动提醒,刺激用户点击完成的。

由此可见,数据驱动是通过移动互联网或者其他的相关软件为手段采集海量的数据,将数据进行组织形成信息,之后对相关的信息进行整合和提炼,在数据的基础上经过训练和拟合形成自动化的决策模型。当新的情况发生,新数据输入的时候,系统可以用前面建立的模型以人工智能的方式直接进行决策。如下图所示,信号、数据、信息、情报、知识、智慧,一环扣一环,不断地上升迭代,完成一个又一个决策。 

信号是机器可读的模拟或者数字脉冲,数据是人类可读的信号,信息是经过索引后可以查询的组织化的数据,而情报是对特定人在特定场景下有针对性的信息,知识是大量情报积累后可以改变人的知识结构的部分,智慧是基于知识和经验可用于决策的部分。这个决策在人工智能时代就是基于数据和算法,特别是机器学习建立模型和使用模型的决策。因为在移动互联网时代,业务需要海量毫秒级的瞬间决策,这是人类决策无法完成的。另外,人是感情动物,所有的决策会夹杂着情绪、亲情、关系等社会关系,所做的决策未必是完全客观的,很有可能添加了主观因素。基于数据和模型的数据驱动决策是更加靠谱的方式。

但是这个过程需要数据的不断输入,需要模型根据比对决策结果和现实数据把偏差信息反馈给机器学习,在其后不断的机器学习迭代过程中自我完善。从这个过程的描述中我们可以看到,数据驱动对企业的要求非常高,要有流式的数据不断地注入,要有以机器学习为基础的决策模型,要有能依赖模型输出结果可以推动的业务系统,要有可以反馈预测偏差的反馈机制。

现在大家常听到“数据驱动”,也有很多公司对外宣称其实现了“数据驱动”,诸如“这是一家数据驱动公司”等话语比比皆是。但它果真是一家“数据驱动”公司么?

“数据驱动”的特征

在一个真正的数据驱动的企业,数据是提供报告、深度模拟预测的来源,企业决策者应该将数据分析纳入公司决策流程,并对公司的决策提供价值和影响。数据驱动企业最大的特点是拥有一套完整的数据价值体系。数据价值体系指的是一套完整的从数据收集、整理、报告到转化成行业洞见和决策建议的流程。而落实到操作层面则是通过对数据的收集、整理、提炼,总结出规律形成一套智能模型,之后通过人工智能的方式作出最终的决策。因此,真正的数据驱动公司应该具备以下特征:

1、海量的数据;

2、自动化的业务;

3、强大的模型支持自动化决策。

这三个条件缺一不可,并形成一个循环,不断地进行数据收集,完成建模,自动决策。

何为“以数据为中心”

到目前为止,好多宣称自己是“数据驱动”业务的公司,其实并没有真正的做到“数据驱动”,也许他只是一个“以数据为中心”进行决策的公司,只是在利用数据,并没有真正实现数据的价值。

“以数据为中心进行决策”的方式与“数据驱动”相比,他没有“数据驱动”那样的智能,也没有“数据驱动”那样的高效。“以数据为中心进行决策”顾名思义就是用数据来支持决策,这些数据包括历史记录中的和现在产生的。通过对数据的整理、抽取,将数据转化为可读的知识,形成分析结果,决策者根据分析报告的结果考虑并决定决策结果,最终决策由人为参与。

举一个简单的例子,假设有A 和 B两家订票网站,A 公司将从网站收集到的数据进行分析,通过数据分析结果认为五一是出行高峰,于是决定抬高价格,并手动从后台调整了五一前后的机票价格和酒店价格。

B 公司则通过自动化手段实时收集、分析相关信息,总结规律,形成智能模型,当用户进行搜索时,后台自动根据模型规则,对价格进行调整。

这2个公司,哪家是数据驱动型的公司呢?

显而易见,公司 B 是数据驱动型的公司,而公司 A 则是一家“以数据为中心进行决策”的公司。

“以数据为中心进行决策”的公司,表面上公司所有人员,如产品、运营、技术、销售都可以贡献数据,也可以从数据里得出东西,但中间做决策的是人。如 A 公司,最终由人来决定机票是否提价。

数据即未来

那么该如何真正的打造一个“数据驱动”的项目或公司呢?现在市面上关于大数据的书籍汗牛充栋,扔出去一块砖也可以砸到N个大数据专家。但是数据科学作为一门严肃的新学科方兴未艾,真正关于利用数据科学的方法论解决实际工作中的数据科学问题的实践书籍少之又少。Brian Godsy(布瑞恩·戈德西)在他的《数据即未来》一书详细介绍了数据科学项目的三个阶段:

1、准备阶段进行信息收集;

2、构建阶段将计划付诸行动,利用准备阶段获得的信息以及相关统计和软件提供的可用工具来构建产品;

3、交付阶段进行产品的交付、反馈及修改等。

书中还会教你如何预见问题以及如何处理不确定性,一步步引导你完成软件和科学思维的最佳实践,堪称“数据驱动”方面的扛鼎之作。现在他的中文译版《数据即未来》即将在京东发售。

中文版译者陈斌,先后译有《架构即未来》、《架构真经》等书,其中《架构即未来》还得到了CCTV2《第一时间》栏目的大力推荐。希望这本《数据即未来》能为更多想要在数据领域有所研究的人提供帮助。

相关阅读

《数据即未来》

大数据王者之道

ISBN:978-7-111-58926-6

作 者:[美] 布瑞恩·戈德西 著 

译 者:陈斌 译

定 价:79.00元

出版时间:2018/04

内容简介:

数据即未来:大数据王者之道!

驾驭数据,预见未来,洞察数据科学家思维;

一本帮助你理解数据科学过程,高效完成数据科学项目的实用指南。

易宝CTO陈斌翻译,继《架构即未来》《架构真经》之后又一力作!

相关文章:

  • Google 发布 TensorFlow.js,将机器学习带上浏览器
  • 首都程序员最不爱运动、成都程序员有房又有车、上海程序员最辛苦……原来我们是这样的程序员!
  • 3月份GitHub上最热门的开源项目
  • Web应用安全七大“致命”错误
  • TIOBE 4 月排行榜:Python 强势增长,背后的主力推动者究竟是谁?
  • 以太坊与比特币的异同
  • 不止 Java,Oracle 向 JavaScript 开炮!
  • 犀牛书,Core java以及Python、机器学习等千本好书尽在当当书香节
  • Coder止步35岁?别闹,这份书单带你走上程序员进阶之路!
  • 天了噜,Java 8 要停止维护了!
  • 利用漏洞更改Google搜索排名
  • 这样的代码才是好代码
  • Python 人气王,JS 比 Java 更受企业青睐,PHP不再是最好的语言
  • 中国程序员VS美国程序员,差距在哪里?
  • 扎克伯格为提高员工工作效率,亲自做了这 26 张 PPT ,值得收藏
  • 分享的文章《人生如棋》
  • 2019年如何成为全栈工程师?
  • Android开源项目规范总结
  • Android优雅地处理按钮重复点击
  • CNN 在图像分割中的简史:从 R-CNN 到 Mask R-CNN
  • crontab执行失败的多种原因
  • ES6语法详解(一)
  • HTTP那些事
  • iOS仿今日头条、壁纸应用、筛选分类、三方微博、颜色填充等源码
  • JavaScript新鲜事·第5期
  • JavaSE小实践1:Java爬取斗图网站的所有表情包
  • QQ浏览器x5内核的兼容性问题
  • session共享问题解决方案
  • 阿里云应用高可用服务公测发布
  • 代理模式
  • 工程优化暨babel升级小记
  • 后端_MYSQL
  • 基于web的全景—— Pannellum小试
  • 如何利用MongoDB打造TOP榜小程序
  • 王永庆:技术创新改变教育未来
  • 网页视频流m3u8/ts视频下载
  • 再谈express与koa的对比
  • ​secrets --- 生成管理密码的安全随机数​
  • ​软考-高级-系统架构设计师教程(清华第2版)【第20章 系统架构设计师论文写作要点(P717~728)-思维导图】​
  • #{}和${}的区别是什么 -- java面试
  • (10)工业界推荐系统-小红书推荐场景及内部实践【排序模型的特征】
  • (办公)springboot配置aop处理请求.
  • (附源码)计算机毕业设计ssm基于B_S的汽车售后服务管理系统
  • (论文阅读30/100)Convolutional Pose Machines
  • (五)c52学习之旅-静态数码管
  • (转)memcache、redis缓存
  • (转)nsfocus-绿盟科技笔试题目
  • (转)淘淘商城系列——使用Spring来管理Redis单机版和集群版
  • .NET CORE使用Redis分布式锁续命(续期)问题
  • .NET:自动将请求参数绑定到ASPX、ASHX和MVC(菜鸟必看)
  • .NET构架之我见
  • .NET连接数据库方式
  • .NET文档生成工具ADB使用图文教程
  • @软考考生,这份软考高分攻略你须知道
  • [].slice.call()将类数组转化为真正的数组