当前位置: 首页 > news >正文

关于大数据运维能力的一些思考

作者简介: 2 0年IT工作经验,曾在华为、HP、移动、电网等国内外知名IT企业任职; 关注领域包括证券、航空、制造、电信、电网等。 在数据库开发和优化、数据仓库、系统架构、大中型项目管理、部门管理、数据挖掘和分析、数据治理、大数据方面有一定研究。

640?wx_fmt=gif

 

早在2011年的时候,收到一个任务,就是自研一套运维管理平台,当时基于硬件(CPU、内存、硬盘、网络)的开源运维平台业已成熟,但为什么要自研呢?

1、2010年前后已经开始了虚拟化的进程,只不过不像现在这么成熟这么多选择,当时的考虑更多的还是资源管理问题,虚拟化导致主机、虚拟机和资源之间出现了混搭状况,常用的开源运维平台已无法管理。

2、硬件设备和应用的关系随着虚拟机的出现,出现了多对多的访问关系,确定设备和应用的相互制约相互影响关系对构建快速响应机制极为重要。

3、硬件设备、应用和服务的关系,一般来说应用大于服务,服务可能是一个端口,也可能是一个或多个服务接口,虚拟化产生了分布式,分布式产生了多对多,多又对多的关系。

资源管理是运维管理的基础,为了解决上述问题,还特意看了一段时间ITIL(IT基础架构库),也做了好几版的资源管理设计文档,最后虽然不了了之,也算能够抛开繁琐的细节从总体上思考运维了。

640?wx_fmt=jpeg

基于运维基础做运维,通常会导致一叶障目不见泰山;脱离运维基础谈运维,会导致过度理想化,因为运维本身涉及到系统的方方面面,比如从技术上存在不同数据库、Hadoop、Redis、Kafka,没人能保证看懂所有技术,不过技术是讲分工的,每个人接触和运维一段时间,从架构角度、从运维角度去梳理各种KPI还是可行的;另一方面本人也算搞了三四年大数据了,对大数据的运维看在眼里痛在心中,有切肤之痛。

首先大数据平台的运维较以往的运维从技术上、难度上、复杂度上均提高,这是不争事实。

其次大数据平台的运维手段还是停留在最传统的脚本角度,上百台主机即使有了一些自动化收集脚本,但整体上还处于手工作业阶段,三四个人投入运维,忙死忙活,不见成效。

再次对运维的认知上,还存在严重的不足,运维平台的建设不是为了增加运维人员的工作量,而是解放运维人员,把运维人员从繁琐的事务中解脱出来,处理更高级别和能力的事情,也可以在运维工作系统化过程中,提升自己的认知和技术能力。

最后,运维不仅仅是硬软件的监控,也包括运维工具选型,运维配套管理、运维交付物管理。运维工具选型当然重要,但却不是最重要的;尤其是配套管理,当然这里提到的更多的是数据仓库项目但也不全是,每种类型项目都需要元数据管理、主数据管理、数据质量管理、任务管理,而且更难的是把任务管理和配套管理整合在一起,这又是智能化运维管理的基石。

640?wx_fmt=png

王老师的公众号为:追梦IT人

qrcode?scene=10000004&size=102&__biz=Mzg3MzA5MjU2Mg==&mid=2247483928&idx=1&sn=22d75ed3cac670c17253f1eb39395632&send_time=

相关链接:

个人新书 《MySQL DBA工作笔记》

个人公众号:jianrong-notes

QQ群号:763628645

QQ群二维码如下,个人微信号:jeanron100, 添加请注明:姓名+地区+职位,否则不予通过

640?wx_fmt=png640?wx_fmt=png

在看,让更多人看到

相关文章:

  • 一道经典的MySQL面试题,答案出现三次反转
  • 关于公众号文章搜索,有两个小技巧
  • 程序员:站在“自学”鄙视链顶端的王者
  • 如何使用Python模拟MySQL Slave,可以看看这个开源项目
  • 用好搜索神器Everything,盘活你的文件
  • 【程序员软实力】如何构建?我坚持了2100多天,收获了这些心得
  • MySQL数据流转集成,从快速测试Maxwell开始
  • 从故障处理流程看结构化思维
  • dbaplus-爱可生社区-北京站沙龙归来
  • 唯一ID生成算法剖析,看看这篇就够了
  • 关于学习,很有必要看看这张图
  • 迁移到MySQL的业务架构演进实战
  • 一个看似纠结的MySQL标签需求的梳理
  • 技术学习中的三个有趣的数字
  • 数据库修改密码风险高,如何保证业务持续,这几种密码双活方案可以参考
  • [原]深入对比数据科学工具箱:Python和R 非结构化数据的结构化
  • 「译」Node.js Streams 基础
  • 002-读书笔记-JavaScript高级程序设计 在HTML中使用JavaScript
  • Android单元测试 - 几个重要问题
  • avalon2.2的VM生成过程
  • Flannel解读
  • iOS仿今日头条、壁纸应用、筛选分类、三方微博、颜色填充等源码
  • JavaScript HTML DOM
  • JavaScript创建对象的四种方式
  • Mac 鼠须管 Rime 输入法 安装五笔输入法 教程
  • MySQL-事务管理(基础)
  • Python学习笔记 字符串拼接
  • React-redux的原理以及使用
  • 第三十一到第三十三天:我是精明的小卖家(一)
  • 人脸识别最新开发经验demo
  • 如何选择开源的机器学习框架?
  • 远离DoS攻击 Windows Server 2016发布DNS政策
  • 怎样选择前端框架
  • 不要一棍子打翻所有黑盒模型,其实可以让它们发挥作用 ...
  • 小白应该如何快速入门阿里云服务器,新手使用ECS的方法 ...
  • ​ssh-keyscan命令--Linux命令应用大词典729个命令解读
  • # Java NIO(一)FileChannel
  • # 学号 2017-2018-20172309 《程序设计与数据结构》实验三报告
  • ###STL(标准模板库)
  • (javascript)再说document.body.scrollTop的使用问题
  • (草履虫都可以看懂的)PyQt子窗口向主窗口传递参数,主窗口接收子窗口信号、参数。
  • (附源码)计算机毕业设计SSM在线影视购票系统
  • (附源码)计算机毕业设计SSM智慧停车系统
  • (力扣记录)1448. 统计二叉树中好节点的数目
  • (一)UDP基本编程步骤
  • (转)可以带来幸福的一本书
  • (轉貼) 蒼井そら挑戰筋肉擂台 (Misc)
  • .NET 4 并行(多核)“.NET研究”编程系列之二 从Task开始
  • .NET 8 编写 LiteDB vs SQLite 数据库 CRUD 接口性能测试(准备篇)
  • .net 发送邮件
  • @EventListener注解使用说明
  • [ C++ ] STL_stack(栈)queue(队列)使用及其重要接口模拟实现
  • [ vulhub漏洞复现篇 ] JBOSS AS 5.x/6.x反序列化远程代码执行漏洞CVE-2017-12149
  • [20171106]配置客户端连接注意.txt
  • [Angularjs]ng-select和ng-options