当前位置: 首页 > news >正文

传统运维团队转型应该注意哪些问题?

2018年已经接近尾声,回顾这一年,国内企业都在进行数字化转型,大家越来越关注如何提升效率。在这一过程中,颠覆性的IT技术正在加速落地:容器技术、Kubernetes的使用已经越来越普及,云计算和大数据结合更紧密,AIOps的实践也在不断成熟改善,云原生和DevOps的理念文化也在慢慢渗透到大小规模的技术团队,对运维人员带来很大的冲击,传统运维团队纷纷在转型,自动化甚至智能化运维已经成为了趋势。

在这样的背景下,企业运维团队如何向DevOps转型,如何使用更好的文化和方法来提升效率?我们采访了腾讯IEG蓝鲸团队的党受辉,谈一谈像腾讯这样的大厂的运维如何转型。

嘉宾介绍

党受辉 腾讯互动娱乐技术运营部 蓝鲸产品中心总监

腾讯T4工程师,曾就职于东软集团,为能源行业定制企业信息化体系,加入腾讯后负责运维团队管理。2012年负责互动娱乐事业群基础PaaS(蓝鲸)的设计、建设和运营。结合微服务、云、大数据等理念及前沿技术,构建独立部署的PaaS体系,并通过SaaS化产品,助力行业内应用运维团队的转型升级,推动devops生态及智能化运营。

腾讯这样的大公司,在运维体系的构建过程中如何避免“重复造轮子”?在升级演进的过程中如何避免浪费?

:在腾讯的互动娱乐事业群(IEG),我们采用PaaS技术来架构运维体系,其中的iPaaS层可以兼容已有的重复性功能模块,并且在升级过程中可以采用长期双轨运行的方式平滑替换升级,相比于传统的“烟囱群”式系统的“推倒升级”,避免大量的风险及浪费。

在DevOps等理念和技术的冲击下,传统运维团队如何转型应对?

:从技术角度看,一个业务的全生命周期可以分为CI-CD-CO三段,CI指的是持续集成,从研发团队提交代码作为起点,经过便以构建扫描测试等环节,以版本仓库为终点;CD指的是持续部署,以版本仓库为起点,经过各模块自动化部署,到业务上线提供服务为终点;CO指的是持续运营,从业务上线服务为起点,到业务下线终止服务为终点,期间包含各种运营事件。

传统运维的定位主要在CD段,但由于微服务、虚拟化、容器化等技术的冲击之下,运维对CD段的把控在减弱,甚至有些公司直接按照SRE等理念从开发侧覆盖了运维团队的部分职能,从而使运维团队萎缩到了管理资产和成本的角色,丧失了精细化运营能力。

腾讯IEG的运维团队借助PaaS技术,将运维团队转型为“运维开发”团队,首先完成了自身CD段的自动化工具构建,而后通过iPaaS集成大数据能力,服务于CO段的业务及非技术人员,最后仿照运营aPaaS的持续集成流水线,为业务开发团队打造了CI段的全套工具产品,完成了对业务及业务团队全生命周期的运营支持。

关于CI-CD-CO具体指的是什么意思?

:CI指的是持续集成,从研发团队提交代码作为起点,经过便以构建扫描测试等环节,以版本仓库为终点;CD指的是持续部署,以版本仓库为起点,经过各模块自动化部署,到业务上线提供服务为终点;CO指的是持续运营,从业务上线服务为起点,到业务下线终止服务为终点,期间包含各种运营事件。

腾讯是如何看待“运维开发”这一全新岗位的?与AIOps有什么关系?

:我们将运维开发视为与测试开发、营销开发等并列的一种岗位,主要职能是做工具类的运营系统,例如持续集成、日志分析、资源管理、版本发布、环境变更、监控处理、灾备切换、日常巡检、电子工单、运营分析、运营管控、经营管理等。互联网公司面临着很大的竞争压力,需要从各个层面提升经营效率,降低成本。而落地工具文化,是途径之一。我们依托PaaS技术,将传统应用运维团队转型为运维开发团队,来承担这一重要职能。

运维开发团队以Python为主语言构建PaaS之上的SaaS应用,而在从运维开发向AIOps的体系化过渡过程中,也可以以较低的成本完成转型。

如何体系化的落地智能运维(AIOps)?

:如果要“体系化”的落地智能运维,需要首先构建完善的机械自动化体系以及完整的数据分析体系,最后辅以符合运维技术栈的分析挖掘平台来实现。否则只能是作为案例或试点存在,无法“体系化”推进。

腾讯如何使用Kubernetes构建容器管理体系,在“特殊化定制”与“保持与社区版本同步升级”之间如何平衡?

:社区版本升级和个性化功能定制的确是很多企业的矛盾,我们在容器管理平台中采用k8s与mesos双引擎并行的方式来解决这个问题。

腾讯这样体量的公司,其海量运维体系的逻辑、方法和经验,是否适用于中小企业或初创公司?

:腾讯IEG虽然有一万多名员工,五百多款业务,但由于不同业务间的体量差异很大,有几万节点的大型游戏,也有数百节点的中小型游戏,因此其理论方法和实践经验适合于不同规模和类型的企业。

本次CNUTCon全球运维技术大会—深度培训专场,腾讯IEG蓝鲸团队带来的5大主题分享,适合什么样的群体,可以为我们带来什么收获?

答:适合于

  • 希望在企业中落地自动化、数据化、智能化的运维团队;

  • 希望从传统运维转型为运维开发的团队;

  • 希望从资源资产管理转向业务管理的运维团队;

  • 希望从传统SLA保障转型为对业务提供“技术运营”支持的运维团队。

你能想象“英雄联盟”只有5个人的运维团队吗?因此腾讯运维的理论方法和实践经验适合于不同规模和类型的企业。

想了解更多信息,关注CNUTCon 深度培训,党受辉老师将分享传统运维团队向自动化、运维开发、智能运维及IT运营领域转型所必经的管理架构及技术平台架构变革之路。

相关文章:

  • Nginx WEB服务器反向代理(一)
  • 宇宙最帅XX--Alpha阶段项目复审
  • 中奖名单已出炉!速来围观,有没有你?
  • Java反编译工具Jad详解
  • 【跃迁之路】【641天】程序员高效学习方法论探索系列(实验阶段398-2018.11.14)...
  • ElasticSearch权威指南学习(排序)
  • HBase技术与应用实践 | HBase2.0重新定义小对象实时存取
  • d3
  • 将毫秒时间转换为yyyy-MM-dd HH:mm:ss格式
  • hiveUDF的使用
  • MySQL 数据库中间件 MyCAT 基础解析
  • Spring Boot与ActiveMQ整合
  • 2019版软件测试培训资料
  • dockerfile参数
  • 8:查询APP设备相关信息
  • 网络传输文件的问题
  • 《微软的软件测试之道》成书始末、出版宣告、补充致谢名单及相关信息
  • 【399天】跃迁之路——程序员高效学习方法论探索系列(实验阶段156-2018.03.11)...
  • 【Linux系统编程】快速查找errno错误码信息
  • 【编码】-360实习笔试编程题(二)-2016.03.29
  • android 一些 utils
  • ERLANG 网工修炼笔记 ---- UDP
  • input的行数自动增减
  • SQLServer之索引简介
  • Work@Alibaba 阿里巴巴的企业应用构建之路
  • 阿里云爬虫风险管理产品商业化,为云端流量保驾护航
  • 初识 beanstalkd
  • 大数据与云计算学习:数据分析(二)
  • 高性能JavaScript阅读简记(三)
  • 基于axios的vue插件,让http请求更简单
  • 如何优雅地使用 Sublime Text
  • 山寨一个 Promise
  • 实现简单的正则表达式引擎
  • 实战|智能家居行业移动应用性能分析
  • 数组大概知多少
  • 算法系列——算法入门之递归分而治之思想的实现
  • 中国人寿如何基于容器搭建金融PaaS云平台
  • linux 淘宝开源监控工具tsar
  • # Swust 12th acm 邀请赛# [ E ] 01 String [题解]
  • #LLM入门|Prompt#1.8_聊天机器人_Chatbot
  • #pragma预处理命令
  • (003)SlickEdit Unity的补全
  • (2)(2.10) LTM telemetry
  • (安卓)跳转应用市场APP详情页的方式
  • (二)Pytorch快速搭建神经网络模型实现气温预测回归(代码+详细注解)
  • (机器学习的矩阵)(向量、矩阵与多元线性回归)
  • (原創) X61用戶,小心你的上蓋!! (NB) (ThinkPad) (X61)
  • (转)fock函数详解
  • (转)真正的中国天气api接口xml,json(求加精) ...
  • (转载)利用webkit抓取动态网页和链接
  • ***测试-HTTP方法
  • .NET Core MongoDB数据仓储和工作单元模式封装
  • .NET Core 成都线下面基会拉开序幕
  • .net mvc部分视图
  • .Net 路由处理厉害了