当前位置: 首页 > news >正文

BAT都有哪些AIOps的经典案例?

首先,我们一起划重点:不提供干货的案例,都不能算好案例。

\\

AIOps的概念从2016年被提出以来,热度一直在增加,都是混运维这个圈的,我相信你听过或看过不少关于AIOps的报道。所以,是时候提供一些落地案例,增加一下你对AIOps的信心了。

\\

11月16-17日,CNUTCon全球运维技术大会将在上海举行,我们邀请了BAT的专家来分享他们在AIOps领域的实践经验,知道你爱听“踩坑”教训和“排雷”经验,请相信,你想要的,我们都有!小编也是用尽毕生力气摁住了Molly和Joy的小手手,为大家争取来一次“剧透”的机会,提前带大家探究下他们要讲的内容!

\\

聊起百度,想必大家的记忆都是从“百度一下”开始的,但很显然,百度并不想被大家定义为一个“搜索引擎”,于是他们涉足了各种领域,有了“百度文库”“百度知道”“百度学术”“百度地图”“百度网盘”“百度外卖”等产品。

\\

818d4d23279027ed96ffbab1ab8af4a0.jpg

\\

互联网产品迭代速度非常之快,因此,百度每年都有数以万计的程序变更。但变化都伴随着风险,据统计超过50%的服务故障来源于发布。为了减少变更发布故障带来的损失,更好地管理海量规模的发布变更过程,百度智能变更(BID)产品应运而生。BID提供了包含自动化部署、分级发布和变更检查的完整解决方案。

\\

我们请来了百度智能云事业部的高级研发工程师陈云,为你重点讲述百度变更发布检查从人工到智能进阶。

\\

「她说」

\\

随着模块监控逐渐完善,很多模块都有数以十万计的监控数据,依靠配置规则或人工来检查发布效果是不可完成的任务。为了应对海量指标检查的需求,我们利用AIOps相关技术,设计出了一套可根据历史变更及对照组情况自动判断指标状态的智能检测算法。该算法不需要人工配置参数,通过自动训练参数并准确地判断异常,并且具备较好的普适性。最后,我们将展示智能发布检查在百度的具体实践效果。

\\

本次演讲的主要内容如下:

\\
  1. 故障来源及分布;\\t
  2. 分级发布机制;\\t
  3. 智能发布检查算法(异常定义、算法流程、基于T检验的指标变化度量、基于历史变更的异常变化检测、基于对照组的异常变化检测);\\t
  4. 百度变更发布智能检查实践。\

你能从中学到:

\\
  1. 学习尽可能限制变更过程中异常影响范围的机制;\\t
  2. 理解变更检查在变更过程中的重要地位和作用;\\t
  3. 学习如果利用AIOps相关技术对变更过程中指标状态进行智能判断的方法。\

提到阿里巴巴,你最先想到的是哪个词呢?移动支付?还是双十一?阿里系在产品种类上,也不甘落后。听说今年优酷直播世界杯,也是阿里云的小伙伴们在保驾护航。世界杯看得怎么样?是不是很清晰,又不卡顿呢?

\\

我们请来了阿里云的视频云运维专家不畏,为你分享:智能的大脑——谈阿里视频云智能调度系统的演进。

\\

「他说」

\\

调度系统作为CDN的核心模块,对业务的质量、成本和稳定性等各方面起决定性作用。随着业务类型的快速变化,从传统的图片等小文件,到点播流媒体、直播、动态加速,调度系统也随之在不停的迭代更新以更加适应业务形态的调度模型,在业务和系统快速变化之下的稳定性、效率、智能运营是摆在运维面前的难题。希望这次可以深入浅出地介绍多次负责护航阿里“双十一”和2018俄罗斯世界杯的视频云智能调度系统,以及智能化运维在业务发展中的演进及其背后的思考。

\\

本次演讲的主要内容如下:

\\
  1. 阿里云视频云调度系统的演进之路;\\t
  2. 在调度演进中的智能化运维思考和实践;\\t
  3. 调度系统全盘智能化之下的运维价值。\

你能从中学到:

\\
  1. 阿里视频云调度系统在业务变化下是如何演进实践的;\\t
  2. 在系统快速变化下的智能化运维思考模式。\

去年王者荣耀,今年一起吃鸡。这是不是很多人在手游界的常态。小编虽然是个女孩子,但也经常混迹于“王者峡谷”。但我也是今天第一次去思考,游戏里的故障,腾讯是怎么定位的呢?

\\

我们邀请到了腾讯技术运营部的高级工程师刘伟,为你深入浅出地介绍:智能运维助力游戏故障定位。

\\

「他说」

\\

随着游戏业务监控建设不断完善,海量业务故障时产生成百上千条告警,如何智能进行告警收敛、定位故障根源、实时统计业务影响是现阶段游戏运营面临的一个难题。本次分享以覆盖上百款游戏的智能故障定位平台出发,介绍腾讯游戏在智能异常检测、故障关联分析、故障知识图谱等方面的技术探索。

\\

本次演讲内容如下:

\\
  1. 利用动态阈值方法进行KPI曲线异常检测;\\t
  2. 基于自然语音处理的实时舆情检测; \\t
  3. 故障定位领域关联分析及知识图谱技术。\

你能从中学到:

\\
  1. 学习智能监控全流程系统架构设计;\\t
  2. 学习腾讯游戏在故障定位领域探索的经验;\\t
  3. 掌握海量数据下动态阈值监控方法、实时舆情检测模型;\\t
  4. 掌握构建专业知识图谱方法及知识图谱在故障领域应用。\

相关文章:

  • 如何查看当前Open的Cursor
  • 基于OHCI的USB主机 —— USB设备获取描述符通用函数
  • Spring Cloud Feign的两种使用姿势
  • Android应用程序安装过程源代码分析(2)
  • 知行不合一,Elon Musk 最大的敌人居然是自己?
  • 第二章 vSphere可用性之准备软硬件环境
  • 谈谈观察者模式和发布订阅模式
  • 策略模式
  • spark本地环境的搭建到运行第一个spark程序
  • VC6不支持typedef中递归。终于找到了Tuple的实现方案。
  • 设计模式-工厂模式
  • RHCS Oracle HA for OEL5.8 KVM实践配置
  • 面试必问之【对象和函数】篇
  • Hyper-v Server在线调整虚拟硬盘大小
  • Redis配置解读
  • 【笔记】你不知道的JS读书笔记——Promise
  • 【干货分享】SpringCloud微服务架构分布式组件如何共享session对象
  • 2017届校招提前批面试回顾
  • 5分钟即可掌握的前端高效利器:JavaScript 策略模式
  • CentOS学习笔记 - 12. Nginx搭建Centos7.5远程repo
  • ECMAScript6(0):ES6简明参考手册
  • egg(89)--egg之redis的发布和订阅
  • ES10 特性的完整指南
  • golang 发送GET和POST示例
  • JS进阶 - JS 、JS-Web-API与DOM、BOM
  • leetcode388. Longest Absolute File Path
  • mysql innodb 索引使用指南
  • vue的全局变量和全局拦截请求器
  • 从PHP迁移至Golang - 基础篇
  • 二维平面内的碰撞检测【一】
  • 分享一份非常强势的Android面试题
  • 服务器之间,相同帐号,实现免密钥登录
  • 工作踩坑系列——https访问遇到“已阻止载入混合活动内容”
  • 规范化安全开发 KOA 手脚架
  • 基于Javascript, Springboot的管理系统报表查询页面代码设计
  • 快速体验 Sentinel 集群限流功能,只需简单几步
  • 盘点那些不知名却常用的 Git 操作
  • 普通函数和构造函数的区别
  • 适配iPhoneX、iPhoneXs、iPhoneXs Max、iPhoneXr 屏幕尺寸及安全区域
  • 在Mac OS X上安装 Ruby运行环境
  • postgresql行列转换函数
  • ​520就是要宠粉,你的心头书我买单
  • #我与Java虚拟机的故事#连载13:有这本书就够了
  • #我与Java虚拟机的故事#连载19:等我技术变强了,我会去看你的 ​
  • (差分)胡桃爱原石
  • (附源码)spring boot儿童教育管理系统 毕业设计 281442
  • (附源码)小程序儿童艺术培训机构教育管理小程序 毕业设计 201740
  • (黑马C++)L06 重载与继承
  • (一)使用Mybatis实现在student数据库中插入一个学生信息
  • (译)2019年前端性能优化清单 — 下篇
  • (转) Face-Resources
  • .NET Core SkiaSharp 替代 System.Drawing.Common 的一些用法
  • .NET面试题(二)
  • @RestControllerAdvice异常统一处理类失效原因
  • []FET-430SIM508 研究日志 11.3.31