当前位置: 首页 > news >正文

azure 最佳实践-- 系统运维

系统运维方案


对应用程序进行设计,使运维团队拥有他们需要的工具,云已经大大影响了运维所扮演的角色。他们不再负责管理托管应用程序的硬件以及基础架构。然而,运维仍然在运行成功云应用程序中扮演着关键角色。运维团队的一些重要职能包括:
部署
监控
系统升级
对异常的响应
安全审计


完整的日志和跟踪追踪机制在云应用中尤为重要。需要运维团队参与设计,以确保应用程序为他们提供需要有帮助的数据和见解。


建议做法
使一切都是可监控的。一旦部署并运行解决方案,日志和跟踪就是对系统观测的主要途径。系统追踪记录有助于查明瓶颈,性能问题和故障点。这些记录捕获每次事件,如应用程序状态更改,错误和异常。要记录在生产环境,否则你在最需要的时候失去对其监控。


使用监控仪器。监控可以深入了解应用程序在可用性,性能以及系统运行状况等方面的表现。例如,监控会告诉你系统是否符合SLA。监控会在系统正常运行过程中进行。它应该尽可能接近于实时,以便运维能够快速对问题做出响应。理想情况下,监控能够帮助避免一切的严重错误。有关详细信息,请参阅监控和诊断。
根本原因分析。每次系统错误都需要找出本次错误发生的根本原因。


分布式跟踪机制。使用专为并发,异步和云设计的分布式跟踪系统。跟踪应包括用于关联服务的ID。单次操作可能涉及到多个服务的调用。如果操作失败,这个关联ID有助于找出故障发生的原因。


标准化日志。运维团队将需要从系统的各种服务收集日志并进行整合。如果每个服务都使用自己的日志记录格式,就很难甚至不可能获取到有用信息。可以定义一个包含相关ID,事件名称,sender IP地址等字段公共结构。每个服务可以继承于基础结构以包含更多字段。


自动化管理任务,包括配置,部署和监控。自动化任务并使其可重复,以避免人为操作错误。


将配置视为代码。将配置文件提交到代码版本控制系统中,以便跟踪其版本信息,并在需要时回滚。

相关文章:

  • 全角字符unicode码对应表
  • azure 最佳实践 -- 尽量使用托管服务
  • azure 最佳实践 -- 使用正确的数据存储
  • 变形金刚2影院版完整字幕
  • azure 最佳实践-- 为演化而设计
  • 做真正Hacker的乐趣──自己动手去实践
  • azure 最佳实践 -- 随业务演化的架构
  • 看完只有沉默的爱
  • 重温TCP-IP学习笔记——1/3
  • 嵌入式GUI设计第一阶段回顾
  • 重温TCP-IP学习笔记- 2/3
  • Windows Mobile 6.5 Widgets开发初体验
  • 重温TCP-IP学习笔记 3/3
  • android webview 跳过免费ssl证书验证
  • android webview file标签点击弹出选择文件或拍照菜单
  • 【Under-the-hood-ReactJS-Part0】React源码解读
  • Android交互
  • Angular 4.x 动态创建组件
  • AWS实战 - 利用IAM对S3做访问控制
  • ES6核心特性
  • Netty 框架总结「ChannelHandler 及 EventLoop」
  • PHP CLI应用的调试原理
  • Python进阶细节
  • Spring Cloud Feign的两种使用姿势
  • V4L2视频输入框架概述
  • Yii源码解读-服务定位器(Service Locator)
  • 初探 Vue 生命周期和钩子函数
  • 机器人定位导航技术 激光SLAM与视觉SLAM谁更胜一筹?
  • 时间复杂度与空间复杂度分析
  • 使用Tinker来调试Laravel应用程序的数据以及使用Tinker一些总结
  • 通过来模仿稀土掘金个人页面的布局来学习使用CoordinatorLayout
  • 推荐一款sublime text 3 支持JSX和es201x 代码格式化的插件
  • 学习JavaScript数据结构与算法 — 树
  • 在 Chrome DevTools 中调试 JavaScript 入门
  • ​iOS安全加固方法及实现
  • ​用户画像从0到100的构建思路
  • ![CDATA[ ]] 是什么东东
  • (java版)排序算法----【冒泡,选择,插入,希尔,快速排序,归并排序,基数排序】超详细~~
  • (附源码)spring boot车辆管理系统 毕业设计 031034
  • (解决办法)ASP.NET导出Excel,打开时提示“您尝试打开文件'XXX.xls'的格式与文件扩展名指定文件不一致
  • (篇九)MySQL常用内置函数
  • (区间dp) (经典例题) 石子合并
  • (四) 虚拟摄像头vivi体验
  • (原)本想说脏话,奈何已放下
  • (原創) 系統分析和系統設計有什麼差別? (OO)
  • (转)setTimeout 和 setInterval 的区别
  • (转)winform之ListView
  • (转)全文检索技术学习(三)——Lucene支持中文分词
  • **登录+JWT+异常处理+拦截器+ThreadLocal-开发思想与代码实现**
  • *Algs4-1.5.25随机网格的倍率测试-(未读懂题)
  • .NET MAUI学习笔记——2.构建第一个程序_初级篇
  • .Net Remoting常用部署结构
  • .NET 材料检测系统崩溃分析
  • .NET 中 GetProcess 相关方法的性能
  • /proc/vmstat 详解