当前位置: 首页 > news >正文

linux服务器集群运维经验

公司大概有5000+以上的服务器节点,包括各种应用,我和同事共同维护大约2500+的服务器,主要包括一些视频cdn,直播视频cdn,webcdn和p2p服务器。

 以下是自己在运维工作中的一点经验和看法,希望对大家有所帮助
  1.       服务器型号的区分,为以后的统一化和标准化作硬件上的准备,很多人忽视这一点,其实如果这一点做得好会使后面的运维工作轻松很多,根据应用我们主要把服务器分为3中,cpu密集型,主要用于大量计算应用,比如p2p;内存密集型,用于cache类应用,比如squid,varnish缓存服务器;磁盘密集型,用于大存储类应用,比如视频存储服务器,hadoop日志存储集群。
2.       系统的的自动安装,主要有kickstart和cobbler
3.       统一的yum源和定制化的rpm包, 并集成至yum源站,为后续的环境初始化做软件上的准备
4.       构建专属于自己的内网DNS
5.       标准化的统一的命名方式(标准化基础),便于使用puppet管理,并且减少操作的错误,如果每个机器的hostname都为localhost,那将是一个多么可怕的事。。。在我们的生产环境中主要使用下面这种命名方式
机房-主业务-应用程序-IP后两位-公司域名,这样一眼就可以看出是哪台服务器,应用于什么业务,报警也可以直接定位。
 
6.自动化的配置管理和环境部署工具:puppet,puppet的模块编写要尽量减少模块直接的耦合度,并使用class继承的方式来减少运维的工作量,定制化的facter变量会使软件的配置环境更加灵活,由于puppet暂时不支持群集,所以在实际应用中需要部署多套,根据经验,1500台左右的server时puppet会出现性能问题。
 
7.       强大有效的监控系统,在生产环境中我们使用了zabbix proxy+zabbix master的群集结构,zabbix可以实现有效的系统和应用级别的监控,应用监控同时也使用了ppmon来实现多点监控。
选择zabbix有一个最大的好处,就是监控数据是存放在数据库中的,这样就可以利用数据库中的数据做很多操作,比如可以分析一段时间内服务器的各个性能指标,查看服务器的资源利用率,可以对数据进行聚合操作,从而分析全网的指标,比如总的流量,总的http code分布情况。
 
8.       日志收集服务器群集 和qos分析系统,构建 有效的日志收集系统可以有效地对用户的访问数据进行整合和分析,可以快速的分析qos,对应重要的节点我们采用本地分析并导入mongodb,最后导入zabbix的方式,非重要节点则直接将日志打包压缩,通过ftp上传至hadoop数据仓库集群中。
9.       构建冗余的结构,消除单点,在生成环境中对于一些重要节点都采用keepalived-ha的方案来提高冗余度。对于resin,php等应用服务器则在前端使用nginx做反向代理,同时nginx使用keepalived-ha
  10.   自动化的代码分发系统,主要是controltier + svn的使用,可以方便快速地部署代码。 
以上是自己的一点经验,欢迎大家来拍砖。
本文出自 “ 菜菜光的博客” 博客,请务必保留此出处 http://1662935.blog.51cto.com/1652935/846177

相关文章:

  • jsbeautifier + JScript.NET/JavaScript 编程实现 JavaScript、HTML、CSS 代码格式化脚本命令行工具 并集成到 EditPlus...
  • Python实现简单接口自动化测试
  • Codeforces Round #428 (Div. 2)
  • 【转】搜索算法的剪枝优化
  • vue.js过渡效果之--javascript钩子
  • 吓死猪队友 只用命令行登录Windows就问你怕不怕!
  • 从零开始学习Sencha Touch MVC应用之十四
  • 四 APPIUM GUI讲解(Windows版)(转)
  • net user使用
  • 如何在Ubuntu上使用Grafana监控Docker
  • 电脑快捷键
  • 字符合并[HAOI2016]
  • love——sir thomas browne
  • 开源 java CMS - FreeCMS2.6 积分记录
  • 个人记事本-介绍
  • SegmentFault for Android 3.0 发布
  • Android开源项目规范总结
  • canvas实际项目操作,包含:线条,圆形,扇形,图片绘制,图片圆角遮罩,矩形,弧形文字...
  • CSS实用技巧
  • jdbc就是这么简单
  • Redash本地开发环境搭建
  • 构建工具 - 收藏集 - 掘金
  • 基于axios的vue插件,让http请求更简单
  • 看域名解析域名安全对SEO的影响
  • 离散点最小(凸)包围边界查找
  • 模仿 Go Sort 排序接口实现的自定义排序
  • 前端攻城师
  • 前端每日实战:61# 视频演示如何用纯 CSS 创作一只咖啡壶
  • 如何进阶一名有竞争力的程序员?
  • 小李飞刀:SQL题目刷起来!
  • 一、python与pycharm的安装
  • 移动端唤起键盘时取消position:fixed定位
  • 责任链模式的两种实现
  • const的用法,特别是用在函数前面与后面的区别
  • ​LeetCode解法汇总307. 区域和检索 - 数组可修改
  • ​如何使用ArcGIS Pro制作渐变河流效果
  • # 执行时间 统计mysql_一文说尽 MySQL 优化原理
  • #免费 苹果M系芯片Macbook电脑MacOS使用Bash脚本写入(读写)NTFS硬盘教程
  • #我与Java虚拟机的故事#连载19:等我技术变强了,我会去看你的 ​
  • #在 README.md 中生成项目目录结构
  • $.extend({},旧的,新的);合并对象,后面的覆盖前面的
  • (zt)基于Facebook和Flash平台的应用架构解析
  • (附源码)python旅游推荐系统 毕业设计 250623
  • (附源码)计算机毕业设计SSM基于健身房管理系统
  • (个人笔记质量不佳)SQL 左连接、右连接、内连接的区别
  • (小白学Java)Java简介和基本配置
  • (转)visual stdio 书签功能介绍
  • (转载)Linux网络编程入门
  • ./mysql.server: 没有那个文件或目录_Linux下安装MySQL出现“ls: /var/lib/mysql/*.pid: 没有那个文件或目录”...
  • .NET CORE 2.0发布后没有 VIEWS视图页面文件
  • .net core IResultFilter 的 OnResultExecuted和OnResultExecuting的区别
  • .NET Remoting学习笔记(三)信道
  • .net6+aspose.words导出word并转pdf
  • .NET中的Exception处理(C#)
  • @Transactional 竟也能解决分布式事务?