陆陆续续在前一家公司和弊厂目前做了一些运维性质的工作,当初也有考虑过转岗专业运维工程师,不过还是放不下写代码这个兴趣。姑且放下西方那一套DevOps的称呼或者什么理论不说。初识一样事物可以假借初生牛犊妄言无须明白,然笔者现阶段正欲重新设计运维相关系统,恰逢良机有意识地明确究竟什么才是(IT)运维,以及包含的工作、职责有哪几方面。这样才有助于理解工作内容,弄清流程、数据的轻重缓急。

切莫滥竽充数、蛇行雀步

什么是运维

运维是运营与维护(Operation and maintenance)的简称。

一般是指对大型组织已经建立好的网络软硬件的维护,其中传统的运维是指信息技术运维(IT运维)。 所谓IT运维管理,是指单位IT部门采用相关的方法、手段、技术、制度、流程和文档等, 对IT运行环境(如软硬件环境、网络环境等)、IT业务系统和IT运维人员进行的综合管理

随着信息化进程的推进,运维管理将覆盖对整个组织运行,进行支持的管理信息系统涵盖的所有内容,除了传统的IT运维, 还拓展了业务运维和日常管理运维。其参与的对象也从IT部门和人员,拓展到组织的管理层和各部门,及其相关的业务骨干。 运维的最终结果是对软件运行中各种性能的维护

运维的对象

  • IT与业务系统
    • 满足内容繁杂,持续变化,多种多样的业务需求
    • 对满足的过程进行描述与维护
    • 包含两类人员,随着运维环境、功能、技术的提升,将会逐步退出运维领域
      • 提供业务支持的技术人员
      • 组织的管理层与业务骨干
  • 日常运维管理
    • 对IT与业务运维的需求、过程、结果进行管控
    • 对管理信息系统自身运行状态的管控
    • 实现针对应用变化的追踪,预测、管控和防范应用的风险
    • 包含的人员
      • 运维部门的管理人员
      • 运维部门的技术人员

工作分类

IT运维

IT运维是IT管理的核心和重点,内容众多且繁杂,主要可以分为6大子系统

  • 物理/虚拟设备管理:对网络设备、服务器设备、操作系统运行情况进行监控
  • 应用/服务管理:对各种应用支持软件例如数据库、中间件、集群以及通用或特定服务的管理,例如邮件,域名解析等等。
  • 容灾管理:对系统以及业务进行统一的存储备份以及恢复管理
  • 目录/内容管理:对组织内部需要统一发布或因人制定的内容以及公共信息管理
  • 资源资产管理:组织内部各项资源资产情况管理,和财务部门形成数据交互
  • 信息安全管理:包含多种方面,可以依据ISO17799国际标准,包含了安全组织方式,资产分类控制,人员、物理、环境安全,

通信运营安全、访问控制与业务连续性管理等等

业务运维

业务运维包含对核心业务系统运行情况的管理,可以体现在系统的关键成功因素(Critical Success Factors) 以及关键绩效指标(Key Performance Indicators)

  • 面向整个组织针对各个业务满足业务需求,提供运行环境的安装,加载,配置,升级等服务。
  • 面向整个组织提供业务系统方面的问题受理、响应、处理以及转交等服务
  • 面向整个组织各级部门提供业务系统的操作指导,应用等服务

日常运维管理

日常运维管理在于明确和规范运维人员的岗位职责、工作安排、提供绩效考核量化依据、提供解决经验与知识积累与共享运行/维护阶段以及服务/支持阶段的分界线为面向IT部门内部还是面向业务部门或面向客户。

  • 面向整个组织提供业务系统的运行情况监控,问题定位,故障排除等服务。
  • 面向整个组织提供满足业务系统的需求变化如数据项、元数据、管理流程、数据空间等方面的管理以及标准化
  • 面向整个组织提供业务系统运行状态、需求变化的记录、追踪、保存和分析方面的管理

运维工作的几大职责

  • 资产与成本管理
  • 需求分析和方案设计
  • 系统的安装与配置
  • 系统运行情况记录、监控与告警
  • 问题的追踪与分析
  • 故障的定位与排除
  • 容量评估与规划
  • 风险与安全管理
  • 知识管理与人员管理

五大要素

  • 运营 Operation 设备资产状态的管理,确保高效安全可靠的流程
  • 维护 Maintenance 确保维护动作安全有效,提升系统的性能与可靠性,对维护流程提供指导
  • 工程支持 Engineering Support 提供组织内部有效的技术支持,对系统的实现进行定期的设计实现审核、控制管理
  • 培训 Training 对组织人员进行必要的运维技巧、知识、操作规范与安全意识的训练
  • 管理 Administration 对运维部门自身的系统、设备人员进行状态追踪,技能绩效考核

来源参考

小结

本篇参考收集到的资料,以纯粹(枯燥)理论的角度总结运维部门的工作内容以及职责。在后一篇中笔者将结合实际经验谈一谈如何 在形式、制度以及人员等方面来开展合理的运维工作

__END__