运维自动化要点——可运维性
1. 可运维性和业务架构
运维自动化是我们所追求的目标,但我们有时候过于强调自动化能力,却忽略了影响自动化落地的一个关键因素,那就是业务架构。对于运维团队来说,最理想的微服务架构首先应该具备良好的可运维性。没有可运维性的应用或架构不仅会给运维团队带来麻烦,还可能对他们的职业发展产生负面影响。因此,在追求自动化的同时,我们也需要重视业务架构的可运维性。
2. 配置管理
在微服务架构中,我们建议将应用的二进制文件与配置分离管理,以实现独立部署的目标。被分离出来的应用配置可以通过三种方式进行管理:文件模式、配置项模式和分布式配置中心模式。不同的企业可以选择最适合自己的配置管理方式,但关键是要求各个业务使用一致的方案,这样运维人员就可以有针对性地建设工具和系统来管理配置。
3. 版本管理
在运维中,我们需要清晰地描述运维对象,比如包、配置、脚本等。与源代码管理类似,运维也需要对这些对象进行版本控制和脚本化管理,以确保自动化操作的准确性和可靠性。将所有东西纳入版本控制是运维管理的基本要求之一,只有这样才能更好地管理运维对象。
4. 标准操作
运维日常工作中存在大量重复度高的操作,这些操作可能造成学习成本、无价值操作、重复建设的脚本或工具以及人工执行风险等浪费。如果能够在企业内形成统一的运维操作规范,并将文件传输、远程执行、应用启动停止等操作规范化、集中化、一键化,就能大大提高运维的效率和质量。
5. 进程管理
进程管理涉及应用安装路径、目录结构、进程名、端口号、启停方式和监控方案等。做好进程管理的全局规划,可以极大地提升自动化运维程度,减少计划外任务的发生。
6. 空间管理
磁盘空间的良好管理可以确保业务数据有序存放,并有效降低计划外任务的发生。为此,我们需要提前制定备份策略、存储方案、容量预警和清理策略等,并配合有效的工具来实施这些任务,以减少对运维的困扰。
7. 日志管理
日志规范的推行需要开发和运维的密切配合。理想的日志规范应包含以下要求:将业务数据与日志分离、解耦日志与业务逻辑、统一日志格式、清晰定义返回码和注释、可获取业务指标(如请求量、成功率和延时)、定义关键事件输出级别、管理存放时长和压缩备份等。只有在满足以上要求的日志规范得以落地后,开发、运维和业务才能获得更好的监控和分析能力。
8. 集中管控
运维工作常常被切割成不同的部分,如发布变更、监控分析、故障处理、项目支持和多云管理等。为了提高整体运维管控的效率和质量,我们需要建立一站式的运维管理平台,将所有工作信息衔接起来,传递经验,杜绝信息孤岛和人工传递信息所带来的运营风险。这样,运维团队可以更好地管理运维工作。
以上是关于运维自动化中可运维性的一些要点。通过重视业务架构的可运维性、配置管理、版本管理、标准操作、进程管理、空间管理、日志管理和集中管控,我们可以提高运维的效率和质量,实现更好的自动化运维。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。