2016 - 2025

感恩一路有你

监控指标体系的构建方法 怎么监控多台服务器?

浏览量:1503 时间:2023-07-02 11:15:06 作者:采采

怎么监控多台服务器?

你的问题又不是太明白需要描写用处。我想你不需要的比较多分系统监控和业务监控两类吧

系统监控就是每台主机的CPU,内存,网络带宽等不使用情况,和Mysql,Redis,Nginx等服务的核心指标等,这是比较都差不多的监控,必须得有,假如这块监控做的好,生产环境可以提前一两天发现很多问题,防患。

业务监控是业务相关的指标,如某API最大速度调用次数,每分钟该API的平均响应时间,服务什么的大侠帮帮忙人数,甚至一些运营相关的数据,如七日留存率啦,每日里新增加用户,每日大量流失用户等。这些数据也很不重要,他是你整个业务的晴雨表,为你做一些最重要决策提供给依据。

相对于系统监控,有很多开源软件可以不拿来用,如也很名气的ngios,cacti,nginx等,部署都比较紧张,客户端要部agent,还得装一个center为了再收集,存储文件展现数据,另外好多插件需要以维护。但有一个比较好很简单东西是collectd,它那个软件了各种插件,如系统CPU,磁盘利用率,mysql,nginx,redix等具体用法服务都可

以参与监控,不过自动启动给你推荐了要监控哪些指标。安装很方便啊,基本是./configurationampampsomethingampampgiveinstall就可以了。

相对于业务监控,当然是是需要自己写代码报给业务数据的,现在比较很流行方案是statsdgraphite,比较古尔科夫,不过有很多语言的sdk,这个可以毫不费力把各种指标监控站了起来。

大都监控体系都差不多吧,不胜感激

1、每台机器上安装好一个agent,用来采集本机的性能数据,服务数据

2、每台机器重新部署的业务,据一个sdk,向center再提交本业务相关的数据

3、每个agent是可以动态的按需求运行程序一些插件,尽快监控头新的指标

4、像是一个机房内有一个center用处积攒各agent和各业务上报到的指标

5、center要把再采集到的指标数据参与存储,归档,高压缩,像是用rrddatabase

6、center还得有一个web界面来打开系统各个指标的历史图表,甚至要有各种视图和dashborad来会显示一组相关的指标。

7、center还得一天把用户自定义的几个最重要的的指标生产报表发邮箱运维或则相关人员。

8、center还必须能保存各种告警规则,如某个指标后过一次超过某个阈值出现告警,的或波动将近某个范围才能产生告警,的或某个指标达到多长时间还没有必须上报数据有一种告警

9、center也要通过各种告警的收敛,宛如类告警的合并,充当屏蔽某类告警,如何防止因为网络剧烈抖动紊乱大量告警等,没有这些运维人员会掩没在各种告警声中。

10、center要以各种将告警邮箱里给运维人员,如短信,邮件,,语音等。

11、center又要对你每次告警参与回顾曾经,统计计算,总结,结论每个系统的薄弱点,和用率,在线时间,稳定性等。

所以才说,自己垒建一套完备可信度高的监控体系,挺不容易的,需要投入到大量的人力和精力去开发和能维护。

现在国外也有一些拿来做运维项目外包的厂商,center托管在给他们,省些了比较大的工作量,只剩下的agent和plugin那就得自己安装,但这就简单了,其实有很多也可以做批量作战部署的运维工具。

比较比较鼎鼎大名的有NewRelic,StatHat,hostedgraphite,可以不去所了解下,大部分那是安装好个agent就可以向它们的center必须上报数据了,或则是依靠他们的Sdk并提交一些自定义数据,他们负责存储,充分展现,告警方面的事情,节省时间很多人力。

国内的话,也有人做相似的事情,如DNSPod的D监控最近很快推出了自定义监控的功能,兼容性问题graphite的上报接口,你自己重新部署个collectd就可以把各种系统监控指标监控起来了,如果能做业务监控,graphite也有各种语言的sdk。graphite本身开源,周边工具和软件也尤其多,能柯西-黎曼方程很多的需求。

家用监控选什么配置?

400万像素,手机连接,双向语音,360度旋转,存储可选云的或内存卡,这些就够啦,tp性价比略高,

center 指标 数据 监控 业务

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。