您的当前位置:首页Zabbix运维监控平台解决方案

Zabbix运维监控平台解决方案

来源:小侦探旅游网
Zabbix运维监控解决方案

目录

一、背景 .......................................................................................................................................................................... 1

二、目标 .......................................................................................................................................................................... 2

监控的基本内容 ....................................................................................................................... 2

三、采用的软件 ............................................................................................................................................................ 3

四、软件的特点 ............................................................................................................................................................ 3

五、软件的优势 ............................................................................................................................................................ 3

系统架构 ................................................................................................................................... 5 监控实现方式: .......................................................................................................................... 5 监控指标 ................................................................................................................................... 6 规则引擎 ................................................................................................................................... 7

一、背景

网站平台部署运行后会出现各种各样的故障,比如服务器CPU负载高,磁盘容量使用超过80%,内存使用超过阈值,系统进程多,tomcat服务宕机等问题都会给公司平台稳定和服务带来非常大的损失,此时需要一个相对完整的监控体系可以24小时监控您的网站,一旦网站发生异常,会有报警提醒您,如邮件,微信,电话,短信,及时避免流量损失。

Zabbix是一个企业级的开源分布式监控解决方案,它是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案.

zabbix具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库性能监控、FTP等通用协议监控、多种告警方式、详细的报表图表绘制)支持自动发现网络设备和服务器;支持分布式,能集中展示、管理分布式的监控点;扩展性强,server提供通用接口,可以自己开发完善各类监控。

zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux,Solaris,HP—UX,AIX,Free BSD,Open BSD,OS X等平台上。

二、目标

物理范围:

组件:硬件,OS,存储,中间件,数据库,机房,网络等 维度:可用性,性能。 指标:见下。

监控的基本内容

性能数据 基本CPU,磁盘,网络,内存等关系系统正常运行的基本指标. 端口状态 一般交换机或网络设备,端口启动状态,流量大小,网络状态 日志内容 日志内容监控,系统日志,应用程序日志,错误信息。 系统状态 DB ,OS,中间件等的系统状态

硬件状态 硬盘状态,风扇,电池,内存,主板等系统状态

机房状态 UPS,机柜电功率,机房电功率,机房温度,湿度,空气质量,漏水,消防,人员出入,机房门状态,机柜门状态,红外线,图像,防盗等 应用状态 程序启动时间,网站访问速度等。

三、采用的软件

软件名称: ZABBIX 4.0 LTS

四、软件的特点

zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案.zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供柔软的报警机制以让系统管理员快速定位/解决存在的各种问题,其真正的可扩展性,高可用性,易用性,灵活性,极大地降低了企业的总成本,是目前最受欢迎的解决方案

五、软件的优势

1.企业级开源监控方案 2. 各组件分离

Zabbix由3部分构成,zabbix server,Web front,zabbix DB,Zabbix Proxy与可选组件zabbix agent。 3 监控方式

zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux, Solaris, HP-UX, AIX, Free

BSD, Open BSD, OS X,W等agent 配置文件中,根据要求编写脚本,将定期执行该脚本获取指定的信息.

格式:

UserParameter=custom.updatescript,/etc/z平台上。

4支持自定义监控

Zabbix agent支持脚本监控,只需要在

abbix/zabbix_agentd/custom_updatescript

5支持远程执行命令

允许指定的server,调用agent本机系统命令,获取相关信息。 6硬件配置信息采集

zabbix agent需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU等信息的收集。

7丰富的可视化功能,包括仪表盘,自定义图表和网络拓扑功能 8代理支持的系统版本

zabbix agent可以运行在Linux ,Solaris, HP—UX, AIX, Free BSD, Open BSD, OS X, Tru64/OSF1, Windows NT4.0, Windows 2000/2003/XP/Vista)等系统之上。 9支持无代理监控方式

Zabbix server 可以支持fping ,对网络通畅,丢包率,错误率,重传等的监控 10支持Web网站的自动登录测试

可以支持对web网站的自动登录测试,并对登录结果进行匹配和测试。 11 核心功能

zabbix server可以单独监视远程服务器的服务状态;同时也可以与zabbix agent配合,可以轮询zabbix agent主动接收监视数据(trapping方式),同时还可被动接收zabbix agent发送的数据(trapping方式)。

另外zabbix server还支持SNMP (v1,v2),可以与SNMP软件(例如:net-snmp)等配合使用. 12 支持分布式监控

Zabbix proxy 为分布式服务器的一种实现方式。

Zabbix proxy 和zabbix server 同步config。Zabbix proxy 主动轮训zabbix agent,将数据采集到zabbix proxy的数据库中,将数据,zabbix proxy 使用一个进程将数据同步到zabbix sever上。

如果发生proxy联系不到server ,将对在本地数据库保持2天的数据,网络联通或server可以通信后,proxy将对把数据重新传送到server。 准备采用的软件:zabbix 4.0 LTS

系统架构 监控实现方式:

OS 安装Agent,zabbix server 设置监控配置项,采集结果。

网络设备 通过SNMP,zabbix Server开启snmppoller进程轮询SNMP,根据SNMP查询结果

存储设备 一般通过API方式,没有API的,采用登陆设备上,返回命令采集结果,对采集结果进行格式化。

数据库 一般为通过插件,第二种为通过集中库,对数据库进行读取。

硬件 通过IPMI方式,获取相关硬件信息,如风扇,温度,电池,硬盘,内存插槽等硬件环境信息.

机房监控 通过API方式,直接调用机房环境监控系统的数据。

中间件 通过JMX 监控,MQ 或其他的memo cache 通过编写脚本并格式化输出。 应用: 通过嵌入Jar包,程序轮询,将相关信息收集到本地,然后推送到监控服务器上 业务: 通过将数据库中的数据采集,查询发送给监控服务器。 监控指标 Number 1 CPU 2 3 4 5 6 Memory CPU Utilization Memory Utilization Swap /pagfile Utilization Network Transfer Network Packet 7 Disk 8 9 10 11 12 13 Service Disk I/O Process Monitoring Windows Service TCP Port Connectivity TCP Port Response Time DNS Monitoring File System Utilization Error /Drop Type Case Load Average 备注 14 15 Log 16 17 18 Other File NTP Monitoring Text Log EventLog File Monitoring Performance (windows) counter 规则引擎

1、警报触发机制:

规则引擎,查询zabbix 监控数据DB中的事件,根据系统架构编写,根据指标或触发器,生成事件,规则引擎对事件和系统的的负责人,显示警报内容。 2、警报的校验:

对任何警报,通过3种的间接方式验证,如果在3个网段发生的事件进行校验,如果发生两个重复的警报内容,则触发警报. 3、警报的发送方式:

事件平台,邮件,微信,电话和短信 现阶段,事件为统一平台 事件平台 4、警报推送方式:

PUSH方式,即根据CMDB中的系统的负责组的信息进行定位目标人群,群组人员信息由负责人负责.

因篇幅问题不能全部显示,请点此查看更多更全内容