分类目录:监控

以下是分类 监控 下的所有文章

对没有监控的微服务Say No!

本文转自微信号EAWorld。扫描下方二维码,关注成功后,回复“普元方法+”,将会获得热门课堂免费学习机会!本文转自微信号EAWorld。本文转自微信号EAWorld。扫描下方二维码,关注成功后,回复“普元方法+”,将会获得热门课堂免费学习机会!本文转自微信号EAWorld。 目录: 一、监控简介 二、监控策略 三、总结 一、监控简介 ……

阿里万亿交易量级下的秒级监控

我今天分享的内容是:怎么在万亿交易量下实现足够实时的秒级监控? 我先来介绍一下监控系统 Sunfire,它是阿里集团的业务监控系统,前身是蚂蚁的 xflush,它支持应用标准化监控,如操作系统,JVM,中间件等。 除此之外还有更强大的日志监控能力,大多数业务的监控指标都从应用的日志中抽取。目前覆盖了集团几乎所……

如何构建万台服务器下的立体化监控体系?

了更好地帮助大家理解监控的维度,本文先从一个通用的网站架构开始谈起,然后讲一讲 58 集团是怎么在横向和纵向两个维度覆盖各种类型监控的。 主要分为两个部分进行分享: 网站的总体架构 构建立体化的监控体系 网站的总体架构 业务集群 对于大多数的技术人员来说,最熟悉的就是业务集群,我……

集群信息管理,架构设计中最容易遗漏的一环

准备系统性介绍“技术体系规划”了,这是第一篇。   监控平台,服务治理,调用链跟踪,数据收集中心,自动化运维,自动化测试… 很多要讲,却没想好从哪里入手。 讲Z平台,可能需要提前介绍Y服务;讲Y服务,可能需要提前介绍X知识。   思来想去,准备从技术体系里,最容易被遗漏,非常基础,却又非常重要的“集群信……

集群信息管理,架构设计中最容易遗漏的一环

准备系统性介绍“技术体系规划”了,这是第一篇。   监控平台,服务治理,调用链跟踪,数据收集中心,自动化运维,自动化测试… 很多要讲,却没想好从哪里入手。 讲Z平台,可能需要提前介绍Y服务;讲Y服务,可能需要提前介绍X知识。   思来想去,准备从技术体系里,最容易被遗漏,非常基础,却又非常重要的“集群信……

分级告警策略,人性化系统监控

一、啥是告警? 监控平台发现系统异常,向系统负责人发出文字(例如,邮件/短信),色彩(有些公司,编译不过,CI平台会亮红灯),声音(有些公司,有蜂鸣器嗡嗡响,研发压力大呀)等警示,就是告警。   绝大部分公司,主要是通过文字发出系统异常告警信息。   文字告警有哪些常见的方法? 以58到家为例,目前……

一篇文章全面了解监控知识体系[转]

前言介绍 监控是整个运维乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供详实的数据用于追查定位问题。 目前业界有很多不错的开源产品可供选择。选择一款开源的监控系统,是一个省时省力,效率最高的方案。当然对监控不是很明白的朋友们,看了以下文章可能会对监控整个体系有比较深刻的认识。 ps:本……

zabbix_server的自动发现,实现批量添加主机,并链接到模板

一、需求 zabbix 服务器可以手动加入zabbix-agent客户端,对于少量的机器,这没有什么。但到了线上,我们有大量的服务器需要监控时,如果再一个个的手动加的话,工作量势必会增加很多。这时,zabbix-server 的Discovery 自动发现 功能便派上了用场。 二、条件 1.zabbix server 已经部署好,所需要加入的服务器zabbix-agen……

abbix部署(Linux上部署/监控端/被监控端)

一、监控系统的简单介绍 (1)cacti:存储数据能力强,报警性能差 (2)nagios:报警性能差,存储数据仅有简单的一段可以判断是否在合理范围内的数据长度,储存在内存中。比如,连续采样数据存储,有连续三次不在合理范围内的数据就报警 (3)zabbix:结合上面两种工具的优点,又可以存储数据,又可以报警 ……

详解zabbix安装、部署和配置(Server端)

Linux下常用的系统监控软件有Nagios、Cacti、Zabbix、Monit等,这些开源的软件,可以帮助我们更好的管理机器,在第一时间内发现,并警告系统维护人员。 今天开始研究下Zabbix,使用Zabbix的目的,是为了能够更好的监控mysql数据库服务器,并且能够生成图形报表,虽然Nagios也能够生成图形报表,但没有Zabbix这么强大。 首……

如何用 Nagios 监控通用服务

Nagios内置了很多脚本来监控服务。本篇会使用其中一些来检查通用服务如MySql、Apache、DNS等等。 为了保证本篇集中在系统监控,我们不会在这里配置主机组或者模板,它们已经在 前面的教程中覆盖了,它们可以满足需要了。 在命令行中运行Nagios 通常建议在添加到Nagios前,先在命令行中运行Nagios服务检测脚本。它会给出……

使用 SNMP 和 Cacti 监控 Linux 服务器

SNMP(简单网络管理协议)用于收集设备内部发生的数据,如负载、磁盘状态、带宽之类。像Cacti这样的网络监控工具用这些数据来生成图标以达到监控的目的。 在一个典型的Cacti和SNMP部署中,会有一台或多台启用了SNMP的设备,以及一台独立的用来从那些设备收集SNMP回馈的监控服务器。请记住,所有需要监控的设备必须启用SNM……

10个值得推荐的服务器监控软件

监控你的WEB服务器或者WEB主机运行是否正常与健康是非常重要的。你要确保用户始终可以打开你的网站并且网速不慢。服务器监控工具允许你收集和分析有关你的Web服务器的数据。 有许多非常好的服务器监控解决方案,而为了省去你寻找方案的麻烦,这里我为你列出了我能找到的最好的服务器监控工具。 1. Performance Co-Pilot P……