Skip to content

Latest commit

 

History

History
272 lines (266 loc) · 8.37 KB

目录.md

File metadata and controls

272 lines (266 loc) · 8.37 KB

目录

前言

第一部分 概述

第1章 云计算时代的监控系统

1.1 云计算时代的应用系统

1.1.1 企业“IT云化”实现数字化转型
1.1.2云计算时代的敏捷应用
1.1.3 IT管理变革,关注业务服务质量

1.2 云计算监控的目标和挑战

1.2.1 云计算监控目标
1.2.2 云计算监控挑战

1.3 云资源监控管理

1.3.1 资源监控管理范围 1.3.2 资源监控系统的实现

1.4 百花齐放的开源监控软件工具

1.4.1 监控系统成熟度
1.4.2 Zabbix监控系统
1.4.3 OpenTSDB监控系统

1.5 应云而生的Prometheus监控系统

1.5.1 Prometheus应云而生,茁壮成长
1.5.2 功能完善、监控所有层级指标
1.5.3 开放、高效、易用完整解决方案

1.6 本章小结

第2章 Prometheus基本概念及部署

2.1 Prometheus架构

2.1.1架构简介
2.1.2应用场景

2.2 Prometheus快速部署

2.2.1二级制文件快速部署
2.2.2使用Docker快速安装
2.2.3 Prometheus Web UI

2.3 Prometheus相关概念

2.3.1 数据模型
2.3.2 Metric四种类型
2.3.3 Jobs 和 Instances

2.4 Prometheus核心组件

2.5 本章小结

第二部分 Prometheus技术基础

第3章 Exporter导出器

3.1 概述

3.1.1 Exporter类型
3.1.2 文本数据格式
3.1.3 获取Exporter

3.2 主机监控

3.2.1 Linux主机监控
3.2.2 Windows主机监控

3.3 数据库监控

3.3.1 MySQL server exporter
3.3.2 Redis exporter

3.4 Nginx监控

3.5 Prometheus之黑盒监控

3.5.1软件安装与部署
3.5.2配置文件

3.6 示例使用的软件

3.7本章小结

第4章 服务发现

4.1基于文件的服务发现

4.2基于Consul的服务发现

4.2.1 Consul体验应用信息
4.2.2 软件下载与部署
4.2.3 服务注册发现
4.2.4 与Prometheus集成

4.3基于DNS的服务发现

4.3.1 自建DNS服务SRV记录设置
4.3.2 阿里云域名解析SRV记录设置

4.4 Relabelling

4.5本章小结

第5章 PromQL数据查询

5.1 时序数据库

5.2 PromQL简介

5.2.1数据模型与数据类型
5.2.3 时间序列选择器

5.3 PromQL聚合操作

5.4 PromQL运算符

5.4.1 算术运算符
5.4.2 关系运算符
5.4.3 向量匹配
5.4.4 逻辑运算符
5.4.5 运算符优先级

5.5 PromQL函数

5.5.1 数学函数
5.5.2 时间函数
5.5.3 标签操作函数
5.5.4 Counter指标增长率计算
5.5.5 Gauge指标趋势变化预测

5.6 PromQL查询分析

5.6.1 指标分析
5.6.2 PromQL操作分析

5.7本章小结

第6章 告警处理

6.1概述

6.2 Alertmanager部署

6.2.1 Alertmanager机制
6.2.2使用二进制文件方式安装
6.2.3 使用Docker安装

6.3 Alertmanager配置

6.3.1 global
6.3.2 templates
6.3.3 route
6.3.4 receivers
6.3.5 inhibit_rules

6.4 Prometheus告警规则

6.4.1与Alertmanager关联
6.4.2告警规则
6.4.3使用模板

6.5告警接收器

6.5.1通过Email接收告警
6.5.2通过企业微信接收告警
6.5.3基于Webhook实现钉钉接收告警
6.5.4关于告警通知模板

6.6告警临时静默

6.7本章小结

第7章 可视化Grafana

7.1 概述

7.2 Granfana安装

7.2.1 CentOS上安装
7.2.2 Windows上安装
7.2.3 使用Docker安装

7.3基本概念

7.4 Prometheus 数据源

7.4.1数据源添加
7.4.2页面UI说明

7.5仪表盘导入

7.5.1 Node Exporter 仪表盘
7.5.2 Windows Node 仪表盘
7.5.3 MySQL 仪表盘
7.5.4 Redis 仪表盘
7.5.5 Nginx仪表盘
7.5.6 Blackbox Exporter仪表盘

7.6定制监控图表

7.6.1定制仪表盘
7.6.2定制面板

7.7权限管理

7.7.1添加用户
7.7.2添加Org
7.7.3 添加Team

7.8本章小结

第8章 Pushgateway

8.1概述

8.2 Pushgateway集成

8.2.1 软件下载与部署
8.2.2 Pushgateway UP状态

8.3 Pushgateway数据管理

8.3.1 向Pushgateway发送和查看监控指标 8.3.2 删除Pushgateway中的监控标准 8.3.3 基于推送的Prometheus监控

8.4 本章小结

第三部分 监控综合实践

第9章 OpenStack云计算监控

9.1 概述

9.1.1 云服务商运营监控
9.1.2 云服务客户侧监控

9.2 OpenStack云管平台及其监控组件

9.2.1 OpenStack云管平台
9.2.2 OpenStack监控架构
9.2.3 监控数据采集Ceilometer
9.2.4 监控数据存储Gnocchi
9.2.5 监控告警服务Aodh

9.3 OpenStack_exporter

9.3.1 OpenStack_exporter部署
9.3.2 OpenStack监控可视化展示

9.4 OpenStack-Helm监控

9.4.1 基于OpenStack-Helm部署Prometheus
9.4.2 基于OpenStack-Helm部署Grafana

9.5 本章小结

第10章 Docker容器监控

10.1 概述

10.1.1 Docker容器
10.1.2 Docker容器架构
10.1.3 Docker容器监控

10.2 部署cAdvisor容器监控

10.2.1 安装与运行cAdvisor
10.2.2 cAdvisor结果输出
10.2.3 cAdvisor常用搭配方案
10.2.4 集成Prometheus
10.2.5 Grafana结果实时展示

10.3 Docker容器监控深入分析

10.3.1 抓取指标的生命周期
10.3.2 cAdvisor架构及分析

10.4 本章小结

第11章监控Kubernetes

11.1 Prometheus与Kubernetes完美结合

11.1.1 Kubernetes概述
11.1.2 Kubernetes Operator
11.1.3 Prometheus Operator

11.2 传统方式Kubernetes部署Prometheus

11.2.1 kubernetes部署Prometheus
11.2.2 kubernetes部署kube-state-metrics
11.2.3 kubernetes部署node-exporter
11.2.4 在kubernetes部署grafana

11.3 通过Operator部署Prometheus监控

11.3.1 kubernetes基础环境
11.3.2 安装Prometheus Operator
11.3.3 部署kube-prometheus

11.4 服务配置

11.4.1 静态配置
11.4.2 服务发现配置

11.5 监控对象

11.5.1 容器监控
11.5.3 kube-state-metrics监控
11.5.4主机监控

11.6 数据展现

11.6.1 在Kubernetes集群中安装Grafana
11.6.2 配置Grafana
11.6.3 Grafana插件
11.6.4 Grafana 展示数据

11.7 告警

11.7.1安装AlertManager
11.7.2告警规则
11.7.3 微信告警

11.8 本章小结

第12章 微服务及业务监控

12.1 微服务监控

12.1.1 微服务架构模式
12.1.2 以服务为中心的监控
12.1.3 微服务关键监控指标

12.2 构建Spring Boot微服务监控

12.2.1 Spring Boot技术体系
12.2.2 配置加载Actuator监控组件
12.2.3 使用io.micrometer构建监控指标
12.2.4 搭建PetClinic微服务监控

12.3 业务监控与运营指标

12.3.1 业务运营指标
12.3.2 业务量类指标
12.3.3 构建运营指标体系

12.4 在Spring Boot自定义Metrics

12.4.1 扩展Spring Boot支持监控埋点
12.4.2 自定义Metrics监控指标
12.4.3 使用Collector导出业务指标

12.5 本章小结

第13章 日志监控设计与实现

13.1 概述

13.2 mtail日志监控

13.2.1 mtail安装与使用
13.2.2 mtail运行与输出
13.2.3 mtail与Prometeheus、Grafanan集成
13.2.4 处理Web服务器访问日志
13.2.5 集成mtail定制caching_exporter
13.2.6 nginx-prometheus-exporter

13.3 Fluentd日志监控

13.3.1 Fluentd概述
13.3.2 Fluentd采集流程
13.3.3 Fluentd的Prometheus插件
13.3.4 Fluentd采集全链路方案
13.3.5 Fluentd的Prometheus监控
13.3.6 Fluentd_Exporter支持Prometheus监控

13.4 grok_exporter日志监控

13.5本章小结

第14章Prometheus监控系统生产部署

14.1 最佳实践原则

14.2 数据存储

14.2.1 本地存储
14.2.2 远端存储

14.3 构建高可用监控集群

14.3.1 联邦集群解决方案
14.3.2 Thanos集群解决方案
14.3.3 Cortex集群解决方案

14.4 Alertmanager高可用

14.4.1Gossip机制
14.4.2 搭建本地集群环境

14.5 Prometheus服务发现

14.6 Prometheus自动化部署

14.6.1 使用Ansible部署Prometheus监控系统概述
14.6.2 设计roles组件
14.6.3 参数调整与部署

14.7 本章小结