Skip to content

Latest commit

 

History

History
146 lines (109 loc) · 6.8 KB

clinic-data-instruction-for-tiup.md

File metadata and controls

146 lines (109 loc) · 6.8 KB
title summary
PingCAP Clinic 数据采集说明
详细说明 PingCAP Clinic 诊断服务在使用 TiUP 部署的 TiDB 集群和 DM 集群中能够采集哪些诊断数据。

PingCAP Clinic 数据采集说明

本文提供了 PingCAP Clinic 诊断服务(以下简称为 PingCAP Clinic)在使用 TiUP 部署的 TiDB 集群和 DM 集群中能够采集的诊断数据类型,并列出了各个采集项对应的采集参数。当执行 Clinic Diag 诊断客户端(以下简称为 Diag)数据采集命令时,你可以依据需要采集的数据类型,在命令中添加所需的采集参数。

通过 PingCAP Clinic 在使用 TiUP 部署的集群中采集的数据用于诊断和分析集群问题。

Clinic Server 是部署在云端的云服务,位于 PingCAP 内网(中国境内)。如果你把采集的数据上传到了 Clinic Server 供 PingCAP 技术人员远程定位集群问题,这些数据将存储于 PingCAP 设立在 AWS S3 中国区(北京)的服务器。PingCAP 对数据访问权限进行了严格的访问控制,只有经授权的内部技术人员可以访问该数据。

在对应的技术支持 Case 关闭后,PingCAP 会在 90 天内对相关数据进行永久删除或匿名化处理。

TiDB 集群

本节列出了 Diag 在使用 TiUP 部署的 TiDB 集群中能够采集的诊断数据类型。

TiDB 集群信息

诊断数据类型 输出文件 PingCAP Clinic 采集参数
集群基础信息,包括集群 ID cluster.json 每次收集默认采集
集群详细信息 meta.yaml 每次收集默认采集

TiDB 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 tidb.log --include=log
Error 日志 tidb_stderr.log --include=log
慢日志 tidb_slow_query.log --include=log
配置文件 tidb.toml --include=config
实时配置 config.json --include=config
性能数据 cpu_profile.protomem_heap.protogoroutine.txtmutex.txt --include=perf

TiKV 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 tikv.log --include=log
Error 日志 tikv_stderr.log --include=log
配置文件 tikv.toml --include=config
实时配置 config.json --include=config
性能数据 cpu_profile.proto --include=perf

PD 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 pd.log --include=log
Error 日志 pd_stderr.log --include=log
配置文件 pd.toml --include=config
实时配置 config.json --include=config
tiup ctl pd -u http://${pd IP}:${PORT} store 的输出结果 store.json --include=config
tiup ctl pd -u http://${pd IP}:${PORT} config placement-rules show 的输出结果 placement-rule.json --include=config
性能数据 cpu_profile.protomem_heap.protogoroutine.txtmutex.txt --include=perf

TiFlash 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 tiflash.log --include=log
Error 日志 tiflash_stderr.log --include=log
配置文件 tiflash-learner.tomltiflash-preprocessed.tomltiflash.toml --include=config
实时配置 config.json --include=config
性能数据 cpu_profile.proto --include=perf

TiCDC 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 ticdc.log --include=log
Error 日志 ticdc_stderr.log --include=log
配置文件 ticdc.toml --include=config
性能数据 cpu_profile.protomem_heap.protogoroutine.txtmutex.txt --include=perf
Debug 数据 info.txtstatus.txtchangefeeds.txtcaptures.txtprocessors.txt --include=debug

Prometheus 监控数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
所有的 Metrics 数据 {metric_name}.json --include=monitor
Alert 列表 alerts.json --include=monitor

TiDB 系统变量

诊断数据类型 输出文件 PingCAP Clinic 采集参数
获取 TiDB 系统变量(默认不采集,采集需要额外提供数据库帐号) mysql.tidb.csv --include=db_vars
global_variables.csv --include=db_vars

集群节点的系统信息

诊断数据类型 输出文件 PingCAP Clinic 采集参数
内核日志 dmesg.log --include=system
系统和硬件的基础信息 insight.json --include=system
系统 /etc/security/limits.conf 中的内容 limits.conf --include=system
内核参数列表 sysctl.conf --include=system
socket 统计信息(即 ss 的命令结果) ss.txt --include=system

DM 集群

本节列出了 Diag 在使用 TiUP 部署的 DM 集群中能够采集的诊断数据类型。

DM 集群信息

诊断数据类型 输出文件 PingCAP Clinic 采集参数
集群基础信息,包括集群 ID cluster.json 每次收集默认采集
集群详细信息 meta.yaml 每次收集默认采集

dm-master 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 m-master.log --include=log
Error 日志 dm-master_stderr.log --include=log
配置文件 dm-master.toml --include=config

dm-worker 诊断数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
日志 dm-worker.log --include=log
Error 日志 dm-worker_stderr.log --include=log
配置文件 dm-work.toml --include=config

Prometheus 监控数据

诊断数据类型 输出文件 PingCAP Clinic 采集参数
所有的 Metrics 数据 {metric_name}.json --include=monitor
Alert 列表 alerts.json --include=monitor

集群节点的系统信息

诊断数据类型 输出文件 PingCAP Clinic 采集参数
内核日志 dmesg.log --include=system
系统和硬件基础信息 insight.json --include=system
系统 /etc/security/limits.conf 中的内容 limits.conf --include=system
内核参数列表 sysctl.conf --include=system
socket 统计信息(即 ss 的命令结果) ss.txt --include=system