Skip to content

Latest commit

 

History

History
57 lines (33 loc) · 1.74 KB

debugging_guide.md

File metadata and controls

57 lines (33 loc) · 1.74 KB
  1. 测试环境搭建
  2. 测试代码开发
  3. Spark on ACK测试
  4. 测试结果分析
  5. 问题排查定位

测试过程中,如果参数配置不对,比如内存太小,很容器出现OOM等异常,这里可以通过两种方式来排查问题。以执行tpcds-query-runner-with-alluxio为例说明。

spark-ui

任务运行过程中,可以通过spark-ui实时看到每个sql的执行情况,方式如下:

执行 kubectl get services 可以看到如下信息:

sparkapplication_svc.jpg

其中tpcds-benchmark-sql-ui-svc即spark-ui对应的service。

执行下面命令:

kubectl port-forward svc/tpcds-benchmark-sql-ui-svc 4040:4040

可以看到

port-forward_svc.jpg

然后在浏览器中输入:localhost:4040,就可以看到spark-ui中的任务执行情况。

localhost_spark_ui.jpeg

ack-spark-history-server

任务结束后,如果想看到历史数据,可以采用这种方式,操作步骤如下:

执行如下命令,获取SparkApplication任务id。

kubectl get sparkapplication tpcds-benchmark-sql -o yaml

get_sparkapplication_id.jpeg

在上图中可以得到sparkApplicationId。

然后再获得ack-spark-history-server的endpoint

kubectl get service ack-spark-history-server 

get_spark_history_svc.jpeg

然后在浏览器中输入上图中的 EXTERNAL-IP和端口,就可以看到所以spark任务的历史数据,再通过上一步找到的sparkApplicationId找到对应记录即可。