Skip to content

Hive-Waterdrop-CK 导数问题复盘总结 #55

@godliness

Description

@godliness

2021-3-31日进行的hive导数到clickhouse目前仍然存在如下几个问题待解决:

  1. ck 内存超杀 具体原因分析 已完成
  2. spark task失败重试,数据为什么没有重复, 是哪些参数决定了原子性?已完成
  3. gzip压缩http content encoding为什么导致inflate failed: data error? 已完成
  4. ck 导入 hive实际类型和ck表字段类型不一致依然也可以导入成功?已完成
  5. hive orc parquet文件中没有dt字段,jdbc支持输入sql是否可以解决?不能的话,用什么方案? 已完成

若还存在其他问题请补充

@mxzlxy @FishermanZzhang @glove747

Metadata

Metadata

Assignees

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions