tale is Extract, Transform, Aggregate, Load
业务无关模块
- 日志模块
- 日志加载方式
- 日志格式标准
- 配置模块
- 配置文件格式检查和验证器
- 配置规范,字段含意
- 统计模块
- 数据成功和失败数量的统计
业务相关模块
模块间数据流转方式。模块,类,数据与方法的组织方式
- 数据输入
- 数据源支持
- MongoDb
- MySQL
- Text based file
- 数据源支持
- 数据转换(清洗),是否需要支持升维降维?
- 筛选
- 替换
- 类型转换
- 添加列
- 数据计算
- 一般聚合
- cohort计算
- 数据输出
- 输出到文本文件
模型设计 任务模型 Job 状态管理 生命周期管理 Task