最近在调研数据质量监控框架,发现一些开源产品:
- Apache 开源的 Griffin https://griffin.apache.org/
- 微众银行开源的 Qualitis https://github.com/WeBankFinTech/Qualitis
以及一些厂的自建 DQC 平台的经验(非开源)
- 网易 https://www.wxkol.com/item/067b1ecfedb31ff2.html
- 伴鱼 https://www.infoq.cn/article/8ozct75kmp8o4mypkqam
我们的需求是:
- 常规的多数据源支持、规则管理、任务管理
- 最好能支持复杂校验规则。(比如支持 使用一些脚本语言定义规则)
- 支持报表、通知等
请教各位大神给推荐些开源系统,或者指出一些开源系统的坑,或者分享自己自研 DQC 的坑。 谢谢大家!