开个帖子记录一下,我开发 chDB 的过程:
-
从 2023 年中国新年开始,花了几个月的业余时间黏合了个 Python + ClickHouse + jemalloc
-
得到了 ClickHouse CTO 的肯定和帮助:
- https://github.com/ClickHouse/ClickHouse/issues/32513#issuecomment-1513723095
- https://news.ycombinator.com/item?id=35674252 这里的 zX41ZdbW 就是 alexey-milovidov
-
花费了 2 周时间在 chDB 的 Python 模块中加入 jemalloc,CI 基准测试显示性能提升了约 24.8%
- ClickHouse 包含超过 90 个子模块,并且还内置了 LLVM libc ,在加上 Python 进程空间的 libc……想想这一切,真让人抓狂……为了搞定这一切,我甚至给 jemalloc 提了个 patch
后续更新一下 ClickBench 我觉得有希望在 embedded 数据库里拿到第一的位置