Hasty Briefsbeta

双语

DuckLake v1.0

4 days ago
  • #database
  • #lakehouse
  • #data-lake
  • DuckLake v1.0 是一款生产就绪的湖仓格式规范,它将元数据存储在数据库中,而非对象存储中的分散文件里。
  • DuckDB 的 ducklake 扩展作为参考实现,支持 SQLite、PostgreSQL 和 DuckDB 作为目录,现已成为 DuckDB 十大核心扩展之一。
  • v1.0 版本的关键功能包括针对小型操作的数据内联、用于性能优化的排序表、桶分区、几何与变体类型支持,以及实验性的删除向量。
  • 社区采用情况包括 Apache DataFusion、Apache Spark、Trino 和 Pandas 的客户端支持,已在数十家公司投入生产使用,并由 MotherDuck 提供托管服务。
  • DuckLake v1.1 的未来计划包括变体内联和多删除向量 puffin 文件,而 v2.0 版本可能侧重于类似 Git 的分支、基于权限的角色和增量物化视图。