目录
产品简介
databend 是一个开源的elastic和workload-aware现代云数据仓库。
databend 是一款强大的云数仓,专为弹性和高效设计,自由且开源。它是 snowflake 的开源替代品,也可在云中使用。databend 使用最新的矢量化查询处理技术,让您可以在对象存储( s3、azure blob、谷歌云存储、华为云 obs或minio)上进行超快的数据分析。
产品特点
- 瞬间弹力
databend 将存储与计算完全分离,这使您可以根据应用程序的需要轻松扩展或缩小。
- 优异的表现
databend利用数据级并行(vectorized query execution)和指令级并行(simd)技术,提供性能卓越的数据分析。
- 类似 git 的 mvcc 存储
databend 使用快照存储数据。查询、克隆和恢复表中的历史数据非常容易。
- 支持半结构化数据
databend 支持摄取各种格式的半结构化数据,例如 csv、json 和 parquet,这些数据位于云端或您的本地文件系统中;databend还支持半结构化数据类型:array、map、json,便于半结构化导入和操作。
- mysql/clickhouse 兼容
databend 符合 ansi sql 并兼容 mysql/clickhouse 有线协议,可以轻松连接现有工具(mysql client、clickhouse client、vector、dbeaver、jupyter、jdbc等)。
- 使用方便
databend 没有要构建的索引,不需要手动调整,不需要手动计算分区或分片数据,所有这些都在数据加载到表中时为您完成。
产品优势
新数仓,新模样
作为一个对标 snowflake 和 clickhouse 的新生云数仓,不光要充分发挥「云原生」的力量,带来全新的设计和实现,同时还要在性能和可维护性之间进行平衡。
- 支持 stage 和 data sharing 以帮助用户更好地介入数据的生命周期。
- 全新的 planner 架构,更加友好的 sql 错误提示,更高效和充分的执行计划优化技术。
- 全新类型系统的设计与实现,支持类型检查和类型安全的向下转型。
- 兼具 push 模式和 pull 模式的 processor 调度执行框架。
- 实验性的 native format 支持,本地盘性能进一步提高。
databend as lakehouse
数字时代为 databend 提出了更高的要求,我们必须着手解决海量数据的存储与管理问题,既要支持负载更大的数据量,也要支持更加丰富的数据来源。我们做了以下工作来更好地实现「databend as lakehouse」这一愿景。
- 使用自研的 opendal 来一统数据访问层
- 更加充分的结构化、半结构化数据支持
- 多目录,更方便对接 hive 等自定义 catalog
- 支持直接读取查询位于本地 / satge / 远端的数据文件
极致能效比
经过一年来的持续精进,databend 整体进入到了一个新阶段,「存算分离、弹性调度」,能效比大幅提高。
- 在部分场景下可以和 clickhouse 达到接近性能
- 比 elasticsearch 下降 90% 成本,比 clickhouse 下降 30%以上成本
产品架构
关联产品
databend cloud
databend cloud 是围绕 databend 打造的一款易用、低成本、高性能的新一代大数据分析平台,让用户更加专注数据价值的挖掘。databend cloud 上线了国际版和国内版两个可用区,欢迎有需要的小伙伴申请试用。
所属公司
北京数变科技有限公司(英文名 databend cloud)成立于2021年3月,致力于构建世界上最强大的数据云。该团队由曾在 clickhouse 社区、google anthos 和阿里云工作的工程师组成。企业注册资本1024万人民币,并已于2021年完成了天使轮,交易金额数百万美元。
相关资料
- databend m6米乐安卓版下载官网:https://www.databend.com/
https://www.databend.cn/ - databend 文档:https://databend.rs/
- twitter:https://twitter.com/datafuse_labs
- slack:https://datafusecloud.slack.com/
- wechat:databend
- databend github 开源地址:https://github.com/datafuselabs/databend
- 《databend in 2022》