产品简介
openmldb是一个面向机器学习应用提供正确、高效数据供给的开源数据库。除了超过10倍的机器学习数据开发效率的提升,openmldb也提供了统一的计算与存储引擎减少开发运维的复杂性与总体成本。
产品特性
-
一致性
openmldb首先保证在线和离线特征计算一致性,科学家使用openmldb建模生成的特征,可规避特征穿越等问题,上线后使用相同llvm ir进行编译优化,保证与在线特征计算逻辑一致。其次保证数据存储一致性,数据从离线到在线进行实时同步,用户不需要为离线和在线管理不同数据源,也避免数据不一致对特征和模型带来的影响。
-
高性能
openmldb基于c 和llvm实现了原生sql编译器,内置了数十种物理计划和表达式优化过程,可针对不同硬件环境动态生成二进制码,内存结构针对特征存储优化。最终特征存储空间和成本比同类产品可降低9倍,在线实时特征计算性能提升9倍,离线批处理计算性能比同类产品也提升6倍以上。
-
高可用
openmldb的大规模并行计算服务和数据库存储服务,都支持多节点分布式高可用特性,可以自动failover避免单点故障。
-
sql支持
openmldb支持用户友好的sql接口,兼容大部分ansi sql语法以及针对ai场景拓展了新的sql特性。以时序特征抽取为例,支持标准sql的over window语法,还针对ai场景需求进行拓展,支持基于样本表滑窗的window union语法,实时计算引擎支持基于当前行的request mode窗口聚合计算。
-
ai优化
openmldb以面向ml应用开发优化为目标,架构设计以及实现上都针对ai进行大量优化。在存储方面以高效的数据结构存储特征数据,无论是内存利用率还是实时查询效率都比同类型产品高数倍,而计算方面提供了机器学习场景常用的特殊拼表操作以及特征抽取相关udf/udaf支持,基本满足生产环境下机器学习特征抽取和上线的应用需求。
-
低门槛
openmldb使用门槛与普通数据库接近,无论是建模科学家还是应用开发者都可以使用熟悉的sql进行开发,并且同时支持ml应用落地所必须的离线大数据批处理服务以及在线特征计算服务,使用一个数据库产品就可以低成本实现ai落地闭环。
所属公司
第四范式成立于2014年9月,是企业级人工智能领域的行业先驱者与领导者。第四范式提供以平台为中心的人工智能m6米乐安卓版下载的解决方案,并运用核心技术开发了端到端的企业级人工智能产品,致力于解决企业智能化转型中面临的效率、成本、价值问题,提升企业的决策水平。现已广泛应用于金融、零售、制造、能源与电力、电信及医疗保健等领域,在中国所有以平台为中心的决策型企业级ai市场中排名第一。
相关资料:
openmldb gitee仓库: https://gitee.com/mirrors/openmldb
第四范式m6米乐安卓版下载官网:https://www.4paradigm.com/index.html
开始年份 :2017年
项目类型:开源