产品简介
milvus 作为专门设计用于处理输入向量查询的数据库,它能够以万亿规模索引向量。与现有的主要按照预定义模式处理结构化数据的关系数据库不同,milvus 是自下而上设计的,用于处理从非结构化数据转换而来的嵌入向量。
随着互联网的发展和发展,非结构化数据变得越来越普遍,包括电子邮件、论文、物联网传感器数据、facebook 照片、蛋白质结构等等。为了让计算机理解和处理非结构化数据,使用嵌入技术将这些数据转换为向量。milvus 存储并索引这些向量。milvus 能够通过计算两个向量的相似距离来分析它们之间的相关性。如果两个嵌入向量非常相似,则意味着原始数据源也相似。
产品特点
-
为非结构化数据构建
milvus 帮助用户关注非结构化数据的语义含义,而不是分片、数据持久化和负载均衡等复杂性。milvus 支持向量和标量数据的高性能、混合搜索,为非结构化数据处理开辟了新的可能性。
-
按需性能
milvus 是云原生的,可以轻松进行水平扩展。该平台能够处理任何规模的存储和计算,并具有支持按需和自动扩展的微服务设计。
-
成本效益
milvus 改进了 faiss 和 hnswlib 等高性能存储和索引库,保证了时间和资源高效的查询速度。milvus 采用多种加速方式(如 cpu、simd、gpu 和 fpga),可在毫秒级内检索万亿级数据集上的矢量数据。
-
方便使用的
milvus 支持多种数据类型,并提供完善的多语言 sdk。milvus 通过 python-orm api 提供跨笔记本电脑、本地集群和云的集成用户体验。丰富的部署和可视化工具可帮助用户更快地启动和运行 milvus。
-
社区支持
milvus 毕业于 lf ai & data foundation 的孵化器计划,已被全球 1,000 多个组织采用。该平台充满活力的开源社区欢迎所有人的贡献。
企业案例
所属公司
上海赜睿信息科技有限公司(zilliz)
相关资料
网站:https://milvus.io/
源代码:https://github.com/milvus-io/milvus
技术文档:https://milvus.io/docs/
国家:中国
开始年份 :2019年
项目类型:开源