提到数据库排名,此时脑海里浮现出的是什么?是 db-engines,还是墨天轮数据库排行?两者间有什么区别?下面来聊一下业内这两个知名数据库排名平台。
本篇文章约有 3000 字,预计阅读时间 7 分钟,如阅读时间有限,请直接阅读文章末尾的对比表格。
正文开始前,作者先在这里贴标签,如有不准确、不全面的地方,欢迎文章下方留言交流。
db-engines 数据库排行
- 国际数据库产品
- 谷歌搜索引擎
- 出现较早(2012 年)
- 网络原因导致分数有偏差
墨天轮国产数据库排行
- 聚焦国产数据库
- 百度搜索引擎
- 流行度计算符合本土化
- 平台官方月度解读
目录导读
米乐app官网下载主页:
db-engines 创建于 2012 年 10 月,由奥地利 it 咨询公司 solid it 创建和维护,截至本月(2021 年 9 月)即将运营满 9 年。
它的 slogan 是“knowledge base of relational and nosql database management systems”,9 年间所收录产品从 2012 年最初记载的 5 个分类、18 款数据库产品发展到如今的 15 个分类、378 款数据库产品,称得上是数据库的知识库,在相关产品对比及选型文章中不断被引用。
自多年前接触 db-engines开始,网站的米乐app官网下载主页始终保持这种怀旧的风格,不知道是否在传递着经典不褪色的意思?
(图源:db-engines 米乐app官网下载主页)
db-engines is a new initiative to collect and present information on relational and nosql database management systems.
db-engines 第一篇 blog 的第一句话:“db-engines 是一个用来收集并展现关系型和非关系型数据库信息的新项目。”
在过去的一段时间,谷歌、亚马逊等厂商依托于强大的基础设施在数据领域的创新使行业发生天翻地覆的变化,发展的同时也给业内带来了一些困惑,db-engines 试图通过“人气值”即流行度得分的形式给出参考,同时提供了产品相对应的概念和属性。
db-engines 流行榜单概况
(图源:db-engines 排名和曲线)
db-engines 9 月榜单,一眼望去 top 产品都是相对熟悉的主流数据库,个别产品虽没有使用过但也眼熟了。
- 比较有意思的是甲骨文自家的开源产品 mysql 总在觊觎 oracle 的位子,没有赶超却数次逼近。
- 曲线比较优美的要数 postgresql 和 mongodb,一路高歌猛进、得分稳定上涨。
在榜单解读方面 db-engines 没有定期专栏解读,blog 板块下的文章更新频率较低。
下面看下 db-engines 是通过什么方式计算流行度的。
db-engines 如何计算流行度?
db-engines 网站对数据库流行度得分的计算方式如下。
- 数据库产品在网站上被提及的次数
以搜索引擎查询中的结果数衡量。目前使用谷歌和必应进行这项测量,为了只计算相关结果,db-engines 采集以及对应的术语,例如“oracle”和“database”。 - 对这个系统的普遍兴趣
对于这一衡量标准,db-engines 使用的是google trends中的搜索频率。- 关于系统的技术讨论频率
使用知名 it 相关问答网站 stack overflow 和 dba stack exchange 上的相关问题数量和感兴趣的用户数量进行衡量。- 相关工作的 offer 数量
使用的是领先的求职搜索引擎上的招聘信息,如 indeed 和 simply hired。- 在专业网络中提到该系统的个人简介的数量
使用的是国际上最流行的职业社交网站 linkedin。- 社交网络中的相关性
统计推特上提到该系统的推文数量。
了解完流行度的计算方式后不知你现在作何感想,6 个方面的内容难以覆盖到我们身边大部分人。这里不讨论“xx上网”,毕竟有人离不开、有人嫌麻烦。个人觉得从本土化角度分析,离我们确实稍有点距离。
- 都知道技术要使用 google 找答案,但还有一部分同仁习惯于某度(设置米乐app官网下载主页的同学请举手);
- 老玩家比较熟悉 stack overflow 和 dba stack exchange 问答网站,现在使用频率如何?
- linkedin 的简历是新的么?
- indeed、simply hired 是否有使用过?还是和我一样只见过名字
可以说 db-engines 在一定程度上忽略掉了我们这个大市场。
虽然友好度欠佳,仔细看 db-engines 其实还是有我国部分数据库的身影,如 tidb、polardb、sequoiadb、tdsql、kingbase、tsdb、tdengine、esgyndb 和 k-db 等产品,为你们点赞!
米乐app官网下载主页:
回首过去的两到三年,国产数据库迎来了一波新的发展,尤其在新基建驱动下如获新生,更多的用户和厂商也开始关注起国产数据库这一领域。
墨天轮国产数据库流行度排行在 2019 年和大家见面,起初墨天轮排行榜中可以查到国际主流数据库的排名情况,从 2020 年 9 月开始,推出“国产数据库流行度排行”,聚焦国产产品,建设国产生态,同年 10 月榜单中加入了信通院评测参考指标,提供更丰富的参考维度。
(图源:墨天轮国产数据库排行)
墨天轮国产数据库流行度榜单由刚开始收录的 104 款产品发展至如今(2021 年 9 月) 142 款产品,涉及 8 个分类,展现国产数据库崛起、繁荣发展的一面。
以下来是盖老师(eygle)对近年国产数据库发展的理解。
2019,国产数据库元年开启新纪元
2020,国产数据库崭露峥嵘的发轫之年
2021,国产数据库的躬行实践之年
墨天轮国产数据库流行榜单概况
(图源:墨天轮国产数据库排行和曲线)
以上截图是墨天轮 2021 年 9 月的国产数据库流行度榜单。
- top10 中有 4 款是开源产品,并均位于 top5,开源引领格局;
- 本月 tidb 虽分数有减但仍以绝对的分数优势稳居第一;
- oceanbase 得分下滑明显,达梦进一步拉近与 oceanbase 的距离;
- opengauss 凭借活跃的生态本月获得较大的涨幅,超越 polardb 取得排名第四的佳绩。
详细解读请参考墨天轮发布的“”。
墨天轮如何计算流行度?
墨天轮主要根据如下数据来计算出数据库当月的得分和热度。
0、加分项
gartner市场份额排行;idc市场份额排行;gartner魔力象限;tpc-c排行;通过信通院评测;db-engines上榜。
后续计划引入专利数、论文数、公示的中标记录、参加知名论坛、权威评测榜单、举办活动次数等。
1、搜索引擎
引入百度、必应、谷歌以及微信公众号文章当月搜索条目数,且每个搜索引擎权重不同,如国内百度、公众号文章较高;
除了数据库英文名称搜索,加入中文化搜索如“金仓数据库”、“达梦数据库”等,且每个关键字设置了不同的权重,如中文化搜索较高;
排除关键字为通用英文的问题,如k-db、cloudtable、tsdb等的搜索关键字改为浪潮k-db、华为cloudtable、阿里tsdb。
2、趋势指数
引入百度指数、360趋势数据。
3、博文数目
引入微信公众号、csdn、墨天轮等社区中博文数目。
4、招聘岗位数
引入51job相关招聘数据。
5、文献数目
引入知网数据。
6、问答数目
引入csdn、stack exchange、stack overflow、墨天轮问答数据,且权重不同,如csdn、墨天轮问答较高。
相比 db-engines,墨天轮排行榜在本土化方面做的比较好,1 个加分项和 6 个考核维度的内容看起来没有距离感。
- 搜索引擎方面覆盖了常用的百度和必应,同时也包含谷歌,更是有我们几乎每天都在读的公众号文章;
- 趋势、博文数目、文献均符合本土化,尤其是知网、公众号和 csdn 的引入;
- 在招聘方面目前只看到有 51job 的数据,如果能加上其他常用招聘平台数据会更加完备。
除此之外,墨天轮结合每月结合产品流行度的动态,推出了“国产数据库排行榜 - 月度解读”专栏,官方发布解读文章,国产动态一览无余。
(图源:墨天轮国产数据库排行榜月度解读)
前面两部分内容说明了流行度的计算方式,也看出在本土化渠道差异较大,为了进一步说明,这里引入百度和谷歌的指数。
时间范围 2021.8.1~2021.8.31,分别观察在不同搜索引擎下搜索指数的差异。
oracle/mysql
(图源:百度指数 oracle/mysql)
(图源:谷歌趋势 oracle/mysql)
以下是 8 月的指数对比。
- 百度指数
- mysql 平均值 5045,oracle 平均值 3564;
- mysql 平均值约为 oracle 的 1.42 倍。
- 谷歌趋势
- mysql 平均值 38,oracle 平均值 75;
- mysql 平均值约为 oracle 的 0.51 倍。
在百度中明显 mysql 热度更高,在谷歌中 8 月的平均值只达到 oracle 的一半,两平台对与 oracle 和 mysql 的指数计算是截然相反的。
tidb/oceanbase/dameng
(图源:百度指数 tidb/oceanbase/dameng)
(图源:谷歌趋势 tidb/oceanbase/dameng)
以下是 8 月的指数对比。
- 百度指数
- tidb 平均值 656,oceanbase 平均值 395,达梦平均值 53;
- tidb 指数平均值约为 oceanbase 的 1.66 倍,约为达梦的 12.38 倍。
- 谷歌趋势
- tidb 平均值 18,oceanbase 平均值 2,达梦平均值 2;
- tidb 指数平均值为 oceanbase 的 9 倍,同样为达梦的 9 倍。
谷歌趋势中 oceanbase 和 达梦的分数仅仅为 2,top 产品的分值比例也同百度存在较大的差异。
无论是主流产品的对比还是国内数据库产品的对比,两个平台的指数差异是相当大的,可见对产品流行度排行的影响。
这里贴出链接,可自行验证。
百度指数:
谷歌趋势:
为了更直观展现 db-engines 和墨天轮国产数据库排行的区别和特点,结合文章开头提到的标签,直接上表格。
看完以上内容,哪个榜单更适合你呢?
作者|tank
邮箱|tankdba@outlook.com
参考资料