400-780-1667
新闻动态 当前位置:首页 >> 新闻动态
从华为数据库到阿里数据库世界第一,亩产一万斤的浮夸何时休?
发布时间:2019-10-10 15:42:33| 浏览次数:

贸易战到现在一年多的时间,国人在高科技核心领域处处被美国扼腕锁喉,特别是信息领域:从芯片.操作系统不胜枚举,而我们只能从农业,稀土等非核心的领域对美国予以回击,并且不断主动赴美示好谈判,国人包括笔者自己都深感无力而憋屈。我泱泱大国,近几十年经济发展世界瞩目,各种“我的国”呼之欲出,歌舞升平,各种院士.博士. 专家教授数量都超过老美,且每年巨额科研投入,怎么会被老美掐住七寸?


笔者包括所有从业者从内心深处名族情节都希望国内有相关公司和产品能打败老美,让我一众IT从业者眼眉吐气,可以自豪的对子女说:你老爸曾经是个英俊的IT男,上过战场,虽然没参加抗美援朝,但是贸易战国乱当头的时候给老美迎头痛击,捍卫我IT界脸面。

 

华为和阿里估计也深知国人民族情节,纷纷在数据库领域重磅发布相关产品:华为数据库让业界汗颜;阿里OCEANBASE性能打败ORACLE 9年世界纪录并大肆宣扬;且无知媒体和从业者也跟风吹嘘,认为我们完全打败老美,业内一片繁荣,扬眉吐气:

 

笔者不是数据库领域的专家。但是也曾经在玩过几年ORACLE.db2,也玩过国产数据库,主机系统存储等基础架构领域有过10几年经验,平时打交道的客户基本99%都是ORACLE IBM. 微软的客户,对数据库以及基础设施这个行业略知一二,笔者作为这个行业老兵一颗爱国之心绝对不低于各位。

 

 

  • 华为数据库让业界汗颜?

 


华为GaussDB数据库,取名 Gauss 旨在致敬数学家高斯。在发布会上也介绍了其“轩辕内核”。在媒体报道中称,外界也认为 GaussDB 内核具有超越现有开源数据库如 MySQL  PostgreSQL 的极致性能。

 

 

然而,根据华为官方网站的消息:

 

GaussDB是华为公司自主研发的关系型数据库管理系统。具备通用的的数据库管理功能。它是基于PostgreSQL9.2开发的,在性能、安全、可用性和可维护性上做了增加。主要适用于对数据的插入、删除和查询为主,更新的频率较低。对数据完整性要求比较高的事务型应用。能满足数据级别在500GB以下的要求。GaussDB能很好的满足我司部分产品的应用需求,做到性能无损切换。


 

达梦几十年专注做自研数据库,华为原数据库研发负责人是达梦创始人冯裕才教授的博士生......


华为数据库研发时间9年左右(不知道是否有水分),研发团队人数笔者一直查不到准确资料,据内部人说这产品的研发非常坎坷,多次出现团队大规模离开的情况,且PostgreSQL最近两年才火起来,开源社区国内人才非常有限。

 

和大多数创业公司一样GaussDB数据库其实也是基于PostgreSQL9.2开发的,PostgreSQL 作为开源数据库,具有最接近ORACLE的兼容性和性能类似于红芯浏览器基于Chrome开发。起名“轩辕内核”的做法,非常具有误导性,很容易让人误以为GaussDB 数据库是国内从零开始自己做的。这种做法好比红芯公司把红芯浏览器的Chrome内核起了个名字叫“神农内核”这个“轩辕内核”应该指的是华为做了一个人工智能的东西插入其中,而并非GaussDB 数据库华为从零开始自主研发。但这种报道方式行业内人也许能看懂,但很容易引发吃瓜群众和媒体的误导。从媒体“外界也认为 GaussDB 内核具有超越现有开源数据库如 MySQL  PostgreSQL的极致性能”的报道来看,已经造成了事实上的误导。

 

国外一开源,国内就自主

 

大家在对红芯浏览器口诛笔伐的同时,却对华为不限制追捧。

 

 

  • 阿里数据库成绩刷新ORACLE尘封九年记录,登顶世界第一?


阿里团队的风格很符合马老师的作风,一向高调,高举高打,这次把院士也拉来站台。

 

李国杰,1943529日生于湖南省邵阳县,男,汉族,计算机专家。中共党员。主要从事计算机体系结构、并行算法、人工智能、计算机网络、信息技术发展战略等方面的研究,发表科学论文150多篇,出版了《创新求实录》、《新一代信息技术产业培育与发展研究报告》、《Information Science &Technology in China: A Roadmap to 2050》等文集和战略咨询报告。长期从事国家863计划高技术研究,两次担任国家“973 计划”项目首席科学家。主持研制成功曙光一号并行计算机、曙光1000大规模并行机和曙光2000/ 3000超级服务器,为发展我国高性能计算机产业做出了突出贡献,先后获得国家科技进步一等奖和三次二等奖。领导计算所研制成功龙芯CPU1994年获得首届何梁何利基金科技进步奖,2000年被评为全国先进工作者。曾被选为九届/十届全国人大代表,中共第十七届党代表。

 

原来李院士并非数据库专家,阿里的号召能力还是一向的强;

 

测试结果如下:



 

初看确实很牛逼,蚂蚁金服排名第一,笔者也非常兴奋:

 

蚂蚁金服排名第一

60,880,800 tpmC

排名第二的是甲骨文

30,249,688 tpmC

 

但是这个榜单很清楚有木有:



所有灰色背景的测试结果

由于软硬件升级的原因而过期

测试结果,有效期仅3

……

只有蚂蚁的测试结果是白背景,其他公司因为太久没有参与测试,以前的测试结果统统过期了

 “蚂蚁金服OceanBase现在的测试成绩,达到了甲骨文Oracle数据库在9年前测试成绩的两倍

 

而根据摩尔定律,今天的硬件性能是9年前硬件性能多少倍?


15年的时候上海某千人计划学者的某跑公司号称脚踢Oracle 拳打EMC当时就用分布式PostgreSQL数据库和H3C服务器搞的一体机战胜过ORACLE RAC(当然号称自主);



看看ORACLE测试用例:




 

并且:

 

阿里OceanBase是分布式数据库,ORACLE只是RAC 11G。如今已经是20C

 

   各位看官,我觉得胸口碎大石,憋的慌,阿里这牛吹的太过了些。不知道接下里怎么自圆其说:

 

  不过就是阿里啊,阿里校友满天下,阿里系朋友圈公关软文滔滔不绝有木有?并且秀出了肌肉和测试艰辛:

   

 

 


我想国内四大国产数据库创始人应该都是国内顶尖专家和ORACLE IBM数据库领域科研人员更是业界翘楚。阿里高薪请来的专家肯定也不会弱!

 

关于国产数据库技术的现状,以下这篇文章我推荐各位仔细阅读(作者是一个数据库领域20多年的技术老人):

https://blog.csdn.net/dataondemand0514/article/details/80570834

总结如下:

1,        国产数据库现状


国内主流几家数据库厂家基本是国内这个领域顶尖高校教授专家团队主导,国内数据库人才非常匮乏。每个公司基本囊括国内最好的数据库人才:几十人到百人的研发团队,主要参考ORACLE等数据库产品自研或者买入落后国外数据库的代码,如:南大通用;且只做数据库,人力各种资源集中。历时20年左右;

数据库是一个技术难度非常巨大的产品,像ORACLE,IBM这种数据库巨头,近40年,上万研发人员的长期投入。国内和国外一线数据库厂家依然差距巨大,不光是人才的匮乏,还有巨额资金的长期投入。如果不是某些政府,军工特定行业国产需要,恐怕早已倒闭。基本在自由市场不是做数据库的都没听说过。

 

说这么多是是希望各位理解,基础科研不是运动,不是一个大厂投点钱两个专家带一帮小弟短期内就能赶超英美,这是违背科学规律的,它是需要长期耐心的投入。看看我们每年巨额的核高基投入和产出就知道了。在看看世界级的IBM实验室和贝尔实验室。

 

以上国产数据库主要是单库,阿里(本次性能第一的测试)和华为以及最近几年国内的创业公司基本都是开源改的分布式数据库。

 

2,        数据库是个大生态


大家知道,数据库是装在操作系统上,还可能存在中间件,操作系统是装在服务器上,服务器是需要芯片的。应用是基于数据库开发适配的。这些领域除了应用,基本都被老美扼腕,是不能不承认的事实,注定国产数据库如果其他生态不补齐短板,短期内国产数据库即使稳定性.性能.功能能满足需求,也是不会发展起来的。


华为也好,阿里也好,主营非数据库。不会单独像ORACLE这种十几万的数据库厂家投入巨资和人员去做一个单一产品(国内好的数据库人才凤毛麟角)。如果金融.运营商.政府等行业在业务允许的情况去使用,产品才有适用各种业务场景的机会,稳定性.功能和性能才有机会不断迭代,路漫漫其修远兮,需要我们的不断努力!


 

 

笔者最后想说:首先笔者作为IT同行,对国产基础设施领域每一个进步都鼓舞自豪,唯愿国货自强。但是我们必须面对现实,承认差距,不能自欺欺人基础科研需要诚心下来,远离商业。想想我们当年的原子弹怎么造起来的?

 

这些年国内IT行业亩产一万斤式样的浮夸风愈演愈烈,语不惊人死不休,少些包装作秀,不要让业界一提国产就想到拿来主义:开源。东西好不好不适合自己吹的,看看用户评价和市场占有情况。贸易战,开源组织差点就玩死华为!阿里和华为作为国内顶级行业先锋,精英荟萃,更应该以事实为依据,少些哗众取宠和浮躁商业宣传,为业内国产自强做出表率。

 
 
 上一篇:Oracle Database 20c 十大新特性一览
 下一篇:35期OCP开班圆满成功!!