9 月 18 日,在 2020 杭州云栖大会上,阿里巴巴宣布成立云原生技术委员会,阿里巴巴高级研究员蒋江伟担任委员会负责人,达摩院数据库首席科学家李飞飞、阿里云计算平台高级研究员贾扬清、阿里云原生应用平台研究员丁宇等多位阿里技术负责人参与其中。
委员会的诞生,不仅意味着阿里全面拥抱云原生,而且标志着云原生升级为阿里技术新战略。可见,阿里在云原生方向下足了决心。
要问这股决心来自什么?阿里云原生技术负责人丁宇表示,“这来自于跟技术要红利。那么,什么是领先一代的技术?是能真正发挥技术与产品的价值,帮助企业业务实现突破与创新,助力企业更好地发展。”
在丁宇眼中,云原生就是“领先一代的技术”。“我们在不断发展的过程中看到这个方向,又通过自身实践,证明这是一个正确方向,从而更加认可它。因此,我们就比别人更早一些下定决心。”丁宇说。
事实上,在过去多年的云原生实践中,阿里获得了不少技术红利。
向技术要红利
据悉,2009 年,阿里落地了分布式,2011 年又落地了容器化……2019 年电商核心系统 100% 上云,“每一年,我们都在跟技术要红利。”丁宇说。
– 双 11 万笔交易成本 4 年下降 80%
在双 11 场景下,阿里以前做 1 万笔交易要花 100 块,而现在只要 20 块,再乘以阿里的交易规模系数,可以看到这个成本节省的红利是巨大的。
丁宇表示,“这就是通过云原生降低的成本。”一般来说,云原生的第一步是容器化。当容器化以后,整个系统就可以进行标准化对接,云上的弹性变得更加灵活。“我们用云原生的标准化调度技术,做统一调度和混合部署。这样,很多业务的工作负载都跑在同样的调度下,于是,整个资源效率和利用率得到了大幅提升。
同时,我们的系统架构从集中式到分布式再到微服务化,整个业务的迭代效率得到快速提高,团队也不断壮大。比如,原来可能三四百人支持的四五个系统,很快变成了 20 万个微服务,一个人就能负责四五个微服务,整个技术迭代的效率也得到了大幅提高。”他说。
抛个对比,100 人维护一个系统和 1 个人维护四五个微服务,哪一个效率更高?答案无疑是后者。
除了降低成本,云原生还提高了阿里的技术效率。现在,阿里的业务由公共云的标准产品来提供支持,包括全面切换到云原生数据库上。“通过 SLA 交互建立起来的服务体系实际上更有保障,这样的服务不仅更标准,而且更加系统化,而不是靠以前的人肉方式去提供服务。”
另外,委员会还制定了一些有挑战性的目标:研发效率提高 30%。在丁宇看来,作为一个有万名工程师的公司,研发效率提升 30% 产生的红利将是非常可观的。他强调,“云原生不仅帮助了双 11,还帮助了阿里,无论从资源成本,还是技术迭代效率上都得到大幅提高。”
– 从几周到几分钟
在经济体内,蚂蚁集团也通过云原生拿到了技术红利。据蚂蚁可信原生技术部负责人何征宇介绍,在蚂蚁集团,资源池通过容器的方式来统一交付,这大大提升了资源治理能力。以前,资源交付主要以主机为主,用虚拟机的技术去承载业务负载,这就会出现一个问题:可观测比较难。“而容器化之后的可伸缩性和统一调度的能力对我们大有帮助”。
在服务治理上,蚂蚁引入 Service Mesh。通过云原生的方法和解耦规范 API 的方法,业务和基础设施可以在同一个系统里、在不同平面上工作,这样一来业务对基础设施一些需求的响应速度就得到提高,进一步释放了基础设施人员和业务人员的生产力。
举一个典型的例子,SOFAMesh 是蚂蚁针对金融行业特殊需求而开发的金融级中间件,它从 2009 年开始开发,是蚂蚁金融级云原生分布式框架 SOFAStack 的一部分。以前,切换资源后需要重新部署,中间的切换时间长达几周。而 SOFAMesh 的上线,彻底改变了这种情况,切换资源不再需要重新部署,切换时间更是缩短到分钟级。这意味着,像蚂蚁森林这样每天都会面临流量小高峰的业务,无需事先留足资源余量,提前 10 分钟开始切换资源都绰绰有余。
在去年双 11,SOFAMesh 100% 覆盖蚂蚁金服核心支付链路,几十万容器,峰值千万 QPS,平均 RT(响应时间)为 0.2ms,是业界最大的 Service Mesh 集群。
– 双 11 加速云原生化
阿里内部有一句话,“没有经过双 11 检验的技术就不是一个成熟的技术。”
在丁宇看来,双 11 的挑战是,如何用一个比较低的成本实现吞吐能力最大化和用户体验最大化。因此,这是一个技术的权衡标准。
“作为双 11 的技术 Leader,我们就要去考虑,今年哪些地方要升级,哪些地方不要升级,这些升级是不是能够进一步的提升效率、降低成本、控制好风险,又能使用比较领先的技术。其实就是通过技术领先一代所获取的未来红利。如果用当下的技术去做,我们很难做出技术的优势,很难给业务提供更好的支撑。”他说。
双 11 有一个特点是会出现极限峰值。打个比方,日常的峰值是 1 万,双 11 可能会达到 30 万。换句话说,这是一个 30 倍以上的峰值。面对这样的情况,“阿里不可能用 30 倍的成本去支撑双 11,这肯定是公司难以承受的代价”。
在一个确定的时间会有如此大的极限峰值,这实际上推动阿里技术人考虑怎么去降低成本、提升稳定性,推动技术一代代向前演进。
怎么降低成本?丁宇解释,”早在 2011 年,阿里开始自研容器技术。2013 年 Docker 问世,阿里云容器融合其先进理念,并在 2015 年推进集团业务全面的容器化演进,容器技术对于双 11 的显著影响还包括在具体的混部技术实施中,通过混部技术,可节省 30% 左右的 IT 成本支出,在双 11 这个特殊时间段里,将每万笔交易成本降低 75% 以上。”
他说,“最后跟万千客户一样,我们就完全走到了云上。其实还是价值驱动,我们发现上云对业务是最好的,从各个方面都有提升,最后双 11 就完全跑在云上了。”
从某种程度说,双 11 不仅是阿里技术的“练兵场”,而且还加速了集团内部的云原生化。
在双 11 的场景中,通过落地云原生技术,阿里越来越确信云原生技术方向上的价值。2019 年,阿里将电商核心系统 100% 搬到云上,但是这并非一蹴而就。
丁宇向 InfoQ 记者指出,“我们不是一次就搬完的,因为技术分很多层次。今天,我们做的是云原生上云,更多的依赖于云上的标准化产品和技术。云原生产品让我们真正看到了红利,我们就会上云,不断往上走,然后更深层次的去上云。”
正因为拿到了技术红利,看到了云原生的价值,所以让阿里更加坚定这个方向,成立云原生技术委员会,对内加速上云,对外增加投入,让更多的技术人投入进来。
阿里经济体云原生化蓝图
据悉,阿里经济体是一个规模庞大的企业集团,有淘宝、天猫、盒马、AliExpress、Lazada、阿里巴巴国际站、1688、饿了么、优酷、钉钉、阿里妈妈、阿里云、菜鸟、蚂蚁集团等成员。实现这些成员的全面云原生化是云原生技术委员会的主要目标之一。
委员会的首要目的是统一思想。丁宇表示,“虽然核心是赋能开发者和客户,但我们自己首先要构建体系,然后统一思路,建设一些标准。但我觉得,委员会还需要再往下一层,面向未来。
云原生有哪些技术,它的路线是什么,形成哪些新的特性,形成哪些新的竞争力,未来市场和客户还会需要什么,我觉得需要更多的拉通,更多前瞻的布局,还有落实更多眼下的工作,这都是委员会应该去做的事情。”
上云会涉及阿里技术的方方面面,比如数据库、安全、大数据、中间件、容器调度和 Serverless 等。云原生技术委员会的成立,聚集起各个领域的负责人,形成更多共识,统一节奏。
写在最后
站在今天看,云原生已经成为云计算的下一站,它是云计算的再升级。正如丁宇所言,“云原生还会有更多的创新,有更多的产品技术。从企业客户和开发者角度,云原生是云计算释放红利的最短路径,是企业数字化的最短路径。”
而在云原生时代,云计算会持续地向前演进。“下一个十年,我希望能真正释放云的红利,最重要的还是让更多的人用上云或理解云,降低整个 IT 开发或研发门槛。
比如,我可能几块钱就租个虚拟机,5 分钟就能上手,编写自己的应用。只有这样,我觉得云计算才能真正地进入到我们生活的方方面面,通过开发者的手为我们的企业和社会创造更大的价值。”何征宇说。
极牛网精选文章《向技术要红利!阿里未来1年投20亿推进云原生技术》文中所述为作者独立观点,不代表极牛网立场。如若转载请注明出处:https://geeknb.com/12845.html