深度融合英特尔新一代至强技术,互联科技实现混合云平台的跨越式升级

2021-12-22 16:14:03 科技快报 chinanews

Flexera发布的《2021年云计算市场发展状态报告》数据显示,82%的受访企业计划或已经部署了混合云,10%的受访企业部署了多云环境。同时工信部华信研究院数据显示,整个云计算市场保持稳定增长的同时,私有云市场涨幅更为明显。这表明在企业级混合云市场,私有云、公有云和混合云成为企业云战略方向的主要选择,也是企业数字化转型的重要利器。

作为承载千行百业的数字化转型的IDC厂商世纪互联,服务了超6000家客户,25年间一直处于数字化转型的生态之中,一路见证其数字化转型带来的巨大改变。世纪互联秉持“让数字化简单易得”的理念,携手更多合作伙伴,持续深耕一体化数据中心的建设与布局,助力全国一体化大数据中心协同创新体系的构建,助力各行各业加速实现数字化转型。

面对混合云趋势,世纪互联基于云计算技术新一代整体托管及运维的互联网基础设施托管服务,提出互联网基础设施Services+战略。在IDC架构发展过程中,基于标准的服务器集群、可扩展的数据中心网络以及共享存储打造的集中式、标准化建设的“糖葫芦串”架构虽然进一步降低基础设施复杂性,但是随着企业业务的增加和变化,整个架构的性能和扩展性形成挑战。世纪互联提出的互联网基础设施Services+战略打破原有的大集中和标准化建设,以云原生技术为核心,基于计算、网络、存储虚拟化资源池打造的云计算基础设施——企业托管私有云EHPC服务,具备快速配置、随需应变、整体租用等优势,能够增强资源利用率,提高伸缩性弹性管理应用和数据需求规模化、降低成本,大大提高了提高业务敏捷性,实现了高效满足业务发展的需求。

同时基于世纪互联集团集团下的互联科技NEOLINK混合云平台,结合在2021年7月收购的TCE(TenxCloudContainerEnterprise,时速容器云)平台,打造了支持云原生的下一代架构,在基础设施层推出了面向行业数字化的虚拟数据中心、托管私有云、容器平台、裸金属和混合云一体机柜等混合云服务,通过互联科技统一多云管理服务门户为多云管理信息采集、数据服务提供数据中心互联、云互联、云原生服务互联以及云安全互联等统一多云的管理服务,满足不同行业、不同业务应用场景,加速企业数字化转型进程。



业务高速增长为互联科技平台带来的技术挑战

但是我们也看到,新兴技术的发展为企业带来了全新的可能性的同时,也带来了如何利用企业数字化转型到达最佳成果的调整。对于世纪互联而言,如何帮助企业用好云、管好云并释放云的技术红利也成为云服务商面临的重要挑战。世纪互联业务在高速增长的同时,互联科技混合云架构在支撑整个集团业务发展的过程中,也面临以下几个挑战:

第一,能耗问题。世纪互联集团作为一家以建设IDC为主体的公司,一直紧跟国家政策和发展方向,致力于打造低碳高效的商用IDC环境,集团上下十分注重节能减排的各项措施。互联科技混合云平台希望在不同的业务负载情况下,能有更智能和动态的的模式来保持性能要求并相对节约能耗。

第二,性能问题。随着混合云业务的增加,比如云原生、对于平台性能的要求越来越高,平台时常出现性能瓶颈,不能对多样的业务需求提供有力支持。

第三,成本问题。集团业务的增加,需要实现虚拟机的大量部署,从而造成了集群的内存一直处在高负载状态,且单纯扩充DRAM会造成成本高昂,对整个平台运营成本带来大的挑战。

第四,可靠性问题,互联科技为对外提供企业私有云和企业虚拟机服务,近一年时间相关业务增长较为迅速,企业私有云机柜数量也保持高量增长。多数业务为基于VMware底层对外提供服务,2021年上半年统计角度来看有比较高的几率出现内存CE错误”,内存UCE错误,更严重者可能会出现Esxi宿主机出现紫屏宕机的情况,严重影响云平台对外提供服务底层的稳定性及可靠性。

英特尔新一代平台释放的技术价值

互联科技长期以来与英特尔在新技术引入和使用方面有着深度和全面的合作。基于混合云平台面临的痛点,通过和英特尔专家的交流,采用英特尔第三代至强可扩展处理器产品和加扩傲腾持久内存等产品和解决方案,并根据不同的业务应用场景进行试验和测试,实现了整个平台的能耗、性能、可靠性以及成本等方面的优化,为后续推广和部署提供了数据支持和保证。

新一代Icelake实现业务系统感知的高效数据中心

通过深度集成IntelDynamic SST能力到世纪互联TCE(TenxCloudContainer Enterprise,时速容器云)平台,基于TCE(TenxCloudContainerEnterprise)容器产品为基础环境,在相同硬件、产品、负载等条件一致的情况下,对采用具备SST高级功能的IntelCPU产品,根据不同的业务应用场景进行试验,通过调整动态SST-PerformanceProfile,采用指定SST-PP方式降低功耗(针对于高性价比要求的应用场景和产品,要求做到客户无感知),分析对数据中心电力的影响,打通了基础架构层和云原生调度层的动态协同能力,为时速云提供更加灵活高效的节能调节及控制方式,从而实现业务系统感知的高效数据中心节能减排目标。

测试结果显示,通过选购的Y系列IntelCPU,在应用SST技术的基础上,使得互联科技进一步整合了CPU资源,精简了CPU的型号选择。通过本次实验,SST-PP应用前后对整集群性能的影响可以做到对客户“无感知”,单R机柜单台服务器受到CPU功耗变化,每日基础电力消耗可降低0.4A-0.42A,整月估算通过SST-PP的整合后可降低R机柜单台服务器约为12A消耗。

世纪互联即将采用英特尔尾标带“Y”具备SST高级功能的CPU服务器目前总数约为500台,占据45R机柜。粗略计算集群可节约电力开销约550万/年~926万/年,对整个集团未来完成节能目标都具有十分重要的意义。

新一代Icelake助力容器云高性能计算

针对容器云面临的性能瓶颈,互联科技需要引入有更高计算能力、更多核心线程数的高密度CPU来提升集群整体性能及业务能力。经过和英特尔专家的交流,选定XeonPlatinum8352V进行测试,选择的原因主要是在价格最优的情况下,8352V可以提供更多的核心数和线程数,提供更强大的资源能力,更适用于云环境的TCO标准。互联科技通过测试CPU计算能力和并行能力展示了IntelXeon Platinum 8352V CPU 在容器场景下的测试验证效果。

测试一:以容器方式跑sysbench,测试CPU计算能力

经测试对比,8352V高性能机型比标准机型在单位时间计算能力有50%~70%提升。参考官方价格对比TCO和性能增长,在目前使用较多的4Threads和8Threads场景下,性能的增长满足业务要求,且与TCO的增加差异在客户可接受范围内。8352V可推荐在高性能计算业务场景使用。

测试二:采用LoadRunner模拟操作用户对应用发起并发测试

经对比测试,8352V机型与标准机型做同样并发数压力测试,8352V机型有较多CPU空闲率,且TPS有将近50%的提高。尤其是在高并发数400的测试下,5318Y已经达到瓶颈,而8352V凭借着更多资源调度能力,CPU并未跑满,还可以继续提供更多服务。

经测试评估,8352V机型凭借更多的资源,更强的性能可满足互联科技高性能密集型业务需求,相比标准机型,对关键业务性能有显著提升。在互联科技完成收购时速云后,满足时速云产品提供更高性能且高竞争力的产品的需求,实现为客户侧新基建带来行业领先的云原生产品、专业成熟的解决方案和客户服务能力,为客户数字化转型的全生命周期提供强大动能。

傲腾内存助力互联科技打造低成本多样化方案

互联科技目前LevelDB集群CPU平均尚有约25%~40%的空闲,但内存基本处于持续满载状态,扩容需求很紧急,面对现有内存瓶颈,在考虑成本为高优先级的前提下,采用BPS的配置,实现了在性能可以接受的情况下,TCO效益优势明显。目前互联科技已经追加了BPS到近期采购清单。

在整机TCO提升24%的情况下,内存容量得到9倍提升,读性能提升1.5倍左右。受BPS带宽较低(相较DRAM)影响,写性能降低到70%~80%之间,尚在可接受范围内。



傲腾整机配置

本次测试中的两个机型的横向对比中,使用二代傲腾BPS大容量内存的机型,仅写性能受到了一定影响,内存容量和读性能都有较大提升。综合考虑,面对现有内存瓶颈,在考虑成本为高优先级的前提下,扩充BPS是一个正确的选择。

英特尔IcelakeMAC提高互联科技运营稳定性

针对互联科技云平台对外提供服务底层的稳定性及可靠性需求,对其私有云环境内全部宿主机进行测试。通过在下半年使用Intel新的Icealake处理器,并开启AdvancedRAS中IntelMCARecovery后,在稳定性、可靠性的统计对比情况,良好的数据对比让互联科技将开启MCA作为一项重要的技术手段来提升世纪互联整体的竞争力。

本次测试集群宿主机为20+节点的AllFlash集群、资源置备用量约为70%左右,CPU计算资源均全线升级为最新IntelIcelake平台。在升级到英特尔最新的Icelake基础之上,应用MCA技术到部分集群,使得系统可以探测硬件错误:如系统总线错误,ECC错误,奇偶校验错误,cache错误,TLB错误等等。本次测试验证了MCA可以有效的检测并自动恢复CPU或内存中的部分逻辑坏损或报错,自动终止该错误线程,提高系统稳定可靠性,为运维排错争取了更多的时间窗口。

结合三季度至今的故障率统计得出,在开启MCA后同一集群发生故障率在21年下半年为3%左右,相较21年上半年的15%改善明显,集群的整体稳定性提升了5倍左右。对于客户服务IntelMCA Recovery的启用,效果非常明显,降低了私有云底层硬件的故障屡,有效的提高了客户服务SLA。

英特尔携手云平台赋能千行百业

混合云平台是未来企业数字化转型的首要选择,互联科技和英特尔的合作,也是对整个混合云平台全面升级的一次合作。通过深度集成英特尔各项能力到互联科技云平台,提高了互联科技内部的研发实力,和互联科技服务客户的深度和广度,为互联科技庞大的客户群提供行业领先、完整的端到端的云原生产品及解决方案,成为更加开放和创新活力的新一代互联网基础设施。

可以看到双方的合作,不仅可以窥探出企业对于混合云平台在技术创新发展的趋势,从而推动业界标准的提高。同时在通过软硬件结合充分发挥CPU平台的整合能力,不断扩展混合云平台所支持的应用场景及其PaaS服务特性,助力包括互联科技等云平台服务于千行百业。



最近发表