智算中心与算力底座如何高效融合?
智算中心发展趋势
自第三次工业革命以来,算力与人们生活越来越密不可分。如今,算力正在成为像水、电一样人类赖以生存的基础设施,尤其是近三年疫情倒逼产业数字化的发展,进一步提升了算力对于社会运转的重要程度。南宁机房
IDC发布的《数据时代2025》预测,到2025年全球数据量将达到175ZB,而中国数据量的平均增速快于全球3%,预计到2025年将增至48.6ZB,占全球数据圈的27.8%。
智算中心与传统数据中心的区别
与传统数据中心主要关注于存储、管理和处理大量数据的不同,智算中心从以下几个方面区别于传统数据中心。
三大区别
1.智算中心更注重提供高性能计算、人工智能、机器学习等计算密集型任务的支持。因此,需要更高速的网络带宽支持高性能计算任务,需要更低的网络延时去满足高性能计算任务。
2.智算中心的网络架构通常采用分布式架构,以支持大规模计算任务的处理。同时,智能计算中心还采用了更先进的网络技术,如 InfiniBand、RoCE 等,以提高网络性能和可靠性。
3.智能计算中心通常采用专业的网络管理工具和监控系统,要求更加精细化和实时化,以保障网络的稳定性和可靠性。
智算中心对网络基础设施的挑战
关于智算中心三连问:
Q1
智算中心对网络基础的速率
及时延长的需求会是怎样?
Q2
哪类光模块会更受青睐?
Q3
如何应对作为网络基础设施的布线系统?
以业界领先的英伟达最新推出的DGX SuperPOD为例:NVIDIA的最新GPU服务器是DGX H100,它有4个800G端口连接到交换机(以8x400GE的方式运行),4个400GE 端口连接到存储,1GE和 10GE端口用于管理。
(图片来源网络,侵删△)
一个DGX SuperPOD(如下图所示)可以包含32个连接到18个交换机的GPU服务器在同列机柜中。每列机柜将有384x400GE光纤链路用于交换结构和存储,以及64个铜链路用于管理,数据机房中光纤链路的数量显著增加。
智算中心的建设者应仔细考虑在AI集群中会使用哪些光收发器和光纤电缆,以最大限度地减少成本和功耗。如上所述,AI集群中最长的链路主要集中在100米以内。对于短距离传输,光学器件的成本将由收发器决定。
(图片来源网络,侵删△)
并行光纤收发器的优点:
它们不需要用于波分复用的光多路复用器和多路分用器。这使得并行光纤收发器的成本和功耗都更低,即使考虑到MPO系统较传统熔纤系统提高了布线系统的成本部分。例如,400G-DR4 收发器与使用双工光缆的400G-FR4收发器相比,使用8芯MPO系统的性价比更高。在非高速网络应用领域,单模光纤和多模光纤均可以很好的支持100米的连接。
由于硅光子学技术的进步已降低了单模收发器的成本,使其更接近等效多模收发器的成本。但市场研究表明,对于高速收发器(400G+),单模收发器的成本仍然是多模收发器的两倍。虽然多模光纤的成本略高于单模光纤,多模和单模之间的光缆成本差异较小,因为多芯MPO光缆的成本主要取决于MPO连接器。此外,高速多模收发器比单模收发器消耗的功率要低一到两瓦。在智算中心中高速网络光模块爆发式增长的预期下,电力能耗的节省也是值得重点考量的一环。
智算中心是否需要采用结构化布线
Part.1 智算中心是否需要采用结构化布线
目前在智算中心布线的水平配线区(HDA)和设备配线区(EDA)普遍采用直连方式,直连方式在布线时可能更为简便,但一旦系统需要扩展或改变,可能会导致布线的混乱,尤其在系统规模较大场景。另外直连方式下,故障排除可能更为困难。所以智算中心是否需要采用结构化布线取决于具体的网络需求和规模。结构化布线是一种在建筑物或数据中心中安装数据通信的通用基础设施,它提供了一种灵活、可维护和可管理的网络基础架构。是否采用结构化布线一般要考虑以下几个因素。
规模情况:
如果智算中心的规模较大,涉及到大量的网络设备、服务器和用户,结构化布线可以帮助组织和管理这些设备,提供高效的网络连接。
未来扩展:
结构化布线设计的一个优势是它能够提供未来扩展的能力。如果智算中心预计会进行扩展,结构化布线可以更容易地适应新设备的添加和网络拓扑的变化。
维护管理:
结构化布线简化了网络的维护和管理。通过标准化的布线系统,诊断和修复问题变得更加容易。
灵活应用:
结构化布线提供了更大的灵活性,允许不同类型的设备连接到网络。这对于智算中心中可能涉及各种设备和技术的环境而言是重要的。
成本效益:
虽然结构化布线的初始成本可能较高,但从长远来看,它可能会降低维护成本并提供更好的性能,从而实现成本效益。广西布线
综合考虑当前需求、未来发展计划、管理效率、性能要求以及长期拥有成本等因素,如果直连方式满足您当前的需求并且在未来几年内不会面临大规模的变化,那么可能可以继续使用。然而,如果未来会有扩展或技术更新的需求,考虑采用结构化布线则是一个更长远的选择。
Part.2 SHIP一舟产品解决方案优点
1、密度高,运营成本低
一舟提供行业领先的高密度光纤管理,使所占空间更少,从而客户可以在数据中心周围部署更多能产生收益的服务器等设备。
2、更快速、更简便的移动、添加和更换
专为更优化、更快速安装而设计。通过减少移动、添加和更换所需的时间,大幅降低总成本并优化产品生命周期成本。清晰、精准的端口标识是加快安装和维护速度的重要因素。我们使用有条理的光纤路由组件和使用不同类别颜色且非常明显的端口标识来确保每次安装维修时既快又准。
3、提供未来更高的数据传输速率的空间
一舟光纤管理系统的设计为从10G 串行调整到40G 和100G 并行光纤提供了一条快速、简单的升级途径。例如:高密度系统允许不同的数据传输速率和应用在同一高密度机箱中混合使用,而且不会破坏相邻模块和连接。这种高度的灵活性不仅提高了客户的投资回报率而且提高了客户对其现有资产的利用率。
4、提高电缆整洁度和设备通风率
4、提高电缆整洁度和设备通风率
电缆管理的设计简洁可靠不仅能改善设备机架内电缆杂乱的现象,而且随着数据中心的发展,还能够防止堵塞或侵占电缆的路径空间。为了保持正常运行,需要对关键业务交换机、存储系统和服务器进行稳定和有效的冷却,我们的目标是设计出不会对功率和冷却限制造成影响的光纤管理系统。
5、实现零宕机和经济的运行
我们在产品开发阶段的主要目标就是让设备在使用期内可重复使用并具有较强的可靠性。为实现这一目标,我们将精密的光纤技术与创新的光纤管理方案结合起来。使产品应用得更简洁清晰和更有条理,从而提高产品的可重复性并降低系统出现停机的风险。
大模型时代
新型智算中心的相关技术受到国内外高度关注
但是目前产业存在多种解决方案
技术路线也尚未统一
一舟亦希望产业凝聚力量
形成共识共同推动智算关键技术成熟
一舟小编思考总结:
参考之前数据中心或云数据中心的建设中,三大运营商及以BAT等为代表的专业云数据中心服务商建设的均为超大规模数据中心,企业自建的数据中心在规模上就小了很多。
二者不仅在规模上存在较大差异,其网络架构及设备互联的方式上亦存在不同。运营商数据中心内的设备间互联多采用长跳线直连方式,而企业级数据中心则采用结构化布线方式,更多的考虑因素是后期维护的便利性,未来网络升级的平滑性。
因此,其主干部分在设计时就会考虑满足未来网络升级的需求,进而保护其昂贵的投资。再进入智算中心阶段后,二者大概率仍会沿用之前的互联方式。南宁布线