超以太网开放合作,关注5G通信板块机会
小夏子2023
2024-04-24 11:20:58
来自北京
  • 1
  • 评论
  •   ♥  收藏
  • A
    分享到:

一、事件:

在AIGC等催化下智算需求激增,InfiniBand一直以零丢包的特点在AI训练中独占鳌头,配合英伟达GPU几乎垄断AI智算市场。

为抵抗这种市场挤压,2023年AMD、Arista、博通思科等联合组织超以太联盟正式成立,力在推动行业格局变化。超以太网联盟(Ultra Ethernet Consortium,UEC)旨在创建一个“基于以太网的完整通信堆栈架构”,用超以太网传输协议取代基于以太网的RoCE协议,提高网络量、降低延迟,增强网络的可靠性和稳定性,既保持了以太网的成本效益和普及性,又提供了超级计算互连所需的性能。

UEC集结了AMD、Arista、博通、思科等设备商和Meta、微软等云厂商,国内企业包括阿里云、百度世纪互联、字节跳动、华为、新华三、光迅科技、腾讯、锐捷网络等。

事件点评:以太网具备通用性和硬件部署经济性,在短期与InfiniBand有望形成抗衡,并随着丰富生态中参与者的合作迭代,在长期胜出;以太网生态中的头部供应商未来有望受益于AI催化下的硬件扩容和以太网占有率提升的双重利好因素。相关ETF方面,5G通信ETF(515050),截至1季度末,其前十大持仓股分别为立讯精密中际旭创工业富联中兴通讯紫光股份兆易创新新易盛三安光电天孚通信沪电股份。(数据来源,wind)

二、人工智能对网络要求更高,催动通信技术协议发展

智能计算对通信网络的需求大幅提升。2017年Google发布《Attention Is All You Need》,成为后续大模型架构基础,论文中提出的Transformer神经网络利用Self-attention自注意力机制实现并行处理。自此,人们意识到模型表现与其参数规模成正比,从Transformer的1亿参数量到Switch Transformer的1.6万亿参数量,参数和训练集规模不断刷新。大模型通过数据并行和模型并行辅助训练,计算节点较多,且节点之间需要高频进行中间计算结果的通信,为了提高GPU有效计算时间占比、避免网络延迟和带宽限制拖累AI训练效率,智算场景对通信性能提出了更高要求。

人工智能对通信网络需求包括超大规模组网需求、超高带宽需求、超低时延及抖动需求、超高稳定性需求、网络自动化部署需求。在人工智能大规模训练任务中,高效集群组网方案能够提升AI分布式训练的效率,所以智能计算对通信网络的规模、带宽、时延、稳定性和网络部署提出高要求,相较于传统的通用计算和超算有所提升。

三、InfiniBand和超以太简介

1. InfiniBand

InfiniBand是服务器硬件平台的I/O标准,通过交换机在节点间的点对点通道进行数据传输,通道私有且受保护。InfiniBand拥有极高量和极低延迟,扩展性好,最高能扩展到具有数万个节点的集群。实际部署时,需要使用一整套符合InfiniBand标准的硬件设备。InfiniBand多应用于高性能计算集群、人工智能和超大规模基础设施,为大型企业或科研中心提供服务。

每一个InfiniBand体系结构(InfiniBand Architecture,即IBA)称为子网(Subnet),每个子网内最高可有65,536个节点(Node)。InfiniBand交换机用于子网范围内,跨子网需要使用路由器或网关系统。每个节点通过网卡连接至子网:使用主信号适配器(HCA)连接至CPU、内存;通过目标通道适配器(TCA)连接至I/O。

IBTA(InfiniBand Trade Association)于1999年成立,成立之初主要为了改良PCI总线升级慢、导致I/O性能限制系统发展的痛点,主要成员包括Cray、Emulex、HP、IBM、Intel、Mellanox、Microsoft、Oracle、QLogic。InfiniBand推出之初,IBM、SUN、HP、Dell等多家企业发布InfiniBand相关产品,Cisco、QLogic等公司也相继通过收购进入InfiniBand市场。而在2003-2004年间,多家InfiniBand企业退出市场,到2008年主要参与者仅剩Cisco、QLogic、Voltaire和Mellanox。后Cisco转向FCoE(Fibre Channel over Ethernet,以太网光纤通道)和10Gb以太网;Intel收购QLogic的InfiniBand交换机和适配器,后推出Omni-Path架构;Mellanox于2010年收购Voltaire。由此,InfiniBand市场形成Mellanox一枝独秀的局面。2019年,英伟达(Nvidia)公司豪掷69亿美元,击败对手英特尔和微软(分别出价60亿和55亿美元),成功收购了Mellanox。

IB市场上,主要是Nvidia(收购的Mellanox公司)和Intel(收购的Qlogic公司)两大玩家。IB虽然性能更好,但价格较贵。

2. 超以太

以太网是目前全球应用最广泛的局域网技术,由IEEE的802.3标准制定相关的技术标准。标准中包括了物理层的连接、电信号以及介质访问控制等内容。除了IEEE标准组织,还有以太网技术联盟(ETC)和超级以太网联盟(UEC)等组织也会发布相关标准。凭借着高可靠性、低成本、易于管理以及高速等优势,以太网技术广泛应用于自动化、自动驾驶、企业网和云计算等领域。

AMD等厂商共同组建超以太网联盟(Ultra Ethernet Consortium,UEC),旨在创建一个“基于以太网的完整通信堆栈架构”,用超以太网传输协议取代基于以太网的RoCE协议,提高网络量、降低延迟,增强网络的可靠性和稳定性,既保持了以太网的成本效益和普及性,又提供了超级计算互连所需的性能。

UEC分别从物理层、链路层、传输层、软件层四大方面改进以太网技术,近期又成立了存储、管理、兼容性&测试、性能&调试工作组,刚刚展开工作。

UEC旨在用一种新的超以太传输协议替代现有的RoCE协议,致力于改造以太网上的RDMA操作来优化AI和HPC工作负载。超以太传输协议和RoCE协议都属于RDMA协议是当今AI训练工作的基本组成部分,它允许CPU,GPU,TPU或其他加速器将数据直接从发送方的存储器传输到接收方的存储器。这种零拷贝方法可实现低延迟并避免操作系统开销。RoCE主要被设计用于传统数据中心环境,而UET协议支持多路径、分组喷射传输和高效的速率控制算法,这些特性使得UET特别适合于AI和HPC工作负载,能够为这些高负载应用提供更好的网络效能和效率,适用于高性能计算场景。此外在性能上向AI和HPC工作负载提供更加简单的的API,致力于提高网络利用率和降低尾部延迟,有利于加速RDMA操作。

最后,UEC通过智能RDMA、网络级负载均衡、优先级流量控制(PFC)、iLossless智能算法、ACC(Automatic ECN)和全生命周期自动管理等关键技术打造无损网络架构,解决丢包和重传问题,实现0丢包以太网。

3. InfiniBand VS. 超以太

超以太与InfiniBand作为两种用于AI和HPC领域的网络通信技术,各具特点,适用于不同应用场景。

在效应上,超以太网注重解决大规模部署中的性能和效率问题,而InfiniBand可能因端点间的一对一关系限制网络效率。目前,以太网和InfiniBand在支持大规模部署时都存在实际端点数量的限制,例如InfiniBand的尾延迟增加问题。

在生态上,超以太网以其开放标准促进了广泛的技术融合和不同制造商和设备间的联合创新,采取开放的方式寻求未来AI与HPC解决方案,而InfiniBand则与NVIDIAGPU共同形成了一个封闭但优化的性能高地。

在定位上,InfiniBand主要应用于高性能计算,追求高速率和可靠性,有物理地址限制。而以太网在推出目的是兼容性,面向更多终端设备互联,目前在全世界范围内应用广泛。

在成本上,基于InfiniBand的网络架构硬件供应商仅有英伟达,生态较为封闭,英伟达议价能力强;而基于以太网协议的网络架构有丰富的硬件供应商,下游客户采购时选择多,成本可控。

四、投资观点

UEC将以新形式进行传输层处理,在非无损网络的情况下也可实现以太网性能提升,较RDMA更灵活。基于UEC提供的功能,以太网将不会发生队头阻塞,可实现以最小的丢包控制到目标主机最终链路上的扇入,并能减少消息延迟,无需针对网络和工作负载调整拥塞算法参数,网络扩展性强,支持1,000,000个端点。UEC传输协议未来有望超越RoCE协议,力争对标InfiniBand性能,实现以太网在智算领域渗透率的提升。

UEC成立进一步增强网络设备端对AI和HPC大规模部署的灵活性,开放的生态与环境也有望催化对于解耦等需求较多的客户选择相应的解决方案,UEC成立进一步增强网络设备端对AI和HPC大规模部署的灵活性,开放的生态与环境有望催化对于解耦等需求较多的客户选择相应的解决方案。超以太联盟相关企业及网络侧交换机与光模块相关企业也有望受益。

相关产品:

5G通信ETF(515050)及其联接基金(008086/008087),指数成分股在光通信、光模块主题的暴露超30%,5G通信ETF跟踪中证5G通信主题指数,选取产品和业务与5G通信技术相关的上市公司股票作为样本股,捕捉通信技术革新带来的机遇。

$华夏中证5G通信主题ETF联接A(OTCFUND|008086)$

$华夏中证5G通信主题ETF联接C(OTCFUND|008087)$

人工智能 AIETF(515070)及其联接基金(008585/008586):中证人工智能主题指数(指数代码: 930713.CSI,指数简称: CS 人工智)选取为人工智能提供基础资源、技术以及应用支持的公司中选取代表性公司作为样本股,反映人工智能主题公司的整体表现。该指数已纳入截至 2018 年 9月 30 日的 IOSCO 金融基准原则鉴证报告范围。

$华夏中证人工智能主题ETF联接A(OTCFUND|008585)$

$华夏中证人工智能主题ETF联接C(OTCFUND|008586)$

云计算50 ETF(516630)及其联接基金(019868/019869):中证云计算与大数据主题指数(指数代码: 930851.CSI,指数简称: 云计算指数) 选取 50 只业务涉及提供云计算服务、大数据服务以及上述服务相关硬件设备的上市公司 A 股作为样本股,以反映云计算与大数据主题股票的整体表现。

$华夏中证云计算与大数据主题ETF发起式联接A(OTCFUND|019868)$

$华夏中证云计算与大数据主题ETF发起式联接C(OTCFUND|019869)$

数据来源:华西证券、国盛证券、中信建投证券中金公司、Wind,截至2024.4.22,以上个股不作投资推荐。

以上基金属于指数基金,存在标的指数回报与股票市场平均回报偏离、标的指数波动、基金投资组合回报与标的指数回报偏离等主要风险,其联接基金存在联接基金风险、跟踪偏离风险、与目标ETF业绩差异的风险等特有风险,且市场或相关产品历史表现不代表未来。申购:A类基金申购时,一次性收取申购费,无销售服务费;C类无申购费,但收取销售服务费。二者因费用收取、成立时间可能不同等,长期业绩表现可能存在较大差异,具体请详阅产品定期报告。投资者在投资基金之前,请仔细阅读基金的《基金合同》、《招募说明书》和《产品资料概要》等基金法律文件,充分认识基金的风险收益特征和产品特性,并根据自身的投资目的、投资期限、投资经验、资产状况等因素充分考虑自身的风险承受能力,在了解产品情况及销售适当性意见的基础上,理性判断并谨慎做出投资决策,独立承担投资风险。

对于ETF基金,投资者投资于本基金面临跟踪误差控制未达约定目标、指数编制机构停止服务、成份券停牌等潜在风险、标的指数回报与股票市场平均回报偏离的风险、标的指数波动的风险、基金投资组合回报与标的指数回报偏离的风险、标的指数变更的风险、基金份额二级市场交易价格折溢价的风险、申购赎回清单差错风险、参考IOPV决策和IOPV计算错误的风险、退市风险、投资者申购赎回失败的风险、基金份额赎回对价的变现风险、衍生品投资风险等。

对于ETF联接基金,基金资产主要投资于目标ETF,在多数情况下将维持较高的目标ETF投资比例,基金净值可能会随目标ETF的净值波动而波动,目标ETF的相关风险可能直接或间接成为ETF联接基金的风险。ETF联接基金的特定风险还包括:跟踪偏离风险、与目标ETF业绩差异风险、指数编制机构停止服务风险、标的指数变更的风险、成份券停牌或违约的风险等。

本资料不作为任何法律文件,观点仅供参考,资料中的所有信息或所表达意见不构成投资、法律、会计或税务的最终操作建议,我公司不就资料中的内容对最终操作建议做出任何担保。在任何情况下,本公司不对任何人因使用本资料中的任何内容所引致的任何损失负任何责任。市场有风险,入市需谨慎。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500