服务器竞赛升温,CPU芯片赛道迎来热钱
在数字化浪潮的推动下, 服务器 市场持续蓬勃发展,各大厂商纷纷加大投入,力求在这场激烈的竞争中占据一席之地。
服务器市场,强劲增长
AI 的到来,引爆了服务器市场。
TechInsights最新数据显示,到2028年,服务器市场规模将达到2730亿美元,年复合增长率为18%。要知道,在2022年,全球服务器市场规模为1215.8亿美元,这一数值在当下时点已不容小觑,然而这仅仅是2028年的一半。
到2028年,专为AI应用设计的服务器将占市场份额的59%,复合年增长率为49%。
再看中国市场。
中国正成为全球最主要的服务器增长市场。2021年中国服务器市场规模达到250.9亿美元;2022年中国服务器市场规模为273.4亿美元。
根据IDC、浪潮信息、清华大学全球产业研究院联合编制的《2022—2023全球计算力指数评估报告》显示,2022年,中国整体服务器市场规模保持6.9%的正增长,占全球市场比重达25%,2017年至2022年的复合增长率达48.8%。
AI服务器方面,IDC预计2023年中国AI服务器市场规模将达到91亿美元,同比增长82.5%;2027年将达到134亿美元,年均复合增长率为21.8%。
在服务器市场持续繁荣的当下,CPU的地位愈发凸显。CPU作为其核心部件,其性能和功耗直接影响着服务器的整体表现,也因此成为市场关注的焦点。
服务器CPU架构之争
与GPU不同,CPU主要完成的是通用计算和逻辑控制的工作,打个比方,如果GPU是一个高效的执行者,那么CPU可以看做一个能力全面的调度者。
CPU作为计算机系统运算和控制的核心,是信息处理、程序运行的最终执行单元。
目前CPU行业主要由三大生态体系主导:
一是基于x86指令系统和Windows操作系统的Wintel体系,主要用于服务器与电脑等;在Wintel体系中,CPU厂商生产芯片,操作系统厂商提供操作系统。
二是基于Arm指令系统和Android操作系统的AA体系,主要用于低功耗和高度节能的应用,例如云计算服务器和边缘计算设备。在AA体系中,CPU厂商对芯片或系统厂商进行指令系统或IP核授权,操作系统厂商提供基础版操作系统,由整机厂商定制专用芯片和发行版操作系统。
在算力多元化的新时代,尽管x86架构依然占据着服务器CPU市场超九成的份额,稳坐行业巨头之位,但竞争从未停止。
近年来,ARM也正加速进入服务器领域,这一表现在中国市场尤为明显。按照Gartner的数据,2023年一季度全球Arm服务器出货量占比是7%,如果以全球出货量330.5万台来估算,那么Arm服务器出货量大约在23.135万台左右,其中约40%即9.254万台是出口到了中国市场,在中国服务器市场整体出货量达89.7万台的背景下,占到了10.32%。
除了我们熟知的x86和Arm,RISC-V这一新兴架构正以其开放、灵活的特性,为服务器芯片提供更加广阔的发展机遇。RISC-V以其模块化、可扩展的设计,允许开发者根据具体需求定制指令集,从而打造出高效、节能且高度适配特定应用场景的服务器芯片。
一起看看不同赛道的竞争格局。
服务器CPU芯片,激战打响
x86架构
首先看x86架构。基于x86架构的服务器CPU市场中的主要玩家有英特尔、AMD以及中国大陆的海光、兆芯等。
AMD在最近几年的表现极为强劲。根据MercuryResearch最新发布的x86处理器市场份额数据显示,2024年第一季度AMD在服务器、桌面和移动端均获得了更高的市场份额,分别达23.6%、23.9%、19.3%。
值得注意的是,在2021年第一季度AMD服务器市场份额只有8.9%。
英特尔是x86服务器CPU领域毫无争议的霸主,不过,即便是有着多年深厚积累的英特尔,也不得不面对来自AMD的市场侵蚀。
国产厂商海光主攻服务器芯片,而兆芯则个人PC、服务器都有涉及。
海光信息是国产高端CPU的领军者。海光CPU主要面向复杂逻辑计算、多任务调度等通用处理器应用场景需求,兼容国际主流x86处理器架构和技术路线。海光CPU已经有海光一号、海光二号、海光三号实现商业化,公司目前在售的海光CPU产品主要为海光三号。
从应用场景角度看,公司将海光CPU产品分为7000、5000和3000三个系列,不同系列具有不同的性能。7000系列主要应用于高端服务器,主要面向数据中心、云计算等复杂应用领域。5000系列主要面向政务、企业和教育领域的信息化建设中的中低端服务器需求。3000系列主要应用于工作站和边缘计算服务器,面向入门级计算领域。其中7000系列CPU是海光收入的主要构成。
兆芯也是x86服务器CPU市场的参与者,目前兆芯已经形成了开先系列桌面处理器和开胜系列服务器处理器两大产品线。服务器处理器的产品系列有开胜KH-40000系列处理器、开胜KH-30000系列处理器、开胜KH-20000系列处理器、开胜ZX-C+FC-1080/1081系列处理器。
开胜 KH-40000系列服务器处理器,采用“永丰”自主内核微架构,支持自主互连技术ZPI3.0,单颗处理器集成最高32核心,具备64MB高速缓存,支持8通道DDR4内存,适用于云计算、大数据分析、视频处理、数据库备份、高性能存储,以及超融合一体机等解决方案的搭建和部署。
基于x86架构和生态优势,兆芯在党政和商用领域应用广泛,尤其在PC产业上使用Wintel生态,优势明显。不过由于架构版权问题,导致兆芯过去的产品性能相较同期竞品仍有所差距;在后续的推进中,兆芯不仅着眼于性能优化,还坚定地致力于提升自主可控能力,奋力追赶行业步伐。
今年年初,基于兆芯自研处理器开胜KH-40000/32的双路通用超云服务器正式落地,型号为R3210Z11。
随着中国政府对半导体产业的持续支持,以及国内外市场需求的增长,兆芯CPU有望在全球CPU市场中占据一席之地。
Arm架构入局者愈来愈多
再看Arm架构。基于Arm架构的服务器CPU市场中的主要玩家有华为鲲鹏、飞腾等。
在通用计算处理器领域,华为鲲鹏在2014年发布鲲鹏912处理器,2016年发布鲲鹏916处理器。2019年1月华为正式发布鲲鹏920芯片。
鲲鹏920是目前业界领先的ARM-based处理器。该处理器采用7nm制造工艺,由华为公司自主设计完成。通过优化分支预测算法、提升运算单元数量、改进内存子系统架构等一系列微架构设计,大幅提高处理器性能。典型主频下,SPECintBenchmark评分超过930,超出业界标杆25%。同时,能效比优于业界标杆30%。鲲鹏920以更低功耗为数据中心提供更强性能。
得益于强大的计算能力、高并发处理能力和优秀的能效比,鲲鹏服务器主要应用于云计算、大数据分析、数据库、AI训练与推理等多种场景,并构建了从底层芯片到操作系统、再到上层应用软件的全栈国产化解决方案。
中国移动2021-2022年PC服务器集采项目中,采用海光芯片的服务器达59982台,占比20.90%,采用鲲鹏芯片的服务器达58901台,占比20.53%,鲲鹏与海光服务器招标数量接近1:1,整体国产服务器占比高达41.43%。
不仅是中国移动,在中国电信AI算力服务器(2023-2024年)集采项目中,国产服务器的采购数量占比亦达47.5%。从金额来看,超80亿元的采购总额中,鲲鹏服务器约占28亿元。今年3月,中国移动2024年PC服务器集采中标公告显示,华为鲲鹏再次占据较大份额。
飞腾是PKS(飞腾P、麒麟K、安全S)生态体系主导者,其党政市场占有率高。飞腾芯片产品具有谱系全、性能高、生态完善、自主化程度高等特点,目前主要包括高性能服务器CPU(飞腾腾云S系列)、高效能桌面CPU(飞腾腾锐D系列)、高端嵌入式CPU(飞腾腾珑E系列)和飞腾套片四大系列,为从端到云的各型设备提供核心算力支撑。
基于飞腾CPU的产品在国内政务办公、金融、电信、电力、能源、轨交、教育和医疗等行业信息系统领域已实现批量应用。
同时,飞腾联合5000家生态伙伴,打造3200余种硬件方案,适配近30000款软件,兼容200万级移动APP,构建了国内最庞大的信息产业生态,有力支撑了中国自主信息体系的发展。飞腾在全国政府信创中标超过300万片,市占率超过50%,有力支撑了国家信创工程推进,并逐步向更复杂的电子政务、智慧政府领域延伸。在电信行业,搭载飞腾CPU的服务器在三大运营商的云资源池中得到广泛部署,服务了大量国产化项目。
近年来,ARM架构的兴起下,许多巨头纷纷开始自研ARM架构的服务器芯片,包括国外的亚马逊、谷歌甚至微软,国内的腾讯、阿里巴巴等。
ARM能够挤进服务器市场的核心优势在于,基于ARM的服务器可以支持多样化和快速变化的工作负载,并且更具可扩展性和成本效益;其次,对于不同的利基型市场能够提供更高的定制化,生态系统也更灵活;另外,ARM架构服务器体积相对较小,符合现今微型数据中心的需求。
技术变化带来的机会是全球性的,不限于地域,不限于公司规模,除了这些龙头企业还有诸多初创公司迈进ARM CPU的圈子,包括启灵芯、鸿钧微、遇贤微等。
然而,Arm在服务器CPU这条道路上还有很多困难需要面对,在这之中自然也有不少初创公司倒在这波热潮中,比如前面提到的启灵芯。这些公司需要克服技术、市场、生态等多方面的挑战,才能在竞争激烈的服务器市场中立足。
自研指令集的龙芯和申威
除了以上两大架构,中国芯片市场还有一些厂商通过其他架构不断研发与创新并取得了不错的成绩,比如分别走MIPS、Alpha路线的龙芯中科和申威,他们不仅通过独特的架构设计推出了高性能的芯片产品,而且在自主可控方面也取得了较高的水平。
龙芯中科是中国科学院计算所自主研发的通用CPU,采用自主LoongISA指令系统,兼容MIPS指令,所有IP模块皆为自主设计,拥有片内安全机制,可信性高。龙芯处理器以32位核64位单核及多核CPU/SOC为主,主要面向高端嵌入式、个人电脑、服务器和高性能机等应用。
龙芯产品体系分为三大系列,龙芯1号系列为低功耗、低成本的专用嵌入式SoC或MCU处理器,主要面向嵌入式专用应用领域,如物联终端、仪器设备、数据采集等,主要根据需求定制;龙芯2号系列为低功耗通用处理器,采用单芯片SoC设计,应用场景面向工业控制与终端等领域,如网络设备、行业终端、智能制造等,定位于Intel的凌动系列;龙芯3号系列为高性能通用处理器,通常集成4个及以上64位高性能处理器核,与桥片配套使用,应用场景面向桌面和服务器等信息化领域,对标Intel的酷睿/至强系列。
申威处理器以Alpha指令集为基础进行拓展,高度自主可控。申威在研发出第一代基于Alpha指令集的CPU后,将指令集替换为自研的自主可控申威64位指令集,完全区别于原有Alpha指令集。申威处理器专注于高性能计算,尤其是在服务器领域,浮点运算算力与同期外国处理器相当。申威SW26010是中国首个采用国产自研架构且性能强大的计算机芯片。
申威在服务器领域向上至超算领域的应用场景中性能强大,优势较为明显。2016年6月20日,搭载了40960颗申威SW26010并运行国产操作系统神威睿思的神威太湖之光获得全球超级计算机第一名,神威太湖之光峰值计算速度达每秒12.54亿亿次,是全球首台峰值计算速度超过十亿亿次的超级计算机,持续性能为每秒9.3亿亿次,软件硬件并行,均为申威自主设计。
越来越多厂商拥抱RISC-V
RISC-V架构在最近两年异常火热。一位三年前重点关注ArmCPU创业公司的投资人表示:“我很久没看ArmCPU的创业公司了,现在CPU的创业方向是RISC-V。”
RISC-V如何成为一众厂商的追捧呢?
中国工程院院士倪光南在达摩院玄铁RISC-V生态大会上提到,对比x86,RISC-V可能从以下两个方面实现超越:
其一,今天x86架构仍垄断着服务器和桌面领域,这是因为过去几十年里,x86架构在这些领域形成了强大的生态,以至于其他架构因生态较为薄弱而不能取代它,假以时日这种情况会发生变化。另一方面,现在的x86架构也已经不是纯粹的CISC了,实际上在它内部也用硬件将某些CISC指令转化为它内部的RISC指令再予以执行。
其二, 在后PC时代,CPU架构的竞争力不仅要体现在性能上,还需在芯片面积、能耗、价格、研发周期、生态支持等等方面全方位地体现出来。以此衡量,x86架构不但在新兴领域没有优势,而且在传统领域市场总量也不会有多大增长,甚至其份额也可能被RISC-V所蚕食。
从市场的视角审视,RISC-V不仅契合了中国对于芯片自主研发与掌控的战略需求,同时也为专用服务器市场带来了前所未有的定制化机遇。随着技术发展的深入,当传统CPU的性能提升遭遇瓶颈时,市场将逐渐转向更为精细化和专业化的定制化需求,这将成为RISC-V服务器进一步拓展其应用领域的契机。
目前国内外已有不少公司进入了RISC-V服务器赛道,不过其中部分公司主要涉及服务器中的AI加速芯片。IP公司包括阿里达摩院、SiFive、Ventana、Tenstorrent等;芯片公司包括算能、进迭时空、希姆计算、蓝芯算力、微核芯、超睿科技等。
2019年7月,阿里达摩院面向高性能市场发布了RISC-V处理器核—玄铁C910,后来基于玄铁C910设计了曳影1520SoC。
2021年12月,SiFive发布了IP核P650,据了解,该产品配有128KB一级缓存、2MB二级缓存、16MB三级缓存(16核)等配置,性能指标为11.xSPECInt/GHz,对标ARMCortex-A77,可用于数据中心等场景。
去年3月,北京算能科技发布了首款国产64核RISC-V服务器处理器SOPHONSG2042,随后在8月的第三届滴水湖中国RISC-V产业论坛上又首次披露了其新一代的RISC-V服务器芯片——SOPHONSG2044的相关信息。
VentanaMicroSystems成立于2018年,总部位于美国库比蒂诺。2022年12月,Ventana公司就曾发布了全球首款基于RISC-V架构的服务器CPU——VeyronV1。而在2023RISC-V峰会上,Ventana又发布了其第二代服务器CPU——VeyronV2,在指令扩展、内核设计、互联标准、制程工艺等众多方面进行了全面升级,官方宣称其性能超越了 AMD 的高端服务器芯片Epyc9754,堪称最强RISC-V服务器CPU。
目前,开源RISC-V在中国具有超大规模的市场、丰富的应用场景和庞大的工程师群体推动下,已成为中国最受欢迎的CPU芯片架构之一。然而RISC-V和x86、ARM生态上还是有一些差距,无论从软件规模上还是性能优化程度上,都还没有达到x86和ARM的水平。因此,RISC-V进入服务器市场还存在诸多挑战。
从创新性、成本乃至性能等角度来看,其实Arm以及未来的RISC-V都会是极具竞争力的服务器CPU架构,可现今的服务器仍是一个固执且切入周期较长的市场,x86目前尚未触及设计和工艺的瓶颈,即便有了AI加速器、DPU等组件的加入,服务器架构并没有发生剧变,所以x86在未来的十年内依然将占据主导地位。
只不过随着设计方法、制造工艺的同步,Arm已经在该领域开启了较为成熟的商业化进程,随着时间的推移,市场份额会逐渐升高。
倪光南曾多次表示,中国在芯片产业发展过程中应当重视RISC-V架构。至于何时RISC-V能真正有望来到“三分天下”,业内人士表示如果Arm授权体系出现一些变数,同时RISC-V的高性能进展更顺利、核性能提升很快,生态进展也很顺利的前提下,很快Arm就会与RISC-V正面交锋。
当然,RISC-V作为后来者,面临的挑战还有很多。除了生态构建依然在完善进程中,这种开源架构也要避免类似此前MIPS架构所带来的分散化、碎片化难题。
国产CPU迎来窗口期
中信证券表示,未来三年可能是国产算力芯片发展关键窗口期,目前国产算力硬件理论性能可接近国际主流,“生态优势有望形成正反馈循环,进而支撑市场地位持续领先”。
在2023年11月28日举行的2023龙芯产品发布暨用户大会上,新一代通用处理器龙芯3A6000发布。北京市经信局副局长顾瑾栩表示,龙芯此次发布的自主通用处理器3A6000性能追平国际先进水平,作为北京市技术创新企业的代表,其全面发力加速实现自主信息技术的重大跨越,为实现科技自立自强提供坚实支撑。
工业和信息化部电子信息司副司长史惠康表示,3A6000处理器的推出说明国产CPU在自主可控程度和产品性能上已双双达到新高度,也证明了国内有能力在自研CPU架构上做出一流的产品。并希望能加快先进封装、内存一体化集成等相关的技术攻关,不断推出具有国际竞争力的产品。