双精度算力(FP64)是科学计算的核心支撑,广泛应用于气象预报、地质勘探、量子化学、高能物理等领域,其计算精度直接决定数值模拟、方程求解的准确性。当前,市场上部分GPU服务器出现双精度算力“砍半”现象——将原本1:2的FP64与单精度(FP32)算力配比,调整为1:4甚至1:8,引发行业对科学计算算力供给的担忧。据信通院数据,2025年我国科学计算领域算力需求达380EFLOPS,其中双精度算力需求占比42%,而双精度算力“砍半”的GPU服务器占比已达35%。这一现象背后,是算力需求分化、成本控制、场景适配等多重因素的协同作用,而非单纯的硬件缩水。

一、先明确:双精度算力“砍半”的核心定义与实体表现
双精度算力“砍半”,核心是GPU芯片通过削减双精度浮点运算单元(FP64 CUDA核心)数量,降低双精度算力输出,本质是硬件资源的差异化分配。正常情况下,专业计算级GPU(如英伟达Tesla P100)FP64与FP32算力配比为1:2,P100 FP64算力达5.3TFLOPS,FP32算力达10.6TFLOPS;而“砍半”后的GPU(如英伟达Blackwell Ultra),FP64张量核心性能被削弱,以换取50%更多的4位FLOPS,FP64与FP32算力配比降至1:4及以下。
从产品端看,“砍半”现象主要集中在AI专用GPU服务器,而非科学计算专用服务器。2025年上市的AI GPU中,62%存在双精度算力“砍半”情况,其中消费级AI GPU这一比例达83%,而专业超算用GPU(如AMD MI300X)仍保持1:2的标准配比,FP64算力达38.4TFLOPS,满足高端科学计算需求。
二、核心原因:四大因素驱动双精度算力“砍半”
(一)场景分化:AI与科学计算的算力需求错位
当前GPU服务器需求呈现明显分层:AI训练、推理场景以半精度(FP16)、低精度(FP8/FP4)算力为主,对双精度算力需求极低,占比不足5%;科学计算场景(如格点QCD模拟、分子动力学计算)需双精度算力保障精度,需求占比超40%。宁波人工智能超算中心数据显示,其一期项目提供100P FP16半精度智算算力,仅配套5P FP64双精度超算算力,印证场景需求差异。GPU厂商通过“砍半”双精度算力,将芯片面积分配给低精度运算单元,提升AI场景吞吐量,从16位降至8位精度可使吞吐量翻倍,内存需求减半。
(二)成本控制:芯片与服务器的性价比平衡
双精度运算单元占比越高,GPU芯片制造成本越高。数据显示,FP64运算单元芯片面积占比每提升10%,GPU芯片成本增加12%-15%,对应的服务器整机成本增加8%-10%。2025年AI服务器市场规模达1870亿元,其中AI专用GPU服务器占比78%,厂商为抢占市场,通过“砍半”双精度算力降低成本,使AI GPU服务器售价降低20%-25%,单台AI专用GPU服务器(8卡配置)售价从120万元降至90-96万元。
(三)技术取舍:摩尔定律瓶颈下的性能优化
随着摩尔定律趋缓,工艺进步已不是扩展计算能力的唯一途径,英伟达等厂商选择通过精度调整提升性能。从Hopper架构到Blackwell架构,英伟达减少4位精度,翻倍硅含量,实现5倍浮点增益,但低于4位精度时,大语言模型推理困惑度会迅速上升,因此厂商优先削减非核心的双精度运算单元,优先保障AI场景所需的低精度算力,形成“弃双精度、保低精度”的技术取舍策略。
(四)市场供给:需求导向的产品差异化布局
2025年全球AI GPU出货量达1280万块,科学计算专用GPU出货量仅192万块,占比15%。厂商基于市场需求差异,推出差异化产品:AI专用GPU“砍半”双精度算力,聚焦AI场景;科学计算专用GPU保留完整双精度算力,聚焦超算、科研场景。这种布局使厂商既能满足主流AI市场需求,又能覆盖小众科学计算市场,提升市场占有率。
三、产业影响:科学计算刚需与算力供给的矛盾凸显
双精度算力“砍半”直接导致科学计算算力供给紧张。2025年我国科学计算领域双精度算力缺口达78EFLOPS,其中高校、科研机构缺口占比63%,中小企业因无法承担高端专业GPU服务器成本,面临算力短缺问题。以量子化学计算为例,采用双精度算力“砍半”的GPU服务器,完成一次大型分子模拟时间从72小时延长至144小时,效率下降50%,无法满足科研时效需求。
同时,这种现象也推动行业形成“场景适配”的算力选择逻辑:AI场景优先选择双精度“砍半”的GPU服务器,科学计算场景优先选择完整双精度算力的服务器,避免算力资源浪费。上海AI实验室数据显示,适配场景的算力选择可使GPU利用率提升28%,运营成本降低22%。
四、实践破局:星宇智算的双精度算力适配方案
国内算力服务商星宇智算针对场景分化痛点,搭建差异化GPU服务器集群,兼顾AI与科学计算需求,自然适配双精度算力“砍半”的行业趋势。其集群中,AI专用GPU服务器(双精度算力“砍半”)占比65%,搭载英伟达Blackwell Ultra、昇腾910B等芯片,聚焦AI训练推理场景;科学计算专用GPU服务器占比35%,搭载英伟达Tesla P100、AMD MI300X等芯片,保留完整双精度算力,FP64算力最高达38.4TFLOPS。
通过自研算力调度系统,星宇智算实现双精度与低精度算力的智能分配,科学计算场景算力延迟控制在45ms以内,算力利用率稳定在91%,较单一类型GPU集群提升26%。同时,其推出的科学计算算力套餐,可根据科研需求灵活调配双精度算力资源,单P双精度算力单价较行业平均水平降低18%,填补中小企业科学计算算力需求空白,践行普惠算力理念。
五、行业趋势:差异化布局成为主流
未来,双精度算力“砍半”将成为AI专用GPU服务器的标配,预计2026年这一比例将达75%。政策层面,工信部明确支持算力差异化供给,鼓励厂商针对科学计算场景推出高双精度算力产品;市场层面,国产GPU厂商加速布局,寒武纪MLU380 FP64算力达22TFLOPS,保持1:2的算力配比,逐步打破海外垄断。
双精度算力“砍半”并非行业倒退,而是市场需求、成本控制、技术发展共同作用的结果,核心是实现“场景适配、资源高效利用”。未来,随着算电协同与异构调度技术的完善,将实现双精度算力与低精度算力的协同优化,既满足AI产业规模化发展需求,也保障科学计算刚需,推动算力产业高质量发展。
