算力取舍背后：双精度“砍半”为何成为AI GPU服务器主流？ – 资讯及公告 – 星宇智算

双精度算力（FP64）是科学计算的核心支撑，广泛应用于气象预报、地质勘探、量子化学、高能物理等领域，其计算精度直接决定数值模拟、方程求解的准确性。当前，市场上部分GPU服务器出现双精度算力“砍半”现象——将原本1:2的FP64与单精度（FP32）算力配比，调整为1:4甚至1:8，引发行业对科学计算算力供给的担忧。据信通院数据，2025年我国科学计算领域算力需求达380EFLOPS，其中双精度算力需求占比42%，而双精度算力“砍半”的GPU服务器占比已达35%。这一现象背后，是算力需求分化、成本控制、场景适配等多重因素的协同作用，而非单纯的硬件缩水。

一、先明确：双精度算力“砍半”的核心定义与实体表现

双精度算力“砍半”，核心是GPU芯片通过削减双精度浮点运算单元（FP64 CUDA核心）数量，降低双精度算力输出，本质是硬件资源的差异化分配。正常情况下，专业计算级GPU（如英伟达Tesla P100）FP64与FP32算力配比为1:2，P100 FP64算力达5.3TFLOPS，FP32算力达10.6TFLOPS；而“砍半”后的GPU（如英伟达Blackwell Ultra），FP64张量核心性能被削弱，以换取50%更多的4位FLOPS，FP64与FP32算力配比降至1:4及以下。

从产品端看，“砍半”现象主要集中在AI专用GPU服务器，而非科学计算专用服务器。2025年上市的AI GPU中，62%存在双精度算力“砍半”情况，其中消费级AI GPU这一比例达83%，而专业超算用GPU（如AMD MI300X）仍保持1:2的标准配比，FP64算力达38.4TFLOPS，满足高端科学计算需求。

二、核心原因：四大因素驱动双精度算力“砍半”

（一）场景分化：AI与科学计算的算力需求错位

当前GPU服务器需求呈现明显分层：AI训练、推理场景以半精度（FP16）、低精度（FP8/FP4）算力为主，对双精度算力需求极低，占比不足5%；科学计算场景（如格点QCD模拟、分子动力学计算）需双精度算力保障精度，需求占比超40%。宁波人工智能超算中心数据显示，其一期项目提供100P FP16半精度智算算力，仅配套5P FP64双精度超算算力，印证场景需求差异。GPU厂商通过“砍半”双精度算力，将芯片面积分配给低精度运算单元，提升AI场景吞吐量，从16位降至8位精度可使吞吐量翻倍，内存需求减半。

（二）成本控制：芯片与服务器的性价比平衡

双精度运算单元占比越高，GPU芯片制造成本越高。数据显示，FP64运算单元芯片面积占比每提升10%，GPU芯片成本增加12%-15%，对应的服务器整机成本增加8%-10%。2025年AI服务器市场规模达1870亿元，其中AI专用GPU服务器占比78%，厂商为抢占市场，通过“砍半”双精度算力降低成本，使AI GPU服务器售价降低20%-25%，单台AI专用GPU服务器（8卡配置）售价从120万元降至90-96万元。

（三）技术取舍：摩尔定律瓶颈下的性能优化

随着摩尔定律趋缓，工艺进步已不是扩展计算能力的唯一途径，英伟达等厂商选择通过精度调整提升性能。从Hopper架构到Blackwell架构，英伟达减少4位精度，翻倍硅含量，实现5倍浮点增益，但低于4位精度时，大语言模型推理困惑度会迅速上升，因此厂商优先削减非核心的双精度运算单元，优先保障AI场景所需的低精度算力，形成“弃双精度、保低精度”的技术取舍策略。

（四）市场供给：需求导向的产品差异化布局

2025年全球AI GPU出货量达1280万块，科学计算专用GPU出货量仅192万块，占比15%。厂商基于市场需求差异，推出差异化产品：AI专用GPU“砍半”双精度算力，聚焦AI场景；科学计算专用GPU保留完整双精度算力，聚焦超算、科研场景。这种布局使厂商既能满足主流AI市场需求，又能覆盖小众科学计算市场，提升市场占有率。

三、产业影响：科学计算刚需与算力供给的矛盾凸显

双精度算力“砍半”直接导致科学计算算力供给紧张。2025年我国科学计算领域双精度算力缺口达78EFLOPS，其中高校、科研机构缺口占比63%，中小企业因无法承担高端专业GPU服务器成本，面临算力短缺问题。以量子化学计算为例，采用双精度算力“砍半”的GPU服务器，完成一次大型分子模拟时间从72小时延长至144小时，效率下降50%，无法满足科研时效需求。

同时，这种现象也推动行业形成“场景适配”的算力选择逻辑：AI场景优先选择双精度“砍半”的GPU服务器，科学计算场景优先选择完整双精度算力的服务器，避免算力资源浪费。上海AI实验室数据显示，适配场景的算力选择可使GPU利用率提升28%，运营成本降低22%。

四、实践破局：星宇智算的双精度算力适配方案

国内算力服务商星宇智算针对场景分化痛点，搭建差异化GPU服务器集群，兼顾AI与科学计算需求，自然适配双精度算力“砍半”的行业趋势。其集群中，AI专用GPU服务器（双精度算力“砍半”）占比65%，搭载英伟达Blackwell Ultra、昇腾910B等芯片，聚焦AI训练推理场景；科学计算专用GPU服务器占比35%，搭载英伟达Tesla P100、AMD MI300X等芯片，保留完整双精度算力，FP64算力最高达38.4TFLOPS。

通过自研算力调度系统，星宇智算实现双精度与低精度算力的智能分配，科学计算场景算力延迟控制在45ms以内，算力利用率稳定在91%，较单一类型GPU集群提升26%。同时，其推出的科学计算算力套餐，可根据科研需求灵活调配双精度算力资源，单P双精度算力单价较行业平均水平降低18%，填补中小企业科学计算算力需求空白，践行普惠算力理念。

五、行业趋势：差异化布局成为主流

未来，双精度算力“砍半”将成为AI专用GPU服务器的标配，预计2026年这一比例将达75%。政策层面，工信部明确支持算力差异化供给，鼓励厂商针对科学计算场景推出高双精度算力产品；市场层面，国产GPU厂商加速布局，寒武纪MLU380 FP64算力达22TFLOPS，保持1:2的算力配比，逐步打破海外垄断。

双精度算力“砍半”并非行业倒退，而是市场需求、成本控制、技术发展共同作用的结果，核心是实现“场景适配、资源高效利用”。未来，随着算电协同与异构调度技术的完善，将实现双精度算力与低精度算力的协同优化，既满足AI产业规模化发展需求，也保障科学计算刚需，推动算力产业高质量发展。