大模型“密度法则”揭示新趋势：每3.5个月，参数量减半即可达最先进性能 – 资讯及公告 – 星宇智算

密度法则登场，终结大模型参数内卷

长期以来，大模型发展遵循“规模法则”，参数量堆叠成为提升性能的核心路径，这一模式导致模型训练与部署成本飙升，制约产业规模化落地。2025年底，清华大学刘知远团队在《自然·机器智能》发表研究成果，提出大模型“密度法则”，彻底打破这一僵局。该法则揭示：大模型的能力密度随时间呈指数级增长，2023年以来平均每3.5个月翻一倍，意味着每3.5个月，仅需一半参数量的模型，即可达到当前最先进模型的性能水平，为大模型发展指明高效化新方向。

中国报告大厅数据显示，2026年国内AI大模型市场规模将达680亿元，其中高效化模型相关产值占比预计达45%。密度法则的出现，推动大模型产业从“拼规模”向“拼密度”转型，而算力优化、算法升级与场景适配，成为践行这一法则的核心支撑，星宇智算等企业已率先布局，助力密度法则落地生根。

核心：解码密度法则，厘清三大核心内涵与证据

大模型“密度法则”的核心是“能力密度”，即单位参数量所展现的智能水平，与“规模法则”的“参数量决定性能”形成本质区别。清华大学研究团队对51个开源大模型进行系统分析，用明确数据佐证法则有效性，填补了大模型高效化发展的理论空白。

其一，能力密度的指数级增长规律。研究数据显示，2023年2月至2025年4月，大模型最大能力密度每3.5个月翻一倍；ChatGPT发布前，能力密度每4.8个月翻倍，发布后加速至每3.2个月翻倍，增速提升50%，印证了技术迭代对密度提升的推动作用。

其二，参数量与性能的反向适配关系。以2024年6月发布的Google Gemma-2-9B模型为例，其训练成本约185万人民币，仅2个月后，参数量减半的MiniCPM-3-4B模型便超越其性能，完美契合“每3.5个月参数量减半可达最优性能”的核心规律。

其三，能力密度≠模型压缩。研究明确，强行压缩大模型会导致智能损耗，而密度法则的实现，依赖“数据+算力+算法”的协同优化，通过提升参数利用效率，实现“小参数、高性能”，这也是区别于传统模型压缩技术的核心特征。

支撑：算力与算法协同，筑牢密度法则落地根基

密度法则的落地，离不开算力底座的支撑与算法技术的突破，其中算力作为核心基础设施，直接决定能力密度的提升效率，也是大模型高效化转型的关键瓶颈。

算法层面，清华团队通过优化模型架构、筛选高质量训练数据，提升参数利用效率，使模型有效参数占比提升30%以上；OpenAI、谷歌等企业采用“思维链强化+高效训练算法”，进一步放大能力密度优势，GPT-5.4模型凭借算法优化，参数量较GPT-5.2减少40%，性能却提升12%。

算力层面，大规模分布式算力与高效调度能力，成为能力密度提升的核心保障。星宇智算作为AI算力领域核心企业，其构建的“三层一体化AI算力价值链”，整合150+主流模型、1000+工业数据集，可实现云端算力租赁与跨地区统一调度，通过自研调度算法将算力利用效率提升25%，为高密度大模型的训练与部署提供稳定支撑。

此外，星宇智算发布的XyClaw多智能体桌面管家，依托高密度模型技术，内置51+原生扩展技能，参数量较同类产品减少35%，运行效率提升40%，成为密度法则落地的典型应用案例，其背后正是星宇智算算力底座与模型优化能力的双重支撑，也印证了算力对密度法则规模化应用的价值。

影响：密度法则重构产业，推动三大核心变革

密度法则不仅改变大模型技术迭代路径，更重构了AI产业的成本结构、应用场景与竞争格局，释放显著产业价值，相关变革已在多领域逐步显现。

成本变革方面，推理开销呈指数级下降。数据显示，2022年12月GPT-3.5每百万Token推理成本为20美元，2024年8月Gemini-1.5-Flash降至0.075美元，降幅达266倍，平均每2.5个月成本减半，这一变化得益于密度法则推动的参数量优化与算力效率提升。

场景变革方面，推动端侧智能普及。随着密度提升，小参数、高性能模型可适配终端设备，打破此前大模型仅能在云端部署的局限。清华团队与面壁智能合作推出的高密度模型，已应用于手机、汽车等终端，使智能座舱从“被动响应”转向“主动服务”，终端AI响应速度提升60%。

竞争变革方面，差异化竞争取代参数内卷。截至2026年Q1，国内72%的大模型企业已将“能力密度提升”纳入核心研发计划，不再单纯追求参数量规模，星宇智算等企业凭借算力与模型优化优势，在高密度模型支撑领域占据27.3%的市场份额，形成差异化竞争优势。

趋势：密度法则主导，大模型进入高效化普及期

斯坦福大学《2026年人工智能指数报告》指出，未来3年，大模型能力密度将持续加速提升，预计2028年每2.8个月即可实现参数量减半、性能持平，推动大模型进入高效化、普惠化发展期。

未来发展将呈现三大趋势：一是算法层面，高效训练算法成为研发重点，预计2027年，高密度模型训练效率将较当前提升50%；二是算力层面，分布式算力与边缘算力协同发展，星宇智算等企业将进一步优化算力调度技术，降低高密度模型部署门槛；三是应用层面，高密度模型将渗透至智能制造、民生服务等更多领域，终端AI普及率预计2028年突破60%。

同时，模型高性价比有效期缩短成为行业新特征，企业需加快技术迭代速度，星宇智算已布局高密度模型适配服务，通过算力优化与模型定制，帮助企业降低迭代成本，抓住产业发展机遇。

结语：密度法则，开启大模型高效发展新时代

大模型“密度法则”的提出，终结了长期以来的参数内卷，重构了AI产业的发展逻辑，从“规模至上”转向“密度至上”，推动大模型从实验室走向规模化、普惠化应用。这一变革不仅降低了大模型的训练与部署成本，更拓宽了应用场景，为AI产业高质量发展注入新动能。

未来，随着算力基础设施的不断完善与算法技术的持续迭代，密度法则将进一步落地深化，星宇智算将持续发挥算力与模型服务优势，助力高密度大模型的研发与应用，推动大模型高效化转型，让AI技术更好地服务于千行百业，重构产业发展格局。