DeepSeek R1模型：降低AI大模型训练成本，引发算力投资担忧

author 2025-02-07 共27人围观，发现1个评论

华泰证券研报指出，DeepSeek发布的R1模型及其相关应用，以显著降低的训练成本达到了与现有前沿模型相当的效果，引发市场对算力投资的担忧。

DeepSeek R1模型的创新及影响：

华泰证券分析认为，DeepSeek的主要创新在于其在预训练阶段引入了强化学习。这使得DeepSeek V3的训练成本仅为Llama 3系列的7%。这一突破性进展对当前AI大模型的成本控制做出了重要贡献，有望显著降低现有模型的训练和推理成本。降低训练成本意味着更低的算力需求，这对于AI行业发展具有深远意义，同时也可能对当前以扩大GPU集群规模为主的算力投资策略产生冲击。

对未来大模型研发的影响及中美技术差距：

目前，北美主要的AI公司主要通过扩大GPU集群规模来提升模型性能，探索下一代大模型。DeepSeek的训练成本优化方法能否在下一代模型研发中同样有效，还有待进一步观察和验证。然而，DeepSeek的成功表明，在“Scaling Law”（规模律，即模型性能随着规模增长而提升的规律）放缓的大背景下，中美两国在大模型技术上的差距有望缩小。这将促进全球AI技术领域的竞争，并加速AI技术的创新和发展。

未来展望及潜在风险：

DeepSeek R1模型的成功为AI大模型的研发提供了新的思路，也为降低AI应用门槛提供了可能。然而，我们也需要关注以下潜在风险：