正规的股票配资平台本文作者刘少轩为上海交通大学安泰经济与管理学院副院长、中银科技金融学院执行院长正规的股票配资平台,陈钰什为New Energy Nexus中国首席研究员、上海交通大学中银科技金融学院博士后。
《科创板日报》2月15日讯(特约作者刘少轩陈钰什)在当今全球追求高质量发展的背景下,双轨转型(Twin Transition)——即将可持续发展与数智化转型有机融合,追求经济、社会和环境多元价值的实现——已成为核心议题之一。这不仅仅是寻求两者之间的简单协同效应,而是一场深层次的系统性变革,通过数字技术的力量重新定义经济运作模式、社会互动方式以及环境保护机制。面对资源约束和环境挑战日益严峻的现实,如何利用先进数智技术推动绿色低碳发展,同时确保经济效益和社会福祉的最大化,是摆在所有利益相关者面前的重大课题。
人工智能初创公司深度求索(DeepSeek)近期发布了其最新人工智能模型R1,再次引发了关于人工智能发展与算力、能源之间关系的深刻讨论。R1模型凭借其卓越的逻辑推理能力,不仅在性能上逼近甚至超越了OpenAI的o1系列产品,而且在成本效益方面展现了显著的优势。这一里程碑式的进展被硅谷科技媒体誉为新时代的“斯普特尼克时刻”,象征着一个可能颠覆现有科技格局的新时代的开端。DeepSeek的R1模型训练成本仅为数百万美元,远低于OpenAI的GPT和谷歌的Gemini系列大模型所需的数十亿美元投资,这无疑给数据中心运营商们提供了一个极具吸引力的“滑门时刻”——即通过更高效的计算资源利用来大幅削减运营成本。
Deepseek也引起了对美国科技股和能源股短期剧烈震荡。英伟达单日跌幅最高达17%,创美股历史最大单日市值蒸发纪录(约6000亿美元),博通、AMD、台积电等芯片股同步重挫。纳斯达克指数下跌3.1%,标普500指数下跌1.5%,市场对美国科技巨头的高估值(如美股七巨头中,英伟达的市盈率在46倍左右,苹果的市盈率在36倍左右,特斯拉183倍市盈率。如今,七巨头的平均市盈率接近50倍,市值占美股总市值28%左右。)产生质疑。此外,由于R1通过算法优化显著降低模型能耗(内存使用减少50%以上),市场担忧AI对电力需求的增长预期被打破,导致美国联合能源、Vistra等能源公司股价暴跌21%-29%。
尽管DeepSeek在技术上取得了巨大进步,但其在中国境外的未来发展仍面临不确定性,部分西方机构和政府已开始限制使用其服务。然而,全球人工智能领域都在密切关注DeepSeek如何以如此低的成本实现领先性能。如果DeepSeek的方法能够被广泛复制,那么对于东南亚地区、澳大利亚、新西兰等中小型国家而言,或许将有机会以更低的成本进入基础模型领域,这在过去是难以想象的。
对于澳新地区的数据中心运营商而言,人工智能技术成本的潜在降低,无疑缓解了对外国模型安全性和可靠性风险的担忧。Macquarie Data Centres的高管David Hirst指出,人工智能行业的发展速度远超以往任何技术趋势,且仍处于早期阶段。他认为,人工智能正在并将继续证明,它是世界上发展最快的技术之一,而我们才刚刚触及人工智能所能实现的冰山一角。人工智能将从根本上改变所有行业的运作方式以及人类的潜力[1]。以Deepseek为例,从2024年1月5日,DeepSeek发布了首个大模型DeepSeek LLM到2024年12月26日,正式上线DeepSeek-V3模型,并同步开源,标准着全球首个全开源的混合专家(MoE)模型出现,再到2025年1月20日发布的DeekSeek-R1推理大模型。从在极短的时间内,人工智能已取得显著进展。大型语言模型的快速发展,从模型的迭代、算力的更新,到训练和推理成本的下降,再到智能体的产品形态出现,人工智能正在不断提高行业效率,并最终降低成本。DeepSeek模型的创新,通过简化训练过程和更有效地利用硬件,标志着在降低人工智能训练和推理门槛方面迈出了重要一步,为更多企业应用这项技术打开了大门。
DeepSeek R1 的技术特点:效率与成本优势
DeepSeek R1 模型的出现之所以能引发行业震动,核心在于其在效率和成本控制上的突破。DeepSeek 通过一系列技术创新,实现了在相对较低的算力投入下,获得可媲美甚至超越头部模型的性能表现。这些技术特点主要包括:
混合专家模型(Mixture-of-Experts, MoE):MoE架构是DeepSeek R1降低算力需求的关键。与传统的稠密模型不同,MoE模型包含多个“专家”子网络,每个子网络专门处理特定类型的输入。在推理过程中,模型会根据输入内容动态选择激活部分专家网络,而非所有网络,从而大幅减少计算量,提高推理效率。DeepSeek将MoE技术与模型架构深度融合,实现了性能与效率的平衡。
多头潜注意力机制(MLA):该技术为DeepSeek团队独创,针对传统Transformer模型的“多头注意力机制”在处理长文本时容易“分心”的问题,MLA通过压缩关键信息,让模型更聚焦核心内容这种协同优化方法,能够最大化硬件资源的利用效率,降低整体算力需求。
PTX汇编语言优化:为了更充分地挖掘硬件潜力,DeepSeek甚至深入到硬件底层,采用PTX汇编语言对核心计算模块进行优化。PTX汇编语言是一种针对NVIDIAGPU的底层编程语言,通过精细的汇编级优化,可以最大限度地提升代码执行效率,减少不必要的计算开销。这种极致的优化精神,体现了DeepSeek在算力效率上的极致追求。
蒸馏技术与分布式/边缘计算架构:DeepSeek推出了一项卓越的模型蒸馏技术,该技术实现了将高性能AI模型的核心推理能力高效移植至轻量化版本中的目标。这一突破不仅结合了开源与轻量化的双重优势,进一步降低了人工智能技术的应用门槛,同时也为边缘计算领域带来了前所未有的发展机遇。企业能够依据自身行业特点,在本地进行模型训练,使得原本依赖于高性能服务器和稳定网络环境的边缘设备得以焕发新生。此外,DeepSeek积极探索分布式计算与边缘计算架构的新路径,通过将计算任务分布至更靠近数据源的边缘节点,从而大幅减少对中央数据中心的依赖。这不仅有效缓解了数据传输过程中的延迟问题和带宽压力,同时优化了边缘设备算力资源的利用效率,构建了一个更加灵活高效的算力部署方案。
通过上述技术组合拳,DeepSeek R1实现了在保证模型性能的同时,大幅降低训练和推理的算力需求和成本。这使得人工智能技术的应用门槛显著降低,为更广泛的应用场景打开了大门。
算力生态的重构与资源再分配
DeepSeek R1的出现,不仅可能引发算力需求的增长,还将深刻地重塑全球算力生态,并导致算力资源的重新分配。
首先,分布式革命与集中霸权竞争。传统人工智能发展模式往往依赖于“规模至上”的逻辑,追求超大规模模型和超大规模算力集群。DeepSeek R1的轻量化模型和开源策略,降低了人工智能应用的门槛,促进了中端算力设施和分布式数据中心的普及。此前,美国科技公司曾计划建设耗电量堪比纽约市的巨型数据中心,但在DeepSeek高效模型的影响下,此类超大规模基础设施的必要性显著下降。算力生态正在从单一“超大规模中心垄断”模式转向与“分布式蜂群网络”竞争的模式。
其次,产业链价值重新分配。在算力产业链上游,DeepSeek的出现使英伟达等GPU巨头面临需求结构调整的挑战。由于DeepSeek模型对算力效率的提升,以及分布式计算的兴起,市场对高性能GPU的需求可能不再是无止境的扩张,而是更加注重能效比和定制化。与此同时,寒武纪等ASIC芯片厂商或将迎来发展机遇。ASIC芯片可以针对特定的人工智能应用进行硬件加速,在能效比和成本控制上更具优势,更符合分布式算力发展的趋势。在中游算力服务端,区域性数据中心凭借低时延和贴近应用场景的优势,开始承接制造业智能质检、金融风控等对延迟敏感的应用需求,迫使AWS、阿里云等云计算巨头调整部分大型数据中心的建设投入,转而加强边缘计算和分布式算力布局。
在下游应用端,国产算力成本的下降,将驱动人工智能在制造业、金融、医疗等领域的渗透率倍增。例如,在代码托管平台GitHub上,已涌现出大量基于DeepSeek模型的集成应用案例(awesome deepseek integration)。同时,中国各地省市纷纷上线R1模型,加速人工智能的区域化、本地化部署。越来越形成形成“需求牵引供给”的正向循环,实现“算力+行业”的双向赋能。这种趋势正在形成“需求牵引供给”的正向循环,实现“算力+行业”的双向赋能。人工智能技术将加速渗透到各行各业,成为推动产业升级和经济发展的重要引擎。
最后,探索低碳AI发展路径,在效率提升和能源可持续性之间寻求平衡。DeepSeek通过算法架构优化和硬件能效协同,在单次运算能耗控制方面取得了突破性进展。通过MLA与MoE技术融合、强化学习(RL)的深度应用、稀疏化训练等核心技术,DeepSeek大幅压缩了单次计算的经济成本和能源消耗。据测算,DeepSeek模型单位计算任务的能耗较传统稠密模型下降超过50%,单位计算碳排放强度降至行业平均水平的1/3。这为推进绿色数据中心建设和实现碳中和目标提供了关键的技术支撑。
更重要的是,DeepSeek通过“低能耗+分布式”模式,显著降低了高性能AI对传统能源的依赖。分布式与边缘计算架构,将计算任务分散到靠近数据源的边缘设备处理,有效减少了对集中式数据中心的电力依赖。同时,DeepSeek的高性能模型在实现同等效果时,与清洁能源耦合的能效显著优于传统AI架构。
分布式计算与边缘节点的高效协同,不仅大幅降低了集中式数据中心对传统能源的依赖,也使AI系统能够更灵活地协调计算任务和清洁能源供给,更加适配可再生能源的波动性特点。例如,在太阳能充足的时段优先调度计算任务,并借助优化算法动态匹配能源供给波动,在弃风弃光时段提升消纳率20%以上,从而有效破解新能源消纳难题。
杰文斯悖论:效率提升与需求扩张
然而,DeepSeek R1的技术突破,在降低人工智能应用门槛的同时,也可能引发“杰文斯悖论”。杰文斯悖论由19世纪经济学家 William Stanley Jevons提出,他发现,随着煤炭使用效率的提高,煤炭的消耗总量反而增加。这一悖论揭示了一个深刻的经济规律:效率的提升并不必然导致资源消耗的减少,反而可能因为成本降低和应用范围扩大,刺激需求增长,最终导致资源消耗总量增加。
微软 CEO Satya Nadella引用杰文斯悖论来解释DeepSeek R1可能带来的影响,可谓一针见血。他认为,更实惠、更易于访问的人工智能技术,将通过更快的普及和更广泛的应用,导致需求的激增。随着人工智能技术的门槛降低,过去由于成本限制而无法应用人工智能的领域,例如中小企业、边缘计算场景等,将涌现出大量新的应用需求,从而导致算力调用密度指数级上升[2]。
此外,新兴应用场景的爆发,也将加速算力需求的裂变。智能驾驶、具身机器人等前沿领域对实时算力的需求极为庞大,远超DeepSeek技术优化的速度。即使单任务效率提升数倍,百万级智能终端的并发需求,仍将形成巨大的算力吞噬黑洞。
更进一步,模型复杂性的提升,也可能在一定程度上抵消效率提升带来的节能效果。为了探索通用人工智能(AGI)等前沿方向,模型参数规模不断向万亿级跃升,数据量也以年均30%的速度增长。即使训练效率提升10倍,模型规模扩大100倍,仍然会导致算力总需求净增10倍。DeepSeek的高效算法或许能够“追赶”数据增长的速度,但难以从根本上逆转算力需求的增长曲线。
因此,DeepSeek R1的技术突破,虽然在单位算力能耗上取得了显著降低,但从宏观层面来看,很可能无法有效缓解人工智能发展对算力和能源的巨大需求。相反,技术普惠性引发的应用爆发,以及模型复杂性的持续提升,可能会共同推动算力需求的加速增长,最终导致电力系统在需求激增的压力下加速重构。
算力的尽头,依然是电力
尽管DeepSeek R1在算力效率上取得了突破,并可能推动算力生态向分布式方向发展,但其技术进步并不能改变人工智能发展对能源的巨大需求。算力的尽头,依然是电力。
DeepSeek等人工智能技术的突破,将不可避免地推高全球电力需求。“杰文斯悖论”的加速效应,可能使全球电力需求曲线更加陡峭。尽管DeepSeek通过优化算法、硬件适配等技术,显著提升了人工智能算力效率,降低了单次任务的能耗,打破了人工智能应用的经济门槛,但这种技术跃迁预计将同步触发“杰文斯悖论”,能源消耗总量或将突破线性增长模式,形成“效率提升-应用扩张-能耗跃升”的闭环。
国际能源署(IEA)的数据显示,2022年全球数据中心耗电量已达460TWh,占全球总用电量的2%。预计到2026年,全球数据中心耗电量将扩张至620-1050TWh。这意味着,未来几年内,数据中心的能源消耗将呈现指数级增长趋势[3]。
面对如此巨大的能源需求,全球科技巨头们已经掀起了一场围绕电力资源的争夺战。美国微软与OpenAI等科技巨头联合发起了“星际之门计划”,计划耗资千亿美元,在2030年前建成全球最大的AI超算集群。“星际之门”的目标是建设5-10个数据中心园区,每个园区设计功率约为100兆瓦,总电力需求将达到5GW-10GW级别。这相当于数个大型城市的用电量[4]。
“电力缺口可能成为AI时代的卡脖子问题”,这正在成为行业共识。科技巨头对清洁能源的大规模投资和抢占,本质上是对新一轮工业革命核心资源的争夺。谁掌握了充足、廉价、绿色的电力资源,谁就将在人工智能时代的竞争中占据更有利的位置。需要举具体的案例。
四家拥有大模型业务的美国科技公司——微软、亚马逊、谷歌、Meta仍然坚持“大力出奇迹”的策略,即大规模算力投资。2024年,美国科技四巨头的资本支出均达到历史最高点,总额高达2431亿美元,同比增长63%。预计2025年,它们的资本支出总额将超过3200亿美元,总增速约为30%[5]。
巨额的资本支出,主要用于购买算力设备,建设数据中心,以支撑人工智能业务的快速发展。这些科技巨头们相信,更高的算力投入,能够带来更好的模型性能和更快的技术迭代速度。在商业竞争中,算力的质量代表的是速度问题,更高算力通常带来更好的效果。短期内节省算力固然重要,但从长远来看,算力需求只会螺旋上升,面向未来投资算力才是更重要的战略选择。英伟达2025年2月6日其股价单日涨幅超5%,市值重回3万亿美元,也回应了这个趋势,反映了市场对算力芯片(如GB200芯片)放量的预期。
这些科技巨头们之所以敢于如此大手笔地投入算力,一方面是因为它们“钱袋子”依然富余,净利润和现金流能够支撑高强度的算力投资;另一方面,巨额的算力投资也已经产生了实际回报,“云+AI”业务的收入和利润正在快速增长,这进一步刺激了它们加大算力投资的力度。谷歌、微软等巨头在2025年Q1财报中披露,AI业务资本开支同比增35%,表明算力扩张仍在持续,电力需求韧性显现。
除去科技公司,主权国家和地区也同步进入到算力的竞赛当中。欧盟委员会于2025年2月宣布的“Invest AI”计划,拟通过公共和私人资金调动总额2000亿欧元,核心目标是建设4座AI超级工厂,配备约10万颗最先进AI芯片(是目前欧洲在建工厂的4倍),专注于训练复杂AI模型。其中,200亿欧元专门用于设立欧洲基金支持这些工厂[6]。日本、沙特、印度等国家也纷纷将算力主权纳入国家战略。
中国路径:效率、可持续性与分布式协同
面对全球人工智能发展的新趋势,以及算力与能源的挑战,中国需要探索一条具有自身特色的发展路径。DeepSeekR1的技术突破,为我们提供了一个重要的启示:在人工智能发展中,效率和可持续性同样重要,甚至比单纯的算力堆砌更为关键。
中国在人工智能发展上,既要仰望星空,追求前沿技术的突破,也要脚踏实地,注重应用场景的落地。DeepSeek R1和V3的出现,代表了一种相对低算力、高表现的技术路线,这符合中国国情和发展阶段的实际需求。对于中国而言,在算力资源相对紧张的情况下,更应该注重效率优化,通过技术创新,提升单位算力的价值,降低对能源的消耗。
同时,中国也要清醒地认识到,优秀的硬件在人工智能发展过程中仍然不可替代。算法的优化固然重要,但更好的硬件意味着更低的训练时间和更高的效率。尤其是在人工智能前沿研究领域,例如AI for Science,仍然需要足够的算力进行支持。因此,中国在发展高效算法的同时,也要加强在算力基础设施领域的投入,构建自主可控的算力底座。
未来,人工智能领域的竞争,将是前沿技术创新和应用场景落地的双线竞争。既要“卷前沿”,在基础理论和核心技术上取得突破,也要“卷应用”,将人工智能技术广泛应用到各行各业,创造实际价值。有能力的企业,必然是“两手都要抓,两手都要硬”,既要布局前沿技术,也要深耕应用场景。
在能源战略上,中国应坚持效率优先、绿色发展的原则,在效率与可持续性之间寻找平衡。DeepSeek 的分布式算力架构,为我们提供了一个重要的方向:通过分布式革命,瓦解算力集中垄断的格局,构建更加灵活、高效、绿色的算力网络。
更进一步,算力分布式革命,应与分布式能源革命协同推进。通过将算力设施与分布式能源(如光伏、风电)相结合,构建“源-荷-储-算”协同的新型电力系统。分布式算力可以作为新型电力系统的“荷”,通过智能调度算法,与分布式能源的波动性出力相匹配,实现“电-算协同”,提升清洁能源的消纳能力,降低电力系统的风险。
分布式算力革命与分布式能源革命的协同发展,将倒逼电网进化,加速传统电网向智能电网转型。智能电网需要具备动态负荷优化分配、实时响应能力,以适应分布式能源和分布式算力的需求。这将推动电力系统从传统的“单向传输”模式,向“双向互动”、“源网荷储”协同优化的模式转变,构建更加清洁、高效、安全、可靠的现代能源体系。
结论:展望人工智能、算力与能源的未来
DeepSeek R1的出现,标志着人工智能技术发展进入了一个新的阶段。效率优化和成本控制,成为人工智能技术发展的重要驱动力。然而,技术进步并不能改变人工智能对算力和能源的巨大需求。杰文斯悖论提醒我们,效率提升并不必然导致资源消耗的减少,反而可能刺激需求增长,最终导致资源消耗总量增加。
面对人工智能发展带来的算力与能源挑战,全球科技界和能源界需要携手合作,共同探索可持续发展之路。一方面,要继续加强技术创新,提升算力效率,降低单位算力能耗;另一方面,要大力发展清洁能源,构建绿色算力基础设施,推动能源结构的转型升级。
在中国,我们应坚持效率优先、绿色发展的原则,探索具有中国特色的AI发展路径。通过技术创新、模式创新和政策引导,在效率与可持续性之间找到最佳平衡点,实现人工智能与经济社会、生态环境的和谐共生。算力分布式革命与分布式能源革命的协同推进,将为中国构建绿色、高效、智能的未来能源体系,赢得人工智能时代的竞争优势,提供强劲的动力。