【环球时报报道 记者 杨沙沙】“阿里巴巴正全力打造中国的‘AI(人工智能)工厂’。”香港《南华早报》日前报道称,在5月20日杭州举行的阿里云峰会上,阿里云资深副总裁刘伟光表示,阿里云正在进行全栈技术革新,从底层芯片、Agentic Cloud(智能体云)、模型到推理平台全面升级,以“建设中国最大的AI工厂”。
与此同时,从英伟达黄仁勋近年来的“工厂叙事”,到百度李彦宏提出的“日活智能体数”新标尺,再到德勤预测2028年美国将大规模运营“AI工厂”,一个“制造智能”的新时代正在到来。“AI工厂”究竟生产什么?从“Token(词元)工厂”到“AI工厂”,行业逻辑发生了怎样的变化?中国在这场“造厂”竞赛中进度如何,又面临哪些独特挑战?
“AI工厂”的底层逻辑
《南华早报》报道称,刘伟光将AI定义为一种全新的制造业形态,通过“训练与推理工厂”创造收入,并称阿里巴巴是国内唯一一家在“AI全栈五层架构”中均有布局的AI与云公司,这五层架构贯通了芯片、智能体云、AI模型、模型服务平台以及智能体应用。
实际上,早在2022年,黄仁勋就提到“AI工厂”概念,“AI数据中心处理海量且连续的数据以训练和完善AI模型,原始数据进来,经过提炼,然后智能输出——企业正在制造智能并运营大型‘AI工厂’”。
从那以后,黄仁勋对“AI工厂”进行层层递进的解释,逐渐用“工厂叙事”全面取代“芯片叙事”。英伟达在多领域的布局,也证明了黄仁勋所说的“英伟达已经从一家GPU(图形处理器)公司演变为‘AI工厂’公司”。英伟达的官方博客显示,2025年,黄仁勋公开表示:“AI现在已经是一种像互联网和电力一样的基础设施。我们今天建造的就是‘AI工厂’。”他进一步解释,“给AI工厂注入能量,就会生产出非常有价值的产品,这些产品就叫作Token(词元)。”
今年3月,黄仁勋再次发文,将AI产业形象比喻为“五层蛋糕”,自下而上依次由能源、芯片、基础设施、模型和应用构成。其中基础设施层包括土地、供电、冷却系统、建筑工程、网络通信,以及将成千上万处理器编排到一台机器的系统,这些系统就是“AI工厂”。他认为,芯片工厂、计算机组装厂和“AI工厂”正在以前所未有的规模建设,这正在成为人类历史上规模最大的基础设施建设。

长江商学院金融学助理教授梅丹青接受《环球时报》记者采访时,则从更细致的角度透视“AI工厂”的逻辑:最底层是电力、冷却、机房和网络;再往上是芯片和加速器;然后是云平台、推理引擎、调度系统和安全治理;再往上,是通用基础模型,以及围绕它搭建的行业适配、知识库和Agent(智能体)编排;最后是各种真实业务场景。梅丹青认为,英伟达的“AI工厂”,也是在强调它是用来规模化“制造智能”的基础设施,核心是把算力转化成可用、可计量、可收费的智能输出。
而在上述各种“AI工厂”概念中,瑞银证券中国互联网行业分析师熊玮一语道破中国发展“AI工厂”最明显的正在破解的瓶颈——算力。“在面对爆发式需求增长的时候,全球企业都说自己算力不够。中国的算力还面临一些高端芯片进口的限制。”熊玮告诉《环球时报》记者,在外界压力下,国产芯片近些年发展非常迅速,一些上游基建层的芯片正受益于中游模型提供厂巨大的投资,目前汇聚了很多产业链价值。
“芯片这个环节补上之后,我们全栈技术革新就是一个非常完美的故事线了。”刘伟光在发布会结束后接受多家媒体采访时表示,跟去年相比,今年提及阿里是“中国领先的AI全栈服务提供商”底气更足,原因是阿里当天发布基于新一代AI芯片真武M890的磐久AL128超节点服务器,主打解决Agent场景下的海量并发推理和大模型训练需求。
刘伟光形容说,每一款模型训练出来,背后都有强大的算力支撑。算力随着模型参数的变化,也在更快迭代,这两者绑在一起,就像齿轮互相咬合、不断螺旋上升。“未来如果每一块芯片都能跑出比竞争对手更多的Token、更高质量的Token,那我们就胜利了。”数据显示,阿里巴巴GPU芯片已经开始规模化量产,目前真武系列芯片已累计出货56万片,服务中国电信等400多家企业机构。
便宜货还是奢侈品?
“AI工厂”生产什么?中国电信集团首席科学家、美国贝尔实验室院士毕奇是这样解释的:以前的工厂生产的是物理世界的产品,有实体价值。随着信息技术发展,虚拟产品也被证实有巨大的经济价值,数据也能成为资产。
“AI工厂”的核心就是生产虚拟产品,与物理工厂一样,这里有两个关键内容:一是“设备”,也就是算力;另一个是“产品”及其计价方式。以前算力的度量是FLOPS,即每秒的浮点运算,其计价方式很难被大众接受。但大模型出现后,“Token”这个概念与流量十分相似,成为可以公认的、可以计费的算力价值单位。
“算力中心配合大模型,源源不断地生产出有经济价值的Token,就像工厂用机器生产产品一样。前者卖Token,后者卖商品。”毕奇接受《环球时报》记者采访时表示,“AI工厂”就是算力中心与大模型的结合体,它的产品就是Token,就像网络的产品是流量一样。
毕奇进一步解释说,不同的Token,价值天差地别。“这就像工厂生产的衣服,有几块钱一件的,也有几万块一件的名牌。价值高低取决于它用在什么领域、给什么行业解决什么问题、创造了多大的实际价值。”
5月13日,百度创始人李彦宏在百度AI开发者大会上,首次提出AI时代的“度量衡”——日活智能体数(DailyActive Agents,简称DAA)。他认为,“当人类进入智能体时代,衡量一个平台和生态的繁荣,更应该关注DAA这个指标,关注有多少Agents在给人类干活,并交付结果。这比无谓的Token消耗,更接近价值,也更接近本质。”
毕奇认为,“日活智能体数”是一种更高质量的“AI工厂”计价方式。“光有算力中心像缝纫机一样不停生产Token是较为原始的,关键是要生产出高质量、高附加值的‘衣服’,并按其在该行业的价值计价。”毕奇表示,Token用在哪个行业,经济价值多大,完全取决于大模型的质量和方向,以及它能为谁解决什么问题。“算力中心就像缝纫机,而大模型的设计和知识产权,以及提供价值的服务形式,才决定了衣服是便宜货还是奢侈品”。
“‘AI工厂’这个概念很容易被误解成‘算力崇拜’。好像谁有更多GPU、更多机房、更多电力,谁就赢了。”梅丹青认为,上半场的竞争可能看重上述因素,但真正的下半场是企业能否建立评估体系,引导AI产品往更好更高质量的方向发展,否则“AI工厂”很容易变成昂贵的Token生产机器。
中美是“AI工厂”领域两个主要玩家
德勤在今年3月发布的《德勤企业AI基础设施调查:2028年展望》报告称,2025年11月至12月,德勤调查了来自五个行业(消费,能源、资源与工业,金融服务,生命科学与医疗,科技、媒体与电信)、年收入超过5亿美元的515位美国企业领导者,结果显示,超过70%的受访者预计到2028年将大规模运营“AI工厂”。
“现在很多国家和地区都在讲‘AI工厂’,但背后的逻辑不太一样。”梅丹青告诉记者,美国更像是前沿模型和全球AI服务工厂;欧洲倾向于建设主权AI和公共创新基础设施,它的重点不完全是商业利润,而是希望欧洲企业和科研机构在AI时代不要完全依赖美国平台;中东更像是能源和资本驱动的算力枢纽;韩国、日本则侧重于发展产业AI和制造业升级平台。
综合来看,中美是“AI工厂”领域两个主要玩家。梅丹青认为,中国发展“AI工厂”,有三方面优势:第一,中国应用场景密度高,企业试错速度快,制造业、物流、电商、金融、政务、医疗等场景都不是简单聊天,而是大量重复决策、系统调用以及异常处理等等;第二,中国的工程化和成本控制能力很强,中企擅长把新技术快速产品化、低成本化、规模化,在低成本推理、工程优化、模型压缩、国产芯片适配上会有很强动力;第三,中国基础设施建设能力强,“AI工厂”的底层是基础设施项目,需要电力、土地、冷却、网络、机房建设和运维等,而中国在大型基建、能源调度和产业园区配套方面有丰富经验。
“中国的‘AI工厂’建设已经明显开始了。”梅丹青表示,阿里此次不是单独发布一个模型,或一块芯片,而是把模型、云基础设施、AI芯片和Agent服务平台放在一起讲。这说明中国头部云厂商已经意识到,未来AI竞争不是单点能力竞争,而是全栈能力竞争。
熊玮则分析称,中国模型厂能够提供的Token定价,远低于美国同行。虽然模型性能有一定差距,但性能的差距远小于定价差距,“中国模型的开发者们投入更多的研发资源和精力,策略更加重视,使得模型的推理效率更加极致,让中方的成本优势更明显。”
毕奇认为,目前大模型技术还在快速迭代阶段,未来可能会有多次“换道”,而在基础科学和颠覆性创新方面,美国目前占据主导地位。美国通过不断“换道”可能总能抢先占据制高点,中国必须紧紧跟上,否则有落后危险。
但毕奇也表示,中美之间在AI产业上实际是高度互补的,合作空间远大于竞争。美国尽管擅长“从0到1”的尖端科学创造,但如果找不到应用,技术就会“烂在锅里”。中国在大力攻坚“从0到1”原始创新的同时,同样重视“从1到100”的工程化应用和执行力。如果两国能合作,绝对会是“1+1>2”的结果。此外,目前舆论虽然渲染竞争,但两国国情可能最终仍会促成“有竞争,但合作大于竞争”的局面。