【全网独家:2万字深度解析Token产业链】Token产业链的“万亿长征”:从一粒词元到算力通胀时代的投资图谱
展开
首语:一粒尘埃的重量
2026年3月23日,中国发展高层论坛上,国家数据局局长刘烈宏将“Token”正式定名为“词元”,并将其定位为“智能时代的价值锚点”。彼时,绝大多数人不会想到——短短20天后,这个词会出现在国家政策文件里,成为“词元交易”的主角;更少有人想到,围绕这粒“数字尘埃”,竟能牵动4500亿元的基建投资、万亿级的资本市场,以及中美两个超级大国在AI赛道上的路径分化。
这粒“尘埃”有多轻?一个Token,不过是AI大模型处理文本、图像、视频的“最小计量单位”——一个汉字、一个英文单词碎片、一个像素块的信息量。轻到用户在使用豆包、Kimi时,根本不会意识到自己的每次提问正在被拆解成成千上万个这样的“数字粒子”。
这粒“尘埃”又有多重?2026年3月,中国日均词元调用量突破140万亿,两年增长超千倍。摩根大通的一组预测更令人心惊:2030年中国推理算力Token消费量将达3900千万亿,5年增长近400倍。以当下1个Token约0.001分人民币的市场均价粗算,仅中国的Token消耗就对应着千亿级的年产值——而这还只是调用成本,不包括背后芯片、智算中心、光模块、液冷等庞大生态的乘数效应。
轻轻一粒Token,足以搅动万亿江山。
我做分析师这些年,见过稀土涨价带飞整个板块的疯狂,也见过锂矿从天花板跌到地板只用了一年半。但“词元经济”不一样——它的需求端不是某个行业、某项政策,而是整个智能时代的基础单元。你可以不买电动车,可以不装光伏,但只要用AI、用智能助手、用自动驾驶,你就在消耗Token。这种渗透率,注定了它不会是昙花一现的主题炒作。
本专栏站在2026年5月初这个时间窗口,想和你一起把Token产业链这张图铺开,看它的筋骨、看它的血脉、也看清哪些地方藏着暗礁。我们从政策说起,再到产业、市场、技术,最后落在个股层面——不是泛泛而谈的概念罗列,而是尽量还原这条产业链真实的脉动。
一、词元的“成人礼”——从技术术语到国家战略
为什么是2026年?
Token这个概念并不新鲜。早在2017年Transformer架构诞生之初,它就是NLP模型的处理单元。可以说,从谷歌那篇划时代的论文《Attention Is All You Need》开始,Token就已经存在了。但当时它只活在深度学工程师的黑话里,外人不会关心“分词器”怎么把一句“今天天气真好”切成六个Token,也没人在乎一个中文词汇到底对应几个子词。
直到2023年ChatGPT引爆AI浪潮,Token才从开发者手册走向大众视野。那一年的关键词是“对话”和“惊艳”——大家关心的是模型能聊得多像人,而不是每个字消耗了多少Token。
让Token真正“成人”的,是2026年的三重催化。这三股力量几乎在同一时间窗内汇聚,把Token从一个技术术语推到了国家战略的高度。
第一重:政策定调——从“数据要素”到“词元交易”。
2026年3月23日,刘烈宏在中国发展高层论坛上将Token定名为“词元”,并赋予其“智能时代的价值锚点”和“连接技术供给与商业需求的结算单位”的双重定位。我反复琢磨过这份发言,觉得“价值锚点”四个字用得很重——它意味着Token不再只是API计费的技术参数,而是被官方正式确认为数字经济的基础度量。
更值得玩味的是紧接着的动作。4月15日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,首次在官方政策文件中提出“探索词元交易等新型交易模式”。从概念定名到政策写入,间隔仅23天。在我的政策研究经验里,这种“闪电速度”只出现在顶层战略强推的领域——上一个享受这种待遇的,大概是五年前的“数据要素”。
到了4月28日,工信部与国家数据局联合发布《关于联合实施2026年“模数共振”行动的通知》,明确以钢铁、石化、电力装备等二十余个行业为重点,推动“数据—模型—场景应用”良性互促循环。“词元”不再是空转的概念,而是找到了落地的锚点——钢铁厂的质量检测、石化设备的预测维护、电网的智能调度,这些实打实的工业场景都在成为Token消耗的沃土。
第二重:需求裂变——虫洞级的爆发速度。
如果你只看2025年各家的预测报告,很难相信2026年真实发生的数字。2024年初,中国日均Token调用量是1000亿;到2025年底,跃升到100万亿;而2026年3月,已经突破140万亿。两年,增长超千倍。
我打个比方。如果以每秒Token消耗来算,2024年初大约是每秒1157万Token——差不多等于每秒“说”一部短篇小说。到了2026年3月,这个数字变成了每秒约16.2亿Token——相当于每秒“说”一套大英百科全书。这不是什么渗透率提升、用户基数扩大的线性增长,这是需求形态本身发生了质变。
更惊人的加速度还在后面。2026年元旦至今,仅AI推理任务相关的Token调用量在短短三个月内暴增250%。推理是什么?就是用户每一次提问、每一次让AI写文案、画图、分析数据的动作。推理消耗Token不是“训练时的一次性大火”,而是“日常运营里的持续小火”——但架不住每天有上亿用户添柴。
第三重:商业模式确立——“按度计费”的回声。
对投资者来说,比需求爆发更重要的,是这种需求能不能变成可持续的现金流。2026年上半年,答案开始明朗。
腾讯云、阿里云、百度智能云集体上调AI相关服务价格,部分模型Token计费涨幅超过400%。这件事的意义不在于涨了多少,而在于“涨了”——涨价说明供给紧缺,涨价也说明下游愿意接受。这三家公司的客户覆盖了中国互联网的大半壁江山,它们的集体提价,等于宣告了一个事实:算力不再是按卡卖的“批发货”,而是按Token卖的零售商品。“水电化”的商业模式正在确立,这个行业从“项目制”的To B逻辑,切换到了“用量制”的运营逻辑。前者是脉冲式的,签一单吃半年;后者是流水式的,用户越多、用得越久,收入就越稳定。
“词元经济学”的三个层次
要理解Token经济的投资逻辑,不能只看表面热闹。我建议先建立三层认知框架,这个框架是跑通整篇文章分析逻辑的底层操作系统。
第一层:Token是“度量衡”。
过去我们评价一个AI公司好不好,标准很主观——技术牛不牛、团队强不强、融资多不多。现在有了Token调用量,一切变得可量化。哪家大模型用的人多、用得深,看Token数据一目了然。就像电商时代看GMV、移动互联网时代看DAU,AI时代最硬的活跃度指标就是Token量。AI产业从定性叙事进入了定量竞争的阶段,这是机构资金愿意入场的前提——他们可以建模了。
第二层:Token是“结算货币”。
百度智能云、火山引擎、腾讯云等主流平台均已按Token结算API服务。这意味着AI服务不再是企业IT采购中的“项目制预算”——今年批了500万就花500万,明年可能批600万也可能不批——而是变成了运营性的“流动支出”,像一个月的电费单,随用随付。这种商业模式的可持续性更强,且能更灵敏地反映需求的季节性和趋势性变化。对企业来说可以减少前期投入;对云厂商和模型厂商来说,只要有用户粘着,就能持续收钱。
第三层:Token是“价值链起点”。
从Token消耗出发,可以衍生出很多我们现在只是刚刚看到苗头的服务:数据集交易、模型授权、智能体托管、数据资产质押……国家数据局征求意见稿里勾勒的三个层次——数据流通、词元计价、资产化变现——不是一个概念闭环,而是一条正在铺开的真实链条。如果把数据比作石油,Token就是炼化之后的“成品油”,每一个下游应用都能再加工、再增值。
中美分岔:“算力军备”vs“能效内卷”
全球AI竞争格局正在发生一个很有意思的迁移,这个迁移直接决定了中美两个市场的投资逻辑差异。
美国的战略重心在“前沿突破”。英伟达Vera Rubin平台七颗芯片全部投产,制程从3nm走向1.6nm,参数从万亿级迈向十万亿级模型。这是一条“算力军备竞赛”路线,以峰值算力为绝对武器——谁能训练出最大的模型,谁就能在技术上定义下一代范式的标准。
中国走的则是另一条路,我更愿意称之为“能效内卷”。核心考核指标已从过去的“峰值算力”转向黄仁勋在GTC 2026大会上明确提出的两个新标尺:“每瓦Token吞吐量”和“每百万Token成本”。翻译成大白话:我不管你能跑多快,我就看花一度电、花一块钱,能吐出多少Token。
沐曦光启智能研究院院长李兆石最近洞察到一个很关键的“成本反直觉”。他的核心推断是:算卡成本越高,不一定意味着词元越贵;词元成本的决定性因素是吞吐效率而非硬件标价,软件优化和系统架构设计可以大幅改变竞争格局。这个逻辑在过去的硬件思维里是反常识的——我们都惯了“贵的就更好”,但在AI推理的世界里,贵一倍但吞吐量高两倍,单位成本反而更低。
两条路线没有绝对的对错。美国选择的是技术浪漫主义,中国选择的是工程实用主义。但结果已经摆在那里了:2026年5月初的一周(4月27日至5月3日),中国AI大模型周调用量达7.942万亿Token,按周增长81.7%;美国则为3.258万亿Token,环比下滑34.6%。全球调用量前六的模型全部来自中国,中国模型的Token价格仅为国外竞品的1/6至1/10。
这意味着什么?坦率地说,在AI的“普及之战”中,中国暂时抢占了主动权。美国的模型可能更聪明、参数更大,但中国模型更便宜、更好用、调用量更大。这是一场成本和规模的战争,而规模本身又能进一步压低成本——形成正向飞轮。
站在投资的角度,这个判断直接影响标的筛选方向。如果你买的是美国芯片股,盯住的是制程迭代、前沿突破;如果你买的是A股的Token产业链,盯住的应该是调用量增长、渗透率提升和单位成本优化。逻辑不同,不可混用。
二、算力通胀——一场产业链的“供给侧改革”
一张涨价的“多米诺骨牌”
2025年10月的时候,H100一年期GPU租赁合同价格还在每GPU每小时1.70美元的低位。当时市场上甚至有人担心“算力过剩”——毕竟2024年涌进来那么多智算中心,供给看上去很充足。但到了2026年3月,也就是不到半年时间,这个数字已经爬到了2.35美元,涨幅接近40%。折算成人民币,一台8卡H100服务器的月租金从大约5-6万元涨到了8-9万元,一年下来多出30多万的成本。如果你是模型创业公司,这30多万不是小数目。
GPU仅仅是第一块倒下的骨牌。内存合约价紧跟着跳涨,2026年第一季度同比暴涨了4到5倍,这个涨幅放在半导体历史上也属罕见;服务器厂商承受不住上游价格压力,大幅上调整机售价,部分运营商被迫推迟了部署计划。然后整个涨价链条传导到了最下游:腾讯云、阿里云、百度智能云相继宣布AI算力相关服务涨价,幅度从5%到400%以上不等。400%这个数字尤其值得留意——它不是大规模训练任务的涨价,而恰恰是推理Token计费的涨价,直接打在了终端消费者的调用成本上。
这一轮涨价跟往年任何一个半导体景气周期都不太一样。过去是什么情况?手机出货量多了,内存涨一涨;数据中心建设提速,服务器涨一涨。个别环节的供需失衡,补一补就缓过来了。但2026年的这一轮,是全链条的共振。
涨价逻辑非常清晰,是“需求倒逼式”的:AI智能体大规模落地——Token调用量像开了闸的水库——推理算力全线告急——GPU租赁价格应声上涨——内存、光模块、服务器全面跟涨——云厂商承受不住,把成本压力通过API提价传导出去——模型厂商算力成本飙升——要么提价、要么咬牙优化。这条传导链的每一环都足够紧张,而源头的Token需求仍在以每周两位数的速度攀升。
再往深挖一层,背后有三股更根本的驱动力在起作用。一是硬件成本在“逆向”暴涨。HBM高带宽存储与高端芯片全面进入卖方市场,采购成本攀升,交期拉长,运维人力也水涨船高。二是需求结构从“训练”转向了“推理”。训练是批量的,一波投下去之后用几个月来消化;推理是持续在线、频繁调用的。智能体场景对推理的消耗远超对话场景——这个我们后面还会展开讲。三是“有卡≠有可用算力”。服务器整机组装、高速网络互联、电力配套到位、数据中心土建上架,每一条路都堵着或多或少的瓶颈,系统性的交付能力约束把供给端的弹性压得死死的。
云厂商的“算力通胀”与模型厂商的“成本焦虑”
2026年4月,财联社出了一篇报道,标题非常直白——“Token热加剧算力荒,云厂商坐不住了”。我读完之后的最大感触是:这篇文章的标题精准得让人心疼。云厂商不是坐不住,是急得睡不着觉。
三大云厂商的资本开支已经进入不计成本的冲刺模式。阿里宣布未来三年投入超千亿元用于云和AI硬件基础设施建设。腾讯2025年资本支出792亿元,2026年明确表态AI投入金额至少翻倍。字节跳动2026年的资本支出计划约1600亿元,近一半砸向AI芯片和数据中心。这几个数字背后,是巨头们集体焦虑的真实投射——谁也不敢在这个窗口期掉队,因为一旦客户惯了对家平台的API,迁移成本会极高。
但我注意到,砸钱和真能砸出货来是两回事。一位算力行业的从业者向财联社记者私下交了实底:“我们现在每天都心惊肉跳,因为买不到货,现在大家手上都没东西租了。”这不是夸张。SemiAnalysis的数据更令人震惊:半数GPU供应商明确表示H系列“无货”。更糟的是,2026年8到9月之前所有即将上线的Blackwell系列产能,已经被预订一空。也就是说,你现在下定金,得等到暑假末甚至更晚才能拿到卡,而这中间的几个月的算力空白怎么填?
在这场“卖方市场”里,游戏规则被重写了。掌握稳定采购渠道和雄厚资金的公司可以迅速部署新算力、锁定长期合同,拿到极高的营收和利润能见度。它们甚至可以在拿到货之后转手倒租,赚取中间差价。而中小玩家在“有钱也拿不到卡”的残酷现实面前,议价能力被削弱到极点。行业整合的压力正在积聚——那些拿不到足够算力、又付不起上涨后价格的初创模型公司,可能会在未来一年里面临生存危机。
从“算力自由”到“算力平权”
算力租赁平台的崛起,是这场产业链重构中最让我兴奋的变量之一。它们的商业逻辑听起来简单:把智算中心动辄数千卡的大块算力切开,按小时、按卡分租给中小企业,降低它们进入AI赛道的第一道门槛。这正是“算力平权”的核心叙事。此前只有大厂烧得起GPU集群,创业公司想做模型微调都要东拼西凑找资源,现在你在算力租赁平台上花几千块就能租几个小时的H100集群,这对生态活跃度的提升是巨大的。
但平权有平权的代价。算力租赁行业的核心利润变量只有两个:利用率和调度效率。头部平台通过自研的多云调度技术,可以把GPU利用率做到70%到80%,这意味着每10块钱的算力成本中,有近8块钱是在产出的。而行业平均利用率只有40%到50%,也就是说一半的算力在闲着折旧。这个差距看似只是运营水平的差异,实则决定了生死。以并行科技为例,公司2026年一季度归母净利润同比增长223%,AI云服务与系统集成业务协同放量,企业类业务营收大幅增长至3.13亿元,同比增速168%。它的打法非常务实——把不卖超算云的老本行和新切入的AI算力租赁结合起来,用技术降本、用规模锁客。与之形成鲜明对比的是鸿博股份,这家曾经被视为算力租赁“明星”的公司,2026年一季度因“上年同期高基数及业务结构调整”导致业绩显著下滑,还特意发了澄清公告,说与MiniMax未开展合作。市值仅剩81亿元,与龙头之间的差距被迅速拉大。
国海证券在4月21日出了一份研报,判断AI推理拐点已至,算力租赁进入量价齐升的高景气周期,是当前AI产业链确定性较强的核心赛道。我基本同意这个判断,但补充一句:量价齐升是行业整体的故事,选对龙头才能把这个故事变成自己的收益。算力租赁行业已经过了“谁有卡谁就赢”的草莽阶段,进入拼运营效率、拼资金实力、拼客户粘性的精细运营期。
三、全球维度——OpenRouter排行榜背后的中国答案
榜首的背后:不只是便宜
2026年2月,中国AI大模型调用量在三周内大涨127%,首次超越美国。OpenRouter当时公布的Top5排行中,前三甲被中国模型包揽:MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5,再加上排名靠前的DeepSeek V3.2,四款中国模型合计贡献了Top5总调用量的85.7%。这个数字让我反复看了好几遍——不是60%、70%那种“领先一个身位”的量级,而是接近九成的绝对统治力。
到了5月初(4月27日至5月3日当周),中国模型的领先优势不仅没有收敛,反而进一步拉大。腾讯Hy3 preview(free)以3.03万亿Token的周调用量跃居全球榜首,同比增长799%,这个增速几乎可以拿去任何一个行业当“异常值”审;Kimi K2.6紧随其后排名第二,DeepSeek V4 Flash更是首次登上榜单,周调用量0.704万亿Token,周增长率344%。注意,DeepSeek V4 Flash上线的第一周就冲到这个体量,说明的产品化思路和开发者生态整合得非常利索。
“便宜”确实是中国模型最强的那把利器。据测算,当前中国国产词元定价约为海外的十分之一。能做到这个价格,靠的不是亏本卖吆喝——模型厂商没那么傻——而是软件优化的吞吐效率提升,加上差异化硬件选型策略。同样是推理,在昇腾上跑的国产模型,经过系统层优化后单位成本可以压得比国外方案低一个数量级。
但如果你认为中国模型霸榜仅仅是便宜,那低估了整个故事。便宜是表象,背后还有三个更深层的结构性因素在起作用。
第一,应用场景优势。中国拥有全球最完整的工业链和商业场景——电商有阿里、京东、拼多多,社交和内容有微信、抖音、快手,数字化基建的东西南北全面铺开。这些场景每天产生海量数据,为AI模型提供了天然的应用土壤。训练模型需要数据,打磨模型需要场景反馈,而中国市场的纵深和复杂度几乎没有其他国家可以复制。
第二,Agent竞争力的非线性跃迁。国金证券在5月的一篇研报里精准地点了一笔:DeepSeek V4、GLM-5等国内模型的Agent能力正在快速进阶。Agent跟对话不一样,它要持续推理、循环调用工具、维护任务状态,每一次交互都可能拆解成几十上百次子推理,Token消耗呈现几何级放大。当国内模型在Agent技术上追上来之后,堆出的算力需求比单纯做聊天机器人高出一个维度。
第三,中国模型正在从“流量”变成全球AI的“数字基础设施”。现在外国开发者用中国模型写代码、做内容生成、建智能客服,就像他们过去用AWS和Cloudflare一样自然。MiniMax的海外收入占比已经超过70%;智谱的API年化经常性收入突破2.5亿美元,2026年一季度Token调用量增长400%。这个收入结构告诉我一个事实:中国的AI模型已经不只是“出口产品”,而是在变成“出口服务”。一旦基础设施地位确立,切换成本非常高,用户粘性将构成天然的护城河。
“出海即赚钱”的商业模式
把这个问题展开聊聊,因为这可能是2026年最值得跟踪的AI商业模式之一。
中国模型出海正在跑通一种“全球流量变现”的新路径,模式比当年的工具出海、游戏出海更轻、更可持续。核心逻辑是:以高性价比吸引全球开发者和中小企业调用API——通过调用量持续变现——现金流反过来支撑更大的算力采购——规模采购压低单位成本——价格优势进一步巩固——吸引更多用户。这是一个漂亮的飞轮。不像工具出海那样需要做本地化运营团队,不像游戏出海要不断制造新爆款,API服务的边际成本极低,用户一旦接入就很难离开。
以Kimi为例,到2026年2月,的海外收入已经超过国内收入。月之暗面团队并没有在海外大规模建团队,Kimi的海外增长几乎全靠全球开发者社区的口碑传播。MiniMax更不用说,在OpenRouter上的周调用量一度高达3.07万亿Token,拿走了整个平台超过五分之一的份额。能做到这个体量,不可能只是路过的流量——开发者已经把的API嵌入了自己的产品逻辑,Token消耗是每天稳定产生的。
还有一个值得关注的产业动态:贵州数据宝近期推出了TopenRouter.com,全面对标OpenRouter,号称“每分钟500万Token、每小时3亿Token的峰值输出”。中国的词元交易平台从服务国内市场走向链接全球开发者,这个变化的方向意义大于短期数据。说明Token的交易和分发本身正在成为一个独立的生意。
中国模式的全球影响
中国模型的极致性价比不是一时的价格战,而是在真切地重塑全球AI产业的定价权。
英伟达CEO黄仁勋在GTC 2026大会上说过一句分量很重的判断:AI竞争的核心已从模型训练转向Token生产效率。我不是第一次听他发表类似观点,但2026年这版表述最直接。他给出的两个新衡量标尺——每瓦Token吞吐量和每百万Token成本——与李兆石的“成本反直觉”几乎可以互相印证。训练是“一次性大招”,几亿美元砸下去烧出一个模型;推理才是“持续现金流”,每天的调用就是每天的收入。谁能在推理效率上持续领先,谁就能吃下这波现金流的大头。
这对A股投资者的启示很简单:不要再死盯着“谁家的算力最高”,那已经是旧剧本了。新的主线是:谁的每Token成本最低、谁的调用量增速最快、谁的算力运营效率最高。过去,算力越强、模型越大等于竞争优势;现在,单位Token成本更低、能效更高的模式才是真正的护城河。
四、产业链全景——五大层级的“掘金地图”
下面花较大篇幅把Token产业链五层结构逐一拆开。每一层的竞争要素不同、景气节奏不同、个股质地悬殊很大。逐个梳理不是为了写行业百科全书,而是为了在后面提出个股意见时,能有一个扎扎实实的产业底座在垫着。
(一)芯片层(算力发动机):从“可用”到“好用”的质变
芯片是Token生产的物理原点——电能从这一头进去,Token从那头出来,中间经历无数次浮点运算。这个环节技术门槛最高、资本开支最重,但一旦跨过护城河,也最难被替代。Token产业链上的定价权有相当大一部分集中在这一层。
板块全景:为什么芯片层突然站在质变临界点?
国产AI芯片的故事已经讲了好几年,市场对“国产替代”这个词多少有些审美疲劳。投资者在问同一个问题:到底什么时候从“能用”变成“好用”?2026年4月24日,这个问题终于等来了一个历史性的回答。当天,DeepSeek全新大模型V4预览版上线,这次迭代跟以往任何版本都不太一样——V4脱离了英伟达 CUDA 生态,全面适配华为昇腾芯片,在昇腾上完成了训练与推理全链条的跑通。消息发布后,国产AI芯片板块应声拉升,海光信息午后一度猛涨超10%,寒武纪、摩尔线程齐齐跟涨。
到2026年4月底,已经有8家国产AI芯片品牌适配了DeepSeek V4:华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯。这8家几乎囊括了当前国产主力阵容,全栈适配的规模效应开始显现。中银国际随后给出一个有力的判断:国产大模型已基本跑通全栈国产化,形成从底层硬件到上层应用的完整技术链条,国产算力板块或迎来“质变临界点”。
这句话的分量需要体味。过去好几年,全球绝大部分前沿AI模型都跑在英伟达CUDA生态上,而且跑得很舒服——开发者惯了,调优工具统一,迁移成本极高。黄仁勋自己也公开说过,即使英伟达在峰值算力上被超越,真正的护城河在于整个软件生态体系。V4让大家看到了一种可能性:这道护城河,也许不是不可逾越的。当中国的头部模型原厂愿意在国产芯片上深度适配,就相当于完成了最难的一步生态冷启动。接下来,其他开发者跟进的成本会越来越低。
从投资角度看,国产芯片板块当前的核心驱动力有三条,缺一不可。一是需求爆炸:字节2026年国产算力采购份额预计超过400亿元,阿里1200亿中的国产占比也在持续提升,三大运营商在2026年均加大了国产算力采购力度。二是供给改善:2026年被认为是国产芯片规模化量产的关键之年,第一上海证券研报指出芯片设计公司与代工厂的合作在优化,制造端良率有望突破。三是应用场景恰好匹配——国产算力在推理场景的优势远大于训练,而2026年的行业重心恰好从训练转向推理,正是国产算力发挥特长的窗口期。
个股剖析:海光信息( 688041 )
海光信息是当前A股国产AI芯片板块中逻辑最通顺的标的之一。它的主营业务是高端处理器,覆盖通用计算(CPU)和AI加速计算(DCU)两条腿,产品已经在信创领域大规模出货。公司最核心的竞争力在于跟x86生态的兼容能力——它的CPU可以跑绝大多数现有的企业级应用,DCU则逐步向大模型推理场景渗透。这意味着海光不需要从零开始构建软件生态,可以借助已有的成熟生态做国产替代。2026年4月底,DeepSeek V4适配事件公布后,海光信息连续走强,显示市场对“国产芯片+大模型”这条链路的高度认可。公司的技术路线并非英伟达CUDA的直接翻版,而是采用了更具通用性的设计思路,在多场景适配上有天然的灵活性优势。从业绩端看,海光的DCU产品线在智算中心的渗透率正在快速提升,信创市场之外,商业客户的比例也在走高,这为后续增长打开了更大空间。需要留意的风险是:美国出口管制的任何升级都可能对先进制程代工形成瓶颈;同时公司当前估值已经反映了较为乐观的国产替代预期,一旦量产进度低于预期,回调压力会来得很快。
寒武纪( 688256 )
寒武纪是A股唯一一家纯粹的云端AI芯片公司,没有GPU的传统包袱,从第一天起就围绕AI计算架构做设计。这种“原教旨式”的专注让它在产品端形成了独特的竞争力。2026年一季度财报显示,预付账款和合同负债双双高增——这两项指标在半导体行业是判断需求景气度的先行信号,它们的跳升意味着下游客户正在抓紧下订单、付定金,生怕抢不到产能。寒武纪的思元系列芯片已被多家智算中心纳入标配,同时公司还在边缘侧布局低功耗芯片,形成云边协同的产品矩阵。跟海光不同的是,寒武纪更强调从芯片指令集到上层框架的全自研体系,这使得它在中长期具备更强的技术壁垒,但短期内的生态适配成本也更高。DeepSeek V4适配寒武纪,相当于帮它补上了最缺的应用生态背书。公司目前尚未实现盈利,这是机构分歧最大的地方——有观点认为它的亏损是成长代价,未来规模效应会自然收敛;也有声音担心研发投入持续高企会拖累现金流,需要密切关注后续几个季度的毛利率和经营现金流变化。
摩尔线程( 688795 )
摩尔线程是国产全功能GPU的标杆,也是少数在通用计算和图形渲染两个维度同时发力的国产GPU厂商。2026年完成A股上市后,公司有了更充裕的资金储备,产能扩张节奏明显加快。DeepSeek V4适配摩尔线程的消息,让市场重新审视这家公司的定位——它不只是做图形卡,而是有能力承载大模型推理和轻量训练的全能型选手。摩尔线程的核心优势在于生态兼容性:对OpenGL、Vulkan等图形API的支持,以及向CUDA兼容层的持续投入,让开发者迁移成本大幅降低。公司目前的产能规模和英伟达还有相当差距,但作为国产体系中的“通用GPU选项”,它的替代价值正随着算力通胀而逐步放大。风险点在于,GPU是一个烧钱极快的赛道,摩尔线程上市后能否在收入和研发之间找到平衡,需要长期跟踪。
地平线(9660.HK)
地平线专注的是另一个维度——端侧的Token生成。自动驾驶和智能座舱场景中,芯片要实时处理摄像头、雷达的多模态输入,并在毫秒级完成推理和决策。这个场景跟云端推理的需求很不一样:功耗要极低、延迟要极短、可靠性要极高。地平线在车载智能芯片领域是国内绝对的第一梯队,征程系列芯片累计出货量已达数百万片量级。2026年L3级自动驾驶加速落地后,单车的Token生成量将大幅攀升——每公里路程产生的视觉Token、点云Token、决策Token都在成倍增加。地平线作为车载计算方案的核心供应商,直接受益于这波智能化升级。需要提示的是,车载芯片市场竞争日趋激烈,英伟达Orin和高通Snapdragon Ride都在抢夺高端份额,地平线能否守住中高端市场并向上突破,是关键考验。
瑞芯微( 603893 )
瑞芯微是端侧SoC芯片的隐形冠军。AIoT设备——智能摄像头、智能音箱、工业视觉终端——几乎都用得到它的芯片。这些设备在日常运行中持续产生和处理Token,虽然单颗芯片算力不大,但胜在出货量极大,累积效应可观。瑞芯微的产品线覆盖从低功耗到高性能的多个层级,客户生态分散,不依赖单一大客户,业绩波动率较小。2026年端侧AI持续渗透,新的应用形态(如AI眼镜、AI耳机)进一步拓宽了公司产品的应用边界。对瑞芯微来说,最大的投资价值在于“稳”——不像云端芯片那样享受高估值弹性,但作为端侧Token生成的重要基础设施,它在产业链中的位置是确定的。
(二)智算中心层(算力工厂):4500亿的新基建盛宴
2026年,中国算力基建投资约4500亿元,智能算力占比升至58%,智算中心从过去几年的“超前的布局”变成了当下的核心投资主阵地。政府工作报告明确将超大规模智算集群、算电协同纳入新基建工程,这一层拿到了最高级别的政策背书。
智算中心是什么生意?它的商业模式本质就是把电力、土地、网络和芯片凑起来,建一座全天候运转的“Token工厂”。成千上万颗GPU装进机柜,配上供电、液冷散热、高速交换机互联,稳定产出算力,收入来自算力租赁或直接对外提供API服务。利润率关键看三个变量:用电成本、芯片采购成本、上架率。电费占运营成本的大头,所以很多智算中心选址在内蒙古、贵州这些电价便宜、气候凉爽的地方;芯片采购成本在算力通胀背景下被抬高,考验的是采购节奏和议价能力;上架率不够,一切归零,前期投入的折旧会压垮利润表。
参与者分三类。运营商——中国移动、中国电信、中国联通——手里有通信土地、电力指标和低成本资金,是国家级算力网络的核心承载平台。中国移动在哈尔滨的智算中心已经跑出了1.8万卡纯国产算力集群,电信和联通也在加速投建。互联网巨头——阿里云、腾讯云、华为云——以自有业务和云服务构建的巨量需求做底座,是最具规模效应的玩家。第三方IDC,如润泽科技、万国数据、秦淮数据、光环新网,核心价值在于给大客户提供“算力+电力+散热”的一站式托管方案。润泽科技是这一层最典型的Token经济受益者,它是字节跳动和智谱AI的核心IDC供应商,算力租赁相关收入占比已经超过60%。
智算中心层,投资逻辑相对清晰:运营商和头部IDC在景气周期中确定性最强,但弹性不如算力租赁和光模块;需要重点盯防的是电力成本上升——高功率集群密集上架后,电力消纳和储能配套将成为成本端的新变量,算电协同能力可能决定这一层未来的利润走向。
(三)算力租赁层(算力中介):最拥挤也最确定的黄金赛道
算力租赁被国海证券明确定义为“当前AI产业链确定性较强的核心赛道”,四个字概括:量价齐升。这几年来,真正能同时做到量升和价升的赛道少之又少,需要同时满足需求持续旺盛和短期供给刚性两个条件。算力租赁恰好踩中了这两个点。
这个行业正经历从“有卡就赢”的草莽阶段向“运营决胜负”的精细阶段的转变。头部玩家靠调度系统把GPU利用率做到70%-80%,中小平台停留在40%-50%。这个差距放在财务上,意味着同样一台8卡服务器,头部玩家一个月能多赚两三万。规模上去了,客户粘性(头部玩家一般签长协)锁住了收入,毛利率差距自然拉开。
个股剖析:并行科技(920493.BJ)
并行科技是北交所少有的AI算力纯正标的,前身主业是超算云服务,近年大力切入AI算力租赁赛道,业绩迎来爆发式增长。2026年一季度归母净利润同比暴增223%,企业类业务营收跳升至3.13亿元,同比增速168%。这个增速放在任何赛道都相当亮眼。并行科技的打法清晰:把超算时代积累的高性能计算调度技术复用到AI集群管理上,用技术手段将GPU集群利用率拉到行业领先水平,然后通过长期采购合同锁定芯片供货,避免现货市场的高溢价。自2023年11月以来,公司已累计采购AI/GPU算力服务器超25亿元,仅2026年前四个月就砸下约13亿元。百亿市值、百倍PE的估值不好说便宜,但算力租赁赛道的高景气给了它消化估值的窗口期。华源证券给予“买入”评级并给出目标价,主逻辑就是公司AI算力租赁业务将持续受益于推理需求爆发,采购节奏的提前锁定能力构成核心壁垒。风险方面,需警惕公司体量尚小、大客户集中度偏高的经营脆弱性。
鸿博股份( 002229 )
鸿博股份是A股算力租赁概念的先驱,曾因率先切入这个赛道获得极高关注度。然而2026年一季度业绩却出现明显回落,股价从高位大幅回调至16元附近,市值跌至81亿元。公司在互动平台多次澄清,与MiniMax等明星AI公司并无业务合作,部分市场此前给予的预期没有兑现。鸿博的案例对整个算力租赁板块都是一个深刻的风险警示:一个诱人的产业故事,如果缺乏实打实的订单和客户关系支撑,估值可能会在快速膨胀后迅速“挤水分”。算力租赁不是只要手里有几台GPU服务器就能躺赚的生意,客户渠道、资金实力、采购节奏、运营效率,每一项都有硬门槛。就目前来看,鸿博要重新赢回市场信心,需要在业绩端拿出实打实的订单增长证明自己。
(四)模型应用层(算力消费):赢者通吃,但路径各有不同
模型应用层是整个产业链的“消费端”。一切芯片、智算中心、算力租赁的投入,最终都要靠用户的实际使用量来变现;这一层想象空间最大,但确定性的分布极不均匀,未来几乎一定会是少数赢家吃掉大半利润。
竞争格局已经初步定型,但各家走的路子差异很大。字节(豆包)是C端吞吐机,日活超1.5亿,日均Token消耗量稳坐国内头把交椅。豆包每多一个日活用户,每天就多出数以百万计的Token增量,头部效应在C端放大得非常极致。智谱AI是B端API龙头,政企订单爆发式增长,API年化经常性收入突破2.5亿美元,三度提价仍供不应求,B端的壁垒比想象中深得多——政企客户一旦把模型嵌入业务流程,更换成本很高。MiniMax是出海之王,海外收入占比超70%,走的是借OpenRouter等全球分发平台获取长尾开发者的路线,轻型而高效。DeepSeek走极致性价比路线,算法创新做到推理成本降至行业十分之一以下,V4系列首发即爆量,344%的周增长证明了低价也能跑出高效率。
个股剖析:科大讯飞( 002230 )
科大讯飞是模型应用层中少有的“B端场景深耕型”玩家,不卷通用对话、不走全球流量分发,而是扎在政企、教育、医疗这三个壁垒极高的垂直领域。星火大模型日均处理Token超3万亿,AI开放平台年收入达135亿元,两个数字放在一起看,就知道它的商业化已不是概念阶段。教育领域,讯飞的智慧课堂已覆盖数万所学校,日常使用的批改、评分、个性化推荐功能持续产生Token消耗;医疗领域,辅助诊疗、语音病历在国内医院渗透率不断提升;政务领域,智能客服和文档处理需求在“模数共振”行动推动下加速释放。这三个场景的共同点是:专业性强、监管门槛高、对准确性要求苛刻,模型一旦通过验收并嵌入工作流,替换成本极高,这构筑了科大讯飞的场景壁垒。风险在于,互联网大厂正在向下渗透To B场景,讯飞在某些边缘场景可能面临价格战压力,需要持续保持技术和服务的领先优势。
昆仑万维( 300418 )
昆仑万维在“天工”大模型上找到了独特的出海路径,海外收入占比超过70%。2025年API收入达32亿元,同比增长210%,这个基数对于一个最初以游戏和工具出海为主业的公司来说,转型力度和节奏都相当积极。天工大模型的差异化卖点在于多语言能力和对新兴市场的适配——不是去跟GPT在英语市场硬碰硬,而是在中东、东南亚、拉美等地区获取了大量开发者和企业用户。昆仑万维也通过自身原有的海外流量生态为天工导流,降低了获客成本。“出海即赚钱”的飞轮效应在昆仑身上体现得比较充分。风险方面,海外市场竞争正快速升温,当地本土化模型也在成长,昆仑要想守住出海先发优势,需要保持技术迭代和本地化服务的强度。
拓尔思( 300229 )
拓尔思是大数据与人工智能交叉领域的老牌公司,主阵地是政务和金融垂直场景的自然语言处理。在政务领域,政府公文自动撰写、政策智能解读、舆情分析对语义推理的要求极高,拓尔思有多年积累的知识图谱和行业语料库做护城河。金融领域,合规审查、智能投研、合同分析等场景同样需要高精度的NLP能力。公司近年将语义推理能力和Token计费服务结合起来,形成了从模型、数据到计费工具的闭环产品,这使它在某些特定领域的粘性甚至超过通用大厂。拓尔思市值偏小、成交量不高,属于细分赛道的“隐形冠军”型标的,弹性可能偏弱,但胜在业务稳定性强。要关注的是大模型技术迭代速度远超传统NLP时期,拓尔思能否持续跟上前沿节奏、避免技术过时,是关键挑战。
(五)配套基础设施层(算力支撑):光模块与液冷的分化时刻
配套基础设施是“卖铲子中的铲子”生意。不管大模型这一仗最后谁能活下来,把GPU插在机柜里、连成集群、通上电、散好热,就必须用到光模块、液冷、交换机、光纤和储能设备。这个逻辑决定了配套层在所有产业链分层中拥有最高的确定性。
但2026年的新变化是,确定性最高的赛道也开始出现剧烈的内部分化。过去只要沾上“光模块”三个字就能涨,现在市场在挑肥拣瘦。
光模块:史上最强一季报与“预期差”的冲击
2026年一季度,中际旭创单季营收194.96亿元,同比暴增192.12%;归母净利润57.35亿元,同比增长262.28%。新易盛营收83.38亿元,同比增长106%。三家头部光模块公司(“易中天”)一季度合计营收接近292亿元,总市值一度突破1.89万亿元,超越贵州茅台——这在A股科技股的漫长历史上都极为罕见,显示市场把光模块的景气度打到了极致乐观。
但一季报发布后,板块迅速分化。新易盛因净利润环比下滑13%低于预期,股价一天跌掉11%,市值蒸发约700亿元。天孚通信连续两个季度毛利下行,股价在5个交易日内累计回调超17%。唯有中际旭创凭借最强劲的超预期幅度守住了阵脚。市场的反应毫不留情,它揭示了一个深层逻辑:当市值已经膨胀到能对标茅台的水平时,任何边际放缓都会被市场成倍放大解读。在光模块这个一年前还被认为“最确定”的赛道上,投资者必须开始区分交易“故事”的人和交易“业绩”的人。
个股剖析:中际旭创( 300308 )
中际旭创是光模块板块里确定性最强的锚。800G光模块已成为AIDC内部高速互联的标配,1.6T产品也在加速导入,公司手握北美和中国头部云厂商的长期订单,订单能见度已经排到2027年。一季度192%的营收增速、262%的净利增速,放在哪里都是顶级成绩。公司的核心壁垒在于:与下游大客户深度绑定的联合研发能力,快速的产能爬坡节奏,以及在高端光模块封装工艺上的积累。这三点叠加,让中际在每一次光模块代际升级时都能率先抢占窗口期。市值一度突破万亿,显示市场将其视为AI浪潮中的核心基础资产。估值问题无法回避——即便以2026年预测业绩看,当前PE也处于历史极高区间,这要求公司的业绩增速必须持续兑现预期,容错空间极小。一旦海外云厂商资本开支出现放缓信号,股价波动在所难免。
新易盛( 300502 )
新易盛同样是数据中心高速光模块的核心供应商,800G产品出货量紧追中际旭创,客户结构更偏多元化——既有北美云厂商,也有国内头部互联网公司。一季度106%的营收增速依然亮眼,但环比净利润下滑13%这一点触动了市场高度敏感的神经。光模块行业每一代产品迭代时,毛利率会呈现前高后低的周期性特征——新产品刚推出时溢价最高,等供给上来、竞争加剧后毛利自然回落。新易盛面临的正是这个周期力量,市场担心它的高毛利阶段在2026年上半年已见顶。公司需要在下半年用业绩证明,量的增长可以覆盖价的压力。好消息是,全球AIDC建设远未见顶,光模块总盘子还在快速扩张;坏消息是,当行业竞争烈度提升,二线龙头的议价能力会最先受考验。
液冷:爆发中的行业分化
2026年液冷行业进入系统性放量期,行业总规模有望达到700亿至1050亿元,AI服务器液冷渗透率突破50%,新建智算中心几乎实现100%液冷标配。以前的问题是“用不用液冷”,现在变成了“谁能按期交付、谁能保质放量”。
但在一季度报告中,行业出现了剧烈的质变信号。龙头英维克一季度营收增长了26%,但净利润暴跌82%,扣非净利暴跌87%,经营现金流也大幅恶化。我反复看过它的一季报,净利暴跌的主因是高额研发投入和营销费用前置,这代表它在主动抢市场份额,但从投资角度看,现金流恶化在景气上行期足以让市场警醒。反观佳力图,凭借全栈液冷技术能力和相对稳健的资金面,在一季度板块中表现相对从容,拿下了多家智算中心的订单。
个股剖析:佳力图( 603912 )
佳力图是液冷温控赛道中辨识度较高的二线龙头,核心卖点是“全栈液冷”——从冷板式到浸没式均有产品覆盖,技术路线多元,能根据客户机柜功率密度和机房条件提供定制化方案。2026年液冷行业订单爆发,佳力图连续获得多个智算中心项目,在手订单充足。相比于英维克,佳力图市值更小、估值倍数更低,在业绩兑现期反而获得了更高弹性。一季度相对稳健的财务表现也让它在英维克“暴雷”后获得了一波资金切换的支撑。风险在于,液冷行业技术路线仍在演进,冷板和浸没谁能成为长期主流存有变数;此外,佳力图体量较小,面对大型IDC客户时的议价能力有待加强,毛利率能否在规模扩张中保持稳定值得跟踪。
储能与光纤:算力背后的“隐形英雄”
宁德时代( 300750 )在Token产业链中的位置常常被低估。智算中心是高载能体,一座万卡集群的功率动辄几十兆瓦,必须配建储能系统来保障稳定供电、削峰填谷、参与电网调度。“算电协同”概念之下,宁德时代的储能电池系统成为智算中心的刚需部件。宁德在储能领域的全球市占率超40%,规模效应带来的成本优势无人能及,同时电池技术向高安全、长循环方向演进,契合智算中心对供电可靠性近乎苛刻的要求。对投资者来说,把宁德纳入Token产业链组合,更多是作为“底仓型”配置——它不光有AI算力这层新增量,本身新能源的基本盘也足够厚实。
亨通光电( 600487 )则是算力网络底层传输的“光纤护航者”。智算中心之间、智算中心与用户之间的海量数据交互,依赖高带宽、低时延的光纤网络。“东数西算”工程要求算力枢纽间的网络时延控制在数毫秒之内,这对光纤光缆的质量和传输性能提出了新标准。亨通光电作为光纤光缆头部厂商,持续受益于全国算力网的建设。光纤的周期性属性确实不可否认,但在算力基建长周期向上的背景下,其需求韧性比以往要强不少。
(六)跨层布局的全栈玩家
有些巨头不屑于只占一层,它们从芯片一路吃到应用,构建全栈能力。华为是最突出的全栈式Token工厂总包商——昇腾芯片、华为云、各地智算中心、盘古大模型,从物理算力到模型服务全线贯通,是国产算力自主可控的核心中军。阿里巴巴拥有平头哥芯片、阿里云、PAI平台和通义千问,以电商和商业服务为落地场景,形成了从芯片到应用的完整闭环。腾讯手握紫霄/沧海自研芯片、腾讯云和混元大模型,社交、游戏两大自有流量池带来的Token消耗规模极大,是隐性消耗王者。字节跳动目前主要布局AIDC、算力租赁和模型层,以火山引擎和豆包为核心,在C端占据领先地位,并不急于全栈,但每一层都做得够深。
五、市场维度——题材联动、量价与技术的三重共振
到了5月初,回头复盘4月的行情,几个关键词值得标注。
催化剂密集轰炸的四月
2026年A股的算力行情呈现出“催化剂密集轰炸”的特征,每次大事件都对算力板块带来一波脉冲式拉升。
4月24日DeepSeek V4发布是春季行情的最大催化剂。V4脱离CUDA、全面适配华为昇腾,消息一出,海光信息一度涨超10%,寒武纪和摩尔线程跟涨,带动整个国产芯片板块放量。这个事件的意义在于,它把“国产算力”从一个可以反复炒但缺乏实质验证的老题材,变成了有真凭实据支撑的新投资逻辑——市场看到了生态在形成,而不只是政策在鼓励。
OpenRouter每周发布的全球调用量排名,已经成为A股算力板块的高频情绪指标。每次数据一发,如果中国模型排名靠前,算力概念股就有动作。5月初的一周数据显示,腾讯Hy3 Preview(free)跃居全球第一,DeepSeek V4 Flash周增长344%首次上榜,这些数字在5月5日当天成为交易群里的高频讨论。这就是AI时代的“题材联动”新范式——不是看静态文件的落地,而是追每周更新的全球竞争排行,信息传播效率极高。
政策端的催化密度同样惊人,从3月“词元”定名,到4月“词元交易”入政策、“模数共振”行动发布,政策消息几乎以每周一条的频率涌出,不断强化市场对Token经济的中长期信心。云厂商在2026年上半年的集体涨价公告,也直接利好了整个算力链,东方财富证券的点评很到位——“词元经济崛起+云涨价”,这两个力量叠加,增强了算力景气度的可持续性叙事。
万亿成交背后的结构性分化
4月最后一周,A股周成交额中枢维持在2.60万亿以上,交投极其活跃。新易盛4月24日单日成交额突破500亿,创下A股科技股历史纪录。这么大的量发生在业绩公布后大幅下跌的交易日里,说明多空分歧极其剧烈——有人在恐慌出逃,也有人在逆势低吸。
板块层面,科创50在当周跑赢创业板指,显示出国产算力正在接棒此前以英伟达生态为核心的海外算力链。4月30日,国证半导体芯片指数强势拉涨4.35%,寒武纪上涨17.28%,海光信息上涨5.84%,半导体板块整体放量——这印证了资金的迁徙方向:从“易中天”的光模块叙事,部分转移到“国产替代”的芯片叙事上。
市值特征方面,“易中天”三巨头合计市值从1月的约1.63万亿飙涨至4月底的约2.34万亿,4个月净增约7092亿。这个膨胀速度已经类似于新能源最狂热时期的估值扩张。当市值进入万亿俱乐部后,市场对边际变化的容忍度急剧收窄——新易盛一天蒸发700亿就是例证。
技术面信号
以国证半导体芯片指数为参照,截至4月30日收于15254点,当日涨幅5.35%。自2月低点以来已累计上涨超50%,周线级别MACD保持在多头区域,中长期趋势尚属健康。但短期RSI接近70,显示超买压力在累积,回调蓄力并不意外。
CPO概念板块总市值已飙升至约3万亿,新易盛、中际旭创自2023年以来累计涨幅均超40倍。新易盛在4月24日放量暴跌后已失守20日均线,短期技术上偏弱;中际旭创相对坚挺,仍在20日线上方运行。算力租赁板块整体估值偏高,鸿博股份PE超100倍,并行科技2026-2028年预测PE分别约223、128、80倍——这意味着市场已经把极高的增长预期焊在了估值里,一旦业绩没跟上,修正幅度会很剧烈。
液冷板块走势呈典型的“事件驱动”特征,每逢大厂液冷订单的行业消息传出,佳力图、英维克就快速拉升。但英维克一季报“暴雷”后,板块整体承压,后续要等待新的订单催化才能重启升势。
六、投资策略——站在“算力黄金年代”的十字路口
特别声明: 以下策略属投研框架分析,非直接推荐。市场变化不可预测,投资者应关注市场数据的最新变化,独立自主决策,并承担投资盈亏。
五层产业链的投资价值排序
综合景气度、确定性和估值安全边际三个维度,我给Token产业链五个层级排个序。
第一梯队:配套基础设施层。 受益逻辑最直接——不管哪家模型赢,基础设施先收钱。光模块订单排到2027年,业绩确定性首屈一指,但估值高企,任何边际放缓信号都会被放大。中际旭创在“易中天”中竞争优势最强,一季报超预期程度最大,订单壁垒最深。液冷赛道方向确立,但个股甄别很重要——英维克一季报的教训犹在,佳力图等二线龙头在细分市场中有较高性价比。交换机、储能、光纤在组合中适合作为底仓配置,弹性偏小但稳定性好。
第二梯队:算力租赁层。 AI推理拐点已至,量价齐升逻辑顺畅。并行科技受益于技术优势和采购前瞻性,阿里云和火山引擎则有大厂生态加持。这个行业的危险在于竞争加剧和中尾部产能出清——鸿博股份的一季报就是一个活生生的警示牌。
第三梯队:芯片层。 国产芯片正从可用走向好用,DeepSeek V4的生态适配标志了一个质变临界点。海光信息、寒武纪、摩尔线程均受益于国产替代和算力需求双重驱动。但当前估值已不低,美国出口管制是永远绕不开的达摩克利斯之剑,更宜等待回调分批介入。
第四梯队:模型应用层。 弹性最大,不确定性也最大。C端赢者通吃效应最强,字节(豆包)的霸主地位短期难撼;B端和出海的智谱、MiniMax、DeepSeek各具特色。散户更适合用ETF做赛道配置,而非重仓押注单一个股。
第五梯队:智算中心层。 运营商和头部IDC属于基础设施型资产,政策背书最强、现金流最稳,弹性相对有限,适合稳健型资金做底仓配置。
五组下半年必须紧盯的核心矛盾
第一,国产芯片量产进度与良率。 2026年被寄予国产算力量产元年的厚望。良率能不能达标、产能能不能匹配订单,直接决定海光信息、寒武纪这些标的的估值中枢能否进一步上移。每个季度的财报预付和存货数据,就是跟踪的最核心先行指标。
第二,云厂商资本开支的节奏。 2026年上半年BAT和字节都在以千亿量级狂砸算力采购,这种力度下半年能不能维持,决定了整条产业链的景气天花板。重点紧盯阿里、腾讯、字节的季度财报电话会指引,任何措辞变化都会被市场放大。
第三,美股科技股的外溢效应。 美国MAG云厂商2026年 CAPE X指引接近翻倍,这个趋势能否持续,会通过光模块订单直接冲击A股。关注英伟达财报和美国科技股整体走势,光模块板块一向对美股映射极其敏感。
第四,出口管制与地缘政治。 中美科技博弈是长期变量。2026年下半年美国会不会进一步升级对华芯片出口限制?如果升级,国产替代逻辑会阶段性强化;但如果连推理芯片都被收紧,那整个产业链的运转可能受阻。
第五,估值风险的临界点。 “易中天”合计市值一度超越茅台,算力租赁PE普遍超百倍——市场定价已经极度乐观。国海证券也明确提示了风险:如果AI需求增速不及预期、云厂商资本开支放缓、或者H100供给释放快于预期,算力租赁价格可能回落。一旦某个环节出现“预期差”,高估值板块的连锁回调可能比想象中来得更快更猛。
组合配置思路
进攻型组合(高弹性,适宜风险偏好较高的活跃投资者): 国产芯片(海光信息、寒武纪)作为主线先锋,算力租赁(并行科技)吃量价齐升,光模块(中际旭创)锚定确定性,液冷(佳力图)补弹性。逻辑是把赛道领军者和细分黑马搭配起来,在高景气中博取超额收益。
稳健型组合(看重基本面确定性,适宜中长期价值投资者): 光模块(中际旭创)做底仓压阵,液冷(佳力图)挑质地更稳健的二线,智算中心/IDC(润泽科技)拿长线逻辑,交换机(紫光股份)、储能(宁德时代、阳光电源)、光纤(亨通光电)补充配置。这个组合抓的是“卖水人”的确定性,无论哪家模型胜出都要用到这些基座组件。
主题型组合(政策驱动,适合中长期事件研究型投资者): 以国产算力全栈为主线,关注华为昇腾概念、DeepSeek生态、字节AI产业链、智算中心新基建。事件驱动逻辑较强,需要对政策动态和行业新闻保持高度敏感,根据节奏灵活调整。
六、投资策略——站在“算力黄金年代”的十字路口
特别声明: 以下策略属投研框架分析,非直接推荐。市场变化不可预测,投资者应关注市场数据的最新变化,独立自主决策,并承担投资盈亏。
组合配置的实战思考
把上述五层分析和个股剖析串起来,在实际组合构建上,可以围绕三个差异化思路来展开。
进攻型配置。 以国产芯片为核心矛头(海光信息、寒武纪各配一定权重),算力租赁(并行科技)捕捉量价齐升弹性,光模块(中际旭创)作为确定性锚,液冷(佳力图)补充细分弹性。这个组合的总波动会比较大,芯片和算力租赁的估值已经包含了较高增长预期,一旦业绩兑现顺利,潜在收益空间也相应更高——但同样,一旦市场风险偏好收缩,这些品种的跌幅也不会轻。
稳健型配置。 把重心放在配套基础设施层,以中际旭创做大底仓,液冷端选佳力图等二线龙头降低个股黑天鹅风险,再搭配润泽科技吃智算中心IDC的长期逻辑,紫光股份分享交换机需求扩张,宁德时代和阳光电源覆盖算电协同的储能刚需,亨通光电补充光纤底仓。这组配置的目标不是博短期超额收益,而是追求在AI算力景气长周期中的稳定复利回报。
主题型配置。 适合对行业政策和技术进展有长期跟踪惯的投资者,核心抓的是阶段性题材爆发力。比如围绕国产算力全栈做文章——华为昇腾生态、DeepSeek适配链、字节系算力采购链——每一个主题催化都可能带来一波脉冲式拉升。关键在于催化剂识别和节奏把握,先于市场发现政策或技术节点,一旦事件兑现要及时评估是否了结。
不追热点,守逻辑
最后我想说一点自己的体会。2026年的算力行情,跟过去几年的新能源行情有一个共同的迷人之处——需求故事足够宏大,天花板足够高,产业链足够长,市场可以反复从中挖掘新的细分机会。但也正因为如此,它容易引诱投资者频繁追逐短期热点,在涨声中追高,在回调中割肉,来回损耗。
我自己在跟踪Token产业链的过程中,始终反复提醒自己的一个原则是:守逻辑,不追热点。 热点每天都在变——今天是DeepSeek适配,明天是OpenRouter排行,后天是云厂商提价——但核心逻辑不变:Token调用量还在指数级增长,算力依然是AI时代的稀缺资源,国产替代正在从预期走向现实。只要这三个底层逻辑没有松动,整条产业链的长期投资价值就还在。短期的估值波动、情绪起伏,都是这个长期逻辑之下的噪音。
对普通投资者而言,也许最好的策略不是试图踩准每一个题材轮动的节奏,而是在充分理解这条产业链之后,选择自己最认可的层级和最认可的标的,分批建仓,耐心持有。Token经济的故事不是月线级别的,而是年级别的。在这样一个量级的产业浪潮面前,有时候,慢就是快。
结语:长坡,厚雪,少踩坑
Token经济的画卷才刚刚展开。AI应用渗透率的提升远没有到头,Token消耗量的指数级增长短时间内不会停下。这是一条足够长的坡,雪也够厚。
但它同样暗藏沟壑。高估值、高预期、高敏感度的三重叠加,意味着任何边际变化都可能在短期触发剧烈波动。作为分析师,我们的本分是尽量客观地描摹产业面貌,厘清各层级的投资逻辑,坦诚指出每一个不能忽视的风险点。
如果这篇两万字的行业分析,能在你2026年的投资路上提供些许方向感,那便不枉了我连日梳理数据的功夫。祝投资顺利,看清方向,稳健前行。
---
【风险提示与免责声明】
本文全部内容为投研框架分析,不构成任何形式的投资建议或推荐。文中所有提及的上市公司及证券产品,仅作为行业研究的举例说明。Token产业链及相关行业虽处于高景气阶段,但个股估值已处于历史较高分位水平,下行风险同样显著。市场变化不可预测,投资者应关注最新数据变化,独立自主进行投资决策,并自行承担全部投资风险和盈亏。股市有风险,入市须谨慎。
2026年3月23日,中国发展高层论坛上,国家数据局局长刘烈宏将“Token”正式定名为“词元”,并将其定位为“智能时代的价值锚点”。彼时,绝大多数人不会想到——短短20天后,这个词会出现在国家政策文件里,成为“词元交易”的主角;更少有人想到,围绕这粒“数字尘埃”,竟能牵动4500亿元的基建投资、万亿级的资本市场,以及中美两个超级大国在AI赛道上的路径分化。
这粒“尘埃”有多轻?一个Token,不过是AI大模型处理文本、图像、视频的“最小计量单位”——一个汉字、一个英文单词碎片、一个像素块的信息量。轻到用户在使用豆包、Kimi时,根本不会意识到自己的每次提问正在被拆解成成千上万个这样的“数字粒子”。
这粒“尘埃”又有多重?2026年3月,中国日均词元调用量突破140万亿,两年增长超千倍。摩根大通的一组预测更令人心惊:2030年中国推理算力Token消费量将达3900千万亿,5年增长近400倍。以当下1个Token约0.001分人民币的市场均价粗算,仅中国的Token消耗就对应着千亿级的年产值——而这还只是调用成本,不包括背后芯片、智算中心、光模块、液冷等庞大生态的乘数效应。
轻轻一粒Token,足以搅动万亿江山。
我做分析师这些年,见过稀土涨价带飞整个板块的疯狂,也见过锂矿从天花板跌到地板只用了一年半。但“词元经济”不一样——它的需求端不是某个行业、某项政策,而是整个智能时代的基础单元。你可以不买电动车,可以不装光伏,但只要用AI、用智能助手、用自动驾驶,你就在消耗Token。这种渗透率,注定了它不会是昙花一现的主题炒作。
本专栏站在2026年5月初这个时间窗口,想和你一起把Token产业链这张图铺开,看它的筋骨、看它的血脉、也看清哪些地方藏着暗礁。我们从政策说起,再到产业、市场、技术,最后落在个股层面——不是泛泛而谈的概念罗列,而是尽量还原这条产业链真实的脉动。
一、词元的“成人礼”——从技术术语到国家战略
为什么是2026年?
Token这个概念并不新鲜。早在2017年Transformer架构诞生之初,它就是NLP模型的处理单元。可以说,从谷歌那篇划时代的论文《Attention Is All You Need》开始,Token就已经存在了。但当时它只活在深度学工程师的黑话里,外人不会关心“分词器”怎么把一句“今天天气真好”切成六个Token,也没人在乎一个中文词汇到底对应几个子词。
直到2023年ChatGPT引爆AI浪潮,Token才从开发者手册走向大众视野。那一年的关键词是“对话”和“惊艳”——大家关心的是模型能聊得多像人,而不是每个字消耗了多少Token。
让Token真正“成人”的,是2026年的三重催化。这三股力量几乎在同一时间窗内汇聚,把Token从一个技术术语推到了国家战略的高度。
第一重:政策定调——从“数据要素”到“词元交易”。
2026年3月23日,刘烈宏在中国发展高层论坛上将Token定名为“词元”,并赋予其“智能时代的价值锚点”和“连接技术供给与商业需求的结算单位”的双重定位。我反复琢磨过这份发言,觉得“价值锚点”四个字用得很重——它意味着Token不再只是API计费的技术参数,而是被官方正式确认为数字经济的基础度量。
更值得玩味的是紧接着的动作。4月15日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,首次在官方政策文件中提出“探索词元交易等新型交易模式”。从概念定名到政策写入,间隔仅23天。在我的政策研究经验里,这种“闪电速度”只出现在顶层战略强推的领域——上一个享受这种待遇的,大概是五年前的“数据要素”。
到了4月28日,工信部与国家数据局联合发布《关于联合实施2026年“模数共振”行动的通知》,明确以钢铁、石化、电力装备等二十余个行业为重点,推动“数据—模型—场景应用”良性互促循环。“词元”不再是空转的概念,而是找到了落地的锚点——钢铁厂的质量检测、石化设备的预测维护、电网的智能调度,这些实打实的工业场景都在成为Token消耗的沃土。
第二重:需求裂变——虫洞级的爆发速度。
如果你只看2025年各家的预测报告,很难相信2026年真实发生的数字。2024年初,中国日均Token调用量是1000亿;到2025年底,跃升到100万亿;而2026年3月,已经突破140万亿。两年,增长超千倍。
我打个比方。如果以每秒Token消耗来算,2024年初大约是每秒1157万Token——差不多等于每秒“说”一部短篇小说。到了2026年3月,这个数字变成了每秒约16.2亿Token——相当于每秒“说”一套大英百科全书。这不是什么渗透率提升、用户基数扩大的线性增长,这是需求形态本身发生了质变。
更惊人的加速度还在后面。2026年元旦至今,仅AI推理任务相关的Token调用量在短短三个月内暴增250%。推理是什么?就是用户每一次提问、每一次让AI写文案、画图、分析数据的动作。推理消耗Token不是“训练时的一次性大火”,而是“日常运营里的持续小火”——但架不住每天有上亿用户添柴。
第三重:商业模式确立——“按度计费”的回声。
对投资者来说,比需求爆发更重要的,是这种需求能不能变成可持续的现金流。2026年上半年,答案开始明朗。
腾讯云、阿里云、百度智能云集体上调AI相关服务价格,部分模型Token计费涨幅超过400%。这件事的意义不在于涨了多少,而在于“涨了”——涨价说明供给紧缺,涨价也说明下游愿意接受。这三家公司的客户覆盖了中国互联网的大半壁江山,它们的集体提价,等于宣告了一个事实:算力不再是按卡卖的“批发货”,而是按Token卖的零售商品。“水电化”的商业模式正在确立,这个行业从“项目制”的To B逻辑,切换到了“用量制”的运营逻辑。前者是脉冲式的,签一单吃半年;后者是流水式的,用户越多、用得越久,收入就越稳定。
“词元经济学”的三个层次
要理解Token经济的投资逻辑,不能只看表面热闹。我建议先建立三层认知框架,这个框架是跑通整篇文章分析逻辑的底层操作系统。
第一层:Token是“度量衡”。
过去我们评价一个AI公司好不好,标准很主观——技术牛不牛、团队强不强、融资多不多。现在有了Token调用量,一切变得可量化。哪家大模型用的人多、用得深,看Token数据一目了然。就像电商时代看GMV、移动互联网时代看DAU,AI时代最硬的活跃度指标就是Token量。AI产业从定性叙事进入了定量竞争的阶段,这是机构资金愿意入场的前提——他们可以建模了。
第二层:Token是“结算货币”。
百度智能云、火山引擎、腾讯云等主流平台均已按Token结算API服务。这意味着AI服务不再是企业IT采购中的“项目制预算”——今年批了500万就花500万,明年可能批600万也可能不批——而是变成了运营性的“流动支出”,像一个月的电费单,随用随付。这种商业模式的可持续性更强,且能更灵敏地反映需求的季节性和趋势性变化。对企业来说可以减少前期投入;对云厂商和模型厂商来说,只要有用户粘着,就能持续收钱。
第三层:Token是“价值链起点”。
从Token消耗出发,可以衍生出很多我们现在只是刚刚看到苗头的服务:数据集交易、模型授权、智能体托管、数据资产质押……国家数据局征求意见稿里勾勒的三个层次——数据流通、词元计价、资产化变现——不是一个概念闭环,而是一条正在铺开的真实链条。如果把数据比作石油,Token就是炼化之后的“成品油”,每一个下游应用都能再加工、再增值。
中美分岔:“算力军备”vs“能效内卷”
全球AI竞争格局正在发生一个很有意思的迁移,这个迁移直接决定了中美两个市场的投资逻辑差异。
美国的战略重心在“前沿突破”。英伟达Vera Rubin平台七颗芯片全部投产,制程从3nm走向1.6nm,参数从万亿级迈向十万亿级模型。这是一条“算力军备竞赛”路线,以峰值算力为绝对武器——谁能训练出最大的模型,谁就能在技术上定义下一代范式的标准。
中国走的则是另一条路,我更愿意称之为“能效内卷”。核心考核指标已从过去的“峰值算力”转向黄仁勋在GTC 2026大会上明确提出的两个新标尺:“每瓦Token吞吐量”和“每百万Token成本”。翻译成大白话:我不管你能跑多快,我就看花一度电、花一块钱,能吐出多少Token。
沐曦光启智能研究院院长李兆石最近洞察到一个很关键的“成本反直觉”。他的核心推断是:算卡成本越高,不一定意味着词元越贵;词元成本的决定性因素是吞吐效率而非硬件标价,软件优化和系统架构设计可以大幅改变竞争格局。这个逻辑在过去的硬件思维里是反常识的——我们都惯了“贵的就更好”,但在AI推理的世界里,贵一倍但吞吐量高两倍,单位成本反而更低。
两条路线没有绝对的对错。美国选择的是技术浪漫主义,中国选择的是工程实用主义。但结果已经摆在那里了:2026年5月初的一周(4月27日至5月3日),中国AI大模型周调用量达7.942万亿Token,按周增长81.7%;美国则为3.258万亿Token,环比下滑34.6%。全球调用量前六的模型全部来自中国,中国模型的Token价格仅为国外竞品的1/6至1/10。
这意味着什么?坦率地说,在AI的“普及之战”中,中国暂时抢占了主动权。美国的模型可能更聪明、参数更大,但中国模型更便宜、更好用、调用量更大。这是一场成本和规模的战争,而规模本身又能进一步压低成本——形成正向飞轮。
站在投资的角度,这个判断直接影响标的筛选方向。如果你买的是美国芯片股,盯住的是制程迭代、前沿突破;如果你买的是A股的Token产业链,盯住的应该是调用量增长、渗透率提升和单位成本优化。逻辑不同,不可混用。
二、算力通胀——一场产业链的“供给侧改革”
一张涨价的“多米诺骨牌”
2025年10月的时候,H100一年期GPU租赁合同价格还在每GPU每小时1.70美元的低位。当时市场上甚至有人担心“算力过剩”——毕竟2024年涌进来那么多智算中心,供给看上去很充足。但到了2026年3月,也就是不到半年时间,这个数字已经爬到了2.35美元,涨幅接近40%。折算成人民币,一台8卡H100服务器的月租金从大约5-6万元涨到了8-9万元,一年下来多出30多万的成本。如果你是模型创业公司,这30多万不是小数目。
GPU仅仅是第一块倒下的骨牌。内存合约价紧跟着跳涨,2026年第一季度同比暴涨了4到5倍,这个涨幅放在半导体历史上也属罕见;服务器厂商承受不住上游价格压力,大幅上调整机售价,部分运营商被迫推迟了部署计划。然后整个涨价链条传导到了最下游:腾讯云、阿里云、百度智能云相继宣布AI算力相关服务涨价,幅度从5%到400%以上不等。400%这个数字尤其值得留意——它不是大规模训练任务的涨价,而恰恰是推理Token计费的涨价,直接打在了终端消费者的调用成本上。
这一轮涨价跟往年任何一个半导体景气周期都不太一样。过去是什么情况?手机出货量多了,内存涨一涨;数据中心建设提速,服务器涨一涨。个别环节的供需失衡,补一补就缓过来了。但2026年的这一轮,是全链条的共振。
涨价逻辑非常清晰,是“需求倒逼式”的:AI智能体大规模落地——Token调用量像开了闸的水库——推理算力全线告急——GPU租赁价格应声上涨——内存、光模块、服务器全面跟涨——云厂商承受不住,把成本压力通过API提价传导出去——模型厂商算力成本飙升——要么提价、要么咬牙优化。这条传导链的每一环都足够紧张,而源头的Token需求仍在以每周两位数的速度攀升。
再往深挖一层,背后有三股更根本的驱动力在起作用。一是硬件成本在“逆向”暴涨。HBM高带宽存储与高端芯片全面进入卖方市场,采购成本攀升,交期拉长,运维人力也水涨船高。二是需求结构从“训练”转向了“推理”。训练是批量的,一波投下去之后用几个月来消化;推理是持续在线、频繁调用的。智能体场景对推理的消耗远超对话场景——这个我们后面还会展开讲。三是“有卡≠有可用算力”。服务器整机组装、高速网络互联、电力配套到位、数据中心土建上架,每一条路都堵着或多或少的瓶颈,系统性的交付能力约束把供给端的弹性压得死死的。
云厂商的“算力通胀”与模型厂商的“成本焦虑”
2026年4月,财联社出了一篇报道,标题非常直白——“Token热加剧算力荒,云厂商坐不住了”。我读完之后的最大感触是:这篇文章的标题精准得让人心疼。云厂商不是坐不住,是急得睡不着觉。
三大云厂商的资本开支已经进入不计成本的冲刺模式。阿里宣布未来三年投入超千亿元用于云和AI硬件基础设施建设。腾讯2025年资本支出792亿元,2026年明确表态AI投入金额至少翻倍。字节跳动2026年的资本支出计划约1600亿元,近一半砸向AI芯片和数据中心。这几个数字背后,是巨头们集体焦虑的真实投射——谁也不敢在这个窗口期掉队,因为一旦客户惯了对家平台的API,迁移成本会极高。
但我注意到,砸钱和真能砸出货来是两回事。一位算力行业的从业者向财联社记者私下交了实底:“我们现在每天都心惊肉跳,因为买不到货,现在大家手上都没东西租了。”这不是夸张。SemiAnalysis的数据更令人震惊:半数GPU供应商明确表示H系列“无货”。更糟的是,2026年8到9月之前所有即将上线的Blackwell系列产能,已经被预订一空。也就是说,你现在下定金,得等到暑假末甚至更晚才能拿到卡,而这中间的几个月的算力空白怎么填?
在这场“卖方市场”里,游戏规则被重写了。掌握稳定采购渠道和雄厚资金的公司可以迅速部署新算力、锁定长期合同,拿到极高的营收和利润能见度。它们甚至可以在拿到货之后转手倒租,赚取中间差价。而中小玩家在“有钱也拿不到卡”的残酷现实面前,议价能力被削弱到极点。行业整合的压力正在积聚——那些拿不到足够算力、又付不起上涨后价格的初创模型公司,可能会在未来一年里面临生存危机。
从“算力自由”到“算力平权”
算力租赁平台的崛起,是这场产业链重构中最让我兴奋的变量之一。它们的商业逻辑听起来简单:把智算中心动辄数千卡的大块算力切开,按小时、按卡分租给中小企业,降低它们进入AI赛道的第一道门槛。这正是“算力平权”的核心叙事。此前只有大厂烧得起GPU集群,创业公司想做模型微调都要东拼西凑找资源,现在你在算力租赁平台上花几千块就能租几个小时的H100集群,这对生态活跃度的提升是巨大的。
但平权有平权的代价。算力租赁行业的核心利润变量只有两个:利用率和调度效率。头部平台通过自研的多云调度技术,可以把GPU利用率做到70%到80%,这意味着每10块钱的算力成本中,有近8块钱是在产出的。而行业平均利用率只有40%到50%,也就是说一半的算力在闲着折旧。这个差距看似只是运营水平的差异,实则决定了生死。以并行科技为例,公司2026年一季度归母净利润同比增长223%,AI云服务与系统集成业务协同放量,企业类业务营收大幅增长至3.13亿元,同比增速168%。它的打法非常务实——把不卖超算云的老本行和新切入的AI算力租赁结合起来,用技术降本、用规模锁客。与之形成鲜明对比的是鸿博股份,这家曾经被视为算力租赁“明星”的公司,2026年一季度因“上年同期高基数及业务结构调整”导致业绩显著下滑,还特意发了澄清公告,说与MiniMax未开展合作。市值仅剩81亿元,与龙头之间的差距被迅速拉大。
国海证券在4月21日出了一份研报,判断AI推理拐点已至,算力租赁进入量价齐升的高景气周期,是当前AI产业链确定性较强的核心赛道。我基本同意这个判断,但补充一句:量价齐升是行业整体的故事,选对龙头才能把这个故事变成自己的收益。算力租赁行业已经过了“谁有卡谁就赢”的草莽阶段,进入拼运营效率、拼资金实力、拼客户粘性的精细运营期。
三、全球维度——OpenRouter排行榜背后的中国答案
榜首的背后:不只是便宜
2026年2月,中国AI大模型调用量在三周内大涨127%,首次超越美国。OpenRouter当时公布的Top5排行中,前三甲被中国模型包揽:MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5,再加上排名靠前的DeepSeek V3.2,四款中国模型合计贡献了Top5总调用量的85.7%。这个数字让我反复看了好几遍——不是60%、70%那种“领先一个身位”的量级,而是接近九成的绝对统治力。
到了5月初(4月27日至5月3日当周),中国模型的领先优势不仅没有收敛,反而进一步拉大。腾讯Hy3 preview(free)以3.03万亿Token的周调用量跃居全球榜首,同比增长799%,这个增速几乎可以拿去任何一个行业当“异常值”审;Kimi K2.6紧随其后排名第二,DeepSeek V4 Flash更是首次登上榜单,周调用量0.704万亿Token,周增长率344%。注意,DeepSeek V4 Flash上线的第一周就冲到这个体量,说明的产品化思路和开发者生态整合得非常利索。
“便宜”确实是中国模型最强的那把利器。据测算,当前中国国产词元定价约为海外的十分之一。能做到这个价格,靠的不是亏本卖吆喝——模型厂商没那么傻——而是软件优化的吞吐效率提升,加上差异化硬件选型策略。同样是推理,在昇腾上跑的国产模型,经过系统层优化后单位成本可以压得比国外方案低一个数量级。
但如果你认为中国模型霸榜仅仅是便宜,那低估了整个故事。便宜是表象,背后还有三个更深层的结构性因素在起作用。
第一,应用场景优势。中国拥有全球最完整的工业链和商业场景——电商有阿里、京东、拼多多,社交和内容有微信、抖音、快手,数字化基建的东西南北全面铺开。这些场景每天产生海量数据,为AI模型提供了天然的应用土壤。训练模型需要数据,打磨模型需要场景反馈,而中国市场的纵深和复杂度几乎没有其他国家可以复制。
第二,Agent竞争力的非线性跃迁。国金证券在5月的一篇研报里精准地点了一笔:DeepSeek V4、GLM-5等国内模型的Agent能力正在快速进阶。Agent跟对话不一样,它要持续推理、循环调用工具、维护任务状态,每一次交互都可能拆解成几十上百次子推理,Token消耗呈现几何级放大。当国内模型在Agent技术上追上来之后,堆出的算力需求比单纯做聊天机器人高出一个维度。
第三,中国模型正在从“流量”变成全球AI的“数字基础设施”。现在外国开发者用中国模型写代码、做内容生成、建智能客服,就像他们过去用AWS和Cloudflare一样自然。MiniMax的海外收入占比已经超过70%;智谱的API年化经常性收入突破2.5亿美元,2026年一季度Token调用量增长400%。这个收入结构告诉我一个事实:中国的AI模型已经不只是“出口产品”,而是在变成“出口服务”。一旦基础设施地位确立,切换成本非常高,用户粘性将构成天然的护城河。
“出海即赚钱”的商业模式
把这个问题展开聊聊,因为这可能是2026年最值得跟踪的AI商业模式之一。
中国模型出海正在跑通一种“全球流量变现”的新路径,模式比当年的工具出海、游戏出海更轻、更可持续。核心逻辑是:以高性价比吸引全球开发者和中小企业调用API——通过调用量持续变现——现金流反过来支撑更大的算力采购——规模采购压低单位成本——价格优势进一步巩固——吸引更多用户。这是一个漂亮的飞轮。不像工具出海那样需要做本地化运营团队,不像游戏出海要不断制造新爆款,API服务的边际成本极低,用户一旦接入就很难离开。
以Kimi为例,到2026年2月,的海外收入已经超过国内收入。月之暗面团队并没有在海外大规模建团队,Kimi的海外增长几乎全靠全球开发者社区的口碑传播。MiniMax更不用说,在OpenRouter上的周调用量一度高达3.07万亿Token,拿走了整个平台超过五分之一的份额。能做到这个体量,不可能只是路过的流量——开发者已经把的API嵌入了自己的产品逻辑,Token消耗是每天稳定产生的。
还有一个值得关注的产业动态:贵州数据宝近期推出了TopenRouter.com,全面对标OpenRouter,号称“每分钟500万Token、每小时3亿Token的峰值输出”。中国的词元交易平台从服务国内市场走向链接全球开发者,这个变化的方向意义大于短期数据。说明Token的交易和分发本身正在成为一个独立的生意。
中国模式的全球影响
中国模型的极致性价比不是一时的价格战,而是在真切地重塑全球AI产业的定价权。
英伟达CEO黄仁勋在GTC 2026大会上说过一句分量很重的判断:AI竞争的核心已从模型训练转向Token生产效率。我不是第一次听他发表类似观点,但2026年这版表述最直接。他给出的两个新衡量标尺——每瓦Token吞吐量和每百万Token成本——与李兆石的“成本反直觉”几乎可以互相印证。训练是“一次性大招”,几亿美元砸下去烧出一个模型;推理才是“持续现金流”,每天的调用就是每天的收入。谁能在推理效率上持续领先,谁就能吃下这波现金流的大头。
这对A股投资者的启示很简单:不要再死盯着“谁家的算力最高”,那已经是旧剧本了。新的主线是:谁的每Token成本最低、谁的调用量增速最快、谁的算力运营效率最高。过去,算力越强、模型越大等于竞争优势;现在,单位Token成本更低、能效更高的模式才是真正的护城河。
四、产业链全景——五大层级的“掘金地图”
下面花较大篇幅把Token产业链五层结构逐一拆开。每一层的竞争要素不同、景气节奏不同、个股质地悬殊很大。逐个梳理不是为了写行业百科全书,而是为了在后面提出个股意见时,能有一个扎扎实实的产业底座在垫着。
(一)芯片层(算力发动机):从“可用”到“好用”的质变
芯片是Token生产的物理原点——电能从这一头进去,Token从那头出来,中间经历无数次浮点运算。这个环节技术门槛最高、资本开支最重,但一旦跨过护城河,也最难被替代。Token产业链上的定价权有相当大一部分集中在这一层。
板块全景:为什么芯片层突然站在质变临界点?
国产AI芯片的故事已经讲了好几年,市场对“国产替代”这个词多少有些审美疲劳。投资者在问同一个问题:到底什么时候从“能用”变成“好用”?2026年4月24日,这个问题终于等来了一个历史性的回答。当天,DeepSeek全新大模型V4预览版上线,这次迭代跟以往任何版本都不太一样——V4脱离了英伟达 CUDA 生态,全面适配华为昇腾芯片,在昇腾上完成了训练与推理全链条的跑通。消息发布后,国产AI芯片板块应声拉升,海光信息午后一度猛涨超10%,寒武纪、摩尔线程齐齐跟涨。
到2026年4月底,已经有8家国产AI芯片品牌适配了DeepSeek V4:华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯。这8家几乎囊括了当前国产主力阵容,全栈适配的规模效应开始显现。中银国际随后给出一个有力的判断:国产大模型已基本跑通全栈国产化,形成从底层硬件到上层应用的完整技术链条,国产算力板块或迎来“质变临界点”。
这句话的分量需要体味。过去好几年,全球绝大部分前沿AI模型都跑在英伟达CUDA生态上,而且跑得很舒服——开发者惯了,调优工具统一,迁移成本极高。黄仁勋自己也公开说过,即使英伟达在峰值算力上被超越,真正的护城河在于整个软件生态体系。V4让大家看到了一种可能性:这道护城河,也许不是不可逾越的。当中国的头部模型原厂愿意在国产芯片上深度适配,就相当于完成了最难的一步生态冷启动。接下来,其他开发者跟进的成本会越来越低。
从投资角度看,国产芯片板块当前的核心驱动力有三条,缺一不可。一是需求爆炸:字节2026年国产算力采购份额预计超过400亿元,阿里1200亿中的国产占比也在持续提升,三大运营商在2026年均加大了国产算力采购力度。二是供给改善:2026年被认为是国产芯片规模化量产的关键之年,第一上海证券研报指出芯片设计公司与代工厂的合作在优化,制造端良率有望突破。三是应用场景恰好匹配——国产算力在推理场景的优势远大于训练,而2026年的行业重心恰好从训练转向推理,正是国产算力发挥特长的窗口期。
个股剖析:海光信息( 688041 )
海光信息是当前A股国产AI芯片板块中逻辑最通顺的标的之一。它的主营业务是高端处理器,覆盖通用计算(CPU)和AI加速计算(DCU)两条腿,产品已经在信创领域大规模出货。公司最核心的竞争力在于跟x86生态的兼容能力——它的CPU可以跑绝大多数现有的企业级应用,DCU则逐步向大模型推理场景渗透。这意味着海光不需要从零开始构建软件生态,可以借助已有的成熟生态做国产替代。2026年4月底,DeepSeek V4适配事件公布后,海光信息连续走强,显示市场对“国产芯片+大模型”这条链路的高度认可。公司的技术路线并非英伟达CUDA的直接翻版,而是采用了更具通用性的设计思路,在多场景适配上有天然的灵活性优势。从业绩端看,海光的DCU产品线在智算中心的渗透率正在快速提升,信创市场之外,商业客户的比例也在走高,这为后续增长打开了更大空间。需要留意的风险是:美国出口管制的任何升级都可能对先进制程代工形成瓶颈;同时公司当前估值已经反映了较为乐观的国产替代预期,一旦量产进度低于预期,回调压力会来得很快。
寒武纪( 688256 )
寒武纪是A股唯一一家纯粹的云端AI芯片公司,没有GPU的传统包袱,从第一天起就围绕AI计算架构做设计。这种“原教旨式”的专注让它在产品端形成了独特的竞争力。2026年一季度财报显示,预付账款和合同负债双双高增——这两项指标在半导体行业是判断需求景气度的先行信号,它们的跳升意味着下游客户正在抓紧下订单、付定金,生怕抢不到产能。寒武纪的思元系列芯片已被多家智算中心纳入标配,同时公司还在边缘侧布局低功耗芯片,形成云边协同的产品矩阵。跟海光不同的是,寒武纪更强调从芯片指令集到上层框架的全自研体系,这使得它在中长期具备更强的技术壁垒,但短期内的生态适配成本也更高。DeepSeek V4适配寒武纪,相当于帮它补上了最缺的应用生态背书。公司目前尚未实现盈利,这是机构分歧最大的地方——有观点认为它的亏损是成长代价,未来规模效应会自然收敛;也有声音担心研发投入持续高企会拖累现金流,需要密切关注后续几个季度的毛利率和经营现金流变化。
摩尔线程( 688795 )
摩尔线程是国产全功能GPU的标杆,也是少数在通用计算和图形渲染两个维度同时发力的国产GPU厂商。2026年完成A股上市后,公司有了更充裕的资金储备,产能扩张节奏明显加快。DeepSeek V4适配摩尔线程的消息,让市场重新审视这家公司的定位——它不只是做图形卡,而是有能力承载大模型推理和轻量训练的全能型选手。摩尔线程的核心优势在于生态兼容性:对OpenGL、Vulkan等图形API的支持,以及向CUDA兼容层的持续投入,让开发者迁移成本大幅降低。公司目前的产能规模和英伟达还有相当差距,但作为国产体系中的“通用GPU选项”,它的替代价值正随着算力通胀而逐步放大。风险点在于,GPU是一个烧钱极快的赛道,摩尔线程上市后能否在收入和研发之间找到平衡,需要长期跟踪。
地平线(9660.HK)
地平线专注的是另一个维度——端侧的Token生成。自动驾驶和智能座舱场景中,芯片要实时处理摄像头、雷达的多模态输入,并在毫秒级完成推理和决策。这个场景跟云端推理的需求很不一样:功耗要极低、延迟要极短、可靠性要极高。地平线在车载智能芯片领域是国内绝对的第一梯队,征程系列芯片累计出货量已达数百万片量级。2026年L3级自动驾驶加速落地后,单车的Token生成量将大幅攀升——每公里路程产生的视觉Token、点云Token、决策Token都在成倍增加。地平线作为车载计算方案的核心供应商,直接受益于这波智能化升级。需要提示的是,车载芯片市场竞争日趋激烈,英伟达Orin和高通Snapdragon Ride都在抢夺高端份额,地平线能否守住中高端市场并向上突破,是关键考验。
瑞芯微( 603893 )
瑞芯微是端侧SoC芯片的隐形冠军。AIoT设备——智能摄像头、智能音箱、工业视觉终端——几乎都用得到它的芯片。这些设备在日常运行中持续产生和处理Token,虽然单颗芯片算力不大,但胜在出货量极大,累积效应可观。瑞芯微的产品线覆盖从低功耗到高性能的多个层级,客户生态分散,不依赖单一大客户,业绩波动率较小。2026年端侧AI持续渗透,新的应用形态(如AI眼镜、AI耳机)进一步拓宽了公司产品的应用边界。对瑞芯微来说,最大的投资价值在于“稳”——不像云端芯片那样享受高估值弹性,但作为端侧Token生成的重要基础设施,它在产业链中的位置是确定的。
(二)智算中心层(算力工厂):4500亿的新基建盛宴
2026年,中国算力基建投资约4500亿元,智能算力占比升至58%,智算中心从过去几年的“超前的布局”变成了当下的核心投资主阵地。政府工作报告明确将超大规模智算集群、算电协同纳入新基建工程,这一层拿到了最高级别的政策背书。
智算中心是什么生意?它的商业模式本质就是把电力、土地、网络和芯片凑起来,建一座全天候运转的“Token工厂”。成千上万颗GPU装进机柜,配上供电、液冷散热、高速交换机互联,稳定产出算力,收入来自算力租赁或直接对外提供API服务。利润率关键看三个变量:用电成本、芯片采购成本、上架率。电费占运营成本的大头,所以很多智算中心选址在内蒙古、贵州这些电价便宜、气候凉爽的地方;芯片采购成本在算力通胀背景下被抬高,考验的是采购节奏和议价能力;上架率不够,一切归零,前期投入的折旧会压垮利润表。
参与者分三类。运营商——中国移动、中国电信、中国联通——手里有通信土地、电力指标和低成本资金,是国家级算力网络的核心承载平台。中国移动在哈尔滨的智算中心已经跑出了1.8万卡纯国产算力集群,电信和联通也在加速投建。互联网巨头——阿里云、腾讯云、华为云——以自有业务和云服务构建的巨量需求做底座,是最具规模效应的玩家。第三方IDC,如润泽科技、万国数据、秦淮数据、光环新网,核心价值在于给大客户提供“算力+电力+散热”的一站式托管方案。润泽科技是这一层最典型的Token经济受益者,它是字节跳动和智谱AI的核心IDC供应商,算力租赁相关收入占比已经超过60%。
智算中心层,投资逻辑相对清晰:运营商和头部IDC在景气周期中确定性最强,但弹性不如算力租赁和光模块;需要重点盯防的是电力成本上升——高功率集群密集上架后,电力消纳和储能配套将成为成本端的新变量,算电协同能力可能决定这一层未来的利润走向。
(三)算力租赁层(算力中介):最拥挤也最确定的黄金赛道
算力租赁被国海证券明确定义为“当前AI产业链确定性较强的核心赛道”,四个字概括:量价齐升。这几年来,真正能同时做到量升和价升的赛道少之又少,需要同时满足需求持续旺盛和短期供给刚性两个条件。算力租赁恰好踩中了这两个点。
这个行业正经历从“有卡就赢”的草莽阶段向“运营决胜负”的精细阶段的转变。头部玩家靠调度系统把GPU利用率做到70%-80%,中小平台停留在40%-50%。这个差距放在财务上,意味着同样一台8卡服务器,头部玩家一个月能多赚两三万。规模上去了,客户粘性(头部玩家一般签长协)锁住了收入,毛利率差距自然拉开。
个股剖析:并行科技(920493.BJ)
并行科技是北交所少有的AI算力纯正标的,前身主业是超算云服务,近年大力切入AI算力租赁赛道,业绩迎来爆发式增长。2026年一季度归母净利润同比暴增223%,企业类业务营收跳升至3.13亿元,同比增速168%。这个增速放在任何赛道都相当亮眼。并行科技的打法清晰:把超算时代积累的高性能计算调度技术复用到AI集群管理上,用技术手段将GPU集群利用率拉到行业领先水平,然后通过长期采购合同锁定芯片供货,避免现货市场的高溢价。自2023年11月以来,公司已累计采购AI/GPU算力服务器超25亿元,仅2026年前四个月就砸下约13亿元。百亿市值、百倍PE的估值不好说便宜,但算力租赁赛道的高景气给了它消化估值的窗口期。华源证券给予“买入”评级并给出目标价,主逻辑就是公司AI算力租赁业务将持续受益于推理需求爆发,采购节奏的提前锁定能力构成核心壁垒。风险方面,需警惕公司体量尚小、大客户集中度偏高的经营脆弱性。
鸿博股份( 002229 )
鸿博股份是A股算力租赁概念的先驱,曾因率先切入这个赛道获得极高关注度。然而2026年一季度业绩却出现明显回落,股价从高位大幅回调至16元附近,市值跌至81亿元。公司在互动平台多次澄清,与MiniMax等明星AI公司并无业务合作,部分市场此前给予的预期没有兑现。鸿博的案例对整个算力租赁板块都是一个深刻的风险警示:一个诱人的产业故事,如果缺乏实打实的订单和客户关系支撑,估值可能会在快速膨胀后迅速“挤水分”。算力租赁不是只要手里有几台GPU服务器就能躺赚的生意,客户渠道、资金实力、采购节奏、运营效率,每一项都有硬门槛。就目前来看,鸿博要重新赢回市场信心,需要在业绩端拿出实打实的订单增长证明自己。
(四)模型应用层(算力消费):赢者通吃,但路径各有不同
模型应用层是整个产业链的“消费端”。一切芯片、智算中心、算力租赁的投入,最终都要靠用户的实际使用量来变现;这一层想象空间最大,但确定性的分布极不均匀,未来几乎一定会是少数赢家吃掉大半利润。
竞争格局已经初步定型,但各家走的路子差异很大。字节(豆包)是C端吞吐机,日活超1.5亿,日均Token消耗量稳坐国内头把交椅。豆包每多一个日活用户,每天就多出数以百万计的Token增量,头部效应在C端放大得非常极致。智谱AI是B端API龙头,政企订单爆发式增长,API年化经常性收入突破2.5亿美元,三度提价仍供不应求,B端的壁垒比想象中深得多——政企客户一旦把模型嵌入业务流程,更换成本很高。MiniMax是出海之王,海外收入占比超70%,走的是借OpenRouter等全球分发平台获取长尾开发者的路线,轻型而高效。DeepSeek走极致性价比路线,算法创新做到推理成本降至行业十分之一以下,V4系列首发即爆量,344%的周增长证明了低价也能跑出高效率。
个股剖析:科大讯飞( 002230 )
科大讯飞是模型应用层中少有的“B端场景深耕型”玩家,不卷通用对话、不走全球流量分发,而是扎在政企、教育、医疗这三个壁垒极高的垂直领域。星火大模型日均处理Token超3万亿,AI开放平台年收入达135亿元,两个数字放在一起看,就知道它的商业化已不是概念阶段。教育领域,讯飞的智慧课堂已覆盖数万所学校,日常使用的批改、评分、个性化推荐功能持续产生Token消耗;医疗领域,辅助诊疗、语音病历在国内医院渗透率不断提升;政务领域,智能客服和文档处理需求在“模数共振”行动推动下加速释放。这三个场景的共同点是:专业性强、监管门槛高、对准确性要求苛刻,模型一旦通过验收并嵌入工作流,替换成本极高,这构筑了科大讯飞的场景壁垒。风险在于,互联网大厂正在向下渗透To B场景,讯飞在某些边缘场景可能面临价格战压力,需要持续保持技术和服务的领先优势。
昆仑万维( 300418 )
昆仑万维在“天工”大模型上找到了独特的出海路径,海外收入占比超过70%。2025年API收入达32亿元,同比增长210%,这个基数对于一个最初以游戏和工具出海为主业的公司来说,转型力度和节奏都相当积极。天工大模型的差异化卖点在于多语言能力和对新兴市场的适配——不是去跟GPT在英语市场硬碰硬,而是在中东、东南亚、拉美等地区获取了大量开发者和企业用户。昆仑万维也通过自身原有的海外流量生态为天工导流,降低了获客成本。“出海即赚钱”的飞轮效应在昆仑身上体现得比较充分。风险方面,海外市场竞争正快速升温,当地本土化模型也在成长,昆仑要想守住出海先发优势,需要保持技术迭代和本地化服务的强度。
拓尔思( 300229 )
拓尔思是大数据与人工智能交叉领域的老牌公司,主阵地是政务和金融垂直场景的自然语言处理。在政务领域,政府公文自动撰写、政策智能解读、舆情分析对语义推理的要求极高,拓尔思有多年积累的知识图谱和行业语料库做护城河。金融领域,合规审查、智能投研、合同分析等场景同样需要高精度的NLP能力。公司近年将语义推理能力和Token计费服务结合起来,形成了从模型、数据到计费工具的闭环产品,这使它在某些特定领域的粘性甚至超过通用大厂。拓尔思市值偏小、成交量不高,属于细分赛道的“隐形冠军”型标的,弹性可能偏弱,但胜在业务稳定性强。要关注的是大模型技术迭代速度远超传统NLP时期,拓尔思能否持续跟上前沿节奏、避免技术过时,是关键挑战。
(五)配套基础设施层(算力支撑):光模块与液冷的分化时刻
配套基础设施是“卖铲子中的铲子”生意。不管大模型这一仗最后谁能活下来,把GPU插在机柜里、连成集群、通上电、散好热,就必须用到光模块、液冷、交换机、光纤和储能设备。这个逻辑决定了配套层在所有产业链分层中拥有最高的确定性。
但2026年的新变化是,确定性最高的赛道也开始出现剧烈的内部分化。过去只要沾上“光模块”三个字就能涨,现在市场在挑肥拣瘦。
光模块:史上最强一季报与“预期差”的冲击
2026年一季度,中际旭创单季营收194.96亿元,同比暴增192.12%;归母净利润57.35亿元,同比增长262.28%。新易盛营收83.38亿元,同比增长106%。三家头部光模块公司(“易中天”)一季度合计营收接近292亿元,总市值一度突破1.89万亿元,超越贵州茅台——这在A股科技股的漫长历史上都极为罕见,显示市场把光模块的景气度打到了极致乐观。
但一季报发布后,板块迅速分化。新易盛因净利润环比下滑13%低于预期,股价一天跌掉11%,市值蒸发约700亿元。天孚通信连续两个季度毛利下行,股价在5个交易日内累计回调超17%。唯有中际旭创凭借最强劲的超预期幅度守住了阵脚。市场的反应毫不留情,它揭示了一个深层逻辑:当市值已经膨胀到能对标茅台的水平时,任何边际放缓都会被市场成倍放大解读。在光模块这个一年前还被认为“最确定”的赛道上,投资者必须开始区分交易“故事”的人和交易“业绩”的人。
个股剖析:中际旭创( 300308 )
中际旭创是光模块板块里确定性最强的锚。800G光模块已成为AIDC内部高速互联的标配,1.6T产品也在加速导入,公司手握北美和中国头部云厂商的长期订单,订单能见度已经排到2027年。一季度192%的营收增速、262%的净利增速,放在哪里都是顶级成绩。公司的核心壁垒在于:与下游大客户深度绑定的联合研发能力,快速的产能爬坡节奏,以及在高端光模块封装工艺上的积累。这三点叠加,让中际在每一次光模块代际升级时都能率先抢占窗口期。市值一度突破万亿,显示市场将其视为AI浪潮中的核心基础资产。估值问题无法回避——即便以2026年预测业绩看,当前PE也处于历史极高区间,这要求公司的业绩增速必须持续兑现预期,容错空间极小。一旦海外云厂商资本开支出现放缓信号,股价波动在所难免。
新易盛( 300502 )
新易盛同样是数据中心高速光模块的核心供应商,800G产品出货量紧追中际旭创,客户结构更偏多元化——既有北美云厂商,也有国内头部互联网公司。一季度106%的营收增速依然亮眼,但环比净利润下滑13%这一点触动了市场高度敏感的神经。光模块行业每一代产品迭代时,毛利率会呈现前高后低的周期性特征——新产品刚推出时溢价最高,等供给上来、竞争加剧后毛利自然回落。新易盛面临的正是这个周期力量,市场担心它的高毛利阶段在2026年上半年已见顶。公司需要在下半年用业绩证明,量的增长可以覆盖价的压力。好消息是,全球AIDC建设远未见顶,光模块总盘子还在快速扩张;坏消息是,当行业竞争烈度提升,二线龙头的议价能力会最先受考验。
液冷:爆发中的行业分化
2026年液冷行业进入系统性放量期,行业总规模有望达到700亿至1050亿元,AI服务器液冷渗透率突破50%,新建智算中心几乎实现100%液冷标配。以前的问题是“用不用液冷”,现在变成了“谁能按期交付、谁能保质放量”。
但在一季度报告中,行业出现了剧烈的质变信号。龙头英维克一季度营收增长了26%,但净利润暴跌82%,扣非净利暴跌87%,经营现金流也大幅恶化。我反复看过它的一季报,净利暴跌的主因是高额研发投入和营销费用前置,这代表它在主动抢市场份额,但从投资角度看,现金流恶化在景气上行期足以让市场警醒。反观佳力图,凭借全栈液冷技术能力和相对稳健的资金面,在一季度板块中表现相对从容,拿下了多家智算中心的订单。
个股剖析:佳力图( 603912 )
佳力图是液冷温控赛道中辨识度较高的二线龙头,核心卖点是“全栈液冷”——从冷板式到浸没式均有产品覆盖,技术路线多元,能根据客户机柜功率密度和机房条件提供定制化方案。2026年液冷行业订单爆发,佳力图连续获得多个智算中心项目,在手订单充足。相比于英维克,佳力图市值更小、估值倍数更低,在业绩兑现期反而获得了更高弹性。一季度相对稳健的财务表现也让它在英维克“暴雷”后获得了一波资金切换的支撑。风险在于,液冷行业技术路线仍在演进,冷板和浸没谁能成为长期主流存有变数;此外,佳力图体量较小,面对大型IDC客户时的议价能力有待加强,毛利率能否在规模扩张中保持稳定值得跟踪。
储能与光纤:算力背后的“隐形英雄”
宁德时代( 300750 )在Token产业链中的位置常常被低估。智算中心是高载能体,一座万卡集群的功率动辄几十兆瓦,必须配建储能系统来保障稳定供电、削峰填谷、参与电网调度。“算电协同”概念之下,宁德时代的储能电池系统成为智算中心的刚需部件。宁德在储能领域的全球市占率超40%,规模效应带来的成本优势无人能及,同时电池技术向高安全、长循环方向演进,契合智算中心对供电可靠性近乎苛刻的要求。对投资者来说,把宁德纳入Token产业链组合,更多是作为“底仓型”配置——它不光有AI算力这层新增量,本身新能源的基本盘也足够厚实。
亨通光电( 600487 )则是算力网络底层传输的“光纤护航者”。智算中心之间、智算中心与用户之间的海量数据交互,依赖高带宽、低时延的光纤网络。“东数西算”工程要求算力枢纽间的网络时延控制在数毫秒之内,这对光纤光缆的质量和传输性能提出了新标准。亨通光电作为光纤光缆头部厂商,持续受益于全国算力网的建设。光纤的周期性属性确实不可否认,但在算力基建长周期向上的背景下,其需求韧性比以往要强不少。
(六)跨层布局的全栈玩家
有些巨头不屑于只占一层,它们从芯片一路吃到应用,构建全栈能力。华为是最突出的全栈式Token工厂总包商——昇腾芯片、华为云、各地智算中心、盘古大模型,从物理算力到模型服务全线贯通,是国产算力自主可控的核心中军。阿里巴巴拥有平头哥芯片、阿里云、PAI平台和通义千问,以电商和商业服务为落地场景,形成了从芯片到应用的完整闭环。腾讯手握紫霄/沧海自研芯片、腾讯云和混元大模型,社交、游戏两大自有流量池带来的Token消耗规模极大,是隐性消耗王者。字节跳动目前主要布局AIDC、算力租赁和模型层,以火山引擎和豆包为核心,在C端占据领先地位,并不急于全栈,但每一层都做得够深。
五、市场维度——题材联动、量价与技术的三重共振
到了5月初,回头复盘4月的行情,几个关键词值得标注。
催化剂密集轰炸的四月
2026年A股的算力行情呈现出“催化剂密集轰炸”的特征,每次大事件都对算力板块带来一波脉冲式拉升。
4月24日DeepSeek V4发布是春季行情的最大催化剂。V4脱离CUDA、全面适配华为昇腾,消息一出,海光信息一度涨超10%,寒武纪和摩尔线程跟涨,带动整个国产芯片板块放量。这个事件的意义在于,它把“国产算力”从一个可以反复炒但缺乏实质验证的老题材,变成了有真凭实据支撑的新投资逻辑——市场看到了生态在形成,而不只是政策在鼓励。
OpenRouter每周发布的全球调用量排名,已经成为A股算力板块的高频情绪指标。每次数据一发,如果中国模型排名靠前,算力概念股就有动作。5月初的一周数据显示,腾讯Hy3 Preview(free)跃居全球第一,DeepSeek V4 Flash周增长344%首次上榜,这些数字在5月5日当天成为交易群里的高频讨论。这就是AI时代的“题材联动”新范式——不是看静态文件的落地,而是追每周更新的全球竞争排行,信息传播效率极高。
政策端的催化密度同样惊人,从3月“词元”定名,到4月“词元交易”入政策、“模数共振”行动发布,政策消息几乎以每周一条的频率涌出,不断强化市场对Token经济的中长期信心。云厂商在2026年上半年的集体涨价公告,也直接利好了整个算力链,东方财富证券的点评很到位——“词元经济崛起+云涨价”,这两个力量叠加,增强了算力景气度的可持续性叙事。
万亿成交背后的结构性分化
4月最后一周,A股周成交额中枢维持在2.60万亿以上,交投极其活跃。新易盛4月24日单日成交额突破500亿,创下A股科技股历史纪录。这么大的量发生在业绩公布后大幅下跌的交易日里,说明多空分歧极其剧烈——有人在恐慌出逃,也有人在逆势低吸。
板块层面,科创50在当周跑赢创业板指,显示出国产算力正在接棒此前以英伟达生态为核心的海外算力链。4月30日,国证半导体芯片指数强势拉涨4.35%,寒武纪上涨17.28%,海光信息上涨5.84%,半导体板块整体放量——这印证了资金的迁徙方向:从“易中天”的光模块叙事,部分转移到“国产替代”的芯片叙事上。
市值特征方面,“易中天”三巨头合计市值从1月的约1.63万亿飙涨至4月底的约2.34万亿,4个月净增约7092亿。这个膨胀速度已经类似于新能源最狂热时期的估值扩张。当市值进入万亿俱乐部后,市场对边际变化的容忍度急剧收窄——新易盛一天蒸发700亿就是例证。
技术面信号
以国证半导体芯片指数为参照,截至4月30日收于15254点,当日涨幅5.35%。自2月低点以来已累计上涨超50%,周线级别MACD保持在多头区域,中长期趋势尚属健康。但短期RSI接近70,显示超买压力在累积,回调蓄力并不意外。
CPO概念板块总市值已飙升至约3万亿,新易盛、中际旭创自2023年以来累计涨幅均超40倍。新易盛在4月24日放量暴跌后已失守20日均线,短期技术上偏弱;中际旭创相对坚挺,仍在20日线上方运行。算力租赁板块整体估值偏高,鸿博股份PE超100倍,并行科技2026-2028年预测PE分别约223、128、80倍——这意味着市场已经把极高的增长预期焊在了估值里,一旦业绩没跟上,修正幅度会很剧烈。
液冷板块走势呈典型的“事件驱动”特征,每逢大厂液冷订单的行业消息传出,佳力图、英维克就快速拉升。但英维克一季报“暴雷”后,板块整体承压,后续要等待新的订单催化才能重启升势。
六、投资策略——站在“算力黄金年代”的十字路口
特别声明: 以下策略属投研框架分析,非直接推荐。市场变化不可预测,投资者应关注市场数据的最新变化,独立自主决策,并承担投资盈亏。
五层产业链的投资价值排序
综合景气度、确定性和估值安全边际三个维度,我给Token产业链五个层级排个序。
第一梯队:配套基础设施层。 受益逻辑最直接——不管哪家模型赢,基础设施先收钱。光模块订单排到2027年,业绩确定性首屈一指,但估值高企,任何边际放缓信号都会被放大。中际旭创在“易中天”中竞争优势最强,一季报超预期程度最大,订单壁垒最深。液冷赛道方向确立,但个股甄别很重要——英维克一季报的教训犹在,佳力图等二线龙头在细分市场中有较高性价比。交换机、储能、光纤在组合中适合作为底仓配置,弹性偏小但稳定性好。
第二梯队:算力租赁层。 AI推理拐点已至,量价齐升逻辑顺畅。并行科技受益于技术优势和采购前瞻性,阿里云和火山引擎则有大厂生态加持。这个行业的危险在于竞争加剧和中尾部产能出清——鸿博股份的一季报就是一个活生生的警示牌。
第三梯队:芯片层。 国产芯片正从可用走向好用,DeepSeek V4的生态适配标志了一个质变临界点。海光信息、寒武纪、摩尔线程均受益于国产替代和算力需求双重驱动。但当前估值已不低,美国出口管制是永远绕不开的达摩克利斯之剑,更宜等待回调分批介入。
第四梯队:模型应用层。 弹性最大,不确定性也最大。C端赢者通吃效应最强,字节(豆包)的霸主地位短期难撼;B端和出海的智谱、MiniMax、DeepSeek各具特色。散户更适合用ETF做赛道配置,而非重仓押注单一个股。
第五梯队:智算中心层。 运营商和头部IDC属于基础设施型资产,政策背书最强、现金流最稳,弹性相对有限,适合稳健型资金做底仓配置。
五组下半年必须紧盯的核心矛盾
第一,国产芯片量产进度与良率。 2026年被寄予国产算力量产元年的厚望。良率能不能达标、产能能不能匹配订单,直接决定海光信息、寒武纪这些标的的估值中枢能否进一步上移。每个季度的财报预付和存货数据,就是跟踪的最核心先行指标。
第二,云厂商资本开支的节奏。 2026年上半年BAT和字节都在以千亿量级狂砸算力采购,这种力度下半年能不能维持,决定了整条产业链的景气天花板。重点紧盯阿里、腾讯、字节的季度财报电话会指引,任何措辞变化都会被市场放大。
第三,美股科技股的外溢效应。 美国MAG云厂商2026年 CAPE X指引接近翻倍,这个趋势能否持续,会通过光模块订单直接冲击A股。关注英伟达财报和美国科技股整体走势,光模块板块一向对美股映射极其敏感。
第四,出口管制与地缘政治。 中美科技博弈是长期变量。2026年下半年美国会不会进一步升级对华芯片出口限制?如果升级,国产替代逻辑会阶段性强化;但如果连推理芯片都被收紧,那整个产业链的运转可能受阻。
第五,估值风险的临界点。 “易中天”合计市值一度超越茅台,算力租赁PE普遍超百倍——市场定价已经极度乐观。国海证券也明确提示了风险:如果AI需求增速不及预期、云厂商资本开支放缓、或者H100供给释放快于预期,算力租赁价格可能回落。一旦某个环节出现“预期差”,高估值板块的连锁回调可能比想象中来得更快更猛。
组合配置思路
进攻型组合(高弹性,适宜风险偏好较高的活跃投资者): 国产芯片(海光信息、寒武纪)作为主线先锋,算力租赁(并行科技)吃量价齐升,光模块(中际旭创)锚定确定性,液冷(佳力图)补弹性。逻辑是把赛道领军者和细分黑马搭配起来,在高景气中博取超额收益。
稳健型组合(看重基本面确定性,适宜中长期价值投资者): 光模块(中际旭创)做底仓压阵,液冷(佳力图)挑质地更稳健的二线,智算中心/IDC(润泽科技)拿长线逻辑,交换机(紫光股份)、储能(宁德时代、阳光电源)、光纤(亨通光电)补充配置。这个组合抓的是“卖水人”的确定性,无论哪家模型胜出都要用到这些基座组件。
主题型组合(政策驱动,适合中长期事件研究型投资者): 以国产算力全栈为主线,关注华为昇腾概念、DeepSeek生态、字节AI产业链、智算中心新基建。事件驱动逻辑较强,需要对政策动态和行业新闻保持高度敏感,根据节奏灵活调整。
六、投资策略——站在“算力黄金年代”的十字路口
特别声明: 以下策略属投研框架分析,非直接推荐。市场变化不可预测,投资者应关注市场数据的最新变化,独立自主决策,并承担投资盈亏。
组合配置的实战思考
把上述五层分析和个股剖析串起来,在实际组合构建上,可以围绕三个差异化思路来展开。
进攻型配置。 以国产芯片为核心矛头(海光信息、寒武纪各配一定权重),算力租赁(并行科技)捕捉量价齐升弹性,光模块(中际旭创)作为确定性锚,液冷(佳力图)补充细分弹性。这个组合的总波动会比较大,芯片和算力租赁的估值已经包含了较高增长预期,一旦业绩兑现顺利,潜在收益空间也相应更高——但同样,一旦市场风险偏好收缩,这些品种的跌幅也不会轻。
稳健型配置。 把重心放在配套基础设施层,以中际旭创做大底仓,液冷端选佳力图等二线龙头降低个股黑天鹅风险,再搭配润泽科技吃智算中心IDC的长期逻辑,紫光股份分享交换机需求扩张,宁德时代和阳光电源覆盖算电协同的储能刚需,亨通光电补充光纤底仓。这组配置的目标不是博短期超额收益,而是追求在AI算力景气长周期中的稳定复利回报。
主题型配置。 适合对行业政策和技术进展有长期跟踪惯的投资者,核心抓的是阶段性题材爆发力。比如围绕国产算力全栈做文章——华为昇腾生态、DeepSeek适配链、字节系算力采购链——每一个主题催化都可能带来一波脉冲式拉升。关键在于催化剂识别和节奏把握,先于市场发现政策或技术节点,一旦事件兑现要及时评估是否了结。
不追热点,守逻辑
最后我想说一点自己的体会。2026年的算力行情,跟过去几年的新能源行情有一个共同的迷人之处——需求故事足够宏大,天花板足够高,产业链足够长,市场可以反复从中挖掘新的细分机会。但也正因为如此,它容易引诱投资者频繁追逐短期热点,在涨声中追高,在回调中割肉,来回损耗。
我自己在跟踪Token产业链的过程中,始终反复提醒自己的一个原则是:守逻辑,不追热点。 热点每天都在变——今天是DeepSeek适配,明天是OpenRouter排行,后天是云厂商提价——但核心逻辑不变:Token调用量还在指数级增长,算力依然是AI时代的稀缺资源,国产替代正在从预期走向现实。只要这三个底层逻辑没有松动,整条产业链的长期投资价值就还在。短期的估值波动、情绪起伏,都是这个长期逻辑之下的噪音。
对普通投资者而言,也许最好的策略不是试图踩准每一个题材轮动的节奏,而是在充分理解这条产业链之后,选择自己最认可的层级和最认可的标的,分批建仓,耐心持有。Token经济的故事不是月线级别的,而是年级别的。在这样一个量级的产业浪潮面前,有时候,慢就是快。
结语:长坡,厚雪,少踩坑
Token经济的画卷才刚刚展开。AI应用渗透率的提升远没有到头,Token消耗量的指数级增长短时间内不会停下。这是一条足够长的坡,雪也够厚。
但它同样暗藏沟壑。高估值、高预期、高敏感度的三重叠加,意味着任何边际变化都可能在短期触发剧烈波动。作为分析师,我们的本分是尽量客观地描摹产业面貌,厘清各层级的投资逻辑,坦诚指出每一个不能忽视的风险点。
如果这篇两万字的行业分析,能在你2026年的投资路上提供些许方向感,那便不枉了我连日梳理数据的功夫。祝投资顺利,看清方向,稳健前行。
---
【风险提示与免责声明】
本文全部内容为投研框架分析,不构成任何形式的投资建议或推荐。文中所有提及的上市公司及证券产品,仅作为行业研究的举例说明。Token产业链及相关行业虽处于高景气阶段,但个股估值已处于历史较高分位水平,下行风险同样显著。市场变化不可预测,投资者应关注最新数据变化,独立自主进行投资决策,并自行承担全部投资风险和盈亏。股市有风险,入市须谨慎。
话题与分类:
主题股票:
主题概念:
声明:遵守相关法律法规,所发内容承担法律责任,倡导理性交流,远离非法证券活动,共建和谐交流环境!
