
当全球AI算力重心从训练加速转向推理,一场围绕性价比与能效的芯片战争正悄然爆发。
2025年以来,谷歌TPU v7高调锚定推理时代,英伟达重金整合Groq核心资产,行业共识已然形成:未来五到十年,推理芯片将主导AI的演进方向。在这场历史性窗口期中,中国企业能否凭借场景优势、工程创新与供应链韧性实现弯道超车?
2月3日,云天励飞(688343.SH)举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力 AI推理芯片战略布局。
云天励飞董事长兼CEO陈宁表示,公司将核心研发资源集中于攻克大模型落地的“成本壁垒”,致力于通过底层架构创新,力争实现百万 Tokens 推理成本降低 100 倍以上的目标,推动 AI 从技术尝鲜走向普惠生产力。
过去一年,全球算力产业风向标已发生显著偏转,重心正加速向推理侧倾斜。谷歌在2025年4月发布第七代TPU“Ironwood”时,明确将其定位为“面向推理时代”的基石,强调在大规模推理与能效上的系统化优化。
这一阶段的核心需求,已不再是依赖GPU、CUDA生态以及由数十万乃至百万张高性能计算卡互联所构建的“绝对算力”,而是转向对高性价比推理芯片的迫切需求。
陈宁表示,未来5~10年,将是AI推理芯片的高光时刻。行业的深刻变革、技术演进的趋势,以及时代赋予的历史性机遇,共同构成了我们在2025年坚定聚焦AI大算力推理芯片的战略驱动力。
过去一年多,无论是谷歌Gemini,还是字节跳动的豆包等大模型,其单模型对算力的需求,尤其是处理的Token数量,已呈数百倍增长。这些激增的Token,正如第四次工业革命中的“电”与“水”,已成为真正的核心生产力。而支撑如此海量Token处理的关键,并非训练(Training),而是推理(Inference)。
值得注意的是,就在上个月,英伟达以200亿美元的代价,虽未正式收购,但实质上整合了Groq最核心的资产。Groq由前谷歌TPU核心团队创立,英伟达通过引入其创始团队、核心技术人员,并获得其IP的永久授权,完成了这场战略性布局。
Groq的市值变化极具代表性,过去三年增长约7倍;而仅在2025年9月至2026年1月这短短四个月内,其估值便从70亿美元飙升至200亿美元,再度增长近3倍,增速甚至超越了英伟达自身。这一现象背后,折射出一个关键趋势:推理芯片的增长早已悄然超越训练芯片。未来的世界,属于推理芯片。
正因如此,云天励飞在2025年果断将芯片战略全面聚焦于云端大算力、大模型专用的推理芯片。无论是手机中的豆包助手、智能耳机里的实时同声传译,还是AR眼镜中驱动的AI模型,其核心诉求都是成本、效率与市场经济学,天博体育安卓版下载即每个Token背后的推理成本必须持续下降。
陈宁谈到,“我们的目标是:每年将百万Token的推理成本降低100倍,到2030年实现‘百亿Token仅需一分钱人民币’。唯有达到这一成本水平,AI才能真正引爆一场普惠性的工业革命。”
中国在AI应用场景的丰富度与落地速度上已全球领先,基础设施建设能力更是世界最强。然而,在模型层与芯片层,中国仍相对落后。但这也意味着巨大的追赶与超越空间。只要补齐模型与芯片这两块关键拼图,中国完全有能力引领第四次工业革命。
陈宁认为,客观而言,在训练领域,GPU与CUDA生态已由英伟达确立为全球事实标准,短期内难以撼动。但在推理芯片领域,格局尚未成型,谷歌TPU v7、Groq等新兴架构刚刚崭露头角,这为中国企业提供了历史性窗口。
因此,陈宁谈到,中国应在训练芯片领域持续追赶,确保差距不被进一步拉大;在推理芯片领域全力超车,依托中国丰富的应用场景、强大的电网与基建能力,以及蓬勃发展的开源模型生态,实现弯道超车。
也正是基于这一判断,云天励飞正在打造专为大模型推理优化的新型处理器架构GPNPU,并提出了“GPNPU= GPGPU+NPU+3D堆叠存储”的核心公式,旨在兼顾通用计算的通用性与 NPU 的高效性,在工程层面同时解决可迁移、可部署、可持续降本三大难题。
在通用生态层面,鉴于 CUDA 仍是全球最成熟、覆盖最广的加速计算平台之一,云天励飞的 GPNPU 架构致力于正视主流生态的迁移成本问题,能够实现一行代码完成 CUDA 程序兼容,极大降低了进入生产系统的门槛。
在推理能效层面,NPU 能够实现更高的计算效率和能效比,面对大模型推理这种高度结构化、可被体系化优化的负载,专用化设计带来的能效优势更容易转化为真实成本优势,这也是国际厂商持续加码专用路线的重要原因。
同时,针对行业公认的“内存墙”瓶颈,云天励飞正深度研发 3D 堆叠存储及更前沿的互连技术,以提升带宽与能效,降低推理时延。
在架构工程与产品化路径上,云天励飞采用“算力积木”架构,即通过 Chiplet 扩展与互连思路,将标准计算单元进行模块化封装与组合,让算力像搭积木一样按需扩展,形成从边缘到更大规模推理的弹性产品形态。
陈宁称,未来五年,云天励飞将全力打磨并推广DeepVerse 100、200、300系列芯片,覆盖互联网、通信运营商及各行业头部客户。这不仅是我们技术路线的落地体现,更将驱动公司营收进入高速增长通道。
而支撑公司跨越周期的,是长期积累构筑的商业护城河。陈宁将核心竞争力总结为技术、产能、生态、市场、资本五大关键要素。这五大维度的协同共振,将是云天励飞应对行业激烈竞争的底气。
针对行业普遍关注的供应链安全问题,云天励飞高级副总裁、CFO 兼董秘邓浩然谈到,公司目前是国内屈指可数手握充足国产产能保障的企业之一,这一战略储备为后续芯片的大规模量产与交付提供了确定性。
吃刨汤申福建写在前面的话:在重庆合川吃刨猪汤走红之时,我看到了乡村传统文化重振的希望,特以此文奉献给喜爱乡村传统文化的人们!吃刨汤,是川渝农家杀年猪后共享丰收喜悦的一种传统民俗,源于何时已无从考究。20世纪六七十年代,农村生活清苦。
寒潮将至,预防暴雪和气温骤降影响春运2月4日是中国传统二十四节气中的第一个节气——立春,全国大多地区气温继续升高,江南大部温暖如春。但自5日起,寒潮来袭,中东部将出现剧烈降温和雨雪天气,多个省份将降下大到暴雪或大暴雪,需防范雨雪天气和气温骤降对春运及能源供应带来影响。
来源:【四川日报-川观新闻】川观新闻记者 裴玉松 文露敏 文/图1月30日,尽管是个工作日,离成都世纪城新国际会展中心还有老远,就能听到展馆内沸腾的人声。当天,第29届中国(四川)新春年货购物节(以下简称“年货节”)在此开幕。
日本首相指名选举拟于2月18日举行;此前高市早苗称“达不成条件将即刻辞职”
据中国新闻网援引据日本共同社3日援引多名相关人士消息,日本政府和执政党已开始协调2月18日召集实施首相指名选举的特别国会。资料图:日本国会议事堂。据报道,被选出的首相将立即着手组建内阁,经在日本皇宫举行的首相任命仪式和内阁大臣认证仪式后,新内阁将正式成立。
又一白酒在四川“一炮打响”,399品质卖128,不是五粮液、泸州老窖!
你知道吗?四川盆地地处北纬 30 度黄金酿酒带,这个纬度有多神奇?它与法国波尔多、意大利托斯卡纳等世界著名葡萄酒产区完全重合。这里年平均气温 16-18℃,为微生物生长提供了完美的温床。其盆地广泛分布的紫色土和黄黏土,富含微量元素,是中国最肥沃的自然土壤之一。
河南一小学原校长称因与女教师恋爱被定为师德师风不合格 当地回应:将重新梳理处置流程
大皖新闻讯 2月4日,大皖新闻报道了河南一小学原校长称因与女教师恋爱被定为师德师风不合格一事,教育部门回应称依据纪委处分决定认定一事,引发关注。对此,当地区委有关部门负责人回应大皖新闻记者称,当地领导已亲自安排,将由纪委启动特殊事件的处理程序,重新梳理此事的处置流程。
其实黄金价格受宏观经济、地缘政治、供需关系、市场行为四大核心维度影响,各因素通过不同逻辑共同作用于价格走势: 一、宏观经济与货币政策(核心驱动) 1. 美元指数与黄金负相关 黄金以美元计价,美元走强时,非美元持有者购买成本上升,需求下降;美元走弱时,黄金吸引力增强。
最近有消息说,菲律宾在南海划了个军事演习区,连中国黄岩岛也算进去了,说白了,这就是在侵犯中国的领海、领土和领空,中国在主权问题上,从来都不会让步,肯定要坚决反击。