2025全球AI芯片峰会 | 北极雄芯徐涛:前沿架构支持大模型应用的实践及展望

4小时前 阅读数 6 #综合
图片

9月17日,2025全球AI芯片峰会在上海举行,来自AI芯片领域的42位产学研专家及创业先锋代表,畅谈对大模型下半场中国AI芯片创新、落地、生存、破局的最新观察与思考。本届峰会以“AI大基建 智芯新世界”为主题,覆盖大模型AI芯片、架构创新、存算一体、超节点与智算集群技术等前沿议题。北极雄芯联创、副总裁徐涛应邀出席,并作主题演讲。


在下午的大模型AI芯片专题论坛上,北极雄芯与多家企业共同探讨创新的技术路径与最新进展。北极雄芯联创、副总裁徐涛以《前沿架构支持大模型应用的实践及展望》为主题进行分享。

大模型推理落地有效降本迫在眉睫。截至2025年6月,中国日均tokens消耗量突破30万亿,比2024年增长300+倍,且依然处于高速增长期。而大模型应用商业化闭环任重道远,一方面C段订阅付费较难,B端API调用收费与美国相比有数量级的差距,另一方面国内算力成本并不优于美国。北极雄芯联创、副总裁徐涛谈道,当前中国大模型应用落地商业化,解决成本问题至关重要。而受制于各类制裁,面对高速增长的算力、存储容量、内存带宽的“不可兼得三角”,国内上下游企业亟需共同开展架构创新。

在云端推理场景,北极雄芯将在近期推出面向Decode环节的专用加速方案,通过Chiplet+PIM/PNM的近存计算技术大幅降低推理成本至少一个数量级,相比主流GPU芯片提升10倍以上性价比。在端侧AI领域,北极雄芯的启明935系列芯粒通过Chiplet灵活组合应用,为主机厂提供AI Box、舱驾一体、高阶智驾等不同挡次应用的解决方案。

image.png

北极雄芯联创、副总裁徐涛



关于北极雄芯

北极雄芯致力于成为基于Chiplet的定制化高性能计算解决方案领航者,目前公司积累了CPU、NPU和GPU三款芯粒、面向多种工艺的D2D互连IP,可以向市场提供基于Chiplet技术的定制化高性能芯片开发解决方案。


 往期精彩回顾 

北极雄芯完成新一轮过亿元融资

▲北极雄芯Chiplet产品矩阵进入交付阶段

图片北极雄芯再获西安财金和沃格光电投资



版权声明

本文仅作者转发或者创作,不代表旺旺头条立场。
如有侵权请联系站长删除

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门