首页 / 新闻 / 大模型背景下,AI芯片厂商面临怎样的机遇与挑战?

大模型背景下,AI芯片厂商面临怎样的机遇与挑战?

作者: 兆光科技 发布时间: 2025/04/07 点击: 1565次

百舸争流,创新者先

从2022.11.30的ChatGPT,到2023.6.13的360智脑大模型2.0,全球AI界已为大模型持续疯狂了七个多月。ChatGPT们正如雨后春笋般涌现,向AI市场投放一个个“炸弹”:办公、医疗、教育、制造,亟需AI的赋能。

而AI应用千千万,把大模型打造好才是硬道理。

对于大模型“世界”来说,算法是“生产关系”,是处理数据信息的规则与方式;算力是“生产力”,能够提高数据处理、算法训练的速度与规模;数据是“生产资料”,高质量的数据是驱动算法持续迭代的养分。在这之中,算力是让大模型转动的前提。

我们都知道的是,大模型正对算力提出史无前例的要求,具体的表现是:据英伟达数据显示,在没有以Transformer模型为基础架构的大模型之前,算力需求大致是每两年提升8倍;而自利用Transformer模型后,算力需求大致是每两年提升275倍。基于此,530B参数量的Megatron-Turing NLG模型,将要吞噬超10亿FLOPS的算力。

 (AI不同模型算法算力迭代情况 图源:格隆汇)

作为大模型的大脑——AI芯片,是支撑ChatGPT们高效生产及应用落地的基本前提。保证算力的高效、充足供应,是目前AI大算力芯片厂商亟需解决的问题。

GPT-4等大模型向芯片厂商狮子大开口的同时,也为芯片厂商尤其是初创芯片厂商,带来一个利好消息:软件生态重要性正在下降。

早先技术不够成熟之时,研究者们只能从解决某个特定问题起步,参数量低于百万的小模型由此诞生。例如谷歌旗下的AI公司DeepMind,让AlphaGO对上百万种人类专业选手的下棋步骤进行专项“学习”。

而小模型多了之后,硬件例如芯片的适配问题迫在眉睫。故,当英伟达推出统一生态CUDA之后,GPU+CUDA迅速博得计算机科学界认可,成为人工智能开发的标准配置。

现如今纷纷涌现的大模型具备多模态能力,能够处理文本、图片、编程等问题,也能够覆盖办公、教育、医疗等多个垂直领域。这也就意味着,适应主流生态并非唯一的选择:在大模型对芯片需求量暴涨之时,芯片厂商或许可以只适配1-2个大模型,便能完成以往多个小模型的订单。

也就是说,ChatGPT的出现,为初创芯片厂商们提供了弯道超车的机会。这就意味着,AI芯片市场格局将发生巨变:不再是个别厂商的独角戏,而是多个创新者的群戏。

本报告将梳理AI芯片行业发展概况、玩家情况,总结出大算力时代,玩家提高算力的路径,并基于此,窥探AI大算力芯片的发展趋势。

国产AI芯片,正走向AI 3.0时代

现阶段的AI芯片,根据技术架构种类来分,主要包括GPGPU、FPGA、以 VPU、TPU 为代表的 ASIC、存算一体芯片。

根据其在网络中的位置,AI 芯片可以分为云端AI芯片 、边缘和终端AI芯片;

云端主要部署高算力的AI训练芯片和推理芯片,承担训练和推理任务,例如智能数据分析、模型训练任务等;

边缘和终端主要部署推理芯片,承担推理任务,需要独立完成数据收集、环境感知、人机交互及部分推理决策控制任务。

根据其在实践中的目标,可分为训练芯片和推理芯片:

纵观AI芯片在国内的发展史,AI芯片国产化进程大致分为三个时代。

1.0时代,是属于ASIC架构的时代

自2000年互联网浪潮拉开AI芯片的序幕后,2010年前后,数据、算法、算力和应用场景四大因素的逐渐成熟,正式引发AI产业的爆发式增长。申威、沸腾、兆芯、龙芯、魂芯以及云端AI芯片相继问世,标志着国产AI芯片正式启航。

2016年5月,当谷歌揭晓AlphaGo背后的功臣是TPU时,ASIC随即成为“当红辣子鸡”。于是在2018年,国内寒武纪、地平线等国内厂商陆续跟上脚步,针对云端AI应用推出ASIC架构芯片,开启国产AI芯片1.0时代。

ASIC芯片,能够在某一特定场景、算法较固定的情况下,实现更优性能和更低功耗,基于此,满足了企业对极致算力和能效的追求。

所以当时的厂商们,多以捆绑合作为主:大多芯片厂商寻找大客户们实现“专用场景”落地,而有着综合生态的大厂选择单打独斗。

地平线、耐能科技等AI芯片厂商,分别专注AI芯片的细分领域,采用“大客户捆绑”模式进入大客户供应链。

在中厂们绑定大客户协同发展之际,自有生态的大厂阿里成立独资芯片公司平头哥,着眼AI和量子计算。

2019年,平头哥发布的第一款AI芯片含光800,便是基于ASIC架构打造,用于云端推理。据阿里介绍,1颗含光800的算力相当于10颗GPU,含光800推理性能达到78563 IPS,能效比500 IPS/W。相比传统GPU算力,性价比提升100%。

在1.0时代,刚出世的国内芯片厂商们选择绑定大客户,有综合生态的大厂选择向内自研,共同踏上探索AI芯片算力的征途。

2.0时代,更具通用性的GPGPU“引领风骚”

尽管ASIC有着极致的算力和能效,但也存在着应用场景局限、依赖自建生态、客户迁移难度大、学习曲线较长等问题。

于是,通用性更强的GPGPU(通用图形处理器)在不断迭代和发展中成为AI计算领域的最新发展方向,当上AI芯片2.0时代的指路人。

自2020年起,以英伟达为代表的GPGPU架构开始有着不错的性能表现。通过对比英伟达近三代旗舰产品发现,从FP16 tensor 算力来看,性能实现逐代翻倍的同时,算力成本在下降。

于是,国内多个厂商纷纷布局GPGPU芯片,主打CUDA兼容,试探着AI算力芯片的极限。2020年起,珠海芯动力壁仞科技、沐曦、登临科技天数智芯瀚博半导体等新势力集结发力,大家一致的动作是:自研架构,追随主流生态,切入边缘侧场景。

在前两个时代中,国产AI芯片厂商都在竭力顺应时代潮流,前赴后继地跟随国际大厂的步伐,通过研发最新芯片解决AI算力芯片的挑战。

我们能看到的变化是,在2.0时代中,国产AI芯片厂商自主意识觉醒,尝试着自研架构以求突破。

3.0时代,存算一体芯片或成GPT-4等大模型的最优选

ASIC芯片的弱通用性难以应对下游层出不穷的应用,GPGPU受制于高功耗与低算力利用率,而大模型又对算力提出前所未有的高要求:目前,大模型所需的大算力起码是1000TOPS及以上。

以 2020 年发布的 GPT-3 预训练语言模型为例,其采用的是2020年最先进的英伟达A100 GPU, 算力是624TOPS。2023年,随着模型预训练阶段模型迭代,又新增访问阶段井喷的需求,未来模型对于芯片算力的需求起码要破千。

再例如自动驾驶领域,根据财通证券研究所表明,自动驾驶所需单个芯片的算力未来起码要1000+TOPS:2021年4月, 英伟达就已经发布了算力为1000TOPS的DRIVE Atlan芯片;到了今年,英伟达直接推出芯片Thor,达到2000TOPS。

由此,业界亟需新架构、新工艺、新材料、新封装,突破算力天花板。除此之外,日渐紧张的地缘关系,无疑又给高度依赖先进制程工艺的AI大算力芯片厂商们提出新的挑战。

在这些大背景下,从2017年到2021年间集中成立的一批初创公司,选择跳脱传统冯·诺依曼架构,布局存算一体等新兴技术,中国AI芯片3.0时代,正式拉开帷幕。

目前存算一体,正在上升期:

学界,ISSCC上存算/近存算相关的文章数量迅速增加:从20年的6篇上涨到23年的19篇;其中数字存内计算,从21年被首次提出后,22年迅速增加到4篇。

产界,巨头纷纷布局存算一体,国内陆陆续续也有近十几家初创公司押注该架构:

特斯拉2023 Investor Day预告片末尾,特斯拉的dojo超算中心和存算一体芯片相继亮相;在更早之前,三星、阿里达摩院包括AMD也早早布局并推出相关产品:阿里达摩院表示,相比传统CPU计算系统,存算一体芯片的性能提升10倍以上,能效提升超过300倍;三星表示,与仅配备HBM的GPU加速器相比,配备HBM-PIM的GPU加速器一年的能耗降低了约2100GWh。

目前,国内的亿铸科技知存科技苹芯科技九天睿芯等十余家初创公司采用存算一体架构投注于AI算力,其中亿铸科技、千芯科技偏向数据中心等大算力场景。

现阶段,业内人士表示,存算一体将有望成为继CPU、GPU架构之后的第三种算力架构。

该提法的底气在于,存算一体理论上拥有高能效比优势,又能绕过先进制程封锁,兼顾更强通用性与更高性价比,算力发展空间巨大。

在此基础上,新型存储器能够助力存算一体更好地实现以上优势。目前可用于存算一体的成熟存储器有NOR FLASH、SRAM、DRAM、RRAM、MRAM等。相比之下,RRAM具备低功耗、高计算精度、高能效比和制造兼容CMOS工艺等优势:

目前,新型存储器RRAM技术已然落地:2022上半年,国内创业公司昕原半导体宣布,大陆首条RRAM 12寸中试生产线正式完成装机验收,并在工控领域达成量产商用。据昕原半导体CTO仇圣棻博士介绍,昕原RRAM产品的良率已经超过93%。

随着新型存储器件走向量产,存算一体AI芯片已经挺进AI大算力芯片落地竞赛。

而无论是传统计算芯片,还是存算一体芯片,在实际加速AI计算时往往还需处理大量的逻辑计算、视频编解码等非AI加速计算领域的计算任务。随着多模态成为大模型时代的大势所趋,AI芯片未来需处理文本、语音、图像、视频等多类数据。

对此,初创公司亿铸科技首个提出存算一体超异构AI大算力技术路径。亿铸的畅想是,若能把新型忆阻器技术(RRAM)、存算一体架构、芯粒技术(Chiplet)、3D封装等技术结合,将会实现更大的有效算力、放置更多的参数、实现更高的能效比、更好的软件兼容性、从而抬高AI大算力芯片的发展天花板。

站在3.0时代门口,国产AI大算力芯片厂商自主意识爆发,以期为中国AI大算力芯片提供弯道超车的可能。

AI芯片市场的发展动力,大抵来源于以下几个因素。

中央与地方政府正为提供充足算力而奔波

2023年2月,中央政府发布多个相关报告与布局规划,强调东数西算中算力的调动,目前已落下一子:东数西算一体化服务平台。

地方政府层面,例如成都在2023年1月,发布“算力券”,即将政府算力资源与算力中介服务机构、科技型中小微企业和创客、科研机构、高校等共享,有效提高算力利用率;北京在2023年3月,发布加快落实算力的相关意见,加快计算中心、算力中心、工业互联网、物联网等基础设施建设。

基于国家与地方政府相关政策指引,AI厂商们纷纷建立起超算/智算中心,较于以往不同的是,今年算力的首个市场化运作模式诞生,智算中心算力的规模也实现质的飞跃:据国家信息中心与相关部门联合发布的《智能计算中心创新发展指南》显示,目前全国有超过30个城市正在建设或提出建设智算中心。

AI芯片产业布局规划持续落地

可以看到,关于AI芯片政策已从“十三五”的规划阶段,来到“十四五”的落地阶段:提高AI芯片研发技术,推广AI应用。

同时,各地明确提出,要加强AI芯片产业布局。在这之中,浙江、广东、江苏等省份均提出了至2025年,人工智能芯片领域的具体发展方向。

存算一体正成为地方算力产业新机遇

存算一体,正成为深圳算力产业链创新发展的新机遇,并在积极落地之中。

2023年4月2日,在第二届中国产业链创新发展峰会新一代信息技术产业发展论坛上,北京大学深研院信息工程学院副院长杨玉超表示,深圳将立足于相对完善的产业链集群,从先进工艺与封装、创新电路与架构、EDA工具链、软件与算法生态这四个方面解决存算一体在产业化应用上的挑战。

今年4月,中国大模型正式爆发,未来,对于AI大算力芯片的需求只增不减。

现有的大模型,正向着英伟达A100大算力芯片狮子大开口:

故例如商汤等AI厂商,正把眼光放置在国产AI大算力芯片上:2023年4月10日商汤披露,目前商汤所用的国产化AI芯片占比达到总体的10%。这无疑,将加速国内AI芯片厂商的成长。

英伟达表示,未来将从GPU架构出发,走向“GPU+DPU的超异构”:推出NVLink-C2C 、支持UCLe+芯粒+3D封装;推出Thor“超异构”芯片2000T;

AMD表示,未来硬件创新突破更难,将走向“系统级创新”,即从整体设计的上下游多个环节协同设计来完成性能的提升。

千亿美元的AI芯片市场,2023火得滚烫

整体人工智能产业链,基本分为基础层、技术层和应用层三个层面:

基础层包括AI芯片、智能传感器、云计算等;技术层包括机器学习、计算机视觉、自然语言处理等;应用层包括机器人、无人机、智慧医疗、智慧交通、智慧金融、智能家居、智慧教育、智慧安防等。

基础层作为人工智能行业发展的基础,为人工智能提供数据和算力支撑,其中,AI芯片是人工智能算力的基础。

在AI产业尚未成熟之时,基础层企业当前价值量最大,中国人工智能产业链中,基础层企业比例达到83%,技术层企业比例为5%,应用层企业比例为12%。

基础层决定大楼是否稳固,而下游的应用层面决定大楼高度。在应用层,智能机器人、无人机等智慧终端潜力无限,智慧城市、智慧医疗等领域,更是有不少金子能挖。目前,我国智能机器人市场规模持续快速增长。

数据显示,2017-2021年我国智能机器人市场规模从448亿元增长至994亿元,期内年均复合增长率达22.05%,预计2023年其市场规模将达1300亿元。

据中国信通院数据统计,中国智慧城市市场规模近几年均保持30%以上增长,2021年市场规模达21.1万亿元,预计2023年其市场规模将达28.6万亿元。

千亿美元市场,AI芯片魅力无限

在全球数字化、智能化的浪潮下,技术层的技术正不断迭代:自动驾驶、影像辨识、运算等技术正在各领域深化应用;与此同时,应用层的物联网设备正不断丰富:工业机器人、AGV/AMR、智能型手机、智能音箱、智能摄影机等。

这无疑,会推动基础层的AI芯片与技术市场迅速成长。根据灼识咨询数据,2022年全球AI芯片市场规模达到960亿美元,预计2027年达到3089亿美元,2022年至2027年的复合年增长率为23%:

国内的AI芯片市场,更为火热:根据灼识咨询数据,2022年中国AI市场规模达到319亿美元,预计于2027年将达到1150亿美元,2022年至2027年的复合年增长率为29.2%。

2021,AI芯片赛道迎来风口

随着下游安防、汽车等市场需求量增大,再加上2019年以来,美国持续制裁国内厂商的动作,2021年,国内AI芯片赛道迎来风口。在这一年里,资本们竞相挑选属于中国AI芯片市场的“潜力狗”,以期掌握未来芯片市场的话语权。尽管2022年投资热度有所回落,但总体金额仍超百亿元。

(2016-2023年中国人工智能芯片行业融资整体情况 图源:前瞻经济学人APP)

C轮后的融资较少,AI芯片市场仍处于萌芽期

通过分析投资轮次发现,AI芯片市场仍处于萌芽期:目前人工智能芯片行业的融资轮次仍处于早期阶段,C轮后的融资数量较少。

(2016-2023年中国人工智能芯片行业投融资轮次情况 图源:前瞻经济学人APP)

存算一体成为香饽饽

细分赛道来看,GPU是价值量最高的赛道,摩尔线程等GPU玩家融资超10亿,荣获“MVP”;

而存算一体赛道融资公司数量最多,亿铸科技、知存科技等七家存算一体玩家,备受资本青睐。值得注意的是,存算一体赛道下的四家初创公司亿铸科技、知存科技、苹芯科技、后摩智能,已连续两年获得融资。

国内AI大算力赛道,玩家几何?

目前,寒武纪、平头哥等1.0时代玩家,现已成为优质AI算力芯片上市公司;2.0时代涌现的非上市AI算力芯片公司如壁仞科技、登临科技、天数智芯等在产品端持续发力;3.0时代,千芯科技、亿铸科技等初创公司正在存算一体这一架构上寻求突破。

经偲睿洞察整理发现,目前,多数AI芯片公司布局边缘侧、中心侧偏小算力场景,例如智慧安防、智慧城市、智慧医疗等应用场景;壁仞科技、平头哥、亿铸科技能够覆盖边缘侧、中心侧偏大算力场景;在新一批初创企业中,亿铸科技做出大胆的尝试,试图用存算一体架构去做大算力场景。

故,我们按照架构以及应用场景分类,呈现出以下AI算力芯片中游厂商全景图:

ChatGPT火爆来袭,引发AI产业巨浪,国产AI芯片正迎来3.0时代。在大模型催生的3.0时代,亟需AI大算力芯片提供充足算力,让日益沉重的大模型快速滚动起来。

大模型盛行,芯片厂商如何解决大算力难题?

算力,即国力

伴随“元宇宙”时代开启,GPT-4等大模型来势汹汹,数据流量将迎来爆发增长。据IDC预测数据,预估未来五年,全球算力规模将以超过50%的速度增长,到2025年整体规模将达到3300EFlops。而2025年全球物联网设备数将超过400亿台,产生数据量接近80ZB,且超过一半的数据需要依赖终端或者边缘的计算能力进行处理。

(全球算力需求未来增长情况 图源:中国银河证券研究院)

(全球算力增长速度明显落后于数据量增长 图源:中国银河证券研究院)

数据量暴增,各国急需算力维系数据的正常运转,各国之间的算力之争,正式打响。而事实上远不止算力之争这么简单,这背后,是各国国力的角逐。

2022年3月,由IDC、浪潮信息、清华大学全球产业研究院联合编制的《2021-2022全球计算力指数评估报告》,揭示了现如今“算力与国力”的基本关系:

全球各国算力规模与经济发展水平显著正相关,算力规模越大,经济发展水平越高。计算力指数平均每提高1点,数字经济和GDP将分别增长3.5‰和1.8‰;美国和中国的计算力指数分别为77分和70分,明显领先其他国家的计算力指数。

场景众多,不同的算力场景,对芯片的要求不同

小至耳机、手机、PC,大到汽车、互联网、人工智能(AI)、数据中心、超级计算机、航天火箭等,“算力”都在其中发挥着基础核心作用。而不同的算力场景,对芯片的要求不同:

可以看到,数据中心由于其算法多样、迭代速度更快等特性,对芯片的要求尤其高:既要其高算力、又要其低功耗、低成本、高可靠性,还要其具备更高的通用性。


标签: AI

版权申明:本站文章部分自网络,如有侵权,请联系:hezuo@lyzg168.com

特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

联系我们

输入您的联系信息,我们将尽快和你取得联系!

洛阳兆光网络科技有限公司

Tel:18623768730

企业QQ:210603461

Emile:hezuo@lyzg168.com

地址:洛阳市西工区王城大道221号富雅东方B座1711室

网站:https://www.lyzg168.com

洛阳app开发,洛阳app开发公司,洛阳手机软件开发,苹果保上架,洛阳网站开发,洛阳网站制作,洛阳微信定制开发

我们的微信

关注兆光,了解我们的服务与最新资讯。

Copyright © ​2018-2019 洛阳兆光网络科技有限公司 豫公网安备41030302000813号 豫ICP备18025879号