您的位置:主页 > 公告动态 > 期货市场资讯 > 期货市场资讯

被榨干的AI算力,谁将成为解药?-香港期货

大模子这股热风,已经吹到了上游算力。

随着百度、腾讯、阿里等纷纷拿出相关手艺结构以及底层设施贮备,为中国的ChatGPT奋力一战,麋集上线的大模子面临着伟大的算力需求,“算力从何而来”的问题随之搬上台面。

一方面,算力昂贵。以ChatGPT为例,支持其算力至少需要上万颗英伟达的GPU A100,单次模子训练成本跨越1200万美元。

另一方面,算力有限。今年4月5日,Open AI就因需求量过大为由关闭过ChatGPT Plus的付费渠道,这意味着仅公布几个月,OpenAI就曾面临算力缺口。

那么问题就来了,GPU烧钱且有限的算力现况,对于大模子来说是否就是*解?

“蹭”大模子和AIGC的热度,业内也涌现手艺及方案的“混战”。海内外云盘算大厂发力自研芯片和软硬件系统优化、二级市场CPO(共封装光学)观点股一起飙升、存算跳出来说是“突破逆境的清晰蹊径”、量子盘算更是被以为“*潜力的破局者”。

在投算力未来上,投资人也最先兵分几路,有人坚定烧GPU、有人最先刷起模子训练优化的项目,更有投资过存算、Chiplet的VC设计在赛道内寻找更优的投资标的,尚有投资量子盘算的机构在期待从底层到上层的一场算力革命的大发作。

俨然,这场“算力军备竞赛”在一级市场,已经暗潮涌动。

01 国产GPU:以量取胜

大模子的生长有算法、算力、数据三大主要因素。

算力是大模子训练的主要能量引擎,也是现在海内生长大模子产业的一大壁垒。芯片能力直接影响着高算力训练效果和速率,故而高端GPU芯片的数目若干,成为业内判断企业大模子能力的主要指标。

然而,对于海内大模子玩家而言,高端GPU芯片面临着入口受限的问题,已经由“买不买得起”变为“用不用得上”。据此前媒体报道,海内云厂商主要接纳的是英伟达的中低端性能产物,譬如GPU A800。

在外洋芯片能否撑起大模子的算力需求疑问下,一众GPU国产厂商也在捉住国产替换的契机。

然则,海内GPU芯片的云端训练公司如壁仞科技(通用GPU芯片BR100)、天数智芯(“智铠100”)、寒武纪(云端推理思元270)的产物虽在多媒体和图形处置的单精度浮点盘算FP32的理论指标上做得不错,但没有处置FP64的能力。

而大模子训练需要处置高颗粒度的信息,对云端训练芯片的芯片处置信息的精致度和算力速率要求更高,在超算领域,双精度浮点盘算能力FP64是举行高算力盘算的硬性指标。

英伟达的A100就同时具备上述两类能力。

凭证果然新闻,现在海内*支持FP64双精度浮点运算的只有海光推出的DCU(协处置器),然则它的性能只有A100的60%左右。

对此,沙漠创投VP俞悦坦言,虽然现在烧GPU是最为现实的方案,但就海内GPU厂商的角度,还需要更多时间去追赶。

普华资源合资人蒋纯则以为,手艺差距是一方面,尚有一方面是美国卡脖子的问题,这就要求海内企业想做高端GPU芯片,要有能力走出一条从装备到质料,完天下产化的蹊径。若是做不到,就只能退而求其次。

但这样的国产GPU对于大模子是否就无用了?否则。

蒋纯进一步注释,国产GPU即便做不出最壮大,但也能做泛起在所需要的产物,只是更多是以低端的GPU去追赶和堆叠,让一堆GPU通过优化和协调来协同作用,即以量取胜、再去组合模拟优化的路径。

值得注重的是,GPU越堆越多,内部治理的难度也就越大,故而提高GPU并行运行的资源行使率,做模子推理/训练优化的项目也最先在VC圈最先涌现,成为了一线投资人研究的偏向之一。

但就蒋纯来说,这类项目虽然有价值,也是个不错的偏向,但并不足以戳中他的心巴。他坦言,有时刻有价值的事纷歧定有好的商业模式。

“就系统来说,阿里、华为等大厂一定比小公司有优势。由于手艺从大环境里磨练出来,最后应用到大环境里。创业公司自力做,大公司一上来就学走了,要不就是手艺卖给大厂。”

而就GPU芯片而言,大厂又未必有*优势,反倒给了创业公司时机。

他示意,虽然大厂有资金、场景,但存在一个老问题,就是以部门形式来做,无法做到创业公司all in的 “疯狂”。而芯片有知识产权以及商业壁垒,创业公司有能力将芯片卖给大厂。

02 GPU“防守”,存算“包抄”

值得注重的是,烧GPU,并非恒久之策。

动辄几亿算力投入的模子训练阶段只是最先,模子推理应用阶段算力成本更是可能高达百亿级别。大算力之下,背后的功耗更是惊人。

围攻英伟达,三大巨头的芯片再出招!

全球零碳研究中央曾大略合计了ChatGPT全生命周期的碳足迹:自 2022 年 11 月 30 日运行以来,其制造装备的碳排放量跨越了33. 41 吨,模子训练碳排放跨越 552 吨,运行 60 天碳排放约为229. 2 吨。

而随着模子越来越大,根据传统方式盘算将越来越贫苦。而海内想用高端GPU这一传统的数字电路方式来解决大算力,存在上游质料、装备等基本障碍,短期难以解决。

面临未来潜在的算力指数增进,也有不少企业和VC开启了换挡操作,以存算、Chiplet等手艺,来到达能够支持大模子的算力。

其中,就存算赛道来说,身处一线的蒋纯显著感受到变热闹了。

2019年投知存科技时,他发现许多人还不知道存内盘算,而现在这个能手艺壁垒的赛道,他考察到创业公司可能有近10家,且热度还在延续升温。

“越来越多人会发现存内盘算在全球的大模子时代异常主要。传统的盘算机系统架构是顺应盘算麋集型应用的,而现在AI都是数据麋集型应用,以是一定要有新的架构来更好地应对AI这种数据麋集型应用。从原理上来说,存内盘算是一种解决AI算力需求的根个性手段,而且相较于量子盘算、光盘算而言更有望在短期内实现出来。芯粒跟堆叠也会对AI类盘算提供辅助。”

蒋纯示意,存算即用器件自己特征来算,相当于是一次并行盘算,譬如ChatGPT 1700多亿参数,传统的数字电路要算许多次,而存算可能一个节奏就能算完。至于堆叠,则是将一片memory和一片逻辑电路堆在一起,缔造了一个有伟大内存的CPU,应用在大模子上就会异常好地加速运算。

蒋纯对赛道的感受简直也跟果然数据显示相一致。

据企查查数据显示,存算赛道2018年-2019年融资生意数目为11笔,而2020年至今,融资生意数为28笔,其中有22笔集中在2021年至2022年间,加速态势显著。

但他也指出,现在全球已做生意用的存算照样用在边缘端,譬如高保真降噪耳机等,以低功耗带来高算力。与此同时,从公司战略上来看,现在存算企业可分为两派。

一派是上来就大容量的盘算,要狂投入研发成本,短期看不出效果,融资几轮估值上百亿,但最后没有功效,就会越到后面越难做,可能就无人接盘;而另一派则是小步快跑,先流片、应用,甚至搭生态,边研发边回血,让投资人有信心续投,也是蒋纯以为海内存算企业更现实的生长战略。

据他考察,现在大模子出来之后,投资人在看到市场的远景下,对这两派存算企业都有意愿去投钱,纵然当下没有功效展示。

“我们投的时刻,这些手艺一定有许多的不确定性,譬如能不能做出来,能不能成为主流。现在来看确定性是越来越高了,存算企业都在做大模子支持的相关研发,优质项目会出现加速生长的态势。我以为5年内,存算能够成为一个对照成熟的解决方案,甚至有可能是主流解决方案。”

在这场全球手艺较量中,蒋纯以为GPU跟存算是合大于竞的关系:GPU作为现在最成熟的方案,不能放弃,需要有一批公司扛着,来正面刚;而存算属于包抄穿插进攻,打破外洋手艺壁垒,实现新手艺的换道超车。

03 防御进攻都有了,量子盘算还能做什么?

根据上述所说,大模子算力之争,短期看GPU自研,中期看存算、Chiplet,那么被投资人视为新盘算偏向的量子盘算在其中又能饰演什么角色?

事实上,VC对量子盘算的关注不只限于此次ChatGPT的热潮,AR/VR、5G等新应用场景的不停涌现,以及种种型的应用场景发作式增进,让市场对算力的需求水涨船高,产业亟待挖掘具有推翻性的盘算形式。

量子盘算作为一种新型架构的盘算,可以实现指数级算力提升,更可谓是不得不关注的焦点。

据企查查数据显示,2017年至今,海内量子盘算赛道共完成31起融资事宜,果然披露融资金额超25亿元,融资主要发生在2021年及以后,占比近7成。其中图灵量子、本源量子、量旋科技、玻色量子、国仪量子等在近年获多轮融资。

对于这一疑问,量旋科技CEO项金根对量子盘算跟经典盘算机的算力差距,给出了飞机和地面交通工具的比喻。

他示意,当下存算、光芯片、其他一些封装的改善手艺,本质上照样经典盘算机的局限,它运算的原理跟GPU本质上没有太大改变,更多是在传统的框架下做的一些改善,使得人工智能的芯片效率更高。

对于现有的AI芯片、存算一体或其他封装手艺对AI算力的提升,项金根示意认可,同时他也以为需要差异维度去看差异解决方案对算力的助力,这内里纷歧定存在*解。

“未来,量子盘算机一定能够助力人工智能。AI需要的算力会越来越多,到 2030 年左右可能不光是算力,连耗电量都是异常恐怖的数据级。以是要真正解决AI大规模的算力需求,量子盘算机是一个很有潜力的应用偏向,而且量子盘算机的运算模式跟人工智能有自然的贴合性,量子盘算机可以加速AI的一些应用场景,而AI亦可以加速量子盘算的研发,优化其操控精度。”

那么,云云具有革命性的量子盘算何时能应用到AI领域?项金根以为,到2030年行业生长顺遂进入容错量子盘算阶段,将可能是一个落地的时间点。

相较于项金根给出的10年之约,俞悦以为量子盘算相关算法在一些行业特定义务上的实验落地,在这个时间点可能会有一些效果,至于解决AI的通用义务上,他则相对守旧地给出了“50年”的看法。甚至投了图灵量子的遐想创投也示意,量子盘算从产业化的角度看,仍挑战诸多,充满时机。

遐想创投坦言,量子盘算落地需要解决百万量子比特操作能力、低环境要求、高集成度等焦点问题,具有较高的入局门槛,其产业化仍面临手艺路径不确定、人才贮备稀缺、产业链配套早期以及无法用传统的逻辑、电路头脑举行推导和复刻的四大痛点。

云云看来,这些问题待解之下,量子盘算就略微显得理想丰满、现实骨感。

此外,俞悦还指出,从逻辑上说,量子盘算一定能解决许多算力问题,但即便云云,还需要连系成本,才气知道量子盘算是不是一个从投入产出看的*方案。

在俞悦看来,眼下量子盘算行业还未发生一些根个性的转变希望,中短期与其寄希望于其他方案来解决大模子所遇到的算力问题,不如指望GPU这些经典盘算的硬件价钱能下来。

“解决算力的成本一定会越来越廉价,GPU价钱对于大模子玩家来说只是暂时的,终究不会对AI生长组成太大瓶颈。而其他方案的成熟还需要许多配套的软件生态匹配,相对来说更是一个异常长周期的事情。”