您的位置:主页 > 公告动态 > 期货市场资讯 > 期货市场资讯
大模子618开启:阿里降价,百度免费-香港期货开
2024年5月,互联网大模子率先迎来“618”。
制图:周鑫雨
5月20日晚间,阿里云用一条“明天,又有事发生”的民众号贴文,放出了降价风声——21日早上10:00,通义千问模子家族宣布降价,开源和闭源均有差异水平的限免和降价政策。
其中,阿里云商业化的主力大模子Qwen-Long,输入价钱降幅甚至到达了97%,价钱从原有的20元/百万Tokens,直降为0.5元/百万Tokens。
这一价钱,以0.0003元/千Tokens的玄妙优势,击穿了5月15日字节刚刚宣布的“豆包大模子”的输入地板价:0.8元/百万Tokens。
然而,低价*刚易位4小时,百度就前来“掀翻了价钱地板”——文心一言两款模子ERNIE Speed和ERNIE Lite,直接宣布“免费”。
在2023年,模子的降价仍然遵从着训练效率优化和规模效应的自然趋势。
2023年11月,百度的大模子平台“文心千帆”,曾经调整了相同汉字数目对应的Token数,变相将模子的价钱降低了20%。与之对应地,是文心大模子的推理成本降低到了原来的1%。
但2024年的模子价钱战,开打得险些毫无预兆。
价钱断崖的劈头,是一条名为“DeepSeek V2”的鲶鱼。DeepSeek的出品机构“深度求索”的背后,是坐拥过万张英伟达A100 GPU的量化基金——幻方量化。
珞珈伊云完成数千万元资天使轮融资,德迅投资出手
5月6日,深度求索宣布了DeepSeek大模子的新版本V2。作为模子领域的“黑马”,2360亿参数规模的DeepSeek V2,模子性能处于国产*梯队,订价也没有什么肩负,支持32k上下文的模子API订价仅1元/百万Tokens(盘算)、2元/百万Tokens(推理),是彼时百度文心4.0-8k推理价钱(120元/Tokens)的1/60。
制图:周鑫雨
往后,大模子独角兽智谱AI率先加入了价钱战。5月11日,智谱AI旗下的GLM-3-Turbo,价钱从5元/百万Tokens,降低到了1元/Tokens。
“黑马”搅局模子订价的另一面,则是更具性价比的小模子被重提。
不少从业者对智能涌现示意,小模子的潜力还没被完全挖掘,完全可以通过数据治理、效率优化等战略,以小博大,这对于下游客户而言也是更有性价比的选择。
2024年4月22日,Meta宣布的开源模子Llama-3,就以70B的“小参数”,和跨越20倍参数目的GPT-4在性能上掰手腕。紧接着,微软又宣布了3.8B的模子Phi-3 mini,号称性能对标GPT-3.5,还能在苹果A16芯片上流通运行。
对于下游客户而言,昂贵的大模子不够“香了”。大厂大模子的整体降价,也是在顺应市场选择。
不外,即即是价钱砸穿地板,大厂们依然有利可图。大模子只是门面,大厂的渔翁之意,是通过模子卖自己的云服务。
以拥有自己的盘算集群的幻方量化为例,据SemiAnalysis盘算,在其算力服务力行使率最高的情形下,DeepSeek每台服务器每小时收益可达35.4美元,毛利率在70%以上。
但对于被迫卷入价钱战的小厂商和初创公司而言,营收的压力将会更大。2024年5月21日,零一万物CEO李开复就直言,不介入价钱战,最新模子Yi-Large的API订价仍为20元/百万Tokens。
未来,小厂们唯有在单点或多点性能上和竞争对手们拉开差距,才气分到蛋糕。