来源:民众期货 2024-05-23 17:00
5 月 21 日上午,阿里云在其例行峰会上,意外地释放了大降价的新闻:通义千问 GPT-4 级主力模子推理输入价钱降至 0.5 元/百万 tokens,直降 97%。
阿里云降价通告 | 泉源:阿里云
这个大幅度降价的新闻瞬间引发了与业界的普遍关注和讨论,但短短数小时连锁反映泛起了,百度智能云官宣文心大模子主力模子 ERNIE Speed(上下文长度 8K、128K)、ERNIE Lite(上下文长度 8K、128K)免费。虽然这两个模子和阿里宣布降价的模子并不完全对应,然则这个动作让许多人最先高呼中国大模子企业的 API 商业模式,岂非就这样在 3 小时内就消逝了吗?
文心大模子两大主力模子周全免费
现实上在更早之前,字节跳动宣布,豆包通用模子推理输入价钱为 0.8 元/百万 tokens。
虽然这些价钱背后在并发量,模子能力上有许多差其余细节区别,甚至凭证创业者的现实盘算,真正落到营业里用起来,各家的成本下降都没有宣传上那么夸张。
但至少纸面上看,每百万 token 推理输入量,字节、阿里、百度先后在一周内官宣了 0.8 元,0.5 元和免费的报价。有业界人士甚至开顽笑说,眼瞅着下一家跟进的厂商可能就得发钱津贴让客户用 API 了,在这么短的时间内发生这样猛烈的转变,到底是由于什么?这是一次市场宣传上的内卷?照样大模子 API 挪用的商业模式,就真的这么消解了吗?
01
价钱战背后,大模子
API 挪用的商业模式
实在最早 ChatGPT 宣布时,人人对大模子直接作为服务被挪用的商业模式有很大期待。事实,与上一波 AI 烟囱式的项目交付方式相比,大模子带来了更通用的 AI 能力,作为尺度化服务被挪用,原理上也说得通。
就拿 OpenAI 来说,有两大商业化手段,一是像 ChatGPT Plus 20 美元/月这样的会员订阅模式,另一个是开发者 API 挪用服务。在这两大尺度化服务的拉动下,2023 年 12 月 31 日,The information 爆出 OpenAI 的年度经常性收入(Annual Recurring Revenue,ARR)已经到达了 16 亿美元。
但即便强如 OpenAI 的模子能力,这个体量的营收相比其百亿美金级其余研发成本而言,现在看也照样杯水车薪。
事实上,只提供模子的 API,距离 AI 应用在场景中落地另有很大距离,大部门 AI 应用还需要在一个通用的模子 API 之上,在场景里喂数据、做微调等来优化模子引擎。看到这一瓶颈后,海内大模子厂商在已往一年也做了一系列探索来降低 AI 应用的门槛,以期扩大大模子的挪用量。
以百度智能云为例,去年相继推出模子开发工具 Model Builder 和 AI 应用开发工具 AppBuilder、更具效价比的差异模子等,但模子的挪用增进似乎依然有限。今年 4 月,百度智能云推出生态打法,和有渠道、场景的供应商一起互助服务客户,旨在进一步拉升文心大模子尺度化的 API 挪用量。这些迹象上看,大厂们显然并没有真的准备放弃 API 挪用的商业模式,但这个商业模式还没有真正收到陋习模的钱,倒是真的问题。
上周,百度最新宣布的数据显示,文心大模子日处置文本 2500 亿 token,另一大厂字节跳动日均处置 1200 亿 token 文本,但其中很大一部门是大厂内部营业在挪用做 AI 应用和营业探索。
可以看出,只管模子厂商做了许多实验,但尺度化的模子 API 并没有迎来确定性的增进。
这是本周大厂模子推理价钱降低的大条件和靠山。明白了模子 API 挪用的需求现状,也就不难明白这一波降价动作——降价并没有真的损失若干收入,不如激活下市场,赚个吆喝,促进许多企业从「免费试用」最先下水,早点启动对 AI 进入营业流的实验。
实在,这一波降价的连锁反映,真正的源头并不是阿里云,也不是字节跳动,比大厂降价更早的,是一家创业公司。
大模型卷价格,向量数据库卷什么?
5 月 6 日,海内创业公司幻方旗下的大模子公司「深度求索」开源了第二代 MoE 模子:DeepSeek-V2,主打参数更多、能力更强、成本更低。
由于 DeepSeek 的手艺优势在全球大模子圈子获得了普遍好评,而其在模子能力迫近*梯队闭源模子的条件下,还把推理成本降到了 1 块钱/百万 token,也就是说,成本是 Llama3 70B 的七分之一,GPT-4 Turbo 的七十分之一。而且,DeepSeek v2 还能做到有利润,这显然是是模子架构、系统、工程的一系列提高带来的成本降低。
这一信息在现实做模子应用的产业界引起了普遍讨论,在外洋也引起了不小的颠簸,半导体和人工智能自力研究机构 SemiAnaysis 称其性能直逼大模子 GPT-4 所代表的*梯队,同时推理价钱相当低,是不能小觑的中国气力。
DeepSeek v2 宣布其价钱为 1 元/百万 token 后,随即引来了大模子价钱战,智谱、面壁、字节、阿里、百度,以及今天跟进的科大讯飞、腾讯云相继宣布了模子推理价钱降低。
对于各家差其余降价战略,已经有一些质疑声音称一些降价的模子自己吞吐量就低,而高性能模子并没有降价。而且另有许多细节条款会让最终企业用起来没有宣传的那么廉价,从这个角度看,降价更多是模子厂商出于市场和品牌的考量,举行的一波内卷。
归根结底,能形成价钱战的连锁反映,也是当前各大模子的能力放在可用的场景中,尚未拉开差距,用户甚至有免费开源的产物可以用。
一位 SaaS 厂商首创人向极客公园示意,「对我来说用谁的实在无所谓,由于他们最后跑得都差不多,当把时间线拉长来看,最后这些厂商提供的模子 API 服务,99.9% 的概率跟今天的云是差不多的看法。另外,若是一个通用的模子 API 无法深度适配场景,照样要自己基于开源模子,用场景数据做专门的深度训练,也不会接通用的模子 API。」
最终的的客户需求,实在是端到端的诉求,是可以用、可以看到效果的器械,而不是模子挪用。
02
大模子,巨头和
创业公司有差其余游戏
固然,模子推理价钱降低自己也是手艺生长带来的一定效果,有一系列工程、架构、系统手段可以连续优化。今天破晓微软 Build 开发者大会上,纳德拉还举例注释了这一趋势。他说,已往一年 GPT-4 性能提升了 6 倍,但成本降低到了之前的 1/12,对应性能/成本提升了 70 倍。
「难的是探索模子能力上限,至于模子推理价钱一定有设施降低」,Minimax 首创人闫俊杰上周坐客极客公园直播节目中表述了这一手艺趋势,他示意,模子推理价钱降低到可用,在学术界已经发生过三次了,这不难。
模子手艺的攀升,才是 API 挪用商业模式能继续增进的条件。实在细看今天宣布降价的模子产物也是一样,真正大规模、高性能、支持高并发的模子推理照样要收费,降价幅度是有限的。
但耐久来看,API 模式最终磨练的照样模子能力,若是手艺拉不开差距,价钱也一定拉不开差距,最终模子挪用的价值会被稀释,虽然依旧是主要的基础设施,但价值巨细就从油变水了。
换一个角度看,今天一个通用的模子 API 可能不是迫切的需求。就像 Lepton.ai 的首创人贾扬清在同伙圈表达的看法,「站在整个 AI 业界的角度我想说,降价是个拍脑壳就可以做的简朴战略,然则真正的 To B 商业乐成更难。」今天企业在使用 AI 的时刻,并不是成本驱动的,「今天不是说 API 贵才没有人用,而是由于要搞清晰,到底怎么用起来发生营业价值」。
从这个角度看,若何把大模子能力推动到企业的营业里的很大一部门义务,可能又回落到传统 SaaS 厂商(用 AI 升级产物之后)手里,需要他们作为智能生产力的「干线物流」 「前置仓」,运送到各个场景中。
随着模子 API 直供模式的高度内卷,巨头实在已经在向能交付价值的 SaaS 看,微软今天宣称 GitHub Copilot 订阅者已经有 180 万付用度户。谷歌克日也正在与 CRM 营销巨头 Hubspot 谈高达 300 亿美金收购可能性,由于前者可能会行使这次收购来增强其在 AI 领域产物整合。
对于巨头而言,模子手艺和现实场景,两个都要抓,才气有规模化的收入。但归根结底,模子能力和别人拉开距离,才是 API 模式可以发生价值的「西岳一条路」的挑战。
而对于大模子创业公司而言,也是个「西岳两条路」的事态,即要么做出比大公司更好的模子手艺,要么从模子走向产物,直接缔造价值。
智能的能力不会是免费的,然则怎么规模化的缔造价值,巨头和创业公司,都还在寻找谜底。
————民众国际期货金融有限公司