智谱AI因算力告急,限售GLM Coding Plan编程套餐

2025年1月21日,智谱发布公告,宣布对GLM Coding Plan编程套餐限售,每日可销售量降低为之前的20%。

智谱表示,近期部分用户在模型调用高峰期(工作日15:00-18:00)遇到了不同程度的并发限流报错、模型速度变慢等问题。为了保障已有用户权益,智谱宣布暂时限量发售GLM Coding Plan,限售后每日可销售量降为当前的20%。限售将从1月23日10:00开启,后续每日10:00刷新额度。

回归商业本质,智谱当前价格和额度卖的Coding Plan必然难以持续。

智谱招股书显示云端部署业务毛利为0,这还是2025上半年按照原价售卖API。下半年开始主推的coding plan,交20人民币一个月可以用掉几十亿token,官方文档写明了相当于api原价的0.1折。2025下半年财报的api毛利,可想而知。

Coding Plan的订阅和ChatGPT完全不同。ChatGPT用户面更广,以小白为主,一天聊天能聊多少?代码领域就大量消耗token,代码库读入就是10K以上。程序员的用户群体天生喜欢狂用,榨干订阅套餐的全部额度。

智谱Coding Plan Lite,20人民币一个月,每5小时可以调用120次prompt,宣传语强调是Claude Pro的3倍。

问题在于,Anthropic给Claude Code的使用量限额是经过计算之后,能够维持利润和运行的合理区间。Claude Pro套餐,20美元一个月,在Claude Code里面每5小时只能用40条消息。超过了,要么升级200美元一个月的套餐,要么按照API价格计费。

Claude Pro价格是智谱Coding Plan的7倍,智谱的额度却是3倍,一来一去就是21倍。当真这是永动机和做慈善吗?

更麻烦的是,因为Coding Plan超售,已经严重影响到了智谱正常API业务了。GLM 4.7 和 4.6,后台的速率限制并发砍成了1。并发为1,意味着大多数API用例都无法使用了。

注意,这不是coding plan,是正常用户API付费调用。

更不用说智谱家的API本来输出稳定性就堪忧,断断续续,ttft首token延迟有时候需要10秒,平均输出速度20tps。

GLM 4.5 一直到 4.7 在模型能力上的进展是喜人的,那就让付费的API用户能好好用,而不是推出一些商业上完全无法平衡的产品,反过来挤占正常用户使用。


已发布

分类

,

来自

评论

一条对“智谱AI因算力告急,限售GLM Coding Plan编程套餐”的回复

  1. […] 事实上,本网站在此前智谱宣布限售Coding Plan时就指出—— […]

发表评论

了解 AI前哨 的更多信息

立即订阅以继续阅读并访问完整档案。

继续阅读