2025年底OpenAI在ChatGPT当中推送年度总结,用户能看到自己发了多少消息、打败了多少人。不少用户都在社交媒体上发帖展示。
ChatGPT年度总结的海报分享内容会显示年度消息发送条数,并显示TOP 5% Message Sent等字样。笔者通过曲线拟合发现,ChatGPT用户平均每年发送1138条消息,也即每天3条。

我们收集了一批数据,试着反推ChatGPT整体的用户使用分布。
为什么几个数据点就能反推?因为互联网产品的用户使用行为,普遍呈现对数正态分布。背后逻辑是,一个人用多少是多个因素相乘的结果——兴趣、时间、需求、习惯等等。每一个因素都满足正态分布,相乘过程天然产生对数正态分布。
社交平台发帖量、App日活时长、SaaS产品调用次数,拟合出来基本都是这个形状:大量轻度用户,少数重度用户,右侧拖着长长的尾巴。既然知道分布形态,用几个高分位点拟合两个参数就行了。
数据采集
笔者在社交媒体上查询相关帖子,每个百分位数采集策略是每个档位取下限。
ChatGPT的百分位采取了相应的四舍五入策略,例如Top 1%,消息从6800条到100K都有。如果将消息条数更高的 Top 0.1% 混进来,数据就失真了。
最后选取的4个数据点:
| 排名 | 年消息数 |
|---|---|
| Top 15% | 1800条 |
| Top 10% | 2700条 |
| Top 5% | 3400条 |
| Top 1% | 6800条 |
拟合结果
用最小二乘法拟合对数正态分布,得到 μ = 6.57,σ = 0.97,理论值和观测值吻合得很好。
对数正态分布结果显示,ChatGPT用户平均每年发送1138条消息,也即每天3条。最主要的结果汇总如图——

用户分层画像:
| 你在哪个位置 | 一年发多少条 | 相当于每天 |
|---|---|---|
| 中位用户 | 710条 | 2条 |
| 超过75%的人 | 1367条 | 4条 |
| Top 10% | 2464条 | 7条 |
| Top 5% | 3505条 | 10条 |
| Top 1% | 6791条 | 19条 |
消息消耗集中度:
- Top 1% 用户吃掉 8.8% 的消息量
- Top 10% 吃掉 37.8%
- Top 20% 吃掉 55.1%
我们常说的二八定律,也即前20%的用户消耗掉了80%的消息,或者说后80%只消耗了20%的消息,在ChatGPT上可能并不成立。ChatGPT用户分布相对平均,前20%用户消耗了总消息条数的55%,分布并没有那么极端。基尼系数0.51,不平等程度跟美国收入分配差不多。
OpenAI的Plus会员可能非常赚钱
一个有意思的发现:Plus用户占比约5%。如果我们假设TOP 5%的用户订阅了ChatGPT Plus会员。Top 5%的门槛是一年3400条,折合每天才10条消息。
换言之,绝大多数Plus会员,每天用不了几次。20美元一个月,一天10条。而ChatGPT的实际推理成本,哪怕按照官方API售价,每条消息成本也是极低的。
换句话说,大部分Plus会员是在给OpenAI送钱。他们付了订阅费,但使用量远没有把额度用满。真正高频使用、可能让OpenAI亏本的重度用户,只是极少数。
这和智谱GLM Coding Plan形成鲜明对比。Coding Plan面向程序员,用户天然高频、高消耗,很容易把额度榨干。ChatGPT面向大众,大部分人其实聊不了多少。而目前ChatGPT的周活用户已经达到了8亿,渗透率提高的同时也将大量非技术向的小白用户纳入其中,他们的活跃度远不及早期使用ChatGPT的技术狂人。
从这个角度看,OpenAI作为一个消费级产品,订阅定价策略相当精明:消费级用户日常聊天的消耗,是真的用不了多少量,即便会员也用不了多少。
局限性
需要指出的是,我们的数据全部来自分布的右尾(Top 15%以内),对于中位数及以下用户的估计更多是模型外推,而非直接的数据支持。
此外,现实中的分布可能比单一对数正态更复杂:存在大量注册后几乎不使用的”僵尸用户”,免费用户与Plus订阅用户(约占5%)可能形成不同的子分布,极端重度用户的尾部可能比对数正态预测的更厚。这些因素在仅有四个高端分位数数据点的情况下难以修正。
尽管如此,本文的估计作为一阶近似,仍能提供对ChatGPT用户使用行为的有价值洞察。

发表评论