生成式AI,尤其是 ChatGPT,一直是科技媒体、主流媒体和几乎所有领域专业人士的谈资。它将如何颠覆你的工作?人工智能会取代你吗?好莱坞作家、房产中介、遛狗人(dog walkers,帮雇主遛狗)和麻醉师还有需要吗?
Datos 拥有 2000 万台设备(台式机和移动设备,覆盖 200 多个国家/地区),用户可匿名选择加入调查组,这可以让我们深入了解真实用户在网络上的行为,因此我们与 Datos 的人员合作,开展了一个具有挑战性的项目,至少要揭开 ChatGPT 的一些神秘面纱。
调查 1:ChatGPT 的使用量是否在增加?
如果你读过《ChatGPT 预测使用量将增长 900%》或《ChatGPT 在六个月内实现了 Facebook 需要十年才能实现的目标》等令人屏息的报道,你就会认为这个token预测生成系统拥有每个风险投资人梦寐以求的东西:J曲线增长。但是,更敏锐的观察者可能已经注意到了The Honest Broker上最近发表的一篇文章:《来自 ChatGPT 难堪的指标揭示人工智能需求已在萎缩》,或者华尔街日报和华盛顿邮报的类似报道。
首先,我们从宏观看看 OpenAI流量情况
自 5 月份以来,OpenAI 的流量下降了 29.15%。有多种说法可以解释这种情况,但并不表明对生成式AI的兴趣或使用确实在下降:
说法 1) 专业用户/常规用户的使用量仍处于历史最高水平或仍在增长;只有新用户/没有特定任务的用户的使用量在下降
说法 2)大量的使用与学校作业有关,美国、加拿大和其他有暑假的国家的教育用户是造成使用量下降的原因。
Datos 的点击流调查收集了数百万选择加入其访谈的设备所访问的每个 URL,从中我们不仅可以看到 OpenAI 的每月流量,还可以看到这些设备的访问次数。这应该有助于我们验证或排除说法1。
在这里我们可以看到,自五月份以来,月访问量1-2次的设备量确实有所下降。12 月时,这组访问量也曾出现了大幅下降(当时有关 ChatGPT 3 功能的爆炸性新闻刺激了首次使用量的飞速增长)。但是,对月访问量为 3-10 次的设备或月访问量为 11 次以上的设备进行分析后,说法1的论点就站不住脚了。自 5 月份以来,这两种设备的访问量都出现了明显下降。事实上,访问量超过 11 次/月的设备自 4 月份以来一直在下降!
这就留下了第二个说法:教育用户是下降的原因。从四月份以来的数据下降情况来看,这已经是一个很难接受的说法了,但既然在揭示答案的过程中会发现更多有关 ChatGPT 使用情况的信息,让我们继续探讨。
调查 #2:人们要求 ChatGPT 解决哪些任务?
是教育领域的应用推动了 ChatGPT 的应用吗?我们是否正在培养这么一代使用人工智能完成大部分作业的学生?或者,反过来说,ChatGPT 正在取代谷歌搜索的回答问题,消除对软件程序员的需求,也许是在角色扮演游戏桌上代替过劳的“说书人(storyteller,ST)”。
为了回答这些问题,Datos 向 SparkToro 提供了来自 ChatGPT 的 7000 多条真实用户Prompt,然后我们筛选出了最可信/最相关的 4098 条(删除了只有几个单词或胡言乱语、表情包等无意义的Prompt)。
这个结果非常有趣,首先,我将拆分每个会话里包含的Prompt次数。
从上面我们可以看出,ChatGPT 的用户在单次Prompt、2-4 次Prompt和 5 次以上Prompt会话之间几乎是平均分配的(各占 1/3)。但是,这种类型的分析并不能告诉我们用户在用这些Prompt做什么。由于 Datos 能够提供 ChatGPT 页面的全文,我们对这些页面进行了分析(使用了最好的主题分类系统之一:由于 Datos 能够提供 ChatGPT 页面的全文,因此我们对这些页面进行了分析(使用了当下最好的话题分类系统,即ChatGPT 自己)。
我首先要求 ChatGPT 提供类别分类,然后选取其中最常见的(在 4098 个独特提示中,只有约 20 个占 95% 以上),并手动将其划分为顶级类别,如上图所示。编程是最大的使用场景,29.14% 的Prompt系列属于这一使用场景。它也是最清晰/最不含糊的。为了确认分类器的准确性,我手工检查了每个Prompt系列中的 100 多条(这是一项艰巨但有趣的任务),发现 ChatGPT 标记为此类的每条Prompt中都有编程帮助(包括编写特定代码、格式化代码、捕捉代码中的错误等)
正如其他人经常指出的那样,该工具擅长与编程相关的任务。难怪它如此受欢迎。
接下来是教育–但不仅仅是小学或中学教育。这里还包括个人知识或兴趣追求,以及工作目的的专业知识。内容创作也是如此–有些显然是个人行为(数据集中经常出现的情况是,D&D 城主需要为他们的冒险设计谜语或任务),而有些则是专业行为(”给我写一篇 500 字的关于底特律管道问题的博文”–估计是一位厌倦了自己撰写材料的内容营销人员)。
销售和营销用例与内容创造有重叠之处,但我选择将它们分开,以便只看到那些只能归类为帮助销售和营销专业人员完成任务的会话(分析、关于在哪些渠道推广产品的问题、广告优化任务,甚至信息/推广帮助都在数据集中)。
为了使这次调查更加细致,我提供了近乎完整的子类别细目(除了一些高度重叠/主观的子类别,我把它们合并了):
我使用了上面饼状图中的颜色编码,使细分更易于扫描,例如,”写作帮助(writing assistance)”、”个人内容创作(personal content creation)”、”创意构思(creative ideation) “和 “专业内容创作(professional content creation) “都用灰色编码,因为它们都属于更广泛的 “内容 (Content)”用例。
高等教育(Higher education)、初等教育(primary education)和课程作业(homework)都是 ChatGPT会话进行分类的子类别,这些类别加在一起占所有使用案例的约 10%。这不足以解释从 4 月/5 月到 7 月流量下降约 29% 的原因,因此,我认为我们可以对说法2 盖棺认定。
我还发现,分析 ChatGPT 提示对话中最常见的一些词语也很有意思。对于那些好奇的人,我在下面附上了一个可视化图表:
“Write”、”Create “和”List “可能是 ChatGPT 提示语中显而易见的动词。但是,在 2.39% 的提示对话中发现了 “搜索引擎优化”?令人震惊!”游戏 “占 4.66%,这是另一个惊喜。虽然没有出现在这一细分中,但仍然很有趣(至少对我来说):
Judge(判断) 0.61%
SaaS 0.56%
Pricing(定价) 0.54%
Curriculum(课程) 0.46%
Employment(就业) 0.44%
Employer(雇主) 0.39%
Attorney(代理律师) 0.37%
Lawyer(律师) 0.37%
Tweet(推文) 0.34%
Movie 0.32%
DnD (or D&D)(龙与地下城) 0.17%
RPG(角色扮演游戏) 0.15%
正如我所说,使用 ChatGPT 的角色扮演故事“说书人(ST)”数量之多令人惊讶。也许《Hasbro/Wizards of the Coasts》的开发者应该考虑在 DnDBeyond的下一次升级中使用这个功能😊。