《Anthropic经济指数》是由 Anthropic 推出的一个项目,旨在深入了解人工智能对劳动市场和经济的长期影响。该指数的初步报告基于数百万匿名对话数据,通过 Claude.ai 平台的分析,揭示了人工智能在现代经济中如何融入实际任务。该报告首次提供了基于实际数据的分析,帮助我们理解 AI 在不同行业中的应用。该项目还公开了使用的数据集,以便研究人员进一步分析和扩展这些发现。
以下是《Anthropic经济指数》的全文翻译。
在未来几年中,AI 系统将对人们的工作方式产生重大影响。正因如此,我们推出了 Anthropic 经济指数——这是一个旨在长期追踪和理解 AI 对劳动力市场及经济影响的项目。
该指数的首份报告基于数百万条匿名的 Claude.ai 对话数据,提供了前所未有的数据信息和分析,清晰呈现了 AI 如何在现代经济中被应用于各类实际任务。
我们还将公开此次分析所使用的数据集,以便研究人员在我们的成果基础上进一步探索和扩展。制定针对未来劳动力市场转型及其对就业与生产力影响的政策响应,需要多方观点的综合。因此,我们也邀请经济学家、政策专家以及其他研究人员对该指数提供意见和建议。
以下是首份报告的主要发现
按任务使用情况
– 目前,AI 的应用主要集中在软件开发和技术写作任务上。
– 超过三分之一的职业(约36%)在至少四分之一的相关任务中使用 AI;
– 约4%的职业在其任务中使用 AI 的比例高达75%及以上。
增强与自动化的应用比例
AI 的应用更倾向于“增强”模式(57%):与人类协作、提升人类能力;
“自动化”模式(43%):AI 直接替代人类完成任务。
不同薪资水平职业中的 AI 应用
– 在中高收入的职业(例如计算机程序员和数据科学家)中,AI 的应用更为普遍;
– 而在最低薪与最高薪的职位中,AI 的使用率均较低。
– 这既反映了当前 AI 能力的局限,也体现了实际应用中的各种障碍。
请参见下文了解我们初步发现的更多细节。
人工智能在经济中的应用范围和方式,这些数据来自 Claude.ai 的真实使用数据。这些数字指的是与 Claude 对话中与个别任务、职业和类别相关的百分比。
绘制 AI 在劳动力市场中的应用图谱
我们的新报告延续了从工业革命时期的纺纱机到当今汽车制造机器人等技术对劳动力市场影响的长期研究。此次我们聚焦于 AI 的持续影响。我们既没有通过调查人们的 AI 使用情况,也不试图预测未来,而是基于实际数据直接反映 AI 的应用现状。
分析职业任务
我们的研究始于经济学文献中的一个重要洞见:有时关注具体的职业任务比关注整个职业更为合理。
不同工作往往共享某些任务和技能,例如视觉模式识别既是设计师、摄影师、安全检查员以及放射科医生的共同任务。
某些任务比其他任务更适合通过新技术实现自动化或增强。 因此,我们预期 AI 会在不同职业中的不同任务上有选择地得到应用,对任务进行细致分析可以更全面地展现 AI 如何融入经济活动。
使用 Clio 将人工智能的使用与任务相匹配
这项研究得益于 Claude 提供的洞察与观察,我们开发了自动化分析工具 Clio,该工具能在保护用户隐私的前提下自动分析与 Claude 的对话。
使用大约一百万条 Claude 对话数据(主要来自 Claude.ai 免费版和专业版), 利用 Clio 将这些对话按职业任务进行归类。
我们依据美国劳工部的分类选择任务。劳工部维护着一个包含约20,000项具体工作任务的数据库,称为“职业信息网络”(O*NET)。
Clio 将每条对话与最能代表该对话中 AI 角色的 O*NET 任务进行匹配,然后按照 O*NET 方案将任务归类到对应的职业,并进一步划分为诸如教育与图书馆、商业与金融等几个大类别。
我们的 Clio 系统将与 Claude 的对话(严格保密;左上)转化为职业任务(中上)和职业的过程。
结论
按职业类型的 AI 使用
计算机与数学类
– AI 采用率最高的任务和职业类别是“计算机与数学”类,主要涵盖软件工程相关岗位。
– 37.2% 的查询归属于此类别,涉及软件修改、代码调试、网络故障排查等任务。
艺术、设计、体育、娱乐与媒体类
– 第二大类别为“艺术、设计、体育、娱乐与媒体”,占查询量 10.3%,主要反映人们利用 Claude 进行各类写作和编辑工作。
其他类别
– 高体力劳动的职业(例如“农业、渔业和林业”)查询量仅占 0.1%。
对比分析
– 我们还将数据中各职业的 AI 使用率与其在劳动力市场中的整体占比进行了比较,比较结果如下图所示:
对于每种工作类型,与 Claude 相关的对话的百分比以橙色显示,而美国经济中从事该工作类型的工人百分比(来自美国劳工部的 O*NET 类别)则以灰色显示。
– “计算机与数学”类虽然只占 3.4% 的劳动力,但其 AI 使用率高达 37.2%;
– 办公室与行政支持类在劳动力中占比最高(12.2%),对应的 AI 使用率为 7.9%。
职业内 AI 使用深度
– 仅约 4% 的职业在至少 75% 的任务中使用 AI。
– 约 36% 的职业在至少 25% 的任务中使用 AI。
– 数据中未发现某个工作被完全自动化的证据——AI 更多是分散应用于各项任务,对不同任务组的影响存在差异。
AI 使用与薪资
整合 O*NET 数据中的美国中位薪资信息后,发现:
– 低薪和极高薪的工作均显示出极低的 AI 使用率(如洗发师、产科医生),
– 中高薪职业(如程序员、文案撰稿人)则是 AI 使用最频繁的群体。
年薪(x 轴)与 Claude 交谈中涉及该职业的百分比(y 轴)。图中突出显示了一些说明性职业。
自动化与增强
分析任务执行方式,区分“自动化”与“增强”:
增强:AI 与用户协作完成任务(57%);
自动化:AI 直接完成任务(43%)。
细分 – 增强型任务细分为:验证(2.8%)、任务迭代(31.3%)和学习(23.3%);
自动化型任务细分为:反馈循环(14.8%)和指令式(27.8%)。
与 Claude 的对话中涉及增强与自动化的百分比,以及每个类别中任务子类型的细分。我们论文中对子类型的定义如下。指令:以最少的交互完成任务委派;反馈循环:由环境反馈指导的任务完成;任务迭代:协作细化过程;学习:知识获取和理解;验证:工作验证和改进。
注意事项
本研究为观察 AI 如何改变劳动力市场提供了独特视角,但存在若干局限:
无法确知使用 Claude 完成任务的用户是否出于工作需要;不清楚用户如何利用 Claude 的回复(例如是否复制代码或进行事实核查);分析仅基于 Claude.ai 免费和专业版数据,而非 API、团队或企业用户;由于任务种类繁多,Clio 可能对部分对话的分类存在错误;Claude 无法生成图像,因此部分创意用途未能在数据中体现;编码相关应用可能在数据中被过度代表,因此数据样本不一定代表 AI 使用的整体情况。
结论与未来研究
AI 的使用正迅速扩展,且模型能力不断增强。
劳动力市场的格局可能在短期内发生显著变化,未来许多现有工作可能会逐步演变而非完全消失。
我们将定期重复上述分析,以追踪未来可能出现的社会和经济变革,并定期发布相应研究成果及数据集,作为 Anthropic 经济指数的一部分。
虽然研究展示了 AI 的应用数据,但未提供具体政策建议,未来的应对策略需结合证据、价值观和广泛经验。
数据开放及意见征集
本报告及 Anthropic 经济指数的重要贡献在于其新方法论,提供了关于 AI 影响的详细数据。
我们将公开共享本次分析使用的数据集,并计划在未来持续共享更多数据。
完整数据集可供下载,同时也开放了供研究人员反馈意见和提出新研究方向的表单。
致谢
感谢以下专家在早期发现和报告草稿阶段提供的富有成效的意见和讨论:
Jonathon Hazell, Anders Humlum, Molly Kinder, Anton Korinek, Benjamin Krause, Michael Kremer, John List, Ethan Mollick, Lilach Mollick, Arjun Ramani, Will Rinehart, Robert Seamans, Michael Webb, Chenzi Xu.
报告全文访问地址:https://www.anthropic.com/news/the-anthropic-economic-index
完整PDF文件:https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf