返回列表 发布新帖
查看: 5|回复: 1

人民日报 | 从词元海量调用说开去(创新谈)

[复制链接]

35

主题

14

回帖

159

积分

注册会员

积分
159
发表于 昨天 11:07 | 查看全部 |阅读模式
从词元海量调用说开去(创新谈)
王云杉
《人民日报》(2026年05月25日 第 19 版)


  近来,词元(Token)一词持续刷屏科技圈、经济圈,而让它“破圈”的,是一组极具冲击力的数据——今年3月,我国日均词元调用量突破140万亿。从2024年初的1000亿,到2025年底的100万亿,再到突破140万亿,两年间增长超千倍。

  这组跳跃式增长的数据,让词元这一专业术语走进大众视野,折射出我国人工智能产业的蓬勃脉动。

  什么是词元?它是大模型处理信息的最小信息单元,如果说我们读书写字以“字”为单位,那么AI(人工智能)处理数据时,就会先将数据拆解成一个个可处理的词元,它可以是单个汉字、标点符号,也可以是一个词语片段。我们每一次向AI提问、使用AI生成内容,都是在调用词元。

  词元调用量的持续走高,是人工智能应用走进生活、融入产业的生动见证。

  技术的价值,最终要体现在应用落地与场景赋能上。如今,AI已融入我们生活的方方面面:教师用AI辅助备课提质增效,农民用AI诊断病虫害守护收成,小微企业用AI优化供应链降低成本,办公职员用AI处理文案……从“点亮”日常生活到深度赋能产业,从文本生成到智能体的广泛应用,AI越来越好用,带动词元调用量持续攀升。这背后,是亿万用户与万千企业对AI技术的认可,更是我国人工智能应用生态日趋成熟的有力证明。

  词元调用量的持续走高,更藏着AI产业商业化破局的关键密码,是供给侧创新动能的集中释放。

  词元的每一次调用,都离不开算力、算法、电力等产业链各环节的协同支撑,人工智能产业链的竞争力,也能通过词元这一载体得到衡量。

  比如,算力越强,词元处理速度越快、单位成本越低;算法越优,模型生成的内容质量越高、词元调用频次越高;电力供给越稳定、成本越低,词元的生产与调用成本也会降低,甚至能让中国的绿电以词元形式实现价值出海……

  这种全链条的价值评估能力,加上词元本身所具备的可计量、可定价、可交易的特征,使其成为连接技术供给与商业需求的“结算单位”,让人工智能产业的商业化路径愈发清晰——就像我们按流量付费使用网络,人工智能服务也可以通过“按词元计费”,进一步在产业、民生场景转化落地,成为数字经济新的增长引擎。

  词元调用量的持续走高,是数据要素价值释放的鲜活注脚,离不开政策措施的有力托举。

  人工智能的发展离不开数据的支撑。词元的海量调用,得益于高质量数据集的持续扩容——截至2025年底,我国已建成高质量数据集超10万个,总体量超890PB(千万亿字节),数据通过拆解为词元被AI处理、应用,最终转化为实实在在的生产力,推动模型迭代、应用落地。

  这也进一步说明,随着中国数据要素市场化配置改革向纵深推进,高质量数据的供给体系正在形成,数据要素从供给到价值释放的良性循环加速成形,不断为人工智能产业注入源头活水。

  一个个跳动的数字背后,是技术的迭代、应用的深化,更是产业的跃迁。随着技术的加速进化、智能经济新形态的茁壮成长,我国人工智能产业将向着更高质量、更深层次、更广领域发展,为数字中国建设注入源源不断的新动能。

35

主题

14

回帖

159

积分

注册会员

积分
159
 楼主| 发表于 昨天 11:09 | 查看全部
全球“词元短缺”如何解?(经济透视)
沈建光
《人民日报》(2026年05月25日 第 16 版)

  今年以来,全球人工智能领域出现了一个新挑战——“词元短缺”。多家国际顶尖模型厂商与科技巨头对人工智能服务实施了不同程度的限量供应与调用限制。例如,Claude模型的开发者美国Anthropic公司调整了使用条款,以遏制高峰时段的过量使用;亚马逊公司表示,“产能限制”已拖累其增长步伐;OpenAI公司甚至暂停或放缓了类似视频应用Sora等非核心项目的资源投入,将宝贵的算力集中于可产生直接营收的业务板块。

  所谓词元,通俗来讲,就是大模型处理信息的最小单元。就像我们的阅读以字为单位一样,人工智能在处理文字、图片或代码时,会将信息拆解为一个个可计算的最小单位。大模型每处理一个词元,都要消耗相应的计算资源。因此,词元短缺本质上是算力短缺的一种具象表达,它直观反映了智能时代算力资源的使用成本与供需矛盾。

  当前,全球部分国家和地区出现的算力紧张局面,一方面与芯片制造、电力供应等物理层面的瓶颈有关,更关键的原因在于,人工智能需求的爆发式增长超出了现有供给的承载能力。全球人工智能模型聚合平台OpenRouter公司的数据显示,今年第一季度,每周词元消耗量翻了两番。这种需求的快速上升,主要源于人工智能应用范式的深刻转变。

  一是人工智能正从“辅助工具”向“任务代理”跨越。过去,人工智能主要用于聊天问答、内容生成等简单场景。如今,一些新型人工智能代理已能直接操作电脑,完成代码编写、文件整理、跨软件协作等复杂任务。这种从“动嘴”到“动手”的转变,使得单次任务的算力消耗大幅增加,部分复杂任务甚至可提升数个数量级。

  二是顶尖供应商坚持“以算力换智力”。为了提升人工智能完成任务的可靠性与准确性,全球顶尖模型广泛采用“推理时扩展”技术。模型在回答前,会像人类一样在后台进行多轮分析、推演和检查。例如,在处理“调研某行业并撰写报告”这一任务时,人工智能需要自主打开网页、读取财报、调用分析工具,单任务可持续运行数小时,词元消耗量可达数百万级别。

  三是商业化应用突破关键临界点。随着高性能模型在稳定性、准确性上实现质的突破,人工智能开始在金融、医疗、企业核心业务等场景中创造实际收益。企业大规模调用模型的意愿显著增强,算力需求正从“技术尝鲜”转向“业务刚需”。

  面对词元短缺带来的挑战,全球科技企业正在积极探索应对之策。短期来看,优化资源配置是破局的关键。一个普遍的做法是通过算法优化来降低任务对高端算力的依赖。比如,OpenAI和Anthropic等公司的编程代理已经能够对输入信息进行“上下文压缩”,先处理摘要信息,必要时再查询原始资料,以节约算力。中国企业在推理效率提升方面也取得明显进展。一些国际平台统计显示,中国人工智能模型周度的全球调用量一度超过海外模型,这是中国模型凭借较高性价比和算力使用效率,承担大量高频、通用型任务的体现。这也证明,通过技术创新提升单位算力的产出效率,是缓解算力焦虑的有效途径。

  长期来看,扩充产能与推进技术替代同样重要。当前,全球科技企业正在加快建设数据中心,扩大高端芯片采购规模。同时,为降低对单一供应链的依赖,一些企业也在积极探索替代路线。例如,谷歌提出强化自研TPU芯片体系,试图通过软硬一体化的定制芯片来降低成本、稳固供应。此外,边缘计算、更高效的模型架构(如混合专家模型)以及新型存储与互联技术,也在逐步走向成熟,有望从不同维度缓解集中的算力压力。

  词元短缺现象,是全球算力格局深度调整的一个缩影。在智能时代,算力已成为类似水、电一样的基础性战略资源。唯有兼顾短期优化与长期布局,统筹技术迭代与产能建设,才能推动人工智能产业平稳有序发展,在激烈的国际科技竞争中赢得主动。

  (作者为京东集团首席经济学家)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

地模论坛 © 2001-2026 Discuz! Team. Powered by Discuz! W1.5 京ICP备14024088号
关灯 在本版发帖 返回顶部
快速回复 返回顶部 返回列表