营商情报
Business Intelligence

时政要闻 News

小词元撬动智能经济大市场(大数据观察·智能经济新形态)

来源:人民日报 | 作者:人民日报 | 发布时间 :2026-04-03 | 20 次浏览: | 🔊 点击朗读正文 ❚❚ | 分享到:

头条看点

  词元(Token),大模型处理信息的最小信息单元。我国日均词元调用量大幅增长,不仅折射智能经济的澎湃活力,也意味着一套新型商业逻辑正在加速演进。智能时代,有了可计量、可定价、可交易的词元,人工智能有望成为像水、电一样支撑社会运转的基础资源。  

  用户端,查资料、写代码、改文案;企业端,金融风控、智能客服、代码修正……如今,人工智能应用落地的每一个场景,都离不开对词元(Token)的海量调用。

  词元,大模型处理信息的最小信息单元。今年3月,中国日均词元调用量突破140万亿,两年增长超千倍。怎么理解词元?词元和人工智能产业的关系是什么,未来发展趋势如何?记者进行了采访。

  词元调用量爆发性增长,背后是模型能力提升

  有人疑惑,词元和常见的数据有何不同?

  “人工智能大模型的本质是一套复杂的数学运算系统,它无法像人类一样直接读懂文字、听懂声音、看懂画面。”中国移动研究院网络与IT技术研究所副所长唐华斌说,人工智能大模型必须先将各类原始数据转化为自己能识别的“语言”,再通过运算输出结果,词元就是这套“语言”中最基础的单元。

  具体来看,文字词元像“乐高积木”,一个单词或一个汉字被拆成一块块词元;音频词元像“乐谱上的音符”,一段声音被切成极短的时间片段,每一片包含音调、音量;视频词元像“拼图碎片”,每一帧画面被切成一个个小方格,并且还要考虑时间上的连续性……

  “在大模型看来,三种模态的词元完全没有差别。在模型眼里,它不觉得自己是在读文字或看视频,它只觉得自己是在处理一串极其复杂的数字序列。”火山引擎智能算法负责人吴迪表示。

  一个个基础的词元,构成了智能经济运行的“细胞”。今年3月,中国人工智能大模型周词元调用量连续3周占据领先地位,成为全球大模型应用活跃度最高的国家之一。

  “词元调用量爆发性增长,最直接的原因是模型能力的提升。每一次模型能力的提升,就会解锁更多应用场景,从而使大模型词元调用量进一步激增。”吴迪介绍,以Seedance(豆包视频生成模型)2.0为例,生成1分钟视频大约会消耗超过100万个词元。

  同时,新的应用形态、新的商业模式,也会驱动大模型词元调用量大幅上涨。唐华斌表示,最近兴起的智能体和传统单轮问答不一样,它的运行往往意味着更长的上下文、更频繁的模型调用、更多轮次的任务拆解,以及工具执行过程中的持续反馈。

  “简单任务,如果只需要单轮或几轮工具调用就能搞定,消耗词元只需要几千;如果需要几十轮工具调用,则需要至少消耗几万词元乃至更多。”吴迪说,智能体等新业态的涌现,让词元调用量又进入了一个快速增长的通道。