中国Token出海惠及东南亚本土语言模型

更新于:
2026-04-20 14:33

近日,中国AI大模型“出海”再获突破。以 阿里通义千问 为代表的中国基础模型,正成为东南亚本土语言模型发展的关键支撑。

新加坡国家级大模型项目 SEA-LION,在早期采用西方模型时,曾出现将委内瑞拉误判为东盟成员国等低级错误,暴露出主流AI在东南亚语言理解上的明显短板。该地区拥有超过1200种语言,但长期以来主流模型相关语料占比不足1%,导致印尼语、泰语、越南语等处理能力严重不足。

为解决“语言鸿沟”,新加坡于2023年投入7000万新元启动本土大模型计划,并在2025年转向以通义千问为基座模型。该模型在预训练阶段使用约36万亿Token,覆盖119种语言和方言,同时在后训练阶段补充超过1000亿东南亚语言Token,大幅提升本地语种理解能力。

转型后,SEA-LION V4迅速登顶东南亚语言模型榜单,在印尼语、马来语、泰语、越南语等多个细分领域表现领先。与此同时,中国模型在全球调用规模上持续扩大。根据 OpenRouter 数据,2026年4月初,中国大模型周调用量已连续五周超过美国,达到12.96万亿Token,约为后者的4倍,全球调用量前列亦多为中国模型。

业内人士指出,Token出海的本质,是中国在算力、模型和应用体系上的整体输出。随着本地语料不断丰富,东南亚长期存在的“数字语言壁垒”正被逐步打破,中国AI正成为全球智能服务体系的重要参与者。

扫码分享到微信/朋友圈
首次发布:
2026-04-20 13:56

首页

>

Heading

>

Heading

Heading

Heading

Heading

Heading

Heading 1

Heading 2

Heading 3

Heading 4

Heading 5
Heading 6

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.

Block quote

Ordered list

  1. Item 1
  2. Item 2
  3. Item 3

Unordered list

  • Item A
  • Item B
  • Item C

Text link

Bold text

Emphasis

Superscript

Subscript

感谢那些选择与我们同行的伙伴

你们的信任,是我们坚持长期主义的理由

搜素“出海第一站”公众号,获取更多资讯内容。