

近日,中国AI大模型“出海”再获突破。以 阿里通义千问 为代表的中国基础模型,正成为东南亚本土语言模型发展的关键支撑。
新加坡国家级大模型项目 SEA-LION,在早期采用西方模型时,曾出现将委内瑞拉误判为东盟成员国等低级错误,暴露出主流AI在东南亚语言理解上的明显短板。该地区拥有超过1200种语言,但长期以来主流模型相关语料占比不足1%,导致印尼语、泰语、越南语等处理能力严重不足。
为解决“语言鸿沟”,新加坡于2023年投入7000万新元启动本土大模型计划,并在2025年转向以通义千问为基座模型。该模型在预训练阶段使用约36万亿Token,覆盖119种语言和方言,同时在后训练阶段补充超过1000亿东南亚语言Token,大幅提升本地语种理解能力。
转型后,SEA-LION V4迅速登顶东南亚语言模型榜单,在印尼语、马来语、泰语、越南语等多个细分领域表现领先。与此同时,中国模型在全球调用规模上持续扩大。根据 OpenRouter 数据,2026年4月初,中国大模型周调用量已连续五周超过美国,达到12.96万亿Token,约为后者的4倍,全球调用量前列亦多为中国模型。
业内人士指出,Token出海的本质,是中国在算力、模型和应用体系上的整体输出。随着本地语料不断丰富,东南亚长期存在的“数字语言壁垒”正被逐步打破,中国AI正成为全球智能服务体系的重要参与者。
.png)
.png)
.png)


.jpg)
.png)




.png)



.png)