阿里巴巴集团旗下研究机构达摩院本周推出了首个基于东南亚语言训练的人工智能大模型版本SeaLLM,欧博以及名为SeaLLM-chat的聊天机器人,反映了阿里巴巴对东南亚市场的重视。
根据阿里巴巴网站Alizila发布的信息,此次发布的AI大型语言模型包括130亿参数和70亿参数两个不同的版本,能够处理的语言包括越南语、印度尼西亚语、泰语、马来语、高棉语、老挝语、他加禄语和缅甸语。
大模型“出海”顺势而为
阿里巴巴表示,基于东南亚语言版本的大模型,是在东南亚国家大模型需求不断增长的背景下推出的,旨在通过创建更具包容性和区域相关性的AI大模型,从而反映东南亚文化的细微差别。
目前东南亚地区大多数的AI大模型来自西方国家,大模型的训练主要使用英语或者其他拉丁语系语言。阿里巴巴达摩院语言技术实验室主任邴立东表示:“这项创新将加速人工智能的普及,为数字领域历史上代表性不足的社区提供支持。”
据介绍,SeaLLM大模型通过多种东南亚语言的训练,其对非拉丁语言做了特殊的词表处理,对相同长度的句子tokenization之后,得到的sequence长度是ChatGPT的九分之一,并且具有更复杂的任务执行能力。 它在使用东南亚语言理解科学、化学、物理到经济学等多种学科方面优于大多数开源大模型。
阿里巴巴在多语言人工智能研究方面与南洋理工大学长期合作。南洋理工大学计算机科学与工程学院 (SCSE) 助理教授Luu Anh Tuan表示,SeaLLM大模型的推出可能为数百万讲英语和汉语以外语言的人带来新的机会,还可以帮助企业更深度地参与东南亚市场,并构建自己的聊天机器人助手。
从阿里巴巴大模型的布局来看,第一财经记者注意到,欧博娱乐该集团旗下的不同业务部门都在开发大模型。近期有消息称,淘宝天猫商业集团也正在筹建大模型团队,目前已开始招聘工作。第一财经记者向淘宝天猫商业集团相关负责人求证该消息,对方不予置评。
目前,阿里巴巴布局最广泛的大模型是阿里云旗下的通义千问。就在本月早些时候,阿里云开源了该模型720亿参数和18亿参数版本。自今年8月以来,该大模型在Model Scope、Hugging Face上的下载总量超过150万次。
此次阿里巴巴大模型“出海”,也是跟随阿里云业务发展的必然。阿里云最早布局东南亚区域。根据研究机构Gartner数据,2021年阿里云在马来西亚的市场份额占比就接近30%,在印尼市场份额接近23%,成为支撑增长的重要引擎之一。
目前,阿里云已在新加坡、印尼、菲律宾、马来西亚和泰国开设数据中心,在东南亚区域共有10个可用区。去年9月,阿里云宣布未来三年投入70亿元建设国际本地化生态。阿里云的客户包括,阿里控股的东南亚电商Lazada、新加坡零售企业REDMART、马来西亚社交平台Yippi等。
三股力量角逐东南亚大模型市场
如今,中国大模型“出海”也是瞄准了中国电商以及物流等企业加深东南亚布局的需求。
东南亚正在成为中国电商竞逐的新热土。例如,阿里巴巴旗下东南亚电商平台Lazada的目标是,到2030年实现1000亿美元的营业额,该平台在东南亚地区拥有3亿消费者。
就在12月11日,TikTok宣布与印尼科技巨头GoTo达成协议,TikTok电商平台TikTok Shop印尼业务与GoTo旗下电商平台Tokopedia合并为PT Tokopedia,TikTok对后者拥有控股权。
Tokopedia又被称为“印尼淘宝”,此举标志着TikTok电商“杀”回印尼。该平台也将成为Lazada在东南亚最大的竞争对手。新加坡咨询公司墨腾创投的数据显示,2022年,印尼电商交易额约为520亿美元,其中约25亿美元来自TikTok,占到了TikTok在东南亚GMV(商品交易总额)的57%。
另一大需求是直播。随着TikTok等跨境电商在东南亚开展业务,外语主播招募和管理面临着挑战,跨境电商希望能够借助生成式AI等技术的力量,通过AI数字人直播等方式,快速低成本地布局直播电商并带来业务的增量。
IDC中国研究总监卢言霞对第一财经记者表示:“在零售领域,生成式AI的主要应用场景包括库存管理预测,个性化推荐,客户服务自动化,市场趋势预测以及虚拟试衣和产品展示等。”
阿里巴巴竞逐东南亚大模型市场也反映了中国企业正在利用语言方面的优势,在全球和国内的大模型热潮中寻求差异化的竞争。据不完全统计,截至今年7月,中国企业和研究机构共发布了超过130个大型语言模型,在国内掀起了“百模大战”。
尽管拥有众多的模型,但分析师表示,中国人工智能企业在快速变化的市场中仍然面临多方面的挑战,例如如何吸引更多用户,以及缺乏杀手级应用程序等。
除了阿里巴巴之外,由新加坡国家研究基金支持的AI多模态大模型开发计划(NMLP)也已经启动,新加坡政府将为此投入总额5200万美元的资金。
第一财经记者还关注到,今年6月,科大讯飞也宣布了其大模型在东南亚的战略。科大讯飞方面表示,东南亚已成为科大讯飞海外业务的第一站和战略中心。
奥维咨询董事合伙人张君毅对第一财经记者表示:“东南亚市场主要由三股势力组成,一个是东南亚当地的力量,比如新加坡国家支持的大模型,第二个是中国力量,以阿里巴巴为代表的,第三股力量是来自OpenAI等欧美公司的大模型,也是目前使用最多的,未来‘三国逐鹿’仍将持续。”