推广 热搜: page  使用  音视频  个数  搜索引擎  选择  企业  百度  可以  父亲 

AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4

   日期:2025-01-01     作者:8writ    caijiyuan   评论:0    移动:http://ww.kub2b.com/mobile/news/18210.html
核心提示:果式文案一出,少不了网友的热议。基于深度学习的机器翻译,虽然对于训练过的文本语料可以游刃有余,但对于和训练文本差异过大的

果式文案一出,少不了网友的热议。

基于深度学习的机器翻译,虽然对于训练过的文本语料可以游刃有余,但对于和训练文本差异过大的文本,翻译能力就会大幅下降。

除了训练数据的局限性之外,AI的上下文理解有限、也让不同语种的语言结构差异和文化语境差异等原因,也会导致AI经常给出偏差很远的答案。

就没有一款轻易上手、放心可用的高效AI翻译工具吗?

我们经过一番实测发现,在一众模型产品中,阿里国际最新的大模型产品——Marco-MT,在广义的翻译领域表现就相当亮眼,通过结合上下语义、场景、对象等,提供更加精准的翻译,结合阿里的数据优势,在电商领域尤为出色。

国产大模型,解决「光腿神」难题

众所周知,电商行业中术语繁多,不同领域有众多盲点,即使请专职的翻译,也很难短时间内给出最准确的说法。

举个例子,在国内卖爆了的光腿神器,怎么解释给歪果仁呢?

有人说,用现成的翻译产品不就行了?

翻译2号则更加拉跨,内容和语法完全不对。

接下来,我们加大难度。

「真的是可盐可甜,穿着显瘦,拍照简直不要好看呀,太上镜了!」,怎么说?

泰美辣!扎起来的时候看不出来是假发,而且发质看起来超好的,发量看起来也很多!对于短发发量少星人太友好了呜呜好喜欢!

性能如此强大的翻译模型,为什么出自阿里国际?

显然,这与公司在该领域的多年积累密不可分:

  • 数十亿规模的高质量电商预料数据,让团队在跨境电商领域一下子就建起了起极为显著的数据优势

  • 服务于全球市场的电商平台,让团队对不同国家和地区的文化、语言以及商业法规有了深入的了解

而将英语译成其他语言方面,也有一半语言的测试结果超过了谷歌、ChatGPT。

这么好用的大模型,用起来会不会很贵?恰恰相反!

除了常见的中英,还覆盖了韩语、日语、西班牙语、法语等全球使用量最多的语种,以及乌尔都、孟加拉、尼泊尔、希伯来等小语种。

可以说,跨境电商常用语种,Marco基本实现了全覆盖。

应用场景

能够在多语种之间流畅转换,Marco也就打通了跨境电商中的两个核心场景。

内容本地化

对于个人文档翻译,Marco也能根据上下文提供高质量翻译。

译文不仅有良好的可读性,还支持不同风格,满足个人用户的多样化需求。

总之,Marco作为AI原子能力,可以轻松接入到电商商品管理、客服及搜索导购等系统中。

商家和买家都能获得自动翻译服务,沟通效率倍增,全面提升消费者触达效果。

可以说,Marco的出现,能让阿里国际的速卖通、Lazada、Trendyol等电商平台,以及外部电商类客户,比如为多平台运营商家提供服务的独立SaaS商(ISV),和对翻译效果有更高要求的跨境商家,都能提供更丝滑的服务。

背后技术

在训练Marco的过程中,阿里国际团队用了多项创新性技术。

基于通义千问系列大模型,他们进行了多语言增强训练,搭建出多语言大模型基座——Marco翻译大模型。

预训练过程中,Marco采用了多语言数据筛选技术。

比如,特别增强语种识别、多维度数据质量评估,由此,就获得了高质量、大规模多语言数据。

与此同时,通过利用多语言MoE、参数扩展方法,从而保证主导语言(如中英)性能不下降的情况下,提升了其他语种的性能。

微调阶段,基于多语言大模型基座,再利用SFT对模型翻译能力全面激活。

对此,研究人员提出了一种自动构建高质量偏好数据的方法,通过强化学习缓解LLM的幻觉问题,还提升了电商场景特有词翻译效果。

Marco翻译大模型还有两处独特的创新。

大模型驱动

首先,模型能够主动进行语义理解与内容重构,而不是简单的文字转换,从而避免了各种哭笑不得的歧义。

比如,「你的宝贝正在路上」,不会再被翻译成「Your baby is on the way」;

而且「猪猪女孩」,也不再会被直白地翻译为「Pig girl」。

这些富含特色文化且难以直译的词汇,Marco翻译大模型都能恰如其分地表达出来。

情景化翻译

其次,AI翻译中融入了情境化翻译能力,这就使它能够依据特定的环境及目标受众进行智能调整。

最终呈现的效果上,不仅翻译准确无误,还贴近本土语言的自然流畅。

跨境电商ALL in AI,下一步再降成本

说来,阿里国际为什么要做翻译大模型呢?

与那些致力于模型研发、实现AGI公司不同,阿里国际从一开始就想明白了,要走AI应用落地之路。

AI成为跨境电商关键变量

2023年,人工智能作为技术全新变量,掀起了整个跨境电商行业的巨大风暴。

全球最大电商平台亚马逊,推出了AI服务平台Amazon Bedrock,让客户通过在线领先模型构建GenAI应用程序。

还有虾皮(Shopee)、Shopify等一些知名电商平台,争相布局。

作为全球最大的跨境电商平台之一,阿里国际也在全力All in AI。

去年4月,他们在内部专门成立了AI Business百人团队,并对40+关键场景进行AI测试。

中小商家们在出海路上经历的「九九八十一难」——语言文化壁垒、专业人才短缺、获客成本高等等,被逐一破解。

比如,AI图像编辑功能可以一键实现裁剪、背景生成、移除等功能,点击率超7%;

近半年的数据显示,平均每两个月,商家对于AI的调用量就翻1倍,AI的调用量已经突破日均1亿次。

更具象地说,一个在速卖通起家的Zeuslap显示器创业9年,借助AI从名不经传的小作坊,迅速成长为平台行业TOP 1的品牌。

以往,他们会招聘专业美工师,从抠图、找素材、PS,一周只能做4-5套。

阿里国际之所以成绩斐然,与团队过去所攻克的研究难题密不可分。

在多语言方面,为了提升大模型多语言能力,并将其更高效地用实际任务中,多语言增强大模型MarcoPolo由此诞生。

并且,实现了更低成本更优效果。

在多模态方面,多模态大模型MarcoPolo-VL能够用「眼睛」精准识别,进行推荐。

还有团队最新发布的多模态大模型Ovi,直接拿下开源第一。

在ICCV 2023顶会上,一向低调的阿里国际AI团队,凭借「视觉-语言算法推理」workshop拔得头筹。

这次,Marco翻译大模型亮相,进一步为语言文化壁垒提供了绝佳的解决方案。

这款AI翻译大模型核心聚焦在两大领域——电子商务、日常交流。

它将集成到阿里国际旗下众多跨境电商业务平台,如速卖通、Lazada、Trendyol。

首先,它与阿里生态系统深度融合。

阿里国际拥有着天然的3亿用户出海业务,而且电商足迹遍布全球100+国家/地区,连接着数百万商家及数亿消费者。

这一庞大的生态网络预示着,仅在阿里国际内部,就拥有服务广泛用户群体和多样化应用场景的广阔舞台。

其次,AI翻译服务并不局限于阿里生态之内。

团队成员们积极向外扩展,让Marco翻译大模型触及更广泛用户群体、商业实体。

因为,外部的生态才是一个潜力无穷、规模惊人的市场空间,尤其是全球新兴市场的需求。

阿里国际AI国际在最受欢迎TOP 20使用国中,约半数未发展中国家。

那么,全新的AI翻译大模型也将赋能这些国家的中小企业(SMEs),帮助它们跨越语言障碍,高效开展全球业务。

未来,阿里国际还将持续投入,扩展语向的数量,提升更多不同场景下的翻译质量。

最重要的是,进一步降低用户的使用成本。

在阿里国际看来,AI+跨境电商只是迈出了第一步,AI之于电商最大的改造,应是做到「降本增效」的极致。

向前一步,可以看到AI会颠覆电商用户交互、购物形态。

向后一步,AI将会重塑整个电商供应链,甚至上从根本去改变搜、推、广的商业模式。

AI将为跨境电商的未来带来种种可能,让我们拭目以待。

本文地址:http://ww.kub2b.com/news/18210.html     企库往 http://ww.kub2b.com/ ,  查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

 
 
更多>同类最新文章
0相关评论

文章列表
相关文章
最新动态
推荐图文
最新文章
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号