近期,国外一份调查报告误将392万和83万的采购费用翻译为39.2亿和830万,闹出国际笑话。有分析认为,此乌龙事件是国外机器翻译软件造成的。
让很多人意想不到的是,看似简单的数字,在机器翻译中向来是一大痛点。就以「392.687694万元」为例,我们测试不同翻译软件的翻译结果。
数字翻译「中译英」测试
首先测试「中译英」,国内外9款主流翻译软件中,只有火山翻译和腾讯翻译君准确地翻译出了392万。其余7款产品,有翻译成392的,有翻译成39.2亿的,甚至还有翻译成392万亿的,比正确结果扩大一亿倍,另外4款都翻译成了3.92亿。测试结果如下列组图所示。
火山翻译:
腾讯翻译君:
北京副中心元宇宙行动计划发布,首提跟踪NFT、聚焦数字藏品等举措:金色财经消息,北京通州区与北京市科委、中关村管委会,北京市经信局联合印发了《北京城市副中心元宇宙创新发展行动计划(2022-2024年)》(以下简称《行动计划》)。根据《行动计划》,副中心将聚焦培育元宇宙细分产业链,打造数字设计、数字人、混合现实、数字艺术4大产业链条;引入云上内容创作生产线企业,促进内容创作数实共生,打造数字内容创作生态圈;探索数字资产权益全生命周期管理,跟踪NFT(非同质化通证)技术前沿动态,大力发展数字资产交易服务;加快安全芯片、零信任网络、可信计算等技术的研发和产业化,持续强化区块链技术攻关与应用,打造数字信任的安全保障体系。[2022/8/24 12:44:27]
以下为其他7款翻译产品的测试结果。
翻译为39.2亿:
微软中国CTO韦青:应注意 metaverse 发展中遇到的数字鸿沟现象:12月5日消息,由清华大学人工智能国际治理研究院主办,联合国开发计划署担任国际支持机构的 2021 人工智能合作与治理国际论坛于 12 月 5-6 日在清华大学主楼举办。知名加密艺术家宋婷受邀参与主论坛 III 元宇宙未来治理前瞻圆桌论坛。圆桌讨论中,微软(中国)CTO 韦青表示推进产业实践的同时,应注意 metaverse 发展中遇到的数字鸿沟现象。英伟达 Omniverse 中国区负责人何展表示虚拟世界不是物理世界的替代,文化灵魂如何被数字手段呈现需要被思考。加密艺术家宋婷分享了人工智能和区块链艺术在拉丁美洲的公益实践,也表示通向更美好数字文明的 metaverse 需要更多创造而非更多消费,需要更多共情而非更多歧视,需要更开放和更创新,而非制造更多数字世界和物理世界的机械对立。[2021/12/5 12:52:37]
翻译为392:
翻译为392万亿:
巴黎数字银行Qonto即将以约44亿欧元估值完成4亿欧元融资,Tiger Global领投:11月4日消息,知情人士透露,巴黎数字银行Qonto即将以约44亿欧元估值完成4亿欧元融资,Tiger Global领投。该公司在2020年1月的上轮融资估值为8.11亿美元,现有投资者包括腾讯、DST Global及Peter Thiel的Valar Ventures。Qonto为企业提供本地IBAN、万事达卡、无限交易记录,且不收取转账佣金。(BusinessInsider)[2021/11/4 21:24:52]
翻译为3.92亿:
Interac在加拿大获得SecureKey区块链数字ID技术专有权:10月14日消息,支付网络和数字ID提供商Interac已经获得SecureKey为加拿大提供区块链数字ID服务的专有权,该公司正着手建立联合身份网络,让消费者使用网上银行凭证登录公共和私营部门的网络服务。此次战略收购SecureKey加拿大业务合同及其在加拿大的知识产权独家许可,是Interac于2019年收购2Keys Corporation后在数字ID领域的最新投资。
据悉,SecureKey的Verified.Me应用程序基于IBM区块链技术构建,帮助用户使用自己同意从连接(如银行)共享的信息,在线、当面或通过电话验证身份,访问健康记录和政府服务等内容,并在银行和电信公司开户。2016年,加拿大六家主要金融机构参与SecureKey 2700万美元的融资。(Finextra)[2021/10/4 17:23:48]
报告:央行数字货币全球赛跑 韩国已进入概念证明阶段:据区块链平台Xangle最新报告《全球央行数字货币研发概览》,全世界约有80%的央行正在从事央行数字货币(CBDC)相关工作。该数字比2017年增加了15个百分点。从主要国家来看,瑞士、英国、挪威处于基本概念研究阶段,新加坡、EU、法国、加拿大、韩国、已进入概念证明阶段,中国、瑞典正在准备上线试点项目,巴哈马已经上线试点项目。报告还分析称,新型冠状病扩散引发的现金流动量减少以及各国央行的量化宽松货币政策加速了各国央行对CBDC的研究速度。[2020/5/28]
数字翻译「英译中」测试
我们用不同软件把英文「3.92687694millionyuan(RMB)」翻译回中文,会是怎么样的结果?
这次只有火山翻译准确翻译出了392万元人民币。其他8款产品,有翻成3.92万的,有翻成39.2亿的,也有翻成392万亿的,另外5家都翻成了3.92万亿。测试结果见下列组图。
火山翻译:
其他产品的翻译结果:
数字的重要性毋庸多言,在商业条款中如果翻译错一个数字,可能会带来成千上万的损失;建筑图纸中一个数字翻译的疏漏,就可能导致一项庞大建筑工程轰然倒塌。想要保证数字翻译的准确度,远不是誊写一串阿拉伯数字再翻译单位这么简单。从上面测试中也可以看到,一些国际巨头的翻译产品,在数字翻译中照样会出现偏差万倍甚至上亿倍的错误。
数字翻译难在哪?
数字翻译对翻译者关于目标语言数字表达的理解要求较高,在中英翻译中,数字翻译的难点主要在以下方面:
a.中英语言中不同的数字单位,如1000万翻译成10million,不能简单地「拷贝」
b.很长的数字容易带来偏差
c.超大数字的翻译问题,如trillion、万亿以上的单位
d.中英语言中不同的计量单位,如中文中的“斤”,容易被翻译成“kg”
e.带有货币符号的数字容易犯错
当前,很多翻译软件对数字没有做额外的处理,采用的是与普通文字相同的sequence-to-sequence神经机器翻译模型。这一模型翻译质量较高,流畅性较好,但存在一个显著的缺陷,就是缺乏常识和推理能力,无法理解对于人类来说比较简单的规则,例如,“万”和“million”的的转换、单位货币之间的不同等。
火山翻译如何解决数字翻译难题?
我们从火山翻译技术分享中了解到,火山翻译的翻译模型见到对应的数字之后,会将其抽取出来,通过推理、计算等智能过程,对数字进行跨语言的语义转换,然后将其置于翻译句子适当的位置中,类似人类的翻译推理过程。
火山翻译是字节跳动旗下火山引擎的AI中台能力之一,技术能力已经在飞书的文档、消息翻译和火山引擎的企业级客户中广泛应用。由于当前机器翻译场景中存在大量的数字内容,数字翻译也一直是火山翻译团队持续优化的重要方向。目前,火山翻译已经支持56门语言、3080个语向的翻译。
DeFi应用需求的井喷,进一步暴露了“公链之王”以太坊的短板:低性能、高延迟、Gas费用不断高企.
1900/1/1 0:00:00火影忍者手游每周更新的一些限时活动中,我比较看重的奖励就是金币,想必大部分玩家应该也都是有同样的想法。只要是能够产出大量金币的活动,而且门槛也不高,都有概率会被玩家称为是良心活动.
1900/1/1 0:00:00中国国际服务贸易交易会金融服务展区内的数字人民币专题展区。中国网记者郑亮摄中国网讯在本次服贸会八大专题展之一的金融服务专题展区,一个人们越来越熟悉的红色标识高高地悬挂着,它就是数字人民币那红色的.
1900/1/1 0:00:00北京商报讯9月24日,央行官网发布关于进一步防范和处置虚拟货币交易炒作风险的通知称,近期,虚拟货币交易炒作活动抬头,扰乱经济金融秩序,滋生、非法集资、、、等违法犯罪活动.
1900/1/1 0:00:00明明利好不断,比特币却突然闪崩近19%,近40万人爆仓280亿,交易所都宕机了。市场大呼不解,到底发生了什么?一个小时跌了7000美元 比特币一度闪崩近19% 昨夜,比特币价格突然闪崩,一个多小.
1900/1/1 0:00:00《金融时报》(FinancialTimes)发布了2021年全球金融硕士排名,对于有志于留学英国的学生来说,选择学校不光要看各项排名,工作经验相关的要求也是非常重要的一环.
1900/1/1 0:00:00