Facebook研究人员使用数学来获得更好的翻译 保时捷的Macan EV将在几年内完全替代其汽油车 Tenet Healthcare最大的投资者正在购买股票 得克萨斯州的房屋价格正在上涨 Netflix能否在第二季度订户失望后带来成功 花旗集团报告交易范围内的股票收益 大众汽车公司正在考虑为其兰博基尼超级跑车品牌权衡选择权 了解耐克公司的历史以及该公司的的最大股东 分析师称亚马逊网络服务仍然是该股的巨大亮点 布鲁诺·马尔斯的净资产是多少 微软与英特尔公司受益于商用PC销量超预期 新型全电动沃尔沃XC40将配备Android信息娱乐系统 2019年最好的行车记录仪 雪佛兰汽车制造商正在推出一款名为C8.R的新Corvette赛车版 丰田正在延长电动汽车电池的保修期限因为它们的使用寿命很长 NASCAR赛车可能在2022年实现混合动力 2021年丰田Mirai燃料电池轿车进入第二代RWD 福特Ranger和Transit的最新款车型 雪佛兰已经发布了有关下一代C8.R赛车的更多细节 原型车正在内华达州的沙漠中飞驰 您的雪佛兰经销商也将飞驰而过 大众汽车的五座Atlas Cross Sport即将在美国上市 金德·摩根股票下跌随市场上涨您应该知道什么 吉利德科学超越股市涨幅您应该知道什么 Garmin超越股市涨幅您应该知道什么 随着市场上涨雅培的股票下跌您应该知道什么 特斯拉集会可能是一个增长的机会 分析师预测增长后方股上涨 出售PG&E股票是因为它可能跌至零 思科系统公司尽管在过去三个月中下跌了近20%但其股价可能会飙升70% 分析师表示现在该再次购买Match Group
您的位置:首页 >新闻 > 金融 >

Facebook研究人员使用数学来获得更好的翻译

2019-10-14 08:24:15   来源:

机器翻译工具的设计者仍然大多依靠字典来使外语易于理解。但是现在有了一种新方法:数字。Facebook研究人员说,将单词变成数字并利用语言之间的数学相似性是一个有前途的途径-即使“星际迷航”这样的通用传播者仍然遥不可及。

强大的自动翻译是互联网巨头的首要任务。在世界范围内允许尽可能多的人交流不仅是无私的目标,而且还是一项好生意。Facebook,Google和Microsoft以及俄罗斯的Yandex,中国的百度等都在不断寻求改善其翻译工具的方法。

Facebook在巴黎的一个研究实验室中聘用了人工智能专家。欧洲社交网络基础AI研究的共同负责人Antoine Bordes说,Facebook目前使用多达200种语言。当前,自动翻译是基于具有两种语言的相同文本的大型数据库来工作的。但是对于许多语言对来说,没有足够的平行文本。

这就是为什么研究人员一直在寻找另一种方法的原因,例如Facebook开发的系统可以创建单词的数学表示形式。每个单词在数百个维度的空间中成为一个“向量”。在该向量空间中,口语中具有紧密关联的单词也发现自己彼此接近。

-从巴斯克到亚马孙?--

例如,如果您在语义上使用'cat'和'dog'一词,它们是描述相似事物的词,因此它们在向量空间上会非常紧密地结合在一起,”该系统之一的Guillaume Lample说。设计师。

“如果您使用马德里,伦敦,巴黎等欧洲首都之类的话,那就是同一主意。”然后可以使用算法将这些语言映射相互链接-最初是粗略的,但最终会变得更加精致,直到可以匹配整个短语而没有太多错误为止。

兰普尔说,结果已经很有希望。兰普尔说,对于英语-罗马尼亚语的语言对,Facebook当前的机器翻译系统比单词矢量系统“相等或可能更差”。他说,但对于Facebook-传统系统没有很多双语文本可供参考的英语-乌尔都语稀疏语言对来说,单词矢量系统已经很出色了。

但是这种方法是否可以将巴斯克语翻译成亚马逊部落的语言?兰普尔说,从理论上讲,是的,但实际上,要映射该语言,需要大量书面文本,这是亚马逊部落语言所缺乏的。他说:“如果您只有成千上万个短语,它将无法正常工作。您需要成千上万个短语。”

-'圣杯'-法国CNRS国家科学中心的专家表示,Lample为Facebook采取的方法可能会产生有用的结果,即使它不能带来完美的翻译效果。NRS的莱迪思实验室的Thierry Poibeau也从事机器翻译的研究,他称向量向量法为“概念性革命”。他说“没有并行数据的翻译”(两种语言的词典或相同文档的版本)“是机器翻译的圣杯”。