'>

南京金优设计公司

微软技术院士黄学东:以人为师,机器翻译达人类专业水平

原标题:微软技术院士黄学东:以人为师,机器翻译达人类专业水平
今年是黄学东加入微软的第25年,但这位微软老将至今仍活跃在人工智能领域科学研究的前线。
2018年3月份,他带领的团队在机器翻译领域拿下一项里程碑式的成就:其研发的机器翻译系统在通用新闻报道的newstest2017中译英测试集上,达到了人工翻译水平。这是首个在新闻报道的翻译质量和准确率上媲美人工翻译的翻译系统。在去年8月,也是在黄学东的带领下,其团队在产业标准Switchboard语音识别基准测试中实现了对话语音识别词错率(word error rate,简称WER),低至5.1%,创造了当时该领域内错误率最低纪录,首次达成与专业速记员持平而优于绝大多数人的表现。
在两年不到的时间里,黄学东的团队接二连三地取得突破。他的成绩也获得了微软的认可。2017年,他被评选为微软技术院士(Technical Fellow),这代表着微软技术人员的最高荣誉,获得这一荣誉的人还包括图灵奖得主Butler W Lampson、Charles P. Thacker等。
黄学东
近日,在北京微软亚洲研究院里,这位国际电子电气工程师学会(IEEE)和美国计算机学会(ACM)的双科院士,微软认知工具包CNTK的缔造者之一,用一口带着湖南乡音的普通话接受了澎湃新闻(www.thepaper.cn)的采访。
从大学时代到加入微软,踏上25年的技术征程,再到带领团队屡创佳绩,黄学东谈到了自己为什么能坚持这么久的原因:就是想让语言交流能够更美好,人与人之间的语言障碍可以消除。目前,黄学东的团队已经在语音识别的词错率上达到了专业速记员的水平,并且在机器翻译上比肩人类专业译者。在采访中,除了谈到最新的机器翻译突破背后的故事外,黄学东还谈到了人工智能技术发展最终是否会取代人的问题,以及中美之间的人工智能之争。
以人为师:微软机器翻译提前7年超越人类译者
在2017年,牛津大学曾向机器学习(Machine Learning)的研究人员做过一项调查,调查的内容是对人工智能未来发展的预测。根据这些研究人员的预测,未来10年的人工智能会在很多方面超过人类。其中,他们预测机器翻译想要超过人类业余译者需要8年时间。
根据这项预测,微软今年真人百家乐试玩3月份研发出的机器翻译系统,实际上将机器翻译中译英方面超越人类业余译者的时间提前了7年,并达到了比肩人类专业译者的水平。
“这是一个历史性的突破,因为语言一直是我们人类交流最重要的东西,尤其中国要走向世界,中翻英现在可以达到专业的水平,这是一个历史性的突破。这对中国走向世界,对人工智能的推进都有正面意义,非常鼓舞人心。”黄学东告诉澎湃新闻(www.thepaper.cn)。
据黄学东介绍,这个项目由来自微软亚洲研究院和微软雷德蒙研究院的三个研究组,进行了跨越中美时区、跨越研究领域的联合创新。
自1954年开始,机器翻译一直是人类想要攻坚的领域。无奈在过去的几十年中,由于技术方法,计算力和训练数据等原因,研究人员一直未能找到有效的突破口。直到进入21世纪,研究人员引入深度学习的神经网络,构建了神经机器翻译(Neural Machine Translation)才有了突破。
神经机器翻译,简要的说,就是对源语言的句子进行编码,即转化为计算机可以“理解”的形式,编码的结果会形成很多隐含变量,每个隐含变量代表从句首到当前词汇为止的语义信息。然后通过一个解码的过程,一个词、一个词输出译文。
这一次微软的突破可谓是既站在了巨人的肩膀上,又用到了自己的创新:微软的机器翻译系统不仅用了最新的神经网络技术,还用了微软自己研发的一些独到的技术,做到了集大成者。
在微软这次的创新中,微软的研究团队借鉴了人类在翻译时的一些思维方式。第一个是对偶学习(Dual Learning)。这有点像人类在学习英语时,当把中文翻译成英文后,通常还需要检查,即将英文再翻译回中文,看是否正确,做到翻译的一致性。这样做的目的是能在中翻英、英翻中的过程中做到联合优化。微软就将这一方法“教”给了机器。