活动回顾 || 迎接大学生活的十堂课 第十讲:人机交互式机器翻译
黄博士首先介绍了机器翻译的现状。机器翻译同人工翻译一样,都是将源语言转化为目标语言。目前,不管是腾讯、搜狗、百度,还是谷歌、有道、必应,它们都投入了巨大的人力物力财力进行机器翻译的研究。接着,黄博士又从几个问题出发,“机器翻译与辅助翻译到底有什么区别,机器翻译是什么,该如何衡量机器翻译的性能”,我们继续了解机器翻译。
接着,黄博士回顾了机器翻译的发展历程。机器翻译的源头要追溯到美苏冷战时期。美国为更好得翻译苏联的情报,想到用机器来代替人工进行繁杂的翻译工作。但起初受技术水平限制,并没有取得良好的效果。1954年到1966年一度处于停滞期。直到1982年,METEO天气翻译的出现,为机器翻译带来了一丝曙光。1993年,IBM模型的出现又为机器翻译的发展打开另一扇大门。
目前,机器翻译仍面临许多困难。第一点,自然语言中普遍存在的歧义和未知现象:南京市长江大桥、休假式治疗、维修性拆除……第二点,机器翻译不仅仅是字符串的转换,在翻译类似于“青梅竹马”这样的文字时,机器也无能为力。第三点,机器翻译的解不唯一,而且始终存在人为的标准。这也是翻译专业的同学需要面对的问题。第四点,一些句式复杂、理解有难度的语句人类翻译起来也很困难。
随后,黄博士介绍了统计机器翻译(SMT)和神经网络翻译(NMT)两种翻译方法。在IBM模型出现后,机器翻译全部采取的是统计翻译方法。2013年来,随着深度学习的研究取得较大进展,基于人工神经网络的机器翻译逐渐兴起。统计机器翻译主要通过翻译模型、语言模型、调序模型进行翻译。而神经网络翻译基于Word Embedding(词蕴含)技术进行翻译。统计机器翻译的优势在于忠实度,但是不一定符合语法。神经网络翻译的优势在于其流畅性,但容易“翻译过度”或者“翻译不足”,导致错得很流畅。
接下来,黄博士讲到他目前的主要研究领域“人机交互式机器翻译”。如何将机器翻译融合到翻译流程中,是黄博士正在解决的主要问题。黄博士的研究团队提出译后编辑、交互式机器翻译、融合机器翻译的输入法以及提高术语翻译水平等解决方法。通过这些解决方法,机器翻译来辅助人工翻译,人工翻译反过来提高机器翻译。
目前,人机交互式机器翻译仍存在着一些问题,如:长句和复杂句式的处理问题,弱规范、非规范化文本的翻译问题,双语资源缺乏问题等等。对于未来的趋势与展望,黄博士说人机交互式机器翻译会比目前预期的更加重要,希望得到更多人的推动。
同学感言
感谢黄博士带来的讲座。通过这次讲座,我对人机交互式翻译的产生、发展以及应用有了大致的了解,也更加清楚该如何运用机器来辅助自己翻译。黄博士是理工科出身,思维严谨,富有逻辑,但是他的演讲不显沉闷,在演讲过程中,时不时可以听见大家欢乐的笑声。总得来说,这场讲座干货颇多,精彩纷呈。
——人文社科学院二年级本科生 周海林
来听这次讲座主要还是抱着学习和了解知识的心态。随着科技发展,人工智能和翻译被看作是对立的两面,但其实如黄博士所讲,人机交互的模式才是现在最需要也最值得研究的。与其去考虑机器到底能不能取代人,还不如去学习如何提升自己,变成不能被取代的人。AI到底会如何发展,怎样发展,不是我们所能预料和把握的,我们能把握的只有自己和眼前的机会。
——人文社科学院一年级本科生 刘玥含