投递人 itwriter 发布于 2018-02-10 12:55 原文链接 [收藏] « »

图片来源:视觉中国

  图片来源:视觉中国

  在冬奥会举行前夕,谷歌翻译闹出了一桩和冬奥会有关的笑话。据 BBC 网站消息称,挪威代表队的主厨希望购买 1500 个鸡蛋,他将相关语句输入谷歌翻译服务,结果韩国本地的超市给送来了 15000 个鸡蛋。

  显然,是谷歌翻译服务在中间环节出了问题。不过现在尚不知准确原因,而且 BBC 认为,韩文中独有的计数体系以及挪威代表队厨师的拼写也可能是造成问题的原因。此事目前尚无法判定,但从侧面反映出翻译软件服务可能存在一些问题。

  近年来随着互联网与智能手机的发展,在线翻译的普及度也越来越高。随着市场和技术的进一步发展,入局在线翻译的企业增加,尤其是对于先进技术的吸纳,使得技术也渐趋成熟。但在发展的同时,也难免会存在缺陷和疏漏。

  一、巨头争相布局翻译市场,AI 翻译技术日趋成熟

  去年,AI 技术为各界津津乐道,不论是大众、厂商还是各行各业,都对其产生了空前的兴趣。作为现代科技中足以引领潮流的技术,也引得众多行业中的大佬纷纷入局。谷歌、苹果、微软、百度、阿里、腾讯都在加紧发布自家的 AI 翻译软件产品。

AI 翻译难以达到专业翻译水准,原因何在?

  尽管机器翻译的出现已有数十年的时间,但在过去几年间涌现出的 AI 软硬件翻译产品数量成倍增长,远超出了之前那些年出现的翻译产品。

  国外,微软于 2016 年发布了翻译工具 Microsoft Translator,这是全球首款真正意义上的“万能翻译器”。该产品最大的亮点在于,可以通过对底层深度神经网络技术的应用,实现精确的语音识别和翻译。Microsoft Translator 的识别与翻译部分采用了 ResNet 深度神经网络与长期短期记忆技术,而 ResNet 神经网络深度则高达 150 层。

  谷歌的翻译软件似乎更受青睐一些,多年的搜索引擎历程使其积累的大量的数据与经验。大概在 2014 年左右,有关在机器翻译中应用深度学习的论文开始大量出现。谷歌根据这些理论成果,对自家的翻译软件进行多次改进以提升其准确度。

  谷歌本身拥有大量的机器集群,在这些集群上部署神经网络训练任务相对而言就非常容易了。只需指定所需资源,就能将训练任务加以部署,从而最大限度地缩减研究成本。这可以使研究者从这类事情中解放出来,更加专心致力于网络结构方面的研究,并且能够让他们去进行大量的实验,用以验证其想法,这使得谷歌的翻译产品进步加速。

  国外市场如火如荼,国内的情形也与之相差无几。

  去年 9 月,百度在日本发布了智能翻译机。可在中英、中日等多种语言互译模式中流畅识别一键翻译,还能为手机、电脑等设备提供 WIFI,且自带 80 余个国家的移动数据流量,自动连接 4G 网络。

  同年,腾讯也推出了一款名为“翻译君”的翻译软件。该软件驱动内核为 AI,采用 NMT(神经网络机器翻译)+语音识别等先进技术,能够实现同声传译功能,且支持在手机等移动终端的应用及实时会话翻译等内容。

  去年,一直在语音交互方面有深入研究的科大讯飞推出了智能翻译产品“晓译翻译机”。内置语音识别技术,配合运算芯片可实现中英离线互译,也能做到不受网络环境限制。

AI 翻译难以达到专业翻译水准,原因何在?

  甚至连电商也开始涉足 AI 翻译领域。去年 8 月,京东推出了一款可进行多国语言实时翻译的“准儿翻译机”。

  互联网企业纷纷入局,可看到 AI 翻译领域的火爆程度。在技术上,各家企业也有所提升。

  例如近年来,NMT(神经网络机器翻译)技术火热,它能够模仿人脑神经思考的模式,产出高质量的译文,并将误差降低 55%~85%。谷歌将其应用于网页翻译与手机,百度、阿里、腾讯等互联网企业也将深度学习的理念加入机器翻译中。

  此外,语言的处理、语音交互等技术的发展使得翻译产品的场景升级加速,也让翻译产品从 CAT(辅助翻译)的阶段过渡到了 AI Interactive Translation(人工智能交互翻译)的阶段。当今各类技术层出不穷,实质上 AI 处理人类语言大致可分为基于规则的机器翻译、基于实例的机器翻译和统计的翻译三种类型,目前谷歌等公司采用的基本上是最后一种。

  从全球 AI 翻译市场来看,技术达到一个较为成熟的状态。随着全球各方面交流的加大,未来翻译市场的需求将持续呈现指数级增长速率,预计全球机器翻译市场将在 2019 年增长至 69 亿美元。

  然而任何行业和技术在发展过程中,都不可避免地会出现一些缺陷与疏漏,AI 翻译市场也同样不例外。

  二、达到专业翻译水准,AI 翻译仍然缺乏足够数据支撑

  在翻译水平方面,AI 翻译还难以达到令人十分满意的程度,甚至在翻译过程中闹出过许多笑话。

  去年,一名巴勒斯坦人遭到以色列警方逮捕。原因可谓十分“乌龙”:他在 Facebook 上用阿拉伯文发了一条内容为“早上好”的帖子。结果由于翻译软件的错误,内容变为“攻击他们”。

AI 翻译难以达到专业翻译水准,原因何在?

  在翻译软件出现的问题方面,最典型的例子是“苹果式中文”,因其经常破坏性地创造中文语序读法而饱受吐槽。如“开发者的大事,大快所有人心的大好事”、“真的笑,笑出声”等蹩脚的翻译方式经常出现在苹果的产品中。

  由此看来,尽管 AI 翻译技术大幅提升,但与高水平翻译所要求的“信、达、雅”之间还存在相当大的距离。对人类而言,需要的绝不仅仅是逐字逐句的字面翻译,还要体现出语调、情感,甚至是韵味。

  想要传达出这些,需要翻译者有一定的敏感度、水准以及境界。目前 AI 技术虽已发展到一定程度,但对于这些要求尚不可达到。如果真的想要达到“信、达、雅”的高度,AI 要克服人类口语化的难题,如语音断句、语法差异等。

  那么机器究竟通过怎样的方法才能解决这些问题?其实 AI 翻译的难点也是整个行业面临的难点,那就是如何使 AI 像真正的人类一样拥有智能行为。AI 翻译的准确程度实际上取决于数据。目前的翻译体系中多是来自官方的文档,但缺少娱乐、体育方面的数据。加之各地口语中随意性较大并存在网络用语,所以 AI 翻译仍需庞大的词汇库加以支撑。

  理论上来看,所有的问题都能通过庞大的数据来解决,但短期之内,AI 翻译的数据支撑仍然处于严重缺乏状态。

  此外,传统翻译行业对 AI 翻译也颇有微词。有观点认为,不论是翻译机还是翻译软件,由中文翻译成其他语言之时效果尚可,但由其他语言翻译过来准确率则不高,在实际交流中更是难以应用。

  去年 2 月,谷歌全新的 NMT 系统在韩国世宗大学与人类译员进行的翻译对战。在 50 分钟内双方同时翻译两段文本。结果 NMT 不占丝毫优势,并且评委指出 NMT 系统翻译出的文本九成都存在语法方面的问题。

AI 翻译难以达到专业翻译水准,原因何在?

  随着技术的完善与进步,未来的 AI 将能够完成大部分的简单翻译要求。但对于多元化、细微化的专业翻译需求,AI 又能否实现呢?其实,世界上的语言多达上千种,而绝大多数的语言还缺乏足够的资料,所以需要不断地去积累。

  此外,AI 翻涉及到多种知识,如语言学、计算机科学、数学及神经认知科学。所以 AI 翻译是一个相当复杂的领域。因此想要真正实现 AI 翻译服务的应用,还需要相当长时间的发展与完善。

  【钛媒体作者介绍:文/最极客东方亦落,本文版权归“最极客”所有 】

24小时阅读排行

    最新新闻

      相关新闻