1.引言
自然语言是在人类文明发展的漫长过程中自然形成的,它的形成是基于每个人所拥有的一种基本权利:自由创造语言符号和自由约定符号语义。而自然语言的“标准化”工作,则是以自由创造成果的自然流行为基础和前提。同时,机器翻译是人们通过对自然语言和人脑思维过程的理解,让计算机模拟人脑翻译过程来实现的。它是自然语言处理(NaturalLanguageProcessing)的一个分支,与计算语言学(ComputationalLinguistics)、自然语言理解(NaturalLanguageUnderstanding)之间存在着密不可分的关系。目前,机器翻译仅仅是处理自然语言的一个研究分支,运用计算机翻译体系,把人类语言翻译的发展,转换成电脑的运算法则,使得电脑根据运算的法则,将输入的源语言翻译成所需要的目标语言……机器翻译对所涉及的语言现象往往采取一种简单化的处理态度,结果导致译文的可读性很差,难以付诸实用(冯志伟,2004)。机器翻译的发展依存于语言学的发展,即如何把源语言的词汇、语法结构对等地转换成目标语言的词汇语法结构。
目前市场上存在分别是以语法“规则”和“语料库”为基础的两种机译方法。从理论上来说,输进计算机中的规则和语言材料越多,翻译的质量也就越高。以最具特色、最具代表性的谷歌翻译为例,谷歌翻译目前可提供63种主要语言之间的实时翻译;它可以提供所支持的任意两种语言之间的互译,包括字词、句子、文本和网页翻译。甚至谷歌领先实现日常对话中的实时翻译,拥有较强的语音识别技术,可以通过声音实现自动检索,再将语音识别和机译结合在一起。
2.机器翻译的瓶颈
到了20世纪80年代,“机器翻译”的研究进入了反思的理性阶段,其标志是开始有人质疑“机器翻译”这一概念,提出了我们必须区分机器翻译以下三种概念:(a)机器翻译(machinetranslation):全部翻译由机器完成,但是其结果必须经人工修订;(b)辅助手段(computeraidsfortranslators):翻译活动由人工进行,机器翻译只是作为人们翻译时使用的辅助工具;(c)非翻译人员为获取梗概大意偶尔使用的机器翻译系统(translationsystemsforthe“occasional”non-translatoruser)(JohnHutchins,2001)。
中国数学家、语言学家周海中曾在论文《机器翻译五十年》中指出:要提高机译的质量,首先要解决的是语言本身问题而不是程序设计问题;单靠若干程序来做机译系统,肯定是无法提高机译质量的。同时,他还指出:在人类尚未明了“人脑是如何进行语言的模糊识别和逻辑判断”的情况下,机译要想达到“信、达、雅”的程度是不可能的。这也是制约机译质量提高的一大瓶颈。值得一提的是,美国发明家、未来学家雷·科兹威尔最近在接受《赫芬顿邮报》采访时预言,到2029年机译的质量将达到人工翻译的水平。对于这一论断,学术界还存在很多争议。
我们现在的语言信息处理最先要解决的问题就是消除歧义。自然语言在词汇、句法、语义、语用等各个层面都充满歧义,请看下例:
例.在对企业产生兴趣后,便要了解企业提供的职位,所需的人数和所需的专业,而这些便是职位需求的内容。
*Intheinterestofenterprise,andtounderstandtheenterpriseprovidestheposition,thenumberandtheprofessional,andthesearethecontentsoftheposition’srequirements.
就词汇层面而言:“产生兴趣”“专业”等都存在误译;句子层面上是一个介词短语和一个不定式串接,且设置为状语;从语义上看更是混乱,没有明确的主语和句间关系的体现。
经整合译为:Havebeeninterestedintheenterprise,weneedtoknowthepositionsofferedbyenterprises,therequirednumberandthedesiredprofessions,whicharethecontentsofthejobdemand.
不难看出,影响机译发展的最大因素在于译文的质量。就已有的成就来看,机译的质量离终极目标仍相差甚远。
3.机器翻译毕业论文摘要
摘要是论文的缩影,在质方面的要求是要准确把握论文内容。在许多情况下,读者不必通读全文,只要看完摘要就会知道论文的梗概。尤其在英语专业毕业论文写作中,因为其他部分可参阅资料,而摘要部分必须双语一致且要自己整理撰写,因此,写好摘要对顺利完成论文写作至关重要。从语言研究的角度来说,机器翻译系统分析、理解和生成自然语言的能力还不到位,处理不了的语言现象很多。英语和汉语的语义和结构的解析过于简单化,使目前英汉机器翻译模式缺乏可信赖性。以下是一则毕业论文中文摘要,分别用有道翻译、爱词霸翻译(百度在线翻译与之相同)、和在线翻译进行中文摘要的翻译。
本文以中美企业招聘广告作为研究对象,从企业基本情况描述、职位需求、学历要求和继续教育、职位要求和具体能力素质方面、具体薪酬和培训发展机会、歧视问题、声明或愿景七个方面进行对比分析,归纳出中国企业在招聘广告中描述方式的不足,并给予了适当建议。
为便于机译翻译的分析,现将四种机译结果融合:
ThisarticlebytheChineseandAmericanEnterprisewantadtooktheobjectofstudy,fromtheenterprisebasicsituationdescription,thepositiondemand,theschoolrecordrequestandthecontinuingeducation,thepositionrequestandtheconcreteabilityqualityaspect,specificcompensationandtraininganddevelopmentopportunities,discrimination,thestatementortheprospectsevenaspectsofcomparativeanalysis,summarizedtheChineseenterprisesintherecruitmentadsdescribetheshortageoftheway,andgiveappropriateadvice.
分析:(1)英语词汇选用错误。从词汇角度来看,商务英语词汇具有较强的专业性,常被认为专门词汇,需要专业知识和英语的综合运用。如“继续教育”(furthereducation),“声明或愿景”(statementorvisiondescription)等。
(2)机译语序错误。在进行商务英语论文写作时,句法、语义及语用就必须做深层次思考。英语句型有避免头重脚轻原则;中文摘要在对招聘广告进行大量描述后,才进入主句意义中;英文则不然。如“本文以中美企业招聘广告作为研究对象,从……七个方面进行对比分析”(WiththeobjectofrecruitmentadvertisementsbetweenSino-Americanenterprises,thisthesiswillmakeacomparativeanalysisfromsevenaspects,suchas…)。
(3)语言表述不规范。如“以……为研究对象”(Withtheobjectof…),“归纳……不足”(summarizetheadequaciesof…)。
(4)语态使用不恰当。英文摘要重点突出摘要的客观性,同时突出摘要所要表达的相关信息。如“给予了适当建议”(thepropersuggestionsareoffered)。
(5)时态错误。在介绍论文研究内容、结论等客观事实时,一般现在时使用得最为广泛,主要用于陈述性、资料性文摘中,而有道翻译用了一般过去时态(summarized)。
4.解决途径
从上述分析中,我们理解了机器翻译的瓶颈,但也看到机器翻译的广泛应用和不断完善。作为学生群体,如何更好地利用机器翻译,这也是本文的重点之一。由于语言的线性特征,学生在做机器翻译时必须首先分析语言语境,分析语言语境基本上能够确定原句的唯一意义(贺学耘等,2007),能够分析上下句间的指代、替代、省略、连接、重复等的这些关系,才能够产生正确的可以接受的译文。
机器翻译的新课题之一——基于语料库的方法,对于相同或相似文本的翻译有非常显着的效果,随着例句库规模的增加,其作用也越来越显着。对于实例库中的已有文本,可以直接获得高质量的翻译结果。对与实例库中存在的实例十分相似的文本,可以通过类比推理,并对翻译结果进行少量的修改,构造出近似的翻译结果。学生应尽可能比较对比几类翻译结果,并进行类比推理,再结合专业知识进行信息组合。
机器翻译要求对所涉及的语言的各种知识和规律在计算机中表示、存贮和处理。因此,如何设计一种强有力的语言规则知识表示形式,即文法规则表示形式,并以此为基础,设计面向各种不同自然语言的结构分析规则体系,是机译系统开发中要解决的一个基本语言学问题。文法体系研究中另一个值得关注的就是建立和利用知识库。随着机器翻译研究中语用学的引入,知识库含义的外延在不断扩大。它不仅包括机器词典所提供的各种有关的语言知识,而且还包括各种有关语境、语用和常识等知识。
建立在一个客观认识和理性思考的基础上,我们也有理由相信:在计算器专家、语言学家、心理学家、逻辑学家和数学家的共同努力下,机译的瓶颈问题将会得以解决。