汉语和英语的比较

CanChn

本站元老
VIP
注册
2005-03-09
消息
8,498
荣誉分数
3,274
声望点数
373
原发于 ting-shuo.com


序、学习一门语言就是学习一种思维
一、语言的编码效率
二、汉语吸收外来语的问题
三、词性
四、语法的阑尾
五、十千,还是一万?国人的自虐
六、你我他
七、洋腔问题


学习一门语言就是学习一种思维

学习外语,一旦你跨出日常用语和科学表述而接触到情感表达,一个迎面而来的事实是,语言不可精确互译。

这个现象源于语言的一个本质属性:语言本身就是不精确的,更何况两种语言的对译。从思维到语言是一个失真的过程,从语言翻译到另一门语言,是信号减弱噪声增大的过程。

佛经里有“拈花微笑”的故事,讲的是佛的状态要用心去体会,不可以用语言传达。我的理解,这个故事并不是说我的状态不同于其他凡人的状态,而“不可说”。而是我不愿意去选择语言这种形式,接受语言固有的缺陷,承受因语言传达而造成的失真效果。

如果人的思维是茫茫的空间,那么语言是其中有限的点。这些点,有的覆盖范围大但是模糊,有的覆盖范围小但是相对清楚。这里你就看出其中的固有矛盾了,类似于“以有涯随无涯,殆已!”

你产生一个思维,需要从你的思维空间中找出一个语言的点,表达出来。从这个语言点到你最初的思维点,这中间是有一定距离的。但是语言最可恶的不止于此。一旦你的思维用语言表达出来了,你的最初的思维点就丧失了,你开始借助你选择的语言点进行进一步的思考。

这个现象,就是思维和语言的互动。思维影响语言,语言反过来影响思维。这就是文学家所说的“语言是魔鬼”。也是我们常听说的一个说法,学习一门语言就是学习一种思维。
 
一、语言的编码效率

一、语言的编码效率
语言究竟是什么呢?语言是一套编码系统。人类的语言和电子设备的通信协议,本质上是一样的。就是我有信息,我通过这套代码和协议传送给你,你接受到我的信息并且理解,我们完成了这个交流的过程。(我觉得没有学习过电子工程的语言学家们可能不能从这个角度理解语言,所以有时候会冒出些偏颇的结论。)

语言有两个方面,口头和书面。人类语言都是从口头语言发展起来的,成熟的语言会发展到书面形式。如果这么理解的话,口头和书面好像是一个事物的两个方面。但是如果你从编码的角度理解,你就会有个新的视角――口头和书面是两套代码,一套音频代码,一套视频代码。这两套代码是个多对多的映射关系。口头和书面,不如我们想象中的联系那么紧密。

从这个结论出发,我们会得到很多推论。随意的举几个例子:
一、我们可以有全新的一套视频代码替换现有的,而这个系统工作正常,比如有人提出抛弃汉字,全部拼音化。
二、口头语言的编码效率和书面语言的编码效率是可以分开来看的,比如汉语的口头语言的效率要比汉字的效率高。
三、书面的字符集要包括上标点符号,因为标点符号是传达不可或缺的信息的。比如英语离开空格是无法工作的。不要小看这个空格,这里面有讲头,以后再讲。
等等等等

有人说汉字的效率高,因为同样的一篇文章,肯定是中文的最短。我并不是太确定。这里面有个字体大小的问题。你必须有个标准。比如,把字体调到能让人能看清的最小限度,在同样面积的里面,究竟哪种语言能传送更多的信息。我没有明确的结论。

从书写的角度,汉字的速度显然慢。所以汉字才被简化以提高书写速度。

显然汉字可以进一步简化而不引起歧义。为了提高效率,越简化越好吗?不是的。编码学还有另一个指标,叫做容错。一条信息的冗余越小,它的容错率就越差。比如英语也可以简化,就是缩写。Quantity可以缩写成Qty而不引起任何歧义,但是容错能力巨减。如果你错写一个字母或者少写一个字母,比如写成Quatity,读者可以猜测你的意思,但是如果Qty变成Qt,读者就是错误理解为quarter。所以效率的提高是以牺牲容错能力为代价的。

汉字的书写速度慢,但是阅读速度快。因为汉字接近图形,而人对图形的反应比对字符的反应要快得多。所以你看软件菜单里,有的干脆用汉字作图标(让不认识汉字的人使用汉字图标!)

因为汉字的传出(书写)成本高,传入(阅读)成本低,可以得出一个有趣的结论是,汉字在大规模信息传递中,效率比其他语言高。也就是说,假设所有人都懂汉语和英语,纯粹以效率来衡量,一对一的书面交流应该用英文,出版报纸则应该用中文。

纸面书写是传统方式,在计算机时代,键盘输入和硬盘内存储存是新的衡量标准。结论也是显而易见,汉字输入慢,汉字存储密度高。中文输入法仍然是个软点。

讲完书面讲口头。

代码集大的系统有优势。汉语的优势在乎声调。汉语有四声,再加上轻声,共有5种声调, 21个声母,35个韵母。英语有28个辅音,20个元音。这个差别还是比较大的。

一个比较合理的计量方法是:
汉语,比如“汉”,计作2,因为它包含h和an。但是“睡”要计作3,因为它有sh, u, i。如果是三声的“水”,要计作4,因为三声和其他声调不同,它是个拐音。

英语。Pen,计作2,道理与汉语相同。Language要计作6,因为它有l, an, g, u, i, ge。Select要计作6,这里的每个字母都发音。汉语的拐声被多计一个数,相应的,英语的长音要计作2,比如cheese要计作4,因为它用时略长。

注意上面不是我们常说的音节,我算得比较细,权且称为“音数”吧。

常见的日常词汇里,大概四五个音数就搞定了。但是英语稍微复杂一点音数就开始增长,即使像常见的finish, prepare, tooth paste。flower是个更过分的例子,这么常用的词竟然有5个音。

而中文词汇基本上都用两个汉字,到四个汉字就到了成语的领域。(成语需要单独讨论。古语的信息载量更大,四个字顶一句话。)中文里四个以上的词汇极少。即使像“绻缱”这么罕见的词都是两个字。

再据个例子,“造”是基本的通用的字,“盖”精确一些涵盖面小一点,“建设”算是比较高级的词。他们的音数分别是2,2,5。对应成英文:make, build, construct。音数分别是3,4,7。稍微复杂一点单词就变长了。
 
二、汉语吸收外来语的问题

二、汉语吸收外来语的问题
汉语吸收外来语的问题是个热门话题,有很多似是而非的观点,其中也包括专家观点。

有一种说法是,拼音文字吸收外来语能力强,汉字不能表达发音。

这是个很邪门的观点,辩驳起来不需要深奥的知识,只需要听上去很弱智的实验。从这个实验我们可以看到语言的很多个方面。

我们来做个实验,我有一个英文词knight要介绍给一个不会讲英文的中国人,还有一个中文词“侠”要介绍给一个不会讲中文的英国人。我不能自己读出来,而要写成文字,让他们学会这两个外来语。我们来看看中文和英文分别是怎么工作的。我的结论是,它们没有本质不同(实际上也不可能有什么本质不同)。

我把knight写成中文“奈特”,把“侠”写成英文Xia。
首先先找两个不识字的小朋友,给他们看,让他们读出来。他们都读不出来。
然后找两个识字的人,让他们读,他们都读出来了。
这说明什么呢?这说明,文字表达发音,是因为你认识它,如果你不认识它,它不表发音。中文和英文是一样的。这是个很弱智的结论,但并不是每个人都明白。

继续实验,我问这两个人,他们看到的词是什么意思。他们都不知道。
这时我有两个办法,一个是用他们听得懂的话解释这两个外来语,另一个方法是放弃音译采取意译。我现在把knight写成“骑士”,把“侠”写成swordman。他们都正确地读出来,并且有个大概的概念了。

至此完成了外来语的吸收。在以上的所有步骤中,两个语言的功能都是一样的。

顺便点明一个过于明显的事实,这两个语言的人群,在读外来语的时候都是近似发音。这之间也是没有区别的。所谓的音译,都是近似音译。只要是近似音译就存在混淆的可能。

虽然说这两个语言接受外来语的本质一样,这里面确实有很多细节是不一样的。

第一、我实验了不识字的人和识字的人,他们的实验结果是一样的。但是我没有去问正在学习识字的人。只要你掌握了英文的26个字及其拼写法则,我就能通过英文让你读出任何一个外来语。但是你需要学习几百个汉字,我才能通过汉字让你读出任何一个外来语。这中间,可能需要多几个月到几年的学习时间。读写汉字比读写英文难。但是,有多难?也没多难。小学生的智力够了。

第二、你会发现实验中的英国人读的并不如中国人那么顺利,他可能会把Xia读得类似eksya,而不是你预期的结果。这后面是什么道理?这后面有个大道理――英文的拼写规则已经被世界各地的使用者搞乱了。

英语是实际的世界语言。所有人都用。这些外国人使用的时候就会发明词汇以适用自己语言的发音。试着找一找英文里的外国人名,很多是英国人看到也读不出来的。在中国这个例子里,就是中国发明了汉语拼音。让英国人拼写毛泽东的发音,他们会写成Mao Tse-tung,但是我们决定写成Mao Zedong,英语世界也就接受了。这时英语遇到了汉语没有的困难。汉语的发音和使用是中国人决定的,但是英语的拼写和发音却是全世界人民决定的。

反过来想一想,假设有一个国家的人在使用汉语,他们的决定把knight译成“赫特”,并且说“赫”在这里是个多音字,发“耐”的音。你是不是有点啼笑皆非的感觉。那样中文就遇到英文今天遇到的困难了。

第三、通过音译,英语无论吸收到多少外来语,它仍然是英语,但是中文却不再是中文了。看一个虚拟的例句。
Fazhaning a xiaokang society is a big mubiao of the Chinese zhengfu。
假设经过几百年,这么一句英语里出现四个的外来语。如果它们被完全吸收的话,读者不会觉得不适。这句话,仍然是英文。

但是如果中文完全采取音译,几百个汉字就够了。所有相同发音的汉字都可以只留一个。同时中文书写必然会发展出空格。这时候中文就不再是中文了。

不过,那只是个假设。我不认为外来语会取代一种语言的自身词汇而成为主干。对中文和英文都是一样的。

第四、最后一点,这个实验的最终结果。最有可能的结果是,英文选择音译,而中文选择意译。

音译不如意译,更何况我已经强调了,音译都是近似音译。如果同时有音译和意译,意译更有可能胜出。

英语为什么能倾向音译呢?其实也有无奈的地方,就是词根匮乏。比如,盲流、小康、杀熟。这些词,你让英文怎么意译呢?找出普通人能懂的词根组成一个词,不可行。用一个单词对应一个汉字,翻译之后太长,也就不是一个新单词了。

中文不存在这个问题。有几千个常用汉字可以让你选,每一个都有含义。中文里有很多音译和意译兼顾的令人叫绝的译文,在英文我从来没见过。

但是针对这个骑士和侠客的例子,音译其实是很有道理的,意译则优劣互现。这里面就真有个思维方式的问题了。这里表现出来的是,中国人用已有的概念去理解新事物,英语世界则把这个新事物原封不动的呈现,让使用者慢慢去理解。

一个例子。如果日本武士和欧洲的武士是两种不同的人,就应该把他们音译成Samurais,而不是意译成Warriors。这是一种态度。

把knight翻译成骑士,有助于理解,也容易导致误解。骑士?是骑着马的高尚的人吗?当然,我们现在都理解骑士的含义,但那是慢慢理解的,这个理解的过程并不比理解一个音译词汇的过程更快捷。

但是英语倾向于音译是利用自身的优点而避开自己的弱点。有人让汉语采取这套反而是放弃汉语优点而使用汉语弱项的方法,这是我不能理解的啊。
 
三、词性

三、词性
词性,在英语里的作用比在汉语里要强得多。汉语词汇的词性弱,比如动词作名词,形容词作名词。这种用法在英语里也有,比如名词作形容词,但是比汉语要少得多。

例句,和平和发展是天下大势。发展一般来讲是个动词,但是在这个句子里它在主语的位置,所以这里它是名词。发展究竟是个动词还是名词,可能不重要了。那完全取决于它在句子里的作用。

在英语里,develop是个动词。如果你要用名词,根据你不同的需要,可以加ing变成developing,或者用它的名词形式development。

英语是个很严谨的语言,但是汉语不讲究词性也并不是没有道理。如果一个词的词性是通过它和其他词汇的关系定义的,那么当你看到一句话的时候,词性不就不言自明了吗?打个比方,我在美国买东西都说“元”,在中国买东西也说“元”。一旦我离开这个背景,比如我在外汇市场,或者在和国内的人聊天,我会说“美元”。但是在平常生活中,元必然是美元,我何苦要多点明这一层呢?把这个比方放回上面的例句,如果你知道“发展”在这个句子里只可能是名词而不可能是动词,我何苦再做词性变化呢?

这个,也是我一再说过的语言和思维的关系的一个例子。

这种想法是不无道理的,在现实中显然也没出现问题,那么也轮不到我们作学术上的批评。但是有这么一个民谚:所有可能搞砸的东西迟早会搞砸。不严谨的东西总会造成混淆或者不便。

我可以想出一个例子。比如,婚姻是浪漫的终点。浪漫,在这里是形容词还是名词?这句话,是说浪漫终止于婚姻,还是说婚姻是恋爱旅程的充满浪漫气息的终点呢?

如果词性清楚了,就不会有问题。看两种不同的说法。
Marriage is a romantic end.
Marriage is the end of romance.

这个例子有点精心设计了。设计好了圈套让汉语钻。我们没有必要非那么说话,可以改成,婚姻是浪漫的结果。结果,由因到果,没有中止的意思。
 
四、语法的阑尾

四、语法的阑尾
语法的阑尾是没有传达信息作用的语法规则。看下面的例子。

刚开始学习英语的时候,英语里的词形变化是个新鲜的概念。中国人最容易犯的两个错,是名词的单数复数变化,和动词的第三人称单数。这是托福改错题必考的内容。

这两个语法现象超级的简单,初级学习者就能领会。但是这实在和你是初级还是高级没有关系,纯粹是你讲英语熟练不熟练的问题。有的人可以过四级,但是说话不用单三。

要说这个单三,真是无聊。它实际上能起的作用微乎其微。
It makes sense.
It make sense.
从编码学的角度看,第二个句子,完全传达一样的信息,不会引起任何歧义,唯一的错误就是语法错误。
这里面有美学的价值吗?没有。
那么这个语法规则,不就是语法的阑尾吗?
其实在教育水平不高的美国人嘴里也会出现He don’t know. You was upset. 等等。

我唯一能想象出来的单三可以有信息含量的情况是,主语是单复同型。
The sheep walks away.
The sheep walk away.
在这个例子里,你可以通过谓语是不是单数第三人称来看出是一只羊还是好几只羊。既然是特殊情况,就应该特殊处理,而不应该发明一个普遍应用的单三规则。我不理解为什么英语竟然发明了这么复杂的东西而不传递任何信息。

汉语也有语法的阑尾。比如量词。

英语的可数名词的表达方法是数字+名词,这比汉语简单。但是在汉语里是数字+量词+名次。量词还往往是根据后面的名词量身订制的,难以学习。即使在中国小学课本里也有关于量词的练习题。比如,一(挺)机关枪在一(根)电线杆上向五(坨)牛粪射出1827(发)愤怒的子弹。如果你把括号里的所有量词都去掉,不会影响你要传达的信息,甚至你的听众能帮你填写上。

那么名词的单复数是语法的阑尾吗?比如many book, ten book。没有任何信息传达的错误,只有语法上的错误。

单复数是思维上的一个简单概念,必然体现在语言上。汉语也有单复数之分,比如,人和人们。但是汉语不强制单复数,英语强制。我曾听过有人说,“我看着书架上的书们。”我当时肃然起敬。这哥们儿英语太好,已经彻底忘了怎么说中国话了。书架上的书是复数,在英语里也是复数形式,但是在汉语里你不需要加一个“们”。

从这个句子我们可以看出单复数是传达重要信息的,不是没用的规则。

为什么汉语不强制单复数呢?我想这还是个成本问题。对一个常见的6个字母6个音的英语单词,后面加一个s,只增长1/6。但是汉语的常见词汇只有2个汉字大概四五个音,增加一个“们”,成本陡增50%。

汉语的态度是,如果这个名词究竟是单数还是复数与我要传达的信息不相干,或者你可以做出合理推测,那么我说的时候我就不明确传达这个信息了。但是对于英语,既然表达单复数这么简便,何乐而不为?

我们好像正在接近一个结论。汉语是个很凝练取巧的语言。但是必然的代价就是不精确。这一点,在后面要谈的时态问题上就更明显了。
 
五、十千,还是一万?国人的自虐

五、十千,还是一万?国人的自虐
学外语难,因为你讲母语的时候养成了很多习惯。比如中国人刚开始讲英语不分he和she,因为在汉语里这两个词的发音是一样的。难中之难,是读数字,因为数字的读法实在已经根深蒂固了。中国人,还真是聪明。外国人数到千就数不上去了,中国人能多数一位。这有点像计算机里的字长,中国多一位。这个习惯,比看天气预报时用摄氏而不是华氏还难放弃。我来美国之后,在好长一段时间里都是用汉语在心里读数字。

这里说一个数字分位符的问题,看看中国人是如何自虐的。

我这里说的数字分位符的问题就是长数字每隔三位的逗号。比如,125,857,980。我提出的观点是,分位符在中国应该隔四位,而不是三位。

我在国内的时候,打草稿算钱从来都是每隔四位分开的。但是发现并不是每个人都这样。所以请允许我不厌其详的解释一遍。这个道理非常简单,你可能会听着很烦。

先要从中文和英文在数字念法的区别说起。中文每隔四位进一阶,但是英文每隔三位进一阶。在英文里,没有“万”这个概念。中文的“万”相当于英文的“十千”,中文的“十万”相当于英文的“百千”。中文里念数字,个、十、百、千、万、亿。在英文里变作Thousand(1,000),Million(1,000,000),Billion(1,000,000,000)。

位数非常多的数字会造成读数困难。当你看到125857980,你需要先数清楚才读得出来。于是数字分位符应运而生。对于英文读者来说,把长数字每隔三位分开非常有帮助。上面的数字写作125,857,980,可以一眼就读成125 million 857 thousand 980。对中文读者来说,这个分位符却没有任何帮助,甚至可能添乱。但是同样的道理,如果我们换作每隔四位加一个逗号:1,2585,7980。这时候你可以一目了然的读作,1亿2585万7980。

数字分位符目前主要是为了国际接轨,为了数字让外国人看着方便。对此我没有任何意见。毕竟在财会制度、工程计算上,中国是学习者,不具备制定规则的能力。但是面向汉语人群的地方,比如和同事之间讨论问题,甚至银行存款单,中文书籍报刊的出版,能不能每隔四位分开呢?

这个问题我在网上曾经有幸得到一位老编辑的回复。她说这是个习惯养成的问题,习惯就好了。比如公制的推广。开始觉得不便,用熟了就好了。我认为这之间不可比较。把尺换成米,没有任何牵涉。数字分位符,是基于语言的一个工具。在语言不变的情况下,怎么能拿来一个工具呢?虽然我可以记住万在第一个逗号左边第二位,亿在第二个逗号左边第三位,这不是自虐是什么?除非你放弃汉语的读数方法,否则你用英语的数字分位符是帮助不了汉语读者的。把这个问题更简单化,请问
125,857,980
1,2585,7980
你喜欢哪一种写法?在简单和更简单之间,哪一个写法更简单?
 
六、你我他

六、你我他
这一篇讲人称代词。

交谈中指自己、对方、和第三方,这是人的基本思维。表现在语言上,汉语和英语也是相同点多。但是还是有不同点的。

首先是个性别问题。

第一人称我和第二人称你,不需要加性别,因为交谈双方可以通过外貌识别对方的性别。中文里曾经有个女字旁的你,已经被淘汰了,我的输入法不包含这个字,不能输入。

第三人称需要加性别信息。中文书面上没有问题,但是到了口头汉语有了点麻烦――这两个字发音相同。上次我提到过,中国人刚开始讲英语不分he和she。这个例子让我们惊叹于人类大脑的功能。虽然你脑子里存在这个第三方的性别的信息,但是因为你不必作出发音的区分,大脑就把这一步省却了,直到学英语在增加这么一个步骤。

动物格和物格的“它”,不需要分性别。

物主形式在两个语言里也是相同的。我的,你的,他的……这些都必须有相应的词汇。

单复数。英语出现了麻烦。英语的第二人称不分单复数,没有你和你们的区别。这在生活中相当不方便。人们正在努力用其他方法解决这个问题,比如单数的时候用you,强调多数的时候用you guys。还是挺吃力的。

汉语里还有一个“咱们”,在英语里没有对应物。这个词虽然出现在字典里,但是很多中国人不用这个词。这算是个方言吧,所以我解释一下。我对你说“我们”,不包括你。我对你说“咱们”,包括你。比如我对其他班的学生会说“我们班如何如何”,对同班同学会说“咱们班如何如何”。刚上大学的时候其他省份的同学对我说“我们班”,我的感觉怪怪的。再比如我对你说“我们要去吃饭了。”意思是,对不起,我要和别人去吃饭了,不包括你。这个词很有用,建议推广。

英语里有宾格,汉语没有。这中间的差别请参照我前面写的《词性》一节。宾格是为了语法需要。在语法上英语要严谨得多。

下面是个英语世界的文化上的新问题,很有趣。

第三人称有性别之分,因为性别是识别人类的一个重要信息。但是随着女权主义兴起,用性别识别一个人好像在政治上不那么正确了。比如你在作一个概念上的描述:“一个学医的学生,他需要完成七年的学习。”“她们护理专业的学生找工作容易。”在女权主义者耳朵里,你对女性抱有成见。为什么医生就是男性,护士就是女性呢?

对此民间产生了一些应急的办法,比如发明了s/he这个词,通指第三人称,不指明性别。或者干脆用女性代词描述所有形象,医生、教授、警察、等等,但是请不要有女性词汇描述罪犯等感念。

目前英语还没有演变出一个新词。在中国还没有产生这个需要。
 
妙文,精彩!

中文灵活,英文严谨。
中文可以翻译英文,如果中文底子好,可以翻译得很好;
英文很难翻译中文,至少我是这样,中文思维基本不可能翻译成英文说出来。
我喜欢学英文,尽管很难学好。
 
后退
顶部