关于英语书写系统的一些想法
最近在准备一个讲座的时候,发现对于外行在处理印地语、泰语这些书写上不分词的语言时,倘若没有一定的词汇知识,阅读起来十分困难。使用阿拉伯文、希伯来文这些辅音音素文字书写的语言也是如此(且元音常可省略),泰语更特别的在于元音不一定标在辅音上,而甚至可能标在辅音前面,或者是以一种框式结构或组合的点缀出现。中文也没有分词,外国人刚接触中文时大概也有这样的感觉吧。然而,以英语为代表的拉丁字母书写体系的语言,一般以结构主义的“词”这一层级为单位,词间存在空格,看似比没有分词的语言更容易阅读,但事实真的如此吗?
从小学英语的时候,大家常有一种感觉,当时大家总是笑称“每个单词都看得懂,但连在一起就读不懂了”,但仔细想想是存在语言学的道理的。道理很简单,有可能组合起来看不懂的东西是个“构式”,根据构式的经典定义,整体不等于部分之合,那自然无法通过部分推出整体意义。因此,按以前的话说,应当尽可能去记更多的词组和固定搭配。
除此之外,个人在长期阅读过程中,还发现一旦采取了这样的看法之后,会发现很多“短语词汇/构式”其实表达的都是一些非常基本的概念,比如一些复合介词、复合连词,无非表达的还是常见的因果啊,转折等等常见的关系。在书写上,有一些已经连在了一起,比如nevertheless, nonetheless,而有一些还是分开的,如because of, ought to。换而言之,一个语言总共需要表达的功能并不多,只不过存在大量的“近义表达”。在阅读的时候,我们只需要认出他们,把他们归入我们熟悉的各个概念类别中去就行了;在写作和口语使用时则稍麻烦一些,需要从近义词中进行选择(目前也有很多关于近义词选择的研究)。
而一旦采取了这种观点之后,可以发现对书写系统的看法甚至也会产生改变。不分词的语言是真的没有符号上的间隔吗?阿拉伯文也许连写的情况比较多,但包括中文在内的其他文字并非如此,也存在一些基本单位间隔(比如汉字之间的间隔)。对于汉语来说,通常我们又认为词可以包含一个字或者好几个字,一个词通常对应一个意义单位。而对英语来说,常常存在多词表达(multi-word expressions),本质上只表达一个意义单位,那不正是说,这个多词单位本身才是一个有意义的“词”呢?一旦通过意义作为标准去分词,英语中通过空格区分开的“书写词”(orthographical word)则更类似于一个个汉字,而能够整体表达某意义的,才是一个“意义词”。
比如make use of整体表达“利用”,并不是“制造+使用+的”,可以看成一个单位。因此短语[making use of] source materials就可以看成三个词(关于动宾关系和修饰关系是否形成固定结构需另外讨论)。但也许有人会说,如果make use of是一个词,是否可以连写在一起呢,也就是makeuseof?如果不受书写形式的影响,在说话人脑中也未必不是如此,只不过所有的词形变化此时都不再在词尾,而是在词中,类似于用中缀(infix)体现,比如ma-de-useof、mak-ing-useof,看似也可以。当然也可能存在更复杂的情况,比如这类V+N+P结构为何至今没有凝固为一个传统意义上的词,也许除了时态等动词形态变化外,也会受其他因素影响,比如虽然当中的N不能添加冠词,但可以增加修饰语,比如变成make full use of,传统观点的支持者也许会想,这样总不能看成一个词了吧?当然,也有一部分学者会认为这是一个语法化的连续体,失去冠词是第一步,慢慢地如果等形容词也不能添加之后,可能就完全凝固了。不过如果从汉语的视角来看,即使看似是固定的汉语习语,在语言创新的驱使下能够更改内部成分的做法也不少(比如表示意外的习语“我了个去”也可以插入修饰语变成“我了个大去”),甚至把固定的词拆成两部分(如离合词)。因此这种做法也可以看作通过类推来对习语的内部修饰。
当然,本文的目的并非企图说服读者说英语中应当重新认定“词”的地位,只是提供了一个新的视角。结构主义语言层级的划分不是基于人的,但构式语法则更符合人脑对语言的理解。若采用构式的观点后,很多问题都自然会迎刃而解。而对语言学习者来说,通过所谓的整体记忆、语块(chunk)记忆效果似乎也会更好。毕竟,语言中需要表达的功能总共只有那么一点,剩下的都只是根据各种制约因素下的具体构式(/词汇)的选择而已。
20190628 补充
之前见过一个黑科技,叫作ReadSmart,经典的句法教材Carnie 2013似乎使用了这种技术,但可惜在网上后来没有找到与其相关的新发展。其大致原理是,在排版的时候,将意思上比较接近的单词间的空格显示得窄一些,而将意义较远的词间距显示得相对较宽(另外换行处也可以有讲究),以此来更便于读者阅读以及获取更高的阅读速度。比如
The text formatting in this book has been adapted and modified by ReadSmart®, an algorithm which imposes almost undetectable changes in presentation.
当然这里只是一个示范,只用了双空格和单空格来区分,效果未必明显,大家可以尝试阅读一下。其原理和本文中提到的观点类似(当然背后应当有更多心理语言学的实验来符合人的阅读习惯),希望以后这样的语言科技越来越多。
从小学英语的时候,大家常有一种感觉,当时大家总是笑称“每个单词都看得懂,但连在一起就读不懂了”,但仔细想想是存在语言学的道理的。道理很简单,有可能组合起来看不懂的东西是个“构式”,根据构式的经典定义,整体不等于部分之合,那自然无法通过部分推出整体意义。因此,按以前的话说,应当尽可能去记更多的词组和固定搭配。
除此之外,个人在长期阅读过程中,还发现一旦采取了这样的看法之后,会发现很多“短语词汇/构式”其实表达的都是一些非常基本的概念,比如一些复合介词、复合连词,无非表达的还是常见的因果啊,转折等等常见的关系。在书写上,有一些已经连在了一起,比如nevertheless, nonetheless,而有一些还是分开的,如because of, ought to。换而言之,一个语言总共需要表达的功能并不多,只不过存在大量的“近义表达”。在阅读的时候,我们只需要认出他们,把他们归入我们熟悉的各个概念类别中去就行了;在写作和口语使用时则稍麻烦一些,需要从近义词中进行选择(目前也有很多关于近义词选择的研究)。
而一旦采取了这种观点之后,可以发现对书写系统的看法甚至也会产生改变。不分词的语言是真的没有符号上的间隔吗?阿拉伯文也许连写的情况比较多,但包括中文在内的其他文字并非如此,也存在一些基本单位间隔(比如汉字之间的间隔)。对于汉语来说,通常我们又认为词可以包含一个字或者好几个字,一个词通常对应一个意义单位。而对英语来说,常常存在多词表达(multi-word expressions),本质上只表达一个意义单位,那不正是说,这个多词单位本身才是一个有意义的“词”呢?一旦通过意义作为标准去分词,英语中通过空格区分开的“书写词”(orthographical word)则更类似于一个个汉字,而能够整体表达某意义的,才是一个“意义词”。
比如make use of整体表达“利用”,并不是“制造+使用+的”,可以看成一个单位。因此短语[making use of] source materials就可以看成三个词(关于动宾关系和修饰关系是否形成固定结构需另外讨论)。但也许有人会说,如果make use of是一个词,是否可以连写在一起呢,也就是makeuseof?如果不受书写形式的影响,在说话人脑中也未必不是如此,只不过所有的词形变化此时都不再在词尾,而是在词中,类似于用中缀(infix)体现,比如ma-de-useof、mak-ing-useof,看似也可以。当然也可能存在更复杂的情况,比如这类V+N+P结构为何至今没有凝固为一个传统意义上的词,也许除了时态等动词形态变化外,也会受其他因素影响,比如虽然当中的N不能添加冠词,但可以增加修饰语,比如变成make full use of,传统观点的支持者也许会想,这样总不能看成一个词了吧?当然,也有一部分学者会认为这是一个语法化的连续体,失去冠词是第一步,慢慢地如果等形容词也不能添加之后,可能就完全凝固了。不过如果从汉语的视角来看,即使看似是固定的汉语习语,在语言创新的驱使下能够更改内部成分的做法也不少(比如表示意外的习语“我了个去”也可以插入修饰语变成“我了个大去”),甚至把固定的词拆成两部分(如离合词)。因此这种做法也可以看作通过类推来对习语的内部修饰。
当然,本文的目的并非企图说服读者说英语中应当重新认定“词”的地位,只是提供了一个新的视角。结构主义语言层级的划分不是基于人的,但构式语法则更符合人脑对语言的理解。若采用构式的观点后,很多问题都自然会迎刃而解。而对语言学习者来说,通过所谓的整体记忆、语块(chunk)记忆效果似乎也会更好。毕竟,语言中需要表达的功能总共只有那么一点,剩下的都只是根据各种制约因素下的具体构式(/词汇)的选择而已。
20190628 补充
之前见过一个黑科技,叫作ReadSmart,经典的句法教材Carnie 2013似乎使用了这种技术,但可惜在网上后来没有找到与其相关的新发展。其大致原理是,在排版的时候,将意思上比较接近的单词间的空格显示得窄一些,而将意义较远的词间距显示得相对较宽(另外换行处也可以有讲究),以此来更便于读者阅读以及获取更高的阅读速度。比如
The text formatting in this book has been adapted and modified by ReadSmart®, an algorithm which imposes almost undetectable changes in presentation.
当然这里只是一个示范,只用了双空格和单空格来区分,效果未必明显,大家可以尝试阅读一下。其原理和本文中提到的观点类似(当然背后应当有更多心理语言学的实验来符合人的阅读习惯),希望以后这样的语言科技越来越多。
您好,看了您的一些文章,有些问题,可以私信您吗
我的微信是:15862201935
很急,是关于我的硕士论文的一些问题,求大神指点
请问您准备考博或者之后打算从事语言学方面的科研工作么
> 我来回应