生成语法理论和形式科学——读《Linguistics and Formal Science:Introduction》(二)
形式科学,是对数学、逻辑学、特别是数理逻辑、理论计算机科学、科学哲学以及相应的各个分支科学的总称。这些学科的重要特点之一就是采用公理化的方法建立该学科的知识结构。现代形式语法理论的目标之一就是向这些学科看齐,使得理论体系建立在一个坚实的、严密精确的科学基础上。和上述学科不同的是,形式语法理论所研究的对象是自然语言,需要对语言现象进行观察、采样、分析、测试,这一系列活动属于经验科学的范畴,毋宁说更像是物理学,与纯粹心智活动的经典形式科学有着相当大的区别。虽然数学理论最终可以应用到大量的实际问题中,但是现代数学的高度抽象,使得该学科更具有“先验”的特质:往往是一种数学理论在没有实践背景的情况下被提出,而理论成熟后才发现在其它实用科学中的应用。例如复数、布尔代数、数论,刚开始时只是作为数学家们为解决数学本身的问题而提出,没有任何实际应用背景。随着20世纪后半期信息科学的发展,这些理论才找到了应用场所。例如,复数已成为物理学的基本工具之一,而布尔代数是计算机科学的基础,数论的最新应用是密码学理论。而语言学,特别是形式语法理论,则是数学理论、特别是数理逻辑应用的新的用武之地。这说明,数学的先验性是其它学科无法比拟的。
而语言学研究本身,则分别受到自古以来两大对立哲学观点的影响:实证论和唯理论。大多数人将Chomsky的生成语法理论比附为唯理论,或心智主义学派,而将该理论的前驱结构主义学派看做是实证论的代表。不过,历史往往是复杂的,不是容易那么整齐划一的。这个容后再谈。我们关心的是形式科学、特别是公理化方法对形式语法理论的影响。在这里想要澄清一点的是,当我们用“形式语法理论”这个术语时,通常包括了主流的生成语法、其它相关的理论以及其衍生的理论,同时还包括了范畴语法——直接植根于逻辑和哲学的语法理论,以及不太被提及但在计算语言学中常用的“依存语法”理论;不过从影响力来讲,前者和后两者不可同日而语,因此通常我将“形式语法理论”和“生成语法理论”常常“无预警”替换使用,尽管在严格意义上并不准确。
形式语法理论的最大特点之一就是和数学一样,使用大量的符号表达概念。使用符号的好处就是可以避免自然语言存在的模糊、二义性和解释上的不确定性。但是和数学不同的是,形式语法理论并不存在一个完备的、一致的形式语言作为描述工具。这些符号系统,只是零敲碎打地从各种形式科学——有些是逻辑学、有些是集合论有些是理论计算机科学——借用而来,从未形成一个完整的体系。其中的原因,依笔者之管见,第一是语法理论本身尚未成熟;第二尚未出现专门研究描述语言理论的形式语言的学问;第三,语言学最终能否像数理逻辑、或理论计算机科学一样成为可公理化的学科尚在争议之中。
在理解形式科学和形式语法理论的关系之前,需要先了解一下什么是公理化,它为什么成为精密科学向往的目标。
我们知道,几千年以来,人类在各种活动中积累了大量的知识和经验。对于如何记录、组织、传承这些知识从未有过什么系统性的方法,大部分都淹没在浩如烟海的用自然语言写成的著作之中。不过,一个令人惊奇的例外就是欧几里得的几何学。几何学知识本身,发源于古埃及和巴比伦作为土地丈量的基本工具。这些知识后来传播到希腊,最后,由古希腊人欧几里得(Euclid)整理写成了《几何原本》。《几何原本》是对当时所有已知几何知识的汇总。令人称奇的的是,这个汇总,并不是“几何大辞典”、“几何百科全书”、或“几何学教程”的形式,而是以命题的形式作为表达手段,以演绎推理作为派生手段,从寥寥数条“公理”(axiom)、公设(postulate)出发,派生出所有几何定理,从而构筑成整个几何学知识大厦的逻辑体系。《几何原本》所总结的几何知识固然伟大,但真正使得它流传千古的是它组织这些知识的方法:高度的逻辑性、成熟严密的结构,就是以今天的标准来衡量仍然令人仰视。而且这样高度发达的演绎推理系统,前无古人,没有参照系,仿佛已从欧氏头脑中突然形成一般。因此《几何原本》如何成形仍然是个谜。
直到19世纪之前2000年以来,《几何原本》的逻辑高度后人仍然无法企及,只有景仰和模仿的份。从莱布尼茨到弗雷格都试图用同样的方法对数学的其它知识重新进行组织:称之为“公理化”(axiomatization)。直到19世纪下半叶,由戴德金(Richard Dedekind)和魏尔斯特拉斯(Karl Weierstrass)利用集合论定义自然数,再通过自然数定义整数、有理数最后达到实数。一旦建立了严密的实数理论,数学分析这座现代知识的大厦就有了严格的基础,在此基础上再定义连续、极限和收敛,就建成了有史以来最宏伟的数学理论体系。与此同时,皮亚诺(Guiseppe Peano)则直接以自然数的基本命题作为公理,为严格定义实数理论创建了与《几何原本》相媲美的公理体系。从此,知识的公理化程度,成为某一学科成熟度的一种测量标准。公理化的出现不但为知识的记录和传承找到了最科学的方法,也为新学科的出现指明了发展的方向。在数理逻辑由哥德尔(Kurt Gödel)的定理奠定科学基础之后,20世纪后半叶,有人开始将其原理运用到自然语言的研究,其代表人物就是Richard Montague。Montague的基本观点就是:人工语言(一阶逻辑语言)本质上和自然语言没有什么不同,既然可以藉由公理化方法建立严格的逻辑语言,就没有理由对自然语言做不了同样的事。这种想法首先得到了1960年代生成语法学界的研究者的共鸣。以Emmon Bach为代表的生成语法研究者开始转向比“标准理论”更为形式化的语言研究:通常称之为Montague Grammar。Montague语法本质上是对自然语言语义的研究,严格地说是对英语一些语言片段的语义研究,这种研究后来和范畴语法——一种逻辑语法——相结合,产生了迄今为止最为严格精确的形式语法理论,成为最有可能“公理化”的自然语言语法理论之一。
而生成语法,作为Montague语法最初的灵感来源之一,却逐渐转向了语言与心理、语言与认知等心理学科的发展方向,甚至认为语言学最终应当归结为生物学的研究(linguistics is part of psychology, ultimately biology)。评论这个命题的是非不是本篇笔记的目的,但这个定义至少和《句法结构》中明确设定的语言学目标大不相同(Linguists must be concerned with the problem of determining the fundamental underlying properties of successful grammars. The ultimate outcome of these investigations should be a theory of linguistic structure in which the descriptive devices utilized in particular grammars are presented and studied abstractly, with no specific reference to particular languages)。
因此,与现行的P&P理论(无论是GB古典形式还是MP现代形式)相对而言,我们这里所指称的“生成语法理论”,毋宁说是指《句法结构》意义上的“原始”生成语法。
现在回到Tomalin的著作《Linguistics and the Formal Science》。这本书的主题不是生成语法本身,而是影响这个理论的其它学科和理论。作者首先回顾了自生成语法诞生以来关注该理论和形式科学关系的相关著作,从1957年Robert Lees的《Review of Syntactice Structure》到2001年的最近论著,基本囊括了所有有影响的著作。作者认为生成语法标榜比别的语言学理论更科学是更接近“形式科学”公理化的要求,但令人惊奇的是,几十年来在汗牛充栋的生成语法著作当中竟无人在这个问题上给出一个详细、明确的分析和说明,因此构成了作者完成此书的最基本的动机。
然后,作者详细回顾了自牛顿、莱布尼茨微积分问世后几百年形式科学的建立过程以及与此相关的的三大学派:逻辑论、形式论(又称公理主义)和直觉论的基本观点。
从形式科学的基本观点出发,作者进一步从数学、特别是从形式论的公理主义角度分析了递归函数论、逻辑系统以及逻辑实证主义的后期代表人物的“建构性系统理论”(constructive system theory)、建构式唯名论(constructive nominalism)以及相继产生的形式语言学理论(formal linguistic theory)。最后,作者深入分析了Chomsky早期(1957年《句法结构》之前)句法理论的基本轮廓和思想传承以及从1955-1957这段时间内所谓“转换生成语法”最终产生的思想来源和过程。
作者关心的不是转换生成语法本身的理论价值,而是它是从哪里来的,为什么这个理论出世后是这样一个模样。这个理论为什么会出现在1950年代,是偶然的还是必然的。这些问题也正是笔者正在思考的问题。不过笔者还有一些问题在这篇著作中没有得到回答:为什么转换生成语法会成为今天这个模样?为什么这个理论引发了那么多的争议,而且这个争议不是从外部而是从这个学派的内部从而产生了那么多由此衍生的众多语言学流派。我们从中能够学到什么?我想,这不仅仅是我个人正在思考的问题,也是所有从事研究、正在学习的所有生成语法理论的爱好者们都应当思考的问题,尤其是在国内当下对生成语法理论的两极观点(一极是竭力排斥、另一极是对乔氏顶礼膜拜)盛行之际。
(未完待续)
而语言学研究本身,则分别受到自古以来两大对立哲学观点的影响:实证论和唯理论。大多数人将Chomsky的生成语法理论比附为唯理论,或心智主义学派,而将该理论的前驱结构主义学派看做是实证论的代表。不过,历史往往是复杂的,不是容易那么整齐划一的。这个容后再谈。我们关心的是形式科学、特别是公理化方法对形式语法理论的影响。在这里想要澄清一点的是,当我们用“形式语法理论”这个术语时,通常包括了主流的生成语法、其它相关的理论以及其衍生的理论,同时还包括了范畴语法——直接植根于逻辑和哲学的语法理论,以及不太被提及但在计算语言学中常用的“依存语法”理论;不过从影响力来讲,前者和后两者不可同日而语,因此通常我将“形式语法理论”和“生成语法理论”常常“无预警”替换使用,尽管在严格意义上并不准确。
形式语法理论的最大特点之一就是和数学一样,使用大量的符号表达概念。使用符号的好处就是可以避免自然语言存在的模糊、二义性和解释上的不确定性。但是和数学不同的是,形式语法理论并不存在一个完备的、一致的形式语言作为描述工具。这些符号系统,只是零敲碎打地从各种形式科学——有些是逻辑学、有些是集合论有些是理论计算机科学——借用而来,从未形成一个完整的体系。其中的原因,依笔者之管见,第一是语法理论本身尚未成熟;第二尚未出现专门研究描述语言理论的形式语言的学问;第三,语言学最终能否像数理逻辑、或理论计算机科学一样成为可公理化的学科尚在争议之中。
在理解形式科学和形式语法理论的关系之前,需要先了解一下什么是公理化,它为什么成为精密科学向往的目标。
我们知道,几千年以来,人类在各种活动中积累了大量的知识和经验。对于如何记录、组织、传承这些知识从未有过什么系统性的方法,大部分都淹没在浩如烟海的用自然语言写成的著作之中。不过,一个令人惊奇的例外就是欧几里得的几何学。几何学知识本身,发源于古埃及和巴比伦作为土地丈量的基本工具。这些知识后来传播到希腊,最后,由古希腊人欧几里得(Euclid)整理写成了《几何原本》。《几何原本》是对当时所有已知几何知识的汇总。令人称奇的的是,这个汇总,并不是“几何大辞典”、“几何百科全书”、或“几何学教程”的形式,而是以命题的形式作为表达手段,以演绎推理作为派生手段,从寥寥数条“公理”(axiom)、公设(postulate)出发,派生出所有几何定理,从而构筑成整个几何学知识大厦的逻辑体系。《几何原本》所总结的几何知识固然伟大,但真正使得它流传千古的是它组织这些知识的方法:高度的逻辑性、成熟严密的结构,就是以今天的标准来衡量仍然令人仰视。而且这样高度发达的演绎推理系统,前无古人,没有参照系,仿佛已从欧氏头脑中突然形成一般。因此《几何原本》如何成形仍然是个谜。
直到19世纪之前2000年以来,《几何原本》的逻辑高度后人仍然无法企及,只有景仰和模仿的份。从莱布尼茨到弗雷格都试图用同样的方法对数学的其它知识重新进行组织:称之为“公理化”(axiomatization)。直到19世纪下半叶,由戴德金(Richard Dedekind)和魏尔斯特拉斯(Karl Weierstrass)利用集合论定义自然数,再通过自然数定义整数、有理数最后达到实数。一旦建立了严密的实数理论,数学分析这座现代知识的大厦就有了严格的基础,在此基础上再定义连续、极限和收敛,就建成了有史以来最宏伟的数学理论体系。与此同时,皮亚诺(Guiseppe Peano)则直接以自然数的基本命题作为公理,为严格定义实数理论创建了与《几何原本》相媲美的公理体系。从此,知识的公理化程度,成为某一学科成熟度的一种测量标准。公理化的出现不但为知识的记录和传承找到了最科学的方法,也为新学科的出现指明了发展的方向。在数理逻辑由哥德尔(Kurt Gödel)的定理奠定科学基础之后,20世纪后半叶,有人开始将其原理运用到自然语言的研究,其代表人物就是Richard Montague。Montague的基本观点就是:人工语言(一阶逻辑语言)本质上和自然语言没有什么不同,既然可以藉由公理化方法建立严格的逻辑语言,就没有理由对自然语言做不了同样的事。这种想法首先得到了1960年代生成语法学界的研究者的共鸣。以Emmon Bach为代表的生成语法研究者开始转向比“标准理论”更为形式化的语言研究:通常称之为Montague Grammar。Montague语法本质上是对自然语言语义的研究,严格地说是对英语一些语言片段的语义研究,这种研究后来和范畴语法——一种逻辑语法——相结合,产生了迄今为止最为严格精确的形式语法理论,成为最有可能“公理化”的自然语言语法理论之一。
而生成语法,作为Montague语法最初的灵感来源之一,却逐渐转向了语言与心理、语言与认知等心理学科的发展方向,甚至认为语言学最终应当归结为生物学的研究(linguistics is part of psychology, ultimately biology)。评论这个命题的是非不是本篇笔记的目的,但这个定义至少和《句法结构》中明确设定的语言学目标大不相同(Linguists must be concerned with the problem of determining the fundamental underlying properties of successful grammars. The ultimate outcome of these investigations should be a theory of linguistic structure in which the descriptive devices utilized in particular grammars are presented and studied abstractly, with no specific reference to particular languages)。
因此,与现行的P&P理论(无论是GB古典形式还是MP现代形式)相对而言,我们这里所指称的“生成语法理论”,毋宁说是指《句法结构》意义上的“原始”生成语法。
现在回到Tomalin的著作《Linguistics and the Formal Science》。这本书的主题不是生成语法本身,而是影响这个理论的其它学科和理论。作者首先回顾了自生成语法诞生以来关注该理论和形式科学关系的相关著作,从1957年Robert Lees的《Review of Syntactice Structure》到2001年的最近论著,基本囊括了所有有影响的著作。作者认为生成语法标榜比别的语言学理论更科学是更接近“形式科学”公理化的要求,但令人惊奇的是,几十年来在汗牛充栋的生成语法著作当中竟无人在这个问题上给出一个详细、明确的分析和说明,因此构成了作者完成此书的最基本的动机。
然后,作者详细回顾了自牛顿、莱布尼茨微积分问世后几百年形式科学的建立过程以及与此相关的的三大学派:逻辑论、形式论(又称公理主义)和直觉论的基本观点。
从形式科学的基本观点出发,作者进一步从数学、特别是从形式论的公理主义角度分析了递归函数论、逻辑系统以及逻辑实证主义的后期代表人物的“建构性系统理论”(constructive system theory)、建构式唯名论(constructive nominalism)以及相继产生的形式语言学理论(formal linguistic theory)。最后,作者深入分析了Chomsky早期(1957年《句法结构》之前)句法理论的基本轮廓和思想传承以及从1955-1957这段时间内所谓“转换生成语法”最终产生的思想来源和过程。
作者关心的不是转换生成语法本身的理论价值,而是它是从哪里来的,为什么这个理论出世后是这样一个模样。这个理论为什么会出现在1950年代,是偶然的还是必然的。这些问题也正是笔者正在思考的问题。不过笔者还有一些问题在这篇著作中没有得到回答:为什么转换生成语法会成为今天这个模样?为什么这个理论引发了那么多的争议,而且这个争议不是从外部而是从这个学派的内部从而产生了那么多由此衍生的众多语言学流派。我们从中能够学到什么?我想,这不仅仅是我个人正在思考的问题,也是所有从事研究、正在学习的所有生成语法理论的爱好者们都应当思考的问题,尤其是在国内当下对生成语法理论的两极观点(一极是竭力排斥、另一极是对乔氏顶礼膜拜)盛行之际。
(未完待续)
现代形式语法理论的日记 ( 全部 )
推荐这篇日记的豆列 ( 全部 )
- 现代形式语法理论:生成语法和范畴语法 (赛义甫)
- 皮爾士的幽靈旅行指南 (好公民库尔蕾丝)
> 我来回应