公理

传统逻辑中,公理(英语:axiom)是没有经过证明,但被当作不证自明的一个命题。因此,其真实性被视为是理所当然的,且被当做演绎及推论其他(理论相关)事实的起点。当不断要求证明时,因果关系毕竟不能无限地追溯,而需停止于无需证明的公理。通常公理都很简单,且符合直觉,如“a+b=b+a”。

不同的系统,会预计不同的公理。例如非欧几何的公理,和欧氏几何的公理就有一点不同;另外,集合论的选择公理在许多系统的建构中,也富有争议。有些系统坚持不预设选择公理。也有一些数学家在建构系统时,刻意排除掉皮亚诺公理中的数学归纳法,以确保所有的证明,都可以直接演算。

数学中,公理这一词被用于两种相关但相异的意思之下——逻辑公理非逻辑公理。在这两种意义之下,公理都是用来推导其他命题的起点。和定理不同,一个公理(除非有冗余的)不能被其他公理推导出来,否则它就不是起点本身,而是能够从起点得出的某种结果—可以干脆被归为定理了。

逻辑公理通常是被视为普遍为真的陈述(如 (A ∧ B) → A),而非逻辑公理(如a + b = b + a)则实际上是在一特定数学理论(如算术)中的定义性的性质。在后者的意思之下,公理又可被称为“公设”[1]。一般而言,非逻辑公理并不是一个不证自明的事实,而应该说是在建构一个数学理论的过程中被用来推导的一个形式逻辑表示式。要公理化一个知识系统,就是要去证明该系统的主张都可以由数目不多而又可明确理解的陈述(公理)推导出来。一般来说都有多种方法来公理化一个给定的数学领域。

然而,逻辑公理系统也并非唯一。直觉主义逻辑模糊逻辑等新的逻辑结构,都建立在略有差异的公理上。因此,与其把公理看作不证自明的事实,不如看作是在一个特定的数学或逻辑系统中,先于一切证明前设

历史发展

古希腊

经由可靠的论证(三段论、推理规则)由前提(原有的知识)导至结论(新的知识)的逻辑演绎方法,是由古希腊人发展出来的,并已成为了现代数学的核心原则。除了重言式之外,没有任何事物可被推导,若没有任何事物被假定的话。公理即是导出特定一套演绎知识的基本假设。公理不证自明,而所有其他的断言(若谈论的是数学,则为定理)则都必须借助这些基本假设才能被证明。然而,对数学知识的解释从古至今已不太一样,且最终“公理”这一词对今日的数学家眼中和在亚里士多德欧几里得眼中的意思也有了些许的不同。

古希腊人认为几何学也是数种科学的其中之一,且视几何学的定理和科学事实有同等地位。他们发展并使用逻辑演绎方法来作为避免错误的方法,并以此来建构及传递知识。亚里士多德的后分析篇是对此传统观点的一决定性的阐述。

“公理”,以传统的术语来说,是指在许多科学分支中所共有的一个不证自明的假设。

在各种科学领域的基础中,或许会有某些未经证明而被接受的附加假定,此类假定称为“公设”。公理是许多科学分支所共有的,而各个科学分支中的公设则是不同的。公设的有效性必须建立在现实世界的经验上。确实,亚里士多德曾言,若读者怀疑公设的真实性,这门科学之内容便无法成功传递。

传统的做法在《几何原本》中很好地描绘了出来,其中给定一些公设(从人们的经验中总结出的几何常识事实),以及一些“公理”(极基本、不证自明的断言)。

公设
  1. 能从任一点画一条直线到另外任一点上去。
  2. 能在一条直线上造出一条连续的有限长线段。
  3. 能以圆心和半径来描述一个
  4. 每个直角都会相互等值。
  5. 平行公设)若一条直线与两条直线相交,在某一侧的内角和小于两个直角,那么这两条直线在各自不断地延伸后,会在内角和小于两直角的一侧相交
公理
  1. 等同于相同事物的事物会相互等同
  2. 若等同物加上等同物,则整体会相等。
  3. 若等同物减去等同物,则其差会相等。
  4. 相互重合的事物会相互等同。
  5. 整体大于部分。

近代的发展

近150年来,数学家所学到的是,将意思从数学陈述(公理公设命题定理)和定义中抽离出去是很有用的。此一抽象化(或甚至可说是公式化)使得数学知识变得更一般化,容许多重不同的意思,且因此可以用在多重的方面上。

结构主义的数学走得更远,并发展出没有“任一”特定应用的理论和公理(如体论群论拓扑学向量空间)。“公理”和“公设”之间的差异消失了。欧几里得公设因为可以导出大量的几何事实而被创造出来。这些复杂事实的真实性依赖于对基本假定的承认。然而,若舍弃第五公设,则可以得到有更多内容的理论,如双曲几何。我们只需要准备以更弹性的方式来使用“线”和“平行”等术语。双曲几何的发展教导了数学家们公设应该被视为单纯的形式陈述,而不是基于经验的事实。

当数学家使用的公理时,其含义甚至变得更加地抽象了。体论的命题没有关注于任一特定的应用上;数学家现在于完全的抽象化上工作著。体有许多的例子;而体论可以给出对所有这些例子适用的正确知识。

说体论的公理是“被视为不证自明的命题”是不正确的。实际上,体的公理是一套局限。若任一给定的加法与乘法系统符合此些局限,则我们对此系统立即可以得到许多额外的资讯。

现代数学家也对数学基础作了相当程度的形式化,从而使得数学理论可以被视为数学物件,且逻辑本身亦能被视为是数学的一个分支。戈特洛布·弗雷格伯特兰·罗素庞加莱大卫·希尔伯特库尔特·哥德尔是此发展中的几位关键角色。

在现今的理解里,一套公理是任何一群形式陈述的断言,而透过应用某些定义良好的规则,可由这些公理推导出其他形式陈述的断言。在此观点下,逻辑只是变成了另一个形式系统。一套公理应该是相容的,即应该不可能由此公理中导出矛盾来。一套公理亦应该是非冗余的,即一个可以由其他公理导出的断言不应被视为是一个公理。

近代的逻辑学家最初希望数学的不同分支,最好是所有的数学,都可以被一套相容的基本公理中推导出来。数学形式主义的一个早期成功的例子为希尔伯特对欧几里得几何的公理化,以及相关地,对此些公理相容性的确定。

在更广的方面来看,还有人企图将所有数学放在康托尔集合论之下。不过,罗素悖论的出现和朴素集合论中相似的矛盾,指出任何此类的形式系统最终都有可能是不相容的。

此计划遭受到的决定性挫败是在1931年,哥德尔证明出只要一个相容的形式系统能够蕴涵皮亚诺公理,就可以在系统内建构出一个其真实性和此套公理独立的陈述。作为一个推论,哥德尔证明出一个如皮亚诺算术的理论,其相容性在理论本身之内会是一个不可证的断言。

相信皮亚诺算术的相容性是合理的,因为它被自然数的系统所满足-一个无限但在直觉上易被接受的形式系统。然而,直到现在,依然没有已知的方法判定集合论中策梅罗-弗兰克尔公理的相容性。选择公理-此理论的关键假定,也依然是一个极具争议的假设。更甚之,利用力迫法的技巧,可以证明连续统假设独立于策梅罗-弗兰克尔公理之外。因此,即使是这种极一般的公理也还不能被视为是数学的决定性基础。

数理逻辑

数理逻辑里,公理可以清楚地被区别成两种:逻辑公理非逻辑公理(有些类似传统上对“公理”和“公设”的区别)。

逻辑公理

在一个语言中存在着某些普遍有效的公式,亦即被每个变数赋值函数的每个结构所满足的公式。口语上来说,是存在着在任一可能的论域、可能的解释和赋值上都是“正确”的陈述。通常将逻辑公理视为能充分证明所有此语言中重言式的一套“最小”的重言式;在谓词逻辑中有更多的逻辑公理是需要的,为了证明那些在严格意义上不是重言式的逻辑事实。

例子

命题逻辑

命题逻辑里,一般将逻辑公理视为所有如下形式的公式,其中的   可以是语言中的任何公式,且包含的逻辑运算符只有逻辑非 蕴涵 两种:

  1.  
  2.  
  3.  

上面的每个形式都是一个“公理模式”,是用来产生无限多公理的规则。例如,若ABC命题变数,则  都会是公理模式1.的例子,因此都会是公理。可以证明只要有这三个公理模式和“肯定前件”,即可证明出所有命题演算中的重言式。也可证明只以其中的一对模式是无法和“肯定前件”一起充分证明出所有的重言式的。

其他包含着相同或不同逻辑运算符的公理模式也可以另行建构出来。

这些公理模式也被使用于谓词逻辑里,但需要附加上其他逻辑公理,藉以讨论包含了量词的命题。

一阶逻辑

等于公理 一阶语言。对每个变数 而言,公式

 

是普遍有效的。

这表示,对于任一变数 ,公式 可被视为是一个公理。而且,在这例子里,为了不落入含糊不清及一连串永不终止的“原始概念”之中,要不就是将 的精确概念给先建立完全,要不就是得规范符号 纯形式及语法的用法,只视之为一个字串,且只是由符号组成的字串。数理逻辑确实就是这么做的。

全称例化公理模式 给定一在一阶语言 中的公式 、一变数 和一 ,公式

 

是普遍有效的。

其中 代表以项 代换 中的 后所得到的公式。较不严谨地,这个例子允许我们如此陈述,若知道一特定性质 对每个 皆成立,且 代表着此结构内的一特定物件,则应可主张 是对的。

存在推广公理模式 给定一在一阶语言 中的公式 、一变数 和一项 ,公式

 

是普遍有效的。

非逻辑公理

非逻辑公理是在特定理论中充当基本假设的一种公式。两个不同的结构如自然数整数的推理可能涉及相同的逻辑公理;非逻辑公理则试图汲取对特定结构(或一套结构,如)来讲是特殊的地方。因此,非逻辑公理,不像逻辑公理,并不是“重言式”。非逻辑公理的别称为“公设”。

几乎每个现今的数学定律都是起始于一套给定的非逻辑公理,且曾被认为在原则上,每个理论都可以如此公理化,并且公式化成纯粹逻辑公式的语言。但这已被证明是不可能的了;然而,最近此一做法又以新逻辑主义的形式复活了起来。

非逻辑公理通常在数学论述中被简称为“公理”。这并不表示它们在某种绝对的意思上是正确的。例如,在一些里,群运算是可交换的,且这可以在加入加法公理下断言,但去掉此公理就可以很好地发展(更一般化的)群论,且甚至可以拿此公理的否定来做非可换群的研究。

因此,公理和定义了演绎系统推理规则一起构成了形式逻辑系统的基础。

例子

此节会给出一些完全由一套非逻辑公理(或简称公理)发展出来的数学定律。任何对此些题目的严谨处理都起始于对公理的详述。

基本理论如算术实分析复变分析通常都是由非公理化的方式开始介绍,但通常直接或间接地都会使用到具选择公理的策梅罗-弗兰克尔集合论(ZFC)的公理,或是一些极相似的公理化集合论,例如NBG。后者是ZFC集合论的保守扩展,在集合方面与ZFC具有相同的定理,因此两者有紧密的联系。有时,稍强的理论如MK,或带有允许使用格罗滕迪克全集强不可达基数的集合论也会被使用,但实际上,大多数数学家都可以在弱于ZFC的系统中确实地证明他们所需要的命题,比如在二阶算术中就可能做到这点。

在数学中,拓扑学的研究扩展成点集拓扑代数拓扑微分拓扑,和所有相关领域,如同调论同伦论。“抽象代数”也发展出群论伽罗瓦理论

此列表可以扩展至包含大多数的数学领域,如公理化集合论测度论遍历理论几率论表示理论微分几何等。

算术

皮亚诺公理一阶算术最广被使用的“公理化”。这套公理的强度足以证明许多数论中重要事实,以及允许哥德尔建立他著名的哥德尔不完备定理

设有一语言 ,其中, 是一个常数符号且 是一个一元函数且满足如下公理:

  1.  
  2.  
  3.  ,对任一 中有一自由变数的公式 而言。

其标准结构为 ,其中 为自然数的集合、 后继函数,且 自然被解释为数0。

欧几里得几何

平面几何中的4+1个公设大概是最古老且最有名的一组公理。这些公理被称为“4+1”,因为近两千年来,第五公设(“通过一直线外一点恰好存在一平行线”)一直被怀疑可以从前4个公理中导出。但最后,第五公设还是被证实是独立于前4个公理。确实,可以假设通过一直线外一点会没有平行线、恰好有一平行线,或有着无限多条平行线存在。这些选择给出了不同形式的几何,其三角形的内角和会分别为小于、等于或大于180度。这几种几何分别被称为椭圆几何欧几里得几何双曲几何

实分析

其研究的对象为实数。实数可唯一由一“戴德金完备有序体”(即带有上界的非空实数集合必然有最小上界)所决定(在同构意义上)。然而,若要表达这些公理的性质,需要使用到二阶逻辑勒文海姆-斯科伦定理告诉我们若局限于一阶逻辑里来描述,任何实数的公理系统都会允许有其他的模型,有些会小于实数,有些则会大于实数。后者有些被研究于非标准分析中。

在数理逻辑中的角色

演绎系统和一致性

一致性的要求是最重要的。如果一公理系统,不会同时推导到命题“p”和“非p”,那么它就称为一致的系统。 不一致的系统,会同时推导出“p”和“非p”的矛盾结果,在数学推论上,是不能容许的。

演绎系统和完备性

演绎系统包括有逻辑公理的集合 、非逻辑公理的集合 和“推理规则”的集合 。演绎系统的一个理想的性质为完备性

一个系统被称为是完备的,若对所有公式 

 ,则 

亦即,对任一为 “逻辑结果”的陈述,皆存在一个从 的陈述出发的“演绎”。这有时被表达为“所有真的陈述都是可证的”,但必须了解这里的“真”意指“公理集合致使其为真”,而不是“在某一特定解释下为真”。哥德尔完备性定理表明了某个常用类别的演绎系统的完备性。

注意“完备性”在哥德尔不完备定理中会有着不同的意思,其表示在算术理论中没有一套“递归”且“一致”的非逻辑公理 会是“完备”的,亦即总是存在一个算术陈述 ,其  都不能由给定的公理中证出。

这里,一边是指“演绎系统的完备性”,一边则是指“一套非逻辑公理的完备性”。因此,完备性定理和不完备性定理,除了其名称之外,并不相互冲突。

更多的探讨

早期的数学家视公理化几何为物理空间的模型,且明显地只能有此一模型。另一种数学系统可能存在的想法,对19世纪的数学家而言是极度困扰的,并费尽苦心地想要将这些系统从传统算术中推导出来。伽罗瓦证明这些努力大多都是白费的。最后,这些在代数系统中相互平行的抽象系统看起来似乎有其重要性,而现代代数也由此诞生了。以现在的观点来看,任意的公式集合都可以作为公理,只要这些公式并未被发现为不一致的便可。

参见

参考资料

引用

  1. ^ 高淑蓉. 國立清華大學微積分—高淑蓉. 2015-04-12 [2016-08-07]. (原始内容存档于2020-09-26) (中文). 

来源

  • Mendelson, Elliot (1987). Introduction to mathematical logic. Belmont, California: Wadsworth & Brooks. PlanetMathAxiom》的内容,版权遵守知识共享协议:署名-相同方式共享协议。

外部链接