Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Alejandro Cassini
Clase teórica N° 2
Consideraciones introductorias
Comenzaremos ahora con el estudio del método axiomático formal tal como se
usa en la matemática aproximadamente desde fines del siglo XIX o principios del siglo
XX. Hay una historia del método axiomático, sin duda, que se remonta a la Antigüedad
pero, salvo excepciones, la matemática siempre se desarrolló de manera no axiomática,
por lo cual muchas teorías matemáticas importantes fueron axiomatizadas muy
tardíamente a pesar de que esas teorías existían desde mucho tiempo antes. La
matemática se sigue enseñando de manera no axiomática, incluso en las carreras de
matemática; todos hemos aprendido algo de aritmética o de geometría sin necesidad de
usar el método axiomático. Sin embargo, si consultamos un diccionario de matemática,
todas las definiciones de los conceptos son axiomáticas. Los conceptos matemáticos se
definen explícitamente por medio de un conjunto de axiomas. Además del interés en sí
que pueda tener para la matemática y para la filosofía de la matemática, el método
axiomático tiene un interés particular en la filosofía de la ciencia empírica que
habremos de capitalizar en unas pocas clases. El punto esencial es que la concepción
estándar, o clásica, de las teorías empíricas, elaborada por los filósofos del empirismo
lógico en las décadas de 1920 y 1930, está basada en el método axiomático formal.
Luego se agregan otros elementos, pero el eje o la estructura es un sistema axiomático,
entonces, además del interés que pueda tener por sí mismo este método, emplearemos
estos conocimientos cuando estudiemos la estructuras de las teorías empíricas.
Básicamente, estos autores como ya dije en su momento, tomaban como ejemplo las
teorías físicas, ya que es difícil encontrar teorías axiomatizadas fuera del ámbito de la
física. En general, el método axiomático, salvo por intentos de algunos filósofos, ha sido
ajeno a la biología, a la química, y a las demás ciencias naturales, y ni hablar a las
ciencias sociales, allí nunca se ha usado ni se usa. Pero en la física sí se ha usado y
1
algunas de las teorías clásicas de la física, como la mecánica de Newton, fueron
presentadas de manera axiomática. Obviamente, la mecánica clásica no fue
axiomatizada a la manera del método axiomático formal que estudiaremos aquí,
simplemente porque en la época de Newton no existía tal método, no existían los
métodos formales.
2
El método axiomático es un tema sobre el que no existe demasiada bibliografía
accesible, en el sentido de que los libros avanzados de lógica o de filosofía de la
matemática ya presuponen un conocimiento del tema por parte del lector y, por
consiguiente, no lo explican demasiado, mientras que los libros introductorios no usan
el método axiomático o le dedican muy poco espacio. En algún momento hace ya
muchos años, en esta cátedra buscamos traducir alguna obra básica sobre el método
axiomático y realmente no la encontramos, por eso yo decidí escribir una dedicada
explícitamente a este curso, que voy a seguir, pero solo parcialmente, es decir, cada vez
la sigo menos en parte porque en algunos puntos he cambiado de opinión y en parte
porque no quiero repetir siempre los mismos ejemplos, así que los ejemplos los iré
variando sin seguir la secuencia que está allí. El libro se llama El juego de los principios
y también lo encuentran en el Campus Virtual. Lo que está allí es la segunda edición, de
2013, que corrige y extiende la primera versión, de 2007, que ya no recomiendo porque
lamentablemente contiene una cantidad de erratas y errores que hacen difícil entender
algunos temas, cosa que en parte es responsabilidad mía y en parte de los editores. En
alguno de los apéndices encontrarán traducidos sistemas axiomáticos de lógica y de
matemática, desde Aristóteles hasta el siglo XX, que tienen un interés histórico. Como
podrán advertir si miran ese apéndice, los sistemas lógicos y matemáticos
axiomatizados casi nunca se presentaron en lenguajes formalizados, pero nosotros los
escribiremos en el lenguaje de la lógica de primer orden, que como siempre señalo, los
matemáticos no usan. En matemática, la lógica se emplea siempre de manera implícita y
las teorías no se presentan formalizadas, sino en el lenguaje natural, complementado con
todo el vocabulario propiamente matemático. Pero los símbolos lógicos que conocemos
y el lenguaje de la lógica formal raramente se usan. Los capítulos 3, 4 y 5 de El juego de
los principios, tratan, respectivamente, de la estructura, la interpretación y las
propiedades de los sistemas axiomáticos. El capítulo 5 debe complementarse con el
apéndice 1, que trata sobre las pruebas de consistencia. Los capítulos contienen más
material del que necesitamos, por lo que algunos ejemplos, que indicaré luego, pueden
obviarse.
3
puramente definicionales. Sobre eso no se puede discutir demasiado o no se puede
opinar demasiado, como no se puede discutir demasiado cuestiones de definiciones
matemáticas; las cosas son así por definición. Uno podría preguntarse por qué son así,
pero primero tiene que aprenderse todas esas definiciones de todos esos conceptos, lo
cual hace que el tema sea un poco aburrido también para mí. Por eso no reproduciré
palabra por palabra las definiciones de todos los conceptos que estudiaremos; se
encuentran en el libro y las pueden estudiar de allí. Me detendré a explicar algunos
conceptos porque de otro modo la clase se vuelve simplemente una lectura de
definiciones. Luego ilustraré esos conceptos con algunos ejemplos que no están en el
libro. En el capítulo 2 decidí presentar un sistema de lógica con bastante detalle, junto
con ejemplos de demostraciones en ese sistema, pero justamente la lógica no es un buen
ejemplo de sistema axiomático. Creo que es mejor presentar una teoría matemática,
como la Aritmética de Peano de primer orden, que veremos enseguida, o también la
teoría de la probabilidad; así, a la vez, se ejemplifica un sistema axiomático y uno
conoce una teoría matemática en concreto. Por supuesto, si uno conoce solamente los
axiomas de la teoría, conoce muy poco, pero después todo se deduce de allí. La parte
difícil es, justamente, deducir los teoremas, cosa que no haremos porque no es una tarea
filosófica. En mi opinión, probar teoremas nunca es una tarea filosófica, es una tarea
propiamente matemática. No importa acerca de qué sean los teoremas; la matemática tal
como se la entiende hoy es algo extremadamente amplio. Por ejemplo, el ajedrez es
parte de la matemática: probar un teorema acerca del ajedrez, por ejemplo, que no se
puede dar jaque mate con caballo y rey contra rey, es demostrar un teorema de la
matemática pura. Para hacerlo, se toman las reglas del ajedrez como axiomas y se
prueba como teorema que no es posible dar jaque mate con esas piezas, y eso
independientemente de toda experiencia de jugar ajedrez. Así que siempre que uno
pruebe teoremas sobre algo está haciendo matemática, no importa sobre qué sean los
teoremas, ya sean sobre juegos, sobre decisiones, sobre estrategias de la guerra; todo eso
es parte de la matemática. La teoría de juegos es claramente una teoría matemática.
Pero, sin duda, hay teorías de la matemática que son más representativas o más cercanas
a lo que uno ha aprendido o sabe o considera que es matemática y, como siempre repito,
gran parte de la matemática no tiene nada que ver con los números. La idea de que la
matemática se ocupa de números es una idea muy antigua y ya estaba superada en el
siglo XIX, porque en ese siglo hay gran parte de la matemática que no se ocupa de
números, aparte del hecho de que la geometría nunca se ocupó de números. El concepto
4
fundamental de la matemática no es el de número, sino el de función. No hay teoría
matemática que no use funciones, aunque hay muchas teorías que no usan números,
como la topología. La tarea de un matemático puede caracterizarse mejor diciendo que
se dedica a probar las propiedades de ciertas funciones.
6
veritativo. Por tanto, es obvio que pueden considerarse como verdades evidentes. En un
sistema formal, los axiomas se conciben como ciertas fórmulas o cadenas de símbolos
que se eligen convencionalmente porque resultan útiles para deducir los teoremas, pero
que no son verdaderos ni falsos.
La idea que surgió junto con el método axiomático formal es una cierta
concepción formalista de toda la matemática, según la cual no hay objetos matemáticos
de los que la matemática se ocupa. La matemática se ocupa, en palabras de Hilbert, de
manipular símbolos, dicho de la manera más cruda. Los objetos de la matemática
podrían ser cualquier cosa, vasos de cerveza o mesas, solía decir Hilbert, o cualquier
objeto que cumpla con lo estipulado en los axiomas, pero no hay objetos
específicamente matemáticos que la teoría esté describiendo. Las teorías de la
matemática pura no tienen referencia, no se refieren a alguna clase determinada de
objetos. Después veremos cómo se interpreta un sistema axiomático y encontraremos
que hay infinitas posibilidades de interpretación. Pero la idea formalista, que viene de
Hilbert justamente, es que la matemática no se ocupa de cierto tipo de objetos especiales
que son los objetos matemáticos, como podrían ser los números, u otros objetos
abstractos. La matemática se ocupa de sistemas formales que está constituidos por
símbolos a los cuales no se les asigna significado. Y mediante una serie de reglas nos
enseña cómo manipular esos símbolos y como realizar demostraciones a partir de ellos,
como realizar inferencias.
7
Elementos de un sistema axiomático
8
subyacente. Nosotros utilizaremos exclusivamente la lógica clásica de primer orden
como lógica subyacente de los sistemas, pero, en general, el matemático emplea incluso
toda la teoría de conjuntos como lógica subyacente, o sea, usa una lógica mucho más
potente, que es equivalente a una lógica de orden N, es decir, a una lógica de cualquier
orden (segundo, tercero, etc.). Supondremos también que la lógica subyacente es
siempre clásica, a menos que se indique lo contrario. Ustedes saben que existen
muchísimas lógicas no clásicas, la mayoría de ellas de uso puramente filosófico, a los
cuales los matemáticos no les prestan mucha atención, hasta el punto de que a veces ni
siquiera saben de su existencia. Pero no siempre es así porque hay excepciones. A mí
me sorprendió saber, hace poco cuando estuve en un congreso sobre información
cuántica, que los que trabajaban en hacer programación usaban la lógica intuicionista,
que es una lógica más restringida que la clásica. Pero, por lo general, si no se hace
explícito, siempre se presupone que la lógica que se usa en un sistema axiomático es
clásica. Es la que se emplea en la enorme mayoría de los casos. Y muchos matemáticos
opinan que para ellos no existe otra, y que no hay otra que se use en la práctica de la
matemática. Pero —repito— esto en algunos ámbitos especializados puede no ser así,
pero en términos genéricos si no se hace explícita la lógica es siempre una lógica
clásica, cuyo piso, por así decir, cuyo mínimo es la lógica de primer orden (con
identidad y descripciones, cuando es necesario). La lógica proposicional axiomatizada
no es un buen ejemplo de sistema axiomático ya por esta razón, porque no tiene lógica
subyacente. O sea, si yo presento un sistema axiomático de lógica proposicional, que es
la lógica más básica, no hay una lógica subyacente que la lógica proposicional use, el
sistema tiene que dársela a sí mismo; este es un caso excepcional donde la lógica
subyacente la crea el propio sistema. Lo que importa retener ahora es que uno siempre
puede reconstruir cuál es la lógica subyacente del sistema que está implícita en
principio, y que en casi todos los sistemas de las ciencias formales es una lógica clásica,
aunque pueda ser más potente que la lógica de primer orden (como es el caso de la
lógica de segundo orden).
9
una cantidad de símbolos matemáticos que se presuponen y que no estarán sujetos a
interpretación. Puede decirse que tienen un significado lógico fijo. Por ejemplo, el
símbolo de identidad (=), ese es un símbolo que no es propio de un sistema axiomático
en particular; es un símbolo que proviene de la lógica subyacente, que se supone
comprendido y que no admite diferentes interpretaciones. Y en general, si el sistema es
un sistema de matemática, la aritmética puede considerarse presupuesta, como parte de
la lógica subyacente. Sin embargo, los símbolos específicos del sistema son de carácter
no lógico. Esos son los términos por así decir propios o específicos del sistema, aquellos
que cada sistema introduce y que luego estarán sujetos a interpretación.
Entre los símbolos no lógicos de un sistema distinguimos dos clases, una de las
cuales es esencial para todo sistema y la otra no. La primera la forman los términos
primitivos y la otra los términos definidos. Aquí tenemos ya uno de los elementos
esenciales que hay que presentar cuando se introduce un sistema axiomático: siempre es
necesario especificar cuáles son los términos primitivos del sistema. Cuando uno
presenta un sistema, puede no mencionar la lógica subyacente y puede no mencionar los
símbolos lógicos; los da por supuestos. Un sistema axiomático puede tener o no
términos definidos, no son esenciales; los términos definidos simplemente se introducen
por razones de economía o conveniencia y siempre son eliminables. O sea, todo lo que
se puede expresar en un lenguaje empleando términos definidos también se puede
expresar empleando términos primitivos. Cuando se presenta un sistema axiomático, es
necesario presentar algunos términos que se toman como primitivos. Y esto quiere decir
simplemente que son términos que no se definen en dicho sistema; los términos
primitivos son, entonces, simplemente términos no definidos.
10
además, otro término primitivo “P” especificando que es un predicado monádico, por
tanto, cuando se le asigne significado, no podrá referirse a un individuo, se referirá a
una clase de objetos. En el sistema, ni “a” ni “P” tienen un significado asignado, pero se
advierte que son de distinta categoría lógica. Otra categoría de términos es la de funtor,
que no es ni una constante de individuo, ni un predicado, ni una relación; es un término
que tiene otra categoría, que denota una función de un cierto grado (unaria, binaria,
etc.). El símbolo “+”, que denota la suma, por ejemplo, es un funtor binario (que
relaciona tres objetos, no necesariamente diferente, como ocurre en la expresión “a + b
= c”. Entonces, los términos primitivos, si bien no tienen significado, tienen categoría
lógico-gramatical. En la gramática formal de los lenguajes naturales ocurre algo
análogo: es necesario especificar la categoría gramatical de cada símbolo, por ejemplo,
sustantivos, adjetivos, verbos, pronombres, etc. Cada uno de ellos desempeña funciones
diferentes en una oración.
Los términos primitivos son esenciales dado que incluso en un sistema no formal
uno no podría definir todos los términos que usa. Si intentara hacer eso, necesariamente
caería en un círculo: todos los términos del sistema se definirán mediante otros términos
del mismo sistema, por lo que las definiciones serán circulares, en alguna medida. Eso
ya lo vio Aristóteles claramente al comienzo de los Segundos analíticos; Aristóteles lo
dice respecto de la demostración pero vale también para la definición. En algún
momento hay que introducir algún término que no se define. Si ustedes se fijan en la
estructura de un diccionario en una lengua natural, el diccionario siempre es circular
porque todos los términos que están en ese diccionario están definidos mediante otros
términos que también están en ese diccionario. La circularidad se ve claramente cuando
uno intenta aprender otro idioma con un diccionario; al buscar una palabra se ve
remitido a otras palabras que uno no conoce, y al buscar esas, a otras, hasta que vuelve a
encontrar algunas de las que buscaba en la definición de otras. Eso es inevitable, si se
quieren definir todas las palabras. Pero hay círculos que son virtuosos, en el sentido de
que forman una especie de red, y otros círculos que son viciosos. Si yo defino el
término “a” empleando el término “b” y, a su vez, a “b” empleando “a”, he caído en un
círculo vicioso, donde no puedo saber el significado de ninguno de los dos términos.
Pero si “a” se define por medio de “b y c”, “c” por medio de “d y e”, y así, se forma
una red de conceptos, en la cual puedo volver al punto de partida “a” por diversos
caminos. De esa manera, se esclarecen los significados de todos los términos que
11
forman la red. Todo diccionario siempre es circular, pero en el método axiomático no se
admite tampoco esa clase de círculos virtuosos en las definiciones. Debe haber ciertos
términos que no tienen definición y que, por tanto, se toman como primitivos; y es
esencial indicar cuales son esos primitivos y cuáles no.
Los términos definidos son términos que se definen mediante los términos
primitivos y los símbolos lógicos del vocabulario del sistema. El objeto de introducir
términos definidos es más bien reemplazar o eliminar expresiones complejas para
simplificarlas. Supongamos que “a”, “b” y “c” son términos primitivos de un sistema
y yo introduzco una definición para el término “d”. ¿Qué se gana con esto?
Supongamos que hay expresiones que apareces muy frecuentemente en las fórmulas
del sistema. Si se introduce un término definido cuyo significado está dado por esa
expresión, entonces, cada vez que aparezca se la puede reemplazar por el término
definido. De ese modo, se simplifica el lenguaje del sistema. Supongamos que esa
expresión que se repite sea “(a + b / c)”, donde “a”, “b” y “c” son términos
primitivos del sistema. Es conveniente, entonces, introducir el término definido “d”
del siguiente modo: d def = (a + b / c). Así, cada vez que en una fórmula aparezca la
expresión “(a + b / c)”, puedo eliminarla reemplazándola por el término “d”. Es
evidente que, de esta manera, el lenguaje del sistema se hace más simple y
económico. Esa es la función de los términos primitivos, básicamente. Pero pueden
no estar presentes en un sistema porque todo lo que se puede decir con términos
definidos se puede decir solamente con los primitivos. Así pues, toda fórmula que se
escriba en un sistema axiomático formal con los términos primitivos es equivalente a
otra fórmula que se escribe solamente con términos primitivos, solo que este
equivalente puede ser más complicado. En la física también es muy usual introducir
términos definidos que son meras abreviaturas de ciertas fórmulas complicadas. Por
1
ejemplo, en la teoría de la relatividad aparece con frecuencia la expresión ,
𝑣2
1−√ 2
𝑐
pero, por definición, se la llama , con lo cual se simplifican mucho las ecuaciones.
𝑚.𝑣
Así, la fórmula del momento relativista 𝑝 = se escribe, como 𝑝 = 𝑚. 𝑣. 𝛾, que
𝑣2
1−√ 2
𝑐
es, obviamente mucho más simple. Muchos sistemas axiomáticos, sin embargo, no
usan términos definidos, simplemente porque no los necesitan.
12
El tercer componente de un sistema axiomático, el 2 de la lista, son las
llamadas reglas de formación. Una vez especificado el vocabulario de un sistema
axiomático, es posible empezar a construir su lenguaje. La finalidad es poder formar
las secuencias o cadenas de símbolos que se consideran bien formadas en el sistema.
Para poder tener esas fórmulas, es necesario contar con un cierto conjunto de reglas
lógico-gramaticales que se llaman reglas de formación. Son el equivalente de las
reglas sintácticas, de las reglas de la sintaxis en la gramática de los lenguajes
naturales, que indican cómo combinar las palabras para formar oraciones correctas
de la lengua. Esas reglas varían con los idiomas. En español “veo el verde árbol” y
“veo el árbol verde” son ambas oraciones bien formadas; en inglés, en cambio, “I see
the green tree” está bien formada, pero no “I see the tree green”. Las reglas de
formación determinan cómo se combinan los términos del vocabulario para formar
ciertas cadenas de símbolos que se consideraran fórmulas bien formadas (fbf).
13
sucesivamente. Imaginemos una regla para el uso de los paréntesis ( ); la regla diría
algo así: si “a” es una fbf, entonces, “(a)” también es una fbf. Por el carácter
recursivo de la regla de formación se sigue que “((a))”, “(((a)))”, etc., también son
fbf. Si algo es una fbf, entonces, el resultado de colocarlo entre paréntesis también es
una fbf. La recursividad de la regla de formación permite que a partir de una fbf
cualquiera se pueda obtener un número infinito de fbf, aplicando cada vez
nuevamente la regla al resultado de la aplicación anterior. Imaginemos ahora una
regla para el uso de las conectivas lógicas de un sistema lógico:
Aplicando esa regla a dos fbf cualesquiera y se pueden formar fbf cada vez
más extensas, como “(→) → (→)”, pero siempre finitas. Una sola regla de
formación, si es recursiva, basta para generar un número infinito de fbf.
En la regla RF1, las letras griegas son metavariables que se refieren a cualquier
fbf, por ejemplo, “” pude referirse a una fórmula compleja de la lógica proposicional
como “(p v q v r)”, o cualquier otra. Las reglas de formación se escriben con
metavariables porque tienen un carácter metalingüístico: son reglas que se refieren a
símbolos del lenguaje y nos indican cómo combinarlos. En matemática siempre que se
mencionan dos símbolos que se refieren a dos cosas y no se dice explícitamente que
sean diferentes, siempre pueden ser la misma, o sea y pueden ser la misma fórmula.
Entonces, aplicando RF1 al ejemplo anterior, obtendríamos la fbf siguiente: “(p v q v
r) → (p v q v r)”. El conjunto de todas las fbf de un sistema axiomático se llama el
lenguaje de ese sistema. Así pues, cuando se habla del lenguaje de una teoría se hace
referencia al conjunto de todas las fórmulas que están bien formadas en esa teoría.
Dicho conjunto es siempre infinito, a causa del carácter recursivo de las reglas de
formación. Una sola regla de formación aplicada recursivamente a una sola fbf permite
generar un número infinito de fbf (recordemos la regla para usar los paréntesis, que nos
permite formar la secuencia infinita de fbf: (), (()), ((())), …, a partir de la única fbf
). Así, en cualquier sistema axiomático, hay infinitas fbf, aunque cada una de ellas
tiene una extensión finita.
14
no cómo convertir una fbf en otra fbf. Para ello se requiere otro tipo de reglas. La
distinción entre reglas de formación y reglas de transformación también existe en la
gramática de los lenguajes naturales, pero se reconoció más tardíamente, aunque todos
los hablantes las usamos. En los lenguajes formales, las reglas de transformación
especifican cómo obtener una fbf a partir de otras fbf, mientras que en los lenguajes
naturales las reglas gramaticales de transformación especifican como obtener una
oración sintácticamente bien formada a partir de otra oración sintácticamente bien
formada. Se trata claramente, de reglas sintácticas. En una lengua natural, por ejemplo,
una regla de transformación sería la regla para pasar una oración en voz activa a la voz
pasiva. Esa regla no nos indica cómo formar una oración a partir del vocabulario
disponible de nuestra lengua, sino cómo transformar una oración que está bien formada
en otra que también está bien formada. En español, a partir de “Yo leo este libro” se
puede obtener “Este libro es leído por mí”. Al hacer eso hemos pasado de una oración
bien formada a otra oración bien formada aplicando, una regla de transformación
implícita que nos dice cómo pasar una oración a la voz pasiva. Los hablantes lo
hacemos naturalmente bien sin ser conscientes de la regla, pero es claro que esa no es
una regla de formación. La regla de formación nos indica cómo formar una oración a
partir del vocabulario. Esta regla dice otra cosa distinta, dice cómo obtener una oración
bien formada a partir de otra oración bien formada. Entonces, las reglas de
transformación transforman (de allí su nombre) ciertas fbf en otras fbf.
15
causaron problemas en el sentido de que todos los matemáticos estaban más o menos de
acuerdo en cuáles eran las reglas válidas para hacer demostraciones en matemática. El
consenso se rompió a principios de siglo XX cuando se cuestionaron por primera vez
las demostraciones por el absurdo. Lo hizo por primera vez el matemático holandés
Liutzen Brouwer (1881-1966), el creador de la lógica intuicionista. Las pruebas por el
absurdo, evidentemente, están basadas en una regla de inferencia que presupone, entre
otras cosas, las leyes lógicas del tercero excluido ( v ) y de doble negación (
). Cuando se prueba por el absurdo una determinada fórmula , lo que se hace es
negarla, deducir desea negación una fórmula contradictoria, y luego, mediante la doble
negación concluir, . Por ejemplo, si se quiere probar , se procede así:
ß ß
⎯⎯⎯
Es decir, si de una fórmula se deduce una contradicción, esa fórmula debe ser
falsa, y dado que esa fórmula es la negación de la que se quiere demostrar, se concluye,
por doble negación que tal fórmula es verdadera. La lógica intuicionista justamente no
aceptaba esta regla lógica y, por consiguiente, cuestionaba las pruebas por el absurdo, a
las que consideraba de carácter no constructivo y, por tanto, inválidas en matemática. El
problema con esta posición intuicionista es que hay una cantidad de teoremas
matemáticos para los cuales no se ha podido encontrar otro tipo de demostración que las
demostraciones por el absurdo, incluso en la geometría de Euclides ocurre eso. Con el
surgimiento del intuicionismo por primera vez se presentó una discusión sobre qué
reglas de demostración son aceptables. Y este es un punto filosóficamente interesante y
muy profundo porque si alguien presenta una demostración de un teorema, está
presuponiendo que todos están de acuerdo con las reglas que se han usado para deducir
ese teorema. Pero si no hay acuerdo sobre eso, por ejemplo, si la prueba es una prueba
por el absurdo y alguien piensa que ese tipo de pruebas no es válido, entonces, no podrá
aceptar que ese teorema ha sido demostrado. En cualquier caso, la demostración por el
absurdo se sigue usando ampliamente en matemática, porque —repito— hay muchos
teoremas para los que no se ha encontrado otra manera de probarlos; pero, por supuesto,
eso no quiere decir que no exista otra prueba, sino simplemente que nadie sabría cómo
probarlos, al menos hasta ahora. Si se rechazan las pruebas por el absurdo, una gran
16
parte de la matemática clásica se viene abajo, ya que esa clase de pruebas se usa
ampliamente en la demostración de numerosos teoremas fundamentales. Por supuesto,
si la lógica subyacente de un sistema es clásica, las pruebas por el absurdo son válidas
porque en la lógica clásica son válidas tanto la ley del tercero excluido como la de doble
negación. Probablemente, más del 99% de los matemáticos son clásicos y aceptan las
demostraciones por el absurdo. Pero filosóficamente es interesante que el
cuestionamiento de esta clase de pruebas haya surgido desde el interior de la
matemática misma; no fue un problema artificial creado por los filósofos.
Paradójicamente, Brouwer encontró que uno de los teoremas principales que él mismo
había probado como matemático, el teorema de punto fijo que lo hizo famoso, no era
demostrable con su propia lógica intuicionista. Pero hay que cuidarse de generalizar sin
excepciones y decir que la lógica que se usa en matemática es siempre la lógica clásica;
de eso yo mismo tuve que retractarme, y muchos matemáticos también, porque hay
ejemplos concretos donde se usa la lógica intuicionista creada por Brouwer.
17
lógica proposicional. Ese esquema, entonces, es una manera simbólicamente resumida,
la única posible, de presentar un conjunto infinito de axiomas. Obviamente, esos
infinitos axiomas no se pueden listar, pero sabemos cómo obtenerlos a partir del
esquema de axioma, simplemente, sustituyendo de manera uniforme las metavariables
por fbf de la lógica proposicional.
Cuando una teoría contiene un número finito de axiomas se dice que está
finitamente axiomatizada y cuando no, que no está finitamente axiomatizada. Basta que
una teoría tenga un solo esquema de axioma para que no esté finitamente axiomatizada,
independientemente del número adicional de axiomas que pueda contener. Ocurre que
en matemática hay muchas teorías que no son finitamente axiomatizables. Dos ejemplos
famosos son la Aritmética de Peano de primer orden y la teoría de conjuntos de
Zermelo-Fraenkel. Ambas contienen esquemas de axiomas que no se pueden
reemplazar (o nadie sabe cómo hacerlo hasta ahora) por un conjunto finito de axiomas.
Son teorías que no son finitamente axiomatizables. Es deseable que una teoría tenga un
número finito de axiomas, porque de esa manera resulta más simple e intuitiva, pero no
es indispensable. La lógica proposicional actualmente se presenta usando solamente
esquemas de axiomas. La Aritmética de Peano de primer orden y la teoría de conjuntos
de Zermelo-Fraenkel emplean axiomas y esquemas de axiomas a la vez, lo cual parece
poco elegante desde un punto de vista estético. Pero no se sigue de ese hecho ninguna
dificultad.
18
una lista de teoremas en última instancia, ni más ni menos, pero no basta con decir eso.
Repitamos entonces, la definición:
La axiomatización de la aritmética
19
teorías matemáticas, incluso las más antiguas como la aritmética de los números
naturales, se usaban de manera no axiomática y las demostraciones eran demostraciones
intuitivas, por así decirlo, no codificadas formalmente. No es fácil identificar cuál fue el
primer sistema axiomático formal. A veces suele ocurrir en historia de la ciencia que
hay ciertas cuestiones o problemas que están en el ambiente y las respuestas a esos
problemas aparecen de manera simultánea e independiente en distintos lugares, en
distintos autores que trabajan sin conexiones entre sí. Por eso son tan frecuentes los
descubrimientos simultáneos y las disputas de prioridad entre científicos. Actualmente
rige la convención de que tiene la prioridad del descubrimiento el primero que lo
publica, aunque a veces se publican simultáneamente… Todos los artículos científicos
se publican con la fecha de recepción. La fecha que cuenta como fecha del
descubrimiento es la fecha de recepción por parte de la revista que lo publica y eso es lo
que establece la prioridad. Pero también son frecuentes los casos en que alguien hace un
descubrimiento y otro lo descubre después y lo publica antes.
20
teoremas. Hay una cantidad de autores de finales del siglo XIX, todos matemáticos,
como Moritz Pasch (1843-1930) en Alemania, Mario Pieri (1860-1913) en Italia, Henri
Poincaré (1854-1912) en Francia, y David Hilbert (1862-1943) en Alemania, entre
otros, que se proponen reaxiomatizar la geometría euclídea de manera más rigurosa.
Aquí surge una pregunta importante. Supongamos que cada uno de estos autores
presenta un sistema axiomático con diferentes axiomas y todos ellos pretenden
axiomatizar la geometría euclídea. ¿Cómo puede saberse que efectivamente que
axiomatizan la geometría euclídea y no teorías diferentes? Analizando las respectivas
listas de axiomas, eso no puede saberse con certeza. Es necesario probar que cada uno
de esos sistemas es equivalente a los otros, es decir, que todos son lógicamente
equivalentes entre sí. ¿Cómo se prueba esa equivalencia? Supongamos que sean solo
dos sistemas. Primero es necesario traducir los axiomas de cada uno al lenguaje del
otro, porque pueden usar diferentes términos primitivos, y de hecho es así. Luego es
necesario probar que los axiomas de un sistema se deducen como teoremas en el otro
sistema y viceversa. Con ello se habrá probado que los sistemas son equivalentes y que,
por tanto axiomatizan la misma teoría. Todo lo que se puede deducir en uno, se podrá
deducir en el otro y viceversa. Pero eso hay que probarlo, puede no ser nada evidente,
sobre todo cuando esos axiomas están escritos en lenguajes diferentes, que es lo que
ocurría en este caso. Por ejemplo, a Poincaré se le ocurrió tomar como término
primitivo de la geometría euclídea el término “movimiento”, algo que era muy
novedoso porque es muy moderno para la geometría. Tradicionalmente, se tomaban
como primitivos de la geometría euclídea los términos “punto”, “recta” y “plano”, que
es lo que hizo Hilbert. En suma, como ya dijimos, dos conjuntos diferentes de axiomas
axiomatizan la misma teoría si y solo si son lógicamente equivalentes entre sí. Pero eso
debe ser probado, no puede saberse por una mera lectura de los axiomas de cada
sistema. La manera de probarlo es deducir los axiomas de un sistema como teoremas en
el otro y viceversa; una vez hecho eso, queda probado que los dos sistemas son
equivalentes. Por tanto, permiten demostrar exactamente los mismos teoremas y
resultan, entonces, dos formulaciones diferentes de la misma teoría.
21
lenguaje de la lógica que empleamos actualmente. La formación del lenguaje de la
lógica también llevó su tiempo, por eso cuando se intenta leer a los autores del siglo
XIX o principios del XX, a veces resulta difícil porque no es sencillo acostumbrase al
formalismo con el que están escribiendo. En general, las obras clásicas de la historia de
la ciencia son muy difíciles de leer, incluso para un científico. Por ejemplo, a un
especialista actual en electrodinámica le resultaría extremadamente difícil leer la gran
obra de James Clerk Maxwell (1831-1879) sobre electrodinámica, llamada A Treatise
on Electricity and Magnetism, a pesar de que no es tan lejana, de 1873, porque el
lenguaje de Maxwell no es el lenguaje que usa la física actual, el simbolismo no es el
simbolismo que se usa. Además, la manera de formular las teorías, incluso en física y en
matemática, cambia muy frecuentemente. El formalismo se actualiza y se vuelve más
compacto en la notación. Yo he traducido los axiomas de Peano en el apéndice 2 de El
juego de los principios, pero no usaré la formulación que él presentó, sino una
formulación más actual. El formalismo más antiguo de la lógica matemática viene de
Peano y de ahí lo tomó Bertrand Russell (1872-1970), que lo popularizó ampliamente;
pero luego ese formalismo se modificó varias veces hasta llegar a la notación canónica
que se usa ahora. Pero incluso actualmente, no todos los autores emplean la misma
notación, incluso en lógica. Un aspecto útil del libro Lógica de la A-Z, que ya cité antes,
es que al final tiene una lista completa de todos los formalismos y sus equivalencias.
Así, por ejemplo, para la negación hay seis símbolos distintos que han usado distintos
autores, para la conjunción hay cinco, para el bicondicional hay cuatro, etc. Todos esos
símbolos se usaron en algún momento, incluso de manera simultánea en diferentes
autores, y eso hace más difícil leerlos y compararlos. Es evidente que la uniformización
o estandarización del lenguaje científico constituye un progreso por sí mismo, como lo
fue en su momento la introducción del sistema métrico decimal o, antes, la numeración
arábiga.
22
axioma admite diferentes formulaciones equivalentes. De hecho, todos los axiomas de
cualquier teoría se pueden reducir a un único axioma poniéndolos en conjunción y
encontrando una forma equivalente no conjuntiva. De ese modo, siempre podemos
emplear un único axioma, que inevitablemente será extenso y complicado. Por otra
parte, cualquier axioma se puede cortar o dividir en varios axiomas, encontrando una
forma equivalente conjuntiva y separando los diferentes componentes de la conjunción.
La misma teoría se puede axiomatizar con diferentes números de axiomas. Siempre es
posible formular cualquier teoría axiomática con un único axioma. Pero, por razones de
conveniencia, se prefiere aumentar el número de axiomas y utilizar axiomas
relativamente cortos y relativamente intuitivos hasta donde sea posible. Por esa razón la
formulación actual más conocida de la aritmética de Peano tiene siete axiomas, mientras
que Peano usaba solamente cinco, pero esto es una cuestión puramente convencional.
23
otro número natural, que es su sucesor. Esos son los primitivos del sistema que todavía
se siguen usando así en algunas presentaciones. En otras formulaciones más actuales, se
agregan dos primitivos: los términos “suma” y “producto”, que son también funtores
binarios, es decir, que relacionan tres individuos, como lo hacen las operaciones de
suma y multiplicación entre números naturales.
Axiomas:
(A1) x (Sx = 0)
(A2) x y (Sx = Sy → x = y)
(A3) x (x + 0 = x)
(A5) x (x . 0 = 0)
En general, cuando hay varios cuantificadores del mismo tipo sobre varias
variables se suele escribir una sola vez y después por ejemplo: x,y,z o xyz.. El orden de
los axiomas también es relativamente convencional, aunque generalmente queda
establecido por el uso. Los dos primeros axiomas expresan las propiedades de la
función sucesor. El primer axioma a veces se expresa en la forma equivalente: x (0 =
Sx). Los axiomas tercero y cuatro introducen las reglas para usar la suma; los axiomas
cuarto y quinto hacen lo mismo con la función producto. El sexto axioma relaciona la
suma con el producto. Todos los axiomas están escritos solo con los términos primitivos
del sistema y los símbolos de la lógica de primer orden.
24
El séptimo axioma que, es el quinto de la formulación de Peano, tiene un
carácter diferente de los demás, porque es un esquema de axioma. Formula el llamado
principio de inducción matemática, que suele expresarse así: si el primer número
natural tiene una determinada propiedad y si para todo número natural ocurre que si un
número tiene esa propiedad, entonces, el sucesor también la tiene, entonces, todos los
números naturales tienen esa propiedad. Es un esquema de axioma porque incluye la
metavariable de predicado monádico , que puede referirse a cualquier predicado
monádico no especificado. Esa metavariable está libre, no está cuantificada, porque en
la lógica de primer orden no se pueden cuantificar las variables de predicados, que, de
hecho, se tratan como constantes.
25
El estudio de las teorías de segundo orden está fuera del alcance de este curso,
pero al menos quiero explicar el concepto de extensión que acabo de usar. Si a una
teoría T1 se le agregan nuevos axiomas, se obtiene otra teoría T2 que es más potente que
la primera porque contiene todos los teoremas de T1 y, además, todos los infinitos
teoremas que se siguen de los nuevos axiomas. En ese caso se dice que T2 es una
extensión de T1 y que T1 es una subteoría de T2, ya que todos los teoremas de T1
también son teoremas de T2, pero no a la inversa. La extensión se llama conservativa
cuando no permite probar nuevos teoremas en el lenguaje de T1 más que los que ya
formaban parte de esa teoría. Si eso no ocurre, como en el caso de AP2 respecto de AP1,
se dice que la extensión es no conservativa. Estos no son conceptos que sea necesario
conocer en este curso. Basta saber que AP2 es una teoría mucho más potente que AP1 y,
en tanto teoría de segundo orden, tiene propiedades muy diferentes. En todo lo que
sigue, sin embargo, nos limitaremos a las teorías de primer orden. Además, todos los
ejemplos de El juego de los principios son de teorías de primer orden.
(A1) x (x = a)
(A2) x y (x = y → x = y)
(A3) x (x 1 a = x)
Bibliografía
27
28