You are on page 1of 505

Carlos Ivorra Castillo

ALGEBRA

Mathematics, rightly viewed, possesses not only


truth, but supreme beauty a beauty cold and austere, like that of sculpture.
Bertrand Russell

Indice General
Pre
ambulo

ix

Introducci
on

xiii

Captulo I: El lenguaje de la teora de conjuntos


1.1 Conjuntos . . . . . . . . . . . . . . . . . . . . .
1.2 Los axiomas de la teora de conjuntos . . . . .
1.3 Funciones . . . . . . . . . . . . . . . . . . . . .
1.4 Los n
umeros naturales . . . . . . . . . . . . . .
1.5 Relaciones de orden . . . . . . . . . . . . . . .
1.6 Conjuntos finitos . . . . . . . . . . . . . . . . .
1.7 Productos cartesianos . . . . . . . . . . . . . .
1.8 Relaciones de equivalencia . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

1
1
3
13
18
27
33
39
42

Captulo II: Anillos


2.1 Leyes de composici
on interna . . . . . . .
2.2 Los n
umeros enteros . . . . . . . . . . . .
2.3 Conceptos b
asicos sobre anillos . . . . . .
2.4 Cuerpos de cocientes. N
umeros racionales
2.5 Anillos de polinomios . . . . . . . . . . . .
2.6 Apendice: Sumas y productos finitos . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

45
45
51
57
65
73
81

Captulo III: Aritm


etica en dominios ntegros
3.1 Ideales . . . . . . . . . . . . . . . . . . . . .
3.2 Divisibilidad en dominios ntegros . . . . . .
3.3 Ideales y divisibilidad . . . . . . . . . . . .
3.4 Divisibilidad en Z . . . . . . . . . . . . . . .
3.5 Divisibilidad en anillos de polinomios . . . .
3.6 Congruencias y anillos cociente . . . . . . .
3.7 Ejemplos . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

87
87
93
97
101
103
111
125

Captulo IV: Algunas aplicaciones


133
4.1 N
umeros perfectos . . . . . . . . . . . . . . . . . . . . . . . . . . 133
4.2 Primos de Fermat . . . . . . . . . . . . . . . . . . . . . . . . . . 137
4.3 Ternas pitag
oricas . . . . . . . . . . . . . . . . . . . . . . . . . . 140
v

INDICE GENERAL

vi
4.4
4.5
4.6

Sumas de cuadrados . . . . . . . . . . . . . . . . . . . . . . . . . 142

El Ultimo
Teorema de Fermat . . . . . . . . . . . . . . . . . . . . 146
Enteros ciclot
omicos . . . . . . . . . . . . . . . . . . . . . . . . . 151

Captulo V: M
odulos y espacios vectoriales
5.1 M
odulos . . . . . . . . . . . . . . . . . . . .
5.2 Suma de m
odulos . . . . . . . . . . . . . . .
5.3 M
odulos libres . . . . . . . . . . . . . . . .
5.4 Matrices . . . . . . . . . . . . . . . . . . . .
5.5 M
odulos finitamente generados sobre DIPs .
5.6 Apendice: Espacios vectoriales de dimensi
on

. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
infinita

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

155
155
161
166
174
180
193

Captulo VI: Grupos


6.1 Conceptos b
asicos . . . .
6.2 Grupos de permutaciones
6.3 Subgrupos normales . . .
6.4 Producto de grupos . . . .
6.5 Grupos cociente . . . . . .
6.6 Las unidades de Z/nZ. . .
6.7 Grupos alternados . . . .
6.8 p-grupos . . . . . . . . . .
6.9 Los teoremas de Sylow . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

195
195
204
211
217
219
224
226
228
231

Captulo VII: Extensiones de cuerpos


7.1 Extensiones algebraicas . . . . . .
7.2 Extensiones normales . . . . . . . .
7.3 Extensiones separables . . . . . . .
7.4 Normas y trazas . . . . . . . . . .
7.5 La teora de Galois . . . . . . . . .
7.6 Cuerpos algebraicamente cerrados
7.7 Cuerpos formalmente reales . . . .
7.8 Extensiones ciclot
omicas . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

235
235
245
248
257
259
264
269
277

. . . . . . .
de m
odulos
. . . . . . .
. . . . . . .
. . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

283
283
295
302
314
321

Captulo IX: Resoluci


on de ecuaciones por radicales
9.1 Polinomios simetricos . . . . . . . . . . . . . . . .
9.2 La resultante de dos polinomios . . . . . . . . . . .
9.3 El grupo de Galois de un polinomio . . . . . . . . .
9.4 Ecuaciones c
ubicas . . . . . . . . . . . . . . . . . .
9.5 Ecuaciones cu
articas . . . . . . . . . . . . . . . . .
9.6 Grupos resolubles . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

327
327
331
335
341
347
352

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

Captulo VIII: Algebra


lineal
8.1 Determinantes . . . . . . . . .
8.2 Clasificaci
on de homomorfismos
8.3 Clasificaci
on de endomorfismos
8.4 Formas bilineales . . . . . . . .
8.5 Aplicaciones . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

INDICE GENERAL
9.7
9.8

vii

Extensiones radicales . . . . . . . . . . . . . . . . . . . . . . . . . 358


Apendice: La trascendencia de e y . . . . . . . . . . . . . . . . 366

Captulo X: Enteros algebraicos


10.1 La forma bilineal asociada a la traza
10.2 Anillos de enteros algebraicos . . . .
10.3 Divisibilidad en anillos de enteros . .
10.4 Dominios de Dedekind . . . . . . . .
Captulo XI: Factorizaci
on en cuerpos
11.1 Los primos cuadr
aticos . . . . . . .
11.2 El grupo de clases . . . . . . . . .
11.3 C
alculo del n
umero de clases . . .
11.4 Los teoremas de Euler . . . . . . .
11.5 La ley de reciprocidad cuadr
atica .
11.6 El smbolo de Jacobi . . . . . . . .
Captulo XII: Complementos sobre
12.1 Cuerpos finitos . . . . . . . . .
12.2 El teorema de la base normal .
12.3 Extensiones inseparables . . . .
12.4 Extensiones trascendentes . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

375
375
377
388
402

cuadr
aticos
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

417
417
420
424
436
440
446

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

451
451
458
460
463

.
.
.
.

.
.
.
.

.
.
.
.

cuerpos
. . . . . .
. . . . . .
. . . . . .
. . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

Ap
endice A: El axioma de elecci
on

471

Ap
endice B: Conjuntos infinitos

477

Bibliografa

485

Indice de Materias

486

Pre
ambulo
Este libro es una versi
on extendida de mi libro original del mismo ttulo.
Adem
as de haber a
nadido bastante material nuevo, otra diferencia sustancial
respecto de la versi
on anterior es que ahora las nuevas versiones de los libros

Algebra
[Al], Geometra [G] y An
alisis matem
atico I [An] est
an concebidas para
ser ledas simult
aneamente, mientras que las anteriores podan leerse sucesivamente en el orden indicado. Esto ha hecho que parte del material original haya
pasado de un libro a otro en las versiones nuevas.
M
as concretamente, si los captulos de los tres libros se leen de arriba hacia
abajo y de izquierda a derecha seg
un la disposici
on de la tabla de la p
agina
siguiente, cada uno s
olo requiere el conocimiento de los captulos precedentes,
salvo por unas pocas excepciones indicadas m
as abajo. Consideramos que este
orden es mucho m
as natural en la medida en que imita lo que sera el estudio
simult
aneo de tres asignaturas y se aprovecha dicha simultaneidad para enfatizar
las relaciones entre ellas.
El libro [An] es el u
nico que no cubre todos los contenidos de la versi
on
anterior, sino que los u
ltimos captulos de dicha versi
on aparecen ahora en el
libro An
alisis matem
atico II, que debe ser entendido como un segundo volumen
del mismo libro, cuyos captulos contin
uan la numeraci
on del primero, y que
han sido separados porque ya no guardan ning
un paralelismo con los de [Al]
y [G].
El primer captulo de [Al] es una introducci
on a la teora de conjuntos, cuyos
aspectos m
as tecnicos (los relacionados con el axioma de elecci
on y la teora de
cardinales infinitos) se han relegado a dos apendices. La teora descrita es la
teora de Zermelo, que resulta m
as que suficiente para formalizar los contenidos
de los tres libros. El u
nico inconveniente es que se queda corta para desarrollar plenamente la teora de cardinales infinitos, pero hemos preferido reducirla
a lo imprescindible, aun al precio de no poder enunciar con total precisi
on algunos resultados sobre rango y dimensi
on de m
odulos y espacios vectoriales
de dimensi
on infinita que, aunque resulta natural presentarlos al tratar estos
conceptos, no son realmente necesarios en ning
un momento.
Los contenidos de [Al I] (y sus apendices) sirven de base a los tres libros.
A su vez, los captulos [G II] y [An I] se apoyan en las estructuras algebraicas
introducidas en [Al II]. En estos dos captulos se presentan dos construcciones
alternativas de los n
umeros reales, mediante secciones de Dedekind en [G II] y
mediante sucesiones de Cauchy en [An I]. Por otra parte, el captulo [An II] se
ix

Pre
ambulo

Algebra
Al I

Geometra

lisis I
Ana

Preliminares

Al II

GI

Anillos

Geometra absoluta

Al III

G II

An I

Aritmetica

Geometra arquimediana

N
umeros reales

Al IV

G III

Aplicaciones

Geometra eucldea

Al V

G IV

An II

M
odulos

Geometra analtica

Topologa

Al VI

GV

An III

Grupos

Complejos y cuaternios

Compacidad, . . .

Al VII

G VI

Cuerpos

Regla y comp
as

Al VIII

G VII

Algebra
lineal

Biyecciones afines

Al IX
Ecuaciones
Al X
Enteros algebraicos
Al XI
Enteros cuadraticos
Al XII
Complementos
Al Ap A
Ax. de elecci
on
Al Ap B
Conjuntos infinitos

G VIII
Geometra
G IX
Geometra
GX
C
onicas
G XI
Geometra
G XII
Geometra
G XIII
Geometra

An IV
Calculo una variable
An V
Calculo varias variables
An VI
Variedades
An VII
Ecuaciones diferenciales
An VIII
Medida I
An IX
Medida II
An Ap A
Compleci
on de un e.m.
An Ap B
Fracciones continuas
An Ap C
Dinamica clasica

afn
proyectiva

parab
olica
hiperb
olica
elptica

apoya en la geometra analtica expuesta en [G IV].


Las u
nicas dependencias que no respetan el orden indicado en la tabla prececente son las siguientes:
La secci
on [G 7.7] usa la medida de Jordan definida en [An 9.1], pero dicha
secci
on puede leerse antes de [G 7.7], pues no requiere nada intermedio.
El captulo [An VII] usa en un ejemplo las c
onicas definidas en la secci
on
[G 10.1], pero esta secci
on (pero no el resto del captulo) puede leerse
tras [G IV] y resulta incluso recomendable hacerlo, como ilustraci
on de
las posibilidades de la geometra analtica.
Las lneas horizontales en la tabla separan bloques tem
aticos. El segundo
bloque de [Al], despues del captulo de preliminares conjuntistas al que ya hemos
hecho referencia, contiene una presentaci
on de la aritmetica b
asica desde el

xi
punto de vista del algebra abstracta, junto con aplicaciones que conectan este
enfoque abstracto con resultados cl
asicos. En el tercer bloque se introducen
nuevas estructuras abstractas con resultados que se aplican principalmente a
la geometra (en [G]) y a la aritmetica en el cuarto bloque, que contiene una
introducci
on a la teora algebraica de n
umeros. El libro termina con un captulo
en el que se recopilan algunos resultados que no han sido necesarios en los
captulos precedentes pero que son relevantes de cara a estudios m
as avanzados.
El primer bloque de [G] contiene un tratamiento axiom
atico de la geometra
eucldea, el segundo desarrolla los elementos b
asicos de la geometra analtica,
el tercero est
a dedicado a la geometra proyectiva y el cuarto a las geometras
no eucldeas.
Por u
ltimo, [An] est
a dividido en tres bloques, dedicados respectivamente
a la topologa, al c
alculo diferencial y al c
alculo integral. El libro termina
con tres apendices, el primero de los cuales es una prolongaci
on tecnica del
captulo [An I] con material que no es necesario para los captulos posteriores,
el segundo expone la teora de las fracciones continuas, en la que se combinan
aspectos aritmeticos con aspectos topol
ogicos y, por u
ltimo, hemos considerado
oportuno incluir un resumen de la din
amica cl
asica que puede servir al lector
para asimilar mejor las numerosas aplicaciones a la fsica presentadas en el libro.
En realidad, todos los conceptos fsicos involucrados se van explicando en los
propios ejemplos a medida que van siendo necesarios, pero tal vez el lector no
familiarizado con la fsica prefiera una exposici
on concentrada en unas pocas
p
aginas que le sirva de referencia.

Introducci
on
Aunque en muchas culturas de la antig
uedad es posible encontrar conocimientos matem
aticos no triviales, las primeras teoras matem
aticas sofisticadas,
con muchos aspectos en com
un con las matem
aticas tal y como las entendemos
hoy en da, las encontramos en la cultura griega cl
asica. Las matem
aticas griegas eran esencialmente aritmetica (el estudio de los n
umeros) y geometra (el
estudio de las formas geometricas). No eran para ellos disciplinas independientes, pues la concepci
on griega de la aritmetica era esencialmente geometrica:
las operaciones entre n
umeros las conceban geometricamente como relaciones
entre longitudes, areas y vol
umenes. Sin embargo, con el tiempo esta relaci
on se
invirti
o, pues durante la Edad Media la aritmetica evolucion
o para convertirse

en Algebra,
y posteriormente los matem
aticos fueron constatando de forma paulatina que gran parte de la geometra griega poda entenderse como una forma
de algebra (geometra analtica), y el resto como algebra combinada con an
alisis
matem
atico (geometra diferencial).
En que consiste esta evoluci
on de la aritmetica hacia el algebra? En realidad no hay una frontera definida entre la aritmetica y la llamada
algebra
elemental, pero la idea b
asica es que el algebra opera con n
umeros indeterminados. Obviamente los griegos ya razonaban con n
umeros indeterminados,
pero el algebra incluye un lenguaje adecuado para tal fin y una serie de tecnicas
generales expresables en dicho lenguaje. Por ejemplo, los griegos ya saban resolver lo que en el lenguaje algebraico moderno se llaman ecuaciones de segundo
grado, pero las expresiones

b b2 4ac
2
ax + bx + c = 0
y
x=
2a
son expresiones algebraicas modernas, al igual que las tecnicas que permiten
pasar de la primera expresi
on a la segunda. De hecho, la palabra
algebra
procede de las palabras al-
yarabi que aparecen en el ttulo del tratado Alkit
ab al-mukhtas.ar f h.is
ab al-yarabi wal-muq
abala (compendio de c
alculo por
reintegraci
on y sustituci
on) del matem
atico persa Muhammad ibn Musa alJwarizmi, escrito hacia el a
no 820 d.C., y que contiene tecnicas sistem
aticas
para resolver ecuaciones de primer y segundo grado.
Bastan los elementos del algebra elemental para algebrizar la geometra,
de modo que los puntos del plano o del espacio pueden identificarse con pares o
ternas de n
umeros, y las rectas, los planos y las curvas se identifican a su vez con
xiii

xiv

Introducci
on

ecuaciones o sistemas de ecuaciones que caracterizan sus puntos. Esto permite


reducir problemas geometricos a problemas puramente algebraicos, consistentes
en analizar si determinados sistemas de ecuaciones tienen o no soluci
on, etc.
Pero el paso que convirti
o al algebra en lo que actualmente se entiende como
tal, lo que m
as especficamente se conoce como
algebra abstracta, consisti
o
en pasar de operar con cantidades indeterminadas a estudiar operaciones indeterminadas, es decir, a estudiar expresiones algebraicas como xy 5 + x en las que
no s
olo x e y son indeterminadas, sino tambien las operaciones + y que se
realizan entre ellas.
En efecto, el algebra abstracta estudia las llamadas estructuras algebraicas,
que consisten en conjuntos cuyos elementos pueden ser de cualquier naturaleza
(no necesariamente n
umeros) en los que hay definidas unas operaciones indeterminadas a las que s
olo se les exige que cumplan ciertas propiedades b
asicas que
definen cada tipo de estructura (grupos, anillos, cuerpos, espacios vectoriales,
m
odulos etc.) Comprender cabalmente el algebra abstracta requiere comprender, entre otras cosas, que este proceso de abstracci
on no es gratuito ni arbitrario, sino que, por el contrario, pensar en terminos de estructuras abstractas
es la llave hacia una comprensi
on mucho m
as profunda de muchos resultados
concretos de la aritmetica, la geometra y de muchas otras ramas de la matem
atica, muy distantes de estas. Algunos argumentos que en terminos del
algebra elemental pueden ser muy laboriosos y difciles de recordar pueden sustituirse por otros conceptualmente muy simples en los que intervienen de forma
esencial conceptos abstractos. En otros casos, tratar de encontrar un argumento
elemental es sencillamente descabellado, y entonces las tecnicas abstractas resultan imprescindibles.

Un ejemplo famoso que ilustra este hecho es el llamado Ultimo


Teorema de
n
Fermat, que es la afirmaci
on seg
un la cual la ecuaci
on x + y n = z n , para cualquier n
umero natural n > 2, no admite soluciones enteras en las que los tres
n
umeros x, y, z sean no nulos. Nadie conoce una demostraci
on elemental de
este hecho, y la u
nica prueba conocida requiere un uso del algebra abstracta que
supera con creces a los contenidos de este libro. Aqu presentaremos otros ejemplos y aplicaciones m
as elementales que, no obstante, permitan al lector percibir
los nexos existentes entre las estructuras algebraicas abstractas y las situaciones
concretas, tanto algebraicas como geometricas, que justifican su interes y su utilidad, si bien el amplio espectro de aplicaciones del algebra abstracta trasciende
tambien con creces la peque
na muestra que daremos aqu.
Puesto que el algebra abstracta trata con conjuntos abstractos, el rigor matem
atico aconseja dedicar un primer captulo y as lo hemos hecho a la
teora de conjuntos, en el que introducimos los elementos y conceptos b
asicos
del lenguaje conjuntista sobre el cual se pueden fundamentar todas las ramas
de la matem
atica.

Captulo I

El lenguaje de la teora de
conjuntos
Es habitual distinguir distintas ramas o especialidades dentro de la matem
atica seg
un sus objetos de estudio respectivos, como el algebra, la geometra,
la topologa, el an
alisis matem
atico, etc. Ninguna de ellas puede considerarse
aislada y claramente delimitada de las restantes, sino que todas tienen m
ultiples
conexiones e interrelaciones. En principio, la teora de conjuntos es una m
as de
estas ramas, la que tiene por objeto el estudio de los conjuntos en general.
Sin embargo, el lenguaje que los matem
aticos han desarrollado para el estudio
de los conjuntos en general ha resultado ser el m
as adecuado para expresar con
claridad y precisi
on los conceptos y resultados de todas las dem
as ramas de la
matem
atica, y los hechos m
as elementales de la teora de conjuntos han resultado ser el punto de partida id
oneo para todas ellas. Es por ello que dedicamos
este primer captulo a introducir el lenguaje, los conceptos y los resultados m
as
elementales de la teora de conjuntos, a modo de base sobre la cual presentaremos en los captulos siguientes los resultados algebraicos que constituyen el
autentico objeto de este volumen.

1.1

Conjuntos

Toda la matem
atica puede construirse a partir de dos conceptos fundamentales: el concepto de conjunto y el de pertenencia. Cuando decimos que son
conceptos fundamentales (o primitivos) queremos decir que no es posible dar
definiciones operativas de estos conceptos, es decir, definiciones a partir de las
cuales podamos deducir l
ogicamente sus propiedades, como sucede con cualquier concepto matem
atico que no sea uno de estos dos. Si intentamos dar
una definici
on de conjunto, lo m
aximo que podemos decir es que un conjunto es una colecci
on de objetos, y esto no es operativo porque conjunto y
colecci
on son sin
onimos, con lo que realmente no hemos definido nada. Aun
as, con esta definici
on obtenemos una idea informal de lo que pretendemos
1

Captulo 1. El lenguaje de la teora de conjuntos

que sea un conjunto en el sentido tecnico especfico que tiene esta palabra en
matem
aticas, idea que podemos terminar de perfilar con algunos ejemplos:
Ejemplos Si escribimos A = {a, b, c}, entenderemos que A es un conjunto que
tiene tres1 elementos a, b, c. Para expresar que a es uno de los elementos del
conjunto a escribiremos2 a A, y leeremos el elemento a pertenece al conjunto
A. Por el contrario, si d es un elemento distinto de a, b y c, escribiremos
d
/ A para indicar que el elemento d no pertenece al conjunto A. Con esto
hemos introducido el segundo (y u
ltimo) concepto fundamental de la teora de
conjuntos, la relaci
on de pertenencia.
Hay que precisar que, aunque hayamos definido un conjunto como una
colecci
on de elementos, no hay que entender de ah que todo conjunto deba
tener al menos un elemento. Al contrario, vamos a admitir la existencia de un
conjunto vaco, que representaremos por , determinado por la propiedad de
no tener elementos. Podemos pensar que un conjunto es como una bolsa, que
es susceptible de contener elementos, pero que nada impide que este vaca.
Es muy importante tener presente que el concepto matem
atico de conjunto
permite que unos conjuntos sean a su vez elementos de otros conjuntos. Por
ejemplo, el conjunto B = {a, {b, c}} no debe ser confundido con el conjunto
A anterior. Si suponemos que a, b, c son distintos entre s, entonces A es un
conjunto con tres elementos, mientras que B es un conjunto con dos elementos,
uno de ellos es a, que es com
un a A y a B, y el otro es el conjunto {b, c}, de
modo que
{b, c} B,
{b, c}
/ A.
Esto podra llevarnos a concluir que en el lenguaje de la teora de conjuntos
hay dos clases de objetos: los elementos puros como a, b, c, que no son conjuntos,
sino objetos susceptibles de pertenecer a conjuntos, y los conjuntos como A y B,
formados por tales elementos o por otros conjuntos. El lector puede pensar que
esto es as si lo prefiere, pero la realidad es que los u
nicos conjuntos que vamos
a necesitar en todo momento son los conjuntos puros, es decir, los conjuntos
cuyos elementos son todos conjuntos, formados a su vez por conjuntos, todos
ellos formados a su vez por conjuntos, y as sucesivamente. No hay ning
un
inconveniente tecnico en suponer que existen elementos puros, pero lo cierto
es que en ning
un momento nos van a hacer falta para nada, por lo que es m
as
pr
actico restringir el significado tecnico de la palabra conjunto en matem
aticas
para entender que significa conjunto puro.
Tanto si el lector prefiere pensar que existen elementos puros y, por lo
tanto, conjuntos mixtos que los incluyen en su composici
on como si prefiere
adoptar el convenio usual de trabajar u
nicamente con conjuntos puros, el hecho
es que todos los conceptos matem
aticos que vamos a definir en este libro (o en
1 En realidad, dicha notaci
on no presupone que, por ejemplo, tenga que ser a 6= b. Si se
diera este caso, A tendra dos elementos, o uno solo si a = b = c.
2 El signo es una deformaci
on de la letra griega y fue introducido como abreviatura de
la palabra griega
(est
a), de modo que a A es una abreviatura de a est
a en A.

1.2. Los axiomas de la teora de conjuntos

cualquier otro libro que no entre en cuestiones muy especficas de la teora de


conjuntos) ser
an conjuntos puros.
Esto no significa que una expresi
on como A = {a, b, c} sea inaceptable por
contener elementos puros, sino que meramente estamos adoptando el convenio de que si consideramos un conjunto de este tipo, sus elementos a, b y c
ser
an a su vez otros conjuntos, cuya composici
on puede que sea irrelevante para
las consideraciones que queramos hacer, por lo que tal vez nunca lleguemos a
precisarla, pero eso no significa que a no tenga a su vez sus elementos, digamos
a = {x, y}, donde x e y ser
an nuevos conjuntos cuya composici
on podramos
investigar a su vez, etc.
Los ejemplos precedentes pretenden precisar el sentido que los matem
aticos
dan a las palabras conjunto y pertenencia, pero fundamentar una teora matem
atica en una definici
on circular de conjunto y en unos ejemplos aclaratorios
dista mucho del canon de rigor que se exige en la matem
atica formal. La forma
v
alida de precisar operativamente el significado de las palabras conjunto y
pertenencia no es a traves de unas definiciones necesariamente insatisfactorias ni a traves de unos ejemplos, sino a traves de unos axiomas que constituyan
las afirmaciones b
asicas que aceptaremos que cumplen los conjuntos, de las
cuales se pueden deducir todas las dem
as. Dedicaremos la secci
on siguiente a
presentar los axiomas b
asicos de la teora de conjuntos.

1.2

Los axiomas de la teora de conjuntos

La idea de conjunto como colecci


on de objetos est
a contenida en el siguiente axioma fundamental:
Axioma de extensionalidad Dos conjuntos son iguales si y s
olo si tienen
los mismos elementos.
En terminos pr
acticos, si tenemos dos conjuntos A y B y podemos demostrar
que, bajo el supuesto de que un x cumple x A necesariamente x B y
viceversa, entonces este axioma nos permite concluir que A = B.
M
as conceptualmente, lo que dice el axioma de extensionalidad es que si dos
conjuntos A y B se diferencian en algo, necesariamente tiene que ser en sus
elementos. Los conjuntos no tienen ning
un otro rasgo distintivo aparte de sus
elementos. Esta concepci
on de los conjuntos puede no ser la m
as adecuada en
otros contextos. Por ejemplo, uno podra considerar que un equipo de f
utbol
es algo distinto de un equipo de beisbol, incluso si ambos est
an formados por
los mismos jugadores. Lo que dice el axioma de extensionalidad es que en el
sentido matem
atico de conjunto esto no es admisible. No hay conjuntos de
f
utbol o de beisbol, ni conjuntos rojos o verdes. Las u
nicas propiedades de
los conjuntos son las determinadas por quienes son sus elementos.
A menudo es conveniente descomponer el contenido del axioma de extensionalidad en dos partes a traves del concepto de inclusi
on:

Captulo 1. El lenguaje de la teora de conjuntos

Definici
on 1.1 Diremos que un conjunto A es un subconjunto de un conjunto B
o que A est
a contenido, o incluido, en B, y lo representaremos por A B, si
todo elemento de A es tambien un elemento de B.
En estos terminos, el axioma de extensionalidad afirma que una igualdad de
conjuntos equivale a una doble inclusi
on: A = B si y s
olo si A B y B A.

A veces es u
til visualizar los conjuntos mediante los llamados diagramas de
Venn. La figura muestra la representaci
on de tres conjuntos A, B, C, donde
hay que entender que los elementos de A
A
C
est
an representados por los puntos enceB
rrados por la curva que tiene la A junto
a ella. Vemos entonces que A B, pero
no A 6= B, pues hay elementos de B que
no est
an dentro de A.
Para indicar que se da una inclusi
on A B, pero que esta es estricta, es
decir, que todo elemento de A pertenece tambien a B, pero existen elementos
de B que no est
an en A (tal y como les sucede a los conjuntos de la figura),
usaremos la notaci
on A B.
Esto equivale a que A B y A 6= B, o tambien a que A B y B 6 A. La
u
ltima notaci
on es la que emplearemos para indicar que B no es un subconjunto
de A. As, por ejemplo, la figura muestra que B 6 C y C 6 B.
Notemos que otras propiedades obvias de la inclusi
on de conjuntos son las
siguientes: A A (todo conjunto es un subconjunto de s mismo) y que si
A B y B C entonces A C (si todo elemento de A est
a en B y todo
elemento de B est
a en C es evidente que todo elemento de A est
a en C).
En este punto debemos se
nalar que la noci
on de conjunto que estamos manejando es tan general y abstracta que resulta peligroso hacer afirmaciones generales a la ligera sobre lo que podemos esperar que cumplan los conjuntos. Por
ejemplo, en contextos no matem
aticos, podemos hablar del conjunto de todos
los planetas del sistema solar, del conjunto de los dedos de mi mano, etc., y
podemos sentirnos tentados de extrapolar de ah un principio general:
Axioma de comprensi
on Dada cualquier propiedad3 P , existe un conjunto
cuyos elementos son exactamente los conjuntos que cumplen la propiedad P .
3 Quiz
a el lector eche en falta un concepto preciso de propiedad. Ciertamente, es necesario especificar qu
e entendemos por propiedad para que un axioma como
este pueda
tenerse por preciso y riguroso, pero una determinaci
on del concepto de propiedad requiere
tecnicismos relacionados con la l
ogica matem
atica, y no vamos a entrar en ello aqu. Baste
saber que es posible dar una definici
on totalmente satisfactoria del concepto de propiedad
y que, en la pr
actica, la idea subyacente es que una propiedad es cualquier propiedad valga
la circularidad que, como decimos, es evitable definible con precisi
on en t
erminos de los
conceptos primitivos de conjunto y pertenencia o a partir de cualesquiera otros previamente
definidos a partir de ellos, como el de inclusi
on.

1.2. Los axiomas de la teora de conjuntos

Notemos que, para cada propiedad P , s


olo puede haber un conjunto cuyos
elementos sean precisamente los conjuntos que cumplen la propiedad P , pues
si hubiera dos, tendran exactamente los mismos elementos (los conjuntos con
la propiedad P ), luego el axioma de extensionalidad implicara que ambos son
en realidad el mismo conjunto. Por lo tanto, si aceptamos el axioma de comprensi
on, para cada propiedad P podemos representar mediante {x | P x} (lease
el conjunto de todos los x que cumplen P x) el (
unico) conjunto de todos los
conjuntos que tienen la propiedad P .
Por desgracia, no podemos admitir el axioma de comprensi
on, ya que resulta
ser contradictorio. En efecto, basta considerar la propiedad P x x
/ x, que
nos dara el conjunto
R = {x | x
/ x},

es decir, el conjunto de todos los conjuntos que no son elementos de s mismos.


Este conjunto resulta ser contradictorio, ya que llegamos a un absurdo tanto
si suponemos que R R como si suponemos que R
/ R. En el primer caso, por
ser un elemento de R debe cumplir la propiedad P que lo define, es decir, debe
cumplir R
/ R, que es justo lo contrario de lo que habamos supuesto. Si, por
el contrario, suponemos que R
/ R, entonces R tiene la propiedad P que define
a R, luego debera cumplir R R, y de nuevo tenemos una contradicci
on.
Esto se conoce como paradoja de Russell, y nos permite concluir que el
axioma de comprensi
on afirma la existencia de conjuntos que no pueden existir,
y por ello debemos descartarlo.
A los matem
aticos les llev
o un tiempo encontrar la manera de hablar rigurosamente de conjuntos sin poder postular que las propiedades definen conjuntos,
y la soluci
on m
as simple la obtuvo Ernst Zermelo, que se dio cuenta de que no
hay inconveniente en aceptar que las propiedades definen subconjuntos. Concretamente, Zermelo propuso el axioma siguiente:
Axioma de especificaci
on Dado un conjunto A y una propiedad P , existe
un conjunto cuyos elementos son los elementos de A que cumplen P .
Nuevamente, s
olo puede existir un conjunto con los elementos de A que
cumplen P , pues si hubiera dos, ambos tendran los mismos elementos (los
elementos de A que cumplen P ), y por el axioma de extensionalidad seran el
mismo. Por lo tanto, aceptando el axioma de especificaci
on, dado cualquier
conjunto A y cualquier propiedad P , podemos representar mediante
{x A | P x}
al (
unico) subconjunto de A formado por los conjuntos que cumplen P .
Notemos que no llegamos a nada absurdo aunque apliquemos este axioma
a la propiedad P x x
/ x. No hay ning
un inconveniente en considerar el
conjunto
R = {x A | x
/ x} A
cuyos elementos son los elementos de A que no se pertenecen a s mismos.

Captulo 1. El lenguaje de la teora de conjuntos

Lo que podemos probar ahora es que R


/ A, pues si R A, tendramos
la misma contradicci
on de antes tanto si R R como si R
/ R. Y una vez
determinado que R
/ A, podemos asegurar, m
as concretamente, que R
/ R, ya
que si fuera R R A entonces, en particular, tendramos que R A, y ya
hemos visto que eso es imposible.4
Aceptando el axioma de especificaci
on nos encontramos con que x
/ x no es
la u
nica propiedad que da lugar a contradicciones si intentamos aplicar el axioma
de comprensi
on. Lo mismo le sucede a la propiedad P x x = x. En efecto, si
pudieramos aplicar el axioma de comprensi
on a esta propiedad, tendramos el
conjunto
V = {x | x = x},
es decir, el conjunto de todos los conjuntos que son iguales a s mismos, y como
eso sucede siempre, V sera simplemente el conjunto de todos los conjuntos.
Pero si existiera tal conjunto, entonces podramos definir, por el axioma de
especificaci
on, el conjunto
R = {x V | x
/ x},
y de nuevo tenemos una contradicci
on, la condici
on x V se cumple siempre y
podemos suprimirla, lo que nos da que R = {x | x
/ x} es el conjunto parad
ojico
de Russell.
En suma, el axioma de especificaci
on implica que no existe ning
un conjunto
universal V que contenga a todos los conjuntos. Notemos que no hay ninguna
contradicci
on en ello. El problema con el axioma de comprensi
on es que afirma
que existen conjuntos que no pueden existir. En cambio, el axioma de especificaci
on no afirma que exista el conjunto de todos los conjuntos, y no hay ninguna
contradicci
on en que hayamos concluido que, de hecho, no existe.

Este
es un buen punto para reflexionar sobre la zona gris de la figura de la
p
agina 4. Podemos considerar que el rect
angulo representa la totalidad de los
conjuntos, pero hay que entender que dicha totalidad es un abismo inabarcable. Los conjuntos nos permiten parcelar cualquier zona de tama
no moderado
dentro de esa totalidad, pero fuera de cada conjunto queda siempre un abismo
inconmensurable e imparcelable.
Notemos que el axioma de especificaci
on s
olo nos permite definir subconjuntos de un conjunto dado, y no es posible construir todos los conjuntos que
necesitan los matem
aticos yendo siempre hacia abajo, sino que necesitamos
otros axiomas que nos permitan, a partir de un conjunto, construir otros mayores, que no sean subconjuntos suyos. Hay tres axiomas que cumplen esta
funci
on:
4 Tal vez el lector se pregunte si es posible que un conjunto se pertenezca a s
mismo. La
respuesta es que la pregunta es irrelevante: en ning
un momento vamos a considerar conjuntos
que se pertenezcan a s mismos, de modo que da igual suponer que no existen o suponer que
existen y no tenerlos en cuenta para nada. Si optamos por lo m
as simple, que es suponer que
no existen, entonces R = {x A | x
/ x} es simplemente R = A, y la conclusi
on a la que
hemos llegado es a que A
/ A.

1.2. Los axiomas de la teora de conjuntos

Axioma del par Dados dos conjuntos A y B, existe otro conjunto C cuyos
elementos son exactamente A y B.
Axioma de la uni
on Dado un conjunto A, existe otro conjunto B cuyos
elementos son exactamente los que pertenecen a alguno de los elementos de A.
Axioma de partes Dado un conjunto A, existe otro conjunto cuyos elementos
son exactamente todos los subconjuntos de A.
Observemos que, en los tres casos, el conjunto cuya existencia se afirma es
u
nico, por el axioma de extensionalidad, ya que dos conjuntos en las condiciones
indicadas tendran los mismos elementos. Por lo tanto podemos darles nombre:
El conjunto cuyos u
nicos elementos son dos conjuntos dados A y B lo representaremos por {A, B} y lo llamaremos par desordenado de A y B.
El conjunto cuyos elementos son todos los elementos
S de alguno de los elementos de un conjunto dado A lo representaremos por A y lo llamaremos gran
uni
on de A.
El conjunto cuyos elementos son todos los subconjuntos de un conjunto dado
A lo representaremos por PA y lo llamaremos conjunto de las partes de A.
Por ejemplo, si un conjunto X consta
de los tres conjuntos A, B y C reS
presentados en la p
agina 4, entonces X se corresponde con la regi
on de color
blanco de la figura, es decir, la regi
on que incluye tanto los puntos de A, como
los de B como los de C.
Es importante que en el axioma del par no exigimos que los dos conjuntos A
y B sean distintos. En caso de que sean el mismo, escribiremos {A} = {A, A},
que es el conjunto cuyo u
nico elemento es A.
Con estos axiomas ya podemos introducir algunas construcciones conjuntistas b
asicas:
Dados dos conjuntos A y B, definimos su uni
on como el conjunto
S
A B = {A, B},

cuyos elementos son los elementos que est


an ya sea en A o en B. M
as
precisamente, x A B es equivalente a que se cumpla x A o x B.

Dados dos conjuntos A y B, definimos su intersecci


on como el conjunto
A B = {x A | x B},
que resulta de aplicar el axioma de especificaci
on al conjunto A y la propiedad P x x B. As, los elementos de A B son los que est
an a la
vez en A y en B. Por lo tanto, x A B es equivalente a que se cumpla
x A y x B.

Captulo 1. El lenguaje de la teora de conjuntos


Dados dos conjuntos A y B, definimos su complemento como el conjunto
A \ B = {x A | x
/ B},
de modo que x A \ B es equivalente a x A y x
/ B.
Dado cualquier conjunto A, definimos el conjunto vaco como
= {x A | x 6= x},
que obviamente es un conjunto sin elementos y no depende del conjunto
A a partir del cual lo calculamos, pues dos conjuntos sin elementos tienen
los mismos elementos (ninguno), y por el axioma de extensionalidad son
el mismo conjunto.

La figura siguiente muestra la representaci


on (en gris oscuro) de la uni
on,
la intersecci
on y el complemento de dos conjuntos A y B, as como la no
representaci
on del conjunto vaco.

AB

AB
B

B
A

A\B

A
Es importante tener presente que, para todo conjunto X, se cumple la relaci
on X, es decir, el conjunto vaco es un subconjunto de cualquier conjunto. Esto es pura l
ogica: en general, para que suceda A 6 B es necesario
que exista un elemento de A que no sea elemento de B, luego, para que pudiera
suceder 6 X, tendra que existir un elemento x tal que x
/ X, pero
como no tiene elementos, esto es imposible.
Se dice que dos conjuntos A y B son disjuntos si A B = , es decir, si no
tienen elementos en com
un. Por ejemplo, en la figura de la p
agina 4 se tiene
que A y C son disjuntos, mientras que B y C no lo son.
Es posible demostrar muchas propiedades elementales sobre uniones, intersecciones y complementos. Veamos una muestra:

1.2. Los axiomas de la teora de conjuntos

Teorema 1.2 (Leyes de De Morgan) Si A, B son dos subconjuntos de un


conjunto X, entonces
X \ (A B) = (X \ A) (X \ B),

X \ (A B) = (X \ A) (X \ B).

n: Veamos la primera igualdad (la segunda se demuestra


Demostracio
an
alogamente). Para probar una igualdad de conjuntos demostramos la doble
inclusi
on. Para probar tomamos un x X \ (A B). Esto significa que x A
yx
/ A B. Como la uni
on contiene los elementos que est
an ya sea en A como
en B, para que x
/ A B tiene que suceder que x
/Ayx
/ B. Entonces, como
xX yx
/ A, resulta que x X \ A, e igualmente x X \ B. Por definici
on
de intersecci
on x (X \ A) (X \ B).
Ahora probamos la inclusi
on opuesta: tomamos x (X \ A) (X \ B). Esto
significa que x X \ A y x X \ B. De la primera parte deducimos que x X
yx
/ A, y de la segunda adem
as que x
/ B. Como x
/Ayx
/ B, podemos
concluir que x
/ A B, luego x X \ (A B).
S
Hemos definido la gran uni
on X como la uni
on de todos los conjuntos que
forman parte de X. Igualmente podemos definir una gran intersecci
on:
Teorema 1.3 Si X 6= , existe un u
nico conjunto Y cuyos elementos son los
que pertenecen a todos los elementos de X.
n: Como X no es el conjunto vaco, existe un A X. Ahora
Demostracio
consideramos la propiedad P x x pertenece a todos los elementos de X, que
es una propiedad a la que podemos aplicar el axioma de especificaci
on, para
formar el conjunto
Y = {x A | P x}.
El conjunto Y cumple lo pedido, pues si x pertenece a todos los elementos de
X, entonces cumple P x y, en particular, x A, luego x Y . Recprocamente,
si x Y entonces cumple P x, luego x pertenece a todos los subconjuntos de X.
El conjunto Y es u
nico por el axioma de extensionalidad, ya que dos conjuntos
que cumplieran lo requerido tendran los mismos elementos (los que pertenecen
a todos los elementos de X), luego seran el mismo conjunto.
Al conjunto dado por el teorema
anterior lo llamaremos gran intersecci
on
T
de X y lo representaremos
por
X.
Es
importante
tener
en
cuenta
que
la
gran
T
intersecci
on no est
a definida. El lector familiarizado con las sutilezas de la
l
ogica puede plantearse quien debera ser dicha intersecci
on en caso de existir.
El sexto y u
ltimo axioma que vamos a considerar en esta secci
on (y el
pen
ultimo que vamos a necesitar) es el siguiente:
Axioma de infinitud Existe un conjunto X con la propiedad de que X
y, siempre que x X, se cumple tambien que {x} X.
Vamos a analizar el contenido de este axioma. Para ello llamaremos conjuntos inductivos a los conjuntos X que cumplen lo que afirma el axioma de

10

Captulo 1. El lenguaje de la teora de conjuntos

infinitud. A diferencia de lo que suceda con los dem


as axiomas sobre existencia
de conjuntos, no podemos concluir por el axioma de extensionalidad que exista
un u
nico conjunto inductivo, pero podemos demostrar lo siguiente:
Teorema 1.4 Existe un u
nico conjunto inductivo X con la propiedad de que
est
a contenido en cualquier otro conjunto inductivo.
n: Sea X0 un conjunto inductivo cualquiera. Sabemos que
Demostracio
existe por el axioma de infinitud. Sea I = {A PX0 | A es inductivo}, que es
un conjunto bien definido por el axioma de especificaci
on. Sus elementos son
todos los subconjuntos inductivos de X0 . En particular IT6= , pues X0 I.
Esto nos permite formar la gran intersecci
on X = I. Vamos a probar
que el conjunto X cumple lo requerido. En primer lugar probamos que X es
inductivo. Para ello, en primer lugar debemos ver que X. Por definici
on
de gran intersecci
on, esto equivale a que pertenece a todos los elementos de
I, y eso es cierto, porque los elementos de I son conjuntos inductivos, y por
definici
on todos tienen a por elemento.
En segundo lugar tomamos x X y tenemos que probar que {x} X. Para
ello tenemos que probar que {x} pertenece a todos los elementos de I. Tomemos
uno cualquiera, digamos A I. Como x X, sabemos que x pertenece a todos
los elementos de I, y en particular x A. Como A I, resulta que A es
inductivo, luego por definici
on de conjunto inductivo, si x A, tambien tiene
que cumplirse que {x} A. Con esto hemos probado que {x} est
a en cualquier
elemento de I prefijado, luego {x} X.
Ahora consideramos cualquier conjunto inductivo Y y tenemos que probar
que X Y . Para ello empezamos demostrando que X0 Y es un conjunto
inductivo. En efecto, como X0 e Y son ambos inductivos, tenemos que X0
y Y , luego X0 Y . Por otra parte, si x X0 Y , tenemos que x X0
y x Y , y al ser ambos inductivos {x} X0 y {x} Y , luego {x} X0 Y .
As pues, hemos probado que X0 Y es inductivo y claramente X0 Y X0 ,
luego X0 Y PX0 . Esto equivale a que X0 Y I, pues es un subconjunto
inductivo de X0 . Por u
ltimo, si x X, entonces x est
a en todos los elementos
de I, luego x X0 Y luego x Y . Esto prueba que X Y .
Definici
on 1.5 Llamaremos conjunto de los n
umeros naturales al menor conjunto inductivo (en el sentido del teorema anterior) y lo representaremos por N.
Observemos que N, por definici
on de conjunto inductivo. Cuando pensemos en el conjunto vaco como n
umero natural lo representaremos por 0 y lo
llamaremos cero, si bien tecnicamente 0 y son dos nombres alternativos para
el mismo conjunto.
Si n N, por definici
on de conjunto inductivo tenemos que {n} N. Cuando
pensemos en {n} como n
umero natural escribiremos Sn en lugar de {n}, y
diremos que Sn es el siguiente de n.
Al siguiente de 0 lo llamaremos uno y lo representaremos por 1 = S0 = {},
al siguiente de 1 lo llamaremos dos y lo representaremos por
2 = S1 = {1} = {{}},

1.2. Los axiomas de la teora de conjuntos

11

igualmente definimos el tres, el cuatro, el cinco, el seis, el siete, el ocho y el


nueve como:
3 = S2 = {{{}}}
7 = S6 = {{{{{{{}}}}}}}
4 = S3 = {{{{}}}}
8 = S7 = {{{{{{{{}}}}}}}}
5 = S4 = {{{{{}}}}}
9 = S8 = {{{{{{{{{}}}}}}}}}.
6 = S5 = {{{{{{}}}}}}
Es claro que 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 son n
umeros naturales. En general:
Teorema 1.6 (Axiomas de Peano) El conjunto N de los n
umeros naturales
cumple las propiedades siguientes:
1. 0 N (el cero es un n
umero natural).

2. Si n N, entonces Sn N (el siguiente de un n


umero natural es un
n
umero natural).
3. 0 no es el siguiente de ning
un n
umero natural.
4. Si m, n N cumplen Sm = Sn, entonces m = n (si dos n
umeros naturales
tienen el mismo siguiente, es que son el mismo).
5. Si A N tiene la propiedad de que 0 A y siempre que n A tambien
Sn A, entonces A = N (principio de inducci
on).

n: 1) El cero es un n
Demostracio
umero natural porque N es un conjunto
inductivo y 0 = N por definici
on de conjunto inductivo.
2) Si n N, entonces Sn = {n} N, tambien por definici
on de conjunto
inductivo.
3) No puede suceder que 0 = Sn, porque entonces = {n}, cuando el
conjunto de la derecha no es vaco, ya que contiene a n.
4) Si Sm = Sn, esto es lo mismo que {m} = {n}, y entonces m {m} = {n},
luego m = n.

5) La hip
otesis es que A es un conjunto inductivo, y entonces N A porque
N es el menor conjunto inductivo (est
a contenido en cualquier otro, seg
un el
teorema 1.4). Como por hip
otesis A N, tenemos que A = N.
Observaciones Ahora podemos entender plenamente el axioma de infinitud:
hemos elegido una operaci
on conjuntista, concretamente x 7 {x}, que cuando
la vamos aplicando sucesivamente al conjunto va produciendo conjuntos distintos de los precedentes: , {}, {{}}, {{{}}}, . . . y hemos postulado que
existe un conjunto que contiene a todos los conjuntos que se obtienen de este
modo. Obviamente dicho conjunto no es u
nico, pues puede contener elementos
extra no deseados, pero siempre podemos quedarnos con el menor de todos
ellos, N, que es el menor conjunto que puede obtenerse a partir de 0 = aplicando la operaci
on siguiente, sin ning
un a
nadido. A los conjuntos que vamos
obteniendo al aplicar la operaci
on siguiente los llamamos n
umeros naturales
0, 1, 2, 3, . . .

12

Captulo 1. El lenguaje de la teora de conjuntos

Abusando un poco del lenguaje, podemos expresar que N es el menor conjunto inductivo mediante N = {0, 1, 2, 3, . . .}, donde los puntos suspensivos indican que los elementos de N son u
nicamente los que resultan de calcular siguientes
y m
as siguientes, pero la versi
on formal de este hecho es el teorema anterior.
A partir de aqu, el hecho de que hayamos definido concretamente el n
umero
tres como 3 = {{{}}} se vuelve completamente irrelevante. Lo u
nico que
importa de los n
umeros naturales es que cumplen los axiomas de Peano. Que
conjuntos hemos seleccionado concretamente para que esto suceda no tiene importancia. Ninguno de los resultados que vamos a demostrar sobre los n
umeros
naturales depender
an de cu
ales sean concretamente los elementos del 3 o del 7.
Aqu tenemos un primer ejemplo de un concepto matem
atico (el de los
n
umeros naturales) que nadie concibe como conjuntos, sino m
as bien como elementos puros, pero esto no contradice que tecnicamente podamos definir los
n
umeros naturales de modo que sean conjuntos (y de hecho conjuntos puros).
Podramos haber elegido otra operaci
on siguiente. Por ejemplo, si hubieramos elegido x 7 x {x} entonces los n
umeros naturales hubieran sido
0 = ,

1 = {0},

2 = {0, 1},

3 = {0, 1, 2},

4 = {0, 1, 2, 3},

...

Esta alternativa es mucho m


as conveniente para quien pretenda adentrarse en
la teora de conjuntos, pero para nuestros fines es irrelevante una u otra opci
on
y la que hemos elegido simplifica la demostraci
on de los axiomas de Peano. M
as
adelante volveremos sobre la comparaci
on de conjuntos de n
umeros naturales
obtenidos a partir de elecciones diferentes de la funci
on siguiente o incluso
del 0 (que tampoco es obligatorio que sea el conjunto vaco).
Conviene destacar el significado del quinto axioma de Peano, el principio
de inducci
on. Para ello consideramos cualquier propiedad P y lo aplicamos al
conjunto A = {n N | P n}. Su traducci
on a este caso es la siguiente:
Principio de inducci
on Si probamos que 0 tiene la propiedad P y, bajo la
hip
otesis de que n N cumple la propiedad P (hip
otesis de inducci
on), podemos
demostrar que Sn tambien cumple la propiedad P , entonces podemos asegurar
que todo n
umero natural cumple la propiedad P .
Veamos un ejemplo sencillo de demostraci
on por inducci
on:
Teorema 1.7 Todo n
umero natural distinto de 0 es el siguiente de otro n
umero
natural.
n: Tomamos como propiedad P la propiedad P n si n 6= 0
Demostracio
entonces n es el siguiente de otro n
umero natural. Y vamos a probar por
inducci
on que la cumplen todos los n
umeros naturales. Se cumple P 0, pues no
se da el caso de que 0 6= 0. Si suponemos por hip
otesis de inducci
on que se
cumple P n, entonces se cumple P Sn, simplemente porque Sn es el siguiente de
un n
umero natural. Por lo tanto todos los n
umeros tienen la propiedad P .
Para extraer m
as consecuencias de los axiomas de Peano necesitamos algunos
conceptos conjuntistas adicionales.

1.3. Funciones

1.3

13

Funciones

El concepto de funci
on es una de las piezas fundamentales del vocabulario
conjuntista. Para introducirlo necesitamos otros conceptos previos.
Tenemos definidos los pares desordenados {a, b}, y es claro que de una igualdad {a, b} = {c, d} no podemos concluir necesariamente que a = c y b = d, pues
{a, b} = {b, a}, y perfectamente podra suceder que a = d y b = c.
Esto hace conveniente definir el par ordenado con primera componente a y
segunda componente b como (a, b) = {{a}, {a, b}}. Entonces:
Teorema 1.8 Si a, b, c, d son conjuntos cualesquiera, entonces
(a, b) = (c, d) si y s
olo si a = c y b = d.
n: Es inmediato que si a = c y b = d entonces (a, b) = (c, d).
Demostracio
Vamos a probar la implicaci
on opuesta. Para ello suponemos primero que a = b.
Entonces, por definici
on de par ordenado, (a, b) = {{a}, {a, a}} = {{a}} y
(c, d) = {{c}, {c, d}} = {{a}}. Esto obliga a que {c} = {c, d} = {a}, de donde
se sigue claramente que c = d = a = b.
Llegamos a la misma conclusi
on si c = d, por lo que podemos suponer que
a 6= b y c 6= d. Tenemos que {{a}, {a, b}} = {{c}, {c, d}}. Entonces, como
{a} {{c}, {c, d}}, tiene que ser {a} = {c} o bien {a} = {c, d}, pero el segundo
caso es imposible, porque entonces c = a = d. Por lo tanto, {a} = {c} y esto
implica que a = c.
Igualmente, {a, b} {{c}, {c, d}}, y no puede ser {a, b} = {c}, porque entonces a = c = b, luego tiene que ser {a, b} = {c, d}, luego b {c, d}, luego b = c
o bien b = d, pero no puede ser b = c = a, luego b = d, como haba que probar.
Observemos ahora que si a A y b B, entonces a, b A B, luego
{a}, {a, b} A B, luego {a}, {a, b} P(A B), luego
(a, b) = {{a}, {a, b}} P(A B),
luego (a, b) PP(A B). Esto nos permite probar:
Teorema 1.9 Dados dos conjuntos A y B, existe un u
nico conjunto cuyos elementos son todos los pares ordenados (a, b) con a A y b B.

n: Basta aplicar el axioma de especificaci


Demostracio
on a la propiedad
P x x es un par ordenado de la forma x = (a, b), con a A y b B y definir
X = {x PP(A B) | P x}.
As, todo elemento de X es un par ordenado en las condiciones requeridas,
y si x = (a, b) es cualquiera de dichos pares, justo antes del enunciado de
este teorema hemos probado que x PP(A B) y adem
as P x, luego x X.
La unicidad es por el axioma de extensionalidad, ya que dos conjuntos que
cumplieran lo requerido tendran los mismos elementos (los pares ordenados
con primera componente en A y segunda componente en B), luego seran el
mismo conjunto.

14

Captulo 1. El lenguaje de la teora de conjuntos

Llamaremos producto cartesiano de los conjuntos A y B al conjunto dado


por el teorema anterior, y que representaremos por A B. As, si a A y
b B, tenemos que (a, b) A B, y todos los elementos de A B son de esta
forma.
A partir de este punto podemos olvidarnos de que los pares ordenados (a, b)
son conjuntos. Nunca m
as necesitaremos pensar en ellos como conjuntos, sino
que lo u
nico que importa es que determinan el orden de sus componentes y que
pueden recolectarse en los productos cartesianos.
Definici
on 1.10 Diremos que un conjunto f es una aplicaci
on o funci
on de
un conjunto A en un conjunto B (y lo representaremos por f : A B) si
f A B y para cada a A existe un u
nico b B tal que (a, b) f . Dicho
b recibe el nombre de imagen de a por f y se representa por f (a). Tambien se
dice que a es una antiimagen de b por f .
Diremos que f es inyectiva si cuando x, y A cumplen f (x) = f (y), entonces
x = y (elementos distintos tienen im
agenes distintas).
Diremos que f es suprayectiva si para todo b B existe un a A tal que
f (a) = b (todo elemento de B tiene al menos una antiimagen en A).
Diremos que f es biyectiva si es inyectiva y suprayectiva.
Ejemplos Sea5 A = {0, 1, 2} y B = {0, 1, 2, 3, 4} y sea
f = {(0, 3), (1, 0), (2, 3)}.
Entonces f es una aplicaci
on f : A B. Ciertamente es un subconjunto
de A B (sus elementos son pares con primera componente 0, 1 o 2 y segunda
componente 0, 1, 2, 3 o 4) y cada elemento de A tiene una u
nica imagen por f
en B, a saber, f (0) = 3, f (1) = 0, f (2) = 3. Podemos representar f mediante
un diagrama de flechas, as:
A

f
0
0

1
2

3
2
4

Vemos que f no es inyectiva, porque hay dos elementos distintos de A (e 0


y el 2) que tienen la misma imagen en B: se cumple f (0) = f (2), pero 0 6= 2.
Tambien vemos f no es suprayectiva, porque hay varios elementos en B que no
tienen antiimagen en A (el 1, el 2 y el 4).
5 Por definici
on {0, 1, 2} = {0} {1} {2} es el conjunto cuyos elementos son 0, 1 y 2, y
an
alogamente con {0, 1, 2, 3, 4}.

1.3. Funciones

15

La figura siguiente muestra una aplicaci


on inyectiva g : A B y otra
suprayectiva de h : B A:
A

g
0
0

1
2

2
4

0
1
2
3
4

PP h
0

P
P

PP P
P
q
P
P
PP
1

P
2

Vemos que, en efecto, la aplicaci


on g no asigna una misma imagen a dos
elementos distintos, por lo que es inyectiva, pero no suprayectiva, ya que hay
elementos sin antiimagen. En cambio, la de la derecha no es inyectiva, pues
h(0) = h(4) y tambien h(1) = h(2), pero s que es suprayectiva, ya que todo
elemento de B tiene al menos una antiimagen.
La figura siguiente muestra una aplicaci
on biyectiva entre dos conjuntos A
y C:
A

Notemos que este es el aspecto tpico de una aplicaci


on biyectiva entre dos
conjuntos: cada elemento de A tiene una u
nica imagen en C y cada elemento
de C tiene una u
nica antiimagen en A (una porque la aplicaci
on es suprayectiva y u
nica porque es inyectiva). De esta suerte, los elementos de A quedan
emparejados con los elementos de C sin que falte ni sobre ninguno.
En la pr
actica, para definir una aplicaci
on f : A B basta especificar
(una vez dados A y B) cu
al es la imagen f (a) B de cada elemento a A.
Por ejemplo, podemos definir S : N N sin m
as que especificar que
si n N, entonces S(n) = {n}. Toda definici
on hecha de este modo puede
traducirse a una aplicaci
on del axioma de especificaci
on. Concretamente, en
este caso sera
S = {x N N | existe un n N tal que x = (n, S(n))}.
Igualmente, para probar que dos aplicaciones f : A B y g : A C
son iguales (como conjuntos) no usaremos normalmente una doble inclusi
on que
nos obligue a recordar que f y g son conjuntos de pares ordenados. Eso es
equivalente a probar (teniendo en cuenta que estamos suponiendo de antemano
que f y g tienen el mismo dominio A) que para todo a A se cumple que
f (a) = g(a). En otras palabras:

16

Captulo 1. El lenguaje de la teora de conjuntos


Dos aplicaciones son iguales si y s
olo si tienen el mismo dominio y
asignan la misma imagen a cada elemento de dicho dominio.

En efecto, si se cumple esto podemos probar que f = g por doble inclusi


on:
si x f , entonces x es un par ordenado x = (a, f (a)), pero como f (a) = g(a),
de hecho x = (a, g(a)) g. Esto prueba que f g e igualmente se prueba que
g f.
Introducimos ahora algunos conceptos adicionales sobre una aplicaci
on cualquiera f : A B (los ejemplos que las acompa
nan hacen referencia a las
funciones g y h correspondientes a los gr
aficos de la p
agina precedente):
1. El conjunto A sobre el que est
a definida f se llama dominio de f y lo
representaremos por Df .
2. Si X A, definimos f [X] = {b B | existe x X tal que f (x) = b}.
As, f [X] es el conjunto de las im
agenes de los elementos de X.
Por ejemplo, h[{1, 2, 3}] = {1, 2}.
3. En particular f [A] es el conjunto de todas las im
agenes de los elementos
de A y se denomina rango o imagen de f . Lo representaremos por Rf o
por Im f . Notemos que f es suprayectiva si y s
olo si f [A] = B.
Por ejemplo, Rg = {0, 2, 3}.
4. Si Y B, definimos f 1 [Y ] = {a A | f (a) Y }. Se trata del conjunto
de todas las antiim
agenes de los elementos de Y .
5. Si X A definimos f |X : X B como la aplicaci
on que coincide con f
sobre los elementos de X, es decir, su dominio es X y , para cada x X,
se define f |X (x) = f (x).
6. Si f es inyectiva y C = f [A], definimos f 1 : C A como la u
nica
aplicaci
on que a cada elemento de C le asigna su u
nica antiimagen por
f , es decir, si c C, entonces f 1 (c) es el u
nico elemento a A tal que
f (a) = c. As f (a) = b es equivalente a f 1 (b) = a, pero para que esto
tenga sentido es necesario que f sea inyectiva, pues si b tuviera varias
antiim
agenes, no estara bien definido f 1 (b).
7. En particular, si f : A B biyectiva, tambien f 1 : B A biyectiva.
Si A B, la aplicaci
on i : A B dada por i(a) = a se llama inclusi
on
de A en B. Si, m
as concretamente, A = B, la inclusi
on i : A A se llama
aplicaci
on identidad en A.
Si f : A B, g : C D y f [A] C, podemos definir la composici
on
f g : A D como la aplicaci
on dada por (f g)(a) = g(f (a)), es decir, la
aplicaci
on que se calcula pasando de a A a f (a) f [A] C y luego de f (a)
a g(f (a)) D.

1.3. Funciones

17

Por ejemplo, si g y h son las aplicaciones de las figuras de la p


agina anterior,
se cumple que g h es la identidad en A, pues (g h)(0) = h(g(0)) = h(3) = 0,
e igualmente se comprueba que (g h)(1) = 1 y (g h)(2) = 2.
Los conceptos que acabamos de introducir satisfacen numerosas relaciones
de interes que conviene conocer. Veamos algunas de ellas:
1. Si f : A B, g : B C y h : C D, entonces (f g)h = f (g h).
En efecto, los dos miembros de la igualdad son aplicaciones A D y,
para cada a A, se cumple que
((f g) h)(a) = h((f g)(a)) = h(g(f (a)) = (g h)(f (a) = (f (g h))(a).
Por lo tanto, en esta situaci
on podemos escribir f g h sin necesidad
de poner parentesis. Se trata de la aplicaci
on que act
ua primero como f ,
luego aplica g y luego h.
2. Si f : A B es biyectiva, entonces f f 1 = iA es la identidad en A y
f 1 f = iB es la identidad en B.
En efecto, si a A y f (a) = b, entonces f 1 (b) = a, luego

(f f 1 )(a) = f 1 (f (a)) = f 1 (b) = a = iA (a),


e igualmente se comprueba que (f 1 f )(b) = b = iB (b), para todo b B.
3. Si f : A B e iA , iB son las identidades en A y en B, respectivamente,
entonces iA f = f = f iB .
4. Si f : A B y X, Y B, entonces
f 1 [X Y ] = f 1 [X] f 1 [Y ],

f 1 [X Y ] = f 1 [X] f 1 [Y ],

f 1 [X \ Y ] = f 1 [X] \ f 1 [Y ].
Comprobamos la primera como ejemplo: si a f 1 [X Y ], entonces
f (a) X Y , luego f (a) X o bien f (a) Y , luego a f 1 [X] o bien
a f 1 [Y ], luego a f 1 [X] f 1 [Y ]. Esto nos da la inclusi
on , la
inclusi
on se demuestra an
alogamente.
5. Si f : A B y g : B A y f g = iA es la identidad en A, entonces
f es inyectiva y g es suprayectiva.
En efecto, para ver que f es inyectiva tomamos x, y A y suponemos que
f (x) = f (y). Entonces g(f (x)) = g(f (y)), luego (f g)(x) = (f g)(y),
luego x = y.
Para ver que g es suprayectiva tomamos a A y observamos que se cumple
g(f (a)) = a, luego f (a) B es una antiimagen de a por g.

18

Captulo 1. El lenguaje de la teora de conjuntos

Ejercicio: Sea f : A B y sean X, Y A. Estudiar si se cumplen las igualdades


f [X Y ] = f [X] f [Y ],

f [X Y ] = f [X] f [Y ],

f [X \ Y ] = f [X] \ f [Y ].

Por u
ltimo observamos que si f : A B, por definici
on f A B, luego
f P(A B). Por lo tanto, podemos usar el axioma de especificaci
on y definir
B A = {f P(A B) | f : A B},
que es el conjunto de todas las aplicaciones de A en B, ya que la restricci
on
f P(A B) no elimina a ninguna de ellas.

1.4

Los n
umeros naturales

Para definir los n


umeros naturales hemos elegido arbitrariamente un conjunto como 0 (concretamente ) y una operaci
on conjuntista adecuada como
siguiente (concretamente x 7 {x}). Veamos ahora que hay muchas otras
elecciones posibles. En lugar de la versi
on del axioma de infinitud que hemos
adoptado, podramos haber tomado esta variante m
as abstracta:
Axioma de infinitud (variante) Existe un conjunto X con una aplicaci
on
S : X X inyectiva y no suprayectiva.
Observemos que la versi
on anterior del axioma implica esta, ya que la aplicaci
on sucesor S : N N es inyectiva y no suprayectiva (eso es precisamente
lo que afirman los axiomas de Peano 3 y 4). Ahora vamos a ver que esta versi
on
abstracta es suficiente para construir un conjunto de n
umeros naturales.
Sea S : X X una aplicaci
on inyectiva y no suprayectiva, tal y como
postula el axioma. Entonces podemos elegir un elemento 0 X que no tiene
antiimagen. Diremos que A X es inductivo si 0 A y cuando n A entonces
tambien S(n) A. Sea I =T{A PX | A es inductivo}. Observemos que I 6= ,
ya que X I. Sea N = I. Exactamente igual que en la demostraci
on del
teorema 1.4 podemos probar que N es inductivo. En particular, si n N , se
cumple que S(n) N , por lo que podemos restringir S|N : N N . Vamos a
llamar S a esta restricci
on. Entonces:
Teorema 1.11 (Axiomas de Peano) Existe un conjunto N , una aplicaci
on
S : N N y un elemento 0 de modo que se cumplen las propiedades siguientes:
1. 0 N
2. Si n N , entonces S(n) N .
3. No existe ning
un n N tal que S(n) = 0.
4. Si m, n N y S(m) = S(n), entonces m = n.
5. Si A N tiene la propiedad de que 0 A y siempre que n A tambien
S(n) A, entonces A = N .

1.4. Los n
umeros naturales

19

n: Las propiedades 1) y 2) se cumplen porque N es inductivo,


Demostracio
la propiedad 3) porque hemos elegido 0 sin antiimagen por S, la propiedad 4)
porque S es inyectiva y la 5) porque lo que afirma es que A N X es
inductivo, luego A I, luego N A, ya que los elementos de N est
an en todos
los elementos de I.
Podemos definir igualmente 1 = S(0), 2 = S(1), etc. As tenemos la misma
situaci
on que antes, salvo que ahora no hemos precisado cu
ales son concretamente los elementos de N ni quien es concretamente el cero ni en que consiste
concretamente el paso al siguiente n
umero natural. Conviene recoger esto en
una definici
on:
Definici
on 1.12 Un sistema de Peano es una terna6 (N, S, 0) que cumple las
cinco propiedades del teorema anterior.
Vemos entonces que el axioma de infinitud que hemos dado en esta secci
on
es equivalente a la existencia de una terna de Peano (pues hemos probado que
existe una a partir del axioma y, recprocamente, la funci
on S de una terna de
Peano es una aplicaci
on inyectiva y no suprayectiva). El axioma de infinitud
dado en la secci
on 1.2 implica la existencia de un sistema de Peano en el que,
concretamente, 0 = y S(n) = {n}, pero esto es anecd
otico.
Para poner de manifiesto que lo u
nico que importa realmente de los n
umeros
naturales es que forman un sistema de Peano ahora vamos a trabajar con uno
cualquiera de ellos. Empezamos demostrando la propiedad m
as importante de
los n
umeros naturales junto con el principio de inducci
on:
Teorema 1.13 (Principio de recursi
on) Sea (N, S, 0) un sistema de Peano,
sea g : A A una aplicaci
on arbitraria y sea a A. Entonces existe una
u
nica aplicaci
on f : N A tal que f (0) = a y para todo n N se cumple que
f (S(n)) = g(f (n)).
La u
ltima propiedad se expresa a menudo diciendo que el diagrama siguiente
es conmutativo:
g
/A
AO
O
f

f
S

/N

Decir que un diagrama de este tipo es conmutativo quiere decir que si vamos
de un punto a otro por dos caminos diferentes el resultado es el mismo, en este
caso f g = S f , que es justo lo que afirma el teorema.
En la pr
actica, el principio de recursi
on afirma que para definir una aplicaci
on f : N A no es necesario definir explcitamente f (0), f (1), f (2), etc.,
sino que basta definir f (0) como un cierto a A y explicar c
omo se calcula
f (S(n)) supuesto que ya hayamos calculado f (n), es decir, dar una funci
on
6 En

general podemos definir una terna como (a, b, c) = ((a, b), c).

20

Captulo 1. El lenguaje de la teora de conjuntos

g que determine f (S(n)) a partir de f (n). Esto determina completamente la


funci
on f , que vendr
a dada por:
f (0) = a,

f (1) = f (S(0)) = g(a),

f (3) = g(g(g(a))),

f (2) = f (S(1)) = g(g(a)),

f (4) = g(g(g(g(a)))),

...

Cuando definimos una funci


on de este modo se dice que la estamos definiendo
por recurrencia, o que la definici
on es recursiva.
Antes de ver ejemplos y aplicaciones vamos a demostrar el teorema:
n: Diremos que h : X A es una aproximaci
Demostracio
on si:
1. X N , 0 X y siempre que n X y n 6= 0 existe un m X tal que
n = S(m)
2. h(0) = a y siempre que n X y S(n) X, entonces h(S(n)) = g(h(n)).
As, las aproximaciones son funciones que cumplen lo que requiere el teorema
salvo que no tienen por que estar definidas en todo N .
Veamos en primer lugar que si h : X A y h0 : X 0 A son aproximaciones y n X X 0 , entonces h(n) = h0 (n).
Lo probamos por inducci
on sobre n. Concretamente, consideramos la propiedad P n dada por: si n X X 0 , entonces h(n) = h0 (n), y vamos a comprobar
que la cumplen todos los elementos de N .
Se cumple para 0, porque por definici
on de aproximaci
on 0 X X 0 y
0
h(0) = a = h (0).
Supongamos, como hip
otesis de inducci
on, que si n X X 0 , entonces
0
h(n) = h (n) y vamos a probar que lo mismo vale para S(n). Para ello suponemos que S(n) X X 0 . Entonces, por definici
on de aproximaci
on, x X X 0
(aqu usamos el cuarto axioma de Peano, que dice que n es el u
nico anterior
de S(n)). Entonces, por hip
otesis de inducci
on h(n) = h0 (n), y por definici
on
de aproximaci
on h(S(n)) = g(h(n)) = g(h0 (n)) = h0 (S(n)). Esto termina la
prueba.
Ahora probamos que para todo n N existe una aproximaci
on h con n en
su dominio. Lo probamos nuevamente por inducci
on sobre n. Es inmediato que
la aplicaci
on h : {0} A dada por h(0) = a es una aproximaci
on, y tiene a 0
en su dominio, luego el resultado es cierto para 0.
Supongamos, por hip
otesis de inducci
on que h : X A es una aproximaci
on tal que n A. Si S(n) A, entonces h cumple lo requerido para S(n).
En caso contrario es f
acil ver que h0 : X {S(n)} A definida como h sobre
los elementos de X y como h0 (S(n)) = g(h(n)) es una aproximaci
on con S(n)
en su dominio.
Ahora ya podemos definir f : N A como sigue: para cada n N ,
sabemos que existe una aproximaci
on h : X A con n en su dominio y que,
si tomamos dos cualesquiera, el valor de h(n) va a ser el mismo para ambas.
Por lo tanto podemos definir f (n) = h(n).

1.4. Los n
umeros naturales

21

Esto hace que, en particular, f (0) = a, porque todas las aproximaciones


asignan a 0 la imagen a. Por otra parte, si n N y h : X A es una
aproximaci
on tal que S(n) A, entonces por definici
on de aproximaci
on n A,
luego por definici
on de f tenemos que f (n) = h(n) y f (S(n)) = h(S(n)), y por
definici
on de aproximaci
on
f (S(n)) = h(S(n)) = g(h(n)) = g(f (n)).
Por lo tanto, f cumple lo pedido, y s
olo falta probar que s
olo hay una f
que cumpla esta propiedad. Para ello tenemos que probar que si f : N A
y f 0 : N A cumplen las condiciones del enunciado, entonces f = f 0 , para
lo cual a su vez basta probar que si n N entonces f (n) = f 0 (n). Esto lo
probamos por inducci
on. Para n = 0 se cumple, pues f (0) = a = f 0 (0). Si
suponemos como hip
otesis de inducci
on que f (n) = f 0 (n), entonces
f (S(n)) = g(f (n)) = g(f 0 (n)) = f 0 (S(n)).
esto termina la prueba de la unicidad de f .
Como primera aplicaci
on demostramos la equivalencia entre todos los sistemas de Peano:
Teorema 1.14 Si (N, S, 0) y (N 0 , S 0 , 00 ) son dos sistemas de Peano, entonces
existe f : N N 0 biyectiva tal que f (0) = 00 y que hace conmutativo el
diagrama siguiente:
NO

S0

/ N0
O

/ N0

Observemos que esto significa que f (1) = f (S(0)) = S 0 (f (0)) = S 0 (00 ) = 10 ,


f (2) = f (S(1)) = S 0 (f (1)) = S 0 (10 ) = 20 y, en general, que f transforma el
0 de un sistema en el 00 del otro, el 1 de un sistema en el 10 del otro, y as
sucesivamente. En definitiva, f es como un diccionario que traduce cero
por zero, uno por one, dos por two y as sucesivamente, poniendo en
evidencia que los dos sistemas de Peano no son m
as que dos ristras de nombres
alternativos para los n
umeros naturales, de modo que es lo mismo partir de
dos, calcular el siguiente tres y luego traducir three que partir de dos,
traducir two y luego calcular el siguiente three.
n: Aplicamos el teorema de recursi
Demostracio
on a 00 N 0 y a la funci
on
0
0
S : N N . La conclusi
on es que existe una funci
on f : N N 0 tal que
f (0) = 00 y para todo n N se cumple que f (S(n)) = S 0 (f (n)), que es la
condici
on de conmutatividad para el diagrama. S
olo falta probar que f es
biyectiva.
Para ello invertimos los papeles y definimos f 0 : N 0 N mediante el teorema de recursi
on aplicado al segundo sistema de Peano, de modo que f 0 (00 ) = 0
0
y para todo n N 0 se cumple que f 0 (S 0 (n0 )) = S(f 0 (n0 )).
0

22

Captulo 1. El lenguaje de la teora de conjuntos

Ahora demostramos por inducci


on que f 0 (f (n)) = n para todo n N .
0
Para n = 0 tenemos que f (f (0)) = f 0 (00 ) = 0. Si vale para n, entonces
f 0 (f (S(n))) = f 0 (S 0 (f (n))) = S(f 0 (f (n))) = S(n).
Esto prueba que f f 0 es la identidad en N , y la propiedad 5 de la p
agina 17
nos da que f es inyectiva. Pero invirtiendo los papeles obtenemos tambien que
f 0 f es la identidad, luego f es suprayectiva, y concluimos que es biyectiva.
A partir de aqu fijamos un sistema de Peano cualquiera (N, S, 0), que puede
ser el que hemos construido concretamente en la secci
on 1.2 u otro cualquiera,
y llamaremos n
umeros naturales a los elementos de N.
Vamos a aplicar el teorema de recursi
on tomando como a un n
umero natural
m N y como g la aplicaci
on siguiente S : N N. El teorema nos da que
existe una u
nica fm : N N tal que fm (0) = m y fm (S(n)) = S(fm (n)).
Sin embargo, en lugar de usar la notaci
on habitual para aplicaciones, es decir,
fm (n), vamos a usar una notaci
on especfica, y escribiremos m + n = fm (n).
Con esta notaci
on, las propiedades que determinan por recurrencia la funci
on
fm se escriben as:
m + 0 = m,

m + S(n) = S(m + n).

En particular, observamos que m + 1 = m + S(0) = S(m + 0) = S(m), por lo


que a partir de ahora ya no volveremos a escribir S(n) para referirnos al siguiente
de un n
umero natural, sino que usaremos la notaci
on m + 1. Puesto que esta
ser
a la notaci
on que emplearemos en lo sucesivo, conviene reescribir en estos
terminos los resultados que hemos enunciado hasta ahora con la notaci
on S:
Principio de inducci
on Si probamos que 0 tiene la propiedad P y bajo la
hip
otesis de que n N cumple la propiedad P (hip
otesis de inducci
on) podemos
demostrar que n + 1 tambien cumple la propiedad P , entonces podemos asegurar
que todo n
umero natural cumple la propiedad P .
Principio de recursi
on Si g : A A es una aplicaci
on arbitraria y a A,
existe una u
nica aplicaci
on f : N A tal que f (0) = a y para todo n N se
cumple que f (n + 1) = g(f (n))
Suma de n
umeros naturales La suma de dos n
umeros naturales m y n est
a
unvocamente determinada por las propiedades siguientes:
m + 0 = m,

m + (n + 1) = (m + n) + 1.

Esta definici
on se corresponde con la suma que el lector conoce sin duda
desde sus primeros a
nos. Por ejemplo:
2 + 3 = 2 + (2 + 1) = (2 + 2) + 1 = (2 + (1 + 1)) + 1 = ((2 + 1) + 1) + 1
= (3 + 1) + 1 = 4 + 1 = 5.

1.4. Los n
umeros naturales

23

Producto de n
umeros naturales El producto de dos n
umeros naturales
est
a unvocamente determinado por las propiedades
m 0 = 0,

m(n + 1) = m n + m.

Observemos que la definici


on de producto se basa en el teorema de recursi
on
tomando a = 0 y como g : N N la aplicaci
on dada por g(n) = n + m.
Esto nos define una funci
on gm , pero en lugar de gm (n) escribimos m n, o
simplemente mn. Como en el caso de la suma, este producto es el producto
de toda la vida. No obstante, antes de hacer cuentas con el es conveniente
demostrar las propiedades b
asicas de estas operaciones:
1. (m + n) + r = m + (n + r).
Por inducci
on7 sobre r. Para r = 0 se reduce a m + n = m + n. Si vale
para r, entonces
(m + n) + (r + 1) = ((m + n) + r) + 1 = (m + (n + r)) + 1
= m + ((n + r) + 1) = m + (n + (r + 1)),
donde hemos aplicado la definici
on de suma, la hip
otesis de inducci
on, y
dos veces m
as la definici
on de suma.
Esta propiedad nos permite escribir expresiones m + n + r sin necesidad
de intercalar parentesis. As, por ejemplo,
3 + 3 = 3 + 2 + 1 = 3 + 1 + 1 + 1 = 3 + 1 + 1 = 5 + 1 = 6.
2. m + n = n + m.
Para probar esto demostramos antes algunos casos particulares. En primer
lugar demostramos que 0 + n = n por inducci
on sobre n (notemos que
n + 0 = n se cumple por la definici
on de suma). Para n = 0 es 0 + 0 = 0,
Si vale para n, entonces
0 + (n + 1) = (0 + n) + 1 = n + 1.
En segundo lugar demostramos que 1 + n = n + 1, tambien por inducci
on
sobre n. Para n = 0 es 1 + 0 = 1 = 0 + 1, la primera igualdad por
la definici
on de suma y la segunda porque ya hemos visto que sumar 1
equivale a pasar al siguiente. Si vale para n, entonces
1 + (n + 1) = (1 + n) + 1 = (n + 1) + 1.
Ahora probamos el caso general por inducci
on sobre n. Para n = 0 es
m + 0 = m = 0 + m. Si vale para n, entonces
m + (n + 1) = (m + n) + 1 = (n + m) + 1 = n + (m + 1)
= n + (1 + m) = (n + 1) + m,
donde hemos usado las propiedades precedentes.
7 Por inducci
on sobre r significa que vamos a aplicar el principio de inducci
on a la propiedad P r (m + n) + r = m + (n + r), considerando m y n fijos.

24

Captulo 1. El lenguaje de la teora de conjuntos


3. (m + n)r = mr + nr.
Por inducci
on sobre r. Para r = 0 es (m + n)0 = 0 = 0 + 0 = m 0 + n 0.
Si vale para r entonces
(m + n)(r + 1) = (m + n)r + m + n = mr + nr + m + n
= mr + m + nr + r = m(r + 1) + n(r + 1).
4. m(n + r) = mn + mr.
Por inducci
on sobre r. Para r = 0 es mn = mn. Si vale para n, entonces
m(n + (r + 1)) = m((n + r) + 1) = m(n + r) + m
= mn + mr + mmn + m(r + 1).
5. (mn)r = m(nr).
Por inducci
on sobre r. Para r = 0 es (mn)0 = 0 = m(0) = m(n0). Si vale
para r, entonces
(mn)(r + 1) = (mn)r + mn = m(nr) + mn = m(nr + n) = m(n(r + 1)),
donde hemos usado la propiedad anterior.
Como en el caso de la suma, esta propiedad hace innecesarios los parentesis
entre los terminos de una multiplicaci
on.
6. n 1 = n.

n: n 1 = n(0 + 1) = n 0 + n = 0 + n = n.
Demostracio

7. mn = nm.
Demostramos antes algunos casos particulares. En primer lugar vemos
que 0 n = 0. Para n = 0 es 0 0 = 0. Si vale para n, entonces
0 (n + 1) = 0 n + 0 = 0 + 0 = 0.
En segundo lugar 1 n = n. Para n = 0 es 1 0 = 0. Si vale para n,
entonces 1(n + 1) = 1 n + 1 1 = n + 1. Ahora probamos el caso general,
por inducci
on sobre n. Para n = 0 es m0 = 0 = 0m. Si vale para n,
entonces
m(n + 1) = mn + m = nm + m = nm + 1 m = (n + 1)m,
donde hemos usado la propiedad 3.
8. Si m + r = n + r, entonces m = n.
Por inducci
on sobre r. Para r = 0 tenemos m+0 = n+0, luego ciertamente
m = n. Si vale para r y tenemos m + (r + 1) = n + (r + 1), esto es lo
mismo que (m + r) + 1 = (n + r) + 1, o tambien S(m + r) = S(n + r), luego
por el cuarto axioma de Peano m + r = n + r, luego m = n por hip
otesis
de inducci
on.

1.4. Los n
umeros naturales

25

9. Si m + n = 0, entonces m = n = 0.
En efecto, si fuera n 6= 0, entonces n = r + 1 para cierto r (teorema 1.7),
y entonces m + n = (m + r) + 1 6= 0, pues el 0 no es el siguiente de ning
un
n
umero natural.
10. Si mn = 0, entonces m = 0 o bien n = 0.
En caso contrario, m = m0 + 1, n = n0 + 1, luego, al igual que antes,
mn = (m0 + 1)(n0 + 1) = (m0 + 1)n0 + m0 + 1 6= 0.
Ahora ya es f
acil operar con n
umeros naturales. Por ejemplo,
3 2 = 3(1 + 1) = 3 + 3 = 6.
Una nueva aplicaci
on del teorema de recursi
on nos permite introducir las
potencias:
Exponenciaci
on de n
umeros naturales La exponenciaci
on de dos n
umeros
naturales est
a unvocamente determinada por las propiedades siguientes:
m0 = 1,

mn+1 = mn m.

Dejamos como ejercicio demostrar sus propiedades:


1. Si n 6= 0, entonces 0n = 0 (pero 00 = 1, por definici
on).
2. 1n = 1.
3. mn+r = mn mr .
4. (mn )r = mnr .
5. (mn)r = mn nr .
6. Si m < n y 1 < r, entonces mr < nr .
7. Si m n, entonces mr nr .
El u
ltimo concepto b
asico de la aritmetica de los n
umeros naturales es la
relaci
on de orden:
Ordenaci
on de los n
umeros naturales Diremos que un n
umero natural
m es menor o igual que otro n, y lo representaremos por m n, si existe un
r N tal que m + r = n. Observemos que en tal caso dicho r es u
nico por
la propiedad 8 precedente, por lo que podemos llamarlo resta de n y m, y lo
representaremos por n m.
Notemos que m m, porque m + 0 = m. Escribiremos m < n para indicar
que m n y m 6= n.
Por ejemplo, como 2 + 3 = 5, se cumple que 2 < 5 y que 5 2 = 3.
Veamos ahora las propiedades correspondientes:

26

Captulo 1. El lenguaje de la teora de conjuntos


1. Para todo natural n se cumple que 0 n.
En efecto, 0 + n = n.

2. Si m y n son n
umeros naturales, entonces m n o bien n m.

Por inducci
on sobre n, si n = 0 se cumple n = 0 m. Si vale para n,
tenemos que m n o bien n m. Si se da el primer caso, existe un r tal
que m + r = n, luego m + r + 1 = n + 1, luego m n + 1, como haba que
probar.
Supongamos ahora que n m y sea r tal que n+r = m. Si r = 0 entonces
n = m, luego n + 1 = m + 1, luego m n + 1, como haba que probar.
Si r 6= 0, existe un r0 tal que r = r0 + 1, luego n + r0 + 1 = m, luego
n + 1 m.

3. Si m n y n m, entonces m = n.

Tenemos que m + r = n y n + r0 = m, luego m + r + r0 = m = m + 0,


luego r + r0 = 0, luego r = r0 = 0, luego m = n.

4. Si m n y n r, entonces m r.

Tenemos que m + u = n y n + v = r, luego m + u + v = r, luego m r.

5. Se cumple m n si y s
olo si m + r n + r.

En efecto, m n equivale a que exista un u tal que m + u = n, lo cual


equivale a que m + r + u = n + r, lo cual equivale a que m + r n + r.

6. Si r 6= 0 y mr = nr, entonces m = n.

En efecto, no perdemos generalidad si suponemos m n, de modo que


n = m + u, luego nr = mr + ur, luego mr + 0 = mr + ur, luego ur = 0,
luego u = 0, luego m = n.

7. Si r 6= 0, entonces m n si y s
olo si mr nr.

Si m n, existe un u tal que m + u = n, luego mr + ur = nr, luego


mr nr. Recprocamente, si mr nr, entonces o bien m n, como
queremos probar, o bien n m, en cuyo caso nr mr por la parte ya
probada, luego nr = mr por 3, luego n = m por 6, luego m n.

Notemos que, trivialmente, n < S(n), luego la ordenaci


on que acabamos
de introducir se corresponde con la que resulta al ir generando los n
umeros
naturales a partir del 0 mediante la operaci
on siguiente, es decir:
0 < 1 < 2 < 3 < 4 <

La relaci
on de orden en N permite dar un significado preciso a algunas expresiones con puntos suspensivos. Por ejemplo, para cada n N podemos
definir
In = {1, . . . , n},
In = {0, . . . , n 1}

y esto hay que entenderlo como que In = {m N | 1 m n} (con lo que en


particular I0 = ) e igualmente In = {m N | m < n}, que son definiciones
v
alidas por especificaci
on.

1.5. Relaciones de orden

1.5

27

Relaciones de orden

Acabamos de definir una ordenaci


on de los n
umeros naturales (que no es
sino la ordenaci
on usual que el lector conoca sin duda de antemano). Sin
embargo, el conjunto de los n
umeros naturales no es el u
nico conjunto que
vamos a manejar en el que es posible considerar una relaci
on de orden, y por
ello es conveniente desarrollar una teora general o, m
as bien, un lenguaje
general sobre conjuntos ordenados para estar en condiciones de aplicar los
mismos hechos generales a distintos casos particulares sin necesidad de redefinir
los conceptos y repetir las demostraciones en cada caso. Para ello necesitamos
en primer lugar una teora general sobre relaciones.
Definici
on 1.15 Una relaci
on R en un conjunto A es un subconjunto del producto cartesiano R A A.
En la pr
actica, en lugar de escribir (a, b) R, escribiremos a R b y diremos
que a est
a relacionado con b (respecto de la relaci
on R).
Observaciones Como en el caso de las funciones, en la pr
actica podemos
olvidar que las relaciones son tecnicamente conjuntos de pares ordenados. As,
para definir una relaci
on R en un conjunto A basta especificar que a R b si y
s
olo si a y b cumplen una determinada propiedad P ab. Esto equivale a definir
R como el conjunto
R = {(a, b) A A | P ab}.
Por ejemplo, si R es una relaci
on en un conjunto A, podemos definir su
relaci
on inversa como la relaci
on R1 dada por
a R1 b

si y s
olo si

b R a.

Tecnicamente, R1 se define por el axioma de especificaci


on, como el conjunto
R1 = {x A A | existen a, b A tales que x = (a, b) y (b, a) R},
pero la primera forma de definir esta o cualquier otra relaci
on es m
as pr
actica.
Otro ejemplo: en la secci
on anterior hemos definido la ordenaci
on de los
n
umeros naturales como una propiedad m n que pueden tener o no dos
n
umeros naturales dados. Ahora podemos considerar el conjunto
{(m, n) N N | m n}
y, si llamamos a este conjunto, tenemos que m n en el sentido de la
secci
on anterior si y s
olo si se cumple esto mismo en el sentido que acabamos de
introducir, es decir, en el sentido de que el par (m, n) pertenece al conjunto .
Veamos algunos conceptos del lenguaje de las relaciones.

28

Captulo 1. El lenguaje de la teora de conjuntos

Definici
on 1.16 Una relaci
on R en un conjunto A es:
Reflexiva si para todo a A se cumple que a R a.
Irreflexiva si para ning
un a A se cumple que a R a.
Simetrica si cuando a, b A cumplen a R b tambien cumplen b R a.
Antisimetrica si cuando a, b A cumplen a R b y b R a entonces a = b.
Asimetrica si no existen a, b A que cumplan a R b y b R a.
Transitiva si cuando a, b, c A cumplen a R b y b R c entonces a R c.
Conexa si cuando a, b A, o bien se cumple a R b o bien b R a.
Una relaci
on en un conjunto A es una relaci
on de orden parcial si es
reflexiva, antisimetrica y transitiva. Si adem
as es conexa, se dice que es una
relaci
on de orden total.
Una relaci
on < en un conjunto A es una relaci
on de orden parcial estricto
si es irreflexiva, asimetrica y transitiva. Si adem
as cuando a, b A se cumple
a < b o b < a o a = b se dice que es una relaci
on de orden total estricto.
Un conjunto parcialmente (resp. totalmente) ordenado es una par (A, ),
donde es una relaci
on de orden parcial (resp. total) en A.
Observaciones En la secci
on anterior hemos demostrado que la relaci
on
definida all sobre el conjunto N de los n
umeros naturales es una relaci
on de
orden total, y es f
acil ver que la relaci
on < definida como m < n si m n y
m 6= n es una relaci
on de orden total estricto.
En realidad esto es un caso particular de un hecho general: siempre que
en un conjunto A tenemos definida una relaci
on de orden (total o parcial) no
estricto , la relaci
on dada por a < b si y s
olo si a b y a 6= b es una relaci
on de
orden estricto (total o parcial seg
un lo sea la relaci
on dada) y, recprocamente,
si < es cualquier relaci
on de orden estricto en un conjunto A, la relaci
on dada
por a b si y s
olo si a < b o a = b es una relaci
on de orden no estricto, de
modo que una y otra se determinan mutuamente. Por lo tanto, es indiferente
hablar de relaciones de orden estricto o no estricto en un conjunto: siempre
que tenemos definida una, podemos dar por hecho que tenemos definida de este
modo una del otro tipo.
Al hablar de conjuntos ordenados es frecuente omitir la relaci
on de orden,
y decir, por ejemplo que A es un conjunto ordenado, de modo que hay que
entender que (A, ) es un conjunto ordenado con cierta relaci
on de orden que
no se menciona, ya sea porque es una relaci
on arbitraria denotada por , ya
porque sea una relaci
on especfica que se deduce del contexto. Por ejemplo,
siempre que hablemos de N como conjunto ordenado se entender
a que hablamos
del par (N, ), donde es la relaci
on definida en la secci
on precedente.

1.5. Relaciones de orden

29

El hecho de emplear el signo para referirnos tanto a una relaci


on de orden
arbitraria como a relaciones de orden concretas definidas en ciertos conjuntos
(de momento s
olo tenemos definida la de N) no da lugar a confusi
on porque rara
vez se consideran varias relaciones de orden definidas sobre un mismo conjunto,
por lo que el significado de se deduce en cada contexto de los elementos sobre
los que act
ua. S
olo en caso de considerar varias relaciones de orden sobre un
mismo conjunto ser
a necesario distinguir unas de otras con signos como 0 , ,
E, etc.
En general, si X es un conjunto parcialmente ordenado, adem
as de la relaci
on sobrentendida, tenemos la relaci
on estricta asociada <, y las relaciones
inversas de ambas, que representaremos siempre por y > respectivamente.
As, por ejemplo, 5 3 es lo mismo que 3 5.
Ampliamos ahora nuestro vocabulario sobre un conjunto parcialmente ordenado A:
1. Si X A, consideraremos a X como conjunto ordenado con la restricci
on8
a X de la relaci
on de orden de A.
2. Si X A y m X, diremos que m es el mnimo de X si para todo x X
se cumple que m x. Notemos que si X tiene mnimo, este es u
nico, pues
si m y m0 son dos mnimos, entonces ambos est
an en X y deben cumplir
m m0 y m0 m, luego m = m0 . Por ello podemos representarlo por
mn X (aunque recordemos que, en general, puede no existir).
3. Si X A y M X, diremos que M es el m
aximo de X si para todo
x X se cumple que x M . Al igual que sucede con los mnimos, si X
tiene m
aximo este es u
nico, y podemos representarlo por m
ax X.
4. Si X A y c A, diremos que c es una cota inferior de X si para
todo x X se cumple que c x. La diferencia con el mnimo es que
no exigimos que c X, y esto hace que un mismo conjunto pueda tener
muchas cotas inferiores distintas (o ninguna).
5. Si X A y C A, diremos que C es una cota superior de X si para todo
x X se cumple x C.

Por ejemplo, si X = {3, 5, 6}, tenemos que, respecto al orden usual de N, los
n
umeros 0, 1, 2, 3 son cotas inferiores de X y 3 = mn X, mientras que cualquier
n
umero n 6 es una cota superior, y 6 = m
ax X.
Tambien es claro que 0 = mn N, mientras que N no tiene m
aximo elemento,
ya que si M N fuera el m
aximo, debera cumplir M + 1 M , lo cual es falso.

Observemos que si un conjunto tiene m


aximo entonces este es el mnimo del
conjunto de sus cotas superiores, e igualmente el mnimo (si existe) es el m
aximo
del conjunto de sus cotas inferiores.
8 T
ecnicamente, la restricci
on es X = A (X X), de modo que, si x, y X, entonces
x X y es equivalente a x A y, pero X s
olo est
a definida para elementos de X.

30

Captulo 1. El lenguaje de la teora de conjuntos


La ordenaci
on de los n
umeros naturales tiene una propiedad notable:

Teorema 1.17 (Principio de buena ordenaci


on) Todo subconjunto no vaco de N tiene un mnimo elemento.
n: Sea X N un conjunto no vaco, de modo que existe un
Demostracio
cierto m X. Consideremos la propiedad P c c es una cota inferior de X.
Claramente se cumple P 0, y m + 1 no tiene la propiedad P , pues no es cierto
que m + 1 m. Si fuera cierto que cuando c cumple la propiedad P tambien
la cumple c + 1, el principio de inducci
on nos dara que todo n
umero natural
cumple la propiedad P , y hemos visto que eso es falso. Por lo tanto, tiene que
existir un c N que cumpla P c, pero de modo que c + 1 no cumpla P . En otras
palabras, c es una cota inferior de X, pero c + 1 no lo es. Lo segundo significa
que existe un n X tal que n < c + 1, y lo primero implica que c n < c + 1.
De aqu se sigue9 que c = n, luego c X es el mnimo de X.
Por ejemplo, es f
acil probar que n + 1 = mn{m N | m > n}, es decir, que
el siguiente de un n
umero natural n es el mnimo n
umero natural mayor que n.

En general, el principio de buena ordenaci


on hace que si tenemos que existe
un n
umero natural que cumple una propiedad P , podamos considerar el mnimo
n
umero natural que cumple la propiedad P , es decir, el mnimo del conjunto no
vaco {n N | P n}, con lo que tenemos un n
umero que, adem
as de cumplir P ,
cumple que ning
un natural menor cumple P . Veamos un ejemplo de este tipo
de argumentaci
on:
Teorema 1.18 (Divisi
on eucldea) Dados dos n
umeros naturales D y d, con
d 6= 0, existen unos u
nicos c y r tales que D = dc + r y r < d.
n: Como d 6= 0, tenemos que 1 d, luego D dD. As pues,
Demostracio
D es un n
umero natural x que cumple D dx, luego podemos tomar el mnimo
n
umero natural x que cumple D dx.
Si D = dx, entonces basta tomar c = x y r = 0. Si, por el contrario, D < dx
entonces necesariamente x 6= 0, luego podemos considerar c = x 1 < x. Por
la minimalidad de x tiene que ser dc < D < d(c + 1) = dc + d. Sea r = D dc,
de modo que dc + r < dc + d, luego r < d.
Con esto tenemos probado que existen c y r que cumplen lo pedido. Ahora
tenemos que ver que son u
nicos. Si c1 , c2 , r1 , r2 cumplieran lo requerido y
c1 6= c2 , podemos suponer que c1 < c2 . Entonces
D = dc1 + r1 < dc1 + d = d(c1 + 1) cc2 dc2 + r2 = D,
contradicci
on. Por lo tanto, c1 = c2 , y entonces D = dc1 + r1 = dc1 + r2 , luego
r1 = r2 .
En las condiciones del teorema anterior, se dice que c y r son, respectivamente, el cociente y el resto de la divisi
on eucldea del dividendo D entre el
divisor d.
9 Tenemos que c+r = n y n+s = c+1, con s 6= 0, luego s = s0 +1, luego c+r+s0 +1 = c+1,
luego r + s0 = 0, luego r = 0, luego c = n.

1.5. Relaciones de orden

31

El proceso de tomar el menor n


umero natural que cumple una propiedad
puede usarse en una forma fuerte de razonamiento por reducci
on al absurdo
conocida como demostraci
on por contraejemplo mnimo. Esto significa que si
queremos probar que todo n
umero natural cumple una propiedad P , podemos
suponer, por reducci
on al absurdo que existe un n
umero natural que no cumple
P , y entonces tomar el mnimo n
umero natural n que no cumple P . As, para
llegar a un absurdo no s
olo contamos con que n no cumple P , sino tambien con
que todos los n
umeros menores que n cumplen P .
A su vez, la demostraci
on por contraejemplo minimal es equivalente a una
versi
on fuerte del principio de inducci
on. En principio, en una demostraci
on por
inducci
on suponemos que el anterior de un n
umero cumple una propiedad P y
demostramos que dicho n
umero cumple P . Ahora vamos a ver que, si queremos,
podemos suponer como hip
otesis de inducci
on que, no s
olo el inmediato anterior
del n
umero cumple P , sino que todos los n
umeros menores la cumplen:
Teorema 1.19 (Principio de inducci
on fuerte) Sea A N tal que, para
todo n
umero natural n, si todo m < n cumple que m A, tambien n A.
Entonces A = N.
Si aplicamos esto a un conjunto de la forma A = {n N | P n}, vemos que si
suponemos como hip
otesis de inducci
on que todos los n
umeros menores que uno
dado n tienen la propiedad P y llegamos a que n tambien tiene la propiedad P ,
podemos concluir que todo n
umero natural n tiene la propiedad P .
n: Si no es cierto que A = N, como A N, tiene que existir
Demostracio
un n N que no este en A. Podemos tomar entonces un contraejemplo mnimo,
es decir, el mnimo n
umero natural n que no est
a en A. Dicho n
umero tiene la
propiedad de que todos los menores que el s que est
an en A, luego la hip
otesis
del teorema nos dice que n tiene que estar en A, y eso es una contradicci
on.
Observemos que con esta formulaci
on no hace falta exigir una demostraci
on
aparte de P 0, porque es trivialmente cierto que todo n
umero natural menor
que 0 cumple la propiedad P , y estamos suponiendo que bajo este caso trivial
de la hip
otesis de inducci
on podemos demostrar P 0. Esto no quita para que,
en la pr
actica, al suponer que todo n
umero natural menor que n cumple P ,
pueda ser conveniente tratar por separado los casos n = 0 (donde la hip
otesis
de inducci
on no aporta nada) y n 6= 0.
Existe un principio de recursi
on fuerte an
alogo al principio de inducci
on
fuerte. Seg
un el principio de recursi
on, para definir una funci
on f : N A
por recurrencia basta especificar f (0) y c
omo puede calcularse f (n + 1) a partir
de f (n), es decir, basta imponer una relaci
on de la forma f (n+1) = g(f (n)) que
exprese f (n + 1) como una funci
on dada de f (n). Ahora vamos a probar que,
si queremos, podemos definir f (n) como funci
on de todos los valores previos
f (0), . . . , f (n 1) o, en otras palabras, que para definir f (n) podemos suponer
que f ya est
a definida sobre los n
umeros anteriores a n.

32

Captulo 1. El lenguaje de la teora de conjuntos

Enunciar esto con precisi


on requiere algunas definiciones previas. Recordemos que hemos definido In = {0, . . . , n 1} (en particular I0 = ). Vamos
a llamar A al conjunto10 de todas las aplicaciones h : In A, para alg
un
n N. Si f : N A, para cada n N definimos f |n = f |In A , as f |n es la
restricci
on de f a los n
umeros naturales menores que n. En particular f |0 = .
Principio de recursi
on fuerte Si A es un conjunto y g : A A, existe
una u
nica aplicaci
on f : N A tal que para todo n N se cumple que
f (n) = g(fn ).
Notemos que esto expresa lo que hemos indicado: que podemos definir f (n)
como una cierta funci
on de f |n , es decir, definir f suponiendo que f ya est
a
definida sobre los n
umeros menores que n.
n: Diremos que h es una aproximaci
Demostracio
on si existe un n N tal
). Veamos
que h : In A y para todo m n se cumple que h(m) = g(h|Im

que si m n y h : Im
A, h0 : In A son dos aproximaciones, entonces
= h, es decir, que ambas coinciden sobre la parte com
h0 |Im
un de su dominio.

En efecto, si no es as, existe un i Im


tal que h(i) 6= h0 (i). Podemos tomar
el mnimo n
umero natural en el que esto sucede, y entonces h|Ii = h0 |Ii , luego
h(i) = g(h|Ii ) = g(h0 |Ii ) = h0 (i), por definici
on de aproximaci
on, contradicci
on.

Ahora veamos que para cada m N existe una aproximaci


on h : Im
A.

Lo probamos por inducci


on sobre m. Para m = 0 es I0 = y basta tomar

h = . Si vale para m y tenemos una aproximaci


on h : Im
A, definimos
0

h : Im+1 A como la aplicaci


on que sobre Im coincide con h y adem
as

h0 (m) = g(h). Es claro que h0 es una aproximaci


on, pues si n Im
se cumple
que h0 (n) = h(n) = g(h|In ) = g(h0 |In ), y para n = m tenemos tambien que
).
h0 (m) = g(h) = g(h0 |Im

Ahora basta definir f : N A como f (n) = h(n), donde h es cualquier


aproximaci
on que tenga a n en su dominio. Hemos probado que no importa cu
al
elijamos, pues todas coinciden en la parte com
un de sus dominios. En particular
fn = h|In , luego se cumple que f (n) = h(n) = g(h|In ) = g(fn ), como queramos
probar.
La unicidad de f se debe a que si existiera otra f 0 : N A que cumpliera lo
mismo y f 0 6= f , entonces existira un n N tal que f (n) 6= f 0 (n), y podramos
tomar el menor n
umero natural que cumple esto, en cuyo caso f |n = f 0 |n , luego
f (n) = g(f |n ) = g(f 0 |n ) = f 0 (n), contradicci
on.
En la pr
actica nunca hay necesidad de explicitar cu
al es exactamente la
funci
on g que estamos considerando al aplicar el principio de recursi
on fuerte.
La idea es que podemos definir f (n) con cualquier criterio que involucre la
10 Notemos que A es un conjunto, pues si h : I A, entonces h I A N A,
n
n
luego f P(N A), luego podemos definir por especificaci
on

A = {h P(N A) | existe un n N tal que h : In A}.

1.6. Conjuntos finitos

33

restricci
on fn . Cualquier criterio explcito que asigne un elemento de a a una
funci
on fn que se supone definida podr
a plasmarse en una funci
on g adecuada.
En particular, puesto que en la definici
on de f (n) podemos hacer referencia a
fn , tambien podemos hacer referencia al dominio de fn , que es In , o bien el
m
aximo del dominio de fn , que es n. Esto nos da un principio de recursi
on
intermedio entre el que acabamos de demostrar y el que tenamos ya probado:
Para definir una funci
on f : N A podemos definir f (n + 1) en
funci
on de f (n) y de n.
Veamos un ejemplo de esta situaci
on:
Definici
on 1.20 Definimos la funci
on factorial N N, en la que la imagen
de un n
umero natural n se representa por n!, como la dada por las condiciones
0! = 1,

(n + 1)! = n! (n + 1).

De este modo
0! = 1,

1! = 1,

2! = 1 2,

3! = 1 2 3,

4! = 1 2 3 4,

...

y en general resumiremos la definici


on recurrente de n! mediante la expresi
on
con puntos suspensivos: n! = 1 2 n, con el convenio adicional de que 0! = 1.
Tecnicamente, esta definici
on no se ajusta a las condiciones de la versi
on
original del principio de recursi
on, porque no se define (n + 1)! como funci
on
u
nicamente de n!, sino de n! y de n, pero, por lo que acabamos de explicar, la
existencia y unicidad de la funci
on factorial s que est
a justificada por la versi
on
fuerte del principio de recursi
on.

1.6

Conjuntos finitos

Ya hemos observado que N es un conjunto infinito, pero no hemos introducido


ninguna definici
on formal que nos permita distinguir entre conjuntos finitos e
infinitos. Ahora estamos en condiciones de hacerlo. Para ello conviene introducir
un concepto general:
Definici
on 1.21 Diremos que dos conjuntos X e Y son equipotentes y lo representaremos por X Y , si existe una aplicaci
on f : X Y biyectiva.
Por ejemplo, los conjuntos A = {0, 1, 2} y C = {0, 2, 4} son equipotentes,
pues en la p
agina 15 se muestra una biyecci
on k : A C. Recordemos que
las biyecciones emparejan los elementos de un conjunto con los de otro, de
modo que cuando entre dos conjuntos se puede establecer una biyecci
on esto
se traduce en lo que normalmente expresamos diciendo que tienen el mismo

n
umero de elementos (en el ejemplo, A y C tienen ambos tres elementos). Esa
es la idea que vamos a explotar aqu. Antes demostramos unas propiedades
elementales:

34

Captulo 1. El lenguaje de la teora de conjuntos

Teorema 1.22 Se cumple:11


1. X X.
2. Si X Y , entonces Y X.
3. Si X Y e Y Z, entonces X Z.
n: 1) La identidad iX : X X es una aplicaci
Demostracio
on biyectiva
que prueba que todo conjunto es equipotente a s mismo.
2) Si X Y , existe f : X Y biyectiva, y es claro entonces que la
aplicaci
on inversa f 1 : Y X es biyectiva, luego Y X.
3) Por hip
otesis existen f : X Y y g : Y Z biyectivas, y es f
acil
comprobar entonces que f g : X Z es biyectiva.
La existencia de una aplicaci
on inyectiva f : A B se traduce en que
los objetos de A pueden emparejarse uno a uno con los de B, aunque pueden
sobrar objetos en B (que no sobren equivale a que f sea suprayectiva y, por
consiguiente, biyectiva). Por lo tanto, el teorema siguiente es intuitivamente
obvio, aunque una prueba formal requiere distinguir algunos casos:
Teorema 1.23 Para todo par de n
umeros naturales m y n, existe una aplicaci
on inyectiva f : Im In si y s
olo si m n.
n: Recordemos que In = {1, . . . , n}. Si m n, es claro que
Demostracio
Im In , por lo que la inclusi
on i : Im In es una aplicaci
on inyectiva.
Falta probar que si m > n no puede existir f : Im In inyectiva. De
no ser as, podemos tomar el menor n
umero natural m para el que existe una
aplicaci
on f : Im In inyectiva con n < m.
El conjunto In tiene que contener las im
agenes por f de los elementos de
Im , luego In 6= , luego n 6= 0. A su vez esto implica que m 6= 0. Digamos que
m = m0 + 1 y que n = n0 + 1.
Si n no tiene antiimagen por f , entonces f |Im0 : Im0 In0 inyectiva, y
n0 < m0 , con lo que m0 < m cumple la misma propiedad que m, cuando se
supona que m era el mnimo que la cumpla, contradicci
on.
Supongamos pues que existe un a Im tal que f (a) = n. Si a = m, sigue
siendo cierto que f |Im0 : Im0 In0 es inyectiva, pues al quitar m del dominio
de la aplicaci
on, ya no necesitamos a n en la imagen, y tenemos la misma
contradicci
on.
11 Quiz
a el lector piense que la equipotencia puede considerarse una relaci
on en el sentido
de la secci
on anterior, es decir, que podamos considerar que la relaci
on es el conjunto
E = {(X, Y ) | X Y }. Sin embargo, no existe tal conjunto E. La raz
on es que, S
si existiera,
todo S
conjunto
X cumplira que (X, X) = {{X}, S
{X,
S
SX}} E, luego {X} E, luego
X
E, luego podramos definir V = {X
E | X = X}, y sera el conjunto de

todos los conjuntos, que ya sabemos que lleva a una contradicci


on. Esta
es una de las pocas
ocasiones en las que rozaremos el abismo.

1.6. Conjuntos finitos


Supongamos, por u
ltimo, que a < m. Entonces f (m) = b In , con b 6= n, pues si
fuera b = n sera f (m) = f (a), luego m = a.
Por lo tanto b In0 . Esto nos permite definir
g : Im0 In0 como la aplicaci
on que coincide con f salvo que f (a) = b, que sigue siendo
inyectiva y nos lleva a la misma contradicci
on.

35
Im

In
m
n
f

a - - - - - - - - -

-
-- b
g

En particular, si Im In , tenemos aplicaciones biyectivas (luego inyectivas)


de uno en otro y viceversa, luego el teorema anterior nos da que m = n. Esto
justifica la definici
on siguiente:
Definici
on 1.24 Un conjunto X es finito si existe un n N tal que X In .
En tal caso n es u
nico y recibe el nombre de cardinal de X. Lo representaremos
por |X|. Los conjuntos que no son finitos se llaman infinitos.
El c
alculo del cardinal de un conjunto es lo que normalmente se llama contar. Por ejemplo, un conjunto A = {a, b, c}, donde a, b y c son distintos dos
a dos cumple |A| = 3, porque podemos definir f : I3 A biyectiva mediante
f (1) = a, f (2) = b, f (3) = c.
De este modo, por la propia definici
on vemos que |In | = n. En particular
|| = 0 y, de hecho, es el u
nico conjunto de cardinal 0.
El resultado fundamental sobre cardinales es el siguiente:
Teorema 1.25 Dos conjuntos finitos son equipotentes si y s
olo si tienen el
mismo cardinal. Todo conjunto equipotente a un conjunto finito es finito.
n: Si X es un conjunto finito y X Y , entonces existe un
Demostracio
n tal que In X Y , luego In Y , luego Y es finito y |Y | = |X| = n. Si
|X| = |Y | = n, entonces X In Y , luego X Y .
Otro hecho b
asico es el siguiente:
Teorema 1.26 Si X es un conjunto finito e Y X, entonces Y es finito,
|Y | |X| y se da la igualdad |Y | = |X| si y s
olo si Y = X.
n: Sea X un conjunto finito y supongamos que existe un
Demostracio
x X. Sea n = |X| y sea f : In X biyectiva. Notemos que n 6= 0, pues
estamos suponiendo que X 6= . Por lo tanto n = n0 + 1.
Podemos suponer que f (n) = x, pues si la antiimagen de x es un m < n,
podemos considerar la aplicaci
on g : In X que coincide con f salvo que
g(n) = f (m) y g(m) = f (n). Es f
acil ver que g sigue siendo biyectiva, pero as
se restringe a una biyecci
on In0 X \ {x}. Por lo tanto, X \ {x} es finito y
|X \ {x}| = |X| 1.
Pasemos ya a probar el enunciado, por inducci
on sobre |X|. Si |X| = 0
entonces X = , luego necesariamente Y = y |X| = |Y | = 0.

36

Captulo 1. El lenguaje de la teora de conjuntos

Si vale para conjuntos de cardinal n y |X| = n + 1, distinguimos dos casos:


si Y = X entonces trivialmente Y es finito y tiene el mismo cardinal que X. En
caso contrario existe un x X \ Y , con lo que Y X \ {x}, que seg
un hemos
probado es un conjunto finito de cardinal n. Por la hip
otesis de inducci
on Y es
finito y |Y | |X \ {x}| = n < n + 1 = |X|.
Por ejemplo, ahora podemos probar:
Teorema 1.27 N es infinito.
n: Si N fuera finito, tendra un cardinal n N, pero eso
Demostracio
es imposible, porque In+1 N y, seg
un el teorema anterior, se cumplira que
n + 1 = |In+1 | |N| = n, contradicci
on.
Para probar que un conjunto X tiene cardinal menor o igual que otro conjunto Y no hace falta que X Y , sino que basta con que exista una aplicaci
on
inyectiva de X en Y . M
as en general:
Teorema 1.28 Sea X 6= un conjunto arbitrario e Y un conjunto finito. Las
afirmaciones siguientes son equivalentes:12
1. X es finito y |X| |Y |.
2. Existe una aplicaci
on f : X Y inyectiva.
3. Existe una aplicaci
on g : Y X suprayectiva.
n: 1 2. Sea |X| = n, |Y | = m. Basta componer una
Demostracio
biyecci
on X In con la inclusi
on In Im con una biyecci
on Im Y . El
resultado es una aplicaci
on f : X Y inyectiva.
2 1. Tenemos que f [X] Y , luego f [X] es finito y |f [X]| |Y |. Adem
as
f : X f [X] biyectiva, luego X es finito y |X| = |f [X]| |Y |.
2 3. Fijemos x0 X y definimos g : Y X mediante
1
f (y) si y F [X],
g(y) =
x0
si y Y \ F [X].
Es inmediato comprobar que g es suprayectiva, pues cada x X tiene a f (x)
por antiimagen.
3 2. Sea |Y | = n y fijemos una aplicaci
on h : In Y biyectiva.
Entonces g 0 = h g : In X es suprayectiva. Sea f 0 : X In la aplicaci
on
dada por f 0 (x) = mn g 01 [x]. Es f
acil ver que es inyectiva, al igual que lo es
f = f 0 h : X Y .
Otro resultado notable sobre aplicaciones entre conjuntos finitos es el siguiente:
12 El hecho de que la negaci
on de 1 implique la negaci
on de 2 se conoce como principio
del palomar, pues se ilustra con este ejemplo: si en un palomar hay m
as palomos que nidos,
tiene que haber al menos un nido con m
as de un palomo (porque la aplicaci
on que a cada
palomo le asigna su nido no puede ser inyectiva).

1.6. Conjuntos finitos

37

Teorema 1.29 Sea f : X Y una aplicaci


on entre dos conjuntos finitos del
mismo cardinal. Entonces f es inyectiva si y s
olo si f es suprayectiva si y s
olo
si f es biyectiva.
n: Si f es inyectiva, entonces f : X f [X] biyectiva, luego
Demostracio
|f [X]| = |X| = |Y |, luego f [X] = Y por 1.26, luego f es suprayectiva.
Si f es suprayectiva pero no inyectiva, existen x, x0 X distintos tales que
f (x) = f (x0 ), pero entonces f |X\{x} : X \ {x} Y sigue siendo suprayectiva,
luego |Y | |X \ {x}| < |X| = |Y |, contradicci
on.

Hemos definido la suma de n


umeros naturales mediante una relaci
on recurrente que la caracteriza. Ahora podemos demostrar que la suma se corresponde
con la idea que todos tenemos de ella: m + n es el n
umero de cosas que tenemos
cuando juntamos m cosas a otras n cosas.
Teorema 1.30 Si X e Y son conjuntos finitos disjuntos, entonces X Y es
finito, y |X Y | = |X| + |Y |.
n: Sean f : Im X, g : In Y biyectivas. Entonces
Demostracio
podemos definir h : Im+n X Y mediante

f (u)
si 1 u m,
h(u) =
g(u m) si m + 1 u m + n.
Notemos que si m+1 u m+n, entonces 1 um n, luego um In . Es
f
acil ver que h es biyectiva, luego X Y es finito y |X Y | = m + n = |X| + |Y |.
Ahora probamos un resultado m
as general:
Teorema 1.31 Si X e Y son conjuntos finitos, entonces
|X Y | = |X| + |Y | |X Y |.
n: Basta tener en cuenta que X Y = X (Y \ (X Y )),
Demostracio
donde X e Y \ (X Y ) son disjuntos. Por el teorema anterior
|X Y | = |X| + |Y \ (X Y )|.
Por otra parte Y = (X Y ) (Y \ (X Y )) y los dos conjuntos son disjuntos,
luego nuevamente por el teorema anterior
|Y | = |X Y | + |Y \ (X Y )|.
Por lo tanto |Y \ (X Y )| = |Y | |X Y |, luego sustituyendo en la primera
ecuaci
on obtenemos la f
ormula del enunciado.
Ahora interpretamos el producto:
Teorema 1.32 Si X e Y son conjuntos finitos, entonces X Y es finito y
|X Y | = |X||Y |.

38

Captulo 1. El lenguaje de la teora de conjuntos

n: Lo probamos por inducci


Demostracio
on sobre |Y |. Si |Y | = 0 entonces
Y = , y es claro que X Y = , luego es finito y |X Y | = 0 = |X||Y |.
Si vale cuando |Y | = n y suponemos que |Y | = n + 1, tomamos y Y , de
modo que |Y \ {y}| = n, y por hip
otesis de inducci
on X (Y \ {y}) es finito y
|X (Y \ {y})| = |X| n. Ahora basta observar que
X Y = (X (Y \ {y}) (X {y}),
que la uni
on es disjunta y que X {y} X (a traves de la biyecci
on (x, y) 7 x),
luego X {y} es finito y |X {y}| = |X|. Por el teorema 1.30 concluimos que
X Y es finito y que
|X Y | = |X| n + |X| = |X|(n + 1) = |X||Y |.
Vamos a contar algunos conjuntos m
as. Observemos que si f : A B
entonces f A B, luego f P(A B). Por lo tanto, si definimos, por
especificaci
on,
B A = {f P(A B) | f : A B},
entonces B A es el conjunto de todas las aplicaciones de A en B. El que se
represente con esa notaci
on se debe al teorema siguiente:
Teorema 1.33 Si A y B son conjuntos finitos, entonces B A es un conjunto
finito y |B A | = |B||A| .
n: Por inducci
Demostracio
on sobre |A|. Si |A| = 0, entonces A = , y
tecnicamente existe una aplicaci
on de A en B, porque : B es cierto,
si nos ajustamos a la definici
on de aplicaci
on. Por lo tanto B A = {} y es un
A
0
conjunto finito de cardinal |B | = 1 = |B| = |B||A| .
Supongamos que el resultado es cierto cuando |A| = n y supongamos que
|A| = n + 1. Sea a A y sea A0 = A \ {a}, que es un conjunto finito de
0
0
cardinal n. Por hip
otesis de inducci
on B A es finito y |B A | = |B|n .
0

Definimos f : B A B A B mediante f (g) = (g|A0 , g(a)). Es f


acil ver
0
que f es biyectiva. Por lo tanto B A B A B, y el teorema anterior nos da
0
que B A es finito y |B A | = |B A ||B| = |B|n |B| = |B|n+1 = |B||A| .
Teorema 1.34 Si X es un conjunto finito, PX es finito y |PX| = 2|X| .
n: Basta observar que f : {0, 1}X PX definida por
Demostracio
1
f (g) = g [1] es biyectiva, y luego aplicar el teorema anterior.
Terminamos con otra propiedad importante de los conjuntos finitos:
Teorema 1.35 Si A es un conjunto finito no vaco y es cualquier relaci
on
de orden total sobre A, entonces A tiene m
aximo y mnimo elemento.

1.7. Productos cartesianos

39

n: Sea |A| = n > 0 y sea f : A In biyectiva. SuponDemostracio


gamos que A no tiene m
aximo elemento (para el caso del mnimo se razona
an
alogamente). Eso significa que, para todo x A, existe un y A tal que
x < y. De entre todos los y que cumplen esto, podemos elegir aquel para el que
f (y) es mnimo. Esto nos da un criterio para definir una aplicaci
on g : A A
con la propiedad de que x < g(x), para todo x A. Podemos aplicar el principio
de recursi
on, que nos da una aplicaci
on h : N A tal que h(0) es cualquier
elemento prefijado de A y h(n + 1) = g(h(n)).
Observemos que si m < n, entonces h(m) < h(n). En efecto, lo razonamos
por inducci
on sobre n. Si n = 0 no se cumple m < 0, luego la implicaci
on
se cumple trivialmente. Si vale para n y suponemos que m < n + 1, entonces
m n. Si m = n entonces h(m) < g(h(m)) = h(m + 1) = h(n + 1), como haba
que probar, y si m < n entonces por hip
otesis de inducci
on
h(m) < h(n) < g(h(n)) = h(n + 1)
y concluimos igualmente. Pero esto significa que h es inyectiva, con lo que
podemos afirmar que N es finito, y as tenemos una contradicci
on.
En particular, si A N no es vaco y consideramos en A el orden usual de
los n
umeros naturales, sabemos que A tiene mnimo elemento, y ahora podemos
afirmar que tiene m
aximo si y s
olo si es finito, pues si es finito tiene m
aximo
por el teorema anterior, y si tiene m
aximo m, entonces A Im {0}, luego es
finito.

1.7

Productos cartesianos

Hemos definido los conceptos de par ordenado y de producto cartesiano de


dos conjuntos, pero conviene dar una definici
on alternativa que se generalice
f
acilmente a familias de m
as de dos conjuntos. Para ello conviene introducir
antes algunos convenios de notaci
on muy habituales:
A veces, en lugar de expresar mediante X : I A que X es una aplicaci
on
de un conjunto I en otro conjunto A, escribiremos {Xi }iI , y escribiremos Xi
en lugar de X(i).
Cuando empleamos esta notaci
on tenemos que distinguir entre {Xi }iI , que
es una aplicaci
on, y {Xi | i I} = X[I], que es el conjunto formado por todos
los conjuntos Xi , es decir, la imagen de la aplicaci
on.
En el caso particular en que I = In es frecuente usar notaciones alternativas,
como {Xi }ni=1 o (Xi )ni=1 o incluso, con puntos suspensivos: (X1 , . . . , Xn ). Los
objetos de esta forma se llaman n-tuplas de conjuntos13 . En definitiva, lo que
estamos diciendo es que el objeto representado por (X1 , . . . , Xn ) o por {Xi }ni=1
no es m
as que una aplicaci
on con dominio In y rango en un conjunto que no
especificamos, que a cada n
umero i le asigna una imagen X(i) = Xi .
13 para n = 2 son pares, para n = 3 son ternas, para n = 4 son cu
adruplas, para n = 5
quntuplas y, en general, n-tuplas.

40

Captulo 1. El lenguaje de la teora de conjuntos

Por ejemplo, la quntupla x = (4, 5, 5, 2, 0) es una aplicaci


on x : I5 N tal
que x1 = 4, x2 = 5, x3 = 5, x4 = 2, x5 = 0. Tecnicamente es el conjunto
x = {(1, 4), (2, 5), (3, 5), (4, 2), (5, 0)},
pero no ganamos nada represent
andolo as.
Volviendo al caso general, a menudo se dice que {Xi }iI es una familia14
(indexada) de conjuntos. Recordemos que X : I B, para cierto conjunto B.
Entonces definimos el producto cartesiano de {Xi }iI como el conjunto
Q
S
Xi = {x ( B)I | para cada i I se cumple x(i) Xi }.
iI

Con la notaci
on que estamos introduciendo, los elementos x

Xi son de

iI

la forma x = {xi }iI = (xi )iI , es decir, familias de conjuntos (que son como
n-tuplas generalizadas, no necesariamente finitas) tales que xi Xi .
En el caso particular en que todos los conjuntos Xi coinciden con un mismo
conjunto X, entonces el producto cartesiano coincide con el conjunto que ya
hemos definido como X I , es decir, el conjunto de todas las aplicaciones de I
en X. Sin embargo, con la notaci
on que estamos introduciendo, cada x X I
lo representaremos de la forma x = (xi )iI .
En el caso de una familia {Xi }ni=1 (es decir, cuando I = In ), representaremos
tambien el producto cartesiano con las notaciones alternativas
n
Q
Xi = X1 Xn ,
i=1

y sus elementos son las n-tuplas (x1 , . . . , xn ) tales que xi Xi .

En el caso de los productos con I = In y con todos los factores iguales a un


mismo conjunto X, escribiremos
n

X =

n
Q

i=1

n veces

z
}|
{
X = X X,

cuyos elementos son n-tuplas (x1 , . . . , xn ) con cada xi X.

De este modo, ahora tenemos dos interpretaciones posibles de (3, 5) NN.


Podemos considerar que N N es el producto cartesiano definido originalmente,
en cuyo caso (3, 5) = {{3}, {3, 5}}, o bien que es el que acabamos de definir,
14 Tambi
en es frecuente llamar familias (no indexadas) de conjuntos a cualquier conjunto
cuyos elementos sean conjuntos. Seg
un los convenios que estamos adoptando todos los conjuntos est
an formados por conjuntos, por lo que la diferencia entre un conjunto y una familia
de conjuntos es puramente psicol
ogica: al decir familia de conjuntos estamos indicando que
nos interesa ver a sus elementos como conjuntos. Por ejemplo, nadie llama a N familia de
conjuntos, porque, aunque los n
umeros naturales son conjuntos, eso es algo que en la pr
actica
se olvida, mientras que PN s se considera una familia de conjuntos, porque sus elementos,
no s
olo son conjuntos, sino que adem
as se conciben como tales.

1.7. Productos cartesianos

41

en cuyo caso (3, 5) = {(1, 3), (2, 5)}. Sin embargo, resulta totalmente irrelevante si nos referimos a uno o a otro, pues la naturaleza conjuntista del par
(3, 5) no tiene importancia. Lo u
nico que importa es que (3, 5) es un conjunto
que determina unvocamente una primera componente 3 y una segunda componente 5. Podemos adoptar el convenio de que, a partir de ahora, todos los
productos cartesianos que consideremos lo son en el nuevo sentido que acabamos
de introducir, pero eso no tiene ninguna traducci
on sensible en la pr
actica.
Notemos que A1 es casi lo mismo que A, pero no exactamente. Est
a formado
por todas las aplicaciones de {1} en A, luego A1 = {{(1, a)} | a A}. As la
aplicaci
on A A1 dada por a 7 (1, a) es biyectiva y hace que todo lo que
digamos para A tenga una traducci
on obvia a A1 y viceversa.
Q
En general, cada producto cartesiano
Xi tiene asociadas las proyecciones,
iI
Q
que son las aplicaciones pi :
Xi Xi dadas por pi (x) = xi . Claramente son
iI
suprayectivas.
Terminamos esta secci
on con algunos resultados de combinatoria15 :
Si {Xi }iI es una familia de conjuntos, podemos definir
S
S
T
T
Xi = {Xi | i I},
Xi = {Xi | i I}
iI

iI

(la segunda definici


on requiere que I 6= ). Cuando I = In usaremos tambien
las notaciones alternativas
n
S

i=1

Xi = X1 Xn ,

n
T

i=1

Xi = X1 Xn .

Teorema 1.36 Toda uni


on finita de conjuntos finitos es finita.
n: Por inducci
Demostracio
on sobre el n
umero de conjuntos que unimos.
Si tenemos una familia {Xi }1i=1 , entonces la uni
on es X1 que es finito por
hip
otesis. Si vale para uniones de n conjuntos, entonces
n+1
S
i=1

Xi =

n
S

i=1

Xi Xn+1 ,

que es una uni


on de dos conjuntos finitos, el primero por hip
otesis de inducci
on
y el segundo por hip
otesis. Por lo tanto, es finita.
Similarmente se prueba que todo producto cartesiano de un n
umero finito
de conjuntos finitos es finito.
Definici
on 1.37 Si A es un conjunto, llamaremos A AA al conjunto de
todas las aplicaciones f : A A biyectivas.
Ya hemos probado que si A es un conjunto finito con |A| = n, entonces
|AA | = nn . Ahora vamos a calcular el cardinal de A .
15 Se

llama combinatoria al c
alculo de cardinales de conjuntos finitos.

42

Captulo 1. El lenguaje de la teora de conjuntos

Teorema 1.38 Si A es un conjunto finito y |A| = n, entonces |A | = n!


n: Si f : A B es biyectiva, podemos definir una apliDemostracio
caci
on F : A B biyectiva mediante F (x) = f 1 x f , por lo que
|A | = |B |. Esto hace que no perdamos generalidad si suponemos A = In .
Escribiremos n en lugar de In .
Notemos que n es el conjunto de todas las n-tuplas (m1 , . . . , mn ) cuyas
componentes son distintas dos a dos.
Ahora observamos que podemos definir H : n+1 In+1 n como la
aplicaci
on que a cada n+1-tupla (m1 , . . . , mn+1 ) con mi = n + 1 le asigna el par
formado por i como primera componente y la n-tupla que resulta de suprimir mi
en (m1 , . . . , mn+1 ). Una comprobaci
on rutinaria muestra que H es biyectiva,
luego |n+1 | = |In+1 n | = (n + 1)|n |.
Ahora basta razonar que |n | = n! por inducci
on. Si n = 0 entonces, por
las sutilezas de la l
ogica, es 0 = {}, luego |0 | = 1 = 0! Si se cumple para n,
entonces |n+1 | = |n |(n + 1) = n!(n + 1) = (n + 1)!

1.8

Relaciones de equivalencia

Terminamos este captulo introduciendo otro concepto conjuntista b


asico,
que hasta ahora no hemos necesitado, pero que aparecer
a constantemente en
los temas siguientes.
Definici
on 1.39 Una relaci
on de equivalencia en un conjunto A es una relaci
on
R en A que es reflexiva, simetrica y transitiva.
Recordemos que, explcitamente esto significa que todo a A cumple a R a,
si a R b entonces tambien b R a y si a R b y b R c entonces a R c.
Ejemplo Consideremos X = {1, 2, 3}, A = PX y R la relaci
on en A dada por
U RV

si y s
olo si

|U | = |V |.

Es inmediato que se trata de una relaci


on de equivalencia, pues todo conjunto
tiene el mismo cardinal que el mismo, si U tiene el mismo cardinal que V
entonces V tiene el mismo cardinal que U , y si U tiene el mismo cardinal que V
y V tiene el mismo cardinal que W entonces U tiene el mismo cardinal que W .
El diagrama siguiente nos permite formarnos una imagen de la relaci
on:
{1}

{1, 2}
{2}

{3}

{1, 3}
{2, 3}

{1, 2, 3}

1.8. Relaciones de equivalencia

43

Cada flecha a b indica que a R b. El hecho de que la relaci


on sea reflexiva
se traduce en que cada elemento tiene una flecha en forma de rizo, el hecho de
que sea simetrica se traduce en que todas las flechas son dobles , y el hecho
de que sea transitiva se traduce en que los ocho elementos de A se agrupan en
bloques totalmente conectados. Esos bloques son las clases de equivalencia que
vamos a definir a continuaci
on.
Definici
on 1.40 Sea R una relaci
on de equivalencia en un conjunto A. Para
cada a A la clase de equivalencia de a es el conjunto
[a]R = {x A | x R a}
de todos los elementos de A relacionados con a. El conjunto de todas las clases
de equivalencia16 de A respecto de R se llama conjunto cociente y se representa
por A/R. La aplicaci
on p : A A/R dada por p(a) = [A]R se llama proyecci
on
can
onica y claramente es suprayectiva.
As, en el ejemplo precedente vemos que hay cuatro clases de equivalencia,
por lo que el cociente A/R tiene cuatro elementos, uno correspondiente a cada
cardinal posible de un subconjunto de X. Tambien podemos constatar en el los
hechos generales que recoge el teorema siguiente:
Teorema 1.41 Sea R una relaci
on de equivalencia en un conjunto A.
1. Si a A, entonces a [a]R .
2. Si a, b A, entonces a R b si y s
olo si [a]R = [b]R .
3. Si a, b A, entonces no a R b si y s
olo si [a]R [b]R = .
Por lo tanto, A/R es una partici
on de A, es decir, una familia de subconjuntos de A no vacos y disjuntos dos a dos cuya uni
on es A.
n: 1) es inmediato, porque a R a.
Demostracio
2) Si a R b, probamos la igualdad de sus clases por doble inclusi
on: si se
cumple x [a]R , entonces x R a, luego x R b por transitividad, luego a [b]R .
La otra inclusi
on se prueba igual, teniendo en cuenta que b R a por simetra.
Recprocamente, si [a]R = [b]R , entonces a [a]R = [b]R , luego a R b.
3) Si [a]R [b]R 6= , existe x [a]R [b]R , luego x R a y x R b, luego por
simetra y transitividad a R b. Recprocamente, si a R b, entonces a [a]R [b]R ,
luego [a]R [b]R 6= .

La notaci
on [a]R que hemos introducido para las clases de equivalencia es
generica, pero a menudo introduciremos notaci
on especfica para cada relaci
on
que consideremos.
16 Notemos

que dicho conjunto se puede definir por especificaci


on, pues se trata de
A/R = {X PA | existe un a A tal que X = [a]R }.

44

Captulo 1. El lenguaje de la teora de conjuntos

La idea subyacente al concepto de clases de equivalencia y conjunto cociente


es que formalizan un proceso de abstracci
on: si en un conjunto de bolas de
colores consideramos la relaci
on de equivalencia ser del mismo color, cada
clase de equivalencia contendr
a a las bolas de un mismo color, y el conjunto
cociente tendr
a un elemento por cada color que puedan tener las bolas, igual
que en el ejemplo anterior el cociente tena un elemento por cada cardinal posible
que pueden tener los conjuntos considerados.

Captulo II

Anillos
Sin duda el lector estar
a familiarizado con numerosas propiedades y reglas
de operaci
on que involucran sumas, productos, cocientes, desigualdades, valores
absolutos, etc. A lo largo de este libro nos vamos a encontrar diversos contextos
en los que unas mismas reglas de operaci
on son v
alidas, y para no tener que
justificarlas individualmente en cada caso, es u
til axiomatizarlas, es decir, fijar
como axiomas unas propiedades b
asicas de modo que, si comprobamos que
son aplicables en un contexto dado, autom
aticamente son v
alidas tambien las
numerosas consecuencias derivables de dichos axiomas. Esto lleva al concepto
de anillo o m
as en general, al de estructura algebraica, que es un conjunto
dotado de ciertas funciones y/o relaciones que satisfacen ciertos axiomas. En
el captulo anterior ya nos hemos encontrado con una de ellas, la de conjunto
ordenado, que hemos definido como un par (A, ) formado por un conjunto
A y una relaci
on de orden en A. En este captulo introduciremos algunas m
as
(esencialmente las relacionadas con la estructura de anillo), aunque m
as adelante
tendremos ocasi
on de introducir y estudiar otras m
as.

2.1

Leyes de composici
on interna

El primer paso en la direcci


on que nos acabamos de marcar es dar una
definici
on general de operaci
on en un conjunto, que generalice a la suma y
el producto de n
umeros naturales, que son las u
nicas operaciones que hemos
introducido hasta ahora.
Definici
on 2.1 Una ley de composici
on interna o una operaci
on interna en un
conjunto A es una aplicaci
on : A A A. En la pr
actica, en lugar de
escribir ((a, b)) para representar la imagen del par (a, b) por la aplicaci
on ,
usaremos la notaci
on a b.
En definitiva, una ley de composici
on interna en un conjunto A es cualquier
criterio que nos permita operar dos cualesquiera de sus elementos a y b para
obtener un nuevo elemento a b de A.
45

46

Captulo 2. Anillos

Al final de la secci
on 1.4 hemos introducido la suma y el producto de n
umeros
naturales. Tecnicamente, hemos definido la suma m + n como fm (n), donde
fm : N N es una funci
on definida por recurrencia en terminos de m. Ahora
podemos definir + como la aplicaci
on que a cada par (m, n) N N le asigna
esta suma m+n, y as + pasa a tener un significado aut
onomo, concretamente
el de una ley de composici
on interna en N. Lo mismo se aplica al producto.
Veamos algunas definiciones generales. Fijemos un conjunto A con una ley
de composici
on interna .
1. Se dice que es asociativa si cumple
(a b) c = a (b c),
para todos los elementos a, b, c A.
2. Se dice que es conmutativa si cumple ab = ba para todos los elementos
a, b A.
3. Un elemento neutro para es un elemento e A tal que a e = e a = a,
para todo a A.

Observemos que una operaci


on no puede tener m
as de un elemento
neutro, pues si tiene dos, digamos e y e0 , de la definici
on se sigue que
e = e e0 = e0 .

4. Si A tiene elemento neutro e, un elemento opuesto para un a A es un


b A tal que a b = b a = e.
De todas las propiedades que puede tener una ley de composici
on interna, la
asociativa va a ser para nosotros irrenunciable, es decir, no vamos a estudiar
ninguna operaci
on que no la posea. Esto nos lleva a introducir una de las
estructuras algebraicas m
as elementales:
Definici
on 2.2 Un semigrupo es un par (A, ), donde A es un conjunto y es
una ley de composici
on interna en A que cumple la propiedad asociativa. Si
adem
as cumple la propiedad conmutativa diremos que (A, ) es un semigrupo
conmutativo.
As, estudiar los semigrupos es estudiar las propiedades disponibles siempre
que contemos con una ley asociativa, sea esta cual sea.
Por ejemplo, una propiedad elemental es que si (A, ) es un semigrupo con
elemento neutro e y a A tiene inverso, entonces dicho inverso es u
nico. En
efecto, si tiene dos inversos b y b0 , se cumple que
b = b e = b (a b0 ) = (b a) b0 = e b0 = b0 .
Vamos a introducir dos convenios habituales de notaci
on para las leyes de
composici
on interna:

2.1. Leyes de composici


on interna

47

Notaci
on multiplicativa Usaremos para representar cualquier ley de composici
on interna asociativa en un conjunto dado A. En tal caso, si la operaci
on
tiene elemento neutro, lo representaremos por 1, y si un a A tiene elemento
opuesto, lo representaremos por a1 y lo llamaremos tambien elemento inverso.
Notaci
on aditiva Usaremos + para representar cualquier ley de composici
on
interna asociativa y conmutativa en un conjunto dado A. En tal caso, si la
operaci
on tiene elemento neutro, lo representaremos por 0, y si un a A tiene
elemento opuesto, lo representaremos por a y lo llamaremos tambien elemento
simetrico. Tambien adoptaremos el convenio de escribir ab en lugar de a+(b).
Hay que entender que la notaci
on multiplicativa la aplicaremos tanto para
leyes conmutativas como no conmutativas, mientras que la notaci
on aditiva s
olo
la usaremos para leyes conmutativas.
Otro convenio habitual es el de omitir las leyes de composici
on (u otras relaciones o funciones asociadas) al nombrar una estructura algebraica, tal y como
ya hemos establecido para el caso de los conjuntos ordenados. As, hablaremos
de un semigrupo A en lugar de escribir (A, ) o (A, +), dejando al contexto si
usamos la notaci
on aditiva o multiplicativa. En otras palabras, cuando decimos
que A es un semigrupo, hay que entender que en realidad nos estamos refiriendo
a un par (A, +) o (A, ).
Veamos otro ejemplo en el que difieren las notaciones multiplicativa y aditiva:
para cada a A en un semigrupo con elemento neutro y cada n N podemos
definir an (si la notaci
on es multiplicativa) o na (si es aditiva) mediante las
relaciones recurrentes:
a0 = 1,

an+1 = an a,

0 a = 0,

(n + 1)a = na + a.

Notemos que no hemos definido dos operaciones, sino una sola, escrita con
dos notaciones distintas. Dejamos como ejercicio demostrar por inducci
on sus
propiedades b
asicas que expresamos con notaci
on multiplicativa y traducirlas a notaci
on aditiva.
am+n = am an ,

(am )n = amn ,

(ab)n = an bn .

La tercera s
olo es v
alida si ab = ba (de donde, por inducci
on, se prueba como
paso previo que bn a = abn ).
Tambien conviene observar que al particularizar estas definiciones a los semigrupos (N, +) y (N, ) obtenemos las definiciones usuales de producto y exponenciaci
on de n
umeros naturales.
Una potencia an es el resultado de multiplicar a por s mismo n veces. Ahora
vamos a definir el producto de n elementos de un semigrupo, no necesariamente
iguales entre s.

48

Captulo 2. Anillos

Definici
on 2.3 Sea (A, ) un semigrupo con elemento neutro y sea {ai }ni=0 una
sucesi
on de elementos de A. Definimos por recurrencia,1
Q
Q
Q
ai = 1,
ai = ( ai ) aj ,
i<0

i<j+1

i<j

para j n, de modo que en particular tenemos definido el producto finito de


los elementos dados:
n
Q
Q
a0 an =
ai =
ai .
i=0

i<n+1

Esta
es la notaci
on que usaremos cuando empleemos la notaci
on multiplicativa
en
el
semigrupo.
Si
usamos
notaci
o
n
aditiva
usaremos
el
signo
de sumatorio
P
, es decir, la definici
on anterior se traduce a
P

ai = 0,

i<0

ai =

i<j+1

y en particular a1 + + an =

n
P

ai =

i=0

j
P

ai + aj ,

i<j

ai .

i<n+1

Hemos definido productos y sumas finitas con ndices que empiezan en 0,


pero podemos partir de cualquier n
umero natural si definimos:
n
Q

ai =

i=m

nm
Q

am+i ,

i=0

para m n,

y an
alogamente con notaci
on aditiva.
Las sumas y productos finitos definidos de este modo satisfacen una serie de
propiedades obvias, como que se pueden partir por cualquier punto 0 i n:
a0 an = (a0 ai )(ai+1 an ).
Desde un punto de vista tecnico, estas obviedades se traducen en una serie
de tediosos argumentos rutinarios por inducci
on que el lector puede consultar
en el apendice al final de este captulo si est
a interesado en ellos.
Veamos una aplicaci
on de las sumas finitas:
Teorema 2.4 Si k > 1 es un n
umero natural, para cada m N no nulo existe
una u
nica sucesi
on {ci }ni=0 de n
umeros menores que k tal que cn 6= 0 y
m=

n
P

ci ki .

i=0
1 T
ecnicamente estamos aplicando el teorema de recursi
on de este modo: definimos una
funci
on f : N A mediante f (i) = ai si i n y f (i) = 1 en otro caso. A su vez, definimos
g : N A mediante g(0) = 1 y g(j + 1) = g(j) f (j), de modo que g(j + 1) se define como

funci
on de g(j) y de j. Finalmente,

n
Q

i=0

ai = g(n + 1).

2.1. Leyes de composici


on interna

49

n: Observemos en primer lugar que m < km . En efecto, para


Demostracio
m = 0, 1 es inmediato, y si vale para m 1, entonces
m + 1 m + m = 2m < k km = km+1 .

Por lo tanto, hay un mnimo n m tal que m < kn . No puede ser n = 0,


pues entonces sera m = 0, luego n = n + 1 y se cumple kn m < kn+1 .
Observemos que la unicidad de n implica la de n, es decir, hemos probado que
para todo natural m > 0 existe un u
nico natural n tal que kn m < kn+1 .
Llamaremos o(m) a este u
nico n.
Si dividimos m = kn c + m0 , con m0 < kn , tiene que ser c < k, ya que si
fuera c k, tendramos m kn k = kn+1 . Adem
as c > 0, o de lo contrario
m = m0 < kn . As pues, todo n
umero natural m > 0 puede expresarse en la
forma
m = ckn + m0 ,
0 < c < k,
m0 < kn m.
Observemos que esta expresi
on es u
nica, pues necesariamente n = o(m) (ya
que m < (k 1)kn + kn = kkn = kn+1 ) y entonces c y m0 est
an unvocamente
determinados como cociente y resto de la divisi
on eucldea. Vamos a probar
que todo natural m no nulo admite una descomposici
on como la que indica el
enunciado con n = o(m).
Razonamos por inducci
on sobre m. Supuesto cierto para todo m0 < m,
consideramos la expresi
on m = ckn + m0 . Si m0 = 0 entonces m = ckn ya tiene
la forma deseada. En caso contrario, por hip
otesis de inducci
on
m0 =

n0
P

ci ki ,

i=0

donde n0 = o(m0 ) < n (porque m0 < kn ) y, definiendo ci = 0 para n0 < i < n y


cn = c, tenemos que
m=

n0
P

i=0

ci ki +

n1
P

i=n0 +1

ci ki + cn kn =

n
P

ci ki .

i=0

Para probar la unicidad observamos que


kn

n
P

ci ki < kn+1 .

i=0

En efecto, la primera desigualdad se sigue de que cn 6= 0 separando el u


ltimo
sumando, y la segunda se prueba por inducci
on sobre n. Si vale para n, entonces
n+1
P
i=0

ci ki =

n
P

i=0

ci ki + cn+1 kn+1 < kn+1 + (k 1)kn+1 = kn+2 .

Por lo tanto, razonando por inducci


on sobre m, si tenemos dos descomposiciones
n
n0
P
P
m=
ci ki =
c0i ki
i=0

i=0

50

Captulo 2. Anillos

en las condiciones del enunciado, necesariamente n = n0 = o(n), con lo que, por


la unicidad de la descomposici
on
cn kn +

n1
P
i=0

ci ki = c0n kn +

n1
P
i=0

c0i ki

(notemos que hemos probado que los segundos sumandos son < kn ), tenemos
que cn = c0n y
n1
n1
P
P 0 i
ci ki =
ci k .
i=0

i=0

Llamamos n
yn
0 a los m
aximos naturales tales que cn 6= 0 y c0n 0 6= 0, respectivamente, de modo que
n

i=0

ci ki =

n
0
P

i=0

c0i ki .

Por hip
otesis de inducci
on n
=n
0 y ci = c0i para todo i < n
, lo que implica que
0
las dos sucesiones {ci }in y {ci }in son iguales.
Definici
on 2.5 La sucesi
on {ci }in dada por el teorema anterior se llama representaci
on en base k del n
umero m. Es habitual usar la notaci
on
cn c0(k) =

n
P

ci ki .

i=0

Por ejemplo, 232(5) = 252 +35+2. Observemos que, en general, k = 1k+0,


por lo que la representaci
on de k en base k es k = 10(k) .
Sin m
as raz
on de peso que el hecho de que el n
umero de dedos que tenemos
en las manos, cuando no se especifica la base se entiende que es k = 9 + 1, de
modo que la notaci
on usual para este valor de k es k = 10. As pues, convenimos
en que
n
P
cn c0 =
ci 10i .
i=0

De este modo, todo n


umero natural tiene un nombre can
onico en terminos de
las diez cifras 0, . . . , 9, aunque la elecci
on del n
umero 10 es puramente arbitraria.
En principio, la menor base admisible es k = 2, de modo que, por ejemplo,
10 = 23 + 2 = 1010(2) . Por lo tanto, todo n
umero natural admite un nombre
can
onico en terminos u
nicamente de las cifras 0 y 1.
Con este resultado tenemos ya justificados todos los resultados de la aritmetica elemental (la que conocen los ni
nos), salvo que no vamos a describir aqu
los algoritmos sobradamente conocidos para sumar, restar, multiplicar y dividir
n
umeros naturales a traves de sus desarrollos decimales.

2.2. Los n
umeros enteros

2.2

51

Los n
umeros enteros

Los n
umeros naturales y su aritmetica tienen una interpretaci
on geometrica
intuitiva. Podemos visualizarlos como puntos equidistantes en una recta:


0
1
2
3
4
5
6
7
8
9
10
De este modo la relaci
on de orden m < n se interpreta como m est
a a la
izquierda de n, sumar 2 + 3 se interpreta como situarse en el punto asignado
al 2 y desplazarse 3 lugares hacia la derecha, mientras que restar 5 3 consiste
en situarse sobre el 5 y desplazarse tres lugares hacia la izquierda. El hecho de
que no se pueda restar 5 7 se interpreta como que no podemos desplazarnos 7
lugares a la izquierda del 5 sin salirnos de los puntos asignados a los n
umeros
naturales.
Ahora vamos a introducir los n
umeros enteros, que extienden a los n
umeros
naturales de modo que la figura anterior se completa hasta:


5
4
3
2
1
0
1
2
3
4
5
Sumar dos n
umeros enteros se interpreta como partir del punto asignado al
primero y desplazarse tantos lugares como indica el segundo hacia la derecha si
este es positivo o hacia la izquierda si es negativo. Este paso de los n
umeros
naturales a los enteros tiene interes por muchas razones. Se
nalamos algunas:
Desde un punto de vista puramente algebraico, obtenemos una estructura
m
as rica. Concretamente, todo n
umero entero tiene un opuesto para la
suma, cosa que no le sucede a ning
un n
umero natural, salvo el 0.
Esto tiene a su vez consecuencias aritmeticas. Por ejemplo, si tratamos
u
nicamente con n
umeros naturales y tenemos una igualdad a + b = c + d,
no podemos pasar a a c = d b a menos que tengamos la garanta de que
a c y d b, lo cual no tiene por que suceder a priori y puede obligarnos
a descomponer el razonamiento en varios casos. En cambio, si trabajamos
con n
umeros enteros un paso as siempre es v
alido.
Por otra parte, aunque es todava un ejemplo muy elemental, es un primer
paso hacia la conceptualizaci
on abstracta de la aritmetica. Para alguien
que s
olo conozca los n
umeros naturales, la suma y la resta son dos operaciones distintas, consistentes en moverse en sentidos opuestos, en a
nadir
en un caso y en sustraer en otro. Sin embargo, para quien concibe a los
n
umeros naturales como una parte de los n
umeros enteros, una resta mn
es lo mismo que la suma m+(n). Los n
umeros enteros permiten concebir
como una misma cosa lo que parecan ser dos cosas bastante diferentes.
Por u
ltimo, de cara a las aplicaciones geometricas, se trata de un paso
m
as en el camino que nos llevar
a a asignar un n
umero a cada punto de
una recta, lo cual a su vez permite traducir a terminos algebraicos los
problemas geometricos.

52

Captulo 2. Anillos

Aunque sin duda el lector tendr


a un concepto claro de los n
umeros enteros
y su aritmetica, ahora debemos concretar tecnicamente esa idea en terminos de
conjuntos, es decir, hemos de definir los n
umeros enteros como unos conjuntos
adecuados, al igual que hemos hecho con los n
umeros naturales. Una forma
r
apida de hacerlo sera definir, por ejemplo, los enteros no negativos como los
de la forma (0, n), con n N, y los enteros negativos como los de la forma (1, n),
con n N no nulo. En estos terminos el entero 5 sera el par (0, 5), mientras
que 5 sera el par (1, 5). Sin embargo, aunque r
apido, no es un criterio muy
pr
actico, porque para definir la suma de n
umeros enteros en estos terminos y
demostrar sus propiedades b
asicas tendramos que distinguir tediosamente casos
y m
as casos. Hay una forma mucho m
as elegante de construir un conjunto que
podamos tomar razonablemente como el conjunto de los n
umeros enteros.
La idea es que cada n
umero entero puede expresarse como resta de dos
n
umeros naturales. Por ejemplo, 5 = 7 2 y 5 = 2 7. En general, cada par
(m, n) NN determina el n
umero enero mn (que a
un no tenemos definido),
pero podemos pensar de definir el n
umero entero m n precisamente como el
par (m, n). Entonces el conjunto de los n
umeros enteros sera tecnicamente
N N, aunque al final nos olvid
aramos de ello.
Sin embargo, esto no es viable literalmente, porque pares como (2, 7) y
(10, 15) deben ser el mismo n
umero entero 5, y dos cosas distintas no pueden
ser la misma cosa. Este problema ontol
ogico se resuelve mediante un procedimiento que nos aparecer
a de forma recurrente en muchos contextos: cuando
queremos definir un objeto como abstracci
on de una propiedad com
un de
varios de ellos en este caso queremos abstraer de cada par (m, n) la resta
que determina definimos la relaci
on de equivalencia que relaciona a dos objetos si y s
olo si deberan representar al mismo objeto y formamos el conjunto
cociente.
En nuestro caso, si nos preguntamos cu
ando dos pares (a, b) y (c, d) de
n
umeros naturales deberan dar lugar a la misma resta a b = c d, la
respuesta es cuando a + d = b + c. Lo importante es que esta u
ltima condici
on
es una igualdad entre n
umeros naturales que, al contrario que a b = c d, no
involucra ning
un concepto que no tengamos ya definido. En conclusi
on:
Definici
on 2.6 Definimos en N N la relaci
on de equivalencia dada por
(a, b) R (c, d)

si y s
olo si

a + d = b + c.

Llamaremos conjunto de los n


umeros enteros al cociente Z = (N N)/R. La Z
es por el alem
an Zahl (n
umero).
La comprobaci
on de que la relaci
on R es de equivalencia no ofrece ninguna dificultad. Por ejemplo, la transitividad se debe a que si (a, b) R (c, d) y
(c, d) R (e, f ), entonces
a + d = b + c,

c + f = d + e,

luego sumando miembro a miembro a + d + c + f = b + c + d + e y, simplificando,


a + f = b + e, luego (a, b) R (e, f ).

2.2. Los n
umeros enteros

53

De momento representaremos por [a, b] la clase de equivalencia de par (a, b),


si bien enseguida encontraremos una notaci
on m
as conveniente. En principio,
como caso particular de 1.41, sabemos que [a, b] = [c, d] si y s
olo si a + d = b + c.
Si n N, definimos
+n = [n, 0] Z,

n = [0, n] Z

Llamaremos n
umeros enteros positivos y negativos, respectivamente, a los elementos de los conjuntos
Z+ = {+n | n N, n > 0},

Z = {n | n N, n > 0},

y aparte definimos 0 = [0, 0] Z.

Se cumple entonces que Z = Z {0} Z+ y los tres conjuntos son disjuntos


dos a dos. En efecto:
Todo n
umero entero es de la forma [m, n], con m, n N. Si m < n
entonces [m, n] = [0, n m] Z , si m = n entonces [m, n] = [0, 0] y si
m > n entonces [m, n] = [m n, 0] Z+ .
Si [m, n] Z+ Z entonces [m, n] = [r, 0] = [0, s], para ciertos r, s > 0,
pero entonces r + s = 0, lo cual s
olo es posible si r = s = 0, contradicci
on.
Igualmente, si [m, 0] = [0, 0] es que m = 0, luego ning
un n
umero de Z+ es
igual a 0, e igualmente con Z .
En otras palabras, todo n
umero entero es positivo, negativo o cero, y no
puede ser dos cosas a la vez. Por consiguiente, Z consta exactamente de los
elementos
0, +1, 1, +2, 2, +3, 3, . . .
y es importante que en esta enumeraci
on no aparecen terminos repetidos, es
decir, que s
olo puede suceder que +n = +m o que n = m si m = n (por
ejemplo, +n = +m equivale a [n, 0] = [m, 0], y a su vez a n = m).
Ordenaci
on de los n
umeros enteros Definimos en Z la relaci
on dada por2
[a, b] [c, d] si y s
olo si a + d b + c.
No es inmediato que esto sea una definici
on v
alida. En general, cuando
definimos una relaci
on o una funci
on sobre las clases de equivalencia de un
conjunto cociente, es necesario comprobar que la definici
on no depende de la
elecci
on de los representantes de las clases. Concretamente, si [a, b] = [a0 , b0 ]
y [c, d] = [c0 , d0 ], sera incoherente que usando la primera representaci
on obtuvieramos que [a, b] [c, d], mientras que usando la segunda obtuvieramos
[a0 , b0 ] 6 [c0 , d0 ].
2 La

idea detr
as de esta definici
on es que pretendemos que las clases [a, b] y [c, d] representen
a las restas a b y c d, respectivamente, y a b c d equivale a a + d b + d, de modo
que esta u
ltima relaci
on no involucra las restas a b y c d que no tenemos definidas.

54

Captulo 2. Anillos

Pero esto no sucede: tenemos que a + b0 = b + a0 y c + d0 = d + c0 . Si adem


as
a+d b+c, entonces, sumando todo, a+d+b+a0 +c+d0 b+c+a+b0 +d+c0 ,
y simplificando, a0 + d0 b0 + c0 .
Es f
acil comprobar que se trata de una relaci
on de orden total:
[a, b] [a, b], pues a + b a + b.
Si [a, b] [c, d] y [c, d] [a, b], entonces a + d b + c y c + b d + a, luego
a + d = b + c, luego [a, b] = [c, d].
Si [a, b] [c, d] y [c, d] [e, f ], entonces a + d b + c y c + f d + e.
Sumando ambas desigualdades y simplificando, queda a + f b + e, luego
[a, b] [e, f ].
Si m n, entonces +m +n y n m, pues lo primero equivale a que
[m, 0] [n, 0], es decir, a que m n, y lo segundo a que [0, n] [0, m] ,
es decir, tambien a que m n.
Para todo m, n N no nulos se cumple que m 0 +n, pues lo primero
equivale a que [0, m] [0, 0], y a su vez a que 0 m, e igualmente con la
segunda desigualdad.
Teniendo en cuenta que todo n
umero entero es 0 o de la forma n, con
n > 0, los dos u
ltimos puntos implican que la relaci
on de orden es total y que
con esta ordenaci
on
< 5 < 4 < 3 < 2 < 1 < 0 < +1 < +2 < +3 < +4 < +5 <
En particular, el conjunto Z+ de los enteros positivos es el formado por los
enteros mayores que 0, mientras que los enteros negativos Z son los enteros
menores que 0.
Suma y producto de n
umeros enteros Definimos ahora una suma y un
producto3 en Z:
[a, b] + [c, d] = [a + c, b + d],

[a, b][c, d] = [ac + bd, ad + bc].

De nuevo hay que justificar que estas operaciones est


an bien definidas en el
sentido de que no dependen de la elecci
on de los representantes, es decir, que si
[a, b] = [a0 , b0 ] y [c, d] = [c0 , d0 ], entonces [a + c, b + d] = [a0 + c0 , b0 + d0 ] y tambien
[ac + bd, ad + bc] = [a0 c0 + b0 d0 , a0 d0 + b0 c0 ].
Dejamos como ejercicio el caso de la suma y comprobamos el producto.
Tenemos que a + b0 = b + a0 y que c + d0 = d + c0 , y queremos probar que
ac + bd + a0 d0 + b0 c0 = ad + bc + a0 c0 + b0 d0 .
3 Si

pensamos que [a, b] y [c, d] pretenden representar las restas (que a


un no tenemos definidas) ab y cd, el producto se define teniendo en cuenta que (ab)(cd) = ac+bd(bc+ad),
y la definici
on adecuada de la suma se deduce an
alogamente.

2.2. Los n
umeros enteros

55

Esto equivale a
ac + bd + a0 d0 + b0 (c0 + d) = (a + b0 )d + bc + a0 c0 + b0 d0 ,
ac + bd + a0 d0 + b0 c + b0 d0 = a0 d + bd + bc + a0 c0 + b0 d0 ,
(a + b0 )c + a0 d0 = a0 (c0 + d) + bc,
a0 c + bc + a0 d0 = a0 c + a0 d0 + bc.
Por lo tanto, se da la igualdad requerida.
Veamos las propiedades de estas operaciones (en todas ellas se entiende que
m, n, r, etc. son n
umeros enteros cualesquiera):
1. (m + n) + r = m + (n + r).
En efecto, ([a, b]+[c, d])+[e, f ] = [a+c+e, b+d+f ] = [a, b]+([c, d]+[e, f ]),
donde hemos usado la asociatividad de la suma de n
umeros naturales.
2. m + n = n + m.
[a, b] + [c, d] = [a + c, b + d] = [c + a, d + c] = [c, d] + [a, b].
3. m + 0 = m.
[a, b] + [0, 0] = [a, b]
4. Todo n
umero entero tiene un opuesto para la suma, pues
[a, b] + [b, a] = [a + b, a + b] = 0.
M
as precisamente, si n N tenemos que +n + (n) = 0, luego el opuesto
de +n es n y viceversa.
5. (mn)r = m(nr).
Hay que comprobar que ([a, b][c, d])[e, f ] = [a, b]([c, d][e, f ]). Basta aplicar
rutinariamente la definici
on del producto a ambos miembros hasta comprobar que la expresi
on resultante es la misma (usando las propiedades de
la suma y el producto de los n
umeros naturales).
6. mn = nm.
La comprobaci
on es an
aloga a la de la propiedad anterior.
7. m(+1) = m.
La definici
on de producto da que [a, b][1, 0] = [a, b].
8. m(n + r) = mn + mr.
La comprobaci
on es an
aloga a la de 5.
9. Si mn = 0, entonces m = 0 o n = 0.

56

Captulo 2. Anillos

10. Si m n, entonces m + r n + r.

Suponemos que [a, b] [c, d], luego a + d b + c, y queremos probar que


[a + b] + [e, f ] [c + d] + [e, f ], es decir, que [a + e, b + f ] [c + e, d + f ] o,
equivalentemente, que a + e + d + f b + f + c + e, lo cual es claramente
cierto.

11. Si m 0 y n 0, entonces mn 0.

Sabemos que los enteros no negativos son los de la forma +m, +n, con
m y n naturales, y entonces (+m)(+n) = +(mn) 0. En efecto, por la
propia definici
on, [m, 0][n, 0] = [mn, 0].

Podramos demostrar muchas propiedades m


as, pero estas son las u
nicas
que necesitamos demostrar antes de olvidarnos de que hemos construido los
n
umeros enteros como clases de equivalencia de pares de n
umeros naturales.
En efecto, para prescindir completamente de ese tecnicismo s
olo nos falta una
observaci
on:
Consideremos la aplicaci
on i : N {0} Z+ dada por i(n) = +n (notemos
que +0 = 0). Ya hemos probado que es biyectiva, y que m < n equivale a
i(m) < i(n). Ahora podemos observar adem
as que
i(m + n) = i(m) + i(n),

i(mn) = i(m)i(n).

M
as explcitamente, que +(m + n) = +m + (+n) y que +(mn) = (+m)(+n).
Esto significa que la aplicaci
on i es un diccionario que hace corresponder
cualquier afirmaci
on aritmetica sobre los n
umeros naturales 0, 1, 2, 3, . . . con la
afirmaci
on correspondiente sobre los enteros no negativos 0, +1, +2, +3, . . . de
modo que 3 < 5 es equivalente a +3 < +5, y 2 + 5 = 7 es equivalente a que
+2 + (+5) = +7, y 2 3 = 6 es equivalente a que (+2)(+3) = +6. As, todo lo
que sabemos sobre n
umeros naturales sigue siendo cierto si los sustituimos por
los enteros no negativos4 y, por consiguiente, a partir de ahora podemos olvidarnos de los conjuntos que hasta ahora tom
abamos como n
umeros naturales
y pasar a considerar que los n
umeros naturales son los enteros no negativos.
Esto nos permite afirmar que
N = {0} Z+ Z,
de modo que la suma y el producto de n
umeros naturales son las restricciones
a N N de las operaciones correspondientes en Z. En particular, ya no es
necesario emplear la notaci
on +1, +2, +3, etc., que us
abamos para distinguir a
los n
umeros enteros positivos de los n
umeros naturales correspondientes, sino
que podemos eliminar el signo + y llamar 1, 2, 3, etc. a los enteros positivos, que
a partir de ahora son tambien los n
umeros naturales.
precisamente, es f
acil ver que {0} Z+ es un sistema de Peano tomando como
operaci
on siguiente la funci
on S(n) = n+(+1), por lo que es un conjunto de n
umeros naturales
tan v
alido como cualquier otro.
4 M
as

2.3. Conceptos b
asicos sobre anillos

57

Adem
as, a partir de ahora ya nunca necesitaremos recordar que los n
umeros
enteros son clases de equivalencia de pares de los antiguos n
umeros naturales,
sino que nos bastar
a saber que Z est
a formado por los n
umeros naturales y sus
opuestos (junto con que se cumplen las propiedades que hemos demostrado).
No obstante, recordamos por u
ltima vez la construcci
on de Z para explicitar
la idea subyacente que la ha dirigido en todo momento, es decir, que la clase
[m, n] pretenda representar la resta no definida m n. Ahora podemos afirmar
(sin hacer referencia a restas no definidas) que
[m, n] = [m, 0] + [0, n] = +m + (n) = m n,
donde m y n son n
umeros naturales antiguos en la primera expresi
on y
n
umeros naturales nuevos enteros no negativos en la u
ltima.

2.3

Conceptos b
asicos sobre anillos

Las reglas que sin duda domina el lector sobre manipulaci


on de expresiones
que involucran sumas, productos, desigualdades, etc. sobre n
umeros enteros
son aplicables en muchos otros contextos que nos van a ir apareciendo en lo
sucesivo, pero para justificar que algunas propiedades que sabemos v
alidas para
los n
umeros enteros son aplicables en otros contextos es necesario saber que
propiedades b
asicas deben cumplirse en tales contextos alternativos para que la
extrapolaci
on este justificada. Eso nos lleva a la estructura algebraica de anillo
y a otras relacionadas con ella:
Definici
on 2.7 Un anillo es una terna (A, +, ) en la que A es un conjunto
y +, son dos leyes internas en A, de modo que se cumplan las propiedades
siguientes:
1. (a + b) + c = a + (b + c) para todos los a, b, c de A.
2. a + b = b + a para todos los a, b de A.
3. Existe un elemento 0 en A tal que a + 0 = a para todo a de A.
4. Para todo a de A existe un a en A tal que a + (a) = 0.
5. (ab)c = a(bc) para todos los a, b, c de A.
6. a(b + c) = ab + ac
(a + b)c = ac + bc para todos los a, b, c de A.
En otros terminos, un anillo es una combinaci
on de dos semigrupos (A, +) y
(A, ), el primero tiene que ser conmutativo y con elemento neutro 0 (que, seg
un
sabemos, es u
nico) y adem
as todo elemento a tiene que tener un opuesto a,
que tambien es u
nico. Al segundo semigrupo no le pedimos en principio que sea
conmutativo ni que tenga elemento neutro, pero s que satisfaga la propiedad 6,
que se conoce como propiedad distributiva del producto respecto de la suma.

58

Captulo 2. Anillos

Como es habitual, usaremos los signos + y para referirnos a las operaciones


de un anillo arbitrario, a las que llamaremos suma y producto, de modo que
estos signos tendr
an una interpretaci
on distinta seg
un el contexto. Del mismo
modo, cuando digamos que A es un anillo, querremos decir que hablamos de
una terna (A, +, ), para ciertas operaciones no indicadas explcitamente.
Si el producto de un anillo cumple la propiedad conmutativa diremos que
el anillo es conmutativo. Si tiene elemento neutro (que ser
a u
nico, lo representaremos por 1 y lo llamaremos la identidad de A) diremos que el anillo es
unitario.
Las propiedades que hemos demostrado en la secci
on precedente demuestran
que (Z, +, ) es un anillo, al que en lo sucesivo, seg
un lo indicado, nos referiremos
simplemente como Z.
El teorema siguiente contiene unas cuantas propiedades sencillas de los anillos. Todas ellas se cumplen en particular en el caso de Z, pero a
un m
as importante es saber que podremos usarlas al trabajar con cualquier conjunto del
que sepamos que tiene estructura de anillo, por muy abstracta que pueda ser la
naturaleza de sus elementos y de sus operaciones.
Teorema 2.8 Sea A un anillo y a, b, c elementos de A.
1. Si a + b = a + c entonces b = c.
2. Si a + a = a entonces a = 0.
3. (a) = a.
4. 0 a = a 0 = 0.
5. (a)b = a(b) = (ab).
6. (a)(b) = ab.
7. (a + b) = a b.
n:
Demostracio
1. a + b = a + c a + a + b = a + a + c 0 + b = 0 + c b = c.
2. a + a = a a + a = a + 0 a = 0.
3. a + a = 0 = a + ((a)) a = (a).
4. 0 a = (0 + 0)a = 0 a + 0 a 0 a = 0.
5. (a)b + ab = (a + a)b = 0b = 0 (a)b = (ab).
6. (a)(b) = (a(b)) = ((ab)) = ab.
7. (a b) + (a + b) = a a + b b = 0 (a b) = (a + b).

2.3. Conceptos b
asicos sobre anillos

59

De la construcci
on de los n
umeros enteros hemos obtenido que los hay de
dos clases: positivos, como +5, y negativos, como 5. Ya hemos justificado que
podamos suprimir el + del +5 al identificarlo con el n
umero natural 5, y ahora
vemos que el del 5 puede entenderse como la notaci
on general que expresa
que 5 es el simetrico de 5, del mismo modo que tenemos que 5 = (5).
Si aplicamos en particular las propiedades 5 y 6 a n
umeros naturales a y b
obtenemos las conocidas reglas de los signos para Z:
negativo positivo = negativo, negativo negativo = positivo

a las que hay que a


nadir, por supuesto, que positivo positivo = positivo, que
no expresa sino que el producto de n
umeros naturales es un n
umero natural.
Con estas propiedades tambien quedan justificadas las reglas de los signos
para la suma. Por ejemplo:
5 9 = (5 + 9) = (9 5) = 4.
En general, ahora es f
acil justificar que para restar dos n
umeros naturales se
resta el mayor menos el menor y se pone el signo del mayor.
Las propiedades que hemos demostrado sobre Z en la secci
on anterior van
bastante m
as all
a de lo que exige la definici
on de anillo conmutativo y unitario,
lo cual significa que no todas las propiedades de Z son extrapolables a cualquier
anillo. A continuaci
on vamos a ir introduciendo algunas definiciones generales
correspondientes a propiedades que se cumplen en Z.
Empezamos por un hecho b
asico, y es que en Z se cumple que 1 6= 0, mientras
que la definici
on de anillo unitario no excluye la posibilidad de que 1 = 0. Ahora
bien, este caso es muy particular, pues si un anillo A cumple esta propiedad,
entonces todo a A cumple a = a 1 = a 0 = 0. En suma, la igualdad 1 = 0
s
olo puede darse si A = {0}.
Los anillos que m
as nos van a interesar son los que llamaremos dominios,
que son los anillos conmutativos y unitarios en los que 1 6= 0.
Claramente, Z es un dominio.

Notemos, por otra parte, que en cualquier anillo se cumple a 0 = 0 a = 0,


pero no es cierto en general que si ab = 0 uno de los factores tenga que ser nulo,
propiedad que si se cumple en Z, seg
un hemos visto.
Definici
on 2.9 Un elemento a de un dominio A es un divisor de cero si es no
nulo y existe un b en A no nulo tal que ab = 0. Un dominio ntegro es un
dominio sin divisores de cero.
Tenemos, pues, que Z es un dominio ntegro.
Una propiedad muy importante de los dominios ntegros es que en ellos
podemos simplificar elementos no nulos de las igualdades, es decir, si en un
dominio ntegro tenemos que ab = ac y a 6= 0, entonces b = c, pues a(b c) = 0,
luego b c = 0.
Ejercicio: Dotar a Z Z de una estructura de dominio que no sea ntegro.

60

Captulo 2. Anillos

Definici
on 2.10 Un anillo ordenado es una cu
adrupla (A, +, , ) de manera
que (A, +, ) es un dominio, (A, ) es un conjunto totalmente ordenado y se
cumplen las dos propiedades de compatibilidad siguientes:
1. Si a b, entonces a + c b + c, para todos los a, b, c A.
2. Si a 0 y b 0 entonces ab 0.
Los elementos no nulos de cualquier anillo ordenado pueden dividirse en
positivos y negativos seg
un que sean mayores o menores que 0. Representaremos por A+ y A al conjunto de los elementos positivos y negativos de A,
respectivamente.
En la secci
on anterior hemos demostrado que Z es un anillo ordenado. Veamos las propiedades que se deducen de este hecho (y que, por lo tanto, son
v
alidas en cualquier anillo ordenado):
Teorema 2.11 Sea A un anillo ordenado. En las propiedades siguientes se
entiende que a, b, etc. son elementos de A:
1. Si a b y c d, entonces a + c b + d.
2. Si a < b y c d, entonces a + c < b + d.
3. a b si y s
olo si b a 0.
4. Si a b, entonces b a.
5. a 0 si y s
olo si a 0.
6. Si a b y c 0, entonces ac bc.
7. Si a b y c 0, entonces bc ac.
8. a2 0.
9. 1 > 0
n: 1) Claramente a + c b + c b + d.
Demostracio

2) Si a < b no puede ser a + c = b + c, pues esto implica a = b, luego


a + c < b + d b + d.
3) a b si y s
olo si 0 = a a b a.

4) Por la propiedad anterior, ambas afirmaciones equivalen a b a 0.

5) Es un caso particular de la propiedad precedente.


6) Tenemos que b a 0, luego (b a)c 0, luego bc ac 0,luego ac bc.

7) Tenemos que c 0 y por la propiedad anterior ac bc, luego


bc ac.
8) Si a 0 entonces a2 0 por la propiedad 2) de compatibilidad. Si a 0,
entonces a 0, luego a2 = (a)2 0.
9) Basta tener en cuenta que 1 = 12 .

2.3. Conceptos b
asicos sobre anillos

61

En particular, la propiedad 1 implica que si b 0 entonces a a+b y esto se


generaliza f
acilmente a sumas finitas: si a1 , . . . , an son elementos no negativos
de A, entonces ai a1 + + an . En particular, si una suma de elementos
no negativos es 0, necesariamente todos los sumandos son 0. Equivalentemente,
una suma finita de terminos positivos es positiva.
Si A es un dominio ntegro y a A es no nulo, entonces a2 6= 0, luego
la propiedad 8 puede refinarse a a2 > 0. Teniendo en cuenta la observaci
on
precedente, si a1 , . . . , an son elementos de A cualesquiera y a21 + + a2n = 0,
necesariamente a1 = = an = 0.
Definici
on 2.12 Si A es un anillo ordenado, definimos las aplicaciones valor
absoluto | | : A A y signo sig : A {1, 0, 1} mediante
(

1 si a > 0,
a si a 0,
|a| =
sig(a) =
0 si a = 0,
a si a < 0,
1 si a < 0.

Observemos que la imagen del valor absoluto est


a, m
as concretamente, en
el conjunto de los elementos no negativos de A. En particular, para Z tenemos
que | | : Z N.
En general, cada elemento de a puede reconstruirse a partir de su signo y su
valor absoluto mediante la relaci
on a = sig(a)|a|.
Teorema 2.13 Sea A un anillo ordenado. Entonces
1. |a| = 0 si y s
olo si a = 0.
2. | 1| = 1.
3. |a| = | a|.
4. |a| b si y s
olo si b a b.
5. |a + b| |a| + |b|.
6. ||a| |b|| |a b|.
7. |ab| = |a||b|.
n: Las tres primeras propiedades son inmediatas por la defiDemostracio
nici
on de valor absoluto.
4) Si |a| b y a 0, entonces a b y b a 0 a b. Si a 0
entonces tenemos a b, luego b a 0 a b.

Recprocamente, si b a b, entonces multiplicando por 1 queda que


b a b, luego, sea a 0 o a 0, se cumple que |a| b.
5) Como |a| |a|, por el apartado anterior |a| a |a|, e igualmente
|b| b |b|. Sumando las desigualdades:
(|a| + |b|) a + b |a| + |b|,
luego |a + b| |a| + |b|.

62

Captulo 2. Anillos

6) |a| = |a b + b| |a b| + |b|, luego |a| |b| |a b|. Igualmente


|b| |a| |b a| = |a b|, luego
|a b| |a| |b| |a b|,
luego ||a| |b|| |a b|.
7) Es claro que |a||b| = ab, y e positivo, luego es |ab|.
Vamos a definir operaciones entre n
umeros enteros y los elementos de un
anillo.
Definici
on 2.14 Sea A un anillo, a un elemento de A y n un n
umero entero.
Definimos el elemento na como5

n veces

a + + a
si n > 0

0
si n = 0
na =

n veces

(a) + + (a) si n < 0


n veces

Si n > 0 definimos tambien an = a a. Si A es unitario a0 = 1, y si a es


n veces

una unidad y n < 0, entonces an = a1 a1 .


Es pura rutina comprobar los hechos siguientes.

Teorema 2.15 Sea A un anillo unitario y a, b elementos de A (que supondremos inversibles cuando proceda). Sean m y n n
umeros enteros. Se cumple:
1. m(a + b) = ma + mb.
2. (m + n)a = ma + na.
3. (m)a = (ma) = m(a).
4. m(na) = (mn)a.
5. Si ab = ba entonces (ab)m = am bm .
6. am+n = am an .
7. (am )n = amn .
8. am = (a1 )m = (am )1 .
Adem
as si A = Z, ma es lo mismo en el sentido de la definici
on anterior que
en el sentido del producto usual en Z.
Para terminar de exponer las propiedades b
asicas de Z probamos que es
posible dividir eucldeamente n
umeros enteros:
5 En general, estas definiciones con puntos suspensivos se traducen f
acilmente en definiciones recurrentes.

2.3. Conceptos b
asicos sobre anillos

63

Teorema 2.16 Sean D y d n


umeros enteros con d no nulo. Entonces existen
unos u
nicos enteros c y r tales que D = dc + r y 0 r < |d|.
n: Consideremos los n
Demostracio
umeros naturales |D| y |d|. Sabemos
que existen naturales c y r tales que |D| = |d|c + r, con 0 r < |d|.
Si r = 0 entonces cambiando el signo de c si es preciso tenemos D = dc + 0.
Supongamos r > 0.
Si D 0 y d > 0 entonces D = dc + r, como queramos.
Si D 0 y d < 0 entonces sirve D = d(c) + r.
Si D < 0 y d > 0 entonces D = d(c 1) + (d r).
Si D < 0 y d < 0 entonces D = d(c + 1) + (d r).
Si tuvieramos dos expresiones distintas D = dc + r = dc0 + r0 , entonces sea
c = c si d > 0 y c = c si d < 0. Igualmente definimos c0 . As dc = |d|
c,
dc0 = |d|0 c0 . Supongamos que c < c0 . Entonces
D = dc + r = |d|
c + r < |d|
c + |d| = |d|(
c + 1) |d|
c0 = dc0 dc0 + r0 = D,
y esto es una contradicci
on. Por lo tanto ha de ser c = c0 y de aqu que
0
dc + r = dc + r , luego r = r0 .
Esta propiedad de los n
umeros enteros confiere propiedades muy importantes
al anillo Z y es poseda tambien por otros anillos de interes. Por ello conviene
tratarla en general:
Definici
on 2.17 Un dominio eucldeo es un dominio ntegro A tal que existe
una funci
on : A \ {0} N que cumpla lo siguiente:
1. Si a, b son elementos de A no nulos (a) (ab).
2. Si D y d son elementos de A con d 6= 0 entonces existen c y r en A de
manera que D = dc + r con r = 0 o bien (r) < (d).
La funci
on se llama norma eucldea.
Es obvio que Z es un dominio eucldeo con la norma dada por (a) = |a|.
Ahora bien, observemos que el cociente y el resto no son u
nicos. Por ejemplo,
para dividir 8 entre 3 podemos hacer 8 = 3 2 + 2 o bien 8 = 3 3 1. En ambos
casos |r| < |d|.
Definici
on 2.18 Un elemento a de un dominio A es una unidad6 si existe un
elemento b en A tal que ab = 1, es decir, si tiene inverso para el producto.
En tal caso sabemos que el inverso de a es u
nico y, de acuerdo con la notaci
on
multiplicativa, lo representaremos por a1 .
Si a es una unidad, entonces a1 es obviamente una unidad, y (a1 )1 = a.
Si a y b son unidades, entonces ab es una unidad, y (ab)1 = a1 b1 .
6 Es importante recordar que la palabra unidad en un dominio no se refiere necesariamente
al 1, sino a cualquier elemento con inverso. La palabra para referirse al 1 es identidad.

64

Captulo 2. Anillos

Obviamente 1 es una unidad y 11 = 1. En cambio 0 no puede ser una


unidad. Una unidad no puede ser divisor de cero, pues si a es una unidad y
ab = 0, entonces b = 1b = a1 ab = a1 0 = 0.
En todo anillo, 1 es tambien una unidad, pues (1)(1) = 1. Las unidades
de Z son exactamente 1 y 1.
En efecto, si m, n Z cumplen mn = 1, entonces |m||n| = 1 y, como |n| 6= 0
(y es un n
umero natural) se cumple 1 |n|, luego |m| |m||n| = 1, luego
|m| = 1, luego m = 1.
Un cuerpo es un dominio en el que todo elemento no nulo es una unidad. En
particular todo cuerpo es un dominio ntegro.
De momento no tenemos ning
un ejemplo de cuerpo. Dedicaremos la secci
on
siguiente a extender Z hasta el cuerpo de los n
umeros racionales, pero antes
terminamos esta con algunos hechos sobre cuerpos que nos servir
an de gua
para dicho fin.
Sea K un cuerpo y a, b dos elementos de K con b 6= 0. La fracci
on determinada por a y b es a/b = ab1 . a y b se llaman, respectivamente, numerador y
denominador de la fracci
on a/b.
Veamos las propiedades b
asicas de las fracciones. La mayora de ellas son
consecuencia inmediata de la definici
on. En todas ellas se presupone la hip
otesis
de que los elementos que aparecen como denominadores son no nulos.
a 1
a
1
b
1.
= a,
= b1 ,
= .
1
b
b
a
a
c
2.
= si y s
olo si ad = bc
b
d
La igualdad de fracciones es ab1 = cd1 , y esto equivale a la igualdad
que resulta de multiplicar por bd 6= 0, que es ad = bc.
a
ac
3. Si c 6= 0, entonces = .
b
bc
a
ca
4. c = .
b
b
a c
ad + bc
5. + =
.
b
d
bd
a c
ad bc
1
1
1
ad + bc
+ =
+
= ad
+ bd
= (ad + bd) =
.
b
d
bd
bd
bd
bd
bd
bd
ac
ac
6.
= .
bd
bd
a/b
ad
7.
=
.
c/d
bc
Terminamos con una u
ltima observaci
on sobre los cuerpos, y es que trivialmente son dominios eucldeos tomando como norma la aplicaci
on constante 1.
En efecto, la divisi
on eucldea puede realizarse siempre con resto 0, es decir,
D = d(D/d) + 0.

2.4. Cuerpos de cocientes. N


umeros racionales

2.4

65

Cuerpos de cocientes. N
umeros racionales

Hemos visto que Z dista mucho de ser un cuerpo, pues sus u


nicas unidades
son 1. Por lo tanto, una fracci
on como 4/5 no tiene sentido en Z. Ahora
vamos a construir el cuerpo Q de los n
umeros racionales, que contiene a Z y
justifica el uso de fracciones de n
umeros enteros.
En realidad, vamos a dar una construcci
on general que nos proporciona un
cuerpo K a partir de cualquier dominio ntegro A. La idea es que K este formado
por todas las fracciones de elementos de A. Si llamamos A = A \ {0}, cada
fracci
on est
a determinada por un par (a, b) A A , pero no podemos definir
las fracciones como los elementos de este producto cartesiano porque distintos
pares pueden determinar la misma fracci
on.
La situaci
on es an
aloga a la que nos encontramos en su momento a la hora
de construir Z a partir de N: debemos definir una relaci
on de equivalencia en el
conjunto de pares de modo que dos de ellos esten relacionados si y s
olo si deben
definir la misma fracci
on, y tomar como fracciones las clases de equivalencia. Los
resultados sobre fracciones que hemos visto en la secci
on precedente nos indican
cu
ales son las definiciones adecuadas, tanto de la relaci
on de equivalencia como
de las operaciones en el cociente:
Definici
on 2.19 Sea A un dominio ntegro y A = A \ {0}. Sea R la relaci
on
en el conjunto A A dada por (a, b) R (c, d) si y s
olo si ad = bc.
Es f
acil ver que es una relaci
on de equivalencia. Veamos por ejemplo la
transitividad: si (a, b) R (c, d) y (c, d) R (e, f ), tenemos que ad = bc y que cf =
de, luego adcf = bcde. Como dc 6= 0 y A es un dominio ntegro, se puede
simplificar, y resulta af = be, luego (a, b) R (e, f ).
a
Representaremos por la clase de equivalencia del par (a, b) y llamaremos
b
K = (A A )/R al conjunto cociente. Por las propiedades b
asicas de las clases
de equivalencia sabemos que
a
c
=
b
d

si y s
olo si

ad = bc.

Definimos en K la suma y el producto dadas por


a c
ad + bc
+ =
,
b
d
bd

ac
ac
= .
bd
bd

Notemos que, como estamos exigiendo que A sea un dominio ntegro, el


hecho de que b, d 6= 0 implica que bd 6= 0. Si no fuera as estas definiciones
no seran correctas. No obstante, todava falta algo por comprobar para dar
por v
alidas estas definiciones, y es que, como siempre que definimos relaciones
o funciones sobre clases de equivalencia, hay que comprobar que la definici
on
no depende de la elecci
on de los representantes. Por ejemplo, para el caso de la
suma, si a/b = a0 /b0 y c/d = c0 /d0 , tiene que cumplirse que
ad + bc
a0 d0 + b0 c0
=
.
bd
b0 d0

66

Captulo 2. Anillos

Esto es equivalente a que (ad + bc)b0 d0 = (a0 d0 + b0 c0 )bd. En efecto, teniendo en


cuenta que ab0 = ba0 y que cd0 = dc0 , vemos que
(ad + bc)b0 d0 = ab0 dd0 + bb0 cd0 = ba0 dd0 + bb0 dc0 = (a0 d0 + b0 c0 )bd.
Ahora es pura rutina comprobar que K cumple todos los axiomas de cuerpo
con estas definiciones. El cuerpo K as construido se llama cuerpo de cocientes
de A. Los elementos neutros de K son 0 = 0/1 y 1 = 1/1, el simetrico de
una fracci
on es (a/b) = (a)/b, y el inverso es (a/b)1 = b/a. Aqu hay que
observar que si a/b 6= 0/1, entonces a 6= 0.

Con esto no hemos terminado la construcci


on del cuerpo de cocientes, pues
nos falta llegar a que podemos ver a A como un subconjunto de K. Esta afirmaci
on requiere varias precisiones, y para plantear exactamente lo que queremos
demostrar conviene introducir algunos conceptos.
Homomorfismos de anillos Es claro que lo que interesa de un anillo no es
en absoluto la naturaleza conjuntista de sus elementos, sino el modo en que los
relacionan las leyes internas. Por ejemplo, si A = {a, b} es cualquier conjunto
con dos elementos, es f
acil convertirlo en un anillo (cuerpo, de hecho) con las
leyes dadas por
a + a = b + b = a, a + b = b + a = b,
aa = ab = ba = a,

bb = b.

Con estas operaciones, a = 0 y b = 1 (es decir, a es el neutro de la suma y b


el del producto) y en estos terminos las operaciones son
0 + 0 = 1 + 1 = 0,

0 + 1 = 1 + 0 = 1,

0 0 = 0 1 = 1 0 = 0,

1 1 = 1.

Si hacemos lo mismo con otro conjunto A0 = {a0 , b0 } obtenemos un anillo


distinto conjuntistamente, pero el mismo anillo algebraicamente. La forma de
plasmar esta relaci
on es el concepto de homomorfismo de anillos que definimos
a continuaci
on.
Definici
on 2.20 Sean A y B dos anillos. Una aplicaci
on f : A B es un
homomorfismo de anillos si cumple f (a + b) = f (a) + f (b), f (ab) = f (a)f (b)
para todos los elementos a y b de A.
Una consecuencia inmediata es que f (0) = f (0 + 0) = f (0) + f (0), luego
f (0) = 0, y que f (a) + f (a) = f (a a) = f (0) = 0, luego f (a) = f (a).
Tambien es claro que si m es un n
umero entero f (ma) = mf (a).
Sin embargo, hay que tener presente que, aunque A y B sean unitarios, no
tiene por que ocurrir f (1) = 1. Por ejemplo la aplicaci
on que vale constantemente 0 es un homomorfismo (el u
nico) que cumple f (1) = 0.
Suponiendo f (1) 6= 0, una condici
on suficiente para que f (1) = 1 es que B
sea un dominio ntegro, pues entonces f (1)f (1) = f (1 1) = f (1) = f (1)1, luego
f (1) = 1.

2.4. Cuerpos de cocientes. N


umeros racionales

67

Otra condici
on que garantiza que f (1) = 1 es que f : A B sea suprayectiva, pues entonces tiene que existir un a A tal que f (a) = 1 y as
f (1) = f (1)1 = f (1)f (a) = f (1 a) = f (a) = 1.
Cuando f (1) = 1 y a A es inversible, se cumple que f (a1 ) es inversible y
f (a1 ) = f (a)1 .
M
as en general, se cumple que f (an ) = f (a)n para todo n Z. Si a no es
inversible, esto se cumple de todos modos para todo n N.

Es inmediato comprobar que la composici


on de homomorfismos es un homomorfismo.
Un isomorfismo de anillos es un homomorfismo biyectivo. Notemos que
1
si f : A B es un isomorfismo, entonces
Atambien es un
1f : B
1
1
isomorfismo, pues f f (a) + f (b) = f f (a) + f f 1 (b) = a + b, luego
f 1 (a + b) = f 1 (a) + f 1 (b), e igualmente ocurre con el producto.
Dos anillos A y B son isomorfos (abreviadamente, A
= B) si existe un
isomorfismo f : A B. Cuando dos anillos son isomorfos son algebraicamente
indistinguibles, es decir, uno es conmutativo si y s
olo si lo es el otro, etc. Por lo
tanto podemos considerarlos como el mismo anillo (aunque conjuntistamente
sean distintos).
Un anillo A es un subanillo de un anillo B si A B y las operaciones de A
son las mismas que las de B. Por ejemplo, {2n | n Z} es un subanillo de Z
(no unitario, por cierto). En general, si f : A B es un homomorfismo, es
f
acil ver que f [A] es un subanillo de B.
Ejercicio: Considerando Z Z y Z {0}, probar que la identidad de un subanillo
puede ser distinta de la del anillo. Probar que esto es imposible si los anillos son
dominios ntegros.

Un monomorfismo de anillos es un homomorfismo inyectivo. Si f : A B


es un monomorfismo es claro que f : A f [A] es un isomorfismo, o sea, A
es isomorfo a un subanillo de B, luego podemos identificar A con su imagen y
considerar que A es un subanillo de B.

Este
es el caso de un dominio ntegro y su cuerpo de cocientes:
Teorema 2.21 Sea A un dominio ntegro y K su cuerpo de cocientes.
1. La aplicaci
on : A K dada por (a) = a/1 es un monomorfismo de
anillos.
2. Si K 0 es un cuerpo y : A K 0 es un monomorfismo de anillos, existe
un u
nico monomorfismo de cuerpos : K K 0 que hace conmutativo
el diagrama siguiente:

/ K0
AA
O
AA
AA
AA

A
K

68

Captulo 2. Anillos

n: 1) es inmediato. Para probar 2) basta definir la aplicaDemostracio


ci
on mediante (a/b) = (a)(b)1 . En general, siempre que definamos una
funci
on sobre fracciones, tenemos que comprobar que la definici
on no depende
de la representaci
on que usamos, pues esta no es u
nica. En este caso se trata
de probar que si a/b = a0 /b0 entonces (a)(b)1 = (a0 )(b0 )1 , ahora bien,
sabemos que ab0 = b0 a y, como es un homomorfismo, (a)(b0 ) = (b0 )(a),
de donde se sigue la relaci
on requerida.
Es f
acil probar que es un monomorfismo y trivialmente hace conmutativo
el diagrama, pues (a)) = (a/1) = (a).
Lo que afirma la parte 1) del teorema anterior es que podemos considerar
a A como un subanillo de su cuerpo de cocientes sin m
as que identificar cada
elemento a con a/1, es decir, considerando que dividir entre 1 es no hacer nada.
La parte 2) afirma en particular que si un cuerpo K 0 contiene a A, entonces
tambien contiene una copia isomorfa de K, a saber, el conjunto {ab1 | a, b A}.
En otras palabras, si ya tenemos a A contenido en un cuerpo K 0 no necesitamos
salirnos de K 0 para construir el cuerpo de cocientes de A. Basta tomar todas las
fracciones posibles con elementos de A y el resultado ser
a un cuerpo isomorfo
al cuerpo de cocientes de A.
Definici
on 2.22 Llamaremos cuerpo de los n
umeros racionales Q al cuerpo de
cocientes de Z. Los elementos de Q son las fracciones a/b con a, b en Z, b 6= 0.
En lo sucesivo, los n
umeros racionales de la forma n/1, donde n Z, los representaremos simplemente por n. As, a partir de ahora nos olvidaremos de
que habamos definido los n
umeros enteros como clases de equivalencia de pares
de n
umeros naturales y pasaremos a considerar que, por ejemplo, el n
umero
entero 5 es el n
umero racional 5/1. Hemos probado que con esto estamos cambiando el Z antiguo por otro anillo isomorfo, por lo que todos los resultados
que conocamos sobre el antiguo Z siguen siendo v
alidos para el nuevo, con
la diferencia de que ahora podemos afirmar que N Z Q.
En general, si D es un dominio ntegro ordenado, toda fracci
on de K puede
expresarse en la forma a/b con b > 0. En efecto, si b < 0 la podemos transformar
en a/b = (a)/(b), y ahora b > 0.
Teorema 2.23 Si A es un dominio ntegro ordenado, entonces su cuerpo de
cocientes K es un cuerpo ordenado con la relaci
on dada por
a
c

b
d

si y s
olo si

ad bc,

donde las fracciones se toman con denominadores positivos.


n: Hay que comprobar que la relaci
Demostracio
on est
a bien definida, es
decir, que si a/b = a0 /b0 y c/d = c0 /d0 (con denominadores positivos) y ad bc,
entonces tambien a0 d0 b0 c0 . En efecto, sabemos que ab0 = a0 b y cd0 = c0 d.
Como b0 , d0 > 0, tenemos que
ad bc ab0 d0 d bb0 d0 c a0 bdd0 bb0 dc0 a0 d0 b0 c0 .

2.4. Cuerpos de cocientes. N


umeros racionales

69

Es claro que se trata de una relaci


on de orden total. Veamos como ejemplo
la prueba de la transitividad: si a/b c/d e/f (con denominadores positivos)
tenemos que ad bc y cf de. Por lo tanto adf bcf bde, luego af be,
luego a/b e/f .
En cuanto a las propiedades de compatibilidad, veamos por ejemplo la de la
suma: Suponemos que a/b c/d y queremos probar que a/b + e/f c/d + e/f .
Equivalentemente, suponemos que ad bc y queremos probar que
af + be
cf + de

,
bf
df
que a su vez equivale a af df + bedf cf df + debf, o tambien a adf 2 cdf 2 ,
pero esto es cierto porque ad cd y f 2 0.
Observemos que, seg
un la relaci
on de orden dada por el teorema anterior,
a/1 b/1 si y s
olo si a b, es decir, que al identificar a A con un subanillo
de K, la relaci
on de orden en A no es sino la restricci
on de la de K.
En particular esto se aplica a Q, que resulta ser un cuerpo ordenado, por
lo que tenemos definidos los conceptos de valor absoluto y signo de un n
umero
racional, y cumplen las propiedades que hemos demostrado en general.
Otra caracterstica general v
alida para todo cuerpo ordenado K es que si u,
v K, con u < v, existe un w K tal que u < w < v. Esto se expresa diciendo
que los cuerpos ordenados son densos en s mismos.
En efecto, podemos definir 2 = 1 + 1 K, que claramente cumple 2 > 0, y
u+v
entonces basta tomar w =
. Es inmediato comprobar que u < v < w.
2
Notemos que Z no cumple esto, sino que entre dos n
umeros enteros consecutivos no hay ning
un otro n
umero entero. Para que el argumento anterior
funcione hace falta que 2 tenga inverso, cosa que no sucede en Z.
Los n
umeros racionales tienen tambien su representaci
on geometrica como
puntos de una recta. Por ejemplo, para representar 7/5 = 1 + 2/5 dividimos en
cinco partes cada intervalo entre dos n
umeros enteros consecutivos y tomamos,
desde 0, 7 de dichos intervalos.

7/5

Notemos que si quisieramos se


nalar en la recta todos los puntos correspondientes a n
umeros racionales, por muy finos que traz
aramos los puntos, en la
pr
actica llenaramos toda la recta. Por ejemplo, para representar todas las
fracciones con denominador 1 000 000 tendramos que poner un mill
on de puntos
entre cada dos n
umeros enteros consecutivos. Sin embargo, el hecho de que los
puntos con n
umeros racionales asignados esten por todas partes, no resuelve
el problema te
orico de si quedan todava puntos de la recta sin asignar o no.
Volveremos sobre esto m
as adelante.

70

Captulo 2. Anillos

N
umeros combinatorios Los cuerpos de cocientes nos permiten salirnos
temporalmente de un anillo en nuestros c
alculos aunque despues volvamos a el.
Veamos un ejemplo.
Sean n, n1 , . . . , nk n
umeros naturales tales que n = n1 + . . . + nk . Definimos
el n
umero combinatorio

n
n!
=
n1 nk
n1 ! nk !
Si 0 m n abreviaremos

n
n
n!
=
=
m
m nm
m! (n m)!


5
Por ejemplo,
= 10. Vamos a demostrar las propiedades principales de los
3
n
umeros combinatorios.
Teorema 2.24 Sean m n n
umeros naturales.

n
n
1.
=
.
m
nm

n
n
2.
=
= 1,
0
n


n
= n.
1

n
n
n+1
3. Si m < n,
+
=
.
m
m+1
m+1
4. Los n
umeros combinatorios son n
umeros naturales.
n: 3) Hay que probar que
Demostracio
n!
n!
(n + 1)!
+
=
.
m! (n m)! (m + 1)! (n m 1)!
(m + 1)! (n m)!
Ahora bien,

n!
n!
+
m! (n m)! (m + 1)! (n m 1)!

n! (m + 1) m! (n m)! n! (m + 1)! (n m)(n m 1)!


+
m! (n m)!
(m + 1)! (n m 1)!

(m + 1)! (n m)!

= n! (m + 1) + n! (n m) = m n! + n! + n n! m n! = (n + 1) n! = (n + 1)!

2.4. Cuerpos de cocientes. N


umeros racionales

71

n
4) Una simple inducci
on nos da que m
es un n
umero natural, pues cada
n
umero combinatorio con n + 1 es suma de dos con n, por el apartado 3).
Para el caso general basta usar que

n
n nk+1
n
=
.
n1 . . . nk nk+1
n1 . . . nk
nk+1
La forma m
as f
acil de calcular los n
umeros combinatorios es disponerlos en
forma de tri
angulo, de modo que cada uno es la suma de los dos que hay sobre
el. El tri
angulo as construido se suele llamar tri
angulo de Tartaglia.
1
1
1
1
1
1

1
2

3
4

1
3

6
10

1
4

10

1
5

Tri
angulo de Tartaglia
Los n
umeros combinatorios tienen una interpretaci
on combinatoria:
Teorema
2.25 Si A es un conjunto de cardinal n y m n, entonces A tiene
n
subconjuntos
de cardinal m.
m

n: Por inducci
Demostracio
on sobre n. Si n =
0 entonces A = y tiene
un u
nico subconjunto de cardinal 0, y ciertamente 00 = 1.
Supongamos que es cierto para conjuntos de cardinal n y supongamos que
|A| = n
nico subconjunto de cardinal 0,
+ 1. Es inmediato que A tiene un u
y n+1
= 1. Consideremos ahora los subconjuntos de cardinal m + 1. Fi0
jado a X, el conjunto X de todos los subconjuntos de A de cardinal m + 1
puede dividirse en dos subconjuntos disjuntos, el subconjunto Y formado por
los subconjuntos que contienen a a y el subconjunto Z formado por los que no lo
contienen. Claramente, hay tantos subconjuntos de X con m + 1 elementos que
contienen a a como subconjuntos
tiene A \ {a} con m elementos. Por

nhip
otesis
n
de inducci
on, |Y | = m
. Por otra parte, tambien es claro que |Z| = m+1
. Por
consiguiente:

n
n
n+1
|X| = |Y | + |Z| =
+
=
.
m
m+1
m+1
La utilidad principal de estos n
umeros ser
a para nosotros el hecho siguiente:
Teorema 2.26 (Binomio de Newton) Sea A dominio, n un n
umero natural
y a, b dos elementos de A. Entonces
n
X
n m nm
(a + b) =
a b
.
m
m=0
n

72

Captulo 2. Anillos
n: Por inducci
Demostracio
on sobre n. Para n = 0 es inmediato.
n+1

(a + b)

n
X
n m nm
= (a + b) (a + b) =
a b
(a + b)
m
m=0
n

n
n
X
n m+1 nm X n m nm+1
=
a
b
+
a b
m
m
m=0
m=0

n+1
X

m=1

n
X
n
n m n+1m
m n+1m
a b
+
a b
m1
m
m=0


n 0 n+1
n n+1 0
=
a b
+
a
b
0
n

n
n
X
X
n
n m n+1m
am bn+1m +
a b
m1
m
m=1
m=1
=

n 0 n+1
n + 1 n+1 0
a b
+
a
b
0
n+1


n
X
n
n
+
+
am bn+1m
m

1
m
m=1
=

n
n 0 n+1
n + 1 n+1 0 X n + 1 m n+1m
a b
+
a
b +
a b
0
n+1
m
m=1
=

n + 1 m n+1m
a b
.
m
m=0
n+1
X

Una consecuencia inmediata es que

Pn

n
m=0 m

De forma similar se demuestra en general:

= (1 + 1)n = 2n .

Teorema 2.27 Sea A un anillo conmutativo y unitario,n un n


umero natural y
a1 , . . . , ak elementos de A. Entonces se cumple:
(a1 + + ak )n =

n1 ,...,nk

n
an1 ank k ,
n1 nk 1

donde la suma se extiende sobre todos los n


umeros naturales n1 , . . . , nk tales
que n1 + + nk = n.

2.5. Anillos de polinomios

2.5

73

Anillos de polinomios

Si x e y son n
umeros enteros, xy + x y x2 2y son otros n
umeros enteros.
2
Su suma es x + xy + x 2y y su producto
(xy + x)(x2 2y) = x2 (xy + x) 2y(xy + x) = x3 y + x3 2xy 2 2xy.
Al trabajar con n
umeros enteros surgen f
acilmente relaciones de este estilo
y a menudo resulta muy u
til poder tratarlas como objetos y no como meros
terminos que relacionan n
umeros concretos. Ahora vamos a presentar una construcci
on general que permite a
nadir a cada anillo unitario A un conjunto de
elementos indeterminados, como aqu son x e y, de modo que obtengamos un
nuevo anillo con elementos como x3 y+x3 2xy 2 2xy. A estos objetos los llamaremos polinomios. Un polinomio no es nada m
as que esto, pero la construcci
on
formal resulta un tanto tecnica.
Definici
on 2.28 Sea S un conjunto. Llamemos M el conjunto de las aplicaciones u : S N tales que el conjunto {i S | u(i) 6= 0} es finito.
Por ejemplo, si S = {x, y, z} y una funci
on u M cumple u(x) = 3, u(y) = 1,
u(z) = 7, nuestra intenci
on es que u represente al monomio puro x3 yz 7 .
Si u, v son funciones de M llamaremos u + v a la funci
on dada por
(u + v)(i) = u(i) + v(i).
Claramente u + v est
a en M .
Notemos que la suma u + v representa al producto de los monomios representados por u ypor v. Si m N y u M llamaremos mu a la funci
on dada
por (mu)(i) = m u(i) . Tambien es claro que mu est
a en M . Es claro que mu
representa a la potencia msima del monomio representado por u. Llamaremos
0 a la funci
on de M que toma constantemente el valor 0.
Si x S llamaremos x M a la funci
on que toma el valor 1 en x y vale 0
en cualquier otro punto. Claramente, x representa al monomio x.
Notemos que si u M y x1 , . . . , xn son los puntos donde u no se anula,
entonces u puede expresarse como u = u(x1 )x1 + + u(xn )xn . Si pensamos
en el primer ejemplo, esto se interpreta como que el monomio u es el producto
del monomio x elevado a 3, por el monomio y, por el monomio z elevado a 7.
Un polinomio arbitrario, como x3 y + x3 2xy 2 2xy, es una suma de monomios no necesariamente puros, sino multiplicados por coeficientes en un anillo
dado. Esto nos lleva a la definici
on siguiente:
Si A es un anillo unitario, llamaremos conjunto de los polinomios con indeterminadas en S sobre A al conjunto A[S] formado por las funciones f : M A
tales que el conjunto {u M | f (u) 6= 0} es finito.

74

Captulo 2. Anillos

As, si f A[S] y u M , el elemento f (u) se interpreta como el coeficiente


del monomio u en f . Con estas ideas el lector puede convencerse de que la
definici
on l
ogica de las operaciones en A[S] es la siguiente:
(f + g)(u) = f (u) + g(u),

(f g)(u) =

f (v)g(w).

v+w=u

Notemos que el sumatorio que define el producto es finito.


Teorema 2.29 Sea A un anillo unitario y S un conjunto. Entonces A[S] es
un anillo unitario. Si A es conmutativo, A[S] tambien lo es.
n: Es f
Demostracio
acil ver que para todos los polinomios f , g, h A[S],
se cumple (f + g) + h = f + (g + h) y f + g = g + f .
La aplicaci
on 0 : M A que toma constantemente el valor 0 es el elemento
neutro de A[S] y si f A[S], la funci
on dada por (f )(u) = f (u) es el
simetrico de f . Si f , g, h A[S] y u M se cumple

P
P
P
(f g)h (u) =
f (s)g(t)h(w) =
f (s)g(t)h(w)
v+w=u s+t=v
w+s+t=u

P
P
=
f (s)g(t)h(w) = f (gh) (u),
s+v=u t+w=v

luego (f g)h = f (gh).

f (g + h) (u) =

f (v) g(w) + h(w)


v+w=u
P
P
=
f (v)g(w) +
f (v)h(w) = (f g)(u) + (f h)(u),
P

v+w=u

v+w=u

luego f (g + h) = f g + f h, e igualmente (f + g)h = f h + gh.


Sea 1 la aplicaci
on que vale 1 sobre 0 M y vale 0 en otro caso. Entonces
(f 1)(u) = f (u), luego f 1 = f . Igualmente 1f = f .
Si A es conmutativo
(f g)(u) =

f (v)g(w) =

v+w=u

g(w)f (v) = (gf )(u),

v+w=u

luego f g = gf , es decir, A[S] es conmutativo.


Los teoremas siguientes prueban que los polinomios son lo que esperamos
que sean. El primer paso es sumergir A en A[S]. El teorema siguiente es una
comprobaci
on rutinaria.
Teorema 2.30 Sea A un anillo unitario y S un conjunto. Para cada a A sea
fa el polinomio que cumple fa (0) = a y que toma el valor 0 en cualquier otro
caso. Sea : A A[S] la aplicaci
on dada por (a) = fa . Entonces es un
monomorfismo de anillos y si A es unitario (1) = 1.

2.5. Anillos de polinomios

75

Definici
on 2.31 En lo sucesivo, si A es un anillo unitario, S un conjunto y
a A, escribiremos a en lugar de (a) y A en lugar de [A]. De este modo A es
un subanillo de A[S]. Para cada x S llamaremos x
al polinomio que cumple
x
(x ) = 1 y que toma el valor 0 en cualquier otro caso. La aplicaci
on que a cada
x le asigna x
es biyectiva, luego podemos identificar x con x
y as considerar
que S A[S]. A los elementos de S los llamaremos indeterminadas.
El teorema siguiente recoge el comportamiento de los polinomios construidos
a partir de las indeterminadas mediante productos. Inmediatamente despues
probaremos que todo polinomio puede construirse a partir de las indeterminadas
mediante sumas y productos.
Teorema 2.32 Sea A un anillo unitario y S un conjunto.
1. Si k N, a A y x S, entonces el polinomio axk toma el valor a sobre
kx y 0 en otro caso.
2. Si k1 , . . . , kn N, a A y x1 , . . . , xn son indeterminadas distintas, entonces el polinomio axk11 xknn toma el valor a sobre k1 x1 + + kn xn
y 0 en otro caso.
3. Si x, y S, entonces xy = yx.
4. Si a A y x S, entonces ax = xa.
n:
Demostracio
1. Por inducci
on sobre k. Para k =
0 es inmediato. Supuesto cierto para k,
entonces (axk+1 )(u) = (axk )x (u) = (axk )(v)x(w) = 0 salvo si v = kx
y w = x , es decir, salvo si u = (k + 1)x , en cuyo caso da a.
2. Por inducci
on sobre n. Para n = 1 es el caso anterior. Supuesto cierto
kn+1
kn+1
kn
para n tenemos que (axk11 xn+1
)(u) = (axk1
1 xn )(v)(xn+1 )(w) = 0
salvo que v = k1 x1 + + kn xn y w = kn+1 xn+1 , es decir, salvo si
u = k1 x1 + + kn+1 xn+1 , en cuyo caso vale a.
3. es inmediato por 2, pues ambos polinomios son la misma funci
on.
4. Basta notar que el caso 1 se prueba igual con a por la derecha.
Como consecuencia inmediata tenemos:
Teorema 2.33 Sea A un anillo unitario y S un conjunto. El polinomio
m
P

ai xk1i1 xknin ,

i=1

donde a1 , . . . , am A, x1 , . . . , xn son indeterminadas distintas y las ntuplas


de naturales (ki1 , . . . , kin ) son todas distintas, vale ai sobre ki1 x1 + + kin xn
y vale 0 en cualquier otro caso.

76

Captulo 2. Anillos

Como los polinomios de esta forma cubren todas las aplicaciones posibles de
M en A (con un n
umero finito de im
agenes no nulas) hemos demostrado:
Teorema 2.34 Sea A un anillo unitario y S un conjunto. Todo polinomio no
nulo de A[S] se expresa en la forma descrita en el teorema anterior para ciertas
indeterminadas, ciertos elementos de A y ciertas ntuplas de naturales. La
expresi
on es u
nica (salvo el orden) si exigimos que todos los ai sean no nulos y
que cada indeterminada tenga exponente no nulo en al menos un sumando.
Definici
on 2.35 En la expresi
on de 2.33, los elementos ai se llaman coeficientes
del polinomio. Concretamente ai es el coeficiente del termino en xk1i1 xknin .
Se entiende que si un termino no aparece en la expresi
on, su coeficiente es 0
(siempre puede a
nadirse multiplicado por 0).
Un polinomio con un u
nico coeficiente no nulo (o sea, un polinomio de la
forma a xk11 . . . xknn ) es un monomio de grado k1 + + kn y coeficiente a. Por
lo tanto, todo polinomio se expresa siempre como suma de monomios. A veces
se les llama binomios, trinomios, etc. seg
un el n
umero de monomios que los
compongan. El grado de un polinomio no nulo p de p es el mayor de los grados
de sus monomios con coeficiente no nulo y lo representaremos por grad p.
El coeficiente del termino del monomio cuyos exponentes son todos nulos se
llama termino independiente, es decir, el termino independiente de f es f (0).
Un polinomio cuyo u
nico coeficiente no nulo sea a lo sumo el termino independiente es un polinomio constante. Los polinomios constantes son exactamente
los elementos de A, seg
un la identificaci
on que hemos realizado.
Tenemos definidos anillos de polinomios con cualquier cantidad de indeterminadas, posiblemente infinitas. Cuando S = {x1 , . . . , xn } es finito, en lugar de
A[S] se escribe tambien A[x1 , . . . , xn ].
Por ejemplo, un elemento de Z[x, y, z] es 3x5 y 2 z 2 + 8x2 z 6z 2 + 5. El
termino independiente es 5, el coeficiente del monomio en x2 z es 8 (en el cual
la indeterminada y tiene exponente 0), el coeficiente del monomio en x5 es 0.
Cuando s
olo hay una indeterminada la expresi
on de un polinomio es m
as
m
P
i
sencilla. Cada polinomio no nulo de A[x] es de la forma
ai x , y la expresi
on
i=0

es u
nica si exigimos que am 6= 0.
El coeficiente del monomio de mayor grado de p se llama coeficiente director
del polinomio p. Un polinomio de A[x] es m
onico si su coeficiente director es 1.
La suma y el producto de polinomios con una indeterminada es m
as simple:
m
P

ai xi +

i=0

m
P

ai x

i=0

m
P

bi xi =

i=0

n
P

(ai + bi )xi ,

i=0
i

bi x

i=0

m
P

m+n
P
k=0

i+j=k

ai bj xk .

Por ejemplo, un elemento de Z[x] es 2x + 5x2 11x + 6. Se trata de un


polinomio de grado 5 con coeficiente director igual a 2.
5

2.5. Anillos de polinomios

77

En la pr
actica escribiremos p = p(x1 , . . . , xn ) para indicar que las indeterminadas x1 , . . . , xn son las u
nicas (a lo sumo) que aparecen en el polinomio p
con exponentes no nulos.
Evaluaci
on de polinomios La evaluaci
on de polinomios es un concepto muy
sencillo: si p(x) = 2x2 4x, pretendemos que p(3) sea 2 32 4 3 = 6. No
obstante vamos a definir las evaluaciones en un contexto m
as general que nos
ser
au
til despues.
Definici
on 2.36 Sean A y B dos anillos conmutativos y unitarios, : A B
un homomorfismo,
on. Para cada
Pm S un conjunto y v : S B cualquier aplicaci
polinomio p = i=1 ai xk1i1 . . . xknin A[S] definimos
p(v) =

m
P

(ai ) v(x1 )ki1 . . . v(xn )kin B.

i=1

La conmutatividad de B y la unicidad de la expresi


on hacen que p(v) este
bien definido, pues dos expresiones de p difieren s
olo en el orden de las indeterminadas y en la presencia de monomios con coeficiente 0, o de indeterminadas
con exponente 0, pero en cualquier caso se obtiene el mismo elemento de B.
Tenemos, por tanto, una aplicaci
on : A[S] B dada por (p) = p(v).
En definitiva (p) se calcula reemplazando los coeficientes de p por su imagen
por y las indeterminadas por sus im
agenes por v.
En la pr
actica, si p = p(x1 , . . . , xn ) escribiremos p(b1 , . . . , bn ) para indicar
el polinomio que resulta de evaluar cada indeterminada xi con el elemento bi .
Notar que aunque S pueda ser infinito, p(v) s
olo depende de la forma en
que v act
ua sobre las indeterminadas que aparecen en p, que son siempre un
n
umero finito. Cuando sea simplemente la identidad en A no lo escribiremos,
y expresaremos la evaluaci
on mediante p(b1 , . . . , bn ).
Teorema 2.37 Sean A y B dos anillos conmutativos y unitarios, : A B
un homomorfismo tal que (1) = 1, S un conjunto y v : S B cualquier
aplicaci
on. Entonces la evaluaci
on : A[S] B es el u
nico homomorfismo
que coincide con sobre A y con v sobre S.
n: Sean p, q A[S], digamos
Demostracio
p=

m
P

i=1

ai xk1i1 . . . xknin ,

q=

m
P

i=1

bi xk1i1 . . . xknin .

Observemos que no hay problema en suponer que los exponentes de los monomios son los mismos, pues podemos a
nadir monomios con coeficiente 0 hasta
igualar ambas expresiones.
m

m
P
P
ki1
kin
(p + q) =
(ai + bi ) x1 . . . xn
=
(ai + bi )v(x1 )ki1 . . . v(xn )kin
i=1

i=1

78

Captulo 2. Anillos
=

m
m

P
P
(ai ) + (bi ) v(x1 )ki1 . . . v(xn )kin =
(ai )v(x1 )ki1 . . . v(xn )kin

i=1

i=1

m
P

(bi )v(x1 )ki1 . . . v(xn )kin = (p) + (q).

i=1

Para probar que conserva productos usaremos el hecho ya probado de que


conserva las sumas.

!
m
P
ki1 +kj1
kin +kjn
(pq) =
ai bj x1
. . . xn
i,j=1

=
=
=

m
P

k +kj1

(ai bj x1i1

i,j=1
m
P

. . . xknin +kjn )

(ai bj ) v(x1 )ki1 +kj1 . . . v(xn )kin +kjn

i,j=1
m
P

(ai )(bj ) v(x1 )ki1 +kj1 . . . v(xn )kin +kjn

i,j=1

m
P

ki1

(ai ) v(x1 )

i=1

kin

. . . v(xn )

m
P

kj1

(bj ) v(x1 )

. . . v(xn )

j=1

= (p)(q).

kjn

La unicidad es evidente.
De este teorema se deducen varios casos particulares de interes.
Teorema 2.38 Sean A y B anillos conmutativos y unitarios y : A B un
homomorfismo tal que (1) = 1. Sea S un conjunto. Entonces existe un u
nico
homomorfismo : A[S] B[S] que coincide con en A y deja invariantes a
las indeterminadas. Adem
as es inyectivo, suprayectivo o biyectivo si lo es.
n: El homomorfismo no es sino el construido en el teorema
Demostracio
anterior tomando como v la identidad en S. Concretamente
m

m
P
P
ki1
kin

ai x1 . . . xn
=
(ai ) xk1i1 . . . xknin .
i=1

i=1

Todo lo pedido es obvio.

Esto significa en particular que si A es un subanillo de B podemos considerar


A[S] como un subanillo de B[S]. As por ejemplo, Z[S] Q[S].
Teorema 2.39 Sea A un anillo conmutativo y unitario. Sea S un conjunto
y supongamos que S = X Y con X e Y disjuntos. Sea B el conjunto de
los polinomios de A[S] tales que todos sus monomios con coeficientes no nulos
tengan tan s
olo indeterminadas de X con exponentes no nulos. Entonces B es
un subanillo de A[S] isomorfo a A[X] y A[S] es isomorfo a A[X][Y ].

2.5. Anillos de polinomios

79

n: Sea : A[X] A[S] el homomorfismo construido en 2.37


Demostracio
con la identidad en A y la identidad en X. Es claro que B es la imagen de y
que es un monomorfismo.
Ahora sea : A[X][Y ] A[S] el homomorfismo construido en 2.37 a partir
de y de la identidad en Y . Es inmediato probar que se trata de un isomorfismo
de anillos.
Por ejemplo, el polinomio 3x5 y 2 z 2 + 8x2 z 6z 2 + 5 de Z[x, y, z] puede ser
identificado con (3x5 y 2 6)z 2 + (8x2 )z + 5 Z[x, y][z], donde ahora 3x5 y 2 6
es el coeficiente de z 2 .
Si lo queremos en Z[z][x, y] ser
a: 3z 2 (x5 y 2 ) + (8z)x2 + (6z 2 + 5), donde
2
ahora 6z + 5 es el termino independiente.
Por otra parte si S T podemos considerar A[S] A[T ].
Propiedades algebraicas Las principales propiedades algebraicas de los anillos de polinomios se deducen de consideraciones sobre los grados. Es obvio que
el grado de la suma de dos polinomios f y g de A[x] es menor o igual que el
m
aximo de los grados de f y g. Ser
a igual a dicho m
aximo si sus grados son
distintos, pero si coinciden se pueden cancelar los coeficientes directores y el
grado de la suma disminuye:
(3x5 2x2 + 5x + 2) + (3x5 + x3 x2 + 1) = x3 3x2 + 5x + 3.
El grado del producto es a lo sumo la suma de los grados. Normalmente se
da la igualdad. Las u
nicas excepciones se dan si uno de los factores es nulo, o
si alguno de los coeficientes directores es un divisor de cero.
Teorema 2.40 Sea A un anillo unitario y p, q dos polinomios no nulos de A[x]
tales que al menos el coeficiente director de uno de ellos no sea un divisor de
cero. Entonces pq 6= 0, grad(pq) = grad(p) + grad(q) y el coeficiente director
del producto es el producto de los coeficientes directores.
n: Sean p =
Demostracio
ces pq =

m+n
P

m
P

i=0

k=0 i+j=k

ai xi , q =

n
P

i=0

bi xi , con am 6= 0 6= bn . Enton-

ai bj xk y el coeficiente de xm+n es exactamente am bn 6= 0,

puesto que uno de ellos no es divisor de cero. Por lo tanto am bn es el coeficiente


director de pq y el grado es m + n.

Teorema 2.41 Sea A un dominio ntegro y S un conjunto cualquiera. Entonces


A[S] es un dominio ntegro.
n: El teorema anterior nos da que si A es un dominio ntegro
Demostracio
entonces A[x] tambien lo es. Aplic
andolo un n
umero finito de veces obtenemos
que si A es un dominio ntegro y S es finito, entonces A[S] tambien lo es. Si S
es arbitrario y f , g son dos polinomios no nulos de A[S], entonces los monomios
con coeficientes no nulos de f y g contienen un n
umero finito de indeterminadas

80

Captulo 2. Anillos

con exponente no nulo, luego f y g est


an en un subanillo A[X] con X finito,
luego A[X] es un dominio ntegro, luego f g 6= 0. Por tanto A[S] es un dominio
ntegro.
Teorema 2.42 Sea A un dominio ntegro y S un conjunto. Entonces las unidades de A[S] son las mismas que las de A.
n: Ve
Demostracio
amoslo primero para A[x]. Si p A[x] es una unidad,
entonces existe otro polinomio no nulo q tal que pq = 1. Por 2.40 tenemos que
grad p + grad q = grad 1 = 0, luego ha de ser grad p = grad q = 0, es decir, p y
q est
an en A, luego p es una unidad en A.
De aqu se sigue el resultado para A[S] con S finito y, por el mismo argumento
que en el teorema anterior, vale para todo S.

Fracciones algebraicas En particular vemos que A[S] no es un cuerpo aunque A lo sea. Como s es un dominio ntegro, podemos definir su cuerpo de
fracciones.
Definici
on 2.43 Sea A un dominio ntegro y S un conjunto. Llamaremos
cuerpo de las fracciones algebraicas o funciones racionales sobre A con indeterminadas en S al cuerpo de cocientes de A[S]. Lo representaremos por A(S).
As, por ejemplo, un elemento de Z(x, y) es

x4 x3 y
x3 4xy 2 +4 .

Ejercicio: Probar que Z(S) = Q(S).

Quiz
a este es un buen momento para empezar a entender la utilidad del
lenguaje algebraico que hemos empezado a introducir en este captulo: el hecho de que Z[x] sea un anillo (y m
as concretamente un dominio ntegro) nos
permite tratar formalmente a sus elementos con las mismas reglas b
asicas que
a los n
umeros enteros. El hecho de que conozcamos la construcci
on general del
cuerpo de cocientes de un dominio ntegro justifica que hablemos de fracciones
de polinomios exactamente igual que de fracciones de enteros, y estos ejemplos
son s
olo una mnima parte de los que nos vamos a encontrar.
Divisi
on de polinomios Debemos ocuparnos ahora de la posibilidad de dividir polinomios. Esta es una caracterstica importantsima de los anillos con
una indeterminada.
Teorema 2.44 Sea A un anillo unitario, D y d dos polinomios no nulos de A[x]
tales que el coeficiente director de d sea una unidad en A. Entonces existen unos
u
nicos polinomios c y r en A[x] tales que D = dc + r con el grado de r menor
estrictamente que el grado de d (tambien podemos exigir que D = cd + r, pero
si A no es conmutativo los polinomios que cumplan esto no tienen por que ser
los mismos).

2.6. Apendice: Sumas y productos finitos

81

n: Si grad D < grad d basta tomar c = 0 y r = D. SupongaDemostracio


mos que grad d grad D.
n
m
P
P
Sea D =
ai xi , d =
bi xi , con an 6= 0 6= bm y m n. Adem
as estamos
i=0

i=0

suponiendo que bm es una unidad de A. Veamos el teorema por inducci


on
sobre n.
Si n = 0, entonces tambien m = 0, es decir, D = a0 , d = b0 , luego basta
tomar c = (b0 )1 a0 y r = 0. Supong
amoslo cierto para polinomios de grado
menor que n.
m
P
nm
i+nm
Consideremos db1
=
bi b1
. El monomio de mayor
m an x
m an x
i=0

grado es bm (bm )1 an xm+nm = an xn , luego se trata de un polinomio de grado n


con coeficiente director an .
Consecuentemente el polinomio D d(bm )1 an xnm tiene grado menor
que n, luego por hip
otesis de inducci
on existen polinomios c0 y r de manera
nm
0
nm
que D db1
a
x
=
dc
+
r
con
grad
r < grad d. Sea c = b1
+ c0 .
m n
m an x
As D = dc + r como se peda.
Veamos ahora la unicidad. Supongamos que D = dc + r = dc0 + r0 . Entonces
d(cc0 ) = r0 r. Si cc0 6= 0, como el coeficiente director de d es una unidad, por
el teorema 2.40. resulta que grad(r0 r) = grad(d(cc0 )) = grad d+grad(cc0 ),
pero grad(r0 r) < grad d grad d + grad(c c0 ), contradicci
on. Concluimos
entonces que c = c0 , luego tambien r = r0 .
El lector que sepa dividir n
umeros naturales puede adaptar su metodo para
dividir tambien polinomios. No hay ninguna diferencia esencial.
Es importante que para poder dividir polinomios el divisor debe tener coeficiente director unitario. En particular podemos dividir siempre entre polinomios
m
onicos. Cuando A es un cuerpo todos los coeficientes son unidades, luego se
pueden dividir polinomios cualesquiera. Como en este caso el grado del producto es la suma de los grados, tenemos todas las condiciones exigidas en la
definici
on de dominio eucldeo, es decir:
Teorema 2.45 Si K es un cuerpo, entonces el anillo de polinomios K[x] es un
dominio eucldeo.
Sin embargo esto es falso si K no es un cuerpo. Por ejemplo Z[x] no es un
dominio eucldeo. Tampoco es cierto en anillos de polinomios con m
as de una
indeterminada. Por ejemplo Q[x, y] no es un dominio eucldeo. Estos hechos los
probaremos en el captulo siguiente. Es interesante notar que en estos momentos
no tenemos idea de c
omo puede probarse la no existencia de una norma eucldea.

2.6

Ap
endice: Sumas y productos finitos

Presentamos en este apendice las propiedades b


asicas que justifican las operaciones con sumas y productos finitos de elementos de un semigrupo A con
elemento neutro. En realidad podramos prescindir del elemento neutro, pero

82

Captulo 2. Anillos

as se simplifica la exposici
on. Recordemos la definici
on 2.3 de producto finito:
dada una sucesi
on {ai }ni=1 de elementos de A, definimos
Q
Q
Q
ai = 1,
ai = ( ai ) aj ,
i<0

i<j+1

i<j

para j n, de modo que en particular tenemos definido el producto finito de


los elementos dados:
n
Q
Q
a0 an =
ai =
ai .
i=0

i<n+1

A su vez, definiendo

n
Q

ai =

i=m

nm
Q

am+i ,

para m n

i=0

se cumple la relaci
on recurrente
u
Q

v+1
Q

ai = au ,

i=u

ai =

i=u

v
Q

ai

i=u

av+1 ,

para u v < n. Esto puede resumirse con la notaci


on

v
Q

i=u

ai = au av .

El teorema siguiente afirma que un producto puede partirse en bloques:


a1 an = (a1 an1 )(an1 +1 an2 ) (anm1 +1 an ).
Teorema 2.46 (Propiedad asociativa generalizada) Sea A un semigrupo
con elemento neutro, sea {ai }ni=1 una sucesi
on de elementos de A, y sea {nj }m
j=0
una sucesi
on de n
umeros naturales 0 = n0 < n1 < < nm = n. Entonces
n
Q

ai =

i=1

m
Q

nj
Q

ai .

j=1 i=nj1 +1

n: Observemos que el primer producto del miembro derecho


Demostracio
nj
Q
m
es el definido a partir de la sucesi
on
ai j=1 .
i=nj1 +1

En primer lugar demostramos que, para todo si 1 u n nk , se cumple


la igualdad
nkQ
+u
nk
nkQ
+u
Q
ai =
ai
ai .
i=1

i=1

i=nk +1

Razonamos por inducci


on sobre u. Para u = 0 no hay nada que probar y
para u = 1 es claramente cierta. Si vale para u 1, entonces

!
n +u
nk +u+1
nk
nkQ
+u
k
Q
Q
Q
ai =
ai ank +u+1 =
ai
ai ank +u+1
i=1

i=1

i=1

nk
Q

i=1

ai

nk +u+1
Q

ai .

i=nk +1

i=nk +1

2.6. Apendice: Sumas y productos finitos

83

En particular, si aplicamos esto a u = nk+1 nk obtenemos que


nQ
k+1

nk
Q

ai =

i=1

ai

i=1

nQ
k+1

ai .

i=nk +1

Ahora probamos por inducci


on sobre k que si 1 k m, entonces
nk
Q

ai =

i=1

nj
Q

k
Q

ai .
j=1 i=nj1 +1

Para k = 0 la igualdad se reduce a 1 = 1. Supuesto cierto para k, si k + 1 m


tenemos que

!
nj
nj
nQ
nQ
nQ
nk
k
k+1
k+1
k+1
k+1
Q
Q
Q
Q
Q
ai =
ai
ai =
ai
ai =
ai .
i=1

i=1

i=nk +1

j=1 i=nj1 +1

i=nk +1

j=1 i=nj1 +1

Aplicando esto a k = m obtenemos la igualdad del enunciado.

A partir de este punto vamos a suponer que el semigrupo es conmutativo y,


pasamos a emplear notaci
on aditiva por ilustrar tambien el uso de esta notaci
on,
si bien podramos mantener tambien la notaci
on multiplicativa.
Teorema 2.47 (Propiedad conmutativa generalizada) Sea A un semigrupo conmutativo y con elemento neutro. Sea {ai }ni=1 una sucesi
on de elementos de A y sea : In In biyectiva. Entonces
n
P

ai =

i=1

n
P

i=1

a(i) .

n: Lo probamos por inducci


Demostracio
on sobre n. Si n = 0 por definici
on ambos miembros son 0. Si vale para n, consideramos una sucesi
on
{ai }n+1
on : In+1 In+1 . Pongamos que (k) = n + 1.
i=1 en A y una biyecci
Por la propiedad asociativa generalizada,
n+1
P
i=1

a(i) =

k1
P
i=1

a(i) + an+1 +

n+1
P

a(i) =

i=k+1

k1
P
i=1

a(i) +

n
P

k1
P
i=1

a(i) +

n+1
P

i=k+1

a(i+1) + an+1 .

i=k

La u
ltima igualdad se debe a que, por definici
on,
n+1
P

a(i) =

i=k+1

Sea : In In dada por


(i) =

nk
P
i=0

a(k+i+1) =

n
P

a(i+1) .

i=k

(i)
si i < k,
(i + 1) si i k.

a(i) + an+1

84

Captulo 2. Anillos

Entonces:
n+1
P
i=1

a(i) =

k1
P
i=1

a (i) +

n
P

a (i) + an+1 =

i=k

n
P

ai + an+1 =

i=1

n+1
P

n
P

i=1

a (i) + an+1

ai .

i=1

donde hemos usado la propiedad asociativa generalizada y la hip


otesis de inducci
on.
Este teorema afirma que una suma finita no depende del orden de los sumandos. Para hacer esto m
as explcito vamos a considerar una sucesi
on {ai }iI ,
donde I es un conjunto finito cualquiera, no necesariamente de la forma In .
Sea n = |I| y sean f : In I, g : In I dos biyecciones. Entonces
= f 1 g : In In es tambien una biyecci
on y cumple que
a(f (i)) = ag(f 1 (f (i))) = ag(i) .
Por el teorema anterior,
definici
on siguiente:

n
P

i=1

af (i) =

n
P

i=1

a(f (i)) =

n
P

i=1

ag(i) . Esto justifica la

Definici
on 2.48 Sea A un semigrupo cuya operaci
on sea conmutativa y tenga
elemento neutro. Sea I un conjunto finito no vaco, sean {ai }iI elementos de
A. Definimos
n
P
P
ai =
af (i) ,
iI

i=1

donde n = |I| y f : In I es cualquier biyecci


on.

Hemos demostrado que la suma as definida es la misma sea P


cual sea la
biyecci
on f empleada para calcularla. Convenimos adem
as en que
Ai = 0.
i

El teorema siguiente sobre cambio del conjunto de ndices es inmediato:

Teorema 2.49 Sea A un semigrupo conmutativo con elemento neutro, consideremos una biyecci
on h : I J entre conjuntos finitos y sean {aj }jJ
elementos de A. Entonces
P
P
ah(i) =
aj .
iI

jJ

n: Si los conjuntos son vacos la igualdad se reduce a 0 = 0.


Demostracio
En caso contrario tomamos n = |I| y f : In I biyectiva y observamos que
si aplicamos la definici
on de suma finita con f para el miembro izquierdo y
f h : In J para el miembro derecho, obtenemos en ambos casos la misma
suma finita.
Ahora podemos expresar la propiedad asociativa generalizada bajo hip
otesis
m
as generales que en la versi
on precedente:

2.6. Apendice: Sumas y productos finitos

85

Teorema 2.50 (Propiedad asociativa generalizada) Sea A un semigrupo


conmutativo con elemento neutro, sea {Ij }m
j=1 una familia de conjuntos finitos
m
S
disjuntos dos a dos, sea I =
Ij y sean {ai }iI elementos de A. Entonces,
j=1

ai =

m P
P

ai .

j=1 iIi

iI

n: Sea kj = |Ij | y sea fj : Ikj Ij biyectiva. Definimos


Demostracio
por recurrencia:
n0 = 0,

nj+1 = nj + kj+1 ,

para 0 j < m.

Sea fj0 : {i N | nj1 + 1 i nn } Ij dada por fj0 (i) = fn (i nj1 ),


claramente biyectiva. Como los conjuntos Ij son disjuntos, las funciones fj0
determinan una funci
on f : Inm I biyectiva. Entonces
P

ai =

n
m
P

i=1

iI

af (i) =

m
P

nj
P

j=1 i=nj1

afj0 (i) =

kj
m P
P

j=1 i=1

afj (i) =

m P
P

ai .

j=1 iIi

Todas las propiedades elementales de las sumas y productos finitos pueden


demostrarse ya f
acilmente, bien a partir de las propiedades que hemos demostrado, bien mediante inducciones sencillas.
Por ejemplo, consideremos la propiedad de intercambio de sumatorios:
n P
m
P

aij =

i=1 j=1

m P
n
P

aij .

j=1 i=1

n
S
Para probarla basta considerar In Im =
{i} Im y aplicar el teorema ani=1
terior:

(i,j)In Im

e igualmente

aij =

n
P

aij =

i=1 (i,j){i}Im

(j,i)Im In

aij =

n P
P

i=1 jIm

m P
n
P

aij =

n P
m
P

aij ,

i=1 j=1

aij ,

j=1 i=1

y los dos miembros izquierdos son iguales por el teorema 2.49, considerando la
biyecci
on f : In Im Im In dada por f (i, j) = (j, i).

Captulo III

Aritm
etica en dominios
ntegros
En el captulo anterior hemos presentado la aritmetica elemental de los
n
umeros enteros, es decir, hemos definido la suma y el producto y hemos visto
que podemos dividir n
umeros enteros, sea para obtener n
umeros racionales, sea
mediante la divisi
on eucldea, para obtener un cociente y un resto enteros. Ahora
vamos a ascender un nivel introduciendo los conceptos de la aritmetica cl
asica:
m
ultiplos, divisores, primos, etc. Todo esto podra hacerse mediante tecnicas
elementales que no involucraran m
as que los conceptos que ya conocemos sobre
n
umeros enteros (incluso podramos trabajar exclusivamente con n
umeros naturales), pero aqu vamos a adoptar un punto de vista eminentemente algebraico,
y formularemos los resultados en terminos que los hagan v
alidos para una clase
muy amplia de anillos, de modo que todos los resultados sobre divisibilidad,
primos, etc. que demostremos para Z ser
an autom
aticamente aplicables a otros
contextos en los que se cumplan unos requisitos mnimos.

3.1

Ideales

En el an
alisis algebraico de la aritmetica es fundamental el concepto de ideal.
Este concepto surgi
o relativamente tarde en el estudio de los n
umeros debido
en gran parte a que para el caso de los n
umeros enteros se vuelve trivial y, por
lo tanto prescindible, e incluso invisible, en el sentido de que a nadie se le
ocurrira definir el concepto de ideal para formular con ellos una serie de hechos
que se enuncian con total naturalidad sin hacer referencia a ellos. Sin embargo,
sucede que cuando las propiedades aritmeticas de Z se expresan en terminos
de ideales, entonces son directamente generalizables a otros contextos, mientras
que las formulaciones cl
asicas que no involucran ideales no lo permiten, de modo
que quien piensa en terminos de ideales puede ver que dos contextos diferentes
son esencialmente an
alogos cuando a quien s
olo piense en terminos de n
umeros
o, m
as en general, de elementos de un anillo puede no ver relaci
on entre ellos.
87

88

Captulo 3. Aritmetica en dominios ntegros

Definici
on 3.1 Un ideal en un dominio1 A es un conjunto I A que cumpla
las propiedades siguientes:
1. 0 I,
2. si a, b I, entonces a + b I,
3. si a A y b I entonces ab I.
Notemos que la propiedad 3. nos da en particular que si b I entonces
b = (1)b I, y combinando esto con 2. resulta que si a, b I, entonces
tambien a b = a b I.
Si a A, se llama ideal principal generado por a al ideal
aA = Aa = {ab | b A}.
El conjunto aA es lo que habitualmente se llama el conjunto de los m
ultiplos
de a en A. Es inmediato comprobar que es realmente un ideal de A. Lo que
expresan los axiomas de la definici
on de ideal es que el 0 siempre es m
ultiplo
de a, que la suma de dos m
ultiplos de a es tambien m
ultiplo de a y que todo
m
ultiplo de un m
ultiplo de a es tambien un m
ultiplo de a.
Del mismo modo que podemos ver el concepto de dominio como una selecci
on de propiedades b
asicas que satisfacen los n
umeros enteros y que abstraemos para aplicarlas a otros objetos que pueden ser muy distintos de los
n
umeros enteros, el concepto de ideal surgi
o como una selecci
on de las propiedades b
asicas que cumplen los conjuntos de m
ultiplos, con la idea de que
pueden ser aplicables a otros subconjuntos de un anillo que no sean realmente
conjuntos de m
ultiplos.
Todo anillo tiene al menos dos ideales, a saber, {0} y el propio A. Se les llama
ideales impropios. El ideal {0} es el ideal trivial y se representa simplemente
por 0. Notemos que ambos son principales, pues 0 = 0A y A = 1A.
Un poco m
as en general, un hecho simple, pero importante, sobre ideales es
que si un ideal I de un dominio A contiene una unidad, entonces I = A.
En efecto, si u I es una unidad, por definici
on de ideal se cumple que
1 = u1 u I y si a A, entonces a = a 1 I. As pues, todo elemento de A
est
a en I.
Por lo tanto, los u
nicos ideales de un cuerpo son los impropios, pues si un
ideal de un cuerpo posee un elemento no nulo, este ser
a una unidad, y el ideal
ser
a el cuerpo completo.
As pues, el concepto de ideal se vuelve trivial cuando se aplica a los cuerpos,
y lo mismo sucede en una amplia clase de anillos, en un sentido menos radical
que recoge la definici
on siguiente:
1 La definici
on es v
alida para anillos unitarios arbitrarios sin m
as que a
nadir que tambi
en
ba I en la propiedad 3.

3.1. Ideales

89

Un dominio de ideales principales (DIP) es un dominio ntegro en el que


todo ideal es principal.
La observaci
on precedente muestra que todo cuerpo es trivialmente DIP,
pero se cumple algo mucho m
as general:
Teorema 3.2 Todo dominio eucldeo es un dominio de ideales principales.
n: Sea A un dominio eucldeo y sea : A \ {0} N su norma
Demostracio
eucldea. Sea I 6= 0 un ideal de A (si I = 0 ya es principal). Sea a I tal que
(a) sea el mnimo del conjunto {(b) | b I, b 6= 0}.
Si b I, entonces b = ac + r, con r = 0 o bien (r) < (a). Como a I,
por la definici
on de ideal ac I, y a su vez b ac I, es decir, r I. Como
(a) es mnimo, no puede ser (r) < (a), luego r = 0, es decir, b = ac aA.
Hemos probado que I aA. Como a I, la otra inclusi
on es consecuencia
de la definici
on de ideal. Por tanto I = aA es un ideal principal.
En particular tenemos que Z es un DIP, es decir, los u
nicos ideales de Z son
los de la forma nZ, para n Z. Tambien son DIP los anillos de polinomios
K[x], donde K es un cuerpo.
Esto es lo que hace que el concepto de ideal sea superfluo al estudiar la
aritmetica de Z o de anillos como K[x]. Cada ideal I de un DIP es de la
forma I = aA, para cierto a A, y todo lo que se diga en terminos de I
puede decirse igualmente en terminos de a, sin necesidad de mencionar ideales
para nada. Sin embargo, vamos a ver las propiedades aritmeticas expresadas
en terminos de ideales son m
as generales que las expresadas en terminos de
elementos reales del anillo, pues siguen siendo v
alidas en contextos en los que
no existe la correspondencia entre (elementos) ideales y elementos reales que
se da en los DIP.
Terminamos esta secci
on introduciendo algunos conceptos convenientes para
tratar con ideales en anillos que no sean DIP.
Definici
on 3.3 Es inmediato que la intersecci
on de una familia (no vaca) de
ideales de un anillo A sigue siendo un ideal de A. Por lo tanto si X A, existe
un mnimo ideal de A que contiene a X, a saber, la intersecci
on de la familia
de todos los ideales de A que contienen a X (existe al menos uno, el propio A).
Lo llamaremos ideal generado por X y lo representaremos por (X). Tambien se
dice que el conjunto X es un generador del ideal (X).
As, para todo subconjunto X de A tenemos que (X) es un ideal de A,
X (X) y si I es un ideal de A tal que X I, entonces (X) I. Otro hecho
obvio es que si X Y A, entonces X (Y ), luego (X) (Y ).
Cuando el conjunto X es finito, X = {x1 , . . . , xn }, el ideal generado por X
se representa por (x1 , . . . , xn ). Entonces se dice que el ideal est
a finitamente
generado.
El teorema siguiente nos da la forma de los elementos de un ideal a partir
de sus generadores.

90

Captulo 3. Aritmetica en dominios ntegros

Teorema 3.4 Sea A un dominio y X A. Entonces


(X) = {a1 x1 + + an xn | n N, ai A, xi X}
En particular si x A, entonces (x) = aA = {ax | a A}.
n: Se comprueba sin dificultad que el conjunto de la derecha
Demostracio
es un ideal de A y claramente contiene a X, luego
(X) {a1 x1 + + an xn | n N, ai A, xi X}.
Por otra parte (X) ha de contener a los elementos de la forma ax, con x
en X, y por ser un subanillo a las sumas de estos elementos, luego se da la
igualdad.
n
n
P

P
Si X tiene un s
olo elemento x, las sumas
ai x =
ai x est
an en el
i=1

i=1

conjunto {ax | a A}, luego (X) {ax | a A}. La otra inclusi


on es obvia.
As pues, los ideales principales son los ideales generados por un u
nico elemento del anillo.2
El teorema siguiente nos proporciona ejemplos de dominios que no son DIP:
Teorema 3.5 Sea A un dominio ntegro. Entonces A[x] es DIP si y s
olo si A
es un cuerpo.
n: Si A es un cuerpo sabemos que A[x] es un dominio euclDemostracio
deo, luego es un DIP. Recprocamente, si A[x] es DIP, sea a A un elemento
no nulo y veamos que es una unidad en A. Para ello consideramos el ideal (x, a)
de A[x]. Como ha de ser un ideal principal existe un polinomio p A[x] tal que
(x, a) = (p), luego a = pq para cierto q A[x], pero entonces grad p + grad q =
grad a = 0, luego grad p = 0 y por tanto p A. Por otra parte tambien
x = pr, para cierto r A[x], pero entonces el coeficiente director de x, que es 1,
es el producto de p por el coeficiente director de r, luego p es una unidad y
(p) = A[x].
Entonces 1 (p) = (x, a), luego 1 = ux + va, para ciertos polinomios
u, v A[x]. Sin embargo el termino independiente de ux es 0 y el de va es ba,
donde b es el termino independiente de v. Resulta, pues, que 1 = ba, con lo que
a es una unidad en A.
En particular Z[x] no es DIP, ni en particular eucldeo.
vale para
Lo mismo

A[S] cuando S tiene m


as de un elemento (pues A[S] = A S \{x} [x] y A[S \{x}]
no es un cuerpo).
Ejercicio: Probar que (x, 2) no es un ideal principal de Z[x], y que (x, y) no es un
ideal principal de Q[x, y].
2 Pero

esto no contradice que un mismo ideal principal pueda tener varios generadores. Por
ejemplo, en Z es claro que (3) = (3). El ideal admite dos generadores, pero s
olo es necesario
uno para generarlo.

3.1. Ideales

91

Esto responde a un problema que habamos dejado planteado al final del


captulo anterior: como Z[x] no es DIP, podemos asegurar que no es un dominio
eucldeo. As pues, no es posible dividir en general polinomios con coeficientes
enteros en los terminos del teorema 2.44, de modo que la restricci
on all impuesta
de que el coeficiente director del divisor sea una unidad no puede eliminarse.
Tampoco es un dominio eucldeo Q[x, y], por la misma raz
on.
Sin embargo, estos anillos, como Z[x] o Q[x, y], aunque no son DIP, cumplen
una propiedad m
as debil de interes:
Definici
on 3.6 Un dominio ntegro A es un anillo noetheriano si todo ideal de
A es finitamente generado.
Evidentemente, todo DIP es un anillo noetheriano.
Teorema 3.7 Sea A un dominio ntegro. Son equivalentes:
1. A es un anillo noetheriano.
2. Para toda cadena ascendente de ideales de A
I0 I1 I2 I3 . . .
existe un n
umero natural n tal que In = Im para todo m n.

3. Toda familia no vaca de ideales de A tiene un maximal3 para la inclusi


on.
n: Si I0 I1 I2 I3 . . . es una cadena ascendente de
Demostracio
S
ideales de A, es f
acil ver que la uni
on i=0 Ii es tambien un ideal de A. Si A
es noetheriano ha de tener un generador finito X. Cada elemento de X est
a
en uno de los ideales Ii , y como X es finito y los ideales
forman
una
cadena,
S
existir
a un natural n tal que X In , pero entonces i=0 Ii = (X) In , lo que
implica que Ii = In para todo i n. Por tanto 1) implica 2).
Si una familia no vaca de ideales de A no tuviera maximal, se podra extraer4
una cadena ascendente de ideales que contradijera 2), luego 2) implica 3).
Si A tuviera un ideal I que no admitiera un generador finito, entonces, dado
cualquier elemento a0 de I, se cumple que (a0 ) 6= I, luego existe un elemento
a1 I \ (a0 ), luego (a0 ) (a0 , a1 ) 6= I, y de esta forma podemos conseguir5 una
cadena de ideales (a0 ) (a0 , a1 ) (a0 , a1 , a2 ) . . . sin que ninguno de ellos
sea maximal. Por lo tanto 3) implica 1).
3 En general, en un conjunto parcialmente ordenado X, un elemento maximal m es un
elemento tal que no existe otro x X tal que m < x. Aqu estamos considerando a la
inclusi
on como un orden parcial en la familia de los ideales de A, y si F es una familia de
ideales de A, un ideal I F es maximal para la inclusi
on ni no existe otro J F tal que
I J.
4 Este

es el primer uso que hacemos del axioma de elecci


on, pero en la versi
on d
ebil del
Principio de elecciones dependientes (A.3). En efecto, lo aplicamos tomando como A una
familia de ideales F y como R la relaci
on dada por I R J si y s
olo si I J. La hip
otesis de que
F no tiene maximal equivale a la hip
otesis que requiere el Principio de elecciones dependientes,
que a su vez nos da la cadena ascendente requerida.
5 T
ecnicamente aqu se aplica tambi
en el principio de elecciones dependientes. Ahora el
conjunto A es la familia de las funciones s : In I tales que s(i + 1) I \ (s(0), . . . , s(i))
para cada i < n, y la relaci
on R es la inclusi
on estricta.

92

Captulo 3. Aritmetica en dominios ntegros

Hemos visto que, aunque Z o Q sean DIP, eso no implica que Z[x] o Q[x, y]
lo sean. En cambio, eso no pasa con la propiedad de Noether:
Teorema 3.8 (Teorema de Hilbert) Si A es un anillo noetheriano entonces
A[x1 , . . . , xn ] tambien lo es.
n: Basta probar que si A es noetheriano tambien lo es A[x],
Demostracio
pues esto implica que lo es A[x1 ], luego tambien A[x1 ][x2 ] = A[x1 , x2 ], y as
llegamos hasta A[x1 , . . . , xn ].
Sea I un ideal de A[x]. Sea Ii el conjunto de los coeficientes directores de
los polinomios de I de grado i (m
as el 0).
Es claro que Ii es un ideal de A, as como que I0 I1 I2 I3 (para
ver que un elemento de Ii est
a en Ii+1 basta multiplicar por x el polinomio que
justifica que est
a en Ii ). Como A es noetheriano, los ideales Ii son iguales a
partir de un Ir .
Sea Ii = (bi1 , . . . , bin ) para i = 0, . . . , r (no es restricci
on suponer que el
n
umero de generadores es el mismo para todos los ideales, pues siempre podemos
a
nadir generadores redundantes). Podemos suponer tambien que los bij 6= 0.
Sea pij un polinomio en I de grado i cuyo coeficiente de grado i sea bij .
Vamos a probar que I = (pij | i = 0, . . . , r, j = 1, . . . , n). Claramente este ideal
est
a contenido en I.
Sea f I un polinomio de grado d. Veremos que est
a en el ideal generado
por los pij por inducci
on sobre d. El coeficiente director de f est
a en Id . Si
d > r notamos que los coeficientes directores de xdr pr1 , . . . , xdr prn son los
n
umeros br1 , . . . , brn , que generan Id = Ir . Por consiguiente, existen elementos
c1 , . . . , cn en A tales que el coeficiente director de f es de la forma
c1 xdr pr1 + + cn xdr prn .
Por consiguiente, el polinomio f c1 xdr pr1 cn xdr prn tiene grado
menor que d (ya que los terminos de mayor grado se cancelan) y est
a en I, luego
por hip
otesis de inducci
on f est
a en el ideal generado por los pij .
Si d r obtenemos un polinomio f c1 pd1 cn pdn de grado menor
que d y contenido en I, con lo que se concluye igualmente.
Terminamos esta secci
on observando que entre los ideales de un anillo se
puede definir una suma y un producto como sigue:
Definici
on 3.9 Sea A un anillo y sean S1 , . . . , Sn subconjuntos de A. Llamaremos
S1 + + Sn
S1 Sn

= {s1 + + sn | si Si para i = 1, . . . , n},


nP
o
m
=
si1 sin | m N y sij Sj para j = 1, . . . , n .
i=1

Es pura rutina comprobar que la suma y el producto de ideales de A vuelve


a ser un ideal de A. Adem
as son operaciones asociativas, conmutativas y distributivas, es decir, P (Q + R) = P Q + P R. De la definici
on de ideal se sigue que
P Q P Q.

3.2. Divisibilidad en dominios ntegros

3.2

93

Divisibilidad en dominios ntegros

Es bien conocido que todo n


umero natural (mayor que 1) se descompone
de forma u
nica salvo el orden en producto de n
umeros primos. Por ejemplo, la
descomposici
on de 360 es
360 = 23 32 5.
Demostraremos este hecho en la secci
on siguiente, mientras que en esta introduciremos todos los conceptos necesarios para enunciar el teorema con precisi
on
y con un cierto grado de generalidad. Empezamos con los conceptos de m
ultiplo
y divisor, que ya hemos introducido de pasada al discutir la definici
on de ideal:
Definici
on 3.10 Sea A un dominio ntegro y a, b dos elementos de A. Diremos
que a divide a b, o que a es un divisor de b, o que b es un m
ultiplo de a, o que b
es divisible entre a (y lo representaremos a | b) si existe un elemento c de A tal
que b = ac.
Por ejemplo en Z tenemos que 3 divide a 15, pero no a 16.
Existen algunos casos triviales de divisibilidad que conviene tener presentes:
0 no divide a ning
un elemento de A salvo a s mismo.
Todo elemento de a divide6 a 0.
Si u A es una unidad, entonces divide a todo a A, pues a = u(u1 a).
Si u A es una unidad, sus u
nicos divisores son las dem
as unidades de a,
pues si a | u, entonces existe un b en A tal que u = ab, luego 1 = abu1 ,
luego a es una unidad.
Es obvio que a | a y que si a | b y b | c entonces a | c. Esto significa que
la divisibilidad es una relaci
on reflexiva y transitiva. De hecho est
a cerca de
determinar una relaci
on de orden parcial, pero en realidad no es antisimetrica.
Por el contrario, el fallo de la antisimetra da lugar a un concepto no trivial:
Diremos que dos elementos a y b de A son asociados si a | b y b | a.
Por ejemplo, en Z tenemos que 3 y 3 son asociados. En general:

Dos elementos no nulos a, b de un dominio A son asociados si y s


olo si existe
una unidad u A tal que a = ub.
En efecto, si a y b son asociados, entonces a = ub y b = va, para ciertos u y
v del anillo A. Por lo tanto a = uva, de donde uv = 1, luego u y v son unidades.
El recproco es trivial, teniendo en cuenta que a = ub equivale a b = u1 a.
6 Ling
usticamente, existe una contradicci
on aparente entre el hecho de que A, por ser un
dominio ntegro, no tiene divisores de 0 y que todos los elementos de A dividen a 0. Lo que
sucede es que todos los elementos de A dividen a 0 trivialmente, es decir, con cociente 0,
mientras que un divisor de 0 es, por definici
on, un elemento que divide a 0 no trivialmente,
con cociente no nulo.

94

Captulo 3. Aritmetica en dominios ntegros

Es claro que la asociaci


on en un dominio ntegro A es una relaci
on de equivalencia. Si A tiene un n
umero finito de unidades, u1 , . . . , un , entonces los
asociados de un a A no nulos ser
an au1 , . . . , aun (entre los que est
a ya el
propio a, ya que una de las unidades ser
a la identidad). As pues, las clases de
equivalencia para la relaci
on de asociaci
on son la formada s
olo por el 0 y las
restantes, que tendr
an n elementos cada una. Como en Z hay dos unidades, 1,
los asociados no nulos en Z se agrupan por parejas: 1, 2, 3, etc.
El concepto de asociaci
on es importante por el motivo siguiente: si queremos
enunciar un teorema de descomposici
on u
nica en factores primos v
alido para Z,
nos vemos obligados a relajar la condici
on de unicidad, ya que, por ejemplo,
360 = 2 2 2 3 3 5 = (2) 2 3 (3) 5.
Aqu tenemos dos descomposiciones en factores primos que no se diferencian
u
nicamente en el orden de los factores. Si quisieramos enunciar el teorema para
n
umeros enteros podramos decir que la descomposici
on es u
nica salvo signos,
pero si queremos un enunciado v
alido para anillos m
as generales la f
ormula
correcta es salvo unidades o salvo asociados.
En efecto, la propia definici
on de asociado implica que dos elementos asociados tienen los mismos m
ultiplos y divisores, por lo que si un primo aparece
en una descomposici
on en factores, esta se puede modificar para que aparezca
en su lugar cualquiera de sus asociados, tal y como hemos hecho con la factorizaci
on del 360, en la que hemos cambiado un 2 por un 2 a cambio de cambiar
tambien un 3 por un 3.
Hay que tener la misma precauci
on al definir el concepto de primo, pues
cuando trabajamos con n
umeros naturales podemos decir que 5 es primo porque
sus u
nicos divisores son 1 y 5, pero si trabajamos con n
umeros enteros resulta
que 5 tiene cuatro divisores: 1 y 5.
En general, en cualquier dominio ntegro A, tenemos que todo elemento
a A tiene por divisores a las unidades de A y a sus propios asociados (entre
los que figura el mismo). A estos divisores los llamaremos divisores impropios
de a. Cualquier otro divisor es un divisor propio.
Por ejemplo, los divisores impropios de 4 en Z son 1, 1, 4 y 4. Sus
divisores propios son 2 y 2. En este sentido podemos decir que 5 s
olo tiene
(en Z) los divisores impropios.
Con estas precauciones, ya podemos dar una definici
on razonable de elemento irreducible en un anillo:
Un elemento a de un dominio ntegro A es irreducible en A si es no nulo, no
es una unidad y no admite ninguna descomposici
on a = bc con b y c elementos
de A, salvo que uno de ellos sea una unidad (y, por lo tanto, el otro es un
asociado de a).
Equivalentemente, un elemento (no nulo ni unidad) es irreducible si sus
u
nicos divisores son los impropios. Es obvio que un elemento es irreducible si y
s
olo si lo es cualquiera de sus asociados.

3.2. Divisibilidad en dominios ntegros

95

En este sentido podemos decir que 5 (al igual que 5) es irreducible en Z.


Es importante que decimos irreducible y no primo, la definici
on de primo
la daremos un poco m
as adelante y, aunque ambas ser
an equivalentes en Z,
en otros anillos no lo ser
an, por lo que el lector debe acostumbrarse a que
no tener divisores propios es la definici
on de elemento irreducible y no la de
elemento primo. Observemos que dicha definici
on excluye tambien al cero y a
las unidades, de modo que 1 y 1 no son irreducibles en Z, por definici
on.
Los elementos no nulos ni unitarios que no son irreducibles se dicen reducibles. As pues, 1 y 1 no son ni reducibles ni irreducibles, sino que en todo
dominio ntegro tenemos el 0, las unidades, los elementos irreducibles y los reducibles.
Ahora ya podemos introducir la noci
on fundamental que est
abamos persiguiendo:
Un dominio ntegro A es un dominio de factorizaci
on u
nica (DFU) si todo
elemento a de A no nulo y que no sea una unidad se descompone como producto de elementos irreducibles a = c1 cn y la descomposici
on es u
nica salvo
ordenaci
on o cambio por asociados (es decir, si a = c1 cn = d1 dm son dos
descomposiciones de a en elementos irreducibles, entonces m = n y, ordenando
los factores adecuadamente, cada ci es asociado a di ).
En la secci
on siguiente demostraremos que Z es un DFU en este sentido. El
resto de esta secci
on lo dedicaremos introducir algunos conceptos m
as relacionados con las descomposiciones en irreducibles.
Si A es un DFU y a es un elemento no nulo ni unitario, para cada elemento
irreducible p de A llamaremos exponente de p en a al n
umero de veces que p o
sus asociados aparecen en cualquier descomposici
on de a en factores irreducibles
(puede ser igual a 0). Lo denotaremos por vp (a).
Por ejemplo, teniendo en cuenta la descomposici
on de 360 en factores irreducibles que hemos mostrado antes, se cumple que
v2 (360) = 3,

v3 (360) = 2,

v5 (360) = 1,

vp (360) = 0 para p 7.

En general, en una descomposici


on de un a A aparecer
an vp (a) factores
asociados a p, es decir, factores de la forma up donde u es una unidad. Si
multiplicamos todas las unidades que as aparecen, resulta que a admite una
descomposici
on en la forma
a = u pn1 1 pnnm ,
donde los pi son irreducibles distintos, ni = vpi (a) y u es una unidad.
La presencia de u es necesaria, pues, por ejemplo, la u
nica forma de factorizar
en Z el 25 de este modo es 25 = (1)52 . Lo importante es que cada p aparece
siempre con exponente vp (a) en virtud de la unicidad de la factorizaci
on.
Adem
as el exponente de un irreducible en un elemento a es por definici
on el
mismo que el de sus asociados, y el exponente de un irreducible en un elemento a

96

Captulo 3. Aritmetica en dominios ntegros

es el mismo que en los asociados de a (pues una factorizaci


on de un asociado de
a se obtiene multiplicando una factorizaci
on de a por una unidad, sin cambiar
los irreducibles).
La factorizaci
on en irreducibles de un producto puede obtenerse como el
producto de las factorizaciones de los factores, de donde se sigue la relaci
on
vp (ab) = vp (a) + vp (b).
Podemos definir vp (a) = 0 para todo irreducible p cuando a es una unidad, y
as la relaci
on anterior es v
alida tambien si a o b es una unidad.
Notemos que un irreducible p divide a un elemento a si y s
olo si vp (a) 6= 0.
En efecto, si vp (a) 6= 0 eso significa que p aparece en una factorizaci
on de a,
luego p | a. Por otra parte si p | a, entonces a = pb para cierto elemento b, luego
vp (a) = vp (p) + vp (b) = 1 + vp (b) 6= 0.
Si a | b, ha de cumplirse que vp (a) vp (b) para todo irreducible p de A. La
condici
on es tambien suficiente, pues si se cumple esto, entonces b se obtiene
como producto de a por el producto de todos los irreducibles p que dividen a b
elevados al exponente vp (b) vp (a) (y una unidad adecuada).
Dos elementos a y b son asociados si y s
olo si vp (a) = vp (b) para todo
irreducible p de A.
Como consecuencia de estos hechos tenemos que en un DFU, si p es irreducible y p | ab, entonces p | a o p | b.
En efecto, estamos suponiendo que 0 6= vp (a) + vp (b), luego una de los dos
exponentes ha de ser no nulo.
Este hecho resulta ser muy importante en la teora de la divisibilidad, hasta
el punto de que conviene introducir un nuevo concepto para comprenderlo adecuadamente:
Si A es un dominio ntegro, diremos que un elemento p de A es primo si es
no nulo, no es una unidad y cuando p | ab entonces p | a o p | b, para todos los
elementos a y b de A.
Ya hemos probado la mitad del siguiente teorema fundamental:
Teorema 3.11 Sea A un dominio ntegro
1. Todo primo de A es irreducible.
2. Si A es DFU, un elemento de A es primo si y s
olo si es irreducible
n: Efectivamente, si p es primo y se descompone como p = ab,
Demostracio
entonces p | a o p | b, pero como a | p y b | p, lo que tenemos es que p es asociado
con a o con b, lo que implica que el otro es una unidad. La segunda afirmaci
on
ya est
a probada.
As pues, una vez sabemos que un dominio ntegro es DFU, ya podemos
hablar de descomposiciones en factores primos en lugar de descomposiciones en

3.3. Ideales y divisibilidad

97

factores irreducibles, pues ambos conceptos coinciden. Pero hay que recordar
que en ausencia de factorizaci
on u
nica primo es un concepto m
as fuerte que
irreducible.

3.3

Ideales y divisibilidad

Aunque todava no estamos en condiciones de comprender enteramente por


que, lo cierto es que los ideales proporcionan el lenguaje id
oneo para expresar
los hechos m
as relevantes de la divisibilidad en un anillo. Como ya sabemos,
si a es un elemento de un dominio ntegro A, entonces el ideal (a) = Aa es
precisamente el conjunto de todos los m
ultiplos de a.
Es claro que a | b equivale a (b) (a), de donde se sigue que a y b son
asociados si y s
olo si (a) = (b), es decir, si y s
olo si generan el mismo ideal.
Hemos de pensar que dos elementos asociados son una misma cosa a efectos
de divisibilidad (ambos tienen los mismos m
ultiplos y divisores). Ahora vemos
que a cada familia de elementos asociados de un dominio ntegro le corresponde
un u
nico ideal principal. En particular el 0 se corresponde con el ideal 0 = (0)
y las unidades de A se corresponden todas ellas con el ideal A = (1).
El lector que quiera comprender adecuadamente la teora de la divisibilidad
debe esforzarse por llegar a entender que los ideales principales representan
mejor que los elementos mismos del anillo los posibles divisores de un elemento
dado. Quiz
a en esta direcci
on le ayude conocer un debil esbozo informal del
modo en que el concepto de ideal era concebido cuando apareci
o en la teora:
Consideremos las dos afirmaciones siguientes relativas a Z. Por una parte
2 | 6 y por otra 2 | 6. A efectos de divisibilidad ambas son equivalentes, puesto
que 2 y 2 son asociados. Podemos resumirlas en una sola si consideramos que
es el ideal (2) = (2) el que divide a 6, y escribimos en consecuencia (2) | 6.
Podemos pensar que los divisores de los elementos de un dominio ntegro no
son otros elementos del anillo, sino sus ideales. As, podemos definir (a) | b
como a | b, lo cual no depende del generador elegido para el ideal, pues dos
cualesquiera son asociados. Notemos que esto equivale a que b (a), luego si I
es un ideal principal tenemos (por definici
on) que I | b b I.
Lo que hace de esto una idea brillante es que en realidad no tenemos por
que exigir a I que sea principal, con lo que cualquier ideal I puede dividir a un
elemento en este sentido.
En un DIP cada divisor ideal se corresponde con una familia de divisores reales asociados (sus generadores), pero hay anillos no DIP en los que se
puede hablar coherentemente de divisores ideales en este sentido sin que esten
asociados a divisores reales, es decir, sin que sean principales. Tales divisores
ideales resultan esenciales para formular una teora de divisibilidad razonable
(y u
til) en dichos anillos. De hecho, los ideales en el sentido moderno fueron
introducidos por Dedekind a finales del siglo XIX para formalizar esta idea de
divisor ideal que no se corresponde con ning
un divisor real.

98

Captulo 3. Aritmetica en dominios ntegros

M
as en general, podemos extender la relaci
on de divisibilidad de modo que
los ideales puedan dividirse entre s. Podemos pensar que un ideal I divide a un
ideal J si J I (comparar con a | b (b) (a)). De momento no entraremos
en la teora de divisores ideales, sino que nos limitaremos a desarrollar la teora
de divisibilidad en dominios ntegros mostrando su conexi
on con los ideales del
anillo. El lector debe tener presente que esta conexi
on se volver
a esencial en
captulos posteriores, por lo que debe acostumbrarse a pensar e interpretar las
cosas en terminos de ideales en la medida de lo posible.
Como primer ejemplo del paso a terminos de ideales, veamos el equivalente
del concepto de elemento primo:
Definici
on 3.12 Un ideal P de un anillo A es primo si P 6= A y para todo par
de ideales I, J de A tales que IJ P , se cumple que I P o J P .
Si tenemos in mente la equivalencia I | J J I vemos que la definici
on
de ideal primo es paralela a la de elemento primo. La condici
on P 6= A se
corresponde con la exigencia de que los primos no sean unidades. Hay, no
obstante, una discrepancia debida principalmente a motivos hist
oricos, y es que,
si bien hemos exigido que el elemento 0 no sea considerado primo, s admitimos
que el ideal 0 sea considerado primo. He aqu una caracterizaci
on pr
actica del
concepto de ideal primo.
Teorema 3.13 Si A es un dominio ntegro, un ideal P de A es primo si y s
olo
si P 6= A y para todo par de elementos a, b de A, si ab P entonces a P o
b P.
n: Si P es primo y ab P , entonces (a)(b) (ab) P , de
Demostracio
donde resulta que (a) P o (b) P , o sea, a P o b P .
Recprocamente, si IJ P , pero I no est
a contenido en P , entonces existe
un a I \ P . Ahora, si b J tenemos que ab IJ P , luego a P o b P ,
y ha de ser b P , es decir, J P .
Ahora es inmediato que en un dominio ntegro A se cumple que un elemento
no nulo a es primo si y s
olo si el ideal (a) es un ideal primo. No obstante
recordamos que el ideal trivial (0) es primo, aunque el elemento 0 no lo es por
definici
on. Si un elemento es irreducible cuando no tiene divisores propios, el
concepto an
alogo para ideales es el siguiente:
Definici
on 3.14 Un ideal M de un anillo A es un ideal maximal si M 6= A y
si I es un ideal de A tal que M I A, entonces M = I o I = A.
Como en el caso de ideales primos, estamos admitiendo la posibilidad de que
el ideal 0 sea maximal (si bien no tiene por que serlo necesariamente).
Al contrario de lo que ocurre con el concepto de primo, no es cierto que un
elemento a de un dominio ntegro A sea irreducible si y s
olo si el ideal (a) es
maximal. La situaci
on es un poco m
as delicada. Concretamente a es irreducible

3.3. Ideales y divisibilidad

99

si y s
olo si (a) es maximal entre los ideales principales, es decir, si (a) 6= A y
cuando (a) (b) A, entonces (a) = (b) o (b) = A.
En efecto, si a es irreducible y (a) (b) A, entonces b | a, luego o bien
b es una unidad (y entonces (b) = A) o bien b es asociado de a (con lo que
(b) = (a)). El recproco es igual. Por lo tanto tenemos:
Teorema 3.15 Sea A un dominio ntegro y a 6= 0 un elemento de A.
1. a es primo si y s
olo si (a) es primo.
2. a es irreducible si y s
olo si (a) es maximal entre los ideales principales
de A.
3. Si A es DIP, entonces a es irreducible si y s
olo si (a) es maximal.
La tercera afirmaci
on es inmediata, pues en un DIP los ideales maximales
coinciden con los ideales maximales entre los ideales principales.
Hemos visto que todo elemento primo de un anillo es irreducible. Entre
ideales podemos demostrar justo la implicaci
on contraria:
Teorema 3.16 En un dominio, todo ideal maximal es primo.
n: Si M es un ideal maximal en A y ab M , pero a, b
Demostracio
/ M,
tendramos que M M + (a) A, luego la maximalidad de M implica que
M + (a) = A. Por lo tanto 1 = m + xa para cierto m M y cierto x A. As
pues b = mb + xab M , con lo que tenemos una contradicci
on.
Ahora estamos en condiciones de probar dos hechos clave.
Teorema 3.17 En un DIP los ideales maximales coinciden con los ideales primos y los elementos irreducibles coinciden con los elementos primos.
n: Si A es un DIP y (a) es un ideal primo no trivial, suDemostracio
pongamos que (b) es un ideal tal que (a) (b) A. Entonces a = bc para
cierto c A. Como (a) es primo se ha de cumplir o bien b (a) (en cuyo
caso (a) = (b)) o bien c (a), en cuyo caso c = da para cierto d A, y as
a = bc = bda, luego (dado que a 6= 0), bd = 1, o sea, b es una unidad y por lo
tanto (b) = A.
La segunda afirmaci
on se sigue de la primera y de 3.15
Con esto podemos probar el resultado principal de esta secci
on. Diremos
que un dominio ntegro A tiene la propiedad de factorizaci
on si todo elemento
de A no nulo ni unidad se descompone en producto de irreducibles.
Teorema 3.18 Todo anillo noetheriano A tiene la propiedad de factorizaci
on.
Si adem
as todo elemento irreducible de A es primo, entonces A es DFU. En
particular todo DIP es DFU.

100

Captulo 3. Aritmetica en dominios ntegros

n: Sea A un anillo noetheriano. Llamemos S al conjunto de


Demostracio
los elementos de A no nulos ni unidades pero que no admitan una descomposici
on
en irreducibles. Hemos de probar que S es vaco.
Si existe un elemento a en S, entonces a no es unidad, luego (a) 6= A. Si
a fuera irreducible entonces el mismo sera una descomposici
on en irreducibles,
luego no lo es. Podemos factorizar a = bc donde ni b ni c es una unidad (ni 0). Si
ninguno estuviera en S entonces se descompondran en producto de irreducibles,
y a tambien. Por tanto al menos uno de los dos est
a en S. Digamos que b S.
Como b | a se cumple que (a) (b). La inclusi
on es estricta, pues si (a) = (b)
entonces a y b seran asociados, es decir, a = bu para cierta unidad u, pero
entonces bu = bc, luego c = u sera una unidad, cuando no lo es.
En definitiva hemos probado que para cada a S existe un b S tal que
(a) (b). Repitiendo este proceso obtendramos una sucesi
on creciente de
ideales (ao ) (a1 ) (a2 ) en contradicci
on con el teorema 3.7. Por lo
tanto S ha de ser vaco y as todo elemento no nulo ni unitario de A admite una
descomposici
on en irreducibles.
Supongamos que los irreducibles coinciden con los primos y que tenemos
dos descomposiciones en irreducibles de un mismo elemento a = c1 cn =
d1 dm . Podemos suponer que m n.
Como dm es primo, ha de dividir a uno de los factores de c1 cn y como
estos son irreducibles, de hecho ha de ser asociado a uno de ellos. Pongamos
que dm es asociado a cn . Entonces cn = um dm para cierta unidad um .
Simplificando dm obtenemos que c1 cn1 um = d1 dm1 . Repitiendo el
proceso con dm1 (y teniendo en cuenta que un irreducible no puede dividir
a una unidad), llegamos tras m pasos a que c1 cnm u1 um = 1, lo que
obliga a que n = m, pues ning
un irreducible puede dividir a 1. Adem
as hemos
obtenido que cada ci es asociado a di , luego la descomposici
on es u
nica.
Con esto tenemos probada la factorizaci
on u
nica de Z y de los anillos K[x]
donde K es un cuerpo. Para el caso de Z es posible dar argumentos directos
m
as elementales basados en el buen orden de N. Por ejemplo, para encontrar
un factor irreducible de un n
umero entero basta tomar el menor natural que lo
divide. Lo mismo ocurre con K[x] considerando el grado de los polinomios.
Para terminar probamos un resultado general sobre existencia de ideales
maximales. Notemos que para anillos noetherianos se cumple trivialmente sin
necesidad del axioma de elecci
on:
Teorema 3.19 (AE) Todo anillo unitario A en el que 1 6= 0 tiene un ideal
maximal. M
as a
un, todo ideal I 6= A est
a contenido en un ideal maximal de A.
n: Dado un anillo unitario A, basta aplicar el lema de Zorn a
Demostracio
la familia de ideales de A distintos de A y que contienen a I, considerada como
conjunto parcialmente ordenado por la inclusi
on. Si C es una
S familia de tales
ideales totalmente ordenada por la inclusi
on, es f
acil ver que C es un ideal de
A que contiene a I, y es distinto de A porque no puede contener a 1 (es en este
punto donde se requiere que A sea unitario). El lema de Zorn nos da entonces
un ideal maximal de A que contiene a I.

3.4. Divisibilidad en Z

3.4

101

Divisibilidad en Z

En Z podemos afinar la unicidad de la descomposici


on en factores primos
exigiendo que estos sean positivos, es decir, n
umeros naturales. As, la descomposici
on en primos del n
umero 60 es 60 = 2 2 3 5, y no consideraremos otras
como 2 2 (3) (5). Si no se indica lo contrario, cuando hablemos de primos
en Z nos referiremos a naturales primos.
El problema m
as elemental que surge a raz de todo esto es encontrar un
metodo para obtener las factorizaciones en primos de n
umeros cualesquiera.
En particular sera conveniente hallar un metodo para reconocer los n
umeros
primos. El metodo m
as simple para hallar todos los primos hasta un n
umero
dado es la llamada criba de Erat
ostenes, que consiste en escribir una lista con
los primeros n naturales, tachar el 1, que no es primo por definici
on, despues
tachar todos los m
ultiplos de 2 (salvo el propio 2), dejar el menor n
umero que
queda (el 3) y tachar sus m
ultiplos, dejar el menor n
umero que queda (el 5) y
tachar sus m
ultiplos, etc. Los n
umeros que sobrevivan ser
an los primos menores
que n. He aqu la lista de los primos menores que 100, que hacen un total de 25:
2,
43,

3,

5,

47,

7,

11,

13,

17,

19,

23,

29,

31,

37,

41,

53,

59,

61,

67,

71,

73,

79,

83,

89,

97.

Para descomponer un n
umero en factores primos podemos ir probando a
dividirlo por los primos menores que el hasta hallar uno que lo divida e ir
repitiendo la operaci
on con los cocientes que vayamos obteniendo. Notemos que
si queremos factorizar un n
umero n y m cumple que n m2 , entonces, si n no
es primo, el menor primo que divide a n ha de ser menor que m. Por ejemplo,
el menor primo que divida a un n
umero menor que 100 ha de ser menor que 10,
luego si un n
umero menor que 100 no es divisible entre 2, 3, 5 o 7, entonces es
primo.
En cualquier caso, siempre es posible distinguir los n
umeros primos de los
compuestos y hallar la factorizaci
on de cualquier n
umero en un n
umero finito
de pasos. M
as adelante encontraremos tecnicas para abordar este problema con
m
as elegancia.
Una cuesti
on importante es si el n
umero de primos es finito o infinito. La
respuesta es que es infinito. Para probarlo observemos que en general un primo
p no puede dividir al mismo tiempo a un n
umero n y a n + 1, pues entonces
dividira a su diferencia, que es 1. De hecho, en Z, si p divide a n, el pr
oximo
n
umero al que divide es n + p. Sabiendo esto demostramos:
Teorema 3.20 (Euclides) En Z hay infinitos n
umeros primos.
n: Dado un n
Demostracio
umero n, consideremos n! Se cumple que todo
n
umero menor o igual que n divide a n!, luego ning
un n
umero menor o igual
que n divide a n! + 1. En consecuencia un divisor primo de n! + 1 ha de ser
mayor que n. Por lo tanto por encima de cada n
umero n hay siempre un n
umero
primo. Esto implica que hay infinitos primos.

102

Captulo 3. Aritmetica en dominios ntegros

Definici
on 3.21 Sea A un dominio ntegro y X un subconjunto de A. Diremos
que un elemento d de A es un m
aximo com
un divisor (mcd) de los elementos
de X si d divide a los elementos de X y cualquier elemento de A que cumpla lo
mismo es un divisor de d.
Diremos que un elemento m de A es un mnimo com
un m
ultiplo (mcm) de
los elementos de X si es m
ultiplo de todos los elementos de X y todo elemento
de A que cumpla lo mismo es un m
ultiplo de m.
Es obvio que m es un mcd o un mcm de X si y s
olo si lo es cualquiera de
sus asociados, es decir, estos conceptos son u
nicos salvo unidades. Por supuesto
el mcd o el mcm de un conjunto dado no tiene por que existir. No obstante,
cualquier subconjunto finito de un DFU tiene mcd y mcm. El lector puede
entretenerse probando que las siguientes recetas nos dan un mcd y un mcm
de cualquier subconjunto finito X de un DFU:
Un mcd de X est
a formado por el producto de los primos que dividen
a todos los elementos de X elevados al mnimo exponente con el que
aparecen en alguno de los elementos de X.
Un mcm de X est
a formado por el producto de todos los primos que
dividen a alg
un elemento de X elevados al mayor exponente con el
que aparecen en los elementos de X.
Por ejemplo, dados los n
umeros
22 3 75 ,

2 5 7,

su mcd es 7 y el mcm es 22 34 52 75 .

34 52 7,

Escribiremos mcd(a1 , . . . , an ) y mcm(a1 , . . . , an ) para representar el mcd y el


mcm de los elementos a1 , . . . , an . A veces el mcd lo representaremos simplemente
por (a1 , . . . , an ).
En Z el mcd es u
nico si lo exigimos positivo. Si no se indica lo contrario
siempre lo supondremos as.
Hay que prestar un poco de atenci
on al cero: por definici
on todo elemento
de un anillo divide a 0, de donde se sigue f
acilmente que el mcd de un conjunto
de elementos que contenga a 0 es el mismo que el del conjunto que resulte de
eliminarlo. Por otra parte si un conjunto de elementos contiene una unidad, su
mcd es 1.
Los elementos de un conjunto son primos entre s si su mcd es 1, es decir,
si no tienen divisores primos comunes. No hay que confundir esto con que sean
primos entre s dos a dos, que es m
as fuerte. Si dividimos los elementos de un
conjunto por su mcd obtenemos un conjunto de elementos primos entre s, pues
si d es el mcd y p es un primo que dividiera al conjunto resultante, entonces dp
dividira al conjunto original, luego dp | d y p sera una unidad.

En particular, A es un DFU, K es su cuerpo de cocientes y a, b A son


no nulos, podemos expresarlos como a = da0 y b = db0 , donde (a0 , b0 ) = 1 y
entonces a/b = a0 /b0 , por lo que toda fracci
on de K se puede elegir irreducible,
en el sentido de que el numerador y el denominador sean primos entre s.

3.5. Divisibilidad en anillos de polinomios

103

En el caso concreto de Z y Q concluimos que cada n


umero racional admite
una u
nica representaci
on como fracci
on irreducible con denominador positivo.
En Z, nada nos impide considerar un ideal como (6, 9), con dos generadores,
pero sabemos que Z es DIP, luego dicho ideal tiene que ser principal, luego
tiene que poder expresarse en terminos de un u
nico generador. Concretamente,
sucede que (6, 9) = (3), y el teorema siguiente lo prueba en un contexto general:
Teorema 3.22 (Relaci
on de Bezout) Sea A un DIP, sean a1 , . . . , an elementos de A y sea d un mcd de a1 , . . . , an . Entonces (d) = (a1 ) + + (an ),
luego existen ciertos r1 , . . . , rn A de manera que d = r1 a1 + + rn an .
n: Sea (d) = (a1 ) + + (an ) (por definici
Demostracio
on). Vamos a ver
que d es un mcd de a1 , . . . , an .
Como cada ai est
a en (d), ciertamente d | ai . Si s divide a todos los ai ,
entonces (ai ) (s), luego (d) = (a1 ) + + (an ) (s), luego s | d.
Observemos que si d0 es cualquier otro mcd de los elementos dados, entonces
0
(d ) = (d), luego la relaci
on de Bezout es v
alida para cualquiera de ellos.
Este resultado se aplica especialmente a pares de elementos primos entre s:
si m y n son primos entre s, existen r y s tales que rm + sn = 1.
Terminamos esta secci
on con un resultado que, seg
un veremos m
as adelante,
tiene una consecuencia muy importante en la teora de anillos.

p
Teorema 3.23 Sea p un n
umero primo y 0 < m < p. Entonces p |
.
m
p
p
n: Si m = 1, entonces m
Demostraci
o
= p, luego efectivamente p | m
.
p
Si p | m y m + 1 < p, entonces


p
p!
pm
p!
pm p
=
=
=
.
m+1
(m + 1)! (p m 1)!
m + 1 m! (p m)!
m+1 m
p
As pues, p | (p m) m
, y como (m + 1, p) = 1, la divisibilidad se conserva al
p
dividir entre m + 1, es decir, p | m+1
.

3.5

Divisibilidad en anillos de polinomios

El estudio de la divisibilidad no es tan sencillo si pasamos a los anillos de


polinomios A[x]. Tomemos unos cuantos polinomios y multipliquemoslos:
(x2 + 3x 5)(x 1)(2x3 + 3) = 2x6 + 4x5 16x4 + 13x3 + 6x2 24x + 15.
C
omo encontrar los factores a partir del producto? De hecho ni siquiera sabemos si los factores que hemos tomado son irreducibles o no7 . El problema
es que, a diferencia del caso numerico, hay infinitos divisores posibles para un
polinomio dado.
7 Es costumbre hablar de n
umeros primos pero de polinomios irreducibles, aunque en principio son t
erminos equivalentes.

104

Captulo 3. Aritmetica en dominios ntegros

Por otra parte, tenemos planteado otro problema m


as importante. Sabemos
que A[x] es un DFU cuando A es un cuerpo, pero en otro caso A[x] no es DIP.
Sigue siendo A[x] un DFU a pesar de ello cuando A es DFU? Es Z[x] DFU?,
Es Q[x, y] DFU? Vamos a probar que s, y para ello necesitamos un trabajo
previo.
Si D es un DFU y K es su cuerpo de cocientes, vamos a probar que D[x] es
un DFU apoy
andonos en que K[x] lo es. La situaci
on tpica con la que tenemos
que encontrarnos es la siguiente: El polinomio 6x2 24 factoriza en Z[x] como
6x2 24 = 6(x2 4) = 2 3 (x 2) (x + 2).

Vemos que tiene 4 divisores primos. Sin embargo, en Q[x] s


olo tiene dos,
pues los primeros factores pasan a ser unidades. Conviene dar la definici
on
siguiente:
Definici
on 3.24 Sea D un DFU y sea c : D[x] PD la aplicaci
on que a cada
polinomio f D[x] le asigna el ideal generado por un mcd de sus coeficientes no
nulos (no importa cu
al, pues dos cualesquiera son asociados, luego generan el
mismo ideal). Convenimos adem
as en que c(0) = 0. A c(f ) se le llama contenido
del polinomio f .
Diremos que un polinomio f es primitivo si c(f ) = (1), o sea, si sus coeficientes son primos entre s. En particular, todo polinomio m
onico es primitivo.
Por ejemplo, el contenido del polinomio 6x2 24 Z[x] es (6), mientras que
el polinomio x2 4 es primitivo. En general es inmediato que si f D[x] y f 6= 0,
entonces f (x) = c g(x) donde c D es un generador de c(f ) y g(x) D[x] es
un polinomio primitivo. As, para probar que todo polinomio f (x) D[x] se
descompone en irreducibles basta probar que podemos factorizar por una parte
polinomios constantes y por otra polinomios primitivos.
La factorizaci
on de las constantes es obvia, puesto que estamos suponiendo
que D es un DFU. Notemos que todo a D es irreducible en D si y s
olo si lo
es en D[x]. (Una descomposici
on de a en factores no unitarios de D[x] tendra
que constar de polinomios de grado 0, luego seran factores no unitarios de D,
y el recproco es obvio.)
Para probar que todo polinomio primitivo p(x) D[x] se descompone en
irreducibles observamos que los polinomios primitivos no son divisibles entre
constantes no unitarias, ya que una constante que divida a p(x) divide tambien
a su contenido.
As, si p(x) (no unitario) no pudiera descomponerse en irreducibles en D[x],
en particular no sera irreducible, luego se descompondra en dos factores, digamos p(x) = p1 (x)q1 (x), donde ninguno de los dos es una unidad, luego ambos
tienen grado menor que el grado de p(x). Al menos uno de los dos no podra
descomponerse en irreducibles (digamos que p1 (x)), luego p1 (x) no es irreducible
y factoriza como p1 (x) = p2 (x)q2 (x), donde ambos factores son no constantes,
pues dividen a p(x), luego el grado de p2 (x) es menor que el de p1 (x). De este
modo obtenemos una sucesi
on de polinomios p(x), p1 (x), p2 (x), . . . cuyos grados
son estrictamente decrecientes, lo cual es absurdo.

3.5. Divisibilidad en anillos de polinomios

105

Con esto tenemos demostrado que todo polinomio de D[x] no nulo ni unitario
se descompone en producto de irreducibles. La parte delicada es demostrar la
unicidad de la descomposici
on. La idea es usar la factorizaci
on u
nica en D para
probar la unicidad de los factores irreducibles constantes y la unicidad en K[x]
para probar la unicidad de los factores irreducibles no constantes. Necesitamos
dos resultados sobre c(f ).
Teorema 3.25 Sea D un DFU.
1. Si a D y f D[x], entonces c(af ) = (a)c(f ).
2. Si f , g D[x], entonces c(f g) = c(f )c(g).
n: 1) Si c(f ) = (c), es inmediato que ac es un mcd de los
Demostracio
coeficientes de af , luego c(af ) = (ac) = (a)(c).
2) Sea f = cf f1 y g = cg g1 con c(f ) = (cf ), c(g) = (cg ) y f1 , g1 primitivos.
Entonces, por la propiedad precedente,
c(f g) = c (cf f1 cg g1 ) = c(f )c(g)c(f1 g1 ),
luego basta probar que f1 g1 es una primitivo. Sean f1 =
con an 6= 0 6= bm . Entonces f1 g1 =

m+n
P

k=0 i+j=k

ai bj xk .

n
P

i=0

ai xi , g1 =

m
P

bi xi ,

i=0

Si f1 g1 no fuera una primitivo, existir


P a un irreducible p D que dividira a
todos sus coeficientes, es decir p |
ai bj , para cada k entre 0 y n + m.
i+j=k

Como f1 es primitivo, p no divide a todos los ai , luego existe un mnimo


ndice s tal que p | ai para i < s y p - as (en particular as 6= 0).
Igualmente existe un mnimo t tal que p | bj para j < t y p - bt (luego bt 6= 0).
P
Ahora, tomando k = s + t, resulta que p divide a
ai bj y tambien divide
i+j=k

a todos los sumandos salvo quiz


a a as bt , de donde divide a la diferencia, o
sea, a as bt . Como p es primo divide a uno de los factores, lo que nos da una
contradicci
on.
As, si un polinomio f (x) D[x] no nulo ni unitario admite una descomposici
on en irreducibles de D[x] de la forma d1 dr p1 (x) ps (x), donde los di
son los factores constantes, entonces cada pi (x) es primitivo, pues en caso contrario sera divisible entre un polinomio constante irreducible. Por consiguiente
c(f ) = (d1 dr ).

Ahora, la factorizaci
on u
nica en D garantiza que si f admite dos descomposiciones en irreducibles, los factores de grado 0 son los mismos salvo orden
y asociaci
on, pues ambos constituyen descomposiciones en irreducibles de un
generador de c(f ) en D.
Para demostrar la unicidad del resto de la descomposici
on necesitamos dos
resultados:

106

Captulo 3. Aritmetica en dominios ntegros

Teorema 3.26 Sea D un DFU, sea K su cuerpo de cocientes y sean f , g


polinomios primitivos en D[x]. Entonces f y g son asociados en D[x] si y
s
olo si lo son en K[x].
n: Si f y g son asociados en K[x] entonces f = gu para
Demostracio
cierta unidad u de K[x]. Por el teorema 2.42, sabemos que u es un polinomio
constante, es decir, est
a en K. Por lo tanto u = r/s para ciertos r, s D no
nulos. Entonces sf = rg. Como c(f ) = c(g) = (1), tenemos que
(s) = (s) c(f ) = c(sf ) = c(rg) = (r) c(g) = (r),
luego r = sv para cierta unidad v D. En consecuencia sf = rg = svg, luego
f = vg, lo que prueba que f y g son asociados en D[x]. El recproco es obvio.
El teorema siguiente tiene gran interes en s mismo:
Teorema 3.27 (Criterio de irreducibilidad de Gauss) Sea D un DFU,
sea K su cuerpo de cocientes y f D[x] un polinomio primitivo no constante.
Entonces f es irreducible en D[x] si y s
olo si lo es en K[x].
n: Supongamos que f es irreducible en D[x] pero f = gh
Demostracio
donde g, h K[x] no son unidades. Entonces grad g 1, grad h 1. Sean
g=

n a
P
i i
x,
b
i=0 i

h=

m c
P
i i
x,
d
i=0 i

para ciertos ai , bi , ci , di D con bi =


6 0 6= di . Llamemos b = b0 bn y, para
cada i, sea bi = b/bi D.
n
P
Consideremos el polinomio g1 =
ai bi xi D[x]. Podemos descomponer
i=0

g1 = ag2 , siendo c(g1 ) = (a) y g2 D[x] un polinomio primitivo. Claramente


1
a
g = g1 = g2 , luego grad g = grad g2 .
b
b
c
Del mismo modo se llega a que h = h2 , donde c, d D y h2 D[x] es
d
primitivo y grad h = grad h2 . Ahora
f = gh =

ac
g2 h2 ,
bd

con lo que f y g2 h2 son dos polinomios primitivos en D[x] asociados en K[x].


Por el teorema anterior son asociados en D[x], luego existe una unidad u D
tal que f = ug2 h2 , y as f es reducible en D[x], contradicci
on.
Si f es irreducible en K[x] y f = gh con g, h D[x], entonces g o h es una
unidad en K[x], por ejemplo g, lo que significa que g K, pero como est
a en
D[x], en realidad g est
a en D. Entonces (1) = c(f ) = (g)c(h), luego g es una
unidad en D, luego en D[x]. Esto prueba que f es irreducible en D[x].
Finalmente podemos probar:

3.5. Divisibilidad en anillos de polinomios

107

Teorema 3.28 (Gauss) Si D es un DFU y S un conjunto, entonces D[S] es


un DFU.
n: Veamos primeramente que D[x] es DFU. Sea f D[x] no
Demostracio
nulo ni unidad. Hemos visto que f admite una descomposici
on en polinomios
irreducibles en D[x]
f = d1 dr p1 (x) ps (x),
donde los di son los factores de grado 0 y los pi (x) son necesariamente primitivos.
Tambien sabemos que los di son u
nicos salvo orden y asociaci
on.
Por otra parte, si K es el cuerpo de cocientes de D, tenemos que los pi (x)
son irreducibles en K[x] y d1 dr es una unidad en K[x]. As, si f admite dos
factorizaciones en D[x], los correspondientes pi (x) han de ser los mismos salvo
orden y asociaci
on en K[x], pero tambien sabemos que la asociaci
on en K[x]
coincide con la asociaci
on en D[x] para polinomios primitivos de D[x]. Esto
prueba la unicidad de la descomposici
on y nos da que D[x] es un DFU.
Aplicando este resultado un n
umero finito de veces obtenemos que D[S] es
un DFU cuando el conjunto S es finito. El caso general se reduce al finito
del modo usual (dos factorizaciones en irreducibles en D[S] seran tambien dos
factorizaciones en irreducibles en un D[S0 ], con S0 finito).
Tenemos as demostrados dos resultados que, sin ser excesivamente complejos, no son triviales en absoluto y representan un papel relevante en la teora que
estamos desarrollando. Con las tecnicas que hemos necesitado para llegar a ellos
podemos probar f
acilmente un criterio u
til de irreducibilidad de polinomios:
Teorema 3.29 (Criterio de irreducibilidad de Eisenstein) Sea D un
n
P
DFU, sea K su cuerpo de cocientes, f =
ai xi D[x] un polinomio no
i=0

constante con an 6= 0 y p D un primo. Supongamos que p | ai para todo


i = 0, . . . , n 1, as como que p - an y p2 - a0 . Entonces f es irreducible en
K[x] y, si es primitivo, en D[x].

n: Sea f = cf f1 donde f1 D[x] es primitivo. Basta probar


Demostracio
que f1 es irreducible en K[x], pues cf es una unidad en K, luego f tambien ser
a
irreducible. El resto del teorema es consecuencia del criterio de Gauss.
Tambien por el criterio de Gauss, basta probar que f1 es irreducible en D[x].
Notemos que p no divide a cf (porque no divide a an ).
Cada coeficiente de f es el producto de cf por el correspondiente coeficiente
de f1 , luego f1 sigue cumpliendo las hip
otesis del teorema. Por no cambiar de
notaci
on podemos suponer que f = f1 (pero ahora f es primitivo).
r
s
P
P
Supongamos que f = gh, donde g =
bi xi y h =
cj xj . Ninguno
i=0

j=0

de los dos puede ser constante o de lo contrario f no sera primitivo. Como


c(g)c(h) = c(f ) = (1), tanto g como h son primitivos.
Tenemos que p | a0 = b0 c0 , luego p divide a uno de los factores. Pongamos
por caso que p | b0 . Como p2 - a0 no puede ser que p divida tambien a c0 .

108

Captulo 3. Aritmetica en dominios ntegros

Como g es primitivo, p no puede dividir a todos los bi . Tomemos el menor


natural k tal que p | bi para
P i < k y p - bk . As 1 k r < n.
El coeficiente ak =
bi cj es divisible entre p y por otra parte p divide a
i+j=k

todos los sumandos salvo quiz


a a bk c0 , luego divide a la diferencia, que es justo
bk c0 . Sin embargo p - bk y p - c0 , contradicci
on.
Ejercicio: Probar que en Q[x] hay polinomios irreducibles de grado arbitrariamente
grande.

Aunque los polinomios a los que podemos aplicar el criterio de Eisenstein


han de cumplir unas propiedades muy particulares, en realidad este criterio es
u
til en m
as ocasiones de las que en principio se podra pensar. Ello se debe al
resultado siguiente:
Teorema 3.30 Sea A un dominio. Sea a una unidad de A y b cualquier elemento de A. La aplicaci
on f : A[x] A[x] dada por f p(x) = p(ax + b) es
un isomorfismo de anillos, luego en particular un polinomio p(x) es irreducible
en A[x] si y s
olo si p(ax + b) lo es.
n: Claramente f es un homomorfismo porque no es sino la
Demostracio
evaluaci
on en ax + b. Es biyectivo porque tiene por inverso a la evaluaci
on en
a1 x a1 b.

Por ejemplo, para probar que el polinomio p(x) = 8x3 6x 1 es irreducible


en Z[x], basta ver que lo es en Q[x], pero por el teorema anterior basta ver que
lo es el polinomio p( 12 x + 12 ) = x3 3x 3, que es irreducible en Q[x] por el
criterio de Eisenstein.
La b
usqueda de factores irreducibles de grado 1 de un polinomio equivale a
la b
usqueda de sus races, tal y como explicamos a continuaci
on.
Definici
on 3.31 Sea A un dominio y f (x) un polinomio en A[x]. Podemos
considerar a f como una funci
on f : A A. En efecto, para cada elemento
a A tenemos definida la evaluaci
on f (a) A. Diremos que a es una raz del
polinomio f si f (a) = 0.
La relaci
on b
asica entre la divisibilidad y la existencia de races se sigue del
siguiente teorema elemental:
Teorema 3.32 (Teorema del resto) Sea A un anillo conmutativo y unitario,
f (x) A[x] y c A. Entonces existe un u
nico polinomio q(x) A[x] tal que
f (x) = q(x)(x c) + f (c).
n: Si f = 0 basta tomar q = 0. En otro caso el resultado
Demostracio
se sigue del teorema 2.44, que nos da dos polinomios q(x) y r(x) de manera
que f (x) = q(x)(x c) + r(x) con el grado de r menor que el de x c, o
sea, r es de grado cero, luego constante. Sustituyendo x por c resulta que
f (c) = q(c)(c c) + r, o sea, r = f (c).
Como consecuencia

3.5. Divisibilidad en anillos de polinomios

109

Teorema 3.33 Sea A un dominio ntegro. Sea f (x) A[x] y c A. Entonces


c es una raz de f (x) si y s
olo si (x c) | f (x).
n: Si c es una raz de f (x) entonces f (c) = 0, luego el teorema
Demostracio
anterior se reduce a que existe un polinomio q(x) tal que f (x) = q(x)(x c),
luego (x c) | f (x).
Si (x c) | f (x) entonces f (x) = q(x)(x c) para cierto polinomio q(x). Por
lo tanto f (c) = q(c)(c c) = 0, es decir, c es una raz de f (x).
De aqu que un polinomio irreducible de grado mayor que 1 no puede tener
races. Por otro lado un polinomio de grado 1, ax + b siempre tiene una raz en
un cuerpo, a saber, b/a. As obtenemos lo siguiente:
Si K es un cuerpo, un polinomio de grado 2 o 3 es irreducible en K[x] si y
s
olo si no tiene races en K.

En efecto, si se pudiera descomponer en producto de irreducibles, al menos


uno de sus factores irreducibles tendra grado 1, luego tendra una raz en K.
Para polinomios de grado mayor que 3 la no existencia de races ya no implica
la irreducibilidad. Por ejemplo, el polinomio (x2 + 1)2 es reducible en Q[x] y no
tiene races en Q.
El teorema anterior implica un hecho muy importante sobre las races de un
polinomio en un dominio ntegro:
Teorema 3.34 Sea A un dominio ntegro y sea f (x) A[x] un polinomio de
grado n. Entonces f (x) tiene a lo sumo n races en A.
n: Sean c1 , . . . , cm races distintas de f (x) en A. Por el
Demostracio
teorema anterior tenemos que (x c1 ) | f (x), es decir, f (x) = (x c1 )f1 (x).
Como c2 es raz de f tenemos que 0 = f (c2 ) = (c2 c1 )f1 (c2 ) y como
las races son distintas c2 c1 6= 0. Como A es un dominio ntegro ha de
ser f1 (c2 ) = 0, luego por el teorema anterior f1 (x) = (x c2 )f2 (x), de donde
f (x) = (x c1 )(x c2 )f2 (x).
Repitiendo esto m veces tenemos que (x c1 ) (x cm ) | f (x), por lo que
el grado de (x c1 ) (x cm ), que es m, ha de ser menor o igual que el grado
de f (x), que es n.
Sin embargo el n
umero de races de un polinomio no tiene por que igualar
a su grado. Por ejemplo, x2 + 1 no tiene races en Q[x], pues el cuadrado de un
n
umero racional no puede ser negativo. Por otro lado (x 1)2 tiene grado 2 y
una u
nica raz.
Ejercicio: Probar que las races enteras de un polinomio de Z[x] dividen a su termino
independiente.

Hay un an
alogo al criterio de Gauss, pero referente a la existencia de races
en lugar de la irreducibilidad. La prueba es mucho m
as sencilla:
Teorema 3.35 Sea D un DFU y K su cuerpo de cocientes. Sea p(x) un polinomio m
onico no constante con coeficientes en D. Si c es una raz de p(x)
en K, entonces c D.

110

Captulo 3. Aritmetica en dominios ntegros

n: Sea c = a/b, con a, b D. Si c


Demostracio
/ D entonces b - a, luego
n
P
existe un primo p D tal que vp (a) < vp (b). Sea p(x) =
di xi , donde dn = 1.
Entonces

i=0

n1

a
a
a
+ dn1 n1 + + d1 + d0 = 0.
n
b
b
b
Multiplicando por bn queda:

an = dn1 ban1 d1 bn1 a d0 bn .


Ahora bien, el exponente de p en el miembro izquierdo es exactamente
nvp (a), mientras que en el miembro derecho es estrictamente mayor que nvp (a),
con lo que tenemos una contradicci
on.
Ejemplo Si A es un anillo y n N es un n
umero natural n 2, una raz
n-sima de a es otro elemento b A tal que bn = a. Si aplicamos el teorema
anterior al polinomio xn a vemos que si A es un DFU, entonces a A tiene
raz n-sima en el cuerpo de cocientes K si y s
olo si la tiene en A.
Por ejemplo, es inmediato que 2 no tiene raz cuadrada en Z, por lo que
podemos afirmar que tampoco la tiene en Q. Esto es significativo porque hay
razones geometricas por las que debera haber un punto en cada recta asociado
a una raz cuadrada de 2, y, en general, de cualquier n
umero positivo, lo que
podemos concluir que la representaci
on geometrica de los n
umeros racionales
no abarca todos los puntos de una recta.
Ejemplo Terminaremos con una aplicaci
on m
as sofisticada del criterio de Eisenstein: Consideremos el polinomio xn 1 Z[x]. Evidentemente no es irreducible, porque tiene la raz x = 1. Eso significa que es divisible entre x 1.
No es difcil llegar a que
xn 1 = (x 1)(xn1 + xn2 + + x + 1).
Vamos a probar que si p es un n
umero natural primo, entonces el polinomio
p(x) = xp1 +xp2 + +x+1 es irreducible en Z[x] (o en Q[x]). Por el teorema
3.30 basta probar que p(x + 1) es irreducible en Z[x]. Aplicamos la evaluaci
on
en x + 1 a la igualdad anterior y obtenemos
(x + 1)p 1 = (x + 1 1)p(x + 1) = xp(x + 1).
Por tanto

p
p
X
X
p k
p k
xp(x + 1) =
x 1=
x ,
k
k
k=0

p
P
p k1
y en consecuencia p(x + 1) =
.
k x

k=1

k=1

Por el teorema 3.23 tenemos que p divide a todos los coeficientes de p(x + 1)
salvo al correspondiente a xp1 , que es 1. Adem
as p2 no divide al termino
independiente, que es p. Por el criterio de Eisenstein, p(x + 1) es irreducible,
luego p(x) tambien.

3.6. Congruencias y anillos cociente

3.6

111

Congruencias y anillos cociente

Las congruencias son una herramienta muy potente en el estudio de los


n
umeros enteros. La soluci
on de muchos problemas de muy diversa ndole, as
como algunas propiedades generales sobre los anillos, encuentran su expresi
on
m
as natural en terminos de congruencias. Los anillos cociente proporcionan una
visi
on alternativa m
as conceptual de la noci
on de congruencia.
Definici
on 3.36 Consideremos un dominio A y un ideal I. Diremos que dos
elementos a y b de A son congruentes m
odulo I, abreviado a b (mod I), si
a b I.
Teniendo en cuenta que 0 I, que el opuesto de un elemento de I est
a en I y
que la suma de elementos de I est
a en I, se sigue f
acilmente que la congruencia
m
odulo I es una relaci
on de equivalencia en A.
Diremos que dos elementos de A son congruentes m
odulo un tercero si lo
son m
odulo el ideal que este genera. Explcitamente:
a b (mod m) si y s
olo si m | a b.
En el caso de un DIP, como es Z, podemos hablar de congruencias en estos
terminos sin perder generalidad y sin mencionar para nada ideales, pero es bueno
saber que, en el fondo, lo que hay es un ideal.
En el caso concreto de Z podemos dividir a = nc + r, con 0 r < n,
y resulta que a r (mod n). As, todo n
umero entero es congruente con un
n
umero natural menor que n, exactamente con su resto al dividirlo entre n.
Por otra parte dos n
umeros naturales distintos menores que n no pueden ser
congruentes entre s, ya que su diferencia en el orden adecuado es un n
umero
natural no nulo menor que n, luego no puede ser un m
ultiplo de n. Vamos a
expresar adecuadamente lo que hemos obtenido:
Si I es un ideal de un anillo A, llamaremos A/I al conjunto cociente originado
por la relaci
on de congruencia m
odulo I.
Lo que acabamos de probar es que el conjunto Z/nZ tiene exactamente n
elementos. Por ejemplo Z/5Z est
a formado por las clases siguientes:
{
{
{
{
{

...
...
...
...
...

20,
19,
18,
17,
16,

15, 10, 5, 0, 5, 10,


14, 9, 4, 1, 6, 11,
13, 8, 3, 2, 7, 12,
12, 7, 2, 3, 8, 13,
11, 6, 1, 4, 9, 14,

15,
16,
17,
18,
19,

20,
21,
22,
23,
24,

...
...
...
...
...

}
}
}
}
}

La primera clase la forman los m


ultiplos de 5, la segunda los n
umeros que al
ser divididos entre 5 dan resto 1, etc. Si llamamos [a] a
la clase de equivalencia

de a tenemos por ejemplo que [4] = [1] y que Z/5Z = [0], [1], [2], [3], [4] .
En general, en un anillo A, los elementos congruentes con un cierto a m
odulo
un ideal I son los b que cumplen b a I, es decir, los elementos de la forma
a + i para un cierto i I. Por lo tanto [a] = a + I = {a + i | i I}.

112

Captulo 3. Aritmetica en dominios ntegros

El interes de todo esto radica en el hecho siguiente:


Teorema 3.37 Sea A un dominio e I un ideal de A. Si a, a0 , b, b0 son elementos de A que cumplen [a] = [a0 ] y [b] = [b0 ], entonces tambien [a + b] = [a0 + b0 ]
y [ab] = [a0 b0 ]. El conjunto A/I se convierte en un dominio con las operaciones
definidas mediante [a] + [b] = [a + b], [a][b] = [ab]. Al anillo A/I se le llama
anillo cociente de A m
odulo el ideal I.
n: Tenemos que a a0 I y que b b0 I, de donde
Demostracio
(a + b) (a0 + b0 ) = (a a0 ) + (b b0 ) I,
ab a0 b0 = ab a0 b + a0 b a0 b0 = (a a0 )b + a0 (b b0 ) I,
por las propiedades de los ideales. Esto nos garantiza que las operaciones definidas mediante [a] + [b] = [a + b] y [a][b] = [ab] no dependen de la elecci
on de a
y b en cada una de las clases. El resto del teorema es inmediato. Por ejemplo
la asociatividad de la suma se cumple porque
([a] + [b]) + [c] = [a + b] + [c] = [a + b + c] = [a] + [b + c] = [a] + ([b] + [c]).

De esta forma nos hemos encontrado con una familia de anillos finitos. Estos
anillos resultan utilsimos para determinar si un n
umero dado divide o no a otro.
En efecto, se cumple que m | n si y s
olo si [n] = 0 m
odulo m, y esto es f
acil de
calcular. Por ejemplo, tomando clases m
odulo 7:
[234] = [2][10][10] + [3][10] + [4] = [2][3][3] + [3][3] + [4]
= [6][3] + [2] + [4] = [1][3] + [6] = [3]
Esto prueba que el resto de 234 entre 7 es 3, y por tanto no es m
ultiplo
de 7. Hemos hecho muchas operaciones, pero todas muy sencillas. Con n
umeros
peque
nos no siempre es m
as r
apido, pero con n
umeros grandes es muy pr
actico.
En algunos casos, las congruencias proporcionan criterios generales de divisibilidad en terminos de las expresiones decimales de los n
umeros naturales.
Recordemos que el desarrollo decimal de un n
umero n es de la forma
n=

k
P

i=0

con 0 ci 9.

ci 10i ,

Un n
umero natural es m
ultiplo de 2 si y s
olo si termina en 0, 2, 4, 6 u 8.

En efecto, al tomar clases m


odulo 2 en el desarrollo decimal de n, como
[10] = [0], queda
[n] =

k
P

[ci ][10]i =

i=0

k
P

[ci ][0]i = [c0 ].

i=0

3.6. Congruencias y anillos cociente

113

Por lo tanto [n] = [0] si y s


olo si [c0 ] = [0], es decir, si y s
olo si la u
ltima
cifra es una de las cinco cifras pares.
Con lo que a simple vista sabemos que 6 278 es par mientras que 29 953
es impar.
Un n
umero natural es m
ultiplo de 3 si y s
olo si la suma de sus cifras lo
es.
Al tomar clases m
odulo 3 sucede que [10] = [1] luego
[n] =

k
P

[ci ][10]i =

i=0

k
P

[ci ][1]i =

i=0

k
P

[ci ] = [

i=0

n
P

ci ].

i=0

Por lo tanto el resto de n m


odulo 3 es 0 si y s
olo si lo es el de la suma de
sus cifras.
As, para saber si 3 725 es m
ultiplo de 3 sumamos 3 + 7 + 2 + 5 = 17 y
repetimos la operaci
on: 1+7 = 8. Como 8 no es m
ultiplo de 3, concluimos
que 3 725 tampoco lo es. De hecho al dividirlo entre 3 su resto es el mismo
que el de 8, o sea, 2.
Un n
umero natural n es m
ultiplo de 4 si y s
olo si el n
umero formado por
sus dos u
ltimas cifras es m
ultiplo de 4.
En este caso [10] = [2], luego [10]2 = [0] y todas las potencias posteriores
se anulan tambien. Consecuentemente,
[n] =

k
P

[ci ][10]i = [c1 ][10] + [c0 ] = [c1 10 + c0 ],

i=0

y el n
umero c1 10 + c0 es el n
umero formado por las dos u
ltimas cifras
de n.
Por ejemplo, el a
no 2 494 no ser
a bisiesto, ya que, m
odulo 4,
[2 494] = [94] = [9][2] + [4] = [1][2] + [0] = [2].
Un n
umero natural es m
ultiplo de 5 si y s
olo si acaba en 0 o en 5.

Ahora [10] = [0] y el c


alculo es el mismo que el de los m
ultiplos de 2. La
conclusi
on es que n es m
ultiplo de 5 si y s
olo si su u
ltima cifra lo es, y
esto sucede cuando es 0 o 5.

No hay un criterio sencillo para la divisibilidad entre 6, 7, 8, aunque en el


caso del 6 podemos afirmar trivialmente que un n
umero es m
ultiplo de 6 si y
s
olo si lo es de 2 y de 3, con lo que podemos combinar los dos criterios que
hemos visto. Para 9 tenemos que [10] = [1], y el criterio es el mismo que para
el 3. Para 10 es [10] = [0], y se concluye que los m
ultiplos de 10 son los que
terminan en 0.
Ejercicio: Encontrar un criterio para la divisibilidad entre 11. N
otese que en este
caso [10] = [1].

114

Captulo 3. Aritmetica en dominios ntegros

Si el lector no est
a familiarizado con las congruencias, un ejercicio altamente
recomendable es que trate de anticiparse a los resultados generales que vamos a
exponer experimentando con casos particulares. Por ejemplo, he aqu las tablas
de sumar y multiplicar en Z/6Z:
+
0
1
2
3
4
5

0
0
1
2
3
4
5

1
1
2
3
4
5
0

2
2
3
4
5
0
1

3
3
4
5
0
1
2

4
4
5
0
1
2
3

5
5
0
1
2
3
4

0
1
2
3
4
5

0
0
0
0
0
0
0

1
0
1
2
3
4
5

2
0
2
4
0
2
4

3
0
3
0
3
0
3

4
0
4
2
0
4
2

5
0
5
4
3
2
1

El lector debera construirse tablas an


alogas para otros m
odulos, como mnimo las de n = 5 y, a ser posible, las de los m
odulos menores, y si puede utilizar
alg
un lenguaje de programaci
on, tambien las de otros mayores, hasta 10, por
ejemplo. En realidad, si lo intenta se dar
a cuenta inmediatamente que las tablas
de la suma son siempre mon
otonas y predecibles, con lo que puede limitarse, si
lo prefiere, a construir las tablas del producto.
Por ejemplo, en la tabla anterior se ve que Z/6Z no es un dominio ntegro,
sino que tiene divisores de 0. Por ejemplo, [2][3] = [0]. En cambio, si calcula
la tabla de Z/5Z ver
a que no tiene divisores de 0. M
as a
un, podr
a comprobar
que el 1 aparece en todas las filas distintas de la del 0, lo que se traduce en que
todo elemento no nulo tiene inverso, luego Z/5Z es un cuerpo.
El lector experimentador puede obtener empricamente los primeros valores
de n para los cuales Z/nZ s es dominio ntegro: 2, 3, 5, 7, 11, . . . A estos hay
que a
nadir el 0 porque el correspondiente anillo cociente es isomorfo a Z, y no
vale el 1 porque en la definici
on de dominio exigimos que 0 6= 1, mientras que
Z/1Z s
olo tiene un elemento.
Si analizamos la raz
on por la que un anillo Z/nZ no es ntegro vemos que en
cada caso la explicaci
on es siempre la misma: en Z/4Z la clase [2] es un divisor
de 0 porque 2 2 = 4. En Z/6Z las clases [2] y [3] son divisores de 0 porque
2 3 = 6, etc. En general, las factorizaciones de n dan lugar a divisores de cero.8
Concluimos que un anillo Z/nZ no puede ser ntegro a menos que n sea primo.
El lector puede tratar de probar directamente que Z/pZ es ntegro si p es
primo. Nosotros vamos a dar una prueba general. Notemos que en un anillo
cociente A/I se cumple 0 = [0] = 0 + I = I, luego [a] = 0 si y s
olo si a I.
Teorema 3.38 Sea A un dominio y P un ideal de A. Entonces A/P es un
dominio ntegro si y s
olo si P es un ideal primo.
n: Si P es primo entonces P 6= A, luego 1
Demostracio
/ P , luego en
A/P se cumple que [1] 6= [0]. As pues, A/P es un dominio. Si [a], [b] son dos
8 Pero no es el u
nico caso exactamente. Por ejemplo, m
odulo 6, tenemos que [3][4] = [0],
pero es que 3 4 contiene la factorizaci
on 6 = 3 2.

3.6. Congruencias y anillos cociente

115

elementos de A/P tales que [a][b] = 0, entonces [ab] = [0], es decir, ab P .


Como P es primo, a P o b P , luego se cumple que [a] = 0 o [b] = 0, es
decir, A/P es un dominio ntegro.
Recprocamente, si A/P es un dominio ntegro, ha de ser [1] 6= [0], luego
1
/ P y en consecuencia P 6= A. Si a, b son elementos de A tales que ab P ,
entonces [a][b] = [ab] = 0, y como A/P es ntegro [a] = 0 o [b] = 0, es decir,
a P o b P , luego P es primo.

Queda as justificado que los anillos Z/pZ son dominios ntegros cuando p es
un primo. El lector que tenga a mano sus tablas podr
a conjeturar una respuesta
a la siguiente pregunta: De entre los Z/pZ, cu
ales son cuerpos?
La respuesta es que todos lo son. De nuevo el lector es invitado a justificar
este hecho. Ha de probar que en un anillo Z/pZ con p primo todo elemento es
una unidad. Por ejemplo, en Z/5Z vemos que [2]1 = [3], pues [2][3] = [6] = [1].
El lector emprendedor debera recordar la relaci
on de Bezout (3.22). De nuevo,
aqu vamos a ver una prueba general:
Teorema 3.39 Sea A un dominio y sea M un ideal de A. Entonces A/M es
un cuerpo si y s
olo si M es un ideal maximal.
n: Si M es maximal entonces es primo, luego A/M es un
Demostracio
dominio ntegro. Veamos que si [a] 6= [0] entonces [a] es una unidad en A/M .
Como a
/ M tenemos que M + (a) 6= M , luego por la maximalidad de M ha
de ser M + (a) = A. En particular 1 M + (a), luego 1 se puede expresar de la
forma 1 = m + ba, para cierto m M y cierto b A. Tomando clases resulta
que [1] = [m] + [b][a] = [b][a], luego [a] es en efecto una unidad.
Si A/M es cuerpo entonces M es un ideal primo, y en particular M 6= A.
Consideremos un ideal N de A tal que M N A. Sea a un elemento de N
que no este en M . As [a] 6= 0, luego existe un b A tal que [a][b] = [1], es decir,
[ab 1] = [0], luego ab 1 M N y como a N , tambien ab N , luego
1 N y por tanto N = A. Esto prueba que M es un ideal maximal.
Como en Z los ideales maximales coinciden con los primos, resulta que los
anillos Z/pZ son cuerpos. Hay otra raz
on por la cual los anillos Z/nZ que son
dominios ntegros son tambien cuerpos, y es que son finitos:
Teorema 3.40 Todo dominio ntegro finito es un cuerpo.
n: Sea A un dominio ntegro finito. Hay que probar que todo
Demostracio
elemento no nulo u de A es una unidad. Si A = {0, u1 , . . . , un }, entonces los
elementos uu1 , . . . , uun son todos distintos y no nulos, luego se da la igualdad de
conjuntos {u1 , . . . , un } = {uu1 , . . . , uun } y por lo tanto: u1 un = uu1 uun ,
es decir, u1 un = un (u1 un ). Como u1 un no es 0, podemos cancelarlo,
lo que nos da un = 1, o sea u un1 = 1, luego u es una unidad.
Hay una variante de este argumento que, seg
un veremos, tiene muchas consecuencias interesantes:

116

Captulo 3. Aritmetica en dominios ntegros

Teorema 3.41 Sea A un dominio con un n


umero finito n de unidades y sea u
una unidad de A. Entonces un = 1.
n: Sean u1 , . . . , un las unidades de A. Entonces los elementos
Demostracio
uu1 , . . . , uun son todos distintos, pues si uui = uuj , como u es una unidad, se
cumple ui = uj . Adem
as el producto de unidades es una unidad, luego en
realidad {u1 , . . . , un } = {uu1 , . . . , uun } y en particular los productos coinciden:
u1 un = uu1 uun , es decir, u1 un = un (u1 un ), y como u1 un es
una unidad, podemos cancelarlo, lo que nos da un = 1.
En particular, el cuerpo Z/pZ tiene p 1 unidades, luego si [a] Z/pZ
cumple [a] 6= [0], entonces [a]p1 = [1], luego [a]p = [a] (y esto u
ltimo vale

incluso si [a] = [0]). Esta


es una de las formas en las que se suele enunciar el
teorema de Fermat:
Teorema 3.42 (Teorema de Fermat) Para todo primo p y todo n
umero entero a, se cumple que ap a (mod p).
Homomorfismos y cocientes Ya hemos visto que la existencia de un monomorfismo de anillos f : A B se interpreta como que A puede ser considerado
como un subanillo de B. Ahora veremos que si f es un epimorfismo entonces B
puede ser considerado un cociente de A.
Definici
on 3.43 Si f : A B es un homomorfismo de anillos, llamaremos
n
ucleo de f al conjunto N(f ) = {a A | f (a) = 0}.
No ofrece ninguna dificultad probar que N(f ) es un ideal de A. Una propiedad u
til es la siguiente:
Teorema 3.44 Si f : A B es un homomorfismo de anillos, se cumple que
f es monomorfismo si y s
olo si N(f ) = 0.
n: Una implicaci
Demostracio
on es evidente, y para ver la otra supongamos que N(f ) = 0 y que f (a) = f (b). Entonces f (b a) = 0, y en consecuencia
b a N(f ) = 0, es decir, b = a.
Por ejemplo, si f : K A es un homomorfismo de un cuerpo K en un
anillo A, o bien f es constante igual a 0 o bien es un monomorfismo, porque el
n
ucleo de f tiene que ser un ideal de K, y s
olo hay dos opciones: que sea K, en
cuyo caso f es nulo, o bien que sea 0, en cuyo caso f es un monomorfismo.
Notemos ahora que si A es un anillo e I es un ideal de A, entonces la
aplicaci
on p : A A/I dada por p(a) = [a] es un epimorfismo, llamado
epimorfismo can
onico. Claramente N(p) = I.
El pr
oximo teorema nos dice que todo epimorfismo es esencialmente de este
tipo:

3.6. Congruencias y anillos cociente

117

Teorema 3.45 (Teorema de isomorfa) Sea f : A B un homomorfismo



de anillos. Entonces la aplicaci
on f : A/ N(f ) f [A] dada por f [a] = f (a)
es un isomorfismo de anillos que hace conmutativo el diagrama siguiente:
f

/B
;
ww
w
w
w
p
ww
ww f
A/ N(f )
A

n: La aplicaci
Demostracio
on est
a bien definida, pues si [a] = [b], entonces
a b N(f ), con lo que f (a b) = 0, o sea, f (a) = f (b).
Es inmediato
comprobar que se trata de un homomorfismo y es inyectivo
porque si f [a] = f([b]), entonces f (a) = f (b), f (a b) = 0, a b N(f ),
luego [a] = [b]. La conmutatividad del diagrama es inmediata.

Notemos que, en las condiciones del teorema anterior, si f es un epimorfismo,


entonces f es un isomorfismo entre B y A/ N(f ) de modo que si sustituimos
cada elemento de B por su equivalente en el cociente, entonces f se corresponde
con la proyecci
on can
onica.
La caracterstica de un anillo Con ayuda de los conceptos precedentes
vamos a profundizar un poco en la estructura de los anillos. Observemos que si
A es un dominio, entonces tenemos definidos los elementos
1,

2 1 = 1 + 1,

3 1 = 1 + 1 + 1,

...

n 1,

...

Aqu hay que entender que en la expresi


on n 1 el n
umero n es un n
umero
natural, mientras que el 1 es la identidad de A. El resultado no es un n
umero
natural, sino un elemento de A. Por ejemplo, si hacemos el c
alculo en Z/6Z
obtenemos que
6 1 = 1 + 1 + 1 + 1 + 1 + 1 = 0,
cosa que no debera sorprender al lector.

Definici
on 3.46 Llamaremos caracterstica de un dominio A (car A) al mnimo
n
umero natural no nulo n tal que n1 = 0, o bien car A = 0 si no existe tal n.
En otras palabras, la caracterstica de un dominio es el mnimo n
umero de
veces que hay que sumar 1 consigo mismo para obtener 0, o bien 0 si esto es
imposible.
Claramente Z y Q son anillos de caracterstica 0, mientras que Z/nZ tiene
caracterstica n.
Notemos que si A B son dominios ntegros, entonces la identidad en A es la
misma que la identidad en B (pues la identidad en A cumple 1 = 1 1, y el u
nico
elemento no nulo que cumple esto en B es la identidad), luego car A = car B.
Otro hecho notable es que la caracterstica de un dominio ntegro ha de ser
o bien 0 o bien un n
umero primo, pues si car A = mn, donde m y n no son 1,
entonces m1 6= 0 6= n1, pero (m1)(n1) = (mn)1 = 0, luego A no es ntegro.

118

Captulo 3. Aritmetica en dominios ntegros

Fijemos ahora un anillo unitario A y consideremos la aplicaci


on f : Z A
dada por f (n) = n1, que claramente es un homomorfismo.
Si A tiene caracterstica 0, entonces f (n) 6= 0 para todo n > 0, luego tambien
para todo n 6= 0. Por lo tanto, el n
ucleo de f es el ideal 0 y f es un monomorfismo
o, equivalentemente, un isomorfismo entre Z y f [Z], de modo que f [Z] es un
anillo indistinguible de Z a efectos algebraicos.
Por consiguiente, en la pr
actica podemos identificar cada n Z con n1 A y
considerar as que Z A. En otras palabras, si A es un anillo de caracterstica 0
y escribimos 3 A, nos referimos al elemento 3 = 1 + 1 + 1 A, e igualmente
3 = 1 1 1 A. El hecho de que f sea un monomorfismo se traduce en
que en A se cumple 2 + 3 = 5, 3 4 = 12 o 5 6= 18 porque todo esto es cierto
en Z.
Supongamos ahora que A tiene caracterstica m > 0 y vamos a probar que
el n
ucleo de f es mZ. En principio sabemos que f (m) = 0, luego dicho n
ucleo
es un ideal no nulo de Z, que ser
a de la forma rZ, para cierto r > 0 tal que
r | m. En particular 0 < r m, pero, como r 1 = 0 y m es el menor natural no
nulo que cumple esto, tiene que ser r = m, luego el n
ucleo es ciertamente mZ.
El teorema de isomorfa nos da entonces un monomorfismo f : Z/mZ A,
dado por f([n]) = n 1. Nuevamente, esto nos legitima a identificar a Z/mZ con
un subanillo de A, el formado tambien por las sumas de unos, con la diferencia
de que ahora dicho anillo de sumas de unos no es isomorfo a Z, sino a Z/mZ.
En resumen:
Si A es un dominio de caracterstica 0, entonces tiene como subanillo a Z
(identificado con el anillo formado por las sumas de unos y menos unos).
Si K es un cuerpo de caracterstica 0, entonces, por el teorema 2.21 tenemos que K no s
olo contiene a Z, sino tambien a su cuerpo de cocientes Q.
Si A es un dominio de caracterstica n > 0, entonces tiene como subanillo
a Z/nZ (identificado con el anillo formado por las sumas de unos de A).
Si A es un dominio ntegro (en particular un cuerpo) de caracterstica
p > 0 entonces p es primo y contiene como subcuerpo a Z/pZ.
M
as precisamente, si K es un cuerpo de caracterstica 0, podemos considerar
que, por ejemplo, 5/3 K sin m
as que entender que nos referimos al elemento.
1+1+1+1+1
.
1+1+1
As pues, los anillos Z y Z/nZ son los menores en sus respectivas caractersticas, pues est
an contenidos en cualquier dominio de la misma caracterstica.
M
as precisamente, si K es un cuerpo y k K es un subcuerpo, el cuerpo
formado a partir del 1 mediante sumas, restas y cocientes, que es isomorfo a Q o
a un cuerpo de restos Z/pZ, est
a contenido en k (porque 1 k y al sumar, restar

3.6. Congruencias y anillos cociente

119

o dividir unos no nos salimos de k). As pues, se trata del menor subcuerpo
de K, en cuanto a que est
a contenido en todos sus subcuerpos. Dicho cuerpo
mnimo se llama el cuerpo primo de K.
Veamos un par de teoremas que muestran por que la caracterstica de un
anillo es un dato a tener en cuenta.
Teorema 3.47 Sea A un dominio de caracterstica prima p. Entonces para
todos los elementos a y b de A se cumple (a b)p = ap bp .
n: Usamos el teorema 3.23:
Demostracio
(a + b)p =

p
p1
P
P p k pk
p k pk
p
p
a
b
=
a
+
b
+
= ap + bp .
k
k a b

k=0

k=1

Si p es impar (ab)p = ap +(b)p = ap bp . Si p = 2 entonces b+b = 2b = 0,


luego b = b y el resultado vale.
n

Obviamente de aqu se sigue que, m


as en general, (a b)p = ap bp .
Teorema 3.48 Sea K un cuerpo con car K 6= 2 y sea p(x) = ax2 +bx+c K[x]
con a 6= 0. El polinomio p(x) tiene una raz en K si y s
olo si existe
un K
de manera que 2 = b2 4ac. En tal caso, si llamamos = b2 4ac, las
races de p(x) son

b b2 4ac
.
2a
n: Supongamos que K cumple a 2 + b + c = 0. MultiDemostracio
plicando por 4a tenemos que (2a)2
+ 2(2ab) + 4ac = 0, de donde (2a + b)2 =
2
b 4ac y por lo tanto 2a + b = b2 4ac. Como car K 6= 2, 2a 6= 0 y as

b b2 4ac
=
.
2a

Si existe b2 4ac K, es f
acil ver que los elementos definidos por la
f
ormula anterior son races de p(x).
Veamos algunas observaciones m
as:
Todo anillo de caracterstica 0 es infinito (porque contiene a Z).
Sin embargo, un anillo de caracterstica no nula puede ser infinito. Por
ejemplo, el cuerpo de fracciones algebraicas (Z/nZ)(x).
Todo anillo ordenado tiene caracterstica 0, pues una simple inducci
on
demuestra que n 1 > 0 para todo n > 0.

En particular vemos que en un anillo finito no es posible definir ninguna


relaci
on de orden que cumpla los axiomas de anillo ordenado.

120

Captulo 3. Aritmetica en dominios ntegros

Podra pensarse que, por el contrario, todos los anillos de caracterstica 0


pueden ordenarse, pero no es as. Por ejemplo, si un cuerpo K, de caracterstica 0, contiene un elemento i K tal que i2 = 1, entonces no puede
ser dotado de una relaci
on de orden que lo convierta en un cuerpo ordenado,
porque tendra que ser i2 = 1 < 0 y, por otra parte, los cuadrados tienen que
ser positivos en un cuerpo ordenado. En el apartado siguiente probamos que
existe un cuerpo as.
Cocientes de anillos de polinomios Veamos una u
ltima aplicaci
on de los
anillos cociente:
Teorema 3.49 Sea k un cuerpo y p(x) k[x] no constante. Entonces existe
un cuerpo K que contiene a k en donde p(x) tiene una raz.
n: Tomando un factor irreducible, podemos suponer que p(x)
Demostracio
es irreducible (pues toda
raz de un factor de p(x) es tambien raz de p(x)).
Entonces el ideal p(x) es maximal en k[x] (teorema 3.15), luego el anillo
cociente K = k[x]/ p(x) es un cuerpo.
La proyecci
on can
onica p : k[x] K se restringe a un homomorfismo
j : k K dado por j(a) = [a]. Como es no nulo (pues j(1) = 1), tiene que
ser un monomorfismo de cuerpos, a traves del cual podemos identificar a k con
su imagen, es decir, a cada a k con la clase [a] K.
Por otra parte, llamamos = [x] K. La clave del argumento es que,
al haber tomado el cociente respecto del ideal (p(x)), en K se cumple que
n
P
[p(x)] = 0. M
as explcitamente, si p(x) =
ai xi , entonces
i=0

0 = [p(x)] =

n
P

[ai ][x] =

i=0

n
P

ai i = p(),

i=0

donde hemos usado la identificaci


on [ai ] = ai . As pues, es una raz de p(x)
en K.
Definici
on 3.50 Si k es un cuerpo y p(x) k[x] es un polinomio irreducible,
llamaremos k[] al cuerpo construido en la demostraci
on del teorema anterior,
es decir, k[] = k[x]/(p(x)) y = [x], de modo que es una raz de p(x) en
k[].
La estructura de este cuerpo es f
acil de describir. En principio, sus elementos
m
P
son de la forma [q(x)], donde q(x) k[x]. Si q(x) =
bi xi , entonces
i=0

[q(x)] =

m
P

[bi ][x]i =

i=0

m
P

bi i = q(),

i=0

de modo que k[] = {q() | q(x) k[x]}. Esto significa que todo elemento
de k[] se obtiene sumando y multiplicando potencias de y elementos de k.
Pero podemos precisar m
as. Si p(x) tiene grado n, dado cualquier q(x) k[x]

3.6. Congruencias y anillos cociente

121

podemos dividir q(x) = p(x)c(x) + r(x), donde r(x) =

n1
P

ci xi , y entonces,

i=0

como p() = 0, queda que q() = r(), luego

k[] = {cn1 n1 + + c1 + c0 | c0 , . . . , cn1 k}.


As pues, todo elemento de k[] se expresa como suma de las n potencias consecutivas 1, , . . . , n1 multiplicadas por elementos de k. M
as a
un, cada elemento
de k[] admite una u
nica expresi
on de esta forma, es decir, si
cn1 n1 + + c1 + c0 = c0n1 n1 + + c01 + c00 ,
entonces ci = c0i para todo i. En efecto, tenemos que
(cn1 c0n1 )n1 + + (c1 c01 ) + c0 .c00 = 0.
Si llamamos t(x) =

n1
P
i=0

(ci c0i )xi , entonces t() = 0, lo cual, haciendo = [x] y

eliminando la identificaci
on de k con su imagen en k[], equivale a que [t(x)] = 0,
es decir, a que p(x) | t(x), pero la u
nica forma en que un polinomio de grado n
puede dividir a otro de grado a lo sumo n 1 es que el segundo sea 0. Por lo
tanto t(x) = 0, lo cual significa que ci = c0i para todo i, como queramos probar.
Ejemplo El polinomio x2 + 1 no tiene races en Q, luego es irreducible en
Q[x], luego podemos formar el cuerpo Q[i], que contiene una raz i de dicho
polinomio, es decir, un elemento que cumple i2 = 1. Tenemos as un cuerpo
de caracterstica 0 que no puede ser dotado de estructura de cuerpo ordenado.

El teorema chino del resto Vamos a mostrar distintos grados de abstracci


on de un teorema que apareci
o enunciado por primera vez en un tratado del
matem
atico chino Sun Tzu, del que se sabe que vivi
o entre los siglos IV y V d.C.
Su enunciado m
as elemental afirma que un sistema de congruencias lineales
x a1 (mod m1 ),

...

, x an (mod mn )

tiene soluci
on siempre que los m
odulos m1 , . . . , mn son primos entre s dos a dos.
M
as a
un, las soluciones x del sistema forman una misma clase de congruencia
m
odulo m = m1 mn .
En terminos m
as modernos, este mismo enunciado puede expresarse as:
Teorema 3.51 (Teorema chino del resto) Si m1 , . . . , mn son n
umeros enteros primos entre s dos a dos y m = m1 mn , se tiene el isomorfismo de
anillos
Z/mZ
= (Z/m1 Z) (Z/mn Z)
dado por [a] 7 ([a], . . . , [a]).

122

Captulo 3. Aritmetica en dominios ntegros

n: Es claro que la aplicaci


Demostracio
on f (a) = ([a], . . . , [a]) define un
homomorfismo de anillos de Z en el producto de los anillos cociente (considerado
como anillo con las operaciones definidas coordenada a coordenada), y su n
ucleo
es mZ, pues obviamente f (m) = 0 y, si f (a) = 0, entonces cada mi divide a
a y, como son primos entre s, esto implica que m | a, luego a mZ. Por
consiguiente, el teorema de isomorfa nos da un monomorfismo de Z/mZ en el
producto de anillos, y ahora basta observar que ambos anillos tienen el mismo
n
umero de elementos, luego una aplicaci
on inyectiva entre ellos tiene que ser
biyectiva.
La demostraci
on anterior es muy simple, porque prueba la inyectividad, que
es trivial, y autom
aticamente obtiene la suprayectividad, que es la parte no trivial. Sin embargo, as no tenemos ninguna informaci
on sobre c
omo encontrar
un entero a que resuelva el sistema de congruencias para unos ai dados. Vamos a dar una prueba alternativa que s nos indica c
omo obtener antiim
agenes
explcitamente y que adem
as sirve en un contexto m
as general:
Teorema 3.52 (Teorema chino del resto) Si D es un DIP, m1 , . . . , mn son
elementos de D primos entre s dos a dos y m = a1 an , se tiene el isomorfismo
de anillos
D/(m)
= D/(a1 ) D/(an )
dado por [a] 7 ([a], . . . , [a]).

n: El mismo argumento del teorema anterior prueba que la


Demostracio
aplicaci
on indicada es un monomorfismo de anillos. Falta probar que es suprayectivo. Llamemos mi = m/ai D. Es claro que ai y mi son primos entre s,
luego por la relaci
on de Bezout existen ri , si D tales que ri ai + si mi = 1. Si
llamamos ei = si mi , tenemos que
ei 1 (mod ai ),

ei 0 (mod aj ),

para j 6= i.

Ahora, dados u1 , . . . , un D, es claro que la clase de a = u1 e1 + + un en


m
odulo m es una antiimagen de ([u1 ], . . . , [un ]).
La hip
otesis de que el anillo considerado es DIP la hemos usado al usar la
relaci
on de Bezout. Vamos a probar que dicha hip
otesis es necesaria:
Teorema 3.53 Si D es un dominio de factorizaci
on u
nica, las afirmaciones
siguientes son equivalentes:
1. D es un dominio de ideales principales.
2. Los ideales primos de D son maximales.
3. Si a1 , . . . , an son elementos de D primos entre s dos a dos y m = a1 an ,
se tiene el isomorfismo de anillos
D/(a1 ) D/(an )
D/(m) =
dado por [a] 7 ([a], . . . , [a]).
4. Si a1 , . . . , an son elementos de D y d es su m
aximo com
un divisor, existen
r1 , . . . , rn D tales que d = r1 a1 + + rn an .

3.6. Congruencias y anillos cociente

123

n: 1) 2) es el teorema 3.17.
Demostracio
2) 3) Es claro que el homomorfismo descrito en el enunciado es un monomorfismo. El problema es ver que es suprayectivo. Dividimos la prueba en
varios pasos:
i) Si es primo en D, entonces las unidades de D/( r ) son las clases de
los elementos primos con .
Lo probamos por inducci
on sobre r. Para r = 1 es trivial, pues el ideal ()
es primo, luego por hip
otesis es maximal, luego D/() es un cuerpo.
Si vale para r y (, ) = 1, por hip
otesis de inducci
on existe 0 D de
manera que 0 1 (mod r ), es decir, 0 1 = r . Sea D y = 0 + r .
Veamos que eligiendo adecuadamente se cumple que 1 (mod r+1 ).
Tenemos que 1 = 0 1+ r = r ( +), luego 1 (mod r+1 )
si y s
olo si (mod ). Ahora bien, por el caso r = 1 resulta que es
una unidad m
odulo , luego existe un que cumple la congruencia.
El recproco es obvio: si 1 (mod r+1 ) entonces + r+1 = 1, con
lo que claramente - .
ii) Se cumple 3) bajo la hip
otesis de que ai = iri , donde los i son primos
no asociados dos a dos.
Llamemos mi = m/ai , de modo que mi es primo con ai , luego, por i),
sabemos que mi es una unidad en D/(ai ), es decir, que existe un si D tal que
ei = si mi 1 (mod ai ), y obviamente ei 0 (mod aj ), para j 6= i. Entonces,
dados u1 , . . . , un D, es claro que u = u1 e1 + + un en es una antiimagen de
([u1 ], . . . , [un ]) por el homomorfismo del enunciado.
Por consiguiente, [u] es una unidad de D/(m) si y s
olo si ([u], . . . , [u]) es una
unidad en el producto, lo que equivale a que [u] sea una unidad en cada cociente
D/(iri ) y hemos probado que esto equivale a que u sea primo con cada i , lo
que equivale a que u sea primo con m.
iii) Si m D no es nulo ni unitario, las unidades de D/(m) son las clases
de los elementos primos con m.
Podemos descomponer m = 1r1 nrn , donde es una unidad y los i son
primos no asociados dos a dos. Como (m) = (m1 ) y los primos con m son
los mismos que los primos con m1 , podemos suponer que = 1. Llamamos
ai = iri y por ii) tenemos el isomorfismo del enunciado.
Por lo tanto, si u D, la clase [u] es una unidad en D/(m) si y s
olo si
([u], . . . , [u]) es una unidad en el producto, lo cual equivale a que cada clase [u]
sea una unidad en D/(ai ), y por i) esto equivale a que u sea primo con cada i ,
lo que a su vez equivale a que u sea primo con m.
Por u
ltimo, usando iii) en lugar de i), la prueba de ii) vale en general,
sin suponer que cada ai es una potencia de primo (notemos que no se pierde
generalidad si suponemos que cada ai no es nulo ni unitario), lo que nos da 3).
3) 4) Razonamos por inducci
on sobre n. Consideramos primero el primer
caso no trivial, que es n = 2. Sea a1 = db1 , a2 = db2 , de modo que b1 y b2 son

124

Captulo 3. Aritmetica en dominios ntegros

primos entre s. Por 3) existe un u D tal que u 1 (mod b1 ), u 0 (mod b2 ).


Explcitamente, u = 1 + b1 c1 = b2 c2 , luego
d = d(b1 c1 + b2 c2 ) = c1 a1 + c2 a2 ,
como haba que probar. Si vale para n, sea d = mcd(a1 , . . . , an ), de modo que
d = mcd(d , an+1 ). Por hip
otesis de inducci
on y por el caso n = 2 ya probado,
tenemos que
d = r1 a1 + rn an ,
d = rd + san+1 ,
de donde d = rr1 a1 + rrn an + san+1 .
4) 1) Notemos que 4) equivale a que (a1 , . . . , an ) = (d). Sea I un ideal
propio de D y tomemos I no nulo. Factoricemos = 1 n como
producto de primos. Si es cualquier primo e I () entonces | luego
= i para alg
un i.
Definimos e() = mn e (), donde recorre los elementos no nulos de I y

e () es el exponente de en . Acabamos de probar que si e() > 0 entonces


= i para un i, es decir, que e() = 0 para todos los primos excepto quiz
a
algunos de los i .
Por la propia definici
on de e() tenemos que para cada i existe un i I
e( )
e( )
de modo que ei (i ) = e(i ). Sea = 1 1 n n . Obviamente se cumple
que I (). Adem
as = mcd(, 1 , . . . , n ), pues ciertamente divide a
, 1 , . . . , n (porque est
an en I) y si es un divisor com
un de todos ellos
entonces los divisores primos de ser
an algunos de los i (porque | ) y
ei () ei (i ) = e(i ), luego | .
Por 4) tenemos que () = (, 1 , . . . , n ) I, luego I = ().
As pues, el teorema chino del resto, al igual que la relaci
on de Bezout o
la maximalidad de los ideales primos son caractersticas que determinan a los
dominios de ideales principales entre los dominios de factorizaci
on u
nica. Aparentemente, pues, no es posible demostrar el teorema chino del resto en dominios
de factorizaci
on u
nica que no sean DIPs, pero sucede que si reformulamos el teorema en terminos de ideales, entonces es v
alido en cualquier dominio ntegro:
Teorema 3.54 (Teorema chino del resto) Sea D un dominio ntegro y
sean a1 , . . . , an ideales de D tales que ai +aj = D para i 6= j. Si 1 , . . . , n D,
existe un x D tal que x i (mod ai ) para i = 1, . . . , n.
n: Para n = 2 tenemos que a1 +a2 = 1, para ciertos elementos
Demostracio
ai ai , y basta tomar x = 2 a1 + 1 a2 .
En el caso general, para cada i 2 elegimos ai a1 , bi ai tales que
ai + bi = 1. Entonces
1=

n
Q

(ai + bi ) a1 +

i=2

n
Q

ai = D.

i=2

Por el caso ya probado existe un elemento y1 D tal que y1 1 (mod a1 ),


y1 0 (mod ai ) para i 2. Similarmente podemos definir elementos yi D

3.7. Ejemplos

125

que cumplan
yi 1 (mod ai ),

yi 0 (mod aj ) para j 6= i.

Basta tomar x = 1 y1 + + n yn .

3.7

Ejemplos

Terminamos este captulo con algunos ejemplos que ilustren los conceptos que hemos introducido. Empezamos desarrollando el u
ltimo ejemplo de
la secci
on precedente.
Los enteros de Gauss Consideremos el cuerpo Q(i), cuyos elementos, seg
un
hemos visto, se expresan de forma u
nica como a + bi, con a, b Q, y donde
i2 = 1. Esto determina completamente la suma y el producto:
a + bi + c + di = a + c + (b + d)i,

(a + bi)(c + di) = ac bd + (ad + bc)i.

Llamaremos conjugado de un elemento a + bi Q(i) al elemento dado por


a + bi = a bi. Una simple comprobaci
on muestra que la conjugaci
on z 7 z
es un isomorfismo Q(i) Q(i). Claramente es biyectiva y s
olo hay que comprobar que z1 + z2 = z1 + z2 y z1 z2 = z1 z2 , lo cual se sigue trivialmente de las
expresiones precedentes para la suma y el producto en Q(i).
A su vez podemos definir la norma N : Q(i) Q mediante N(z) = z z
o, explcitamente, N(a + bi) = (a + bi)(a bi) = a2 + b2 . Esta norma es
multiplicativa, en el sentido de que N(z1 z2 ) = N(z1 ) N(z2 ).
En efecto, N(z1 z2 ) = z1 z2 z1 z2 = z1 z1 z2 z2 = N(z1 ) N(z2 ).
Dentro de Q(i) podemos considerar el anillo de los enteros de Gauss:
Z[i] = {a + bi | a, b Z}.
Es inmediato comprobar que la suma, el producto y el opuesto de un entero de
Gauss vuelve a ser un entero de Gauss, por lo que realmente Z[i] es un subanillo
de Q(i), y de hecho un dominio ntegro. Adem
as, la norma se restringe a una
aplicaci
on N : Z[i] N, que obviamente sigue siendo multiplicativa.
Vamos a probar que Z[i] es un dominio eucldeo con dicha norma.

Obviamente cumple la propiedad 1 de la definici


on 2.17. Sean , dos
enteros de Gauss, con 6= 0. Entonces / = a + bi Q[i]. Sean m y n
enteros9 tales que |a m| 1/2, |b n| 1/2. Llamemos = m + ni Z[i] y
r = . As = + r, con

N()
2
2
< N().
N(r) = N() = N( ) N() = ((am) +(bn) ) N()

9 Siempre existen tales enteros, pues dado un n


umero racional a = u/v, podemos dividir
u = vc + r, con 0 r < v, y entonces u/v = c + r/v, con 0 r/v < 1. En suma, a < c < a + 1.
Si c a > 1/2, consideramos c0 = c 1, y entonces c0 < a y a c0 < 1/2. En cualquier caso,
hemos encontrado un m Z (sea m = c o m = c0 ) tal que |a m| 1/2.

126

Captulo 3. Aritmetica en dominios ntegros

As pues, resulta que Z[i] es tambien un DIP y un DFU. Vamos a calcular sus
unidades. Para ello observamos que si u Z[i] es una unidad, entonces existe
un v Z[i] tal que uv = 1, luego N (u)N (v) = N (1) = 1 y como son n
umeros
naturales, esto s
olo es posible si N (u) = 1. Recprocamente, si un entero de
Gauss cumple N (u) = 1 es que es una unidad, pues tenemos que u
u = 1, y
u
Z[i].
Ahora bien, los enteros de Gauss a + bi de norma 1 son los que cumplen
a2 + b2 = 1, y es claro que esto s
olo sucede si (a, b) = (1, 0), (0, 1) o, lo que
es lo mismo, si u = 1, i. Por lo tanto Z[i] tiene cuatro unidades, frente a las
dos que tiene Z.
Por consiguiente, en Z[i] los asociados no nulos aparecen en grupos de cuatro
y no en parejas, como en Z. Los asociados de 3, por ejemplo, son 3, 3, 3i, 3i.
De aqu podemos extraer una lecci
on interesante, y es que ser primo es
relativo. Por ejemplo,
2 = (1 + i)(1 i),
y ninguno de los factores es una unidad, luego 2 es primo en Z, pero no en Z[i].
De hecho, la descomposici
on anterior es la descomposici
on en factores primos
de 2, ya que N (1 + i) = 2, y esto hace que sea irreducible, pues si pudieramos
descomponer 1 + i = uv, tendramos que 2 = N (1 + i) = N (u)N (v), y como son
n
umeros naturales, necesariamente una de las dos normas es 2 y la otra es 1,
luego uno de los factores es una unidad. Lo mismo vale para el segundo factor.
M
as a
un, los dos factores primos de 2 no son realmente distintos, en el sentido
de que son asociados, pues 1 i = i(1 + i). Por lo tanto, la descomposici
on
de 2 se expresa m
as claramente como 2 = i(1 + i)2 .
Ejercicio: Comprobar que 5 = (2 + i)(2 i) es una factorizaci
on de 5 en dos primos
de Gauss no asociados. Comprobar que no hay enteros de Gauss de norma 3 y deducir
que 3 es primo en Z[i].

Enteros ciclot
omicos de orden 3 Consideramos un ejemplo similar al anterior, pero partiendo del polinomio x2 + x + 1, que es irreducible en Q[x], porque
no tiene races o, m
as en general, porque as lo hemos visto en el u
ltimo ejemplo
de la secci
on 3.5. Podemos considerar el cuerpo Q[], donde es una raz del
polinomio dado, es decir, cumple que 2 + + 1 = 0. Sus elementos son de la
forma a + b, con a, b Q. La suma y el producto vienen dados por
a + b + c + d = a + c + (b + d),

(a + b)(c + d) = ac bd + (ad + bc bd).

En efecto,
(a + b)(c + d) = ac + (ad + bc) + bd 2 = ac + (ad + bc) + bd(1 )
= ac bd + (ad + bc bd).

3.7. Ejemplos

127

A menudo es preferible pensar que los elementos de Q() son de la forma


a + b + c 2 entendiendo que la expresi
on no es u
nica, sino que, como se da la
relaci
on 1 + + 2 = 0, se cumple que
a + b + c 2 = a + r + (b + r) + (c + r) 2
para cualquier r Q, es decir, podemos transformar cualquier elemento de Q()
sumando un mismo n
umero racional a todas sus coordenadas sin que se altere
su valor.
En este caso definimos la conjugaci
on10 mediante
a + b = a + b 2 = a b b.
Es f
acil ver que conserva sumas y productos. Por ejemplo, para el producto
tenemos que
(a + b)(c + d) = ac bd + (ad + bc bd) = ac bd + (ad + bc bd) 2 ,
a + b c + d = (a + b 2 )(c + d 2 ) = ac + (ad + bc) 2 + bd,
y ambas expresiones son iguales porque la primera se transforma en la segunda
sumando bd a todas las coordenadas.
Como antes definimos la norma N : Q() Q mediante N(z) = z z, lo que
explcitamente es
2
2
2
2
2
2
N(a + b) = (a + b)(a + b ) = a + b + ab + ab = a ab + b .

Como la conjugaci
on es conmutativa, la norma tambien lo es, es decir, se
cumple que N(z1 z2 ) = N(z1 ) N(z2 ).
Definimos el anillo de los enteros ciclot
omicos de orden 3 como
Z[] = {a + b | a, b Z}.
Como en el caso de los enteros de Gauss es inmediato que se trata de un subanillo de Q(), en particular es un dominio ntegro, y la norma se restringe
a una aplicaci
on N : Z[] N. En efecto, notemos que si ab 0 entonces
trivialmente a2 ab + b2 0, y si ab < 0 entonces
a2 ab + b2 > a2 2ab + b2 = (a b)2 0.
Tambien sucede que Z[] es un dominio eucldeo con la norma que estamos
considerando. La primera condici
on se cumple trivialmente y, en cuanto a la
segunda, si , Z[] con 6= 0, consideramos el cociente / = a+b Q[]
lector puede preguntarse por qu
e en Q(i) hemos definid a + bi = a bi y ahora no
definimos a + b = a b. En realidad la definici
on de conjugaci
on sigue el mismo criterio
en ambos casos: en el primer caso las races de x2 + 1 son i y i y la conjugaci
on intercambia
una con otra. Ahora las races de x2 + x + 1 son y 2 , y la conjugaci
on tambi
en intercambia
una por otra.
10 El

128

Captulo 3. Aritmetica en dominios ntegros

y tomamos m, n Z tales que |a m| 1/2, |b n| 1/2. Sea = m + n y


r = , con lo que
N(r) = N( ) = N(

) N() = N(a m + (b n)) N(),

y
2
2
N(a m + (b n)) = |(a m) (a m)(b n) + (b n) |

(a m)2 + |a m||b n| + (b n)2

3
,
4

luego en definitiva = + r con N(r) < N().


As pues, Z[] es tambien DIP y DFU. Exactamente el mismo razonamiento
empleado para Z[i] nos da que las unidades son los elementos de norma 1, es
decir, los a + b que cumplen la ecuaci
on a2 + b2 ab = 1.
Para resolverla observamos que no pueden ser a < 0 y b > 0 o viceversa, pues
entonces el miembro izquierdo suma al menos 3. Por lo tanto, o bien a 0 y
b 0, o bien a 0 y b 0. Escribiendo la ecuaci
on en la forma (ab)2 +ab = 1
concluimos f
acilmente que hay seis soluciones, correspondientes a
1,

(1 + ) = 2 .

As pues, hemos encontrado un DFU con seis unidades, en el que los asociados no nulos se agrupan, por tanto, de seis en seis.
Es f
acil ver que no hay enteros ciclot
omicos de norma 2, pues para que se
cumpla a2 + b2 ab = 2, como antes tienen que ser a 0 y b 0 o bien a 0 y
b 0, y ahora la ecuaci
on (a b)2 + ab = 2 resulta imposible, pues si el primer
2
sumando es 0 queda a = 2, que es imposible, y si es 1 fuerza a que el segundo
tambien sea 1, pero entonces a = b = 1 y el primer sumando sera 0.
Esto se traduce en que 2 es primo, pues si factorizara como 2 = , entonces
N() N() = N(2) = 4, pero, como ninguna norma puede ser 2, uno de los
factores tendra norma 1, luego sera una unidad y la factorizaci
on es trivial.
Por otra parte N(1) = 3, lo que nos da la factorizaci
on 3 = (1)(1 2 ),
que es una descomposici
on en factores primos, pues ambos factores tienen
norma 3, luego si cualquiera de ellos se descompone en producto de dos enteros ciclot
omicos, uno de los factores tiene que tener norma 1, luego es una
unidad.
Adem
as, los dos factores son asociados, pues 1 2 = 2 (1 ), luego la
descomposici
on de 3 en factores primos es 3 = 2 (1 )2 .
Un ejemplo
de dominio
sin
on u
nica Consideramos finalmente

factorizaci
el cuerpo Q 5 , donde 5 es una raz del polinomio x2 + 5. Copiando
literalmente los argumentos para el caso de Z[i], podemos definir el anillo


Z 5 = {a + b 5 | a, b Z}

3.7. Ejemplos

129


con la norma N : Z 5 N dada por

2
2
N(a + b 5) = (a + b 5)(a b 5) = a + 5b .
Nuevamente, las unidades son los elementos de norma 1, que en este caso
son simplemente 1, como en Z. Pero lo que
no es posible es imitar la prueba
de que Z[i] es un dominio eucldeo, porque Z 5 ni siquiera es DFU. Para
probarlo basta observar que

3 7 = 21 = (4 + 5 )(4 5 ).
Se trata de dos descomposiciones en irreducibles, pues las normas de los cuatro
factores son, respectivamente, 9, 49, 21 y 21. Si alguno de ellos no fuera irreducible, se descompondra en producto de elementos de norma 3 o 7, pero no existen
elementos de estas normas, pues es f
acil ver que las ecuaciones a2 + 5b2 = 3 y
2
2
a + 5b = 7 no tienen soluciones enteras.
Adem
as son dos descomposiciones distintas, ya que los u
nicos asociados de
3
son 3,
y
ninguno
de
ellos
aparece
en
la
segunda
factorizaci
on. Por lo tanto,

Z 5 no es DFU. M
as a
un, cualquiera de los factores es un ejemplo de

irreducible que no es primo, pues por ejemplo, 3 | (4 + 5 )(4 5 ), pero 3


no divide a ninguno de los factores. Si lo hiciera sera

3(u + v 5) = 3u + 3v 5 = 4 5,
y por la unicidad de la expresi
on 3v | 1, lo cual es imposible.

Ejercicio: Definir y estudiar el anillo Z

2 . Probar que es un dominio eucldeo.

Descomposici
on en fracciones simples Terminamos con un ejemplo mucho m
as elemental que los anteriores, pero que ilustra el uso de la factorizaci
on
u
nica en los anillos de polinomios. Se trata de una descomposici
on que se usa
principalmente a la hora de calcular integrales de cocientes de polinomios con
coeficientes reales:
Teorema 3.55 Si k es un cuerpo, toda funci
on racional z k(x) se descompone de forma u
nica como
z=f+

ri
n X
X
fij
i=1 j=1

pji

donde f, fij , pi k[x], los polinomios pi son m


onicos, irreducibles, distintos dos
a dos, y fij es nulo o tiene grado menor que pi (pero firi 6= 0).
n: Sea z = u/v, con u, v k[x]. Podemos suponer que u y
Demostracio
v son primos entre s y que v es m
onico. Si v = 1 tenemos la descomposici
on
con f = u. En caso contrario consideremos un factor primo p1 de v, de modo

130

Captulo 3. Aritmetica en dominios ntegros

que v = pr11 v y p1 no divide a v. Podemos suponer que tanto p1 como v son


m
onicos. Vamos a probar que
r

1
u
u
X
f1j
= +
,
v
v j=1 pj1

donde u
y v son primos entre s y los polinomios f1j tienen grado menor que
el grado de p1 . Si obtenemos esta descomposici
on, podemos aplicar el mismo
resultado a u
/
v y as sucesivamente hasta que el denominador acabe siendo 1 (lo
cual ocurrir
a necesariamente tras un n
umero finito de pasos, porque a cada paso
le quitamos un factor primo). Con esto habremos llegado a una descomposici
on
de z como la que aparece en el enunciado.
Como p1 y v son primos entre s, por la relaci
on de Bezout existen polinomios
c, d tales que c
v + dp1 = 1. Esta igualdad implica en particular que p1 no divide
a c, y tampoco divide a u porque u y v son primos entre s. Por lo tanto, en la
divisi
on uc = gp1 + f1,r1 , el resto f1,r1 no puede ser nulo, y tiene grado menor
que el de p1 . As pues,
u
du
g
v + du
u1
= uc +
p1 =
p1 + f1,r1 =
p1 + f1,r1 ,
v
v
v
v
donde u1 y v son primos entre s. Aplicamos el mismo razonamiento a u1 /
v
para obtener la descomposici
on

u u2
u2 2
=
p1 + f1,r1 1 p1 + f1,r1 =
p + f1,r1 1 p1 + f1,r1 ,
v
v
v
donde u2 y v son primos entre s (aunque ahora f1,r1 1 s puede ser 0, lo que
suceder
a si p1 divide a u1 ). Repetimos el proceso hasta obtener:
r

1
X
u
u

= pr11 +
f1j pr11 j ,
v
v
j=1

donde cada f1j es nulo o tiene grado menor que el de p1 y u


= ur es primo con
v. Dividiendo entre pr11 obtenemos
r

z=

1
u
u
X
f1j
= +
,
v
v j=1 pj1

que es la descomposici
on que busc
abamos.
Ahora vamos a probar la unicidad. Supongamos que una misma fracci
on
z k(x) admite dos descomposiciones en factores simples. Pongamos que una
de las descomposiciones tiene m fracciones (sin contar el polinomio inicial) y
la otra n, con m n. Razonamos por inducci
on sobre n. Si n = 0 tenemos
simplemente dos polinomios, que trivialmente han de ser el mismo, pues ambos
han de coincidir con z.

3.7. Ejemplos

131

Consideremos una descomposici


on cualquiera:
z=f+

ri
n X
X
fij
i=1 j=1

pji

Al sumar todas las fracciones correspondientes a pi , el denominador com


un es
pri i , y el numerador es una suma en la que todos los sumandos son m
ultiplos de
pi menos uno (fi,ri 6= 0), luego tenemos que
z=f+

n
X
hi
ri ,
p
i=1 i

donde pi no divide a hi . Al efectuar la suma (incluyendo a f ), con denominador


com
un pr11 prnn , el numerador es una suma de n + 1 terminos, todos los cuales
son m
ultiplos de pi menos uno, a saber, pr11 hi prnn , luego el numerador no
es m
ultiplo de pi . As pues, concluimos que, si z = u/v con u y v primos entre s
y v m
onico, necesariamente v = pr11 prnn y que u no es divisible entre ninguno
de los pi .
Con esto hemos probado que, en cualquier descomposici
on de z en fracciones
simples, los polinomios pi son necesariamente los factores irreducibles de v, y
los ri son los exponentes con que aparecen en v.
Consideremos de nuevo las dos descomposiciones que estamos suponiendo
que tiene z. Pongamos que una contiene el sumando f1r1 /pr11 y la otra g1r1 /pr11 .
Seg
un hemos visto,
u = f1,r1 pr22 prnn + m
ultiplos de p1 = g1,r1 pr22 prnn + m
ultiplos de p1 ,
luego p1 divide a f1,r1 g1,r1 , lo cual s
olo es posible si f1,r1 = g1,r1 , ya que
ambos tienen grado menor que p1 .
Esto significa que podemos cancelar el sumando f1,r1 /pr11 de ambas descomposiciones, y as llegamos a otra fracci
on que admite dos descomposiciones en
factores simples de longitudes m 1 y n 1. Por hip
otesis de inducci
on, ambas tienen que ser iguales, luego las dos descomposiciones de partida tambien
coinciden.
Ejemplo Vamos a calcula la descomposici
on en fracciones simples de
x3
.
(x 1)(x 2)2
Sabemos que tiene que ser de la forma
x3
A
B
C
=
+
+
.
(x 1)(x 2)2
x 1 x 2 (x 2)2
Para calcular A multiplicamos por x 1 y evaluamos en 1:
x3
B(x 1) C(x 1)
=A+
+
,
2
(x 2)
x2
(x 2)2

132

Captulo 3. Aritmetica en dominios ntegros

luego 2 = A. Si multiplicamos por (x 2)2 obtenemos C:


x3
A(x 2)2
B(x 2)2
=
+
+ C,
x1
x1
x2
de donde 1 = C. Ahora que conocemos A y B, dando, por ejemplo, a x el
valor x = 3 obtenemos B:
0 = 1 + B 1,
luego B = 2. En definitiva:
x3
2
2
1
=
+

.
(x 1)(x 2)2
x 1 x 2 (x 2)2

Captulo IV

Algunas aplicaciones
En este captulo estudiaremos algunos problemas cl
asicos de la teora de
n
umeros que ilustren la relaci
on entre la teora general de anillos que hemos
estudiado y los problemas concretos sobre n
umeros enteros, a la vez que motiven las tecnicas y conceptos algebraicos m
as avanzados que introduciremos
en los temas siguientes. Comenzamos con dos problemas que se remontan a la
matem
atica griega.

4.1

N
umeros perfectos

Los n
umeros se han relacionado desde siempre con el esoterismo y la adivinaci
on. As, el n
umero 7 se ha considerado un n
umero de buena suerte, mientras
el 13 era considerado nefasto. Un concepto que tiene su origen en esta clase de
teoras es el de n
umero perfecto. Un n
umero es perfecto si es la suma de sus
divisores distintos de el mismo (siempre considerando n
umeros naturales). Por
ejemplo, los divisores de 6 son 1, 2 y 3 y se cumple que 6 = 1 + 2 + 3. El n
umero
6 es perfecto. Otro ejemplo de n
umero perfecto es el 28 = 1 + 2 + 4 + 7 + 14.
Definamos la funci
on (n) igual a la suma de los divisores de n. En estos
terminos un n
umero n es perfecto si y s
olo si (n) = 2n (pues tambien sumamos
el propio n).
Una funci
on f de n
umeros naturales es multiplicativa si cuando (m, n) = 1
cumple f (mn) = f (m)f (n). Las funciones multiplicativas aparecen frecuentemente en teora de n
umeros, y de hecho acabamos de encontrarnos con una.
Para probarlo hemos de tener en cuenta que si (m, n) = 1, entonces cada divisor
de mn se expresa de forma u
nica como el producto de un divisor de m y un
divisor de n. En efecto, si a | mn, descomponemos el n
umero a en un producto,
el primero de cuyos factores contenga a los factores primos de a que dividen a
m y el segundo a los que dividen a n. Por lo tanto
P
PP
P P P
(mn) =
d=
uv =
u
v =
u (n) = (m)(n).
d|mn

u|m v|n

u|m

v|n

133

u|m

134

Captulo 4. Algunas aplicaciones

Por otra parte, si p es un primo es f


acil calcular (pn ) = 1 + p + + pn .
Teniendo en cuenta la identidad (1 + x + x2 + + xn )(x 1) = xn+1 1, resulta
que
pn+1 1
(pn ) =
p1
As podemos calcular f
acilmente la funci
on . Por ejemplo,
(100) = (22 )(52 ) =

23 1 53 1

= 7 31 = 217.
21 51

Euclides recoge en sus Elementos el hecho de que si el n


umero 1+2+ +2n =
n n+1
2
1 es primo, entonces el n
umero 2 (2
1) es perfecto.
n+1

En efecto, como para los primos p se cumple que (p) = p + 1, en nuestro


caso tenemos que (2n+1 1) = 2n+1 , y como es multiplicativa,

2n (2n+1 1) = (2n )(2n+1 1) = (2n+1 1) 2n+1 = 2 2n (2n+1 1) .


Descartes afirm
o (y la primera prueba conocida se debe a Euler) que un
n
umero par es perfecto si y s
olo si es de la forma indicada por Euclides.

Para verlo tomemos un n


umero par, que lo podremos expresar en la forma
2n m, donde n > 0 y m es un n
umero impar. Si es perfecto, (2n m) = 2n+1 m.
Como es multiplicativa
(2n+1 1)(m) = 2n+1 m.

(4.1)

Como 2n+1 1 es impar, el exponente de 2 en (m) ha de ser n + 1, es decir,


(m) = 2n+1 a para cierto n
umero natural a. Sustituyendo en (4.1) obtenemos
(2n+1 1)2n+1 a = 2n+1 m, luego
(2n+1 1)a = m.

(4.2)

Por lo tanto (m) = 2n+1 a = m + a. Ahora bien, si a > 1 resulta que 1,


a y m son divisores distintos de m, luego (m) debe ser al menos 1 + a + m,
contradicci
on. Concluimos que a = 1 y que (m) = m + 1, lo que s
olo es posible
si m no tiene m
as divisores que 1 y m, es decir, si m es primo.
Sustituyendo a = 1 en (4.2) queda que m = 2n+1 1, luego el n
umero
original era 2n (2n+1 1) con 2n+1 1 primo, o sea, de la forma establecida
por Euclides. Con un leve cambio de ndice podemos enunciar as lo que hemos
probado:
Un n
umero par es perfecto si y s
olo si es de la forma 2n1 (2n 1) y 2n 1
es primo.
Respecto a los n
umeros perfectos impares no se conoce ninguno, pero nadie
ha demostrado que no existan. Es un problema abierto.
Ejercicio: Estudiar la funci
on d(n) = n
umero de divisores de n.

Ahora pasamos a ocuparnos del problema de determinar para que valores de


n se cumple que el n
umero 2n 1 es primo. El lector emprico ya debera haber

4.1. N
umeros perfectos

135

empezado a recopilar datos. He aqu lo que puede obtenerse sin esforzarse uno
mucho:
n
2 3 4
5
6
7
8
9
10
11?
2n 1 3 7 15 31 63 127 255 511 1023 2 047?
La tabla muestra los primeros valores de 2n 1. Es f
acil ver que para n = 2,
3, 5 y 7 obtenemos primos (el 127 es primo porque no es divisible por primos
menores que 12). Tampoco cuesta ver que los n
umeros restantes no lo son.
Todos son m
ultiplos de 3 salvo el 511, que es divisible entre 7. El n
umero
correspondiente a 11 est
a entre interrogantes porque ya no es f
acil decidir si es
primo. Habra que tratar de dividirlo entre todos los primos menores que 45 y
hay un total de 14. Dejemos eso para luego y centremonos en los casos claros.
Vemos que 2n 1 no siempre es primo. Conjetura algo el lector sobre en que
casos lo es? No hay que forzar mucho la imaginaci
on para sospechar que 2n 1
es primo exactamente cuando n lo es.
Tratemos de probar que 2n 1 no es primo si n es compuesto. Para buscar
un posible divisor a 2n 1 observemos los divisores que hemos encontrado en
nuestros ejemplos:
n
2 3 22
5
23
7
23
32
25
2
2 1 3 7 3 5 31 3 7 127 3 5 17 7 73 3 11 31
n

Si al lector no le basta esto para conjeturar que divisores podemos encontrar


en el n
umero 2n 1 cuando n no es primo, he aqu una pista m
as. La factorizaci
on siguiente no ha sido hallada por tanteo: 214 1 = 16 383 = 3 43 127.
Es f
acil encontrar el factor 3, pero c
omo se encuentran los factores 43 y 127 en
el cociente 5.461?
La mayor pista est
a en el 127. El 127 es el primo correspondiente a n = 7 y
7 es uno de los factores de 14. El otro factor es 2 y su primo correspondiente el
3, que tambien divide a 214 1. Tambien es claro el caso n = 10, cuyos factores
son 2 y 5 y en 210 1 aparecen los primos correspondientes, 3 y 31. Vemos que
tambien aparecen otros primos, como el 11 en 210 1 o el 5 y el 17 en 28 1,
pero eso no importa. La conjetura es que si d | n entonces 2d 1 | 2n 1, y
la prueba es trivial si usamos congruencias: tomando clases m
odulo 2d 1 se
d
cumple que [2] = [1], luego si n = dm

m
[2n 1] = [2]d [1] = [1]m [1] = [0],
lo que prueba que en efecto 2d 1 | 2n 1.
Con esto ya tenemos que para que 2n 1 sea primo el n
umero n ha de ser
primo. Los n
umeros de la forma 2p 1 con p primo se llaman n
umeros de
Mersenne. La cuesti
on es si todos los n
umeros de Mersenne son primos. Antes
hemos probado que los primos de Mersenne est
an en correspondencia con los
n
umeros pares perfectos. He aqu los n
umeros perfectos que hemos encontrado:
p
2 3
5
7
2p 1
3 7 31
127
2p1 (2p 1) 6 28 496 8 128

136

Captulo 4. Algunas aplicaciones

Seg
un nuestras conjeturas el n
umero 211 1 debera ser primo. El lector
animoso puede tratar de dividirlo entre los 14 primos menores que 45. Aqu
vamos a estudiar el problema pensando m
as para trabajar menos. Es evidente
que 211 1 = 2.047 no es m
ultiplo de 2, 3 o 5. Vamos a ver si puede ser
m
ultiplo de 7. No s
olo vamos a probar que no lo es, sino que vamos a encontrar
razones por las que no puede serlo, con lo que podremos descartar muchos
m
as primos aparte del 7. El n
umero 211 1 ser
a m
ultiplo de 7 si y s
olo si al
tomar clases m
odulo 7 se cumple que [2]11 = [1]. Las potencias de 2 m
odulo 7
pueden calcularse recurrentemente [2]n+1 = [2]n [2], lo que nos permite reducir
las potencias al tiempo que las calculamos: [2]2 = [4], [2]3 = [4][2] = [8] = [1],
[2]4 = [1][2] = [2], etc. As vamos obteniendo lo siguiente:
n
[2]n

0
1
2
3
4
5
6 ...
[1] [2] [4] [1] [2] [4] [1] . . .

Vemos que el [1] se alcanza cclicamente en los m


ultiplos de 3, luego no es
necesario llegar hasta el 11: como 11 no es m
ultiplo de 3, 211 1 no puede ser
m
ultiplo de 7.
Por lo tanto la raz
on por la que 211 1 no es m
ultiplo de 7 es que 11 no es
m
ultiplo de 3. De d
onde ha salido ese 3? Es obvio que al calcular potencias de
un elemento dado no nulo de Z/pZ, como es [2], tarde o temprano obtendremos
un valor repetido, pues s
olo hay un n
umero finito de valores posibles, o sea, dado
a en Z/pZ, existen n
umeros naturales 0 < m < n tales que am = an = am anm ,
luego anm = 1. En resumen, ha de haber un natural no nulo d tal que ad = 1.
Si tomamos el d menor posible es obvio que el 1 se alcanzar
a exactamente en
los m
ultiplos de d, que es lo que nos hemos encontrado.
En resumen, dado un primo p existe un n
umero d tal que 2n 1 es divisible
entre p si y s
olo si d | n. El lector puede calcular los valores de d para distintos primos. No es inmediato, pero tampoco excesivamente laborioso. Como
siempre, el lector perezoso tiene a continuaci
on una tabla:
p 3 5 7 11 13 17 19
d 2 4 3 10 12 8 18
Encuentra el lector alguna relaci
on entre p y d? Fermat encontr
o una al
estudiar el problema: d | p 1. Esto es esencialmente el teorema de Fermat
que hemos probado en el captulo anterior. En efecto, hemos demostrado que
2p1 1 (mod p), y como 2n vale 1 en los m
ultiplos de d, ha de ser d | p 1.
Tenemos que para que 211 1 sea divisible entre p es necesario que el d
correspondiente a p divida a 11, pero como d no puede ser 1 (esto es evidente),
ha de ser d = 11, y por el teorema de Fermat 11 | p 1. En resumen, para que
un primo p pueda dividir a 211 1 es necesario que sea de la forma p = 11m + 1.
Buscamos ahora los n
umeros de la forma 11m + 1 menores que 45. Podemos
ahorrarnos los valores impares de m porque dan n
umeros pares, que no pueden
ser primos. Resulta que s
olo hay un valor posible: 11 2 + 1 = 23. Acabamos
de probar que si 211 1 no es primo, entonces es divisible entre 23.

4.2. Primos de Fermat

137

Ahora calculamos m
odulo 23:
[2]5
[2]10
[2]11

= [32] = [9],
= [9]2 = [9][3][3] = [27][3] = [4][3] = [12],
= [24] = [1].

Luego resulta que, despues de todo, 211 1 no es primo. Concretamente factoriza


como 23 89.
En realidad hoy en da no se sabe si hay un n
umero finito o infinito de primos
de Mersenne. De todos modos los primos de Mersenne no terminan en el 27 1.
Vamos a probar con el siguiente candidato: 213 1 = 8.191. As veremos la
potencia de la tecnica que hemos desarrollado.
2
En primer lugar 213 1 < 214 = 27 = 1282 , luego nos basta buscar
posibles divisores primos menores que 128.
Supongamos que p | 213 1. Entonces m
odulo p se cumple que [2]13 = [1].
Si d es el menor natural no nulo tal que [2]d = [1] se cumple que d | 13, y por
el teorema de Fermat 13 | p 1. As pues p = 13n + 1. M
as a
un, como n ha de
ser par necesariamente, p = 26n + 1.
Los valores de 26n + 1 menores que 128 son 27, 53, 79, 105. S
olo hay dos
primos, lo que significa que si 213 1 no es primo entonces es divisible entre 53
o 79. Es f
acil ver que no es el caso. Tomamos clases m
odulo 53:
[2]6 = [64] = [11], [2]12 = [11]2 = [121] = [15], [2]13 = [30] 6= [1].
Y ahora m
odulo 79:
[2]6
[2]12
[2]13

=
[64]
= [15]2
= [24]

= [15],
= [15][5][3] = [75][3] = [4][3] = [12],
6
=
[1].

Con ayuda de ordenadores se ha podido ampliar la lista de primos de Mersenne. Los 15 primeros corresponden a los valores de p dados en la tabla 4.1.
Tabla 4.1: Primos p tales que 2p 1 es un primo de Mersenne
p

2, 3, 5, 7, 13, 17, 19, 31, 61, 89, 107, 127, 521, 607, 1 279, . . .

Ejercicio: Probar que n 1 | nk 1, con lo que si k > 1 el n


umero nk 1 no puede
ser primo salvo si n = 2.

4.2

Primos de Fermat

En la secci
on anterior hemos visto que un primo de Mersenne es un primo
de la forma 2n 1, lo cual obliga a que el exponente sea primo. Similarmente,
se define un primo de Fermat como un primo de la forma 2n + 1.

138

Captulo 4. Algunas aplicaciones

La tabla siguiente muestra que en este caso el exponente no necesita ser


primo:
n
1 2 3 4 5 6
7
8
9
10
2n + 1 3 5 9 17 33 65 129 257 513 1 025
Por el contrario, resultan primos los n
umeros correspondientes a los valores
n = 1, 2, 4, 8, . . . Fermat conjetur
o bas
andose en esto que los primos que hoy
n
llevan su nombre son exactamente los n
umeros de la forma 22 + 1.
Ciertamente todo primo de Fermat es de esta forma: sea p = 2n +1 un primo
de Fermat. Seg
un hemos observado en la secci
on anterior, existe un natural d
tal que p | 2k 1 si y s
olo si d | k, y hemos visto que d | p 1 = 2n , luego d
tiene que ser una potencia de 2.
u
M
as precisamente, si n = 2u v, con v impar, entonces 22 v 1 (mod p),
u+1
luego 22 v 1 (mod p). As, d | 2u+1 v y es potencia de 2, luego de hecho
e
e1
d | 2u+1 . Sea, pues e u + 1 tal que [2]2 = [1] pero [2]2
6= 1. Como el
e1
e1
2
n
cuadrado de esta clase es [1], ha de ser [2]
= [1] y as 2 + 1 | 22
+ 1.
e1
Puesto que 2e1 n, necesariamente 2n + 1 = 22
+ 1 y n = 2e1 .
n

Queda por ver si todo n


umero de la forma 22 + 1 es primo. Volvamos a la
tabla y ampliemosla:
n
0 1 2
3
4
5
n
22 + 1 3 5 17 257 65 537 4 294 967 297
Ahora chocamos nuevamente con un problema computacional. No es f
acil
decidir si los n
umeros que aparecen son primos o no. De hecho el lector ha aceptado en la tabla anterior que el n
umero 257 es primo, lo que supone probar que
no es divisible entre primos menores o iguales que 13. Las tecnicas que hemos
empleado en la secci
on anterior para estudiar la primalidad de los n
umeros de
Mersenne se pueden adaptar f
acilmente para estudiar los n
umeros de Fermat.
No obstante, conviene refinarlas ligeramente probando una versi
on m
as fuerte
del teorema de Fermat para las potencias de 2:
Teorema 4.1 Si p es un primo impar, entonces 2

p1
2

n: Sea s = (p 1)/2. Entonces


Demostracio
s! =

2k

1ks/2

(2k + 1) =

0k s1
2

(1)n

1ns

(1)2k 2k

1ks/2

1ks/2

2k

0k s1
2

(1)
Q

0k s1
2

p2 1
8

(mod p).

(1)2k+1 (2k 1)

(p 2k 1) (mod p)

Ahora observamos que si 0 2k + 1 s, entonces s = p s < p 2k 1 p.


Notemos que la desigualdad estricta se debe a que para que fuera una igualdad s

4.2. Primos de Fermat

139

tendra que ser par, pero entonces 2k + 1 < s, luego p s < p 2k 1. As


pues, el u
ltimo producto recorre todos los n
umeros pares s < 2k p, luego
P
n
Q
Q
1ns
s! (1)
2k
2k (1)s(s+1)/2 2s s! (mod p)
1ks/2

s/2<ks

Claramente, s! 6= 0 en Z/pZ, luego podemos simplificarlo, y queda que


(1)s(s+1)/2 2s 1 (mod p),
2

lo cual equivale a que 2s (1)s(s+1)/2 = (1)(p

1)/8

(mod p).

En particular, si un primo p cumple p 1 (mod 8), no s


olo sabemos que
2p1 1 (mod p), que es lo que afirma el teorema de Fermat, sino algo ligeramente m
as fuerte, a saber, que 2(p1)/2 1 (mod p). Vamos a sacarle partido
a este hecho:
Vamos a estudiar si el n
umero 65 537 es o no primo. Sabemos que se trata de
4
22 + 1. Supongamos que es divisible entre un primo p. Entonces, m
odulo p se
4
5
cumple que [2]2 = [1], y elevando al cuadrado [2]2 = [1]. Consecuentemente
el natural d que cumple 2k 1 (mod p) si y s
olo si d | k (que ya hemos visto
que es potencia de 2) tiene que ser d = 25 .
Por otra parte d | p 1, o sea, 25 | p 1 y por tanto p ha de ser de la
forma p = 32k + 1. M
as a
un, como p 1 (mod 8), el teorema anterior nos da
que 2(p1)/2 1 (mod p), por lo que podemos afirmar, m
as precisamente, que
25 = d | (p 1)/2, luego p = 64k + 1.
4

La raz cuadrada de 22 + 1 es apenas mayor que 22 = 256, luego si nuestro


n
umero no es primo tiene un divisor primo p < 256. Los primeros valores de la
sucesi
on 64k + 1 son:
65, 129, 193, 225, 257, . . .
y el u
nico primo en ella menor que 256 es 193. Por lo tanto, 65 537 ser
a primo
si y s
olo si no es divisible entre 193. Comprobar que esto es cierto no supone
ninguna dificultad, luego, en efecto, 65 537 es primo.
El siguiente posible primo de Fermat es muchsimo mayor. Si aplicamos el
5
mismo razonamiento concluimos que si 22 + 1 no es primo, entonces tiene un
divisor primo de la forma p = 128k + 1 y p < 65 536. Esto nos deja todava un
gran n
umero de candidatos. Los diez primeros son
129, 257, 385, 513, 641, 769, 897, 1 025, 1 153, 1 281, . . .
(los primos est
an en negrita).
El primer primo es f
acil de descartar por su forma, ya que se trata de 28 + 1
5
8
y m
odulo 2 + 1 se cumple [22 + 1] = [28 ]4 + [1] = [1]4 + [1] = [2] 6= [0].

140

Captulo 4. Algunas aplicaciones

Respecto al siguiente, las potencias de 2 m


odulo 641 son las siguientes:
2,
4,
8,
16, 32, 64, 128, 256, 129, 258,
125,
250, 141, 282, 77, 154, 308, 25, 50, 100,
200, 400, 159, 318, 5, 10, 20,
40,
80,
160,
320,
1.
5

As pues, [22 + 1] = [0], es decir, 641 | 22 + 1 que no es, por tanto, primo.
Posiblemente as fue c
omo Gauss lleg
o a descubrir este hecho. Por supuesto una
5
calculadora nos da m
as r
apidamente que 22 + 1 = 641 6.700.417 (y el segundo
factor resulta ser primo).
Hoy en da no se conoce ning
un otro primo de Fermat distinto de los cinco
que ya hemos encontrado, a saber:
3,

4.3

5,

17,

257,

65 537.

Ternas pitag
oricas

Diofanto trat
o en su Aritmetica el problema de encontrar ternas de n
umeros
naturales no nulos x, y, z tales que x2 + y 2 = z 2 . Estas ternas se llaman ternas
pitag
oricas, pues seg
un el teorema de Pit
agoras permiten construir tri
angulos
rect
angulos con lados enteros. Los egipcios las usaban para construir angulos
rectos en arquitectura. Entre los ejemplos m
as conocidos est
an 32 + 42 = 52 ,
2
2
2
2
2
2
5 + 12 = 13 , 7 + 24 = 25 . C
omo encontrarlas todas?
En primer lugar notamos que si (x, y, z) es una terna pitag
orica, tambien lo
es (mx, my, mz) para cualquier n
umero m y, recprocamente, dada una terna
pitag
orica (x, y, z), podemos dividir sus componentes por su m.c.d. para obtener otra que cumpla adem
as (x, y, z) = 1. Una terna cuyos elementos no
tengan divisores comunes se llama primitiva. Si encontramos un metodo para
hallar todas las ternas primitivas, las restantes se obtienen multiplic
andolas por
n
umeros arbitrarios, luego el problema est
a resuelto. Las ternas anteriores son
todas primitivas.
Ante todo notemos que un divisor primo de dos de las componentes de una
terna pitag
orica, divide a la tercera. Por ejemplo, si p | x y p | z, entonces
p | z 2 x2 , con lo que p | y 2 y por lo tanto p | y. Esto significa que, en realidad,
las componentes de una terna pitag
orica primitiva son primas entre s dos a dos.
En particular no puede haber m
as de una componente par. Un n
umero es par o
impar si y s
olo si lo es su cuadrado, y la suma y la diferencia de n
umeros impares
es par. Como consecuencia si dos de las componentes son impares, la restante
ha de ser par, es decir, en una terna primitiva hay siempre dos componentes
impares y una par.
Ahora veamos que z ha de ser impar. En otro caso lo son x e y, es decir,
x = 2m + 1, y = 2n + 1, luego x2 = 4m2 + 4m + 1, y 2 = 4n2 + 4n + 1. Al tomar
clases m
odulo 4 resulta que [z]2 = [x]2 + [y]2 = [1] + [1] = [2]. Sin embargo
ninguna clase m
odulo 4 tiene a [2] por cuadrado: [0]2 = [0], [1]2 = [1], [2]2 = [0],
2
[3] = [1].

4.3. Ternas pitag


oricas

141
Tabla 4.2: Ternas pitag
oricas
p
2
3
4
4
5
5
6
6
7
7
7

q
1
2
1
3
2
4
1
5
2
4
6

x
4
12
8
24
20
40
12
60
28
56
84

y
3
5
15
7
21
9
35
11
45
33
13

z
5
13
17
25
29
41
37
61
53
65
85

Como la situaci
on de x e y es simetrica, podemos suponer que x es par e y
impar. Seg
un lo visto z es tambien impar. Consecuentemente z + y, z y son
ambos pares. Digamos que x = 2u, z + y = 2v, z y = 2w.
Ahora x2 = z 2 y 2 = (z + y)(z y), luego u2 = vw, v > 0, w > 0.
Por otro lado (v, w) = 1, ya que si un primo p divide a ambos, entonces
1
(z + y) +
2
1
p | (v w) = (z + y)
2
p | (v + w) =

1
1
(z y) = 2z = z,
2
2
1
(z y) = y,
2

y como (y, z) = 1, esto es contradictorio.


Por la factorizaci
on u
nica, es claro que si vw = u2 con (v, w) = 1, v > 0,
w > 0, entonces tanto v como w han de ser cuadrados (cada uno ha de contener
cada primo un n
umero par de veces porque as le ocurre a u). Pongamos v = p2
2
y w = q . Obviamente (p, q) = 1.
As tenemos que z = v + w = p2 + q 2 , y = v w = p2 q 2 . En particular
q < p.
Como z e y son impares, p y q deben tener paridad opuesta. Sustituyendo
en las f
ormulas anteriores queda
x2 = z 2 y 2 = p4 + 2p2 q 2 + q 4 p4 + 2p2 q 2 q 4 = 4p2 q 2 = (2pq)2 ,
luego x = 2pq.
En consecuencia la terna original queda de la forma
(x, y, z) = (2pq, p2 q 2 , p2 + q 2 ),
donde p, q son n
umeros naturales primos entre s, q < p y de paridad opuesta.
Recprocamente, es f
acil comprobar que cualquier terna en estas condiciones
es una terna pitag
orica primitiva. Por lo tanto ya sabemos enumerarlas todas.
La tabla 4.3 contiene las correspondientes a los valores de p 7.

142

Captulo 4. Algunas aplicaciones

En una tablilla cuneiforme aproximadamente del a


no 1.500 a.C. se ha encontrado una enumeraci
on de ternas pitag
oricas, entre las cuales se encontraba
(4.961, 6.480, 8.161). Se obtiene con p = 81 y q = 40.
Ejercicio: Comprobar que toda terna pitag
orica contiene un m
ultiplo de 3, un
m
ultiplo de 4 y un m
ultiplo de 5.

4.4

Sumas de cuadrados

Una pregunta relacionada con el problema anterior es: que n


umeros naturales pueden expresarse como suma de dos cuadrados? Antes de teorizar sobre
ellos echemos una ojeada a las sumas de los primeros diez cuadrados, que se
muestran en la tabla siguiente. Los primos est
an en negrita.
Para interpretar la tabla pensemos un poco que debemos buscar en ella.
Notemos que si z = x2 + y 2 entonces para todo natural n se cumple tambien
n2 z = (nx)2 + (ny)2 , es decir, que si multiplicamos una suma de cuadrados por
un cuadrado, obtenemos otra suma de cuadrados. Se dice que un n
umero n
es libre de cuadrados si todos los primos que lo dividen tienen multiplicidad 1.
Todo n
umero n puede expresarse de forma u
nica como producto de un cuadrado
perfecto y de un n
umero libre de cuadrados. Basta agrupar por un lado todos
los pares de primos que lo dividen y por otro los primos que queden sin pareja.
Lo que decamos hace un momento es que si la parte libre de cuadrados de
un n
umero natural n es suma de dos cuadrados, entonces n tambien lo es. Lo
primero que podemos observar en la tabla es que se cumple el recproco, es decir,
la parte libre de cuadrados de todos los n
umeros de la tabla est
a tambien en la
tabla. Por ejemplo: la parte libre de cuadrados de 117 es 13. Esto nos lleva a
nuestra primera conjetura: Un n
umero es suma de dos cuadrados si y s
olo si lo
es su parte libre de cuadrados.
0

1 4 9 16 25 36 49 64
2 5 10 17 26 37 50 65
8 13 20 29 40 53 68
18 25 34 45 58 73
32 41 52 65 80
50 61 74 89
72 85 100
98 113
128

81
82
85
90
97
106
117
130
145
162

100
101
104
109
116
125
136
149
164
181
200

Ahora quedemonos tan s


olo con los n
umeros de nuestra lista que son libres
de cuadrados, es decir:
0, 1, 2, 5, 10, 13, 17, 26, 29, 34, 37, 41, 53, 58,
61, 65, 73, 74, 82, 85, 89, 97, 101, 106, 109, 113.

4.4. Sumas de cuadrados

143

Esta lista contiene todos los n


umeros libres de cuadrados menores que 121 (el
primer n
umero que falta en la tabla) que pueden expresarse como suma de dos
cuadrados.
Vemos que no est
an todos los primos, pero los primos que aparecen en los
compuestos est
an tambien en la lista: 10 = 2 5, 26 = 2 13, 34 = 2 17,
58 = 2 29, 65 = 5 13, 74 = 2 37, 82 = 2 41, 85 = 5 17, 106 = 2 53.
La conjetura es, pues, que un n
umero libre de cuadrados es suma de dos
cuadrados si y s
olo si lo son los primos que lo componen. Respecto a los primos
que son suma de dos cuadrados nos quedan los siguientes
2, 5, 13, 17, 29, 37, 41, 53, 61, 73, 89, 97, 101, 109, 113.
Si el lector no conjetura nada a simple vista, no cuesta mucho encontrar una
condici
on que han de cumplir. Si un primo impar es de la forma p = x2 + y 2 ,
entonces x e y han de tener paridades opuestas, digamos x = 2u, y = 2v + 1.
Como consecuencia resulta que p = 4u2 + 4v 2 + 4v + 1, es decir, p = 4m + 1. Si
el lector calcula los primeros primos de la forma 4n + 1 obtendr
a precisamente
la lista anterior (sin el 2, claro).
Sospechamos entonces que un primo impar es suma de dos cuadrados si y
s
olo si es congruente con 1 m
odulo 4. La conjetura general sera entonces que un
n
umero es suma de dos cuadrados si y s
olo si los primos impares que lo dividen
con multiplicidad impar son congruentes con 1 m
odulo 4. Vamos a probar que
la conjetura es exacta. De hecho, vamos a ver que estos hechos que estamos
observando son reflejos en Z de la aritmetica de los enteros de Gauss Z[i].
En efecto, en el captulo anterior hemos visto que tenemos definida la norma
umero natural
N : Z[i] N dada por N (a + bi) = a2 + b2 . Por lo tanto, un n
es suma de dos cuadrados si y s
olo si existe un u Z[i] tal que N(u) = n.
Sabemos que Z[i] es un dominio de factorizaci
on u
nica. Notemos que
a + bi | (a + bi)(a bi) = N(a + bi),
es decir, todo entero de Gauss divide a su norma.
Si es un primo de Gauss, entonces | N() y N() es un n
umero natural
que se descompone en producto de primos en Z, luego ha de dividir a uno de
esos primos. Es decir, existe un primo p tal que | p, luego N() | p2 , luego
N() = p o N() = p2 . As pues, hay dos clases de primos de Gauss: los de
norma prima p y los de norma p2 .
Fijemonos en primer lugar en los primos tales que N() = p2 . Sabemos
que | p, digamos p = , para cierto Z[i]. Tomando normas, p2 = p2 N(),
luego es una unidad, y por consiguiente es asociado a p. En otras palabras,
los primos de norma p2 son los de la forma p y pi, los asociados de p. Si p es
primo de Gauss, entonces no es suma de dos cuadrados, pues si p = N(), para
cierto Z[i], entonces | N() = p, pero p es primo (y no es una unidad),
luego es asociado a p y, por consiguiente, su norma es p2 , no p. Por otra parte,
si es un primo de Gauss de norma p, entonces sabemos que p es suma de dos
cuadrados. Resumimos lo que hemos obtenido:

144

Captulo 4. Algunas aplicaciones


Para todo primo p en Z, se cumple que p es suma de dos cuadrados
si y s
olo si es la norma de un primo de Gauss y no es suma de dos
cuadrados si y s
olo si p es un primo de Gauss.

De aqu se sigue la mayor parte de nuestras conjeturas: un n


umero n es suma
de dos cuadrados si y s
olo si existe un entero de Gauss u tal que N(u) = n. Si
descomponemos u = 1 r en producto de primos queda n = N(1 ) N(r ).
Ahora es obvio que si un primo p divide a n con exponente impar, uno de los
factores N (i ) ha de ser igual a p (si s
olo hubiera del tipo p2 el exponente en n
sera par), luego p es suma de dos cuadrados. Recprocamente, si los primos que
dividen a n con exponente impar son suma de dos cuadrados, podemos formar
un entero de Gauss u de norma n (multiplicando primos de Gauss de norma p
si el exponente de p en n es impar y primos naturales p si el exponente es par).
En resumen: un n
umero natural es suma de dos cuadrados si y s
olo si los
primos que lo dividen con exponente impar son sumas de dos cuadrados.
Teniendo en cuenta que la parte libre de cuadrados de un n
umero es el
producto de los primos que lo dividen con exponente impar, esto implica todo
lo que habamos conjeturado excepto una cosa: que los primos que son suma de
dos cuadrados son 2 y los congruentes con 1 m
odulo 4. Puesto que obviamente
2 = 12 + 12 , lo u
nico que falta por probar es que un primo impar p es suma de
dos cuadrados si y s
olo si p 1 (mod 4).
Una implicaci
on es trivial: Si p = x2 + y 2 , basta observar que, en Z/4Z, los
u
nicos cuadrados son 0 y 1, luego p 0, 1, 2 (mod 4), pero descartamos el 0 y
el 2 porque entonces p sera par, y as queda que p 1 (mod 4).

Supongamos ahora que p 1 (mod 4) y vamos a probar que p no es primo


en Z[i], pues eso ya implica que p es suma de dos cuadrados. A su vez, para
ello basta probar que existe un n Z tal que 1 n2 (mod p). En efecto, en
tal caso p | n2 + 1 = (n + i)(n i), pero claramente p - n i en Z[i], luego p no
puede ser primo.
En otros terminos, hemos de probar que 1 tiene raz cuadrada en Z/pZ.
Para ello consideramos el polinomio x(p1)/2 1, entre cuyas races est
an todos
los cuadrados no nulos de Z/pZ (por el teorema de Fermat 3.42). Por otra
parte, en Z/pZ hay (p 1)/2 cuadrados no nulos (x2 = y 2 si y s
olo si y = x, y
x 6= x). Como un polinomio tiene a lo sumo tantas races en un cuerpo como
indica su grado, concluimos que las races de x(p1)/2 1 son exactamente los
elementos con raz cuadrada. Ciertamente, si p 1 (mod 4) tenemos que 1 es
una de dichas races.
Con lo visto podemos comprender la utilidad de los conceptos algebraicos
tales como el anillo de enteros de Gauss. Es posible demostrar estos resultados
sin recurrir a ellos, pero las pruebas son m
as tecnicas y laboriosas. La prueba
que hemos dado no requiere apenas c
alculos, es por lo tanto m
as f
acil de recordar
y explica realmente por que la propiedad de ser suma de dos cuadrados depende
s
olo de la parte libre de cuadrados. En muchos casos, las tecnicas algebraicas
permiten llegar a resultados que seran imposibles mediante meros c
alculos. M
as
adelante veremos m
as ejemplos.

4.4. Sumas de cuadrados

145

No estamos en condiciones de estudiar que numeros pueden expresarse como


suma de tres cuadrados (aunque el lector podra conjeturar f
acilmente cu
ales
son), pero vamos a demostrar un importante resultado debido a Lagrange:
Teorema 4.2 Todo n
umero natural es suma de cuatro cuadrados.
n: En primer lugar observamos que el producto de dos n
Demostracio
umeros naturales expresables como suma de cuatro cuadrados es tambien suma de
cuatro cuadrados. Esto puede probarse comprobando directamente la identidad
siguiente:
(x2 + y 2 + z 2 + w2 )(x02 + y 02 + z 02 + w02 )
= (xx0 yy 0 zz 0 ww0 )2 + (xy 0 + yx0 + zw0 wz 0 )2
+(xz 0 + zx0 + wy 0 yw0 )2 + (xw0 + wx0 + yz 0 zy 0 )2 ,
pero conviene tener presente que esta f
ormula no es el producto de una gran
inspiraci
on, sino que surge de forma natural al considerar los anillos de cuaternios.1
Como consecuencia basta demostrar que todo n
umero primo es expresable
como suma de cuatro cuadrados.
Por razones tecnicas vamos a necesitar la variante que resulta de sustituir x0
por x0 en la f
ormula anterior:
(x2 + y 2 + z 2 + w2 )(x02 + y 02 + z 02 + w02 )
= (xx0 yy 0 zz 0 ww0 )2 + (xy 0 yx0 + zw0 wz 0 )2
+(xz 0 zx0 + wy 0 yw0 )2 + (xw0 wx0 + yz 0 zy 0 )2 .

(4.3)

Como 2 = 12 + 12 + 02 + 02 , basta probar que todo primo impar p es suma


de cuatro cuadrados.
Los n
umeros x2 con 0 x 12 (p 1) son incongruentes m
odulo p, e igualmente ocurre con 1 y 2 con 0 y 12 (p 1).
Como en total son p + 1, existen x, y en estas condiciones tales que
x2 1 y 2 (mod p).
Equivalentemente, existe un natural m tal que
1 2
mp = x2 + y 2 + 1 < 1 + 2 p < p2 ,
2

luego 0 < m < p.


Sea r el menor natural no nulo tal que existen n
umeros enteros x, y, z, w
que cumplan rp = x2 + y 2 + z 2 + w2 . Como m cumple esto, ser
a r m < p.
1 V
ease

el final de la secci
on 5.3 de [G], los cuatro cuadrados que aparecen en el segundo
miembro son las coordenadas del producto de cuaternios
(x + yi + zj + wk)(x0 + y 0 i + z 0 j + w0 k).

146

Captulo 4. Algunas aplicaciones

Necesariamente r es impar, pues si fuera par, 0, 2 o 4 de los x, y, z, w seran


pares y, reorden
andolos, podramos exigir que x + y, x y, z + w y z w fueran
pares. Entonces
1
2 1
2 1
2 1
2
1
rp = (x + y) + (x y) + (z + w) + (z w) ,
2
2
2
2
2

en contradicci
on con la minimalidad de r.

Nuestro objetivo es probar que r = 1. Supongamos que r > 1.


Sean x0 , y 0 , z 0 , w0 los restos m
odulo r de x, y, z, w entre r/2 y r/2 (es
posible ya que r es impar).
Claramente n = x02 + y 02 + z 02 + w02 x2 + y 2 + z 2 + w2 = rp 0 (mod r),
pero n > 0, pues en otro caso x0 = y 0 = z 0 = w0 = 0, r dividira x, y, z, w, luego
r2 | x2 + y 2 + z 2 + w2 = rp, de donde r | p y en consecuencia r = 1, contra lo
supuesto. Tambien es claro que n < 4( 12 r)2 = r2 .
Sea 0 < k < r tal que n = kr. Por la identidad (4.3), krpr = z12 +z22 +z32 +z42
para ciertos naturales z1 , z2 , z3 , z4 y, teniendo en cuenta c
omo se obtienen a
partir de x, y, z, w, x0 , y 0 , z 0 , w0 , es claro que los cuatro son m
ultiplos de r (por
ejemplo z1 = xx0 yy 0 zz 0 ww0 x2 y 2 z 2 w2 = rp 0 (mod r)).
As pues zi = rti y por tanto r2 kp = r2 t21 + r2 t22 + r2 t23 + r2 t24 , con lo que
kp = t21 + t22 + t23 + t24 , en contra de la minimalidad de r.

4.5

El Ultimo
Teorema de Fermat

Pierre de Fermat fue un eminente matem


atico que realiz
o grandes descubrimientos en teora de n
umeros, pero, de acuerdo con las costumbres de su epoca,
jam
as public
o nada, y su trabajo es conocido por la correspondencia que mantuvo con otros matem
aticos, as como por la publicaci
on p
ostuma de sus obras,
llevada a cabo por su hijo Samuel. Entre las notas as publicadas se encontraban
ciertas anotaciones en los m
argenes de una edici
on de la Aritmetica de Diofanto,
una de las cuales, situada junto al punto en el que Diofanto encuentra las ternas
pitag
oricas, afirma que mientras que ciertamente existen n
umeros enteros
que satisfacen la ecuaci
on x2 + y 2 = z 2 , el resultado es falso para exponentes
mayores que dos, es decir, que la ecuaci
on xn + y n = z n no tiene soluciones
positivas para n > 2. Fermat afirma tener una maravillosa demostraci
on de
este hecho, pero que no cabe en el margen del libro. Indudablemente Fermat
debi
o de cometer un error, pues s
olo recientemente se ha encontrado una compleja prueba basada en potentes tecnicas algebraicas de las que Fermat distaba
mucho de disponer.
La afirmaci
on:
La ecuaci
on xn + y n = z n no tiene soluciones enteras positivas para
exponentes n > 2.

se conoce con el nombre de Ultimo


Teorema de Fermat, aunque, seg
un lo dicho,
es pr
acticamente seguro que Fermat nunca lo demostr
o ni tampoco fue su u
ltima
conjetura, ni mucho menos.


4.5. El Ultimo
Teorema de Fermat

147

Aqu vamos a resolver algunos casos particulares del Ultimo


Teorema de
Fermat y daremos algunas indicaciones del camino que permite obtener m
as resultados sobre el. El caso m
as simple, dado el estudio sobre las ternas pitag
oricas
que hemos llevado a cabo, es el caso n = 4.
Teorema 4.3 La ecuaci
on, x4 + y 4 = z 2 no tiene soluciones enteras positivas.

En particular el Ultimo Teorema de Fermat es cierto para n = 4.


n: Si existen soluciones positivas de la ecuaci
Demostracio
on x4 + y 4 = z 2 ,
2 2
entonces (x , y , z) es una terna pitag
orica. Notemos que si un primo p divide a
x, y, z entonces p2 | z y (x/p, y/p, z/p2 ) sigue cumpliendo la ecuaci
on. Aplicando
esto un n
umero finito de veces podemos suponer que (x, y, z) = 1, y claramente
esto implica que en realidad son primos entre s dos a dos y que la terna (x2 , y 2 , z)
es primitiva.
Seg
un la clasificaci
on de las ternas pitag
oricas, x2 = 2pq, y 2 = p2 q 2 ,
2
2
z = p + q , donde p y q son n
umeros enteros primos entre s, de distinta
paridad y p > q > 0 (intercambiamos x con y si es necesario para que x2 sea el
par).
Ahora, p2 = y 2 + q 2 , luego (q, y, p) es otra terna pitag
orica, lo que obliga a
que p sea impar, luego q ha de ser par, y as q = 2ab, y = a2 b2 , p = a2 +b2 , para
ciertos enteros a y b primos entre s, de paridad opuesta, a > b > 0 (notemos
que se trata de una terna primitiva porque (p, q) = 1).
Por lo tanto x2 = 4ab(a2 + b2 ) y en consecuencia ab(a2 + b2 ) = (x/2)2 . Por
otra parte (a, b) = 1 implica f
acilmente que (ab, a2 + b2 ) = 1.
Ahora usamos un argumento muy simple pero importante: si el producto
de dos n
umeros naturales primos entre s es un cuadrado, entonces ambos son
cuadrados, pues cada uno de ellos debe tener cada factor primo con exponente
par.
Concluimos que ab y a2 + b2 son cuadrados y, por el mismo argumento,
tambien lo son a y b. Digamos a = u2 , b = v 2 , a2 + b2 = w2 . Entonces
u4 + v 4 = a2 + b2 = w2 = p < p2 + q 2 = z < z 2 .
En resumen, si existe una terna de n
umeros positivos (x, y, z) que satisfaga
la ecuaci
on x4 + y 4 = z 2 , existe otra (u, v, w) que cumple lo mismo pero con
w2 < z 2 . Si existieran tales ternas debera haber una con z mnimo, lo cual es
falso seg
un lo visto, por lo que la ecuaci
on no tiene soluci
on.

Es importante notar que el teorema anterior no s


olo prueba el Ultimo
Teorema de Fermat para n = 4, sino en general para n = 4k. En efecto, si existieran
n
umeros positivos (x, y, z) tales que x4k + y 4k = z 4k , entonces (xk , y k , z k ) sera
una soluci
on a la ecuaci
on x4 + y 4 = z 4 , lo cual es imposible. En particular el

Ultimo Teorema de Fermat es cierto para las potencias de dos.

De aqu se sigue ahora que si el Ultimo


teorema de Fermat es cierto para
exponentes primos impares, entonces es cierto para todo exponente. En efecto,
si existen soluciones positivas a una ecuaci
on xn + y n = z n , entonces n no puede
ser potencia de 2, luego existe un primo impar p tal que p | n, o sea, n = pk,
para cierto entero k, luego (xk , y k , z k ) es una soluci
on positiva a la ecuaci
on
xp + y p = z p .

148

Captulo 4. Algunas aplicaciones

Observemos tambien que si p es impar el Ultimo


Teorema de Fermat equivale
a la no existencia de soluciones enteras no triviales (o sea, con xyz 6= 0) de la
ecuaci
on
xp + y p + z p = 0,
lo que muestra que en realidad el papel de las tres variables es simetrico. Esto
simplifica algunos argumentos.

Terminaremos esta secci


on demostrando el Ultimo
Teorema de Fermat para
el exponente p = 3. Para ello necesitamos estudiar un poco m
as la aritmetica
del anillo Z[] de los enteros ciclot
omicos de orden 3, que hemos introducido al
final del captulo anterior. Recordemos que sus elementos se expresan de forma
u
nica como a + b, con a, b Z, donde 3 = 1 y, m
as concretamente, satisface
la relaci
on 2 + + 1 = 0.
Sabemos que Z[] tiene seis unidades: 1, , 2 , y que = 1 es
primo y divide a 3, cuya factorizaci
on es 3 = 2 2 .
M
as en general, si restamos dos de las unidades 1, , 2 obtenemos un
asociado de :
1 = ,

2 1 = 2 ,

2 = .

En cambio, si las sumamos, obtenemos una unidad:


1 + = 2 ,

1 + 2 = ,

+ 2 = 1.

Si sumamos una consigo misma obtenemos un asociado del primo 2:


1 + 1 = 2,

+ = 2,

2 + 2 = 2 2 .

De aqu concluimos la primera de las propiedades siguientes:


Si dos unidades cumplen 1 2 (mod 3), tiene que ser 1 = 2 , puesto
que la diferencia s
olo puede ser divisible entre 2 o entre salvo que sean
la misma.
Si = a + b, se cumple que | si y s
olo si 3 | a + b.

En efecto, obviamente 1 (mod ), luego a + b a + b (mod ). Por


lo tanto, si | , tenemos que | a + b, luego 3 = N() | (a + b)2 , luego
3 | a + b. Recprocamente, si 3 | a + b, entonces | a + b, luego | .

Si - , entonces existe una unidad tal que (mod 3).

Como 3 - a + b, tiene que darse uno de los casos siguientes, con e = 1:


(a, b) = (3h + e, 3k), (3h, 3k + e), (3h + e, 3k + e),
luego e (mod 3), e (mod 3), e(1 + ) (mod 3), respectivamente, y en cualquier caso (mod 3), para una cierta unidad .

Si - , entonces 3 1 (mod 9).

Por la propiedad precedente sabemos que = 3 + , luego


3 = (3 + )3 3 = 1 (mod 9).


4.5. El Ultimo
Teorema de Fermat

149

Ahora mostramos la conexi


on entre la ecuaci
on de Fermat y los enteros
ciclot
omicos. Observemos que 1, y 2 son races distintas en el cuerpo
Q() del polinomio t3 + 1, luego son todas sus races, y podemos factorizar:
t3 1 = (t + 1)(t + )(t + 2 ).
En particular, si , Z[] y 6= 0, sustituyendo t = / y multiplicando por
3 queda
3 + 3 = ( + )( + )( + 2 ),
que vale igualmente si = 0. Si multiplicamos el segundo factor por y el
tercero por 2 en total hemos multiplicado por 3 = 1, luego la igualdad sigue
siendo v
alida, pero pasa a tener la forma
3 + 3 = ( + )( + 2 )( 2 + ).

(4.4)

Esta segunda factorizaci


on tiene la propiedad adicional de que
+ + + 2 + 2 + = 0.
Con esto ya podemos probar:
Teorema 4.4 La ecuaci
on x3 + y 3 + z 3 = 0 no tiene soluciones no triviales (es
decir, con todas las variables no nulas) en Z[], en particular en Z.
n: Supongamos que la ecuaci
Demostracio
on tiene una soluci
on no trivial
3 + 3 + 3 = 0. Entonces existe una soluci
on primitiva, es decir, una soluci
on
no trivial tal que , y sean primos entre s dos a dos, pues si un primo
divide a dos de ellos, la ecuaci
on hace que divida al tercero, luego /, /, /
son tambien una soluci
on no trivial de la ecuaci
on, y repitiendo este proceso un
n
umero finito de veces tenemos que llegar a una soluci
on primitiva.
Observemos ahora que tiene que dividir a uno de los n
umeros , , (y
s
olo a uno, porque la soluci
on es primitiva). En efecto, si no divide a ninguno
de ellos, hemos visto que
3 e1 (mod 9),

3 e2 (mod 9),

3 e3 (mod 9),

donde ei = 1. Pero entonces2 e1 + e2 + e3 0 (mod 9), lo cual es imposible.


Llamaremos coordenada especial de una soluci
on primitiva (, , ) a la que
es divisible entre . Si la ecuaci
on tiene soluci
on, debera haber una soluci
on
primitiva en la que el exponente de en la coordenada especial fuera el menor
n
umero natural posible (no nulo). Sin embargo, vamos a probar que a partir de
cualquier soluci
on primitiva se puede encontrar otra tal que el exponente de
en la coordenada especial sea menor, con lo que tendremos una contradicci
on.
principio, esta congruencia es en Z[], pero notemos en general, que m, n, r Z
cumplen m n (m
od r) en Z[] si y s
olo si lo cumplen en Z, ya que si m n = (a + b)r,
igualando coordenadas tiene que ser br = 0, luego la congruencia se cumple en Z.
2 En

150

Captulo 4. Algunas aplicaciones

Dada la simetra, no perdemos generalidad si suponemos que | . Entonces


3 | 3 y la ecuaci
on nos da que 3 | 3 + 3 . Como no divide a ni a ,
3
sabemos que e (mod 9), 3 f (mod 9), donde e = 1, f = 1.
Como 2 | 3, en particular 3 | 9, luego las congruencias anteriores valen
tambien m
odulo 3 , y por consiguiente
e + f 3 + 3 0 (mod 3 ).
En particular, 3 | e + f y esto s
olo es posible si e + f = 0 (pues la suma s
olo
puede ser 0, 2 o 2). Por lo tanto,
3 = 3 + 3 e + f = 0 (mod 9).

As pues, 4 | 3 , por lo que 2 | .

En definitiva, con esto hemos demostrado que la coordenada especial debe


ser divisible entre , no una, sino al menos dos veces.
Ahora consideramos la factorizaci
on de 3 = 3 + 3 dada por (4.4).
Llamemos
1 = + , 2 = + 2 , 3 = 2 + ,
de modo que 3 = 1 2 3 y 1 + 2 + 3 = 0.

Observamos que 1 2 3 (mod ), pues los tres son congruentes con


+ . Como 3 | 1 2 3 , en principio divide a uno de los tres, pero como son
congruentes, | i para los tres valores i = 1, 2, 3.

Sea i0 = i / y vamos a probar que 10 , 20 y 30 son primos entre s dos a dos.


En efecto, si un primo divide a dos de ellos, por ejemplo a 10 y 20 , entonces
| 1 y | 2 , luego
| 2 2 1 = ( 2 ) = ,

| 2 1 = ( 2 ) = ,

luego | y | , cuando y son primos entre s. Igualmente llegamos a


una contradicci
on si suponemos que 10 y 30 o 20 y 30 no son primos entre s.
Tenemos, pues, que 3 = 3 10 20 30 y 10 + 20 + 30 = 0. Sea = /, que
sigue cumpliendo | , pues hemos visto que divide al menos dos veces a .
Entonces 3 = 10 20 30 y ahora razonamos como sigue: cada primo aparece
con exponente m
ultiplo de 3 en el miembro izquierdo de esta ecuaci
on, luego
tambien en el miembro derecho, pero como los tres factores no tienen primos en
com
un, podemos afirmar que cada primo aparece con exponente m
ultiplo de 3
en cada uno de ellos, es decir, que, para i = 1, 2, 3, se cumple que i0 = i i3 ,
para ciertos i Z[] y ciertas unidades i . As pues,
3 = 1 2 3 13 23 33 ,

1 13 + 2 23 + 3 33 = 0,

y los i son primos entre s dos a dos porque lo eran los i0 .


M
as a
un, = 1 2 3 , para cierta unidad tal que 3 = 1 2 3 . Pero
toda unidad elevada al cubo da 1, luego e = 1 2 3 = 1. Como | ,
tenemos que divide a un i , y s
olo a uno, porque son primos entre s dos a
dos. Recapitulemos lo que tenemos hasta aqu:

4.6. Enteros ciclot


omicos

151

Hemos encontrado una ecuaci


on
1 13 + 2 23 + 3 33 = 0

(4.5)

en la que los i son primos entre s dos a dos y uno de ellos es divisible entre
, los i son unidades y e = 1 2 3 = 1, y m
as a
un, si | i , entonces su
exponente cumple
v (i ) =

1
1
1
v (i0 ) = (v (i ) 1) < (v (1 ) + v (2 ) + v (3 )) = v ().
3
3
3

S
olo falta ver que podemos eliminar las unidades de (4.5) para obtener una
nueva soluci
on primitiva en la que el exponente de en la coordenada especial
sea menor que el de partida. En lo que queda de la prueba s
olo nos vamos a
apoyar en estos hechos, luego por simetra podemos suponer que | 3 .
Entonces 13 e (mod 9) y 23 f (mod 9), para ciertos e = 1, f = 1.
Como | 3 , en particular 3 | 33 , luego (4.5) nos da que
e1 + f 2 1 13 + 2 23 3 33 0 (mod 3).
Seg
un hemos visto en las observaciones previas a este teorema, esto implica
que e1 + f 2 = 0, luego 1 = 2 , luego e = 21 3 . Por consiguiente, si
multiplicamos (4.5) por 21 obtenemos
31 13 + 31 23 + e33 = 0
y, teniendo en cuenta que e = 1 = e3 , esto equivale a
(1 1 )3 + (1 2 )3 + (e3 )3 = 0,
luego llamando 0 = 1 1 , 0 = 1 2 , 0 = e3 , vemos que se trata de una
soluci
on primitiva de la ecuaci
on de Fermat con 0 < v ( 0 ) < v () y tenemos
la contradicci
on que busc
abamos.

4.6

Enteros ciclot
omicos

Uno de los ingredientes centrales de la prueba del teorema 4.4 ha sido la


factorizaci
on (4.4) de la suma 3 + 3 . La primera demostraci
on de este teorema
se debe a Euler, quien us
o la factorizaci
on parcial:
x3 + y 3 = (x + y)(x2 xy + y 2 )
que podemos conseguir sin introducir n
umeros imaginarios. El caso p = 5
fue demostrado independientemente por Dirichlet y Legendre mediante tecnicas
similares, considerando la factorizaci
on
x5 + y 5 = (x + y)(x4 x3 y + x2 y 2 xy 3 + y 4 ).

152

Captulo 4. Algunas aplicaciones

Sin embargo, el hecho de que el segundo factor fuera cada vez m


as complicado
haca que los argumentos se volvieran cada vez m
as enrevesados. Los casos
superiores se vuelven pr
acticamente intratables debido a que la complejidad
aumenta desmesuradamente. Dirichlet intent
o probar el caso p = 7, pero s
olo
consigui
o una prueba para exponente 14.
Fue Kummer quien, bas
andose en ideas de Lame, obtuvo una prueba del
teorema de Fermat para una amplia clase de primos. No estamos en condiciones de abordar la teora de Kummer, pero podemos indicar que uno de sus
ingredientes es factorizar completamente el polinomio xp + y p tal y como hemos
hecho en el caso p = 3. Concretamente, tenemos la factorizaci
on
xp 1 = (x 1)(xp1 + + x + 1),
y vimos en el captulo anterior que el factor p(x) = xp1 + + x + 1 es
irreducible. El teorema 3.49 nos da que existe un cuerpo Q[] en el que p(x)
tiene una raz . Concretamente
Q[] = {ap2 p2 + + a1 + ao | ap2 , . . . , a0 Q},
y adem
as la expresi
on de cada elemento es u
nica. Por razones que veremos m
as
adelante a este cuerpo se le llama cuerpo ciclot
omico pesimo.
Como p() = 0 y p(x) | xp 1, resulta que p 1 = 0, o sea, p = 1 y,
obviamente, 6= 1.
No puede ocurrir que n = 1 para 0 < n < p, pues entonces, tomando el
mnimo n que cumple esto, p = nc + r con 0 < r < p (p es primo), y entonces
p = ( n )c r = r 6= 1, contradicci
on. Esto significa que las potencias 1 = 0 ,
, 2 , . . . , p1 , son distintas dos a dos, pues si i = j , entonces ij = 1.
Adem
as todas cumplen ( i )p = 1, luego son las p races del polinomio xp 1,
o sea, xp 1 = (x 1)(x ) (x p1 ).
Sustituyendo x = x/y y multiplicando por y p obtenemos la factorizaci
on
xp + y p = (x + y)(x + y) (x + p1 y).
Esta factorizaci
on en polinomios de grado 1 es la m
as simple posible, y es la
clave para obtener pruebas del teorema de Fermat para numerosos valores de p.
Para ello es necesario estudiar el cuerpo Q[] as como el anillo de los llamados
enteros ciclot
omicos:
Z[] = {ap2 p2 + + a1 + a0 | ap2 , . . . , a0 Z}.

Kummer demostr
o que si este anillo es DFU entonces se cumple el Ultimo
Teorema de Fermat para exponente p, y luego generaliz
o el argumento sustituyendo la hip
otesis por otra mucho m
as debil.
Como la relaci
on p = 1 es m
as sencilla de manejar que la relaci
on
p1 + + + 1 = 0,

(4.6)

4.6. Enteros ciclot


omicos

153

resulta conveniente trabajar con los elementos de Q[] en la forma


ap1 p1 + + a1 + a0

(4.7)

(de modo que, al operar, simplemente reducimos las potencias p que puedan
aparecer).
El u
nico inconveniente es que la expresi
on ya no es u
nica. Si tenemos
ap1 p1 + + a1 + a0 = 0,
usando la relaci
on (4.6) tenemos que
ap1 p1 + + a1 + a0 ap1 ( p1 + + + 1) = 0,
o sea,
(ap2 ap1 ) p2 + + (a1 ap1 ) + (a0 ap1 ) = 0,
y por la unicidad
ap1 = ap2 = = a1 = a0 .
De aqu se sigue en general que
ap1 p1 + + a1 + a0 = bp1 p1 + + b1 + b0
si y s
olo si (restando los dos miembros)
ap1 bp1 = ap2 bp2 = = a1 b1 = a0 b0 ,
o en otras palabras, si existe un n
umero racional c tal que ai = bi + c, para todo
i = 0, . . . , p 1. Equivalentemente, los coeficientes de una expresi
on (4.7) est
an
unvocamente determinados salvo suma de un n
umero racional (o de un n
umero
entero si el elemento est
a en Z[]).
En los pr
oximos captulos iremos aplicando a estos anillos los resultados que
vayamos obteniendo.

Captulo V

M
odulos y espacios
vectoriales
Consideremos el anillo de enteros ciclot
omicos Z[] para p = 5, que est
a
formado por elementos de la forma a + b + c 2 + d 3 , donde a, b, c, d Z.
Puede probarse que es un DFU, pero la prueba es complicada. Eso nos asegura
que todo entero ciclot
omico se expresa en la forma 1e1 rer , para ciertos
primos ciclot
omicos i no asociados dos a dos y cierta unidad . Sin embargo,
determinar cu
ales son los primos ciclot
omicos no es inmediato, ni tampoco lo es
determinar cu
ales son las unidades ciclot
omicas y cu
ales son sus caractersticas
algebraicas.
Frente a estas dificultades, tenemos un resultado sencillo sobre la forma que
tiene un entero ciclot
omico arbitrario, y es que cada uno de ellos se expresa de
forma u
nica como suma de los elementos 1, , 2 , 3 multiplicados por enteros.
Esta representaci
on est
a en la base de todo estudio que podamos hacer sobre
estos anillos, y ahora vamos a introducir una estructura algebraica m
as debil
que la de anillo que permite formular resultados de este tipo en contextos muy
generales. La idea b
asica particularizada a este ejemplo concreto consiste en
prescindir del producto en general entre dos enteros ciclot
omicos cualesquiera y
considerar u
nicamente productos entre enteros ordinarios y enteros ciclot
omicos.
Sucede entonces que el hecho de que Z Z[] resulta irrelevante, y resulta
m
as conveniente pensar en Z como un dominio de operadores externo a Z[],
es decir, como un conjunto sin m
as vinculaci
on con Z[] que el hecho de que
est
a definido un producto Z Z[] Z[] que cumpla unos axiomas b
asicos.
Esto nos lleva a la definici
on de m
odulo:

5.1

M
odulos

Definici
on 5.1 Sea A un anillo unitario. Un Am
odulo izquierdo es una terna
(M, +, ) tal que M es un conjunto, + : M M M es una operaci
on
interna en M y es lo que se llama una operaci
on externa en M con dominio de
155

156

Captulo 5. M
odulos y espacios vectoriales

operadores en A, lo que significa simplemente que : A M M . Adem


as
se han de cumplir las propiedades siguientes:
1. (r + s) + t = r + (s + t) para todos los r, s, t M .
2. r + s = s + r para todos los r, s M .
3. Existe un elemento 0 M tal que r + 0 = r para todo r M .
4. Para todo r M existe un elemento r M tal que r + (r) = 0.
5. a(r + s) = ar + as para todo a A y todos los r, s M .
6. (a + b)r = ar + br para todos los a, b A y todo r M .
7. a(br) = (ab)r para todos los a, b A y todo r M .
8. 1r = r para todo r M .
Observamos que la suma en un m
odulo ha de cumplir las mismas propiedades
que la suma en un anillo, por lo que las propiedades elementales de la suma
de anillos valen para m
odulos. Por ejemplo, el elemento 0 que aparece en la
propiedad 3 es u
nico, as como los elementos simetricos que aparecen en 4.
Un Am
odulo derecho se define igualmente cambiando la operaci
on externa
por otra de la forma : M A M . La u
nica diferencia significativa es
que la propiedad 7 se convierte en (rb)a = r(ba), que escrito por la izquierda
sera a(br) = (ba)r (en lugar de a(br) = (ab)r, que es la propiedad de los
m
odulos izquierdos). Mientras no se indique lo contrario s
olo consideraremos
m
odulos izquierdos, aunque todo vale para m
odulos derechos. Seguiremos el
mismo convenio que con los anillos, seg
un el cual las operaciones de un m
odulo
se representar
an siempre con los mismos signos, aunque sean distintas en cada
caso. Tambien escribiremos M en lugar de (M, +, ).
Veremos que los m
odulos sobre cuerpos tienen un comportamiento mucho
m
as simple y regular que sobre anillos arbitrarios, aunque en realidad conviene
notar que la propiedad conmutativa del producto en los cuerpos no es relevante
para ello.
Por eso definimos un anillo de divisi
on como un anillo unitario en el que
1 6= 0 y donde todo elemento no nulo tiene inverso para el producto. En otras
palabras, es un anillo que cumple todos los axiomas de la definici
on de cuerpo
salvo quiz
a la conmutatividad del producto.
Si D es un anillo de divisi
on, los Dm
odulos se llaman espacios vectoriales.
Tenemos disponibles muchos ejemplos de m
odulos:
1. En primer lugar, si A es un anillo unitario, entonces A es un Am
odulo
con su suma y su producto.

5.1. M
odulos

157

2. M
as en general, si B es un anillo unitario y A es un subanillo que contenga
a la identidad, entonces B es un Am
odulo con la suma de B y el producto
restringido a A B.
3. M
as en general a
un, si : A B es un homomorfismo de anillos unitarios tal que (1) = 1, entonces B es un Am
odulo con la suma en B y el
producto dado por ab = (a)b (el ejemplo anterior sera un caso particular
de este tomando como homomorfismo la inclusi
on).
4. Un caso particular de este ejemplo es que si A es un anillo unitario e I es
un ideal de A, entonces el anillo cociente A/I es un Am
odulo con su suma
y el producto dado por a[b] = [ab] (basta tomar como el epimorfismo
can
onico).
5. Otro caso particular es que si A es un anillo unitario, entonces A es un Z
m
odulo con el producto usual de un entero por un elemento de A (tomando
(m) = m1).
As, continuando el ejemplo que hemos considerado al principio del captulo,
podemos considerar a Z[] como Z-m
odulo como caso particular de 2) o de 5),
aunque tambien podemos considerarlo como Z[]m
odulo en virtud de 1).
Enunciemos a continuaci
on las propiedades elementales de los m
odulos. Todas se demuestran igual que para anillos. Observemos que el producto de
n
umeros enteros por elementos de un m
odulo est
a definido exactamente igual
que para anillos.
Teorema 5.2 Sea A un anillo unitario y M un Am
odulo.
1. Si r + s = r + t entonces s = t para todos los r, s, t M ,
2. r + r = r si y s
olo si r = 0, para todo r M ,
3. (r) = r para todo r M ,
4. (r + s) = r s, para todos los r, s M ,
5. a0 = 0r = 0, para todo a A y todo r M ,
6. n(ar) = (na)r = a(nr), para todo n Z, a A y r M ,
7. Si A es un anillo de divisi
on, a A, r M y ar = 0, entonces a = 0 o
r = 0.
(Por ejemplo, la propiedad 7 se cumple porque si a 6= 0, entonces existe a1
y por tanto a1 ar = a1 0 = 0, 1r = 0, r = 0).
Definici
on 5.3 Sea A un anillo unitario y M un Am
odulo. Diremos que un
m
odulo N es un subm
odulo de M si N M y las operaciones de N son las
mismas que las de M .

158

Captulo 5. M
odulos y espacios vectoriales

Evidentemente, si un subconjunto de un m
odulo dado puede ser dotado de
estructura de subm
odulo, la forma de hacerlo es u
nica (pues las operaciones
en N han de ser las restricciones de las de M ). Por tanto es indistinto hablar
de subm
odulos de M que de subconjuntos que pueden ser estructurados como
subm
odulos. Pero no siempre es posible considerar a un subconjunto como
subm
odulo (por ejemplo si no contiene al 0). Las condiciones que se han de
cumplir para ello las da el teorema siguiente:
Teorema 5.4 Sea A un anillo unitario y M un Am
odulo. Un subconjunto
N de M puede ser dotado de estructura de subm
odulo si y s
olo si cumple las
condiciones siguientes:
1. N 6= ,
2. Si r, s N entonces r + s N ,
3. Si a A y r N , entonces ar N .
n: Obviamente si N es un subm
Demostracio
odulo ha de cumplir estas
condiciones. Si N cumple estas condiciones entonces por 2) y 3) la suma y el
producto est
an definidos en N . Por 1) existe un r N , por 3) r = (1)r N ,
por 2) 0 = r r N . Por tanto N tiene neutro y de nuevo por 3) el simetrico
de cada elemento de N est
a en N . El resto de las propiedades exigidas por la
definici
on se cumplen por cumplirse en M .
Las condiciones 2) y 3) del teorema anterior pueden resumirse en una sola:
Teorema 5.5 Sea A un anillo unitario y M un Am
odulo. Un subconjunto N
de M puede ser dotado de estructura de subm
odulo si y s
olo si N 6= y para
todos los a, b A y todos los r, s N se cumple que ar + bs N .
Definici
on 5.6 De los teoremas anteriores se desprende que si A es un anillo
unitario y M es un Am
odulo, entonces M y 0 = {0} son subm
odulos de M ,
y se llaman subm
odulos impropios. Cualquier otro subm
odulo de M se llama
subm
odulo propio. El subm
odulo 0 se llama tambien subm
odulo trivial.
Es obvio que la intersecci
on de una familia de subm
odulos de M es un
subm
odulo de M . Si X es un subconjunto de M , llamaremos subm
odulo generado por X a la intersecci
on de todos los subm
odulos de M que contienen a X.
Lo representaremos hXi.
Es inmediato a partir de la definici
on que si N es un subm
odulo de M y
X N , entonces hXi N . Igualmente si X Y M , entonces se cumple
hXi hY i. Notemos que hi = 0. Cuando el conjunto X sea finito, digamos
X = {x1 , . . . , xn }, escribiremos tambien hXi = hx1 , . . . , xn i.
Si M = hXi diremos que el conjunto X es un sistema generador de M .
Diremos que M es finitamente generado si tiene un sistema generador finito. El
modulo M es mon
ogeno si admite un generador con un solo elemento.

5.1. M
odulos

159

Al considerar a un anillo conmutativo y unitario A como Am


odulo los
subm
odulos coinciden con los ideales, de donde se sigue que el subm
odulo generado por un subconjunto X coincide con el ideal generado por X, es decir,
(X) = hXi.
Es f
acil reconocer los elementos del subm
odulo generado por un subconjunto
(cf. 3.4):
Teorema 5.7 Sea A un anillo unitario, M un Am
odulo y X M . Entonces
hXi = {a1 r1 + + an rr | n N, ai A, ri X} .
La prueba es sencilla: un subm
odulo que contenga a X ha de contener
necesariamente al conjunto de la derecha, pero es f
acil ver que este subconjunto
es de hecho un subm
odulo, luego contiene a hXi.
Los elementos de la forma a1 r1 + + an rr , con los ai A, se llaman
combinaciones lineales de r1 , . . . , rn . En estos terminos, el teorema anterior
afirma que el subm
odulo generado por un conjunto X es el conjunto de todas
las combinaciones lineales de los elementos de X.

Por ejemplo, ahora podemos decir que Z[] = 1, , 2 , 3 , y as tenemos enmarcada en un contexto general la relaci
on que permite expresar todo
entero ciclot
omico en funci
on de estos cuatro generadores y de n
umeros enteros. Igualmente
tenemos
que
Q[]
es
un
Q
espacio
vectorial,
as

como que

Q[] = 1, , 2 , 3 . En situaciones como esta en las que puede haber ambig


uedad es costumbre explicitar
tomando
como domino
el anilloque estamos

de operadores para distinguir 1, , 2 , 3 Z de 1, , 2 , 3 Q , de modo que el


primero es el m
odulo formado por todas las combinaciones lineales de los generadores con coeficientes en Z y el segundo el espacio vectorial formado por
todas las combinaciones lineales de los generadores con coeficientes en Q.
Lo mismo sucede en otros contextos. Por ejemplo, podemos considerar a Q[]
como Q[]-m
odulo y tambien como Z-m
odulo. Por ello, distinguiremos entre
sus Q[]-subm
odulos (es decir, subm
odulos respecto de su estructura de Q[]m
odulo) y sus Z-subm
odulos (que son sus subm
odulos respecto de su estructura
de Z-m
odulo).
Concretamente, como Q[] es un cuerpo, no tiene ideales propios (es decir,
no tiene Q[]-subm
odulos propios y se cumple trivialmente que Q[] = h1iQ[] ,
mientras que s que tiene muchos Z-subm
odulos propios, como Z = h1iZ , o
h1 + iZ = {n + n | n Z}.
Los m
odulos cociente se definen exactamente igual que los anillos cociente:
Definici
on 5.8 Sea A un anillo unitario, M un Am
odulo y N un subm
odulo
de M . Definimos en M la relaci
on de congruencia m
odulo N mediante
r s (mod N ) si y s
olo si r s N .

160

Captulo 5. M
odulos y espacios vectoriales

Es f
acil probar que se trata de una relaci
on de equivalencia en M . Llamaremos M/N al conjunto cociente. La clase de equivalencia de un elemento r M
es
[r] = r + N = {r + s | s N }.
La prueba del teorema siguiente es completamente an
aloga a la de 3.37:
Teorema 5.9 Sea A un anillo unitario, M un Am
odulo y N un subm
odulo
de M . El conjunto M/N es un Am
odulo con las operaciones dadas por
[r] + [s] = [r + s]

a[r] = [ar].

Se le llama m
odulo cociente.
Es f
acil ver que si I es un ideal de un anillo A, entonces el A-m
odulo cociente
A/I es el m
odulo que resulta de considerar al anillo cociente A/I como A-m
odulo
a traves del epimorfismo can
onico A A/I.
Definimos los homomorfismos de m
odulos de forma an
aloga a los de anillos.
Su interpretaci
on es la misma:
Definici
on 5.10 Sea A un anillo unitario y M , N dos Am
odulos. Una aplicaci
on f : M N es un homomorfismo de m
odulos si cumple:
f (r + s) = f (r) + f (s), para todos los r, s M ,
f (ar) = af (r), para todo a A y todo r M .
Obviamente esto equivale a que f (ar + bs) = af (r) + bf (s), para a, b A,
r, s M .
Un monomorfismo de m
odulos es un homomorfismo inyectivo.
Un epimorfismo de m
odulos es un homomorfismo suprayectivo.
Un isomorfismo de m
odulos es un homomorfismo biyectivo.
Un endomorfismo de m
odulos es un homomorfismo de un m
odulo en s
mismo.
Un automorfismo de m
odulos es un isomorfismo de un m
odulo en s mismo.
Una aplicaci
on lineal es un homomorfismo de espacios vectoriales.
La composici
on de homomorfismos es un homomorfismo, la inversa de un
isomorfismo es un isomorfismo. Dos m
odulos M y N son isomorfos (M
= N)
si existe un isomorfismo entre ellos.
Si f : M N es un homomorfismo de m
odulos, es f
acil ver que si N 0 es
1
0
un subm
odulo de N entonces f [N ] es un subm
odulo de M y si M 0 es un
subm
odulo de M , entonces f [M ] es un subm
odulo de N .

5.2. Suma de m
odulos

161

En particular, se define el n
ucleo de f como N(f ) = {r M | f (r) = 0},
es decir, N(f ) = f 1 [0], que es un subm
odulo de M . La imagen de f es
Im f = f [M ] = {f (r) | r M }, que es un subm
odulo de N .
Si A es un anillo unitario, M es un Am
odulo y N es un subm
odulo de M , la
aplicaci
on f : M M/N dada por f (r) = [r] es un epimorfismo de m
odulos
llamado epimorfismo can
onico. Se cumple que N(f ) = N .
Dado un m
odulo M y subm
odulos N N 0 M es claro que N 0 /N es un
subm
odulo de M/N . Es f
acil probar que todo subm
odulo de M/N es de esta
forma.
Los teoremas siguientes son an
alogos a 3.44 y 3.45, respectivamente:
Teorema 5.11 Un homomorfismo de m
odulos es inyectivo si y s
olo si su n
ucleo
es trivial.
Teorema 5.12 (Teorema de isomorfa) Consideremos un anillo unitario A
y sea f : M N un homomorfismo de Am
odulos. Entonces la aplicaci
on
f : M/ N(f ) Im f definida por f([r]) = f (r) es un isomorfismo de m
odulos.

5.2

Suma de m
odulos

Como hemos indicado, una de las razones por las que es u


til la estructura
de m
odulo es porque permite obtener descripciones sencillas de los elementos de
un m
odulo que resultan f
aciles de manejar. Un primer an
alisis de la estructura
de un m
odulo consiste en descomponerlo en suma de m
odulos m
as simples en
el sentido en que indicamos a continuaci
on:
Definici
on 5.13 Sea A un anillo conmutativo y unitario y M un Am
odulo.
Llamaremos suma de una familia de subm
odulos {Ni }iI de M al subm
odulo
S

P
Ni =
Ni
iI

iI

Es decir, la suma de una familia de subm


odulos es el menor subm
odulo que
los contiene a todos. Por el teorema 5.7, un elemento de este subm
odulo es una
combinaci
on lineal de elementos de algunos de los m
odulos Ni con coeficientes
en A, pero al multiplicar un elemento de Ni por un elemento de A obtenemos
otro elemento de Ni , y la suma de dosPelementos de un mismo Ni est
a tambien
en Ni . Por lo tanto un elemento de
Ni es de la forma r1 + + rn , donde
iI

cada sumando est


a en un subm
odulo distinto. En particular si la familia es
finita,
N1 + + Nn = {r1 + + rn | ri Ni }.

Descomponer un m
odulo en suma de subm
odulos nos da una informaci
on
importante sobre su estructura. Por ejemplo, el hecho de que todo elemento de
Z[] se exprese como combinaci
on lineal de 1, , 2 , 3 equivale a decir que

Z[] = h1i + hi + 2 + 3 .

162

Captulo 5. M
odulos y espacios vectoriales

Pero sabemos que se cumple m


as: cada elemento de Z[] se expresa de forma
u
nica como suma de un elemento de cada uno de estos cuatro subm
odulos.
Vamos a analizar en general cu
ando sucede algo as:
Definici
on 5.14 Sea A un anillo unitario y M un Am
odulo. Se dice que una
familia de subm
odulos {Ni }iI es independiente si para cada ndice i se cumple
P
Ni
Nj = 0.
j6=i

Si {Ni }iI es una familia


odulos
P de subm
L independientes, se dice que su suma
es directa y en lugar de
Ni se escribe
Ni .
iI

iI

Teorema 5.15 Sea A un anillo unitario, M un Am


odulo y N1 , . . . , Nn una
familia de subm
odulos tales que M = N1 + + Nn . Equivalen:
1. M = N1 Nn .
2. Si m1 + + mn = 0 con cada mi Ni , entonces cada mi = 0.
3. Cada elemento m M se expresa de forma u
nica como suma
m = m1 + + mn
con cada mi Ni .

n: Por simplificar, vamos a probarlo para el caso n = 3. El


Demostracio
caso general es an
alogo. De hecho el resultado es cierto incluso con infinitos
sumandos.
1) 2). Si m1 + m2 + m3 = 0 con cada mi Ni , entonces
m1 = m2 m3 N1 (N2 + N3 ) = 0,
y an
alogamente se concluye que m2 = m3 = 0.
2) 3). Como M = N1 + N2 + N3 , todo elemento de M se descompone en
una suma de la forma m1 + m2 + m3 , con cada mi Ni . Si un elemento admite
dos descomposiciones
m1 + m2 + m3 = m01 + m02 + m03
entonces (m1 m01 )+(m2 m02 )+(m3 m03 ) = 0, luego por 2) podemos concluir
que (m1 m01 ) = (m2 m02 ) = (m3 m03 ) = 0, luego ambas descomposiciones
son la misma.
3) 1). Si un elemento m1 N1 (N2 + N3 ), entonces m1 = m2 + m3 ,
mi Ni , o sea, m1 + 0 + 0 = 0 + m2 + m3 , luego por la unicidad, m1 = 0, es
decir, N1 (N2 + N3 ) es el subm
odulo trivial. Igualmente ocurre si permutamos
los ndices.
Por ejemplo, ahora podemos afirmar que

Z[] = h1i hi 2 3 .

5.2. Suma de m
odulos

163

Nota Hemos enunciado el teorema anterior para sumas finitas porque es el


caso que realmente vamos a necesitar, y el enunciado general para sumasPposiblemente infinitas oculta parcialmente la idea b
asica. En general, si M =
Ni ,
iI

que la suma sea directa equivale a que siempre que una suma mi1 + +min = 0
con mij Nij y los ndices ij I son distintos dos a dos, entonces cada mij = 0
(esta es la versi
on general de 2), lo cual equivale a su vez a que todo m M no
nulo se expresa de forma u
nica como suma m = mi1 + + min con mij Nij
no nulo y los ndices ij I distintos dos a dos (y esta es la versi
on general
de 3). La prueba del caso general se obtiene modificando ligeramente la que
hemos visto.
En general, si un m
odulo M se expresa como suma directa de una familia
de n subm
odulos, entonces cada elemento de M determina y est
a determinado
por un elemento de cada uno de los subm
odulos, es decir, determina y est
a
determinado por un elemento del producto cartesiano de los subm
odulos. Esto
nos lleva a introducir el concepto de producto de m
odulos:
Definici
on 5.16 Sea A un anillo unitario y M1 , . . . , Mn una familia de A
m
odulos. Entonces el producto cartesiano

M1 Mn = (m1 , . . . , mn ) | mj Mj para cada j = 1, . . . , n


es un Am
odulo con las operaciones dadas por

(m1 , . . . , mn ) + (m01 , . . . , m0n ) = (m1 + m01 , . . . , mn + m0n ),


r (m1 , . . . , mn ) = (rm1 , . . . , rmn ).
Esto vale en particular cuando todos los factores son un mismo m
odulo M ,
con lo que tenemos una estructura de Am
odulo sobre el producto M n .
Es obvio que la aplicaci
on i : Mi M1 Mn que a cada elemento
m Mi le asigna la ntupla cuya componente iesima es m y las restantes
son 0 es un monomorfismo de m
odulos, por lo que podemos identificar a cada
Mi con su imagen, es decir, con el subm
odulo de M1 Mn formado por
las ntuplas que tienen nulas todas sus componentes salvo la iesima. La u
nica
precauci
on es que en principio puede ocurrir que Mi = Mj , mientras que sus
im
agenes respectivas por i y j ser
an subm
odulos distintos de M1 Mn
(isomorfos, pero distintos).
Tambien es inmediato que si (m1 , . . . , mn ) M1 Mn entonces
(m1 , . . . , mn ) = 1 (m1 ) + + n (mn ),
luego M1 Mn = M1 + + Mn . Adem
as M2 + + Mn est
a formado por
las ntuplas con la primera componente nula, luego M1 (M2 + + Mn ) = 0.
Lo mismo vale con otros ndices, con lo que M1 Mn = M1 Mn .
En resumen, dada una familia de Am
odulos, hemos construido un A
m
odulo que es suma directa de una familia de subm
odulos isomorfos a los

164

Captulo 5. M
odulos y espacios vectoriales

dados. Recprocamente, si un m
odulo M es suma directa de una familia de
subm
odulos M = M1 Mn , entonces M es isomorfo al producto cartesiano M1 Mn . El isomorfismo es la aplicaci
on que a cada elemento de M
le asigna la ntupla formada por los elementos en los que se descompone seg
un
el teorema 5.15.
Estos resultados son ciertos en el caso de tener infinitos m
odulos, pero con
una precauci
on:
Q
Si tenemos una familia de Am
odulos {Mi }iI , el producto cartesiano
Mi
iI
es un Am
odulo con las operaciones definidas por
(xi )iI + (yi )iI = (xi + yi )iI ,

r (xi )iI = (r xi )iI .


Q
Igualmente, las aplicaciones i : Mi
Mi dadas por
iI

i (m)(j) =

m si j = i,
0 si j 6= i,

son monomorfismos de m
odulos,
pero
odulo Mi con su
Q
P al identificar cada m
imagen ya no es cierto que
Mi =
Mi , sino que
iI

iI

iI

Q
Mi = f
Mi {i I | f (i) 6= 0} es finito ,
iI

pues el miembro derecho es claramente un subm


odulo del producto cartesiano
que contiene a todos los subm
odulos Mi , luego tambien a su suma. Esto nos
da la inclusi
on , y la contraria se sigue inmediatamente de que todo elemento
no nulo del miembro derecho es suma de un n
umero finito de elementos de los
subm
odulos Mi :
f = i1 (f (i1 )) + + in (f (in )),
donde {i1 , . . . , in } = {i I | f (i) 6= 0}.

Pero la suma de los subm


odulos i [Mi ] sigue siendo directa (por el mismo
argumento que en el caso finito), por lo que definimos la suma directa externa
de los m
odulos {Mi }iI como

L
Q
Mi = f
Mi {i I | f (i) 6= 0} es finito .
iI

iI

De este modo, dada una familia arbitraria de Am


odulos, podemos construir
un m
odulo que se expresa como suma directa de subm
odulos isomorfos a los
m
odulos dados. Pero es importante recordar que esta suma directa externa no
coincide con el producto cartesiano cuando el n
umero de factores es infinito. En
tal caso tenemos dos m
odulos distintos:
L
Q
Mi
Mi .
iI

iI

El segundo consta de tuplas infinitas arbitrarias, mientras que el primero


contiene las que s
olo tienen una cantidad finita de componentes no nulas.

5.2. Suma de m
odulos

165

Alrededor de las sumas directas y productos hay definidos diversos homomorfismos naturales. Todas las propiedades concernientes a ellos se demuestran
f
acilmente y los dejamos como ejercicios para el lector:
Q
Las proyecciones: i :
Mi Mi dadas por i (f ) = f (i) son claraiI

mente
odulos, que a su vez se restringen a epimorfismos
Lepimorfismos de m
i :
Mi Mi .
iI

Cuando el n
umero de factores es finito, M = M1 Mn , las proyecciones vienen dadas, m
as explcitamente, por i (m1 + + mn ) = mi .

Si tenemos homomorfismos
odulos
Q
Qde m
Q fi : Mi Ni , podemos definir
un homomorfismo
fi :
Mi
Ni mediante
iI

iI

iI

fi )((mi )iI ) = (fi (mi ))iI .

iI

L
L
L

Este
se restringe a su vez a un homomorfismo
fi :
Mi
Ni .
iI

iI

iI

En el caso finito la definici


on es

(f1 fn )(m1 , . . . , mn ) = (f1 (m1 ), . . . , fn (mn )).


Dados homomorfismos
de m
odulos fi : Mi N , podemos definir otro
P
L
homomorfismo
fi :
Mi N mediante
iI

iI

fi )(x) =

iI

fi (xi ),

iI

donde es fundamental que la suma de la derecha tiene un n


umero finito
de sumandos no nulos, pues en otro caso no estara definida.
En el caso finito queda
(f1 + + fn )(m1 , . . . , mn ) = f1 (m1 ) + + fm (mn )
Dados homomorfismos
de m
odulos
fi : M Ni , podemos definir otro
Q
Q
homomorfismo
fi : M
Ni mediante
iI

iI

fi )(m)(i) = fi (m).

iI

En el caso finito: (f1 fn )(m) = (f1 (m), . . . , fn (m)).


Es posible enunciar y demostrar muchas propiedades elementales de estos
homomorfismos.
Por
fi : Mi
Q
Q
Q ejemplo,
L si L
L Ni son isomorfismos, entonces
fi :
Mi
Ni y
fi :
Mi
Ni son tambien isomorfismos.
iI

iI

iI

iI

iI

iI

166

5.3

Captulo 5. M
odulos y espacios vectoriales

M
odulos libres

El hecho de que todo entero ciclot


omico se exprese de forma u
nica como
combinaci
on lineal de 1, , 2 , 3 puede expresarse de una forma m
as directa en
terminos de la estructura de Z-m
odulo de Z[] que mediante la descomposici
on
en suma directa que hemos mostrado. Para ello introducimos el concepto de
independencia lineal:
Definici
on 5.17 Sea A un anillo unitario, M un Am
odulo y X un subconjunto
de M . Diremos que X es un conjunto libre, o que sus elementos son linealmente
independientes, si para todos los x1 , . . . , xn X distintos dos a dos1 y todos los
a1 , . . . , an A, la igualdad a1 x1 + + an xn = 0 s
olo se da en el caso trivial
a1 = = an = 0.
En caso contrario se dice que X es un conjunto ligado o que sus elementos
son linealmente dependientes.
En otras palabras, un conjunto X es libre si la u
nica forma de expresar el 0
como combinaci
on lineal de elementos de X es tomando todos los coeficientes
nulos.
Es claro que un conjunto que contenga a 0 es ligado, pues 1 0 = 0 es una
combinaci
on lineal no trivial nula.
Un subconjunto X de un Am
odulo M es una base de M si es un generador
libre. Un m
odulo es libre si tiene una base.
Notemos que las definiciones implican trivialmente que es una base del
m
odulo nulo.
Por ejemplo, es f
acil ver que una base de An es {e1 , . . . , en }, donde ei An
es la n-tupla dada por

1 si i = j,
eij =
0 si i 6= j.
Esta base recibe el nombre de base can
onica de An . Por ejemplo, la base
3
can
onica de A es la formada por (1, 0, 0), (0, 1, 0), (0, 0, 1).
Observemos que si X = {x1 , . . . , xn } es una base de un Am
odulo M , entonces
M = hx1 i hxn i ,
pues por el teorema 5.7 todo elemento de M es de la forma a1 x1 + + an xn ,
es decir, M = hx1 i + + hxn i, y por la definici
on de conjunto libre se cumple
la condici
on 2) del teorema 5.15, luego la suma es directa.
1 Notemos que los elementos de X con los que formamos la combinaci
on lineal tienen
que ser distintos dos a dos. De lo contrario, todo conjunto no vaco sera ligado. Podemos
definir tambi
en que una n-tupla (x1 , . . . , xn ) es linealmente independiente si cuando se cumple
a1 x1 + +an xn = 0 necesariamente a1 = = an = 0, y esto implica que los xi son distintos
dos a dos, pues si xi = xj con i 6= j, bastara tomar ai = 1, aj = 1 y los dem
as coeficientes
nulos para tener una combinaci
on lineal no trivial nula.

5.3. M
odulos libres

167

De nuevo por el teorema 5.15, cada elemento m M se expresa de forma


u
nica como combinaci
on lineal
m = a1 x1 + + an xn
de los elementos de X. La n-tupla (a1 , . . . , an ) An de los coeficientes de dicha
combinaci
on se llaman coordenadas de m en la base X (esto presupone que
hemos fijado una ordenaci
on de la base). M
as a
un, teniendo en cuenta que
(a1 x1 + + an xn ) + (b1 x1 + + bn xn ) = (a1 + b1 )x1 + + (an + bn )xn ,
a(a1 x1 + + an xn ) = aa1 x1 + + aan xn ,
es obvio que la aplicaci
on que a cada elemento de M le asigna su ntupla de
coordenadas es un isomorfismo de m
odulos, o sea, M
= An .
Teniendo en cuenta que An siempre es un A-m
odulo libre, tenemos probado
el teorema siguiente:
Teorema 5.18 Sea A un anillo unitario y M un Am
odulo. Se cumple que M
tiene una base con n elementos si y s
olo si M es isomorfo al Am
odulo An .
Es f
acil ver que esto vale igualmente para bases infinitas: Un Am
odulo M
L
tiene una base X si y s
olo si es isomorfo a una suma directa M
A. La
=
xX

base can
onica de la suma directa es la formada por los ex dados por

1 si y = x,
ex (y) =
0 si y 6= x.

Ahora podemos decir, por ejemplo, que 1, , 2 , 3 forman una base de Z[]
como Z-m
odulo, y tambien de Q[] como Q-espacio vectorial.
Es f
acil ver que una base de un anillo de polinomios A[x] como A-m
odulo es
la formada por todas las potencias de x:
1,

x,

x2 ,

x3 ,

x4 ,

...

Es importante se
nalar que no todos los m
odulos son libres, aunque s lo
ser
an casi todos los que nos van a interesar. Por ejemplo, el anillo Z/nZ es un
Zm
odulo no libre, ya que si fuera libre debera ser isomorfo a una suma directa
de varias veces Z, lo cual es imposible, ya que tales sumas son infinitas y Z/nZ
es finito.
Las bases son u
tiles a la hora de determinar los homomorfismos de un m
odulo
en otro. Es inmediato que si dos homomorfismos de m
odulos coinciden sobre
los elementos de un sistema generador, entonces son el mismo homomorfismo.
Sobre las bases se puede decir m
as:
Teorema 5.19 Sea A un anillo unitario, M y N dos Am
odulos y X una
base de M . Entonces cada aplicaci
on f : X N se extiende a un u
nico
homomorfismo f : M N .

168

Captulo 5. M
odulos y espacios vectoriales

n: Cada elemento no nulo de M se expresa de forma u


Demostracio
nica
como combinaci
on lineal a1 x1 + + an xn de elementos de X con coeficientes
en A no nulos. La unicidad nos permite definir sin ambig
uedad
f (a1 x1 + + an xn ) = a1 f (x1 ) + + an f (xn )
y es f
acil ver que la aplicaci
on as definida (con la condici
on adicional f (0) = 0)
es un homomorfismo.
Ejemplo Podemos definir un homomorfismo : Z[] Z[] de Z-m
odulos
sin m
as que especificar las condiciones
(1) = 1,

() = 2 ,

( 2 ) = 4 ,

( 3 ) = 6 = .

Esto determina la imagen de cualquier otro elemento de Z[] (que en este caso
es la que se obtiene cambiando por 2 ), por ejemplo:
( 4 ) = (1 2 3 ) = 1 2 4 = 3 = ( 2 )4
Todo lo que hemos dicho hasta aqu en este captulo es v
alido para A-m
odulos
arbitrarios. Ahora vamos a ver que caractersticas adicionales se dan cuando A
es un anillo de divisi
on, es decir, cuando consideramos espacios vectoriales.
Si D es un anillo de divisi
on y V es un D-espacio vectorial, es costumbre
llamar vectores a los elementos de V y escalares a los elementos de D. Hay un
hecho elemental que marca la diferencia entre un espacio vectorial y un m
odulo
cualquiera:
Teorema 5.20 Si V es un D-espacio vectorial, entonces un conjunto X V
es ligado si y s
olo si uno de sus elementos es combinaci
on lineal de los restantes.
n: Si x = 1 x1 + + n xn , con xi X \ {x}, entonces
Demostracio
x+1 x1 + +n xn = 0 es una combinaci
on lineal nula no trivial de elementos
de X, luego X es ligado. Recprocamente, si X es ligado, existen elementos
x1 , . . . , xn X distintos dos a dos y escalares 1 , . . . , n D no todos nulos
tales que 1 x1 + + n xn = 0. Renumerando podemos suponer que 1 6= 0,
y entonces (y aqu usamos que D es un anillo de divisi
on)
x1 = 11 2 x2 11 n xn ,
luego x1 es combinaci
on lineal de x1 , . . . , xn .
Nota Esto no es cierto para m
odulos arbitrarios. Por ejemplo, en Z como
Z-m
odulo tenemos que X = {2, 3} es ligado, ya que 3 2 + (2) 3 = 0, pero no
es cierto que 2 = n3 ni 3 = n2 para ning
un entero n, luego ninguno de los dos
es combinaci
on lineal del otro.
Una consecuencia importante resulta de unir el teorema anterior a un sencillo hecho general: si x es combinaci
on lineal de los elementos de X, entonces
hXi = hX {x}i. Esto es inmediato, porque X {x} hXi, y esto implica
hX {x}i hXi. La otra inclusi
on es cierta en general.

5.3. M
odulos libres

169

Teorema 5.21 Si V es un D-espacio vectorial finitamente generado (es decir,


si tiene un generador finito), entonces tiene una base. M
as a
un, todo sistema
generador contiene una base.
n: Consideremos un generador finito de V , de modo que
Demostracio
V = hv1 , . . . , vn i. Si no es libre, por el teorema anterior uno de los generadores
es combinaci
on lineal de los dem
as, y por la observaci
on precedente puede ser
eliminado, con lo que pasamos a tener un sistema generador de V con n 1
elementos. Tras un n
umero finito de pasos tenemos que llegar a un generador
libre (que puede ser , si V = 0).
Con esto hemos probado que todo generador finito contiene una base. Si X es
un sistema generador arbitrario de V , basta probar que contiene un generador
finito. Ahora bien, si v1 , . . . , vn es un generador finito de V , entonces cada
vi puede expresarse como combinaci
on lineal de un cierto subconjunto finito
n
S

Xi X. El conjunto X =
Xi X es finito y es un sistema generador
i=1

de V , pues V = hv1 , . . . , vn i hX i V .

Y ahora podemos probar uno de los resultados fundamentales:


Teorema 5.22 Si V es un D-espacio vectorial finitamente generado, entonces
todas las bases de V tienen el mismo cardinal.
n: En la prueba del teorema anterior hemos visto que todo
Demostracio
generador contiene una base finita, luego todas las bases de V tienen que ser
finitas (una base no puede estar estrictamente contenida en otra base, ya que entonces la mayor no sera libre). Sean, pues X = {x1 , . . . , xn }, Y = {y1 , . . . , ym }
dos bases de V . Podemos tomar n m.
El elemento y1 se expresa como combinaci
on lineal de los elementos de X
y1 = d1 x1 + + dn xn ,
y como es no nulo, alguno de los coeficientes ser
a no nulo. Reordenando la base
podemos suponer que d1 6= 0. Entonces podemos despejar
1
1
x1 = d1
1 y1 d1 d2 x2 d1 dn xn ,

luego resulta que x1 hy1 , x2 , . . . xn i. Obviamente X hy1 , x2 , . . . xn i y as


hy1 , x2 , . . . , xn i = V .
Consecuentemente y2 = e1 y1 + +en xn y alguno de los coeficientes distintos
de e1 ha de ser no nulo (o si no y2 = e1 y1 , luego e1 y1 y2 = 0, con lo que Y
sera ligado).
Reordenando la base podemos suponer que e2 6= 0 y repitiendo el argumento
anterior concluimos que hy1 , y2 , x3 , . . . , xn i = V .
De este modo llegamos finalmente a que hy1 , . . . , yn i = V . De aqu se sigue
que m = n, pues en otro caso existira yn+1 y sera combinaci
on lineal de
y1 , . . . , yn , con lo que Y sera ligado.
Antes hemos visto que si en un sistema generador un vector es combinaci
on
lineal del resto, podemos eliminarlo y seguimos teniendo un sistema generador.

170

Captulo 5. M
odulos y espacios vectoriales

Otro hecho elemental es que si X es un sistema libre y v es un vector que no es


combinaci
on lineal de elementos de X, entonces X {v} sigue siendo libre.
En efecto, si fuera ligado, existira una combinaci
on lineal no trivial
1 x1 + + r xr + v = 0,
donde necesariamente 6= 0, o de lo contrario X sera ligado, y esto nos permitira despejar v (usando que tiene inverso, de modo que este argumento
requiere que D sea un anillo de divisi
on) para concluir que v s que es combinaci
on lineal de elementos de X, en contra de lo supuesto.
De aqu deducimos otra consecuencia importante sobre los espacios vectoriales:
Teorema 5.23 Si V es un D-espacio vectorial finitamente generado, entonces
todo conjunto libre de vectores de V est
a contenido en una base.
n: Sea v1 , . . . , vn una base de V . Si X no es generador,
Demostracio
alguno de los vi no es combinaci
on lineal de los elementos de X, pues si todos
lo fueran tendramos que V = hv1 , . . . , vn i hXi V . Pongamos que es v1 .
Entonces, por la observaci
on precedente, X {v1 } es libre.
Si X{v1 } no es generador, entonces, como antes, alg
un vi no es combinaci
on
lineal de sus elementos (y obviamente no ser
a v1 , luego podemos suponer que
es v2 ) y por lo tanto X {v1 , v2 } es libre. Tras un n
umero finito de pasos
tenemos que llegar a que X {v1 , . . . , vr } es un generador libre (pues en el
peor de los casos lo ser
a cuando a
nadamos todos los vectores de la base), y as
tenemos una base que contiene a X.
Definici
on 5.24 Si V es un espacio vectorial sobre un anillo de divisi
on D, se
llama dimensi
on de V , y la representaremos por dimD V , al n
umero de elementos
de cualquier base de V .
El teorema 5.22 implica que todo espacio vectorial finitamente generado
tiene asociada una dimensi
on, que es un n
umero natural (el espacio vectorial
nulo tiene dimensi
on 0). Por ello, en lugar de hablar de espacios vectoriales
finitamente generados, es m
as frecuente referirse a ellos como espacios vectoriales
de dimensi
on finita.
En la secci
on 5.6 recogemos los resultados que prueban que el concepto de
dimensi
on est
a bien definido tambien para espacios no finitamente generados
(que se llaman, consecuentemente, espacios vectoriales de dimensi
on infinita),
pero nunca vamos a necesitar esos resultados.
Que un espacio vectorial V tenga dimensi
on n significa que, fijada una base,
cada elemento de V est
a determinado por n elementos de D. Por ejemplo,
dim Q[] = 4 porque cada elemento de Q[] est
a determinado por cuatro coordenadas enteras.
Nos gustara afirmar lo mismo para Z[], pero primero tenemos que justificar
que tambien en el caso de un Z-m
odulo libre todas las bases tienen el mismo
n
umero de elementos. El teorema siguiente nos lo garantiza:

5.3. M
odulos libres

171

Teorema 5.25 (AE) Si A es un anillo conmutativo y unitario y M es un


Am
odulo libre finitamente generado, entonces todas las bases de M tienen el
mismo n
umero de elementos.2
n: Sea I un ideal maximal de A (teorema 3.19). Es claro que
Demostracio
n

IM =
ai mi n N, ai I, mi M
i=1

es un subm
odulo de M . El Am
odulo cociente M/IM se convierte en un A/I
m
odulo con el producto dado por [a][m] = [am].
Esta definici
on es correcta, pues si [a] = [a0 ] y [m] = [m0 ], entonces
am a0 m0 = am am0 + am0 a0 m0 = a(m m0 ) + (a a0 )m0 IM,

pues m m0 M y a a0 I.
Como I es un ideal maximal, el anillo cociente A/I es en realidad un cuerpo,
luego M/IM es un espacio vectorial. Ahora basta probar que que toda Abase
de M tiene el mismo cardinal que una A/Ibase de M/IM , pues entonces
M/IM ser
a un espacio vectorial de dimensi
on finita y todas las bases de M
tendr
an como cardinal la dimensi
on de M/IM .
En efecto, si X = {x1 , . . . , xn } es una Abase de M , vamos a demostrar que
X = {[x1 ], . . . , [xn ]} es una A/Ibase de M/IM y que las n clases son distintas
dos a dos, con lo que tambien tiene n elementos.
n
P
Todo elemento de M/IM es de la forma [u], con u M , luego u =
aj xj ,
j=1
n
P
y entonces [u] =
[aj ][xj ], lo que prueba que X genera M/IM .
j=1
n
P
Supongamos ahora que
[aj ][xj ] = [0] para ciertos elementos aj de A y
j=1

vamos a probar que [a1 ] = [an ] = 0, lo cual demuestra a la vez que los [xj ]
son distintos dos a dos y que son linealmente independientes.
n
n
m
P
P
P
Tenemos que
aj xj IM , luego
aj xj =
bk mk , para ciertos elej=1

j=1

k=1

mentos mk M y ciertos bk I.

Como X es una base de M , cada mk se expresa como mk =

n
P

cjk xj .

j=1

Por lo tanto
n
P

j=1

aj xj =

m
P

bk mk =

k=1

Pero como X es base, aj =

m
P

k=1
m
P

k=1

bk

n
P

j=1

cjk xj =

n
P

j=1

m
P

k=1

bk cjk xj .

bk cjk I, porque cada bk I, luego aj I,

luego [aj ] = 0. Con esto tenemos que X es base de M/IM y tiene el mismo
n
umero de elementos que X.
2 Notemos que el axioma de elecci
on s
olo aparece en la prueba al aplicar el teorema 3.19,
luego no es necesario si suponemos que el anillo A es noetheriano.

172

Captulo 5. M
odulos y espacios vectoriales

Definici
on 5.26 Si M es un m
odulo libre sobre un anillo conmutativo y unitario A, llamaremos rango de M (rang M ) al n
umero de elementos de cualquier
base de M .
Por supuesto, el que se use la palabra rango al hablar de m
odulos libres
arbitrarios y de dimensi
on al hablar de espacios vectoriales no es m
as que una
costumbre arraigada, pero en realidad el concepto es el mismo.
Como en el caso de la dimensi
on, hemos probado que el rango est
a definido para todo A-m
odulo libre finitamente generado con A conmutativo y
unitario, por lo que es habitual referirse a ellos como A-m
odulos libres de
rango finito. No obstante, la prueba del teorema anterior se adapta trivialmente al caso de m
odulos no necesariamente finitamente generados usando la
generalizaci
on 5.52 de 5.22 a espacios vectoriales no necesariamente finitamente
generados.
Ahora ya podemos afirmar que rang Z[] = 4, y esto significa simplemente
que cada entero ciclot
omico est
a completamente determinado por 4 n
umeros
enteros.
Observemos que si M y N son A-m
odulos libres, entonces
rang(M N ) = rang M + rang N.
En efecto, si los rangos son finitos tenemos que M
= Am , N
= An , y entonces
m
n m+n

M N =A A =A
, donde el u
ltimo isomorfismo es el dado por
((a1 , . . . , am ), (b1 , . . . , bn )) 7 (a1 , . . . , am , b1 , . . . , bn ).
El argumento se generaliza f
acilmente al caso en que alguno de los rangos es
infinito, usando que si I J = , entonces
L
L L
A
A=
A.
iI

jJ

iIJ

La dimensi
on en espacios vectoriales se comporta mucho mejor que el rango
en m
odulos libres en general. Veamos primero algunos resultados positivos sobre
espacios vectoriales y despues comentaremos la situaci
on general.
Teorema 5.27 Sea V un espacio vectorial de dimensi
on finita sobre un anillo
de divisi
on D y sea W un subespacio de V . Entonces:3
1. dim V = dim W + dim(V /W ). En particular dim W dim V .
2. Si dim W = dim V entonces W = V .
n: 1) Sea X una base de W . Por el teorema 5.23 sabemos
Demostracio
que X se extiende a una base Y de V . Veamos que si y1 , . . . , yn Y \ X,
entonces las clases [y1 ], . . . , [yn ] son linealmente independientes (y en particular
distintas) en V /W .
3 El lector familiarizado con la teor
a de cardinales infinitos se dar
a cuenta de que la prueba
de 1. vale igualmente aunque las dimensiones sean infinitas. No puede decirse lo mismo de 2.

5.3. M
odulos libres

173

En efecto, si a1 [y1 ] + + an [yn ] = 0 entonces a1 y1 + + an yn W , luego


se expresa como combinaci
on lineal de elementos de X, es decir,
a1 y1 + + an yn = b1 x1 + + bm xm ,
y esto nos da dos expresiones distintas de un mismo elemento de V como combinaci
on lineal de elementos de la base Y , lo cual es imposible salvo que todos
los coeficientes sean nulos.
Por otra parte, todo elemento de V /W es de la forma [v], donde v V . El
elemento v se expresa como combinaci
on lineal de elementos de Y , digamos
v = a1 y1 + + an yn + b1 x1 + + bm xm ,
donde y1 , . . . , yn Y \ X y x1 , . . . , xm X. Por lo tanto
[v] = a1 [y1 ] + + an [yn ] + b1 [x1 ] + + bm [xm ] = a1 [y1 ] + + an [yn ] + 0

y esto prueba que [y] | y Y \ X es un generador, luego una base de V /W ,


que seg
un lo visto tiene el mismo cardinal que Y \ X. As pues
dim V = |Y | = |X| + |Y X| = dim W + dim(V /W ).
2) Si dim W = dim V = n finito, entonces una base de W (con n elementos)
se ha de extender hasta una base de V , tambien con n elementos, luego toda
base de W lo es tambien de V . Esto implica que W = V .
Un razonamiento similar permite probar el resultado siguiente:
Teorema 5.28 Sean V y W dos subespacios de dimensi
on finita de un espacio
vectorial sobre un anillo de divisi
on D. Entonces existen conjuntos X e Y tales
que X es base de V , Y es base de W , X Y es base de V W y X Y es base
de V + W . En particular
dim(V + W ) + dim(V W ) = dim V + dim W.
La prueba consiste esencialmente en partir de una base de V W y extenderla
hasta una base X de V y hasta una base Y de W . En realidad, la prueba vale
tambien si las dimensiones no son finitas.
En particular la dimensi
on de una suma directa de subespacios es igual a la
suma de las dimensiones de los subespacios.
Como consecuencia inmediata del teorema de isomorfa y del teorema 5.27
se cumple lo siguiente:
Teorema 5.29 Sea f : V W una aplicaci
on lineal entre espacios vectoriales sobre un anillo de divisi
on D. Entonces dim V = dim N(f ) + dim Im f .
Otra propiedad sencilla en torno a las dimensiones es que si V es un espacio
vectorial de dimensi
on finita n, entonces todo sistema libre con n elementos es
una base, al igual que todo sistema generador con n elementos. En efecto, todo

174

Captulo 5. M
odulos y espacios vectoriales

sistema libre con n elementos se extiende hasta una base, que ha de tener n
elementos, luego tiene que ser ya una base. Igualmente, todo sistema generador
con n elementos contiene una base con n elementos, luego el mismo es una base.
Casi todos estos resultados son falsos sobre m
odulos libres cualesquiera, incluso en los casos m
as simples. Por ejemplo, 2Z es un subm
odulo de Z con el
mismo rango finito, pero 2Z 6= Z (al contrario que 5.27). Por otro lado {2} es
un subconjunto libre de Z que no puede extenderse hasta una base de Z y el
conjunto {2, 3} es un generador de Z que no contiene una base. Por otra parte,
no todo cociente de un m
odulo libre es libre (p.ej. Z/2Z).

5.4

Matrices

Una base finita en un A-m


odulo libre M no s
olo permite determinar los
elementos de M en terminos de una n-tupla de coordenadas en An , sino que
tambien permite reducir a un n
umero finito de coordenadas los homomorfismos
entre M y cualquier otro A-m
odulo libre que tenga tambien una base finita.
Para mostrarlo necesitamos el concepto de matriz:
Definici
on 5.30 Sea A un anillo unitario y m, n n
umeros naturales no nulos.
Una matriz m n sobre A es una aplicaci
on B : {1, . . . , m} {1, . . . , n} A.
Escribiremos bij en lugar de B(i, j) y tambien B = (bij ). En la pr
actica escribiremos los elementos de una matriz m n dispuestos en m filas y n columnas
as:

b11 b1n

..
B = ...
.
bm1

bmn

Llamaremos Matmn (A) al conjunto de todas las matrices m n sobre A.


Las matrices n n se llaman matrices cuadradas. Escribiremos Matn (A) en
lugar de Matnn (A).
Evidentemente dos matrices B = (bij ) y C = (cij ) son iguales si y s
olo si
tienen las mismas dimensiones m n y bij = cij para todo par de ndices i, j.
Podemos identificar los elementos de An con las matrices 1 n, es decir,
con las matrices con una sola fila y n columnas. A estas matrices se las llama
matrices fila. Cuando A es un anillo de divisi
on se las llama tambien vectores
fila.
Por analoga, las matrices m 1, es decir, las matrices que constan de una
sola columna, se llaman matrices columna o vectores columna cuando A es un
anillo de divisi
on.
En las matrices fila y columna suprimiremos el ndice fijo, es decir, las representaremos as:

a1
..
(a1 , . . . , an ),
. .
an

5.4. Matrices

175

Llamaremos matriz traspuesta de una matriz B Matmn (A) a la matriz


B t Matnm (A) que resulta de intercambiar las filas de B por sus columnas,
es decir, la componente (i, j) de B t es la componente (j, i) de B.
De este modo, la traspuesta de una matriz fila es una matriz columna y
viceversa. Claramente B tt = B.
Una matriz cuadrada B es simetrica si B = B t , es decir, si bij = bji para
todo par de ndices i, j.
La fila i-esima de una matriz B es la matriz fila Bi = (bi1 , . . . , bin ). La
columna j-esima de la matriz B es la matriz columna

b1j

B j = ...
bmj

luego, en este sentido, una matriz m n tiene m filas y n columnas.

Llamaremos matriz nula de orden m n a la matriz m n que tiene todas


sus componentes iguales a 0.
Llamaremos diagonal principal de una matriz cuadrada B Matn (A) a la
n-tupla (b11 , . . . , bnn ).
Una matriz cuadrada es una matriz diagonal si tiene nulas todas sus componentes que no est
an en la diagonal principal.
Una matriz diagonal es una matriz escalar si tiene todas sus componentes
de la diagonal principal iguales entre s.
La matriz identidad de orden n es la matriz escalar n n cuyas componentes
de la diagonal principal son iguales a 1. La representaremos por In . Si definimos
la delta de Kronecker mediante

1 si i = j
ij =
0 si i 6= j
entonces In = (ij ).
Ahora definimos unas operaciones con matrices:
Si B = (bij ) y C = (cij ) son matrices m n, llamaremos B + C a la matriz
m n dada por B + C = (bij + cij ).
Si B = (bij ) es una matriz m n y a A, llamaremos aB a la matriz m n
dada por aB = (abij ).
Con estas operaciones Matmn (A) se convierte en un A-m
odulo libre de
rango mn. Una base la forman las mn matrices que tienen un 1 en cada una de
las posiciones posibles y las restantes componentes nulas.
La estructura de A-m
odulo en los espacios de matrices fila no es sino la
estructura usual en los espacios An .

176

Captulo 5. M
odulos y espacios vectoriales

Finalmente definimos el siguiente producto de matrices:


Si B Matmn (A) y C Matnr (A), la matriz BC Matmr (A) es la
n
P
que tiene en la posici
on (i, j) el elemento
bik ckj .
k=1

Es pura rutina comprobar las propiedades siguientes (que se cumplen cuando


las dimensiones de las matrices son las apropiadas):
1. B(CD) = (BC)D.
2. B(C + D) = BC + BD.
3. (B + C)D = BD + CD.
4. BIn = Im B = B.
5. Si A es conmutativo (BC)t = C t B t .
En general, el producto de matrices no es una operaci
on interna en el conjunto Matmn (A), pero s lo es en los espacios de matrices cuadradas. Los
espacios Matn (A) son anillos unitarios con la suma y el producto de matrices.
Salvo en casos triviales no son conmutativos. La aplicaci
on que a cada elemento
a A le asigna la matriz escalar aIn es un monomorfismo de anillos, con lo que
podemos identificar los elementos de A con las matrices escalares, y as A es un
subanillo de Matn (A). El producto de una matriz por el elemento a coincide
con el producto por la matriz aIn .
Vamos a dar una interpretaci
on de todo esto en terminos de m
odulos.
Sea M un A-m
odulo libre de rango finito n. Una base ordenada de M es
una n-tupla B = (u1 , . . . , un ) tal que u1 , . . . , un forman una base de M .
Llamaremos sistema de coordenadas asociado a la base ordenada B a la
aplicaci
on B : M An que a cada elemento m M le asigna la n-tupla
(a1 , . . . , an ) tal que m = a1 u1 + + an un . A B (m) se le llama n-tupla de
coordenadas de m respecto a la base B.
Sea f : M N un homomorfismo entre m
odulos libres de rangos m y n
respectivamente. Sean B = (u1 , . . . , um ) y B 0 = (v1 , . . . , vn ) bases ordenadas
de M y N . Entonces, para cada ui existen unos u
nicos elementos aij A tales
n
P
que f (ui ) =
aij vj .
j=1

Llamaremos matriz asociada a f en las bases B y B 0 a MB


B (f ) = (aij ), es
decir, a la matriz que tiene por filas a las coordenadas en la base B 0 de las
im
agenes de los miembros de la base B.
Teorema 5.31 Sea f : M N un homomorfismo entre A-m
odulos libres
de rangos m y n respectivamente. Sean B y B 0 bases ordenadas de M y N .
0
Entonces MB
nica matriz que cumple:
B (f ) es la u

0
B 0 f (u) = B (u)MB
B (f ),
para todo u M .

5.4. Matrices

177
0

n: Sean B = (u1 , . . . , um ) y B 0 = (v1 , . . . , vn ), sea MB


Demostracio
B (f ) =
Pm
(aij ) y sea B (u) = (x1 , . . . , xm ). Entonces u = i=1 xi ui y
m

m
m
n
P
P
Pn
P
P
f (u) =
xi f (ui ) =
xi j=1 aij vj =
xi aij vj ,
i=1

i=1

luego

B 0 f (u) =

m
P

i=1

j=1

xi aij

i=1

= B (u)MB
B (f ).

Si una matriz C cumple B 0 f (u) = B (u)C, entonces tomando u = ui la


n-tupla B (u) es la que tiene un 1 en el lugar i-esimo y 0 en los restantes. El
producto B (u)C no es sino la fila
de C, luego dicha fila i-esima est
a
i-esima

0
formada por las coordenadas B 0 f (ui ) , al igual que la fila i-esima de MB
(f
).
B
0
Por lo tanto C = MB
B (f ).
Definici
on 5.32 Si M y N son A-m
odulos, llamaremos HomA (M, N ) al conjunto de todos los homomorfismos entre M y N . Si ambos son libres de rangos
m y n, fijadas dos bases ordenadas B y B 0 de M y N respectivamente, tenemos
definida una aplicaci
on
0

MB
B : HomA (M, N ) Matmn (A),
que claramente es biyectiva.
0

B
En efecto, si MB
por el teorema
anterior para todo
B (f ) = MB (g),
entonces

elemento u de M , se cumple B 0 f (u) = B 0 g(u) , luego ha de ser f (u) =


g(u) y por lo tanto f = g, la aplicaci
on es inyectiva. Por otra parte, dada una
matriz C Matmn (A), por el teorema 5.19 existe f HomA (M, N ) que enva
a cada componente de la base B al elemento de N que en la base B 0 tiene por
0
n-tupla de coordenadas a la correspondiente fila de C, con lo que MB
B (f ) = C.

Ejemplo La aplicaci
on f : Q[] Q[] dada por f () = es claramente
una aplicaci
on lineal, considerando a Q[] como Q-espacio vectorial. Vamos a
calcular su matriz en la base ordenada B = (1, , 2 , 3 ). Para ello notamos
que f (1) = , f () = 2 , f ( 2 ) = 3 y f ( 3 ) = 4 = 1 2 3 . Por
lo tanto,

0
1
0
0
0
0
1
0

MBB (f ) =
0
0
0
1
1 1 1 1
As, esta matriz (un n
umero finito de datos) determina completamente la aplicaci
on f .

Si A es un anillo conmutativo, el conjunto HomA (M, N ) puede ser dotado


de estructura de A-m
odulo de forma natural:

178

Captulo 5. M
odulos y espacios vectoriales

Definimos f + g como el homomorfismo que sobre cada m M act


ua mediante (f + g)(m) = f (m) + g(m),
y
si
a

A,
entonces
af
es
el
homomorfismo

determinado por (af )(m) = a f (m) (notemos que si A no es conmutativo af


no tiene por que ser un homomorfismo).
0

Es f
acil comprobar que la aplicaci
on MB
odulos, es
B es un isomorfismo de m
0
B0
B0
B0
B0
decir, que MB (f + g) = MB (f ) + MB (g) y que MB
(af
)
=
aM
(f
).
B
B
Por ejemplo, si u M , entonces

0
0
B0
B0
B (u) MB
= B (u)MB
B (f ) + MB (g)
B (f ) + B (u)MB (g)

= B 0 f (u) + B 0 g(u)

= B 0 f (u) + g(u)

= B 0 (f + g)(u) ,
0

B
B
luego por la unicidad de 5.31, MB
B (f + g) = MB (f ) + MB (g).

Esto explica las definiciones que hemos dado de suma de matrices y producto
de una matriz por un elemento de A: la suma de dos matrices es la operaci
on
que nos da la matriz asociada al homomorfismo suma de los homomorfismos
asociados a los sumandos, y similarmente con el producto por elementos de A.
Respecto al producto de matrices, su interpretaci
on es la siguiente:
Teorema 5.33 Sean f : M N y g : N R homomorfismos de Am
odulos libres de rango finito. Sean B, B 0 y B 00 bases ordenadas de M , N y R
00
B0
B 00
respectivamente. Entonces MB
B (f g) = MB (f )MB 0 (g).
n: Si u M , entonces
Demostracio

B 00

0
B 00
B (u)MB
B (f )MB 0 (g) = B 0 f (u) MB 0 (g) = B 00 g f (u)

= B 00 (f g)(u) ,
00

00

B
B
luego por la unicidad de 5.31, MB
B (f g) = MB (f )MB 0 (g).

Definici
on 5.34 Si M es un A-m
odulo, representaremos por EndA (M ) =
HomA (M, M ) al conjunto de todos los endomorfismos de M . Es f
acil ver que
EndA (M ) es un anillo con la suma de homomorfismos que ya tenemos definida
y con la composici
on de aplicaciones como producto.
Si M es libre de rango n y B es una base ordenada, el teorema anterior prueba
que la aplicaci
on MBB : EndA (M ) Matn (A) es un isomorfismo de anillos.
Notemos que la matriz identidad se corresponde con la aplicaci
on identidad.
Las unidades de EndA (M ) son los endomorfismos que tienen una inversa
como aplicaciones, es decir, los endomorfismos biyectivos, que reciben el nombre
de automorfismos de M . Si M es libre de rango finito, la aplicaci
on MBB hace
corresponder los automorfismos de M con las matrices regulares en el sentido
siguiente:

5.4. Matrices

179

Definici
on 5.35 Una matriz C Matn (A) es regular si es una unidad del
anillo Matn (A), es decir, si existe una matriz C 1 Matn (A) tal que CC 1 =
C 1 C = In . En tal caso la matriz C 1 es u
nica y se llama matriz inversa de C.
Una matriz cuadrada que no es regular es una matriz singular.
Una propiedad elemental es que si A es conmutativo y B es una matriz
regular, entonces la matriz traspuesta B t tambien es regular y (B t )1 = (B 1 )t .
En efecto, basta observar que (B 1 )t B t = (BB 1 )t = Int = In , e igualmente en
orden inverso.
Teorema 5.36 Si f : M N es un homomorfismo entre m
odulos libres del
mismo rango finito y B, B 0 son bases ordenadas de M y N respectivamente,
0
entonces f es un isomorfismo si y s
olo si MB
B (f ) es regular y, en tal caso,
0
1
1
MB
) = MB
.
B 0 (f
B (f )
n: Sea g HomA (N, M ) tal que g = f 1 si suponemos que
Demostracio
0
B0
1
f es isomorfismo o tal que MB
si suponemos que MB
B 0 (g) = MB (f )
B (f ) es
regular.
0
B
B
B
En cualquier caso se cumple que MB
B (f )MB 0 (g) = MB (f g) = In = MB (I)
0
0
B
B
B
B0
y MB 0 (g)MB (f ) = MB 0 (g f ) = In = MB 0 (I), de donde se siguen las dos
implicaciones.
Las matrices tambien proporcionan una forma sencilla de obtener las coordenadas de un elemento de un m
odulo libre en una base conocidas sus coordenadas
en otra base:
Definici
on 5.37 Si B = (u1 , . . . , un ) y B 0 = (v1 , . . . vn ) son dos bases ordenadas de un mismo A-m
odulo M , se llama matriz de cambio de base a la matriz
0
B0
MB
B = MB (I), donde I es la identidad en M .
0

B 1
Claramente MB
= MB
esima de MB
B es regular y (MB )
B 0 . La fila i-
B es
B 0 (ui ) y para todo m M se cumple la relaci
on
0

B 0 (m) = B (m)MB
B ,
0

es decir, el producto por MB


B transforma las coordenadas de m en B en las
coordenadas de m en B 0 .
Teorema 5.38 Se cumple
1. Si A es un dominio ntegro y B, C Matn (A) cumplen que BC = In ,
entonces B y C son regulares y C = B 1 .
2. Si A es un dominio ntegro y B Matmn (A), C Matnm (A) cumplen
que BC = Im , CB = In , entonces n = m, B y C son regulares y C = B 1 .
n: Sea K el cuerpo de cocientes de A. Entonces Matn (A)
Demostracio
puede considerarse como un subanillo de Matn (K). Fijemos una base del espacio
vectorial K n y consideremos las aplicaciones lineales f , g : K n K n cuyas

180

Captulo 5. M
odulos y espacios vectoriales

matrices en la base considerada sean B y C respectivamente. Entonces la matriz


de f g es In , lo que significa que f g es la aplicaci
on identidad. De aqu se
sigue que f es un monomorfismo, luego dim Im f = dim K n = n. Por 5.27
tenemos que Im f = K n , luego f es un isomorfismo y por el teorema anterior
B es regular. Multiplicando por B 1 en BC = In obtenemos que C = B 1 . La
prueba de 2 es an
aloga.

5.5

M
odulos finitamente generados sobre DIPs

Podemos resumir los resultados que hemos demostrado sobre espacios vectoriales de dimensi
on finita diciendo que un espacio vectorial de dimensi
on finita
sobre un anillo de divisi
on D est
a completamente determinado por un n
umero
natural, su dimensi
on d, en el sentido de que todos los Despacios vectoriales de dimensi
on d son isomorfos a Dd y desde un punto de vista algebraico,
como espacios vectoriales, podemos decir que todos son el mismo espacio,
aunque difieran como conjuntos. Podemos expresar esto diciendo que los espacios vectoriales de dimensi
on finita quedan completamente clasificados por su
dimensi
on, en el sentido de que, conocida la dimensi
on, conocido el espacio.
En esta secci
on vamos a tratar de llegar a resultados similares para m
odulos
finitamente generados sobre un dominio de ideales principales D. Sabemos que
lo anterior es cierto igualmente para los Dm
odulos libres de rango finito, pero
tambien sabemos que puede haber D-m
odulos finitamente generados que no
sean libres.
Vamos a probar que tambien es posible asignar a cada D-m
odulo finitamente
generado un n
umero finito de datos que lo determinar
an salvo isomorfismo,
aunque ahora los datos no se reducir
an a un mero n
umero natural, como
en el caso de los espacios vectoriales. El resultado ser
a una clasificaci
on completa de los D-m
odulos finitamente generados en el mismo sentido que en el
caso de los espacios vectoriales: cada m
odulo tendr
a asignados unos datos de
modo que, conocidos los datos, conocido el m
odulo y, aun sin conocer los datos
que determinan a un m
odulo dado, podremos enumerar en la pr
actica todas
las posibilidades que pueden darse, de modo que podamos analizar cada una
separadamente si es necesario sabiendo que con ello cubrimos todos los casos
posibles.
El teorema de clasificaci
on que vamos a probar aqu es un resultado mucho
m
as abstracto que cualquier otro que hayamos probado hasta el momento, y tal
vez el lector no este en condiciones de apreciar el valor de trabajar con tanta
generalidad. Sin embargo, veremos que el nivel de abstracci
on de esta secci
on se
traduce en que los resultados que vamos a obtener ser
an aplicables en contextos
muy diversos, incluyendo la clasificaci
on de las isometras de un espacio eucldeo,
por citar uno de los ejemplos m
as alejados del terreno que estamos tratando en
este libro.
Nuestro punto de partida ser
a el teorema siguiente:

5.5. M
odulos finitamente generados sobre DIPs

181

Teorema 5.39 (AE) Todo subm


odulo de un m
odulo libre sobre un dominio de
ideales principales es libre de rango menor o igual que el del m
odulo.4
n: Sea L un m
Demostracio
odulo libre sobre un dominio de ideales principales D. Sea B L una base y consideremos en ella un buen orden . Para
cada b B definimos
Lb = hc B | c < bi ,

b = hc B | c bi .
L

b se expresa de forma u
Cada a L
nica como a = u+db, con u Lb y d D.
b D dada por a 7 d es claramente un homomorfismo
La aplicaci
on fb : L
de m
odulos.
Tomemos ahora un subm
odulo M L y vamos a considerar los homomor b D. As, el n
fismos fb restringidos a fb : M L
ucleo de fb es claramente
M Lb . La imagen de fb ser
a un ideal de D. Como D es un dominio de ideales
principales, estar
a generada por un cierto db D. Sea B 0 = {b B | db 6= 0} y,
0
b tal que fb (mb ) = db .
para cada b B elegimos un mb M L
El teorema quedar
a probado si demostramos que C = {mb | b B 0 } es una
base de M (pues, ciertamente, su cardinal es menor o igual5 que el de B).
En primer lugar demostramos que C es linealmente independiente. Supongamos, para ello, que tenemos una combinaci
on lineal nula a1 mb1 + +an mbn = 0,
donde ai D y b1 < < bn son elementos de B. En esta situaci
on, para cada
b M Lb , luego
i < n, tenemos que mbi M L
i
n
a1 mb1 + + an1 mbn1 M Lbn .
Por lo tanto,
0 = fbn (0) = fbn (a1 mb1 + + an1 mbn1 ) + fbn (an mbn ) = an dbn ,
y concluimos que an = 0. Aplicando ahora fbn1 se obtiene que an1 = 0, e
igualmente con todos los coeficientes.
Veamos ahora que C es un sistema generador de M . Por reducci
on al absurdo, supongamos que existe un m M que no puede expresarse como com b para cierto b B, y
binaci
on lineal de elementos de C. Entonces m M L
podemos tomar el mnimo b tal que existe un m en estas condiciones.
Si b
/ B 0 , entonces la imagen de fb es nula, luego fb (m) = 0, lo que significa
b0 ,
que m M Lb , pero entonces existir
a un b0 < b tal que m M L
0
en contradicci
on con la minimalidad de b. Concluimos, pues, que b B , y
entonces fb (m) = ddb , para cierto d D.
4 El teorema usa AE u
nicamente al suponer que el m
odulo dado tiene una base que admite un buen orden, pero esto se cumple trivialmente para m
odulos rango de numerable (en
particular, finito). En tal caso no es necesario AE.
5 En el caso en que la base B sea infinita, el lector debe saber que el cardinal de un
subconjunto es menor o igual que el cardinal del conjunto. Nosotros hemos visto que esto es
as cuando B es finito o incluso infinito numerable, y nunca vamos a necesitar otros casos. De
hecho, en esta secci
on s
olo necesitaremos el caso finito.

182

Captulo 5. M
odulos y espacios vectoriales

b . Claramente fb (m0 ) = ddb ddb = 0.


Llamemos m0 = m dmb M L
0
b0
Consecuentemente, m M Lb , luego, existe un b0 < b tal que m0 M L
y, por la minimalidad de b, tenemos que m0 es combinaci
on lineal de elementos
de C, pero entonces m tambien lo es, y llegamos a una contradicci
on.
Un poco m
as en general, todo subm
odulo de un m
odulo finitamente generado
es finitamente generado:
Teorema 5.40 Sea D un dominio de ideales principales y M un Dm
odulo
con un generador finito de n elementos. Entonces todo subm
odulo de M admite
un generador finito con a lo sumo n elementos.
n: Sea {x1 , . . . , xn } un generador de M , sea L un Dm
Demostracio
odulo
libre de rango n y sea {y1 , . . . , yn } una base de L. Entonces por el teorema 5.19
existe un homomorfismo f : L M tal que f (yi ) = xi para cada i = 1, . . . , n.
Como Imf es un subm
odulo que contiene a un generador de M , necesariamente ha de ser Imf = M , luego f es suprayectiva.

Ahora, si N es un subm
odulo de M , se cumple que N = f f 1 [N ] , y
por 5.39 tenemos que f 1 [N ] es un subm
odulo de L libre y de rango menor
o igual que n. La imagen de una base de f 1 [N ] es claramente un sistema
generador de N .
Ya hemos se
nalado que no todo Z-m
odulo es libre (por ejemplo, Z/nZ). Sin
embargo, ahora podemos dar una condici
on sencilla que determina cu
ando un
m
odulo finitamente generado sobre un DIP es libre. Para ello introducimos
algunos conceptos:
Definici
on 5.41 Si A es un dominio y M es un Am
odulo, un elemento m M
es de torsi
on si existe un a A no nulo tal que am = 0. Llamaremos Mt al
conjunto de todos los elementos de torsi
on de M . Es inmediato comprobar que
Mt es un subm
odulo de M , que recibe el nombre de subm
odulo de torsi
on de M .
Si M = Mt se dice que M es un m
odulo de torsi
on. Si Mt = 0 se dice que M
es libre de torsi
on.
Por ejemplo, Z/nZ es un Zm
odulo de torsi
on, pues nx = 0 para todo
x Z/nZ.
En general, si D es un dominio ntegro y M es un Dm
odulo libre, entonces
es libre de torsi
on, pues si m M es un elemento de torsi
on, podemos expresarlo
como combinaci
on lineal de los elementos de una base:
m = d1 b1 + + dn bn ,
y entonces, si existe un d D no nulo tal que dm = 0, tenemos que
0 = dm = dd1 b1 + + ddn bn ,
luego, por la independencia lineal de la base, dd1 = ddn = 0, y como D es
ntegro, esto implica que d1 = = dn = 0, luego m = 0.
En el contexto en el que estamos trabajando, se cumple el recproco:

5.5. M
odulos finitamente generados sobre DIPs

183

Teorema 5.42 Si D es un dominio de ideales principales, entonces un Dm


odulo finitamente generado es libre si y s
olo si es libre de torsi
on.
n: Sea M un Dm
Demostracio
odulo finitamente generado (que podemos suponer no nulo). Acabamos de ver que si es libre tambien es libre de
torsi
on. Ahora supongamos que es libre de torsi
on. Esto equivale a que cualquier y M no nulo es libre. Sea G un sistema generador finito de M y sea
y1 uno cualquiera de sus elementos no nulos. En general, podemos ir eligiendo
elementos y1 , . . . , yn G tales que {y1 , . . . , yn } sea un sistema libre hasta agotar
los elementos de G o bien hasta que cualquier y G \ {y1 , . . . , yn } haga que
{y1 , . . . , yn , y} sea ligado. Pongamos que G = {y1 , . . . , yn , yn+1 , . . . ym }, donde
tal vez m = n y sea L = hy1 , . . . , yn i, que es un Dm
odulo libre finitamente
generado.
Si m > n, para cada n i m, tenemos una combinaci
on lineal nula
d1 y1 + + dn yn + di yi = 0,
donde no todos los coeficientes son nulos, pero, concretamente, tiene que ser
di 6= 0, pues de lo contrario {y1 , . . . , yn } sera ligado. Entonces di yi L. Sea
d = dn+1 dm 6= 0, de modo que dyi L para todo i = 1, . . . , m. El hecho
de que G es un generador de M implica claramente que dm L para todo
m M . Consideremos ahora la aplicaci
on f : M L dada por f (m) = dm.
Claramente es un homomorfismo de m
odulos, y es un monomorfismo (tiene
n
ucleo trivial) porque M es libre de torsi
on. Por lo tanto M es isomorfo a su
imagen, que es un subm
odulo de L, luego es libre por el teorema 5.39.
Ejercicio: Probar que Q es un Zm
odulo libre de torsi
on, pero no libre.

Podemos precisar m
as la situaci
on:
Teorema 5.43 Sea D un dominio eucldeo y sea M un Dm
odulo finitamente
generado. Entonces M/Mt es un Dm
odulo libre y existe un subm
odulo libre
L de M tal que M = Mt L. En particular L
M/M
,
luego
su
rango est
a
=
t
determinado por M .
n: Observemos en primer lugar que M/Mt es libre de torsi
Demostracio
on.
En efecto, si [x] M/Mt es un elemento de torsi
on, esto significa que existe un
d D no nulo tal que [dx] = 0, es decir, dx Mt , luego existe un d0 D no
nulo tal que d0 dx = 0, luego x Mt , luego [x] = 0. Tambien es claro que M/Mt
es finitamente generado. Por el teorema anterior tenemos que M/Mt es libre.
Sea [m1 ], . . . , [mn ] una base de M/Mt y sea L = hm1 , . . . , mn i. Se cumple
que m1 , . . . , mn son linealmente independientes, pues si
d1 m1 + + dn mn = 0,
entonces d1 [m1 ] + + dn [mn ] = 0, luego d1 = = dn = 0, por la independencia lineal de las clases [mi ].

184

Captulo 5. M
odulos y espacios vectoriales

Por otra parte, M = Mt + L, ya que si m M , entonces existen di D


tales que [m] = d1 [m1 ] + + dn [mn ], luego x = d1 m1 + dn mn L cumple
[m] = [x], luego m x = t Mt , luego m = t + x Mt + L.
Finalmente, M = Mt L, pues esto equivale a que Mt L = 0 y, en efecto,
si m Mt L, entonces m = d1 m1 + + dn mn para ciertos di D, pero
entonces d1 [m1 ]+ +dn [mn ] = [m] = 0, luego d1 = = dn = 0, luego m = 0.
Notemos que la proyecci
on M = Mt L L es un epimorfismo de m
odulos
con n
ucleo Mt , lo que nos da el isomorfismo L
= M/Mt .
Definici
on 5.44 Si M es un m
odulo finitamente generado sobre un DIP D,
llamaremos rango de M al rango del m
odulo libre M/Mt .
Con esto tenemos ya uno de los datos que nos permitir
an clasificar los
m
odulos finitamente generados sobre un DIP. Dos m
odulos tienen el mismo
rango si y s
olo si tienen partes libres isomorfas. Ahora vamos a encontrar otros
datos que determinen todas las posibilidades para la parte de torsi
on.
Si M es un D-m
odulo arbitrario y m M , llamaremos orden de m al
conjunto
o(m) = {d D | dm = 0}.
Claramente es un ideal de D, que ser
a no nulo si y s
olo si m es un elemento de
torsi
on. En tal caso, si o(m) = (a), entonces tenemos que a 6= 0 y un d D
anula a m (es decir, cumple dm = 0) si y s
olo si a | d. Diremos que a es un
periodo de m.
Notemos que los generadores de un ideal principal est
an determinados salvo
unidades, por lo que cada m M determina sus periodos salvo unidades. En
los casos en que tengamos un criterio para seleccionar un generador de cada
ideal no distinguiremos entre orden y periodos. Por ejemplo, en el caso de Z
m
odulos podemos considerar que el orden de un elemento de torsi
on m es su
u
nico periodo positivo, y es el menor natural a tal que am = 0.
Ejemplo Si M = Z/6Z, entonces los ordenes de sus elementos son los dados
por la tabla siguiente:
m 0 1 2 3 4 5
o 1 6 3 2 3 6
Veremos enseguida que no es casual que todos los ordenes sean divisores de 6.
Si a D, definimos M [a] = {m M | am = 0}, que claramente es un
subm
odulo de M .
Definimos el anulador de M como An(M ) = {d D | M [d] = M }, es decir,
el conjunto de los elementos de D que anulan a todos los elementos de M . Es
claro que tambien es un ideal de D, y si M es un m
odulo de torsi
on finitamente
generado entonces es no nulo, pues basta tomar un generador finito de M y

5.5. M
odulos finitamente generados sobre DIPs

185

multiplicar un periodo de cada uno de sus miembros para obtener un elemento


no nulo de An(M ).
Si An(M ) = (e) se dice que e es un exponente de M . As, cada Dm
odulo de
torsi
on tiene un exponente no nulo determinado salvo unidades. En el caso de
Z podemos considerar que el exponente de un Z-m
odulo de torsi
on es el u
nico
exponente positivo.
Por ejemplo, el exponente de Z/6Z es 6 y, en general, es claro que un exponente de D/eD es e.
Es claro que el orden de todo elemento de un m
odulo de torsi
on finitamente
generado tiene que dividir a su exponente (que es lo que habamos observado
en el caso de Z/6Z).
Ejemplos Los Z-m
odulos de torsi
on m
as sencillos que podemos considerar
son los m
odulos Z/nZ, pero no son los u
nicos, pues, por ejemplo, Z/2Z Z/2Z
es un Z-m
odulo de torsi
on con cuatro elementos y no es el mismo que (no es
isomorfo a) Z/4Z. Para comprobar que no son isomorfos basta calcular los
ordenes de sus elementos:
m 0 1 2 3
o 1 4 2 4

m (0, 0) (1, 0) (0, 1) (1, 1)


o
1
2
2
2

Si los m
odulos fueran isomorfos, tendran que tener los mismos elementos de los
mismos ordenes.
Similarmente, podramos pensar que Z/6Z y Z/2Z Z/3Z son dos ejemplos
de Z-m
odulos con seis elementos no isomorfos entre s, pero no es cierto. En
este caso s que son isomorfos, como se desprende del teorema siguiente:
Teorema 5.45 Si D es un dominio de ideales principales y a, b D son
elementos no nulos primos entre s, entonces
D/(ab)
= D/(a) D/(b).
n: Sea f : D/(ab) D/(a) D/(b) la aplicaci
Demostracio
on dada por
f ([x]) = [(x], [x]). Claramente es un homomorfismo de m
odulos, y adem
as es
inyectivo, porque si [x] = 0, [x] = 0, esto significa que a | x y b | x y, como son
primos entre s, esto implica que ab | x, luego [x] = 0 (en D/(ab).
Para probar que f es suprayectivo (y, por lo tanto, un isomorfismo) usamos
la relaci
on de Bezout 3.22, que nos da u, v D tales que ua + vb = 1. As, dado
([x], [y]) D/(a) D/(b), una antiimagen por f es [uay + vbx].
Vamos a demostrar que los u
nicos D-m
odulos de torsi
on finitamente generados son, salvo isomorfismo, las sumas directas de m
odulos de tipo D/aD, y
que son todas distintas entre s salvo las que resultan isomorfas en virtud del
teorema anterior.
Por ejemplo, los u
nicos Z-m
odulos con 12 elementos son
Z/4Z Z/3Z,

Z/2Z Z/2Z Z/3Z.

186

Captulo 5. M
odulos y espacios vectoriales

No incluimos Z/12Z porque es isomorfo al primero, ni Z/2Z Z/6Z porque


es isomorfo al segundo. Observemos que el primero tiene exponente 12 y el
segundo 6.
En general, el teorema anterior implica que, a la hora de cubrir todos los
posibles Z-m
odulos de torsi
on s
olo hemos de considerar sumandos de cardinal
potencia de primo, pues si n no es potencia de primo, entonces Z/nZ se descompone en sumandos de tipo Z/(pr ).
Ejemplo Dado el Z-m
odulo de torsi
on
M = Z/6Z Z/18Z Z/10Z Z/25Z Z/15Z,
aplicando el teorema anterior vemos que es isomorfo a
M Z/2Z Z/2Z Z/2Z Z/3Z Z/3Z Z/9Z Z/5Z Z/5Z Z/25Z,
donde simplemente hemos descompuesto el orden de cada sumando en potencias
de primo. A los n
umeros 2, 2, 2, 3, 3, 9, 5, 5, 25 los llamaremos divisores elementales de M , y vamos a demostrar que est
an determinados y determinan a M
salvo isomorfismo, en el sentido de que, por una parte, no es posible obtener otra
descomposici
on de M que de lugar a un juego distinto de divisores elementales
y, por otra parte, dos Z-m
odulos de torsi
on con juegos diferentes de divisores
elementales no pueden ser isomorfos entre s.
Observemos que, en general, un D-m
odulo M es isomorfo a un D/(a) si y
s
olo si M = hxi con o(x) = (a), pues en tal caso la aplicaci
on D M dada
por d 7 dx es un epimorfismo de m
odulos de n
ucleo (a), luego ciertamente
M
= D/(a), y el recproco es inmediato, ya que D/(a) = h[1]i y o([1]) = (a).
El teorema siguiente muestra que a todo D-m
odulo de torsi
on finitamente
generado le podemos asignar unos divisores elementales. Luego probaremos que
son u
nicos:

Teorema 5.46 Sea D un dominio de ideales principales y M un Dm


odulo de
torsi
on no nulo finitamente generado. Entonces M = hm1 i hmr i, donde
cada mi tiene periodo potencia de primo.
n: Observemos en primer lugar que si a, b D son primos
Demostracio
entre s, entonces M [ab] = M [a] M [b].
En efecto, por la relaci
on de Bezout 3.22 podemos expresar ua + vb = 1,
para ciertos u, v D. As, dado m M [ab], tenemos que m = uam + vbm, con
uam M [b] y vbm M [a], luego M [ab] = M [a] + M [b]. Adem
as la suma es
directa, porque si m M [a] M [b], entonces m = uam + ubm = 0.

Ahora tomamos un exponente e de M , lo descomponemos en potencias de


primos no asociados dos a dos, e = pe11 perr (notemos que no hace falta a
nadir
un factor unitario porque podemos eliminarlo y seguimos teniendo un periodo)
y aplicamos lo anterior:
M = M [e] = M [pe11 ] M [perr ].

5.5. M
odulos finitamente generados sobre DIPs

187

Ahora basta probar que cada M [pei i ] se descompone en suma directa de


subm
odulos mon
ogenos con generadores de periodo potencia de primo. Alternativamente, podemos suponer que M = M [pe ] tiene exponente pe , donde p D
es primo. Entonces los periodos de todos los elementos de M son tambien (salvo
unidades) potencias de p.
Sea k = D/(p), que es un cuerpo, y observemos que M [p] tiene estructura de
k-espacio vectorial (de dimensi
on finita) con el producto dado por [d]m = dm
(el punto relevante es que el producto est
a bien definido).
Vamos a probar, por inducci
on sobre dimk M [p], que
M = hm1 i hmr i ,
de modo que cada mi tiene periodo pei con e1 e2 er .

Para ello tomamos m1 M tal que su periodo sea pe1 con el mayor exponente e1 posible. Si M = hm1 i tenemos ya la conclusi
on. En caso contrario
= M/ hm1 i, que ser
consideramos el cociente M
a no nulo. Como todos los ele =M
[pe1 ]. Ahora
mentos de M tienen periodo divisor de pe1 , tenemos que M
probamos un hecho general:
podemos elegir un representante [y] = [y 0 ] de
En toda clase [y] M
0
modo que [y] e y tienen el mismo periodo.
En efecto. Notemos que, en general, el periodo de una clase divide al de
cualquiera de sus representantes. Si el periodo de [y] es ps , entonces ps y hm1 i,
luego ps y = pt cm1 , con (p, c) = 1, para cierto t e1 . Si t = e1 , entonces ps y = 0,
luego el periodo de y es ps .
Si t < e1 , entonces pt cm1 tiene periodo pe1 t , luego y tiene periodo ps+e1 t ,
luego s + e1 t e1 , porque pe1 anula a y, luego s t y concluimos que
y 0 = y pts cm1 cumple [y 0 ] = [y] y que y 0 tiene periodo ps .
[p] < dimk M [p].
A continuaci
on veamos que dimk M
[p]. Por el resultado que
Para ello tomamos una k-base [x1 ], . . . , [xs ] de M
acabamos de obtener, podemos suponer que cada xi tiene periodo p, es decir,
que x1 , . . . , xs M [p] y se cumple que m1 , x1 , . . . , xs M [p] son linealmente
independientes sobre k, pues si
[d]m1 + [d1 ]x1 + + [ds ]xs = 0,
entonces [d1 ][x1 ]+ +[ds ][xs ] = 0, luego [d1 ] = = [ds ] = 0, luego [d]m1 = 0,
luego [d] = 0.
As pues, podemos aplicar la hip
otesis de inducci
on, seg
un la cual
= h[m2 ]i h[mr ]i ,
M
donde cada [mi ] tiene periodo pei con e2 er . Seg
un hemos visto,
podemos exigir que cada mi tenga tambien periodo pei y, como e1 era el mayor
posible, se cumple que e1 e2 . Ahora basta ver que
M = hm1 i hmr i .

188

Captulo 5. M
odulos y espacios vectoriales

En efecto, es claro que M se descompone en suma de estos subm


odulos.
Falta ver que la suma es directa, pero es que si
d1 m1 + + dr mr = 0,
tenemos que [d2 m2 ] + + [dr mr ] = 0, luego, al ser la suma
entonces en M
directa, [d2 m2 ] = = [dr mr ] = 0, luego pei | di (para i 2), luego di mi = 0
(porque el periodo de mi es el mismo que el de [mi ]), luego d1 m1 = 0.
Seg
un la u
ltima observaci
on previa al teorema, ahora tenemos probado que
todo Dm
odulo de torsi
on finitamente generado es isomorfo a una suma directa
de m
odulos de tipo D/aD con a potencia de primo.
Ahora falta probar la unicidad, es decir, que si un mismo m
odulo admite
dos descomposiciones en las condiciones del teorema anterior, aunque los generadores mi puedan ser distintos, el n
umero de sumandos y los ordenes de estos
ser
an los mismos, lo cual nos permitir
a hablar de los divisores elementales del
m
odulo, que no depender
an de la elecci
on de la descomposici
on elegida para
calcularlos.
Hay otro tipo de descomposici
on de un m
odulo de torsi
on que a menudo es
m
as conveniente. La ilustramos primero con un ejemplo:
Ejemplo Consideremos de nuevo el Z-m
odulo de torsi
on de divisores elementales 2, 2, 2, 3, 3, 9, 5, 5, 25, es decir,
M = hm1 i hm2 i hm3 i hm4 i hm5 i hm6 i hm7 i hm8 i hm9 i ,
donde los ordenes de los mi son los indicados (2, 2, 2, 3, . . .). Tomemos los generadores cuyos ordenes son las mayores potencias de cada primo, en este caso
o(m3 ) = 2, o(m6 ) = 9, o(m9 ) = 25, y entonces el teorema 5.45 nos da que
hm3 i hm6 i hm9 i = hm03 i ,
con o(m03 ) = 2 9 25 = 450. De los sumandos restantes, tomamos los que
corresponden a divisores elementales con las mayores potencias de primos, en
este caso o(m2 ) = 2, o(m5 ) = 3, o(m8 ) = 5, y observamos que
hm2 i hm5 i hm8 i = hm02 i ,
con o(m02 ) = 30. Ahora nos quedan o(m1 ) = 2, o(m4 ) = 3, o(m7 ) = 5, con lo
que podemos agrupar hm1 i hm4 i hm7 i = hm01 i, con o(m01 ) = 30. En total
M = hm01 i hm02 i hm03 i ,
donde los tres generadores tienen ordenes 30, 30, 450. Observemos que hemos
empezado a numerar los generadores por el m03 porque el n
umero de generadores
que obtenemos mediante esta agrupaci
on es igual al m
aximo n
umero de divisores
elementales con la misma base.
Estos ordenes, caracterizados por que cada uno divide al siguiente, se llaman
factores invariantes de M , y vamos a ver que sucede lo mismo que con los

5.5. M
odulos finitamente generados sobre DIPs

189

divisores elementales, es decir, que, por una parte, no es posible obtener dos
descomposiciones distintas de M que lleven a dos juegos distintos de factores
invariantes y, por otra parte, que dos m
odulos de torsi
on con factores invariantes
distintos no pueden ser isomorfos.
Teorema 5.47 Sea D un dominio de ideales principales y M un D-m
odulo
finitamente generado.
1. Existen elementos x1 , . . . , xn M tales que Mt = hx1 i hxn i y para
cada i = 1, . . . , n, o(xi ) = (pei i ), donde pi es un primo de D y ei es un
n
umero natural no nulo.
2. Existen elementos y1 , . . . , ym M tales que Mt = hy1 i hym i, y si
o(yi ) = (fi ), entonces para cada i = 1, . . . , m, se cumple que fi no es cero
ni unidad y si i < m, entonces fi | fi+1 .
3. Los n
umeros n y m, los ideales (pei i ) para i = 1, . . . , n y los ideales (fi )
para i = 1, . . . , m est
an determinados por M , es decir, cualquier descomposici
on de M en la forma indicada en 1) o en 2) da lugar a los mismos
n, m, etc. Los elementos pei i se llaman divisores elementales de M , los
elementos fi se llaman factores invariantes de M .
n: Tenemos probado 1), mientras que 2) es una consecuencia
Demostracio
inmediata: Dada una descomposici
on de tipo 1), multiplicamos todos los primos
que aparecen como base de divisores elementales elevados al mayor exponente
posible, con lo que obtenemos el u
ltimo factor invariante fm (donde m es el
mayor n
umero de divisores elementales con la misma base) y el teorema 5.45 nos
da que las sumas de los generadores correspondientes a los divisores elementales
que hemos tomado es un ym de periodo fm . Luego formamos el factor invariante
fm1 repitiendo el proceso con los divisores elementales que quedan, y seguimos
as hasta que se acaben los divisores elementales.
En cuanto a 3), basta probar la unicidad de los factores invariantes, pues es
claro que si existieran dos descomposiciones distintas en divisores elementales,
a partir de ellas podramos obtener dos descomposiciones distintas en factores
invariantes por el procedimiento que acabamos de describir. Descomponemos
la prueba en varios pasos:
a) Sea Mt = hy1 i hym i una descomposici
on tipo 2) y sea p un primo
de D. Llamando Mi = hyi i, es claro que M [p] = M1 [p] Mm [p], y que
esto es cierto tambien si consideramos a todos los m
odulos como D/(p)-espacios
vectoriales.
(
0 si p - fi ,
b) Se cumple que dim Mi [p] =
1 si p | fi .
En efecto, si p - fi , entonces un r Mi [p] es de la forma r = uyi para un
u A y pr = 0, luego puyi = 0 y fi | pu, luego fi | u, y as r = uyi = 0, o sea,
Mi [p] = 0.

190

Captulo 5. M
odulos y espacios vectoriales

Si fi = pv, para un v D, entonces razonando igual que antes concluimos


que fi | pu, luego v | u, digamos u = tv, con lo que r = tvyi , y por lo tanto
Mi [p] = hvyi i (es claro que vyi Mi [p] y que es no nulo).
c) Por lo tanto la dimensi
on de M [p] es igual al n
umero de factores invariantes
divisibles entre p.
d) Si tenemos dos descomposiciones tipo 2), una en m sumandos y otra en
m0 sumandos, tomamos un primo que divida al primer factor invariante de la
primera descomposici
on (y que por lo tanto divide a los m factores invariantes).
La definici
on de M [p] no depende de la descomposici
on de tipo 2) escogida y
su dimensi
on como D/(p)-espacio vectorial es, por una parte, igual al n
umero
de factores invariantes de la primera descomposici
on divisibles entre p (o sea,
= m) y, por otra parte, es el n
umero de factores invariantes de la segunda
descomposici
on divisibles entre p (es decir, m0 ). Esto prueba que m m0 , e
igualmente se prueba m0 m, luego tenemos que dos descomposiciones tipo 2)
han de tener el mismo n
umero de sumandos. As pues, el n
umero de factores
invariantes es invariante.
M
as a
un, hemos probado que todo primo que divide al primer factor invariante de una descomposici
on divide al primer factor invariante de cualquier
otra descomposici
on.
e) En una descomposici
on de tipo 2), el u
ltimo factor invariante fm es
m
ultiplo de todos los anteriores, luego anula a todos los generadores de Mt ,
y por lo tanto a todos los elementos de Mt , luego es un exponente de Mt (en
principio, hemos probado que es un m
ultiplo de cualquier exponente de Mt ,
pero cualquier exponente anula a ym , luego es m
ultiplo de fm y concluimos que
es asociado a fm ). Puesto que Mt determina sus exponentes, concluimos que
dos descomposiciones tipo 2) deben tener igual (salvo unidades) el u
ltimo factor
invariante.
f) Vamos a probar la unicidad de los factores invariantes por inducci
on sobre
el n
umero de factores primos en que se descompone el u
ltimo factor invariante
de M (que ya sabemos que es invariante).
Sean dos descomposiciones tipo 2:
Mt = hy1 i hym i

Mt = hz1 i hzm i ,

la primera con factores invariantes f1 , . . . , fm y la segunda con factores invariantes g1 , . . . , gm . Ya sabemos que (fm ) = (gm ).
Si fm se descompone en un solo primo, entonces fm es primo, y como los
restantes factores invariantes son divisores suyos, son todos salvo unidades ese
mismo primo, es decir, todos los fi y los gi son iguales, luego tenemos la unicidad.
Supongamos que la unicidad se cumple para m
odulos cuyo u
ltimo factor
invariante se descomponga en n factores primos y que fm se descompone en
n + 1 primos. En d) hemos probado que f1 y g1 son divisibles entre los mismos
primos. Sea p un primo que divida a ambos (luego divide a todos los fi y a
todos los gi ).

5.5. M
odulos finitamente generados sobre DIPs

191

Sea pMt = {pr | r Mt }. Es claro que pMt es un subm


odulo de Mt y
adem
as
pMt = hpy1 i hpym i = hpz1 i hpzm i .
Tambien es obvio que o(pyi ) = (fi /p) y o(pzi ) = (gi /p).
Puede ocurrir que los primeros fi sean iguales a p, con lo que los primeros sumandos de estas descomposiciones seran nulos. Si en ambas descomposiciones
eliminamos los primeros sumandos si son nulos, obtenemos dos descomposiciones tipo 2) del m
odulo pMt , donde el u
ltimo factor invariante es fm /p, luego
podemos aplicar la hip
otesis de inducci
on y concluir que el n
umero de sumandos nulos el igual para las dos descomposiciones, y que las restantes tienen los
mismos factores invariantes (salvo unidades), es decir, el n
umero de fi s iguales
a p es el mismo que el de gi s, y para los restantes, (fi /p) = (gi /p). Esto implica
la igualdad de los (fi )s y los (gi )s.
En resumen, tenemos la clasificaci
on siguiente de los m
odulos finitamente
generados sobre un dominio de ideales principales:
Teorema 5.48 Sea D un DIP y M , N dos D-m
odulos finitamente generados.
Entonces M
olo si M y N tienen el mismo rango y los mismos
= N si y s
factores invariantes (o el mismo rango y los mismos divisores elementales).
n: Una implicaci
Demostracio
on es obvia. Supongamos que M y N tienen el mismo rango y los mismos factores invariantes o divisores elementales.
Entonces existen descomposiciones
M = M 0 hx1 i hxm i

N = N 0 hy1 i hym i ,

donde M 0 y N 0 son m
odulos libres del mismo rango y o(xi ) = o(yi ) para cada
i = 1, . . . , m.
Pero ya hemos observado que hxi i
= D/o(xi ) = D/o(yi )
= hyi i, y por otra
parte M 0
odulos libres del mismo rango. A partir de
= N 0 porque son dos m
un isomorfismo entre cada sumando directo podemos construir un isomorfismo
entre las dos sumas, es decir, M
= N.
Nota Es inmediato (y ya lo hemos usado en la demostraci
on precedente) que
el u
ltimo factor invariante de un m
odulo de torsi
on finitamente generado sobre
un DIP es precisamente el exponente del m
odulo. Esto es un hecho no trivial
que resulta u
til en algunas ocasiones: el exponente de un m
odulo de torsi
on
finitamente generado (que en principio es el mnimo com
un m
ultiplo de los
ordenes de sus elementos) es siempre el orden de uno de sus elementos.
Terminamos esta secci
on con una consecuencia que necesitaremos m
as adelante:

192

Captulo 5. M
odulos y espacios vectoriales

Teorema 5.49 Sea D un DIP, sea L un D-m


odulo libre de rango finito6 y sea
M un subm
odulo de L no nulo y finitamente generado. Entonces existe una
base B de L, existen existen elementos e1 , . . . , em B y f1 , . . . , fm D tales
que f1 e1 , . . . , fm em forman una base de M y para cada i < m se cumple que
fi | fi+1 . Adem
as, los ideales (fi ) est
an unvocamente determinados por L y M .
n: Vamos a probar la existencia por inducci
Demostracio
on sobre el rango
de M . Observemos que si B = {x1 , . . . , xn } es una base de L, las aplicaciones
i
B
: L D que a cada x L le asignan respectivamente su coordenada
i-esima en la base B son homomorfismos de m
odulos y, como M 6= 0, no pueden
ser todos nulos.
En general, para cada homomorfismo h : L D, tenemos que h[M ] es un
ideal de D y, como D es noetheriano, toda familia no vaca de ideales tiene un
elemento maximal, es decir, podemos encontrar un homomorfismo h1 tal que el
ideal h1 [M ] = (f1 ) no este contenido estrictamente en ning
un otro ideal de esta
i
forma. En particular f1 6= 0, pues los B
[M ] no son todos nulos.
Sea y1 M tal que h1 (y1 ) = f1 . Entonces, si h : L D es cualquier
homomorfismo, se tiene que cumplir que h(y1 ) (a1 ), pues en caso contrario
(f1 ) h[M ]. En particular, esto implica que si B es cualquier base de L, las
coordenadas de todo x M en la base B tienen que ser divisibles entre f1 ,
luego todo elemento de M es divisible entre f1 . En particular y1 = f1 e1 , para
cierto e1 L.
Veamos ahora que L = he1 i N(h1 ). En efecto, tenemos que h1 (e1 ) = 1,
luego todo x L se descompone como x = h1 (x)e1 + (x h1 (x)e1 ) y el segundo
sumando est
a en el n
ucleo N(h1 ). Adem
as la suma es directa, porque si tomamos
de1 he1 i N(h1 ) al aplicar h1 sale d = 0, luego de1 = 0.
Si M = hf1 e1 i ya se cumplen las condiciones del enunciado. En caso contrario consideramos L1 = N(h1 ) y M1 = M L1 , y es claro entonces que
M = hx1 iM1 . Por lo tanto, M1 6= 0 es libre de rango una unidad menos que M .
Por hip
otesis de inducci
on existe una base B1 de L1 , existen e2 , . . . , em B1 y
existen f2 , . . . , fm D tales que f2 e2 , . . . , fm em son una base de M1 y fi | fi+1 .
Es claro entonces que B = {e1 } B1 es una base de L y que f1 e1 , . . . , fm em
es una base de M . Adem
as sabemos que las coordenadas de f2 e2 en la base B
(que son f2 y ceros) son divisibles entre f1 , luego f1 | f2 .
Veamos ahora la unicidad de los (fi ). Notemos que, a diferencia de lo que
sucede en el teorema 5.47, los fi pueden ser unidades de D (y entonces podemos
tomarlos iguales a 1). Pongamos que f1 = = fr = 1, que fr+1 , . . . , fm no
son unidades y que B = {e1 , . . . , en }, con m n. Entonces
L = he1 , . . . , en i ,

M = hf1 e1 , . . . , fm em i ,

6 Si el rango de L no es finito podemos tomar un subconjunto finito de una base de L


que permita expresar como combinaciones lineales a todos los generadores de M , y podemos
sustituir L por el subm
odulo generado por dicho conjunto finito, que ser
a un D-m
odulo libre
de rango finito, por lo que el teorema vale igualmente, pero en este paso se usa AE.

5.6. Apendice: Espacios vectoriales de dimensi


on infinita

193

de donde se sigue que


L/M
= (her+1 i / hfr+1 er+1 i) (hem i / hfm em i) hem+1 i hen i .
El u
ltimo bloque de sumandos forma un Dm
odulo libre de rango n m, mientras que los primeros forman el m
odulo de torsi
on del cociente, y como es
claro que o(
ei ) = (fi ), resulta que los factores invariantes de L/M son precisamente fr+1 , . . . , fm . As pues, tenemos que m es el rango de M , luego
est
a unvocamente determinado, los fi no unitarios son los factores invariantes
de L/M , luego los ideales que generan est
an unvocamente determinados, y el
n
umero de fi s unitarios es exactamente m menos el n
umero de fi s no unitarios,
luego todos los (fi ) est
an unvocamente determinados.

5.6

Ap
endice: Espacios vectoriales de dimensi
on
infinita

Recogemos aqu las pruebas de existencia y equicardinalidad de bases para


espacios vectoriales no finitamente generados. Todas ellas usan de forma esencial
el axioma de elecci
on. En primer lugar probamos la existencia de bases:
Teorema 5.50 (AE) Si V es un Despacio vectorial, entonces V es libre. M
as
a
un, todo subconjunto libre de V est
a contenido en una base.
n: La familia de los subconjuntos libres de V que contienen a
Demostracio
uno dado (y siempre podemos tomar como conjunto libre dado el conjunto vaco)
est
a parcialmente ordenada por la inclusi
on y cumple claramente las hip
otesis
del lema de Zorn. Por lo tanto todo subconjunto libre de un espacio vectorial
est
a contenido en uno maximal para la inclusi
on.
En realidad, la prueba vale hasta aqu para m
odulos cualesquiera, pero ahora
observamos que todo subconjunto libre X de un D-espacio vectorial maximal
para la inclusi
on es generador y, por lo tanto, base. En efecto, si no es generador, existe un v V que no es combinaci
on lineal de elementos de X, y por
la observaci
on previa al teorema anterior concluimos que X {v} es libre y
contradice la maximalidad de X.
El hecho de que todo generador contiene una base tambien es cierto en
general:
Teorema 5.51 (AE) Si V es un Despacio vectorial, todo generador de V
contiene una base.
n: Sea X un generador de V . El lema de Zorn nos garantiza
Demostracio
la existencia de un conjunto libre B X maximal respecto a la inclusi
on (es
decir, tal que no est
a estrictamente contenido en ning
un otro subconjunto libre
de X). Se cumple que X hBi, pues si existiera un elemento x X \ hBi,
entonces tenemos que B {x} es libre y est
a contenido en X, en contradicci
on
con la maximalidad de B.

194

Captulo 5. M
odulos y espacios vectoriales

Por lo tanto V = hXi hBi, es decir, V = hBi, y as el conjunto B es una


base de V contenida en X.
Ahora podemos demostrar que todas las bases de un espacio vectorial tienen
el mismo cardinal:
Teorema 5.52 (AE) Si X e Y son dos bases de un mismo D-espacio vectorial,
entonces existe una biyecci
on X Y .
n: Sea V un espacio vectorial con bases X e Y . Como ya
Demostracio
hemos probado el teorema 5.22, podemos suponer que V no es finitamente
generado, con lo que las dos bases son infinitas.
Cada x X puede expresarseScomo combinaci
on lineal de un conjunto
finito Yx Y . Si llamamos Y0 =
Yx , tenemos que todo elemento de X es
xX

combinaci
on lineal de elementos de Y0 , luego X hY0 i, luego V = hXi hY0 i.
Esto implica que Y = Y0 , pues un elemento de Y \ Y0 podra expresarse como
combinaci
on lineal de elementos de Y0 , y entonces Y no sera libre.
Fijando una enumeraci
on de cada conjunto Yx , podemos definir una aplicaci
on inyectiva Y X N (a cada y Y le asignamos un par (x, i), donde
y es el i-esimo elemento de Yx ). El teorema B.11 nos da entonces una aplicaci
on inyectiva Y X. Similarmente obtenemos una aplicaci
on inyectiva
X Y , luego el teorema de Cantor-Bernstein implica que existe la biyecci
on
del enunciado.
Admitiendo, tal y como indicamos en el apendice B, que es posible definir el cardinal de un conjunto arbitrario de modo que dos conjuntos tienen el
mismo cardinal si y s
olo si son biyectables, ahora es claro que la definici
on de
la dimensi
on 5.24 es v
alida para todo espacio vectorial, si bien nosotros s
olo la
usaremos en el caso de espacios de dimensi
on finita.
Igualmente, el lector familiarizado con la teora de cardinales infinitos concluir
a ahora que la prueba del teorema 5.25 es v
alida para m
odulos no necesariamente finitamente generados, por lo que la definici
on del rango 5.26 libre
vale para todo m
odulo libre sobre un anillo conmutativo y unitario.

Captulo VI

Grupos
La estructura de grupo, que vamos a estudiar aqu, es la m
as simple de todas las que hemos estudiado hasta ahora y en parte por esa misma raz
on
una de las que aparecen con frecuencia en los contextos m
as diversos, y que
contribuye en mayor medida a unificar situaciones aparentemente muy alejadas
entre s a traves de un mismo patr
on te
orico. Los problemas que pueden abordarse mediante el estudio de ciertos grupos varan entre estudiar la posibilidad
de dibujar una figura con regla y comp
as hasta estudiar si ciertos anillos tienen
factorizaci
on u
nica, pasando por muchos otros contextos aritmeticos, algebraicos, geometricos, topol
ogicos, etc.

6.1

Conceptos b
asicos

Definici
on 6.1 Un grupo es un par ordenado (G, ), donde G es un conjunto
y : G G G es una ley de composici
on interna en G que sea asociativa,
tenga elemento neutro y todo elemento de G tenga un opuesto. Si adem
as es
conmutativa se dice que (G, ) es un grupo abeliano. En la pr
actica escribiremos
G en lugar de (G, ).
Tal y como explicamos en la secci
on 2.1 al tratar el concepto de semigrupo,
el elemento neutro de un grupo G es u
nico, y tambien lo es el opuesto de cada
elemento de G.
Habitualmente usaremos la notaci
on multiplicativa, en la cual la operaci
on
del grupo se representa por , el elemento neutro se representa por 1 (de modo
que g 1 = 1 g = g para todo g G) y el opuesto de un g G se representa por
g 1 (de modo que gg 1 = g 1 g = 1) y se llama habitualmente inverso de g.
No obstante, para grupos abelianos usaremos tambien la notaci
on aditiva,
en la cual la operaci
on del grupo se representa por +, el elemento neutro se
representa por 0 (de modo que g + 0 = 0 + g = g para todo g G) y el opuesto
de un g G se representa por g (de modo que g g = g + g = 0 para todo
g G) y se llama habitualmente simetrico de g.
195

196

Captulo 6. Grupos

Una relaci
on b
asica al operar en un grupo es que (g1 g2 )1 = g21 g11 (donde
el cambio de orden es crucial si los elementos no conmutan), lo cual se justifica
sin m
as que comprobar que g1 g2 g21 g11 = 1.
En la secci
on 2.1 vimos que en todo semigrupo con elemento neutro est
an
definidas las potencias g n para n N. En el caso de un grupo podemos definir,
de hecho, g n para todo n Z estableciendo que g n = (g 1 )n cuando n < 0.
Comprobaciones rutinarias muestran que se cumplen las propiedades:
g m+n = g m g n ,

(g m )n = g mn ,

(g1 g2 )m = g1m g2m

si g1 g2 = g2 g1 .

Con notaci
on aditiva (para grupos abelianos) estas propiedades se expresan
as:
(m + n)g = mg + ng,

n(mg) = (nm)g,

m(g1 + g2 ) = mg1 + mg2 .

Esto significa que si (G, +) es un grupo abeliano, el producto Z G G


que acabamos de definir hace que (G, +, ) sea un Z-m
odulo. Recprocamente,
si (G, +, ) es cualquier Z-m
odulo, entonces (G, +) es un grupo abeliano y el
producto es precisamente el que acabamos de definir.
Como consecuencia, vemos que los grupos abelianos se corresponden biunvocamente con los Z-m
odulos, en el sentido de que cada grupo abeliano admite una
u
nica estructura de Z-m
odulo (con la suma dada por la operaci
on del grupo) y
cada Z-m
odulo es un grupo abeliano con su suma.
En definitiva, un grupo abeliano es esencialmente lo mismo que un Z-m
odulo,
por lo que el autentico aporte de la teora de grupos frente a la teora de m
odulos
aparece al tratar con grupos no abelianos.
Antes de adentrarnos en el estudio de los grupos conviene se
nalar algunos
ejemplos de grupos que ya nos hemos encontrado:
Los Z-m
odulos son los grupos abelianos.
Si A es un anillo unitario, el conjunto U (A) de las unidades de A es un
grupo con la restricci
on del producto de A, por lo que es habitual referirse
a el como el grupo de las unidades de A.
En particular, si D es un anillo de divisi
on (o un cuerpo), su grupo de
unidades es D = {d D | d 6= 0} y se llama grupo multiplicativo de D.
Si A es un anillo unitario, el conjunto LG(n, A) de las matrices regulares
n n con coeficientes en A es un grupo con el producto de matrices, que
se conoce como el grupo lineal general de dimensi
on n en A.
Si A es un anillo, el conjunto Aut A de los automorfismos de A (isomorfismos de A en s mismo) es un grupo con la composici
on de aplicaciones.
Igualmente, si M es un D-m
odulo, el conjunto AutD (M ) de los automorfismos de M es un grupo con la composici
on de aplicaciones.

6.1. Conceptos b
asicos

197

M
as en general, el conjunto de aplicaciones biyectivas f : X X tales que
tanto f como f 1 conservan una estructura en X es habitualmente un grupo
con la composici
on de aplicaciones. Esto incluye a los homeomorfismos de un
espacio topol
ogico en s mismo, a las biyecciones afines de un espacio afn en s
mismo, a las isometras de un espacio metrico en s mismo, etc.
Homomorfismos Los conceptos b
asicos de la teora de grupos son variantes
de los que ya hemos visto para m
odulos. Empezamos por el de homomorfismo:
Definici
on 6.2 Una aplicaci
on f : G H entre dos grupos G y H es un
homomorfismo de grupos si cumple f (uv) = f (u)f (v) para todo u, v G.
La aplicaci
on f es un monomorfismo, epimorfismo o isomorfismo de grupos si
adem
as es inyectiva, suprayectiva o biyectiva, respectivamente. Un isomorfismo
de un grupo G en s mismo es un automorfismo de G. Llamaremos Aut G al
conjunto de todos los automorfismos de un grupo G.
Es f
acil ver que la composici
on de homomorfismos de grupos es un homomorfismo y que la inversa de un isomorfismo de grupos es tambien un isomorfismo.
En particular, resulta que Aut G es un grupo con la composici
on de aplicaciones.
Diremos que dos grupos G y H son isomorfos si existe un isomorfismo entre
ellos, y lo representaremos por G
= H. En tal caso G y H tienen las mismas
propiedades definibles a partir de la estructura de grupo.
Notemos que, en un grupo G, el elemento neutro es el u
nico g G que cumple
gg = g. Como consecuencia, si f : G H es un homomorfismo de grupos, se
cumple f (g)f (g) = f (g), luego f (1) = 1. Adem
as, como f (g)f (g 1 ) = f (1) = 1,
1
1
tambien se cumple que f (g ) = f (g) .
Subgrupos Pasamos ahora al concepto de subgrupo, an
alogo al de subm
odulo:
Definici
on 6.3 Si G es un grupo, un subgrupo de G es un grupo H G tal
que el producto de dos elementos de H sea el mismo calculado en H o en G. Lo
representaremos por H G.
Notemos que si H G entonces el elemento neutro de H es el mismo que el
de G, pues es el u
nico elemento de H o de G que cumple hh = h. Igualmente,
el inverso de un h H es el mismo en H o en G, pues el inverso en h cumple
tambien las condiciones para ser su inverso en G, y este es u
nico.
Por lo tanto, si H G entonces H es un subconjunto de G tal que el
producto de dos elementos de H est
a en H, el neutro de G est
a en H y el
inverso de cada elemento de H est
a en H. Recprocamente, todo subconjunto
de H que cumpla estas condiciones puede dotarse de forma u
nica de estructura
de grupo de modo que sea un subgrupo de G (estableciendo que el producto de
dos elementos de H sea su producto en G). En la pr
actica conviene resumir
estas condiciones en una sola:

198

Captulo 6. Grupos

Teorema 6.4 Sea G un grupo y H un subconjunto no vaco de G. Entonces


H es un subgrupo de G (con la restricci
on del producto de G) si y s
olo si para
todos los elementos h1 , h2 H se cumple h1 h1

H.
2
n: Obviamente un subgrupo debe cumplir esta condici
Demostracio
on. Si
H la cumple, por ser no vaco existe h H, luego 1 = hh1 H. Adem
as, si
h H, entonces h1 = 1 h1 H, y si h1 , h2 H, tenemos que h1 , h1
2 H,
1
luego h1 h2 = h1 (h1
)

H.
Esto
prueba
que
H

G.
2
Todo grupo G tiene como subgrupos el propio G y el subgrupo 1 = {1},
llamado subgrupo trivial. Los grupos 1 y G se llaman subgrupos impropios de G.
Cualquier otro subgrupo es un subgrupo propio.
Si f : G H es un homomorfismo de grupos, G1 G y H1 H, es f
acil
ver que f [G1 ] H y que f 1 [H1 ] G. En particular se define el n
ucleo de f
como el subgrupo N(f ) = f 1 [1] = {g G | f (g) = 1} G y la imagen de f
como el subgrupo Im f = f [G] H.
Al igual que sucede con los homomorfismos de anillos y de m
odulos, un
homomorfismo de grupos es inyectivo si y s
olo si su n
ucleo es trivial.
A la hora de definir los grupos cociente nos encontramos con una dificultad, y
es que en grupos no abelianos podemos definir la relaci
on de congruencia de dos
formas distintas. Por ello la definici
on de los grupos cociente requiere algunos
conceptos adicionales que veremos despues. De momento nos limitaremos a
definir las congruencias y probaremos algunos resultados elementales en torno
a ellas, necesarios en el estudio de los subgrupos en general.
Definici
on 6.5 Sea G un grupo y H G. Diremos que u, v G son congruentes por la izquierda m
odulo H (y lo representaremos u i v (mod H)) si
cumplen u1 v H.
Diremos que u y v son congruentes por la derecha m
odulo H (y lo representaremos u d v (mod H)) si cumplen uv 1 H.
Es muy f
acil comprobar que ambas relaciones son de equivalencia y que la
clase de equivalencia de un elemento a G para la congruencia por la izquierda
es el conjunto aH = {ah | h H}, mientras que la clase de equivalencia de a
para la congruencia por la derecha es Ha = {ha | h H}.
Llamaremos (G/H)i y (G/H)d a los conjuntos cociente para las relaciones
de congruencia m
odulo H por la izquierda y por la derecha, respectivamente.
En general se cumple que todas las clases de congruencia m
odulo H tienen
tantos elementos como H, pues la aplicaci
on que a cada h H le asigna el
elemento ah aH biyecta H con aH (e igualmente por la derecha).
As pues, si G es finito, los dos conjuntos cociente (G/H)i y (G/H)d tienen
cardinal igual a |G|/|H|. A este cardinal lo llamaremos ndice del subgrupo H
en el grupo G, y lo representaremos por |G : H|.
Por otra parte, es costumbre llamar orden de un grupo a su n
umero de
elementos, es decir, a su cardinal.

6.1. Conceptos b
asicos

199

Tenemos demostrado el teorema siguiente:


Teorema 6.6 (Teorema de Lagrange) Sea G un grupo finito1 y H G.
Entonces |G| = |G : H| |H|. En particular el orden de todo subgrupo de G es
un divisor del orden de G.
Generadores, grupos cclicos Es inmediato que la intersecci
on de toda
familia de subgrupos de un grupo dado es de nuevo un subgrupo, lo cual nos
permite definir el subgrupo generado por un conjunto:
Definici
on 6.7 Sea G un grupo y X G. Llamaremos subgrupo generado
por X a la intersecci
on de todos los subgrupos de G que contienen a X. Lo
representaremos mediante hXi.
Si G = hXi diremos que el conjunto X es un generador de G. Un grupo que
admite un generador con un solo elemento es un grupo cclico.
Los elementos del subm
odulo generado por un conjunto de generadores son
las combinaciones lineales de los generadores. En el caso de los grupos la situaci
on es m
as complicada debido a que no podemos contar con la propiedad
conmutativa:
Teorema 6.8 Sea G un grupo, X un subconjunto de G, X 1 = {x1 | x X}
y g un elemento de G. Entonces:
1. hXi = {x1 xn | n N, x1 , . . . , xn X X 1 }.
2. Si G es finito hXi = {x1 xn | x1 , . . . , xn X}.
3. hgi = {g n | n Z}.

4. Si hgi = m, entonces hgi = {1, g, . . . , g m1 } y g n = 1 si y s
olo si m | n.

n: 1) Sea H = {x1 xn | n N, x1 , . . . , xn X X 1 }.
Demostracio
Tenemos que hXi es un grupo que contiene a los elementos de X, luego tambien
a sus inversos y a los productos que pueden formarse entre ellos. Por lo tanto
H hXi. Es f
acil ver que H es un subgrupo de G y obviamente contiene a X,
luego hXi H.

2) Basta ver que si G es finito y x G, entonces x1 = xm para cierto


n
umero natural m. As un elemento de X 1 puede ser sustituido por varios
factores (iguales) de X.
Esto es cierto porque las potencias x, x2 , x3 , . . . no pueden ser todas distintas
(ya que s
olo pueden tomar un n
umero finito de valores), por lo que existen dos
n
umeros naturales m < n tales que xm = xn .
Entonces xnm = 1 con n m > 0, luego x1 = xnm1 , con n m 1 0.
3) Es consecuencia inmediata de 1).
1 El lector familiarizado con la teor
a de cardinales infinitos observar
a que la demostraci
on
que hemos dado vale igualmente si el grupo G es infinito.

200

Captulo 6. Grupos

4) En la prueba de 2) hemos visto que existe un n


umero natural n 6= 0
tal que g n = 1. Tomemos el menor natural n que cumple esto. Entonces los
elementos 1, g, g 2 , . . . g n1 son todos distintos, pues si dos de ellos coincidieran,
g i = g j con i < j, entonces tendramos g ji = 1 con 0 < j i < n, en contra
de la elecci
on de n. A partir de n las potencias de g se repiten, pues si k Z y
k = nc + r, con 0 r < n, entonces g k = (g n )c g r = g r . En particular g k = 1 si
y s
olo si n | k.
As pues, hgi = {1, g, g 2 , . . . , g n1 }, por lo que n es el orden de hgi, o sea,
n = m.
El teorema anterior nos proporciona mucha informaci
on sobre los grupos
cclicos. Un hecho obvio es que todo grupo cclico es abeliano, pues dos elementos
de un grupo cclico son de la forma g i y g j , para ciertos n
umeros enteros i y j,
luego su producto en cualquier orden es g i+j = g j+i .
As pues, si G = hgi es un grupo cclico, podemos considerarlo como un Zm
odulo, y la aplicaci
on f : Z hgi dada por f (n) = g n es un epimorfismo de
Z-m
odulos (notemos que en G estamos usando notaci
on multiplicativa, lo cual
no es habitual cuando hablamos de Z-m
odulos en general). Ahora observamos
que el n
ucleo N(f ) es un Z-subm
odulo de Z, es decir, un ideal, luego N(f ) = (n),
para cierto n
umero natural n. Si n = 0 entonces f es un isomorfismo, y tenemos
que G
odulos, luego tambien como grupos abelianos. En otro caso
= Z como Z-m
el teorema de isomorfa nos da que G
= Z/nZ. As pues, tenemos clasificados
todos los grupos cclicos salvo isomorfismo:
Teorema 6.9 Sea G = hgi un grupo cclico.
1. Si G es infinito, entonces G
= Z y cada elemento de G se expresa de
forma u
nica como g m , con m Z.
2. Si |G| = n, entonces G
= Z/nZ, y G = {1, g, . . . , g n1 }, de modo que
g i = g j si y s
olo si i j (mod n). En particular, g i = 1 si y s
olo si n | i.
Conviene introducir el concepto siguiente:

Definici
on 6.10 Sea G un grupo y g G. Se llama orden de g a o(g) = hgi.

As, si o(g) es infinito tenemos que hgi


= Z y estamos en el primer caso del
teorema anterior, mientras que si o(g) = n, entonces n es el menor natural no
nulo que hace que g n = 1, y estamos en el segundo caso del teorema anterior.
Notemos que este concepto de orden es un caso particular del definido en 5.44
para m
odulos finitamente generados sobre un DIP.
En el contexto de la teora de grupos es costumbre llamar Cn = Z/nZ, de
modo que decir que un grupo G es cclico de orden n es equivalente a decir que
G
= Cn .

6.1. Conceptos b
asicos

201

Ejemplo Consideremos el grupo multiplicativo U13 del cuerpo Z/13Z, que es


un grupo abeliano de orden 12. La tabla siguiente muestra los ordenes de sus
elementos:
1 2 3 4 5 6 7 8 9 10 11 12
o 1 12 3 6 4 12 12 4 3 6 12 2
Por ejemplo, la tabla siguiente muestra la comprobaci
on de que o(2) = 12:
n
2n

0 1 2 3 4 5 6 7 8 9 10 11
1 2 4 8 3 6 12 11 9 5 10 7

vemos que las potencias de 2 no se repiten hasta 212 = 7 2 = 14 = 1, luego 12


es el menor exponente no nulo que cumple 2n = 1.
Si interpretamos la primera fila de la tabla anterior como los elementos
de Z/12Z, entonces la tabla muestra el isomorfismo Z/12Z U13 dado por
n 7 2n . Las propiedades de los elementos de U13 se comprenden mejor a traves
de este isomorfismo. Por ejemplo, a priori no podamos saber que 3 iba a tener
orden orden 3 en U13 , pero si sabemos que 3 = 24 , entonces es obvio, pues si 12
es el menor natural que cumple 2n = 1, entonces el menor natural que cumple
(24 )m = 1 es m = 3. El apartado 2) de 6.12 nos da la f
ormula general para el
orden de una potencia g m en funci
on del orden de g.
Es f
acil ver que
h3i = {1, 3, 9},

h4i = {1, 3, 4, 10, 9, 12},

h5i = {1, 5, 8, 12},

h12i = {1, 12},

y estos son todos los subgrupos cclicos propios de U13 pues, los elementos de
orden 12 generan todo U13 , 1 genera el subgrupo trivial y los dem
as generan
alguno de los tres subgrupos anteriores. Por ejemplo, h9i = h3i. El teorema
siguiente implica que son todos los subgrupos propios de U13 , de modo que en
total tiene 6 subgrupos, de ordenes 1, 2, 3, 4, 6, 12, respectivamente. Vemos que
hay uno para cada orden posible divisor de 12. Esto no es casual.
Teorema 6.11 Todo subgrupo de un grupo cclico es cclico.
n: Sea G = hgi un grupo cclico. Hemos visto que la apliDemostracio
caci
on f : Z G dada por f (n) = g n es un epimorfismo de grupos. Si
H G, entonces f 1 [H] Z, pero los subgrupos de Z coinciden con los ideales
(son sus Z-subm
odulos), luego existe un m Z tal que f 1 [H] = mZ, luego
mn
H = {g
| n Z} = hg m i.

El teorema siguiente recoge los hechos b


asicos sobre los grupos cclicos finitos:

Teorema 6.12 Sea G = hgi un grupo cclico de orden n.



1. Si m es un n
umero entero, g m = g d , donde d = (m, n).
2. En general o(g m ) = n/(m, n).

3. Si m | n, el grupo G tiene un u
nico subgrupo de orden m.

202

Captulo 6. Grupos

r

n: 1) Sea m = rd. Entonces g m = g d g d , luego
Demostraci
o

hg m i g d . Por otra parte, la relaci


on de Bezout nos da enteros a y b tales
que d = am + bn.

a
d
a
a
As, g d = (g m ) (g n ) = (g m ) 1 = (g m ) hg m i, luego g d hg m i.
2) Por el apartado anterior, basta probar que si d | n, entonces o(g d ) = n/d,
pero es obvio que (g d )n/d = g n = 1 y n/d es el menor natural que cumple esto,
ya que si (g d )m = 1, entonces n | dm, luego n/d | m, luego n/d m.

3) De 2) se deduce que si m | n, entonces G tiene


de orden
un
subgrupo
0
m. Si G tiene dos subgrupos de orden m, digamos g r y g r , entonces se
r
r0
0
cumple
r que
o(g )r0 = o(g ) = m, luego por 2) (r, n) = (r , n) = d, y por 1)
d
g = g = g .
Ejercicio: Probar que todo grupo de orden primo es cclico.

Al calcular los ordenes de los elementos de U13 hemos visto que haba varios
elementos de orden 12, pero en principio no tendra por que haber sido as. Hay
grupos abelianos de orden 12 que no tienen elementos de orden 12, como es el
caso de Z/2Z Z/6Z. Sin embargo, el hecho de que U13 sea cclico no es casual,
sino que es consecuencia del teorema siguiente, el cual se basa a su vez en el
teorema de estructura de los m
odulos finitamente generados sobre un DIP que
demostramos en el captulo anterior:
Teorema 6.13 Todo subgrupo finito del grupo de unidades de un dominio ntegro es cclico.
n: Sea D un dominio ntegro y sea K su cuerpo de cocientes.
Demostracio
Entonces D K , luego basta probar que todo subgrupo finito del grupo
multiplicativo de un cuerpo es cclico. Sea, pues, G K finito. Entonces G es
un Z-m
odulo finitamente generado de torsi
on (por ser finito). Ahora tenemos en
cuenta la nota tras el teorema 5.48, seg
un la cual el exponente m de G coincide
con el u
ltimo factor invariante y es, por lo tanto, el orden de un elemento de
G. Consideramos ahora el polinomio xm 1 K[x]. El hecho de que m sea el
exponente de G se traduce en que todos los elementos de G son races de este
polinomio, pero el n
umero de races de un polinomio en un cuerpo no puede
exceder a su grado, luego |G| m. Como G tiene un elemento de orden m,
tiene que ser |G| = m, y G es cclico.
As pues, como Z/pZ es un cuerpo, su grupo multiplicativo Up es un grupo
cclico de orden p 1.

El grupo cuaternio Veamos un ejemplo de grupo finito no abeliano. Consideremos el cuerpo k = Z/3Z = {0, 1, 1} y el grupo LG(2, k) de las matrices
regulares 2 2 con coeficientes en k. Seleccionamos las dos matrices siguientes:

1
1
1 1
i=
, j=
,
1 1
1 1

6.1. Conceptos b
asicos

203

y vamos a estudiar el grupo Q8 = hi, ji. Se trata de un grupo finito, pues


obviamente LG(2, k) es un grupo finito. En primer lugar tenemos que comprobar
que las dos matrices i, j son realmente regulares, pero esto se ve al calcular sus
potencias:

1
0
1 1
1 0
i2 =
, i3 =
, i4 =
,
0 1
1
1
0 1
2

j =

1
0
0 1

j =

1 1
1 1

j =

1 0
0 1

Esto prueba que i, j tienen por inversas respectivas a i3 , j 3 . Todas las matrices
que hemos calculado son elementos de Q8 . Vamos a darles nombres descriptivos.
La matriz identidad es el elemento neutro de Q8 , por lo que la llamaremos

1 0
1=
.
0 1
A la matriz i2 , que es la identidad cambiada de signo, la llamaremos 1, de
modo que i2 = j 2 = 1 y (1)2 = 1. Como i3 y j 3 resultan de cambiar el
signo a i, j, respectivamente, llamaremos a estas matrices i y j, con lo que
se cumple que i3 = i, j 3 = j. Notemos que i = (1)i, donde aqu 1 es la
matriz i2 = j 2 .
Con esto tenemos ya seis elementos distintos en Q8 , a saber, las matrices
1, i, j. No son las u
nicas, pues tambien est
an

0 1
0 1
k = ij =
, ji =
= (1)k = k.
1
0
1 0
(La u
ltima igualdad es una definici
on, es decir, llamamos k a la matriz (1)k.)
Se cumple que Q8 = {1, i, j, k}. En efecto, basta tener en cuenta que
(1)i = i = i(1),

(1)j = j = j(1),

ji = ij.

En principio, todo elemento de Q8 se expresa como productos de is y js,


pero las relaciones anteriores permiten pasar todas las is a la izquierda y todas
las js a la derecha, con lo que llegamos a que todo elemento de Q8 es de la
forma im j n , y a su vez m y n pueden reducirse a 1 o 3, lo que s
olo nos deja
8 opciones posibles. As pues, por una parte Q8 tiene a lo sumo 8 elementos y,
por otra parte, hemos encontrado 8 elementos distintos en el, luego no hay m
as.
El algebra del grupo cuaternio se recuerda f
acilmente si tenemos en cuenta
que
i2 = j 2 = k2 = 1,
(1)2 = 1,
(1)i = i(1) = i,

(1)j = j(1) = j,

(1)k = k(1) = k,

y que al multiplicar dos de los tres elementos i, j, k se obtiene el tercero si el


producto se hace en el sentido que indican las flechas:

204

Captulo 6. Grupos

j
i

k
y el tercero cambiado de signo si se hace en sentido contrario, es decir:
ij = k,

jk = i,

ki = j,

ji = k,

kj = i,

ik = j.

Vemos, pues, que Q8 es un grupo no abeliano que tiene cuatro subgrupos


cclicos propios:
h1i = {1, 1},

hii = {1, i},

hji = {1, j},

hki = {1, k}.

De hecho, no hay m
as subgrupos, pues 1 es el u
nico elemento de orden 2,
luego no puede haber m
as subgrupos de orden 2, y un subgrupo de orden 4
debe contener a alguno de los elementos i, j, k, y como todos ellos tienen
orden 4, el subgrupo ser
a necesariamente el generado por uno de ellos, que es
uno de los tres subgrupos de orden 4 que ya hemos mostrado.

6.2

Grupos de permutaciones

Antes de seguir introduciendo nuevos conceptos sobre grupos, vamos a estudiar con detalle una familia concreta de grupos finitos que nos ayudar
a a ilustrar
la teora.
En 1.37 hemos definido el conjunto A de todas las biyecciones f : A A,
donde A es un conjunto arbitrario. Ahora es inmediato que dicho conjunto tiene
estructura de grupo con la operaci
on dada por la composici
on de aplicaciones.
Se le llama grupo simetrico del conjunto A. A los elementos de A se les llama
permutaciones de A.
El teorema 1.38 afirma que si A es un conjunto finito con n elementos,
entonces el orden de A es n!
Es inmediato que si dos conjuntos A y B tienen el mismo cardinal, entonces
los grupos simetricos A y B son isomorfos. Basta tomar una aplicaci
on
biyectiva h : A B y asignar a cada permutaci
on f A la permutaci
on
h1 f h B .
En otras palabras, da igual hablar de las permutaciones del conjunto {a, b, c}
que del conjunto {1, 2, 3}. El isomorfismo entre ambos grupos se obtiene cambiando el nombre a los elementos. Por ejemplo, la permutaci
on que enva el 1
al 2, el 2 al 3 y el 3 al 1 se corresponde con la que enva a a b, b a c y c a a.
Por lo tanto, a efectos pr
acticos, el estudio de los grupos de permutaciones de
conjuntos finitos se reduce al de los grupos de permutaciones de los conjuntos
In = {1, . . . , n}. Al grupo simetrico sobre este conjunto lo representaremos
por n , y nos referiremos a el como el grupo de permutaciones de n elementos.

6.2. Grupos de permutaciones

205

Acciones de grupos Un grupo de permutaciones es un caso particular de


una situaci
on que conviene estudiar en un contexto m
as general:
Definici
on 6.14 Una acci
on de un grupo G sobre un conjunto es una aplicaci
on G que cumple las propiedades siguientes (para todos los a
y todos los g1 , g2 G):
1. (ag1 )g2 = a(g1 g2 ).
2. a1 = a.
Cuando hablemos de un grupo G que act
ua sobre un conjunto , esto debe
entenderse como que estamos considerando una cierta acci
on de G sobre A.
Por ejemplo, si G , entonces G act
ua sobre mediante la acci
on dada
por a = (a).
En general, si G act
ua sobre un conjunto , a cada g G le podemos asignar
la aplicaci
on g : dada pro g (a) = ag. Se cumple que es inyectiva,
pues si g (a) = g (b), entonces ag = bg, luego, multiplicando por g 1 , queda
que a = b. Tambien es suprayectiva, pues g (ag 1 )) = a. As pues, g .
Por consiguiente, tenemos una aplicaci
on : G que resulta ser un
homomorfismo de grupos. En efecto, se trata de probar que gh = g h , para
lo cual tomamos a y comprobamos que
gh (a) = agh = (ag)h = h (g (a)) = (g h )(a).
Recprocamente, todo homomorfismo : G determina una acci
on de
G en dada por ag = g (a) cuyo homomorfismo asociado es el propio . As
pues, podemos identificar las acciones de un grupo G en un conjunto con los
homomorfismos : G .
As pues, un grupo G act
ua sobre un conjunto cuando podemos asociar
a cada elemento de G una permutaci
on de de modo que la asociaci
on sea
un homomorfismo de grupos (pero el homomorfismo no tiene por que ser
inyectivo, de manera que dos elementos de g pueden inducir en la misma
permutaci
on).
Es obvio que si un grupo G act
ua sobre un conjunto , todo H G act
ua
sobre con la acci
on en la que, para cada h H, el elemento ah es el determinado por h como elemento de G. Si la acci
on de G se corresponde con el
homomorfismo , la de H se corresponde con la restricci
on |H .

Podemos pensar que cuando un grupo G act


ua sobre un conjunto cada
elemento g G transforma cada elemento a en otro ag , y podemos
considerar todos los elementos de por los que pasa uno dado a medida
que act
uan sobre el los distintos elementos de G. Esto se concreta mediante la
definici
on siguiente:
Si un grupo G act
ua sobre un conjunto , definimos en la relaci
on dada
por
a b si y s
olo si existe g G tal que ag = b.

206

Captulo 6. Grupos

Es f
acil ver que se trata de una relaci
on de equivalencia. La clase de equivalencia de un elemento a A recibe el nombre de
orbita de a bajo G, y est
a
formada por todos los elementos de en que se puede transformar a mediante
los elementos de G. La representaremos por a .
Por otra parte, si a , definimos el estabilizador de a como el conjunto
Ga = {g G | ag = a}, es decir, el conjunto de elementos de G que dejan
invariante a a. Es inmediato comprobar que Ga G.
Entre estos conceptos existe una relaci
on fundamental:

Teorema 6.15 Sea G un grupo que act


ua sobre un conjunto y sea a .
Entonces |a | = |G : Ga |. En particular, si G es finito, el cardinal de las
orbitas
que determina en divide al orden de G.
n: Definimos f : (G/Ga )d a mediante f (Ga g) = ag. La
Demostracio
aplicaci
on est
a bien definida, pues si Ga g = Ga g 0 , entonces g 0 g 1 Ga , luego
ag 0 g 1 = a, luego ag 0 = ag.
La aplicaci
on f es suprayectiva, pues todo b a es de la forma b = ag,
para cierto g G, y tambien es inyectiva, pues si f (Ga g) = f (Ga g 0 ), entonces
ag = ag 0 , luego ag 0 g 1 = a, luego g 0 g 1 Ga , luego Ga g 0 = Ga g. Por lo tanto
f es biyectiva, y as |a | = |(G/Ga )d | = |G : Ga |.
Ejemplo Consideremos la aplicaci
on g 8 dada por
g = {(1, 3), (2, 7), (3, 4), (4, 1), (5, 8), (6, 6), (7, 2), (8, 5)}.
La figura siguiente nos permite visualizarla mejor:
3
1

Las agrupaciones que vemos en la figura son precisamente las orbitas de


la acci
on sobre I8 del grupo G = hgi. En efecto, tenemos que 1g = 3 y 3g = 4,
luego 1g 2 = 4, e igualmente 1g 3 = 1, luego 1g 4 = 3, y as vemos que cualquier
elemento de G transforma el 1 en uno de los tres n
umeros 1, 3, 4. Igualmente se
razona con las dem
as, luego concluimos que la acci
on de G sobre I8 determina
cuatro orbitas, que son
{1, 3, 4},

{2, 7},

{5, 8},

{6}.

Ciclos Consideremos, en general, una permutaci


on g n , sea G = hgi y
sea a In . Entonces la orbita de a respecto de G es {ag m | m Z}. Ahora
bien, como tiene que ser un conjunto finito, existen enteros m1 < m2 tales
que ag m1 = ag m2 , luego ag m2 m1 = a. En suma, existe un n
umero natural
m > 0 tal que ag m = a. Si m es el menor posible y k es cualquier n
umero
entero, entonces k = mc + r, con 0 r < m, y ag k = a(g m )c g r = ag r . En
suma, la orbita de a es en realidad {a, ag, . . . ag m1 }, y tiene cardinal m, pues si
ag i = ag j con 0 i < j < m, entonces aji = 0, con j i < m, en contradicci
on
con la minimalidad de m.

6.2. Grupos de permutaciones

207

As pues, al ir aplicando a un elemento a las potencias sucesivas de g vamos


obteniendo elementos distintos
a 7 ag 7 ag 2 7 7 ag m1 7 a
hasta que, para un cierto m, se cumple ag m = a, y a partir de ah, si seguimos
aplicando g, los elementos de la orbita se van repitiendo cclicamente. El ejemplo
anterior muestra varios casos concretos de esta situaci
on:
1 7 3 7 4 7 1 7 3 7 4 7
5 7 8 7 5 7 8 7

2 7 7 7 2 7 7 7
6 7 6 7 6 7

Definici
on 6.16 Sea g n una permutaci
on, sea G = hgi y sea a In .
Diremos que g es un ciclo si todas las orbitas que determina en In son triviales
(en el sentido de que tienen un u
nico elemento) excepto una. La longitud de un
ciclo se define como el cardinal de su orbita no trivial. Los ciclos de longitud 2
se llaman trasposiciones.
En general, cuando hablemos de la orbita de un ciclo se entender
a que nos
referimos a su orbita no trivial. Diremos que dos ciclos son disjuntos si sus
orbitas lo son.
Si un ciclo g tiene orbita {a, ag, . . . , ag m1 }, con ag m = a, lo representaremos
con la notaci
on
g = (a, ag, . . . , ag m1 ).
Por ejemplo, el ciclo (1, 3, 4) = (4, 1, 3) = (3, 4, 1) 8 es la permutaci
on
que cumple
1 7 3 7 4 7 1,

2 7 2,

5 7 5,

6 7 6,

7 7 7,

8 7 8.

Notemos que, en general, si g es un ciclo de longitud m y a es un elemento


de su
orbita, tenemos que ag m = 1, y entonces g m fija a todos los elementos de
la orbita de a, pues otro cualquiera es de la forma ag i , y resulta que
ag i g m = ag m+i = ag m g i = ag i .
Por otra parte, como g fija a todos los elementos que no est
an en su orbita, lo
mismo le sucede a g m , y concluimos que g m = 1. Por otra parte, si 0 < i < m
tiene que ser g i 6= 1, porque ag i 6= a. Por lo tanto, la longitud de un ciclo no es
ni m
as ni menos que el menor natural m > 0 tal que g m = 1, es decir su orden.
Teorema 6.17 Sea n > 0 un n
umero natural.
1. La longitud de un ciclo de n coincide con su orden.
2. Dos ciclos disjuntos conmutan.
3. Toda permutaci
on de n distinta de 1 se expresa de forma u
nica salvo el
orden como producto de ciclos disjuntos dos a dos.

208

Captulo 6. Grupos

4. El orden de un producto de ciclos disjuntos es el mnimo com


un m
ultiplo
de las longitudes de los ciclos.
5. n est
a generado por las trasposiciones.
n: 1) lo acabamos de probar. Para probar 2), consideramos
Demostracio
un ciclo g de orbita A y otro g 0 de orbita A0 , con A A0 = . Entonces, si
i In , tenemos que

g(i) si i A,
(gg 0 )(i) = g 0 (i) si i A0 ,

i
si i In \ (A A0 ),
y esto no depende del orden, es decir, g 0 g es la misma permutaci
on.

3) Dada g n , sean A1 , . . . , Am sus orbitas no triviales. Es claro que


g[Ai ] = Ai , luego podemos definir gi n tal que gi |Ai = g|Ai y gi |In \Ai es la
identidad. Claramente gi es un ciclo de orbita Ai , y es f
acil ver que g = g1 gm .
La unicidad se debe a que si g = g1 gm , donde los gi son ciclos disjuntos
de orbitas A1 , . . . , Am , entonces necesariamente gi |Ai = g|Ai , de donde se sigue
que A1 , . . . An son necesariamente las orbitas de g. Esto determina los gi salvo
el orden.
4) Sabemos que el orden de un ciclo es su longitud, luego si g = g1 gm es
una descomposici
on en ciclos disjuntos y r es el mnimo com
un m
ultiplo de sus
longitudes, entonces gir = 1, luego (teniendo en cuenta que los ciclos conmutan)
r
g r = g1r gm
= 1. Por otra parte, si r0 < r, entonces existe un i tal que el
0
orden de gi no divide a r0 , luego gir 6= 1, pero si Ai es la orbita de gi , tenemos
0
0
0
que g|Ai = gi |Ai , luego g r |Ai = gir |Ai 6= 1, luego g r 6= 1, luego r es el menor
natural no nulo que cumple g r = 1, es decir, el orden de g.
5) El hecho de que toda permutaci
on se descomponga en producto de ciclos
implica que los ciclos generan n , pero a su vez cada ciclo se puede expresar
como producto de trasposiciones:
(a1 , . . . , am ) = (a1 , a2 )(a1 , a3 ) (a1 , am ),
luego las trasposiciones tambien son un generador.
Ejemplo La descomposici
on en ciclos disjuntos de la permutaci
on del ejemplo
de la p
agina 206 es
g = (1, 3, 4)(2, 7)(5, 8).
Es f
acil operar con permutaciones cuando est
an expresadas como productos
de ciclos disjuntos. Por ejemplo, para calcular el producto de (2, 5, 7)(1, 3) por
(1, 3, 4)(7, 8), es decir,
(2, 5, 7)(1, 3)(1, 3, 4)(7, 8),
tomamos el 1, y vemos que al aplicar sucesivamente los cuatro ciclos obtenemos
1 7 1 7 3 7 4 7 4,

6.2. Grupos de permutaciones

209

luego el producto empieza por un ciclo (1, 4, . . .) Ahora calculamos


4 7 4 7 1 7 1,
luego cerramos el ciclo (1, 4). Pasamos al 2:
2 7 5 7 5 7 5 7 5,
luego tenemos (1, 4)(2, 5, . . .). Ahora partimos del 5:
5 7 7 7 7 7 7 7 8,
luego (1, 4)(2, 5, 8, . . .). Pasamos al 8:
8 7 8 7 8 7 8 7 7,
luego (1, 4)(2, 5, 8, 7, . . .). Ahora:
7 7 2 7 2 7 2 7 2,
luego cerramos el ciclo (1, 4)(2, 5, 8, 7). Falta estudiar el 3 y el 6, pero es f
acil
ver que quedan fijos, luego concluimos que
(2, 5, 7)(1, 3)(1, 3, 4)(7, 8) = (1, 4)(2, 5, 8, 7).
El c
alculo de inversos es tambien muy simple, pues es claro que
(a1 , . . . , an )1 = (an , . . . , a1 ),
y, como los ciclos disjuntos conmutan, el inverso de un producto de ciclos disjuntos es el producto de los ciclos inversos.
Ejemplo: El grupo 3 Observemos que 1 = 1 y 2 = {1, (1, 2)} es un
grupo cclico de orden 2. Consideremos ahora 3 , que es un grupo de orden 6.
Sus elementos distintos de 1 pueden ser trasposiciones (, ) o ciclos de longitud 3: (, , ). Analizando todos los casos posibles, vemos que
3 = {1, (1, 2), (1, 3), (2, 3), (1, 2, 3), (3, 2, 1)}.
En particular vemos que 3 tiene tres elementos de orden 2 y dos elementos de
orden 3. Eso nos da los subgrupos cclicos
h(1, 2)i = {1, (1, 2)},

h(1, 3)i = {1, (1, 3)},

h(2, 3)i = {1, (2, 3)},

h(1, 2, 3)i = {1, (1, 2, 3), (3, 2, 1)}.


Y no hay m
as subgrupos propios, pues todo subgrupo propio tiene que tener 2
o 3 elementos, luego tiene que ser cclico. Observemos que 3 es no abeliano,
pues, por ejemplo,
(1, 2)(1, 3) = (1, 2, 3),

(1, 3)(1, 2) = (3, 2, 1).

210

Captulo 6. Grupos

En realidad, esto prueba que si n 3 el grupo n no es abeliano. Volviendo


al caso n = 3, si llamamos H = {1, (1, 2)}, es f
acil ver que
(3 /H)i = {{1, (1, 2)}, {(1, 3), (3, 2, 1)}, {(2, 3), (1, 2, 3)}},
(3 /H)d = {{1, (1, 2)}, {(1, 3), (1, 2, 3)}, {(2, 3), (3, 2, 1)}},
con lo que vemos que, tal y como habamos indicado, las dos relaciones de
congruencia m
odulo un subgrupo no tienen por que coincidir.
Ejemplo: El grupo 4 El grupo 4 tiene 24 elementos, la tabla siguiente
recoge los tipos posibles y el n
umero de permutaciones de cada tipo:
1 (, ) (, )(, ) (, , ) (, , , )
1
6
3
8
6
Por ejemplo, para calcular el n
umero de ciclos (a, b, c) de longitud 3 observamos que tenemos 4 posibilidades para elegir a, otras 3 para elegir b y otras 2 para
elegir c, lo que nos da 24 posibilidades, pero como (a, b, c) = (c, a, b) = (b, c, a),
estamos contando tres veces cada ciclo, luego el n
umero de ciclos es 8.
Este grupo se nos queda ya demasiado grande, en el sentido de que no
estamos en condiciones de encontrar todos sus subgrupos, pues tiene muchos
m
as que los subgrupos cclicos que podramos calcular f
acilmente. Por ejemplo,
el estabilizador de cada i = 1, 2, 3, 4 (es decir, el conjunto de las permutaciones
en cuya expresi
on en ciclos no aparece el ndice i) es un subgrupo de 4 isomorfo
a 3 . Pero esto no agota los subgrupos que pueden encontrarse en 4 .
Ejercicio: Determinar los tipos de permutaciones de 5 as como cu
antas permutaciones hay de cada tipo.

El grupo D Veamos ahora un ejemplo de grupo infinito, uno de los m


as
sencillos despues del grupo cclico infinito Z. Consideramos en Z las permutaciones dadas por (n) = n + 1 y (n) = n. Definimos el grupo diedrico infinito
como D = h, i.
En primer lugar observamos que i (n) = n + i, de donde se sigue que las
potencias i son distintas dos a dos, luego el orden de es infinito. Por el
contrario, 2 = 1, luego tiene orden 2. Ahora observamos que = 1 (lo
que prueba, en particular, que D no es abeliano), pues
( )(i) = ( (i)) = (i) = i + 1,
( 1 )(i) = ( 1 (i)) = (i 1) = i + 1.
Operando la relaci
on que hemos obtenido se sigue que 1 = . Teniendo
esto en cuenta, aunque cada elemento de D se expresa en principio como
un producto de permutaciones 1 y (como 1 1 1 ), podemos

6.3. Subgrupos normales

211

intercambiar los factores hasta que todas las s queden a la izquierda, y as,
concluimos que
D = { n i | n Z, i = 0, 1}.
Adem
as, ( n i )(0) = i ( n (0)) = i (n) = n, donde el signo depende de i,
luego las permutaciones n i son distintas dos a dos.

Es f
acil ver que las permutaciones n son todas las permutaciones de Z que
conservan el orden, mientras que las permutaciones n son todas las permutaciones de Z que invierten el orden.
Observemos que todos los elementos n tienen orden infinito, mientras que
todos los n tienen orden 2, porque, seg
un las relaciones que hemos probado,
n n = n n = 1.
En particular, observemos que y son dos elementos de orden 2 cuyo
producto = tiene orden infinito. Esto muestra que hay que ser precavido
al tratar de calcular el orden de un producto de dos elementos de un grupo.
M
as a
un, es claro que D = h, i, luego D es un grupo infinito generado
por dos elementos de orden 2.

6.3

Subgrupos normales

Hemos visto que en general las relaciones de congruencia por la izquierda


y por la derecha respecto a un subgrupo no tienen por que coincidir, y sucede
que s
olo cuando coinciden puede definirse consistentemente una estructura de
grupo en el conjunto cociente. Estudiemos, pues, en que casos coinciden. Para
ello nos ser
a de utilidad el concepto de automorfismo interno de un grupo.
Definici
on 6.18 Sea G un grupo y g, h G. Definimos el conjugado de h por g
como el elemento hg = g 1 hg G. Definimos la funci
on g : G G dada por
g (h) = hg . Es f
acil comprobar que g es un automorfismo de G. M
as a
un, la
aplicaci
on : G Aut G dada por (g) = g es un homomorfismo de grupos.
A la imagen de este homomorfismo, es decir, al subgrupo Int G = {g | g G}
se le llama grupo de los automorfismos internos de G.
Es evidente que hg = h si y s
olo si gh = hg, luego Int G = 1 si y s
olo si G es
abeliano.
Si A G, escribiremos Ag = g [A] = {ag | a A}.
Teorema 6.19 Sea G un grupo y H un subgrupo de G. Las siguientes condiciones son equivalentes:
1. La relaci
on de congruencia m
odulo H por la izquierda coincide con la
relaci
on de congruencia m
odulo H por la derecha.
2. gH = Hg para todo elemento g G.
3. (G/H)i = (G/H)d (y entonces escribiremos simplemente G/H).

212

Captulo 6. Grupos

4. H g = H para todo elemento g G.


5. H g H para todo elemento g G.
n: Teniendo en cuenta que gH y Hg son las clases de equiDemostracio
valencia de g por la izquierda y por la derecha m
odulo H, es claro que 1), 2) y
3) son equivalentes.
Tambien es f
acil probar que gH = Hg equivale a que H = g 1 Hg = H g .
1
S
olo falta probar que 5) implica 4), pero esto es consecuencia de que H g H
implica que H H g , luego de hecho H = H g .
Definici
on 6.20 Diremos que N es un subgrupo normal de un grupo G si cumple las condiciones del teorema anterior. Lo representaremos mediante N E G.
Es inmediato que 1, G E G, as como que todo subgrupo de un grupo abeliano es normal. Tambien es f
acil ver que todo subgrupo de ndice 2 es normal.
La raz
on es que un subgrupo H con ndice 2 en un grupo G da lugar a dos clases
de congruencia, una es H (tanto por la izquierda como por la derecha) y la otra
es G \ H, luego se cumple la condici
on 3) de 6.19.
Tambien es claro que si G = hXi, entonces para que N G sea un subgrupo
normal basta con que N x = N para todo x X, y si G es finito basta con que
N x N para todo x X.
El homomorfismo G Int(G) Aut(G) G hace que podamos considerar a la conjugaci
on como una acci
on de G en el propio G visto como conjunto.
La relaci
on de equivalencia en G asociada a esta acci
on se llama tambien
conjugaci
on, es decir, dos elementos g1 , g2 G son conjugados si existe un
g G tal que g1g = g2 .
La orbita de un elemento g G respecto de la conjugaci
on se llama clase de
conjugaci
on de g y se representa por
cl(g) = {g x | x G}.
El estabilizador de un g G recibe el nombre de centralizador de g, y se representa por
CG (g) = {x G | g x = g} = {x G | xg = gx},
es decir, est
a formado por los elementos de G que conmutan con g. La relaci
on
general entre estabilizadores y orbitas afirma en este caso que
|cl(g)| = |G : CG (g)|.
Si H G y g G, el conjunto H g es la imagen de H por un automorfismo (interno) de G, luego H g G. Los subgrupos de la forma H g se llaman
conjugados de H.
Es claro que H 7 H g determina una acci
on de G sobre el conjunto de
todos los subgrupos de G. La orbita de un subgrupo es el conjunto de todos sus

6.3. Subgrupos normales

213

subgrupos conjugados. El estabilizador de un subgrupo H se llama normalizador


de H en G, y se representa por
NG (H) = {g G | H g = H}.
es claro que H E NG (H) G. De hecho, NG (H) es el mayor subgrupo de G en
el que H es normal. La relaci
on fundamental entre orbitas y estabilizadores se
traduce ahora en que |G : NG (H)| es el n
umero de conjugados de H en G. En
particular, H E G si y s
olo si NG (H) = G.
Veamos las propiedades de la conjugaci
on en grupos de permutaciones.
Teorema 6.21 Sea n un n
umero natural no nulo.
1. Si (a1 , . . . , am ) es un ciclo en n y n , entonces

(a1 , . . . , am ) = (a1 ), . . . , (am ) .

2. Dos permutaciones de n cuyas descomposiciones en producto de ciclos


disjuntos sean 1 r y 1 s son conjugadas si y s
olo si r = s y
(reordenando adecuadamente) la longitud de cada i coincide con la de i .
n: 1) En primer lugar,
Demostracio

(a1 , . . . , am ) (a1 ) = (a1 , . . . , am ) 1 (a1 )

= (a1 , . . . , am )(a1 ) = (a2 )

= (a1 ), . . . , (am ) (a1 ) .

Lo mismo vale para cualquier otro ai . Si a es distinto de (a1 ), . . . , (am ),


entonces 1 (a) es distinto de a1 , . . . , am , luego (a1 , . . . , am ) 1 (a) = 1 (a)
y

(a1 , . . . , am ) 1 (a) = 1 (a) = a = (a1 ), . . . , (am ) (a).

As pues (a1 , . . . , am ) y (a1 ), . . . , (am ) act


uan igual sobre todos los
elementos, luego son iguales.

2) Si g n , entonces (1 r )g = 1g rg , donde los ig son ciclos disjuntos (por el apartado anterior, si las orbitas de 1 , . . . , r son A1 , . . . , Ar ,
entonces las orbitas de 1g , . . . , rg son g[A1 ], . . . , g[Ar ]). La unicidad de la descomposici
on hace que, r = s y, salvo reordenaci
on, ig = i , luego i y i tienen
la misma longitud.
Respectivamente, si r = s y la longitud de i coincide con la de i , digamos
que i = (ai1 , . . . , aimi ), i = (bi1 , . . . , bimi ), podemos tomar g n que cumpla
g(aij ) = bij , y entonces, por el apartado anterior, ig = i , y concluimos que
(1 r )g = 1 r .
Veamos un par de aplicaciones de este teorema:

214

Captulo 6. Grupos

Teorema 6.22 n est


a generado por las trasposiciones (i, i+1), para 1 i < n.
n: Por 6.17 sabemos que n est
Demostracio
a generado por las trasposiciones, luego basta ver que toda trasposici
on (i, j) se expresa como producto de
las indicadas en el enunciado. Ahora bien, por ejemplo,
(15) = (24)(12) = (35)(23)(12) = (45)(34)(23)(12) = (12)(23)(34)(45)(34)(23)(12),
y es claro que del mismo modo podemos expresar cualquier (i, j) en producto
de trasposiciones de n
umeros consecutivos.
Teorema 6.23 Si p es primo, entonces p est
a generado por un p-ciclo cualquiera y una trasposici
on cualquiera.
n: Sea un p-ciclo y = (ab) una trasposici
Demostracio
on y llamemos
H = h, i. Como la orbita de recorre todos los ndices, existe un k tal que
k (a) = b. Como k H y es tambien un p-ciclo (porque p es primo,
luego
todas sus potencias no triviales tienen orden p), basta probar que k , = p .
Equivalentemente, podemos suponer que (a) = b. Si = (a, b, a3 . . . , ap ), sea
p dada por (1) = a, (2) = b, (ai ) = i. Entonces = (1, . . . , p) y
= (12), luego basta probar que H = h(1, . . . , p), (12)i = p , pues en tal
caso, conjugando por 1 obtenemos que H = p . Equivalentemente, podemos
i
suponer que = (1, . . . , p), = (12). Ahora bien, (12) = (i, i + 1) H, luego
H = p por el teorema anterior.
Ejemplos El grupo 3 tiene tres clases de conjugaci
on, correspondientes a
los tres tipos de permutaciones seg
un su descomposici
on en ciclos disjuntos, que
son 1, (, ) y (, , ).
Observemos que un subgrupo es normal si y s
olo si es uni
on de clases de conjugaci
on. As, el subgrupo N = h(1, 2, 3)i es normal, pues consta de dos clases
de conjugaci
on (y tambien2 porque tiene ndice 2), mientras que los subgrupos
de orden 2 no son normales, ya que contienen una trasposici
on, pero no todas
las trasposiciones, que forman una misma clase de conjugaci
on.
En 4 tenemos cuatro clases de conjugaci
on de cardinal 1, 6, 3, 8 y 6, respectivamente (vease la tabla de la p
agina 210). Vamos a encontrar todos sus
subgrupos normales. Para ello observamos en primer lugar que los ordenes posibles son 1, 2, 3, 4, 6, 8, 12, 24. Los ordenes 1 y 24 corresponden a los subgrupos
impropios.
Ning
un subgrupo normal propio puede contener la clase de las trasposiciones,
ya que generan todo el grupo. Tampoco puede contener a los ciclos de longitud 4,
ya que son 6, m
as el neutro 7, luego el grupo debera tener orden 8 o 12, pero
2 Un

tercer argumento es que si un grupo tiene un u


nico subgrupo de un orden dado,
entonces tiene que ser normal, pues no puede tener otros conjugados, ya que tendran el
mismo orden.

6.3. Subgrupos normales

215

no hay ninguna otra clase de conjugaci


on de cardinal 1 o 5 que podamos a
nadir
para completar esos 7 elementos. Es f
acil ver que

V4 = {1} cl (1, 2)(3, 4) = 1, (1, 2)(3, 4), (1, 3)(2, 4), (1, 4)(2, 3)

es un subgrupo normal de 4 en el que todos los elementos no triviales tienen


orden 2 (o sea, que no es cclico). A este grupo se le llama el grupo de Klein.
Para que un subgrupo normal propio contenga a los ciclos de longitud 3 (que
son
as elneutro 9) ha de tener orden 12, luego faltan los 3 elementos de
8 m
cl (1, 2)(3, 4) . El lector puede probar directamente que

A4 = {1} cl (1, 2)(3, 4) cl (1, 2, 3)

es un subgrupo normal de orden 12 llamado grupo alternado de grado 4, aunque


m
as adelante daremos un argumento que no requerir
a ning
un c
alculo.

Ejercicio: Probar que A4 = (1, 2, 3), (1, 2)(3, 4) .

En resumen, los u
nicos subgrupos normales de 4 son 1 < V4 < A4 < 4 .
El grupo V4 es abeliano, mientras que A4 no lo es. Todo subgrupo de orden 12
en 4 es normal por tener ndice 2, luego A4 es el u
nico.
Ejercicio: Si H E K E G, es necesariamente H E G?

Consideremos g = (1, 2)(3, 4) 4 . Su clase de conjugaci


on tiene 3 elementos, luego C4 () tiene orden 8. Es claro que V4 C4 (), pues el centralizador
contiene a todas las permutaciones que conmutan con g y sucede que g V4
y V4 es abeliano. Pero el centralizador contiene m
as elementos. No es difcil
encontrar otro: = (1, 3, 2, 4) C4 (g), pues
(1, 2)(3, 4)(1,3,2,4) = (3, 4)(2, 1) = (1, 2)(3, 4).
Ahora observamos que el centralizador no es abeliano, pues sabemos que
= (1, 4)(2, 3) C4 (g) y = 1 . En efecto:
(1, 3, 2, 4)(1,4)(2,3) = (4, 2, 3, 1) = (1, 3, 2, 4)1 .
Ahora es f
acil identificar 8 elementos en el centralizador, y sabemos que esos
son todos:
1

2
3

2
3
1 (1324) (12)(34) (4231) (14)(23) (12) (13)(24) (34)
o 1
4
2
4
2
2
2
2
Este grupo recibe el nombre de grupo diedrico de orden 8 y se representa por D8 .
Vemos que tiene dos elementos de orden 4 y 5 de orden 2, pero no son todos
iguales, en el sentido de que 2 = g conmuta con todos los elementos del
grupo
2 (puesto que este es el centralizador de g en 4 ) lo que se traduce en que
E D8 , mientras que los otros cuatro subgrupos de orden 2 no son normales.
De hecho, las clases de conjugaci
on de D8 son:
{1},

{ 2 },

{, 3 },

{, 2 },

{, 3 }.

216

Captulo 6. Grupos

Ejercicio: Probar que D8 tiene tres subgrupos de orden 4.

Observemos que (1, 2)(3, 4) y (1, 4)(2, 3) son permutaciones conjugadas en


4 , pero no en D8 . Hay que tener presente que la relaci
on de conjugaci
on
depende del grupo en el que se considera y una clase de conjugaci
on en un
grupo puede partirse en varias en un subgrupo. Otro ejemplo de esta situaci
on la
proporcionan los ciclos de longitud 3, que forman una u
nica clase de conjugaci
on
en 4 (de 8 elementos) y, aunque todos ellos est
an en A4 , en este subgrupo
forman dos clases de conjugaci
on de 4 elementos cada una.
Basta tener en cuenta que C4 ((1, 2, 3, 4)) tiene 4 elementos (pues su ndice
es el n
umero de conjugados del ciclo), luego C4 ((1, 2, 3, 4)) = h(1, 2, 3, 4)i, pues
obviamente el subgrupo de la derecha tiene que estar en el centralizador, y tiene
ya los elementos justos. Pero entonces,
CA4 ((1, 2, 3, 4)) = A4 C4 ((1, 2, 3, 4)) = h(1, 2, 3, 4)i ,
es decir, el centralizador de un ciclo de longitud 4 en A4 es el mismo que en 4 ,
pero entonces su ndice es la mitad, y as la clase de conjugaci
on tiene s
olo 4
elementos, en lugar de 8. En otras palabras, en 4 hay dos clases de conjugaci
on
de ciclos de longitud 4, con 4 elementos cada una.
No ocurre lo mismo con la clase de conjugaci
on de (1, 2)(3, 4), que est
a
formada por tres permutaciones en 4 y las tres siguen siendo conjugadas en
A4 , ya que CA4 ((1, 2)(3, 4)) = C4 ((1, 2)(3, 4)) A4 = V4 (ya que la intersecci
on
no puede ser todo D8 , pues (1, 3, 2, 4)
/ A4 ), luego |A4 : CA4 ((1, 2)(3, 4))| = 3.
En total, A4 tiene cuatro clases de conjugaci
on, de cardinales 1, 3, 4, 4. Esto
implica, por ejemplo, que A4 no tiene subgrupos de orden 6, ya que un subgrupo
de orden 6 tendra ndice 2, luego sera normal, luego sera uni
on de clases de
conjugaci
on, pero entre los n
umeros 1, 3, 4, 4 no los hay que sumen 6. As pues,
un grupo no tiene por que tener subgrupos de todos los ordenes que dividen a
su orden.
El grupo Q8 tiene una propiedad que no es frecuente en los grupos no abelianos, y es que todos sus subgrupos son normales. En efecto, hemos calculado
todos sus subgrupos y hemos visto que, aparte de los impropios, tiene subgrupos
de orden 4, que son normales porque tienen ndice 2, y un subgrupo de orden 2,
que es {1, 1}, que es normal porque 1 conmuta con todos los elementos del
grupo, luego queda invariante por conjugaci
on.
El lector debera apreciar a traves de los ejemplos anteriores c
omo los conceptos de la teora de grupos (subgrupos, conjugaci
on, centralizador, etc.) nos
permiten profundizar en la estructura de grupos como 4 , mucho m
as all
a de
su mera definici
on como conjunto de las biyecciones de un conjunto de cuatro
elementos.
Hemos calculado C4 ((1, 2)(3, 4)), pero es evidente que el centralizador de
cualquier otra permutaci
on de tipo (, )(, ) va a ser isomorfo al que hemos
calculado. De hecho, va a ser conjugado, como consecuencia de un resultado
general que conviene conocer:

6.4. Producto de grupos

217

Teorema 6.24 Si un grupo G act


ua sobre un conjunto X y tomamos x X,
g G, entonces Gxg = Ggx .
n: Tenemos que h Gxg si y s
Demostracio
olo si xgh = xg, si y s
olo si
xghg 1 = x, si y s
olo si ghg 1 = h0 Gx , si y s
olo si h = h0g Ggx .
En particular, al aplicar esto a la acci
on de 4 en s mismo por conjugaci
on,
tenemos que, como dos permutaciones cualesquiera de tipo (, )(, ) son conjugadas, sus centralizadores tienen que ser conjugados.

6.4

Producto de grupos

Necesit
abamos el concepto de subgrupo normal para adaptar al caso de
grupos el concepto de suma directa de m
odulos. Nos ocupamos de ello en esta
secci
on:
Definici
on 6.25 Sea G un grupo y A y B dos subconjuntos de G. Llamaremos
AB = {ab | a A, b B}. En notaci
on aditiva hablaremos de suma de
subconjuntos y la representaremos A + B.
A diferencia de lo que ocurre con m
odulos, el producto de dos subgrupos no
es necesariamente un subgrupo. El teorema siguiente aclara la situaci
on.
Teorema 6.26 Sea G un grupo y H y K dos subgrupos de G.
1. HK G si y s
olo si HK = KH.
2. Si H E G o K E G, entonces HK G.
3. Si H E G y K E G, entonces HK E G.
n: 1) Si HK G y x HK, entonces x1 HK, luego es
Demostracio
1
de la forma x = hk, con h H y k K. Por lo tanto x = k1 h1 KH.
Igualmente se prueba la otra inclusi
on, luego HK = KH.
Si HK = KH, sean x, y HK. Entonces x = hk e y = h0 k0 con h, h0 H
y k, k0 K. Por lo tanto xy 1 = hkk01 h01 . El elemento kk01 h01 KH =
HK, luego kk01 h01 = h00 k00 para ciertos h00 H y k00 K. Consecuentemente
xy 1 = hh00 k00 HK. Por el teorema 6.4 tenemos que HK G.

2) Si H E G y hk HK, entonces hk = kk1 hk = khk KH k = KH


e igualmente se prueba la otra inclusi
on. Por lo tanto HK = KH y por 1)
HK G.
3) Si g G, como la conjugaci
on por g es un automorfismo de G, se cumple
que (HK)g = H g K g = HK. Por lo tanto HK E G.
El lector debe tener clara la diferencia entre que HK = KH y que hk = kh
para todo h H y todo k K. En el primer caso se dice que H y K conmutan.
En el segundo se dice que conmutan elemento a elemento. La segunda propiedad

218

Captulo 6. Grupos

implica obviamente la primera, pero el recproco no es cierto. Es f


acil encontrar
ejemplos en el grupo 3 .
Notemos que si G es abeliano se cumplen trivialmente todas las condiciones
del teorema anterior y el producto de subgrupos es siempre un subgrupo (cosa
que ya sabamos viendolos como Z-m
odulos).
A menudo es u
til este sencillo resultado:
Teorema 6.27 Si dos subgrupos normales de un grupo G tienen intersecci
on
trivial, entonces conmutan elemento a elemento.
n: Sean N y M E
Demostracio
G tales
n que N M = 1. Sean n N
y m M . Entonces n1 m1 nm = m1 m = n1 nm N M = 1, luego
nm = mn.
Definici
on 6.28 Diremos que un grupo G es producto directo de los subgrupos
N1 , . . . , Nr si todos son normales en G, se cumple que G = N1 Nr y la
intersecci
on de cada Ni con el producto de los factores restantes es trivial. En
tal caso se escribe G = N1 Nr .
Para grupos abelianos el concepto de producto directo coincide con el concepto de suma directa de subgrupos vistos como Z-m
odulos. Simplemente hemos
cambiado la notaci
on aditiva por la multiplicativa (Notemos que N1 Nr =
hN1 , . . . , Nr i). Teniendo en cuenta el teorema anterior, la prueba del resultado
siguiente es an
aloga a la del teorema 5.15.
Teorema 6.29 Sea G un grupo y N1 , . . . , Nr una familia de subgrupos normales tales que G = N1 Nr . Entonces:
1. Si se da la igualdad n1 nr = 1 con cada ni Ni , entonces cada ni = 1.
2. Cada elemento g G se expresa de forma u
nica como producto g =
n1 nr con cada ni Ni .
Al igual que ocurre con los m
odulos, si tenemos una familia de grupos podemos construir un grupo que se exprese como producto directo de una familia
de subgrupos isomorfos a los dados.
Definici
on 6.30 Sea una familia de grupos G1 , . . . , Gr . Llamaremos producto
directo externo de G1 , . . . , Gr al grupo

G1 Gr = (g1 , . . . , gr ) gj Gj para cada j = 1, . . . , r


con la operaci
on dada por (g1 , . . . , gr )(g10 , . . . , gr0 ) = (g1 g10 , . . . , gr gr0 ).

Como en el caso de los m


odulos, la aplicaci
on i : Gi G1 Gr que
a cada elemento g Gi le asigna la r-tupla cuya componente i-esima es g y las
restantes son 1 es un monomorfismo de grupos, por lo que podemos identificar
cada Gi con su imagen, es decir, con el subgrupo Ni de G1 Gr formado

6.5. Grupos cociente

219

por las r-tuplas que tienen todas sus componentes iguales a 1 salvo quiz
a la iesima. Es f
acil ver que cada Ni es isomorfo a Gi y que G1 Gr es producto
directo (en el sentido de 6.28) de los subgrupos Ni .
Dejamos al lector la extensi
on de estos conceptos y resultados al caso de
infinitos factores, que es completamente an
aloga al caso de los m
odulos, aunque
no vamos a necesitarla en
ning
u
n
momento.
Hay
que
distinguir
igualmente
entre
Q
el producto de grupos:
Gi , con la operaci
on dada por (f g)(i) = f (i)g(i), y el
iI
producto directo:
Q
Q
Q
Gi = {f
Gi | {i I | f (i) 6= 1} es finito}
Gi .
iI

iI

iI

Los teoremas de estructura de la secci


on 5.5 nos dan en particular el resultado
siguiente:
Teorema 6.31 Todo grupo abeliano finitamente generado (en particular todo
grupo abeliano finito) es producto directo de un n
umero finito de grupos cclicos.
En particular, podemos hablar de los factores invariantes y los divisores
elementales de un grupo abeliano finito, que nos permiten determinar todos los
grupos abelianos finitos de un determinado orden no isomorfos entre s.
Por ejemplo, tenemos que todo grupo abeliano de orden primo p es isomorfo
a Cp (y, de hecho, es claro que todo grupo de orden primo tiene que ser abeliano,
luego, salvo isomorfismo, Cp es el u
nico grupo de orden p). En cambio, un grupo
abeliano de orden p2 puede ser isomorfo a Cp2 o a Cp Cp . Por ejemplo, es
claro que V4
= C2 C2 , pues no tiene elementos de orden 4.
Teniendo en cuenta que un grupo cclico finito tiene subgrupos de todos los
ordenes posibles (divisores de su orden), ahora es inmediato:
Teorema 6.32 Un grupo abeliano finito tiene subgrupos de todos los
ordenes
que dividen a su orden.

6.5

Grupos cociente

Pasamos por fin al estudio de los grupos cociente. Resulta que s


olo pueden definirse cuando la congruencia izquierda coincide con la derecha, es decir,
cuando el subgrupo es normal:
Teorema 6.33 Sea G un grupo y N E G. Entonces el conjunto cociente G/N
es un grupo con la operaci
on dada por (gN )(hN ) = ghN . El elemento neutro
de G/N es 1N = N . Si g G, se cumple que (gN )1 = g 1 N . Si el grupo G
es abeliano o cclico, entonces G/N tambien lo es.
n: Hay que probar que la operaci
Demostracio
on en G/N est
a bien definida, es decir, que si gN = g 0 N y hN = h0 N , entonces ghN = g 0 h0 N .
Para ello observamos que (gh)1 g 0 h0 = h1 g 1 g 0 h0 = h1 h0 h01 g 1 g 0 h0 .

220

Captulo 6. Grupos

Ahora, h1 h0 N y g 1 g 0 N porque por hip


otesis son congruentes m
odulo
0
N , y como N es normal, h01 g 1 g 0 h0 = (g 1 g 0 )h N , luego (gh)1 g 0 h0 N y
as ghN = g 0 h0 N .
El resto del teorema es obvio. En todo caso, n
otese que si G = hgi, entonces
G/N = hgN i.
Nota Tal y como hemos indicado, la normalidad de H G no s
olo es una
condici
on suficiente, sino tambien necesaria para que el producto considerado
en el teorema anterior en (G/H)i o (G/H)d este bien definido. En efecto, si
el producto est
a bien definido, por ejemplo en (G/H)d , dado h H y g G,
tenemos que Hh = H1, y que Hg 1 = Hg 1 , luego tambien Hg 1 h = Hg 1 ,
luego Hg 1 hg = H, luego hg H, luego H g H, luego H E G.
Es inmediato comprobar que si f : G H es un homomorfismo de grupos y
N E H, entonces f 1 [N ] E G. En particular N(f ) E G, y se cumple el an
alogo
al teorema de isomorfa de m
odulos (con esencialmente la misma prueba):

Teorema 6.34 (Teorema de Isomorfa) Sea f : G H un homomorfismo de grupos.


on f : G/ N(f ) Im f

Entonces N(f ) E G, y la aplicaci


dada por f g N(f ) = f (g) es un isomorfismo de grupos.
Recprocamente, todo subgrupo normal N de un grupo G es el n
ucleo de
un epimorfismo de grupos, a saber, de la proyecci
on can
onica p : G G/N
definida mediante p(g) = gN .
Teorema 6.35 Sea G un grupo y N E G.
1. Si N H G, entonces H/N G/N .
2. Si K G/N , entonces existe un subgrupo H de G tal que N H G y
K = H/N .
3. Si N H G, entonces H/N E G/N si y s
olo si H E G.
4. Las correspondencias descritas en los apartados 1) y 2) determinan una
biyecci
on entre los subgrupos de G/N y los subgrupos de G que contienen
a N . Los subgrupos normales de G se corresponden con los subgrupos
normales de G/N .
n: 1) Es inmediato. Los elementos de H/N son las clases hN
Demostracio
con h H y los de G/N son las clases gN con g G. La operaci
on es la misma.

2) Consideremos el epimorfismo can


onico p : G G/N dado por p(g) =
gN . Definimos H = p1 [K] G. Como N = p1 [1N ], claramente N H. As
H/N = {hN | h H} = p[H] = p p1 [K] = K.
3) Si H/N E G/N , entonces al conjugar un elemento h H por un elemento
g G se cumple hg N = (hN )gN H/N , luego hg H y as H E G. El
recproco es an
alogo.
4) Si H/N = H 0 /N , entonces H = p1 [H/N ] = p1 [H 0 /N ] = H 0 , luego la
correspondencia es inyectiva, y por 2) es suprayectiva.

6.5. Grupos cociente

221

Veamos un par de resultados adicionales muy u


tiles cuando se manejan grupos cociente.
Teorema 6.36 (Segundo teorema de isomorfa) Sea G un grupo, H G
y K E G. Entonces HK/K
= H/(H K).
n: Consideremos la aplicaci
Demostracio
on f : H HK/K dada por
f (h) = hK. Es claro que se trata de un homomorfismo de grupos. Adem
as es
un epimorfismo, pues un elemento de HK/K es de la forma hkK con h H y
k K, pero hkK = hK = f (h).
Un elemento h H est
a en N(f ) si y s
olo si h H y hK K, si y s
olo
si h H K, luego N(f ) = H K y por el teorema de isomorfa concluimos
HK/K
= H/(H K).
Teorema 6.37 (Tercer teorema de isomorfa) Consideremos un grupo G
y dos subgrupos K E G y K H E G. Entonces (G/K)/(H/K)
= G/H.
n: Un elemento de G/K es de la forma gK con g G, luego
Demostracio
un elemento cualquiera de (G/K)/(H/K) es de la forma (gK)(H/K). Adem
as
(gK)(H/K) = (1K)(H/K) si y s
olo si gK H/K, es decir, si y s
olo si g H.
Esto significa que la aplicaci
on f : G (G/K)/(H/K) definida mediante
f (g) = (gK)(H/K) es un epimorfismo de n
ucleo H, luego por el teorema de
isomorfa, (G/K)/(H/K)
= G/H.
Ejercicio: Enunciar y demostrar teoremas de isomorfa an
alogos para m
odulos.

El segundo teorema de isomorfa implica que si H y K son subgrupos de


un grupo finito G y K es normal, entonces |HK| = |H| |K|/|H K|. Vamos a
probar que esto sigue siendo cierto aunque ninguno de los subgrupos sea normal
y HK no sea un subgrupo.
Teorema 6.38 Sea G un grupo finito y H, K dos subgrupos de G. Entonces
|HK| =

|H| |K|
.
|H K|

n: Consideremos la aplicaci
Demostracio
on f : H K HK dada por
f (h, k) = hk. Obviamente es suprayectiva. Si f (h, k) = f (h0 , k0 ), entonces
hk = h0 k0 , luego u = (h0 )1 h = k0 k1 H K.
Hemos probado que si f (h, k) = f (h0 , k0 ), entonces (h0 , k0 ) = (hu, u1 k) para
cierto u H K. El recproco es trivialmente
Esto
significa que

cierto.
para
1
1
u H K , luego
cada
hk

HK
se
cumple
que
f
[hk]
=
(hu,
u
k)
1

f [hk] = |H K|.
En consecuencia, el n
umero de elementos de H K es igual al n
umero de
conjuntos de la forma f 1 [hk] (que es |HK|) multiplicado por el n
umero de
elementos de cada uno de estos conjuntos (que es |H K|), es decir, hemos
probado que |H| |K| = |HK| |H K|.

222

Captulo 6. Grupos

Ejemplo: Los grupos di


edricos finitos Consideremos de nuevo el grupo
diedrico infinito D = h0 , 0 i que hemos construido en la p
agina 210, donde
N = h0 i es un grupo cclico infinito y 00 = 01 . Los subgrupos de N son
cclicos, luego son los subgrupos Nn = h0n i, de modo que N = N1 . Se cumple
que Nn E D , puesNn0 = Nn (porque 0 conmuta con los elementos de Nn )
y Nn0 = h(0n )0 i = 0n = Nn .

Definimos el grupo diedrico de orden 2n como D2n = D / h0n i. Si llamamos


= 0 Nn , = 0 Nn , tenemos que D2n = h, i, donde n = 2 = 1 y = 1 .
Notemos que tiene orden n, pues si 0 < i < n no puede suceder que i = 1,
ya que esto equivale a que 0i h0n i, lo cual es absurdo. Igualmente, tiene
orden 2, ya que 0
/ N , luego en particular 0
/ Nn .
Como todo elemento de D se expresa como 0i 0j , con j = 0, 1, es claro
que todo elemento de D2n se expresa como i j , con i = 0, . . . , n 1, j = 0, 1.
0
0
Adem
as la expresi
on es u
nica, ya que si i j = i j entonces j = j 0 , pues en
0
caso contrario, si, por ejemplo, j = 0, j 0 = 1, tendramos que = ii y de
aqu se sigue que 0 N , contradicci
on. As pues, j = j 0 , lo que implica que
i
i0
0
= y por lo tanto i = i (pues suponemos que los exponentes son menores
que n).
En definitiva: D2n = {1, , . . . , n1 , , , . . . n1 } es realmente un grupo
de orden 2n, que contiene un subgrupo cclico hi de orden n (normal, por tener
ndice 2) y los elementos restantes, de la forma i , tienen todos orden 2.
Es f
acil ver que D2
= C2 y D4
= C2 C2 son abelianos, mientras que D2n
no es abeliano para n 3, ya que entonces 1 6= , por lo que la relaci
on
= 1 implica que y no conmutan.
El teorema siguiente nos permite identificar f
acilmente un grupo diedrico:
Teorema 6.39 Si G = h, i es un grupo de orden 2n tal que n = 2 = 1 y
= 1 , entonces G
= D2n .
n: Las relaciones = 1 y 1 = permiten reducir
Demostracio
todo elemento de G a la forma i j , con 0 i < n, 0 j < 1. Por lo tanto
G = {1, , . . . , n1 , , , . . . n1 }
y estos 2n elementos tienen que ser distintos dos a dos. Adem
as el producto en
G viene determinado por las relaciones:
i j = i+j ,

i j = ij ,

i j = i+j ,

i j = ij .

Esto hace que si dos grupos G = h, i y G0 = h 0 , 0 i cumplen las condiciones


del enunciado, la aplicaci
on f : G G0 dada por f ( i j ) = 0i 0j es un isomorfismo de grupos. Como el grupo D2n cumple las condiciones del enunciado,
cualquier otro grupo que las cumpla es isomorfo a el.
Observemos que 3 cumple las condiciones del teorema anterior con las
permutaciones = (1, 2, 3), = (1, 3), luego 3
= D6 .

6.5. Grupos cociente

223

Por otra parte, D8 es un grupo no abeliano de orden 8 distinto de Q8 , ya que


en Q8 hay seis elementos de orden 4 y uno de orden 2, mientras que en D8 hay
dos elementos de orden 4 y cinco de orden 2. En cambio, el grupo D8 definido
en la p
agina 215 es claramente isomorfo al grupo D8 que hemos definido aqu,
de modo que D8
= C4 ((1, 2)(3, 4)) 4 .
En general, es f
acil ver que n tiene un subgrupo isomorfo a D2n . Basta
tomar = (1, . . . , n) y = (1, n)(2, n 2) , de modo que = 1 . Es
f
acil ver entonces que h, i tiene orden 2n y cumple las hip
otesis del teorema
anterior.
Ya conocemos todos los grupos de orden 8:
Teorema 6.40 Todo grupo no abeliano de orden 8 es isomorfo a D8 o a Q8 .
n: Sea G un grupo no abeliano de orden 8. Un hecho elemenDemostracio
tal es que si un grupo tiene todos sus elementos de orden 2 entonces es abeliano.
En efecto, dados x, y G, tenemos que xy = (xy)1 = y 1 x1 = yx.
Por lo tanto, G tiene que tener un elemento de orden distinto de 2, y no
puede tener elementos de orden 8, porque entonces sera abeliano. Concluimos
que G tiene al menos un elemento x de orden 4. Sea N = hxi, que es un
subgrupo normal de G, porque tiene ndice 2. Explcitamente, tenemos que
N = {1, x, x2 , x3 }, donde o(x) = o(x3 ) = 4 y o(x2 ) = 2. Vamos a distinguir dos
casos:
1) En G existe otro elemento y de orden 2 distinto de x2 .
Entonces hxi hyi = 1, luego | hxi hyi | = 8, luego G = hxi hyi = hx, yi.
Como N E G, tenemos que xy N y tiene orden 4, pero no puede ser xy = x,
ya que entonces x e y conmutaran, luego G sera abeliano. Por consiguiente
xy = x1 y el teorema anterior nos da que G
= D8 .
2) En G no existen m
as elementos de orden 2.
Entonces, si y G \ N , necesariamente y tiene que tener orden 4 y x2 = y 2 ,
puesto que y 2 tiene orden 2. En particular | hxi hyi | = 2, luego | hxi hyi | = 8 y
G = hxi hyi = hx, yi. Sea z = xy. Entonces z
/ hxi, pues en tal caso y hxi, e
igualmente z
/ hyi, luego z es un nuevo elemento de orden 4 y z 2 = x2 = y 2 .
Vamos a llamar 1 = x2 = y 2 = z 2 , que claramente conmuta con x, y, z y
podemos llamar a su vez
x = (1)x = x(1) = x3 ,

y = (1)y = y(1) = y 3 ,

z = (1)z = z(1) = z 3 .

Como en el caso anterior, por la normalidad de N , se cumple que xy = x3 ,


luego xy = yx3 = yx, luego yx = z. Por otra parte yz = yxy = xy 2 = x, e
igualmente se comprueba que zy = x, zx = y, xz = y, y con esto ya es f
acil
probar que la biyecci
on obvia determina un isomorfismo G
Q
.
= 8
As pues, en total hay cinco grupos de 8:
C8 ,

C4 C2 ,

C2 C2 C2 ,

D8 ,

Q8 .

224

6.6

Captulo 6. Grupos

Las unidades de Z/nZ.

Estudiamos ahora los grupos Un de unidades del anillo Z/nZ. Observamos


en primer lugar que las unidades son f
aciles de identificar:
Teorema 6.41 Para cada n
umero natural n 1, se cumple que
Un = {[m] Z/nZ | (m, n) = 1}.
n: Si (m, n) = 1, por la relaci
Demostracio
on de Bezout existen enteros u,
v tales que um + vn = 1, luego [u][m] = 1, luego [m] Un . Si, por el contrario,
d | m, d | n con d > 1, entonces n = dn0 con 0 < n0 < n, luego [n0 ] 6= 0 y
[n0 ][m] = [n0 ][d][m0 ] = 0, luego [m] es un divisor de 0, luego [m]
/ Un .
El teorema 5.45 afirma en particular que si (m, n) = 1, entonces tenemos un
isomorfismo de Z-m
odulos
Z/mnZ
= (Z/mZ) (Z/nZ)
que viene dado por [x] 7 ([x], [x]). Pero es inmediato que se trata de un
isomorfismo de anillos si en el producto cartesiano de la derecha consideramos
el producto dado por (a, b)(c, d) = (ac, bd), y tambien es claro que las unidades
de este producto de anillos son los pares de unidades. Adem
as, un isomorfismo
de anillos se restringe a un isomorfismo entre los grupos de unidades de los
anillos, luego tenemos probado el teorema siguiente:
Teorema 6.42 Si m, n son n
umeros naturales primos entre s, entonces
Umn
= Um Un .
Por lo tanto, para conocer la estructura de los grupos de unidades basta estudiar los de la forma Upn , con p primo. Antes de ocuparnos de ello estudiaremos
una funci
on que nos aparecer
a en varios contextos:
Definici
on 6.43 La funci
on de Euler : N N es la que a cada n
umero
natural n le asigna el n
umero (n) de n
umeros naturales menores que n primos
con n.
Equivalentemente, (n) = |Un |.
Teorema 6.44 La funci
on de Euler est
a caracterizada por las propiedades siguientes:
(pn ) = (p 1)pn1 ,

si (m, n) = 1,

(mn) = (m)(n).

n: La segunda propiedad es consecuencia inmediata del teoDemostracio


rema anterior. En cuanto a la primera, los n
umeros naturales menores que pn
que no son primos con pn son los de la forma pm, con 0 m < pn1 , luego son
pn1 , luego (pn ) = pn pn1 = (p 1)pn1 .
As, por ejemplo, (1 000) = (23 )(53 ) = (2 1)22 (5 1)52 = 400.
He aqu un ejemplo en el que interviene la funci
on de Euler:

6.6. Las unidades de Z/nZ.

225

Teorema 6.45 Si G es un grupo cclico de orden n y m | n, entonces G tiene


exactamente (m) elementos de orden m.
n: Por 6.12 sabemos que G tiene un u
Demostracio
nico subgrupo H de
orden m, el cual contiene a todos los elementos de orden m. Si H = hhi, ese
mismo teorema nos da que o(hr ) = m/(m, r), luego o(hr ) = m si y s
olo si
(m, r) = 1, de donde es claro que hay (m) elementos de orden m.
Tambien sucede que un grupo cclico de orden n tiene (n) automorfismos.
De hecho, podemos precisar m
as:
Teorema 6.46 Si G es un grupo cclico de orden n, entonces Aut(G)
= Un .
n: No perdemos generalidad si suponemos que G = Z/nZ.
Demostracio
Entonces, cada u Un define un automorfismo u : G G definido por
u (x) = ux. La aplicaci
on Un Aut(G) dada por u 7 u es claramente
un homomorfismo. Es inyectivo, porque si u = 1 entonces u = u (1) = 1, y
es suprayectivo, porque si Aut(G), entonces (1) tiene que tener orden n,
luego por 6.12 tenemos3 que u = (1) Un , luego (1) = u (1) y esto implica
que = u , pues dos homomorfismos que coinciden en un generador son iguales.
Pasamos ya a estudiar la estructura de los grupos Un . Nuestro punto de
partida es el teorema 6.13, que nos da que si p es primo Up es cclico (ya que es
el grupo de unidades del cuerpo Z/pZ). Los generadores de Up se llaman races
primitivas m
odulo p.
Teorema 6.47 Sea p un primo impar y e 2. Entonces el grupo Upe es cclico
y un generador es [r(p + 1)], donde r es una cierta raz primitiva m
odulo p
(elegida adecuadamente).
n: Puesto que el orden de Upe es (pe ) = pe1 (p 1), basta
Demostracio
probar que [r] tiene orden p 1 y [p + 1] tiene orden pe1 .
Sea s una raz primitiva m
odulo p cualquiera. Entonces definimos
e1

r = sp

s (mod p),

con lo que r tambien es una raz primitiva m


odulo p. Adem
as
e1

[r]p1 = [s]p

(p1)

= [1],

pues el orden de cualquier elemento divide al orden del grupo.


Si [r]m = [1], entonces pe | rm 1, luego p | rm 1, luego p 1 | m (pues r
tiene orden p 1 m
odulo p). Esto prueba que el orden de [r] es p 1.
e2

Veamos por inducci


on sobre e 2 que (1 + p)p
1 + kpe1 (mod pe ),
para un cierto k (dependiente de e) tal que k 6 0 (mod p).
3 Tomamos g = 1 en 6.12, teniendo en cuenta que all
la notaci
on es multiplicativa y aqu
es aditiva. La conclusi
on es que (1) = r 1, donde n/(n, r) = n, luego r 1 = [r] Un .

226

Captulo 6. Grupos

Para e = 2 se cumple con k = 1.


e2
Supuesto cierto para e, tenemos (1 + p)p
= 1 + kpe1 + ape = 1 + tpe1 ,
donde t = k + ap 6 0 (mod p). Entonces
e1

(1 + p)p

= (1 + tpe1 )p = 1 + ptpe1 + + tp pp(e1) .

Como p > 2 y e 2, esta expresi


on es de la forma 1 + tpe + bpe+1 , luego
e1
(1 + p)p
1 + tpe (mod pe+1 ), con t 6 0 (mod p).
e1

Por lo tanto al tomar clases m


odulo pe resulta [1 + p]p
= [1], luego el
orden de la clase [1 + p] ha de ser un divisor de pe1 . Si el orden fuera menor
e2
que pe1 , entonces tendramos que [1 + p]p
= [1], o sea, [kpe1 ] = [0], luego
p | k, contradicci
on. Por lo tanto el orden de [1 + p] es exactamente pe1 .
El teorema anterior no es v
alido para p = 2. Obviamente U2 = 1 y U4
= C2 .
Para potencias mayores la situaci
on es la siguiente:
Teorema 6.48 Si e 3, entonces U2e
= C2 C2e2 . Un generador del primer
factor es [1] y un generador del segundo es [5], es decir, todo elemento de U2e
se expresa de forma u
nica como [5]j , donde j = 0, . . . , 2e2 1.
El orden de U2e es 2e1 . Claramente [1] tiene orden 2. Una simple inducci
on muestra que para e 3
e3

52
e3

de donde [5]2

e3

= (1 + 22 )2

1 + 2e1

(mod 2e ),

6= [1], mientras que


e2

52

(1 + 2e1 )2 1 (mod 2e ),

luego el orden de [5] es 2e2 .


Por otra parte [1] no es una potencia de [5], ya que si se cumpliera 2e | 5r +1
para alg
un r, entonces 4 | 5r + 1, pero m
odulo 4 es [5]r = [1]r = [1] 6= [1].


De este modo, los subgrupos
intersecci
on trivial, luego
[1]
y [5]
tienene1
su suma es directa. As pues, [1] [5] tiene 2
elementos y por consiguiente es todo el grupo U2e .
Por ejemplo, U3000
= U8 U3 U125
= C2 C2 C2 C124 .

6.7

Grupos alternados

Vamos a ver ahora que cada grupo n tiene un u


nico subgrupo de ndice 2
que ya conocemos para el caso de 4 (y trivialmente en 2 y 3 ). Para probar
su existencia en general necesitamos una definici
on un tanto tecnica:

Definici
on 6.49 Sea n 2, sea Pn = {i, j} 1 i < j n . Para cada
permutaci
on n y cada b = {i, j} con 1 i < j n, sea

1 si (i) < (j)


(, b) =
1 si (j) < (i)

6.7. Grupos alternados

227

Llamaremos signatura de a
sig =

bPn

(, b) {1, 1}.

Las permutaciones de signatura 1 se llaman permutaciones pares. Las de signatura 1 se llaman impares.
Enseguida daremos una interpretaci
on sencilla de este concepto. Primero
conviene probar lo siguiente:
Teorema 6.50 Sea n 2. Entonces la aplicaci
on sig : n {1, 1} es un
homomorfismo de grupos.
n: Sean
Demostracio
acil comprobar que
, n y sea b Pn . Es f
(, b) = (, b) , [b] . Como la aplicaci
on Pn Pn dada por b 7 [b] es
biyectiva, se cumple que

Q
Q
sig( ) =
(, b) =
(, b) , [b]
bPn

bPn

Q
Q
Q
Q
=
(, b)
, [b] =
(, b)
(, b) = (sig )(sig ).
bPn

bPn

bPn

bPn

Consideremos la trasposici
on (1, 2) n . Es claro que (1, 2), b = 1 si y
s
olo si b = {1, 2}, luego sig(1, 2) = 1. M
as a
un, todas las trasposiciones son
conjugadas (por el teorema 6.21), y obviamente
sig( ) = (sig )sig = sig ,
pues {+1, 1} es un grupo abeliano. Esto implica que todas las trasposiciones
tienen signatura 1. Si unimos esto al teorema anterior y al teorema 6.17,
tenemos probado el teorema siguiente:
Teorema 6.51 Una permutaci
on es par o impar si y s
olo si se descompone en
un n
umero par o impar de trasposiciones, respectivamente.
No podamos tomar esto como definici
on porque requiere probar que una
misma permutaci
on no puede descomponerse a la vez en producto de un n
umero
par y de un n
umero impar de trasposiciones, cosa que ha quedado probada
implcitamente.
Es f
acil reconocer la signatura de una permutaci
on descompuesta en ciclos.
Basta recordar que, seg
un la prueba de 6.17 5), un ciclo de longitud m se
descompone en m1 trasposiciones, luego un ciclo es par si y s
olo si su longitud
es impar.
Definici
on 6.52 Llamaremos grupo alternado de grado n al grupo An formado
por las permutaciones pares de n , es decir, al n
ucleo del homomorfismo sig.

228

Captulo 6. Grupos

Por el teorema de isomorfa, n /An


= {1, 1}, luego |n : An | = 2, es decir,
|An | = n!/2. Notemos que esto vale en realidad para n 2, pues en 1 = 1 no
hay permutaciones impares.
Claramente A2
= 1, A3
= C3 y A4 es el grupo de 12 elementos que ya
hemos estudiado. Es no abeliano, y no es isomorfo a D12 , porque D12 tiene un
subgrupo de orden 6, mientras que hemos visto que A12 no lo tiene.

6.8

p-grupos

Todos los teoremas que hemos demostrado hasta aqu (salvo el teorema de
estructura de los grupos abelianos finitos) son meras consecuencias sencillas de
las definiciones que hemos dado. A partir de aqu vamos a demostrar algunos
resultados no triviales sobre grupos finitos que aplicaremos en diversas ocasiones.
En esta secci
on estudiamos los p-grupos, es decir, los grupos de orden potencia
de primo. Para ello conviene introducir un concepto:
Definici
on 6.53 Llamaremos centro de un grupo G al conjunto Z(G) de los
elementos de G que conmutan con todos los elementos de G, es decir:
Z(G) = {g G | CG (g) = G}.
Es claro que Z(G) E G y que G es abeliano si y s
olo si Z(G) = G.
Por ejemplo, es f
acil comprobar que Z(Q8 ) = {1} y que Z(A4 ) = 1.
Teorema 6.54 Si n 3, entonces Z(n ) = 1 y

1
si n es impar,
Z(D2n ) = n/2

si n es par.

n: Sea n tal que 6= 1. Esto significa que existen


Demostracio
i, j In tales que (i) = j, i 6= j. Como n 3 existe un k In distinto de i,
j. Entonces (jk) (i) = k , luego (jk) 6= 1, luego no conmuta con (jk), luego

/ Z(n ).
En D2n tenemos que i = i si y s
olo si i1 = i+1 , si y s
olo si
2 = 1, lo cual no puede suceder si n 3, luego i
/ Z(D2n ).
En cambio, i = i si y s
olo si i = i , si y s
olo si 2i = 1, lo cual, si
n/2
1 i < n, s
olo puede ser si n = 2i, y en tal caso
Z(D2n ), pues hemos
visto que conmuta con , y obviamente conmuta con .
Ejercicio: Probar que si n es impar D4n
= D2n C2 .

En particular, los dos grupos no abelianos que conocemos de orden 8, es


decir, D8 y Q8 tienen el centro de orden 2. Vamos a ver que esto no es casual.
Para ello probamos un resultado general:

6.8. p-grupos

229

Teorema 6.55 (Ecuaci


on de clases) Si G es un grupo finito no abeliano,
existen elementos x1 , . . . , xn G tales que CG (xi ) 6= G y
|G| = |Z(G)| +

n
P

i=1

|G : CG (xi )|.

n: Sean x1 , . . . , xm un representante de cada clase de conDemostracio


jugaci
on de G. Podemos suponer que las clases de x1 , . . . , xn tienen m
as de
un elemento cada una, mientras que las de xn+1 , . . . , xm tienen un solo elemento. Pero cl(x) = {x} es equivalente a x Z(G), luego tenemos que
Z(G) = {xn+1 , xn }. Ahora basta tener en cuenta que
|G| =

m
P

i=1

|cl(xi )| = |Z(G)| +

donde |G : CG (xi )| 6= 1.

n
P

i=1

|cl(xi )| = |Z(G)| +

n
P

i=1

|G : CG (xi )|.

De aqu se sigue inmediatamente:


Teorema 6.56 Si p es un primo y G es un p-grupo (un grupo de orden potencia
de p), entonces Z(G) 6= 1.
n: Basta considerar la ecuaci
Demostracio
on de clases para G, en la que
p divide tanto a |G| como a cada |CG (xi )|, luego p | |Z(G)|, y esto implica que
Z(G) 6= 1.
En el caso de los grupos no abelianos de orden 8, en principio su centro
podra tener 2 o 4 elementos, pero el teorema siguiente descarta el segundo
caso:
Teorema 6.57 Si un grupo G cumple que G/Z(G) es cclico, entonces G es
abeliano, luego |G : Z(G)| no puede ser un n
umero primo.
n: Sea G/Z(G) = hgZ(G)i. Entonces, todo x G cumple
Demostracio
que xZ(G) = g n Z(G), luego x = g n z, con z Z(G), pero es claro que dos
elementos de esta forma conmutan, luego G es abeliano.
As pues, el centro de todo grupo de orden p3 tiene que tener orden p. M
as
a
un:
Teorema 6.58 Si p es primo, todo grupo de orden p o p2 es abeliano.
n: Ya sabemos que todo grupo de orden p es isomorfo a
Demostracio
Cp . Si G tiene orden p2 , los dos teoremas anteriores nos dan que Z(G) 6= 1 y
|Z(G)| 6= p, luego Z(G) = G.
As pues, todos los grupos de ordenes 1, 2, 3, 4, 5, 7, 9, 11, 13 son abelianos y
son todos de la forma Cp o bien Cp Cp .
El teorema siguiente nos ser
au
til en varias ocasiones:

230

Captulo 6. Grupos

Teorema 6.59 Si p es un primo, todo p-grupo posee subgrupos de todos los


grupos que dividen a su orden.
n: Sea |G| = pn . Vamos a probar que G cumple el resultado
Demostracio
por inducci
on sobre n. Si n = 1 entonces G es cclico y no hay nada que probar.
Si vale para grupos de orden pm con m < n distinguimos dos casos: si G es
abeliano ya sabemos que cumple el teorema. En caso contrario, |Z(G)| = pr ,
con r > 0 luego |G/Z(G)| = pnr . Por hip
otesis de inducci
on G/Z(G) tiene un
subgrupo H/Z(G) de orden pi , para todo i n r, luego |H| = pi+r . Esto
prueba que G tiene subgrupos de todos los ordenes pi con r i n, pero como
Z(G) es abeliano, tiene subgrupos de orden pi para 0 i r, luego G tambien.
En particular todo p-grupo tiene un subgrupo de ndice p. Vamos a probar
que tales subgrupos tienen que ser normales, lo cual es consecuencia de un
resultado m
as general. Para demostrarlo introducimos una acci
on que usaremos
con frecuencia:
Definici
on 6.60 Si G es un grupo y H G, definimos la acci
on por multiplicaci
on de G sobre el conjunto = (G/H)d como la dada por (Hg)g 0 = H(gg 0 ).
Claramente se trata de una acci
on, luegoTdetermina un homomorfismo de
grupos : G cuyo n
ucleo es N( ) =
Hg.
gG

En efecto, x N( ) si y s
olo si para todo g G se cumple que Hgx = Hg,
lo cual equivale a que gxg 1 H, o tambien a que x H g , para todo g G.
En particular, N( ) H.
Por ejemplo, tomando H = 1 obtenemos esta consecuencia:
Teorema 6.61 Todo grupo finito es isomorfo a un subgrupo de un grupo n .

Pero el resultado que perseguamos es el siguiente, que generaliza al hecho


de que los subgrupos de ndice 2 son normales:
Teorema 6.62 Sea G un grupo finito y H un subgrupo tal que |G : H| = p sea
el menor primo que divide a |G|. Entonces H E G.
n: Sea = (G/H)d y : G el homomorfismo asoDemostracio
ciado a la acci
on por multiplicaci
on. Sea N = N( ) E G. Se cumple que
N H G. Por el
teorema de isomorfa G/N
es isomorfo a un subgrupo de
, luego |G : N | p!, pero tambien |G : N | |G| y p es el menor primo que
divide a |G|. Es claro
entonces que |G : N | = p (no puede ser |G : N | = 1
porque p = |G : H| |G : N |). Ahora bien, si N H G y los dos tienen
ndice p, tiene que ser H = N E G.

6.9. Los teoremas de Sylow

6.9

231

Los teoremas de Sylow

Terminamos este captulo con unos resultados fundamentales sobre existencia de subgrupos en grupos finitos. Hemos visto que el grupo alternado A4
tiene orden 12, pero no tiene subgrupos de orden 6. Sin embargo, ahora vamos
a probar que todo grupo finito tiene subgrupos de cualquier orden potencia de
primo que divida a su orden. Para ello conviene dar esta definici
on:
Definici
on Sea G un grupo finito y p un n
umero primo. Sea |G| = pn m,
con (p, m) = 1 (quiz
a con n = 0). Un subgrupo H de G de orden pn se llama
p-subgrupo de Sylow de G.
Teorema 6.63 (Primer teorema de Sylow) Si G es un grupo finito y p un
n
umero primo, entonces G tiene un p-subgrupo de Sylow.
n: Por inducci
Demostracio
on sobre el orden de G. Si G tiene orden 1
es obvio. Supongamos que todos los grupos de orden menor que |G| tienen
p-subgrupos de Sylow y demostremos que G tambien los tiene.
Si p - |G|, entonces el subgrupo trivial es un p-subgrupo de Sylow de G.
Supongamos, pues, que p |G|. Sea |G| = pn m, con (p, m) = 1.
Distinguimos dos casos:

Caso 1 Existe un subgrupo H < G tal que p - |G : H|.

Entonces pn | |H| y por hip


otesis de inducci
on H tiene un p-subgrupo de
Sylow P de orden pn , y as, P es tambien un p-subgrupo de Sylow de G.
Caso 2 Para todo subgrupo H < G, se cumple que p | |G : H|.

Entonces la ecuaci
on de clases nos da que p |Z(G)|. Como se trata de un
grupo abeliano, tiene un elemento de orden p o, lo que es lo mismo, tiene un
subgrupo H Z(G) de orden p. Como los elementos de H conmutan con todos
los elementos de G, es evidente que H g = H para todo g G, o sea, H E G.
Se cumple que |G/H| = pn1 m y tiene un subgrupo de Sylow P/H que
cumplir
a |P/H| = pn1 , luego |P | = pn , es decir, P es un subgrupo de Sylow
de G.
Como todo p-grupo tiene subgrupos de todos los ordenes posibles, es claro
que, tal y como habamos anunciado, todo grupo finito tiene subgrupos de
todos los ordenes potencia de primo que dividan a su orden. Veamos algunas
aplicaciones:
Teorema 6.64 Si p es un primo impar, todo grupo no abeliano de orden 2p es
isomorfo a D2p .
n: Sea G un grupo no abeliano de orden 2p. Por el teorema de
Demostracio
Sylow tiene que tener un elemento x de orden p y otro y de orden 2. Entonces
hxi hyi = 1, luego | hxi hyi | = 2p, luego G = hx, yi. El grupo N = hxi es
normal, porque tiene ndice 2, luego xy N . Pongamos que xy = xi . Entonces

232

Captulo 6. Grupos
2

x = xy = (xy )y = xi , luego i2 1 (mod p), luego i = 1, pero si i = 1


entones xy = x y G sera abeliano, luego xy = x1 , luego G
= D2p por 6.39.
En particular, todo grupo de orden 6 es isomorfo a C6 o a D6
= 3 .
Teorema 6.65 Si p < q son primos y p - q 1, entonces todo grupo de orden pq
es cclico. Por ejemplo, todo grupo de orden 15 es cclico.
n: Sea G un grupo de orden pq y sea N E G un q-subgrupo
Demostracio
de Sylow, que es normal por 6.62. Sea H un p-subgrupo de Sylow. Entonces
N H = 1, luego |N H| = pq, luego G = N H. Consideramos el homomorfismo
f : H Aut(N ) que a cada h H le asigna la conjugaci
on por h. Por 6.46
tenemos que |Aut(N )| = q 1, luego N(f ) 6= 1, luego N(f ) = H, y esto significa
que si n N y h H entonces nh = n, es decir, que N y H conmutan elemento
a elemento, luego G es abeliano, luego es cclico.
La tabla siguiente contiene todos los subgrupos de cada orden posible entre
2 y 15. El u
nico caso que no tenemos demostrado es el correspondiente a los
subgrupos de orden 12, donde aparece un grupo Q12 que no conocemos:
orden
grupos
2
C2
3
C3
4
C4 , C2 C2
5
C5
6
C6 , D6
= 3
7
C7
8
C8 , C4 C2 , C2 C2 C2 ,
D8 , Q8

orden
grupos
9
C9 , C3 C3
10
C10 , D10
11
C11
12
C12 , C6 C2 , A4 , D12 , Q12
13
C13
14
C14 , D14
15
C15

Antes de ocuparnos de ese caso conviene refinar un poco el teorema de Sylow:


Teorema 6.66 (Segundo teorema de Sylow) Si G es un grupo finito, todo
p-subgrupo de G est
a contenido en un p-subgrupo de Sylow y dos p-subgrupos de
Sylow cualesquiera son conjugados.
n: Sea P un p-subgrupo de Sylow de G y sea Q un p-subgrupo
Demostracio
arbitrario. Entonces Q act
ua sobre = (G/P )d por multiplicaci
on a derecha.
El teorema 6.15 nos da que las orbitas de los elementos de G/P tienen cardinal
potencia de p, sin excluir la posibilidad de que alguna tenga cardinal p0 = 1.
De hecho, concluimos que alguna orbita ha de tener cardinal igual a 1, pues,
de lo contrario, el cardinal de , que es |G : P |, sera suma de potencias (no
triviales) de p, luego sera m
ultiplo de p.
As pues, existe un g G tal que la clase x = P g forma una orbita trivial,
con x como u
nico elemento. M
as explcitamente, P gq = P g para todo q Q.
En particular gq P g, luego q P g , para todo q Q. Concluimos que Q P g
y P g es tambien un subgrupo de Sylow de G.

6.9. Los teoremas de Sylow

233

Si Q es tambien un p-subgrupo de Sylow de G, entonces ha de darse la


igualdad Q = P g , pues tenemos una inclusi
on y ambos grupos tienen el mismo
orden.
As pues, los p-subgrupos de Sylow forman una orbita en la acci
on de G por
conjugaci
on en el conjunto de todos sus subgrupos, luego si P es un p-subgrupo
de Sylow, el n
umero total de ellos es |G : NG (P )|, que es un divisor del orden de
G (e incluso de |G : P |). En particular G tiene un u
nico p-subgrupo de Sylow
si y s
olo si tiene un p-subgrupo de Sylow normal.
Grupos de orden 12 Sea G un grupo no abeliano de orden 12. Sea P3 un
3-subgrupo de Sylow. Supongamos que no es normal. Entonces la acci
on por
multiplicaci
on de G sobre el conjunto = (G/P3 )d determina un homomorfismo
: G tal que N() P3 . Como P3 no es normal, tiene que ser N() = 1,
luego G es isomorfo a un subgrupo de 4 de orden 12, luego G
= A4 .
A partir de aqu suponemos que P3 E G, con lo que P3 = {1, x, x2 } es el
u
nico 3-Sylow de G y x, x2 son los u
nicos elementos de orden 3 de G.
Entonces G act
ua por conjugaci
on sobre P3 , luego |G : CG (x)| 2, ya que
cl(x) {x, x2 }. As pues, CG (x) tiene orden 6 o 12. En cualquier caso hay un
y CG (x) de orden 2, luego a = xy tiene orden 6. Sea N = hai E G (es normal
porque tiene ndice 2).
Un elemento b G \ N tiene que tener orden 2, 4, 6 (no puede tener orden 3
porque ya hemos visto que no hay m
as elementos de orden 3 ni 12, porque
entonces G sera abeliano). Si tiene orden 6, entonces | hbi N | = 3, pues la
intersecci
on tiene que contener a los elementos de orden 3, luego b3
/ N y tiene
orden 2. As pues, cambiando b por b3 si es preciso podemos tomar un b G \ N
de orden 2 o 4. Si o(b) = 4, entonces, como no puede ser N hbi = 1 (ya que
entonces |N hbi | = 24), tiene que ser b2 N . En ambos casos G = ha, bi.
Veamos que ab = a1 . En efecto, con N E G, tenemos que ab = ai , para
2
2
cierto i, de modo que a = ab = ai , luego i2 1 (mod 6), y considerando las
seis clases de Z/6Z, vemos que esto s
olo puede ocurrir si ab = a o ab = a1 . En
el primer caso G sera abeliano, luego concluimos que ab = a1 . Si o(b) = 2 el
teorema 6.39 nos da que G
= D12 . Si o(b) = 4, entonces tenemos que
G = ha, bi , con

a6 = b4 = 1,

a3 = b2 ,

ab = a1 .

Sucede que estas propiedades determinan completamente a un grupo Q12 ,


en el sentido de que, por una parte, existe un grupo de orden 12 que cumple
estas condiciones y, por otra parte, dos grupos de orden 12 que las cumplan son
isomorfos entre s.
Dejamos al lector comprobar los detalles: los elementos de un grupo de orden
12 en estas condiciones se expresan de forma u
nica como ai bj , con i = 0, . . . , 5,
j = 0, 1, y el producto de dos de ellos se describe exactamente igual a como
hemos hecho en el teorema 6.39 con el grupo diedrico.

234

Captulo 6. Grupos

Para probar que realmente existe un grupo que cumple estas condiciones
consideramos el cuerpo ciclot
omico Q[] de orden 3, donde 3 = 1 y las matrices

0
0 1
a=
,
b
=
.
0 2
1 0
El grupo G = ha, bi cumple lo requerido.
Terminamos esta captulo con algunos resultados que terminan de perfilar
la teora de Sylow:
Teorema 6.67 (Tercer teorema de Sylow) El n
umero p de p-subgrupos de
Sylow de un grupo finito cumple p 1 (mod p).
n: Sea G un grupo finito, sea el conjunto de sus subgrupos
Demostracio
de Sylow, sea P y consideremos la acci
on de P en por conjugaci
on.
Obviamente, P g = P para todo g P , luego la orbita de P es trivial. Veamos
que es la u
nica. Si Q , cumple que Qg = Q para todo g P , entonces
P NG (Q), pero entonces P y Q son p-subgrupos de Sylow de NG (Q), luego
son conjugados en NG (Q), es decir, existe g NG (Q) tal que P = Qg = Q.
Las orbitas que P forma en tiene cardinal potencia de P , y hemos visto
que la u
nica que tiene cardinal 1 es la de p, luego p = || 1 (mod p).
Ejemplo Todo grupo de orden 42 tiene un u
nico 7-subgrupo de Sylow, que es,
por consiguiente, normal.
En efecto, el n
umero de 7-subgrupos de Sylow tiene que dividir a 6 y ser
congruente con 1 m
odulo 7, luego tiene que ser 7 = 1.
Ejemplo

Todo subgrupo de orden 30 tiene un subgrupo de Sylow normal.

En efecto, como en el ejemplo anterior vemos que 3 = 1, 10, y que 5 = 1, 6.


Ahora bien, si fuera 3 = 10 y 5 = 6, el grupo tendra que tener 10 2 = 20
elementos de orden 3 y 6 4 = 24 elementos de orden 5, lo que suma 44, m
as
que el total de elementos del grupo. Por lo tanto, o bien hay un 3-Sylow, o bien
un 5-Sylow normal.
Teorema 6.68 Si G es un grupo finito, N E G y P es un p-subgrupo de Sylow
de G, entonces P N es un p-subgrupo de Sylow de N y N P/N es un p-subgrupo
de Sylow de G/N .
n: Si P 0 es un p-subgrupo de Sylow de N , entonces P 0 P 00 ,
Demostracio
para cierto p-subgrupo de Sylow P 00 de G, y existe un g G tal que P 00g = P ,
luego P 0g P 00g N g = P N y P N es un p-subgrupo de N que contiene un
p-subgrupo de Sylow de N , luego P N = P 0g es un p-subgrupo de Sylow de N .
La segunda parte se deduce f
acilmente de que |N P/N | = |P : N P |.

Captulo VII

Extensiones de cuerpos
Con la teora de espacios vectoriales y la teora de grupos como herramientas, estamos en condiciones de profundizar notablemente en el estudio de los
anillos que nos han
ido apareciendo
en captulos anteriores, tales como los cuer
pos cuadr
aticos Q 5 o los cuerpos ciclot
omicos Q[]. De momento nos
ocuparemos s
olo
de
los
cuerpos
y
dejaremos
para
m
as adelante el estudio de los

anillos como Z 5 o Z[], pues en este captulo usaremos fuertemente las
propiedades de los espacios vectoriales.

7.1

Extensiones algebraicas

Definici
on 7.1 Diremos que K/k es una extensi
on de cuerpos (o simplemente
una extensi
on) si K es un cuerpo y k es un subcuerpo de K. El cuerpo k se
llama cuerpo base de la extensi
on.
La primera observaci
on importante es que si K/k es una extensi
on, entonces
K es un kespacio vectorial con las operaciones obvias. Llamaremos grado de
la extensi
on a la dimensi
on de K como kespacio vectorial. Lo representaremos
por |K : k|. Una extensi
on es finita o infinita seg
un lo sea su grado.


Por ejemplo, Q 5 : Q = 2, pues una base de Q 5 como Qespacio

vectorial est
a formada por los n
umeros 1 y 5. Los resultados vistos en la
secci
on 4.6
omicos Q[] para un primo p nos dan que

sobre los cuerpos ciclot


Q[] : Q = p1, pues una base de Q[] como Qespacio vectorial es la formada
por 1, , . . . , p2 .

Nos van a interesar especialmente las extensiones finitas, aunque tendremos


ocasi
on de trabajar con algunas infinitas. El resultado siguiente es fundamental
en todo lo que sigue:
Teorema 7.2 (Teorema de transitividad de grados) Sea k K L una
cadena de extensiones de cuerpos. Entonces |L : k| = |L : K| |K : k|.
235

236

Captulo 7. Extensiones de cuerpos

Lo probaremos para extensiones finitas, aunque el caso general se prueba sin


ning
un cambio importante.
n: Sea {x1 , . . . , xm } una base de K como kespacio vectorial.
Demostracio
Sea {y1 , . . . , yn } una base de L como Kespacio vectorial. Basta probar que el
conjunto
{xi yj | i = 1, . . . , m, j = 1, . . . , n}
es una base de L como kespacio vectorial con exactamente mn elementos.
n P
m
P
Supongamos que
aij xi yj = 0 para ciertos coeficientes aij en k. Enj=1 i=1

tonces, para cada j, se cumple que

m
P

i=1

aij xi K y como {y1 , . . . , yn } es una

base de L sobre K, podemos concluir que

m
P

aij xi = 0 para cada j. Ahora,

i=1

al ser {x1 , . . . , xm } una base de K sobre k, podemos concluir que todos los
coeficientes aij son nulos.
Esto prueba que los xi yj son distintos para ndices distintos y que forman
un conjunto linealmente independiente. En particular tiene mn elementos.
Ahora sea z cualquier elemento de L. Como {y1 , . . . , yn } es una base de L
n
P
sobre K, existen elementos b1 , . . . , bn en K tales que z =
bj yj . A su vez,
j=1

cada elemento bj se expresa como combinaci


on lineal bj =

m
P

aij xi para ciertos

i=1

coeficientes aij en k.
n P
m
P
Por tanto z =
aij xi yj es combinaci
on lineal de los elementos xi yj ,
j=1 i=1

que son, pues un generador de L.

En particular una extensi


on finita de una extensi
on finita es una extensi
on
finita del cuerpo menor. Ahora introducimos el concepto m
as importante de
este captulo:
Definici
on 7.3 Sea K/k una extensi
on y a K. Se dice que el elemento a es
algebraico sobre k si existe un polinomio p(x) k[x] no nulo tal que p(a) = 0.
En caso contrario se dice que es trascendente sobre k.
La extensi
on K/k es algebraica si todos los elementos de K son algebraicos
sobre k. En caso contrario se dice que es trascendente.
Por ejemplo, todo elemento a del cuerpo
base es algebraico, pues es raz del

polinomio x a k[x]. El n
umero 5 es raz de x2 + 5 Q[x], luego es
algebraico sobre Q. Por el contrario, en la extensi
on Q(x)/Q, el elemento x es
obviamente trascendente.
Puede parecer fuerte la exigencia de que todos los elementos de una extensi
on
sean algebraicos, pero en realidad se cumplir
a en todos los casos que vamos a
manejar. De ello es responsable en gran parte el teorema siguiente:
Teorema 7.4 Toda extensi
on finita es algebraica.

7.1. Extensiones algebraicas

237

n: Sea K/k una extensi


Demostracio
on finita de grado n y sea a K.
Consideremos las potencias
1,

a,

a2 ,

...

an .

Si hay dos iguales, digamos ai = aj con i 6= j, entonces a es raz del polinomio


no nulo xi xj k[x].
Si son distintas, son n + 1 elementos distintos de un espacio vectorial de dimensi
on n, luego no pueden ser linealmente independientes. Existen coeficientes
b0 , . . . , bn en k no todos nulos de modo que b0 + b1 a + + bn an = 0, con lo que
a es raz del polinomio no nulo b0 + b1 x + + bn xn k[x].

Por ejemplo, consideremos el elemento 1 + 5 Q 5 . Como la ex


tensi
on Q 5 /Q tiene grado 2, siguiendo la prueba del teorema anterior es

suficiente considerar las potencias 1, 1 + 5, (1 + 5 )2 = 4 + 2 5. Hay


que buscar n
umeros racionales a, b, c que cumplan

a + b(1 + 5) + c(4 + 2 5 ) = a + b 4c + (b + 2c) 5 = 0,


lo que equivale a que a
+ b 4c = 0 = b + 2c. Por ejemplo sirven c = 1, b = 2
y a = 6. As pues, 1 + 5 es raz del polinomio 6 2x + x2 Q[x].
Introducimos ahora en general una notaci
on que venimos empleando desde
hace tiempo en muchos casos particulares. Se trata de una forma muy c
omoda
de describir extensiones de un cuerpo a partir de elementos generadores:
Definici
on 7.5 Sea B un dominio ntegro y A un subanillo unitario. Sea S un
subconjunto de B. Llamaremos A[S] a la intersecci
on de todos los subanillos de
B que contienen a A y a S.
Es f
acil probar que
A[S] = {p(a1 , . . . , an ) | n N, p(x1 , . . . , xn ) A[x1 , . . . , xn ], a1 , . . . , an S},
pues este conjunto es ciertamente un subanillo de B que contiene a A y a S,
luego contiene a A[S], y por otra parte, como A[S] es un anillo, ha de contener
a todos los elementos de la forma p(a1 , . . . , an ).
Sea ahora K un cuerpo y k un subcuerpo de K. Si S es un subconjunto de K,
llamaremos k(S) a la intersecci
on de todos los subcuerpos de K que contienen
a k y a S. Se prueba igualmente que

p(b1 , . . . bn )
k(S) =
| n N, p, q k[x1 , . . . , xn ], bi S, q(b1 , . . . , bn ) 6= 0 .
q(b1 , . . . bn )
El cuerpo k(S) se llama adjunci
on a k de S. Cuando S = {b1 , . . . , bn } es un
conjunto finito escribiremos tambien
A[b1 , . . . , bn ]

k(b1 , . . . , bn ).

238

Captulo 7. Extensiones de cuerpos

Notemos que A[S T ] = A[S][T ] y k(S T ) = k(S)(T ). En particular


A[b1 , . . . , bn ] = A[b1 ] . . . [bn ]

k(b1 , . . . , bn ) = k(b1 ) . . . (bn ).

Observemos que la notaci


on A[S] y k(S) para los anillos de polinomios y los
cuerpos de fracciones algebraicas que venimos utilizando es un caso particular
de la que acabamos de introducir.
en son casos particulares los nombres
Tambi

que hemos dado a los anillos Z 5 , etc.


Una extensi
on K/k es finitamente generada si K = k(S), para un conjunto
finito S K. Si K = k(a) la extensi
on es simple. Todo a que cumpla esto (que
no es u
nico) se llama elemento primitivo de la extensi
on.
Es f
acil ver que toda extensi
on finita es finitamente generada, pues si S es
una kbase de K es claro que K = k[S] = k(S).

Ejercicio: Probar que Q( 2, 3 ) = Q( 2 + 3 )

Las extensiones algebraicas tienen un comportamiento y una estructura muy


simples. Sus propiedades b
asicas son consecuencia del teorema siguiente. Es
de destacar que en la prueba hacemos uso de los principales resultados que
conocemos sobre anillos de polinomios y divisibilidad.
Teorema 7.6 Sea K/k una extensi
on y a K un elemento algebraico sobre k.
Entonces:
1. Existe un u
nico polinomio m
onico irreducible p(x) k[x] tal que p(a) = 0.
2. Un polinomio g(x) k[x] cumple g(a) = 0 si y s
olo si p(x) | g(x).

3. k(a) = k[a] = r(a) | r(x) k[x] y grad r(x) < grad p(x) .

n: Consideremos el epimorfismo : k[x] k[a] dado por


Demostracio
(g(x)) = g(a). El hecho de que a sea algebraico significa que N() es un ideal
no nulo y, como
k[x] es DIP, existe un polinomio no nulo p(x) k[x] tal que
N() = p(x) . Como las constantes son unidades, podemos exigir que p(x) sea
m
onico (al dividir por el coeficiente director obtenemos un asociado que genera
el mismo ideal).

Por el teorema de isomorfa, k[x]/ p(x)


= k[a], que es un dominio ntegro,
luego el ideal (p(x)) es primo, y por 3.17 es maximal, luego p(x) es irreducible
y k[x]/ p(x) es un cuerpo. Por lo tanto k[a] resulta ser un cuerpo, de donde se
sigue que k[a] = k(a).
El polinomio p es u
nico,
pues

si q(x) tambien cumple 1), entonces q(a) = 0,


es decir, q(x) N() = p(x) , luego p(x) | q(x), pero si q(x) es irreducible han
de ser asociados, es decir, difieren en una constante, y al ser ambos m
onicos
deben coincidir.

El apartado 2) es consecuencia de que N() = p(x) . Respecto a 3), un


elemento de k[a] es de la forma q(a) con q(x) k[x]. Existen polinomios c(x)
y r(x) tales que q(x) = p(x)c(x) + r(x) y grad r(x) < grad p(x). Entonces
q(a) = p(a)c(a) + r(a) = 0 c(a) + r(a) = r(a), luego tiene la forma pedida.

7.1. Extensiones algebraicas

239

Definici
on 7.7 Sea K/k una extensi
on y a K un elemento algebraico sobre k.
Llamaremos polinomio mnimo de a sobre k al polinomio pol mn(a, k) k[x]
que cumple el teorema anterior.
As pues, pol mn(a, k) es el menor polinomio no nulo de k[x] que tiene a a
por raz, en el sentido de que divide a cualquier otro que cumpla lo mismo.
El teorema siguiente precisa un poco m
as los resultados que hemos obtenido:
Teorema 7.8 Sea K/k una extensi
on y a K un elemento algebraico sobre k.
Sea p(x) = pol mn(a, k). Entonces:
1. La extensi
on k(a)/k es finita y |k(a) : k| = grad p(x).
2. Una base de k(a) sobre k es {1, a, . . . , an1 }, donde n = grad p(x).
n: El teorema 7.6 3) afirma que {1, a, . . . , an1 } es un geneDemostracio
rador de k(a) como kespacio vectorial. Por otra parte ha de ser libre, pues una
combinaci
on lineal de sus elementos no es sino un polinomio q(a) con coeficientes en k y grado menor o igual que n 1, luego q(a) = 0 implica que p(x) | q(x),
luego por grados q(x) = 0 y los coeficientes de la combinaci
on lineal son nulos.
As pues, al adjuntar a un cuerpo un elemento algebraico obtenemos una extensi
on finita, y en particular algebraica. Esto sigue siendo cierto si adjuntamos
un n
umero finito de elementos algebraicos. Si adjuntamos infinitos podemos
perder la finitud, pero nunca el car
acter algebraico de la extensi
on resultante.
Ve
amoslo.
Teorema 7.9 Sea K/k una extensi
on y S un conjunto de elementos de K algebraicos sobre k. Entonces k(S) = k[S] y k(S)/k es una extensi
on algebraica.
Si el conjunto S es finito, entonces k(S)/k es finita.
n: Supongamos primero que S = {a1 , . . . , an } es finito. EnDemostracio
tonces k(a1 ) = k[a1 ], ahora bien, como k[x] k(a1 )[x], todo elemento algebraico
sobre k lo es sobre k(a1 ), luego aplicando de nuevo el teorema 7.6 tenemos
que k(a1 )(a2 ) = k(a1 )[a2 ], luego k(a1 , a2 ) = k[a1 ][a2 ] = k[a1 , a2 ]. Adem
as
k(a1 , a2 )/k(a1 ) es finita y por el teorema de transitividad de grados k(a1 , a2 )/k
tambien es finita. Repitiendo n veces llegamos a que la extensi
on k(a1 , . . . , an )/k
es finita y k[a1 , . . . , an ] = k(a1 , . . . , an ).
Sea ahora S un conjunto cualquiera. Si a k(S), entonces
a=

p(b1 , . . . bn )
,
q(b1 , . . . bn )

para ciertos polinomios p, q k[x1 , . . . , xn ] y ciertos b1 , . . . , bn S.


Por lo tanto a k(b1 , . . . , bn ) = k[b1 , . . . , bn ] k[S]. Adem
as, seg
un lo ya
probado, la extensi
on k(b1 , . . . , bn )/k es algebraica, luego a es algebraico sobre k.
En consecuencia k(S) = k[S] es una extensi
on algebraica de k.

240

Captulo 7. Extensiones de cuerpos

Por consiguiente, una extensi


on algebraica es finita si y s
olo si es finitamente
generada. Una propiedad que acaba de redondear el comportamiento de las
extensiones algebraicas es la siguiente:
Teorema 7.10 Consideremos cuerpos k K L. Entonces la extensi
on L/k
es algebraica si y s
olo si lo son L/K y K/k.
n: Si L/k es algebraica, es obvio que K/k lo es. Por otra
Demostracio
parte, todo elemento de L es raz de un polinomio no nulo con coeficientes en k,
luego en K, y esto quiere decir que L/K tambien es algebraica.
Supongamos que L/K y K/k son algebraicas. Tomemos un a L. Entonces
a es algebraico sobre K. Sean b1 , . . . , bn K los coeficientes de pol mn(a, K).
As, pol mn(a, K) k(b1 , . . . , bn )[x], luego a es algebraico sobre k(b1 , . . . , bn ),
luego la extensi
on k(b1 , . . . , bn )(a)/k(b1 , . . . , bn ) es finita. Como b1 , . . . , bn son
algebraicos sobre k, la extensi
on k(b1 , . . . , bn )/k tambien es finita, luego por
transitividad de grados, k(b1 , . . . , bn )(a)/k es finita, luego algebraica, luego a es
algebraico sobre k.
Una consecuencia sencilla pero importante de estas propiedades es que las
operaciones con elementos algebraicos dan elementos algebraicos.
Teorema 7.11 Si K/k es una extensi
on de cuerpos, el conjunto de los elementos de K que son algebraicos sobre k es un subcuerpo de K.
n: Si , K son algebraicos sobre K, entonces la extensi
Demostracio
on
k(, )/k es finita, luego es algebraica, luego , , / (el cociente si 6= 0)
son algebraicos sobre k, pues est
an en k(, ).
Ejercicio: Probar que si K/k es una extensi
on y p(x) K[x] tiene coeficientes
algebraicos sobre k, entonces toda raz de p(x) en K es algebraica sobre k.

Estudiamos ahora los homomorfismos entre extensiones. Como los cuerpos


no tienen ideales propios, un homomorfismo de cuerpos no nulo es de hecho un
monomorfismo, por lo que definiremos tan s
olo monomorfismos e isomorfismos
entre extensiones.
Definici
on 7.12 Sean K/k y L/l dos extensiones de cuerpos. Un isomorfismo
entre ellas es un isomorfismo de cuerpos : K L tal que [k] = l.
Si K/k y L/k son extensiones de un mismo cuerpo k, entonces un k
monomorfismo (kisomorfismo) entre ellas es un monomorfismo (isomorfismo)
: K L que deja invariantes a los elementos de k. En particular los k
monomorfismos de extensiones son monomorfismos de kespacios vectoriales.
Si K/k es una extensi
on, un kautomorfismo de K es un kisomorfismo de
K/k en K/k, es decir, un isomorfismo de K en K que deja invariantes a los
elementos de k.

7.1. Extensiones algebraicas

241

Notemos que si : K K es un isomorfismo de cuerpos, entonces el conjunto {a K | (a) = a} es un subcuerpo de K, luego contiene al cuerpo primo.
Esto quiere decir, por ejemplo, que los Qautomorfismos de una extensi
on K/Q
son todos los automorfismos de K, es decir, la condici
on de fijar a los elementos
de Q no es una restricci
on en realidad.
Llamaremos grupo de Galois de una extensi
on de cuerpos K/k el grupo
G(K/k) de todos los kautomorfismos de K.
Veremos que, a traves de los grupos de Galois, la teora de grupos se convierte
en una poderosa herramienta para el estudio de las extensiones de cuerpos.
Si tenemos un cuerpo k y un polinomio irreducible p(x) k[x], el teorema
3.49 nos da una extensi
on de k donde p(x) tiene una raz. Si recordamos
la

prueba veremos que la extensi


on es concretamente K = k[x]/ p(x) y la raz
es a = [x] (identificando a k con las clases de polinomios constantes). Esta
extensi
on cumple adem
as que K = k(a). Por otra parte, en la prueba del
teorema 7.6 hemos obtenido que toda extensi
on de la forma k(a), donde a
es raz de p(x), es isomorfa a la construida en 3.49. Como consecuencia dos
cualesquiera de estas extensiones son isomorfas entre s. Lo probamos en un
contexto m
as general.
Teorema 7.13 Sean K/k y L/l dos extensiones y : k l un isomorfismo.
Sea a K un elemento algebraico sobre k. Sea p(x) = pol mn(a, k). Consideremos la extensi
on de a los anillos de polinomios : k[x] l[x]. Sea b una
raz en L de p(x). Entonces se extiende a un isomorfismo : k(a) l(b)
tal que (a) = b.

n: La aplicaci
Demostracio
on : k[x] k(a)dadapor g(x) = g(a) es
un epimorfismo cuyo
ucleo es precisamente el ideal p(x) , luego por el teorema
n
de isomorfa k[x]/ p(x)
= k(a), y la imagen de [x] por el isomorfismo es a.
Es obvio que p(x)
=

pol mn(b, l), luego por el mismo argumento tenemos


tambien que l[x]/ p(x)
= l(b), y la imagen de [x] por el isomorfismo es b.
Por otra parteel isomorfismo

: k[x]
l[x] cumple (x) = x e induce un
isomorfismo k[x]/ p(x)
= l[x]/ p(x) que lleva [x] a [x].
La composici
on de todos estos isomorfismos nos da el isomorfismo buscado.
En particular, un cuerpo de la forma k(a) (con a algebraico) est
a totalmente
determinado por k y el polinomio mnimo de a. Para enunciar esto de la forma
m
as adecuada conviene introducir un concepto.
Definici
on 7.14 Sean K/k y L/k dos extensiones de un mismo cuerpo k y sean
a K y b L dos elementos algebraicos sobre k. Diremos que son kconjugados
si su polinomio mnimo sobre k es el mismo.
Teorema 7.15 Sean K/k y L/k dos extensiones del mismo cuerpo k, sean
a K y b L algebraicos sobre k. Entonces a y b son kconjugados si y s
olo
si existe un kisomorfismo : k(a) k(b) tal que (a) = b.

242

Captulo 7. Extensiones de cuerpos

n: Si a y b son kconjugados el resultado se sigue del teorema


Demostracio
anterior.
Si existe en dichas condiciones

y p(x)
= pol mn(a, k), entonces p(a) = 0,
luego tambien p(b) = p (a) = p(a) = 0, con lo que p(x) = pol mn(b, k)
En la prueba anterior hemos usado dos hechos elementales, pero de uso
muy frecuente: el primero es que un polinomio m
onico irreducible es el polinomio mnimo de cualquiera de sus races. El segundo es que la imagen por un
kmonomorfismo de una raz de un polinomio de k[x] es necesariamente otra
raz de dicho polinomio.

Ejemplo Consideremos la extensi
on Q 5 /Q, que podemos interpretar se
g
un la definici
on 3.50 aplicada al polinomio x2 5, de modo que Q 5 es un

cuerpo en el que 5 es una raz del polinomio x2 5, y que es la adjunci


on a
Q de dicha
raz en el sentido de la definici
on 7.5, pues sus elementos son de la
forma a + b 5, con a, b Q.
Concretamente, en 3.50
hemos definido este cuerpo como el anillo cociente
Q[x]/(x2 5), de modo que 5 es la clase de equivalencia del polinomio x, y as
obtenemos ciertamente un cuerpo en el que x2 5 tiene una raz. Ahora bien,
ya conocemos un cuerpo donde x2 5 tiene una raz, a saber, el cuerpo
Rde los
n
umeros reales, por lo que tambien podemos considerar el cuerpo Q 5 R.

El teorema anterior nos dice que los dos cuerpos Q 5 son Q-isomorfos, por lo

que es irrelevante que pensemos en uno o en otro. Da igual pensar que 3 + 7 5


es un n
umero real
o una clase de equivalencia de polinomios. Los elementos de
la forma a + b 5, sean n
umeros reales o clases de equivalencia de polinomios,
constituyen cuerpos Q-isomorfos, y todas las propiedades algebraicas que valen
para uno, valen para el otro.

En cambio, podemos hablar del cuerpo Q 5 definido seg
un 3.50 como
cociente del anillo Q[x], pero no podemos identificar sus elementos con n
umeros
reales, pues el polinomio x2 + 5 no tiene races en R.
Veamos un primer resultado sobre grupos de Galois:
Teorema 7.16 Si K/k es una extensi
on finita, entonces el grupo de Galois
G(K/k) es finito.
n: Sea K = k[S], donde S = {1 , . . . , n }. Entonces, cada
Demostracio
K es de la forma = p(1 , . . . , n ), con p(x1 , . . . , xn ) k[x1 , . . . , xn ].
Si G(K/k), entonces () = p((1 ), . . . , (n )). Por lo tanto, si dos
k-automorfismos coinciden sobre S, son iguales.
Ahora bien, si pi (x) k[x] es el polinomio mnimo de i , tenemos que
pi (i ) = 0, luego pi ((i )) = (p(i )) = 0, luego (i ) es una de las races de
pi (x) en K. Como un polinomio tiene un n
umero finito de races en un cuerpo,
resulta que (i ) s
olo puede tomar un n
umero finito de valores. Si llamamos
T al conjunto de las im
agenes de elementos de S por elementos de G(K/k),
tenemos que es un conjunto finito, y la aplicaci
on G(K/k) T S dada por
7 |S es inyectiva, luego G(K/k) es finito.

7.1. Extensiones algebraicas

243

Particularicemos el argumento del teorema anterior al caso de una extensi


on
algebraica simple k(a)/k. Tenemos que un kautomorfismo est
a determinado
por el valor (a) que toma en el elemento primitivo a, as como que (a) ha de
ser una raz de pol mn(a, k), luego la extensi
on k(a)/k tiene a lo sumo tantos
kautomorfismos como races tiene (en k(a)) el polinomio mnimo de a.
Recprocamente, si b k(a) es una raz de pol mn(a, k), entonces a y b son
kconjugados, luego existe un kisomorfismo : k(a) k(b), pero k(b) k(a)
y ambos tienen el mismo grado sobre k (el grado del polinomio mnimo de a).
As pues, k(a) = k(b) y es un kautomorfismo de k(a).
En resumen, una extensi
on algebraica simple k(a)/k tiene exactamente tantos kautomorfismos como races tiene en k(a) el polinomio mnimo de a. En
particular el n
umero de kautomorfismos no puede superar al grado de la extensi
on.
Por ejemplo, en la extensi
on Q(i)/Q el elemento primitivo i tiene dos conjugados, el mismo y i. En consecuencia Q(i) tiene dos automorfismos, la
identidad y el determinado por (i) = i, es decir, (a + bi) = a bi.
Recordemos
on 3.7, sobre los cuerpos Q(i),
que en los ejemplos de la secci
Q() o Q 5 ha sido crucial la consideraci
on de las normas respectivas.
Uno de los resultados que proporciona la teora de extensiones algebraicas es
la posibilidad de definir normas similares en cualquier extensi
on finita. Si una
extensi
on K/k tiene grado n y 1 , . . . n son kautomorfismos de K, la norma
de un elemento a K puede definirse como
N(a) = 1 (a) n (a).
Es claro que una norma as definida conserva productos, pero todava no sabemos probar otro hecho fundamental, y es que, para que sirva de algo, N(a) ha
de pertenecer al cuerpo base k.
De momento podemos comprobar, al menos, que este esquema general es
v
alido en los ejemplos que hemos manejado. Por ejemplo, la norma en Q(i)
viene dada por N(a + bi) = a2 + b2 = (a + bi)(a bi) = (a + bi)(a + bi), luego
es ciertamente el producto de los dos automorfismos
on Q(i)/Q. El
de la extensi
lector puede igualmente contrastar el caso de Q 5 , etc.

Ejercicio: Comprobar que la extensi


on ciclot
omica Q()/Q, donde p = 1, tiene
exactamente p 1 automorfismos. Calcular explcitamente la norma de un elemento
a0 + a1 + + ap2 p2 (definida como el producto de sus im
agenes por todos los
automorfismos) en los casos p = 3 y p = 5. Comprobar que en ambos casos la norma
es un n
umero racional y que la norma de un elemento del anillo Z[] es un entero.

Sin embargo no todas las extensiones algebraicas simples tienen tantos isomorfismos como su grado. Se trata de una patologa relativamente frecuente
que debemos comprender. A continuaci
on analizamos con detalle un ejemplo
concreto. Nuestro objetivo a medio plazo ser
a obtener un marco general que
sustituya a los razonamientos particulares que aqu vamos a emplear:

244

Captulo 7. Extensiones de cuerpos

Ejemplo Consideremos el polinomio x3 2, que no tiene races en Q porque


no las tiene en Z (criterio de Gauss).
Por lo tanto es irreducible en Q[x]. Sin

3
embargo,
tiene
una
u

nica
ra
z
2

R,
que nos permite formal la extensi
on

Q[ 3 2]/Q, de grado 3. Tenemos la factorizaci


on

3
3
3
x3 2 = (x 2)(x2 + 2 x + 4),
donde el segundo factor no tieneraces en R (porque la raz c
ubica deun n
umero
3
3
es u
nica), luego tampoco
en
Q[
2].
As

pues,
el
elemento
primitivo
2
no
tiene

conjugados en Q[ 3 2] (aparte de s mismo), luego G(Q[ 3 2 ]/Q) = 1.

Sin embargo, podemos aplicar el teorema


3.49
al cuerpo Q[ 3 2] para obtener

un cuerpo en el que el polinomio


x2 + 3 2 x + 3 4 tiene una
raz , lo que nos

3
permite formar el cuerpo Q[ 2, ], que tiene grado 2 sobre Q[ 3 2], luego grado 6
sobre Q.

El polinomio x3 2 tiene dos races en Q 3 2, , luego tiene tres. Por

razones de simetra conviene abandonar la notaci


on 3 2 y llamar = 3 2, ,
a las tres races. As
x3 2 = (x )(x )(x ).
De este modo, x3 2 es el polinomio mnimo en Q de , y x2 + x + 2 es
el polinomio mnimo en Q() de y . Por lo tanto
|Q(, ) : Q| = |Q(, ) : Q()||Q() : Q| = 2 3 = 6.
Una Qbase de Q() la forman los elementos 1, , 2 . Una Q()base de
Q(, ) la forman 1, , luego una Qbase de Q(, ) est
a formada (seg
un la
prueba de la transitividad de grados) por los elementos
1,

2 ,

2 .

(7.1)

Nos falta la expresi


on de en esta base, pero teniendo en cuenta que
x2 + x + 2 = (x )(x ),
resulta que = , luego = .

Ejercicio: Expresar el producto de cada par de elementos de la base (7.1) como


combinaci
on lineal de los elementos de dicha base. Notemos que 2 + + 2 = 0,
2
luego = 2 .


Ahora tenemos tres monomorfismos , , : Q 3 2 Q(, ) que

asignan a 3 2 los
valores
, y . Con ellos ya podemos definir una norma.

Para cada u Q 3 2 sea


N(u) = (u) (u) (u)

y as tenemos una norma multiplicativa como en Q(i). Vamos


a ver que,
efectivamente, N(u) Q. El elemento u ser
a de la forma u = a + b 3 2 + c 3 2 2 , para
ciertos a, b, c Q. Sus conjugados son
a + b + c2 ,

a + b + c 2 ,

a + b + c 2 .

7.2. Extensiones normales

245

Por tanto la norma ser


a
(a + b + c2 )(a + b + c 2 )(a + b + c 2 ).
Tras un c
alculo no muy complejo (teniendo en cuenta las relaciones que
hemos obtenido entre , , ) se obtiene

3
3
2
3
3
3
N(a + b 2 + c 2 ) = a + 2b + 4c 6abc Q.

M
as a
un, la norma en el anillo Z 3 2 toma valores enteros.

Una muestra de la potencia de la teora es que no hubiera sido nada f


acil
probar directamente que esta expresi
on es multiplicativa, ni mucho menos haber
llegado hasta ella sin el auxilio de la teora de extensiones. No estamos en condiciones de apreciar el valor que tiene la norma de una extensi
on, pero lo cierto
es que representa un papel fundamental no s
olo en la pr
actica, sino tambien en
los resultados te
oricos m
as profundos.
En general vemos que si queremos definir normas en una extensi
on simple
K/k donde no hay suficientes automorfismos, lo que hay que hacer es considerar
una extensi
on mayor L/K que contenga los conjugados del elemento primitivo y
definir la norma como el producto de todos los kmonomorfismos : K L.
En las secciones siguientes nos ocuparemos de justificar que este procedimiento
siempre funciona.

7.2

Extensiones normales

En esta secci
on generalizaremos la tecnica empleada en el u
ltimo ejemplo de
la secci
on precedente en virtud de la cual es posible extender un cuerpo hasta
otro que contenga todas las races de un polinomio dado. Precisamos esta idea
mediante la definici
on siguiente:
Definici
on 7.17 Sea k un cuerpo y p(x) k[x]. Sea K una extensi
on de k.
Se dice que p(x) se escinde en K[x] si existen elementos a0 , a1 , . . . , an K (no
necesariamente distintos) tales que p(x) = a0 (x a1 ) (x an ). Notemos que
a0 es necesariamente el coeficiente director de p.
Se dice que K es un cuerpo de escisi
on sobre k del polinomio p(x) si k K,
el polinomio p(x) se escinde en K[x] y K = k(a1 , . . . , an ), donde a1 , . . . , an son
las races en K de p(x).
Teorema 7.18 Si k es un cuerpo y p(x) k[x] es un polinomio no nulo, entonces existe una extensi
on K/k tal que K es un cuerpo de escisi
on de p sobre
k, y si K 0 cumple lo mismo, entonces K y K 0 son k-isomorfos.
n: Vamos a probar una versi
Demostracio
on de la unicidad un poco m
as
general: si f : k k0 es un isomorfismo de cuerpos (que se extiende a un
isomorfismo f : k[x] k0 [x]), p0 = f (p) y K 0 es un cuerpo de escisi
on de p0 (x)
0
0
sobre k , entonces existe un isomorfismo g : K K que extiende a f . La
unicidad del enunciado se obtiene tomando como f la identidad en k.

246

Captulo 7. Extensiones de cuerpos

Razonamos por inducci


on sobre el grado de p(x). Si tiene grado 0 entonces el
u
nico cuerpo de escisi
on es k y se cumple trivialmente el teorema. Supongamos
que es cierto para polinomios de grado n y que p(x) tiene grado n + 1. Por
el teorema 3.49 existe una extensi
on de k donde p(x) tiene una raz a. Sea
k1 = k(a) y sea p(x) = (x a)p1 (x), con p1 (x) k1 [x]. Por hip
otesis de
inducci
on p1 tiene un cuerpo de escisi
on K sobre k1 .
Esto significa que p1 (x) = a0 (x a1 ) (x an ), con los ai K y adem
as
K = k1 (a1 , . . . , an ), pero entonces tambien p(x) = a0 (x a)(x a1 ) (x an )
y K = k(a, a1 , . . . , an ), luego K es un cuerpo de escisi
on de p sobre k.
Supongamos ahora que tenemos un isomorfismo f : k k0 , que p0 = f (p)
y que K 0 es un cuerpo de escisi
on de p0 sobre k0 . Sea a0 una raz de p0 en K 0
0
0 0
y sea k1 = k (a ). El teorema 7.13 nos da que f se extiende a un isomorfismo
f1 : k1 k10 tal que f (a) = a0 , que a su vez se extiende a un isomorfismo
k1 [x] k10 [x]. Sea p01 = f (p1 ), de modo que p0 (x) = (x a0 )p01 (x). Es claro
entonces que K 0 es un cuerpo de escisi
on sobre k10 de p01 (x), luego por hip
otesis
de inducci
on f1 se extiende a un isomorfismo g : K K 0 , que es tambien una
extensi
on de f .
As, en el ejemplo final de la secci
on anterior hemos construido el cuerpo de
escisi
on sobre Q del polinomio x3 2, que es una extensi
on de grado 6 sobre Q.
Ejercicio: Probar que el cuerpo de escisi
on de un polinomio de grado n sobre un
cuerpo k tiene grado sobre k menor o igual que n!

Vemos as que si un polinomio p(x) k[x] tiene en un cuerpo un n


umero
de races menor que su grado (contando cada raz a tantas veces como el factor
lineal x a divida a p(x)) podemos pasar a una extensi
on K donde tenga
exactamente tantas races como indica su grado, y entonces podemos decir que
p(x) tiene todas sus races en K, en el sentido de que no pueden aparecer
m
as races en ninguna extensi
on de K, ya que el n
umero m
aximo de races es el
grado del polinomio. En este sentido, podemos decir que el cuerpo de escisi
on
de un polinomio es el cuerpo donde este tiene todas sus races. Ahora vamos
a probar que los cuerpos de escisi
on garantizan la presencia de todas las races
de muchos m
as polinomios. Para ello introducimos el concepto siguiente:
Definici
on 7.19 Una extensi
on de cuerpos K/k es normal si cuando un polinomio p(x) k[x] tiene una raz en K, entonces se escinde en K[x].
Vamos a probar que el cuerpo de escisi
on de un polinomio p(x) es siempre
una extensi
on normal, con lo cual no s
olo contiene a todas las races de p(x),
sino tambien las de todos los polinomios con alguna raz en la extensi
on, en
particular las de todos los polinomios mnimos de sus elementos. Nos apoyamos
en el teorema siguiente:
Teorema 7.20 Sea k F K L una cadena de extensiones algebraicas
tal que K sea el cuerpo de escisi
on de un polinomio de k[x]. Sea : F L
un k-monomorfismo. Entonces [F ] K y se extiende a un k-automorfismo
de K.

7.2. Extensiones normales

247

n: Sea p(x) k[x] tal que p(x) = a0 (x a1 ) (x an ) y


Demostracio
K = k[a1 , . . . , an ]. Sea F 0 = [F ] L y sea K 0 = F 0 (a1 , . . . , an ). Entonces K
es un cuerpo de escisi
on de p(x) sobre F y K 0 es un cuerpo de escisi
on de p(x)
0
sobre F . En la prueba del teorema 7.18 hemos visto que se extiende a un
isomorfismo
: K K 0 .
Tomemos un F . Entonces = h(a1 , . . . , an ), para cierto polinomio
h(x1 , . . . , xn ) k[x1 , . . . , xn ], y resulta que
() =
(h(a1 , . . . , an )) = h(
(a1 ), . . . ,
(an )),
pero
enva races de p(x) en races de p(x), luego los elementos
(a1 ), . . . ,
(an )
son a1 , . . . , an , tal vez en otro orden, y as () k(a1 , . . . , an ) = K. Con esto
hemos probado que F 0 = [F ] K, pero entonces
K = k(a1 , . . . , an ) K 0 = F 0 (a1 , . . . , an ) K,

luego K 0 = K, luego
G(K/k) es una extensi
on de .

Teorema 7.21 Una extensi


on finita K/k es normal si y s
olo si K es el cuerpo
de escisi
on de un polinomio de k[x].
n: Supongamos que K es el cuerpo de escisi
Demostracio
on sobre k de
un polinomio y sea p(x) k[x] un polinomio cualquiera con una raz a K.
Tenemos que probar que p(x) se escinde en K[x].
Sea L un cuerpo de escisi
on de p(x) sobre K, de modo que L = K(a1 , . . . , an )
y p(x) = a0 (x a1 ) (x an ). Como a y ai son races de p(x) en L, existe
un k-monomorfismo : k(a) k(ai ), y por el teorema anterior k(ai ) K, es
decir, ai K para todo i, luego a1 , . . . , an K, luego p(x) se escinde en K[x].

Recprocamente, si K/k es normal, como es finita, existen a1 , . . . , an K


tales que K = k[a1 , . . . , an ]. Sea pi = pol mn(ai , k) y sea p = p1 pn . Como
K/k es normal, cada pi se escinde en K[x], luego lo mismo le sucede a p, y es
claro que al adjuntar a k todas las races de p, en particular estamos adjuntando
los ai , luego obtenemos K. Esto prueba que K es un cuerpo de escisi
on de p(x)
sobre k.
Ejercicio: Probar que toda extensi
on de grado 2 es normal.

Por conveniencia reformulamos 7.20 en terminos de extensiones normales:


Teorema 7.22 Sea k F K L una cadena de extensiones algebraicas tal
que K/k sea finita y normal. Sea : F L un k-monomorfismo. Entonces
[F ] K y se extiende a un k-automorfismo de K.
En particular:
Teorema 7.23 Sea K/k una extensi
on finita normal y a, b K. Entonces a y
b son kconjugados si y s
olo si existe un G(K/k) tal que (a) = b.
n: Si a y b son conjugados, por 7.15 existe un kisomorfismo
Demostracio
: k(a) k(b), que por el teorema anterior se extiende a un kautomorfismo
de K. El recproco es obvio.

248

Captulo 7. Extensiones de cuerpos

As pues, en una extensi


on normal la conjugaci
on est
a controlada por
el grupo de Galois. El n
ucleo de la llamada teora de Galois consiste en
obtener informaci
on de una extensi
on normal a partir de su grupo de Galois. En
realidad veremos que la teora requiere una propiedad adicional en la extensi
on
que estudiaremos en la secci
on siguiente.
Observemos que si k K L y L/k es finita normal, entonces L/K tambien
es normal (pues L es el cuerpo de escisi
on sobre K del mismo polinomio que
sobre k), pero en general
la
extensi
o
n
K/k
no tiene por que ser normal, como

lo muestra Q Q 3 2 Q(, ).
Definici
on 7.24 Dada una extensi
on finita K/k, una clausura normal de K sobre k es una extensi
on L/K tal que L/k es normal y no existe ninguna extensi
on
intermedia k K L0 L tal que L0 sea normal sobre k.

Es claro que toda extensi


on finita tiene una clausura normal, pues podemos
expresar K = k[a1 , . . . , an ] y si pi = pol mn(ai , k) y p = p1 pn , basta tomar
como L un cuerpo de escisi
on de p sobre K. Entonces L tambien es un cuerpo
de escisi
on de p sobre K y cualquier extensi
on intermedia L0 normal sobre K
tiene que contener todas las races de p, y entonces tiene que ser L.
Adem
as, dos clausuras normales de una misma extensi
on K/k son K-isomorfas, pues ambas tienen que ser cuerpos de escisi
on de p sobre K.
Nuestra intenci
on es definir la norma de un elemento de una extensi
on finita
K/k como el producto de todas sus im
agenes por los kmonomorfismos de K en
una clausura
normal de K/k, tal y como hemos hecho con para definir la norma

de Q( 3 2)/Q. Sin embargo, para probar que esto es viable todava necesitamos
estudiar una propiedad adicional de las extensiones algebraicas.

7.3

Extensiones separables

En esta secci
on vamos a obtener toda la informaci
on que necesitamos sobre
los monomorfismos de una extensi
on de cuerpos. La idea b
asica es que si la normalidad de una extensi
on nos da propiedades cualitativas importantes acerca
de sus automorfismos (que luego resultan aplicables a una extensi
on finita cualquiera tomando su clausura normal), aqu vamos a introducir otra propiedad,
la separabilidad, que nos dar
a propiedades cuantitativas, es decir, acerca del
n
umero de automorfismos. La separabilidad concierne a la multiplicidad de las
races de los polinomios irreducibles.
En general, si p(x) k[x] es un polinomio no constante y K es una extensi
on
de k tal que p(x) se escinde en K[x], tenemos que
p(x) = a0 (x a1 ) (x an ),

y ahora tenemos que analizar la posibilidad de que algunas races aparezcan


repetidas en esta descomposici
on. Agrupando las repeticiones podemos escribir
p(x) = a0 (x a1 )r1 (x am )rm ,

donde r1 + + rm = n, y los ai son distintos dos a dos.

7.3. Extensiones separables

249

Los exponentes ri est


an unvocamente determinados por p y K, pues son
los exponentes de la descomposici
on de p en factores primos en K[x], que es
un DFU. Diremos que ri es el orden de multiplicidad de la raz ai en p(x).
Si un elemento a K no es raz de p(x), diremos tambien que su orden de
multiplicidad en p(x) es 0.
Una raz se dice simple, doble, triple, etc. seg
un si su orden de multiplicidad
es 1, 2, 3, etc.
Observemos que si p(x) tiene una raz a en un cuerpo K, podemos factorizar
p(x) = (x a)n g(x), con g(x) K[x] tal que g(a) 6= 0, y entonces n es el orden
de multiplicidad de a en p(x) aunque p(x) no se escinda en K[x]. La raz
on es
que si pasamos a un cuerpo de escisi
on L de g(x) sobre K, ninguna de las races
de g(x) en L ser
a a, puesto que g(a) 6= 0, por lo que p se escindir
a en L[x] y la
multiplicidad de a en la factorizaci
on seguir
a siendo n.
Otra observaci
on menor es que podemos definir el orden de multiplicidad
para polinomios con coeficientes en un dominio ntegro, pues todo dominio
ntegro est
a contenido en su cuerpo de fracciones.
Para estudiar la multiplicidad de las races de polinomios es indispensable el
concepto de derivada formal:
n
P
Definici
on 7.25 Sea D un dominio ntegro y f (x) =
ai xi D[x], llamarei=0
mos derivada formal del polinomio f (x) al polinomio
f 0 (x) =

n
P

i=1

iai xi1 D[x].

Por ejemplo, si f (x) = 5x3 2x2 + 4 Q[x], entonces f 0 (x) = 15x2 4x.
Teorema 7.26 Sea D un dominio ntegro y f , g D[x].
1. Si f D entonces f 0 = 0.

2. Si c D, entonces (cf )0 = cf 0 .
3. (f + g)0 = f 0 + g 0 .
4. (f g)0 = f 0 g + f g 0 .
5. (f /g)0 = (f 0 g f g 0 )/g 2 .
n: Las tres primeras propiedades son inmediatas. Para proDemostracio
m
n
P
P
bar la cuarta tomamos f (x) =
ai xi , g(x) =
bi xi , con lo que, usando las
i=0

i=0

propiedades segunda y tercera,


P
0 P
P
(f g)0 =
ai bj xi+j = ai bj (xi+j )0 = (i + j)ai bj (xi+j1 )
ij

ij

X
i

P
ij

iai xi1

X
j

i1

iai x

ij

bj x +

ai x jbj xj1

ij

X
X

bj xj +
ai xi
jbj xj1 = f 0 g + f g 0 .
i

250

Captulo 7. Extensiones de cuerpos

En la quinta propiedad se entiende que g divide a f , y basta calcular


(g(f /g))0 con la regla cuarta y despejar la derivada del cociente.
La relaci
on entre las derivadas y la multiplicidad de las races viene dada
por el teorema siguiente:
Teorema 7.27 Sean D E dominios ntegros, f D[x] y c E tal que
f (c) = 0. Entonces c es una raz simple de f si y s
olo si f 0 (c) 6= 0.
n: Sea f (x) = (x c)n g(x), donde g(c) 6= 0 (y n 1 es el
Demostracio
orden de multiplicidad de c). Entonces f 0 (x) = n(x c)n1 g(x) + (x c)n g 0 (x).
Si c es raz simple de f , entonces n = 1, luego f 0 (x) = g(x) + (x c)g 0 (x), y
por lo tanto f 0 (c) = g(c) + 0 = g(c) 6= 0. Si c es raz m
ultiple, entonces n > 1,
luego
f 0 (c) = n(c c)n1 g(c) + (c c)n g 0 (c) = 0.

Este resultado nos lleva a investigar los casos en que la derivada de un


polinomio puede anularse. Un caso trivial es el de los polinomios constantes.
Teorema 7.28 Sea D un dominio ntegro y f (x) D[x] un polinomio no constante.
1. Si car D = 0 entonces f 0 (x) 6= 0.
2. Si car D = p, entonces f 0 (x) = 0 si y s
olo si existe g(x) D[x] tal que
f (x) = g(xp ).
n: 1) Sea f (x) =
Demostracio
f 0 (x) =

n
P

i=1

n
P

i=0

ai xi , con n > 0 y an 6= 0. Entonces

iai xi1 , donde el coeficiente director es nan 6= 0, luego f 0 (x) 6= 0.

2) Si f 0 (x) = 0, entonces (con la misma notaci


on del apartado anterior) cada
coeficiente iai = 0, para i = 1, . . . , n. Si ai 6= 0 es necesario que i = 0 (en D),
es decir, que p | i. En otras palabras, que los monomios de f (x) con coeficientes
no nulos tienen exponente m
ultiplo de p, es decir,
f (x) =

r
P

i=0

donde g(x) =

r
P

ai xpi =

r
P

ai (xp )i = g(xp ),

i=0

ai xi . El recproco es evidente.

i=0

Ahora ya sabemos lo necesario para estudiar la separabilidad.


Definici
on 7.29 Sea K/k una extensi
on y a K un elemento algebraico sobre k. Diremos que a es separable sobre k si a es raz simple de pol mn(a, k).
Notar que si p(x) = pol mn(a, k) entonces a es separable si y s
olo si p0 (a) 6= 0
0
0
(por 7.27), si y s
olo si p (x) 6= 0, pues si p (a) = 0 entonces p(x) | p0 (x) y,
teniendo en cuenta los grados, p0 (x) = 0. Esta u
ltima condici
on depende s
olo

7.3. Extensiones separables

251

de p, luego si a es separable todos sus conjugados lo son tambien, y pol mn(a, k)


tiene todas sus races simples.
Una extensi
on K/k es separable si todos los elementos de K son separables
sobre k (en particular una extensi
on separable es algebraica). Un cuerpo k es
perfecto si todas sus extensiones algebraicas son separables.
El interes de esta definici
on reside en que pr
acticamente todos los cuerpos
que nos van a interesar son perfectos, luego en la pr
actica todas las extensiones
que manejaremos ser
an separables.
Teorema 7.30 Se cumple:
1. Todo cuerpo de caracterstica 0 es perfecto.
2. Un cuerpo k de caracterstica p es perfecto si y s
olo si
k = kp = {ap | a k}.
3. Todo cuerpo finito es perfecto.
n: 1) Si car k = 0 y K/k es una extensi
Demostracio
on algebraica, sea
a K. Entonces el polinomio p(x) = pol mn(a, k) no es constante y p0 (x) 6= 0,
luego a es separable.
2) Si car k = p y k = kp , sea K/k una extensi
on algebraica y a K, sea
p(x) = pol mn(a, k). Si a no fuera separable, entonces p0 (x) = 0, luego por 7.28
p(x) = f (xp ) para cierto polinomio f (x) k[x].
n
P
Sea f (x) =
ai xi . Como a0 , . . . , ar k = kp , existen b0 , . . . , br k de
i=0

manera que ai = bpi . Por lo tanto


p(x) =

n
P

i=0

donde el polinomio

n
P

i=0

bpi xpi =

n
n
p P
p
P
bi xi =
bi xi ,

i=0

i=0

bi xi k[x]. Por lo tanto p(x) no es irreducible en k[x],

contradicci
on.
Ahora supongamos que k es perfecto y car k = p. Veamos que k = kp .
Sea a k. Sea K la clausura algebraica de k, sea b una raz de xp a en K.
Entonces bp a = 0, o sea, a = bp .
El polinomio xp a = xp bp = (x b)p , y por otro lado tenemos que
pol mn(b, k) | (x b)p , luego ha de ser pol mn(b, k) = (x b)n , para cierto
n p, pero como k es perfecto b es raz simple de pol mn(b, k), es decir, n = 1,
luego x b = pol mn(b, k) k[x]. Por consiguiente b k y a = bp kp .
3) Si k es un cuerpo finito de caracterstica p, entonces la aplicaci
on
: k kp dada por (a) = ap es suprayectiva, pero tambien inyectiva,
puesto que si ap = bp , entonces ap bp = (a b)p = 0, luego a b = 0, o sea,
a = b.
Por lo tanto kp k tienen ambos el mismo cardinal, lo que obliga a que
k = kp .

252

Captulo 7. Extensiones de cuerpos

Como una primera muestra del interes de la separabilidad, vamos a ver el


efecto que tiene combinarla con la normalidad. Para ello introducimos algunos
conceptos.
Definici
on 7.31 Sea K/k una extensi
on. Definimos su cuerpo fijado como

F = a K | (a) = a para todo G(K/k) .


Es claro que efectivamente F es un cuerpo y k F K.

Una extensi
on de Galois es una extensi
on normal y separable. El teorema
siguiente nos da un importante criterio para determinar cu
ando un elemento de
una extensi
on finita de Galois pertenece de hecho al cuerpo base:
Teorema 7.32 Una extensi
on finita K/k es de Galois si y s
olo si su cuerpo
fijado es k.
n: Sea K/k una extensi
Demostracio
on finita de Galois. Sea a un elemento
de su cuerpo fijado y sea p(x) su polinomio mnimo sobre k.
Por la normalidad, p(x) tiene todas sus races en K. Si b es cualquiera de
ellas, ha de existir un G(K/k) tal que (a) = b (teorema 7.23). Pero a est
a
en el cuerpo fijado, luego b = a, o sea, a es la u
nica raz de p(x), que ha de ser,
pues, p(x) = (x a)n . Pero por otra parte a es separable sobre k, luego ha de
ser una raz simple de p(x). As pues p(x) = x a k[x] y por lo tanto a k.
Supongamos ahora que k es el cuerpo fijado de la extensi
on. Veamos que
K/k es normal. Sea p(x) k[x] un polinomio irreducible (que podemos suponer
m
onico) con una raz a K. Hemos de ver que p(x) se escinde en K[x].
Sean a1 , . . . , an todas las races de p(x) en K (sin repeticiones). Sea
g(x) = (x a1 ) (x an ) K[x].

Para cada G(K/k) se cumple que g(x) = x (a1 ) x (an ) ,


pero es obvio que (a1 ), . . . , (an ) son los mismos a1 , . . . , an cambiados de orden,
luego en realidad g(x) = g(x). Esto significa que todos los coeficientes de g(x)
son fijados por , luego est
an en el cuerpo fijado de K/k, que por hip
otesis es
k, o sea, g(x) k[x].
Como p(x) es el polinomio mnimo de a y a es una de las races de g(x),
tenemos que p(x) | g(x), pero por otra parte todas las races de g(x) lo son
de p(x) y adem
as son simples, luego g(x) | p(x). Como ambos son m
onicos
p(x) = g(x) se escinde en K[x] y adem
as con races simples.
Con esto hemos probado tambien que K/k es separable, pues dado a K, si
tomamos p(x) = pol mn(a, k) hemos probado que las races de p(x) son simples.
Comenzamos ahora la labor de contar los automorfismos de una extensi
on
finita. En realidad si la extensi
on no es normal puede no haber m
as automorfismo que la identidad (como le ocurre a Q( 3 2 )/Q), luego si queremos
resultados generales no hemos de contar automorfismos sino monomorfismos.

7.3. Extensiones separables

253

Definici
on 7.33 Sea K/k una extensi
on finita. Llamaremos kmonomorfismos
de K a los kmonomorfismos de K en una clausura normal de K sobre k.
En particular, si K/k es normal entonces los kmonomorfismos de K son de
hecho los kautomorfismos de K.
Llamaremos N(K/k) al n
umero de kmonomorfismos de K (que no depende de la elecci
on de la clausura normal de K/k, pues dos cualesquiera
son K-isomorfas, luego todo k-monomorfismo en una se corresponde con un
k-monomorfismo en otra).
Por ejemplo, si k(a)/k es una extensi
on simple de grado n sabemos que el
n
umero de kmonomorfismos de K es igual al n
umero de kconjugados de a, y si
a es separable sobre k entonces pol mn(a, k) tiene todas sus races simples, luego
a tiene exactamente n kconjugados, es decir, el n
umero de kmonomorfismos
de k(a) es igual al grado de la extensi
on. En smbolos:
N(k(a)/k) = |k(a) : k|.
Vamos a generalizar este hecho a extensiones separables cualesquiera. Primero
probamos un resultado tecnico:
Teorema 7.34 Consideremos una cadena de extensiones k K L con L/k
finita normal. Entonces N(L/k) = N(L/K) N(K/k).
n: Por 7.22 tenemos que cada k-monomorfismo de K se exDemostracio
tiende a un k-automorfismo de L. Basta probar que de hecho se extiende exactamente a N(L/K) de ellos. Notemos que N(L/K) = |G(L/K)| porque la
extensi
on L/K es normal.
Sean y dos extensiones a L de un mismo kmonomorfismo de K. Como
L/k es normal y son kautomorfismos de L, luego 1 es un kautomorfismo de L que de hecho fija a K, es decir, = 1 G(L/K) y = .
As pues, si es una extensi
on cualquiera de un kmonomorfismo de K, las
restantes son de la forma con G(L/K).
Por otra parte, si = 0 , componiendo con 1 concluimos que = 0 ,
luego en efecto, hay tantas extensiones como elementos de G(L/K)
Sea ahora una extensi
on finita normal L = k(a1 , . . . , an ), donde los elementos
ai son separables sobre k. Podemosaplicar el teorema anterior con K = k(a1 )
y concluir que N(L/k) = N L/k(a1 ) |k(a1 ) : k|. Ahora consideramos la cadena
k(a1 ) k(a1 , a2 ) L. Es claro que est
a tambien en
del teorema

las hip
otesis
anterior (a2 es separable sobre k(a1 ) porque pol mn a2 , k(a1 ) pol mn(a2 , k)).
Por lo tanto concluimos que

N(L/k) = N L/k(a1 , a2 ) |k(a1 , a2 ) : k(a1 )| |k(a1 ) : k|

= N L/k(a1 , a2 ) |k(a1 , a2 ) : k|.


Repitiendo el proceso llegamos a N(L/k) = |L : k|.

Esto es esencialmente el resultado al que queremos llegar (y, como vemos, es


una mera generalizaci
on del caso trivial de extensiones simples). Notemos ahora

254

Captulo 7. Extensiones de cuerpos

que si F es el cuerpo fijado de la extensi


on L/k entonces G(L/k) = G(L/F ),
luego |L : k| = |G(L/k)| = |G(L/F )| = |L : F |, con lo que k = F y el teorema
7.32 nos permite concluir que la extensi
on L/k es separable. De aqu se sigue
en primer lugar:
Teorema 7.35 Si K = k(S), donde S es un conjunto de elementos separables
sobre k, entonces la extensi
on K/k es separable.
n: Supongamos primero que S es finito. Sean a1 , . . . , an los
Demostracio
conjugados de todos los elementos de S. Sabemos que todos ellos son separables
sobre k. Entonces L = k(a1 , . . . , an ) es la clausura normal de K/k, y en estas
condiciones hemos probado que L/k es separable, luego K/k tambien. El caso
infinito se reduce trivialmente al caso finito.
Notemos que acabamos de probar que la clausura normal de una extensi
on
finita separable es una extensi
on finita de Galois. Finalmente estamos en condiciones de enunciar el teorema principal de esta secci
on:
Teorema 7.36 Si K/k es una extensi
on finita separable de grado n entonces
el n
umero de kmonomorfismos de K es exactamente igual a n. En particular
si K/k es finita de Galois |G(K/k)| = |K : k|.
n: Lo tenemos probado para extensiones normales. Si K/k
Demostracio
no es normal tomamos la clausura normal L/k. Entonces las extensiones L/k
y L/K son normales, luego el teorema 7.34 y el caso normal nos dan |L : k| =
N(K/k) |L : K|, luego tambien N(K/k) = |K : k|.
El teorema siguiente termina de perfilar el comportamiento de las extensiones
separables, totalmente an
alogo al de las algebraicas en general:
Teorema 7.37 Sea k K L una cadena de extensiones. Entonces L/k es
separable si y s
olo si L/K y K/k lo son.
n: Una implicaci
Demostracio
on es sencilla. La otra se reduce f
acilmente
al caso en que las extensiones son finitas (ver por ejemplo 7.10).
Supongamos, pues, que L/K y K/k son finitas separables. Si a L y b es un
kconjugado de a, entonces existe un kmonomorfismo de K tal que (a) = b.
Si p(x) = pol mn(a, K) entonces pol mn(b, K) = p(x), y es claro que si
a es una raz simple de p(x) entonces b es raz simple de p(x), es decir, los
kconjugados de elementos de L son separables sobre K. De aqu se sigue que
la clausura normal de L sobre k es separable sobre K, luego podemos suponer
que L/k es normal.
La clausura normal de K/k est
a contenida en L, es separable y obviamente L
es separable sobre ella (por la implicaci
on opuesta a la que estamos probando).
Por lo tanto podemos suponer tambien que K/k es normal.
Veamos que el cuerpo fijado de L/k es k. Si a est
a en dicho cuerpo fijado, en
particular a es fijado por G(L/K), luego a K (por 7.32). Todo automorfismo
de K/k se extiende a un automorfismo de L/k que fija a a, luego a est
a en el
cuerpo fijado de K/k, que es k.

7.3. Extensiones separables

255

Ejercicio: Probar que si K/k es una extensi


on de cuerpos, el conjunto Ks de los
elementos de K separables sobre k es un subcuerpo de K.

Terminamos esta secci


on con un teorema no trivial seg
un el cual en muchos
casos los esfuerzos por generalizar el caso de extensiones simples a extensiones
finitas arbitrarias es innecesario:
Teorema 7.38 (Teorema del elemento primitivo) Toda extensi
on finita
separable es simple.
n: Sea K/k una extensi
Demostracio
on finita separable. Distingamos dos
casos seg
un que el cuerpo base k sea finito o infinito. Si k es finito y K es una
extensi
on finita de k, entonces K tambien es un cuerpo finito (cada elemento de
K est
a determinado por sus coordenadas en una k-base, y s
olo hay un n
umero
finito de coordenadas posibles). Por el teorema 6.13 el grupo multiplicativo K
es cclico, es decir, existe un elemento a K tal que sus potencias recorren
todos los elementos de K salvo el cero. Obviamente, K = k(a).
Supongamos ahora que k es infinito. Toda extensi
on finita es finitamente
generada, es decir, es de la forma k(a1 , . . . , an )/k.
Razonando por inducci
on es suficiente probar que si a, b son elementos separables sobre un cuerpo k entonces existe un c k(a, b) tal que k(a, b) = k(c).
Sea A el conjunto de todos los pares (a0 , b0 ), donde a0 es un kconjugado de
a y b0 es un kconjugado de b. Es claro que si (a1 , b1 ), (a2 , b2 ) son dos pares
distintos en A, existe a lo sumo un u k tal que a1 + ub1 = a2 + ub2 . As pues,
como A es finito y k es infinito existe un elemento v k distinto de cero y para
el que a1 + vb1 6= a2 + vb2 , para todo par de pares distintos (a1 , b1 ), (a2 , b2 ) A.
Sea c =
si , son kmonomorfismos distintos de k(a, b)
a + vb. Entonces,

los pares (a), (b) y (a), (b) son pares distintos de A, luego
(c) = (a) + v(b) 6= (a) + v (b) = (c).

Esto significa que c tiene tantos conjugados como kmonomorfismos tiene


la extensi
on k(a, b)/k. Por los resultados que hemos probado, el grado de
pol mn(c, k) coincide con |k(a, b) : k| o tambien |k(c) : k| = |k(a, b) : k|. Puesto
que k(c) k(a, b), de hecho k(a, b) = k(c).
As pues, para reducir dos generadores a, b de una extensi
on separable a uno
solo, hemos de tomar un elemento de la forma c = a+vb, con v en el cuerpo base.
La finalidad de v es simplemente romper la simetra de la expresi
on para que el
n
umero de automorfismos sea el m
aximo posible. Unos ejemplos aclarar
an esta
idea.

Ejemplo Consideremos el cuerpo K = Q 2, 3 . La extensi
on K/Q es
normal, pues K es el cuerpo de escisi
on sobre Q del polinomio (x2 2)(x2 3).
Trivialmente es separable, pues los cuerpos son de caracterstica 0. As pues,
K/Q es una extensi
on finita de Galois. Veamos que tiene grado 4. Para ello
consideramos la cadena


Q Q 2 Q 2, 3 .

256

Captulo 7. Extensiones de cuerpos

Es claro que el grado del primer tramo es 2, luego basta probar


que

elsegundo
tramo tambien tiene grado 2. A su vez esto equivale a que 3
/ Q 2 . Ahora
bien, es f
acil ver que la ecuaci
on
2

a + b 2 = a2 + 2b2 + 2ab 2 = 3

no tiene soluci
on para
a, b Q.

Los conjugados
de
2 son 2 y los conjugados de 3 son 3. Si llama

mos S = { 2, 3}, tenemos que cada elemento de G(K/Q) est


a determinado por su restricci
on a S, es decir, que la aplicaci
on G(K/Q) S dada

por 7 |S es un
de grupos. Como,
adem
as, la imagen de 2
monomorfismo

s
olo puede ser 2 y la de 3 s
olo puede ser 3, vemos que s
olo hay cuatro
permutaciones posibles en la imagen, que expresadas como productos de ciclos
disjuntos son:

1, ( 2, 2), ( 3, 3), ( 2, 2)( 3, 3).


Como la imagen tiene que tener cuatro permutaciones, tienen que ser estas. Es
claro entonces que G(K/Q)
= C2 C2 .

Una
Qbase de K es 1, 2, 3, 2 3 = 6. Un elemento primitivo es
2 + 3, pues al aplicar los cuatro automorfismos obtenemos los conjugados

2 + 3, 2 + 3,
2 3, 2 3.
Los cuatro son, efectivamente,
porque sus coordenadas en la base dada
distintos
son distintas. Por lo tanto Q 2 + 3 tiene grado 4 sobre Q y est
a contenido
en K, luego es K.

Ejercicio: Calcular pol mn( 2 + 3, Q).

Ejemplo Consideremos de nuevo K = Q(, ), donde y son dos de las


races del polinomio x3 2. Seg
un hemos visto en la secci
on anterior, la extensi
on
K/Q es de Galois y tiene grado 6. La imagen de y por cada uno de los seis
automorfismos de K ha de ser , o la tercera raz . Si llamamos S = {, , },
la restricci
on 7 |S es un monomorfismo G(K/Q) 3 , y como ambos
grupos tienen orden 6, tiene que ser un isomorfismo. As pues G(K/Q)
= 3 y
los seis automorfismos permutan , , de todas las formas posibles.
En este caso el elemento + no es un elemento primitivo de K/Q, pues al
aplicarle los seis automorfismos obtenemos s
olo tres conjugados: + , + ,
+ . Por lo tanto pol mn( + , Q) tiene grado 3 y Q( + ) es un cuerpo
intermedio de grado 3 sobre Q. Un elemento primitivo es, por ejemplo .
En efecto, sus conjugados son
,
=
+ 2,
= 2 + , = 2 ,
,
= 2,

7.4. Normas y trazas

257

y son todos distintos por la independencia lineal de y . Puede comprobarse


que pol mn( ) = x6 + 108. Notemos que la presencia del 1 se traduce
en una perdida de la simetra de la expresi
on + , que hace que las las seis
im
agenes por los automorfismos sean distintas. La prueba del teorema del elemento primitivo justifica que siempre podemos conseguir el m
aximo n
umero
posible de conjugados mediante esta tecnica.

7.4

Normas y trazas

Finalmente podemos definir en general la norma de una extensi


on de cuerpos.
Notemos primero que el teorema 7.32 vale en parte para extensiones separables
(no necesariamente normales): Si K/k es separable, un elemento u K est
a
en k si y s
olo si (u) = u para todo k-monomorfismo de K. En efecto, si
consideramos la clausura normal L/k, tenemos que u k si y s
olo si (u) = u
para todo G(L/k), pero las restricciones a K de los k-automorfismos de L
son los k-monomorfismos de K.
Definici
on 7.39 Sea K/k una extensi
on separable de grado n. Sean 1 , . . . , n
los k-monomorfismos de K (en la clausura normal L de K/k). Definimos la
norma y la traza de un K como
N() = 1 () n () L,

Tr() = 1 () + + n () L.

Si G(L/k), entonces i es un k-monomorfismo de K en L, luego


i = j para alg
un j. M
as a
un, si i 6= j, entonces i 6= j , pues act
uan
de forma distinta sobre un elemento primitivo a de K.
Por lo tanto,
la composici
on con permuta los monomorfismos y, en con
secuencia, N() = N(), Tr() = Tr() para todo y todo , es decir,
N(), Tr() k.
Tenemos as dos aplicaciones N, Tr : K k. Es obvio que
N(uv) = N(u) N(v),

Tr(u + v) = Tr(u) + Tr(v).

De hecho la traza es una aplicaci


on lineal de k-espacios vectoriales. Una propiedad elemental es que si k, entonces
|K:k|
,
N() =

Tr() = |K : k| .

Teorema 7.40 (Transitividad de la norma) Sea k K L una cadena


de extensiones finitas separables. Entonces para todo L se cumple
L

K
L
K
TrL
Nk () = Nk NK () ,
k () = Trk TrK ()
n: Sean 1 , . . . , n los K-monomorfismos de L. As
Demostracio
L

NK () = 1 () n ().

258

Captulo 7. Extensiones de cuerpos

Sean 1 , . . . , m los k-monomorfismos de K. Escojamos para cada uno de


ellos i una extensi
on a un
de la clausura normal de L sobre
k-automorfismo

k,
K
L
digamos i . Entonces i NL
()
=

(
())

(
()),
y
()
es
N
N
i
1
i
n
K
K
k
el producto de estos terminos para i = 1, . . . , m.
Los monomorfismos j i , definidos sobre L, son distintos dos a dos, pues si
j i = u v , restringiendo a K tenemos i = v , luego i = v, y componiendo
con el automorfismo inverso queda j = u , luego j = u.
Como en total son mn
de hecho son todos los k-monomor Lmonomorfismos,

fismos de L, luego NK
()
,
que
es
el
producto
de todos los i (j ()), es
N
K
k
igual a NL
().
k
El mismo razonamiento vale para las trazas.

Ejemplo Vamos a calcular la norma de la extensi
on Q 2, 3 /Q.

Un elemento arbitrario de Q 2, 3 es de la forma

= a + b 2 + c 3 + d 6, con a, b, c, d Q.

Su norma en la extensi
on Q 2, 3 /Q 2 es


a+b 2+c 3+d 6
a+b 2c 3d 6

2
2
=
a+b 2 c 3+d 6

= a2 + 2b2 + 2ab 2 3c2 6d2 6cd 2,



y la norma de este n
umero en la extensi
on Q 2 /Q es


a2 + 2b2 3c2 6d2 + (2ab 6cd) 2
N() =

a2 + 2b2 3c2 6d2 (2ab 6cd) 2

2
2
= a2 + 2b2 3c2 6d2 2 (2ab 6cd) .

Ejercicio: Calcular la traza de las extensiones Q( 2, 3 )/Q y Q( 3 2 )/Q.

Ejemplo Consideramos ahora la extensi


on ciclot
omica p-esima Q()/Q para
un primo impar p. Su grado es p 1, luego tiene p 1 automorfismos, determinados por la imagen que toman sobre el elemento primitivo , que ha de ser
uno de sus conjugados i para i = 1, . . . , p 1. Evaluando en 0 el polinomio
xp1 + + x + 1 = (x )(x 2 ) (x p1 ),
obtenemos N() = 1. Como la norma conserva productos se cumple N( i ) = 1
para todo i. Evaluando en 1 el mismo polinomio queda
2
p1
) = 1p1 + + 1 + 1 = p.
N(1 ) = (1 )(1 ) (1

7.5. La teora de Galois

259

Si p - i, entonces Tr( i ) es la suma de los p 1 conjugados de i , es decir,


Tr( i ) = + 2 + + p1 = 1.
Si a Q entonces Tr(a) = a + a + + a = (p 1)a. En resumen,
Tr( i ) =

1
p1

si p - i
si p | i

Una ventaja de la traza frente a la norma es que es mucho m


as f
acil de
p1
P
calcular. En efecto, si
ai i es un elemento cualquiera de Q(), entonces
i=0

Tr

p1
P
i=0

7.5

ai i

p1
P
i=0

ai Tr( i ) = a0 Tr(1)

= (p 1)a0

p1
P
i=1

p1
P

ai = pa0

ai

i=1
p1
P

ai .

i=0

La teora de Galois

Presentamos ahora el teorema fundamental que permite obtener consecuencias relevantes sobre extensiones de Galois a traves del estudio de sus grupos
de automorfismos. B
asicamente afirma que los cuerpos intermedios de una extensi
on finita de Galois se corresponden de forma natural con los subgrupos del
grupo de Galois. M
as concretamente, la correspondencia de Galois asigna a
cada subgrupo el cuerpo que definimos a continuaci
on:
Definici
on 7.41 Sea K/k una extensi
on de cuerpos y H un subgrupo del grupo
de Galois G(K/k). Llamaremos cuerpo fijado por H al cuerpo

F (H) = a K | (a) = a para todo H .

Es muy f
acil probar que ciertamente F (H) es un cuerpo y k F (H) K.
El teorema 7.32 afirma
on algebraica K de un cuerpo k es
que una
extensi
de Galois si y s
olo si F G(K/k) = k. El teorema siguiente contiene la parte
tecnica del teorema de Galois y resulta u
til por s mismo en algunas ocasiones:
Teorema 7.42 (Teorema de independencia de Dedekind) Consideremos
un cuerpo K y sean 1 , . . . , n automorfismos distintos de K. Si c1 , . . . , cn
n
P
son elementos de K tales que
ci i (a) = 0 para todo a K, entonces
c1 = = cn = 0.

i=1

260

Captulo 7. Extensiones de cuerpos

n: Por inducci
Demostracio
on sobre n. Si n = 1, entonces c1 1 (a) = 0
para todo a K, luego en particular c1 1 (1) = 0, es decir, c1 = 0. Supongamos
que n > 1 y que
n
P
ci i (a) = 0
para todo a K.
(7.2)
i=1

Si alg
un ci es nulo entonces todos lo son por hip
otesis de inducci
on. Supongamos que son todos no nulos. Como 1 6= n , existe un elemento b K tal
que 1 (b) 6= n (b). Obviamente b 6= 0. Por hip
otesis,
n
P

ci i (ba) = 0

i=1

para todo a K.

Multiplicando por n (b1 ) y restando de (7.2) queda:


n
P

i=1

ci 1 n (b1 )i (b) i (a) = 0

para todo a K.

Como el u
ltimo
es nulo,
otesis de inducci
on
sumando
podemos aplicar la hip
1
y
concluir
que
c
1

(b
)
(b)
=
0
para
i
=
1,
.
.
.
,
n

1.
En
particular
i
n
i

1 n (b1 )1 (b) = 0 y 1 (b) = n (b), contradicci


on.
Con la ayuda de este resultado podemos probar el teorema siguiente, que
esencialmente contiene la biyectividad de la correspondencia de Galois:
Teorema 7.43 Sea K/k una extensi
on y H un subgrupo finito de G(K/k).
Entonces
|K : F (H)| = |H|.
n: Supongamos que |K : F (H)| = r < |H| = n. Sea
Demostracio
b1 , . . . , br una base de K como F (H)-espacio vectorial. Sea H = {1 , . . . , n }.
La aplicaci
on f : K n K r dada por
f (x1 , . . . , xn ) =

n
P

xi i (b1 ), . . . ,

i=1

n
P

i=1

xi i (br )

es claramente lineal, y como n = dim N(f )+dim Im f dim N(f )+r, concluimos
que dim N(f ) > 0, luego existe una n-tupla (c1 , . . . , cn ) de elementos de K no
n
P
todos nulos de modo que
ci i (bj ) = 0 para j = 1, . . . , r.
i=1

Si a K, entonces a = a1 b1 + + ar br para ciertos a1 , . . . , ar F (H).


Como son fijados por los automorfismos de H se cumple que
n
P

i=1

ci i (aj bj ) = aj

n
P

ci i (bj ) = 0,

i=1

y sumando para todos los j obtenemos que


pero esto contradice al teorema anterior.

n
P

i=1

ci i (a) = 0 para todo a K,

Supongamos ahora que |K : F (H)| > |H| = n. Sean b1 , . . . , bn+1 elementos


de K linealmente independientes sobre F (H).

7.5. La teora de Galois

261

Como antes podemos concluir que existen elementos (a1 , . . . , an+1 ) de K no


todos nulos de modo que
n+1
P

ai j (bi ) = 0

para j = 1, . . . , n.

(7.3)

i=1

Tomando el valor de j correspondiente al automorfismo identidad, se cumple


n+1
P
que
ai bi = 0, lo que significa que alguno de los ai
/ F (H), pues los bi son
i=1

independientes.
Reordenando podemos suponer que ai 6= 0 para i = 1, . . . , r y que los restantes son nulos. Tambien podemos escoger los ai con r mnimo. Ha de ser r > 1,
porque en otro caso tendramos b1 a1 = 0 y entonces a1 = 0, contradicci
on.
Podemos multiplicar todos los ai por a1
y
as

suponer
que
a
=
1.
Como
r
r
alg
un ai
/ F (H) y este no es ciertamente ar , podemos tomar a1
/ F (H).
Entonces existe un ndice h tal que h (a1 ) 6= a1 .
n+1

P
Aplicando h a (7.3) tenemos que se cumple
h (ai )h j (bi ) = 0 para
i=1

todo j = 1, . . . , n. Como j h recorre todo H cuando j = 1, . . . , n, podemos


Pn+1
escribir i=1 h (ai )j (bi ) = 0 y restando de (7.3) llegamos a que
n+1
X
i=1

ai h (ai ) j (bi ) = 0,

para j = 1, . . . , n. Pero ahora los coeficientes son nulos para i = r, . . . , n + 1,


aunque no lo es el primero. O sea, hemos encontrado unos valores que cumplen
lo mismo que (a1 , . . . , an+1 ) pero con m
as ceros, en contra de la minimalidad
de r.
Con esto llegamos al teorema de Galois. En el apartado 7) usamos la notaci
on KL para el cuerpo K(L) = L(K), o sea, el mnimo cuerpo que contiene
a K y L (donde K y L son dos cuerpos contenidos en un cuerpo com
un).
Teorema 7.44 (Teorema Fundamental de la Teora de Galois) Sea K/k
una extensi
on finita de Galois.
1. Existe una biyecci
on entre los cuerpos intermedios k L K y los
subgrupos de G(K/k). Esta biyecci
on asigna a cada cuerpo L el grupo
G(K/L) y su inversa asigna a cada grupo H el cuerpo F (H).
2. Si k L L0 K, entonces G(K/L0 ) G(K/L) G(K/k).
3. Si H H 0 G(K/k), entonces k F (H 0 ) F (H) K.
4. Si k L K entonces K/L es una extensi
on normal (luego de Galois).
5. Si k L K, la extensi
on L/k es normal (luego de Galois) si y s
olo si
G(K/L) es un subgrupo normal de G(K/k).

262

Captulo 7. Extensiones de cuerpos

6. Si k L K y L/k es de Galois, la aplicaci


on r : G(K/k) G(L/k)
dada por r() = |L es un epimorfismo de grupos cuyo n
ucleo es G(K/L),
luego G(L/k)
= G(K/k)/G(K/L)
7. Si H1 , H2 G(K/k) entonces

F hH1 , H2 i = F (H1 ) F (H2 )

F (H1 H2 ) = F (H1 )F (H2 ).

n: 4) Si K/k es normal, K es el cuerpo de escisi


Demostracio
on sobre k de
un cierto polinomio p(x), pero, obviamente, K tambien es el cuerpo de escisi
on
sobre L de p(x), luego K/L es normal.
1) La aplicaci
on que a cada L le asigna
G(K/L)
es

inyectiva,
pues si tenemos G(K/L) = G(K/L0 ), entonces F G(K/L) = F G(K/L0 ) , y como las
extensiones son de Galois, L = L0 .
Si H G(K/k) y L = F (H), es obvio
que H G(K/L) y, por el teorema

anterior, |H| = |K : L| = G(K/L) porque la extensi


on es de Galois, luego
H = G(K/L). Por lo tanto L es una antiimagen de H, luego la aplicaci
on es
biyectiva y su inversa es la que indica el enunciado.
2) y 3) son inmediatos.
5) Supongamos que L/k es normal. Sea G(K/L) y G(K/k). Para
cada a L se cumple que 1 (a) L (por el teorema 7.22). Consecuentemente,

1 (a) = 1 (a) y (a) = 1 (a) = 1 (a) = a, luego tenemos


que G(K/L) y en consecuencia G(K/L) E G(K/k).
Si G(K/L) E G(K/k), tomemos un polinomio irreducible p(x) k[x] con
una raz a en L. Como K/k es normal p(x) se escinde en K. Basta probar que
todas las races de p(x) en K est
an en L, y as p(x) se escindir
a en L. Sea b otra
raz de p(x) en K. Por el teorema 7.23 existe
un
automorfismo
G(K/k) tal

que (b) = a. Hemos de probar que b F G(K/L) = L.

1
Sea G(K/L). Entonces G(K/L), luego ( (a) = a, o sea,
(b) = a o, lo que es lo mismo, (b) = b.
6) La aplicaci
on r est
a bien definida porque si G(K/k), entonces el
teorema 7.22 garantiza que [L] = L, luego r() G(L/k). La aplicaci
on r es
suprayectiva tambien por el teorema 7.22, y obviamente es un epimorfismo de
grupos. El resto es inmediato.

7) Es una consecuencia inmediata de 1), 2) y 3). El grupo hH1 , H2 i es el


menor subgrupo de G(K/k) que contiene a H1 y a H2 , luego su cuerpo fijado
ha de ser el mayor cuerpo intermedio contenido en F (H1 ) y en F (H2 ), o sea,
ha de ser F (H1 ) F (H2 ). An
alogamente se tiene la otra igualdad.
Ejemplo El estudio de los grupos de Galois nos permite conocer todos los
cuerpos intermedios de una extensi
on finita de Galois. Como ilustraci
on vamos
a aplicarlo al cuerpo de escisi
on sobre Q del polinomio x3 2. Sabemos que es
de la forma K = Q(, ), donde , y son las races del polinomio, as como

7.5. La teora de Galois

263

que el grado de la extensi


on es 6, que el grupo de Galois G es isomorfo a 3 y
que por lo tanto permuta las tres races de todos los modos posibles.
Como 3 tiene cuatro subgrupos propios, el teorema de Galois nos dice que
la extensi
on Q(, )/Q tiene exactamente cuatro cuerpos intermedios. Vamos
a calcularlos.
Los subgrupos de 3 son los tres subgrupos de orden 2 generados por las
trasposiciones (, ), (, ) y (, ) y el subgrupo de orden 3 generado por el
ciclo (, , ).

El cuerpo F h(, )i cumple que Q(, ) : F h(, )i = h(, )i = 2,


luego F h(, )i : Q = 3 = Q() : Q. Como obviamente F h(, )i ,

tenemos la inclusi
on Q() F h(, )i y, al coincidir los grados, ha de ser
Q() = F h(, )i .

Igualmente, Q() = F h(, )i y Q() = F h(, )i .

Nos falta calcular F h(, , )i , que ha de tener grado 2 sobre Q. Para ello
observamos que como 6= , se cumple / 6= 1, pero (/)3 = 2/2 = 1, luego
= / es una raz del polinomio x3 1 distinta de 1. Por consiguiente Q(),
el cuerpo ciclot
omico
a contenido
de orden
3, est
en K y tiene grado 2 sobre Q,
luego ha de ser F h(, , )i = Q() = Q 3 .

En la secci
on siguiente mostraremos un primer ejemplo de c
omo la teora de
grupos permite obtener resultados no triviales sobre cuerpos, pero antes veamos
un par de resultados sencillos pero muy u
tiles con los que acabaremos de perfilar
la teora de Galois:
Teorema 7.45 Sean K/k y L/k extensiones finitas de un cuerpo k (contenidas
en un mismo cuerpo) y adem
as supongamos que K/k es de Galois. Entonces la
extensi
on KL/L es tambien de Galois y G(KL/L)
= G(K/K L).
n: La extensi
Demostracio
on K/k es normal, luego K es el cuerpo de
escisi
on sobre k de un cierto polinomio f (x) k[x]. Sean a1 , . . . , an las races de
f (x) en K. Entonces K = k(a1 , . . . , an ), luego es obvio que KL = L(a1 , . . . , an ).
Adem
as a1 , . . . , an son las races de f (x) K[x] en KL, luego KL es el cuerpo
de escisi
on sobre L de f (x), lo que implica que la extensi
on KL/L es normal.
Como los ai son separables sobre k, lo son sobre L y as KL/L es de Galois.
Si G(KL/L), como K/k es normal, se cumple que |K : K K, y
claramente |K G(K/K L).
La aplicaci
on : G(KL/L) G(K/K L) dada por () = |K es
ciertamente un homomorfismo de grupos y de hecho es un monomorfismo, pues
si () = I|K , entonces, como |L = I|L , resulta que = I|KL .
Consideremos el cuerpo E = F (Im ). Entonces K L E K. Si a E
se cumple |K (a) = a para todo G(KL/L), luego a F G(KL/L) = L.

Por lo tanto E KL, es decir, E = KL y as F (Im ) = F G(K/KL) ,


con lo que Im = G(K/K L) y es un isomorfismo.

264

Captulo 7. Extensiones de cuerpos

Teorema 7.46 Sean K/k y L/k dos extensiones finitas de Galois de un mismo
cuerpo k (ambas contenidas en un cuerpo mayor) y tales que K L = k. Entonces KL/k es finita de Galois y G(KL/k)
= G(K/k) G(L/k).
n: Si K es el cuerpo de escisi
Demostracio
on sobre k de un polinomio p(x)
y L es el cuerpo de escisi
on de q(x), es claro que KL es el cuerpo de escisi
on
de pq, luego KL/k es una extensi
on finita de Galois (la separabilidad es clara).
Por el teorema de Galois podemos definir : G(KL/k) G(K/k) G(L/k)
mediante () = (|K , |L ).
Obviamente es un homomorfismo de grupos. De hecho es un monomorfismo porque su n
ucleo es claramente trivial. Para probar que es biyectiva
basta
ver
que
ambos
grupos
tienen el mismo orden, pero por el teorema anterior

G(K/k) = G(KL/L), y as |KL : k| = |KL : L| |L : k| = |K : k| |L : k|.

7.6

Cuerpos algebraicamente cerrados

Sabemos que si k es un cuerpo y p(x) k[x], entonces existe una extensi


on
de k en la que p(x) tiene todas sus races (el cuerpo de escisi
on del polinomio),
pero cabe preguntarse si no es posible encontrar un cuerpo k que contenga ya
todas las races de todos los polinomios de k[x]. El teorema siguiente precisa
esta idea:
Teorema 7.47 Sea K un cuerpo. Las condiciones siguientes son equivalentes:
1. K no tiene extensiones algebraicas distintas de s mismo.
2. Los polinomios irreducibles en K[x] son los polinomios de grado 1.
3. Todo polinomio no constante de K[x] tiene una raz en K.
4. Todo polinomio de K[x] se escinde en K[x].
5. K contiene un subcuerpo k tal que la extensi
on K/k es algebraica y todo
polinomio no constante de k[x] se escinde en K[x].
n: 1) 2) Sabemos que todo polinomio de grado 1 es irreduDemostracio
cible, y los de grado 0 son unidades o el 0. Si existiera un polinomio irreducible
de grado mayor que 1, entonces dicho polinomio no tendra races en K, luego
existira una extensi
on de K en el que tendra una raz a, y K(a) sera una
extensi
on algebraica propia de K.
2) 3) Si un polinomio no es constante entonces no es nulo ni unitario,
luego tiene un factor irreducible, que ser
a de la forma ax + b K[x] con a 6= 0,
luego el polinomio tendr
a por raz b/a.
3) 4) Si f (x) K[x] es constante entonces f (x) = a0 K, luego se escinde
en K[x]. Si no es constante tiene una raz a1 K, luego f (x) = (x a1 )f1 (x),
para cierto polinomio f1 (x) K[x]. Si f1 (x) tampoco es constante tiene una
raz a2 K, luego f (x) = (x a1 )f1 (x) = f (x) = (x a1 )(x a2 )f2 (x), para

7.6. Cuerpos algebraicamente cerrados

265

cierto polinomio f2 (x) K[x]. Como el grado de los polinomios que vamos
obteniendo es cada vez una unidad menor, al cabo de un n
umero finito n de
pasos llegaremos a un polinomio de grado 0, es decir, a una constante a0 y
tendremos f (x) = a0 (x a1 ) (x an ).
4) 5) Basta tomar k = K.
5) 1) Si L/K es una extensi
on algebraica y a L entonces a es algebraico
sobre k, luego podemos considerar el polinomio p(x) = pol mn(a, k), que por
hip
otesis se escinde en K[x]. Existen a0 , a1 , . . . , an K tales que
p(x) = a0 (x a1 ) (x an ).
Como p(a) = 0, necesariamente a = ai para alg
un i, luego a K y en consecuencia L = K.
Definici
on 7.48 Diremos que un cuerpo K es algebraicamente cerrado si cumple cualquiera de las condiciones del teorema anterior.
La propiedad 5. est
a encaminada a encontrar cuerpos algebraicamente cerrados, pues lo que afirma es que si tenemos un cuerpo k que no es algebraicamente
cerrado, para que una extensi
on algebraica K de k lo sea basta con comprobar
que los polinomios de k[x] se escinden1 en K[x], sin necesidad de considerar los
nuevos polinomios (los de K[x]) que hemos obtenido al extender el cuerpo.
Por ejemplo, es obvio que Q no es algebraicamente cerrado y, a pesar de
que muchos polinomios irreducibles en Q[x] se escinden en R[x], lo cierto es que
R no es lo suficientemente grande como para ser algebraicamente cerrado,
pues, por ejemplo, el polinomio x2 + 1 no tiene races en R. Pero vamos a
demostrar que, en cierto sentido, este es el u
nico obst
aculo por el cual R
no es algebraicamente cerrado, y que, al eliminarlo, (es decir, adjuntando a R
una raz de dicho polinomio, con lo que obtenemos el cuerpo C de los n
umeros
complejos), llegamos a un cuerpo algebraicamente cerrado.
Conviene enunciar el resultado en un contexto general, que constituye la
primera aplicaci
on profunda de la teora de Galois que vamos a presentar:
Teorema 7.49 Sea R un cuerpo ordenado que cumpla las dos propiedades siguientes:
1. Todo a R positivo tiene una raz cuadrada en R.
2. Todo polinomio de grado impar en R[x] tiene al menos una raz en R.
Sea K = R(i), donde i es una raz del polinomio x2 + 1. Entonces el cuerpo K
es algebraicamente cerrado.
n: Notemos que x2 + 1 no puede tener races en un cuerpo
Demostracio
ordenado, por lo que |K : R| = 2. El teorema [G 5.2] nos da que todo elemento
de K tiene raz cuadrada. La f
ormula de las ecuaciones de segundo grado nos
da a su vez que todo polinomio de grado 2 con coeficientes en K tiene sus races
en K, lo cual equivale a que K no tiene extensiones algebraicas de grado 2.
1 El

teorema 12.20 afirma que, de hecho, basta con que tengan una raz en K.

266

Captulo 7. Extensiones de cuerpos

Supongamos ahora que K no es algebraicamente cerrado. Entonces existe un


polinomio no constante sin races en K. Sea L la adjunci
on a K de una raz de
dicho polinomio, con lo que tenemos una extensi
on finita L/K de grado mayor
que 1. La extensi
on L/R tambien es finita. Cambiando L por la clausura
normal de L sobre R podemos suponer que L/R es una extensi
on finita de
Galois (notemos que R, al ser un cuerpo ordenado, tiene caracterstica 0, luego
la extensi
on es separable).
Sea P un 2-subgrupo de Sylow del grupo de Galois G = G(L/R). Notemos
que P 6= 1, porque el grupo tiene orden par. Sea F el cuerpo fijado por P , de
modo que R F L. La extensi
on F/R es finita separable, luego tiene un
elemento primitivo, digamos F = R(a). Sea p = pol mn(a, R). Entonces p es
irreducible en R[x], pero es un polinomio de grado impar, pues |F : R| = |G : P |
es impar. Por hip
otesis p tiene que tener una raz en R, lo cual s
olo es posible
si p tiene grado 1, luego F = R y, por consiguiente, P = G.
As pues, hemos concluido que la extensi
on L/R tiene grado potencia de 2,
luego lo mismo le sucede a L/K. Pongamos que |L : K| = |G(L/K)| = 2n .
Ahora usamos que G(L/K) tiene un subgrupo de ndice 2, por el teorema 6.59.
Si F es su cuerpo fijado, tenemos que |F : K| = 2, pero hemos visto que K no
puede tener extensiones de grado 2.
Observemos que el cuerpo R de los n
umeros reales cumple las dos hip
otesis
del teorema anterior (teoremas [An 1.37] y [An 3.23]), luego el cuerpo C de
los n
umeros complejos es algebraicamente cerrado. El teorema siguiente nos da
otro ejemplo:
Teorema 7.50 Si K/k es una extensi
on de cuerpos y A es el conjunto de los
elementos de K algebraicos sobre k, entonces A es un cuerpo algebraicamente
cerrado.
n: Es claro que A = k(A), luego es un cuerpo, y si tomamos
Demostracio
un polinomio no constante p(x) k[x], sabemos que se escinde en K[x], pero
sus races ser
an algebraicas sobre k, luego estar
an en A, luego p(x) se escinde
en A[x], luego A es algebraicamente cerrado por el apartado 5) de 7.47.
Definici
on 7.51 Llamaremos A al conjunto de los n
umeros complejos algebraicos sobre Q que, por el teorema anterior, es un cuerpo algebraicamente cerrado.
Sus elementos se llaman simplemente n
umeros algebraicos.
Llamamos Ra al conjunto de los n
umeros reales algebraicos (sobre Q). Es
claro entonces que a + bi A si y s
olo si a, b Ra .

En efecto, si a, b Ra , entonces, a, b, i A, luego a+bi A. Recprocamente,


si a + bi A, entonces el conjugado a bi tambien es algebraico (con el mismo
polinomio mnimo sobre Q), luego a + bi + a bi = 2a A, luego a A, luego
bi = a + bi a A, luego b A.
Es claro entonces que A = Ra (i). De hecho, es f
acil ver que Ra cumple las
hip
otesis del teorema 7.49, por lo que la clausura algebraica de A se deduce
tambien de este teorema.

7.6. Cuerpos algebraicamente cerrados

267

Observemos que Ra 6= R porque Ra es numerable [An 1.49] y R no lo es


[An 1.46]. Claramente entonces A tambien es numerable, mientras que |C| = c.
Ejercicio: Probar que la extensi
on A/Q es algebraica, pero infinita.

Definici
on 7.52 Diremos que un cuerpo K es una clausura algebraica de un
cuerpo k si K es una extensi
on algebraica de k y es algebraicamente cerrado.
Por ejemplo, C es una clausura algebraica de R, y es la u
nica salvo Risomorfismo, es decir, que si K es cualquier clausura algebraica de R, entonces
K es un cuerpo R-isomorfo a C.
En efecto, podemos considerar una raz K del polinomio x2 + 1, de
modo que existe un R-isomorfismo : C R() K, pero entonces R() es
un cuerpo algebraicamente cerrado y la extensi
on K/R() es algebraica, luego
tiene que ser K = R(), y as : C K es un R-isomorfismo.
Similarmente, A es una clausura algebraica de Q, y tambien es u
nica salvo
Q-isomorfismo. Vamos a deducir esto de un resultado general:
Teorema 7.53 (AE)2 Sea K/k una extensi
on algebraica y : k L un
monomorfismo de cuerpos, con L es algebraicamente cerrado. Entonces se
extiende a un monomorfismo : K L.
n: Sea M el conjunto de todos los pares (A, ) tales que
Demostracio
k A K y : A L es un monomorfismo que extiende a . El conjunto
M est
a inductivamente ordenado por la relaci
on
(A, ) (A0 , 0 ) si y s
olo si A A0 y 0 |A = .
Sea (A, ) un elemento maximal. Es suficiente probar que A = K. En
otro caso sea u K \ A. Sea p(x) = pol mn(u, A) y sea p(x) el polinomio
correspondiente en [A][x] L[x] que, al ser L algebraicamente cerrado, tiene
una raz v L.
El teorema 7.13 nos da un monomorfismo 0 : A(u) L que extiende a ,
en contra de la maximalidad de (A, ). Por tanto A = K.
El caso particular que nos interesa de momento es:
Teorema 7.54 (AE)2 Si K es una clausura algebraica de k, K 0 es una clausura
algebraica de k0 y : k k0 es un isomorfismo, entonces se extiende a un
isomorfismo : K K 0 . En particular dos clausuras algebraicas de un
cuerpo k son kisomorfas.
2 No se necesita AE si la extensi
on K/k es finita, pues entonces puede expresarse como
K = k(a1 , . . . , an ) y puede ir extendi
endose sucesivamente a cada k(a1 , . . . ai ) usando el
teorema 7.13. Si |K : k| = 0 expresamos K = k(a1 , a2 , . . .) y s
olo necesitamos el axioma ED
junto con 7.13.

268

Captulo 7. Extensiones de cuerpos

n: Por el teorema anterior, se extiende a un monomorfismo


Demostracio
: K K 0 .
Como K es algebraicamente cerrado, [K] tambien lo es, y la extensi
on
0
K / [K] es algebraica, luego ha de ser [K] = K 0 , es decir, es un isomorfismo.
Si K y K 0 son dos clausuras algebraicas de un mismo cuerpo k, entonces la
identidad en k se extiende a un kisomorfismo de K en K 0 .
Notemos que si consideramos extensiones algebraicas de Q, no perdemos
generalidad si suponemos que son subcuerpos de C y, m
as concretamente de
A, pues ahora sabemos que toda extensi
on algebraica de Q es Q-isomorfa a un
subcuerpo de A.
Aunque hemos construido explcitamente una clausura algebraica para R y
para Q, lo cierto es que todo cuerpo tiene una clausura algebraica:
Teorema 7.55 (AE) Todo cuerpo tiene una clausura algebraica.
n: Sea k un cuerpo y consideremos el conjunto C = k[x] N.
Demostracio
Para cada k, llamemos
= (x , 0) C. Sea k = {
| k} C.
Notemos que la aplicaci
on k k dada por 7
es biyectiva, por lo que
todo elemento de k se expresa de forma u
nica como
, para un cierto k.
Dotamos a k de estructura de cuerpo mediante
+ = + ,
= . Es
claro que 7
es ahora un isomorfismo de cuerpos, que podemos extender

a un isomorfismo de anillos k[x] k[x].


Si p(x) k[x], representaremos su

imagen por p(x) k[x].


As hemos construido otro cuerpo k que algebraicamente es el mismo que k,
pero que desde un punto de vista conjuntista est
a contenido en C. Basta probar
que k tiene una clausura algebraica.
Sea M el conjunto3 de todos los cuerpos K tales que K/k es una extensi
on
algebraica y, como conjunto, K C y adem
as, si = (p(x), n) K, entonces
p() = 0.
entonces =
Notemos que k M pues si k,
= (x , 0), para cierto
k, de modo que x = x
= x , y ciertamente es raz de x .

Definimos en M la relaci
on de orden dada por K K 0 si y s
olo si K es un
0
subcuerpo de K . Vamos a comprobar que M S
cumple las hip
otesis del lema de
Zorn. Si C M es una cadena, entonces L = C C y si , 0 L, existe un
K C tal que , 0 K (porque C es una cadena) y las operaciones + 0 , 0
son independientes de la elecci
on de K. Por lo tanto, esto define una suma y
un producto en L de modo que cada K C es un subcuerpo de L. Esto implica
claramente que la extensi
on K/k es algebraica, y si = (p(x), n) L, existe un
3 M
KC y
as precisamente, los elementos de M son ternas (K, +, ), de manera que k
+, : K K K. En particular +, C C C, luego

(K, +, ) PC P(C C C) P(C C C),


luego M P(PC P(C C C) P(C C C)) = M. La funci
on de C en la demostraci
on
es garantizar que M pueda definirse por especificaci
on a partir del conjunto M.

7.7. Cuerpos formalmente reales

269

K C tal que K, luego por definici


on de M tenemos que p() = 0, luego
L M es una cota superior de C.
Por el lema de Zorn existe un elemento maximal K M. Basta probar
que K es algebraicamente cerrado. En caso contrario, K admite una extensi
on
algebraica K 0 . Para cada polinomio m
onico irreducible p(x) k[x] tal que p(x)
tenga al menos una raz en K 0 \ K, sean 1 , . . . m sus races en K 0 \ K. Como
p(x) tiene a lo sumo un n
umero finito de races en K, s
olo puede haber un
n
umero finito de n
umeros naturales n tales que (p(x), n) K, luego podemos
tomar un n mayor que todos ellos y definir
i = (p(x), n + i) C \ K.
As tenemos una aplicaci
on inyectiva K 0 C que sobre K es la identidad
0 C a la imagen de esta aplicaci
y sobre K 0 \ K es i 7
i . Si llamamos K
on,
0

es claro que podemos dotar a K de estructura de cuerpo K-isomorfo a K 0 y,


0 M y contradice la maximalidad de K.
como p(i ) = 0, tenemos que K

7.7

Cuerpos formalmente reales

En geometra se trabaja a menudo con cuerpos ordenados, y un cuerpo


ordenado nunca puede ser algebraicamente cerrado. Vamos a estudiar m
as
detalladamente que cuerpos admiten una relaci
on de orden y a continuaci
on
introduciremos un concepto an
alogo al de clausura algebraica para cuerpos ordenados.
Definici
on 7.56 Un cuerpo R es (formalmente) real si existe una relaci
on de
orden en R con la que cumple los axiomas de cuerpo ordenado.
Notemos que la diferencia entre cuerpo real y cuerpo ordenado es que el
segundo concepto presupone una relaci
on de orden dada en el cuerpo, mientras
que un cuerpo real puede admitir distintas relaciones de orden que cumplan los
axiomas de cuerpo ordenado.

Ejemplo Consideremos el cuerpo R = Q 2 R. Obviamente es un cuerpo

ordenado en el que 2 > 0, pero la conjugaci


on (a + b 2) = a b 2 es un
Q-automorfismo de R que nos permite definir otra relaci
on de orden en R con
la que R es tambien un cuerpo ordenado, a saber, la dada por
si y s
olo si () ().

Respecto a este orden, 2 < 0.


Que un cuerpo R sea formalmente real equivale a que exista un subconjunto
con ciertas propiedades:
Sea R un cuerpo. Un conjunto P R es un cono positivo si cumple las
propiedades siguientes:
1. Si a, b P , entonces a + b P y ab P .
2. R = P (P ) y P (P ) = {0} (donde P = {a | a P }).

270

Captulo 7. Extensiones de cuerpos

Es trivial comprobar que si R es un cuerpo ordenado, entonces el conjunto


P = {a R | a 0} es un cono positivo y, recprocamente, si P es un cono
positivo en R, entonces la relaci
on definida por a b si y s
olo si b a P es
una relaci
on de orden total en R con la que R se convierte en cuerpo ordenado
y respecto a la cual P = {a K | a 0}.
Por lo tanto, un cuerpo es real si y s
olo si admite un cono positivo. Esta
condici
on se puede debilitar bastante. Empecemos por relajarla un poco:
Diremos que P R es un precono positivo si cumple las propiedades siguientes:
1. Si a, b P , entonces a + b, ab P .
2. Si a R, entonces a2 P .
3. 1
/ P.
Es claro que todo cono positivo es un precono positivo (basta tener en cuenta
que es el conjunto de elementos 0 del orden que define en K). Recprocamente:
Teorema 7.57 (AE) Si R es un cuerpo, todo precono positivo en R est
a contenido en un cono positivo.4
n: Sea P0 un precono positivo en R y consideremos la familia
Demostracio
de todos los preconos positivos en R que contienen a P0 , considerada como
conjunto parcialmente ordenado por la inclusi
on. Es claro que el lema de Zorn
implica que existe un precono positivo P que contiene a P0 y es maximal respecto
de la inclusi
on. Vamos a probar que es un cono positivo. Obviamente cumple
la propiedad 1) de la definici
on.
Veamos ahora que si x R, entonces, o bien xP (1 + P ) = , o bien
xP (1 + P ) = .
Supongamos lo contrario. Entonces existen elementos a, b, c, d P tales
que xa = 1 + b, xc = 1 + d. Multiplicando ambas ecuaciones resulta que
acx2 = 1 + b + d + bd, luego 1 = acx2 + b + d + bd P , contradicci
on.

Supongamos, pues que xP (1 + P ) = . Sea P 0 = P xP . Como


0 = 02 P , todo p P se puede poner como p = p x0 P 0 , luego P P 0 .
4 Si el cuerpo R del teorema anterior es numerable, entonces no es necesario el axioma de
elecci
on. En efecto, podemos partir de una enumeraci
on {an }
on
n=1 de R y definir una sucesi
de preconos positivos {Pn }
n=0 que empiece con el precono dado P0 y de modo que Pn+1 sea
el conjunto de todos los elementos de R de la forma
s
P

i=1

ai1 aimi

con los aij Pn {an } S


si 1 no est
a en dicho conjunto, o Pn+1 = Pn en caso contrario. Es
claro entonces que P =
Pn es un precono positivo maximal.
n

Salvo que indiquemos otra cosa, esta observaci


on se aplica a todos los resultados posteriores
de esta secci
on, pues el axioma de elecci
on s
olo interviene a trav
es de la aplicaci
on de este
teorema.

7.7. Cuerpos formalmente reales

271

Por otra parte, P 0 es un precono positivo: tomamos p xp0 , q xq 0 P 0 , con


p, p0 , q, q 0 P :
(p xp0 ) + (q xq 0 ) = (p + q) x(q + q 0 ) P 0 .

(p xp0 )(q xq 0 ) = (pq + x2 p0 q 0 ) x(pq 0 + qp0 ) P 0


Como P P 0 , tenemos que P 0 contiene los cuadrados.
Si 1 P 0 , entonces existen a, b P tales que 1 = a bx, luego
a + 1 = bx xP (1 + x), contradicci
on.

La maximalidad de P implica entonces que P = P 0 y, como 0, 1 P (porque


son cuadrados) x = 0 1x P 0 = P .
Similarmente, si suponemos que xP (1 + P ) = , el mismo razonamiento
aplicado a x nos da que x P . Por consiguiente, R = P (P ).

Supongamos por u
ltimo que a P (P ) con a 6= 0. Entonces a, a P
y, por la parte ya probada, 1/a P (P ), luego 1/a P , luego resulta que
1 = a(1/a) P , contradicci
on.
As pues, un cuerpo es real si y s
olo si tiene un precono positivo. Ahora observamos que en todo cuerpo existe un conjunto que casi es un precono positivo:
Definici
on 7.58 Si K es un cuerpo, llamaremos SK al conjunto de todas las
sumas de cuadrados en K.
Como los preconos positivos contienen a todos los cuadrados y son cerrados
para sumas, es obvio que SK est
a contenido en todo precono positivo de K. M
as
a
un, es claro que SK cumple todas las condiciones de la definici
on de precono
positivo salvo quiz
a la u
ltima, es decir, salvo que 1
/ SK .
M
as a
un, conviene observar que SK \ {0} es un subgrupo de K .

Es claro que 1 SK \ {0} y que SK \ {0} es cerrado para productos, luego


la u
nica comprobaci
on necesaria es que tambien es cerrado para inversos:
2
n
X
1
a21 + + a2n
ai
=
=
.
a21 + + a2n
(a21 + + a2n )2
a21 + + a2n
i=1
Con esto llegamos a la caracterizaci
on m
as simple posible de los cuerpos
reales:

Teorema 7.59 (AE) Sea R un cuerpo. Las afirmaciones siguientes son equivalentes:
1. R es real.
2. 1 no es suma de cuadrados en R.
3. No todo elemento de R es suma de cuadrados y car R 6= 2.
4. Una suma de cuadrados en R es nula si y s
olo si todos los sumandos son
nulos.

272

Captulo 7. Extensiones de cuerpos

n: 1) 3) es trivial, pues si R es real toda suma de cuadrados


Demostracio
es 0 y car R = 0.
3) 2) Si 1 SR y car R 6= 2, entonces para todo a R, se cumple que

2
(a + 1)2 (a 1)2
a+1
a1
a=
=
+ (1)
SR ,
4
2
2
luego R = SR .
2) 1) La condici
on 1
/ SR es la u
nica que falta para asegurar que SR
es un precono positivo, luego implica que R es real, por el teorema 7.57.
2) 4) Supongamos que a21 + + a2n = 0 y no todos los sumandos son nulos. No perdemos generalidad si suponemos que ninguno lo es. Necesariamente
entonces, n 2, luego a2n SR \ {0}, luego 1 SR \ {0} (porque hemos
visto que SR \ {0} es un grupo), contradicci
on.
4) 2) Si 1 SR , entonces 12 + (1) = 0 es una suma de cuadrados nula
cuyos terminos no son nulos.
Ahora necesitamos un resultado tecnico:
Teorema 7.60 Sea K/k una extensi
on finita de grado impar de cuerpos de
caracterstica 0 y consideremos a1 , . . . , an k no nulos tales que la ecuaci
on
a1 x21 + + an x2n = 0 tenga una soluci
on no trivial en K (es decir, con alguna
xi 6= 0). Entonces existe tambien una soluci
on no trivial en k.
n: Por el teorema del elemento primitivo K = k(), para
Demostracio
cierto K. Sea g = pol mn(, k), cuyo grado ser
a de la forma 2m + 1. Ahora
usamos que K
= k[x]/(g), como se ve en la prueba del teorema 7.6. Podemos
trabajar con k[x]/(g), de modo que los xi que estamos suponiendo que existen
en K son clases [fi ], para ciertos fi k[x], de modo que
a1 f1 (x)2 + + an fn (x)2 = h(x)g(x).
Podemos exigir adem
as que grad fi 2m y que su m.c.d. es 1. El polinomio del
miembro izquierdo de la igualdad anterior tiene grado par 4m, luego si m 1
el grado de h tiene que ser impar y 2m 1. Entonces, alg
un factor irreducible
de h tiene que tener grado impar. Digamos que h = h1 h2 , donde h1 es irreducible
de grado impar. Sea una raz de h1 en una extensi
on de k y sea K 0 = k(), que
0
es una extensi
on de k de grado impar con |K : k| 2m 1 < 2m + 1 = |K : k|.
Como h1 no puede dividir a todos los polinomios fi , tenemos que las clases
[fi ] k[x]/(h1 )
on no trivial
= K 0 no son todas nulas, y determinan una soluci
2
de a1 x1 + + an x2n en K 0 . Como el grado va disminuyendo, tras un n
umero
finito de pasos tenemos que llegar a un cuerpo K en el que m = 0, es decir, tal
que K = k.
As pues, una condici
on necesaria y suficiente para que un cuerpo admita un
orden compatible con su estructura algebraica es simplemente que 1 no pueda
expresarse como suma de cuadrados.

7.7. Cuerpos formalmente reales

273

Teorema 7.61 (AE) Sea R un cuerpo ordenado y K/R una extensi


on finita.
Supongamos que se da uno de los dos casos siguientes:

1. Existe un a R positivo tal que K = R( a).


2. |K : R| es impar.
Entonces K es real y el orden de R se extiende a un orden en K.
n: Basta probar que el conjunto P0 formado por los elementos
Demostracio
n
P
de la forma
cj j2 , con cj R, j K, cj > 0 es un precono positivo en K,
j=1

pues entonces estar


a contenido en un cono positivo que contendr
a a todos los
elementos positivos de R, luego determinar
a un orden en K que extiende al
de R.
Es claro que P0 cumple todas las condiciones de la definici
on de precono
positivo salvo quiz
a que 1
/ P0 , luego s
olo se trata de probar que es imposible
que
n
P
1 =
cj j2 ,
j=1

con cj > 0 en R y j K. Vamos a dar una prueba separada para cada caso.
En el primero tenemos que
1 =

n
P

j=1

n
n
P
P

cj (aj + bj a)2 =
cj (a2j + ab2j ) +
2aj bj cj a,

luego de hecho 1 =
obviamente positiva.

j=1

n
P

j=1

j=1

cj (a2j + ab2j ), pero esto es imposible, porque la suma es

En el segundo caso basta aplicar el teorema anterior: tenemos que


x20 +

n
P

j=1

cj x2j = 0

tiene soluci
on en K con x0 = 1, luego tambien tiene soluci
on no trivial en R, lo
cual es imposible, al igual que antes.
Como consecuencia:
Teorema 7.62 Si R es un cuerpo real y a R, entonces a es suma de cuadrados si y s
olo si es positivo en toda ordenaci
on de R.
n: Una implicaci
Demostracio
on es obvia y, si a no es suma de cuadrados,

el teorema anterior nos da queR( a) es real y en cualquier ordenaci


on de

este cuerpo sucede que a = ( a)2 > 0, luego a < 0. Un orden en R( a)


se restringe a un orden en R en el que a < 0.
Definici
on 7.63 Un cuerpo R es realmente cerrado si es formalmente real y no
tiene extensiones algebraicas formalmente reales (distintas de el mismo).

274

Captulo 7. Extensiones de cuerpos

Teorema 7.64 (AE) Si R es un cuerpo realmente cerrado, entonces admite


una u
nica relaci
on de orden (que cumpla los axiomas de cuerpo ordenado),
concretamente, la que tiene por cono positivo a R2 (el conjunto de los cuadrados
en R).
n: Si R es realmente cerrado, admite una relaci
Demostracio
on de orden.
2
Sea C su cono positivo. Obviamente
R

C,
pero
si
a

C,
entonces el

teorema 7.61 nos da que el cuerpo R( a) es real,


y
obviamente
es
una
extensi
on

algebraica de R, luego tiene que ser R = R( a), luego a R2 . Por lo tanto,


R2 es un cono positivo y es, de hecho, el u
nico posible.
As pues, a partir de aqu consideraremos a todo cuerpo realmente cerrado
como cuerpo ordenado con la u
nica ordenaci
on posible.
Teorema 7.65 (AE) Si R es un cuerpo, las afirmaciones siguientes son equivalentes:
1. R es realmente cerrado.
2. Todo polinomio en R[x] de grado impar tiene una raz en R y R admite
un orden respecto al que todo elemento positivo tiene raz cuadrada en R.
3. El cuerpo R[i] (donde i2 = 1) es algebraicamente cerrado y contiene
estrictamente a R.
n: 1) 2) Ya hemos visto que R admite una ordenaci
Demostracio
on en la
que los elementos positivos son los cuadrados. Si p(x) R[x] es un polinomio de
grado impar, existe una extensi
on de R en la que tiene una raz . Consideramos
entonces la extensi
on R(), que tiene grado impar sobre R, luego el teorema
7.61 nos da que el cuerpo R() es real, luego R = R(), con lo que p(x) tiene
una raz en R.
2) 3) Como R admite un orden, no puede ser que 1 tenga raz cuadrada
en R. El resto es el teorema 7.49.
3) 1) Vamos a probar que toda suma de cuadrados en R es un cuadrado.
Esto implicar
a que 1 no es suma de cuadrados en R, por lo que 7.59 nos dar
a
que R es real.
Dados a, b R, tenemos que a + bi = (c + di)2 = c2 d2 + 2cdi, luego
a = c2 d2 y b = 2cd, luego
a2 + b2 = (c2 d2 )2 + 4c2 d2 = (c2 + d2 )2 .
Si K/R es una extensi
on algebraica real, entonces adjuntando a K una raz
de x2 + 1 obtenemos otra K() de modo que R()
= R(i), luego R() es
algebraicamente cerrado, luego K K() = R(), pero R() no es real, luego
K = R. Esto prueba que R no tiene extensiones algebraicas reales, luego es
realmente cerrado.
Como consecuencia:

7.7. Cuerpos formalmente reales

275

Teorema 7.66 Si R es un cuerpo realmente cerrado, entonces todo a R tiene


raz n-sima para n impar y, si a > 0, para todo n.
n: Sea n = 2u m, con m impar. El polinomio xm a tiene que
Demostracio
tener una raz b R. Si a > 0, es claro que tambien b > 0, y entonces podemos
extraer sucesivamente u races cuadradas, lo que nos da una raz n-sima de a.
Es f
acil ver que si n es impar entonces cada a R tiene una u
nica raz nsima, mientras que si es par y a > 0 tiene dos,
de las cuales s
olo una es positiva.
Por lo tanto, podemos usar la notaci
on usual n a para referirnos a la u
nica raz
n-sima de a si n es impar o a la u
nica raz positiva si n es par y a 0.
Definici
on 7.67 Si R es un cuerpo formalmente real, una clausura real de R
es una extensi
on algebraica K/R tal que K sea realmente cerrado con un orden
que extienda al de R.
Por ejemplo, el conjunto Ra de los n
umeros reales algebraicos es una clausura
real de Q. M
as a
un:
Teorema 7.68 Toda clausura real de Q es isomorfa a Ra .
n: Sea K una clausura real de Q. Recordemos de [An 1.2]
Demostracio
que un cuerpo ordenado K es arquimediano si N no est
a acotado en K. Vamos a
probar que K es arquimediano. En caso contrario existe K mayor que todos
los n
umeros naturales, luego tambien mayor que todos los n
umeros racionales.
Veamos por inducci
on sobre n que si p(x) Q[x] es un polinomio de grado n,
entonces n+1 > p(). Para n = 0 es precisamente la hip
otesis de que es
mayor que todo elemento de Q. Si vale para n y
p(x) = an+1 xn+1 + + a1 x + a0 ,
por la hip
otesis de inducci
on aplicada al polinomio (p(x) a0 )/x + 1,
n > an+1 n + + a2 + a1 + 1,
luego, multiplicando por > 0,
n+1 > an+1 n+1 + + a2 2 + a1 + > an+1 n+1 + + a2 2 + a1 + a0 .
Esto implica que no puede ser raz de ning
un polinomio m
onico de Q[x], en
contra de que K es algebraico sobre Q.
Por el teorema [An 1.43] tenemos que K es isomorfo (como cuerpo ordenado)
a un subcuerpo R R. Entonces R es tambien una clausura real de Q. En
particular, como R/Q es algebraica, tiene que ser R Ra , pero como Ra es real
y R no admite extensiones algebraicas reales, tiene que ser R = Ra , luego K es
isomorfo a Ra .
En general, todo cuerpo real tiene una clausura real:

276

Captulo 7. Extensiones de cuerpos

Teorema 7.69 (AE) Todo cuerpo ordenado R tiene una clausura real5 cuya
relaci
on de orden extiende a la de R.
n: Sea C una clausura algebraica de R. Podemos aplicar el
Demostracio
lema de Zorn al conjunto de todos los cuerpos ordenados R K C tales que
el orden de K extiende al de R. Obtenemos as un elemento maximal K, es
decir, un cuerpo ordenado que contiene a R como subcuerpo ordenado y que
no admite extensiones algebraicas dentro de C que cumplan lo mismo. Basta
probar que K es realmente cerrado.
El mismo argumento del teorema 7.62 prueba que todo elemento positivo
en K tiene raz cuadrada, por lo que el orden en K es u
nico (los elementos
positivos son los cuadrados).
Es claro que si K admite una extensi
on real algebraica, admite una que
cumple K K 0 C. Pero entonces el orden de K 0 se restringe a un orden en
K, pero como el orden de K es u
nico, de hecho el orden de K 0 extiende al de K,
luego al de R, pero esto contradice la maximalidad de R salvo que K 0 = K.
Tambien es cierto en general que dos clausuras reales de un mismo cuerpo
real R son R-isomorfas, pero la demostraci
on tendr
a que esperar hasta 8.58.
Terminamos ahora con un teorema adicional sobre sumas de cuadrados:
Definici
on 7.70 Un n
umero Ra es totalmente real si todos sus conjugados
(sobre Q) son n
umeros reales.

Por ejemplo, 3 2 es real, pero no es totalmente real, pues sus conjugados (las
otras races c
ubicas de 2) son imaginarias.
Es claro que el conjunto Rtr de los n
umeros totalmente reales es un subcuerpo
de Ra , y de hecho la extensi
on Rtr /Q es de Galois, pues es obvio que todo
conjugado de un n
umero totalmente real es totalmente real.
Diremos que Ra es totalmente positivo si todos sus conjugados son reales
y positivos.
Teorema 7.71 Si K Rtr , un elemento de K es totalmente positivo si y s
olo
si es suma de cuadrados en K.
n: Es inmediato que si K es suma de cuadrados, entonDemostracio
ces es totalmente positivo, pues sus conjugados ser
an n
umeros reales sumas de
cuadrados de n
umeros reales. Recprocamente, si no es suma de cuadrados, el
teorema 7.62 nos da que existe un orden en K respecto al cual < 0. Entonces
K es isomorfo (como cuerpo ordenado) a un subcuerpo de R (por el mismo argumento empleado en 7.68, porque K tiene que ser arquimediano), y la imagen
de por el isomorfismo es un conjugado negativo, luego no es totalmente
positivo.
5 Aqu
usamos por segunda vez el lema de Zorn, pero una vez m
as es f
acil ver que no se
requiere AE si el cuerpo es numerable.

7.8. Extensiones ciclot


omicas

7.8

277

Extensiones ciclot
omicas

En esta secci
on mostraremos c
omo la teora de Galois nos da un buen control
sobre los cuerpos ciclot
omicos. M
as en general, aprovechamos la ocasi
on para
introducir el concepto de extensi
on ciclot
omica de un cuerpo arbitrario y de un
orden arbitrario, no necesariamente primo.
Definici
on 7.72 Llamaremos extensi
on ciclot
omica n-sima de un cuerpo k al
cuerpo de escisi
on sobre k del polinomio xn 1.
u

Si car k = p y n = pu m con (m, p) = 1, entonces xn 1 = (xm 1)p , lo


que implica que el cuerpo de escisi
on de xn 1 es el mismo que el de xm 1, o
en otros terminos, que la extensi
on ciclot
omica n-sima coincide con la extensi
on
ciclot
omica m-sima. Por esta raz
on podemos restringirnos al caso en el que
car k - n (incluyendo el caso car k = 0).
Sea K/k una extensi
on ciclot
omica n-sima tal que car k - n. Entonces la
derivada del polinomio xn 1 es nxn1 6= 0, y la u
nica raz de este polinomio
es 0, que no es raz de xn 1. Por lo tanto las races de xn 1 en K son todas
simples (separables) y hay n de ellas. As pues, toda extensi
on ciclot
omica es
finita de Galois.
Las races del polinomio xn 1 en un cuerpo cualquiera se llaman races
n-simas de la unidad. En una extensi
on ciclot
omica n-sima (bajo las hip
otesis
indicadas) hay n races n-simas de la unidad.
Es obvio que el producto de dos races n-simas de la unidad vuelve a ser
una raz n-sima, as como que el inverso de una raz n-sima es tambien una
raz n-sima. Esto significa que el conjunto de las races n-simas de la unidad
en un cuerpo cualquiera forman un subgrupo finito del grupo multiplicativo del
cuerpo. Por el teorema 6.13 se trata de un grupo cclico.
As pues, si K/k es una extensi
on ciclot
omica n-sima tal que car k - n, el
conjunto de las races n-simas de la unidad es un grupo cclico de orden n. A
los elementos de orden n (o sea, a los generadores) se les llama races n-simas
primitivas de la unidad. Por 6.45 hay exactamente (n) de ellas, donde es la
funci
on de Euler. As, si es una raz n-sima primitiva de la unidad, las races
restantes son 1, , 2 , . . . , n1 . Obviamente, K = k().
Llamaremos polinomio ciclot
omico n-simo al polinomio
cn (x) = (x 1 ) (x m ),
donde 1 , . . . , m son las races n-simas primitivas de la unidad en K. Notemos
que grad cn (x) = m = (n).
Si K/k es una extensi
on ciclot
omica n-sima, K es una raz n-sima
primitiva de la unidad y P es el cuerpo primo de k, entonces cn (x) P [x].
En efecto, la extensi
on P ()/P es tambien ciclot
omica n-sima y, por definici
on,
el polinomio cn (x) para la extensi
on P ()/P es el mismo que para K/k. Los
automorfismos de P () permutan las races primitivas, luego sus extensiones

278

Captulo 7. Extensiones de cuerpos

a P ()[x] dejan invariante a cn (x) (permutan sus factores), pero esto es lo


mismo que decir que dejan
invariantes

a sus coeficientes y, por lo tanto, estos


coeficientes est
an en F G(P ()/P ) = P .
Con esto hemos probado que los polinomios cn (x) pueden obtenerse siempre
a partir de una extensi
on ciclot
omica de un cuerpo primo P . Como dos cuerpos
de escisi
on de un mismo polinomio sobre P son P -isomorfos, en realidad cn (x)
no depende de la extensi
on K de P que tomemos. En resumen, que hay un
u
nico polinomio cn (x) para cada cuerpo primo, o dicho de otro modo, si K es
cualquier cuerpo en el que exista una raz n-sima primitiva de la unidad, es
decir, una raz n-sima de la unidad de orden n, entonces el polinomio cuyas
races (simples) son todas las races n-simas primitivas de la unidad en K es
cn (x), un polinomio que no depende m
as que de la caracterstica de K.
Pronto probaremos que, esencialmente, el polinomio cn (x) tampoco depende
de la caracterstica.
Observemos que c1 (x) = x 1 y c2 (x) = x + 1 (pues 1 es la u
nica raz
cuadrada primitiva de la unidad). El teorema siguiente nos permite calcular
f
acilmente los polinomios ciclot
omicos.
Teorema 7.73 Sea k un cuerpo tal que car k - n. Entonces
xn 1 =

cd (x).

d|n

n: Sea K/k una extensi


Demostracio
on ciclot
omica n-sima. Para cada
divisor d de n sea Ad el conjunto de las races de la unidad de orden d. De este
modo {Ad }d|n es una partici
on del conjunto de las races n-simas de la unidad,
es decir, una partici
on del conjunto de las races de xn 1, y los elementos de
cada Ad son las races d-esimas primitivas de la unidad en K, luego cd (x) tiene
por races a los elementos de Ad . A partir de aqu el teorema es inmediato.
Por lo tanto,

xn 1
cn (x) = Q
cd (x)
d|n
d6=n

As podemos calcular recurrentemente los polinomios ciclot


omicos:
c3 (x) =
c6 (x) =

x3 1
= x2 + x + 1,
x1
x6 1
= x2 x + 1.
(x 1)(x + 1)(x2 + x + 1)

La tabla 7.1 contiene los primeros polinomios ciclot


omicos. El lector observar
a sin duda que los coeficientes no nulos de los polinomios ciclot
omicos
son 1. As se cumple hasta llegar al polinomio ciclot
omico de orden 104, en
cambio, este es el centesimo quinto polinomio ciclot
omico:

7.8. Extensiones ciclot


omicas

279

Tabla 7.1: Polinomios ciclot


omicos
c1 (x)
c2 (x)
c3 (x)
c4 (x)
c5 (x)
c6 (x)
c7 (x)
c8 (x)
c9 (x)
c10 (x)

=
=
=
=
=
=
=
=
=
=

x1
x+1
x2 + x + 1
x2 + 1
x4 + x3 + x2 + x + 1
x2 x + 1
x6 + x5 + x4 + x3 + x2 + x + 1
x4 + 1
x6 + x3 + 1
x4 x3 + x2 x + 1

c105 (x) = x48 + x47 + x46 x43 x42 2x41 x40 x39 + x36 + x35
+ x34 + x33 + x32 + x31 x28 x26 x24 x22 x20 + x17 + x16
+ x15 + x14 + x13 + x12 x9 x8 2x7 x6 x5 + x2 + x + 1.
Como vemos, tiene dos coeficientes iguales a 2. Puede probarse que existen
polinomios ciclot
omicos con coeficientes tan grandes en m
odulo como se quiera.
Lo que s se cumple siempre es que los coeficientes son enteros:
Teorema 7.74 Los polinomios ciclot
omicos sobre Q tienen los coeficientes enteros.
n: Por inducci
Demostracio
on. Para n = 1 tenemos c1 (x) = x 1.
Supongamos que cm (x) Z[x] para todo m < n. Sea
Y
q(x) =
cd (x).
d|n
d6=n

Por hip
otesis de inducci
on q(x) Z[x] y es m
onico. Por el teorema anterior
xn 1 = cn (x)q(x).
En Z[x] existen polinomios p(x) y r(x) tales que xn 1 = q(x)p(x) + r(x),
donde el grado de r(x) es menor que el de q(x), pero esto tambien es cierto en
Q[x] y, por la unicidad de la divisi
on eucldea, ha de ser p(x) = cn (x) y r(x) = 0,
o sea, cn (x) Z[x].
Notemos que las divisiones necesarias para calcular cn (x) seg
un el teorema
7.73 se pueden hacer como si los polinomios fueran de Z[x] aunque en realidad
sean de (Z/pZ) [x], lo que significa que los polinomios ciclot
omicos de caracterstica p (cuando existen) son los mismos que los de caracterstica 0, pero
considerando a sus coeficientes en Z/pZ. En definitiva, cn (x) es esencialmente
u
nico.

280

Captulo 7. Extensiones de cuerpos

Ya conocemos los polinomios ciclot


omicos de orden primo p. En captulos
anteriores hemos visto que cp (x) = xp1 + +x+1 y que es irreducible en Q[x].
Vamos a ver que en realidad esto vale para todos los polinomios ciclot
omicos
sobre Q.
Teorema 7.75 El polinomio cn (x) es irreducible en Q[x].
n: Por el criterio de Gauss es suficiente probar que es irreduDemostracio
cible en Z[x]. Sea f (x) un factor m
onico irreducible no constante de cn (x) en
Z[x]. Hemos de probar que f (x) = cn (x). Sea una raz n-sima primitiva de
la unidad tal que f () = 0. Sea p un primo tal que p n y (p, n) = 1. Veamos
que p es raz de f (x).
Sea cn (x) = f (x)g(x), con f (x), g(x) Z[x]. Por el teorema 6.12 el orden
de p es tambien n, o sea, p es otra raz n-sima primitiva de la unidad y, en
consecuencia, es raz de cn (x). Si no fuera raz de f (x) lo sera de g(x), o sea,
g( p ) = 0. Entonces es raz del polinomio g(xp ) y, como f (x) = pol mn(, Q),
se ha de cumplir f (x) | g(xp ).
Sea g(xp ) = f (x)h(x). Dividiendo eucldeamente en Z[x] y por la unicidad
de la divisi
on en Q[x] podemos concluir que h(x) Z[x].
Ahora
tomamos
m


clases

odulo p en los coeficientes de los polinomios, con lo


que g(xp ) = f (x) h(x) . Pero todo u Z/pZ cumple up = u (pues si u 6= 0
p1
pertenece al grupo multiplicativo,
= 1), y esto nos
pde orden
p p 1, luego u
permite extraer el exponente: g(x ) = g(x) .

Todo factor irreducible de f (x) divide a g(x) , luego a g(x) .


De aqu llegamos a una contradicci
on, pues xn 1 = cn (x)s(x), para un
cierto polinomio en Q[x]. De nuevo por la unicidad

de la divisi
on eucldea
de hecho s(x) Z[x], luego luego xn [1] = f (x) g(x) s(x) , ahora bien,
sabemos que el polinomio xn [1] debe escindirse en factores distintos, pero por
otro lado los polinomios f (x) y g(x) tienen factores comunes.
Con esto hemos probado que p es raz de f (x) para todo primo p < n con
(p, n) = 1.
Si (m, n) = 1 y m < n, entonces los primos en los que se descompone m
son menores que n y primos con n, luego aplicando repetidas veces lo anterior
llegamos a que m es tambien raz de f (x), pero por el teorema 6.12 toda raz
primitiva es de la forma m con (n, m) = 1, luego f (x) tiene todas las races de
cn (x) y, en consecuencia, f (x) = cn (x).
Tras estos resultados generales, pasamos a estudiar los grupos de Galois de
las extensiones ciclot
omicas. En el teorema siguiente incluimos algunos hechos
b
asicos que ya hemos usado y probado.
Teorema 7.76 Sea K/k una extensi
on ciclot
omica n-sima, tal que car k - n.
Entonces:
1. La extensi
on K/k es finita de Galois.
2. Si K es una raz n-sima primitiva de la unidad, K = k().
3. pol mn(, k) | cn (x).

7.8. Extensiones ciclot


omicas

281

4. G(K/k) es isomorfo a un subgrupo del grupo Un de las unidades de Z/nZ.


5. El polinomio cn (x) es irreducible en k[x] si y s
olo si G(K/k)
= Un , y en
tal caso el grado de la extensi
on es (n).
n: 1), 2) y 3) ya est
Demostracio
an probados. Para probar 4) fijamos una
raz n-sima primitiva de la unidad . Para cada G(K/k) es claro que ()
ha de ser otra raz n-sima primitiva, que ser
a de la forma m , con (m, n) = 1.
Como el orden de es n, el n
umero m s
olo est
a determinado m
odulo n, o lo
que es lo mismo, la clase [m] Un est
a unvocamente determinada por .
Sea : G(K/k) Un que a cada automorfismo le asigna la clase [m] del
modo descrito. As, si () = [m], entonces () = m . Es f
acil ver que es
un homomorfismo de grupos. Adem
as si () = [1] entonces () = , luego
= 1. Por lo tanto es inyectivo y G(K/k) es isomorfo a un subgrupo de Un .
5) El polinomio cn (x) es irreducible en k[x] si y s
olo si es el polinomio mnimo
de
las
ra
ces
primitivas
(por
3),
si
y
s
o
lo
si
|K
:
k|
= (n) (por 2), si y s
olo si


G(K/k) = Un , si y s
olo si G(K/k)
= Un (por 4).

En particular todas las extensiones ciclot


omicas son abelianas y las de orden
primo son cclicas (pues los grupos Up son cclicos). El teorema siguiente es un
ejemplo sencillo de c
omo la teora de Galois transforma un problema de cuerpos
en otro m
as manejable sobre grupos finitos.
Teorema 7.77 Para cada n
umero natural n sea n una raz n-sima primitiva
de la unidad. Sean a y b dos n
umeros naturales, d = mcd(a, b) y m = mcm(a, b).
Entonces
Q(a )Q(b ) = Q(m )

Q(a ) Q(b ) = Q(d ).

n: Es claro que Q(d ), Q(a ) y Q(b ) est


Demostracio
an contenidos en
Q(m ), pues d , a y b son potencias de
.
Para
i
=
d,
a,
b, m, llamemos
m

Hi = G Q(m )/Q(i ) . Si identificamos G Q(m )/Q


= Um , de acuerdo con
el teorema 7.76, entonces

Hi = [x] Um x 1 (mod i) ,
pues [x] Hi si y s
olo si ix = i si y s
olo si x 1 (mod i).

Hemos de probar que Ha Hb = Hm = 1 y que Ha Hb = Hd . Ahora bien,


es obvio que x 1 es m
ultiplo de a y b si y s
olo si es m
ultiplo de m, lo que nos
da la primera igualdad.
A su vez esto implica
que |Ha Hb | =
|Ha | |Hb | (por el teorema 6.38). Teniendo
en cuenta que |Hi | = Q(m ) : Q(i ) = (m)/(i), concluimos que
|Ha Hb | =

(m) (m)
(m)
=
= |Hd |.
(a) (b)
(d)

Como Ha Hb Hd , la igualdad de ordenes implica Ha Hb = Hd .


Ejercicio: Probar que a b es una raz m-sima primitiva de la unidad. Deducir
directamente la primera igualdad del teorema anterior.
Ejercicio: Probar que si m es impar entonces Q(m ) = Q(2m ).

Captulo VIII

Algebra
lineal
Presentamos aqu una serie de conceptos, tecnicas y resultados relacionados
con m
odulos y espacios vectoriales que constituyen el n
ucleo de lo que se conoce
como algebra lineal. Empezamos estudiando el concepto de determinante, cuya
versatilidad es tan grande que es difcil dar una idea del amplio abanico de situaciones en las que interviene, desde el c
alculo de areas y vol
umenes hasta en
la definici
on de invariantes que captures informaci
on esencial en numerosos contextos algebraicos, pasando por la formalizaci
on del concepto de orientaci
on
o incluso como herramienta de c
alculo.

8.1

Determinantes

El concepto de determinante de una matriz cuadrada es uno de los m


as
vers
atiles que vamos a estudiar en este captulo. Como la definici
on puede
resultar artificial, en lugar de definirlo directamente empezaremos estableciendo
las propiedades que deseamos que cumplan los determinantes y concluiremos
que la u
nica definici
on posible es la que vamos a adoptar.
Definici
on 8.1 Sea A un dominio y n un n
umero natural no nulo. Entonces An
es un A-m
odulo libre de rango n. Una aplicaci
on f : (An )n A es una forma
multilineal si para todos los elementos v1 , . . . , vn , v 0 An , todos los a, a0 A y
todo ndice 1 i n se cumple
f (v1 , . . . , avi + a0 v 0 , . . . , vn ) = af (v1 , . . . , vi , . . . , vn ) + a0 f (v1 , . . . , v 0 , . . . , vn ).
Una forma multilineal f es antisimetrica si cuando la n-tupla x (An )n resulta
de intercambiar el orden de dos componentes de la n-tupla y (An )n , entonces
f (x) = f (y).
Una forma multilineal f es alternada si toma el valor 0 sobre todas las ntuplas que tienen dos componentes iguales.
Antes de discutir estos conceptos conviene destacar algunas consecuencias
sencillas de la definici
on:
283


Captulo 8. Algebra
lineal

284

Teorema 8.2 Sea A un anillo conmutativo y unitario y f : (An )n A una


forma multilineal.
1. La forma f es antisimetrica si y s
olo si para toda permutaci
on n y
todos los v1 , . . . , vn An se cumple
f (v(1) , . . . , v(n) ) = (sig )f (v1 , . . . , vn )
2. Si f es alternada, entonces es antisimetrica.
n: 1) Si f cumple esta propiedad es antisimetrica, pues al
Demostracio
intercambiar dos elementos estamos aplicando una trasposici
on y las trasposiciones tienen signatura 1. Si f es antisimetrica, el valor de f (v(1) , . . . , v(n) )
puede obtenerse aplicando sucesivas trasposiciones sobre f (v1 , . . . , vn ), que cambiar
an el signo de f tantas veces como trasposiciones compongan a . Por lo
tanto el resultado final ser
a (sig )f (v1 , . . . , vn ).
2) Supongamos que f es alternada y sean 1 i < j n, v1 , . . . , vn An .
Entonces
(i)

(j)

0 = f (v1 , . . . , vi + vj , . . . , vi + vj , . . . vn )
(i)

(j)

(i)

(j)

(i)

(j)

(i)

(j)

= f (v1 , . . . , vi , . . . , vi , . . . vn ) + f (v1 , . . . , vi , . . . , vj , . . . vn )
+ f (v1 , . . . , vj , . . . , vi , . . . vn ) + f (v1 , . . . , vj , . . . , vj , . . . vn )
(i)

(i)

(i)

(j)

= 0 + f (v1 , . . . , vi , . . . , vj , . . . vn ) + f (v1 , . . . , vj , . . . , vi , . . . vn ) + 0,
luego f (v1 , . . . , vj , . . . , vi , . . . vn ) = f (v1 , . . . , vi , . . . , vj , . . . vn ).
Ejercicio: Probar que si car A 6= 2 entonces una forma multilineal sobre (An )n es
antisimetrica si y s
olo si es alternada.

De este modo vemos que los conceptos de forma antisimetrica y forma alternada son casi equivalentes. El segundo nos evita algunos problemas que surgen
cuando puede ocurrir x = x sin que x sea 0, pero en tal caso la teora que
vamos a desarrollar es de poca utilidad. Ahora probamos que siempre existe
una forma multilineal alternada en (An )n , y que es esencialmente u
nica, lo que
dar
a pie a la definici
on de la funci
on determinante.
Teorema 8.3 Sea A un dominio y n un n
umero natural no nulo. Sea e1 , . . . , en
la base can
onica de An y sea a A. Existe una u
nica forma multilineal alternada
f : (An )n A tal que f (e1 , . . . , en ) = a.
n: Supongamos que existe f y veamos que es u
Demostracio
nica. De este
modo obtendremos la forma que ha de tener y podremos construirla.
Sea (v1 , . . . , vn ) (An )n . Para cada i = 1, . . . , n sea
vi = (ai1 , . . . , ain ) =

n
P

j=1

aij ej .

8.1. Determinantes

285

Por la multilinealidad,
f (v1 , . . . , vn ) = f

n
P

j1 =1

n
P

j1 =1

a1j1 ej1 , . . . ,

n
P

jn =1

n
P

jn =1

anjn ejn

a1j1 anjn f (ej1 , . . . , ejn ).

Como f es alternada, todas las asignaciones k 7 jk que no sean biyecciones


har
an que f (ej1 , . . . , ejn ) = 0, luego podemos eliminarlas de las sumas y as
P
f (v1 , . . . , vn ) =
a1(1) an(n) f (e(1) , . . . , e(n) ).
n

Como f es alternada tenemos que f (e(1) , . . . , e(n) ) = (sig )f (e1 , . . . , en ),


luego
P
f (v1 , . . . , vn ) = a
(sig ) a1(1) an(n) .
(8.1)
n

Dado que esta expresi


on no depende de f concluimos que si f existe es
u
nica. Adem
as esto nos lleva a definir f : (An )n A por la f
ormula (8.1).
Si probamos que la funci
on as definida es una forma multilineal alternada y
adem
as f (e1 , . . . , en ) = a, el teorema quedar
a demostrado.
Tomemos v1 , . . . , vn , v 0 An , b, b0 A y 1 i n. Sea vi = (ai1 , . . . , ain ),
v = (a1 , . . . , an ). Claramente bvi + b0 v 0 = (bai1 + b0 a1 , . . . , bain + b0 an ), luego
P
f (v1 , . . . , bvi + b0 v 0 , . . . , vn ) = a
(sig )a1(1) (bai(i) + b0 a(i) ) an(n)
0

= ba

(sig )a1(1) ai(i) an(n) + b0 a

(sig )a1(1) a(i) an(n)

= bf (v1 , . . . , vi , . . . , vn ) + b0 f (v1 , . . . , v 0 , . . . , vn ).

Esto prueba que f es multilineal. Para probar que es alternada supongamos


que vi = vj con i < j. Entonces aik = ajk para k = 1, . . . , n.
Sea An el grupo alternado, formado por las permutaciones de signatura
positiva, y sea Bn el conjunto de las permutaciones impares.
Es inmediato que la aplicaci
on g : An Bn dada por g() = (i, j) es
biyectiva.
Si An y = g(), entonces ai(i) = ai (j) = aj (j) e igualmente se
cumple aj(j) = ai (i) . De aqu resulta que a1(1) an(n) = a1 (1) an (n) ,
y como sig = sig g(), el sumando correspondiente a se cancela con el
correspondiente a g() y, en total, f (v1 , . . . , vn ) = 0.

1 si i = j,
Por u
ltimo, si (v1 , . . . , vn ) = (e1 , . . . , en ), entonces aij =
y el
0 si i 6= j,
u
nico sumando no nulo en (8.1) es el correspondiente a = 1, con lo que queda
f (e1 , . . . , en ) = a.
Ahora ya podemos definir la aplicaci
on determinante. Conviene observar que
si A es un dominio y n un n
umero natural no nulo, podemos identificar (An )n
con Matn (A). Concretamente, cada (v1 , . . . , vn ) (An )n puede identificarse
con la matriz que tiene por filas a v1 , . . . , vn . De hecho esta correspondencia es
un isomorfismo de A-m
odulos.


Captulo 8. Algebra
lineal

286

Por ello es indistinto considerar que el dominio de una forma multilineal es


(An )n o Matn (A). El teorema anterior puede reformularse como que existe una
u
nica forma multilineal alternada f sobre Matn (A) tal que f (In ) sea un valor
dado a A.
Definici
on 8.4 Si A es un dominio y n es un n
umero natural no nulo, llamaremos funci
on determinante det : Matn (A) A a la u
nica forma multilineal
alternada que cumple det(In ) = 1.
Dada una matriz cuadrada B, escribiremos indistintamente det(B) o |B|
para representar al determinante de B.
Seg
un la construcci
on del teorema anterior, si B = (bij ), entonces
P
|B| =
(sig ) b1(1) bn(n) .
n

Por ejemplo, si n = 1 es claro que |a| = a para todo a A.


Para n = 2 tenemos la f
ormula:

a b

c d = ad bc.

Para n = 3 hay 6 sumandos, tres con signo positivo y tres con signo negativo.
El lector puede comprobar que el desarrollo es el este:

a b c

d e f = aei + bf g + cdh ceg bdi af h.

g h i

El esquema siguiente (conocido como regla de Sarrus) permite recordar


f
acilmente la f
ormula:

La f
ormula de los determinantes de orden 4 contiene 24 sumandos, por lo
que no resulta pr
actica. M
as adelante veremos formas razonables de calcular
determinantes de cualquier orden.
Teorema 8.5 El determinante de una matriz cuadrada coincide con el de su
traspuesta.

8.1. Determinantes

287

n: Sea B = (bij ) una matriz n n con coeficientes en un


Demostracio
dominio A. Entonces
P
|B t | =
(sig ) b(1)1 b(n)n .
n

Reordenando los factores de cada sumando queda


P
P
|B t | =
(sig ) b11 (1) bn1 (n) =
(sig 1 ) b11 (1) bn1 (n) ,
n

y como la correspondencia 7 es biyectiva queda


P
|B t | =
(sig ) b1(1) bn(n) = |B|.
n

El interes de este teorema reside en que, gracias a el, todas las propiedades
que cumplen los determinantes respecto a las filas de una matriz se cumplen
tambien respecto a las columnas.
Una de las propiedades m
as importantes de los determinantes es la siguiente:
Teorema 8.6 Consideremos un dominio A, un n
umero natural no nulo n y dos
matrices B, C Matn (A). Entonces |BC| = |B| |C|.
n: Sea f : Matn (A) A dada por f (B) = |BC|. Vamos a
Demostracio
probar que f es una forma multilineal alternada.
Por comodidad usaremos la notaci
on f (B1 , . . . , Bn ) para indicar la imagen
de la matriz B que tiene filas B1 , . . . , Bn . Notemos que la fila i-esima de BC es
(Bi C 1 , . . . , Bi C n ), donde C 1 , . . . , C n son las columnas de la matriz C.
As, f (B1 , . . . , Bn ) = det(Z1 , . . . , Zn ), donde Zi = (Bi C 1 , . . . , Bi C n ). A
partir de aqu se sigue inmediatamente la multilinealidad de f . Adem
as, si
Bi = Bj , entonces Zi = Zj , luego f (B1 , . . . , Bn ) = 0.
Con la notaci
on del teorema 8.3, tenemos adem
as que
f (e1 , . . . , en ) = f (In ) = |In C| = |C|,
luego f ha de ser la aplicaci
on construida en la prueba de dicho teorema cuando
a = |C| (f
ormula (8.1)), que en terminos de matrices y determinantes es simplemente f (B) = |B|a. As pues: |BC| = f (B) = |B||C|.

Ahora vamos a dar algunas propiedades elementales que permiten manipular


determinantes.
Teorema 8.7 Sea A un dominio y B, C Matn (A).Entonces
1. Si C resulta de intercambiar dos filas o columnas de la matriz B, entonces
|C| = |B|.
2. Si C resulta de multiplicar una fila o columna de B por un cierto a A,
entonces |C| = a|B|.
3. Si C resulta de sumar a la fila (o columna) i-esima de B la fila (o columna)
j-esima de B con i 6= j, multiplicada por un a A, entonces |C| = |B|.


Captulo 8. Algebra
lineal

288

n: 1) y 2) son consecuencias inmediatas de la definici


Demostracio
on de
determinante (las variantes con columnas se cumplen por el teorema 8.5).
3) Se cumple porque |C| se descompone por multilinealidad en dos sumandos,
uno es |B| y otro el determinante de la matriz que resulta de repetir en el lugar
i-esimo la columna j-esima (multiplicado por a), y este es nulo.
Estos resultados nos permiten calcular determinantes de cualquier orden
mediante manipulaciones adecuadas. Basta notar que si una matriz cuadrada
B tiene nulos todos los coeficientes bajo la diagonal principal, es decir, si bij = 0
cuando i > j, entonces |B| es el producto de los coeficientes de la diagonal
principal (pues la u
nica permutaci
on que no da lugar a un sumando nulo en la
definici
on de determinante es la identidad).
Por otro lado conviene observar que si A es un dominio ntegro y K es su
cuerpo de cocientes, una matriz en Matn (A) est
a tambien en Matn (K) y su
determinante es el mismo en cualquier caso. Por ello a la hora de calcular
determinantes podemos trabajar siempre en los cuerpos de cocientes, es decir,
podemos hacer divisiones cuando convenga.
Calculemos por ejemplo:


2 3 2
3

4
3 5
0

3
=
2
0
3


5
2 4
7

2 3
2
3
0
9
1
6
0 13
3 15
2
2
0

19
2

12

El segundo determinante resulta de sumar a la segunda fila la primera multiplicada por 2, a la tercera fila la primera multiplicada por 3/2 y a la cuarta
la primera multiplicada por 5/2. De este modo conseguimos ceros bajo el
termino a11 .
Por el mismo proceso hacemos ceros en todas las posiciones bajo la diagonal
principal: sumamos a la tercera fila la segunda multiplicada por 13/18 y a la
cuarta la segunda multiplicada por 19/18. Despues sumamos a la cuarta fila
la tercera multiplicada por 37/67 y obtenemos una matriz triangular, es decir,
con ceros bajo la diagonal:

2 3
2
3 2 3
2
3

0
9
1
6 0
9
1
6

=
= 0
= 0

0 67
19
0 67
19
18
6
18
6

37
36
508
0 18
0
0
0
6
67
Ahora el determinante se reduce al producto de los elementos de la diagonal, o
sea:
= 2 9 (67/18) (508/67) = 508.

De este modo se puede calcular cualquier determinante, pero vamos a probar


que el trabajo puede reducirse considerablemente.
Definici
on 8.8 Sea A un dominio y B Matn (A). Llamaremos menor complementario de bij al determinante de la matriz que resulta de eliminar la fija
i-esima y la columna j-esima de B. Lo representaremos por Bij .

8.1. Determinantes

289

Teorema 8.9 Sea A un dominio y sea B Matn (A) tal que en su fila i-esima
el u
nico elemento no nulo sea bij . Entonces |B| = (1)i+j bij Bij .
n: Supongamos en primer lugar que i = j = n, o sea, bnj = 0
Demostracio
si j = 1, . . . , n 1. As
P
P
|B| =
(sig )b1(1) bn(n) =
(sig )b1(1) b(n1)(n1) bnn
n

= bnn

n1

(n)=n

(sig )b1(1) b(n1)(n1) = bnn Bnn = (1)n+n bnn Bnn

Si i y j son cualesquiera, sea B 0 la matriz que resulta de llevar la fila i-esima


de B a la posici
on n-sima. Para hacer este cambio hay que permutar la fila
i-esima con las n i filas que le siguen, luego el signo del determinante cambia
n i veces: |B| = (1)ni |B 0 |.
Sea ahora B 00 la matriz que resulta de llevar la columna j-esima de B 0 a la
posici
on n-sima. De nuevo |B 0 | = (1)nj |B 00 | y as |B| = (1)2nij |B 00 | =
i+j
(1) |B 00 |.
La fila n-sima de B 00 tiene u
nicamente la componente n-sima no nula, y
adem
as es igual a bij .
00
00
Por lo ya probado |B| = (1)i+j bij Bnn
, pero es obvio que Bnn
= Bij , luego
i+j
|B| = (1) bij Bij .
Teniendo esto en cuenta,
en la primera columna:


2 3 2
3

4
3 5
0

=
3
2 0 3

5
2 4
7

en nuestro ejemplo era suficiente con hacer ceros


2 3
2
3
0
9
1
6
0 13
3 15
2
2
0

19
2

12

= 2

9
13
2
19
2

1
6
3 15
2
1

12

y el determinante que resulta se puede calcular f


acilmente. Por supuesto el
teorema anterior vale para columnas igual que para filas.
Ejemplo Como aplicaci
on vamos a calcular los llamados determinantes de
Vandermonde. Concretamente probaremos que

a1

an Q

(aj ai ),
..
.. =
.
. i<j
n1
a
an1
1

donde a1 , . . . , an son elementos de un dominio A. En particular, si A es un


dominio ntegro, un determinante de Vandermonde es no nulo si y s
olo si los
elementos de su segunda fila son distintos dos a dos.
Lo probaremos por inducci
on sobre n. Para n = 1 o incluso n = 2 es
inmediato. Supuesto para n 1 restamos a cada fila la anterior multiplicada


Captulo 8. Algebra
lineal

290
por a1 , con lo que

obtenemos
1
0
..
.

1
a2 a1
..
.

0 an1
a1 an2
2
2

1
an a1
..
.

an1
a1 an2
n
n

Ahora aplicamos el teorema anterior y obtenemos

a2 a1

an a1

..
..

.
n1 . n2
a
a1 a
an1 a1 an2
2

Por la multilinealidad sobre las columnas este determinante es igual a

a2

an

(a2 a1 ) (an a1 ) .
.. .
..
.
n2
n2
a
a
n

Finalmente por la hip


otesis de inducci
on esto es igual a

i<j

(aj ai ).

En realidad el teorema 8.9 es un caso particular de un resultado m


as general:
Teorema 8.10 Sea A un dominio y B Matn (A). Entonces
|B| =

n
P

(1)i+j bij Bij =

j=1

n
P

(1)i+j bij Bij .

i=1

n: Sean B1 , . . . , Bn las filas de B. As Bi =


Demostracio

n
P

bij ej , donde

j=1

ej = (ij ). Claramente,
det(B) = det(B1 , . . . ,

n
P

bij ej , . . . , Bn ) =

j=1

n
P

n
P

bij det(B1 , . . . , ej , . . . , Bn )

j=1

bij (1)i+j Bij .

j=1

La otra igualdad se prueba an


alogamente.
Pasemos ahora a mostrar el interes te
orico de los determinantes. En primer
lugar veremos que los determinantes determinan cu
ando una matriz es regular.
Definici
on 8.11 Sea A un dominio y B Matn (A). Llamaremos matriz ad Matn (A) dada por
junta de B a la matriz B
bij = (1)i+j Bji .

8.1. Determinantes

291

Notemos que en la posici


on (i, j) est
a el menor complementario de bji , es de se forma sustituyendo en B cada elemento por su menor complementario
cir, B
multiplicado por el signo adecuado y despues trasponiendo la matriz resultante.
Por ejemplo, si

entonces

B11 =

B21 =

B31 =

1
4
3
4
3
1

1 3 2
0 ,
B= 5 1
3 4
2

5
5 1
0
0

= 23,
= 2, B12 =
= 10, B13 =
2
3
2
3 4

1 2
1 3
2

= 13,
= 14, B22 =
= 4, B23 =
2
3
2
3 4

1 2
1
2
3

=
2,
B
=
=
10,
B
=
= 14.
32
33
5
5
0
0
1

Al reemplazar cada elemento por su menor con el signo adecuado queda

2 10
23
14 4 13
2 10 14
luego la matriz adjunta de B es

2 14
2
= 10 4 10 .
B
23 13 14

Teorema 8.12 Sea A un dominio y B Matn (A). Entonces


= BB
= |B|In .
BB

es igual a
n: El termino (i, j) de B B
Demostracio
Si i = j queda

n
P

k=1

n
P

bik (1)k+j Bjk .

k=1

bik (1)k+j Bik = |B| por el teorema 8.10, luego los

son todos iguales a |B|.


elementos de la diagonal principal de B B
Si i 6= j llamemos D la matriz cuyas filas son las de B salvo que en la posici
on
j-esima tiene repetida la fila i-esima. Entonces |D| = 0 y desarrollando por la
fila j-esima queda
0 = |D| =

n
P

k=1

djk (1)k+j Djk =

n
P

bik (1)k+j Bjk ,

k=1

son nulos. Por lo


o sea, los elementos fuera de la diagonal principal de B B

tanto, B B = |B|In . Del mismo modo se prueba la otra igualdad.

Esto significa que la matriz adjunta de una matriz B es casi su matriz inversa.
Para obtener la inversa s
olo falta que sea lcito dividir entre el determinante de
B. La situaci
on es la siguiente:


Captulo 8. Algebra
lineal

292

Teorema 8.13 Sea A un dominio y B Matn (A). Entonces la matriz B es


regular si y s
olo si |B| es una unidad de A, y en tal caso
B 1 =

1
B.
|B|

n: Si la matriz B es regular, entonces existe B 1 de manera


Demostracio
1
que BB
= In , luego tomando determinantes |B| |B 1 | = |In | = 1, lo que
prueba que |B| es una unidad de A.
1
Si |B| es una unidad de A, entonces sea C = |B|
B Matn (A). Por el
teorema anterior, BC = CB = In , luego B es regular y B 1 = C.
En particular una matriz con coeficientes en un cuerpo es regular si y s
olo
si su determinante es distinto de cero.
Aplicaci
on: La regla de Cramer Los resultados anteriores nos dan una
expresi
on sencilla en terminos de determinantes para las soluciones de un sistema
de ecuaciones lineales:

a11 x1 + + a1n xn = b1

an1 xn + + ann xn = bn
Claramente podemos escribirlo matricialmente como
Axt = bt ,
donde A = (aij ) es la matriz de los coeficientes, b = (bi ) es el vector de terminos
independientes y x = (x1 , . . . , xn ). Si |A| 6= 0, el sistema tiene una u
nica
soluci
on, dada por
1 t
xt = A1 bt =
Ab .
|A|
En particular,

xj =

n
1 P
(1)i+j bi Aij .
|A| i=1

Ahora bien, si llamamos C = (cuv ) a la matriz que resulta de sustituir en


A su columna j-esima por el vector b, tenemos que Cij = Aij para todo i, as
como que cij = bi , luego, aplicando el teorema 8.10, llegamos a que
xj =
En resumen:

n
1 P
|C|
(1)i+j cij Cij =
.
|A| i=1
|A|

Regla de Cramer: La j-esima coordenada de la soluci


on de un
sistema de n ecuaciones lineales con n inc
ognitas (cuya matriz de
coeficientes A tenga determinante no nulo) puede calcularse dividiendo entre |A| el determinante de la matriz que resulta de sustituir
la columna j-esima de A por el vector de terminos independientes.

8.1. Determinantes

293

Ejemplo La soluci
on del sistema de ecuaciones

x 2y + z = 3
2x + 2y z = 1

x+ y+z =2

Puede calcularse con la regla de Cramer, pues

1 2
1

2
2 1 = 9 6= 0,

1
1
1

y viene dada por

3 2
1

1
2 1
x = 1
9
2
1
1

1 3
1

1
y = 2 1 1 ,
9
1 2
1

lo que nos da (x, y, z) = (4/3, 1/3, 1).

1 2 3

1
2 1 ,
z = 2
9
1
1 2

Los determinantes tambien nos permiten decidir si n elementos de un m


odulo
libre de rango n son o no linealmente independientes, y si son o no una base.
Teorema 8.14 Sea A un dominio ntegro, sea M un A-m
odulo libre de rango n,
sea (v1 , . . . , vn ) una base ordenada de M , sean w1 , . . . , wn elementos de M y
sea B = (bij ) la matriz cuyas filas son las coordenadas de w1 , . . . , wn en la
base dada. Entonces:
1. (w1 , . . . , wn ) es una base de M si y s
olo si |B| es una unidad de A.
2. (w1 , . . . , wn ) son linealmente independientes si y s
olo si |B| 6= 0.
n: 1) Por 5.19 existe un homomorfismo f : M M tal que
Demostracio
f (vi ) = wi para cada i = 1, . . . , n. La matriz de f en la base (v1 , . . . , vn ) es
precisamente B.
Si w1 , . . . , wn forman una base de M entonces tambien existe un homomorfismo g : M M tal que f (wi ) = vi para cada i = 1, . . . , n. La composici
on
f g es la identidad sobre la base (v1 , . . . , vn ), luego por la unicidad del teorema 5.19 se cumple que f g es la aplicaci
on identidad en M . Igualmente g f
es la identidad en M . Esto prueba que f es un isomorfismo y por lo tanto |B|
es una unidad.
Si |B| es una unidad, la aplicaci
on f es un isomorfismo, luego (w1 , . . . , wn )
es una base de M (pues son la imagen de una base por un isomorfismo).
2) Como la aplicaci
on que asocia a cada elemento de M sus coordenadas
en la base dada es un isomorfismo entre M y An , los elementos w1 , . . . , wn son
linealmente dependientes si y s
olo si lo son sus coordenadas, es decir, las filas
de B.
Las filas de B son linealmente independientes en An si y s
olo si son linealmente independientes en K n , donde K es el cuerpo de fracciones de A. En


Captulo 8. Algebra
lineal

294

efecto, si tenemos una combinaci


on lineal de las filas de B con coeficientes en
K no todos nulos y que es igual a 0, multiplicando por el producto de los denominadores de los coeficientes no nulos, obtenemos una nueva combinaci
on lineal
que tambien anula a las filas de A, ahora con los coeficientes en A y no todos
nulos. La otra implicaci
on es obvia.
Como K n es un espacio vectorial de dimensi
on n, las filas de B son linealmente independientes en K n si y s
olo si son una base de K n .
Por 1), las filas de B son una base de K n si y s
olo si |B| es una unidad en
K, o sea, si y s
olo si |B| 6= 0.
Concluimos la secci
on con otra aplicaci
on de los determinantes, esta vez al
c
alculo del cardinal de los m
odulos cociente de los Z-m
odulos libres.

Teorema 8.15 Sea M un Z-m


odulo libre de rango m y sea N un subm
odulo
de rango n. Entonces:
1. El m
odulo cociente M/N es finito si y s
olo si n = m.
2. Si n = m, (v1 , . . . , vn ) es una base de M , (w1 , . . . , wn ) es una base de N
y B es la matriz cuyas filas son las coordenadas de w1 , . . . , wn en la base
(v1 , . . . , vn ), entonces el cardinal de M/N es | det B|.
n: 1) Sea (z1 , . . . , zm ) una base de M tal que (a1 z1 , . . . , an zn )
Demostracio
sea una base de N para ciertos elementos a1 , . . . , an Z (de acuerdo con el
teorema 5.49). En la prueba de dicho teorema se ve que
M/N
= (Z/a1 Z) (Z/an Z) Zmn .
El cociente ser
a finito si y s
olo si m n = 0, o sea, si y s
olo si m = n.
2) Si m = n, en las condiciones de 1) tenemos

|M/N | = |(Z/a1 Z) (Z/an Z)| = |a1 an | = | det C|,


donde C es la matriz que tiene a a1 , . . . , an en la diagonal y los restantes coeficientes nulos.
Sea f : N M la aplicaci
on dada por f (x) = x para todo x N . La
matriz de f en las bases (a1 z1 , . . . , an zn ) y (z1 , . . . , zn ) es precisamente C.
Sea P la matriz de la aplicaci
on identidad en N respecto de las bases
(w1 , . . . , wn ) y (a1 z1 , . . . , an zn ) (la matriz de cambio de base). Por el teorema
8.13 tenemos que |P | = 1.
Sea Q la matriz de la aplicaci
on identidad en M respecto de las bases
(z1 , . . . , zn ) y (v1 , . . . , vn ). Por la misma raz
on |Q| = 1.
Por el teorema 5.33 la matriz P CQ es la matriz de f respecto de las bases
(w1 , . . . , wn ) y (v1 , . . . , vn ). Por lo tanto las filas de P CQ son las coordenadas
de w1 , . . . , wn en la base (v1 , . . . , vn ), es decir, B = P CQ.
Tomando determinantes y valores absolutos,
| det B| = | det P | | det C| | det Q| = | det C| = |M/N |.

8.2. Clasificaci
on de homomorfismos de m
odulos

8.2

295

Clasificaci
on de homomorfismos de m
odulos

Sabemos que una aplicaci


on lineal entre dos espacios vectoriales est
a completamente determinada por su matriz respecto de dos bases dadas, pero dicha
matriz puede ser m
as sencilla o m
as complicada en funci
on de las bases elegidas.
Ni siquiera es evidente c
omo saber si dos matrices dadas pueden ser la matriz
de la misma aplicaci
on lineal respecto a dos pares de bases. Por razones que
veremos m
as adelante, conviene plantear estos problemas en el contexto m
as
general de los homomorfismos entre m
odulos libres sobre anillos.
Supongamos que f : M N es un homomorfismo entre A-m
odulos libres
de rangos m y n respectivamente y que B y B 0 son bases respectivas. Sea S la
matriz de f en estas bases. Supongamos que f tiene otra matriz T respecto a
otras bases C y C 0 . Cu
al es entonces la relaci
on entre S y T ? Es sencilla: Sea
P la matriz de cambio de base de C a B (es decir, la matriz de la identidad
en M respecto de las bases C y B) y sea Q la matriz de cambio de base de
C 0 a B 0 . Entonces si x es la m-tupla de coordenadas en C de un elemento
m M , tendremos que xP es la m-tupla de coordenadas de m en la base B,
luego xP S es la n-tupla de coordenadas de f (m) en B 0 , luego xP SQ es la ntupla de coordenadas de f (m) en C 0 . Por la unicidad de la matriz, se ha de
cumplir T = P SQ. Adem
as como P y Q son matrices de isomorfismos, ambas
son regulares. En vista de esto definimos:
Definici
on 8.16 Sea A un anillo conmutativo y unitario. Diremos que dos
matrices S, T Matmn (A) son equivalentes si existen matrices regulares P , Q
(de orden m m y n n, respectivamente) tales que T = P SQ.
Es evidente que la equivalencia de matrices es una relaci
on de equivalencia
en el conjunto Matmn (A). Acabamos de demostrar que si S y T son matrices
de un mismo homomorfismo entre A-m
odulos libres f : M N , entonces S y
T son equivalentes. Recprocamente, si S es la matriz de f en ciertas bases y T
es equivalente a S, es f
acil ver que T es la matriz de f en otras bases adecuadas
(las que convierten a P y Q en las matrices del cambio de base).
Ahora vamos a dar un criterio sencillo para determinar cu
ando dos matrices
dadas son o no equivalentes, al tiempo que encontraremos para cada matriz una
equivalente lo m
as sencilla posible. Para ello usaremos el resultado siguiente:
Teorema 8.17 Sea A un anillo conmutativo y unitario y sean S y T dos matrices m n en A. Si T resulta de realizar sobre S una de las operaciones
siguientes, entonces T es equivalente a S:
1. Permutar dos filas (o columnas).
2. Cambiar la fila (o columna) i-esima por la suma de la fila (columna) iesima m
as la fila (columna) j-esima (j 6= i) multiplicada por un a A.
3. Multiplicar una fila (columna) por una unidad u A.


Captulo 8. Algebra
lineal

296

n: Realizar una de estas operaciones equivale a multiplicar


Demostracio
la matriz por la izquierda o por la derecha (seg
un sea sobre filas o columnas)
por una de las matrices regulares siguientes (todas tienen unos en la diagonal y
ceros fuera de ella salvo cuando se indica explcitamente lo contrario):
1

E1ij

i
..

.
0

1
..

.
0
..

.
1

E3i (u)

..

E2ij (a) =

a
..

.
..

.
..

.
1

.
u
..

.
..

1
..

.
1

Las matrices consideradas en la prueba del teorema anterior se llaman matrices elementales. Observemos que
(E1ij )1 = E1ij ,

(E2ij (a))1 = E2ij (a),

(E3i (u))1 = E3i (u1 ).

As, la inversa de una matriz elemental es otra matriz elemental del mismo tipo.
El teorema siguiente nos resuelve el problema de determinar cu
ando dos
matrices sobre un dominio eucldeo son equivalentes:
Teorema 8.18 Sea E un dominio eucldeo y A Matmn (E). Entonces A es
equivalente a una u
nica matriz de la forma

d1
..

dr

..

.
0

donde cada di 6= 0 y di | di+1 . La unicidad se entiende salvo sustituci


on de los
di por asociados (o sea, salvo unidades). Los elementos di se llaman factores
invariantes de A.
n: La prueba que vamos a ver nos da un algoritmo para
Demostracio
calcular los factores invariantes de cualquier matriz dada. Llamemos a la
norma eucldea del anillo E.

8.2. Clasificaci
on de homomorfismos de m
odulos

297

Si A = 0 ya es de la forma requerida. En otro caso, sea aij un coeficiente


de A no nulo con norma mnima. Intercambiando filas y columnas podemos
llevarlo a la posici
on (1, 1), es decir, pasamos a una matriz equivalente donde
a11 6= 0 tiene norma mnima.
Para cada k > 1 dividimos a1k = a11 bk + b1k , de modo que b1k = 0 o bien
(b1k ) < (a11 ).
Restamos a la columna k-esima la primera multiplicada por bk , con lo que
la primera fila se convierte en (a11 , b12 , . . . , b1n ).
Si alg
un b1k es no nulo llevamos a la posici
on (1, 1) el de menor norma y
repetimos el proceso. Como cada vez la norma del coeficiente (1, 1) disminuye,
el proceso no puede continuar indefinidamente, por lo que al cabo de un n
umero
finito de pasos llegaremos a una primera fila de la forma (a11 , 0, . . . , 0).
Repitiendo el proceso con la primera columna llegamos a una matriz equivalente de la forma:

a11 0 0
0

..

B
0

Si a11 no divide a alguno de los restantes coeficientes aij , entonces hacemos


aij = aij c + d con d 6= 0 y (d) < (a11 ), llevamos d a la posici
on (1, 1) y
repetimos el proceso de hacer ceros. Como la norma sigue disminuyendo, tras
un n
umero finito de pasos llegaremos a una matriz como la anterior y en la que
a11 divide a todos los coeficientes restantes.
Ahora repetimos el proceso con la matriz B, lo cual no altera los ceros de la
fila y la columna primera ni el hecho de que a11 divide a todos los coeficientes.
De este modo llegamos a una matriz como la del enunciado.
Ahora demostramos que si dos matrices como la del enunciado son equivalentes, entonces son iguales (salvo multiplicaci
on de sus coeficientes por unidades). Para ello fijamos una cualquiera M y consideramos el homomorfismo
f : E m E n que en las bases can
onicas {e1 , . . . , em } y {f1 , . . . , fn } tiene
matriz M , es decir, f (ei ) = di fi para i = 1, . . . , r y f (ei ) = 0 en otro caso.
Entonces d1 f1 , . . . , dr fr forman una base de Im f y el teorema 5.49 nos da que
r y f1 , . . . , fr est
an unvocamente determinados (salvo unidades) por E n e Im f
(y no dependen de la elecci
on de las bases). Por lo tanto, si otra matriz en
las condiciones del enunciado es equivalente a M , sera la matriz de f en otras
bases, luego tendra que ser la misma M (salvo unidades).
As pues, dos matrices son equivalentes si y s
olo si tienen los mismos factores
invariantes. La matriz equivalente a una matriz dada A que tiene la forma
indicada en el teorema anterior se llama forma can
onica de A, de modo que
dos matrices son equivalentes si y s
olo si tienen la misma forma can
onica (salvo
unidades).
Observemos que en la demostraci
on del teorema anterior hemos llegado a la
forma can
onica realizando u
nicamente operaciones elementales sobre la matriz


Captulo 8. Algebra
lineal

298

dada (es decir, multiplicaciones por matrices elementales). Por lo tanto, hemos
probado lo siguiente:
Teorema 8.19 Dos matrices S, T Matmn (E) sobre un dominio eucldeo E
son equivalentes si y s
olo si existen matrices elementales tales que
S = P1 Pr T Q1 Qs .
A partir de aqu nos centramos en el caso de las matrices sobre un cuerpo
(recordemos que todo cuerpo es trivialmente un dominio eucldeo). Como todos
los elementos no nulos son unidades, todos los factores invariantes de una matriz
A pueden tomarse iguales a 1, luego lo u
nico que puede variar es su n
umero r.
Este n
umero se llama rango de A y lo representaremos por rang A. Tenemos,
pues, que dos matrices sobre un cuerpo son equivalentes si y s
olo si tienen el
mismo rango.
El rango de A tiene una interpretaci
on muy sencilla: sea f una aplicaci
on
lineal de matriz A. Las filas de A son las coordenadas de las im
agenes de los vectores de la primera base respecto a la segunda base. Estas im
agenes generan el
subespacio Im f , luego contienen exactamente dim Im f vectores independientes.
Como la aplicaci
on que a cada vector le asigna sus coordenadas es un isomorfismo, resulta que A tiene dim Im f filas independientes. La forma can
onica de
A es tambien una matriz de f y tiene r filas independientes, luego dim Im f = r
y el rango de una matriz es el n
umero de filas independientes que contiene.
Por otra parte es obvio que si dos matrices son equivalentes sus traspuestas
tambien lo son, y la traspuesta de una forma can
onica es ella misma, luego el
rango de una matriz es el mismo que el de su traspuesta. Por lo tanto:
El rango de una matriz A con coeficientes en un cuerpo es el n
umero
de filas y el n
umero de columnas linealmente independientes.
Si f : V W es una aplicaci
on lineal entre k-espacios vectoriales de
dimensi
on finita, podemos definir su rango rang f como el rango de su matriz
respecto de cualquier par de bases. Como las matrices equivalentes tienen el
mismo rango, no importa la elecci
on de las bases. De hecho, el rango de una
aplicaci
on lineal tiene una interpretaci
on directa que no depende de ninguna
elecci
on de bases, pues es simplemente rang f = dimk Im f .
En efecto, basta tener en cuenta que, fijadas unas bases {v1 , . . . , vm } y
{w1 , . . . , wn }, entonces Im v = hf (v1 ), . . . , f (vm )i y el isomorfismo W
= kn
que a cada vector le asigna sus coordenadas en la base fijada en W transforma
Im f en el subespacio vectorial generado por las filas de la matriz de f en las
bases fijadas, cuya dimensi
on es el rango de la matriz.
Nota La prueba del teorema 8.18 se puede simplificar sustancialmente para
el caso de matrices regulares sobre un cuerpo k, y la posibilidad de tal simplificaci
on tiene consecuencias te
oricas de interes. En principio sabemos que,
mediante productos a izquierda y derecha por matrices elementales, toda matriz

8.2. Clasificaci
on de homomorfismos de m
odulos

299

regular A se puede transformar en la matriz identidad. Ahora veremos que, multiplicando s


olo por la derecha (o s
olo por la izquierda) por matrices elementales
s
olo de tipo E2ij (a), es posible transformar A en una matriz de la forma

..

para cierto k que, de hecho, es necesariamente = |A|, pues las matrices


de tipo E2ij (a) tienen todas determinante 1, luego al multiplicar por ellas no
cambia el determinante de la matriz.
En efecto, sabemos que multiplicar una matriz (por ejemplo, por la derecha)
por matrices de tipo E2ij (a) equivale a sumar a una columna otra multiplicada
por a. Veamos que s
olo con operaciones elementales de este tipo es posible llegar
a una matriz de la forma indicada.
Como A tiene determinante no nulo, no puede tener ninguna fila nula. Si
a12 = 0, sumamos a la segunda columna otra columna adecuada para hacer
a12 6= 0. Seguidamente le sumamos a la primera columna la segunda multiplicada por (1 a11 )/a12 , y as pasamos a una matriz con a11 = 1.
Luego sumamos a la columna j > 1 la columna 1 multiplicada por a1j , con
lo que la primera fila pasa a ser (1, 0, . . . , 0).
Ahora, no puede ocurrir que todos los a2i sean nulos, para i > 1, porque
entonces sera |A| = 0. Esto significa que podemos hacer que a23 6= 0 sum
andole
si es preciso una columna distinta de la primera, lo cual no altera la primera
fila. A su vez, con la tercera columna podemos hacer a22 = 1 sin alterar la
primera fila, y con la segunda columna podemos hacer que la segunda fila pase
a ser (0, 1, 0, . . . , 0) sin alterar la primera fila.
El proceso puede continuar de este modo hasta convertir la pen
ultima fila
en (0, . . . , 0, 1, 0). Con la u
ltima fila ya no podemos razonar igual porque ya
no tenemos filas posteriores. Podemos asegurar igualmente que ann = 6= 0,
pues de lo contrario sera |A| = 0, pero ahora no tenemos una columna posterior
con la que hacer ann = 1. No obstante, si a la columna i-esima le sumamos
la n-sima multiplicada por ani /ann , convertimos la u
ltima fila en (0, . . . , 0, )
sin alterar las filas anteriores.
Definici
on 8.20 Recordemos que el grupo lineal general LG(n, k) es el grupo
de las matrices regulares n n sobre el cuerpo k. El teorema 8.6 implica que
la aplicaci
on determinante det : LG(n, k) k es un epimorfismo de grupos.
Llamaremos grupo lineal especial LE(n, k) al n
ucleo de este epimorfismo, es
decir, el grupo formado por las matrices n n de determinante 1.
Si V es un k-espacio vectorial de dimensi
on n, llamamos LG(V ) al grupo de
los automorfismos de V . Es claro que la aplicaci
on que a cada automorfismo
le asigna su matriz en una base prefijada de V es un isomorfismo de grupos
LG(V )
= LG(n, k).


Captulo 8. Algebra
lineal

300

Si S y T son las matrices de un mismo endomorfismo h : V V respecto


de dos bases de V , entonces T = P 1 SP , por lo que |T | = |P |1 |S||P | = |S|.
Por consiguiente, podemos definir el determinante det h de un endomorfismo h como el determinante de su matriz en cualquier base. Claramente
det : LG(V ) k es tambien un epimorfismo de grupos, a cuyo n
ucleo llamaremos LE(V ).
Claramente, el isomorfismo LG(V )
= LG(n, k) determinado por una base
cualquiera se restringe a un isomorfismo LE(V )
= LE(n, k).
Vamos a ver que la nota precedente nos permite calcular sistemas generadores especialmente simples de los grupos lineales LG(V ) y LE(V ). Para ello
necesitamos un par de definiciones m
as:
Sea V un k-espacio vectorial de dimensi
on n y sea H un hiperplano de V
(es decir, un subespacio vectorial de dimensi
on n 1). La dilataci
on de V de
hiperplano H, direcci
on w V \H y raz
on 6= 0 es el automorfismo u LG(V )
determinado por que fija a los puntos de H y u(w) = w.
Una transvecci
on de V de hiperplano H es un automorfismo u LG(V ) tal
que existe un h H no nulo y una aplicaci
on lineal f : V k de n
ucleo H de
modo que para todo x V se cumpla u(x) = x + f (x)h.
Equivalentemente, u es una dilataci
on de
matriz es

..

V de raz
on si en cierta base su

En particular vemos que det u = . Similarmente, u es una transvecci


on de V
si en cierta base tiene matriz

1
1

.
..

.
1

(Basta tomar la base de la forma h, v, h2 , . . . , hn1 , donde h, h2 , . . . , hn1 es una


base de H y v V \ H.) Claramente, las transvecciones tienen determinante 1.
Teorema 8.21 Sea V un espacio vectorial de dimensi
on finita sobre un cuerpo k y u LG(V ) un automorfismo distinto de la identidad que fije a todos los
puntos de un hiperplano H. Entonces u es una dilataci
on o una transvecci
on,
seg
un si su determinante es distinto o igual a 1.
n: Tomemos v V \ H. Entonces V = H hvi. Pongamos
Demostracio
que u(v) = h + v, con h H y k. Si 6= 1 llamamos w = h + ( 1)v,
y es f
acil ver que u(w) = w, luego h es una dilataci
on (con determinante ).

8.2. Clasificaci
on de homomorfismos de m
odulos

301

Supongamos ahora que = 1, de modo que u(v) = h + v. Como u no es la


identidad, tiene que ser h 6= 0. Sea f : V k la composici
on de la proyecci
on
V = H hvi hvi con el isomorfismo v 7 . En definitiva, f (h0 + v) = .
Entonces, si x = h0 + v, tenemos que
u(x) = h0 + (h + v) = x + h = x + f (x)h,
luego u es una transvecci
on.
El resultado al que queramos llegar es el siguiente:
Teorema 8.22 Si V es un espacio vectorial de dimensi
on finita sobre un cuerpo k, el grupo LG(V ) est
a generado por las dilataciones, y el subgrupo LE(V )
est
a generado por las transvecciones. (La primera afirmaci
on requiere claramente que k 6= {0, 1}, pues, si no, la u
nica dilataci
on es la identidad.)
n: Es claro que todas las matrices elementales de tipo 2 son
Demostracio
matrices de transvecciones, luego la nota previa a la definici
on 8.20, traducida
de matrices a automorfismos, dice que todo automorfismo u LG(V ) se expresa
como composici
on de transvecciones y una dilataci
on, cuya raz
on ser
a necesariamente det u. Por lo tanto, si u LE(V ), entonces = 1 y la dilataci
on es la
identidad, luego tenemos u expresado como composici
on de transvecciones.
En general, tenemos tambien que LG(V ) est
a generado por las dilataciones y las transvecciones. Ahora basta probar que, suponiendo que k 6= {0, 1},
toda transvecci
on es producto de dos dilataciones. Para ello, fijada una transvecci
on u, consideramos una dilataci
on cualquiera w respecto al mismo hiperplano con raz
on distinta de 1. Entonces w0 = u w1 es un automorfismo de V
que fija a H y tiene determinante 6= 1. Por el teorema 8.21 tenemos que es una
dilataci
on, luego la transvecci
on u = w0 w es composici
on de dos dilataciones.
En ocasiones puede ser m
as conveniente la siguiente versi
on, en la que s
olo
interviene una transvecci
on:
Teorema 8.23 Sea V un k-espacio vectorial de dimensi
on finita y sea e1 , . . . , en
una base de V . Entonces el grupo LG(V ) est
a generado por las aplicaciones siguientes:
1. La aplicaci
on fij que intercambia ei con ej y deja fijos a los dem
as vectores
de la base.
2. La transvecci
on s dada por s(e1 ) = e1 + e2 y s(ei ) = ei para i = 2, . . . , n.
3. Las dilataciones ha dadas por ha (e1 ) = ae1 y ha (ei ) = ei para i = 2, . . . , n,
donde a k \ {0}.
n: Sea f LG(V ). Su matriz S en la base dada es equiDemostracio
valente a la matriz identidad, lo que equivale a que es producto de matrices
elementales. Podemos considerar las aplicaciones lineales que en la base dada

302

Captulo 8. Algebra
lineal

tienen por matriz a cada una de las matrices en que se descompone S, y entonces f es la composici
on de dichas aplicaciones lineales. Por lo tanto, basta probar
que cada una de ellas se expresa a su vez como composici
on de las aplicaciones
consideradas en el enunciado.
Las matrices elementales de tipo 1 se corresponden con las aplicaciones descritas en 1.
Las matrices de tipo 2 se corresponden con las transvecciones que cumplen
saij (ei ) = ei + aej y dejan invariantes a los dem
as vectores de la base. Podemos
suponer que a 6= 0, pues en caso contrario se trata de la aplicaci
on identidad. Es
f
acil ver que saij = p sa12 p1 , donde p es la aplicaci
on que cumple p(ei ) = e1 ,
p(ej ) = e2 y deja fijos a los dem
as vectores de la base. Las aplicaciones p y p1
son composiciones de aplicaciones de tipo 1, luego basta estudiar sa12 , pero es
f
acil ver que
sa12 = ha s112 h1/a ,
y s112 es la aplicaci
on del punto 2. del enunciado.
Por u
ltimo, las matrices elementales del tercer tipo determinan las aplicaciones fi1 ha fi1 .

8.3

Clasificaci
on de endomorfismos

En la secci
on anterior hemos clasificado las matrices de los homomorfismos
entre m
odulos libres, de modo que sabemos reconocer si dos matrices corresponden al mismo homomorfismo en bases distintas y a cada homomorfismo le
sabemos encontrar una matriz especialmente simple (en forma can
onica). Nuestro objetivo es obtener una teora an
aloga para endomorfismos de un espacio
vectorial, donde ahora imponemos la condici
on de que no queremos considerar
dos bases para el mismo espacio, sino una sola. Si f : M M es un endomorfismo de un modulo libre M y S, T son las matrices de f respecto a ciertas
bases B y C, el mismo razonamiento que cuando tenamos dos m
odulos nos da
ahora que T = P 1 SP , para cierta matriz regular P (P es la matriz del cambio
de base de B a C y P 1 es la matriz del cambio de base de C a B). Por ello
definimos:
Definici
on 8.24 Sea A un anillo conmutativo y unitario. Diremos que dos
matrices S, T Matn (A) son semejantes si existe una matriz P LG(n, A) tal
que T = P 1 SP .
Es evidente que la semejanza de matrices es una relaci
on de equivalencia en
el conjunto Matn (A). Dos matrices de un mismo endomorfismo de A-m
odulos
libres son semejantes, y si S es la matriz de un endomorfismo f y T es semejante
a S, entonces T es la matriz de f en otra base.
Dos matrices semejantes son equivalentes, pero el recproco no es cierto. Por
ejemplo, en la secci
on anterior hemos observado que dos matrices semejantes
tienen el mismo determinante, y es f
acil encontrar matrices equivalentes con
determinantes distintos, luego no semejantes.

8.3. Clasificaci
on de endomorfismos

303

La idea fundamental en el estudio de un endomorfismo de un espacio V es


encontrarle subespacios invariantes, es decir, encontrar subespacios W tales que
h[W ] W . Por ejemplo, si h es un giro en R3 (cuyo eje pasa por 0), podemos
encontrar dos subespacios invariantes: el plano de giro, donde h es un giro en
R2 , y el eje de giro, donde h es la identidad. La matriz de h ser
a la m
as simple
si tomamos una base que tenga dos vectores en el plano de giro y el tercero en
el eje.
Para encontrar subespacios invariantes podemos valernos de la teora de
m
odulos gracias al planteamiento siguiente: Sea V un espacio vectorial de dimensi
on finita sobre un cuerpo K. Entonces el conjunto EndK (V ) de todos los
endomorfismos de V tiene estructura de anillo (no conmutativo) con la suma
definida punto a punto: (f + g)(v) = f (v) + g(v) y tomando como producto
la composici
on de aplicaciones. Si h EndK (V ) definimos el homomorfismo
K[x] EndK (V ) que a cada polinomio p(x) le asigna p(h). Notemos que
la unidad de EndK (V ) es el endomorfismo identidad, por lo que la imagen del
polinomio 1 es dicha identidad.
Ahora definimos una operaci
on K[x] V
V dada por p(x)v = p(h)(v).
As, por ejemplo, xv = h(v), (x2 + 2)v = h h(v) + 2v, etc. Es f
acil ver que V ,
con su suma de espacio vectorial y esta operaci
on, es un K[x]-m
odulo.
En resumen, hemos dotado a V de estructura de K[x]-m
odulo de modo que
la multiplicaci
on por elementos de K es la que ya tenamos en V como espacio
vectorial y la multiplicaci
on por x consiste en aplicar h. Esto hace que los
subespacios invariantes que estamos buscando sean precisamente los subm
odulos
de V . El teorema siguiente recoge este hecho junto con los resultados que
garantizan que podemos aplicar los teoremas de estructura de m
odulos sobre
dominios de ideales principales (notemos que K[x] es un dominio eucldeo):
Teorema 8.25 Sea V un espacio vectorial de dimensi
on finita n sobre un
cuerpo K, sea h un endomorfismo de V . Entonces
1. V es un K[x]-m
odulo finitamente generado.
2. Sus subm
odulos son los subespacios vectoriales W tales que h[W ] W .
3. El n
ucleo N(h) es un subm
odulo de V .
4. V es un m
odulo de torsi
on.
n: 1) Notar que el producto de un polinomio constante por
Demostracio
un elemento de V es el producto dado de V como espacio vectorial. Por ello
una combinaci
on lineal con coeficientes en K tambien puede considerarse con
coeficientes en K[x], luego una base de V como espacio vectorial es un generador
de V como m
odulo.
2) Si W es un subm
odulo de V , entonces la suma de elementos de W est
a
en W y el producto de un escalar por un elemento de W est
a en W , luego W es
un subespacio vectorial. M
as a
un, si v W , xv = h(v) W , luego h[W ] W .

304

Captulo 8. Algebra
lineal

Recprocamente, si W cumple estas condiciones entonces W es estable para


la suma y para el producto por escalares y por x, de donde f
acilmente se sigue
que W es estable para el producto por cualquier polinomio.
3) es consecuencia de 2).
4) Si v V , entonces los vectores v, xv, . . . , xn v han de estar repetidos o
ser linealmente dependientes, luego existen escalares no todos nulos tales que
t0 v + t1 xv + + tn xn v = 0, o sea, (tn xn + + t1 x + t0 )v = 0, luego v es un
elemento de torsi
on.
Definici
on 8.26 Si V es un espacio vectorial de dimensi
on finita, h es un endomorfismo de V y v V , llamaremos polinomio mnimo de v (pol mn v) al
u
nico polinomio m
onico que genera el ideal
o(v) = {p K[x] | pv = 0},
que es u
nico si exigimos adem
as que sea un polinomio m
onico.
El teorema 5.47 nos garantiza ahora que V se descompone en la forma
V = hv1 iK[x] hvr iK[x] ,
donde la notaci
on hvik[x] representa al subm
odulo generado por v, (mientras
que hvi representar
a al subespacio vectorial generado por v), y de modo que los
polinomios pol mn(vi ) sean, o bien potencias de primo (divisores elementales)
o bien que se dividan sucesivamente (factores invariantes).
Llamaremos divisores elementales y factores invariantes de h a los de V
como K[x]-m
odulo.
Nuestra intenci
on es describir h en terminos de sus factores invariantes o
sus divisores elementales. En primer lugar probamos que la acci
on de h sobre
cada subm
odulo mon
ogeno hviK[x] est
a determinada por pol mn v. Empezamos probando que pol mn v determina la dimensi
on de hviK[x] como espacio
vectorial:
Teorema 8.27 Sea K un cuerpo y V un K-espacio vectorial de dimensi
on
finita n. Sea h un endomorfismo de V . Entonces dim hvik[x] = grad pol mn v.
n: Sea p(x) = pol mn v y sea m su grado. Un elemento
Demostracio
cualquiera de hvik[x] es de la forma q(x)v con q(x) K[x].
Dividamos q(x) = c(x)p(x) + r(x), con grad r(x) < m. Entonces
q(x)v = c(x)(p(x)v) + r(x)v = c(x)0 + r(x)v = r(x)v,

(8.2)

que es combinaci
on lineal de v, xv, . . . , xm1 v.
Estos vectores han de ser distintos y linealmente independientes, pues lo
contrario significa que hay un polinomio q(x) 6= 0 y de grado a lo sumo m 1
tal que q(x)v = 0, pero entonces p(x) | q(x), lo cual es imposible seg
un los

8.3. Clasificaci
on de endomorfismos

305

grados. Por lo tanto v, xv, . . . , xm1 v es una base de < v >k[x] como espacio
vectorial.
Ahora ya estamos en condiciones de caracterizar la acci
on de h sobre un
subm
odulo mon
ogeno:
Teorema 8.28 Sea K un cuerpo, V un K-espacio vectorial de dimensi
on finita
y h un endomorfismo de V . Son equivalentes:
1. Existe un v V tal que V = hvik[x] y pol mn v =

n
P

ai xi (con an = 1).

i=0

2. dimK V = n y existe una base de V en la cual la matriz de h es

0
1

.. ..

.
.

..
..

.
.

0
1
a0 a1 an2 an1
n: 2) equivale a que exista una base {v0 , . . . , vn1 } de V de
Demostracio
n1
P
manera que h(vi ) = vi+1 para i = 0, . . . , n 2 y h(vn1 ) =
ai vi .
i=0

Si se cumple 1), entonces {v, xv, . . . , xn1 v} es una base que cumple 2).
Si {v0 , . . . , vn1 } cumple 2), entonces con v = v0 se cumple que vi = xi v0 ,
n1
n
P
P
as como que xn v =
ai xi v, es decir, p(x) =
ai xi cumple p(x)v = 0,
i=0

i=0

luego es un m
ultiplo del polinomio mnimo de v, pero por otro lado es obvio que
V = hvik[x] , luego el grado del polinomio mnimo de v ha de ser n = grad p(x).
As pues, p(x) = pol mn v.
Ahora veamos c
omo describir la acci
on de h sobre todo el espacio V a traves
de sus factores invariantes o sus divisores elementales.
Definici
on 8.29 Si V es un espacio vectorial de dimensi
on finita y h es un
endomorfismo de V , llamamos polinomio mnimo de h (pol mn h) al u
ltimo
factor invariante.
As, si p(x) es el polinomio mnimo de h, es m
ultiplo de los polinomios
mnimos de todos los generadores, luego p(x) los anula a todos, y con ellos a
todos los elementos de V . As pues, p(x)v = p(h)(v) = 0 para todo vector v,
o equivalentemente, p(h) = 0. Adem
as, cualquier otro polinomio que cumpla
p(h) = 0 anula en particular al generador del subm
odulo correspondiente al
u
ltimo factor invariante, luego tiene que ser m
ultiplo de p(x). As pues, el
polinomio mnimo de h es el menor polinomio que anula a h.
Teorema 8.30 Sea K un cuerpo y V un K-espacio vectorial de dimensi
on
finita n. Sea h un endomorfismo de V . Las afirmaciones siguientes son equivalentes:


Captulo 8. Algebra
lineal

306

1. Los factores invariantes (o divisores elementales) de h son p1 , . . . , pr .


2. Los polinomios p1 , . . . , pr cumplen pi | pi+1 (o que cada pi es potencia de
primo) y, en una cierta base, la matriz de h es de la forma

M1

M2

..

.
Mr

donde cada Mi es la matriz asociada a pi seg


un el teorema 8.28.
n: Consideramos una descomposici
Demostracio
on de V de tipo (8.2) de
modo que los polinomios mnimos de los generadores sean los factores invariantes
o los divisores elementales. Como los subm
odulos son subespacios invariantes,
la restricci
on de h a cada uno de ellos es un endomorfismo y podemos aplicar el
teorema 8.28 para obtener una base de cada uno de ellos de modo que la matriz
de la restricci
on de h sea la indicada, o sea, la Mi del enunciado. La uni
on de
las bases de los sumandos directos forma una base de V y es claro que la matriz
de h en esta base es la indicada.
Recprocamente, si la matriz de h en una base es de la forma indicada,
podemos expresar V como suma directa de los subespacios generados por los
vectores de la base correspondientes a cada una de las cajas Mi de la matriz. Es
claro que estos subespacios son invariantes y que Mi es la matriz de la restricci
on
de h al subespacio i-esimo. Por el teorema 8.28, cada uno de estos subespacios
est
a generado por un vi cuyo polinomio mnimo es pi . Por la unicidad concluimos
que los pi son los factores invariantes o los divisores elementales de h.
Las matrices de la forma descrita en el teorema anterior son formas can
onicas
para la relaci
on de semejanza. En efecto, si A Matn (K) y V es cualquier Kespacio vectorial de dimensi
on n, entonces A es la matriz de un endomorfismo
h de V en una base cualquiera de V , pero en otra base h tiene una matriz de
la forma del teorema anterior (con factores invariantes), luego A es semejante a
una matriz de este tipo.
Por otra parte, si A y B son matrices del tipo del teorema anterior (con
factores invariantes) y son semejantes, entonces son matrices de un mismo endomorfismo h de V , y por la unicidad de los factores invariantes se ha de cumplir
que A = B.
Para divisores elementales se cumple lo mismo salvo por el hecho de que
los factores invariantes est
an ordenados por la divisibilidad, mientras que los
divisores elementales no est
an ordenados de ning
un modo, luego las matrices
que resultan de cambiar el orden de las cajas (con divisores elementales) son
semejantes entre s sin dejar de ser del tipo del teorema 8.30.
Definici
on 8.31 Si K es un cuerpo y A Matn (K), llamaremos 1a forma
can
onica de A (respectivamente, 2a forma can
onica) a la u
nica matriz del tipo
indicado en el teorema 8.30 para factores invariantes (respectivamente para

8.3. Clasificaci
on de endomorfismos

307

divisores elementales, con la consiguiente perdida parcial de unicidad) que es


semejante a la matriz A.
De este modo, dos matrices son semejantes si y s
olo si sus formas can
onicas
son iguales. Los teoremas siguientes nos permiten calcular la forma can
onica de
cualquier matriz.
Teorema 8.32 Sea K un cuerpo y A Matn (K) una matriz del tipo del teorema 8.28 para el polinomio m
onico p(x). Entonces los factores invariantes (los
construidos en el teorema 8.18) de la matriz xIn A Matn (K[x]) son todos
iguales a 1 excepto el u
ltimo, que es p(x).
n
P
n: Sea p(x) =
Demostracio
ai xi , con an = 1. La matriz xIn A es

i=0

1
x
1
..
.

a0

a1

a2

..

..

..

.
x
an2

1
an1 + x

Sumamos a la primera columna la segunda multiplicada por x, la tercera


multiplicada por x2 , etc. Luego a la segunda columna le sumamos la tercera
multiplicada por x, la cuarta multiplicada por x2 , etc. y as sucesivamente. El
resultado es:

0
1

..
..

.
.

1
n

n
P

P
ai xi
ai xi an1 + x
i=0

i=1

Sumando a la fila n-sima la i-esima multiplicada por el coeficiente adecuado


queda:

0
1

..
..

.
.

..

.
1
n

i
ai x
0 0
i=0

Finalmente multiplicamos todas las filas salvo la u


ltima por 1 y reordenamos las columnas, con lo que llegamos a la forma can
onica de la matriz:

..

P
ai xi
i=0


Captulo 8. Algebra
lineal

308

Teorema 8.33 Sea K un cuerpo, V un K-espacio vectorial de dimensi


on finita
n y h un endomorfismo de V . Sea A la matriz de h en 1a forma can
onica.
Entonces los factores invariantes de h son los factores invariantes no unitarios
de la matriz xIn A.
n: Por comodidad llamaremos [A1 , . . . , Ar ] a la matriz forDemostracio
mada por las cajas A1 , . . . , Ar situadas sobre su diagonal. Sean p1 , . . . , pr los
factores invariantes de h. Entonces xIn A = [M1 , . . . , Mr ], donde cada Mi
tiene forma indicada en el teorema 8.28 para el polinomio pi .
Por el teorema anterior, Mi es equivalente a una matriz diagonal de la forma
Ni = [1, . . . , 1, pi ]. Por lo tanto existen matrices Pi , Qi LGn (K[x]) tales que
Pi Mi Qi = Ni .
Sean P = [P1 , . . . , Pr ] y Q = [Q1 , . . . , Qr ]. Es f
acil ver que P y Q son
regulares, as como que
P (xIn A)Q = [P1 M1 Q1 , . . . Pr Mr Qr ] = [N1 , . . . , Nr ]
= [1, . . . , 1, p1 , . . . , 1, . . . , 1, pr ],
luego la forma can
onica de xIn A es [1, . . . , 1, p1 , . . . , pr ].
El resultado definitivo es el siguiente:
Teorema 8.34 Sea K un cuerpo, V un K-espacio vectorial de dimensi
on finita
n y h un endomorfismo de V . Sea A la matriz de h en cualquier base. Entonces
los factores invariantes de h son los factores invariantes no unitarios de la
matriz xIn A.
n: Sea B la matriz de h en 1a forma can
Demostracio
onica. Como A y B

son matrices de h, son semejantes, es decir, existe una matriz P LGn (K) tal
que B = P 1 AP . Entonces
P 1 (xIn A)P = xP 1 In P P 1 AP = xIn B.
Por lo tanto, las matrices xIn A y xIn B son equivalentes, luego tienen los
mismos factores invariantes y, por el teorema anterior, los no unitarios son los
factores invariantes de h.
Definici
on 8.35 Sea K un cuerpo y A Matn (K). Llamaremos factores invariantes de A a los factores invariantes de xIn A (en el sentido de 8.18).
Hemos demostrado que los factores invariantes de un endomorfismo son los
factores invariantes no unitarios de cualquiera de sus matrices.
Tambien es obvio ahora que dos matrices son semejantes si y s
olo si tienen
los mismos factores invariantes (si tienen los mismos factores invariantes tienen
la misma forma can
onica).
Observemos que en principio tenemos dos definiciones de factores invariantes
de una matriz de Matn (K), la dada en el teorema 8.18 y la que acabamos de

8.3. Clasificaci
on de endomorfismos

309

dar, pero sucede que la definici


on seg
un el teorema 8.18 no tiene interes para
matrices sobre un cuerpo, ya que todos los factores invariantes en este sentido
son iguales a 1. Lo u
nico que interesa es su n
umero, o sea, el rango.
Los factores invariantes de una matriz A se calculan sin dificultad mediante
el algoritmo dado en el teorema 8.18. Los divisores elementales se calculan
descomponiendo los factores invariantes en potencias de primos.
Llamaremos polinomio mnimo de una matriz A a su u
ltimo factor invariante. As, si A es la matriz de un endomorfismo h, se cumple que pol mn A =
pol mn h. Dado el isomorfismo entre endomorfismos y matrices, es claro que si
p(x) = pol mn A, entonces p(A) = 0, y si q(x) K[x], entonces q(A) = 0 si y
s
olo si p(x) | q(x).
Ejemplo Vamos a calcular los factores

8 2
12 6
A=
2 3
13 9
Para ello aplicamos el algoritmo del

x8
2
12 x 6

2
3
13
9

invariantes de la matriz

10 6
20 12

7 4
25 15

teorema 8.18 a xI4 A:

10
6
20
12

x7
4
25 x + 15

En primer lugar intercambiamos las dos primeras columnas para situar en


la posici
on (1, 1) un polinomio de norma mnima (o sea, de grado mnimo) (el
2). Dividiendo la fila 1 entre 2 tenemos un 1 en el lugar (1, 1) y restando a
cada columna la primera multiplicada por su primer coeficiente llegamos hasta
la matriz

1
0
0
0
x 6 x2 7x + 12 5x + 10 3x 6

2
3
32 x + 10
x+8
5
9
92 x + 23
20
x + 12

Ahora restamos a cada fila la primera multiplicada por su primer coeficiente


y hacemos ceros debajo del primer 1 (el resto de la matriz no se modifica).
Como el 1 divide a todos los coeficientes restantes podemos continuar con la
submatriz 3 3.
Llevamos el 5 al lugar (2, 2) (otra opci
on sera llevar el 20). Dividimos la
segunda fila entre 5 y obtenemos otro 1, con el que hacemos ceros a su derecha
y bajo el. El resultado es:

1 0
0
0
0 1

0
0

0 0 3x2 7x + 2 2x2 + 4x
0 0 2x2 8x + 8 3x2 10

310

Captulo 8. Algebra
lineal

El cociente de 2x2 + 4x entre 3x2 7x + 2 es 2/3 y el resto (2/3)(x 2).


Restamos a la cuarta columna la tercera multiplicada por 2/3 con lo que
en la posici
on (3, 4) queda (2/3)(x 2). Lo pasamos a la posici
on (3, 3) y
multiplicamos por 3/2:

1 0
0
0
0 1

0
0

0 0

x2
92 x2 + 21
x

3
2
11
2
0 0 53 x2 + 17
x

2x

8x
+
8
3
3

Al dividir el polinomio de la posici


on (3, 4) entre x 2 la divisi
on nos da
exacta, a saber: (3/2)(3x 1)(x 2). Restamos a la cuarta fila la primera
multiplicada por (3/2)(3x 1) y nos queda (factorizando los polinomios):

1 0
0
0
0 1

0
0

0 0

x2
0
2
0 0 13 (5x 7)(x 2) 15
(x

2)(x

1)
2
Restamos a la cuarta fila la tercera multiplicada por (1/3)(5x 7) y queda
un 0 en el lugar (4, 3). Multiplicando la u
ltima fila por 2/15 queda:

1 0
0
0
0 1

0
0

0 0 x2

0
2
0 0
0
(x 2)(x 1)
Por lo tanto los factores invariantes de la matriz A de partida son
x 2 y (x 2)(x 1)2 .
Los divisores elementales son x 2, x 2 y (x 1)2 .
de A es pol mn A = (x 2)(x 1)2 = x3 4x2 + 5x 2.
de A son:


2 0 0 0
2 0 0
0
0 0 1 0 0 2 0
0


0 0 0 1 0 0 0
1
0 2 5 4
0 0 1 2

El polinomio mnimo
Las formas can
onicas

Hemos visto que si A y B son matrices matrices semejantes, o sea, si existe


P LGn (K) tal que B = P 1 AP , entonces tambien xIn B = P 1 (xIn A)P ,
luego tomando determinantes queda |xIn B| = |P |1 |xIn A||P | = |xIn A|.
Definici
on 8.36 Llamaremos polinomio caracterstico de A Matn (K) al polinomio pol car A = |xIn A|. Es f
acil ver que es m
onico de grado n.
Acabamos de probar que las matrices semejantes tienen el mismo polinomio caracterstico, por lo que podemos definir el polinomio caracterstico de un
endomorfismo como el de cualquiera de sus matrices.

8.3. Clasificaci
on de endomorfismos

311

El polinomio caracterstico es mucho m


as f
acil de calcular que los factores invariantes o los divisores elementales y en ocasiones proporciona suficiente
informaci
on sobre una matriz dada.
Por ejemplo, el polinomio caracterstico de la matriz A anterior resulta ser
pol car A = (x 2)2 (x 1)2 .
Este ejemplo muestra que el polinomio caracterstico est
a muy relacionado
con los factores invariantes y los divisores elementales. La relaci
on exacta nos
la da el teorema siguiente:
Teorema 8.37 Sea K un cuerpo y A Matn (K). Entonces el polinomio caracterstico de A es el producto de sus factores invariantes (luego tambien el de
los divisores elementales).
n: Supongamos primero que A es de la forma indicada en el
Demostracio
teorema 8.28, es decir, que tiene un u
nico factor invariante no unitario igual a
n
P
i
ai x .
i=0
n
P
Es f
acil ver que en este caso |xIn A| =
ai xi (basta desarrollar el deteri=0
minante por la primera columna).
Ahora, si una matriz A est
a formada por dos cajas (A = [M, N ] con la
notaci
on del teorema 8.33) es f
acil ver que [M, N ] = [M, I][I, N ], donde I representa en cada caso a la matriz
identidad de las dimensiones adecuadas. Por
[M, I] [I, N ] = |M | |N |. De aqu se sigue en general que
lo
tanto
|A|
=

[M1 , . . . , Mr ] = |M1 | |Mr |.


Si A es una 1a forma can
onica, entonces A = [M1 , . . . , Mr ], donde las matrices Mi son del tipo del teorema 8.28 para cada factor invariante de A.
Entonces xIn A = [xI M1 , . . . , xI Mr ], luego
pol car A = |xI M1 | |xI Mr |.
Por el caso particular ya probado estos factores son los factores invariantes de
A, luego el teorema es cierto para formas can
onicas.
Finalmente, si A es cualquier matriz, su polinomio caracterstico es el mismo
que el de su 1a forma can
onica, que es el producto de sus factores invariantes,
que son tambien los factores invariantes de A.
Una consecuencia es el llamado teorema de Cayley, seg
un el cual toda matriz
es raz de su polinomio caracterstico (porque este es un m
ultiplo de su polinomio
mnimo).
Las matrices semejantes tienen el mismo polinomio caracterstico, aunque el
recproco no es cierto, pues el polinomio caracterstico no determina los factores
invariantes o los divisores elementales.


Captulo 8. Algebra
lineal

312

Por ejemplo, sabiendo que pol car A = (x 2)2 (x 1)2 , los invariantes de A
podran ser:
Factores invariantes
2

Divisores elementales

(x 2) (x 1)

(x 2)2 , (x 1)2

x 1, (x 2)2 (x 1)

x 1, x 1, (x 2)2

x 2, (x 2)(x 1)2

x 2, x 2(x 1)2

(x 2)(x 1), (x 2)(x 1) x 2, x 2, x 1, x 1


Los coeficientes del polinomio caracterstico p(x) de una matriz A son invariantes por semejanza. El primero y el u
ltimo de estos coeficientes (aparte del
director, que es igual a 1) son especialmente simples.
El termino independiente es p(0) = |0In A| = | A| = (1)n |A|. De
aqu se sigue algo que ya sabamos: que las matrices semejantes tienen el mismo
determinante.
Para calcular el coeficiente de xn1 observamos que, seg
un la definici
on de
determinante, uno de los sumandos de p(x) es
(x a11 ) (x ann ) = xn (a11 + + ann )xn1 +
y ning
un otro sumando tiene monomios de grado n 1. As pues, el coeficiente
de grado n 1 de p(x) es (a11 + + ann ).
Definici
on 8.38 Llamaremos traza de una matriz A Matn (K) a
Tr(A) = a11 + + ann .
Hemos probado que las matrices semejantes tienen el mismo determinante
y la misma traza. Por ello podemos definir el determinante y la traza de un
endomorfismo como el de cualquiera de sus matrices.
Las races del polinomio caracterstico de un endomorfismo contienen informaci
on muy importante sobre el mismo. Vamos a comprobarlo. Sea h un
endomorfismo de un espacio vectorial V sobre un cuerpo K y sea A su matriz
en una base. Sea K una raz de pol car A. Entonces |In A| = 0, lo
que significa que la matriz In A no es regular, luego el endomorfismo que
determina, es decir, I h, no es inyectivo, luego su n
ucleo no es trivial, luego
existe un vector v V no nulo tal que h(v) = v. Recprocamente, si existe un
vector v no nulo tal que h(v) = v, invirtiendo el razonamiento llegamos a que
es raz de pol car A.
Definici
on 8.39 Sea h un endomorfismo de un espacio vectorial V sobre un
cuerpo K. Si un vector v V no nulo cumple h(v) = v para cierto K,
diremos que v es un vector propio de h y que es un valor propio de h.
Acabamos de probar que los valores propios de un endomorfismo h son exactamente las races de su polinomio caracterstico.

8.3. Clasificaci
on de endomorfismos

313

Cada vector propio tiene asociado un u


nico valor propio. Recprocamente,
si K es un valor propio de h, entonces tiene asociado el espacio
S(h, ) = {v V | h(v) = v},
que es un subespacio vectorial no trivial de V al que llamaremos espacio fundamental de .
Un caso especialmente interesante es el subespacio S(h, 1), que est
a formado
por los puntos fijos de h.
Ejemplo Sea h un endomorfismo de R4 cuya matriz en la base can
onica sea
la matriz A del ejemplo anterior. Hemos calculado
pol car A = (x 2)2 (x 1)2 ,
luego sus valores propios son 1 y 2.
El sistema de ecuaciones lineales (u, v, w, x)A = (u, v, w, x) tiene soluci
on
(4v, v, 5v, 2v) para cualquier v, luego
S(h, 1) = h(4, 1, 5, 2)i .
Igualmente se calcula
S(h, 2) = h(2, 1, 0, 0), (3, 0, 6, 2)i .
Como el polinomio caracterstico es el producto de los divisores elementales,
los valores propios son las races de los divisores elementales. Como estos son
potencias de irreducibles, es obvio que es un valor propio de h si y s
olo
si uno de los divisores elementales de h tiene la forma (x )e . El teorema
siguiente muestra exactamente la relaci
on entre los valores propios y los divisores
elementales.
Teorema 8.40 Sea K un cuerpo, V un K-espacio vectorial de dimensi
on finita y h un endomorfismo de V . Sea V = hv1 ik[x] hvr ik[x] la descomposici
on de V en subm
odulos asociada a los divisores elementales, es decir, tal
que pol mn vi = pi (x)ei con pi (x) irreducible. Sea K un valor propio de h
y supongamos que pi = x para i = 1, . . . , s. Entonces:

1. S(h, ) = (x a)e1 1 v1 , . . . , (x )es 1 vs k .


2. dim S(h, ) = s.

Si 1 , . . . , t son todos los valores propios de h, entonces se tiene la suma directa


S = S(h, 1 ) S(h, t ).
Al espacio S se le llama espacio fundamental de h.


Captulo 8. Algebra
lineal

314

n: Un vector v 6= 0 es propio con valor propio si y s


Demostracio
olo si
(x)v = 0, luego es inmediato que los vectores (x)e1 1 v1 , . . . , (x)es 1 vs
est
an en (h, ). Por lo tanto tenemos la inclusi
on

(x )e1 1 v1 , . . . , (x )es 1 vs k S(h, ).

Veamos ahora la otra inclusi


on. Si v S(h, ), por la descomposici
on de V
tenemos en principio que v = f1 (x)v1 + + fr (x)vr para ciertos polinomios
fi (x). Seg
un el teorema 8.27 podemos exigir que grad fi (x) < ei .
Como v es un vector propio, se cumple que (x )v = 0, o sea,
(x )f1 (x)v1 + + (x )fr (x)vr = 0.
Como la suma es directa cada sumando es nulo y, por definici
on de polinomio
mnimo, resulta que pi (x)ei | (x )fi (x) para i = 1, . . . , r.
Si i > s tenemos que pi (x) 6= x , luego pi (x)ei | fi (x) y as fi (x)vi = 0,
con lo que la expresi
on de v se reduce a
v = f1 (x)v1 + + fs (x)vs .
Para i s tenemos que (x )ei | (x )fi (x), de donde (x )ei 1 | fi (x),
es decir, fi (x) = qi (x)(x )ei 1 , pero tenemos tambien que grad fi (x) < ei ,
luego la u
nica posibilidad para qi (x) es que sea una constante qi K. Con esto
la expresi
on de v queda en
v = q1 (x )e1 1 v1 + + qs (x )es 1 vs ,
lo que prueba la igualdad.
Estos generadores son independientes, pues cada uno est
a contenido en un
sumando directo distinto. Por la misma raz
on los distintos espacios fundamentales tienen suma directa, pues est
an contenidos en sumandos directos distintos
(los correspondientes a los divisores elementales con raz el valor propio correspondiente).
La matriz A de los ejemplos anteriores tiene divisores elementales x 2,
x 2 y (x 1)2 , por lo que el teorema anterior nos da que dim S(h, 2) = 2 y
dim S(h, 1) = 1 (como ya habamos comprobado).

8.4

Formas bilineales

Al estudiar los determinantes hemos introducido el concepto de forma multilineal. Conviene estudiar m
as detalladamente el caso de las formas bilineales
sobre espacios vectoriales de dimensi
on finita.
Definici
on 8.41 Sea V un espacio vectorial sobre un cuerpo K. Una forma
bilineal en V es una aplicaci
on F : V V K tal que para todo v1 , v2 , v V ,
y todo a, b K se cumple
F (av1 + bv2 , v) = aF (v1 , v) + bF (v2 , v),
F (v, av1 + bv2 ) = aF (v, v1 ) + bF (v, v2 ).

8.4. Formas bilineales

315

La aplicaci
on determinante es un ejemplo de forma bilineal en K 2 , pero es
antisimetrica, y ahora nos vamos a interesar por las formas bilineales opuestas:
Una forma bilineal F es simetrica si para todo par de vectores v1 , v2 V se
cumple F (v1 , v2 ) = F (v2 , v1 ).
Por ejemplo, un producto escalar en el sentido de [G 4.17] es un ejemplo de
forma bilineal simetrica (al que se le exigen propiedades adicionales).
Al igual que ocurre con las aplicaciones lineales, las formas bilineales quedan
determinadas por una base y una matriz:
Si B = (v1 , . . . , vm ) es una base ordenada de V , llamaremos matriz de F
respecto a dicha base a

MB (F ) = F (vi , vj ) .

Teorema 8.42 Sea F : V V K una forma bilineal en un K-espacio


vectorial V . Sea B = (v1 , . . . , vn ) una base ordenada de V . Entonces MB (F )
es la u
nica matriz de Matn (K) tal que para todo v, v 0 V se cumple
F (v, v 0 ) = B (v) MB (F ) B (v 0 )t .
n: Sea B (v) = (x1 , . . . , xn ) y B (v 0 ) = (y1 , . . . , yn ). EntonDemostracio
ces
F (v, v 0 ) = F

P
n

xi vi ,

i=1

n
P

j=1

P
n P
n
yj vj =
xi F (vi , vj ) yj
i=1 j=1

= B (v) MB (F ) B (v 0 )t .

Si una matriz tiene esta propiedad, aplic


andola a los vectores vi y vj obtenemos
que su componente (i, j) ha de ser precisamente F (vi , vj ).
Ejercicio: Probar que una forma bilineal es simetrica si y s
olo si su matriz en una
base cualquiera es simetrica.

Definici
on 8.43 La forma cuadr
atica asociada a una forma bilineal simetrica
F : V V K es la aplicaci
on q : V K dada por q(v) = F (v, v).
Si el cuerpo K tiene caracterstica distinta de 2 entonces F est
a determinada
por q en el sentido de que si dos formas bilineales simetricas determinan la misma
forma cuadr
atica es que son iguales. En efecto, basta calcular
F (v + w, v + w) = F (v, v) + F (w, w) + 2F (v, w)
y despejar
q(v + w) q(v) q(w)
.
2
En particular, fijada una base de V , tenemos una biyecci
on entre las matrices
simetricas n n y las formas cuadr
aticas en V .
F (v, w) =

Las formas bilineales est


an muy relacionadas con el concepto de espacio dual,
que introducimos seguidamente:


Captulo 8. Algebra
lineal

316

Definici
on 8.44 Si K es un cuerpo y V es un K-espacio vectorial, llamaremos
espacio dual de V a V = HomK (V, K), es decir, al espacio vectorial de todas
las aplicaciones lineales de V en K.
Matn1 (K), luego en
Si V tiene dimensi
on finita n sabemos que V =

particular dim V = dim V .


Con m
as exactitud, si B = (v1 , . . . , vn ) es una base de V y fijamos 1 como
base de K, entonces la aplicaci
on MB1 determina un isomorfismo entre V y
Matn1 (K). Una base del segundo espacio la forman los vectores ei = (ij ). La
antiimagen de ei por el isomorfismo es una aplicaci
on vi tal que MB1 (vi ) = ei ,

lo que significa que vi (vj ) = ij (donde ij vale 1 si i = j y 0 en caso contrario).


La base B = (v1 , . . . , vn ) de V determinada por la relaci
on vi (vj ) = ij se
llama base dual de (v1 , . . . , vn ).
Es f
acil hallar las coordenadas de un elemento de V respecto a esta base:
Teorema 8.45 Sea K un cuerpo, V un K-espacio vectorial y B = (v1 , . . . , vn )
una base V . Entonces, las coordenadas en la base dual B = (v1, . . . , vn ) de un
elemento cualquiera v V son B (v ) = v (v1 ), . . . , v (vn ) .
n: Basta observar que
Demostracio
n

n
n
P
P
P
v (vi )vi (vj ) =
v (vi )vi (vj ) =
v (vi )ij = v (vj ),
i=1

i=1

i=1

y como ambas aplicaciones lineales coinciden sobre la base B, han de ser iguales,
n
P
o sea, v =
v (vi )vi .
i=1

Ejercicio: Probar que si f : V W es una aplicaci


on lineal entre espacios vectoriales, entonces la aplicaci
on dual f : W V dada por f (w ) = f w es tambien
lineal. Adem
as f es inyectiva (suprayectiva) si y s
olo si f es suprayectiva (inyectiva).
B

Dadas bases B y C, hallar la relaci


on entre MC
B (f ) y MC (f ).

Si F : V V K es una forma bilineal simetrica tenemos definida una


aplicaci
on lineal
F : V V
v
7 V
K
w
7 F (v, w)
Consideremos una base B = (v1 , . . . , vn ) de V y vamos a calcular la matriz
de esta aplicaci
on respecto a las bases B y B . El elemento (i, j) de esta matriz
ser
a la coordenada j-esima de (vi ), pero seg
un el teorema anterior se trata de

F (vi )(vj ) = F (vi , vj ). Por lo tanto MB


B (F ) = MB (F ).
Definici
on 8.46 Una forma bilineal simetrica F : V V K es regular si la
aplicaci
on F es inyectiva.

8.4. Formas bilineales

317

Si el espacio V tiene dimensi


on finita esto equivale a que F sea un isomorfismo, y por el teorema 5.36 esto equivale a que MB (F ) sea una matriz regular
(para una base cualquiera B de V ), o a que |MB (F )| 6= 0.
As pues, toda forma bilineal simetrica regular en un espacio vectorial de
dimensi
on finita induce un isomorfismo entre V y su espacio dual, del que hay
que destacar que no depende de ninguna elecci
on de bases. Si B = (v1 , . . . , vn )
es una base de V , la antiimagen por F de su base dual es una base B =
(v1 , . . . , vn ) de V (a la que tambien llamaremos base dual de B) caracterizada
por que F (vi , vj ) = ij , para todo par de ndices i, j.
Nos planteamos ahora el problema an
alogo al que ya nos hemos planteado
para los endomorfismos de un espacio vectorial: si tenemos dos bases de un espacio vectorial, que relaci
on hay entre las matrices de una misma forma bilineal
simetrica en ambas bases? C
omo saber si dos matrices dadas corresponden
a la misma forma bilineal en bases distintas? La primera pregunta tiene una
respuesta muy simple:
Definici
on 8.47 Diremos que dos matrices simetricas A y B son congruentes
si existe una matriz regular M tal que A = M BM t .
Es claro que todas las matrices correspondientes a una misma forma bilineal
simetrica son congruentes entre s, y que si B es la matriz de una forma F
en una cierta base, cualquier matriz A congruente con B es la matriz de F
en una base adecuada. En efecto, dadas dos bases de V , si X e Y son las
coordenadas de v y w respecto a una de ellas, sus coordenadas respecto de la
otra ser
an de la forma XM e Y M , donde M es la matriz de cambio de base,
luego F (v, w) = XM BM t Y t , donde B es la matriz de F en esta segunda base.
Por la unicidad de la matriz de una forma bilineal, la matriz de F en la primera
base ha de ser A = M BM t . Esto prueba que las matrices de F respecto de dos
bases de V son congruentes. Igualmente se razona que si A es la matriz de F en
una base, entonces B es la matriz de F en la base determinada por M a partir
de la base dada.
Ahora encontraremos invariantes y formas can
onicas para las matrices de las
formas bilineales simetricas, de modo an
alogo a como hicimos con las matrices de
los endomorfismos de un espacio vectorial. Consideraremos u
nicamente matrices
y espacios vectoriales definidos sobre un cuerpo arbitrario k de caracterstica
distinta de 2.
La gua del procedimiento que vamos a seguir consiste en tratar a las formas
bilineales sobre un espacio vectorial como si fueran un producto escalar. As,
diremos que dos vectores de un espacio vectorial V son ortogonales respecto a
una forma bilineal simetrica F : V V K si cumplen F (v, w) = 0. Lo
representaremos v w.
Hemos de tener presente que la semejanza s
olo llega hasta cierto punto. As,
para una forma arbitraria pueden ocurrir casos como que un vector no nulo sea
ortogonal a s mismo, o incluso a todos los dem
as vectores. Pese a ello, vamos


Captulo 8. Algebra
lineal

318

a probar que V tiene siempre una base ortogonal, es decir, una base v1 , . . . , vn
tal que vi vj = 0 cuando i 6= j.
Teorema 8.48 Sea V un espacio vectorial de dimensi
on finita sobre un cuerpo
de caracterstica distinta de 2 y sea F una forma bilineal simetrica en V . Entonces V admite una base ortogonal respecto a F .
n: Lo probaremos por inducci
Demostracio
on sobre la dimensi
on de V .
En dimensi
on 1 cualquier base es ortogonal. Supuesto cierto para espacios de
dimensi
on n1, consideremos un espacio de dimensi
on n. Si F es identicamente
nula cualquier base es ortogonal. En caso contrario existen vectores v, w tales
que F (v, w) 6= 0. Entonces
F (v + w, v + w) = F (v, v) + 2F (v, w) + F (w, w).
Necesariamente, uno de los tres vectores v, w, v + w no es ortogonal a s
mismo. Llamemos v1 a este vector. Sea
W = {v V | v v1 }.
Claramente W es un subespacio vectorial de V (el subespacio ortogonal a
v1 ). En general los subespacios ortogonales no tienen el buen comportamiento
del caso eucldeo, pero en este caso podemos probar que V = hv1 i W . En
efecto, si w W hv1 i entonces w = v1 v1 , es decir, F (v1 , v1 ) = 0, lo que
implica = 0. Por consiguiente hv1 i W = 0.
Por otra parte, W es el n
ucleo de la aplicaci
on lineal V K dada por
v 7 F (v1 , v), cuya imagen es todo K (porque no es nula), luego dim W = n 1,
y esto implica que V = hv1 i W .
Por hip
otesis de inducci
on W tiene una base ortogonal respecto a la restricci
on de F , digamos v2 , . . . , vn . Es claro que v1 , . . . , vn es una base ortogonal
de V .
Es obvio que la matriz de una forma bilineal en una base ortogonal es una
matriz diagonal. Por lo tanto hemos probado lo siguiente:
Teorema 8.49 Toda matriz simetrica sobre un cuerpo de caracterstica distinta
de 2 es congruente con una matriz diagonal.

(Observemos que la simetra de la matriz es necesaria. Este


es el motivo por
el cual nos hemos restringido a formas simetricas.)
Las matrices diagonales no son formas can
onicas, pues nada impide que
dos matrices diagonales sean congruentes. El problema de encontrar invariantes y formas can
onicas se vuelve extremadamente delicado a partir de este
punto, y depende profundamente del cuerpo considerado. S
olo hay un sencillo resultado que podemos a
nadir en general: Una matriz diagonal de la forma
A = [a21 b1 , . . . , a2n bn ], con cada ai 6= 0 es congruente con B = [b1 , . . . , bn ], pues
A = M BM t , donde M = [a1 , . . . , an ], es decir, podemos eliminar cuadrados de
la diagonal. Esto nos resuelve el problema en cuerpos donde todo elemento sea
un cuadrado, como es el caso de C y, en general, de todo cuerpo algebraicamente
cerrado. En efecto:

8.4. Formas bilineales

319

Teorema 8.50 Sea K un cuerpo de caracterstica distinta de 2 en el que todo


elemento sea un cuadrado. Entonces toda matriz simetrica A sobre K es congruente con una u
nica matriz de la forma [1, . . . , 1, 0, . . . , 0], donde r es el rango
| {z }
de A.
r

En efecto, toda matriz A es congruente con una matriz diagonal, que ser
a de
la forma [a21 , . . . , a2r , 0, . . . , 0], y podemos eliminar los cuadrados para convertirlos
en unos. Es obvio que dos matrices congruentes son equivalentes, luego tienen
el mismo rango, luego el n
umero de ceros y unos que aparecen es fijo.
En particular dos matrices simetricas sobre C (de las mismas dimensiones)
son congruentes si y s
olo si tienen el mismo rango, y esto es comprobable en la
pr
actica.
Consideramos ahora el caso de una forma bilineal simetrica sobre un cuerpo
ordenado R. En este caso, podemos encontrar otro invariante adem
as del rango:
Teorema 8.51 (Ley de inercia de Sylvester) Todas las matrices diagonales congruentes con una matriz simetrica A sobre un cuerpo ordenado R tienen
el mismo n
umero s de coeficientes positivos, al que llamaremos signatura de A.
El n
umero de coeficientes negativos ser
a necesariamente r s, donde r es el
rango de A.
n: Consideremos una forma bilineal F en un espacio vectorial
Demostracio
V definida por la matriz A en una cierta base. Sean v1 , . . . , vn y w1 , . . . , wn dos
bases de V en las que la matriz de F sea diagonal. Podemos suponer que estas
matrices son [a1 , . . . , ar , 0, . . . , 0] y [b1 , . . . , br , 0, . . . , 0], donde r es el rango de
las matrices,
ai > 0 para i = 1, . . . , s,

ai < 0 para i = s + 1, . . . , r,

bi > 0 para i = 1, . . . , s0 ,

bi < 0 para i = s0 + 1, . . . , r.

Hemos de probar que s = s0 .


Sean S = hv1 , . . . , vs i, T = hvs0 +1 , . . . , vn i. Veamos que S T = 0. En
s
P
efecto, todo v S es de la forma v =
i vi , luego
i=1

F (v, v) =

s
P

i,j=1

i j F (vi , vj ) =

s
P

i=1

i2 F (vi , vi ) =

s
P

i=1

i2 ai 0.

Adem
as F (v, v) = 0 si y s
olo si i = 0 para todo i, si y s
olo si v = 0.
Similarmente se prueba que si v T entonces F (v, v) 0 y F (v, v) = 0 si y
s
olo si v = 0. Ahora es claro que S T = 0.
Tomando dimensiones vemos que s + n s0 n, o sea, s s0 . Del mismo
modo se prueba la desigualdad contraria.
El teorema anterior nos permite definir la signatura de una forma bilineal
simetrica sobre un cuerpo ordenado como la de cualquiera de sus matrices.
Esto no nos da todava formas can
onicas, pero si el cuerpo R es eucldeo, es

320

Captulo 8. Algebra
lineal

decir, si todo elemento positivo es un cuadrado, entonces todo elemento de R


es de la forma a2 . Por lo tanto toda matriz simetrica sobre R es congruente
con una matriz diagonal de la forma [a21 , . . . , a2r , 0, . . . , 0], y esta a su vez es
congruente con una de la forma [1, . . . , 1, 1, . . . , 1, 0, . . . , 0] y estas matrices
s que son can
onicas, es decir, dos de ellas no pueden ser congruentes por el
teorema anterior. As pues:
Teorema 8.52 Dos matrices simetricas sobre un cuerpo eucldeo son congruentes si y s
olo si tienen el mismo rango y la misma signatura.
La obtenci
on de formas can
onicas en cuerpos como Q requiere resultados
importantes de teora de n
umeros.
Con el teorema anterior tenemos resuelto el problema te
orico que nos habamos planteado, pero conviene que nos detengamos a dar un metodo para calcular
en la pr
actica la signatura de una matriz simetrica sobre un cuerpo realmente
cerrado, pues la forma de hacerlo es muy simple. Vamos a probar que todo se
reduce a calcular los valores propios de la matriz. Nos basamos en el teorema
siguiente:
Teorema 8.53 Sea h : V V un endomorfismo en un espacio vectorial
eucldeo sobre un cuerpo realmente cerrado. Si la matriz de h en una base
ortonormal es simetrica, entonces V tiene una base ortonormal formada por
vectores propios de h.
n: Sea R el cuerpo de escalares y sea C = R[i]. La hip
Demostracio
otesis
sobre R equivale a que C es algebraicamente cerrado. Sea A la matriz de
h a la que alude el enunciado. En primer lugar probaremos que su polinomio
caracterstico tiene todas sus races en R. Sea C una de sus races. Entonces
z , luego A
zt.
zA = z para un cierto z C n no nulo. Conjugando, zA =
z t =
t
t
t
t

Multiplicando por z queda z z = zA


z = z z . Es claro que z z 6= 0, luego

= .
Sean 1 , . . . , r las races distintas del polinomio caracterstico de A, es decir,
los valores propios de A. Para cada i, sea Vi el espacio de vectores propios
asociado. Veamos que si i 6= j entonces Vi Vj .
Sean x e y las coordenadas de dos vectores en Vi y Vj respectivamente.
Entonces xA = i x, yA = j y, luego Ay t = j y t . Multiplicando obtenemos
i xy t = xAyt = j xy t . Puesto que i 6= j ha de ser xy t = 0, lo que prueba
que los vectores correspondientes son ortogonales.
Sea W = V1 Vr . Veamos que h[W ] W . En efecto, sea v W .
Sean x las coordenadas de v e y las coordenadas de un vector de Vi . Entonces
xy t = 0 y yA = i y, luego xAyt = i xy t = 0. Como xA son las coordenadas de
h(v), concluimos que h(v) es ortogonal a cada Vi , luego a W .
Esto prueba que h puede restringirse a un endomorfismo de W . Es f
acil ver
que la matriz de h en cualquier base ortonormal es simetrica (basta probar que
toda matriz de la forma M AM t lo es). Si W 6= 0, la matriz de h|W en una

8.5. Aplicaciones

321

base ortonormal ser


a simetrica (basta completarla hasta una base ortonormal
de V y usar que la matriz de h en esta base lo es). Aplicando lo ya probado
llegamos a que h tiene un vector propio en W , pero esto es absurdo, pues todos
los vectores propios de h est
an en W . As pues, W = 0 y V = W W = W .
Ahora basta tomar una base ortonormal en cada Vi y unirlas todas.
Equivalentemente, hemos probado que toda matriz simetrica es semejante
a una matriz diagonal1 . En terminos de los invariantes de una matriz, lo que
hemos probado es que las matrices simetricas sobre un cuerpo realmente cerrado
tienen todos sus divisores elementales de grado 1, por lo que la dimensi
on del
espacio fundamental de un valor propio es su multiplicidad en el polinomio
caracterstico. Ahora probamos el resultado que nos interesa:
Teorema 8.54 Sea F una forma bilineal simetrica en un espacio vectorial
eucldeo sobre un cuerpo realmente cerrado. Entonces existe una base ortonormal de V que es ortogonal para F .
n: Sea A la matriz de F en una base ortonormal de V , que
Demostracio
ser
a simetrica. Sea h el endomorfismo de V que en dicha base tiene matriz
A. Por el teorema anterior V tiene una base e1 , . . . , en formada por vectores
propios de h, es decir, si llamamos x1 , . . . , xn a sus coordenadas en la base
original, xi A = i xi , luego si i 6= j se cumple F (ei , ej ) = xi Axtj = i xi xtj = 0,
luego la base es ortogonal para F .
As pues, dada una matriz simetrica A sobre un cuerpo realmente cerrado,
podemos considerar un espacio eucldeo y en el una forma bilineal que tenga
matriz A en una base ortonormal. Si B es la matriz de F en la base dada por
el teorema anterior, tenemos que B es diagonal y B = M AM t , donde M es
la matriz del cambio de base entre dos bases ortonormales, luego es ortogonal,
luego M t = M 1 . Esto significa que las matrices A y B son semejantes, luego
los coeficientes de la diagonal de B son los valores propios de A. En resumen:
Teorema 8.55 Dada una matriz simetrica A sobre un cuerpo realmente cerrado, la matriz diagonal B formada con los valores propios de A (repetidos
seg
un su multiplicidad en el polinomio caracterstico) es congruente2 con A.
Por lo tanto, la signatura de A es el n
umero de valores propios positivos.

8.5

Aplicaciones

Las aplicaciones m
as relevantes de los resultados que hemos presentado en
este captulo (aparte del concepto de determinante, que aparece en los contextos
m
as diversos) se dan en la geometra. No obstante, vamos a presentar aqu
algunas consecuencias algebraicas.
1 M
as a
un, que la matriz de semejanza M puede tomarse ortogonal, es decir, de manera
que M M t = I, pues esta propiedad caracteriza a las matrices que transforman una base
ortonormal en otra base ortonormal.
2 Y la matriz de congruencia puede tomarse ortogonal.


Captulo 8. Algebra
lineal

322

La unicidad de la clausura real Veamos en primer lugar que cada cuerpo


ordenado tiene, salvo isomorfismo, una u
nica clausura real. Para ello fijamos
un cuerpo ordenado K y una clausura real R, de modo que C = R[i] es una
clausura algebraica de K. Sea f (x) K[x] un polinomio m
onico irreducible y
sean 1 , . . . , n sus races en C. Definimos
n
P

j =

t=1

tj .

Como los automorfismos de K(1 , . . . , n )/K permutan los j , es claro que


fijan a cada j , luego j K. Llamamos qf a la forma cuadr
atica en K n que
en la base can
onica tiene por matriz (i+j2 )i,j . Si esta forma tiene rango r y
signatura s, llamamos cf = 2sr, que es el n
umero de terminos positivos menos
el n
umero de terminos negativos en cualquier matriz diagonal congruente con
(i+j2 )i,j .
Teorema 8.56 En las condiciones anteriores, cf es el n
umero de races de f
que pertenecen a R.
n: Como |C : R| = 2, es claro que todo polinomio irreducible
Demostracio
en R[x] tiene grado 1 o 2. Por lo tanto f se descompone en R[x] como producto
de factores
f (x) = (x 1 ) (x m )q1 (x) ql (x),
donde los polinomios qj (x) tienen grado 2, y lo que queremos probar es que
cf = m. Cada qj (x) tiene a su vez dos races conjugadas en C[x], de modo que
qj (x) = (xj )(x j ), con j C. Ahora observamos que si x K n , entonces
qf (x) =

n
P

u+v2 xu xv =

u,v=1

n
P

j=1

m
P

j=1

m
P

j=1

n
P

u=1

n
P

u=1

n
P

u=1

ju1 xu

ju1 xu

ju1 xu

l
P

j=1

n
P

j,u,v=1

n
P

v=1

l
P

j=1

jv1 xv

n
P

u=1

n
P

u=1

ju+v2 xu xv

n
P

j=1

ju1 xu

ju1 +
ju1
xu
2

n
P

u=1

0
10 m
..
..
.
.

10 +
10
2

10
10
2i

n1
1n1 m

1n1 +
1n1
2

1n1
1n1
2i

..
.

..
.

n
P

u=1

ju1 xu

n
P

u=1

Ahora consideramos la matriz M =

ju1 xu

2 !

ju1
ju1
xu
2

l0 +
l0
2

l0
l0
2i

1n1 +
1n1
2

ln1
ln1
2i

..
.

..
.

2 !

8.5. Aplicaciones

323

Enseguida probamos que es regular. Admitiendolo de momento, vemos que


determina un cambio de base respecto de la base can
onica de modo que, en la
nueva base, las coordenadas de x son
n
P

yj =

u=1

ym+2j1 =

ju1 xu ,

n
P

u=1
n
P

ym+2j =

u=1

j = 1, . . . , m,

ju1 +
ju1
xu ,
2

j = 1, . . . , l,

ju1
ju1
xu ,
2i

j = 1, . . . , l,

por lo que la expresi


on coordenada de qf en la nueva base es
qf (y) =

m
P

j=1

yj2 +

l
P

j=1

2
2
2(ym+2j1
ym+2j
),

luego la matriz de qf en la nueva base es diagonal, de la forma


m

z }| { z }| { z }| {
[1, . . . , 1, 2, . . . , 2, 2, . . . , 2],

luego cf = m, como queramos probar. S


olo queda pendiente justificar que,
realmente, M es regular. Para ello consideramos la matriz

..

1
1

N =

i
i

.
..

1 1
i i
y observamos que

MN =

10
..
.

1n1

0
m
..
.

n1
m

10
..
.

10
..
.

1n1

1n1

l0
..
.

ln1

l0
..
.
ln1

luego |M N | es un determinante de Vandermonde, que es no nulo porque las


races de f son distintas entre s. Por lo tanto, tambien |M | 6= 0.
As pues, el n
umero de races reales de un polinomio f est
a determinado
por el propio f , con independencia del cuerpo que tomemos como R. Con esto
podemos probar:

324

Captulo 8. Algebra
lineal

Teorema 8.57 Sea : k1 k2 un isomorfismo de cuerpos ordenados y sean


R1 , R2 clausuras reales de k1 y k2 respectivamente. Sea k1 K R1 tal
que K/k1 es una extensi
on finita. Entonces se extiende a un monomorfismo
K R2 .
n: Sea K = k1 () y sea f1 (x) k1 [x] el polinomio mnimo
Demostracio
de . Sea f2 (x) k2 [x] la imagen de f1 por . Si 1 , . . . , n son las races de f1
en R1 [i], entonces se extiende a un monomorfismo : k1 (1 , . . . , n ) R2 [i],
1 ), . . . , (
n ) son las races de f2 en R2 [i], y es claro que las
de modo que (
im
agenes por de los j definidos antes del teorema anterior para f1 son los
correspondientes a f2 . De aqu se sigue a su vez que qf1 y qf2 tienen el mismo
rango y la misma signatura, por lo que cf1 = cf2 .
Pero sabemos que cf1 > 0, pues es una raz de f1 en R1 , luego f2 tiene
una raz en R2 , digamos 0 . Por consiguiente se extiende a un isomorfismo
: K k2 (0 ) R2 .
Por u
ltimo:

Teorema 8.58 (Artin-Schreier) (AE) Dos clausuras reales de un mismo


cuerpo ordenado k son k-isomorfas.
n: Sean R1 /k y R2 /k dos clausuras reales de k. Basta aplicar
Demostracio
el lema de Zorn al conjunto de todos los k-isomorfismos : k1 k2 , donde
k k1 R1 , k k2 R2 , ordenado por la inclusi
on. Si : k1 k2
es maximal, es decir, no se puede extender a cuerpos mayores, tiene que ser
k1 = R1 , pues en caso contrario podramos tomar R1 \ k1 y K = k1 (), y el
teorema anterior nos dara una extensi
on. Similarmente, tiene que ser k2 = R2 ,
o podramos aplicar el teorema anterior a 1 . Por lo tanto : R1 R2
es un k-isomorfismo de cuerpos (y de hecho de cuerpos ordenados, porque al
transformar cuadrados en cuadrados conserva el orden).
El teorema de Frobenius Para nuestra segunda aplicaci
on tenemos que
introducir el concepto de algebra:
Definici
on 8.59 Si k es un cuerpo, una k-
algebra es una cu
adrupla (A, +, , )
tal que (A, +, ) sea un anillo unitario, (A, +, ) sea un k-espacio vectorial y
adem
as se cumpla la siguiente relaci
on de compatibilidad entre ambas estructuras:
(a b) = (a) b = a (b), para A, a, b A.
En la pr
actica usaremos la misma notaci
on para los dos productos de
un algebra. La aplicaci
on k A dada por 7 1 es claramente un
monomorfismo de anillos, por lo que podemos suponer que k A, de modo que
el producto como espacio vectorial es simplemente la restricci
on del producto
como anillo.
Por ejemplo, el cuerpo C de los n
umeros complejos y el anillo de divisi
on H
de los cuaternios son claramente R-
algebras. La primera es conmutativa y la
segunda no, pero es un algebra de divisi
on, en el sentido de que, como anillo, es
un anillo de divisi
on.

8.5. Aplicaciones

325

Teorema 8.60 (Frobenius) Las u


nicas R-
algebras de divisi
on de dimensi
on
finita sobre R son R, C y H.
n: Sea D un algebra de divisi
Demostracio
on de dimensi
on m sobre R.
Dado a D, la aplicaci
on a : D D dada por a (d) = ad es un endomorfismo de D como espacio vectorial sobre R. Definimos
V = {a D | Tr(a ) = 0},
que claramente es un subespacio vectorial de D de codimensi
on 1.
Vamos a probar que V = {a D | a2 R, a2 0}.
Dado a D, sea p(x) el polinomio caracterstico de a , que podemos factorizar como
p(x) = (x t1 ) (x tr )(x z1 )(x z1 ) (x zs )(x zs ),
donde t1 , . . . tr R y z1 , . . . , zs C \ R. Se cumple que m = r + 2s. Los
factores irreducibles de p(x) en R[x] son los polinomios x ti y los productos
x2 2xRe zi + |zi |2 .
El teorema de Cayley afirma que p(a ) = 0 o, lo que es lo mismo, que
p(a)d = 0 para todo d D. Como D es un anillo de divisi
on, esto implica que
p(a) = 0 y, esto a su vez nos lleva a que a = ti o bien a2 2aRe zi + |zi |2 = 0.
En el primer caso a R y Tr(a ) = a, luego a V si y s
olo si a = 0 si y
s
olo si a2 0.
En el segundo caso a
/ R y el polinomio mnimo de a es x2 2xRe zi +|zi |2 .
Como el polinomio caracterstico y el polinomio mnimo de un endomorfismo
tienen las mismas races, sucede que
p(x) = (x2 2xRe z + |z|2 )k ,
para cierto z C. Concluimos que a V si y s
olo si Re z = 0, si y s
olo si
a2 = |z|2 si y s
olo si a2 0.
Como V tiene codimensi
on 1 y V R = 0, sucede que D = R V .
Consideramos ahora la forma bilineal B : V V R dada por
B(a, b) =

ab + ba
.
2

Esto es correcto, pues ab + ba = (a + b)2 a2 b2 R. M


as a
un, si a 6= 0,
entonces B(a, a) = a2 > 0. Por lo tanto, B es un producto escalar en V .
Sea W V un subespacio vectorial de dimensi
on mnima tal que W genere
D como algebra, es decir, tal que todo elemento de D sea combinaci
on lineal
de 1 y de productos finitos de elementos de W . (Existe porque el propio V
cumple esta condici
on.) Sea e1 , . . . , en una base ortonormal de W respecto del
producto B. Esto significa que
e2i = 1,

ei ej = ej ei ,

si i 6= j.

326

Captulo 8. Algebra
lineal

Si n = 0 entonces D = R. Si n = 1 entonces D = h1, e1 i con e21 = 1, de


donde se sigue que D = C.
Si n = 2 entonces D = h1, e1 , e2 , e1 e2 i, pues las relaciones e21 = e22 = 1,
e1 e2 = e2 e1 reducen cualquier producto de los cuatro elementos anteriores a
una combinaci
on lineal de ellos, por lo que el miembro derecho es una sub
algebra
de D. Es f
acil deducir de aqu que D = H.
S
olo falta probar que n > 2 es imposible. En tal caso, llamemos u = e1 e2 en ,
y observamos que u2 = e1 e2 en e1 e2 en = 1, luego (u + 1)(u 1) = 0, luego
u = 1, pero entonces en = e1 e2 y he1 , . . . en1 i genera D como algebra, en
contra de la minimalidad de W .
As pues, si para dotar a R4 de estructura de anillo era preciso renunciar
a que sea un cuerpo, para cualquier otra dimensi
on distinta de 2 o 4 hay que
renunciar tambien a la estructura de anillo de divisi
on. Es posible definir muchas
estructuras de algebra en cualquier Rn , pero, salvo en los casos contemplados
por el teorema, habr
a elementos no nulos sin inverso.

Captulo IX

Resoluci
on de ecuaciones
por radicales
Las soluciones de una ecuaci
on de segundo grado ax2 + bx + c = 0 (sobre un
cuerpo de caracterstica distinta de 2) vienen dadas por la conocida f
ormula

b b2 4ac
x=
,
2a
entendiendo que si el discriminante = b2 4ac no tiene races cuadradas
en el cuerpo, entonces la ecuaci
on no tiene soluci
on (si bien su soluci
on en
una clausura algebraica tendr
a esta forma). En este captulo estudiaremos la
existencia de f
ormulas an
alogas para ecuaciones de grados superiores, junto con
algunos temas relacionados. No obstante, en las primeras secciones, antes de
intentar resolverlas, en las primeras secciones presentaremos algunos conceptos
y hechos relacionados con los polinomios de una variable.

9.1

Polinomios sim
etricos

Los polinomios simetricos proporcionan una relaci


on importante entre los
coeficientes de un polinomio y sus races. Sus propiedades (conceptualmente
m
as simples) pueden, en ocasiones, sustituir a la teora de Galois. Tambien representan un papel relevante en la teora de n
umeros trascendentes (por ejemplo
en la prueba de la trascendencia de ).
Definici
on 9.1 Sea A un dominio y n . Por 2.37 se cumple que la aplicaci
on : A[x1 , . . . , xn ] A[x1 , . . . , xn ] definida mediante

p(x1 , . . . , xn ) = p(x(1) , . . . , x(n) )

es un homomorfismo de anillos. De hecho es claro que se trata de un isomorfismo


que se extiende a un automorfismo del cuerpo A(x1 , . . . , xn ) (al que seguiremos
llamando ).
327

328

Captulo 9. Resoluci
on de ecuaciones por radicales

Tambien es f
acil comprobar que la aplicaci
on n Aut A(x1 , . . . , xn )
dada por 7 es un monomorfismo de grupos.
Si no hay confusi
on escribiremos (p) en lugar de (p) cuando p sea un polinomio o una fracci
on algebraica en las indeterminadas x1 , . . . , xn . En definitiva,
(p) se obtiene a partir de p intercambiando sus variables del modo indicado
por .
Diremos que una fracci
on algebraica p (en particular un polinomio) es simetrica si (p) = p para toda permutaci
on n .
Notemos que la definici
on depende del anillo de polinomios (o el cuerpo de
fracciones algebraicas) que consideremos pues, por ejemplo, xy + xz + yz es
simetrico como elemento de Q[x, y, z], pero no como elemento de Q[v, x, y, z],
pues la trasposici
on (v, x) no lo deja fijo.
Del hecho de que las aplicaciones sean isomorfismos se deduce inmediatamente que el conjunto de todas las fracciones algebraicas simetricas del cuerpo
A(x1 , . . . , xn ) es un subcuerpo, as como que el conjunto de todos los polinomios
simetricos de A[x1 , . . . , xn ] es un subanillo.
Llamaremos polinomios simetricos elementales de A[x1 , . . . , xn ] a los polinomios e0 , . . . , en dados por
X
e0 = 1, ek =
xi1 xik
para k = 1, . . . , n.
1i1 <<ik n

Vemos, pues, que cada ek es un polinomio simetrico de grado k. Por ejemplo,


los polinomios simetricos de 3 indeterminadas son
1,

x + y + z,

xy + xz + yz,

xyz.

En otras palabras, el polinomio ek es la suma de todos los monomios que


pueden construirse multiplicando k variables distintas.
El teorema siguiente proporciona una relaci
on u
til entre los polinomios simetricos elementales de orden n y los de orden n 1. La demostraci
on es muy
sencilla y queda a cargo del lector.
Teorema 9.2 Sea A un dominio, n > 1, e0 , . . . , en los polinomios simetricos
elementales en A[x1 , . . . , xn ] y e0 , . . . , en1 los polinomios simetricos elementales en A[x1 , . . . , xn1 ]. Entonces:
1. en (x1 , . . . , xn ) = xn en1 (x1 , . . . , xn1 ).
2. ek (x1 , . . . , xn ) = ek (x1 , . . . , xn1 )+xn ek1 (x1 , . . . , xn1 ), para 1 k < n.
Esto significa que los polinomios simetricos elementales de n variables pueden
obtenerse a partir de los polinomios simetricos elementales de n 1 variables
mediante sumas y productos en las que intervenga tambien la variable xn que
les falta. Una simple inducci
on permite probar la siguiente generalizaci
on de
este hecho (que no nos va a ser necesaria luego):

9.1. Polinomios simetricos

329

Teorema 9.3 Sea A un dominio, sean e0 , . . . , en los polinomios simetricos elementales en A[x1 , . . . , xn ] y e0 , . . . , ek los polinomios simetricos elementales en
A[x1 , . . . , xk ], donde 1 k < n. Entonces ei A[
e0 , . . . , ek , xk+1 , . . . , xn ] para
i = 0, . . . , n.
El interes de los polinomios simetricos elementales reside principalmente en
que son los que nos dan los coeficientes de un polinomio a partir de sus races
en un cuerpo de escisi
on. Ve
amoslo:
Teorema 9.4 (Vi`
ete) Sea A un dominio y e0 , . . . , en los polinomios simetricos
elementales en A[x1 , . . . , xn ]. Entonces
(x x1 ) (x xn ) =

n
P

(1)nk enk (x1 , . . . , xn )xk .

k=0

n: Por inducci
Demostracio
on sobre n. Para n = 1 es obvio. Supong
amoslo para n 1.
Sean e0 , . . . , en1 los polinomios simetricos elementales en A[x1 , . . . , xn1 ].
Entonces
(x x1 ) (x xn ) =
=

n1
P
k=0

n1
P
k=0

(1)n1k en1k xk (x xn )

(1)n1k en1k xk+1

= (1)n xn en1 + xn +

n2
P

n1
P

(1)n1k xn en1k xk

k=0

(1)n1k en1k xk+1

k=0

n1
P

(1)n1k xn en1k xk

k=1

= (1)n xn en1 + xn +

n1
P

(1)nk (
enk + xn en1k )xk

k=1

(por 9.2) = (1)n en + xn +

n1
P

(1)nk enk xk

k=1

n
P

(1)nk enk xk .

k=0

Por ejemplo,
(x a)(x b)(x c) = x3 (a + b + c)x2 + (ab + ac + bc)x abc,
lo que en algunos casos puede evitarnos muchas operaciones. Veamos ahora otro
de los hechos clave sobre polinomios simetricos:
Teorema 9.5 Sea A un dominio y sean e1 , . . . , en los polinomios simetricos
elementales en A[x1 , . . . , xn ]. Entonces el anillo de los polinomios simetricos de
A[x1 , . . . , xn ] es A[e1 , . . . , en ].

330

Captulo 9. Resoluci
on de ecuaciones por radicales

n: Por inducci
Demostracio
on sobre n. Para n = 1 resulta que todo
polinomio de A[x] es simetrico, y como e1 = x, se cumple el teorema.
Supongamos el teorema para n1. Sea p(x1 , . . . , xn ) un polinomio simetrico
del anillo A[x1 , . . . , xn ]. Veamos que p(x1 , . . . , xn ) A[e1 , . . . , en ] por inducci
on
sobre el grado de p. En caso de que p sea de grado 0 es evidente. Supongamos
que todo polinomio simetrico de grado menor que m est
a en A[e1 , . . . , en ] y que
p tiene grado m.
Sea p(x1 , . . . , xn1 ) = p(x1 , . . . , xn1 , 0) A[x1 , . . . , xn1 ]. Claramente p
es simetrico. Por la primera hip
otesis de inducci
on p A[
e1 , . . . , en1 ], donde
e1 , . . . , en1 son los polinomios simetricos elementales de A[x1 , . . . , xn1 ]. Esto
significa que existe un polinomio g A[x1 , . . . , xn1 ] tal que p = g(
e1 , . . . , en1 ).
Sea h(x1 , . . . , xn ) = p(x1 , . . . , xn ) g(e1 , . . . , en1 ), simetrico. Por 9.2 se
cumple que ei (x1 , . . . , xn1 , 0) = ei (x1 , . . . , xn1 ) para i = 1, . . . , n 1, luego
h(x1 , . . . , xn1 , 0) = p(x1 , . . . , xn1 ) g(
e1 , . . . , en1 ) = 0.
As pues, xn divide a h(x1 , . . . , xn ) y por simetra todas las variables lo

dividen, y su producto tambien, o sea, en divide a h. Sea h = en h.


= h = (h) = (en )(h)
= en (h),
luego
Si n , tenemos que en h

(h) = h. Esto prueba que h es simetrico y de grado menor que m, luego


A[e1 , . . . , en ], con lo que tambien
por la segunda hip
otesis de inducci
on h

p = g(e1 , . . . , en1 ) + en h A[e1 , . . . , en ].


Ejercicio: Probar que si A es un dominio, 1 , . . . , n son todas las races de un
polinomio m
onico de A[x] en una extensi
on en la cual se escinda (repetidas seg
un su
multiplicidad), y p(x1 , . . . , xn ) es un polinomio simetrico, entonces p(1 , . . . , n ) A.

No es inmediato, ni siquiera a partir del teorema anterior, que el subcuerpo


de las fracciones algebraicas simetricas de un cuerpo k(x1 , . . . , xn ) sea precisamente el cuerpo k(e1 , . . . , en ). Esto es tanto como afirmar que toda fracci
on
algebraica simetrica se expresa como cociente de dos polinomios simetricos. Daremos una prueba basada en la teora de Galois.
Teorema 9.6 Sea k un cuerpo y n 1. Entonces el cuerpo de las fracciones
algebraicas simetricas de k(x1 , . . . , xn ) es k(e1 , . . . , en ). Adem
as la extensi
on
k(x1 , . . . , xn )/k(e1 , . . . , en ) es finita de Galois y su grupo de Galois es n .
n: Consideremos el polinomio p(x) = (x x1 ) (x xn ). El
Demostracio
teorema 9.4 afirma que p(x) k(e1 , . . . , en )[x], lo que implica que las indeterminadas x1 , . . . , xn son algebraicas sobre k(e1 , . . . , en ). M
as a
un, son separables
(porque son races simples de p(x)) y k(x1 , . . . , xn ) es el cuerpo de escisi
on sobre
k(e1 , . . . , en ) de p(x), luego la extensi
on es finita de Galois.
Seg
un vimos en el captulo VII, el grupo de Galois

G = G k(x1 , . . . , xn )/k(e1 , . . . , en )
puede identificarse con un subgrupo del grupo de las permutaciones de las races
de p(x), es decir, de n , por lo que |G| n!

9.2. La resultante de dos polinomios

331

Por otro lado tenemos un monomorfismo n Aut k(x1 , . . . , xn ) y las


im
agenes de los elementos de n , por definici
on de simetra, fijan a los elementos de k(e1 , . . . , en ), es decir, de hecho tenemos un monomorfismo n G.
Teniendo en cuenta los ordenes, este monomorfismo es de hecho un isomorfismo,
es decir, los automorfismos de la extensi
on son exactamente las permutaciones
de las indeterminadas.
Ahora bien, si llamamos E al cuerpo de las fracciones algebraicas simetricas
de k(x1 , . . . , xn ), tenemos las inclusiones
k k(e1 , . . . , en ) E k(x1 , . . . , xn ),
y por definici
on de simetra es obvio que G(k(x1 , . . . , xn )/E) = G, luego el
teorema de Galois implica que E = k(e1 , . . . , en ).

9.2

La resultante de dos polinomios

Ya sabemos que el valor = b2 4ac recibe el nombre de discriminante de


un polinomio de segundo grado ax2 +bx+c. Aqu vamos a presentar un concepto
general de discriminante de un polinomio arbitrario. De hecho estudiaremos un
concepto m
as general a
un:
Definici
on 9.7 Consideremos un anillo conmutativo y unitario A y dos polinomios
f (x) = a0 xn + a1 xn1 + + an ,
donde a0 b0 6= 0. Definimos la

a0

R(f, g) =
b0

g(x) = b0 xm + b1 xm1 + + bm ,

resultante de f (x) y g(x) como el determinante

a1 an

a0 a1 an

.. ..
..

.
.
.

a0 a1 an

b1 bm

b0 b1 bm

..
..

.
.

b0 b1 bm

donde los coeficientes de f aparecen en m filas y los de g en n filas (y donde se


entiende que los huecos corresponden a coeficientes nulos).
En particular, si en el anillo de polinomios A = Z[u0 , . . . , un , v0 , . . . , vm ]
consideramos los polinomios
f (x) = u0 xn + u1 xn1 + + un ,

g(x) = v0 xm + v1 xm1 + + vm ,

tenemos la resultante general R Z[u0 , . . . , un , v0 , . . . , vm ] de grados n y m, que


es un polinomio que se particuliza a la resultante de cualquier par de polinomios
f y g de grados n y m en cualquier anillo A, cuando sus variables se sustituyen
por los coeficientes de f y g.

332

Captulo 9. Resoluci
on de ecuaciones por radicales

De la propia definici
on de determinante se sigue inmediatamente que la resultante general R(u0 , . . . , un , v0 , . . . , vm ) es un polinomio cuyos monomios tienen
n
todos m variables ui y n variables vi . El monomio um
0 vm (la diagonal del determinante) aparece con coeficiente 1. En particular tenemos que R 6= 0.
Tenemos las relaciones siguientes en Z[u0 , . . . , un , v0 , . . . , vm , x]:

a0 xn+m1 + a1 xn+m2 +
a0 xn+m2 +

b0 xn+m1 + b1 xn+m2 +
b0 xn+m2 +

..
.
a0 xn +a1 xn1
+bm xn1

= xm1 f (x)
= xm2 f (x)

m2

+an x

..

an

=
f (x)
= xn1 g(x)
= xn2 g(x)

bm

..

b0 xn +b1 xn1

g(x)

Esto se interpreta como que el sistema de ecuaciones lineales que tiene por
matriz la que define a R y con terminos independientes los de los miembros derechos, tiene por soluci
on (xn+m1 , xn+m2 , . . . , x, 1). Como R 6= 0, podemos
resolver este sistema por la regla de Cramer y, concretamente, la u
ltima componente (igual a 1) se obtiene como cociente de dos determinantes, uno de ellos
es R y el otro es el determinante que resulta de sustituir la u
ltima columna de
la matriz que define a R por el vector de terminos independientes. Concluimos
que R es igual a este u
ltimo determinante y, como los terminos independientes
son m
ultiplos de f (x) o de g(x), llegamos a que
R = F f + Gg,
para ciertos polinomios f , g Z[u0 , . . . , un , v0 , . . . , vm , x]. Sustituyendo las
indeterminadas ui , vi por elementos de un anillo A, obtenemos que, para todo
par de polinomios f (x), g(x) A[x], existen polinomios F (x), G(x) A[x] tales
que
R(f, g) = F (x)f (x) + G(x)g(x).
En particular, vemos que si f (x) y g(x) tienen una raz com
un (en A o en
cualquier extensi
on), entonces R(f, g) = 0. El resultado principal que queremos
probar es el recproco.
Para ello consideramos el anillo B = Z[u0 , v0 , s1 , . . . , sn , t1 , . . . , tm ], y en
B[x] los polinomios
F (x) = u0 (x s1 ) (x sn ),

G(x) = v0 (x t1 ) (x tm ).

Llamemos ui , vi B a los coeficientes de F y G respectivamente, y vamos


a calcular R(F, G). Observemos que ui = u0 u0i , donde u0i es el coeficiente iesimo de F/u0 , e igualmente vi = v0 vi0 . Como cada monomio de R contiene m
variables ui y n variables vi , es claro que
n
R(F, G) = um
0 v0 h,

9.2. La resultante de dos polinomios

333

para cierto h C = Z[s1 , . . . , sn , t1 , . . . , tm ]. Si en R sustituimos un tj por un


si , obtenemos la resultante de dos polinomios con una raz en com
un, luego se
anula (y h tambien). Si vemos a h como polinomio en
Z[s1 , . . . , sn , t1 , . . . ti , . . . tm ][ti ]
(donde el circunflejo significa que quitamos ti ), tenemos que si es raz de h,
luego h es divisible entre si tj , para todo i y todo j. Como estos polinomios
son primos entre s dos a dos, concluimos que
nQ
R(F, G) = um
(si tj )h0 ,
0 v0
i,j

para cierto h0 C.
Ahora bien, cada ui (para i 1) es un polinomio de grado n en s1 , . . . , sn
y cada uj (para j 1) es un polinomio de grado m en t1 , . . . , tm . Por otra
parte, en cada monomio de R(F, G) aparecen m variables ui y n variables vi ,
luego R(f, g) tiene grado mn en cada una de las variables si , ti . Como el grado
en el producto de la derecha exactamente mn, concluimos que h0 Z[u0 , v0 ].
Ahora bien, podemos expresar
0
R(F, G) = um
0 h

n
Q

G(si ),

i=1

de donde se sigue que el miembro derecho (sin contar h0 ) contiene el monomio


n
m m n
n
um
0 vm = (1) u0 t1 tm , al igual que el miembro izquierdo, luego ha de ser
0
h = 1. En definitiva, hemos probado que
n
Q
nQ
R(F, G) = um
(si tj ) = um
G(si ).
0 v0
0
i,j

i=1

Consideremos ahora un cuerpo k y dos polinomios f , g no constantes que se


escindan en k, es decir, que se descompongan como
f = a0 (x 1 ) (x n ),

g = b0 (x 1 ) (x m ).

El homomorfismo Z[u0 , v0 , s1 , . . . , sn , t1 , . . . , tm ] k dado por


u0 7 a0 , v0 7 b0 , si 7 i , ti 7 i
transforma los ui y los vi en los coeficientes de f y g, luego transforma R(F, G)
en R(f, g), lo que nos da la relaci
on
n
Q
nQ
R(f, g) = am
(i j ) = am
g(i ).
0 b0
0
i,j

i=1

Ahora es inmediato el teorema siguiente:

Teorema 9.8 Sean f y g dos polinomios no constantes con coeficientes en un


cuerpo k que se escindan en k[x]. Entonces R(f, g) = 0 si y s
olo si f y g tienen
una raz en com
un.

334

Captulo 9. Resoluci
on de ecuaciones por radicales

Un caso de particular interes se da cuando g es la derivada de f , pues una


raz com
un entre f y f 0 es una raz m
ultiple de f . Si
f (x) = a0

n
Q

(x i ),

i=1

entonces
f 0 (x) = a0

n Q
P

(x j ).

i=1 j6=i

y, seg
un hemos visto,
R(f, f 0 ) = a2n1
0

n
Q

i=1

f 0 (ai ) = a2n1
0

= (1)n(n1)/2 a2n1
0
0

i<j

i6=j

(i j )

(i j )2

Notemos que el coeficiente director de f es na0 , luego la definici


on de resultante muestra que R(f, f 0 )/a0 depende polin
omicamente con coeficientes
enteros de los coeficientes de f (porque podemos sacar a0 de la primera columna del determinante).
Definici
on 9.9 Si f (x) es un polinomio de grado n con coeficientes en un
cuerpo k, definimos su discriminante como
Q
(f ) = (1)n(n1)/2 R(f, f 0 )/a0 = a2n2
(i j )2 k,
0
i<j

donde 1 , . . . , n son las races de f (x) en un cuerpo de escisi


on de k (repetidas
seg
un su multiplicidad).
Hemos probado que (f ) depende polin
omicamente con coeficientes enteros de los coeficientes de f . El teorema siguiente es inmediato:
Teorema 9.10 Un polinomio f (x) con coeficientes en un cuerpo tiene una raz
m
ultiple (en una extensi
on algebraica) si y s
olo si su discriminante es cero.
Ejemplo Si f (x) = ax2 + bx + c, entonces su discriminante es

a
b c

1
(f ) = 2a b 0 = b2 4ac.
a
0 2a b
Ejemplo C
alculos rutinarios muestran que el discriminante de un polinomio
c
ubico
f (x) = ax3 + bx2 + cx + d
es
(f ) = b2 c2 4ac3 4b3 d 27a2 d2 + 18abcd.

9.3. El grupo de Galois de un polinomio

9.3

335

El grupo de Galois de un polinomio

Vamos a introducir algunos resultados que nos proporcionar


an ejemplos para
ilustrar el contenido de las secciones siguientes. El concepto b
asico es el siguiente:
Definici
on 9.11 Sea k un cuerpo y f (x) k[x]. Se llama grupo de Galois de
f (x) al grupo G(K/k), donde K es cualquier cuerpo de escisi
on de f (x) sobre k.
Sabemos que dos cuerpos de escisi
on de un mismo polinomio son k-isomorfos,
luego el grupo de Galois de un polinomio est
a definido salvo isomorfismo.
Si f (x) es irreducible de grado n y tiene n races distintas en K (esto sucede
en particular si k es perfecto), llamando A = {1 , . . . , n } al conjunto de todas
ellas tenemos un monomorfismo de grupos G(K/k) A
= n dado por
la restricci
on a A. Por lo tanto, el grupo de Galois de f (x) se identifica con
un subgrupo del grupo de permutaciones de sus races. En particular su orden
divide a n!
Por otra parte, como K tiene que contener a los cuerpos k(i ), el orden del
grupo de Galois tiene que ser m
ultiplo de n.
Es evidente que si f (x) tiene grado 2 su grupo de Galois es 2 , es decir, C2 .
Observemos ahora que si es el discriminante
de f , por la relaci
on entre

el discriminante y las races, se cumple que K. M


as concretamente, se
cumple que

Q
= an1
(i j ),
0
i<j

donde la ordenaci
on de las races determina si estamos considerando una de
las dos races cuadradas de o bien su opuesta. Tambien es claro que si un
automorfismo
o
n de dos races, entonces

G(K/k) se restringe a una


trasposici
( ) = , por lo que, en general, ( ) = sig .
Teniendo esto en cuenta es inmediato el teorema siguiente:
Teorema 9.12 Sea f (x) k[x] un polinomio irreducible de grado n con races
simples en su cuerpo de escisi
on K. Supongamos que la caracterstica
de k

no es 2. Entonces, si es el discriminante de f, se cumple que k( ) es el


cuerpo fijado por G(K/k) An . En particular k si y s
olo si G(K/k)
consta u
nicamente de permutaciones pares de las races de f .
En particular:
Teorema 9.13 Sea k un cuerpo de caracterstica distinta de 2 o 3, consideremos un polinomio irreducible f (x) k[x] de discriminante y sea K un cuerpo
de escisi
on de f sobre k. Entonces:
1. Si es un cuadrado en k entonces |K : k| = 3 (luego G(K/k)
= C3 ).
2. Si no es un cuadrado en k entonces |K : k| = 6 y G(K/k)
= 3 .

336

Captulo 9. Resoluci
on de ecuaciones por radicales

n: Es consecuencia inmediata del teorema anterior, teniendo


Demostracio
en cuenta que |K : k| es necesariamente m
ultiplo de 3, pues si es una raz de
f se cumple que |k() : k| = 3 y es un subgrupo de 3 .
Ejemplo Los polinomios x3 3x + 1 y x3 4x + 2 en Q[x] parecen similares,
pero sus discriminantes son, respectivamente, 81 y 148 (y ambos son irreducibles
porque no tienen races enteras). Como el discriminante del primero es un
cuadrado en Q y el del segundo no, sus grupos de Galois son distintos: el del
primero es C3 y el del segundo 3 .
Observaci
on Si k es un cuerpo ordenado, y R es una clausura real de k, entonces podemos interpretar tambien el signo del discriminante de un polinomio
de grado 3. Sabemos que al menos una de sus races tiene que ser real (y las
otras dos pueden ser reales o bien un par de races complejas conjugadas). Si
tiene tres races reales distintas , , , entonces
(f ) = a4 ( )2 ( )2 ( )2 > 0.
Si f (x) tiene una raz real dos races complejas conjugadas + i, i,
entonces
(f ) = a4 ( i)2 ( + i)2 (2i)2 = a4 | + i|2 4 2 < 0.
Por u
ltimo, si f (x) tiene dos races iguales (necesariamente reales, al igual que la
tercera), entonces (f ) = 0. Por lo tanto, el signo del discriminante determina
el car
acter real o imaginario de las races de f .
Consideremos el caso de un polinomio de grado 4:
f (x) = x4 + ax3 + bx2 + cx + d k[x].
Supongamos que es irreducible y tiene cuatro races distintas 1 , 2 , 3 , 4 . Sea
K = k(1 , 2 , 3 , 4 ) el cuerpo de escisi
on y llamemos
1 = 1 2 + 3 4 ,

2 = 1 3 + 2 4 ,

3 = 1 4 + 2 3 .

Notemos que se trata de tres elementos distintos de K. M


as precisamente:
1 2
1 3
2 3

= (1 4 )(2 3 ),
= (1 3 )(2 4 ),
= (1 2 )(3 4 ).

(9.1)

As, si identificamos a G = G(K/k) con un subgrupo de 4 a traves de su


acci
on sobre las races de f , tenemos que el cuerpo L = k(1 , 2 , 3 ) queda fijo
por G V , donde V = {1, (12)(34), (13)(24), (14)(23)}.

M
as a
un, se comprueba que L es el cuerpo fijado por G V . Por ejemplo,
si = (12) G, entonces (2 ) = 3 6= 2 , y lo mismo vale para cualquier
otra trasposici
on, si = (123) G, entonces (1 ) = 3 6= 1 , y lo mismo
vale para cualquier otro ciclo de longitud 3, y si = (1234) G, entonces
(1 ) = 3 6= 1 , y lo mismo vale para cualquier otro ciclo de longitud 4.

9.3. El grupo de Galois de un polinomio

337

Como V E 4 , tambien V G E G y por lo tanto L/k es una extensi


on de
Galois tal que G(L/k)
= G/(G V ).
Es pura rutina comprobar que
(x 1 )(x 2 )(x 3 ) = x3 bx2 + (ac 4d)x a2 d + 4bd c2 .

(9.2)

Por ejemplo, por 9.4, el coeficiente de x es A = 1 2 + 1 3 + 2 3 y a su


vez, por la definici
on de los i , esto es la suma de todos los productos i2 j k ,
donde los tres ndices son distintos entre s. Por otra parte, a es la suma de
los cuatro i y c es la suma de los i j k , donde los ndices no se repiten
en cada termino. Al multiplicar ac obtenemos todos los productos i2 j k m
as
cuatro veces 1 2 3 4 = d, por lo que A = ac 4d, como haba que probar.
Igualmente se comprueban los otros dos coeficientes.
El polinomio (9.2) se llama resolvente c
ubica de f (x).
De (9.1) se sigue inmediatamente que un polinomio y su resolvente c
ubica
tienen el mismo discriminante (incluso si este es 0).
Teorema 9.14 Sea f (x) k[x] un polinomio irreducible con races simples en
un cuerpo de escisi
on K, sea G = G(K/k) y sea k L K el cuerpo de
escisi
on de la resolvente c
ubica de f (x). Sea m = |L : k|.
1. Si m = 6 entonces G
= 4 .

2. Si m = 3 entonces G
= A4 .
3. Si m = 1 entonces G
=V.
4. Si m = 2 entonces G
olo
= D8 o bien G
= C4 . El primer caso se da si y s
si f (x) es irreducible en L[x].
n: Sabemos que G tiene que ser un subgrupo de 4 de orden
Demostracio
m
ultiplo de 4, luego su orden puede ser 4, 8, 12 o 24. Si el orden es 24 es obvio
que G = 4 , si el orden es 12, entonces G = A4 , pues este es el u
nico subgrupo
de orden 12 de 4 , si el orden es 8 entonces G es un 2-Sylow de 4 , luego es
isomorfo a D8 y si el orden es 4 entonces puede ser V o un C4 generado por un
ciclo de longitud 4.
Como no hay m
as posibilidades, basta probar la implicaci
on de cada caso
del enunciado. Sabemos que m = |G : G V |, luego si G es 4 , A4 , D8 o V ,
entonces V G y claramente |G : V | es el indicado en el enunciado. Si G = C4
entonces |G V | = 2, luego tambien m = 2, de acuerdo con el apartado 4).
S
olo falta distinguir los dos subcasos de 4). Si G
= D4 , entonces V4 G,
y para cada par de races i , j de f existe V tal que (i ) = j , luego
i y j son L-conjugadas, luego f (x) = pol mn(i , L) es irreducible en L[x].
Por el contrario, si G
olo una trasposici
on como
= C4 , entonces G V tiene s
elemento no trivial, y no todas las races de f (x) son L-conjugadas, luego f (x)
no es irreducible en L[x].

338

Captulo 9. Resoluci
on de ecuaciones por radicales

Ejemplo Vamos a calcular el grupo de Galois sobre Q del polinomio


x4 x3 5x2 + 1.
Para ello calculamos su resolvente c
ubica, que resulta ser x3 + 5x2 4x 21.
Su discriminante es = 6 809 = 11 619, que no es un cuadrado en Z, luego
tampoco en Q. El teorema 9.13 nos da que el cuerpo de escisi
on de la resolvente
c
ubica tiene grado m = 6, luego por el teorema anterior G
= 4 .
En particular, una raz de este polinomio cumple que |Q() : Q| = 4, pero
no es constructible con regla y comp
as (como ya advertamos que poda suceder
tras [G 6.7]), porque seg
un [G 6.8] el cuerpo C de los n
umeros constructibles es
una extensi
on normal de Q, luego si fuera constructible, todos sus conjugados
lo seran tambien, y el cuerpo de escisi
on K del polinomio estara contenido en
C, lo que contradice a [G 6.10] ya que |K : Q| = 24, que no es potencia de 2.
Teorema 9.15 Sea k un cuerpo de caracterstica 0, sean d, e, f k tales que d
no sea unqcuadrado en k, pero que d(e2 f 2 d) s que lo sea. Entonces el cuerpo


K = k
e + f d es una extensi
on cclica de k de grado 4, y el polinomio
q

mnimo de e + f d es
p(x) = x4 2ex2 + (e2 f 2 d).

n: Claramente, e2 f 2
Demostracio
d no puede ser un cuadrado en k,o d
tambien lo sera. Veamos ahora que e + f d no es un cuadrado en k0 = k( d).
En efecto, si

e + f d = (r + s d)2 = r2 + s2 d + 2rs d,
entonces r2 + s2 d = e, f = 2rs, pero entonces
e2 f 2 d = (r2 + s2 d)2 4r2 s2 d = (r2 s2 d)2 ,
contradicci
on. Por lo tanto tenemos una cadena de extensiones cuadr
aticas:
q

k k( d) k0
e+f d =k
e+f d .

La u
ltima igualdad
se debe a que K contiene a e + f d luego tambi
en a d,
q
q

luego a k0
e + f d y, por otra parte, es claro que p(x) tiene a e + f d
por raz, luego K/k tiene grado 4 y p(x) es el polinomio mnimo del elemento
primitivo. Sus races son
q
q
q
q

1 = e + f d, 2 = e + f d, 3 = e f d, 4 = e f d.

Por lo tanto, una raz de la resolvente c


ubica es 1 = 1 2 + 3 4 = 2f d
/ k,
lo cual descarta el caso 3) del teorema 9.14, y nos permite concluir que K/k es
una extensi
on cclica.

9.3. El grupo de Galois de un polinomio

339

Ejemplo Tomando d = e = 2, f = 1 en el teorema anterior, concluimos que


el polinomio x4 4x2p
+ 2 es irreducible en Q[x] y que su grupo de Galois es C4 .

Una de sus races es 2 + 2.


Veamos ahora un ejemplo de grado 5, para lo cual probamos en general:

Teorema 9.16 Si f (x) Q[x] es un polinomio irreducible de grado primo p


con exactamente dos races imaginarias, entonces su grupo de Galois es p .
n: Sea K el cuerpo de escisi
Demostracio
on de f (x) sobre Q. Entonces
G = G(K/Q) se identifica de forma usual con un subgrupo de p y tiene orden
m
ultiplo de p (porque f es irreducible, luego al adjuntar a Q una raz obtenemos
una extensi
on de grado p), luego contiene un elemento de orden p. Pero los
elementos de orden p en p son los ciclos de longitud p. Por lo tanto, G contiene
uno de estos ciclos.
Por otra parte, la conjugaci
on compleja se restringe a un elemento de G
que deja invariantes a todas las races reales y permuta a las dos imaginarias,
luego es una trasposici
on. Ahora basta aplicar el teorema 6.23, que nos da que
G = p .
El teorema 12.8 permite construir polinomios con grupo de Galois n , para
cualquier natural n 2.
Ejemplo El polinomio x5 4x + 2 es irreducible en Q[x] por el criterio de
Eisenstein. Vemos en la gr
afica que tiene tres
races reales. Esto puede justificarse conside10
rando su derivada,
5x4 4, cuyas races son
p
5
, con = 4 4/5, y es f
acil ver que es positiva en ], [ y en ], +[, por lo que el
!1
1
2
polinomio crece en dichos intervalos y decrece !2
!5
en ], [. Esto implica que s
olo puede tener
una raz en cada intervalo, tres en total. La
existencia de races se sigue del teorema de los valores intermedios. Por consiguiente, hay dos races complejas, y el teorema anterior implica que su grupo
de Galois es 5 .
Ejemplo Vamos a probar que el grupo de Galois del polinomio
x8 72x6 + 180x4 144x2 + 36 Q[x]
es isomorfo a Q8 .
En lugar de partir de dicho polinomio, vamos a construir una extensi
on
de Q con grupo de Galois isomorfo a Q8 y veremos que el polinomio anterior

es el polinomio mnimo de un elemento primitivo. Partimos de k1 = Q 2 ,


k2 = Q 3 , k3 = Q 6 , de modo que las tres extensiones cuadr
aticas de Q

est
an contenidas en k0 = Q[ 2, 3]. Definimos

= (2 + 2)(2 + 3)(3 + 6) = 18 + 12 2 + 10 3 + 7 6.

340

Captulo 9. Resoluci
on de ecuaciones por radicales

Ahora observamos que

(18 + 122) + (10 + 72)3 = e1 + f1 d1 ,


=
(18 + 103) + (12 + 73)2 = e2 + f2 d2 ,

(18 + 7 6) + (12 + 5 6) 2 = e3 + f3 d3 .

Observemos que los tres grupos de n


umeros ei , fi ,
di cumplen
o
tesis del
las hip
teorema 9.15 sobre el cuerpo ki . En primer lugar, 3
/ k1 , 2
/ k2 , 2
/ k3 .
Esto puede comprobarse directamente,1 viendo que, por ejemplo, (a+b 2)2 = 2
es imposible en k1 . En segundo lugar comprobamos que di (e2i fi2 di ) s que es
un cuadrado en ki :

3((18 + 12 2)2 (10 + 7 2)2 3) = (3(2 + 2)2 ),

2((18 + 10 3)2 (12 + 7 3)2 2) = (2(3 + 2 3)2 ),

2((18 + 7 6)2 (12 + 5 6)2 2) = (2(3 + 6)2 ).

Observemos adem
as que ki ( di ) = k0 , independientemente
de i. Por lo

tanto, el teorema 9.15 nos da que K = ki ( ) = k0 ( ) es una extensi


on cclica
de grado
4
de
todos
los
k
,
y
a
su
vez
|K
:
Q|
=
8.
El
polinomio
m
nimo
sobre
i

k10 de es
p(x) = x4 2e1 x2 + (e21 3f12 )

Como no est
a en Q[x], el polinomio mnimo de en Q[x] tiene que ser
un m
ultiplo de este de
mayor grado, luego tiene que ser de grado 8 y por
consiguiente K = Q( ). Para calcular dicho
polinomio basta encontrar un

polinomio m
onico de grado 8 que tenga
a

por

ra
z. Para
ello consideramos
el automorfismo de G(k0 /Q) dado por 2 7 2, 3 7 3. Representaremos
por
la imagen de cada k0 por dicho automorfismo. Claramente entonces
p(x) = x4 2
e2 x2 + (
e21 3f12 )

donde
es el polinomio mnimo sobre k1 de ,

= (2 2)(2 + 3)(3 6).

Un c
alculo muestra que = 6(2 + 3)2 , luego

p
(2 + 3) 6

=
K

Como la extensi
on K/k1 es de Galois y p(x) k1 [x] tiene una raz en K, tiene
de hecho todas sus races en K, luego el polinomio
q(x) = p(x)
p(x) = (x4 2e1 x2 + (e21 3f12 ))(x4 2
e1 x2 + (
e21 3f12 ))

= x8 72x6 + 180x4 144x2 + 36

tiene todas
sus races en K. Como una de ellas es y tiene grado 8, es
pol mn( , Q), lo que prueba que K es su cuerpo de escisi
on sobre Q. S
olo
falta probar que G = G(K/Q)
= Q8 .
1 M
as adelante podremos decir que esto es inmediato, ya que los tres cuerpos son distintos
por tener discriminantes distintos.

9.4. Ecuaciones c
ubicas

341

Para ello usamos el teorema 6.40, seg


un el cual G tiene que ser isomorfo a
uno de los grupos
C8 ,

C4 C2 ,

C2 C2 C2

D8

Q8 .

La clave es que los tres subcuerpos ki se corresponden con tres subgrupos cclicos
de G de orden 4 (son cclicos porque las extensiones K/ki son cclicas). Esto
descarta a C8 , que s
olo tiene un subgrupo de orden 4, a C4 C2 , que s
olo tiene
dos subgrupos cclicos de orden 4, a C2 C2 C2 , que no tiene ninguno, y a
D8 , que s
olo tiene uno.

9.4

Ecuaciones c
ubicas

Presentamos ahora la f
ormula general para la resoluci
on de una ecuaci
on
c
ubica:
Teorema 9.17 (F
ormula de Cardano) Sea K un cuerpo de caracterstica
distinta de 2 o 3 y sean a, b, c K. Entonces, las races de la ecuaci
on
x3 + ax2 + bx + c = 0

(9.3)

en una clausura algebraica de K vienen dadas por


q
q

3
3
x = q/2 + D + q/2 D a/3,
donde

p=

3b a2
,
3

q=

2a3 9ab + 27c


,
27

D=

q 2
2

p 3
3

la raz cuadrada de D se escoge arbitrariamente y, fijada esta, las races c


ubicas
u y v se escogen de modo que p = 3uv (es decir, se escoge una arbitrariamente
y la otra se calcula mediante esta relaci
on).
Notemos ante todo que la relaci
on entre las races c
ubicas es correcta, es
decir, que si
q

3
u = q/2 + D
es una raz c
ubica arbitraria del radicando y definimos v mediante p = 3uv,
entonces
q

3
v = q/2 D.

En efecto, elevando al cubo vemos que p3 = 27(q/2 + D)v 3 , luego

(p/3)3 (q/2 D)
v3 =
= q/2 D,
2
(q/2) D
como queramos probar.

342

Captulo 9. Resoluci
on de ecuaciones por radicales

n: En primer lugar realizamos a la ecuaci


Demostracio
on el cambio de
variable
a
x=t ,
(9.4)
3
es decir, consideramos el polinomio f (ta/3), que resulta ser la llamada forma
incompleta de la ecuaci
on c
ubica:
t3 + pt + q = 0,

(9.5)

donde p y q son los valores indicados en el enunciado.


No es casual que haya desaparecido el termino de grado 2. Pensemos que
a es la suma de las tres races de f (x), luego a/3 es su media. Las races de
f (t a/3) los las que resultan de sumar a/3 a las de f (x), y es claro que si a
tres n
umeros les restamos su media, los tres n
umeros resultantes tienen media
(luego suma) 0. Por lo tanto, el resultado del cambio de variable tena que tener
nulo el coeficiente de t2 .
Observemos tambien que, como las races de (9.5) se obtienen sumando un
mismo n
umero a las de (9.3), la f
ormula que da el discriminante en terminos
de las races proporciona el mismo resultado para ambos, y aplicando a (9.5) la
f
ormula que hemos dado al final de la secci
on anterior, el discriminante resulta
ser
D
= 4p3 27q 2 = 2 3 .
2 3
As pues, a efectos pr
acticos D contiene la misma informaci
on que el determinante. En particular sabemos D 6= 0 si y s
olo si las tres races son distintas.
Ahora basta probar que las races de (9.5) son las dadas por la f
ormula del
enunciado sin el termino a/3 final, pues entonces la relaci
on (9.4) nos da que
las races de (9.3) se obtienen a
nadiendo dicho termino. Vamos a deducir la
f
ormula de Cardano bajo la hip
otesis adicional p 6= 0, y luego veremos que es
v
alida incluso si p = 0. Partimos del desarrollo
(u + v)3 = u3 + v 3 + 3u2 v + 3uv 2 = u3 + v 3 + 3uv(u + v),
que nos da la identidad
(u + v)3 3uv(u + v) u3 v 3 = 0.

(9.6)

Por lo tanto, si encontramos valores de u, v tales que


p = 3uv,

q = u3 v 3 ,

(9.7)

tendremos que una soluci


on de (9.5) ser
a t = u + v. Podemos expresar (9.7)
en terminos de u despejando v = p/3u. (Notemos que ha de ser u 6= 0, ya
que suponemos p 6= 0.) Concluimos que una condici
on suficiente para que t sea
soluci
on de (9.5) es que sea de la forma
t=u

p
3u

(9.8)

9.4. Ecuaciones c
ubicas

343

para un u que cumpla la ecuaci


on
u3 + q (p/3u)3 = 0

(9.9)

o, equivalentemente (multiplicando por u3 ):


u6 + qu3 (p/3)3 = 0.

(9.10)

Veamos ahora que la condici


on es necesaria, es decir, que toda raz t de (9.5)
es de la forma (9.8), para un cierto u que cumple (9.10). En primer lugar, dado
cualquier valor de t, siempre existe un valor de u 6= 0 que cumple (9.8). Basta
tomar una raz de la ecuaci
on
u2 tu p/3 = 0.

(9.11)

Llamando v = p/3u, tenemos que t = u + v, p = 3uv. Si t cumple (9.5),


entonces
(u + v)3 3uv(u + v) + q = 0
y, comparando con la identidad (9.6), vemos que se cumple (9.7), lo cual implica
que u cumple (9.9) y, por consiguiente, (9.10).
As pues, concluimos que resolver (9.5) es equivalente a resolver (9.10), en
el sentido de que las soluciones de (9.5) son las que se obtienen a partir de las
de (9.10) a traves de (9.8). Ahora bien, las ecuaci
on (9.10) es cuadr
atica en u3 ,
luego sus soluciones son
p
q q 2 + 4(p/3)3
q p
3
u =
= (q/2)2 + (p/3)3
2
2
o, m
as sencillamente:

u3 = q/2

D.

(9.12)

Combinando las dos races cuadradas de D con las tres races c


ubicas, nos
salen las seis races de (9.10), pero (9.5) s
olo puede tener tres races. Ello se
debe a que, para cada valor de t, hay dos valores de u que cumplen (9.8). Dado
uno de ellos, el otro est
a determinado por la relaci
on
uu0 = p/3,

(9.13)

que se deduce de que u y u0 son las dos races de (9.11).


Fijemos un u+ que cumpla (9.12) con signo positivo y una raz cuadrada
prefijada, y sea u una raz de (9.12) con signo negativo (y la misma raz
cuadrada). Entonces,
(u+ u )3 = (q/2)2 (q/2)2 (p/3)3 = (p/3)3 ,
luego u+ u = (p/3), donde es una cierta raz c
ubica de la unidad. Por consiguiente, u+ ( 2 u ) = (p/3). Cambiando u por 2 u (que tambien cumple
(9.12) con el signo negativo), concluimos que, para cada u+ elegido arbitrariamente, existe un u elegido adecuadamente tal que u+ y u determinan la

344

Captulo 9. Resoluci
on de ecuaciones por radicales

misma raz t de (9.5). En definitiva, vemos que las soluciones de (9.5) son de la
forma (9.8), con
q

3
u = q/2 + D,

donde en esta expresi


on hay que entender que la raz cuadrada de D es fija
(elegida arbitrariamente de entre las dos posibilidades) y que al variar la elecci
on
de la raz c
ubica recorremos las distintas races de (9.5). Finalmente observamos
que, de la segunda ecuaci
on de (9.7), se sigue que

v 3 = q/2 D,
luego podemos escribir
v=

3
q/2 D,

si bien es crucial tener presente que las elecciones de las races c


ubicas u y v no
pueden hacerse de forma independiente, lo cual nos dara 9 races para (9.5),
sino que u y v han de cumplir la relaci
on p = 3uv.
Con esto hemos probado la f
ormula de Cardano bajo elsupuesto de que
p 6= 0. Ahora bien, en caso contrario D = (q/2)2 , luego D = q/2. Al
sustituir cualquiera de las dos elecciones del signo en los radicandos de las
races
c
ubicas obtenemos que una de las dos se anula y la otra se reduce a 3 q y,
ciertamente, las tres elecciones de la raz c
ubica nos dan las tres races de (9.5)
en este caso. Adem
as, la relaci
on p = 3uv se cumple trivialmente.
Sabemos que si D = 0 el polinomio tiene una raz doble (o triple). En tal
caso hay f
ormulas m
as sencillas para calcularlas:
Teorema 9.18 Si D = 0 hay dos posibilidades:
1. Si p = q = 0, entonces la ecuaci
on tiene una raz triple x = a/3.
2. Si pq 6= 0, entonces la ecuaci
on tiene una raz doble y una raz simple,
dadas respectivamente por
x=

3q
a
,
2p 3

x=

4p2
a
.
9q
3

En particular, las tres races est


an en el mismo cuerpo que los coeficientes de la
ecuaci
on.
n: Si p = q = 0 la f
Demostracio
ormula de Cardano nos da inmediatamente 1). En caso contrario, la condici
on D = 0 equivale a 27q 2 = 4p3 , y
usando esto se comprueba sin dificultad que t = 3q/2p es raz tanto de (9.5)
como de su derivada 3t2 + p = 0, por lo que es una raz doble, y al sumarle a/3
tenemos una raz doble de (9.3).
Para calcular la raz simple usamos que el producto de las tres races de (9.5)
tiene que ser q, lo que nos da que la tercera raz es t = 4p2 /9q.

9.4. Ecuaciones c
ubicas

345

Supongamos ahora que k es un cuerpo ordenado y fijemos una clausura


real R. Entonces cabe distinguir dos casos seg
un el signo de D (que es el signo
opuesto al del discriminante del polinomio). Sabemos que si D > 0 entonces
f (x) tiene una raz real y dos races imaginarias conjugadas, mientras que si
D < 0 las tres races son reales. Veamos c
omo queda la f
ormula de Cardano en
el primer caso:
Teorema 9.19 Si D > 0, una raz real viene dada por
q
q

3
3
x = q/2 + D + q/2 D a/3,

donde las races c


ubicas u y v son reales. Las otras dos races son imaginarias,
y vienen dadas por

u+v a
3
x=

(u v) i.
2
3
2
n: El radicando de u es un n
Demostracio
umero real, por lo que la u
nica
raz c
ubica real es una elecci
on posible para u. La relaci
on p = 3uv, implica
que la raz c
ubica v correspondiente es tambien la raz c
ubica real, luego t = u+v
es una raz real. Las otras elecciones para u son u y 2 u, donde

1
3
= +
i,
2
2
es una raz c
ubica de la unidad, y el valor de v correspondiente es, respectivamente, 2 v y v. Por lo tanto, una raz imaginaria de (9.5) es

u+v
3
2
t = u + v =
+
(u v) i
2
2
(y la otra ha de ser su conjugada), de donde se sigue inmediatamente la expresi
on
dada para las races de (9.3) en este caso.
Ejemplo Vamos a resolver la ecuaci
on
x3 + 3x2 + 6x + 2 = 0.
El cambio de variable x = t 1 la transforma en
t3 + 3t 2 = 0.
Vemos entonces que D = 2 > 0, luego la raz real es
q
q

3
3
x = 1 + 2 + 1 2 1.

Las races imaginarias son


p
p

q
q
3
3


1+ 2+ 1 2
3 3
3
x=

1 + 2 1 2 i.
2
2

346

Captulo 9. Resoluci
on de ecuaciones por radicales

Nota Observemos que si en el ejemplo anterior tomamos a Q como cuerpo de


coeficientes de la ecuaci
on y llamamos a la raz real, no es cierto que se
obtenga a partir de una raz c
ubica de un elemento de Q (o devarios), sino que
para obtener necesitamos extraer adem
as la raz cuadrada 2.
Ejemplo El problema siguiente fue planteado en el siglo XIII por el matem
atico chino Qin Jinshao:
Una ciudad est
a rodeada por una muralla circular con dos puertas,
una al norte y otra al sur. Saliendo por la puerta norte y caminando
3 li hacia el norte se llega hasta un
arbol. Saliendo por la puerta sur,
hay que caminar 9 li hacia el este para ver el mismo
arbol. Calcular
el di
ametro de la ciudad.

6r + 9

r
r

Los dos tri


angulos que muestra la figura son semejantes, de modo que se ha de cumplir
p
3(2r + 3)
2r + 3
=
.
9
r
Elevando al cuadrado, simplificando un factor 2r+3
y operando llegamos a la ecuaci
on

r
9

3
243
r3 + r2
= 0.
2
2

3
485
El cambio r = t 1/2 la reduce a t3 t
= 0. Como D = 29403/8 > 0,
4
4
s
olo tiene una raz real, que viene dada por
r
r
198
198
3 485
3 485
t=
+
6+

6
8
8
8
8
q

1 3
3
=
485 + 198 6 + 485 198 6 = 5.
2
Concluimos que r = 4.5 y que el di
ametro de la ciudad es de 9 li.
Veamos ahora la situaci
on cuando el discriminante es positivo:
Teorema 9.20 Si D < 0 la ecuaci
on tiene tres races reales simples, que vienen
dadas por
r
p
+ 2k a
x = 2 cos
,
3
3
3
donde k = 0, 1, 2 y el
angulo 0 < < est
a determinado por
q/2
cos = p
.
(p/3)3

(9.14)

9.5. Ecuaciones cu
articas

347

n: Para aplicar la f
Demostracio
ormula de Cardano podemos elegir
p
p

D = |D| i = (q/2)2 (p/3)3 i,

es decir, nos quedamos


con la raz cuadrada con parte imaginaria positiva. El
m
odulo de q/2 + D es
p
p
= (q/2)2 (q/2)2 (p/3)3 = (p/3)3 ,
y su argumento es el angulo 0 < < que cumple (9.14). Por consiguiente, los
valores posibles de u son los dados por
r

p
+ 2k
+ 2k
u=
cos
+ i sen
.
3
3
3
La ecuaci
on p = 3uv nos da que
r

p
+ 2k
+ 2k
v=
cos
i sen
,
3
3
3
y al calcular x = u + v a/3 obtenemos la expresi
on anunciada. En particular
vemos que las races son reales.
Ejemplo La f
ormula cos 3 = 4 cos3 3 cos nos da que cos 20 satisface la
ecuaci
on
3
1
x3 x = 0.
4
8
Uno podra pensar que resolviendola con la f
ormula de Cardano obtendremos
una expresi
on algebraica para cos 20 , pero no es as. Al aplicar el teorema
anterior obtenemos que = 60 , y que las soluciones de la ecuaci
on son cos 20 ,

cos 140 y cos 260 . M


as precisamente, la f
ormula de Cardano expresa las soluciones de una ecuaci
on con D > 0 en terminos de races c
ubicas de n
umeros
complejos, que implican trisecar angulos, y para calcularlas tenemos que usar
las funciones trigonometricas, luego al final la soluci
on queda irremediablemente
en terminos de un coseno.

9.5

Ecuaciones cu
articas

Tambien es posible expresar en terminos de radicales las races de una


ecuaci
on de cuarto grado:
Teorema 9.21 (F
ormula de Ferrari) Sea K un cuerpo de caracterstica distinta de 2 o 3 y sean a, b, c, d K. Entonces, las races de la ecuaci
on
x4 + ax3 + bx2 + cx + d = 0.

(9.15)

348

Captulo 9. Resoluci
on de ecuaciones por radicales

en una clausura algebraica de K vienen dadas por


p
p
Q Q2 4(P R) a
Q Q2 4(P + R) a
x=
,
x=
,
2
4
2
4
donde, llamando
p=

8b 3a2
,
8

q=

8c 4ab + a3
,
8

r=

256d 64ac + 16a2 b 3a4


, (9.16)
256

P es una raz de la ecuaci


on
p
4pr q 2
P 3 P 2 rP +
= 0,
2
8

(9.17)

y Q, R se determinan mediante las ecuaciones


p = 2P Q2 ,

q = 2QR,

r = P 2 R2 .

(9.18)

En la prueba veremos, m
as concretamente, que, si q 6= 0, la primera ecuaci
on
de (9.18) es redundante, de modo que, a partir de una soluci
on P de (9.17), la
tercera ecuaci
on de (9.18) nos da un valor para R, necesariamente no nulo, y
la segunda ecuaci
on nos da un valor para Q que necesariamente cumplir
a la
primera ecuaci
on. Si q = 0 el sistema (9.18) tiene tambien una soluci
on f
acil
de calcular, pero enseguida veremos que en este caso hay un procedimiento m
as
r
apido para encontrar las races de la ecuaci
on. En efecto, el cambio de variable
x=t

a
4

nos lleva a la ecuaci


on incompleta
t4 + pt2 + qt + r = 0,

(9.19)

donde p, q, r son los dados por (9.16). As, si q = 0, tenemos lo que se conoce
como una ecuaci
on bicuadrada, cuyas races cumplen:
p
p p2 r
2
t =
,
2
luego las cuatro races de (9.15) son
s
p
p p2 r a
x=
.
2
4
Es f
acil ver que si a (9.17) le hacemos el cambio de variable P = x/2 y
dividimos entre el coeficiente director obtenemos la resolvente c
ubica de (9.19).
n: Ya hemos visto que basta resolver (9.19). Para ello obserDemostracio
vamos que
(t2 + P )2 (Qt + R)2 = t4 + (2P Q2 )t2 2QRt + P 2 R2 .

9.5. Ecuaciones cu
articas

349

Por lo tanto, si encontramos valores P , Q, R que cumplan (9.18), las soluciones


de (9.19) ser
an las mismas que las de la ecuaci
on
(t2 + P )2 = (Qt + R)2 .

Esta
puede descomponerse en dos ecuaciones cuadr
aticas:
t2 + P = (Qt + R).
Equivalentemente,
t2 Qt + P R = 0,

t2 + Qt + P + R = 0,

(9.20)

y las races de estas ecuaciones son las indicadas en el enunciado.


As pues, s
olo hemos de encontrar una soluci
on de (9.18). Para ello despejamos
q
q2
q2
Q = , Q2 =
=
,
2R
4R2
4(P 2 r)
con lo que la primera ecuaci
on se convierte en
p = 2P

q2
4(P 2 r)

o, equivalentemente, en la c
ubica
4(P 2 r)(2P p) = q 2

(9.21)

que se simplifica hasta (9.17).


De este modo, podemos tomar una raz cualquiera P de (9.17), luego una
raz cualquiera R de r = P 2 R2 y, por u
ltimo, si R 6= 0, hacemos Q = q/2R.
As, las dos u
ltimas ecuaciones de (9.18) se cumplen por las elecciones de Q y
R, mientras que la primera se cumple porque es equivalente a (9.17).
Si nos encontramos con R = 0 es porque P 2 r = 0 y, a la vista de (9.21),
para que esto pueda suceder ha de ser q = 0. M
asa
un, en tal caso, esta misma
ecuaci
on muestra que las races de (9.17) son P = r o bien P = p/2 y, tomando
R = 0 en el primer caso o Q = 0 en el segundo, encontramos igualmente una
soluci
on de (9.18).
En cualquier caso, vemos que cualquier raz P de (9.17) se puede completar
(f
acilmente) hasta una soluci
on (P, Q, R) del sistema (9.18).
Ejemplo (Euler) Vamos a resolver la ecuaci
on
x4 8x3 + 14x2 + 4x 8 = 0.
El cambio de variable x = t + 2 la reduce a
t4 10t2 4t + 8 = 0.

350

Captulo 9. Resoluci
on de ecuaciones por radicales

La c
ubica auxiliar es
P 3 + 5P 2 8P 42 = 0.
Al resolverla se obtiene que una raz es P = 3, y ahora hemos de resolver
8 = 9 R2 .

4 = 2QR,

Tomamos R = 1, Q = 2 y entonces las cuatro races de la ecuaci


on original
son:
p

2 22 4(3 1) 8
x=

= 3 5,
2
4
p

2 22 4(3 + 1) 8
x=

= 1 3.
2
4
Ejercicio: Nicolaus Bernoulli afirm
o que no era cierta la conjetura seg
un la cual todo polinomio (con coeficientes reales) puede descomponerse en producto de polinomios de grados 1
y 2, y present
o como contraejemplo el polinomio
x4 4x3 + 2x2 + 4x + 4.

Sin embargo, Euler demostr


o que dicho polinomio factoriza como

2
x

2+

4+2 7

x+1+

7+

4+2 7

2
x

4+2 7

x+1+

4+2 7

Demostrar esta factorizaci


on (sin hacer uso de ella, es decir, que no vale limitarse a multiplicar
y ver que el resultado es correcto).

Aplicaci
on a las construcciones con regla marcada Supongamos que
K/k es una extensi
on de grado 3 de subcuerpos de R. Entonces K = k(), para
cierto K, que es raz de un polinomio de grado 3 con coeficientes en k. Si el
polinomio cumple D > 0, el teorema 9.19 nos da una expresi
on para , a partir
de la cual podemos formar una cadena de cuerpos
k = K0 K1 K2 K3 R
q
q

con K1 = k( D), K2 = K1 ( 3 q/2 + D), K3 = K2 ( 3 q/2 D). As


K3 y cada cuerpo resulta de adjuntar al anterior una raz cuadrada o
c
ubica.
Si por el contrario D < 0, el teorema 9.20 nos da una cadena
k = K0 K1 K2 R,
p
donde K1 = k( p/3) (y la raz es real porque D < 0 implica p < 0) y
K2 = K1 (cos(/3)), para cierto tal que cos k. De nuevo, K2 .
Si K/k tiene grado 4, entonces seg
un la f
ormula de Ferrari podemos formar
una cadena k = K0 Km R en una de las condiciones anteriores
tal que P Km (siempre podemos tomar como P una raz real de la c
ubica
auxiliar). Si no est
a en Km , entonces es raz de una de las ecuaciones (9.20),

9.5. Ecuaciones cu
articas

351

luego la segunda raz es tambien real,


ser reales, y podemos
luego Q, R tienen que
prolongar Km con Km+1 = Km ( P 2 r) y Km+2 = Km ( ) R, donde
es el discriminante de la ecuaci
on correspondiente de (9.20). Con esto tenemos
probada una parte del teorema siguiente:
Teorema 9.22 Sea K R un cuerpo y R. Las afirmaciones siguientes
son equivalentes:
1. es constructible con regla marcada a partir de puntos con coordenadas
en K.
2. Existe una cadena de cuerpos K = K0 K1 Kn R de modo
que Kn y |Ki+1 : Ki | 4.
3. Existe una cadena de cuerpos K = K0 K1 Kn R de modo que
Kn y Ki+1 = Ki (i ), donde i est
a en uno de los casos siguientes:

(a) i = a, con a Ki , a > 0.

(b) i = 3 a, con a Ki .
(c) i = cos(/3), para cierto tal que cos Ki .

n: 1) 2) es el teorema [G 6.29]. 2) 3) es consecuencia


Demostracio
inmediata de las observaciones precedentes al enunciado. Por u
ltimo, 3) 1)
se deduce del hecho de que las races cuadradas y c
ubicas son constructibles con
regla marcada, as como que todo angulo se puede trisecar con regla marcada.
En particular:
Teorema 9.23 El polgono regular de n lados es constructible con regla marcada si y s
olo si (n) = 2a 3b .
n: El polgono regular de n lados es constructible si y s
Demostracio
olo si
lo es = cos(2/n). Sea = cos(2/n) + i sen(2/n). Entonces Q() Q(), y
la extensi
on ciclot
omica Q()/Q es abeliana de grado (n). Adem
as el cuerpo
Q() = Q() R tiene grado (n)/2 sobre Q. Si es constructible, el teorema
anterior nos da que (n)/2 = 2a 3b , luego (n) = 2a+1 3b .
Recprocamente, si (n) = 2a 3b , entonces, como G(Q()/Q) es abeliano,
posee subgrupos de todos los ordenes que dividen a su orden, luego podemos
formar una cadena de subgrupos
G(Q()/Q) = G0 5 G1 5 5 Gn = 1,
de modo que |Gi : Gi+1 | = 2, 3. Por el teorema de Galois existe una cadena de
cuerpos Q = K0 Kn = Q() tal que |Ki+1 : Ki | = 2, 3, y el teorema
anterior nos da entonces que es constructible con regla marcada.
Teniendo en cuenta las propiedades de la funci
on de Euler, es inmediato que
la caracterizaci
on del teorema anterior equivale a la siguiente:

352

Captulo 9. Resoluci
on de ecuaciones por radicales

Teorema 9.24 El polgono regular de n lados es constructible con regla marcada si y s


olo si n = 2a 3b p1 pr , donde los pi son primos distintos dos a dos
de la forma 2u 3v + 1.
Los primos indicados en el teorema se llaman primos de Pierpont. Como
en el caso de los primos de Fermat o de Mersenne, no se sabe si hay infinitos,
pero, al igual que sucede con los primos de Mersenne y al contrario que con los
primos de Fermat, se conocen muchos ejemplos de primos de Pierpont, incluso
de tama
nos muy grandes. Los primeros primos de Pierpont son:
2, 3, 5, 7, 13, 17, 19, 37, 73, 97, 109, 163, 193, 257, 433, 487, . . .
As pues, el menor polgono regular no constructible con regla marcada es el
endec
agono regular (11 lados).

9.6

Grupos resolubles

En la secci
on siguiente estudiaremos la existencia de f
ormulas similares a las
de Cardano y Ferrari para polinomios de grado superior a 4, y ello requerir
a
un nuevo concepto de la teora de grupos que presentamos a continuaci
on. Tal
vez el lector prefiera pasar directamente a la secci
on siguiente y volver a esta en
cuanto se mencionen los grupos resolubles, para conocer as la motivaci
on que
nos lleva a su estudio.
Definici
on 9.25 Un grupo finito G es resoluble si existe una sucesi
on de subgrupos de G
1 = G0 E G1 E E Gn = G
(9.22)
tal que cada cociente Gi+1 /Gi sea un grupo abeliano.

En general, una sucesi


on de subgrupos (9.22) se llama una serie de G. Los
subgrupos Gi se llaman terminos de la serie y los cocientes Gi+1 /Gi se llaman
factores de la serie. Una serie es abeliana, cclica, etc. si todos sus factores son
grupos abelianos, cclicos, etc. En estos terminos, un grupo es resoluble si tiene
una serie abeliana.
Ejemplos Es inmediato que todo grupo abeliano G es resoluble, pues 1 E G
es ya una serie abeliana de G. Sin embargo hay grupos resolubles que no son
abelianos. Por ejemplo una serie abeliana de 3 viene dada por 1 E A3 E 3 .
Los factores son A3 /1
= C3 y 3 /A3
= C2 .
Una serie abeliana de 4 es 1 E V4 E A4 E S4 . Ahora V4 /1
= C2 C2 ,
A4 /V4
= C3 y 4 /A4
= C2 (tengase en cuenta que un grupo de orden primo ha
de ser cclico).
M
as adelante veremos ejemplos de grupos no resolubles. Informalmente
podemos decir que la mayora de los grupos finitos son resolubles. El menor
grupo no resoluble tiene 60 elementos y es el u
nico grupo no resoluble de orden
menor que 120.
Un grupo G es simple si no tiene subgrupos normales distintos de 1 y G.

9.6. Grupos resolubles

353

Teorema 9.26 Un grupo no trivial es simple y abeliano si y s


olo si es cclico
de orden primo.
n: Sea G 6= 1 un grupo simple y abeliano. Como todos
Demostracio
los subgrupos de un grupo abeliano son normales, esto equivale a que G no
tenga m
as subgrupos que los impropios. Sea g G un elemento distinto de la
identidad. Entonces tiene que ser G = hgi, luego G es cclico. No puede ser
infinito, porque entonces G
= Z y tiene subgrupos propios, luego tiene que ser
un grupo cclico finito de orden n. Pero entonces G tiene subgrupos de todos
los ordenes que dividen a n, luego n tiene que ser primo. El recproco es trivial:
los grupos cclicos de orden primo no tienen subgrupos propios.
La relaci
on entre los grupos simples y los resolubles es la siguiente:
Teorema 9.27 Todo grupo finito admite una serie con factores simples. Un
grupo es resoluble si y s
olo si admite una serie con factores simples abelianos,
es decir, cclicos de orden primo.
n: Sea G un grupo finito, que podemos suponer no trivial y
Demostracio
consideremos en el una serie cualquiera (siempre podemos tomar la serie 1 E G)
o, si es resoluble, partimos de una serie abeliana. Eliminando terminos repetidos
podemos suponer que es estricta, es decir, que los terminos cumplen Gi C Gi+1 .
Si uno de los factores no es simple, eso significa que tiene un subgrupo
normal propio, que ser
a de la forma N/Gi , para cierto N C Gi+1 , con lo que
la serie se puede extender intercalando N as: Gi C N C Gi+1 . Si el factor
era abeliano, entonces el primero de los dos factores nuevos, N/Gi ,es abeliano
por ser subgrupo de Gi+1 /Gi , y el segundo Gi+1 /N
= (Gi+1 /Gi ) (N/Gi ) es
abeliano por ser cociente de un grupo abeliano.
Repitiendo este proceso, tras un n
umero finito de pasos tenemos que llegar a
una serie en la que todos los factores sean simples, y abelianos si la serie original
era abeliana.
As pues, un grupo resoluble admite una serie, no s
olo abeliana, sino cclica.
Notemos tambien que los u
nicos grupos simples resolubles son los abelianos, es
decir, los cclicos de orden primo.
Una de las razones por las que la mayora de los grupos son resolubles es
que la resolubilidad se conserva por la mayora de las operaciones que pueden
realizarse con grupos. El teorema siguiente da cuenta de ello.
Teorema 9.28 Se cumple:
1. Si G es un grupo resoluble y H G, entonces H es resoluble.
2. Si G es un grupo resoluble y N E G, entonces G/N es resoluble.
3. Si G es un grupo y N es un subgrupo normal de G tal que N y G/N son
resolubles, entonces G es resoluble.

354

Captulo 9. Resoluci
on de ecuaciones por radicales

4. Si H y K son subgrupos resolubles de un grupo G y H E G, entonces


HK es resoluble. En particular el producto directo de grupos resolubles es
resoluble.
n: 1) Sea 1 = G0 E G1 E E Gn = G una serie abeliana de
Demostracio
G. Entonces
1 = G0 H E G1 H E E Gn H = H
es una serie abeliana de H, pues, por el segundo teorema de isomorfa,
.
.

(Gi+1 H) (Gi H) = (Gi+1 H) Gi (Gi+1 H)


.

= Gi (Gi+1 H) Gi Gi+1 /Gi ,

y como el u
ltimo grupo es abeliano, el primero tambien lo es. Por lo tanto H
es resoluble.
2) Si 1 = G0 E G1 E E Gn = G es una serie abeliana de G entonces
1 = G0 N/N E G1 N/N E E Gn N/N = G/N
es una serie abeliana de G/N , pues por los teoremas de isomorfa
.
.
.

Gi+1 N/N ) (Gi N/N )


= Gi+1 N Gi N = Gi+1 (Gi N ) Gi N
.

= Gi+1 (Gi+1 Gi N )
.

= (Gi+1 /Gi ) (Gi+1 Gi N )/Gi ,

y el u
ltimo grupo es un cociente del grupo abeliano Gi+1 /Gi . Por lo tanto G/N
es resoluble.
3) Sean
y

1 = No E N1 E E Nn = N
1 = Ho /N E H1 /N E E Hm /N = G/N

series abelianas de N y G/N respectivamente. Entonces una serie abeliana de


G es claramente
1 = N0 E N1 E E Nn = H0 E H1 E E Hm = G.
4) Por el teorema de isomorfa, HK/H
= K/(H K), que es resoluble por
ser cociente de K. Como H tambien es resoluble, por el apartado anterior HK
tambien lo es.
Veamos ahora una importante familia de grupos simples no abelianos:
Teorema 9.29 Si n 5 entonces el grupo alternado An es un grupo simple y
no abeliano. En particular An y n no son resolubles.

9.6. Grupos resolubles

355

n: Dividimos la prueba en varios pasos:


Demostracio
1) An est
a generado por los ciclos de longitud 3.
Consideremos un producto de dos trasposiciones. Ha de ser de la forma
(a, b)(c, d) o bien de la forma (a, b)(a, c).
En el primer caso (a, b)(c, d) = (a, b, c)(c, a, d).
En el segundo (a, b)(a, c) = (a, b, c).
Todo elemento de An se puede expresar como producto de un n
umero par de
trasposiciones, y cada par de trasposiciones se puede sustituir por un producto
de ciclos de longitud 3, luego toda permutaci
on de An se expresa como producto
de ciclos de longitud 3.
2) Si un subgrupo N E An contiene un ciclo de longitud 3, entonces N = An .
En efecto, sea (a, b, c) N . Si es cualquier otro ciclo de longitud 3, por el
teorema 6.21 existe una permutaci
on n tal que (a, b, c) = .
Si An entonces = (a, b, c) N = N .
Si es impar, (a, b, c) = (c, b, a)1 = (c, b, a)(a,c) , y = (c, b, a)(a,c) , donde
ahora la permutaci
on (a, c) es par y, como (c, b, a) = (a, b, c)1 N , concluimos
igualmente que N .
Por lo tanto N contiene a todos los ciclos de longitud 3, que generan An ,
luego N = An .
3) A5 es simple.
Si N E A5 y N 6= 1, un elemento de N ha de ser de la forma (a, b, c),
(a, b, c, d, e) o bien (a, b)(c, d).
Si N contiene un elemento de la forma (a, b, c) ya hemos visto que N = A5 .
Si N contiene un elemento de la forma (a, b, c, d, e), entonces
(a, b, c, d, e)(a, b, c, d, e)(a,b)(d,e) = (a, b, c, d, e)(b, a, c, e, d) = (b, e, c) N,
luego tambien N = A5 .
Si N contiene un elemento de la forma (a, b)(c, d), sea e distinto de a, b, c, d.
Entonces

(a,b,e)
(a, b)(c, d) (a, b)(c, d)
= (a, b)(c, d)(b, e)(c, d) = (a, e, b) N,
luego tambien N = A5 . Por lo tanto A5 es simple.

4) Finalmente probamos que An+1 es simple suponiendo que lo es An .


Sea N E An+1 y N 6= 1. Notemos que una permutaci
on como (1, 2, 3) puede
considerarse como permutaci
on de A3 o de A4 , etc. Con precisi
on, podemos
identificar An con el conjunto de las permutaciones de An+1 que dejan fijo a
n + 1. As An An+1 .
Tenemos que N An E An , y por hip
otesis de inducci
on es simple, luego
N An = 1 o bien N An = An . Si se da el segundo caso, entonces N contiene
todos los ciclos de longitud 3 de An , luego N = An+1 .
Veamos que no puede ocurrir N An = 1. En tal caso sea N , 6= 1.

356

Captulo 9. Resoluci
on de ecuaciones por radicales

Sea j = (n + 1) 6= n + 1. La permutaci
on no puede ser una trasposici
on
porque sera impar. Tampoco puede ser un ciclo de longitud 3 porque entonces
N = An+1 . En consecuencia podemos encontrar ndices k 6= l distintos de j
y de n + 1 tales que (k) = l (en la expresi
on de como producto de ciclos
disjuntos aparecer
an al menos 4 ndices).
Sea = (n+1,j)(k,l,u,v) , donde u y v son elementos distintos de los anteriores
(estamos en el caso en que n 6). Como hemos conjugado por una permutaci
on
par, tenemos que N .
Como (n + 1) = j, se cumple que (j) = n + 1 y como (k) = l, tambien
(l) = u. Por lo tanto ( )(n + 1) = n + 1, mientras que ( )(k) = u, luego
6= 1, pero N An , contradicci
on.
El hecho de que An es no abeliano para n 5 es consecuencia inmediata de
que An contiene a A4 , que es un grupo no abeliano.
Por el contrario, hemos visto que n es resoluble para n 4.
El teorema de Burnside El teorema 6.59 implica que todo p-grupo es resoluble. M
as a
un, un teorema nada trivial que no vamos a probar aqu, el teorema
de Burnside, afirma que todo grupo cuyo orden es divisible a lo sumo entre dos
primos es resoluble.
Si consideramos los n
umeros naturales menores que 60, s
olo hay dos divisibles
entre tres primos, que son el 30 y el 42. Sin embargo, ninguno de ellos puede
ser simple, por los dos ejemplos tras el teorema 6.67. Esto hace que A5 sea el
menor grupo simple no abeliano y tambien el menor grupo no resoluble.
Veamos otra aplicaci
on del teorema de Burnside:
Teorema 9.30 Un n
umero real es constructible con regla marcada si y s
olo
si el cuerpo de escisi
on K de pol mn(, Q) cumple que |K : Q| = 2a 3b .
n: Si es constructible, el teorema 9.22 nos da que |Q() : Q|
Demostracio
es divisible u
nicamente entre 2 y 3, y lo mismo vale para todos sus conjugados
(aunque no sean reales), luego lo mismo vale para |K : Q|.
Recprocamente, si |K : Q| = 2a 3b , entonces, por el teorema de Burnside,
el grupo G = G(K/Q) es resoluble, luego tiene una serie cclica cuyos factores
tienen todos orden 2 o 3. El teorema de Galois nos da una cadena de cuerpos
intermedios
Q = K0 K1 Kn = K
de modo que |Ki+1 : Ki | = 2, 3 y lo mismo vale para la cadena
Q = K0 R K1 R Kn R
y Kn R, luego por el teorema 9.22 es constructible con regla marcada.
Terminamos introduciendo un concepto que resulta u
til no s
olo al estudiar
grupos resolubles, sino grupos en general: La serie descrita en el teorema 9.27

9.6. Grupos resolubles

357

para un grupo resoluble tiene la mayor longitud posible, pues tiene tantos factores como primos aparecen en el orden de G. Su interes reside en que sus
factores son los m
as sencillos posibles, pero a veces interesa todo lo contrario,
es decir, trabajar con una serie abeliana de longitud mnima. Para construirla
partiremos de G y en cada paso tomaremos el menor subgrupo que podamos
sin que el cociente deje de ser abeliano.
Definici
on 9.31 Sea G un grupo. Llamaremos subgrupo derivado de G al subgrupo G0 generado por los elementos de la forma [x, y] = x1 y 1 xy, para todos
los x, y G.
El elemento [x, y] se llama conmutador de x, y. Su nombre se debe a que
obviamente xy = yx[x, y]. En particular [x, y] = 1 si y s
olo si xy = yx, es decir,
si y s
olo si x e y conmutan.
El teorema siguiente afirma que G0 es el menor subgrupo normal de G cuyo
cociente es abeliano.
Teorema 9.32 Sea G un grupo. Entonces
1. G0 E G y G/G0 es un grupo abeliano.
2. Si N E G, entonces G/N es abeliano si y s
olo si G0 N .
n: 1) Es inmediato que si x, y, g G entonces [x, y]g =
Demostracio
g
[x , y ]. Los elementos de G0 son productos de conmutadores, luego sus conjugados tambien, es decir, G0g G0 , lo que prueba que G0 es normal.
Claramente el cociente G/G0 es abeliano, pues si xG0 , yG0 son dos de sus
elementos, tenemos que x1 y 1 xy G0 , luego (xG0 )(yG0 ) = (yG0 )(xG0 ).

2) Si G0 N , entonces G/N
= (G/G0 ) (N/G0 ), que es un grupo abeliano
por ser un cociente de un grupo abeliano.
Si G/N es abeliano entonces para todo x, y G se cumple (xN )(yN ) =
(yN )(xN ), luego [x, y] = x1 y 1 xy N y, como los conmutadores generan G0 ,
concluimos que G0 N .
g

En particular un grupo G es abeliano si y s


olo si G0 = 1. Un grupo simple no
0
abeliano ha de cumplir G = G, pues ha de ser G0 6= 1 y no hay m
as subgrupos
normales. Otra propiedad evidente es que si H G, entonces H 0 G0 .
Definimos el derivado n-simo Gn) de un grupo G mediante

0
G0) = G,
Gn+1) = Gn) .
Claramente se cumple

Gn+1) E Gn) E E G1) E G0) = G.


Si existe un n
umero n tal que Gn) = 1 entonces la serie derivada
1 = Gn)

G1)

G0) = G.

358

Captulo 9. Resoluci
on de ecuaciones por radicales

es abeliana, luego G es resoluble. Recprocamente, si G es resoluble y


1 = Hn E E H1 E H0 = G
es una serie abeliana de G, aplicando repetidamente el teorema anterior obtenemos que Gi) Hi para i = 1, . . . , n. En efecto, si vale para i, como Hi /Hi+1
0
es abeliano tenemos que Gi+1) = Gi) Hi0 Hi+1 .
As concluimos que Gn) = 1 y que la longitud de la serie derivada es menor
o igual que la longitud de la serie dada. La serie derivada es, pues, la menor
serie abeliana de un grupo resoluble.

9.7

Extensiones radicales

Las f
ormulas de Cardano y Ferrari (junto con la f
ormula para ecuaciones
de segundo grado) muestran que toda ecuaci
on polin
omica de grado 2, 3 o 4
es resoluble por radicales, en el sentido de que sus races se pueden expresar
mediante sumas, productos, cocientes y races a partir de sus coeficientes. Vamos a caracterizar algebraicamente los n
umeros que pueden expresarse de este
modo a partir de elementos de un cuerpo dado. Por simplicidad trabajaremos
u
nicamente con cuerpos de caracterstica 0.
Definici
on 9.33 Una extensi
on de cuerpos K/k es radical si existen elementos a1 , . . . , an en K tales que K = k(a1 , . . . , an ) y existen naturales no nulos
r1 , . . . , rn de manera que ar11 k y ari i k(a1 , . . . , ai1 ), para i = 2, . . . , n.
As, los elementos de k(a1 ) son polinomios en a1 con coeficientes en k y
a1 es una raz r1 -esima de un elemento de k, los elementos de k(a1 , a2 ) son
polinomios en a2 con coeficientes en k(a1 ) y a2 es una raz r2 -esima de un
elemento de k(a1 ). En general todos los elementos de K se pueden obtener a
partir de los de k mediante sumas, productos, cocientes y extracci
on de races.
Recprocamente, si un elemento a admite una expresi
on de este tipo a partir
de ciertos elementos de k, es claro que a est
a contenido en una extensi
on radical
de k.
Por lo tanto, si p(x) es un polinomio no constante con coeficientes en un
cuerpo k, diremos que la ecuaci
on p(x) = 0 es resoluble por radicales si existe
una extensi
on radical K/k tal que p(x) se escinde en K.
Esto equivale a que las races de p(x) se puedan expresar mediante sumas,
productos, cocientes y races a partir de los elementos de k. En estos terminos,
toda ecuaci
on de grado 2, 3 o 4 es resoluble por radicales.
Ejemplo Consideremos la ecuaci
on x10 5x5 +5 = 0. Sus diez races cumplen
s

5
5
5 5
5
x =
,
luego
x=
.
2
2

9.7. Extensiones radicales

359

Esta f
ormula prueba que la ecuaci
on es resoluble por radicales. Para expresarlo en terminos de la definici
on que hemos dado consideramos los cuerpos

Q Q 5 Q 5, Q 5, , Q 5, , , = K,
donde es una raz quinta primitiva de la unidad, y , son
s
s

5
5
5 5 +
5 5
=
, =
2
2

(las races quintas se eligen arbitrariamente).


As, las races de la ecuaci
on son i y i , para i = 1, . . . , 5, luego todas
ellas est
an en K, y tambien es claro que K/Q es una extensi
on radical.
El teorema siguiente justifica que podemos limitarnos a trabajar con extensiones radicales de Galois. Ante todo, notemos que ciertamente toda extensi
on
radical es finita.
Teorema 9.34 Sea k un cuerpo de caracterstica 0 y K/k una extensi
on radical. Sea N la clausura normal de K sobre k. Entonces la extensi
on N/k es
radical (y de Galois).
n: Sea K = k(a1 , . . . , an ) seg
Demostracio
un la definici
on 9.33. Llamemos
pi (x) = pol mn(ai , k). Los polinomios pi (x) se escinden en N y N es la adjunci
on a k de sus races (pues esta extensi
on es normal y contiene a K, y N es
la mnima extensi
on que cumple esto). Si v es una raz en N de pi (x), entonces
ai y v son conjugados, luego existe un G(N/k) tal que (ai ) = v. Entonces
[K] es un cuerpo k-isomorfo a K que contiene a v. De aqu se sigue que existen
cuerpos K1 , . . . , Kr todos ellos k-isomorfos a K y tales que N = K1 Kr .
Es obvio que las extensiones Ki /k son todas radicales, luego existen elementos ai1 , . . . , ain de manera que Ki = k(ai1 , . . . , ain ) y se cumpla la definici
on de
extensi
on radical. Es f
acil ver que tomando N = k(a11 , . . . , a1n , . . . , ar1 , . . . , arn )
se cumple la definici
on de extensi
on radical.
Por lo tanto una ecuaci
on es resoluble por radicales si y s
olo si su cuerpo de
escisi
on est
a contenido en una extensi
on radical de Galois.
Si K = k(a1 , . . . , an ) es una extensi
on radical, podemos considerar la cadena
de cuerpos intermedios Ki = k(a1 , . . . , ai ), de manera que
k = K0 K1 K2 Kn = K,
y cada extensi
on intermedia es de la forma
Ki = Ki1 (ai ),

con ari i Ki1 .

(9.23)

Si adem
as la extensi
on es de Galois podemos considerar los grupos asociados
Gi = G(K/Ki ), que forman una cadena
1 = Gn Gn1 G1 G(K/k).

(9.24)

360

Captulo 9. Resoluci
on de ecuaciones por radicales

Ahora la clave es que vamos a probar que, salvo una restricci


on tecnica, la
condici
on (9.23) equivale a que
Gi E Gi1

Gi1 /Gi es cclico.

(9.25)

Teorema 9.35 Sea K/k una extensi


on de cuerpos, n un n
umero natural no
nulo y k una raz n-sima primitiva de la unidad. Las afirmaciones siguientes
son equivalentes:
1. K/k es una extensi
on cclica de grado d | n.
2. K es el cuerpo de escisi
on sobre k de un polinomio de la forma xd a
irreducible en k[x], y si u es una raz en K de dicho polinomio, entonces
K = k(u).
3. K = k(u) para un cierto u tal que un k.
n: 1) 2) Sea G(K/k) = hi y = n/d k, raz d-esima
Demostracio
primitiva de la unidad. Por el teorema 7.42 existe un w K tal que
v=

d1
P
i=0

Entonces (v) =

d1
P
i=0

tenemos que (u) = u.

i i (w) 6= 0.

i i+1 (w) =

d1
P

i+1 i+1 (w) = v. Si u = v 1

i=0

En general, i (u) = i u, luego los elementos i u para i = 0, . . . , d 1 son


k-conjugados. Adem
as (ud ) = (u)d = d ud = ud , luego a = ud es fijado por el
grupo de Galois y est
a, por consiguiente, en k. El polinomio xd a k[x] tiene
por races a todos los i u para i = 1, . . . , d 1, luego son todas sus races, es
decir, se escinde en K[x]. Adem
as, como son k-conjugadas, xd a es irreducible
en k[x]. Si adjuntamos a k cualquiera de las races de xd a obtenemos una
extensi
on de grado d, pero |K : k| = d, luego obtenemos K.
2) 3) Sea u una raz de xd a en K. Por hip
otesis K = k(u). Adem
as
u = (ud )n/d = an/d k.
n

3) 1) Sea b = un . Es claro que el polinomio p(x) = xn b k[x] tiene


n races distintas en K, a saber: i u, para i = 1, . . . , n. Por lo tanto p(x) se
escinde en K y sus races son separables. Concluimos que K/k es una extensi
on
finita de Galois.
Para cada G(K/k), el elemento (u) ha de ser otra raz de p(x), luego
existe un entero i determinado m
odulo n tal que (u) = i u. Consideremos la
aplicaci
on f : G(K/k) Z/nZ dada por f () = [i].
Se trata de un
de grupos, pues si (u) = i v y (u) = j v,
homomorfismo
j i
entonces (u) = (u), luego f ( ) = f () + f ( ).
Tambien es f
acil ver que se trata de un monomorfismo, luego G(K/k) es
isomorfo a un subgrupo de Z/nZ, luego cclico de orden divisor de n.

9.7. Extensiones radicales

361

Observemos que si en 2) queremos obtener el u que cumple a = ud k y


K = k(u), simplemente hemos de buscar un u que cumpla (u) = u, donde
es un generador del grupo de Galois y una raz d-esima primitiva de la unidad
en k.
Aqu es donde la teora entronca con la teora de grupos resolubles que
hemos presentado en la secci
on anterior: salvo la restricci
on tecnica de que se
requiere la presencia de una raz de la unidad, las cadenas de cuerpos de las
extensiones radicales de Galois se corresponden con series cclicas del grupo de
Galois, de modo que una extensi
on finita de Galois es radical si y s
olo si su
grupo de Galois es resoluble. En realidad esto no es inmediato por culpa de la
condici
on sobre las races de la unidad, pero vamos a ver que las propiedades de
los grupos resolubles permiten tenerla en cuenta sin que se restrinja el alcance
de la equivalencia:
Teorema 9.36 Sea k un cuerpo de caracterstica 0, sea K/k una extensi
on
radical y L un cuerpo tal que k L K con L/k de Galois. Entonces G(L/k)
es resoluble.
n: Por el teorema 9.34 podemos
Demostracio
suponer que K/k es de Galois. Por el teorema de Galois, G(L/k)
= G(K/k) G(K/L), luego basta probar
que G(K/k) es resoluble.
Sean K = k(a1 , . . . , an ) y r1 , . . . , rn seg
un la definici
on 9.33.
Sea K0 = k y para cada i = 0, . . . , n 1, sea Ki+1 = Ki (ai+1 ). De este
modo tenemos
k = K0 K1 Kn = K.
Sea m = r1 rn y sea una raz m-sima primitiva de la unidad en una
extensi
on de K. Sea Li = Ki (). Entonces
k() = L0 L1 Ln = K()
y Li+1 = Li (ai+1 ).
Ahora, Ln /L0 = K()/k() = Kk()/k(). Por el teorema7.45 la ex

tensi
on Ln /L0 es finita de Galois y G(Ln /L0 )
= G K K k() .

Llamemos bi = ari i Ki1 . Por el teorema 9.35 la extensi


on Li /Li1 es finita
de Galois y el grupo G(Li /Li1 ) es cclico. Sea Hi = G(Ln /Li ). Entonces
1 = Hn E Hn1 E E H1 E H0 = G(Ln /L0 ).
y los factores
.
Hi1 /Hi = G(Ln /Li1 ) G(Ln /Li )
= G(Li /Li1 )

son
cclicos. Estoprueba que el grupo G(Ln /L0 ) es resoluble y por consiguiente
G K/(K k()) tambien lo es.

362

Captulo 9. Resoluci
on de ecuaciones por radicales

La situaci
on es k K
La extensi
on k()/k es ciclot
omica,
k() k().

luego abeliana, por lo que K k() /k es una extensi


on finita de Galois abeliana. Adem
as

G K k() k
= G k()/k G k() K k()
es un grupo abeliano, luego resoluble.
Finalmente consideramos k K k() K. Se cumple que
.


G(K/k) G K K k()
= G K k() k


y tanto G K K k() como G K k() k son resolubles, por lo que
G(K/k) es resoluble.
Ahora vamos a probar el recproco. Notemos que al igual que ocurre con el
teorema anterior, la prueba se complica por la necesidad de incorporar una raz
primitiva.
Teorema 9.37 Sea k un cuerpo de caracterstica 0 y K/k una extensi
on finita
de Galois tal que G(K/k) sea resoluble. Entonces existe una extensi
on radical
de k que contiene a K.
n: Sea n el grado de la extensi
Demostracio
on K/k y sea una raz n-sima
primitiva de la unidad en una extensi
on de K. Como en el teorema anterior se
prueba que la extensi
on K()/k() es finita de Galois y

G = G K()/k()
= G K K k() G(K/k)
es resoluble. En consecuencia existe una serie cclica

1 = Gm E Gm1 E E G1 E G0 = G.

Sea Fi el cuerpo fijado por Gi . Entonces Gi = G K()/Fi y


k() = F0 F1 Fm = K().

Para cada i tenemos Fi1 Fi K(), y como Gi1 E Gi , tambien


Fi /Fi1 es de Galois y G(Fi /Fi1 )
= Gi /Gi1 es cclico. Sea


ri = Fi : Fi1 K() : k() = G K()/k() G(K/k) = n.

Podemos aplicar el teorema 9.35, que nos da que Fi = Fi1 (ai ), donde ai es una
raz de un polinomio xri bi Fi1 [x]. As
k k() k(, a1 ) k(, a1 , . . . , am ) = K()
y claramente K()/k resulta ser una extensi
on radical que contiene a K.
El teorema siguiente es consecuencia inmediata de los dos anteriores:
Teorema 9.38 (Galois) Sea k un cuerpo de caracterstica 0 y p(x) un polinomio no constante con coeficientes en k. La ecuaci
on p(x) = 0 es resoluble por
radicales si y s
olo si el grupo de Galois de p(x) sobre k es resoluble.

9.7. Extensiones radicales

363

Ejemplo La ecuaci
on x5 4x+2 = 0 no es resoluble por radicales, pues hemos
visto que el grupo de Galois del polinomio que la define es 5 .
Por otro lado, existen ecuaciones de grados mayores que 4 que s que son
resolubles por radicales. El caso m
as obvio es el de las de la forma xn a = 0,
y un ejemplo menos obvio es la ecuaci
on
x8 72x6 + 180x4 144x2 + 36 = 0,
cuyo grupo de Galois es, seg
un hemos visto, Q8 .
Puede probarse que, para todo natural n, existen polinomios en Q[x] de
grado n cuyo grupo de Galois es n lo que implica que no pueden existir resultados an
alogos a las f
ormulas de Cardano y Ferrari para polinomios de grado
mayor que 4. La prueba no es sencilla, pero hay un camino m
as simple para
llegar a la misma conclusi
on. Necesitamos una definici
on:
Definici
on 9.39 Sea n 1, k un cuerpo y K = k(a0 , . . . , an1 ) el cuerpo
de las fracciones algebraicas en las indeterminadas a0 , . . . , an1 . Llamaremos
polinomio general de grado n sobre k al polinomio
pn (x) = xn + an1 xn1 + + a1 x + a0 K[x].
La ecuaci
on pn (x) = 0 se llama ecuaci
on general de grado n.
De este modo transformamos el concepto l
ogico de variables arbitrarias
a0 , . . . , an1 en el concepto algebraico de indeterminadas de un cuerpo de fracciones algebraicas. A efectos pr
acticos es equivalente. Por ejemplo, la f
ormula
p
a1 a21 4a0
x=
2
se interpreta ahora como la expresi
on de las races de p2 (x) en una extensi
on de
K. En general, una expresi
on para la soluci
on de la ecuaci
on general de grado n
sobre un cuerpo k es una f
ormula para resolver todas las ecuaciones particulares
de grado n con coeficientes en k (de aqu el nombre de ecuaci
on general).
Por lo tanto, si probamos que la ecuaci
on general de grado n no es resoluble
por radicales para n 5, habremos probado que no existen teoremas similares
a los de Cardano y Ferrari para grados superiores a 4. Para ello es suficiente
demostrar que el grupo de Galois del polinomio general de grado n es n , pues
hemos visto que el grupo n no es resoluble para n 5.
Teorema 9.40 Sea k un cuerpo de caracterstica 0. Entonces el grupo de Galois del polinomio general de grado n sobre k es isomorfo a n .
n: Sean a0 , . . . , an1 los coeficientes de pn (x) y u1 , . . . , un las
Demostracio
races de pn (x) en una extensi
on de k(a0 , . . . , an1 ). Entonces,
F = k(a0 , . . . , an1 , u1 , . . . , un )

364

Captulo 9. Resoluci
on de ecuaciones por radicales

es un cuerpo de escisi
on de pn (x) sobre k(a0 , . . . , an1 ).
Tenemos que pn (x) = (xu1 ) (xun ), luego por el teorema 9.4 se cumple
que ak = (1)nk enk (u1 , . . . , un ) para k = 0, . . . , n 1.
Consideremos la aplicaci
on
: k[a0 , . . . , an1 ]
h(a0 , . . . , an1 )

k[e1 , . . . , en ]

7 h (1)n en , . . . , e1

Claramente se trata
de un epimorfismo
de anillos.

Adem
as si h(a0 , . . . , an1 ) = 0, entonces h (1)n en , . . . , e1 = 0 y en
particular

h (1)n en (u1 , . . . , un ), . . . , e1 (u1 , . . . , un ) = 0,

o sea, h(a0 , . . . , an1 ) = 0, lo que prueba que se trata de un isomorfismo de


anillos, que se extiende a un isomorfismo entre los cuerpos k(a0 , . . . , an1 ) y
k(e1 , . . . , en ) y que, a su vez, se extiende a un isomorfismo entre sus respectivos
anillos de polinomios en la indeterminada x.
La imagen por este isomorfismo del polinomio general pn (x) es
xn e1 xn1 + + (1)n en = (x x1 ) (x xn ).
Como F es el cuerpo de escisi
on sobre k(a0 , . . . , an1 ) de pn (x) y k(x1 , . . . , xn )
es el cuerpo de escisi
on sobre k(e1 , . . . , en ) de (x x1 ) (x xn ), es claro que
los respectivos grupos de Galois deben ser isomorfos, es decir,

G F/k(a0 , . . . , an1 )
= G k(x1 , . . . , xn ) k(e1 , . . . , en ) .
El primero es el grupo de Galois de pn (x) y el segundo es isomorfo a n por
el teorema 9.6.
Como consecuencia inmediata tenemos:
Teorema 9.41 (Abel) La ecuaci
on general de grado n no es resoluble por radicales para n 5.
Resoluci
on de c
ubicas mediante races reales Hemos visto que, cuando
una c
ubica tiene tres races reales simples, la f
ormula de Cardano las expresa
como suma de dos races c
ubicas imaginarias conjugadas. Vamos a probar que,
en general, no es posible expresar las soluciones de la ecuaci
on en terminos de
races reales (es decir, con radicando positivo cuando el ndice es par). Concretamente, vamos a demostrar el teorema siguiente:
Teorema 9.42 Sea K un subcuerpo del cuerpo de los n
umeros reales, y consideremos una c
ubica con coeficientes en K que cumpla D < 0 y que no tenga races
en K. Entonces no es posible expresar (ninguna de) sus races en funci
on de
sus coeficientes mediante sumas, productos, cocientes y races que sean n
umeros
reales.

9.7. Extensiones radicales

365

n: Observemos que un n
Demostracio
umero real se puede expresar en
funci
on de elementos de K mediante sumas, productos, cocientes y races reales
si y s
olo si existe una cadena de cuerpos
K = K0 K1 Kn R
tales que Kn y cada cuerpo intermedio es de la forma Ki = Ki1 (i ), para
un cierto i Ki tal que existe un n
umero natural mi 2 tal que imi Ki1 .
En general, pongamos que la ecuaci
on es la definida por el polinomio
f (x) = (x 1 )(x 2 )(x 3 ),
donde i
/ K, y supongamos que existe una cadena de cuerpos
K = K0 K1 Kn R

en las condiciones anteriores y tal que un i Kn . Vamos a llegar a una


contradicci
on. Sea L = K(1 , 2 , 3 ) el cuerpo de escisi
on de f (x) sobre K.
La hip
otesis D
<
0
equivale
a
que
el
discriminante
de
f
(x)
cumple > 0 y

sabemos que L. Si
/ K, como K( ) tienegrado 2 sobre K, no
contiene a los i , luego f es tambien una c
ubica sobre K( ) sin races en este
cuerpo. Adem
as, la cadena de cuerpos

K = K0 ( ) K1 ( ) Kn ( ) R

cumple las
mismas condiciones, luego podemos sustituir K por K( ) y suponer que K. El teorema 9.13 nos da entonces que |L : K| = 3, luego
L = K(1 ) = K(2 ) = K(3 ) y as, i Kn implica que L Kn .
Tambien podemos suponer que n es el mnimo natural tal que Kn contiene
a un i (o, equivalentemente, a todos los i ), con lo que f (x) no tiene races en
Kn1 y, cambiando K por Kn1 , podemos suponer que n = 1.
En definitiva, tenemos que K L K(), donde m K, para cierto
m 2. Podemos suponer que el n
umero natural m es el mnimo posible que
cumple esto. Sea p un divisor primo de m. Entonces K(m/p ) K(), luego,
por la minimalidad de m, tenemos que f (x) no tiene races en este subcuerpo
y, cambiando K por K(m/p ), podemos suponer que p K.
Sea una raz p-esima primitiva de la unidad. Entonces
/ K(), porque la extensi
on K()/K es abeliana (teorema 7.76), luego, si K() K(),
tendramos que K()/K sera de Galois, lo cual es absurdo, porque los conjugados de son los j y son imaginarios.
Por consiguiente, la extensi
on K(, )/K() no es trivial y, de hecho, tiene
grado p por el teorema 9.35. As pues, p divide al grado
|K(, ) : K| = |K(, ) : K()||K() : K|,
pero el primer factor tiene grado p 1, luego p | |K() : K| y as concluimos
que |K() : K| = p.
Como 3 = |L : K| | |K() : K|, de hecho, ha de ser p = 3 y K() = L, pero
esto es absurdo, porque L/K es una extensi
on de Galois y K()/K no lo es.

366

Captulo 9. Resoluci
on de ecuaciones por radicales

Ejemplo Consideremos una raz septima de la unidad:


= cos(2/7) + i sen(2/7)
y sean 1 = + 6 , 2 = 2 + 5 , 3 = 3 + 4 . Notemos que 1 = 2 cos(2/7).
Teniendo en cuenta que 1 + + 2 + 3 + 4 + 5 + 6 = 0, es f
acil ver que
1 + 2 + 3 = 1,

1 2 + 1 3 + 2 3 = 2,

1 2 3 = 1.

Por consiguiente, 1 , 2 , 3 son las races de la ecuaci


on u3 + u2 2u 1 = 0.
Haciendo u = 2x concluimos que cos(2/7) es una de las races de la ecuaci
on
1
1
1
x3 + x2 x = 0.
2
2
8
La f
ormula de Cardano nos da que
s

2
7
1
7
1
1
3
3
cos
=
+ 3i +
3i ,
7
144 3
144 3
6
para cierta elecci
on de las races c
ubicas. (Las otras dos elecciones nos dan
cos(4/7) y cos(8/7).) Ahora bien, el teorema anterior nos asegura que esta
expresi
on es esencialmente imaginaria, en el sentido de que es imposible obtener el resultado
2
cos
= 0.6234898019 . . .
7
con una calculadora pulsando u
nicamente las teclas numericas y las de las operaciones de suma, resta, producto, divisi
on y extracci
on de races.

9.8

Ap
endice: La trascendencia de e y

Para acabar el captulo demostraremos que los n


umeros e y son trascendentes sobre Q. Aunque es f
acil ver que casi todos los n
umeros reales son
trascendentes, pues el conjunto de n
umeros algebraicos es numerable y R no lo
es, demostrar la trascendencia de n
umeros concretos es mucho m
as complicado.
Hermite fue el primero en demostrar la trascendencia de e y Lindemann prob
o
despues la de . Aqu veremos unas pruebas m
as sencillas, pero hay que se
nalar
que la prueba de Lindemann se generaliza a un teorema m
as potente, en virtud
del cual los valores que toman las funciones sen x, cos x, ex , log x, etc. sobre
n
umeros algebraicos sonsalvo los casos triviales n
umeros trascendentes. Por
ello a estas funciones se les llama tambien funciones trascendentes.
Comenzamos introduciendo unos convenios u
tiles de notaci
on:
m
P
Definici
on 9.43 Escribiremos hr = r!, de modo que si f (z) =
cr z r C[z],
r=0

entonces f (h) representar


a

f (h) =

m
X
r=0

cr hr =

m
X
r=0

cr r!

9.8. Apendice: La trascendencia de e y

367

Igualmente, f (z + h) ser
a el polinomio que resulta de sustituir y r por hr = r!
en la expresi
on desarrollada de f (z + y). Concretamente:
m
!
m
m
r
m
X
X
X
r rk k X X
r rk
r
f (z + y) =
cr (z + y) =
cr
z
y =
cr
z
yk ,
k
k
r=0
r=0
k=0

k=0

r=k

luego
f (z + h) =

m
m
X
X

k=0

r=k

!
m
!

m
m
X
X
X
r rk
r!
rk
cr
z
k! =
cr z
=
f k) (z),
k
(r k)!
k=0

r=k

k=0

donde f k) (z) es la k-esima derivada formal del polinomio f . Observemos que


m
X

f (z + h) =

cr (z + h)r ,

r=0

pues
m
X

cr (z + h)r

r=0

m
X

cr

r=0

m
X

m
X

(z r )k) =

k=0

m
m
X
X

k=0

cr z r

r=0

!k)

f k) (z) = f (z + h).

k=0

Adem
as
f (0 + h) =

m
X

f k) (0) =

ur (z) = r!
Teniendo en cuenta que

|z|n

(r+n)!
r!

cr r! = f (h).

r=0

k=0

Sea

m
X

zn
.
(r + n)!
n=1
<

|z|n
,
n!

es claro que la serie converge en todo C y que |ur (z)| < e|z| . Llamaremos
r (z) =

ur (z)
.
e|z|

As, |r (z)| < 1.


s
s
P
P
Teorema 9.44 Sea (z) =
cr z r C[z]. Sea (z) =
cr r (z)z r . Entonr=0
r=0
ces
ez (h) = (z + h) + (z)e|z| .

368

Captulo 9. Resoluci
on de ecuaciones por radicales

n: En primer lugar
Demostracio
r
r
r
X
X
r k rk X r! k
zk
(z + h)r =
z h
=
z = r!
,
k!
k!
k
k=0

k=0

k=0

y por otro lado


r!ez ur (z)z r

= r!
= r!

X
zk

k=0
r
X
k=0

k!

r!

z
,
k!

X
X
zn
zk
zk
z r = r!
r!
(r + n)!
k!
k!
n=1
k=0

k=r+1

o sea, (z + h) = r!e ur (z)z r , y por lo tanto


ez hr = (z + h)r + ur (z)z r = (z + h)r + e|z| r (z)z r .
Multiplicando por cr y sumando en r obtenemos la igualdad buscada.
Teorema 9.45 Sea m 2 y f (x) Z[x]. Definimos los polinomios F1 y F2
mediante:
xm1
xm
F1 (x) =
f (x), F2 (x) =
f (x).
(m 1)!
(m 1)!
Entonces F1 (h), F2 (h) Z, F1 (h) f (0) (mod m) y F2 (h) 0 (mod m).
n: Sea f (x) =
Demostracio

r
P

r=0

F1 (x) =

s
X

ar

r=0

xr+m1
,
(m 1)!

ar xr , con ar Z. Entonces
F1 (h) =

s
X
r=0

ar

(r + m 1)!
Z
(m 1)!

y m divide a cada sumando excepto quiz


a al primero, que es a0 = f (0). Por lo
tanto F1 (h) f (0) (mod m). Con F2 se razona an
alogamente.
Teorema 9.46 El n
umero e es trascendente.
n: Si e fuera algebraico sera la raz de un polinomio con
Demostracio
n
P
coeficientes enteros. Digamos
ct et = 0, con n 1, ct Z, c0 6= 0 (si c0
t=0

fuera 0 podramos dividir entre e y quedarnos con un polinomio menor). Sea p


un primo tal que p > n y p > |c0 |. Sea
(x) =
Por el teorema 9.44:
0=

n
X
t=0

p
xp1
(x 1)(x 2) (x n) .
(p 1)!

ct et (h) =

n
X
t=0

ct (t + h) +

n
X
t=0

ct (t)et = S1 + S2 .

9.8. Apendice: La trascendencia de e y

369

Tomando m = p, el teorema 9.45 nos da que (h) Z y


(h) (1)pn (n!)p (mod p).
Si 1 t n, entonces
(t + x) =

p
(x + t)p1
(x + t 1)(x + t 2) x (x + t n) ,
(p 1)!

y sacando el factor x queda

(t + h) =

xp
f (x),
(p 1)!

con f (x) Z[x]. Por el teorema 9.45 tenemos que (t + h) Z y es un m


ultiplo
de p. Ahora,
S1 =

n
X
t=0

ct (t + h) c0 (h) c0 (1)pn (n!)p 6 0 (mod p),

ya que c0 6= 0 y p > n, |c0 |. As pues, S1 Z y S1 6= 0, luego |S1 | 1. Como


S1 + S2 = 0, lo mismo vale para S2 , es decir, |S2 | 1. Por otro lado, sea
s
P
(x) =
ar xr . Entonces
r=0

s
s
X
X
X

r
|(t)| =
ar r (t)t
|ar | |r (t)|tr
|ar |tr .

r=0

r=0

r=0

Observemos que |ar | es el coeficiente de grado r del polinomio


p
xp1
(x + 1) (x + n) .
(p 1)!

p
Basta ver que si bi es el coeficiente de grado i de (x 1) (x n) ,

p
entonces |bi | es el coeficiente de grado i de (x + 1) (x + n) , pero
|bi | = |(1)pni enpi (1, . . . , n, . . . , 1, . . . , n)|
= (1)pni enpi (1, . . . , n, . . . , 1, . . . , n).

Por lo tanto podemos concluir:


|(t)|

s
X
r=0

|ar |tr =

p
tp1
(t + 1)(t + 2) (t + n) ,
(p 1)!

y en definitiva:

p1
t(t + 1) (t + n)
|(t)| (t + 1)(t + 2) (t + n)
.
(p 1)!

370

Captulo 9. Resoluci
on de ecuaciones por radicales

Pero esta expresi


on tiende a 0 cuando p tiende a infinito (por la convergencia
de la serie de la funci
on exponencial). En consecuencia, tomando p suficienten
P
mente grande podemos exigir que S2 =
ct (t)et cumpla |S2 | < 1, cuando
t=0

hemos demostrado lo contrario para todo p. Esto prueba que e es trascendente.

La trascendencia de es algo m
as complicada de probar. Adem
as de los
teoremas 9.44 y 9.45 necesitaremos otro resultado auxiliar:
Teorema 9.47 Sea p(x) = dxm + d1 xm1 + + dm1 x + dm Z[x], sean
1 , . . . , m sus races en C y sea q(x1 , . . . , xm ) Z[x1 , . . . , xm ] un polinomio
simetrico. Entonces q(d1 , . . . , dm ) Z.
n: Claramente
Demostracio
dm1 p(x) = (dx)m + d1 (dx)m1 + dd2 (dx)m2 + + dm2 dm1 (dx) + dm1 dm .
O sea, dm1 p(x) = r(dx), donde
r(x) = xm + d1 xm1 + dd2 xm2 + + dm2 dm1 x + dm1 dm Z[x]
es un polinomio m
onico y sus races son obviamente d1 , . . . , dm . Consecuentemente, r(x) = (x d1 ) (x dm ) y los coeficientes de r(x) son
(1)i ei (d1 , . . . , dm ) para i = 0, . . . , m. As pues, ei (d1 , . . . , dm ) Z para
i = 1, . . . , m.
Por otro lado sabemos que q(x1 , . . . , xm ) = r(e1 , . . . , em ) para cierto polinomio r(x1 , . . . , xm ) Z[x1 , . . . , xm ], luego

q(d1 , . . . , dm ) = r e1 (d1 , . . . , dm ), . . . , em (d1 , . . . , dm ) Z.


Teorema 9.48 El n
umero es trascendente.
n: Si es algebraico tambien lo es i. Sea
Demostracio
dxm + d1 xm1 + + dm1 x + dm Z[x]
un polinomio tal que d =
6 0 y con raz i. Sean 1 , . . . , m sus races en C.
Como una de ellas es i y ei + 1 = 0, tenemos que (1 + e1 ) (1 + em ) = 0,
o sea,
m
2X
1
1+
et = 0,
t=1

donde 1 , . . . , 2m 1 son 1 , . . . , m , 1 + 2 , . . . , m1 + m , . . . , 1 + + m .
Supongamos que c 1 de ellos son nulos y n = 2m 1 (c 1) no son nulos.
Ordenemoslos como 1 , . . . , n , 0, . . . , 0. As c 1 y
c+

n
X
t=1

et = 0.

(9.26)

9.8. Apendice: La trascendencia de e y

371

Notemos lo siguiente:
ei (x1 , . . . , xn ) = ei (x1 , . . . , xn , 0, . . . , 0),
donde ei es a la izquierda el polinomio simetrico elemental de n variables y a la
derecha el de 2m 1 variables. Por lo tanto
ei (d1 , . . . , dn ) = ei (d1 , . . . , d2m 1 )
= ei (d1 , . . . , dm , d1 + d2 , . . . , dm1 + dm , . . . , d1 + + dm ).
Sea qi (x1 , . . . , xm ) = ei (x1 , . . . , xm , x1 +x2 , . . . , xm1 +xm , . . . , x1 + +xm ).
Claramente se trata de polinomios simetricos con coeficientes enteros y
ei (d1 , . . . , dn ) = qi (d1 , . . . , dm ),
luego el teorema anterior nos permite afirmar que ei (d1 , . . . , dn ) Z.
Si s(x1 , . . . , xn ) Z[x1 , . . . , xn ] es simetrico, entonces s depende polin
omicamente de los ei , luego s(d1 , . . . , dn ) Z. Sea p un primo tal que p > |d|,
p > c, p > |dn 1 n |. Sea
(x) =

p
dnp+p1 xp1
(x 1 ) (x n ) .
(p 1)!

Multiplicamos (9.26) por (h) y aplicamos el teorema 9.44. Nos queda


c(h) +

n
X
t=1

Ahora,
(x) =

(t + h) +

n
X

(t )e|t | = S0 + S1 + S2 = 0.

t=1

p
xp1 p1
d
(dx d1 ) (dx dn ) .
(p 1)!

Los coeficientes de (y d1 ) (y dn ) son polinomios simetricos elementales sobre d1 , . . . , dn , luego son enteros, seg
un hemos visto antes. De aqu
se sigue que tambien son enteros los coeficientes de (dx d1 ) (dx dn ),
con lo que
np
xp1 X
(x) =
gr xr , donde cada gr Z.
(p 1)! r=0
Por el teorema 9.45 tenemos que (h) Z y (h) g0 (mod p). Concretamente, g0 = (1)pn dp1 (d1 dn )p , luego por la elecci
on de p resulta que
p - g0 (aqu es importante que d1 dn Z porque es el termino independiente de (y d1 ) (y dn ). Como p - c, resulta que p - S0 = c(h).
Nos ocupamos ahora de S1 . Tenemos que
(t + x) =

dnp+p1 (t + x)p1
(x + t 1 ) (x + t t1 )
(p 1)!

p
x(x + t t+1 ) (x + t n )

372

Captulo 9. Resoluci
on de ecuaciones por radicales

xp
dp (dt + dx)p1 (dx + dt d1 ) (dx + dt dt1 )
(p 1)!

p
(dx + dt dt+1 ) (dx + dt dn )

np1
X
xp
frt xr ,
(p 1)! r=0

donde frt = fr (dt , d1 , . . . , dt1 , dt+1 , . . . , dn ) y fr es un polinomio simetrico respecto a todas las variables excepto la primera, con coeficientes enteros
y que no depende de t. En efecto, consideramos el polinomio

p1

p
y (x1 )
y (x2 x1 ) (y (xn x1 )
.

Sus coeficientes son los polinomios simetricos elementales actuando sobre x1


(p1 veces) y sobre x2 x1 , . . . , xn x1 (p veces cada uno), luego son polinomios
np1
P
simetricos en x2 , . . . , xn . Digamos que el polinomio es
sr (x1 , . . . , xn )y r .
r=0

Entonces

(t + x) =

np1
X
xp
dp sr (dt , d1 , . . . , dt1 , dt+1 , . . . , dn )dr xr ,
(p 1)! r=0

es decir, fr = dr+p sr (x1 , . . . , xn ). Por lo tanto,

pero

n
!
np1
X X
xp
(t + x) =
frt xr ,
(p

1)!
t=1
r=0
t=1

n
X
n
X

frt =

t=1
n
P

y el polinomio

n
X

fr (dt , d1 , . . . , dt1 , dt+1 , . . . , dn ),

t=1

fr (xt , x1 , . . . , xt1 , xt+1 , . . . xn ) es simetrico (respecto a todas


n
P
las variables), luego Fr =
frt depende simetricamente de d1 , . . . , dn y por
t=1

t=1

lo tanto es un entero. As pues,


n
X
t=1

(t + x) =

np1
X
xp
Fr xr ,
(p 1)! r=0

y por el teorema 9.45 concluimos que S1 =

n
P

t=1

(t + h) Z y es m
ultiplo de p

(aqu hemos usado que (1 + 2 )(h) = 1 (h) + 2 (h), lo cual es evidente).


Esto nos da que S0 + S1 Z y no es un m
ultiplo de p. En particular
|S0 + S1 | 1 y, por la ecuaci
on S0 + S1 + S2 = 0 resulta que tambien S2 Z y
|S2 | 1. Como en el caso de e, ahora probaremos lo contrario.

9.8. Apendice: La trascendencia de e y


Sea (x) =

np+p1
P

373

cr r (x)xr . Entonces

r=0

np+p1
np+p1
X

r
|(x)| =
cr r (x)x
|cr | |xr |

r=0
np+p1

|d|

r=0

p1

|x|
(p 1)!

p
(|x| + |1 |) (|x| + |n |)

(por el mismo razonamiento que en la prueba de la trascendencia de e) y as


|(x)|

M 2np+2p2
,
(p 1)!

donde M es una cota que no depende de p.


Como M 2np+2p2 M 2np+2p = M (2n+2)p = K p = KK p1 , tenemos que
|(x)| K

K p1
(p 1)!

y la sucesi
on converge a 0 cuanto p tiende a infinito, pues la serie converge
a KeK . Esto para cada x fijo. Tomando un primo p suficientemente grande
n
P
podemos exigir que |S2 |
|(t )|e|t | < 1, con lo que llegamos a una contradicci
on.

t=1

Uno de los problemas cl


asicos de la geometra era la rectificaci
on de la
circunferencia, es decir, construir un segmento cuya longitud sea la de una
circunferencia dada. As, partiendo de una circunferencia de di
ametro unitario,
el problema es construir un segmento de longitud . La trascendencia de implica que la rectificaci
on de una circunferencia no es posible con regla y comp
as,
ni siquiera con instrumentos adicionales, como una regla marcada, o un trisector de angulos, etc., pues en todos estos casos los n
umeros constructibles son
algebraicos.

Captulo X

Enteros algebraicos
En el captulo IV vimos c
omo algunos resultados sobre n
umeros enteros est
an
estrechamente relacionados con propiedades de anillos m
as abstractos, como es
el caso de las sumas de cuadrados y el anillo de los enteros de Gauss, o el

Ultimo
Teorema de Fermat y los anillos de enteros ciclot
omicos. Ahora vamos a
retomar esa lnea de resultados equipados con las teoras algebraicas que hemos
desarrollado desde entonces: la teora de m
odulos y espacios vectoriales, la teora
de grupos, etc.

10.1

La forma bilineal asociada a la traza

Antes de entrar en lo que va a ser propiamente el objeto de estudio de este


captulo necesitamos introducir un nuevo concepto que combina elementos de
la teora de cuerpos y del algebra lineal:
Teorema 10.1 Sea K/k una extensi
on de cuerpos finita separable. Entonces
la traza determina una forma bilineal simetrica regular dada por
K K
(, )

k
7 Tr()

n: Es claro que la aplicaci


Demostracio
on as definida es una forma bilineal
simetrica. Calculemos su matriz en una base cualquiera B = (v1 , . . . , vn ) de K.
Sean 1 , . . . , n los k-monomorfismos de K. Entonces
n
n

P
P
MB = (Tr(vi vj )) =
k (vi vj ) =
k (vi )k (vj )
k=1

k=1

t
= k (vi ) ik k (vj ) kj = i (vj ) i (vj ) .

2
Por lo tanto |MB | = i (vj ) . Basta comprobar que este determinante es no
nulo para una base en particular. Concretamente, por el teorema del elemento
375

376

Captulo 10. Enteros algebraicos

primitivo sabemos que K = k() para cierto K, y una k-base de K es


B = (1, , . . . , n1 ). Para esta base, el determinante que hemos de calcular es

1 ()

n ()

,
..
..

.
.

1 ()n1 n ()n1

y este determinante es de Vandermonde, y su segunda fila la forman los n


conjugados de , que son todos distintos (pues es separable y su polinomio
mnimo tiene grado n). Por lo tanto |MB | 6= 0 y la forma es regular.

En particular hemos probado que la traza de una extensi


on finita separable
es siempre no nula (lo que en caracterstica prima no es trivial).

Ejercicio: Considerar el cuerpo Q 3 . Calcular la base dual respecto a la traza de

la base 1,

3 .

Conviene extraer algunas ideas de la demostraci


on del teorema anterior:

Definici
on 10.2 Sea K/k una extensi
on finita separable y B = (v1 , . . . , vn )
una k-base de K. Llamaremos discriminante de B al determinante de la matriz
de la forma bilineal asociada a la traza respecto a la base B. Equivalentemente:


2
[B] = [v1 , . . . , vn ] = Tr(vi vj ) = i (vj ) ,
donde 1 , . . . , n son los k-monomorfismos de K.

Notemos que la segunda expresi


on implica que [B] no depende del orden de
los elementos de la base B (ni por supuesto del de los monomorfismos), pues una
alteraci
on de dicho orden se traduce en una permutaci
on de las filas o columnas
del determinante, lo que a lo sumo implica un cambio de signo que a su vez es
absorbido por el cuadrado.
Hemos probado que [B] k es no nulo y si es un elemento primitivo de
la extensi
on, entonces

Q
2
1, , . . . n1 =
j () i () .
i<j

Hay una u
ltima propiedad de los discriminantes que conviene observar:

Teorema 10.3 Sea K/k una extensi


on de cuerpos finita separable y sean B, C

dos k-bases de K. Entonces [B] = MC


B [C].

n: Basta probar que las matrices de la forma bilineal asociada


Demostracio
a traza guardan la relaci
on
C t
MB = MC
.
(10.1)
B MC MB
Ahora bien, para todo v, w K,
C t
B (v) MC
B (w)t = C (v) MC C (w)t = T r(vw),
B MC MB

luego por la unicidad de la matriz de una forma bilineal, se cumple (10.1).

10.2. Anillos de enteros algebraicos

10.2

377

Anillos de enteros algebraicos

La definici
on siguiente contiene el que va a ser nuestro principal objeto de
estudio en este captulo:
Definici
on 10.4 Un cuerpo numerico es una extensi
on finita de Q.
En general, siempre que apliquemos a un cuerpo numerico K conceptos de
la teora de extensiones de cuerpos se entender
a que se refieren a la extensi
on
K/Q. Por ejemplo, el grado de un cuerpo numerico ser
a el grado sobre Q, un
cuerpo numerico cclico o abeliano ser
a una extensi
on finita de Galois de Q cuyo
grupo de Galois es cclico o abeliano, etc.
Un poco m
as en general, consideremos de momento un cuerpo K de caracterstica 0, que, por lo tanto, contiene al cuerpo Q de los n
umeros racionales. Un
elemento a K es algebraico sobre Q (o, simplemente, algebraico) si y s
olo si es
la raz de un polinomio no nulo con coeficientes racionales, pero multiplicando
dicho polinomio, en caso de que exista, por el producto de los denominadores de
sus coeficientes no nulos obtenemos un polinomio con coeficientes enteros con
las mismas races. As pues un elemento de K es algebraico si y s
olo si es la
raz de un polinomio con coeficientes enteros. El concepto de entero algebraico
surge imponiendo una restricci
on:
Definici
on 10.5 Sea K un cuerpo de caracterstica 0. Un elemento a K
es un entero algebraico si es la raz de un polinomio m
onico con coeficientes
enteros.
Como los enteros algebraicos son en particular n
umeros algebraicos, podemos
limitarnos a estudiar los enteros algebraicos del cuerpo A (la clausura algebraica
de Q). Llamaremos E al conjunto de los enteros algebraicos de A. Si K es un
cuerpo numerico llamaremos OK al conjunto de los enteros algebraicos de K
(La O hace referencia a orden, aunque aqu no introduciremos este concepto
en general). Claramente tenemos que OK = K E.
La caracterizaci
on siguiente muestra entre otras cosas que no todos los
n
umeros algebraicos son enteros algebraicos.
Teorema 10.6 Un elemento algebraico a de una extensi
on de Q es un entero
algebraico si y s
olo si pol mn(a, Q) Z[x].
n: Una implicaci
Demostracio
on es obvia. Supongamos que a es un entero
algebraico y sea p(x) Z[x] un polinomio m
onico tal que p(a) = 0. Sea q(x)
un factor irreducible de p(x) en Z[x] tal que q(a) = 0. Existe un polinomio
r(x) Z[x] tal que p(x) = q(x)r(x). Como el producto de los coeficientes
directores de q(x) y r(x) debe ser igual al coeficiente director de p(x) que es 1,
el coeficiente director de q(x) debe ser 1. Podemos exigir que sea 1 y as q(x)
es un polinomio m
onico irreducible en Z[x] del que a es raz. Por el criterio de
Gauss, q(x) tambien es irreducible en Q[x], luego q(x) = pol mn(a, Q) Z[x].

378

Captulo 10. Enteros algebraicos

Otra consecuencia de este teorema es que los enteros algebraicos de Q son


precisamente los n
umeros enteros:
Teorema 10.7 OQ = Z.
n: Un n
Demostracio
umero racional q es un entero algebraico si y s
olo si
pol mn(q, Q) Z[x], si y s
olo si x q Z[x], si y s
olo si q Z.
El lector debe notar el paralelismo entre el teorema siguiente y resultados
similares sobre cuerpos.
Teorema 10.8 Sea K un cuerpo de caracter
stica
0. Un elemento
c K es

un entero algebraico si y s
olo si Z[c] = q(c) q(x) Z[x] es un Z-m
odulo
finitamente generado. En tal caso es libre de rango |Q(c) : Q|.

n: Supongamos que c es un entero algebraico. Entonces su


Demostracio
polinomio mnimo p(x) tiene coeficientes enteros y su grado es n = |Q(c) : Q|.
Veamos que
Z[c] = hcm | m = 0, . . . , n 1i .
(10.2)
Un elemento arbitrario de Z[c] es de la forma q(c), donde q(x) es un polinomio
con coeficientes enteros. Dividimos q(x) = p(x)u(x) + r(x), donde u y r tienen
ambos coeficientes enteros y el grado de r es menor que n. Entonces resulta que
q(c) = r(c), luego pertenece al miembro derecho de (10.2), y la otra inclusi
on es
obvia. De hecho el generador (1, c, . . . , cn1 ) es una base, pues una combinaci
on
lineal nula es de la forma r(c) = 0, con r(x) Z[x] de grado menor que n, luego
concluimos que r = 0.
Supongamos ahora que Z[c] es finitamente generado. Digamos que admite
n generadores v1 , . . . , vn . Cada vi es un polinomio en c con coeficientes enteros.
Sea m mayor que el grado de cualquiera de dichos polinomios.
Entonces cm se expresa como combinaci
on lineal con coeficientes enteros de
los vi , luego en definitiva cm = q(c), con q(x) Z[x] de grado menor que m. La
ecuaci
on cm q(c) = 0 justifica que c es un entero algebraico.
De aqu podemos deducir las propiedades b
asicas de los enteros algebraicos.
En primer lugar probamos que forman un anillo.
Teorema 10.9 El conjunto E es un subanillo de A. Si K es un cuerpo numerico
entonces OK es un subanillo de K.
n: Sean c, d E. Hay que probar que c + d y cd est
Demostracio
an en E.
Sea {v1 , . . . , vn } un generador de Z[c] y sea {w1 , . . . , wm } un generador de Z[d].
Sea M el Z-m
odulo generado por los todos los productos vi wj .
Todo cr se expresa como combinaci
on lineal con coeficientes enteros de los
vi y todo ds se expresa como combinaci
on lineal con coeficientes enteros de los
wj . Al multiplicar estas expresiones obtenemos una expresi
on de cr ds como
combinaci
on lineal con coeficientes enteros de los generadores de M , luego cada
cr ds M .

10.2. Anillos de enteros algebraicos

379

En particular, Z[cd] M , luego es un Z-m


odulo finitamente generado (teorema 5.40). Por el teorema anterior cd E.
Al desarrollar (c + d)k obtenemos una combinaci
on lineal con coeficientes
enteros de elementos de la forma cr ds , que est
an en M , luego Z[c + d] M y
tambien se cumple que c + d E.
Obviamente OK = E K es un subanillo de K.
Es costumbre referirse a los elementos del anillo OK como a los enteros de
K, es decir, reservar la palabra entero para los enteros algebraicos en lugar
para los enteros de Z. Por este mismo convenio, los enteros de Z = OQ son los
enteros racionales, si K = Q() es el cuerpo ciclot
omico p-esimo, los elementos
de OK se llaman enteros ciclot
omicos, etc.
La relaci
on entre K y OK es similar a la relaci
on existente entre Q y Z.
Por ejemplo, igual que Q es el cuerpo de cocientes de Z, se cumple que K es el
cuerpo de cocientes de OK . Esto se deduce del resultado siguiente:
Teorema 10.10 Para cada c A existe un entero racional no nulo m de manera que mc E.
n: Sea pol mn(c, Q) = xn + an1 xn1 + + a1 x + a0 . Sea
Demostracio
m el producto de los denominadores de todos los coeficientes no nulos de p(x).
Entonces mn (cn + an1 cn1 + + a1 c + a0 ) = 0, luego
(mc)n + an1 m(mc)n1 + + a1 mn1 (mc) + a0 = 0.
Por lo tanto, xn + an1 mxn1 + + a1 mn1 x + a0 es un polinomio m
onico
con coeficientes enteros del cual es raz mc.
Teorema 10.11 Si K es un cuerpo numerico, entonces K es el cuerpo de cocientes de OK .
n: Si a K, entonces existe un entero racional no nulo m tal
Demostracio
que ma OK , por lo tanto a = (ma)/m est
a en el cuerpo de cocientes de OK .
Otra consecuencia importante del teorema 10.10 es que los elementos primitivos siempre se pueden tomar enteros:
Teorema 10.12 Sea K un cuerpo numerico. Entonces existe un c OK tal
que K = Q(c).
n: Por el teorema del elemento primitivo existe un a K tal
Demostracio
que K = Q(a). Sea m un entero racional no nulo tal que c = ma sea entero
en K. Claramente K = Q(c).
Un paso m
as de cara a reproducir para anillos de enteros los resultados
que conocemos sobre cuerpos es demostrar que si K es un cuerpo numerico de
grado n entonces OK es un Z-m
odulo libre de rango n. Para ello nos apoyaremos
en los discriminantes definidos en la secci
on anterior. He aqu un par de hechos
adicionales sobre ellos que vamos a necesitar:

380

Captulo 10. Enteros algebraicos

Teorema 10.13 Sea K un cuerpo numerico de grado n y B una base de K


formada por enteros. Entonces [B] Z y [B] 0, 1 (mod 4).
n: Sea B = (b1 , . . . , bn ). Por hip
Demostracio
otesis b1 , . . . , bn son enteros,
luego sus conjugados tambien lo son (los polinomios mnimos son los mismos),
luego [B] es por definici
on el cuadrado del determinante de una matriz de
coeficientes enteros, luego es entero y adem
as es un n
umero racional, luego es
un entero racional.
Para obtener la segunda parte consideramos los monomorfismos de K, digamos 1 , . . . n , sea
L la clausura normal de K/Q y sea un automorfismo de L.
Sea A = i (bj ) .
El determinante de A es una suma de productos de la forma
(1) (b1 ) (n) (bn ),
donde n . Si le aplicamos obtenemos un termino de la forma

(1) (b1 ) (n) (bn ) .

Ahora bien, cada monomorfismo i ha de ser un (i) , para cierto ndice (i)
(y ahora estamos llamando a una permutaci
on de {1, . . . , n} inducida por el
automorfismo ). Por lo tanto la imagen por del producto es
( (1)) (b1 ) ( (n)) (bn ),
es decir, el sumando del determinante correspondiente a la permutaci
on .
Si (la permutaci
on inducida por) es una permutaci
on par entonces enva
sumandos con signo positivo a sumandos con signo positivo y sumandos con
signo negativo a sumandos con signo negativo, mientras que si es impar entonces intercambia los sumandos positivos con los negativos. En otras palabras,
si llamamos respectivamente P y N a la suma de terminos positivos y negativos
(sin el signo) del determinante de A, tenemos que det A = P N y o bien
(P ) = P y (N ) = N , o bien (P ) = N y (N ) = P .
En cualquier caso (P + N ) = P + N y (P N ) = P N , para todo automorfismo , luego concluimos que P +N , P N Q. Adem
as son enteros algebraicos,
luego est
an en Z. Finalmente,
[B] = (P N )2 = (P + N )2 4P N (P + N )2 0, 1 (mod 4),
pues todo cuadrado es 0 o 1 m
odulo 4.
Teorema 10.14 Sea K un cuerpo numerico de grado n. Entonces OK es un
Z-m
odulo libre de rango n.
n: Por 10.12 sabemos que K = Q(c), donde c OK . EnDemostracio
tonces 1, c, . . . , cn1 es una base de K formada por enteros. Podemos tomar
una base
de K B = {b1 , . . . , bn } formada por enteros tal que el n
umero na
tural [b1 , . . . , bn ] sea mnimo. Vamos a probar que entonces {b1 , . . . , bn } es

10.2. Anillos de enteros algebraicos

381

una base de OK como Z-m


odulo. Obviamente sus elementos son linealmente
independientes sobre Z, pues lo son sobre Q. Basta probar que generan OK .
Supongamos, por el contrario, que existe un elemento d OK que no
pertenezca al subm
odulo generado por {b1 , . . . , bn }. Como en cualquier caso
{b1 , . . . , bn } es una base de K, se cumplir
a que
d = a1 b1 + + an bn ,

(10.3)

para ciertos n
umeros racionales a1 , . . . , an no todos enteros. Podemos suponer
que a1
/ Z. Sea a1 = a + r, donde a Z y 0 < r < 1. Sustituyendo en (10.3)
obtenemos que
rb1 + a2 b2 + + an bn = d ab1 OK .
Si llamamos c1 a este elemento y ci = bi para i = 2, . . . , n obtenemos una nueva
base C de K formada por enteros tal que

r a2 a3 an
0 1 0 0

B
MC = 0 0 1 0 .
.. ..
.. . .
..
. .
. .
.
0 0 0 1
B
Claramente MC = r y en consecuencia

[C] = r2 [B] < [B],

en contra de la elecci
on de B. Por lo tanto B es una base de OK como Z-m
odulo.

Definici
on 10.15 Sea K un cuerpo numerico. Una base entera de K es una
base de OK como Z-m
odulo.
Como todo elemento de K es de la forma c/m, donde c OK y m Z,
es inmediato que una base entera de K es un generador de K como Q-espacio
vectorial, luego es de hecho una base de K.
As, si 1 , . . . , n es una base entera de K, tenemos que
K
OK

= {a1 1 + + an n | a1 , . . . , an Q},
= {a1 1 + + an n | a1 , . . . , an Z}.

En otros terminos, los enteros de K son los elementos cuyas coordenadas


son enteras.
Es importante tener claro que una base de un cuerpo K formada por enteros
no es necesariamente una base entera. Basta pensar que si v1 , . . . , vn es una
base entera de K, entonces 2v1 , . . . , vn sigue siendo una base de K formada
por enteros, pero ya no es una base entera, pues v1 es un entero algebraico y no
tiene coordenadas enteras respecto a esta segunda base.

382

Captulo 10. Enteros algebraicos


Un ejemplo m
as concreto: Es obvio que 1, 5 forman una base de Q 5 y
sus miembros son sin duda enteros algebraicos, pero
para
que fueran una base
entera hara falta que los enteros algebraicos de Q 5 fueran exactamente los
elementos de


1, 5 = {m + n 5 | m, n Z},
y esto no es evidente en absoluto como que es falso!
Ejercicio: Probar que

1+ 5
2

es un entero algebraico.

En general, determinar el anillo de enteros algebraicos de un cuerpo numerico


dado es un problema, cuanto menos, laborioso. Antes de ver algunos ejemplos
conviene entender un poco mejor la situaci
on en general.
Sea B una base entera de un cuerpo numerico K y C cualquier otra base
formada por enteros. Entonces cada componente de C se expresa como comB
binaci
on lineal
de B con coordenadas enteras, es decir, MC Matn (Z), luego
B

n = det MC es un n
umero natural no nulo y
[C] = n2 [B].

La base C ser
a una base entera si y s
olo si es una base de OK . Por 8.14 esto
sucede si y s
olo si det MB
olo si n = 1, si y s
olo si [C] = [B].
C = 1, o sea, si y s
En particular todas las bases enteras de K tienen el mismo discriminante.
Llamaremos discriminante de un cuerpo numerico K al discriminante de
cualquier base entera de K. Lo representaremos por K .
As pues, hemos probado que si C es cualquier base de K formada por enteros, entonces C es una base entera si y s
olo si [C] = K , y en general se tiene
[C] = n2 K , es decir, el discriminante de cualquier base formada por enteros
es divisible entre el discriminante de K (y el cociente es un cuadrado). Ahora
se entiende mejor por que hemos demostrado la existencia de bases enteras
tomando una con discriminante mnimo.
Una consecuencia obvia es la siguiente:
Teorema 10.16 Sea K un cuerpo numerico y B una base de K formada por
enteros y tal que [B] sea libre de cuadrados. Entonces B es una base entera
de K.
Antes de seguir con la teora veamos algunos ejemplos concretos de anillos
de enteros algebraicos.
Enteros cuadr
aticos Como primer ejemplo veamos el caso de los cuerpo
cuadr
aticos, es decir, los cuerpos numericos de grado 2.
En primer lugar, si K es un cuerpo cuadr
atico, K = Q(), donde es un
entero algebraico,
y
por
lo
tanto
ra
z
de
un
polinomio
x2 + bx + c Z[x]. As

b b2 4c
pues, =
y K = Q b2 4c . Podemos expresar b2 4c = m2 d,
2


donde d es libre de cuadrados, y as K = Q m d = Q d .

10.2. Anillos de enteros algebraicos

383


Tenemos, pues, que todo cuerpo cuadr
atico es de la forma K = Q d ,
donde d es un entero libre de cuadrados (obviamente d 6= 1). Como

pol mn d, Q = x2 d = x + d x d ,

resulta que los elementos de K son de la forma a + b d, donde a, b Q, la


extensi
on K/Q es una extensi
y sus automorfismos son la identidad

on de Galois
y el determinado por d = d. A este automorfismo lo llamaremos
simplemente conjugaci
on de K, y lo representaremos por una barra horizontal,
es decir,

a + b d = a b d.

En lo sucesivo, cuando hablemos de un cuerpo cuadr
atico Q d , sobrentenderemos que d es un entero libre de cuadrados.
A la hora de encontrar el anillo de enteros de un cuerpo numerico, el primer

paso es encontrar un elemento primitivo entero, en nuestro caso


tenemos d.
Esto nos da una base formada por enteros, concretamente {1, d}. Calculemos
su discriminante:
2
h i 1
2
1

1, d =
=
2 d = 4d.
d d

Con esto sabemos que el discriminante de K se diferencia de 4d a lo sumo en un


cuadrado, y como d es libre de cuadrados, s
olo hay dos posibilidades, K = 4d
o bien K = d.
El teorema 10.13 da una condici
on necesaria para el segundo caso, y es que
d 1 (mod 4) (no puede ser d 0 (mod 4) porque d es libre de cuadrados).
Veamos que la condici
on es tambien suficiente. Consideremos el n
umero

1+ d
=
.
2
Es f
acil calcular su polinomio mnimo, que resulta ser
x2 x +

1d
.
4

Vemos, pues, que si d 1 (mod 4) entonces es un entero algebraico y

2
1
2
1

[1, ] = 1+ d 1 d = d = d.
2

Como d es libre de cuadrados concluimos que {1, } es en este caso una base
entera de K. Resumimos en un teorema lo que hemos obtenido.

Teorema 10.17 Sea d un entero libre de cuadrados y K = Q d .

1. Si d 6 1 (mod 4) entonces OK = Z d y K = 4d.
h i
2. Si d 1 (mod 4) entonces OK = Z 1+2 d y K = d.

384

Captulo 10. Enteros algebraicos

Recordemos que el anillo Z[i], donde i = 1, se conoce con el nombre de

anillo de los enteros de Gauss. Este


fue el primer anillo
de enteros algebraicos
estudiado en profundidad. Es costumbre llamar i = 1, tal y como hemos
venido haciendo hasta ahora.
0
Ejercicio:
Probar
que
si d y d son enteros distintos libres de cuadrados entonces los
0
cuerpos Q d y Q d no son isomorfos.

En general no es f
acil calcular anillos de enteros, al menos no con la poca
base te
orica que tenemos. Disponemos de la suficiente algebra para desarrollar
la teora general sobre anillos de enteros algebraicos, pero enfrentarse con casos
concretos (por ejemplo para determinar bases enteras) es mucho m
as difcil que
obtener resultados generales. Puede decirse que entre los anillos de enteros, si
Z es la tierra firme, los cuerpos cuadr
aticos son la orilla del mar, pero queda
un oceano entero por explorar sobre el que podemos teorizar en la pizarra, pero
obtener im
agenes concretas de su fauna requiere expediciones demasiado bien
equipadas para nuestras posibilidades. No obstante, curiosear en la orilla es un
buen entrenamiento, y por ello los cuerpos cuadr
aticos van a ser nuestro modelo
b
asico. No obstante, en esta secci
on haremos dos excursiones por las profundidades. Con una base mejor los argumentos que vamos a emplear podran ser
sustituidos por otros m
as conceptuales y m
as simples.
Enteros ciclot
omicos Sea una raz p-esima primitiva de la unidad, donde
p es un n
umero primo impar, y consideremos el cuerpo K = Q(). Recordemos
que en el captulo VII obtuvimos que
p1

p1
P
P
Tr
ai i = pa0
ai ,
i=0

i=0

as como que N( i ) = 1 para todo i, N(1 ) = p.

Ahora debemos notar adem


as que la norma y la traza de los enteros de
un cuerpo numerico cualquiera son enteros racionales, pues por una parte son
n
umeros racionales y por otra son producto (o suma) de enteros algebraicos,
luego enteros. Con todo esto ya podemos demostrar el teorema siguiente:
Teorema 10.18 Sea p un n
umero primo impar y K = Q(), donde es una
raz p-esima primitiva de la unidad. Entonces OK = Z[].
n: Sea =
Demostracio

p2
P

ai i un entero ciclot
omico de orden p. Hemos

i=0

de probar que todos los coeficientes son enteros racionales. En principio sabemos
que la traza es un entero. M
as a
un, para cada 0 k p 2 tenemos que
Tr( k ) Z. As tenemos la misma informaci
on sobre todos los coeficientes:
Tr( k ) = pak
Tr() =

p2
P
i=0

p2
P
i=0

ai Z,

ai Z.

para k 6= p 1

10.2. Anillos de enteros algebraicos

385

Por lo tanto pak Z para todo k = 0, . . . , p 1. Llamemos bk = pak .


Hemos de probar que p | bk para todo k, con lo que los ak ser
an tambien
enteros. Consideremos = 1 . Sustituyendo = 1 y desarrollando
obtenemos
p2
p2
P
P
p =
bi i =
ci i ,
i=0

donde

i=0


p2
X
i j
ci =
(1)
bj Z,
i
j=i

para i = 0, . . . , p 2. Como = 1 , por simetra se cumple tambien


bi =


p2
X
j
(1)i
cj ,
i
j=i

para i = 0, . . . , p 2.
Por lo tanto basta probar que p | cj para todo j, pues entonces estas f
ormulas
implican que p tambien divide a los bi .
Lo probaremos por inducci
on. Suponemos que p | ci para cada i k 1 y
vamos a probar que p | ck , donde 0 k p 2.
La raz
on por la que hemos hecho el cambio de variable es que es una unidad
de OK , mientras que cumple N() = p (pronto veremos que esto implica que
es primo en OK ). Tenemos que
p = N(1 ) =

p1
Q
i=1

(1 i ) = (1 )p1

p1
Q
i=1

(1 + + + i1 ) = p1 ,

para cierto OK . Esto implica que p 0 (mod k+1 ), es decir, m


odulo el
ideal generado por k+1 en OK . Por otro lado,
0 p =

p2
P
i=0

ci i ck k

(mod k+1 ),

pues los terminos anteriores a ck k son m


ultiplos de p por hip
otesis de inducci
on
y los posteriores son m
ultiplos de k+1 directamente. Esto equivale a que ck k =
k+1 para un cierto OK , luego ck = .
Finalmente tomamos normas: cp1
= N(ck ) = N() N() = p N(), luego en
k
efecto p | ck .
Para calcular el discriminante de las extensiones ciclot
omicas nos basaremos
en el siguiente resultado general.
Teorema 10.19 Sea K = Q(a) un cuerpo numerico de grado n y llamemos
p(x) = pol mn(a, Q). Entonces

[1, a, . . . , an1 ] = (1)n(n1)/2 N p0 (a) ,


donde p0 (x) es la derivada formal de p(x).

386

Captulo 10. Enteros algebraicos

n: Seg
Demostracio
un vimos en la secci
on anterior,

2
Q
[1, a, . . . , an1 ] =
j (a) i (a) ,

(10.4)

1i<jn

donde 1 (a), . . . , n (a) son Q


los conjugados
de
a.
n
Por otro lado, p(x) = i=1 x i (a) , y se demuestra f
acilmente (por
inducci
on sobre n) que
p0 (x) =

n Q
n

P
x i (a) ,

j=1 i=1
i6=j

luego

Q
p0 j (a) =
j (a) i (a)
i=1
i6=j

para j = 1, . . . , n. Multiplicando todas estas ecuaciones obtenemos


n
n
n

Q
Q
Q
j p0 (a) =
p0 j (a) =
j (a) i (a) .
N p0 (a) =
j=1

j=1

i,j=1
i6=j

2
Agrupamos los pares j (a) i (a) i (a) j (a) = j (a) i (a) . El
n
umero de factores (1) que aparecen es n(n 1)/2, luego teniendo en cuenta
(10.4) queda
0
n(n1)/2
[1, a, . . . , an1 ],
N p (a) = (1)
y de aqu se sigue el teorema.

Como caso particular obtenemos:


Teorema 10.20 Sea p un primo impar. El discriminante del cuerpo ciclot
omico de orden p es igual a (1)(p1)/2 pp2 .
n: Sea una raz p-esima primitiva de la unidad. Como los
Demostracio
enteros ciclot
omicos son el anillo Z[], una base entera de Q() est
a formada
p
1
por 1, , . . . , p1 . El polinomio mnimo de es p(x) = xx1
y su derivada
vale
pxp1 (x 1) (xp 1)
p0 (x) =
,
(x 1)2
luego p0 () =

p p1
1 .

As pues,
0 pp1 1p1
= pp2 .
N p () =
p

Como p es impar, (1)(p1)(p2)/2 = (1)(p1)/2 y, por el teorema anterior,


[1, , . . . , p1 ] = (1)(p1)/2 pp2 .
Ejercicio: Comprobar el teorema 10.19 sobre los cuerpos cuadr
aticos.

10.2. Anillos de enteros algebraicos

387



El anillo de enteros de Q 3 2 . Vamos a probar que si K = Q 3 2 ,

entonces OK = Z 3 2 .

Recordemos que si llamamos = 3 2 y , a las otras races del polinomio


x3 2, entonces la clausura normal de K es Q(, ) y los monomorfismos de K
envan a , y respectivamente.

Un elemento de K es de la forma = ud + vd 3 2 + wd 3 2 2 , donde u, v, w, d


son enteros racionales primos entre s. Como la extensi
on tiene grado primo no
hay cuerpos intermedios, luego pol mn(, Q) tiene grado 3 y sus races son las
im
agenes de por los tres monomorfismos de K, o sea,
pol mn(, Q) = (x

u v
w
u v
w
u v
w
2 )(x 2 )(x 2 ).
d d
d
d d
d
d d
d

Operando (con bastante paciencia) se llega a


pol mn(, Q) = x3

3u 2 3u2 6vw
u3 + 2v 3 + 4w3 6uvw
x +
x
.
2
d
d
d3

Por lo tanto ser


a entero si y s
olo si
d
d2
d3

| 3u
| 3u2 6vw
| u3 + 2v 3 + 4w3 6uvw

(10.5)
(10.6)
(10.7)

Si existe un primo p tal que p | d y p | u, entonces por (10.6) p2 | 6vw, lo


que implica que p | v o p | w.
Si p | v por (10.7) p3 | 4w3 6uvw, y como p2 | uv, tambien p2 | 4w3 ,
luego p = 2. Pero entonces 4 | 2w3 3uvw y 4 | uv, luego 4 | 2w3 y p | w,
contradicci
on.
Si p | w entonces p3 | 2v 3 6uvw, luego p2 | 2v 3 y p | v, contradicci
on.
As pues (d, u) = 1 y entonces (10.5) implica que d= 1 o d = 3. Basta
probar que d no puede valer 3 y entonces estar
a en Z 3 2 .
Si d = 3, tenemos que (3, u) = 1, y de (10.6) se sigue que (3, v) = (3, w) = 1.
Tomando clases m
odulo 3 en (10.7) queda [u] [v] + [w] = 0. Las u
nicas
posibilidades son [u] = [w] = [1], [v] = [1] o bien [u] = [w] = [1], [v] = [1].
Si hacemos u = 3k + 1, v = 3l 1, w = 3r + 1, sustituimos en
u3 + 2v 3 + 4w3 6uvw
y tomamos clases m
odulo 27, despues de operar queda [9], cuando por (10.7)
debera ser 0.
Con la segunda posibilidad llegamos a [9], luego concluimos que d = 3 es
imposible.
Ahora el teorema 10.19 nos permite calcular el discriminante de la extensi
on:
La derivada del polinomio mnimo de es 3x2 , luego
K = (1)3(31)/2 N(32 ) = N(3) N()2 = 108.

388

10.3

Captulo 10. Enteros algebraicos

Divisibilidad en anillos de enteros

A la hora de estudiar la divisibilidad en anillos de enteros algebraicos es


pr
actico hablar en terminos de sus correspondientes cuerpos de cocientes, es
decir, si K es un cuerpo numerico las unidades, los elementos irreducibles, primos etc. de K son por definici
on las unidades, elementos irreducibles, primos,
etc. de OK . Todos estos conceptos seran triviales aplicados literalmente a K,
por ser un cuerpo. Vamos a ver que los anillos de enteros tienen propiedades
similares a las de Z, aunque no siempre son dominios de factorizaci
on u
nica. No
obstante, m
as adelante veremos que la divisibilidad en estos anillos sigue unas
leyes generales de las cuales la factorizaci
on u
nica de Z es un caso particular.
Una de las piezas clave en nuestro estudio ser
a el hecho de que en los anillos OK
hay definida una norma N : OK Z que conserva los productos. Conviene
recoger en un primer teorema sus propiedades principales:
Teorema 10.21 Sea K un cuerpo numerico y N : OK Z la norma asociada.
1. Para todo a, b OK , se cumple N(ab) = N(a) N(b).
2. Si a OK , entonces N(a) = 0 si y s
olo si a = 0.
3. N(1) = 1.
4. Si a OK , entonces a | N(a).
5. Si a OK , entonces a es una unidad si y s
olo si N (a) = 1 y entonces
N(a1 ) = N(a).
6. Si a, b OK son asociados, entonces N(a) = N(b).
7. Si a OK y N(a) es un n
umero primo, entonces a es irreducible en OK .
n: Las propiedades 1), 2), y 3) son consecuencia inmediata
Demostracio
de la definici
on de norma.
4) Basta observar que N(a)/a es un producto de conjugados de a, luego es
entero, y por otro lado est
a en K, luego N(a)/a OK .
5) Si a es una unidad, aa1 = 1, luego N(a) N(a1 ) = 1 y por lo tanto
N(a) = 1.
Si N(a) = 1 entonces a | 1, luego es una unidad. Como N(a) N(a1 ) = 1,
se cumple N(a1 ) = N(a).
6) es consecuencia de 5), pues dos asociados se diferencian en una unidad.
7) Si a = bc, con b, c OK , entonces N(a) = N(b) N(c), pero como N(a) es
primo, N(b) = 1 o bien N(c) = 1, luego uno de los dos es una unidad.
Ejercicio: Probar que 3 es primo en el anillo Z[i] a pesar de que su norma no es
prima.
Ejercicio: Si K es un cuerpo numerico y K tiene norma 1, es necesariamente
una unidad?

10.3. Divisibilidad en anillos de enteros

389

Tenemos caracterizadas las unidades de los cuerpos numericos como los enteros de norma 1. Obtener descripciones explcitas de los grupos de unidades es,
junto con la determinaci
on de los anillos de enteros, una de las cuestiones m
as
difciles a la hora de estudiar ejemplos concretos de cuerpos numericos, y resulta
imprescindible al abordar muchos problemas concretos. As, por ejemplo, los

resultados de Kummer sobre el Ultimo


Teorema de Fermat dependen fuertemente de un an
alisis de las unidades ciclot
omicas. En este libro estudiaremos
u
nicamente las unidades de los cuerpos cuadr
aticos. Un teorema de Dirichlet
afirma que el grupo de unidades de un cuerpo numerico es infinito salvo en
el caso de los cuerpos cuadr
aticos de discriminante negativo. Para estos cuerpos es f
acil mostrar explcitamente las unidades. Lo hacemos en el teorema
siguiente. El caso de los cuerpos cuadr
aticos de discriminante positivo es mucho
m
as complicado, y de momento no estamos en condiciones de abordarlo.
Teorema 10.22 Sea d un n
umero entero
y libre de cuadrados. En negativo

tonces el grupo U de las unidades de Q d es el siguiente:


Para d = 1, U = 1, 1 .

Para d = 3, U = {1, , 2 }, donde = 1+2 3 .


Para d < 3, U = {1}.


n: La norma en Q d viene dada por N(a+b d) = a2 db2 ,
Demostracio

luego si d < 0 tenemos que la norma es siempre positiva. Un entero a + b d es


una unidad si y s
olo si se cumple la ecuaci
on a2 db2 = 1.

2
2
Para d = 1 esta se reduce a a + b = 1, y adem
as los enteros de Q 1

son los elementos de Z 1 , luego a y b han de ser enteros racionales. Es
claro que las u
nicas soluciones enteras de a2 + b2 = 1 son (1, 0), (0, 1), (1, 0) y
(0, 1), de donde U es el grupo indicado.

Para d = 3 observamos que Q 3 es el cuerpo ciclot
omico de orden 3.
En efecto, como ya hemos observado en otras ocasiones, una raz
del tercer

polinomio ciclot
omico, x2 +x+1, es el n
umero del enunciado, luego Q 3 =
Q().
La norma de un elemento del anillo de enteros Z[] es
2
2
2
2 3
2
2
N(a + b) = (a + b)(a + b ) = a + ab + ab + b = a ab + b
1

1
=
(2a)2 2(2a)b + b2 + 3b2 = (2a b)2 + 3b2 .
4
4

El elemento a + b ser
a una unidad si y s
olo si 14 (2a b)2 + 3b2 = 1, o
sea, si y s
olo si (2a b)2 + 3b2 = 4.
Si b = 0 ha de ser 2a = 2, luego a = 1.
Si b = 1 ha de ser 2a b = 1 y es f
acil ver que entonces (a, b) ha de tomar
los valores (0, 1), (0, 1), (1, 1), (1, 1).
En total quedan las soluciones 1, y 1 , o de otra forma, 1,
y 2 .
As pues, las unidades de Z[] son {1, , 2 }.
Si d < 3 hemos de tener presente que a y b pueden ser enteros o semienteros,
es decir, a = A/2, b = B/2, con A, B Z. Como el caso semientero incluye al

390

Captulo 10. Enteros algebraicos

caso entero, basta probar que las u


nicas soluciones semienteras de a2 db2 = 1
son (1, 0) y (1, 0).
En efecto, tenemos A2 dB 2 = 4, pero si B 6= 0, entonces A2 dB 2 > 4,
pues en realidad d 5, luego ha de ser B = 0 y A2 = 4, o sea, a = 1, b = 0.
El caso restante d = 2 se razona igualmente.
Ocupemonos ahora de los ideales de los anillos de enteros. Los resultados
b
asicos son los siguientes:
Teorema 10.23 Sea K un cuerpo numerico y O su anillo de enteros. Entonces
1. O es un anillo noetheriano.
2. Si I es un ideal no nulo de O entonces el cociente O/I es finito.
3. Un ideal no nulo de O es primo si y s
olo si es maximal.
n: 1) Un ideal I de O es un Z-subm
Demostracio
odulo de O. Como O es
un Z-m
odulo libre de rango finito, I tambien lo es (teorema 5.40), luego I est
a
finitamente generado como Z-m
odulo y a fortiori como ideal.
2) Sea a I, a 6= 0. Sea n = N (a) 6= 0. Como a | n, se cumple
que n I.
Sea {v1 , . . . , vr } una base de O como Z-m
odulo. Entonces [v1 ], . . . , [vr ]
es un generador de O/I como Z-m
odulo, es decir, todo elemento de O/I se
puede expresar de la forma m1 [v1 ] + + mr [vr ], para ciertos n
umeros enteros
m1 , . . . , mr .
Por otra parte n[vi ] = [nvi ] = 0, para i = 1, . . . , r, pues n I. Esto significa
que el orden de cada [vi ] es menor o igual que n y por lo tanto los n
umeros
m1 , . . . , mr pueden tomarse siempre entre 0 y |n| 1. En consecuencia el anillo
O/I es finito.
3) Si P es un ideal primo no nulo, el anillo O/P es un dominio ntegro (por el
teorema 3.38) y 3.40 nos da que O/P es un cuerpo, luego el ideal P es maximal
(por 3.39).
El apartado 2) del teorema anterior puede precisarse m
as. El teorema siguiente muestra que la conexi
on de la norma con la divisibilidad es m
as fuerte
de lo que podra pensarse en un principio.
Teorema 10.24 Sea K un cuerpo numerico y O su anillo de enteros. Para
cada a O a 6= 0 se cumple que |O/aO| = | N(a)|.
n: Sea v1 , . . . , vn una base entera de K. Entonces todo eleDemostracio
mento de O es de la forma m1 v1 + + mn vn , con m1 , . . . , mn Z, y todo
elemento de aO es de la forma m1 av1 + + mn avn , luego una base de aO es
av1 , . . . , avn .
Sean 1 , . . . , n los monomorfismos de K. Entonces

2
2
[av1 , . . . , avn ] = i (avj ) = i (a)i (vj ) .

10.3. Divisibilidad en anillos de enteros

391

Por la multilinealidad del determinante podemos sacar un factor i (a) de


cada fila de la matriz, con lo que obtenemos

2
[av1 , . . . , avn ] = N(a)2 i (vj ) = N(a)2 K .

Sea C la matriz cuya fila i-esima la forman las coordenadas de avi en


v1 , . . . , vn . Entonces sabemos que [av1 , . . . , avn ] = |C|2 K , luego ha de ser
|C| = N(a).
Por otro lado en virtud del teorema 8.15 tenemos que
|O/aO| = | det C| = | N(a)|.
Ejercicio: Usar el cociente Z[i]/(3) para construir las tablas de la suma y el producto
de un cuerpo de 9 elementos.
Ejercicio: Sea K un cuerpo numerico y K un entero de norma prima. Probar
que es primo en OK .

Por u
ltimo demostramos que los anillos de enteros satisfacen una propiedad
que, seg
un el teorema 3.35 es una condici
on necesaria para que puedan tener
factorizaci
on u
nica. En primer lugar la demostramos para el anillo de todos los
enteros algebraicos:
Teorema 10.25 Si c A es raz de un polinomio m
onico p(x) E[x], entonces
c E.
n: Sea p(x) = xn + an1 xn1 + + a0 , donde cada ai E.
Demostracio
Sea B = Z[a0 , . . . , an1 ]. Entonces B es un subm
odulo del anillo de enteros
algebraicos de Q(a0 , . . . , an1 ), luego es un Z-m
odulo finitamente generado. Digamos que B = hv1 , . . . , vri. El mismo argumento
empleado en el teorema 10.8

prueba ahora que B[c] = 1, c, . . . , cn1 B (como B-m


odulo).
Sea N el Z-m
odulo generado por los elementos vi ck , donde 1 i r,
0 k n 1.
As, un elemento de B[c] es una combinaci
on lineal con coeficientes en B de
los ck y cada coeficiente es una combinaci
on lineal con coeficientes enteros de
los vi .
Por lo tanto Z[c] B[c] N y es, en consecuencia, un Z-m
odulo finitamente
generado. Por el teorema 10.8 concluimos que c es un entero algebraico.
Este teorema sirve para probar que determinados n
umeros algebraicos son
enteros. Por ejemplo, un caso particular es que toda raz n-sima de un entero
algebraico es un entero algebraico. Como consecuencia inmediata tenemos la
versi
on an
aloga para anillos de enteros algebraicos:
Teorema 10.26 Sea K un cuerpo numerico y O su anillo de enteros algebraicos. Sea p(x) un polinomio m
onico no constante con coeficientes en O. Si c es
una raz de p(x) en K, entonces c O.

392

Captulo 10. Enteros algebraicos

De aqu se sigue que cualquier anillo A cuyo cuerpo de cocientes sea K pero
que este estrictamente contenido en O no puede tener factorizaci
on u
nica, pues
un elemento de O \ A es raz de un polinomio con coeficientes enteros (luego
en A) y, sin embargo, no est
aen A, en contra de lo que exige el teorema 3.35.
Es el caso, por ejemplo, de Z[ 5].
Estamos comprobando que hay una gran similitud entre los anillos de enteros
algebraicos y el anillo Z, sin embargo esta similitud no llega hasta garantizar
la factorizaci
on u
nica. En efecto, sabemos que los anillos de enteros comparten
propiedades algebraicas con los DIPs y los DFUs, como que son noetherianos,
los ideales maximales coinciden con los primos, etc., pero no es cierto que todos
ellos sean DIPs o DFUs (como ya hemos comprobado en algunos ejemplos).
El hecho de que sean noetherianos garantiza que todo elemento de un anillo de
enteros (no nulo ni unidad) se descompone en producto de irreducibles. Tambien
sabemos que la factorizaci
on en irreducibles ser
au
nica (salvo orden o asociaci
on)
si y s
olo si los elementos irreducibles coinciden con los primos. Sin embargo,
esto no siempre sucede. Ahora vamos a estudiar la situaci
on en los cuerpos
cuadr
aticos.
Conviene distinguir entre cuerpos cuadr
aticos reales o imaginarios, seg
un
que esten generados por la raz cuadrada de un entero positivo o negativo o, en
terminos m
as intrnsecos, seg
un si su discriminante es positivo o negativo. La
diferencia principal entre unos y otros es que la norma de los cuerpos imaginarios
es siempre positiva, mientras que en los cuerpos reales hay
de norma

elementos
positiva y negativa. M
as exactamente, puesto que N a + b d = a2 db2 ,
cuando d < 0 hay s
olo un n
umero finito de valores de a, b que pueden hacer que
la norma tome un valor dado, mientras que si d > 0 no tenemos ninguna cota.
Esto hace que los cuerpos imaginarios se comportan mucho mejor que los cuerpos
reales. Por ello el argumento con el que hemos determinado las unidades de los
cuerpos cuadr
aticos imaginarios no sirve para los cuerpos reales. En general los
cuerpos cuadr
aticos imaginarios son los cuerpos numericos m
as sencillos.
Comencemos, pues, estudiando la unicidad de las factorizaciones en cuerpos imaginarios. A la hora de encontrar factorizaciones no u
nicas es preciso
asegurarse de que los factores considerados son irreducibles, lo cual no es obvio.
Por ejemplo, podra pensarse que las factorizaciones en Q(i)
10 = 2 5 = (3 + i)(3 i)
prueban que Q(i) no es un dominio de factorizaci
on u
nica, pero no es as. La
raz
on es que ninguno de los factores es irreducible.
Se cumple que 2 = (1 + i)(1 i) (no es difcil descubrirlo sin m
as que pensar
en a2 + b2 = 2). Como N(1 + i) = 2 es primo, 1 + i s es irreducible, al igual que
1 i.
Del mismo modo se concluye que 5 = (1 + 2i)(1 2i) es una descomposici
on
en irreducibles. Por lo tanto la factorizaci
on de 10 en irreducibles es
10 = (1 + i)(1 i)(1 + 2i)(1 2i).

10.3. Divisibilidad en anillos de enteros

393

Tabla 10.1: Factorizaciones no u


nicas en cuerpos cuadr
aticos imaginarios
d
5

= 23

= 23

10 14 = 2 7

13 14 = 2 7

14 15 = 3 5

15 4

= 22

22 26 =
23 6

26 27 =
29 30 =
30 34 =

1+ 15
2

1 15
2

1 + 17 1 17

2 11
= 1 + 21 1 21

2 13
= 1 + 22 1 22

1+ 23
1 23
23
=
2
2

3 3 3 = 1 + 26 1 26

2 3 5 = 1 + 29 1 29

2 17
= 2 + 30 2 30

17 18 = 2 3 3 =
21 22 =



1 + 5 1 5

6 6

2 + 10 2 10

1 + 13 1 13

1 + 14 1 14

La otra factorizaci
on se obtiene agrupando los factores en otro orden:
(1 + i)(1 2i) = 3 i
(1 i)(1 + 2i) = 3 + i
Hay otra raz
on por la que una aparente factorizaci
on doble puede no serlo.
Por ejemplo, tenemos que 5 = (1 + 2i)(1 2i) = (2 + i)(2 i). Esto se explica
porque los factores son asociados. En efecto:
1 + 2i = (i)(2 i)
1 2i = (i)(2 + i)
Con estas salvedades podemos buscar autenticos ejemplos de factorizaciones
dobles. Aunque este ejemplo no serva, nos da una idea provechosa, la de buscar
n
umeros irreducibles cuya norma no sea un primo.
La tabla 10.1 nos muestra que las factorizaciones no u
nicas
son algo bastante
frecuente. Vamos a comprobar el primer ejemplo. En Q 5 tenemos que



6.
N(2) = 4, N(3) = 9, N 1 + 5 = N 1 5 =


Como 5 6 1 (mod 4), el anillo de enteros de Q 5 es Z 5 .
Si 2 = xy fuera una descomposici
on no trivial de 2, es decir, donde x e y son
no unidades, entonces N(x) = N(y) = 2.

394

Captulo 10. Enteros algebraicos

Si x = a+b 5, entonces queda a2 +5b2 = 2. Si b 6= 0 entonces a2 +5b2 5,


luego ha de ser b = 0, pero entonces a2 = 2, lo que es imposible para a Z. As
pues 2 es irreducible.
Igualmente se prueba que no existen elementos de norma 3, lo que nos da la
irreducibilidad de los cuatro factores. Por u
ltimo, como

N 1 + 5 6= N(2), N(3),

podemos asegurar que 1 + 5 no es asociado ni de 2 ni de 3, luego las factorizaciones son distintas en sentido estricto.
Las comprobaciones restantes son un interesante ejercicio para el lector. Es
de destacar que incluso hay factorizaciones con distinto n
umero de factores en
cada miembro.
En los cuerpos cuadr
aticos reales el trabajo se complica debido a que las
normas pueden
ser negativas,
lo que impide descartar tan f
acilmente casos como

(x)
=
2
en
Q
5
.
Pese
a
ello,
la
tabla
10.2
contiene
algunos
ejemplos que
N
podemos comprobar.
Tabla 10.2: Factorizaciones no u
nicas en cuerpos cuadr
aticos reales
d

4 + 10 4 10

15 10 = 2 5 = 5 + 15 5 15

26 10 = 2 5 = 6 + 26 6 26

30 6 = 2 3 = 6 + 30 6 30
10 6

= 23 =

Por ejemplo, en Q 10 tenemos N(2) = 4, N(3) = 9, N 4 + 10 =


N 4 10 = 6. Basta probar que no hay enteros de norma igual a 2 ni a


3.

En primer lugar, el anillo de enteros es Z 10 . Si existiera un entero

x = a + b 10 tal que N(a + b 10) = a2 10b2 = 2 o 3, entonces tendra


que ser a2 2 o 3 (mod 10), o lo que es lo mismo, a2 2, 3, 7, 8 (mod 10).
Sin embargo, los cuadrados m
odulo 10 son: 0, 1, 4, 9, 6, 5, 6, 9, 4, 1, luego la
congruencia es imposible. Los otros casos se prueban de modo similar.
Los ejemplos anteriores no deben llevar al lector a pensar que la factorizaci
on
u
nica no se da nunca o casi nunca en cuerpos numericos. Vamos a ver ahora
algunos ejemplos de factorizaci
on u
nica. En general es difcil probar que un
cuerpo numerico es un DFU, salvo en un caso: cuando se trata de un dominio
eucldeo. Como siempre, los casos m
as simples son los cuerpos cuadr
aticos
imaginarios.

10.3. Divisibilidad en anillos de enteros

395

Teorema 10.27
umero negativo libre de cuadrados. El anillo de los
Sea d un n
enteros de Q d es un dominio eucldeo si y s
olo si d es uno de los cinco
n
umeros siguientes:
1, 2, 3, 7, 11
En estos casos, la norma eucldea es (a) = N(a).
n: En primer lugar veamos que los anillos indicados son en
Demostracio
efecto dominios eucldeos.
Es inmediato que la funci
on N cumple los requisitos para ser una norma
eucldea. S
olo hay que probar que la divisi
on eucldea es realizable.
Veamos que para ello es suficiente probar que para todo Q d existe
un entero tal que N( ) < 1.
En efecto, si se cumple esta condici
on, sean y dos enteros con 6= 0.
Consideremos

=
/.
Por
hip
o
tesis
existe
un entero tal que N(/) < 1,

es decir, N ( )/ < 1, luego N( ) < N(). Sea = . De este


modo hemos obtenido que = + , con N() < N().


Sea, pues, = r+s d Q d . Para d 6 1 (mod 4) tenemos que encontrar

un elemento = x + y d tal que x, y Z y (r x)2 d(s y)2 < 1.


En los casos d = 1 y d = 2 basta tomar como x e y los enteros racionales
m
as cercanos a los n
umeros racionales r y s, pues entonces |r x|, |s y| 1/2,
con lo que (r x)2 d(s y)2 1/4 + 2(1/4) = 3/4 < 1.
Los restantes valores de d son
congruentes con 1 m
odulo 4, luego buscamos

1+ d
un elemento de la forma x+y 2 , donde x, y son enteros racionales y de modo

2
que r x (1/2)y d s (1/2)y < 1.
Si tomamos como y el entero racional m
as cercano a 2s, tenemos entonces

2
que |2s y| 1/2, luego s (1/2)y 1/16 y d s (1/2)y 11/16. Nos

2
falta elegir x de modo
que r x (1/2)y < 5/16, para lo cual es suficiente
que r x (1/2)y 1/2, es decir, tomamos como x el entero m
as cercano a
r (1/2)y.
Respecto a los valores de d no contemplados en el enunciado, son 5, 6,
10

y los enteros libres de cuadrados menores que 11. Hemos visto que Q 5 ,

Q 6 y Q 10 no son dominios de factorizaci


on u
nica, luego no pueden
ser eucldeos. Supongamos ahora que d < 11 es libre de cuadrados, luego de
hecho d 13. Sea O el anillo de enteros. Si O fuera eucldeo podramos tomar
un O de norma eucldea mnima entre los enteros no nulos ni unitarios.
Entonces todo O se expresa como
r = 0, 1, 1, por
= c + r, donde

la elecci
on de . Esto significa que O/() = [0], [1], [1] , luego por el teorema
10.24 ha de ser N() 3.

Sea = (a/2)+(b/2) d, donde a y b son enteros. Tenemos que a2 db2 12,


y como d 13, necesariamente b = 0 y |a| 3, pero entonces = a/2 es entero
y no puede ser m
as que = 0, 1, 1, en contra de c
omo ha sido elegido.
Es importante notar que la prueba del teorema anterior nos da un criterio
pr
actico para calcular divisiones eucldeas en los cinco cuerpos a los que se aplica.

396

Captulo 10. Enteros algebraicos

Este criterio es especialmente simple en los casos d = 1 y d = 2, donde dados


dos enteros y , el cociente se obtiene como el entero cuyas coordenadas
est
an m
as pr
oximas a las de /, y el resto es simplemente la diferencia .
Por otra parte, los cinco cuerpos anteriores no son los u
nicos en los que la
factorizaci
on es u
nica. No obstante no hay muchos m
as. Puede probarse que
los u
nicos cuerpos cuadr
aticos con discriminante negativo que son dominios de
factorizaci
on u
nica son los correspondientes a los nueve valores siguientes de d:
Tabla 10.3: Cuerpos cuadr
aticos imaginarios con factorizaci
on u
nica
d = 1,

2,

3,

7,

11,

19,

43,

67

163.

En el captulo XI demostraremos que estos anillos son DFUs. Probar que


son los u
nicos excede nuestras posibilidades.
El caso de los cuerpos cuadr
aticos reales es todava m
as complicado. No
se sabe si hay infinitos de ellos que sean dominios de factorizaci
on u
nica. Los
valores de d menores que 100 para los que la factorizaci
on es u
nica son los
siguientes:
Tabla 10.4: Primeros cuerpos cuadr
aticos reales con factorizaci
on u
nica
d = 2, 3, 5, 6, 7, 11, 13, 14, 17, 19, 21, 22, 23, 29, 31, 33, 37, 38, 41,
43, 46, 47, 53, 57, 59, 61, 62, 67, 69, 71, 73, 77, 83, 86, 89, 93, 94, 97.
Tampoco se sabe si entre ellos hay un n
umero finito de dominios eucldeos.
Al menos
se
sabe
que
s
o
lo
un
n
u
mero
finito
de ellos son eucldeos con norma

(x) = N(x), pero se desconoce si puede haber cuerpos cuadr


aticos que sean
dominios
eucl
deos
con
otra
norma.
Los
cuerpos
cuadr
a
ticos
eucl
deos con la

norma N son exactamente los correspondientes a los siguientes valores de d:
Tabla 10.5: Cuerpos cuadr
aticos reales eucldeos

2, 3, 5, 6, 7, 11, 13, 17, 19, 21, 29, 33, 37, 38, 41, 57, 73
Aunque este resultado tambien escapa a las posibilidades de este libro, vamos
a probar una porci
on.
Teorema 10.28 Los cuerpos cuadr
aticos correspondientes a
d = 2, 3, 5, 6, 7, 13, 17, 21, 29
son dominios eucldeos con el valor absoluto de la norma.
n: El planteamiento es el mismo que en el teorema 10.27.
Demostracio
Para agrupar los casos en los que d es congruente con 1 m
odulo 4 y los casos en
los que no lo es, definimos
= 0,
E=d
si d 6 1 (mod 4)
= 1/2, E = (1/4)d si d 1 (mod 4).

10.3. Divisibilidad en anillos de enteros

397

La condici
on que hay que probar es entonces que para todo par de n
umeros
racionales r y s existen enteros x e y tales que

(r x y)2 E(s y)2 < 1.


(10.8)
Por reducci
on al absurdo vamos a suponer que existen r y s para los que
(10.8) no se cumple cualesquiera que sean x e y.
En primer lugar probamos que podemos suponer que 0 r, s 1/2.
Si d 6 1 (mod 4), podemos sustituir en (10.8) r, x, s, y por
1 r + u,

1 x + u,

2 s + v,

2 y + v,

donde 1 , 2 = 1 y u, v Z, sin que la expresi


on vare, y con esto podemos
reducir r y s al intervalo deseado.
Si d 1 (mod 4) la expresi
on (10.8) resulta inalterada si reemplazamos r,
x, s, y por una de estas alternativas:
1 r + u
r
r
1/2 r

1 x + u
xv
x+y
x

1 s
s + 2v
s
1s

1 y
y + 2v
y
1y

(10.9)
(10.10)
(10.11)
(10.12)

Mediante (10.9) podemos hacer 0 r 1/2. mediante (10.10) hacemos


1 s 1. Si es necesario, (10.11) nos da 0 s 1 y si s no es menor o igual
que 1/2, entonces (10.12) hace que lo sea.
Dados, pues, r y s entre 0 y 1/2 que no cumplan (10.8) para ning
un par
de enteros x e y, para cada uno de estos pares se ha de cumplir una de las dos
afirmaciones siguientes:
(r x y)2
E(s y)2

P (x, y) :
Q(x, y) :

1 + E(s y)2
1 + (r x y)2

Vamos a analizar tres casos particulares:


P (0, 0)
r2
P (1, 0)
(1 r)2
P (1, 0) (1 + r)2

1 + Es2
1 + Es2
1 + Es2

Q(0, 0)
Es2
Q(1, 0)
Es2
Q(1, 0) Es2

1 + r2
1 + (1 r)2
1 + (1 + r)2

Como 0 r 1/2 y E > 0, tenemos que P (0, 0) y P (1, 0) no pueden darse,


luego se cumplen Q(0, 0) y Q(1, 0).
Si se cumple P (1, 0), entonces, usando Q(1, 0) tenemos
(1 + r)2 1 + Es2 2 + (1 r)2 ,

(10.13)

lo que operando lleva a que 4r 2, luego r = 1/2. Sustituyendo en (10.13)


queda Es2 = 5/4.
Ahora bien, dando a E todos los valores permitidos por el enunciado del
teorema, en ning
un caso de obtiene un valor para s que tenga raz cuadrada
racional.

398

Captulo 10. Enteros algebraicos

Por lo tanto se cumple Q(1, 0), es decir, Es2 1+(1+r)2 2 y as E 8.


Pero sucede que E < 8 en todos los casos que estamos contemplando.
Terminamos la secci
on con algunas aplicaciones a los n
umeros enteros. El
siguiente resultado fue planteado por Fermat a sus contempor
aneos.
Teorema

Las u
nicas soluciones enteras de y 2 + 2 = x3 son (x, y) = (3, 5).

n: En primer lugar, y ha de ser impar, pues si fuera par


Demostracio
tambien lo sera x, y llegaramos a que 2 0 (mod 4). Si x e y cumplen la
ecuaci
on, entonces

y + 2 y 2 = x3 .

Un divisor com
un de y + 2 y de y 2 en Z 2 cumplira que

N() | N(y + 2) = x3 y, como tambien dividira a la diferencia, 2 2,


tambien N() | 8,
luego N()= 1 (es impar y potencia de 2).
As pues, y + 2, y
2
son primos entre s. Teniendo en cuenta la
factorizaci
on u
nica de Z 2 as como que las unidades en este anillo son
{1} y ambas son cubos, resulta que si dos n
umeros primos entre s son un

3
cubo, entonces cada factor lo es, es decir, y + 2 = a + b 2 para ciertos
enteros a y b.

Igualando los coeficientes de 2 obtenemos que 1 = b(3a2 2b2 ), lo que


s
olo es posible si b = 1 y a = 1, de donde y = 5 y por lo tanto x = 3.
Ejercicio: Si el producto de dos enteros de Gauss primos entre s es una potencia
cuarta lo es necesariamente cada factor? Es cierto con cubos?

La variante que veremos a continuaci


on, tambien propuesta por Fermat,
resulta un poco m
as complicada.
Teorema Las u
nicas soluciones enteras de la ecuaci
on y 2 + 4 = x3 son
(x, y) = (5, 11), (2, 2).
n: Supongamos primero que y es impar. Tenemos que
Demostracio
(2 + iy)(2 iy) = x3 .
Un divisor com
un de 2 + iy, 2 iy lo es tambien de su suma, 4, luego
N() | 16 y N() | x3 , impar, lo que implica que = 1 y los dos factores 2 + iy,
2 iy son primos entre s. Por consiguiente ambos son cubos, es decir, existen
enteros racionales a y b tales que 2+iy = (a+ib)3 . Conjugando, 2iy = (aib)3
y sumando las dos ecuaciones y simplificando se llega a que 4 = 2a(a2 3b2 ),
luego tenemos que a(a2 3b2 ) = 2.
Claramente entonces a = 1, 2, pero las u
nicas posibilidades que permiten
la existencia de b son a = 1, b = 1 y a = 2, b = 1. Entonces

3
x3 = (a + ib)(a ib) = (a2 + b2 )3

10.3. Divisibilidad en anillos de enteros

399

y los valores de x que se obtienen son x = 2, 5. De y 2 + 4 = 8, 125, obtenemos


que y = 2, 11.
Ahora queda el caso en que y es par. Digamos y = 2Y . Entonces x ha de
ser par tambien, x = 2X y se cumple Y 2 + 1 = 2X 3 . De aqu se sigue que Y es
impar. Factorizamos
(1 + iY )(1 iY ) = 2X 3 .
(10.14)
El m
aximo com
un divisor de 1 + iY y 1 iY divide a la suma 2 = i(1 + i)2 .
Como 1 + i es primo (tiene norma 2), dicho mcd ha de ser 1, 1 + i, o bien 2.
Claramente 2 no divide a 1 + iY , sin embargo, 1 + i s divide tanto a 1 + iY
como a 1 iY (se sigue de que Y es impar).
Al dividir los dos miembros de (10.14) entre (1 + i)2 , en el primer miembro
queda un producto de dos factores primos entre s, y en el segundo miembro
queda iX 3 = (iX)3 . Por lo tanto, cada factor del primer miembro ha de ser un
cubo. En particular (1+iY )/(1+i) es un cubo, es decir, 1+iY = (1+i)(a+ib)3 .
Conjugando y sumando como antes se llega a 1 = (a + b)(a2 4ab + b2 ) y de
aqu salen las soluciones a = 1, b = 0 o bien a = 0, b = 1, que implican
y = 2, y entonces x = 2.
Ahora veremos una interesante prueba debida a Nagell de una conjetura de
Ramanujan.
Teorema
(x, n)

Las u
nicas soluciones de la ecuaci
on x2 + 7 = 2n son las siguientes:
=

(1, 3),

(3, 4),

(5, 5),

(11, 7),

(181, 15).

n: Claramente, x tiene que ser impar, y podemos suponer que


Demostracio
es positivo. Supongamos primero que n = 2m. Entonces podemos factorizar
(2m + x)(2m x) = 7,
de donde 2m + x = 7 y 2m x = 1. Sumando, 2m+1 = 8, luego m = 2, n = 4,
x = 3.
Sea ahora n impar. El caso n = 3 lleva a la soluci
on (1, 3). Supongamos que
n > 3.

Trabajamos en el cuerpo Q 7 , cuyos enteros forman un dominio de
factorizaci
on u
nica. La descomposici
on en factores primos de 2 es la siguiente:

1 + 7
1 7
2=
2
2
Como x es impar, es f
acil ver que x2 +7 es m
ultiplo de 4. Tomando m = n2
podemos reescribir la ecuaci
on del siguiente modo:
x2 + 7
= 2m
4

y podemos factorizarla as en Q 7 :


m
m

x + 7
x 7
1 + 7
1 7
=
.
2
2
2
2

400

Captulo 10. Enteros algebraicos

Ninguno de los primos de la derecha divide a la vez


a los dos factores de
la izquierda, pues entonces dividira a su diferencia, 7, pero las normas
correspondientes no se dividen.
Por la unicidad de la factorizaci
on (y teniendo en cuenta que las unidades
son 1), podemos concluir que

x 7
1 7
=
,
2
2
donde esta expresi
on representa a dos ecuaciones de las que
desconocemos los
signos adecuados, pero en cualquier caso la ecuaci
on para x+ 2 7 debe tener a

la derecha un primo y la de x 2 7 debe tener el otro, mientras que la unidad


1 debe ser la misma en ambas ecuaciones. Al restarlas queda
m
m

1 + 7
1 7
7 =

.
2
2
Ahora probamos que
el signo ha
de ser negativo. Supongamos que es posi
tivo. Llamemos a = 1+ 2 7 y b = 1 2 7 . Estamos suponiendo que am bm =
a b.
Como a + b = 1 y ab = 2, tenemos lo siguiente:
a2 = (1 b)2 = 1 2b + b2 = 1 ab2 + b2 1 (mod b2 )
Por lo tanto am = a(a2 )(m1)/2 a (mod b2 ), y as
a b = am bm a 0 (mod b2 ),
es decir, b2 | b, lo cual

es imposible.
m
m
As pues, 2m 7 = 1 + 7
1 7 . Al desarrollar por el
teorema del binomio de Newton se cancelan los terminos pares y queda


m
m 3
m m
2m 7 = 2
7 + 2
7 + + 2
7 .
1
3
m

Sacamos factor com


un 2 y concluimos que 2m1 m (mod 7).
6
Como 2 1 (mod 7), es claro que si un n
umero m cumple esta congruencia,
tambien lo cumplen todos los congruentes con m m
odulo 42.
Si examinamos todos los n
umeros entre 0 y 41, vemos que los u
nicos que
cumplen la congruencia son m = 3, 5 y 13. El teorema estar
a probado si
demostramos que dos soluciones de la ecuaci
on original (en el caso que estamos
estudiando) no pueden ser congruentes m
odulo 42, pues entonces las u
nicas
soluciones posibles ser
an n = 5, 7, 15, con las que se corresponden x = 5, 11,
181.
Supongamos que m y m0 son soluciones de la ecuaci
on (en realidad queremos
decir que m + 2 y m0 + 2 lo son). Supongamos que m < m0 y m m0 (mod 42).
Sea 7l la mayor potencia de 7 que divide a m0 m. Entonces
m0 m
m0 m

1
m0
m m0 m
m
a =a a
=a
1 + 7
.
(10.15)
2

10.3. Divisibilidad en anillos de enteros

401
l

Como (7l+1 ) = 6 7l , el teorema 3.41 implica que 267 1 (mod 7l+1 ), y


como 6 7l | m0 m, tenemos
0

2m m 1 (mod 7l+1 ).

(10.16)

Una sencilla inducci


on (en la que se usa el teorema 3.23) prueba que
7l

1 + 7 = 1 + 7l 7 (1 + 7),

para cierto entero . Al elevar despues a (m0 m)/7l y desarrollar, obtenemos


que

0
(1 + 7)m m 1 + (m0 m) 7 (mod 7l+1 ).
(10.17)
Ahora pasamos la potencia de 2 al primer miembro
de (10.15),
tomamos

congruencias m
odulo 7l+1 en el anillo de enteros de Q 7 y sustituimos
(10.16) y (10.17), de lo que resulta

0
am am + am (m0 m) 7 (mod 7l+1 ).

(10.18)

7
De nuevo por inducci
on se prueba que am 1+m
(mod 7), luego pode2m

1+m 7
m
mos escribir a =
+ 7 para un cierto entero . Como 7l | m0 m, al
2m
sustituir en (10.18) queda
0

am am +

m0 m
7 (mod 7l+1 ).
2m

(10.19)

m0 m
7 (mod 7l+1 ).
2m

(10.20)

Conjugando:
0

bm bm

Pero al ser m y m0 soluciones de la ecuaci


on, tenemos

0
0
am bm = 7 = am bm ,
luego al restar (10.19) menos (10.20) llegamos a que

(m0 m) 7 0 (mod 7l+1 ).

Por lo tanto, la multiplicidad del primo 7 en m0 m es al menos 2l + 1,


pero esta ha de ser el doble de la multiplicidad
de 7 (visto como primo de Z) en

m0 m, luego la multiplicidad de 7 es al menos 2l + 2 y as 7l+1 | m0 m,


en contra de la elecci
on de l.

Hemos afirmado sin prueba que Q 163 es un DFU (a pesar de que


hemos demostrado que no es un dominio eucldeo). Se trata de un hecho muy
profundo que no estaremos preparados para probar hasta el captulo XI. De
momento vamos a aceptarlo para probar un curioso teorema de Euler:

402

Captulo 10. Enteros algebraicos

Teorema El polinomio p(x) = x2 + x + 41 toma valores primos sobre todos


los n
umeros naturales entre 0 y 39.
n: Es claro que si m < n, entonces p(m) < p(n), luego
Demostracio
los cuarenta primos que se obtienen son distintos. Tambien es f
acil ver que
p(n 1) = p(n), luego los 40 primeros n
umeros negativos dan los mismos
primos.

Como hemos dicho, la prueba usa la factorizaci


on u
nica en Q 163 . Un

entero de este cuerpo es de la forma x + y 1+ 2163 , donde x e y son enteros

racionales. Si hacemos y = 1 obtenemos un entero 2x+1+2 163 con la propiedad de que no tiene divisores enteros racionales no unitarios, y su norma es,
precisamente, x2 + x + 41.
Supongamos que m = x2 + x + 41 es compuesto para un cierto entero x tal
que 0 x 39. Puesto que m < 402 + 40 + 41 = 412 , Existir
a un primo p | m
tal que p 39.

Tenemos p divide al producto de 2x+1+2 163 por su conjugado,


pero no

puede dividir a ninguno de los dos factores, luego p no es primo en Q 163 .


Como tiene norma p2 , ha de descomponerse en producto de dos primos de norma
p. Digamos que

p = s + t 163 s t 163 = s2 + 163t2 ,


donde s y t son ambos enteros o ambos semienteros. Como p es un primo
racional, necesariamente t 6= 0. Esto nos da la contradicci
on
163 (2s)2 + 163(2t)2 = 4p 4 39 = 156.

Observemos que p(40) = 402 + 40 + 41 = 40 41 + 41 = 412 ya no es primo.


Los cuarenta primos alcanzados son:
41, 43, 47, 53, 61, 71, 83, 97, 113, 131, 151, 173, 197, 223, 251,
281, 313, 347, 383, 421, 461, 503, 547, 593, 641, 691, 743, 797, 853,
911, 971, 1 033, 1 097, 1 163, 1 231, 1 301, 1 373, 1 447, 1 523, 1 601.

10.4

Dominios de Dedekind

Ahora vamos a demostrar un resultado muy profundo sobre la aritmetica de


los cuerpos numericos. Vamos a ver que, a pesar de los ejemplos que acabamos
de ver, los anillos de enteros algebraicos s tienen factorizaci
on u
nica siempre
que admitamos la existencia de divisores ideales que no se corresponden con
elementos del anillo. Esta factorizaci
on u
nica se comporta de modo extremadamente regular y, aunque no es tan potente como la factorizaci
on u
nica real,

10.4. Dominios de Dedekind

403

en muchos casos es suficiente para comprender el comportamiento de estos anillos y, en parte, el comportamiento de los n
umeros enteros. El origen de las
ideas que vamos a exponer se remontan al estudio de Kummer sobre los enteros
ciclot
omicos. Kummer quera averiguar si los anillos de enteros ciclot
omicos
tienen factorizaci
on u
nica, y para ello se dedico a buscar factorizaciones de primos racionales por si encontraba alg
un contraejemplo. En este proceso lleg
oa
desarrollar una teora que le permita determinar a priori el n
umero de divisores primos que deba tener un primo racional p, sus multiplicidades, as como
criterios explcitos que le permitan determinar a que enteros ciclot
omicos deba
dividir cada factor, todo esto antes de encontrar dichos factores primos. Cuando
lleg
o por fin a encontrar un contraejemplo a la factorizaci
on u
nica su teora estaba tan perfeccionada y era tan coherente que Kummer pudo demostrar que
era consistente hablar de divisores ideales que se comportaran seg
un las reglas
que haba obtenido, aunque no se correspondieran con ning
un divisor real en
el anillo (del mismo modo que los antiguos algebristas trabajaban con n
umeros
imaginarios aunque no se correspondieran con ning
un n
umero real). A finales
del siglo XIX Dedekind formaliz
o la teora de Kummer identificando sus divisores ideales con los ideales en el sentido usual de la teora de anillos y probando
que los resultados de Kummer son v
alidos en una clase muy general de anillos
que ahora introducimos.
Recordemos que si a y b son ideales de un anillo D, su producto es
n

ab =
pi qi n N y pi a, qi b para i = 1, . . . , n .
(10.21)
i=1

En otras palabras, ab es el menor ideal que contiene a todos los productos


ab tales que a a y b b. Como a y b son ideales, estos productos est
an
contenidos en ambos, luego se cumple que ab a b.
Definici
on 10.29 Un dominio ntegro D es un dominio de Dedekind si todo
ideal propio de D (o sea, distinto de 0 y D) se descompone de forma u
nica salvo
el orden en producto de ideales primos.

Vamos a probar que la factorizaci


on ideal es formalmente an
aloga a la factorizaci
on real de los DFUs. Sin embargo tenemos un obst
aculo justo al principio,
y es que hay un hecho obvio en todo dominio ntegro cuyo an
alogo ideal no es
evidente: los elementos no nulos son simplificables. Para probar que los ideales
no nulos son simplificables demostraremos que el conjunto de los ideales de un
dominio de Dedekind se puede sumergir en un grupo, con lo que para simplificar un ideal en ambos miembros de una igualdad bastar
a con multiplicar por
su inverso en dicho grupo.
Definici
on 10.30 Sea D un dominio ntegro y K su cuerpo de cocientes. Un
ideal fraccional de D es un D-subm
odulo no nulo a de K tal que existe un c D
no nulo de manera que ca D (donde ca = {ca | a a}).
Si a es un ideal fraccional de D, entonces ca es D-subm
odulo de K contenido
en D, luego es un D-subm
odulo de D, o tambien, b = ca es un ideal no nulo de
D y a = c1 b.

404

Captulo 10. Enteros algebraicos

El recproco se prueba igualmente, luego, en definitiva, los ideales fraccionales de D son los conjuntos de la forma c1 b, donde b es un ideal no nulo de D
y c D es no nulo.
Tomando c = 1 deducimos que todos los ideales no nulos de D son ideales
fraccionales. Recprocamente, un ideal fraccional a es un ideal si y s
olo si a D
(por la propia definici
on).
Podemos definir el producto de dos ideales fraccionales por la misma f
ormula
(10.21) que para ideales. Es f
acil comprobar que efectivamente el producto de
ideales fraccionales es un ideal fraccional, as como que cumple la propiedad
asociativa.
Si c K es no nulo, llamaremos ideal fraccional principal generado por c al
ideal fraccional (c) = cD. Es f
acil ver que (c)a = ca. En particular (c)(d) = (cd).
Llamaremos 1 = (1) = D. Es claro que a 1 = a para todo ideal fraccional a.
Diremos que un ideal fraccional a es inversible si existe otro ideal fraccional b
tal que ab = 1. Es claro que si existe tal b entonces es u
nico, y lo representaremos
por a1 .
Todo ideal fraccional principal es inversible, pues (c)1 = (c1 ).
Antes hemos visto que todo ideal fraccional es de la forma c1 b, para cierto
ideal b y cierto entero c. En terminos del producto de ideales fraccionales
tenemos que todo ideal fraccional es de la forma (c)1 b, o sea, una fracci
on de
dos ideales. Para probar que los ideales fraccionales de un dominio de Dedekind
forman un grupo necesitamos unos hechos sencillos v
alidos en cualquier dominio
ntegro.
Teorema 10.31 Sea D un dominio ntegro.
1. Todo ideal fraccional principal de D es inversible.
2. Un producto de ideales de D es inversible si y s
olo si lo es cada factor.
3. Si un ideal inversible de D factoriza como producto de ideales primos,
entonces la descomposici
on es u
nica salvo el orden.
n: 1) Ya hemos observado que (c)1 = (c1 ).
Demostracio
2) Es obvio que si cada factor es inversible el producto tambien lo es (su
inverso es el producto de los inversos). Si el producto es inversible entonces
el inverso de un factor es el inverso del producto multiplicado por los factores
restantes.
3) Supongamos que un mismo ideal no nulo se expresa de dos formas
p1 pr = q1 qs
como producto de ideales primos (necesariamente no nulos). Podemos suponer
que r s.
Tomamos un factor (digamos p1 ) que no contenga estrictamente a ninguno
de los restantes. Por definici
on de ideal primo, y puesto que q1 qs p1 , ha

10.4. Dominios de Dedekind

405

de existir un ndice i de modo que qi p1 . Reordenando podemos suponer que


q1 p1 . Igualmente ha de existir un ndice j tal que pj q1 p1 . Por la
elecci
on de p1 ha de ser pj = q1 = p1 . Tomando inversos podemos eliminarlos
de la factorizaci
on, hasta llegar a que D = qsr qs qs , lo que contradice la
definici
on de ideal primo a no ser que r = s. Es claro que con esto el teorema
queda demostrado.
Teorema 10.32 Si D es un dominio de Dedekind, entonces los ideales fraccionales de D forman un grupo. Adem
as los ideales primos (no nulos) coinciden
con los maximales.
n: Basta probar que todo ideal primo (no nulo) tiene un
Demostracio
inverso y es maximal, pues entonces todo ideal no nulo ser
a inversible por ser
producto de ideales primos (inversibles) y todo ideal fraccional ser
a inversible
porque es de la forma (c)1 b, donde (c)1 es ciertamente inversible y b es un
ideal, luego inversible tambien.
Vemos primero que todo ideal primo inversible es maximal. Sea p un ideal
primo. Hay que demostrar que si d D \ p entonces p + (d) = D. En caso
contrario existen ideales primos tales que p+(d) = p1 pr y p+(d2 ) = q1 qs .
Es f
acil ver que

p + (d) /p = p1 /p pr /p
y
p + (d2 ) /p = q1 /p qs /p .


El ideal p + (d) /p = [d] es principal y D/p es un dominio ntegro, luego
tiene inverso por el teorema anterior, el cual nos da tambien que todos los ideales
primos p1 /p, . . . , pr /p tienen inverso en D/p.
Lo mismo ocurre con q1 /p, . . . , qs /p. Igualamos:



2
2

2
q1 /p qs /p = [d2 ] = [d] = p1 /p pr /p .

Otra aplicaci
on del teorema anterior nos da que s = 2r y que, ordenando
adecuadamente, pi /p = q2i /p = q2i1 /p. De aqu se sigue que pi = q2i = q2i1 ,

2
y de aqu a su vez obtenemos que p + (d2 ) = p + (d) . Consecuentemente

2
p p + (d2 ) = p + (d) p2 + (d).

Todo elemento de p es, pues, de la forma c + ad, con c p2 y a D, pero


como p es primo y d
/ p, ha de ser a p, lo que prueba que p p2 + p(d) p,
es decir, p = p2 + p(d), y como p tiene inverso, 1 = p + (d), contradicci
on.
Finalmente, si p es cualquier ideal primo no nulo, sea c p, c 6= 0. Como
D es un dominio de Dedekind podemos factorizar (c) = p1 pr p, donde los
ideales primos pi son todos inversibles (por el teorema anterior, ya que (c) lo es)
y en consecuencia maximales (por lo ya probado). Por definici
on de ideal primo,
alg
un ideal pi est
a contenido en p, luego por maximalidad p = pi es maximal y
tiene inverso.
Ahora ya podemos trabajar con dominios de Dedekind como si fueran DFUs.

406

Captulo 10. Enteros algebraicos

Definici
on 10.33 Sea D un dominio de Dedekind. Diremos que un ideal b
divide a un ideal a si existe un ideal c tal que a = bc. Lo representaremos b | a.
Notemos que en tal caso c = ab1 . Claramente b | a si y s
olo si ab1 es un
ideal.
Observemos que b | a si y s
olo si a b. En efecto, si b | a entonces a = bc b
y si a b la propia definici
on de producto nos da que ab1 bb1 = 1 = D,
luego el ideal fraccional ab1 es de hecho un ideal y por lo tanto b | a.
As, un ideal p es primo si y s
olo si p 6= 1 y cuando p | ab entonces p | a
o p | b, es decir, el concepto de ideal primo en un dominio de Dedekind es
formalmente an
alogo al de primo real en un DFU.
Similarmente, un ideal p es maximal si y solo si p 6= 1 y cuando a | p entonces
a = 1 o a = p, es decir, el concepto de ideal maximal en un dominio de Dedekind
es formalmente an
alogo al de elemento irreducible en un DFU (notemos que en
terminos de ideales no hay ni unidades ni asociados). Hemos probado que en
un dominio de Dedekind maximal equivale a primo, lo cual es an
alogo al hecho
de que en un DFU irreducible equivale a primo.
Si c D escribiremos a | c o c = ab en lugar de a | (c) o (c) = ab. De este
modo los divisores ideales pueden dividir a elementos reales. Concretamente,
tenemos a | c si y s
olo si (c) a, si y s
olo si c a, es decir, un ideal, como
conjunto, es el conjunto de todos sus m
ultiplos reales. Notar tambien que a | b
si y s
olo si (a) | (b).
La factorizaci
on u
nica ideal nos permite hablar de la multiplicidad de un
ideal primo en otro ideal (o en un elemento real) exactamente en el mismo
sentido que en un DFU. Toda familia finita de ideales tiene un m
aximo com
un
divisor y un mnimo com
un m
ultiplo que se pueden calcular como en un DFU,
aunque en realidad hay una caracterizaci
on m
as simple: Teniendo en cuenta que
a | b es lo mismo que b a, resulta que el m
aximo com
un divisor de una familia
de ideales es el menor ideal que los contiene, y el mnimo com
un m
ultiplo es el
mayor ideal contenido en ellos, o sea:
mcd(a1 , . . . , ar ) = a1 + + ar ,
mcm(a1 , . . . , ar ) = a1 ar .
(esto generaliza el teorema de Bezout.)
En particular (a, b) = (a) + (b) puede entenderse como el ideal generado por
a y b o como el m
aximo com
un divisor de (a) y (b). Es equivalente. Podemos
hablar de ideales primos entre s, etc. con las mismas propiedades que en un
DFU.
Es f
acil encontrar DFUs que no sean dominios de Dedekind. Por ejemplo
Z[x] no es un dominio de Dedekind ya que Z[x]/(x)
= Z, luego (x) es un ideal
primo no maximal. Recprocamente veremos que todos los anillos de enteros
algebraicos son dominios de Dedekind y muchos de ellos no son DFUs. Por lo
tanto la divisibilidad ideal no es una generalizaci
on de la real, sino que ambas
son paralelas. Las dos pueden darse simult
aneamente. Esto ocurre exactamente
en los DIPs:

10.4. Dominios de Dedekind

407

Teorema 10.34 Un dominio ntegro D es un DIP si y s


olo si es un dominio
de Dedekind y un dominio de factorizaci
on u
nica.
n: Si D es DIP ya sabemos que es DFU, y todo ideal propio
Demostracio
de D es de la forma (c), donde c no es 0 ni una unidad. Entonces c se descompone
en producto de primos c = p1 pn , con lo que (c) = (p1 ) (pn ) tambien es
producto de ideales primos. Recprocamente, una descomposici
on de (c) en
ideales primos da lugar a una factorizaci
on de c, de donde se sigue la unicidad.
Si D es a la vez un dominio de Dedekind y un DFU entonces dado un ideal
primo p tomamos un c p no nulo y lo factorizamos c = p1 pn en producto
de primos. Tenemos que p | c, luego p | pi para alg
un i, luego (pi ) p y como
los ideales primos son maximales, p = (pi ) es principal, y todo ideal propio de
D es principal por ser producto de ideales primos principales.
Observemos que el teorema 3.18 implica que un dominio de Dedekind es un
dominio de factorizaci
on u
nica si y s
olo si todos sus elementos irreducibles son
primos, mientras que 3.53 implica que un dominio de factorizaci
on u
nica es un
dominio de Dedekind si y s
olo si todos sus ideales primos son maximales.
Ejercicio: Probar que si X es infinito entonces Q[X] es un DFU no noetheriano.

El concepto de DFU es muy u


til en cuanto que proporciona un gran control
sobre los anillos que tienen esta propiedad, pero est
a el inconveniente de que no
es f
acil determinar cu
ando se da el caso. As, por ejemplo, hasta ahora no hemos
sabido probar que un anillo de enteros algebraicos tiene factorizaci
on u
nica salvo
en el caso en que de hecho es un dominio eucldeo, pero esta propiedad es mucho
m
as fuerte y deja de cubrir muchos casos de interes. El concepto de dominio
de Dedekind, en cambio, admite una caracterizaci
on algebraica muy f
acil de
verificar en la pr
actica. Ve
amosla:
Teorema 10.35 (Teorema de Dedekind) Sea D un dominio ntegro y K su
cuerpo de cocientes. Entonces D es un dominio de Dedekind si y s
olo si cumple
las tres propiedades siguientes:
1. D es noetheriano.
2. Los ideales primos no nulos de D son maximales.
3. Si a K es raz de un polinomio m
onico con coeficientes en D, entonces
a D.
n: Todo dominio de Dedekind es noetheriano, pues una caDemostracio
dena de ideales estrictamente creciente significara una cadena decreciente de divisores, lo cual es imposible. La propiedad 2) est
a probada en el teorema 10.32.
La prueba del teorema 3.35 vale para probar 3) sin m
as cambio que considerar
divisores ideales en vez de reales.
Supongamos ahora que un dominio ntegro D cumple las tres propiedades
del enunciado y veamos que es un dominio de Dedekind. Dividimos la prueba
en varios pasos.

408

Captulo 10. Enteros algebraicos

(i) Sea a 6= 0 un ideal de D. Entonces existen ideales primos p1 , . . . , pr de


manera que p1 pr a.
En caso contrario por el teorema 3.7 existe un ideal a tal que no existen
ideales primos en las condiciones pedidas y que es maximal entre los ideales
para los que esto ocurre.
En particular a no puede ser primo, o cumplira (i) trivialmente. Tampoco
puede ser que a = D. Por lo tanto existen dos ideales b y c tales que bc a,
pero no b a o c a.
Por la maximalidad de a, existen ideales primos p1 , . . . , ps y ps+1 , . . . , pr
tales que
p1 ps a + b,
ps+1 pr a + c,
de donde p1 pr (a + b)(a + c) aa + ab + ac + bc a, contradicci
on.
(ii) Si a es un ideal no nulo de D, llamaremos a1 = {x K | xa D}.
Es claro que a1 es un D-subm
odulo de K, y para cualquier c a no nulo
se cumple que ca1 D, luego a1 es un ideal fraccional de D.
Tambien es inmediato que D a1 , luego a = aD aa1 .
De la definici
on de a1 se sigue que aa1 = a1 a D. Esto significa que el
ideal fraccional a1 a es de hecho un ideal de D.
Notar tambien que si a b son dos ideales de D, entonces D b1 a1 .
(iii) Si a es un ideal propio, entonces D a1 .
Sea p un ideal maximal de D tal que a p. Entonces p1 a1 . Basta
probar que p1 contiene estrictamente a D. Sea a p no nulo. Por (i), sea
r el menor natural tal que existen ideales primos para los que p1 pr (a).
Como (a) p y p es primo, existe un ndice i tal que pi p. Reordenando
podemos suponer que p1 p. Como p1 es maximal ha de ser p1 = p, y por
la minimalidad de r tenemos que p2 pr no est
a contenido en (a). Tomamos,
pues, un elemento b p2 pr \ (a).
Claramente bp (a), luego ba1 p a1 (a) = D y ba1 p1 , pero por
otra parte b
/ (a) = aD, luego ba1
/ D. As pues, p1 6= D.
(iv) Si a es un ideal no nulo de D y S es un subconjunto de K tal que aS a,
entonces S D.
Sea s S. Como D es noetheriano tenemos que a = (a1 , . . . , am ) para
ciertos a1 , . . . , am D. Por hip
otesis ai s a para i = 1, . . . , m, luego existen
elementos bij D de manera que
ai s =

m
X

bij aj

para i = 1, . . . , m.

j=1

Como los ai no son todos nulos, esto quiere decir que s es un valor propio
de la aplicaci
on lineal en K n definida por la matriz B = (bij ), luego s es raz
del polinomio caracterstico p(x) = |B xIm | D[x], que es m
onico. Por la
hip
otesis 3) tenemos que s D.

10.4. Dominios de Dedekind

409

(v) Si p es un ideal maximal de D, entonces pp1 = D.


Por (ii) sabemos que pp1 es un ideal de D tal que p pp1 D. Puesto
que p es maximal, ha de ser p = pp1 o bien pp1 = D. Si se diera el primer
caso, por (iv) tendramos que p1 D, lo que contradice a (iii).
(vi) Si a 6= 0 es un ideal, entonces aa1 = D.
Supongamos lo contrario. Como D es noetheriano existe un ideal a maximal
entre los que incumplen (vi). Obviamente a 6= D. Sea p un ideal maximal tal
que a p.
Por (ii) D p1 a1 , luego a ap1 aa1 D. En particular el ideal
fraccional ap1 es un ideal de D. No puede ocurrir que a = ap1 , pues entonces
(iv) implicara que p1 D en contradicci
on con (iii). As pues, a ap1 , luego
1
la maximalidad de a implica que ap cumple (vi), es decir, que ap1 (ap1 )1 =
D. Por definici
on de a1 esto significa que p1 (ap1 )1 a1 . Por lo tanto
1
1 1
D = ap (ap )
aa1 D, de donde aa1 = D, en contradicci
on con
nuestra hip
otesis.
(vii) Todo ideal propio de D es producto de ideales primos.
En caso contrario sea a un ideal propio maximal entre los que no pueden
expresarse como producto de ideales primos. En particular a no es primo. Sea
p un ideal maximal tal que a p. Como en (vi) concluimos que a ap1 D
y de nuevo por (iv) y (iii), la primera inclusi
on es estricta.
Por la maximalidad de a tenemos que ap1 = p1 pr para ciertos ideales
primos p1 , . . . , pr . Por lo tanto a = p1 pr p, en contra de la elecci
on de a.
(viii) La descomposici
on de un ideal en primos es u
nica salvo el orden.
Supongamos que un mismo ideal propio se expresa de dos formas
p1 pr = q1 qs
como producto de ideales primos (necesariamente no nulos). Podemos suponer
que r s.
Entonces, puesto que p1 es primo y q1 qs p1 , ha de existir un ndice i tal
que qi p1 . Reordenando podemos suponer que q1 p1 y, por maximalidad,
de hecho q1 = p1 . Multiplicando por el inverso tenemos p2 pr = q2 qs .
Repitiendo el proceso llegamos a que pi = qi para i = 1, . . . , r y (si r < s) a que
D = qsr qs , pero entonces D qs , lo cual es imposible. Por lo tanto ha de
ser r = s.
Observemos que la prueba del teorema anterior nos ha dado una expresi
on
explcita para el inverso de un ideal en un dominio de Dedekind:
a1 = {x K | xa D}.
Los teoremas 10.23 y 10.26, junto con el teorema de Dedekind, implican
que todo anillo de enteros algebraicos de un cuerpo numerico es un dominio de

410

Captulo 10. Enteros algebraicos

Dedekind. El teorema 10.23 afirma tambien que estos anillos de enteros cumplen
una propiedad adicional muy importante que no poseen todos los dominios de
Dedekind, y es que los cocientes m
odulo ideales no nulos son finitos. El anillo
Q[x] es un ejemplo de dominio de Dedekind que no cumplen esta condici
on.
El interes de la finitud de los cocientes reside en que es la clave para definir
la norma de un ideal, que representar
a el mismo papel que la norma de los
elementos reales en el estudio de la divisibilidad. En efecto:
Definici
on 10.36 Sea K un cuerpo numerico. Si a es un ideal no nulo de OK ,
llamaremos norma de a al cardinal del anillo cociente: N(a) = |O/a|.
As, la norma de a es un n
umero natural no nulo y N(a) = 1 si y s
olo si
a = 1. El teorema 10.24 implica adem
as que si a O entonces N (a) = | N(a)|,
es decir, que la norma de ideales extiende (salvo signo) a la de enteros reales.
El teorema siguiente acaba de garantizar que la norma de ideales se comporta
satisfactoriamente:
Teorema 10.37 Sea K un cuerpo numerico y O su anillo de enteros. Si a, b
son dos ideales no nulos de O, entonces N(ab) = N(a) N(b).
n: Por la unicidad de la factorizaci
Demostracio
on en primos e inducci
on
sobre el n
umero de factores, basta probar que N(ap) = N(a) N(p) cuando p es
un ideal primo (el caso en que uno de los factores es 1 es obvio).
Consideremos los grupos abelianos finitos a/ap O/ap. El tercer teorema de
isomorfa implica que |O/ap| = |O/a| |a/ap|, o sea, N(ap) = N(a) |a/ap|. Basta
probar que |a/ap| = |O/p|. Notemos que por la factorizaci
on u
nica ap no puede
ser igual a p, luego ap a, es decir, |a/ap| > 1.
Por el mismo motivo no pueden existir ideales b de O tales que ap b a,
pues entonces a | b | ap, luego la descomposici
on en factores de b debe contener
a la de a y estar contenida en la de ap, luego b ser
a igual a ap o a a seg
un que
la multiplicidad de p en b sea la de ap o la de a.
Por lo tanto, si a a\ap, entonces a = ap+(a) y a su vez esto implica que la
aplicaci
on f : O a/ap dada por f (x) = [xa] es un epimorfismo de O-m
odulos
con la propiedad de que p N(f ). Ahora, N(f ) es un O-subm
odulo de O, o
sea, un ideal. Como p es maximal, ha de ser N(f ) = p o N(f ) = O, pero el
segundo caso implicara que a/ap
on.
= O/O, con lo que |a/ap| = 1, contradicci
Lo correcto es a/ap
= O/p, y as |O/p| = |a/ap|.
Con esto estamos en condiciones
omodamente. Vimos en
de ver ejemplos c
la secci
on anterior que en Q 5 tenamos las siguientes descomposiciones en
irreducibles:

6 = 2 3 = 1 + 5 1 5 .
(10.22)
Esto prueba que 2 no es primo, y como N(2) = 4, el ideal (2) s
olo puede
descomponerse en producto de dos ideales primos de norma 2, o sea, 2 = p1 p2 .
Igualmente 3 ha de ser producto de dos ideales de norma 3, digamos 3 = qr.
Por otra parte, los factores de la derecha en (10.22) tienen los dos norma 6,
luego han de descomponerse en producto de un ideal de norma 2 por otro de

10.4. Dominios de Dedekind

411


norma 3. La unicidad de la factorizaci
on obliga a que sea 1 + 5 = p1 q y

1 5 = p2 r, de modo que la factorizaci


on u
nica de 6 es

6 = 2 3 = (p1 p2 )(qr) = (p1 q)(p2 r) = 1 + 5 1 5 .

M
as a
un, evidentemente
aximo com
un divisor de 2 y 1 + 5, es

p1 es el m
decir, que p1 = 2, 1 + 5 .




Similarmente p2 = 2, 1 5 , q = 3, 1 + 5 y r = 3, 1 5 .


Finalmente observamos que p1 = p2 , pues 1 5 = 2 1 + 5 . Por


el contrario q 6= r, pues en otro caso 1 = 3 1 + 5 + 1 5 q, o lo
que es lo mismo, q = 1.
Si llamamos p = p1 = p2 , la factorizaci
on de 6 es,
en definitiva,
6 = p2 qr. Los

factores son ideales porque no est


an en el anillo Z 5 , pero se comportan
como si lo estuviesen.
Ejercicio: Obtener las factorizaciones ideales correspondientes a las factorizaciones
no u
nicas mostradas en el captulo anterior en cuerpos cuadr
aticos reales e imaginarios.

El teorema siguiente recoge los hechos b


asicos sobre las normas de ideales
an
alogos a los ya conocidos para normas de enteros reales.
Teorema 10.38 Sea K un cuerpo numerico y a, b ideales de OK .
1. Si a | b entonces N(a) | N(b).
2. Si N(a) es un n
umero primo, entonces a es un ideal primo.
3. a | N(a).
4. Si a es un ideal primo no nulo, entonces a divide a un u
nico primo racional
p y se cumple que N(a) = pm para cierto natural m menor o igual que el
grado de K.
n: 1) es consecuencia inmediata del teorema 10.37.
Demostracio
2) Un ideal de norma prima no puede descomponerse en primos (por 1),
luego ha de ser primo.
3) Por definici
on, N(a) = |OK /a|. El anillo OK /a es en particular un grupo
finito (con la suma) y el orden de cualquier elemento es divisor de N(a). Por lo
tanto N(a)[1] = [0], lo que equivale a que N(a) a.
4) Como a | N(a) y a es primo, a debe dividir a uno de los primos racionales
que dividen a N(a). Digamos que a | p. Entonces N(a) | N(p) = pn , donde n es
el grado de K. Consecuentemente, N(a) = pm para un cierto m n.
Si a dividiera a otro primo q, el mismo argumento nos dara que N(a) habra
de ser potencia de q, lo cual es imposible salvo si q = p.
Este teorema contiene informaci
on relevante a la hora de estudiar los ideales
propios de un anillo de enteros. El apartado 4) nos dice que todo ideal primo
divide a un primo racional, por lo que factorizando los primos racionales se

412

Captulo 10. Enteros algebraicos

encuentran todos los ideales primos. La unicidad de 4) implica que los primos
racionales (no asociados) son primos entre s, de donde se sigue la existencia de
infinitos ideales primos en cada anillo de enteros (al menos uno distinto para
cada primo racional).
Los hechos siguientes son muy sencillos, pero a menudo resultan u
tiles:
Teorema 10.39 Sea K un cuerpo numerico.
1. Cada ideal no nulo de OK tiene s
olo un n
umero finito de divisores.
2. Cada elemento no nulo de OK pertenece a un n
umero finito de ideales.
3. S
olo un n
umero finito de ideales pueden tener una norma dada.
n: 1) es consecuencia inmediata de la factorizaci
Demostracio
on u
nica.
2) es un caso particular de 1).
3) se sigue de 1) porque cada ideal es un divisor de su norma.
Veamos ahora que en la mayora de los casos es muy f
acil encontrar las
factorizaciones ideales de los primos racionales (y con ello ir encontrando todos
los ideales primos de un anillo de enteros). El teorema siguiente da cuenta de
ello.
Teorema 10.40 Sea K un cuerpo numerico y supongamos que el anillo de los
enteros de K es de la forma Z[], para un entero algebraico . Sea g(x) =
pol mn(, Q) y p un primo racional. Sea g(x) la imagen de g(x) por el epimorfismo de Z[x] sobre (Z/pZ)[x] y sea g = g1e1 grer la descomposici
on de
g en po
linomios m
onicos irreducibles en (Z/pZ)[x]. Entonces los ideales pi = p, gi () ,
para i = 1, . . . , r son primos distintos y la descomposici
on de p en primos es
p = pe11 perr .
n: Para cada i = 1, . . . , r, sea i una raz de gi (x) en una
Demostracio
extensi
on de Z/pZ. Entonces (Z/pZ)(i ) es una extensi
on finita de Z/pZ y
gi = pol mn(i , Z/pZ).

Consideremos la aplicaci
on i : Z[] (Z/pZ)(i ) dada por i q() =
q(i ). Est
a bien definida, pues si q() = r(), entonces (q r)() = 0, luego
g | q r, de donde g | q r, y tambien gi | q r, luego q(ai ) r(ai ) = 0.
(Z/pZ)(i ), y el
Obviamente i es un epimorfismo, luego Z[]/ N(i ) =
segundo anillo esun cuerpo,
de
donde
(
)
es
un
ideal
primo
de Z[].
N
i

Es claro que p, gi () N(i ) (la imagen de p es [p] = 0). Veamos la otra


gi (x). El hecho
inclusi
on. Si q() N(i ), entonces q(i ) = 0, luego q(x) = h(x)
gi (x) = 0 significa que todos los coeficientes del polinomio
de que q(x) h(x)
q(x) h(x)gi (x) son m
ultiplos de p. Consecuentemente

q() = q() h()gi () + h()gi () p, gi () .

Por lo tanto, pi = p, gi () = N(i ) es un ideal primo que obviamente


divide a p.

10.4. Dominios de Dedekind

413

Aplicando que, en general, (p, u)(p, v) (p, uv) concluimos que

pe11 perr p, g1 ()e1 gr ()er = p, g() = (p, 0) = (p).

Notar que la primera igualdad se debe a que g() y g1 ()e1 gr ()er se diferencian en un entero m
ultiplo de p.
As pues, p | pe11 perr . La igualdad la obtendremos considerando las normas.

Por definici
on de norma, N(pi ) = |Z[]/pi | = (Z/pZ)(i ) = pgrad gi , pues
(Z/pZ)(i ) es un espacio vectorial de dimensi
on grad gi sobre Z/pZ, luego es
isomorfo al espacio (Z/pZ)grad gi .
En total N(pe11 perr ) = pe1 grad g1 ++er grad gr = pn , donde n es el grado de
K. As pues N(pe11 perr ) = N(p), lo que nos da que p = pe11 perr .
Los primos pi son distintos, pues si pi = pj , entonces pi | gj (), luego los
polinomios gi y gj tienen la raz [] en com
un en el cuerpo Z[]/pi (este cuerpo
tiene caracterstica p, luego contiene a Z/pZ), pero eso es imposible porque
ambos polinomios son irreducibles en Z/pZ, luego son primos entre s.
La hip
otesis OK = Z[] no la cumplen todos los cuerpos numericos, pero es
bastante frecuente y sabemos que al menos la cumplen los cuerpos cuadr
aticos
y ciclot
omicos de orden primo.

Ejemplo Las factorizaciones de 2 y 3 en Z 5 que hemos obtenido m
as
arriba pueden obtenerse tambien como sigue:

En primer lugar, pol mn( 5, Q) = x2 + 5. Su imagen en el cuerpo

2
(Z/2Z)[x] es x2 + 1 = (x + 1)2 , luego 2 factoriza como 2 = 2, 1 + 5 .
La imagen en (Z/3Z)[x] es x2 + 2 = x2 1 = (x + 1)(x 1), lo que nos da
la factorizaci
on



3 = 3, 1 + 5 3, 1 + 5 = 3, 1 + 5 3, 1 5 .

En el captulo siguiente estudiaremos con detalle las factorizaciones en cuerpos cuadr


aticos. Veamos ahora un resultado general para cuerpos ciclot
omicos.
Teorema 10.41 Sea p un primo racional impar y sea O = Z[] el anillo de los
enteros ciclot
omicos de orden p.
1. La factorizaci
on de p en O es p = pp1 , donde p = ( 1).
2. Si q 6= p es un primo racional, entonces la factorizaci
on de q es de la
forma
q = p1 pr ,
donde los primos son distintos, N(pi ) = q f , con f = op (q) (el orden de q
m
odulo p), y r = (p 1)/f .

414

Captulo 10. Enteros algebraicos

n: 1) En la prueba del teorema 10.18 vimos que = 1


Demostracio
cumple p1 | p, luego pp1 | p y considerando las normas tenemos la igualdad.

2) Aplicamos el teorema anterior. Sea g(x) el polinomio mnimo de . Este


p
p
divide a x 1, lo cual sigue siendo cierto m
odulo q. Como la derivada de x 1
es pxp1 , que es no nulo m
odulo q, y su u
nica raz es 0, concluimos que las races
de xp 1 en una extensi
on de Z/qZ han de ser simples, luego lo mismo vale para
las de g(x). En particular, los factores irreducibles de g(x) en Z/qZ son todos
distintos dos a dos, luego la factorizaci
on de q es de la forma q = p1 pr , donde
los factores son distintos. S
olo falta probar que f = op (q), pues comparando las
normas sale que r = (p 1)/f . Sea e = op (q).
Sabemos que L = Z[]/pi es un cuerpo con q f elementos. En el, [] es una
raz p-esima de la unidad distinta de 1 (pi no puede dividir a = 1), luego
tiene orden p, pero por otro lado el grupo multiplicativo de L tiene orden q f 1,
con lo que p | q f 1 y, en consecuencia, e = op (q) | f .

Un elemento de L es de la forma h [] , con h (Z/qZ)[x]. Como los ele qe

e
e
mentos
aq = a, resulta que h [w]
= h []q = h [ q ] =
de Z/qZ cumplen
h [] , puesto que q e 1 (mod p). Esto significa que todos los elementos de L
e
son races de xq x y as, el n
umero de elementos de L ha de cumplir q f q e ,
luego e = f .

Ejemplo Vamos a considerar el caso p = 23 y q = 47 en el teorema anterior.


Como q 1 (mod p), tenemos que f = op (q) = 1, luego 47 factoriza en 22
primos distintos de norma 47. Vamos a probar que en Z[] no hay elementos de
norma 47, con lo que los factores primos de 47 ser
an ideales no principales, y
habremos probado que Z[] no tiene factorizaci
on u
nica.
El discriminante del cuerpo es = 2321 . Si llamamos 1 , . . . , 22 a los
monomorfismos de Q(), como Q()/Q es
que todoslos
normal concluimos

conjugados i ( j ) est
an en Q(), luego = 2310 23 = det i ( j )

Q(), y de aqu concluimos que Q 23 Q().


Si en Q() hubiera un entero
47, la norma de dicho entero
de norma

respecto a la extensi
on Q()/Q 23 sera un entero cuadr
atico de norma

47 (necesariamente +47). Basta ver, pues, que en Q 23 no hay enteros


de norma 47.

Ahora bien, un entero de Q 23 es de la forma a + b 1+ 223 , con a, b


enteros racionales, y su norma es

1 + 23
2a + b
23
2a + b
23
=
+b
b
N a+b
2
2
2
2
2

1
=
(2a b)2 + 23b2 .
4
Si hubiera un elemento de norma 47 tendramos

188 = 47 4 = (2a b)2 + 23b2 ,

10.4. Dominios de Dedekind

415

pero 188 no es un cuadrado perfecto, ni 188 23 = 165, ni 188 23 4 = 96,


luego b no puede tomar los valores 0, 1, 2, y para valores mayores resulta que
(2a b)2 + 23b2 > 188.
En su estudio de los enteros ciclot
omicos de orden primo, Kummer public
o
en 1844 las descomposiciones en factores primos de todos los primos racionales
1 000 para las extensiones de orden primo p 19. Sucede que todas estas
extensiones son de hecho dominios de factorizaci
on u
nica, por lo que Kummer
pudo encontrar todas las factorizaciones, no sin grandes esfuerzos. Para el
siguiente caso, p = 23, encontr
o las factorizaciones de todos los primos menores
que 47 y demostr
o que 47 no poda ser descompuesto en primos, con lo que hall
o
el menor contraejemplo a la factorizaci
on u
nica en enteros ciclot
omicos de orden
primo. Afortunadamente su teora estaba tan avanzada que Kummer confi
o m
as
en ella que en la evidencia que le mostraba que los cuerpos ciclot
omicos no tenan
factorizaci
on u
nica, y as descubri
o la factorizaci
on ideal de los anillos de enteros
algebraicos.
El teorema 10.40 puede refinarse cuando se aplica a extensiones de Galois
de Q. Ello se debe esencialmente a que los automorfismos obligan a que las
factorizaciones presenten un alto grado de simetra. En efecto, ante todo, si K
es una extensi
on finita de Galois de Q y G(K/Q), es claro que la imagen
[a] de un ideal fraccional cualquiera de K es de nuevo un ideal fraccional, que
ser
a un ideal (entero) si y s
olo si lo es a. As pues, podemos extender a a un
automorfismo del grupo de los ideales fraccionales de K dado por (a) = [a].
Decimos extender porque la acci
on sobre los ideales
con la acci
on
es consistente

sobre elementos reales en el sentido de que () = () , para todo K


no nulo.
Diremos que dos ideales fraccionales a y b son conjugados si existe un automorfismo G(K/Q) tal que (a) = b.
Teorema 10.42 Sea K una extensi
on de Galois de grado n sobre Q y sea p un
primo racional. Entonces la factorizaci
on de p en K es de la forma
p = (p1 pr )e ,
donde los ideales pi son primos distintos, forman una clase de conjugaci
on y
todos tienen la misma norma N(pi ) = pf , para un cierto f tal que ef r = n.
n: Es obvio que si p | p, entonces todo conjugado de p cumple
Demostracio
lo mismo. Veamos que cualquier otro divisor q de p es un conjugado de p.
Supongamos, por reducci
on al absurdo, que (p) 6= q para todo automorfismo
. Por el teorema chino del resto existe un OK tal que
0 (mod q),
1 (mod (p)) para todo G(K/Q).
Pero entonces q | | N(), luego p | N(), luego p | N() y por consiguiente
p | () para alg
un G(K/Q), de donde 1 (p) | , contradicci
on.

416

Captulo 10. Enteros algebraicos

Es claro que el exponente de un primo p en la descomposici


on en primos de
p debe ser el mismo que el de todos sus conjugados. Como todos los divisores
primos de p son conjugados, de hecho todos tienen el mismo exponente e, luego la
factorizaci
on es del tipo indicado en el enunciado. Tambien es obvio que primos
conjugados tienen la misma norma, necesariamente potencia de p. La igualdad
n = ef r se sigue de tomar normas en ambos miembros de la factorizaci
on.
En particular, el teorema anterior afirma que dos primos de un cuerpo
numerico normal son conjugados si y s
olo si dividen al mismo primo racional,
si y s
olo si tienen la misma norma. En general no tiene por que ser as:

Ejemplo Factorizaci
on en el anillo Z 3 2 .

Vamos a determinar
omo se descompone un primo racional p en el anillo de
c
enteros del cuerpo Q 3 2 . Para aplicar el teorema 10.40 hemos de considerar
el polinomio x3 2.
Si p = 2 tenemos que x3 2 x3 (mod
2), luego la factorizaci
on es de la
forma 2 = p3 , con N(p) = 2 (De hecho 2 = 3 2 3 , y para esto no hace falta el
teorema 10.40).
Supongamos que p es impar y sea G = (Z/pZ) . Consideremos el homomorfismo de grupos : G G dado por (u) = u3 . Su n
ucleo est
a formado
por las races c
ubicas de la unidad de Z/pZ. Puede haber una o tres de ellas.
Concretamente, Z/pZ tiene tres races c
ubicas de la unidad si y s
olo si p 1
(mod 3). En efecto:
Si u G es una raz c
ubica de la unidad distinta de 1, entonces o(u) = 3, y
por el teorema de Lagrange 3 | p 1, luego p 1 (mod 3).
Si p 1 (mod 3) y v es una raz primitiva de la unidad m
odulo p, entonces
u = v (p1)/3 es una raz c
ubica de la unidad distinta de 1.
Por lo tanto, si p 6 1 (mod 3) el n
ucleo de es trivial, luego es un monomorfismo, luego un isomorfismo. Por lo tanto [2] tiene una u
nica antiimagen
por , una u
nica raz c
ubica m
odulo p, luego x3 2 se descompone en un factor
de grado 1 y otro de grado 2, y en consecuencia p = pq, donde N(p) = p y
N(q) = p2 .
Si p 1 (mod 3) entonces, el n
ucleo de tiene tres elementos, con lo que o
bien [2] Im , y entonces 2 tiene tres races c
ubicas m
odulo p, o bien [2]
/ Im ,
y entonces 2 no tiene races c
ubicas m
odulo p.
En el primer caso la factorizaci
on es p = pqr, con los tres factores de norma
p, y en el segundo p se conserva primo. Resumimos los resultados en la tabla
siguiente:
Primo

Factorizaci
on
3

p=2
p 1 (mod 3)
p 6 1 (mod 3)

x3 2 (mod p)
x3 2 (mod p)
p 6= 2

resoluble
no resoluble

Norma

pqr
p

p
p3

pq

p / p2

Captulo XI

Factorizaci
on en cuerpos
cuadr
aticos
Los cuerpos cuadr
aticos son los m
as simples de todos los cuerpos numericos
y, entre ellos, los m
as simples son los imaginarios. Sin embargo, su estudio proporciona resultados importantes sobre los n
umeros enteros. En otros captulos
hemos visto algunas de sus aplicaciones. Aqu vamos a estudiar m
as a fondo
su estructura, demostrando algunos resultados que no tienen an
alogos en otros
cuerpos y tambien otros v
alidos para cuerpos numericos arbitrarios, pero cuyas
demostraciones generales no est
an a nuestro alcance. Entre otras cosas, daremos
un algoritmo para determinar si un cuerpo cuadr
atico tiene o no factorizaci
on
u
nica, as como para decidir si un ideal dado es o no principal, y obtener en su
caso un generador.

11.1

Los primos cuadr


aticos

Comenzamos determinando los primos cuadr


aticos. Para facilitar el estudio
conviene introducir unas definiciones.

Definici
on 11.1 Sea Q d un cuerpo cuadr
atico, O su anillo de enteros y p
un primo racional. Entonces N(p) = p2 , luego p puede descomponerse a lo sumo
en dos factores primos de O de norma p. Esto da lugar a tres modos posibles de
factorizaci
on. Si p sigue siendo primo en O, diremos que p se conserva. Si p se
descompone en producto de dos ideales primos distintos, p = pq, diremos que p
se escinde. Si p es el cuadrado de un primo, p = p2 , diremos que p se ramifica.
Ahora vamos
aticos. En primer
a aplicar el teorema 10.40 a los cuerpos cuadr
lugar, si Q d es un cuerpo cuadr
atico, entonces su anillo de enteros es de la

forma Z[], tal y como exigen las hip


otesis. El entero es d si d 6 1 (mod 4)
o bien = 1+2 d si d 1 (mod 4). En el primer caso el polinomio mnimo de
es g(x) = x2 d y en el segundo es g(x) = x2 x + 1d
4 .
417

418

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

Seg
un 10.40, la factorizaci
on de un primo racional p depende de la factorizaci
on de g(x) m
odulo p. M
as concretamente, tenemos que p se conserva primo,
se ramifica o se escinde seg
un si g(x) tiene 0, 1 o 2 races distintas m
odulo p
respectivamente.
Consideramos primero el caso p 6= 2, pues bajo esta hip
otesis podemos considerar la f
ormula usual para las soluciones de la ecuaci
on general de grado 2,
en virtud de la cual la factorizaci
on de g(x) depende u
nicamente de su discriminante, que resulta ser = 4d si d 6 1 (mod 4) y = d si d 1 (mod 4) (o
sea, el discriminante de g(x) es precisamente el discriminante de K).
Ahora conviene introducir un concepto:
Si p es un primo impar y d un entero primo con p, diremos que d es un
resto cuadr
atico m
odulo p si existe un u Z tal que d u2 (mod p). En caso
contrario (siempre suponiendo que d es primo con p) diremos que d es un resto
no cuadr
atico m
odulo p.
En estos terminos, tenemos que g(x) tiene 0, 1 o 2 races m
odulo p si y
s
olo si es un resto no cuadr
atico, es cero o es un resto cuadr
atico m
odulo p,
respectivamente. Ahora bien, como = d o = 4d y p 6= 2, en realidad este
criterio sigue siendo cierto si cambiamos por d.
As pues, si p | d (o, equivalentemente, si p | ) tenemos que
g(x) = x2 d x2 (mod p) o g(x) = x2 x +

1d
(x 1/2)2 (mod p),
4

donde el 1/2 ha de entenderse como el inverso de 2 m


odulo p. Por consiguiente
p = p2 , donde
p = (p, )
o
p = (p, 1/2).

Supongamos ahora que p - d, en cuyo caso tenemos dos posibilidades. Si d


es un resto no cuadr
atico m
odulo p entonces p se conserva primo, mientras que
si d u2 (mod p) entonces
g(x) = x2 d (x + u)(x u) (mod p)
o bien

1d
g(x) = x x +

4
2

de donde a su vez p = p1 p2 , con


pi = (p, u)

1+u
1u
x
x
,
2
2

1u
pi = p,
.
2

Nos falta estudiar el caso p = 2. Si 2 | d entonces d 2 (mod 4) (pues d no


puede ser m
ultiplo de 4). Entonces
g(x) = x2 d x2 (mod 2),
luego 2 = p2 , con p = (2, ).

11.1. Los primos cuadr


aticos

419

Si 2 - d tenemos dos posibilidades: si d 3 (mod 4) entonces


g(x) = x2 d x2 1 (x 1)2 (mod 2),
luego 2 = p2 con p = (2, 1).
Si, por el contrario, d 1 (mod 4), digamos d = 4k + 1, entonces
g(x) = x2 x k.
A su vez hemos de distinguir dos casos: Si k es impar (o equivalentemente,
si d 5 (mod 8)) entonces g(x) no tiene races m
odulo 2 y p se conserva primo.
Si k es par (o sea, d 1 (mod 8)), entonces
g(x) x2 x = x(x 1) (mod 2),
luego 2 = p1 p2 , donde p1 = (2, ), p2 = (2, 1).
El teorema siguiente resume todo lo que hemos obtenido, pero antes introducimos una notaci
on u
til: Si p es un primo y u Z, definimos
[p, u] = (p, u).
Es claro que el ideal [p, u] depende s
olo del resto de u m
odulo p, por lo que
podemos considerar u Z/pZ.
Teorema 11.2 Sea d un n
umero entero libre de cuadrados y p un primo
racional. Consideremos el anillo de los enteros algebraicos del cuerpo Q d .
1. Si p es impar y p | d, entonces p se ramifica:

[p, 0]2 si d 6 1 (mod 4),


p=
[p, 12 ]2 si d 1 (mod 4).

2. Si p es impar y d u2 (mod p), entonces p se escinde:

[p, u][p, u]
si d
6 1 (mod 4),
p=
1u
[p, 1+u
][p,
]
si
d
1 (mod 4).
2
2
3. Si p es impar y d es un resto no cuadr
atico m
odulo p, entonces p se
conserva primo.
4. Si p = 2 tenemos las posibilidades siguientes:
d1

(mod 8) 2 = [2, 0][2, 1] (se escinde),

d 2, 6 (mod 8) 2 = [2, 0]2

(se ramifica),

d 3, 7 (mod 8) 2 = [2, 1]
d 5 (mod 8) 2 = 2

(se ramifica),
(se conserva).

420

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

Observaciones:
1. No puede ocurrir d 0, 4 (mod 8) porque d es libre de cuadrados.
2. Del teorema se sigue que un primo p se ramifica en K si y s
olo si p | .
3. Si p = [p, u] es un ideal en las condiciones del teorema, entonces N(p) = p,
luego Z[]/p = Z/pZ, y u (mod p). Esto nos permite determinar
f
acilmente si dos enteros cuadr
aticos son congruentes m
odulo p, y en particular si un entero cuadr
atico es divisible entre p.
4. El cuerpo K tiene un u
nico automorfismo no trivial, al que llamaremos
conjugaci
on y representaremos por x 7 x
. Es claro que si a es un ideal de
K lo mismo le sucede a su imagen por la conjugaci
on, que representaremos
por a. Del teorema se sigue que cuando p se escinde, entonces lo hace en
la forma p = pp, para cierto ideal primo p. Por ejemplo, en el caso p = 2,
d 1 (mod 8) tenemos que
2 = (2, )(2, 1)
y, ciertamente,
= ( 1), luego (2, 1) = (2,
) = (2, ).
De la u
ltima observaci
on se sigue f
acilmente un resultado m
as general:
Teorema 11.3 Sea K un cuerpo cuadr
atico y a un ideal de su anillo de enteros.
Entonces N(a) = aa.
n: Por la factorizaci
Demostracio
on u
nica basta probarlo para ideales primos. Si p es un ideal primo sea p el u
nico primo racional al que divide. Si p se
conserva primo, entonces p = p y N(p) = p2 = p
p.
Si p se ramifica, entonces p = p2 , de donde p = p y N(p) = p. Por lo tanto
se cumple tambien N(p) = p = p2 = pp.
Si p se escinde, hemos visto que lo hace en la forma p = pp, y concluimos
igualmente.

11.2

El grupo de clases

El problema m
as importante que presenta la factorizaci
on ideal es el de
determinar en que casos un divisor ideal se corresponde con un divisor real (o
sea, es principal) y, en particular, cu
ando todos los divisores son reales, y por
lo tanto el anillo es DFU.
Para abordar este problema introducimos un concepto fundamental en el
estudio de los enteros algebraicos.
Definici
on 11.4 Sea K un cuerpo numerico y O su anillo de enteros. Sea F el
grupo de los ideales fraccionales de O y P el subgrupo formadopor los ideales
fraccionales principales. Es decir, P = (a)(b)1 | a, b O \ {0} . Llamaremos
grupo de clases de K al grupo cociente H = F/P.

11.2. El grupo de clases

421

1
Notemos que todo ideal fraccional es de la forma
a(b)

, donde a es un
1
ideal, luego al tomar clases m
odulo P resulta que a(b)
= [a], es decir, que
podemos considerar a los elementos de H como clases de ideales, en el sentido
de que siempre podemos trabajar con representantes ideales.
Por otra parte, si un ideal c est
a en P, o sea, si c = (a)(b)1 , entonces
(a) = (b)c, luego (b) | (a), luego b | a, luego a = bc para cierto entero c, y
(b)c = (a) = (b)(c). Por lo tanto c = (c). Esto prueba que [c] = 1 si y s
olo si c
es principal.

En consecuencia O es un DIP si y s
olo si H = 1. Puede probarse, aunque ello
excede nuestras posibilidades, que el grupo H siempre es finito, y a su n
umero
de elementos se le llama n
umero de clases de K, y se representa por h. En
estos terminos O es DIP si y s
olo si h = 1. Aqu demostraremos la finitud del
n
umero de clases en el caso particular de los cuerpos cuadr
aticos y daremos un
procedimiento para calcularlo.
Diremos que dos ideales a y b son similares (a b) si son congruentes m
odulo
P. Concretamente, a b si y s
olo si existen enteros algebraicos a y b tales que
b = (a)(b)1 a, o equivalentemente, (a)a = (b)b.
Notemos que si a, b y c son ideales no nulos tales que ac y bc son principales,
entonces a b, pues m
odulo P tenemos [ac] = 1 = [bc], luego [a] = [b].
En el caso concreto
aticos, si b es un ideal no nulo

de los cuerpos cuadr


tenemos que bb = N(b) (1) = bb1 , luego b es similar a b1 . Adem
as a b
si y s
olo si ab es principal.
Nuestro objetivo es encontrar un conjunto finito de representantes de las
clases de H y luego dar un algoritmo que nos permita saber cu
ando dos clases
son la misma, con lo que tendremos completamente determinado el grupo de
clases.
El primer paso es observar que todo ideal a es similar a otro no divisible
entre enteros racionales no unitarios. En efecto: si m es un entero maximal
que divida a a, entonces a = mb y obviamente b no es divisible entre enteros
racionales no unitarios. Tambien es obvio que b es similar a a. Ahora probamos
que b tiene un comportamiento especialmente satisfactorio.
Teorema
11.5 Sea d un entero libre de cuadrados y O el anillo de los enteros
de Q d . Sea a un ideal de O que no sea divisible entre enteros racionales no
unitarios. Sea a = N(a). Entonces todo entero cuadr
atico es congruente m
odulo
a con un entero racional y dos enteros racionales son congruentes m
odulo a si
y s
olo si lo son m
odulo a. En particular se cumple que O/a
= Z/aZ.
n: Por hip
Demostracio
otesis a no es divisible entre primos que se conserven, luego su descomposici
on en primos es de la forma a = pe11 perr , donde
N(pi ) = pi . Si el primo pi se ramifica entonces ei = 1 (o de lo contrario pi | a).
Si pi se escinde entonces pi - a, o de lo contrario pi | a. Por lo tanto los primos
pi son distintos dos a dos.

422

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

Veamos que si m es un entero racional, entonces a | m si y s


olo si a | m. En
efecto, puesto que a | a, una implicaci
on es evidente. Supongamos que a | m.
Tenemos que a = N(a) = pe11 perr .
Si pi se ramifica, ei = 1, pi | m y tomando normas pi | m2 , luego pei i | m.
Si pi se escinde entonces pei i | m y conjugando pei i | m. Como ambos ideales
son primos entre s concluimos que pei i = pei i pei i | m.
Por lo tanto a | m.
Obviamente entonces, m n (mod a) es equivalente a m n (mod a). A
su vez esto implica que la caracterstica de O/a es a, luego Z/aZ O/a. Concretamente Z/aZ est
a formado por las clases con representante entero racional.
Puesto que a = N(a) = |O/a|, ha de darse la igualdad y el teorema queda
probado.
El teorema siguiente contiene esencialmente la finitud del grupo de clases:
Teorema
11.6 Sea d un entero libre de cuadrados y sea O el anillo de enteros
de Q d . Sea el discriminante de K. Entonces todo ideal no nulo a de O
es similar a otro ideal b tal que
2
N(b)

||
.
3

n: Podemos suponer que a no es divisible entre enteros raDemostracio


cionales no unitarios. Consideremos a = N(a). Sea
(
d
si d 6 1 (mod 4)
=
(11.1)
1+ d
si d 1 (mod 4)
2
El teorema anterior nos da que s (mod a) para cierto entero racional s.
Llamemos

s
si d 6 1 (mod 4)
r=
2s1
si d 1 (mod 4)
2
En ambos casos tenemos que

r
= s a.
2
(observemos que en el segundo caso ninguno de los dos sumandos es entero, pero
s la suma.)
El teorema anterior nos da tambien que si a r le sumamos un m
ultiplo de a
se sigue cumpliendo la relaci
o
n
anterior,
luego
podemos
exigir
que
|r|
a/2.

Tenemos que a | r 2 , luego r 2 = ab para cierto ideal b. Adem


as

!
!

2
||
1
||

r+
a2 +
.
= r r2 +
N(ab) = r

2
2
4
4
4
4
Si N(a) N(b), entonces N(a) N(a) N(a) N(b), o sea, a2 (a2 + ||)/4, lo
que equivale a que a2 ||/3.

11.2. El grupo de clases

423

Por otro lado, por el teorema 11.3, N(b) = bb, y como ab y bb son ambos
principales, resulta que a b.
En resumen, a b y N(b) < N(a) salvo si N(a)2 ||/3.
Adem
as b no es divisible
entre enteros racionales no unitarios, pues si m | b

entonces m | b | r 2 , pero esto es imposible: entonces m dividira a s , y


en consecuencia s = m(u + v), luego 1 = mv, contradicci
on.
Esto significa que podemos obtener una sucesi
on de ideales similares con
normas estrictamente decrecientes mientras los cuadrados de las normas superen
a ||/3. Como las normas son n
umeros naturales, tras un n
umero finito de pasos
hemos de llegar a un ideal b similar al de partida y tal que N(b)2 ||/3.
Teorema
11.7 Sea d un entero libre de cuadrados y O el anillo de enteros de
Q d . Entonces el grupo de clases de O es un grupo abeliano finito.

n: Todo ideal fraccional es congruente con un ideal, y todo


Demostracio
ideal es similar a un ideal de norma menor o igual que el menor natural cuyo
cuadrado supera a ||/3. Por el teorema 10.39 s
olo hay un n
umero finito de
ideales con una norma dada, luego tenemos que todo ideal fraccional es similar
a un ideal de entre los elementos de un conjunto finito. Por lo tanto s
olo puede
haber un n
umero finito de clases de similitud, y el grupo cociente es finito.
S
olo con la ayuda de este teorema podemos probar que h = 1 en los casos
d = 1,

2,

3,

7,

11,

19,

2,

3,

5,

13,

y que h = 2 en los casos d = 5, 6, 10, 13, 15.


Veamos algunos ejemplos: si d = 1 tenemos = 4, luego todo ideal es
similar a uno de norma a tal que a2 4/3, luego a = 1. As pues todo ideal es
similar a 1 y por lo tanto h = 1. Esto ya lo sabamos, porque Z[i] es eucldeo.
Si d = 5 entonces = 20 y la cota es a2 20/3, luego a 2. En

Q 5 el 2 se ramifica, luego s
olo hay dos ideales de norma menor o igual que

2, a saber, 1 y [2, 1]. Por lo tanto h 2. En el captulo X vimos que Q 5
no tiene factorizaci
on u
nica, luego h 6= 1. Por lo tanto h = 2.
Si d = 10 tenemos a2 40/3, luego a 3. De nuevo 2 se ramifica y 3 se
conserva primo, luego no hay ideales de norma 3. Tenemos s
olo dos ideales y
as h 2. Como la factorizaci
on no es u
nica h = 2.
M
as interesante es el caso d = 19. Tenemos que a2 19/3, luego a 2,
es decir, todo ideal es similar

a uno de norma menor o igual que 2, pero 2


se conserva primo en Q 19 , luego no hay ideales de norma 2. As pues

todo ideal es similar a 1, o sea Q 19 tiene factorizaci


on u
nica y por otro
lado sabemos que no es eucldeo. Es el primer ejemplo que tenemos de DIP no
eucldeo.

424

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

11.3

C
alculo del n
umero de clases

Ahora veremos que refinando los argumentos de la secci


on anterior podemos
determinar el n
umero de clases de cualquier cuerpo cuadr
atico. Trataremos por
separado los cuerpos imaginarios y los reales. Como siempre, los primeros son
m
as sencillos.

11.3.1

Cuerpos cuadr
aticos imaginarios

Sea ai un ideal no divisible entre enteros distintos de 1. Sea ai = N(ai ).


En la prueba del teorema 11.6 partimos de un n
umero entero o semientero ri
tal que

ai
ri
ai ,
|ri | .
2
2
Desde aqu encontramos otro ideal ai+1 ai (no divisible entre enteros no
unitarios) determinado por

ai+1 ai = ri
.
(11.2)
2

Llamemos ai+1 = N(ai+1 ). Como ai+1 | ri 2 , conjugando ai+1 | ri + 2 ,

es decir, ri 2 ai+1 . Por lo tanto, si llamamos ri+1 a la reducci


on de ri
m
odulo ai+1 de modo que |ri+1 | (1/2)ai+1 , resulta que (ai+1 , ri+1 ) vuelve a
estar en las hip
otesis de 11.6.
Tomando normas en la igualdad (11.2) obtenemos que ai+1 ai = ri2 /4,
por lo que en total tenemos:
ai+1 =

ri2 /4
,
ai

ri+1 ri (mod ai+1 ), |ri+1 |

ai+1
.
2

(11.3)

Estas f
ormulas nos permiten calcular los sucesivos ai y ri sin necesidad de
calcular los ideales ai .
Si alguno de los ai toma el valor 1, entonces el ideal correspondiente ai ser
a
(1), luego el ideal de partida a0 ser
a principal.
Ahora vamos a probar que el recproco es cierto, es decir, que si el ideal
de partida es principal, se alcanza el valor ai = 1 para alg
un i. M
as a
un,
probaremos que si la sucesi
on de los ai deja de ser estrictamente decreciente sin
alcanzar el valor 1, entonces nunca toma el valor 1, con lo que en un n
umero
finito de pasos sabremos siempre si el ideal de partida es o no principal.
En efecto, supongamos que a0 es principal. Sea i el menor natural tal que
ai+1 ai . Seg
del teorema 11.6, esto implica que a2i ||/3.
un laprueba

Sea ai = u + v d , donde u, v son enteros o semienteros. Tenemos, pues,


que
||
(u2 v 2 d)2
.
3

11.3. C
alculo del n
umero de clases

425

En el caso d 6 1 (mod 4) tenemos que u y v son enteros y


(u2 v 2 d)2

4|d|
.
3

En el caso d 1 (mod 4) multiplicamos y dividimos entre 16 y queda


2 |d|
1
(2u)2 (2v)2 d
.
16
3

Si v 6= 0 tenemos en el primer caso d2 4|d|/3, luego |d| 4/3, d = 1 y


entonces a2i 4/3, luego ai = 1 y por lo tanto ai = 1.
En el segundo caso queda d2 16|d|/3, luego |d| 16/3 y, puesto que d 1
(mod 4), la u
nica posibilidad es d = 3, luego a2i 1 y as ai = 1, como antes.
Por otra parte, si v = 0 nos queda ai = (u), luego u ha de ser entero y, como
ai no es divisible entre enteros no unitarios, ai = 1.
Hemos probado que si a0 es principal entonces la sucesi
on de los ai decrece
hasta llegar a 1, luego si deja de decrecer antes de llegar a 1 es que el ideal de
partida no es principal.
Si nos fijamos todava m
as en el proceso podemos obtener un generador del
ideal de partida cuando es principal: Supongamos
que tenemos un generador


de ai+1 = (u). De (11.2) deducimos que (u) ri 2 = ai+1 ai+1 ai = ai+1 ai ,
y por lo tanto

ri /2
ai = u
.
ai+1
Como un generador del u
ltimo ideal es 1, resulta que un generador del ideal
de partida a0 viene dado por

r0 /2 ri1 /2
u=
,
(11.4)
a1 ai
donde i es el menor ndice que cumple ai = 1.
Ejemplos El primer caso que no podamos abordar directamente

con el teorema 11.6 es d = 14. El teorema nos da que todo ideal de Z 14 es similar
a uno de norma menor o igual que 4.
Los primos menores que 4 son 2 = [2, 0]2 y 3 = [3, 1][3, 1]. Todo ideal
de norma menor que cuatro es producto de estos, luego tenemos las siguientes
posibilidades:
(1), [2, 0], [3, 1], [3, 1].
Faltara [2, 0]2 , pero es principal, luego similar a (1). Esto nos da que el
n
umero de clases es h 4.
En primer lugar, el algoritmo que hemos obtenido nos da que ninguno de
los tres ideales distintos de (1) es principal. En efecto, para [2, 0] tenemos que
a0 = 2 y r0 = 0. Entonces a1 = (02 + 14)/2 = 7, y como es mayor que a0 ,

426

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

resulta que [2, 0] no es principal. Para [3, 1] y [3, 1] obtenemos a1 = 5, luego


tampoco son principales. El ideal [2, 0]2 = (2) es principal. Veamos que ocurre
con [3, 1]2 .

En este caso a0 = 9 y hemos de hallar r0 . Sabemos que [3, 1] | 1 14,

por lo que [3, 1]2 | 1 14 = 13 2 14 y el inverso de 2 m


odulo 9 es

2
4,
luego
tenemos
[3,
1]
|
52

14.
Al
reducir
52
m
o
dulo
9
llegamos
a que

14 2 (mod [3, 1]2 ).


As pues, r0 = 2. El algoritmo nos da: (9, 2), (2, 0), (7, ), luego [3, 1]2 no
es principal. Adem
as hemos obtenido que [3, 1]2 es similar a un ideal de norma
2, y el u
nico posible es [2, 0], luego [3, 1]2 [2, 0].
Como el orden de [2, 0] en el grupo de las clases es 2, concluimos que el
orden de [3, 1] ha de ser 4, luego el grupo tiene orden h = 4. Adem
as tenemos
su estructura, se trata de un grupo cclico generado por [3, 1], y sus elementos
son
(1), [3, 1], [3, 1]2 [2, 0], [3, 1]3 [3, 1].

Veamos ahora un ejemplo m


as sofisticado. Consideremos el anillo Z 74 .
Por el teorema 11.6 todo ideal es similar a uno de norma 9. Los primos
menores que 9 son:
2 = [2, 0]2 , 3 = [3, 1][3, 1], 5 = [5, 1][5, 1], 7.
Como 7 se conserva tiene norma 49, luego lo eliminamos. Los ideales con
norma menor o igual que 9 son:
(1),

[2, 0],

[2, 0][3, 1],

[3, 1],

[3, 1],

[2, 0][3, 1],

[5, 1],

[3, 1]2 ,

[5, 1],
[3, 1]2 ,

2,
3.

Si eliminamos los principales no triviales nos quedan 10. Por lo tanto h 10.
El ideal [2, 0] no es principal, pues el algoritmo nos da (2, 0), (37, ). Por lo tanto
tiene orden 2 en el grupo de las clases.
Para el ideal [3, 1] tenemos (3, 1), (25, ), luego tampoco es principal.
Consideramos [3, 1]2 , para el que a0 = 9. Para calcular r0 partimos de que

2

[3, 1] | 1 74 , luego [3, 1]2 | 1 74 = 732 74, y en consecuencia

2 74 1 (mod [3, 1]2 ). El inverso de 2 m


odulo 9 es 4, luego tenemos que
74 4 (mod [3, 1]2 ), o sea, r0 = 4. El algoritmo nos da: (9, 4), (10, ),
luego [3, 1]2 no es principal.
Calculamos [3, 1]3 . En este caso a0 = 27. Adem
as

3
1 74 5 + 17 74 (mod 27).

El inverso de 17 m
odulo 27 es 1717 (17 = (27) 1), que reducido es
8, luego r0 se obtiene reduciendo a 40 (mod 27), es decir, r0 = 13. As:
(27, 13), (9, 4), (10, ). Esto nos dice que [3, 1]3 es similar a un ideal no principal de norma 9. Los u
nicos candidatos son [3, 1]2 y [3, 1]2 , pero [3, 1]2 es

11.3. C
alculo del n
umero de clases

427

imposible: si [3, 1]3 [3, 1]2 , entonces [3, 1] (1). As pues [3, 1]3 [3, 1]2 y
el orden de [3, 1] es al menos 4, pero [3, 1]4 [3, 1]2 [3, 1] = (3)[3, 1] [3, 1],
que tampoco es principal (o lo sera [3, 1]2 ).
Finalmente, [3, 1]5 [3, 1][3, 1] = (3) (1), lo que nos permite concluir
que el orden de [3, 1] en el grupo de las clases es exactamente 5. Por el teorema
de Lagrange, 5 | h 10, luego las u
nicas posibilidades para h son 5 y 10. Como
[2, 0] tiene orden 2, ha de ser h = 10, luego los 10 ideales de nuestra lista son
no similares dos a dos. Como [3, 1] tiene orden 5 y [2, 0] tiene orden 2, la teora
de grupos nos da que [3, 1][2, 0] es un generador del grupo.
Ejercicio: Identificar en la lista las diez potencias del ideal [3, 1][2, 0].

Una aplicaci
on distinta es encontrar generadores de ideales principales, Por
ejemplo, el primo 541 se escinde en Z[i], pues una raz cuadrada de 1 m
odulo
541 es 52, (puede hallarse a partir de que 2 es una raz primitiva de la unidad m
odulo 541, luego [1] = [2540/2 ] y una raz cuadrada es [2540/4 ] = [52]).
As tenemos el primo [541, 52], que ha de ser un ideal principal. Calculamos
(541, 52), (5, 2), (1, ), luego, de acuerdo con (11.4), un generador es
(52 i)(2 i)
= 21 10i.
51
Por lo tanto 541 = (21 10i)(21 + 10i) = (21 + 10i)(21 10i). De este
modo hemos obtenido la representaci
on de 541 = 212 + 102 como suma de dos
cuadrados.

En el captulo anterior usamos la factorizaci


on u
nica de Q 163 . Ahora
es f
acil justificarla: hay que considerar ideales de norma 7 y los primos 2, 3,
5 y 7 se conservan, luego todos los ideales a considerar son principales.
Ejercicio: Probar que para los valores d = 43 y 67 el n
umero de clases es h = 1.

Veamos ahora un ejemplo con d 1 (mod 4). Tomemos d = 47. Hay que
considerar ideales con normas 3. Tenemos 2 = [2, 0][2, 1] y 3 = [3, 0][3, 1]. Los
ideales posibles son (1), [2, 0], [2, 1], [3, 0], [3, 1].

Para [2, 0] tenemos que 1+ 247 0 (mod [2, 0]), luego cambiando el signo
r0 = 1/2. El algoritmo nos da (2, 1/2), (6, ), y [2, 0] no es principal.

2
Consideramos ahora [2, 0]2 . Se cumple que 1+ 247
0 (mod [2, 0]2 ),

es decir, 23 2 47 0 (mod [2, 0]2 ), luego, reduciendo 23/2 m


odulo 4, queda
r0 = 1/2. El algoritmo da (4, 1/2), (3, 1/2), (4, ), luego no es principal y es
similar a un ideal de norma 3
con r = 1/2. Veamos cu
al de los dos es.
1+ 47
Para [3, 0] tenemos que
0 (mod [3, 0]) y r = 1/2.
2
Para [3, 1] tenemos que
2

1+ 47
2

0 (mod [3, 1]) y r = 1/2.

Por lo tanto [2, 0] [3, 1] y de aqu que [2, 0]4 [3, 1]2 . Se cumple

que 1+2 47
0 (mod [3, 1]2 ). Operando y reduciendo m
odulo 9 queda

428

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos
Tabla 11.1: N
umero de clases de cuerpos cuadr
aticos imaginarios
(Los n
umeros en negrita son los que cumplen d 1 (mod 4).)
d
1
2
3
5
6
7
10
11
13
14
15
17
19
21
22
23

h
1
1
1
2
2
1
2
1
2
4
2
4
1
4
2
3

d
26
29
30
31
33
34
35
37
38
39
41
42
43
46
47
51

h
6
6
4
3
4
4
2
2
6
4
8
4
1
4
5
2

d
h
53 6
55 4
57 4
58 2
59 3
61 6
62 8
65 8
66 8
67 1
69 8
70 4
71 7
73 4
74 10
77 8

d
h
78 4
79 5
82 4
83 3
85 4
86 10
87 6
89 12
91 2
93 4
94 8
95 8
97 4

5 47
2

0 (mod [3, 1]2 ), de donde r0 = 5/2 y el algoritmo nos da la sucesi


on (9, 5/2), (2, 1/2), (6, ), luego [2, 0]4 [2, 1] y finalmente concluimos
que [2, 1]5 = [2, 1][2, 0] = (2) 1. As pues, h = 5 y los representantes de las
clases son
(1), [2, 0], [3, 1], [3, 0], [2, 1].
La tabla 11.1 recoge los n
umeros de clases h de todos los cuerpos cuadr
aticos con 100 d 1. El lector puede comprobar los valores que desee.
Observese que el comportamiento de h es extremadamente irregular.

11.3.2

Cuerpos cuadr
aticos reales

El caso real presenta algunas dificultades adicionales. Partimos de un ideal a


no divisible entre enteros no unitarios. Aplicando el algoritmo que hemos visto
para el caso d < 0 llegamos a un ideal ai+1 en las mismas condiciones con la
propiedad de que a2i+1 = N(ai+1 )2 /3.
A partir de este momento cambiaremos el criterio para elegir r m
odulo a.
Tomaremos ri+1 de manera que ri+1 ri (mod ai+1 ) y ri+1 sea el m
aximo
2
que cumple ri+1
< /4. En definitiva, continuaremos la sucesi
on de ideales de
acuerdo con las f
ormulas:

ai+1 ai = ri
.
(11.5)
2

11.3. C
alculo del n
umero de clases
ai+1 =

/4 ri2
,
ai

429

2
ri+1 ri (mod ai+1 ), ri+1
< /4 (m
aximo). (11.6)

(Notemos que la primera ecuaci


on de (11.6) procede de tomar normas en
(11.5), y en el segundo miembro hay que poner un valor absoluto o, equivalen es la raz
temente, hay que garantizar que sea positivo. Esa
on del cambio de
orden respecto a (11.3).)
Hemos de probar que siempre es posible encontrar un ri+1 en las condiciones
de (11.6).
La primera vez es posible porque tenemos a2i+1 /3 (obtenido por el criterio anterior) y existe un entero o semientero r que cumple r ri (mod ai+1 ) y
|r| ai+1 /2 (el que elegiramos con el criterio anterior). Este r cumple tambien
r2 a2i+1 /4 /12 < /4. S
olo hay que cambiarlo por el m
aximo posible y
ya tenemos ri+1 .
Sin embargo, a partir de aqu ai+1 ya no cumple necesariamente a2i+1 /3,
luego no tenemos asegurado que podamos encontrar ri+1 en las condiciones
requeridas. Vamos a probarlo.
Por la maximalidad de ri tenemos que (ri + ai )2 > /4 (la igualdad no
puede darse porque d es libre de cuadrados). De aqu
ri2

/4 + 2ri ai + a2i

> 0, ai

ri2 /4
+ 2ri + ai
ai

> 0, ai+1 + 2ri + ai > 0

y multiplicando por ai+1 queda


a2i+1 2ri ai+1 ai ai+1 < 0,

a2i+1 2ri ai+1 + ri2 /4 < 0,

luego (ai+1 ri )2 < /4.


As pues, cambiando ai+1 ri por el m
aximo posible m
odulo ai+1 , encontramos un ri+1 que cumple (11.6).
M
as a
un, hemos visto que ai+1 ri ri+1 , luego ri ri+1 ai+1 ri+1 .
2
Puesto que tanto ri+1
< /4 como ri2 < /4, esto implica (ri+1 ai+1 )2 < /4,
mientras que por definici
on de ri+1 tenemos (ri+1 + ai+1 )2 > /4, es decir,
2
(ri+1 ai+1 ) < (ri+1 + ai+1 )2 .
Desarrollando los cuadrados queda ri+1 < ri+1 , luego ri+1 > 0, es decir,
a partir del momento en que usamos el nuevo criterio, los ri ser
an siempre
positivos.
Ahora notamos que ai+1 ai ai+1 = /4 ri2 < /4, luego los ideales ai
recorren un conjunto finito de ideales posibles. Necesariamente la sucesi
on ha
de entrar en un ciclo.
Para garantizar que este algoritmo nos permite decidir siempre si el ideal de
partida es principal basta probar que si es as entonces el ideal 1 aparece en el
ciclo. Podemos suponer que a0 es el comienzo del ciclo, de modo que para un k
(mnimo) se cumple a0 = ak .

430

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

Supongamos que a0 = x0 + y0 d , donde los coeficientes son enteros o

semienteros. Por construcci


on, a0 a1 = (r0 + /2), luego al multiplicar queda

x0 + y0 d r0 + /2 = a0 a1 ,

y de este modo a1 = (x1 + y1 d), donde

r0 + /2

x1 + y1 d = x0 + y0 d
.
a0

Repitiendo k veces llegamos a que ak = xk + yk d , donde

(r0 + /2) (rk1 + /2)

xk + yk d = x0 + y0 d
,
a0 ak1

y como x0 + y0 d = xk + yk d , se ha de cumplir que el n


umero

(r0 + /2) (rk1 + /2)


=
(11.7)
a0 ak1
es una unidad.
En general se cumple que

aj+nk = xj+nk + yj+nk d , donde xj+nk + yj+nk d = xj + yj d n .

Definamos xj + yj d = n xj+nk + yj+nk d para j < 0, donde n es


un entero
suficientemente
grande para que j + nk sea positivo. Sea igualmente

aj = xj + yj d , de modo que aj+nk = aj para todo n y todo j (observemos


que los ideales aj con j < 0 no son necesariamente los ideales obtenidos mediante
el algoritmo antesde llegar al ciclo que comienza con a0 ).
Sea = u + v d. Teniendo en cuenta la expresi
on de y que todos losrj
son positivos, es claro que u, v > 0. En particular 6= 1. Sea n = un + vn d.
Los enteros (o semienteros) un y vn satisfacen las relaciones:
un+1
vn+1

= uvn + dvvn
= vun + uvn

(11.8)
(11.9)

Estas ecuaciones muestran que un , vn > 0, as como que ambos se hacen


arbitrariamente grandes cuando n crece. (El caso menos obvio se da si u y v
son semienteros. Entonces d > 4 y (11.8) implica un+1 > 2vn , a su vez (11.9)
implica vn+1 un /2 y entonces vn+2 > un+1 /2 > vn .)

Tenemos que xnk + ynk d = x0 + y0 d n , luego


xnk = un x0 + dvn y0 ,

ynk = vn x0 + un y0 .

Supongamos que x0 e y0 son no nulos y tienen signos opuestos. Para saber el


signo de xnk restamos los cuadrados de los dos sumandos (y tenemos en cuenta
que N(n ) = 1).
u2n x20 d2 vn2 y02 = (1 + dvn2 )x20 d2 vn2 y02 = x20 + dvn2 (x20 dy02 ).

11.3. C
alculo del n
umero de clases

431

Para valores de n lo suficientemente grandes como para que dvn2 (x20 dy02 )
supere en m
odulo a x20 (lo cual siempre acaba ocurriendo porque vn se hace
cada vez mayor) el signo de esta expresi
on es el de x20 dy02 , luego el signo de
2
xnk ser
a el de x0 o el de y0 seg
un si x0 dy02 es mayor o menor que 0.
El c
alculo an
alogo para ynk es el siguiente:
vn2 x20 u2n y02 = vn2 x20 (1 + dvn2 )y02 = y02 + vn2 (x20 dy02 ).
De aqu deducimos que para valores grandes de n el signo de ynk es tambien
el de x0 o el de y0 seg
un si x20 dy02 es mayor o menor que 0. En resumen, que
si x0 e y0 son no nulos y tienen signos opuestos, para valores grandes de n se
cumple que xnk e ynk tienen el mismo signo.
Supongamos ahora que x0 e y0 son no nulos y tienen el mismo signo. Lo que
hemos
probado
antes es que si el signo es distinto, entonces los coeficientes de

x0 + y0 d n tienen el mismo signo si n es suficientemente grande, luego en


nuestro caso los coeficientes de x0 y0 d n tienen el mismo signo cuando n


es grande.

Por definici
on, xnk + ynk d = x0 + y0 d n . Conjugamos teniendo en

1
cuenta
queN()

n = = 1 (luego = ) y obtenemos xnk ynk d =


x0 y0 d . As pues, resulta que xnk y ynk tienen el mismo signo
cuando n es grande, con lo que xnk e ynk tienen signos opuestos.
Con todo esto hemos probado que o bien hay un ndice j para el que xj yj = 0
o bien xj yj toma signos distintos en distintos js. En este u
ltimo caso ha de
haber un entero j tal que xj yj < 0 y xj+1 yj+1 > 0. Vamos a demostrar que
esto es imposible.

Tenemos
que xj+1 + yj+1 d = xj + yj d rj + d /aj , y por otra parte

aj = xj + yj d xj yj d . Por lo tanto


xj+1 + yj+1 d xj yj d = rj + d .

Igualando los coeficientes obtenemos las ecuaciones siguientes:


xj+1 xj dyj+1 yj
xj yj+1 xj+1 yj

= rj ,
= 1.

(11.10)
(11.11)

Si suponemos xj yj < 0 y xj+1 yj+1 > 0 se convierten en


|xj+1 xj | + d|yj+1 yj | = rj ,
|xj yj+1 | + |xj+1 yj | = 1.
Obviamente la segunda ecuaci
on es imposible si las variables son enteros no
nulos. Si son semienteros multiplicamos las ecuaciones por 4 y queda
|2xj+1 | |2xj | + d|2yj+1 | |2yj | = 4rj ,
|2xj | |2yj+1 | + |2xj+1 | |2yj | = 4.

432

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

Si, por ejemplo xj es semientero (luego yj tambien), entonces |2xj |, |2yj |


son congruentes con 1 m
odulo 4. Multiplicamos la primera ecuaci
on por |2xj |,
tomamos congruencias m
odulo 4, usamos la segunda ecuaci
on (tambien como
congruencia) y nos queda que 4rj |2xj |2 |2xj+1 | |2yj |2 |2xj+1 | 0 (mod 4),
luego rj es entero, pero esto es una contradicci
on, pues ha de ser semientero.
En consecuencia existe un entero j para el que xj yj = 0, pero no puede
ser xj = 0 ya que (11.10) nos da entonces dyj+1 yj = rj , lo que contradice la
condici
on |rj |2 < /4 (notemos que en cualquier caso yj es entero).
Por lo tanto yj = 0, y como aj = (xj ) no es divisible entre enteros no
unitarios, ha de ser xj = 1 y, cualquiera que sea j, el ideal aj = 1 es igual a
uno del ciclo 0, . . . , k, como queramos probar.
Notemos que la f
ormula (11.4) para calcular el generador de un ideal principal sigue siendo v
alida en este caso.
Ejemplo Vamos a calcular el n
umero de clases para d = 79. Todo ideal es
similar a uno de norma menor o igual que 10. Los primos se comportan como
sigue:
2 = [2, 1]2 , 3 = [3, 1][3, 1], 5 = [5, 2][5, 2], 7 = [7, 3][7, 3].
Los ideales posibles son
(1),

[2, 1],

[2, 1][3, 1],

[3, 1],

[2, 1][3, 1],

[3, 1],

[5, 2],

[2, 1][5, 2],

[5, 2],

[2, 1][5, 2],

[7, 3],
[3, 1]2 ,

[7, 3],
[3, 1]2 .

Partiendo de [2, 1], tenemos que a0 = 2 y r0 es el mayor n


umero congruente
con 1 m
odulo 2 cuyo cuadrado no supera a 79, o sea, r0 = 7. Aplicamos el
algoritmo: (2, 7), (15, 8), (1, ), luego resulta que [2, 1] es principal (notemos que
la sucesi
on de las normas ya no es decreciente).
Ahora consideramos el ideal [3, 1]. Para este a0 = 3 y r0 es el mayor n
umero
congruente con 1 m
odulo 3 cuyo cuadrado no supera a 79, o sea, r0 = 7. Ahora
tenemos (3, 7), (10, 3), (7, 4), (9, 5), (6, 7), (5, 8), (3, 7).
Como entramos en un ciclo, el ideal [3, 1] no es principal. Adem
as vemos
que [3, 1] es similar a ideales de norma 10, 7, 9, 6 y 5, que tienen que ser algunos
de los que figuran en nuestra lista. No importa cu
ales sean de hecho, pues
como son pares de conjugados, el que no es similar a [3, 1] lo es a [3, 1], luego
es redundante en cualquier caso. Con esto nuestros candidatos se reducen a
(1), [3, 1], [3, 1].
Sabemos que [3, 1] es similar a un ideal de norma 9, que ha de ser [3, 1]2 o
bien [3, 1]2 , pero si fuera [3, 1]2 [3, 1], entonces [3, 1] (1), luego podemos
concluir que [3, 1] [3, 1]2 , y por consiguiente [3, 1]2 no es principal (ni
[3, 1], por ser el conjugado de [3, 1]). Esto nos dice que la clase del ideal
[3, 1] tiene orden 3 en el grupo de clases, luego los tres ideales (1), [3, 1] y
[3, 1] no son similares entre s, y el n
umero de clases es h = 3.

11.3. C
alculo del n
umero de clases

433

No damos m
as ejemplos porque las diferencias con el caso d < 0 son mnimas
en la pr
actica. Veamos ahora que el algoritmo que hemos dado nos permite
tambien determinar las unidades de los anillos de enteros cuadr
aticos reales.
Apliquemos el algoritmo al ideal a0 = (1) (en ning
un momento hemos excluido este caso). Como es principal, al cabo de k pasos volveremos a obtener el (1),
on anterior, el generador al que llegaremos
pero, siguiendo la notaci
xk + yk d no ser
a 1 sino launidad dada por (11.7).
Sabemos que = u + v d 6= 1 y que u, v > 0. De aqu se sigue que
las
potencias de son todas distintas. Vamos a probar que las unidades de Q d
son exactamente n , donde
umeros enteros.
n recorre los n
En
efecto,
sea
x
+
y
d
una
unidad
cualquiera.
Al partir del ideal a0 =
0
0

x0 + y0 d se ha de alcanzar aj = (1) para alg


un j. Como a0 = 1, el valor de
r0 es simplemente el mayor entero cuyo cuadrado no supera a d (la congruencia
m
odulo 1 no es una restricci
on), luego el algoritmo a partir de (a0 , r0 ) contin
ua
exactamente igual a como empieza cuando partamos de a0 = (1), luego el ciclo
de aj s y rj s que
se produce al partir de a0 = (1) es el mismo que el producido

con a0 = x0 + y0 d , luego el valor de que da la f


ormula (11.7) es el mismo
en ambos casos.
Adem
as hemos probado no s
o
lo que aj = (1), sino que para un cierto entero

n se tieneadem
as xj+nk + yj+nk d =
1. Por otra parte xj+nk + yj+nk d =

n x0 +y0 d , luego resulta que x0 +y0 d = n , como queramos demostrar.


En particular hemos demostrado el teorema siguiente:

Teorema 11.8 Sea d un


umero natural libre de cuadrados d 6= 1. Entonces
n
existe una unidad de Q d tal que los elementos n para n Z son distintos

dos a dos y constituyen todas las unidades de Q d . Dicha unidad se llama
unidad fundamental.

Ejemplos Calculemos la unidad fundamental de Q 2 . Hemos de partir del
ideal (1), luego a0 = 1 y r0 es el mayor entero cuyo cuadrado no supera a 2, o
sea, r0 = 1.

El algoritmo es (1, 1), (1, ), luego = 1 + 2 /1 es la unidad fundamental.


n

Las dem
as unidades son las de la forma 1 + 2 .

Para Q 3 queda (1, 1), (2, 1), (1, ), luego

1+ 3 1+ 3
=
= 2 + 3.
2

Para Q 6 resulta (1, 2), (2, 2), (1, ), luego

2+ 6 2+ 6
=
= 5 + 2 6.
2

Para Q 5 es r0 = 1/2 y as (1, 1/2), (1, ). Por lo tanto,

1+ 5
=
.
2

434

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos
Tabla 11.2: N
umero de clases de cuerpos cuadr
aticos reales

Se indica tambien la unidad fundamental y su norma. Los n


umeros en negrita
son los que cumplen d 1 (mod 4). El n
umero es el definido en (11.1).
d h
2
3
5
6
7
10
11
13
14
15
17
19
21
22
23
26
29
30
31
33
34
35
37
38
39
41
42
43
46
47
51

1
1
1
1
1
2
1
1
1
2
1
1
1
1
1
2
1
2
1
1
2
2
1
1
2
1
2
1
1
1
2

d
N()
1+
1
53
2+
+1
55

1
57
5 + 2
+1
58
8 + 3
+1
59
3+
1
61
10 + 3
+1
62
1+
1
65
15 + 4
+1
66
4+
+1
67
3 + 2
1
69
170 + 39
+1
70
2+
+1
71
197 + 42
+1
73
24 + 5
+1
74
5+
1
77
2+
1
78
11 + 2
+1
79
1.520 + 233
+1
82
19 + 8
+1
83
35 + 6
+1
85
6+
+1
86
5 + 2
1
87
37 + 6
+1
89
25 + 4
+1
91
27 + 10
1
93
13 + 2
+1
94
3.482 + 531
+1
95
24.335 + 3.588
+1
97
48 + 7
+1 101
50 + 7
+1

h
1
2
1
2
1
1
1
2
2
1
1
2
1
1
2
1
2
3
4
1
2
1
2
1
2
1
1
2
1
1

N()
3+
1
89 + 12
+1
131 + 40
+1
99 + 13
1
530 + 69
+1
17 + 5
1
63 + 8
+1
7 + 2
1
65 + 8
+1
48.842 + 5.967
+1
11 + 3
+1
251 + 30
+1
3.480 + 413
+1
943 + 250
1
43 + 5
1
4+
+1
53 + 6
+1
80 + 9
+1
9+
1
82 + 9
+1
4+
1
10.405 + 1.122
+1
28 + 3
+1
447 + 106
1
1.574 + 165
+1
13 + 3
+1
2.143.295 + 221.064
+1
39 + 4
+1
5.035 + 1.138
1
9 + 2
1


Para Q 97 es r0 = 9/2, luego el algoritmo nos da

(1, 9/2), (4, 7/2), (3, 5/2), (6, 7/2), (2, 9/2),

(2, 7/2), (6, 5/2), (3, 7/2), (4, 9/2), (1, ).

La unidad fundamental es 5.604 + 569 97.

11.3. C
alculo del n
umero de clases

435

Una aplicaci
on de estos resultados es la soluci
on de la llamada ecuaci
on de
Pell. Se trata de la ecuaci
on dy 2 + 1 = x2 . Fermat plante
o a los matem
aticos
ingleses de su tiempo encontrar un metodo para hallar las soluciones enteras de
dicha ecuaci
on. El nombre de ecuaci
on de Pell se debe a un error de Euler, que
atribuy
o a Pell su soluci
on, cuando al parecer Pell no hizo ninguna contribuci
on
a este tema.

Desde nuestro punto de vista la ecuaci


on equivale a N x+y d = 1. Cuando
d es positivo, libre de cuadrados y no es congruente con
1 m
odulo 4 sabemos
que tiene infinitas soluciones, a saber, las unidades de Z d de norma 1.
Si d < 0 es f
acil ver que las u
nicas soluciones son x = 1, y = 0, luego el caso
no tiene interes. Tambien es f
acil ver que d no debe ser un cuadrado perfecto,
pues si d = a2 una soluci
on de la ecuaci
on de Pell da lugar a la expresi
on
(ay)2 + 1 = x2 , y es f
acil ver que dos cuadrados perfectos no pueden diferir en
una unidad (salvo y = 0, x = 1).
Sin embargo, no hay m
as limitaciones. La ecuaci
on de Pell tiene infinitas
soluciones enteras siempre que d sea un n
umero positivo no cuadrado perfecto.
No vamos a demostrar esto aqu, pero lo cierto es que las soluciones de la
ecuaci
on de Pell dy 2 + 1 = x2 son exactamente los coeficientes de las potencias
de la unidad que se obtiene seg
un el algoritmo visto en este captulo para el
caso d > 0, d 6 1 (mod 4) (es decir, tomando = 4d, aun en el caso de que
d no cumpla estas hip
otesis) si N() = 1, y son los coeficientes de las potencias
de 2 si por el contrario N() = 1. De hecho este algoritmo (conocido como
metodo ingles) fue ideado por Wallis en respuesta al reto de Fermat de resolver
la ecuaci
on de Pell y de el derivan los dem
as algoritmos que hemos visto. Una
justificaci
on de todo esto desde nuestro punto de vista supondra estudiar los
subanillos de los anillos de enteros algebraicos, en lo cual no nos vamos
a detener.
Por ejemplo, la unidad fundamental para d = 97 es 5.604
+
569
97, pero

tiene norma 1, y su cuadrado es 62.809.633 + 6.377.352 97, por lo que la


menor soluci
on de la ecuaci
on de Pell para d = 97 es
97(6.377.352)2 + 1 = 62.809.6332 .
No cabe duda de que Fermat conoca la soluci
on del problema que plante
o,
pues mostr
o como ejemplos las soluciones para los casos d = 109 y d = 149,
que son nada menos que y = 15.140.424.455.100 e y = 2.113.761.020, respectivamente. En el siglo XII, el matem
atico hind
u Bh
ascara Ach
arya conoca la
soluci
on mnima para d = 61, que es la m
as grande para d 100. Se trata de
y = 226.153.980.
Ejemplo Vamos a resolver la ecuaci
on de Pell 18y 2 + 1 = x2 (notemos que 18
no es libre de cuadrados).
Tenemos: (1, 4), (2, 4), (1, ). Por lo tanto

4 + 18 4 + 18
=
= 17 + 4 18.
2
Como N() = 1, la menor soluci
on es y = 4.

436

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos
Tabla 11.3: Soluciones mnimas de la ecuaci
on de Pell
d
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

2
1

4
2
3
1

6
3
2
180
4
1

8
4
39
2
12
42
5
1

d
26
27
28
29
30
31
32
33
34
35
36
37
38
39
41
41
42
43
44
45
46
47
48
49
50

y
10
5
24
1.820
2
273
3
4
6
1

12
6
4
3
320
2
531
30
24
3.588
7
1

14

d
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75

y
d
7
76
90
77
9.100
78
66
79
12
80
2
81
20
82
2.574
83
69
84
4
85
226.153.980 86
8
87
1
88

89
16
90
8
91
5.967
92
4
93
936
94
30
95
413
96
2
97
267.000
98
430
99
3
100

y
6.630
40
6
9
1

18
9
6
30.996
1.122
3
21
53.000
2
165
120
1.260
221.064
4
5
6.377.352
10
1

La tabla 11.3 contiene las menores soluciones de la ecuaci


on de Pell para los
primeros valores de d. Es evidente que los ejemplos mostrados por Fermat no
estaban elegidos al azar. El lector emprendedor puede abordar el caso d = 421.
La soluci
on mnima tiene 33 dgitos.

11.4

Los teoremas de Euler

Acabamos de obtener resultados muy profundos sobre la aritmetica de los


cuerpos cuadr
aticos, el m
as importante de los cuales es sin duda el algoritmo que
nos permite calcular los n
umeros de clases y las unidades fundamentales. Para
hacernos una idea de su importancia vamos a considerar un cuerpo cuadr
atico
K que cumpla dos condiciones:
1. Su n
umero de clases de h = 1, es decir, OK es un DFU.
2. Si K es real entonces tiene unidades de norma negativa.

11.4. Los teoremas de Euler

437


Un ejemplo es K = Q 13 . Su unidad fundamental es 1 + 1+2 13 y tiene
norma 1 (notar que la existencia de unidades de norma negativa equivale a
que la unidad fundamental tenga
norma negativa).

En general tenemos que N x + y 1+2 13 = x2 + xy 3y 2 . Consideremos el


problema siguiente:

Existen n
umeros enteros x e y tales que x2 + xy 3y 2 = 15?
Para alguien que desconozca la teora que hemos desarrollado se trata de un
problema muy difcil, pues el signo negativo delante del 3 hace que la mnima
soluci
on, si existe, pueda estar formada por n
umeros muy grandes, imposibles
de obtener por tanteo.
Sin embargo para nosotros es trivial: la pregunta es si existe un entero de K
de norma 15. Dicho entero factorizara en el producto de un primo de norma 3
por uno de norma 5 (pues los primos cuadr
aticos han de tener norma potencia
de primo), luego en particular ha de haber un primo de norma 5, lo que significa
que 5 ha de escindirse en K (no se ramifica porque no divide al discriminante
= 13). Ahora bien, sabemos que 5 se escinde si y s
olo si 13 es un resto
cuadr
atico m
odulo 5, pero los restos cuadr
aticos m
odulo 5 son 1 y 4, luego
[13] = [3] no es uno de ellos. As pues, la ecuaci
on no tiene soluciones enteras.
Si el lector se pregunta d
onde hemos usado las dos hip
otesis sobre K la
respuesta es que en ning
un sitio: el argumento anterior es v
alido para cualquier
cuerpo cuadr
atico. Las hip
otesis las necesitamos si queremos resolver casos en
los que s haya soluci
on:
En general, existen enteros cuadr
aticos de norma un primo p si y s
olo si p se
escinde o se ramifica en K. Aqu s hacemos uso de las dos hip
otesis: sin ellas
s
olo podemos decir que existe un ideal p de norma p si y s
olo si p se escinde o se
ramifica en K. Si h = 1 se cumplir
a adem
as que p = (), para cierto primo ,
luego podemos concluir que existe un entero cuadr
atico tal que | N()| = p
si y s
olo si p se escinde o se ramifica. Si K es imaginario todas las normas son
positivas, si K es real y hay unidades de norma 1, multiplicando por una
de ellas si es preciso podemos exigir tambien que N() = p, con lo que tenemos
que hay un entero cuadr
atico de norma p si y s
olo si p se escinde o se ramifica
en K.
Por lo tanto podemos construir enteros cuadr
aticos de cualquier norma m
con la u
nica restricci
on de que los primos que dividan a m con exponente impar
se escindan o ramifiquen en K (pues siempre existen enteros cuadr
aticos de
norma p2 , a saber el propio p). En nuestro caso concreto tenemos:
La ecuaci
on x2 + xy 3y 2 = m tiene soluciones enteras para un m
dado si y s
olo si los primos que dividen a m con exponente impar
son de la forma x2 + xy 3y 2 , y un primo p es de esta forma si y
s
olo si p = 13 o 13 es un resto cuadr
atico m
odulo p.

Esta
es una soluci
on completamente satisfactoria del problema, pues nos
permite saber con un n
umero finito de operaciones si cualquier n
umero m es o

438

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

no de la forma indicada. Las operaciones consisten en determinar si 13 es o no


un resto cuadr
atico m
odulo un n
umero finito de primos.
Fijemonos en la condici
on 13
atico m
odulo p. En el caso
es un resto cuadr
general de un cuerpo K = Q d y p un primo impar sera d es un resto
cuadr
atico m
odulo p, y como el discriminante es = d o = 4d, y ciertamente
d es un resto cuadr
atico m
odulo p si y s
olo si lo es 4d, podemos expresar la
condici
on como
es un resto cuadr
atico m
odulo p.

Esta
es la condici
on para que un primo impar que no divida a se escinda
en K, y es lo que hay que comprobar para un n
umero finito de primos p a la
hora de decidir si un n
umero m es la norma de un entero cuadr
atico.
En principio, si nos dan cien primos p y determinamos si cumplen o no esta
condici
on, nuestros c
alculos no nos ayudar
an en nada para decidir si un nuevo
primo cumple la condici
on o no, es decir, el saber si es o no un resto cuadr
atico
m
odulo p no nos dice nada sobre si lo es m
odulo otro primo q.
Pues bien, alrededor de 1.740 Euler estaba investigando un caso particular
de este problema (concretamente cu
ando un primo p divide a un n
umero de la
forma x2 + ny 2 ) y descubri
o algo sorprendente. Es obvio que la condici
on
es un resto cuadr
atico m
odulo p
depende s
olo del resto de m
odulo p. Lo que Euler descubri
o (formulado en
nuestros terminos) es que dicha condici
on depende s
olo del resto de p m
odulo
, es decir, si dos primos impares p, q cumplen p q (mod ) entonces es
un resto cuadr
atico m
odulo p si y s
olo si lo es m
odulo q (o equivalentemente,
p se escinde en K si y s
olo si q se escinde en K). Esto es mucho m
as que
un mero juego de palabras: en efecto, que la condici
on dependa s
olo del resto
de m
odulo p no nos dice nada, porque es fijo y al cambiar p cambiamos
el resto m
odulo p, pero que la condici
on dependa s
olo del resto de p m
odulo
es algo completamente distinto pues, como es una constante de nuestro
problema, hay s
olo un n
umero finito de restos m
odulo a tener en cuenta.
Concretamente,
un
primo
p
que
no
divida
a

ha
de pertenecer a una de las

|| clases del grupo U|| de las unidades m
odulo ||. Lo que nos dice
el
descubrimiento de Euler es que si determinamos el comportamiento de ||
primos, uno en cada clase, ya no necesitamos comprobar si es o no un resto
cuadr
atico m
odulo ning
un otro primo, sino que, dado otro primo p, bastar
a
calcular su resto m
odulo (o sea, ver a que clase corresponde) y ya sabremos
que el comportamiento de p ser
a el mismo que el del primo en dicha clase que
ya habamos estudiado.
En nuestro ejemplo concreto tenemos que considerar el grupo
U13 =

[1], [2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12] .

Tomamos un primo en cada clase, por ejemplo:

53, 2, 3, 17, 5, 19, 7, 47, 61, 23, 37, 51.

11.4. Los teoremas de Euler

439

Comprobamos si 13 es o no un resto cuadr


atico m
odulo cada uno de estos
doce primos (es resto cuadr
atico m
odulo los que est
an en negrita). Si el lector
se molesta en hacer los c
alculos se har
a una idea de lo tedioso que resulta
comprobar que 13 es un resto no cuadr
atico m
odulo 37.
Admitiendo el descubrimiento de Euler, la conclusi
on a la que llegamos es
que un primo p se escinde en K si y s
olo si p 1, 3, 4, 9, 10, 12 (mod 13), p se
conserva en K si y s
olo si p 2, 5, 6, 7, 8, 11 (mod 13) y p se ramifica si y s
olo
si p = 13.
(En realidad nuestros razonamientos no incluyen el caso p = 2, pero veremos
que la conclusi
on vale igualmente).

Esta
es, pues, una soluci
on muchsimo m
as elegante desde un punto de vista
te
orico y muchsimo m
as satisfactoria desde un punto de vista pr
actico, pues
es m
as f
acil calcular el resto de p m
odulo 13 que determinar si 13 es o no
un resto cuadr
atico m
odulo p. Pero los descubrimientos de Euler no acaban
aqu. Notemos que de las 12 clases resulta que 6 corresponden a primos que se
escinden y las otras 6 a primos quese ramifican. Esto no es
as a
un, si
casual. M
nos fijamos veremos que las clases [1], [3], [4], [9], [10], [12] , correspondientes a
primos que se escinden, forman un subgrupo de U13 . Tambien llama la atenci
on
que 1 + 12 = 3 + 10 = 4 + 9 = 13. En general, si llamamos clases de escisi
on a
aquellas cuyos primos se escinden, se cumple:
1. Las clases de escisi
on forman un subgrupo de ndice 2 en U|| .
2. Si K es real la clase [n] es de escisi
on si y s
olo si lo es [n], si K es
imaginario [n] es una clase de escisi
on si y s
olo si [n] no lo es.
Sabiendo esto, el camino por el que hemos llegado a la soluci
on del ejemplo
se allana mucho m
as. En efecto: comprobamos sin dificultad que 13 es un resto
cuadr
atico m
odulo 3 (pues [13] = [1]), por lo tanto [3] es una clase de escisi
on.
Por la propiedad 2) tambien lo es [3] = [10]. Por 1) tambien lo es [3]2 = [9] y
por 2) [9] = [4]. Por u
ltimo [1] es clase de escisi
on por 1) y [12] lo es por 2).
Como ya tenemos 6, sabemos que son todas.
As pues, con esta informaci
on la soluci
on del problema no requiere m
as
c
alculo que el car
acter cuadr
atico de 13 m
odulo 3 (el lector que se haya molestado en calcular el car
acter cuadr
atico de los doce primos de antes apreciar
a
sin duda la diferencia).
Euler descubri
o empricamente estos hechos, aunque no fue capaz de demostrar sino una mnima parte de ellos. No obstante encontr
o una propiedad
sencilla de enunciar sobre restos cuadr
aticos a partir de la cual demostr
o todos
estos resultados. Hoy se conoce como Ley de Reciprocidad Cuadr
atica.
Legendre demostr
o la ley de reciprocidad a partir de un principio aparentemente m
as sencillo que no pudo demostrar y que nosotros hemos usado
t
acitamente: que toda clase de Um contiene alg
un primo. En efecto, en la clase
[1] hemos encontrado el primo 53, en [4] est
a el 17, etc., pero que garanta
tenamos de que en todas las clases bamos a encontrar alg
un primo? Si una

440

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

clase no contuviera primos no tendra sentido decir si es o no una clase de escisi


on. Notar que si [n] es una clase de Um sus elementos son los n
umeros de la
forma mx + n, por lo que el postulado de Legendre se puede enunciar as:
Si m y n son n
umeros naturales primos entre s entonces la progresi
on aritmetica mx + n contiene un n
umero primo.
Cuando contaba con poco m
as de veinte a
nos de edad, Gauss redescubri
o
la ley de reciprocidad cuadr
atica y la demostr
o. Tambien se tropez
o con el
postulado de Legendre y no consigui
o demostrarlo, pero pudo eludirlo a la hora
de probar la ley de reciprocidad.
A
nos m
as tarde, Dirichlet demostr
o lo que hoy se conoce como teorema de
Dirichlet sobre primos en progresiones aritmeticas, seg
un el cual si (m, n) = 1
la progresi
on aritmetica mx + n contiene infinitos primos. La prueba original
de Dirichlet combinaba tecnicas analticas con la aritmetica de los cuerpos ciclot
omicos (de cualquier orden, no necesariamente primo) y escapa a nuestras
posibilidades actuales. Hoy se conoce una prueba que no requiere teora algebraica de n
umeros pero s una cierta dosis de teora de funciones analticas, algo
completamente ajeno a este libro.
As pues, nosotros no demostraremos el teorema de Dirichlet, pero probaremos la ley de reciprocidad sin el. La prueba original de Gauss era muy
complicada, al parecer capaz de desesperar a sus alumnos m
as aventajados.
Despues encontr
o otra prueba basada esencialmente en la aritmetica de los cuerpos cuadr
aticos tambien muy profunda pero conceptualmente m
as clara. A
nos
m
as tarde encontr
o varias pruebas m
as de car
acter m
as elemental. Aqu veremos una prueba m
as moderna completamente elemental. Despues tendremos
que ingeni
arnoslas para evitar el teorema de Dirichlet a la hora de deducir los
teoremas de Euler sobre cuerpos cuadr
aticos.

11.5

La ley de reciprocidad cuadr


atica

Los resultados sobre restos cuadr


aticos se enuncian m
as c
omodamente utilizando una notaci
on debida a Legendre.
Definici
on 11.9 Sea p > 0 un primo impar y n un entero. Definimos el smbolo
de Legendre (n/p) como

1 si n es un resto cuadr
atico m
odulo p
n
1 si n es un resto no cuadr
atico m
odulo p
=

p
0 si p | n
Obviamente, si n n0 (mod p) entonces (n/p) = (n0 /p).

Sea p un primo impar y consideremos la aplicaci


on Up Up dada por
x 7 x2 . Obviamente es un homomorfismo de grupos cuya imagen la forman
las clases de restos cuadr
aticos m
odulo p. Su n
ucleo son las clases de Z/pZ que
cumplen x2 1 = 0. Como Z/pZ es un cuerpo este polinomio tiene s
olo dos

11.5. La ley de reciprocidad cuadr


atica

441

races, a saber, [1]. Ahora el teorema de isomorfa nos da que el n


umero de
clases de restos cuadr
aticos es exactamente la mitad del total de clases, o sea,
(p 1)/2.
El paso siguiente en el estudio de los restos cuadr
aticos es el teorema siguiente:
Teorema 11.10 (Criterio de Euler) Sea p un primo impar y n Z. Entonces

n
n(p1)/2 (mod p).
p
n: Si p | n el teorema es evidente. Supongamos lo contrario.
Demostracio

2
Tomando clases m
odulo p, vemos que n(p1)/2 = [n]p1 = [1], pues [n]
es un elemento del grupo Up , de orden p 1, y acabamos
de comentar que las
u
nicas clases que cumplen esto son [1], luego n(p1)/2 = [1].
Por otro lado, si n es un resto cuadr
atico se cumple [n] = [u]2 , luego
h
i
n(p1)/2 = [u]p1 = [1].

Basta probar que esto s


olo ocurre cuando n es un resto cuadr
atico, pero esto
ocurre cuando [n] es una raz del polinomio x(p1)/2 1, que a lo sumo tiene
(p 1)/2 races, y como de hecho las clases de los restos cuadr
aticos suman
ya este n
umero,
concluimos
que
no
hay
m
a
s.
Por
lo
tanto,
si
n
es
un resto no

cuadr
atico n(p1)/2 ha de ser [1].
Esto nos da un metodo para calcular smbolos de Legendre ligeramente m
as
pr
actico que calcular todos los cuadrados m
odulo p: se calcula n(p1)/2 y se
reduce m
odulo p. Tiene que dar 1, 0 o 1 y ese es el valor de (n/p). Una
consecuencia te
orica de interes es que el smbolo de Legendre es multiplicativo:
Teorema 11.11 Sea p un primo impar y a, b enteros cualesquiera. Entonces:

ab
a
b
=
p
p
p
n: El criterio de Euler nos da que ambos miembros son conDemostracio
gruentes, pero como valen 1, 0 o 1, de hecho son iguales.
Del criterio de Euler tambien se deduce un caso particular de la ley de
reciprocidad cuadr
atica:
Teorema 11.12 Si p es un primo impar,

1
= (1)(p1)/2 ,
p
luego 1 es un resto cuadr
atico m
odulo p si y s
olo si p 1 (mod 4).

442

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

En efecto, el criterio de Euler nos da que ambos miembros son congruentes


m
odulo p, pero de hecho ambos son iguales a 1, luego son iguales entre s.

Por que m
odulo 4? Porque 4 es el discriminante de Q 1 . Tenemos que 1 es un resto cuadr
atico m
odulo p si y s
olo si = 4 es un resto
cuadr
atico m
odulo p y, seg
un uno de los teoremas de Euler que hemos citado
en la introducci
on, esto ha de depender s
olo del resto de p m
odulo || = 4, que
es lo que ahora acabamos de probar.
Nuestra prueba de la ley de reciprocidad se basar
a en el siguiente teorema
de Gauss:
Teorema 11.13 (Gauss): Sea p un primo impar y a un entero primo con p.
Sean los subconjuntos de Up dados por

p1
p1
]
y
P = [1], . . . , [
] .
2
2

Sea r = [a]P N , donde [a]P = [a][u] [u] P . Entonces



a
= (1)r .
p
N=

[1], . . . , [

n: Como
Demostracio
on que a [u] le asigna
[a]
es una unidad, la aplicaci
[a][u] es biyectiva, luego [a]P = |P | = (p 1)/2.
Dados dos elementos de P , digamos [u] y [v] con 0 < u < v (p 1)/2,
no puede suceder que [a][u] = [a][v], pues entonces [a][u] + [a][v] = 0, o sea,
p | a(u + v), luego p|u + v < p, lo cual es imposible.
Esto significa que [a]P = [1], . . . , [(p 1)/2] , y hay exactamente r
signos negativos. Por lo tanto, si llamamos [z] al producto de todos los elementos de P , tenemos que el producto de todos los elementos de [a]P es por
un lado [a](p1)/2 [z] y por otro es (1)r [z]. Como [z] es una unidad podemos
simplificarla y queda [a](p1)/2 = [(1)r ].
El teorema se sigue ahora del criterio de Euler.
Este criterio no nos ser
a especialmente interesante en cuanto dispongamos
de la ley de reciprocidad cuadr
atica, pero como ejemplo para comprenderlo
adecuadamente vamos a usarlo para determinar si 3 es un resto cuadr
atico
m
odulo 19.
Calculamos [3]P , es decir, multiplicamos [3] por los n
umeros del 1 al 9:

[3]P = [3], [6], [9], [12], [15], [18], [2], [5], [8] .
Restamos 19 a los n
umeros mayores que 9 y queda:

[3]P =
[3], [6], [9], [7], [4], [1], [2], [5], [8]

=
[1], [2], [3], [4], [5], [6], [7], [8], [9] .

Como hay 3 signos negativos, (3/19) = (1)3 = 1, luego 3 es un resto


no cuadr
atico m
odulo 19. N
otese que este c
alculo es m
as simple que aplicar el
criterio de Euler directamente.

11.5. La ley de reciprocidad cuadr


atica

443

El 1 es un caso aparte en la ley de reciprocidad cuadr


atica porque es una
unidad. Tambien es un caso aparte el 2 (y muy en el fondo el motivo es que 2 es
el grado de los cuerpos cuadr
aticos). El teorema anterior nos permite resolverlo:
Teorema 11.14 Sea p un primo impar. Entonces

2
2
= (1)(p 1)/8 ,
p
luego 2 es un resto cuadr
atico m
odulo p si y s
olo si p 1 (mod 8).

Aplicamos el teorema de Gauss. Consideramos [2]P = [2], [4], . . . , [p1] .


Entonces r = p1
2 s, donde s es el mayor natural tal que 2s (p 1)/2.

Caso 1: (p 1)/2 es par y, consecuentemente 2s = p1


2 . Calculando obtenemos r = (p 1)/4 y el valor del smbolo de Legendre es (1)(p1)/4 , pero
como (p + 1)/2 es impar, este valor no se altera si lo elevamos a (p + 1)/2, y
p+1
p2 1
como p1
4
2 =
8 , se cumple el teorema.
Caso 2: (p 1)/2 es impar, y 2s = p1
2 1, luego r = (p + 1)/4, y como en
el caso anterior podemos elevar el resultado que nos da el teorema de Gauss al
exponente impar (p 1)/2, de donde se sigue tambien el enunciado.
A la hora de determinar si un n
umero n es o no un resto cuadr
atico m
odulo
un primo dado p, lo mejor es usar el teorema 11.11, que nos reduce el problema
a calcular los smbolos de Legendre para los primos divisores de n y para 1
si n es negativo (de hecho, los primos que tengan exponente par pueden ser
ignorados, pues el cuadrado de un smbolo de Legendre siempre es 1).
Por lo tanto el problema se reduce a calcular smbolos de Legendre (q/p),
donde q es primo o q = 1. Los casos q = 1 y q = 2 ya est
an resueltos. La
ley de reciprocidad cuadr
atica cubre los casos restantes:
Teorema 11.15 (Ley de reciprocidad cuadr
atica) Sean p y q primos impares distintos.
1. Si p o q es congruente con 1 m
odulo 4, entonces

p
q
=
,
q
p
2. Si ninguno de los dos primos es congruente con 1 m
odulo 4, entonces


p
q
=
,
q
p
Equivalentemente, para cualquier par de primos impares p y q se cumple

p
q
= (1)(p1)(q1)/4 .
q
p

444

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

n: Es claro que si p o q es congruente con 1 m


Demostracio
odulo 4 entonces
(p 1)(q 1)/4 es un n
umero par, y en otro caso es impar (los factores (p 1)/2
y (q 1)/2 son impares). Por lo tanto la u
ltima afirmaci
on del enunciado es
equivalente a las dos primeras.
Por el teorema de Gauss, (p/q) = (1)r , donde r es el n
umero de enteros x
entre 1 y (q 1)/2 tales que px es congruente m
odulo q con un entero u tal que
(q 1)/2 u < 0, o sea, px = qy + u para cierto entero y, completamente
determinado por x.
Por lo tanto, r es tambien el n
umero de pares de n
umeros enteros (x, y) tales
que
1/2 < x < q/2
y
q/2 < px qy < 0.
Entonces qy < px + q/2 < pq/2 + q/2, luego y < p/2 + 1/2 y, al ser entero,
y < p/2.
Notar tambien que, como px > 0 y u < 0, de px = qy + u se sigue que y > 0.
En resumen, r es el n
umero de pares de n
umeros enteros (x, y) que cumplen
1/2 < x < q/2,
1/2 < y < p/2
q/2 < px qy < 0.

(11.12)
(11.13)

An
alogamente, (q/p) = (1)s , donde s es el n
umero de pares de enteros que
cumplen estas mismas condiciones cambiando p por q y viceversa. Este n
umero
no se altera si cambiamos tambien x por y.
Si adem
as multiplicamos las desigualdades por 1 queda:
1/2 < x < q/2,
1/2 < y < p/2
(11.14)
0 < px qy < p/2.
(11.15)

q
Lo que queremos probar es que pq
= (1)r+s = (1)(p1)(q1)/4 , lo
p
que equivale a que (p 1)(q 1)/4 (r + s) sea un n
umero par.
Ahora bien, (p 1)(q 1)/4 es el n
umero de pares de enteros (x, y) que
cumplen (11.12), luego (p 1)(q 1)/4 (r + s) resulta ser el n
umero de pares
de enteros (x, y) que cumplen (11.12) pero que no cumplen ni (11.13) ni (11.15).
Notemos que siendo p 6= q es imposible px qy = 0, ya que en tal caso
p | y < p/2. Por lo tanto, la negaci
on de (11.13) y (11.15) equivale a la negaci
on
de q/2 < px qy < p/2. Lo que debemos probar es que el n
umero de pares
de enteros (x, y) que cumplen
1/2 < x < q/2,

1/2 < y < p/2,

y no

q/2 < px qy < p/2

es un n
umero par. La figura 11.1 ilustra la prueba en el caso p = 11 y q = 17.
Definimos los conjuntos

A =
(x, y) 1/2 < x < q/2, 1/2 < y < p/2, px qy < q/2

B =
(x, y) 1/2 < x < q/2, 1/2 < y < p/2, px qy > p/2 .

11.5. La ley de reciprocidad cuadr


atica

445
11x 17y = 0

y
5
4

11x 17y < 17/2

3
2

11x 17y > 11/2

1
2
3
4
5
6
7
Figura 11.1: La ley de reciprocidad cuadr
atica

Claramente se trata de conjuntos disjuntos y hemos de probar que el n


umero
de elementos de A B es par. Para ello basta comprobar que A y B tienen
el mismo n
umero de elementos. La
on : Z Z Z Z dada por
aplicaci
(x, y) = (q+1)/2x, (p+1)/2y es claramente biyectiva y es f
acil comprobar
que cumple f [A] = B, luego el teorema est
a probado.
Antes de extraer consecuencias te
oricas de la ley de reciprocidad, vamos a ver
c
omo nos permite calcular cualquier smbolo de Legendre mediante operaciones
elementales. El metodo consiste, dado (n/p), en reducir n m
odulo p, factorizarlo
en primos y descomponer seg
un 11.11 en el producto de los smbolos de Legendre
de la forma (q/p), donde q recorre los primos que dividen a n con exponente
impar y el 1 si n es negativo. Despues reducimos cada q m
odulo p y volvemos
a factorizar. Cuando lleguemos a un factor (q/p), donde q ya es menor que
p, invertimos el smbolo mediante la ley de reciprocidad y seguimos as hasta
reducir los smbolos a casos calculables directamente o, si queremos, hasta llegar
a 1 o a 1. En la pr
actica es mucho m
as simple de lo que parece. Veamos algunos
ejemplos:

2.002
97

62
97

2
97

31
97

31
97

97
31

4
31

= 1,

donde usamos que 97 1 (mod 8), luego (2/97) = 1, y 97 1 (mod 4), luego
(31/97) = (97/31). Finalmente, 4 es un cuadrado perfecto, luego (4/31) = 1.

15
71

3
71

5
71

71
3

71
5


2
1
=
= 1.
3
5

446

11.6

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

El smbolo de Jacobi

Recordemos que nuestro objetivo es deducir los teoremas de Euler a partir de


la ley de reciprocidad cuadr
atica. Sin embargo no podemos hacerlo directamente
porque ello nos llevara a tomar primos en las clases de los grupos Um , y no
sabemos justificar su existencia.
De este modo, si bien en la pr
actica siempre es m
as conveniente reducir
todos los c
alculos a n
umeros primos mediante factorizaciones, en teora hemos
de arregl
arnoslas para trabajar con n
umeros cualesquiera. Vamos a demostrar
una ley de reciprocidad en la que los n
umeros que intercambiemos no sean
primos necesariamente. El primer paso es generalizar el smbolo de Legendre:
Definici
on 11.16 Sean m y n enteros no nulos primos entre s. Supongamos
que n es impar positivo y factoriza en la forma n = p1 pr , donde los primos
son positivos y no necesariamente distintos. Definimos el smbolo de Jacobi de
m y n como
m m m
=

,
n
p1
pr
(donde los smbolos de la derecha son smbolos de Legendre).
Para n = 1 definimos (m/1) = 1.
Claramente se tiene

0
mm0
m
m
=
,
n
n
n

m m m
=
,
nn0
n
n0

as como que si m m0 (mod n), entonces (m/n) = (m0 /n). Adem


as el smbolo
de Jacobi coincide con el de Legendre cuando n es primo.
Es importante dejar claro que no es cierto que (m/n) = 1 si y s
olo si m es
un resto cuadr
atico m
odulo n. El interes del smbolo de Jacobi es simplemente
que generaliza formalmente el smbolo de Legendre a n
umeros compuestos, pero
no sirve directamente para obtener resultados sobre restos. He aqu la ley de
reciprocidad generalizada:
Teorema 11.17 Sean m, n > 0 enteros impares con (m, n) = 1.

1
1.
= (1)(n1)/2 .
n

2
2
2.
= (1)(n 1)/8 .
n
m n
3.
= (1)(m1)(n1)/4 .
n
m

n: 1) se deduce inmediatamente a partir de la definici


Demostracio
on y de
la propiedad an
aloga de los smbolos de Legendre. Hay que tener en cuenta que
si n y n0 son impares,
4 | (n 1)(n0 1) = nn0 1 (n 1) (n0 1),

11.6. El smbolo de Jacobi

447

luego el n
umero (nn0 1)/2 (n 1)/2 (n0 1)/2 es par, es decir,
0

(1)(nn 1)/2 = (1)(n1)/2 (1)(n 1)/2 .


2) se demuestra igual que 1), usando esta vez que si n y n0 son impares

16 | (n2 1)(n02 1) = (nn0 )2 1 (n2 1) (n02 1),

luego (nn0 )2 1 /8 (n2 1)/8 (n02 1)/8 es par.

3) Si m = 1 es obvio. Supongamos que m es primo. Si m 1 (mod 4),


entonces desarrollamos (m/n) seg
un los factores primos de n, invertimos por la
ley de reciprocidad cuadr
atica, volvemos a agrupar y queda (m/n) = (n/m).
Supongamos que m 1 (mod 4). Si n 1 (mod 4), entonces el n
umero
de factores primos de n congruentes con 1 m
odulo 4 ha de ser par, luego al
descomponer, invertir y agrupar aparece un n
umero par de signos negativos,
luego de nuevo (m/n) = (n/m).
Si n 1 (mod 4) el n
umero de signos negativos que aparecen es impar,
luego resulta que (m/n) = (n/m).
Si m no es primo razonamos igual descomponiendo m y usando la parte ya
probada en lugar de la ley de reciprocidad.
Estos resultados nos permiten calcular smbolos de Jacobi igual que los de
Legendre.
El teorema siguiente contiene el n
ucleo de los teoremas de Euler: Los smbolos de Jacobi dependen s
olo del resto del numerador m
odulo el denominador.
Ahora usaremos la ley de reciprocidad para probar que (con ciertas restricciones)
s
olo dependen del resto del denominador m
odulo el numerador.
Teorema 11.18 Sean m y n enteros primos entre s con n impar y positivo.
Si n0 es un entero impar y positivo tal que n n0 (mod 4m), entonces
m m
=
.
n
n0
Si se cumple m 1 (mod 4) es suficiente exigir n n0 (mod m).

n: Sea m = 2j m0 , donde m0 es impar y = 1. Entonces


Demostracio

j 0 j
n
0

2
m

2
=
(1)(m 1)(n1)/4
n
n
n
n
n
n
m0

0
j
j
m

2
m0

2
n
(m0 1)(n0 1)/4
=
=
(1)
.
n0
n0
n0
n0
n0
n0
m0
m

Como n n0 (mod m), se cumple (n/m0 ) = (n0 /m0 ).


0
0
0
Como n n0 (mod 4), tambien (1)(m 1)(n1)/4 = (1)(m 1)(n 1)/4 .

Si j es par, tambien (2/n)j = (2/n0 )j . Si j es impar, entonces (2/n)j = (2/n)


y (2/n0 )j = (2/n0 ). Adem
as m es par, luego de n n0 (mod 4m) se deduce

448

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

n n0 (mod 8), y por el teorema 11.17 (2/n) = (2/n0 ) (vale 1 si y s


olo si n (o
n0 ) es congruente con 1 m
odulo 8).
Finalmente, tambien por el teorema 11.17, (/n) = (/n0 ) (es igual a 1 si y
s
olo si n (o n0 ) es congruente con 1 m
odulo 4). En consecuencia (m/n) = (m/n0 ).
Si m 1 (mod 4) y n n0 (mod m) entonces j = 0.
Si = 1 entonces directamente
0
m
n
n
m
=
=
=
.
n
m
m
n0
Si = 1 entonces m0 1 (mod 4), luego
0

(1)(m 1)(n1)/4 = (1)(n1)/2 =


y llegamos a la misma conclusi
on.

Ya podemos demostrar los teoremas de Euler. Convine introducir una u


ltima
definici
on:
Definici
on 11.19
Sea d 6= 1 un entero libre de cuadrados y sea el discriminante del cuerpo Q d . Definimos la aplicaci
on signatura
sig : U|| {1, 1},


mediante sig [n] = (d/n) (donde n > 0 es impar)

Por los teoremas 10.17 y 11.18, sig([n]) no depende del impar n > 0 escogido
en la clase. Diremos que una clase A U|| es una clase de escisi
on para d si
sig(A) = +1.
Teorema 11.20
Sea d 6= 1 un entero libre de cuadrados y el discriminante
del cuerpo Q d .
1. La aplicaci
on sig : U|| {1, 1} es un epimorfismo de grupos, por lo
que el conjunto de lasclases
on forma un subgrupo de ndice 2 en
de escisi
U|| , y su orden es || /2.

2. Si d > 0 entonces [n] es una clase de escisi


on si y s
olo si [n] es una clase
de escisi
on.
3. Si d < 0 entonces [n] es una clase de escisi
on si y s
olo si [n] no es una
clase de escisi
on.

4. Si p es un primo que no divide a , entonces p se escinde en Q d si y
s
olo si [p] es una clase de escisi
on. En otro caso se conserva primo.
n: Es inmediato que la signatura es un
Demostracio
de
homomorfismo

grupos. Los apartados 2) y 3) se reducen a probar que sig [1] = signo de d.


En efecto:

11.6. El smbolo de Jacobi

449

Sea d = 2j u, donde u > 0 es impar y = 1. Entonces

sig [1] =

d
4|d| 1

4|d| 1

2
4|d| 1

u
4|d| 1

Aplicamos a cada factor el caso correspondiente del teorema 11.17:

= ,
4|d| 1

O bien j = 0, o bien 8 4|d|. En cualquier caso

2
4|d| 1

= 1.

Finalmente,

u
4|d| 1
1
(u1)/2
(u1)/2
= (1)
= (1)
= 1.
4|d| 1
u
u

Por lo tanto sig [1] = .

Para probar que la signatura es un epimorfismo es suficiente encontrar un


entero n tal que sig [n] = 1. Si d < 0 es consecuencia del apartado 3).
Supongamos d > 0. El caso d = 2 se sigue del teorema 11.17. Basta tomar
un entero n 6 1 (mod 8).
Si d 6= 2 sea p un primo impar que divida a d. Sea d = pm. Podemos tomar
un entero u tal que (u/p) = 1. Por el teorema chino del resto existe un entero
n tal que n u (mod p) y n 1 (mod 4m) (pues al ser d libre de cuadrados se
cumple que (p, m) = 1). Notar que (d, n) = 1. Entonces


d
p
m
n
m
u
m
sig [n] =
=
=
=
= 1.
n
n
n
p
n
p
1
El resto del apartado 1) es el teorema de isomorfa.
4) Por el teorema 11.2 un primo impar p que no divide a se
escinde si y
s
olo si d es un resto cuadr
atico m
odulo p, o sea, si y s
olo si sig [p] = (d/p) = 1.
En caso contrario p se conserva.
Falta considerar el caso
p = 2. Si 2 - entonces = d 1 (mod 4).
Para calcular sig [2] hemos de expresar [2] = [2 + kd], donde k se escoge de
modo que 2 + kd sea impar y positivo.
Podemos exigir k 1
(mod 4), y as 2 + kd 1 (mod 4). El teorema 11.17
1
nos da entonces que 2+kd = 1, luego

sig [2] =

d
2 + kd

|d|
2 + kd

2 + kd
|d|

Seg
un el teorema 11.17 concluimos que

sig [2] = 1 si y s
olo si |d| 1 (mod 8),

2
|d|

450

Captulo 11. Factorizaci


on en cuerpos cuadr
aticos

y como d 1 (mod 4) esto equivale a que d 1 (mod 8), es decir, a que 2 se


escinda en K (seg
un el teorema 11.2).
Entre los teoremas de Euler figuraban algunas propiedades m
as, como que
los cuadrados de U|| son clases de escisi
on, pero esto es consecuencia de que
la signatura es un homomorfismo. Igualmente, el producto de dos clases que no
sean de escisi
on es una clase de escisi
on, etc.

Ejemplo: Consideremos K = Q 3 . Sabemos que su anillo de enteros

Z 3 es un dominio de factorizaci
on u
nica (es eucldeo), pero en vimos que su

unidad fundamental es = 2 + 3, y
as unidades
N
()
= 1. Como todas las dem
son potencia de esta, resulta que Z 3 no tiene unidades de norma negativa,
con lo que no se cumple una de las hip
otesis que ponamos al principio de la
secci
on 11.4.
Tratemos de estudiar, a pesar de ello, que n
umeros
son de la forma x2 3y 2 ,
es decir, que n
umeros son la norma de un entero de Z 3 .

El discriminante de K es = 12 y en el grupo U12 = [1], [5], [7], [11] son


clases de escisi
on [1] y [11] (directamente por el teorema 11.20).
As pues se ramifican 2 y 3, se escinden los primos p 1 (mod 12) y se
conservan los primos p 5 (mod 12).
Por lo tanto, una condici
on necesaria para que un entero m sea de la forma
m = x2 3y 2 es que si un primo p divide a m con exponente impar entonces
p = 2, 3, o p 1 (mod 12), pues en caso contrario es imposible construir
primos cuadr
aticos de norma p.
El recproco no es cierto. Tomemos p = 11. Entones p se escinde, pero eso
s
olo significa que existe un ideal primo denorma
11,
sin embargo no hay enteros
de norma 11. Lo u
nico que tenemos es N 1 2 3 = 11 (si un primo tuviera
norma 11 sera asociado de uno de estos dos, y el cociente sera una unidad de
norma 1).
Si prescindimos de los signos tenemos una equivalencia: para todo entero m
se cumple que m = x2 3y 2 si y s
olo si todo primo p que divida a m con
exponente impar cumple p = 2, 3, o p 1 (mod 12). Para cada m s
olo un
signo es posible (los detalles quedan a cargo del lector)
No es difcil determinar cu
al es el signo adecuado: Si m cumple las condiciones, su signo ser
a el mismo que el de su parte libre de cuadrados m0 . Si
adem
as (m0 , 3) = 1 entonces m0 = x2 3y 2 implica m0 1 (mod 3), luego
0
0
el signo adecuado
es el que verifica tambien m 1 (mod 03). Si 3 | m , como
3 = N 1 3 , el signo para m es el opuesto que para m /3.

Captulo XII

Complementos sobre
cuerpos
En este u
ltimo captulo recogemos una serie de hechos adicionales sobre
cuerpos para los que no podemos mostrar aqu aplicaciones relevantes que justifiquen su interes, pero que, no obstante, son de gran importancia para quien
quiera profundizar en las materias que hemos introducido en este libro.

12.1

Cuerpos finitos

Los cuerpos finitos aparecen en teora de n


umeros como cocientes de los
anillos de enteros de los cuerpos numericos sobre sus ideales primos, y resultan
indispensables cuando se estudian extensiones arbitrarias de cuerpos numericos
(donde el cuerpo base no es necesariamente Q). Fueron estudiados por primera
vez por Galois, por lo que se les llama cuerpos de Galois.
Comencemos observando que los cuerpos finitos tienen necesariamente caracterstica prima. Adem
as, si k es un cuerpo finito de caracterstica p, es
inmediato que k ha de ser una extensi
on finita de su cuerpo primo Z/pZ (no
puede contener una base infinita), luego si |k : Z/pZ| = n, tenemos que k es
un espacio vectorial de dimensi
on n sobre el cuerpo Z/pZ, luego es isomorfo al
producto cartesiano de Z/pZ por s mismo n veces, luego en particular |k| = pn .

En resumen, si k es un cuerpo finito, car k = p, y |k : Z/pZ| = n, entonces


|k| = pn , luego no hay cuerpos finitos de todos los cardinales posibles, sino a lo
sumo de cardinales que sean potencias de primo. Veamos que, salvo isomorfismo,
existe un u
nico cuerpo de orden pn .
Definici
on 12.1 Llamaremos cuerpo de Galois de pn elementos al cuerpo de
n
escisi
on sobre Z/pZ del polinomio xp x, y lo representaremos por CG(pn ).
Si k es un cuerpo de caracterstica prima p, llamaremos automorfismo de
Frobenius de k al automorfismo : k k dado por (a) = ap .
451

452

Captulo 12. Complementos sobre cuerpos

Teorema 12.2 Sea K = CG(pn ) y sea k = Z/pZ su cuerpo primo. Entonces:


1. K es, salvo isomorfismo, el u
nico cuerpo de pn elementos.
2. La extensi
on K/k es de Galois y el grupo de Galois G(K/k) es cclico y
est
a generado por el automorfismo de Frobenius .
3. El cuerpo CG(pm ) es isomorfo a un (
unico) subcuerpo de K si y s
olo si
m | n, y en tal caso es isomorfo al cuerpo fijado por m .
n

n: 1) El polinomio xp x tiene pn races distintas, pues su


Demostracio
derivada es 1, que no tiene races. Sea, pues, K0 K el conjunto de las pn
races. Ahora bien, es inmediato que K0 es un subanillo de K, y todo dominio
ntegro finito es un cuerpo, luego K0 es un cuerpo, luego K = K0 , y as K tiene
pn elementos.
Si L es un cuerpo de pn elementos, entonces por 6.13 sabemos que L es un
grupo cclico de orden pn 1, luego todos sus elementos son races del polinomio
n
n
xp 1 1, luego todos los elementos de L son races de xp x, luego L es un
cuerpo de escisi
on de este polinomio, luego por la unicidad del cuerpo de escisi
on
L es isomorfo a CG(pn ).
2) La extensi
on K/k es de Galois porque es normal porque K es un cuerpo
de escisi
on y es separable porque los cuerpos finitos son perfectos. Sabemos que
n
el grupo multiplicativo K es cclico. Sea K = hui. Entonces up = x, pero
m
up 6= x para todo m < n. Esto equivale a que m (u) 6= 1 para todo m < n,
luego el orden de es como mnimo n, pero como el grupo de Galois tiene n
elementos, el orden de ha de ser exactamente n, y es un generador.
3) El grupo G(K/k), al ser cclico, tiene un u
nico subgrupo para cada divisor
d de n. Si n = dm, entonces el subgrupo de orden d es el generado por m y su
cuerpo fijado L cumple que |K : L| = d, luego |L : k| = m, luego |L| = pm . As
pues, los u
nicos subcuerpos de K son los cuerpos de pm elementos, para cada
m | n, y adem
as K tiene un u
nico subcuerpo isomorfo a cada CG(pm ).
En particular CG(p) = Z/pZ. Al trabajar con cuerpos es m
as usual la
notaci
on CG(p) que Z/pZ.

Fijada una clausura algebraica1 Ap de Z/pZ, podemos identificar cada cuerpo


n
CG(pn ) con el conjunto de las races en Ap del polinomio xp x, y entonces el
apartado 3) del teorema anterior se reduce a que
CG(pm ) CG(pn ) m | n.
Adem
as es claro que entonces Ap =
subcuerpo de Ap de pn elementos.

CG(pn ), y que CG(pn ) es el u


nico

n=1

1 No es necesario el axioma de elecci


on para construir Ap . Basta describir explcitamente
una construcci
on de una cadena de cuerpos K0 K1 K2 de modo que |Kn | = pn!
y definir Ap como la uni
on de estos cuerpos. Todos los cuerpos Kn se pueden construir
como subconjuntos de un conjunto numerable prefijado X y usar una enumeraci
on de X para
realizar todas las elecciones que requiere el proceso sin necesidad de recurrir al axioma de
elecci
on. La prueba de que dos clausuras algebraicas son isomorfas requiere a lo sumo ED.

12.1. Cuerpos finitos

453

Conviene observar que las extensiones entre cuerpos finitos no s


olo son
cclicas, sino tambien ciclot
omicas. En efecto, los generadores del grupo multiplicativo de CG(pn ) son races pn 1-esimas primitivas de la unidad. El cuerpo
CG(pn ) es una extensi
on ciclot
omica de orden pn 1 de cualquiera de sus subcuerpos.
Ejercicio: Sea m un n
umero natural no nulo y p un primo que no divida a m.
Entonces el grado de la extensi
on ciclot
omica m-sima sobre CG(p) es el orden de p
m
odulo m. (Vease la prueba del teorema 10.41.)

Ejemplo Vamos a describir el cuerpo de 8 elementos. Se trata de la u


nica
extensi
on de grado 3 de CG(2). Buscamos un polinomio m
onico irreducible
de grado 3 en CG(2)[x]. Hay 8 polinomios m
onicos de grado 3. Descartamos
los que no tienen termino independiente porque no son irreducibles, con lo que
quedan 4, a saber:
x3 + x2 + x + 1,

x3 + x2 + 1,

x3 + x + 1

x3 + 1

El primero y el u
ltimo tienen raz 1, luego s
olo nos quedan los dos de en
medio. Por ejemplo, tomamos
p(x) = x3 + x + 1.
Necesariamente CG(8) = CG(2)[], donde es una raz de p(x). Por consiguiente,
CG(8) = {a2 + b + c | a, b, c CG(2)}.
La suma de dos elementos de CG(8) se calcula sumando las coordenadas,
mientras que el producto se calcula operando de forma habitual y reduciendo
las potencias de mediante la relaci
on 3 = 1.
Ejercicio: Describir el CG(9). Mostrar un isomorfismo entre este cuerpo y Z[i]/(3).

En este libro hemos visto que algunos problemas de la teora de n


umeros
pueden formularse en terminos de si un n
umero entero dado es o no una norma
de un entero algebraico. En cuerpos finitos la situaci
on es mucho m
as simple:
Teorema 12.3 En una extensi
on de cuerpos finitos, la norma y la traza son
suprayectivas.
n: Sea K/k una extensi
Demostracio
on de cuerpos finitos. Digamos que
k = CG(m) y que |K : k| = d. Entonces G(K/k) = hi, donde (x) = xm . Por
lo tanto la norma es
d1

1+m++m
N(x) = x

= x(m

1)/(m1)

Considerando a la norma como homomorfismo de grupos N : K k ,


d
vemos que su n
ucleo est
a formado por las races del polinomio x(m 1)/(m1) 1,
luego a lo sumo tiene (md 1)/(m 1) elementos. Por el teorema de isomorfa

454

Captulo 12. Complementos sobre cuerpos

la imagen tiene al menos m 1 elementos (observemos que |K | = md 1), pero


estos son todos los elementos de k , luego la norma es suprayectiva.
Similarmente, el n
ucleo de la traza Tr : K k est
a formado por las races
del polinomio
d1
xm
+ + xm + x,
luego a lo sumo tiene md1 elementos, y la imagen de la traza tiene como mnimo
m elementos, luego tambien es suprayectiva.
Al estudiar los cuerpos finitos estamos estudiando, de hecho, todos los anillos
de divisi
on finitos:
Teorema 12.4 (Teorema de Wedderburn) Todo anillo de divisi
on finito es
un cuerpo.
n: Sea K un anillo de divisi
Demostracio
on finito. Sea Z el conjunto de
todos los elementos de K que conmutan con todos los dem
as elementos de K.
Es f
acil ver que se trata de un cuerpo, por lo que K es un espacio vectorial
sobre Z. Si este tiene q elementos, entonces el n
umero de elementos de K es q n ,
donde n es la dimensi
on de K sobre Z.
Para cada K, el conjunto C formado por todos los elementos de K
que conmutan con es tambien un anillo de divisi
on que contiene a Z, luego su
n
umero de elementos es q d , donde d | n (por la transitividad de grados, que vale
igualmente para anillos de divisi
on). Indicamos con un asterisco el conjunto
que resulta de eliminar el 0. Entonces Z es el centro del grupo K y C es el
centralizador de 6= 0. La ecuaci
on de clases 6.55 es en este caso:
qn 1 = q 1 +

X qn 1
d

qd 1

donde d recorre ciertos divisores de n, posiblemente repetidos, distintos de n.


Sea cn (X) el polinomio ciclot
omico de orden n. Es claro que
xn 1 = cn (x)f (x),

xn 1
= cn (x)g(x),
xd 1

para ciertos polinomios f (x), g(x) Z[x].


Evaluando en q vemos que cn (q) divide a todos los terminos de la ecuaci
on
de clases. En particular cn (q) | q 1.
Por otra parte, cn (q) es el producto de factores de la forma q , donde
recorre las races n-simas primitivas (complejas) de la unidad. Claramente

|q | q || = |q 1| 1,

y como q 2 la igualdad s
olo se da si = 1, y entonces n = 1. En otro caso
concluimos que |cn (q)| > q 1, lo que nos da una contradicci
on. As pues, n = 1
y K = Z es un cuerpo.

12.1. Cuerpos finitos

455

El grupo de descomposici
on de un ideal primo Para terminar veamos
un ejemplo de c
omo intervienen los cuerpos finitos en el estudio de los anillos de
enteros algebraicos. Consideremos un cuerpo numerico K que sea una extensi
on
de Galois de Q de grado n, sea G = G(K/Q) su grupo de Galois, sea OK su anillo
de enteros algebraicos, sea p Z un primo y sea P uno de los divisores primos
de p en OK . Sea KP = OK /P, que es un cuerpo de N (P) = pf elementos y,
an
alogamente, llamemos Qp = Z/pZ. Observemos que la inclusi
on Z OP
induce un monomorfismo de cuerpos Qp KP que nos permite considerar a
KP /Qp como una extensi
on de grado f , que es de Galois, por ser una extensi
on
de cuerpos finitos.
Si G, entonces |OK es un automorfismo de OK , luego [P] es tambien
un divisor primo de p en OK (como p P, tambien p = (p) [P]). Es claro
que
GP = { G | [P] = P}
es un subgrupo de G, llamado grupo de descomposici
on de P. Es f
acil calcular
su orden. Para ello consideramos la factorizaci
on de p en OK , que seg
un el
teorema 10.42 es de la forma p = (P1 Pr )e , donde N(Pi ) = f y n = ef r.
Podemos suponer que P = P1 . Dicho teorema nos dice adem
as que la aplicaci
on
G {P1 , . . . , Pr } dada por 7 [P] es suprayectiva, de modo que, para cada
ndice i, existe un i G tal que Pi = i [P]. Podemos tomar 1 = 1.
Ahora bien, la aplicaci
on (G/GP )d {P1 , . . . , Pr } dada por GP 7 [P]
est
a bien definida y es claramente biyectiva, luego |G : GP | = r y, por consiguiente, |GP | = ef .
M
as precisamente, ahora es claro que (G/GP )d = {GP 1 , . . . , GP r }.

Llamamos L a su cuerpo fijado, de modo que Q L K con |L : Q| = r y


GP = G(K/L). Sea OL el anillo de enteros algebraicos de L y sea p = P OL ,
que claramente es uno de los divisores primos de p en OL . Sea Lp = OL /p.
Como antes, las inclusiones Z OL OK inducen monomorfismos de
cuerpos Qp Lp KP que nos permiten considerar a cada cuerpo como
un subcuerpo del siguiente.
Vamos a demostrar que Lp = Qp , lo que significa que N (p) = p.
En primer lugar observamos que los primos pi = Pi OL son distintos de
p, para i 6=Q1. Para ello tomamos Pi \ P y observamos que la norma
() L es un entero algebraico, luego N() OL .
NK
L () =
GP

Como Pi , tambien N() Pi , luego N() pi , pero N()


/ p, pues en
caso contrario N() P y, como es un ideal primo, existe un GP tal que
() P = [P], luego P, contradicci
on. Esto prueba que pi 6 p.
Si i > 1, tenemos que i1 [P] 6= P, luego i1 [P] es un Pj , con j 6= i, luego
qi = i1 [P] OL es un pj 6= p. Aplicamos el teorema chino del resto 3.54 a
los ideales p y m = q2 qr , que son primos entre s, por la factorizaci
on u
nica
ideal. Dado OL , existe 0 OL tal que 0 (mod p) y 0 1 (mod m).
En particular tenemos que 0 (mod P) y 0 1 (mod i1 [P]), para todo
ndice i > 1.

456

Captulo 12. Complementos sobre cuerpos

0
0
0
As m = NL
ndice i > 1, se cumple
Q ( ) = 1 ( ) r ( ) Z y, para cada
0
que i ( ) 1 (mod P), luego m 0 (mod P). Y como son elementos del
anillo OL , de hecho m (mod p). Esto significa que, en Lp , se cumple que
[] = [m] Qp , y como OL era arbitrario, hemos probado que Lp = Qp .

Ahora observamos que si GP , entonces (mod P) equivale a


() () (mod P), luego induce un automorfismo
: KP KP , de
modo que la aplicaci
on GP G(KP /Qp ) dada por 7
es un homomorfismo de grupos. Vamos a probar que es suprayectivo.
Para ello tomamos un elemento primitivo KP = Qp ([]), con OK .
Sea f (x) = pol mn(, L). Como las races de f son enteros algebraicos, los
coeficientes de f (x) tambien lo son, luego f (x) OL [x] y podemos considerar
el polinomio f(x) Lp [x] = Qp [x] que resulta de tomar clases m
odulo p en los
coeficientes de f .
Como la extensi
on K/L es normal, f (x) = (x 1 ) (x l ), para ciertos
i OK distintos dos a dos, con = 1 , luego f(x) = (x [1 ]) (x [l ]),
y as las clases [i ] son todos los conjugados de [].
Por lo tanto, si G(KP /Qp ), tenemos que ([]) = [i ], para un cierto i,
y existe un GP tal que () = i (porque y i son conjugados en K/L),
luego
([]) = [i ] = ([]), luego =
.
El teorema siguiente resume lo que hemos obtenido:
Teorema 12.5 Sea K un cuerpo numerico normal sobre Q, sea OK su anillo de
enteros algebraicos y P un primo en OK . Sea GP el grupo de descomposici
on de
P y sea KP = OK /P el cuerpo de restos. Entonces, el homomorfismo natural
GP G(KP /Qp ) es suprayectivo.
En general el epimorfismo considerado no es inyectivo, pues GP tiene orden
ef y el grupo de Galois de los cuerpos de restos tiene orden f , luego la inyectividad equivale a e = 1. Vamos a dar una condici
on suficiente para que esto
suceda:
El teorema 10.12 nos da que K = Q(), para cierto OK . Consideremos
f (x) = pol mn(, Q) Z[x] y sea Z su discriminante. Vamos a suponer
que p - , de modo que [] 6= 0 en Qp .
As, si 1 , . . . , n OK son las races de f (x), tenemos que
f (x) = (x 1 ) (x n ), luego f(x) = (x [1 ]) (x [n ]),
=

i<j

(i j )2 , luego [] =

i<j

([i ] [j ])2 6= 0,

lo que implica que las clases [i ] KP son distintas dos a dos y son todas las
races del polinomio f(x) Qp [x]. En particular f(x) tiene races simples.
Ahora la conclusi
on es inmediata: si GP no es la identidad, existe un i
tal que (i ) = j 6= i , luego
([i ]) = [j ] 6= [i ], luego
6= 1. Con esto hemos
probado el teorema siguiente:

12.1. Cuerpos finitos

457

Teorema 12.6 Sea f (x) Z[x] un polinomio m


onico irreducible, sea K su
cuerpo de escisi
on, sea p un primo que no divida al discriminante de f y sea P
un divisor primo de p en OK . Entonces el epimorfismo GP G(KP /Qp ) es
un isomorfismo.
De hecho hemos probado algo m
as, y es que si identificamos a GP con un subgrupo del grupo de permutaciones de las races 1 , . . . , n de f (x) y a G(KP /Qp )
con un subgrupo del grupo de permutaciones de las races [1 ], . . . , [n ] de
f(x), entonces las acciones correspondientes son isomorfas, en el sentido de
que (i ) = j si y s
olo si
([i ]) = [j ]. En particular, la descomposici
on en
ciclos disjuntos de es del mismo tipo que la de
.
Hasta aqu no hemos usado ninguna propiedad especfica de los cuerpos finitos, salvo que las extensiones de cuerpos finitos son de Galois. Ahora probamos
un resultado en el que es crucial que, de hecho, son cclicas:
Teorema 12.7 (Dedekind) Sea f (x) Z[x] un polinomio m
onico irreducible
y sea p un primo que no divida a su discriminante. Sea f(x) (Z/pZ)[x] la reducci
on de f (x) m
odulo p y sea f(x) = f1 (x) fm (x) la descomposici
on de f(x)
en polinomios irreducibles. Sea ei = grad fi (x). Sea K el cuerpo de escisi
on
de f (x). Entonces G(K/Q), identificado con un subgrupo del grupo de permutaciones de las races de f (x), contiene una permutaci
on de tipo e1 , . . . , em , es
decir, que se descompone en m ciclos disjuntos de longitudes ei .
n: Continuando con la notaci
Demostracio
on precedente, basta probar
que el automorfismo de Frobenius G(KP /Qp ) determina una permutaci
on
de tipo e1 , . . . , em en el grupo de las permutaciones de [1 ], . . . , [n ]. Ahora
bien, como genera el grupo de Galois, es claro que dos elementos de KP son
conjugados si y s
olo si est
an en la misma orbita respecto a , y como las races
de cada fi tienen que formar una clase de conjugaci
on, resulta que induce
en {[1 ], . . . , [n ]} exactamente m orbitas de longitudes ei , y eso es tanto como
decir que se descompone en m ciclos disjuntos de longitudes ei .
Observemos que este teorema es puramente un teorema de teora de extensiones de cuerpos, de modo que a partir de su enunciado nada indica que la
prueba requiera considerar enteros algebraicos, factorizaciones de primos, etc.
Como aplicaci
on vamos a construir polinomios de Q[x] con grupo de Galois
isomorfo a n :
Teorema 12.8 Para cada natural n 2, existe un polinomio m
onico irreducible f (x) Z[x] de grado n cuyo grupo de Galois (sobre Q) es isomorfo a
n .
n: Podemos suponer que n > 3, pues para n = 2, 3 ya conoDemostracio
cemos ejemplos de polinomios en las condiciones del teorema. Sea f1 (x) Z[x]
un polinomio m
onico de grado n tal que su reducci
on m
odulo 2 sea irreducible.
Existe tal polinomio pues basta tomar el polinomio mnimo sobre Z/2Z de un
elemento primitivo de CG(2n ) y pasar a un polinomio m
onico cuya reducci
on
m
odulo 2 sea dicho polinomio.

458

Captulo 12. Complementos sobre cuerpos

Similarmente, sea f2 (x) = xg(x), donde g(x) Z[x] es un polinomio m


onico
de grado n 1 cuya reducci
on m
odulo 3 sea irreducible. Por u
ltimo tomemos
f3 (x) = u(x)v(x), donde u(x) es un polinomio m
onico de grado 2 cuya reducci
on
m
odulo 5 sea irreducible y v(x) es un polinomio m
onico de grado n 2 que
tenga tambien reducci
on irreducible m
odulo 5 si su grado es impar, o bien
v(x) = xv 0 (x), donde v 0 (x) es m
onico de grado n 3 con reducci
on irreducible
m
odulo 5 si n 2 es par.
Por u
ltimo llamamos f (x) = 15f1 (x) + 10f2 (x) + 6f3 (x), de modo que
f (x) f1 (x) (mod 2),

f (x) f2 (x) (mod 3),

f (x) f3 (x) (mod 5).

As f (x) es m
onico de grado n (pues su coeficiente director es 15 + 10 + 6 = 1)
y es irreducible m
odulo 2, lo cual implica que es irreducible. Sea G su grupo de
Galois. El teorema anterior implica que, visto como grupo de permutaciones de
las races de f , el grupo G contiene un ciclo de longitud n1 (por su reducci
on
m
odulo 3) y una trasposici
on multiplicada por un ciclo de longitud impar l
(por su reducci
on m
odulo 5). Ahora bien, como ( )l = , resulta que tambien
G.

Pongamos que = (1 , . . . , n1 ), donde 1 , . . . , n son las races de f , numeradas adecuadamente en funci


on de . Sea = (i , j ). Como todas las
races son conjugadas, existe G tal que (j ) = n , y cambiando por ,
podemos suponer que = (i , n ). Pero entonces es claro que las permutaciones
k
son todas las trasposiciones (j , n ), para j = 1, . . . , n1. A su vez, si i 6= j,
tenemos que (i , n )(j ,n ) = (i , j ), luego G contiene todas las trasposiciones,
luego es n .
Ejercicio: Construir un polinomio con grupo de Galois 6 sobre Q.

La secci
on siguiente contiene otra aplicaci
on de los cuerpos finitos en la
prueba de un resultado general de la teora de cuerpos.

12.2

El teorema de la base normal

En esta secci
on demostraremos un teorema de cierta importancia en la teora
de Galois (especialmente en relaci
on con la cohomologa de grupos). Su enunciado es muy sencillo: si K/k es una extensi
on de cuerpos, una base normal
de K sobre k es una base cuyos elementos forman una clase de conjugaci
on,
es decir, son todas las races de un mismo polinomio irreducible de k[x]. El
teorema de la base normal afirma que toda extensi
on finita de Galois tiene una
base normal.
Ejercicio: Probar que si una extensi
on finita tiene una base normal entonces es de
Galois.

Un enunciado alternativo del teorema de la base normal es que en toda


extensi
on finita de Galois K/k existe un v K tal que {(v) | G(K/k)} es
una k-base de K.
Como primer paso de la demostraci
on probamos el resultado siguiente:

12.2. El teorema de la base normal

459

Teorema 12.9 Si K/k es una extensi


on finita de Galois, el cuerpo k es infinito
y
G(K/k)
=
{
,
.
.
.
,

},
entonces
existe un v K tal que la matriz
1
n

i j1 (v) ij tiene determinante no nulo.

n: Sea n = |K : k|. Sea u un elemento primitivo, es decir,


Demostracio
K = k(u). Esto implica que pol mn(u, k) tiene grado n, luego los conjugados 1 (u), . . . , n (u) son distintos dos a dos. Sea g(x) K[x] un polinomio
cuyas races sean exactamente los conjugados de u distintos del propio u. Multiplic
andolo por la constante
adecuada
podemos exigir que g(u) = 1.
Claramente entonces g j i1 (u) = ij , donde

1 si i = j
ij =
0 si i 6= j

Al aplicar el automorfismo i j1 a la igualdad g j i1 (u) = ij obtenemos

(i j1 )(g) (u) = ij ,

donde (i j1 )(g) es el polinomio que resulta de sustituir los coeficientes de g


por sus im
agenes por el automorfismo.

Consideremos ahora el polinomio p(x) = det (i j1 )(g)(x) . Obviamente


es no nulo, pues p(u) = 1.
Como tiene un n
umero finito de races y el cuerpo k es infinito, existe un
a k tal que p(a) 6= 0. Como (i j1 )(a) = a, es claro que

(i j1 )(g) (a) = (i j1 ) g(a) ,

luego si llamamos v = g(a) se cumple p(a) = det (i j1 )(v) 6= 0.


Con esto ya podemos probar:

Teorema 12.10 Si K/k es una extensi


on finita de Galois y el cuerpo k es
infinito entonces K/k tiene una base normal.
n: Sea G(K/k) = {1 , . . . , n } y sea v seg
Demostracio
un el teorema
anterior. Basta probar que los conjugados 1 (v), . . . , n (v) forman una k-base
de K. De hecho basta ver que son linealmente independientes. Supongamos
que existen elementos a1 , . . . , an k tales que
a1 1 (v) + + an n (v) = 0.
Aplicamos j1 para j = 1, . . . , n y obtenemos un sistema de ecuaciones de la
forma
n
P
ai (i j1 )(v) = 0,
j = 1, . . . , n.
i=1

El hecho de que la matriz i j1 (v) ij tenga determinante no nulo significa


que sus columnas son linealmente independientes, luego a1 = = an = 0.

460

Captulo 12. Complementos sobre cuerpos

Nos falta demostrar que las extensiones finitas de cuerpos finitos tienen bases normales. Seg
un hemos visto en la secci
on anterior, estas extensiones son
cclicas, luego el caso restante est
a incluido en el teorema pr
oximo, con el que
concluye la prueba.
Teorema 12.11 Toda extensi
on cclica tiene una base normal.
n: Sea G(K/k) = hi. Podemos considerar a como un
Demostracio
endomorfismo de K como k-espacio vectorial. Sea p(x) su polinomio mnimo
(en el sentido de la definici
on 8.29). Si |K : k| = n, tenemos que n = 1, luego
n
p(x) | x 1, pero el grado de p(x) no puede ser menor que n, pues si fuera
pm (x) = an1 xn1 + + a1 x + a0 , tendramos que
an1 n1 () + + a1 () + a0 = 0

para todo K,

en contradicci
on con el teorema 7.42. As pues, p(x) = xn 1. Esto significa
que el k[x]-subm
odulo de K asociado a p(x) tiene dimensi
on n sobre k, luego
es todo K. En otras palabras, que K = hik[x] , para cierto K y, como se
ve en la prueba de 8.28, tenemos que , (), . . . , n1 () es una k-base de K,
luego es una base normal.

12.3

Extensiones inseparables

Pr
acticamente todas las extensiones de cuerpos que hemos manejado en este
libro han sido de caracterstica 0 y por tanto separables. Aqu describiremos el
comportamiento b
asico de las extensiones no separables. El lector debe tener
presente que es posible adentrarse bastante en la teora de n
umeros sin encontrarse nunca con extensiones no separables, por lo que quiz
a nunca necesite
conocer los resultados de este apendice. No obstante, cuando se trabaja con
extensiones de cuerpos infinitos de caracterstica prima (aunque sean separables) es u
til conocer el comportamiento de las extensiones no separables para
justificar que las extensiones que interesan son realmente separables.
Puesto que todas las extensiones de caracterstica 0 son separables, en todo
este apendice supondremos que todos los cuerpos son de caracterstica prima p.
En primer lugar veremos c
omo factorizan los polinomios en el caso general.
Definici
on 12.12 Sea k un cuerpo y f (x) k[x] un polinomio no constante.
Se llama grado de inseparabilidad de f (x) a la mayor potencia pn para la cual
n
f (x) = g(xp ), para cierto g(x) k[x].
n

Obviamente g(x) no puede ser constante, y grad f (x) = grad g(xp ) =


n
pn grad g(x), luego ciertamente hay un m
aximo n que cumple f (x) = g(xp )
para cierto g. El interes de este concepto lo muestra el teorema siguiente:

Teorema 12.13 Sea k un cuerpo y f (x) k[x] un polinomio irreducible con


grado de inseparabilidad pn . Entonces la factorizaci
on de f (x) en su cuerpo de
escisi
on es
n
n
f (x) = a0 (x a1 )p (x ar )p ,
donde a1 , . . . , ar son distintos dos a dos.

12.3. Extensiones inseparables

461
n

n: Tenemos que f (x) = g(xp ) y el polinomio g(x) no puede


Demostracio
n+1
expresarse en la forma g(x) = h(xp ), o de lo contrario f (x) = h(xp ), en
contra de la definici
on del grado de inseparabilidad. El teorema 7.28 nos da
entonces que g 0 (x) 6= 0.
Por otra parte g(x) es irreducible, ya que si g(x) = u(x)v(x) entonces
n
n
n
tambien f (x) = u(xp )v(xp ), luego uno de los factores, digamos u(xp ), es
constante, y u(x) tambien.
Seg
un el teorema 7.27, las races de g(x) son simples, luego su factorizaci
on
en una clausura algebraica de k es de la forma
g(x) = a0 (x b1 ) (x br ),
donde b1 , . . . , br son distintos dos a dos.
n
Sea ahora ai una raz de xp bi . Entonces
n

f (x) = g(xp ) = a0 (xp ap1 ) (xp apr ) = a0 (x a1 )p (x ar )p .

As pues, todas las races de un mismo polinomio irreducible tienen la misma


multiplicidad y esta es potencia de p. El concepto clave en el estudio de las
extensiones no separables es el de la inseparabilidad pura, que en cierto sentido
es el complementario de la separabilidad.
Definici
on 12.14 Un elemento algebraico sobre un cuerpo k es puramente inseparable si es la u
nica raz de su polinomio mnimo sobre k. Una extensi
on
K/k es puramente inseparable si y s
olo si todo elemento de K es puramente
inseparable sobre k.
Obviamente un elemento a es a la vez separable y puramente inseparable
sobre k si y s
olo si pol mn(a, k) = x a, si y s
olo si a k.
M
as en general, seg
un el teorema anterior, un elemento a es puramente
inseparable sobre k si y s
olo si su polinomio mnimo es
n

pol mn(a, k) = (x a)p = xp ap .


n

Entonces ap k y, recprocamente, si ap k para cierto n entonces a


n
n
es raz del polinomio (x a)p k[x], luego pol mn(a, k) | (x a)p , y a es
puramente inseparable sobre k. Es decir, hemos probado el teorema siguiente:
Teorema 12.15 Un elemento a en una extensi
on de un cuerpo k es puramente
n
inseparable sobre k si y s
olo si existe un n
umero natural n tal que ap k.
De aqu se sigue f
acilmente que la adjunci
on a un cuerpo de elementos puramente inseparables da lugar a extensiones puramente inseparables y que una
cadena de extensiones es puramente inseparable si y s
olo si lo son sus terminos.
Definici
on 12.16 Sea K/k una extensi
on de cuerpos. Definimos la clausura
separable de K sobre k como el conjunto Ks de todos los elementos de K separables sobre k, y la clausura puramente inseparable (o clausura perfecta) de K
sobre k como el conjunto Kp de todos los elementos de K puramente inseparables sobre k.

462

Captulo 12. Complementos sobre cuerpos

Del teorema 7.35 se sigue f


acilmente que Ks es un cuerpo, y el teorema 12.15
implica que Kp tambien lo es.
Definimos el grado de separabilidad y el grado de inseparabilidad de una
extensi
on K/k como los grados, respectivamente, |Ks : k| y |Kp : k|.
Si la extensi
on Kp /k es finita su grado es potencia de p (por transitividad
de grados se reduce al caso de una extensi
on simple y este es evidente porque
los polinomios mnimos de los elementos puramente inseparables tienen grado
potencia de p).
El teorema siguiente nos da un gran control sobre las extensiones de caracterstica prima, pues las reduce a una extensi
on separable y una puramente
inseparable:
Teorema 12.17 Sea K/k una extensi
on algebraica.
K/Ks es puramente inseparable.

Entonces la extensi
on

n: Sea a K. Sea p(x) = pol mn(a, k). Sea pn su grado de


Demostracio
n
n
inseparabilidad. Entonces f (x) = g(xp ), con g(x) k[x]. Entonces g(ap ) =
f (a) = 0 e igual que en la prueba del teorema 12.13 vemos que g(x) es irreducible
n
n
y g 0 (x) 6= 0. Por lo tanto ap es raz simple de g(x), y en consecuencia ap es
n
separable sobre k, o sea, ap Ks . Seg
un el teorema 12.15 tenemos que K/Ks
es puramente inseparable.
As pues, tenemos la cadena
k Ks K,
cuyo primer tramo es separable y el segundo puramente inseparable. Veamos
ahora el comportamiento de los monomorfismos con relaci
on a esta descomposici
on. Nos basamos en el teorema siguiente:
Teorema 12.18 Sea K/k una extensi
on puramente inseparable y : k C
un monomorfismo de k en una clausura algebraica de K. Entonces admite
una u
nica extensi
on a K.
n: Por el teorema 7.53 sabemos que admite al menos una
Demostracio
n

extensi
on . Esta
es u
nica, pues si a K entonces existe un n tal que ap k,
n
n
luego (a)p = (ap ), con lo que (a) es necesariamente la u
nica raz del
n
n
polinomio xp (ap ) en C.
Teorema 12.19 Sea K/k una extensi
on algebraica. Entonces
K = Ks Kp

k = Ks Kp .

Si adem
as es finita de grado n, su grado de separabilidad es ns y su grado de
inseparabilidad es np entonces
n = ns np ,

|K : Kp | = ns

|K : Ks | = np .

12.4. Extensiones trascendentes

463

n: Ya sabemos que k = Ks Kp . La extensi


Demostracio
on K/Ks Kp es
separable y puramente inseparable, luego K = Ks Kp .
El grado de separabilidad de K/k es el n
umero de k-monomorfismos de Ks y
por el teorema anterior cada uno de ellos se extiende a un u
nico k-monomorfismo
de K.
Por otra parte es obvio que todo k-monomorfismo de K es un Kp -monomorfismo de K (un k-monomorfismo de K enva un elemento puramente inseparable
de K a un k-conjugado, o sea, a s mismo). As pues ns es el n
umero de Kp monomorfismos de K, y como K/Kp es separable esto es el grado |K : Kp |. La
cadena k Kp K nos da ahora la igualdad n = ns np y la cadena k Ks K
nos da |K : Ks | = np .
Conviene destacar que en la prueba anterior hemos visto que en general
el n
umero de k-monomorfismos de una extensi
on finita K/k es el grado de
separabilidad de la extensi
on.
Algunas observaciones sencillas: toda extensi
on puramente inseparable es
normal, y si K/k es una extensi
on normal entonces
G(K/k) = G(K/Kp )
= G(Ks /k),

G(Kp /k) = 1.

Terminamos con una aplicaci


on:
Teorema 12.20 Si K/k es una extensi
on algebraica tal que todo polinomio de
k[x] no constante tiene una raz en K, entonces K es una clausura algebraica
de K.
n: Por 7.47 basta probar que todo polinomio no constante
Demostracio
f (x) k[x] se escinde en K[x]. Sea F un cuerpo de escisi
on de f sobre K y
sea L la adjunci
on a k de las races de f en F , de modo que L es un cuerpo de
escisi
on de f sobre k. Basta probar que L K y, por el teorema anterior, para
ello basta con que Ls , Lp K.
El caso de Lp es sencillo: si Lp , entonces es la u
nica raz de su
polinomio mnimo sobre k, luego por hip
otesis K.
Por el teorema del elemento primitivo, Ls = k(), para cierto Ks . Por
hip
otesis el polinomio mnimo de sobre k tiene una raz 0 K. Ahora bien,
0 L y es separable sobre k, luego 0 Ls , luego Ls = k( 0 ) K.

12.4

Extensiones trascendentes

En este libro hemos estudiado u


nicamente las extensiones algebraicas de
cuerpos, pero en algunos contextos, sobre todo relacionados con la geometra
algebraica, aparecen tambien extensiones trascendentes y es necesario conocer
algunos resultados fundamentales sobre ellas, que ahora vamos a presentar. El
ejemplo m
as simple de extensi
on trascendente es la determinada por un cuerpo
de fracciones algebraicas k(S) (es decir, el cuerpo de cocientes de un anillo de
polinomios k[S], donde S es un conjunto de indeterminadas) sobre su cuerpo de
constantes.

464

Captulo 12. Complementos sobre cuerpos

Vamos a ver que toda extensi


on de cuerpos es esencialmente una extensi
on
algebraica sobre una extensi
on de este tipo. Esto nos lleva al concepto de
independencia algebraica:
Definici
on 12.21 Sea K/k una extensi
on de cuerpos. Un conjunto S K es
algebraicamente dependiente sobre k si existen elementos s1 , . . . , sn S distintos
dos a dos y un polinomio f k[x1 , . . . , xn ] no nulo tal que f (s1 , . . . , sn ) = 0.
En caso contrario se dice que S es algebraicamente independiente sobre k.
Claramente, {s} es algebraicamente independiente sobre k si y s
olo si s es
trascendente sobre k. Si S T y T es algebraicamente independiente, tambien
lo es S. En particular, todos los elementos de un conjunto algebraicamente
independiente sobre k son trascendentes sobre k.
La idea es que unos elementos son algebraicamente independientes si y s
olo
si no satisfacen ninguna clase de relaci
on algebraica. Por ejemplo, y 2 son
trascendentes sobre Q, pero no son algebraicamente independientes, porque uno
es el cuadrado del otro, y esto hace que f (, 2 ) = 0, donde f (x, y) = x2 y.
El ejemplo m
as simple de conjunto algebraicamente independiente es el del
conjunto S de indeterminadas de un cuerpo de fracciones algebraicas k(S). Al
sustituir un n
umero finito de indeterminadas en un polinomio de varias variables,
lo que obtenemos es un polinomio con otras indeterminadas, pero con los mismos
coeficientes, y el resultado ser
a nulo si y s
olo si el polinomio original era nulo.
Teorema 12.22 Sean K/k y K 0 /k dos extensiones de un mismo cuerpo k,
sean S K y S 0 K 0 algebraicamente independientes y sea f : S S 0
una aplicaci
on biyectiva. Entonces f se extiende a un u
nico k-isomorfismo de
cuerpos f : k(S) k(S 0 ).
n: Lo probamos primero en el caso en que K = k(S) es un
Demostracio
cuerpo de fracciones algebraicas, es decir, el cuerpo de cocientes del anillo de
polinomios k[S]. Entonces la sustituci
on f : k[S] k(S 0 ) dada por 2.37 es un
homomorfismo de anillos que extiende a f y fija a los elementos de k. El hecho de
que S 0 sea algebraicamente independiente significa precisamente que el n
ucleo
de f es trivial, luego se trata de un monomorfismo. El teorema 2.21 nos da
entonces que f se extiende a un k-monomorfismo de cuerpos f : k(S) k(S 0 ).
Como la imagen es un cuerpo que contiene a k y a S 0 , tiene que ser k(S 0 ), luego
f es un k-isomorfismo. La unicidad de los teoremas que hemos citado implica
claramente la unicidad de f.
En el caso general, consideramos un cuerpo de fracciones algebraicas k(S 00 )
cuyo conjunto de indeterminadas tenga el mismo cardinal que S y S 0 . Tomamos
cualquier biyecci
on h : S 00 S y definimos h0 = h f : S 00 S 0 . Por la parte
: k(S 00 ) k(S) y h
0 : k(S 00 ) k(S 0 ),
ya probada existen k-isomorfismos h

y al componerlos obtenemos el k-isomorfismo f : k(S) k(S 0 ) requerido. La


yh
0 implica la de f.
unicidad de h

12.4. Extensiones trascendentes

465

Definici
on 12.23 Sea K/k una extensi
on de cuerpos. Una base de trascendencia de K sobre k es un conjunto S K algebraicamente independiente sobre k
y maximal respecto de la inclusi
on.
Una extensi
on de cuerpos K/k es puramente trascendente si K = k(S), donde
S es un conjunto algebraicamente independiente sobre k (y por consiguiente una
base de trascendencia). El teorema anterior implica que una extensi
on K/k es
puramente trascendente si y s
olo si K es k-isomorfo a un cuerpo de fracciones
algebraicas sobre k.
Las propiedades b
asicas de las bases de trascendencia se siguen del resultado
siguiente:
Teorema 12.24 Sea K/k una extensi
on de cuerpos y S K un conjunto
algebraicamente independiente sobre k. Entonces un elemento u K \ k(S) es
trascendente sobre k(S) si y s
olo si S {u} es algebraicamente independiente.
n: Supongamos que u es trascendente sobre k(S) y supongaDemostracio
mos que f (s1 , . . . , sn , u) = 0, donde f es un polinomio con coeficientes en k y
s1 , . . . , sn S. Podemos expresar esta ecuaci
on en la forma
P
gi (s1 , . . . , sn )ui = 0,
i

para ciertos polinomios gi con coeficientes en k. El hecho de que u sea trascendente sobre k(S) implica que gi (s1 , . . . , sn ) = 0 para todo i, y como S es
algebraicamente independiente los coeficientes de cada gi son nulos, pero estos
son los coeficientes de f , luego f = 0.
Supongamos ahora que S {u} es algebraicamente independiente y que
f (u) = 0, donde f k(S)[x]. Entonces
f (u) =

X gi (s1 , . . . , sn )
ui = 0,
h
(s
,
.
.
.
,
s
)
i
1
n
i

donde gi y hi son polinomios con coeficientes en k. Multiplicando por el producto de los denominadores obtenemos una ecuaci
on similar, pero en la que los
coeficientes son polinomios. De la hip
otesis se sigue f
acilmente que todos los
coeficientes han de ser nulos, de donde tambien gi = 0 para todo i, es decir,
f (x) es el polinomio nulo, luego u es trascendente sobre k(S).
Como consecuencia inmediata tenemos:
Teorema 12.25 Sea K/k una extensi
on de cuerpos y S K un conjunto
algebraicamente independiente. Entonces S es una base de trascendencia si y
s
olo si la extensi
on K/k(S) es algebraica.
As, por ejemplo, si una extensi
on K/k es algebraica, entonces es una base
de trascendencia. Veamos otra consecuencia sencilla:

466

Captulo 12. Complementos sobre cuerpos

Teorema 12.26 (AE) Sea K/k una extensi


on de cuerpos y S K un conjunto arbitrario tal que la extensi
on K/k(S) sea algebraica. Entonces S contiene2 una base de trascendencia de K/k.
n: Sea T S un conjunto algebraicamente independiente
Demostracio
maximal respecto a la inclusi
on. Por el teorema 12.24 resulta que todo elemento
de S \ T es algebraico sobre k(T ), luego la extensi
on k(S)/k(T ) es algebraica, y
K/k(T ) tambien lo es. Por consiguiente, T es una base de trascendencia.
En particular, toda extensi
on finitamente generada (es decir, de la forma
K = k(S), con S K finito) contiene una base de trascendencia finita.
Ahora es claro que toda extensi
on de cuerpos se descompone en una extensi
on puramente trascendente seguida de una extensi
on algebraica.
El resultado fundamental sobre bases de trascendencia es el siguiente:
Teorema 12.27 (AE) Sea K/k una extensi
on de cuerpos. Si S y T son dos
bases de trascendencia de K sobre k, entonces existe una biyecci
on S T .
n: Supongamos en primer lugar que la extensi
Demostracio
on tiene una
base de trascendencia finita S = {s1 , . . . , sn } y sea T cualquier otra base de
trascendencia. No puede ocurrir que todo elemento de T sea algebraico sobre
k(s2 , . . . , sn ), pues entonces K sera algebraico sobre este cuerpo, y en particular
lo sera s1 , lo cual es imposible. Por lo tanto existe t1 T trascendente sobre
k(s2 , . . . , sn ). Por el teorema 12.24 tenemos que el conjunto {t1 , s2 , . . . , sn }
es algebraicamente independiente sobre K. M
as a
un, s1 es algebraico sobre
este conjunto, o de lo contrario podramos a
nadirlo y tendramos un conjunto
algebraicamente independiente que contendra estrictamente a S. De aqu se
sigue f
acilmente que K es algebraico sobre k(t1 , s2 . . . , sn ), lo que implica que
{t1 , s2 , . . . , sn } es una base de trascendencia. Repitiendo el proceso podemos
llegar a una base de trascendencia {t1 , . . . , tn } formada por elementos de T .
Por maximalidad T = {t1 , . . . , tn } luego, efectivamente, T tiene tambien n
elementos.
Supongamos ahora que K/k tiene una base de trascendencia infinita S. Por
la parte ya probada, cualquier otra base de trascendencia T es tambien infinita.
Cada s S es algebraico sobre k(T ), luego es algebraico sobre k(Ts ), para un
cierto
on a k
S conjunto finito Ts T . Entonces K es algebraico sobre la adjunci
de
Ts , luego este conjunto es una base de trascendencia de K/k. Como est
a
sS
S
contenido en T ha de ser igual a T , es decir, T =
Ts . A partir de aqu la
prueba concluye exactamente igual que la de 5.52. sS
2 Si S es finito o numerable no es necesario el axioma de elecci
on. En la prueba,
este se
emplea al tomar el conjunto maximal T , lo cual, en general, requiere el lema de Zorn, pero
si S es finito o numerable, el conjunto T puede construirse recurrentemente a partir de una
enumeraci
on de S.

12.4. Extensiones trascendentes

467

Definici
on 12.28 Llamaremos grado de trascendencia de una extensi
on de
cuerpos K/k al cardinal3 de cualquiera de sus bases de trascendencia. Lo representaremos por gt(K/k).
As, las extensiones algebraicas son las extensiones con grado de trascendencia igual a 0.
Una aplicaci
on:
Teorema 12.29 (AE) Si K y K 0 son cuerpos algebraicamente cerrados de la
misma caracterstica y con el mismo grado de trascendencia sobre su cuerpo
primo, entonces son isomorfos.
n: Sean k y k0 los cuerpos primos correspondientes. Como
Demostracio
son de la misma caracterstica, son isomorfos. La hip
otesis sobre los grados
de trascendencia significa que K y K 0 tienen bases de trascendencia S y S 0
sobre k y k0 , respectivamente, tales que existe una biyecci
on f : S S 0 .
Dicha biyecci
on se extiende a un isomorfismo k(S) k0 (S 0 ). Adem
as K es
la clausura algebraica de k(S) y an
alogamente con K 0 y k0 (S 0 ). Como cuerpos
isomorfos tienen clausuras algebraicas isomorfas, concluimos que K y K 0 son
isomorfos.
Nota El lector familiarizado con la teora de cardinales infinitos no tendr
a
dificultad en probar los hechos siguientes: sea K un cuerpo arbitrario, sea k
su cuerpo primo y sea S una base de trascendencia de K sobre k. Si S es
infinito, teniendo en cuenta que k es numerable (finito o infinito), entonces
|k(S)| = |S| y, como K/k(S) es una extensi
on algebraica, se cumple tambien
que |K| = |k(S)| = |S|. Por el contrario, si S es infinito, del mismo modo
llegamos a que |K| = 0 .
Como conclusi
on, si K es cualquier cuerpo no numerable, entonces su grado
de trascendencia sobre su cuerpo primo es simplemente |K|, luego el teorema
anterior implica lo siguiente:
Dos cuerpos algebraicamente cerrados no numerables de la misma
caracterstica son isomorfos si y s
olo si tienen el mismo cardinal.
Otra consecuencia es que el grado de trascendencia de R sobre Q (o de C
sobre Q) es c.
As como el grado de una cadena de extensiones es multiplicativo, el grado
de trascendencia es aditivo:
Teorema 12.30 Si k K L es una cadena de extensiones de cuerpos,
entonces
gt(L/k) = gt(L/K) + gt(K/k).
3 En principio tenemos que hacer las mismas observaciones que hemos hecho sobre el concepto de dimensi
on de un espacio vectorial: con los resultados expuestos en el ap
endice B
tenemos definido el concepto de grado de trascendencia para extensiones finitamente generadas o, a lo sumo, con un generador numerable. La definici
on general requiere el hecho de que
es posible asignar un cardinal a un conjunto arbitrario.

468

Captulo 12. Complementos sobre cuerpos

n: El enunciado de este teorema, tal y como lo hemos forDemostracio


mulado involucra el concepto general del cardinal de un conjunto arbitrario, as
como la suma de cardinales, pero es posible reformularlo en terminos que no
requieren ninguno de estos conceptos:
Si S es una base de trascendencia de L sobre K y S 0 es una base de
trascendencia de K sobre k, entonces S S 0 es una base de trascendencia de L sobre k (y S S 0 = ).
En efecto: S S 0 = porque, m
as en general, S K = , ya que los
elementos de S son trascendentes sobre K. Si llamamos A = L \ K(S) y
A0 = K \ k(S 0 ), entonces todos los elementos de A son algebraicos sobre K(S)
y todos los elementos de A0 son algebraicos sobre k(S 0 ). Adem
as
L = K(S A) = k(S 0 A0 )(S A) = k(S S 0 A A0 ) = k(S S 0 )(A0 )(A),
y los elementos de A0 son algebraicos sobre k(S 0 ), luego tambien sobre k(S S 0 ),
y los elementos de A son algebraicos sobre K(S) = k(S S 0 A0 ), luego tambien
sobre k(S S 0 A0 ), luego la extensi
on L/k(S S 0 ) es algebraica.
0
S
olo falta probar que S S es algebraicamente independiente. Ahora bien,
si f (x1 , . . . , xn , y1 , . . . , ym ) es un polinomio tal que f (s1 , . . . , sn , s01 , . . . , s0m ) = 0,
con si S, s0i S 0 distintos entre s, entonces, s1 , . . . , sn anulan el polinomio
f (x1 , . . . , xn , s01 , . . . , s0m ) K[x1 , . . . , xn ], luego todos sus coeficientes, que son
polinomios de k[y1 , . . . , ym ] evaluados en s01 , . . . , s0m ) son nulos, por la independencia algebraica de S, luego los coeficientes de dichos coeficientes (que son los
coeficientes de f ) son nulos por la independencia algebraica de S 0 . Por lo tanto
f = 0 y S S es algebraicamente independiente.
Ahora necesitamos un refinamiento del teorema del elemento primitivo:
Teorema 12.31 Si K = k(, ) es una extensi
on finita de cuerpos y es
separable sobre k, entonces K/k es simple.
n: Sea M una extensi
Demostracio
on de K en la que se escindan los
polinomios mnimos de y . Claramente podemos suponer que k es infinito,
con lo que podemos tomar k tal que
6=

0
,
0

para todo par 0 y 0 de k-conjugados de y respectivamente (0 6= ).


Veamos que = + es un elemento primitivo. Ciertamente E = k() K.
Sea g(X) = pol mn(, k) y sea h(X) = g( X) E[X]. Claramente
h() = g( ) = g() = 0.
M
as a
un, si 0 6= es un k-conjugado de , tenemos que
0 = + 0 = ( 0 ) + 6= 0
para todo k-conjugado 0 de .

12.4. Extensiones trascendentes

469

Por consiguiente h(0 ) 6= 0. As, si f = pol mn(, k) tenemos que es la


u
nica raz com
un de f y h en M . Como g se escinde en M [X], lo mismo le
sucede a h, luego X es el m
aximo com
un divisor de f y h en M [X]. Ahora
bien, el m
aximo com
un divisor en E[X] de ambos polinomios debe dividir a
X en M [X], luego E y = E. Esto nos permite concluir que
K = E = k().
Si k es un cuerpo perfecto de caracterstica prima, un cuerpo de fracciones
algebraicas K = k(S) ya no es perfecto, pues no cumple que K = K p (puesto que
las indeterminadas no tienen raz p-esima en K). Por lo tanto, las extensiones
algebraicas de k(S) no son necesariamente separables o, equivalentemente, que
si S es una base de trascendencia de una extensi
on K/k, la extensi
on K/k(S) es
algebraica, pero no necesariamente separable. Sin embargo, el teorema siguiente
muestra que, para extensiones finitamente generadas, siempre podemos elegir
una base de trascendencia adecuada para la que K/k(S) sea separable:
Teorema 12.32 Sea k un cuerpo perfecto y K/k una extensi
on finitamente
generada. Entonces K tiene una base de trascendencia S tal que la extensi
on
K/k(S) es separable.
n: Podemos suponer que k tiene caracterstica prima p. Sea
Demostracio
K = k(t1 , . . . , tn ). Por el teorema 12.26 el conjunto {t1 , . . . , tn } contiene una
base de trascendencia de K/k. Digamos que es la formada por {t1 , . . . , td }.
Entonces t1 , . . . , td , tn son algebraicamente dependientes sobre k, luego existe
un polinomio f (x1 , . . . , xd , xn ) k[x1 , . . . , xd , xn ], no nulo, que podemos tomar
irreducible, tal que f (t1 , . . . , td , tn ) = 0.
Alguna de las derivadas parciales de f tiene que ser no nula, pues en caso
contrario p dividira a los exponentes de todas las variables que aparecen en f ,
luego podramos expresar f = g p y f no sera irreducible. (Aqu usamos que,
como k es perfecto, k = kp y tambien los coeficientes de f son potencias de p.)
Veamos que, si la derivada de f respecto de xj no es nula, el conjunto
{t1 , . . . , td , tn } \ {tj } es algebraicamente independiente sobre k. En efecto, la
hip
otesis sobre la derivada hace que tj sea algebraico sobre {t1 , . . . , td , tn } \ {tj }
(pues garantiza que tj aparece realmente en la ecuaci
on f (t1 , . . . , td , tn ) = 0, es
decir, que el miembro izquierdo, visto como polinomio en xj evaluado en tj , no es
identicamente nulo). Por lo tanto, si {t1 , . . . , td , tn } \ {tj } fuera algebraicamente
dependiente, eliminando uno o m
as de sus elementos obtendramos una base de
trascendencia de K con menos de d elementos, lo cual es absurdo.
As pues, intercambiando tj con tn si es preciso, podemos suponer que la
derivada de f respecto de xn es no nula, lo cual significa que tn es separable
sobre k(t1 , . . . , td ). Si n 1 > d, podemos aplicar el teorema anterior, que nos
da un t0n1 K tal que k(t1 , . . . , td , tn1 , tn ) = k(t1 , . . . , td , t0n1 ). As pues,
cambiando tn1 por t0n1 , ahora tenemos que K = k(t1 , . . . , tn1 ).
El argumento puede repetirse hasta llegar a que K = k(t1 , . . . , td+1 ) con
td+1 separable sobre k(t1 , . . . , td ).
Terminamos demostrando un teorema fundamental para la geometra algebraica. Es una consecuencia sencilla del teorema siguiente:

470

Captulo 12. Complementos sobre cuerpos

Teorema 12.33 Sea k un cuerpo algebraicamente cerrado y F1 , . . . , Fm un conjunto finito de polinomios de k[x1 , . . . , xn ]. Si el sistema de ecuaciones Fi = 0
tiene soluci
on en una extensi
on finitamente generada de k, entonces tiene soluci
on en k.
n: Sea K la extensi
Demostracio
on donde el sistema tiene soluci
on. Por
12.32 tenemos que K = k(t1 , . . . , tr , ), donde t1 , . . . , tr es una base de trascendencia de K/k. Sea p(t1 , . . . , tr , x) k(t1 , . . . , tr )[x] el polinomio mnimo
de . Sea Fi (1 , . . . , n ) = 0, con j K. Cada elemento j ser
a de la forma
j = cj (t1 , . . . , tr , ), con cj (t1 , . . . , tr , x) k(t1 , . . . , tr )[x]. Entonces
Fi (c1 (t1 , . . . , tr , x), . . . , cn (t1 , . . . , tr , x)) = p(t1 , . . . , tr , x)qi (t1 , . . . , tr , x),
para un cierto polinomio qi .
Tomemos (1 , . . . , r ) kr de modo que no anule al denominador de ning
un
coeficiente de p, qi , c1 , . . . , cn ni al coeficiente director de p (es decir, que no
anule a su producto, lo cual es posible porque un polinomio que se anule en todo
punto ha de ser nulo). Tomemos k tal que p(1 , . . . , r , ) = 0 y definamos
i = ci (1 , . . . , r , ). Es claro entonces que (1 , . . . , n ) es una soluci
on del
sistema de ecuaciones.
Hay una raz
on obvia por la que un sistema de ecuaciones polin
omicas
F1 (x1 , . . . , xn ) = 0, . . . , Fm (x1 , . . . , xn ) = 0
con coeficientes en un cuerpo k pueda no tener soluci
on en kn , y es que se
cumpla (F1 , . . . , Fn ) = 1, es decir, que 1 pueda expresarse como combinaci
on
lineal de los polinomios Fi . En tal caso, una soluci
on del sistema llevara a la
identidad 0 = 1. El teorema de los ceros de Hilbert afirma que, si el cuerpo k es
algebraicamente cerrado, este caso trivial es el u
nico caso en el que un sistema
de ecuaciones puede no tener soluci
on:
Teorema 12.34 (Teorema de los ceros de Hilbert) Sea k un cuerpo algebraicamente cerrado y F1 , . . . , Fm k[x1 , . . . , xn ]. Si (F1 , . . . , Fm ) 6= 1, entonces el sistema de ecuaciones Fi = 0 tiene soluci
on en k.
n: Sea M un ideal maximal4 que contenga a (F1 , . . . , Fm ) y
Demostracio
sea K = k[x1 , . . . , xn ]/M . Es claro que las clases de las indeterminadas son una
soluci
on del sistema en K (visto como extensi
on de k), luego por el teorema
anterior existe una soluci
on en k.

4 Esto

no requiere el axioma de elecci


on porque el anillo k[x1 , . . . , xn ] es noetheriano.

Ap
endice A

El axioma de elecci
on
En la secci
on 1.2 hemos presentado una teora axiom
atica de conjuntos, que
no es sino la teora de Zermelo, determinada por seis axiomas:
Extensionalidad Dos conjuntos son iguales si y s
olo si tienen los mismos
elementos.
Especificaci
on Dado un conjunto A y una propiedad P , existe un conjunto
cuyos elementos son los elementos de A que cumplen P .
Par Dados dos conjuntos A y B, existe otro conjunto C cuyos elementos son
exactamente A y B.
Uni
on Dado un conjunto A, existe otro conjunto B cuyos elementos son exactamente los que pertenecen a alguno de los elementos de A.
Partes Dado un conjunto A, existe otro conjunto cuyos elementos son exactamente todos los subconjuntos de A.
Infinitud Existe un conjunto X con una aplicaci
on S : X X inyectiva y
no suprayectiva.
Hemos incluido la versi
on abstracta del axioma de infinitud presentada en
la secci
on 1.4, aunque en la pr
actica podemos optar sin ning
un cambio esencial
por la versi
on concreta dada en la secci
on 1.2 o por cualquier otra alternativa
que implique la versi
on abstracta.
Estos axiomas son suficientes para demostrar la mayor parte de los resultados
de este libro, pero en algunos casos es necesario un axioma m
as:
Axioma de elecci
on (AE) Para todo conjunto X, existe F : X
que para todo conjunto A X que no sea se cumple que F (A) A.

X tal

Una funci
on F en las condiciones indicadas por el axioma se llama funci
on
de elecci
on para X, pues elige un elemento de cada elemento de X. Para algunos
471

472

Apendice A. El axioma de elecci


on

conjuntos X es posible demostrar que existen funciones de elecci


on (por ejemplo,
en el caso de los conjuntos finitos), pero para otros puede no haber ning
un
criterio que determine una, ni por especificaci
on ni empleando ninguno de los
resultados sobre existencia de conjuntos deducibles de los dem
as axiomas, y
entonces el axioma de elecci
on resulta imprescindible.
Es f
acil ver que los dos teoremas siguientes son, de hecho, equivalentes al
axioma de elecci
on:
Teorema
A.1 (AE) Si {Xi }iI es una familia de conjuntos no vacos, entonQ
ces
Xi 6= .
iI
S
n: Sea A = {Xi | i I} y sea F : A A una funci
Demostracio
on de
elecci
on. As, para
cada
i

I,
como
X
=
6
,
se
cumple
que
F
(X
)

X
i
i
i . Sea
S
ahora
x
:
I

A
la
funci
o
n
dada
por
x(i)
=
F
(X
).
Es
claro
entonces
que
i
Q
x
Xi .
iI

Teorema A.2 (AE) Si A es una familia de conjuntos no vacos, existe un


conjunto que tiene exactamente un elemento de cada elemento de A.
S
n: Sea F : A A una funci
Demostracio
on de elecci
on en A y sea
B = F [X]. Si X A, como es no vaco, sabemos que F (X) X B. Si
u X B, entonces u = F (Y ), para cierto Y A, luego u Y X, luego
Y = X, porque los elementos de A son disjuntos dos a dos, luego u = F (X),
que es, por consiguiente, el u
nico elemento de X B.
Otra consecuencia destacada es la siguiente:
Teorema A.3 (Principio de elecciones dependientes) Si A 6= es un
conjunto y R es una relaci
on en A con la propiedad de que para todo a A
existe un b A tal que a R b, entonces existe f : N A tal que, para todo
n N, se cumple f (n) R f (n + 1).
n: Consideramos la familia {Xa }aA formada por los conjunDemostracio
tos Xa = {b A |Qa R b}. Por hip
otesis todos los conjuntos Xa son no vacos,
luego existe g
Xa , que es una funci
on g : A A tal que, para todo
aA

a A, se cumple que g(a) Xa , es decir, a R g(a). Ahora basta aplicar el principio de recursi
on, que nos da una funci
on f : N A tal que f (0) es cualquier
elemento prefijado de A y para todo n N se cumple que f (n + 1) = g(f (n)),
luego en particular f (n) R f (n + 1).
El nombre de principio de elecciones dependientes se debe a que aqu no
tenemos una familia de conjuntos {Xn }nN dada de antemano y elegimos un
f (n) Xn para cada n, sino que cada f (n + 1) se elige entre los posteriores a
f (n) seg
un la relaci
on R, y as, el conjunto de los valores admisibles entre los
que podemos elegir f (n + 1) depende de las elecciones precedentes que nos han
llevado hasta f (n).

473
El principio de elecciones dependientes nos permite hacer en particular elecciones independientes siempre y cuando sean sobre una familia numerable, en
el sentido siguiente:
Teorema A.4 (Axioma de elecci
oQ
n numerable) Si {Xn }nN es una familia de conjuntos no vacos, entonces
Xn 6= .
nN

n: Sea X =
Demostracio

nN

Xn , recordemos que Im
= {0, . . . , m}, y sea

A el conjunto1 de todas las aplicaciones s : Im


X tales que, para todo
n m, se cumple que s(n) Xn . Sea R la relaci
on en A seg
un la cual s R t si
y s
olo si s t.

Se cumple que, A 6= , pues si tomamos x X0 , la funci


on s : I0 X
dada por s(0) = x cumple s A. Adem
as, para todo s A, existe un t A

tal que s R t. En efecto, tenemos que s : Im


X y por hip
otesis existe

y Xm+1 , luego podemos extender s a una aplicaci


on s0 : Im+1
X mediante
s0 (m + 1) = y, y claramente s0 A cumple s R s0 .
Podemos aplicar el principio de elecciones dependientes, que nos da una
funci
on f : N A tal que f (n) f (n + 1), para todo n N. Podemos llamar

sn = f (n), que es una funci


on definida sobre cierto Im
. Ahora bien, una simple

inducci
on demuestra que In Dsn , as como que si m n, entonces sm sn .
Esto nos permite definir f : N XQestableciendo que f (n) = sn (n). Es claro
entonces que f (n) Xn , luego f
Xn .
nN

Notemos que el axioma de elecci


on finito, es decir, el teorema anterior para
familias de la forma {Xn }m
,
se
demuestra
por inducci
on sobre m sin necesidad
n=1
del axioma de elecci
on y no es, por tanto, un axioma, sino un teorema.
Todas las aplicaciones fuertes del axioma de elecci
on que vamos a necesitar (es decir, sin contar aquellas que s
olo requieran el Principio de elecciones
dependientes) las haremos a traves de una consecuencia, bastante tecnica, pero
muy pr
actica. Para enunciarlo tenemos que introducir algunos conceptos.
Sea (A, ) un conjunto parcialmente ordenado, es decir, A es un conjunto y
es una relaci
on de orden parcial en A.
Una cadena en A es un subconjunto c A que est
a totalmente ordenado, es
decir, para todo x, y c se cumple x y o bien y x.
Un m A es maximal si no existe ning
un otro a A tal que m < a.
Notemos que si A est
a totalmente ordenado, maximal es lo mismo que
m
aximo, pero en general no es as: si A tiene m
aximo, es su u
nico elemento
maximal, pero puede haber distintos maximales que no sean m
aximos.
Teorema A.5 (Lema de Zorn) (AE) Todo conjunto parcialmente ordenado
en el que toda cadena tiene una cota superior, tiene un elemento maximal.
1 Notemos

que A puede definirse por especificaci


on a partir de P(N X).

474

Apendice A. El axioma de elecci


on

n: Sea (A, ) un conjunto parcialmente ordenado que cumpla


Demostracio
las hip
otesis. Sea C PA el conjunto de todas las cadenas en A. Sabemos que
toda cadena c C tiene cota superior, pero pueden darse dos casos si existe
una cota superior u A \ c, es decir, una cota superior estricta, que es mayor
que todos elementos de c, entonces c puede prolongarse a una cadena c {u}.
En tal caso, llamamos Xu PA al conjunto de todas las prolongaciones de c
de la forma c {u}.
La alternativa es que c no tenga cotas superiores estrictas. Entonces una
cota superior u de c es un maximal de A, pues si existiera v A tal que u < v,
tendramos que v es una cota superior estricta de c. Nuestro objetivo ser
a
demostrar que existe una cadena c sin cotas superiores estrictas. En cualquier
caso, si c es una cadena en estas condiciones, llamamos Xc = {c}.
Con esto tenemos definida una aplicaci
on X : C PPA o, equivalentemente, una familia
{X
}
de
conjuntos
no
vacos. Por el teorema A.1 podemos
c
cX
Q
tomar G
Xc . Equivalentemente, G : C PA, de modo que, para toda
cC

cadena c C, se cumple que G(c) Xc .


Basta probar que existe una cadena c tal que G(c) = c, pues esto significa
que c no tiene cotas estrictas (ya que en tal caso c
/ Xc , por construcci
on), y
por lo tanto A tiene un elemento maximal.
Si no se cumple G(c) = c, entonces G(c) es una cadena que resulta de a
nadir
un u
nico elemento por encima de todos los elementos de c.
Diremos que c es una buena cadena en (A, ) si c est
a bien ordenada por
y, para cada a c, se cumple que
G({u c | u < a}) = {u c | u a}.
Notemos que {u c | u < a} es trivialmente una cadena, y lo que estamos
pidiendo es que G le a
nada un elemento, y que este sea precisamente a. Es f
acil
comprobar lo siguiente:
es (trivialmente) una buena cadena.
Si c es una buena cadena y a c, entonces los conjuntos {u c | u < a}
y {u c | u a} son tambien buenas cadenas.
Si c es una buena cadena, G(c) tambien lo es.
Ahora demostraremos este hecho:
Si c y c0 son buenas cadenas y a c cumple que {u c | u < a} =
{u c0 | u < a}, entonces a c0 o bien c0 = {u c | u < a}.
En efecto, si c0 6= {u c | u < a} = {u c | u < a}, como por hip
otesis se da
la inclusi
on , tiene que haber un a0 c0 que no este en {u c0 | u < a}, para
lo cual a0 tiene que ser una cota superior estricta de este conjunto. Como c0

475
est
a bien ordenado, podemos suponer que a0 es la mnima cota superior estricta
(en c0 ) de dicho conjunto. Por lo tanto:
{u c0 | u < a0 } = {u c0 | u < a} = {u c | u < a}.
Como el primer y el tercer conjunto son buenas cadenas, al aplicar G obtenemos
un conjunto cuyo m
aximo tiene que ser tanto a0 como a, luego a = a0 c0 .
Veamos ahora que dos buenas cadenas c y c0 est
an necesariamente contenidas
una en la otra. En efecto, si c no est
a contenida en c0 , podemos tomar el mnimo
a c \ c0 , de modo que {u c | u < a} {u c0 | u < a}. Veamos que tiene
que darse la igualdad.
En caso contrario, existe un a0 c0 tal que a0 < a, pero a0
/ c. Podemos
tomar el mnimo posible. As, {u c | u < a0 } = {u c0 | u < a0 }, luego,
seg
un hemos visto, esto implica que c = {u c0 | u < a0 }, pero entonces a < a0 ,
contradicci
on.
Por consiguiente, {u c | u < a} = {u c0 | u < a} y, aplicando de nuevo
la propiedad que hemos demostrado, c0 c.

M
as a
un, si c y c0 son dos buenas cadenas distintas, c0 c y llamamos
a = mn(c \ c0 ), entonces c0 = {u c | u < a}, pues obviamente se cumple a
/ c0
0
y {u c | u < a} = {u c | u < a}.
Ahora es f
acil ver que la uni
on c0 de todas las buenas cadenas es una buena
cadena. En efecto, es una cadena, porque si u, v c0 , existen buenas cadenas
c y c0 tales que u c y v c0 , pero como c c0 o viceversa, tenemos que u y v
est
an en una misma cadena, luego u v o v u.
Adem
as c0 est
a bien ordenada, pues si X c0 no es vaco, un elemento de X
estar
a tambien en cierta buena cadena c, de modo que c X 6= . Como c est
a
bien ordenada, existe m = mn(X c). Vamos a probar que m es el mnimo de
X. En caso contrario existe un x X tal que x < m (luego x
/ c). Dicho x tiene
que cumplir x c0 , para cierta buena cadena c0 que no puede estar contenida
en c, por lo que c c0 . Sea a = mn(c0 \ c), de modo que c = {u c0 | u < a},
pero entonces x < m < a, luego x c, contradicci
on.
Por u
ltimo, si a c0 , entonces a c, para cierta buena cadena c, y vamos a
ver que {u c0 | u < a} = {u c | u < a}. Esto implicar
a que
G({u c0 | u < a}) = {u c | u a} = {u c0 | u a},
lo que terminar
a la prueba de que c0 es una buena cadena. Si u c0 cumple
u < a, pero u
/ c, entonces u c0 , para cierta buena cadena c0 que no puede
cumplir c0 c, luego c c0 . Sea a0 = mn(c0 \ c), de modo que a0 u. Entonces
c = {v c0 | v < a0 }, luego a < a0 u < a, contradicci
on.
Con esto terminamos la prueba sin m
as que observar que, como G(c0 )
tambien es una buena cadena, tiene que ser G(c0 ) c0 (porque c0 es la uni
on
de todas), y la otra inclusi
on se da siempre, luego G(c0 ) = c0 , como haba que
probar.
Veamos un ejemplo de aplicaci
on del lema de Zorn:

476

Apendice A. El axioma de elecci


on

Teorema A.6 (AE) Todo conjunto puede ser bien ordenado.


n: Sea X un conjunto cualquiera (que podemos suponer no
Demostracio
vaco) y sea A el conjunto de todos los pares (Y, ), donde Y X y es un buen
orden en Y . Definimos en A la relaci
on de orden dada por (Y, ) (Y 0 , 0 ) si
y s
olo si:
1. Y Y 0 .
2. Para todo u, v Y se cumple u v si y s
olo si u 0 v.
3. Si u Y , v Y 0 \ Y , entonces u <0 v.
Esto significa que Y 0 mantiene el mismo orden sobre los elementos de Y y
los elementos de Y 0 \ Y son todos posteriores a los de Y , es decir, que el orden
de Y 0 prolonga al de Y .
Es claro que A 6= , pues cualquier subconjunto de X con un elemento
S se
puede ordenar bien de forma trivial. Sea C A una cadena, sea Y =
Y y
(Y,)C

consideremos en Y el orden seg


un el cual u v si y s
olo si existe un (Y, ) C
tal que u, v Y y u v.
Es f
acil comprobar que se trata de una relaci
on de orden en Y , y es un

buen orden, pues si B Y no es vaco, tomamos u B, y entonces existe un


(Y, ) C tal que u Y por lo que B Y 6= , luego existe m = mn(B Y ), y
se cumple que m = mn B, pues si v B, entonces, existe un (Y 0 , 0 ) C tal que
v Y 0 . Como C es una cadena, o bien (Y, ) (Y 0 , 0 ) o bien (Y 0 , 0 ) (Y, ).
En el segundo caso se cumple v Y B, luego m v, luego m v. En el
primer caso, distinguiendo si v Y o si v Y 0 \ Y se llega igualmente a que
m 0 v y de aqu a que m v.

Por lo tanto (Y , ) A. Observemos ahora que si (Y, ) C, entonces


(Y, ) (Y , ). En efecto, se cumplen obviamente las propiedades 1. y 2.
de la definici
on de , y en cuanto a la tercera, si u Y , v Y \ Y , existe un
0
(Y , ) C tal que v Y 0 \ Y . Como C es una cadena tiene que ser Y Y 0 ,
luego u <0 v, luego u < v.
Esto prueba que (Y , ) es una cota superior de C, luego por el lema de
Zorn existe un par (Y, ) maximal en A. Pero necesariamente entonces Y = X,
ya que si fuera Y X, podramos tomar x X \ Y y definir una relaci
on de
orden en Y {x} que prolongara a la de Y poniendo a x como m
aximo elemento.
Claramente se tratara de un buen orden, de modo que (Y, ) (Y {x}, 0 )
en contra de la maximalidad de (Y, ). As pues, es un buen orden en X.

Ap
endice B

Conjuntos infinitos
La mayor parte de los conjuntos con los que vamos a trabajar son infinitos,
y en algunas ocasiones necesitaremos ciertos resultados conjuntistas que muestran que es posible hablar del n
umero de elementos de un conjunto infinito,
y hacer consideraciones sobre el tama
no de un conjunto infinito. Un desarrollo sistem
atico de la teora de cardinales infinitos queda fuera del alcance de
este libro, pero aqu vamos a presentar los pocos resultados que nos van a ser
necesarios.
Conjuntos numerables Vamos a extender parcialmente a conjuntos infinitos
el concepto de contar los elementos de un conjunto. Recordemos que un
conjunto A es finito si existe una biyecci
on f : In A, donde n es un n
umero
natural e In = {1, . . . , n}, entendiendo que I0 = . En tal caso, el n
umero
natural n es u
nico y recibe el nombre de cardinal de A, y se representa por |A|.
La definici
on siguiente generaliza estos conceptos:
Definici
on B.1 Un conjunto A es numerable si es finito o bien existe una biyecci
on f : N A. En tal caso diremos que el cardinal de A es N, aunque
cuando consideramos a N como cardinal de los conjuntos numerables es costumbre escribir N = 0 (
aleph 0).
As pues, si A es un conjunto numerable, su cardinal |A| puede ser un n
umero
natural o bien 0 . Los conjuntos de cardinal 0 son, pues, los conjuntos infinitos
numerables. En otros terminos, un conjunto A es infinito numerable si sus
elementos se pueden organizar como una sucesi
on infinita
a0 ,

a1 ,

a2 ,

a3 ,

a4 ,

...

sin repeticiones.
Quiz
a el lector pueda pensar que todos los conjuntos infinitos son numerables, pero no es as:
Teorema B.2 (Cantor) Si A es un conjunto, no existe una aplicaci
on suprayectiva f : A PA.
477

478

Apendice B. Conjuntos infinitos

n: Supongamos que f : A PA es suprayectiva y consideDemostracio


remos el conjunto X = {x A | x
/ f (x)} PA. Por hip
otesis existe a A tal
que f (a) = X, pero entonces tenemos una contradicci
on:
aXa
/ f (a) a
/ X.
As pues, no puede existir tal aplicaci
on f .
En particular PN es un ejemplo de conjunto infinito no numerable. A continuaci
on vamos a dar criterios para reconocer que conjuntos son numerables.
Extendemos la relaci
on de orden en N para incluir a 0 como m
aximo elemento, de modo que si A y B son conjuntos numerables, la desigualdad |A| |B|
se cumple en particular si |B| = 0 .
Evidentemente, todo conjunto biyectable con un conjunto numerable es numerable. M
as a
un:
Teorema B.3 Si f : A B es inyectiva y B es numerable, entonces A es
numerable y |A| |B|.
n: Sabemos que el resultado es cierto si B es finito, as que
Demostracio
podemos suponer que |B| = 0 . Entonces, si A es finito la conclusi
on es trivial,
luego podemos suponer que A es infinito, y tenemos que probar que es numerable. Sea g : N B biyectiva, de modo que h = f g 1 : A N inyectiva.
Como h : A h[A] es biyectiva, tenemos que h[A] es infinito, y basta probar
que es numerable. Equivalentemente, podemos suponer que A N, es decir,
s
olo hay que probar que todo subconjunto infinito de N es numerable.
Definimos recurrentemente una aplicaci
on k : N A: suponiendo definidos
k(0), . . . , k(n 1), tomamos
k(n) = mn(A \ {k(0), . . . , k(n 1)}).
Notemos que la definici
on es correcta, porque {k(0), . . . , k(n)} A es un
conjunto finito y, como A es infinito, tenemos que A \ {k(0), . . . , k(n 1)} 6= ,
luego tiene un mnimo elemento, que es el que tomamos como k(n).
En particular, si m < n, tenemos que k(m) 6= k(n), pues se cumple que
k(m) {k(0), . . . , k(n 1)}. Esto prueba que k es inyectiva. Veamos que
tambien es suprayectiva. Si existe un a A que no tiene antiimagen, podemos
tomar el mnimo de ellos. Consideremos I = {n N | k(n) < a}. Entonces
k|I : I {0, . . . , a 1} biyectiva, luego I es un subconjunto finito de N,
y esto implica que tiene un m
aximo elemento n. Pero entonces tiene que ser
k(n+1) = a, porque ciertamente a es el mnimo del conjunto N\{k(0), . . . , k(n)},
ya que todo n
umero m < a es de la forma k(i) con i I, luego i n, luego
m {k(0), . . . , k(n)}, y as tenemos una contradicci
on.
En particular, todo subconjunto de un conjunto numerable es numerable.
Veamos una variante del teorema anterior:
Teorema B.4 Si f : A B es suprayectiva y A es numerable, entonces B
es numerable y |B| |A|.

479
n: Sea g : N A biyectiva, de modo que g f : N B es
Demostracio
tambien suprayectiva. Equivalentemente, podemos suponer que A = N. Pero
entonces podemos definir h : B N inyectiva mediante h(a) = mn f 1 [a], y
basta aplicar el teorema anterior.
Otra consecuencia inmediata del teorema B.3 es que un conjunto A es numerable (finito o infinito) si y s
olo si existe f : A N inyectiva.
A continuaci
on vamos a demostrar que N N es numerable. La idea subyacente a la prueba se muestra en la tabla siguiente:
..
.
4 10
3 6 11
2 3 7 12
1 1 4 8 13
0 0 2 5 9 14
0 1 2 3 4
En ella vamos disponiendo los n
umeros naturales completando diagonales:
en la primera diagonal ponemos el 0, en la diagonal siguiente el 1 y el 2, en la
siguiente el 3, el 4 y el 5, y as sucesivamente. Entonces a cada par ordenado
de n
umeros naturales le corresponde el n
umero natural que ponemos en su
fila y su columna. Por ejemplo, f (3, 1) = 13. Esto determina una biyecci
on
f : N N N. En realidad f admite una definici
on algebraica muy simple:
f (x, y) =

(x + y)(x + y + 1)
+ x.
2

La idea para llegar a esta expresi


on tambien es sencilla: por ejemplo, la imagen
f (3, 1) = 13 est
a en la diagonal formada por los pares cuyas componentes suman
x + y = 4. Para llegar a ella ha que pasar antes por las diagonales anteriores,
que contienen 1 + 2 + 3 + 4 = 10 n
umeros, pero como empezamos en el 0 resulta
que el f (0, 4) = 10 es ya ya el primero de dicha diagonal. Para llegar a f (3, 1)
hemos de avanzar x = 3 posiciones. En general, el par f (x, y) se alcanza en la
posici
on
(x + y)(x + y + 1)
1 + 2 + + (x + y) + x =
+ x.
2
Vamos a dar una justificaci
on puramente aritmetica de estos hechos. Para
ello observamos que la funci
on
g(n) =

n(n + 1)
2

cumple n g(n), pues esto equivale a que 2n n2 + n, o a que n n2 , lo cual


se cumple si n = 0 y, en caso contrario equivale a 1 n, que tambien se cumple.
Por lo tanto, para cada natural z existe un mnimo n0 tal que z < g(n0 ). No
puede ser n0 = 0, luego existe un u
nico n = n0 1 tal que g(n) z < g(n + 1).

480

Apendice B. Conjuntos infinitos

Ahora bien,
g(n + 1) g(n) =

(n + 1)(n + 2) n(n + 1)
(n + 1)2
=
= n + 1,
2
2

luego existe un u
nico n
umero natural 0 x n tal que z = g(n) + x. Llamando
y = n x tenemos que z = g(x + y) + x = f (x, y). Esto prueba que f es
suprayectiva.
La inyectividad se debe a que si f (x, y) = f (x0 , y 0 ), entonces, llamando
n = x+y y n0 = x0 +y 0 tenemos que g(n) z < g(n+1) y g(n0 ) z < g(n0 +1),
lo cual s
olo es posible si n = n0 , luego
f (x, y) = g(n) + x = g(n) + x0 ,
de donde x = y 0 y, por consiguiente, de x + y = x0 + y 0 obtenemos que y = y 0 .
M
as en general, ahora podemos probar:
Teorema B.5 Si A y B son conjuntos numerables, entonces el producto cartesiano A B es numerable.
n: Sean g1 : A N y g2 : B N inyectivas. Entonces
Demostracio
la funci
on g : A B N N dada por g(a, b) = (g1 (a), g2 (b)) es inyectiva,
y su composici
on con la biyecci
on N N N que hemos construido es una
aplicaci
on A B N inyectiva, luego A B es numerable.
Es claro que si uno de los dos conjuntos es infinito numerable y el otro es
no vaco (finito o infinito), entonces A B es infinito numerable. Teniendo en
cuenta la relaci
on |AB| = |A||B| v
alida para conjuntos finitos, ahora podemos
extenderla a conjuntos numerables si definimos
0 0 = 0,

0 n = 0

(si n > 0),

0 0 = 0 .

Teorema B.6 La uni


on de un conjunto numerable de conjuntos numerables es
numerable.
n: Sea {An }nN una familia numerable de conjuntos numeDemostracio
rables. Podemos suponer que no son todos vacos, y fijamos un a0 perteneciente
a uno de ellos. Sea1 fn : An N inyectiva y S
sea g : N N N biyectiva.
Definimos como sigue una aplicaci
on h : N
An :
nN

Si g(m) = (n, i) y se cumple que i fn [An ], entonces g(m) = fn1 (i), y


en caso
on g es suprayectiva, pues dado
S contrario g(m) = a0 . As la aplicaci
a
An , existe un n tal que a An , y podemos tomar i = fn (a). Si
nN

m = g 1 (n, i), es claro que h(m) = fn1 (i) = a. Ahora basta aplicar B.4.

1 Aqu
estamos eligiendo una aplicaci
on para cada n, con lo que estamos usando el axioma de
elecci
on. No obstante, se trata del axioma de elecci
on numerable. En general no destacaremos
los usos de las formas d
ebiles del axioma de elecci
on, como el axioma de elecci
on numerable
o el principio de elecciones dependientes.

481
En particular, la uni
on de dos conjuntos numerables, uno de ellos infinito,
es infinita numerable. Esto puede expresarse extendiendo la suma de cardinales
de modo que
0 + n = 0 ,
0 + 0 = 0 .
Hemos visto antes que si A es un conjunto infinito numerable, entonces PA
no es numerable. En cambio:
Teorema B.7 Si X es un conjunto numerable, el conjunto Pf X formado por
todos los subconjuntos finitos de X es numerable.
n: Si X es finito, entonces Pf X es finito, luego la conclusi
Demostracio
on
es trivial. Supongamos, pues, que X es infinito. Si f : X N es una biyecci
on,
podemos definir g : Pf X Pf N mediante g(A) = f [A], y es claro que g es
biyectiva, luego basta probar que Pf N es numerable.
Sea Pn N el conjunto de los subconjuntos de N de cardinal n. Una simple
inducci
on prueba que cada Pn N es numerable. En efecto, P0 N = {} es finito,
n
y si P N es numerable, entonces la aplicaci
on h : Pn N N Pn+1 N dada por
h(A, n) = A {m}, donde m es el mnimo n
umero natural m n tal que m
/A
n+1
es claramente suprayectiva,
por
lo
que
P
N
tambi
e
n
es
numerable.
S f
Finalmente, Pf N =
P N es numerable por ser uni
on numerable de connN
juntos numerables.
El teorema siguiente viene a decir que los conjuntos numerables son los
conjuntos infinitos m
as peque
nos:
Teorema B.8 Todo conjunto infinito contiene un subconjunto infinito numerable.
n: Si X es un conjunto infinito, podemos definir una apliDemostracio
caci
on f : N X inyectiva por recurrencia. Definidos f (0), . . . , f (n 1),
tenemos que {f (0), . . . , f (n 1)} X, porque X es infinito, luego podemos
elegir2 un elemento f (n) X \ {f (0), . . . , f (n 1)}, y es claro que f as definida
es inyectiva.
Conjuntos no numerables Es posible asignar un cardinal |A| a todo conjunto A, aunque no sea numerable, de tal modo que |A| = |B| equivalga a que
exista una aplicaci
on A B biyectiva, y |A| |B| equivalga a que exista una
aplicaci
on A B inyectiva. No vamos a demostrar estos hechos, porque no
nos har
an falta en ning
un momento, pero vamos a probar el resultado b
asico
que sirve de fundamento a la teora de los cardinales infinitos. Nos basamos en
un hecho previo:
2 Esta prueba requiere el axioma de elecci
on, pero puede reducirse al principio de elecciones
dependientes (teorema A.3) sin m
as que considerar el conjunto de todas las aplicaciones inyectivas s : {1, . . . , n} S
X ordenado por la inclusi
on estricta. Una cadena s0 s1 s2
define una aplicaci
on
sn : N X inyectiva.
nN

482

Apendice B. Conjuntos infinitos

Teorema B.9 Sea X un conjunto y F : PX PX una aplicaci


on tal que si
u v X entonces F (u) F (v). Entonces existe un z PX tal que F (z) = z.
n: Sea A = {u PX | F (u) u}. Se cumple que A es un
Demostracio
T
conjunto no vaco (pues contiene a X). Llamemos z =
u PX.
uA

Si u A, entonces z u, luego F (z) F (u) u, con lo que F (z) z.


Por la hip
otesis, F (F (z)) F (z), luego F (z) A, luego z F (z), lo que
nos da la igualdad F (z) = z.
Teorema B.10 (Teorema de Cantor-Bernstein) Sean X e Y conjuntos tales que existen aplicaciones inyectivas f : X Y y g : Y X. Entonces
existe h : X Y biyectiva.
n: Sea F : PX PX la aplicaci
Demostracio
on dada por F (u) =
X \g[Y \f [u]]. Estamos en las hip
otesis del teorema anterior, pues si u v X,
entonces
f [u] f [v],

Y \ f [v] Y \ f [u],

g[Y \ f [v]] g[Y \ f [u]],

X \ g[Y \ f [u]] X \ g[Y \ f [v]],


luego F (u) F (v).
En consecuencia existe un subconjunto z X tal que F (z) = z, es decir,
X \ g[Y \ f [z]] = z o, equivalentemente, X \ z = g[Y \ f [z]]. Por consiguiente,
f |z : z f [z] y g|Y \f [z] : Y \ f [z] X \ z son ambas biyectivas, luego la
uni
on de la primera con la inversa de la segunda nos da la aplicaci
on h buscada.
En terminos de cardinales, lo que afirma el teorema anterior es que si se
cumple |A| |B| y |B| |A|, entonces |A| = |B|. Existe una aritmetica de
los cardinales infinitos que generaliza a la que hemos expuesto para conjuntos
numerables. Para nuestros fines nos bastar
a con el resultado siguiente, que
en terminos de cardinales se interpreta como que si es un cardinal infinito,
entonces 0 = :
Teorema B.11 (AE) Si X es infinito, existe una biyecci
on f : X N X.
n: Consideramos el conjunto F de todas las aplicaciones biDemostracio
yectivas f : Y N Y , con Y X infinito. Observamos que es no vaco,
pues por B.8 sabemos que X contiene un subconjunto numerable Y , y entonces
existe f : Y N Y biyectiva, luego f F.
Consideramos a F como conjunto parcialmente ordenado por la inclusi
on,
es decir, una funci
on f : Y N Y es anterior a otra f 0 : Y 0 N Y 0 si
Y Y 0 y f 0 |Y N = f .
S
Es f
acil ver que si C es una cadena en F, entonces
f C es una cota
f C

superior de C, luego el lema de Zorn nos asegura que existe f : Y N Y


maximal.

483
Veamos que X \ Y tiene que ser finito. En caso contrario contiene un subconjunto numerable Z y existe g : Z N Z biyectiva. Es claro entonces que
(f g) : (Y Z) N Y Z es biyectiva, luego f g F y contradice la
maximalidad de f .
As pues, Z = X \ Y es finito y f : (X \ Z) N X \ Z es biyectiva. Basta
probar que existe una biyecci
on X X \ Z, pues entonces es f
acil construir
biyecciones
X N (X \ Z) N X Z X.
Tomamos W X \Z numerable. Entonces W Z es numerable, luego existe
una biyecci
on W Z W , que se extiende a una biyecci
on
X = (X \ (W Z)) (W Z) (X \ (W Z)) W = X \ Z.
La secci
on 1.6 de [An] contiene algunos resultados adicionales sobre cardinales infinitos.

Bibliografa
[1] Baker, A. Breve introducci
on a la teora de n
umeros. Alianza Ed., Madrid,
1986.
[2] Bastida, J.R. Field extensions and Galois theory. Addison-Wesley P.C.,
California, 1984.
[3] Borevich, Z.I., Shafarevich, I.R. Number Theory. Academic Press,
New York, 1967.
[4] Dean, R.A., A Rational polynomial whose Group is the Quaternions, The
American Mathematical Monthly, 88 (1981) 4245.
rrie, H. 100 Great Problems of Elementary Mathematics, Dover, New
[5] Do
York, 1965.
[6] Edwards, H. M. Fermats last theorem. Springer-Verlag, New York, 1977.
[7] Hungerford, T.W. Algebra. Springer-Verlag, New York, 1974.
[8] Lang, S., Algebra Addison-Wesley P.C., California, 1965.
[9] Stewart, I. y Tall, D. Algebraic number theory. Chapman and Hall,
Londres, 1979.

485

Indice de Materias
acci
on, 205
adjunci
on, 237
adjunta (matriz), 290
algebra, 324
algebraicamente
(in)dependiente, 464
cerrado, 265
algebraico, 236
alternada (forma), 283
alternado (grupo), 227
anillo, 57
conmutativo, 58
de divisi
on, 156
ordenado, 60
unitario, 58
antisimetrica
forma, 283
relaci
on, 28
aplicaci
on, 14
inyectiva, suprayectiva, biyectiva, 14
lineal, 160
asimetrica (relaci
on), 28
asociados, 93
asociativa (propiedad), 46
automorfismo, 178, 240
de grupos, 197
de m
odulos, 160
interno, 211
axioma
de comprensi
on, 4
de elecci
on, 471
de especificaci
on, 5
de extensionalidad, 3
de infinitud, 9, 18
de la uni
on, 7

de partes, 7
del par, 7
base, 166
can
onica, 166
de numeraci
on, 50
de trascendencia, 465
dual, 316, 317
entera, 381
normal, 458
ordenada, 176
Bezout (relaci
on de), 103
bilineal (forma), 314
caracterstica, 117
Cardano (f
ormula de), 341
cardinal, 477
de un conjunto finito, 35
centralizador, 212
centro, 228
cero, 10
cclico (grupo), 199
ciclo, 207
ciclot
omico, 152, 277
clase
de conjugaci
on, 212
de equivalencia, 43
clausura
algebraica, 267
normal, 248
perfecta, 461
puramente inseparable, 461
real, 275
separable, 461
coeficientes, 76
columna, 175
combinaci
on lineal, 159
486

INDICE DE MATERIAS
combinatorio (n
umero), 70
complemento, 8
conexa (relaci
on), 28
congruencia, 111, 159, 198
de matrices, 317
conjugaci
on, 383
de ideales, 415
en un cuerpo, 241
en un grupo, 211, 212
conjunto cociente, 43
conmutador, 357
conmutativa (propiedad), 46
cono positivo, 269
conservaci
on (de un primo), 417
contenido, 104
coordenadas, 167, 176
cota, 29
cuerpo, 64
cuadr
atico, 382
de cocientes, 66
de escisi
on, 245
de Galois, 451
fijado, 252, 259
numerico, 377
primo, 119
delta de Kronecker, 175
derivada formal, 249
derivado, 357
derivado (subgrupo), 357
determinante, 286
diedrico (grupo), 222
de orden 8, 215
infinito, 210
diagonal principal, 175
dilataci
on, 300
dimensi
on, 170
DIP, 89
discriminante, 334, 376, 382
disjuntos (conjuntos), 8
distributiva (propiedad), 57
divisi
on eucldea, 30
divisor, 93, 406
de cero, 59
divisores elementales, 189, 304
dominio, 16, 59

487
ntegro, 59
de Dedekind, 403
de factorizaci
on u
nica, 95
de ideales principales, 89
eucldeo, 63
dual
aplicaci
on, 316
base, 316, 317
espacio, 316
ecuaci
on general, 363
Eisenstein (criterio), 107
elemento primitivo, 238
endomorfismo
de m
odulos, 160
entero, 379
algebraico, 377
ciclot
omico, 127, 379
de Gauss, 125, 384
racional, 379
epimorfismo
can
onico, 116, 161, 220
de grupos, 197
de m
odulos, 160
equipotencia, 33
equivalencia (de matrices), 295
escisi
on
cuerpo de, 245
de un polinomio, 245
de un primo, 417
espacio
fundamental, 313
vectorial, 156
estabilizador, 206
Euler
criterio de, 441
funci
on de, 224
exponente, 95
extensi
on, 235
algebraica, 236
de Galois, 252
finita, 235
finitamente generada, 238
radical, 358
separable, 251
simple, 238

488
trascendente, 236
extension
puramente inseparable, 461
factores invariantes, 189, 296, 304,
308
factorial, 33
factorizaci
on (propiedad de), 99
Ferrari (f
ormula de), 347
fila, 175
finitamente generado
extensi
on, 238
ideal, 89
m
odulo, 158
finito (conjunto), 35
forma
bilineal, 314
regular, 316
simetrica, 315
can
onica, 297, 306
cuadr
atica, 315
multilineal, 283
alternada, 283
antisimetrica, 283
formalmente real (cuerpo), 269
fracci
on algebraica, 80
fraccional (ideal), 403
Frobenius (automorfismo de), 451
funci
on, 14
multiplicativa, 133
Gauss (criterio de), 106
generador
de un grupo, 199
de un ideal, 89
de un m
odulo, 158
grado
de inseparabilidad, 460, 462
de separabilidad, 462
de trascendencia, 467
de un polinomio, 76
de una extensi
on, 235
gran
intersecci
on, 9
uni
on, 7
grupo, 195

INDICE DE MATERIAS
abeliano, 195
alternado, 215, 227
cclico, 199
de clases, 420
de Galois, 241
de un polinomio, 335
de Klein, 215
resoluble, 352
simetrico, 204
simple, 352
homomorfismo
de anillos, 66
de grupos, 197
de m
odulos, 160
ideal
fraccional, 403
principal, 404
generado, 89
impropio, 88
maximal, 98
primo, 98
trivial, 88
identidad, 16
elemento, 58
matriz, 175
imagen, 16, 161, 198
impropios
subgrupos, 198
subm
odulos, 158
inclusi
on, 16
independiente (familia), 162
indeterminada, 73, 75
ndice (de un subgrupo), 198
inducci
on (principio de), 12, 22
inductivo (conjunto), 9
infinito (conjunto), 35
intersecci
on, 7
inversible (ideal), 404
inverso (elemento), 47
irreducible, 94
irreflexiva (relaci
on), 28
isomorfismo
de anillos, 67
de extensiones, 240

INDICE DE MATERIAS
de grupos, 197
de m
odulos, 160
Jacobi (smbolo de), 446
Klein (grupo), 215
Legendre (smbolo), 440
ley de composici
on interna, 45
Ley de reciprocidad cuadr
atica, 443,
446
libre
conjunto, 166
de cuadrados, 142
m
odulo, 166
ligado (conjunto), 166
lineal (grupo)
especial, 299
general, 196
linealmente independientes/dependientes,
166
matriz, 174
adjunta, 290
columna, 174
cuadrada, 174
de cambio de base, 179
de una aplicaci
on, 176
de una forma bilineal, 315
diagonal, 175
elemental, 296
escalar, 175
fila, 174
identidad, 175
inversa, 179
nula, 175
regular, 179
simetrica, 175
singular, 179
traspuesta, 175
maximal (ideal), 98
m
aximo, 29
com
un divisor, 102, 406
menor complementario, 288
Mersenne (n
umero de), 135
mnimo, 29
com
un m
ultiplo, 102, 406

489
m
odulo, 155
cociente, 160
libre, 166
mon
ogeno, 158
m
onico (polinomio), 76
mon
ogeno (m
odulo), 158
monomio, 76
monomorfismo
de anillos, 67
de grupos, 197
de m
odulos, 160
multiplicativa (funci
on), 133
multiplicidad, 406
m
ultiplo, 93, 406
neutro (elemento), 46
Newton (binomio de), 71
noetheriano (anillo), 91
norma
de un ideal, 410
de una extensi
on, 257
eucldea, 63
normal
extensi
on, 246
subgrupo, 212
notaci
on
aditiva, 47
multiplicativa, 47
n
ucleo, 116, 161, 198
numerable (conjunto), 477
n
umero
combinatorio, 70
de clases, 421
de Mersenne, 135
entero, 52
natural, 10, 22
perfecto, 133
operaci
on, 45
opuesto (elemento), 46
orbita, 206
orden
de un elemento, 200
de un grupo, 198
par
desordenado, 7

490
ordenado, 13
partes (conjunto de), 7
Peano
axiomas de, 11, 18
sistema de, 19
Pell (ecuaci
on de), 435
perfecto
cuerpo, 251
n
umero, 133
permutaci
on, 204
par/impar, 227
Pierpont (primo de), 352
polinomio, 73
caracterstico, 310
ciclot
omico, 277
general, 363
mnimo, 239, 304, 305, 309
primitivo, 104
simetrico, 328
elemental, 328
primo
de Fermat, 137
de Mersenne, 135
elemento, 96
ideal, 98
primos entre s, 102
principio
de elecciones dependientes, 472
de inducci
on, 12, 22
fuerte, 31
de recursi
on, 19, 22
fuerte, 32
producto
cartesiano, 14
de m
odulos, 163
directo, 218
proyecci
on can
onica, 43
puramente
inseparable, 461
trascendente, 465
racionales (n
umeros), 68
radical (extensi
on), 358
raz
de la unidad, 277
de un polinomio, 108

INDICE DE MATERIAS
primitiva, 225, 277
ramificaci
on (de un primo), 417
rango, 16, 172, 184, 298
realmente cerrado (cuerpo), 273
recursi
on (principio de), 19, 22
reflexiva (relaci
on), 28
regular
forma bilineal, 316
matriz, 179
relaci
on, 27
de equivalencia, 42
de orden, 28
resoluble
grupo, 352
por radicales, 358
resolvente c
ubica, 337
resto cuadr
atico, 418
resultante, 331
semejantes (matrices), 302
semigrupo, 46
separable, 250, 251
serie, 352
signatura, 227, 319, 448
signo, 61
siguiente, 10
simetrica
forma bilineal, 315
matriz, 175
relaci
on, 28
simetrico
elemento, 47
polinomio, 328
similitud (de ideales), 421
simple
extensi
on, 238
grupo, 352
singular (matriz), 179
sistema
de coordenadas, 176
de Peano, 19
subanillo, 67
subconjunto, 4
subgrupo, 197
derivado, 357
generado, 199

INDICE DE MATERIAS
normal, 212
subm
odulo, 157
generado, 158
impropio, 158
trivial, 158
suma
de m
odulos, 161
directa, 162, 164
Tartaglia (tri
angulo), 71
Teorema
chino del resto, 121, 122, 124
de Cantor-Bernstein, 482
de Cayley, 311
de Dedekind, 259, 407
de Fermat, 116, 146
de Frobenius, 325
de Galois, 362
de isomorfa, 117, 161, 220, 221
de Lagrange, 199
de los ceros de Hilbert, 470
de Sylvester, 319
de Wedderburn, 454
del elemento primitivo, 255
del resto, 108
terna pitag
orica, 140
torsi
on (elemento, m
odulo de), 182
totalmente
positivo, 276
real, 276
transitiva (relaci
on), 28
transitividad
de grados, 235
de la norma, 257
transvecci
on, 300
trascendente, 236
trasposici
on, 207
traspuesta (matriz), 175
traza, 257, 312
trivial
subgrupo, 198
subm
odulo, 158

Ultimo
Teorema de Fermat, 146
uni
on, 7
unidad, 63

491
fundamental, 433
valor
absoluto, 61
propio, 312
Vandermonde, 289
vector
columna, 174
fila, 174
propio, 312
Zorn (lema de), 473

You might also like