Ibort, a. rodriguez, m.a. -  notas de algebra lineal
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Ibort, a. rodriguez, m.a. - notas de algebra lineal

on

  • 954 views

Alger

Alger

Statistics

Views

Total Views
954
Views on SlideShare
953
Embed Views
1

Actions

Likes
0
Downloads
16
Comments
0

1 Embed 1

http://www.slashdocs.com 1

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Ibort, a. rodriguez, m.a. - notas de algebra lineal Document Transcript

  • 1. ´ NOTAS DE ALGEBRA LINEAL A. Ibort y M.A. Rodr´ ıguez Departamento de Matem´ticas, Universidad Carlos III de Madrid aDepartamento de F´ ısica Te´rica II, Universidad Complutense de Madrid o 30 de marzo de 2001
  • 2. ´INDICE Pr´logo o v1 Estructuras algebraicas 1 1.1 Notaci´n y teor´ de conjuntos . . . . . . . . . . . . . . o ıa . . . . . . . . . . . . . . . . . . . 1 1.2 Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2.1 Operaciones binarias internas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2.2 Permutaciones y grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.3 M´s sobre el grupo de permutaciones . . . . . . . a . . . . . . . . . . . . . . . . . . . 5 1.2.4 Homomorfismos de grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.3 Anillos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.3.1 Los n´meros enteros . . . . . . . . . . . . . . . . u . . . . . . . . . . . . . . . . . . . 6 1.3.2 Divisibilidad y factorizaci´n de n´meros enteros o u . . . . . . . . . . . . . . . . . . . 9 1.3.3 Congruencias de n´meros enteros . . . . . . . . . u . . . . . . . . . . . . . . . . . . . 10 1.4 Cuerpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.4.1 El cuerpo de los n´meros racionales . . . . . . . u . . . . . . . . . . . . . . . . . . . 11 1.4.2 El cuerpo de los n´meros reales . . . . . . . . . . u . . . . . . . . . . . . . . . . . . . 12 1.4.3 N´meros Gaussianos . . . . . . . . . . . . . . . . u . . . . . . . . . . . . . . . . . . . 12 1.4.4 El cuerpo de los n´meros complejos . . . . . . . u . . . . . . . . . . . . . . . . . . . 13 1.4.5 Ra´ ıces n-´simas de la unidad . . . . . . . . . . . e . . . . . . . . . . . . . . . . . . . 14 1.5 Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.5.1 El anillo de los polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.5.2 Divisibilidad en el anillo de polinomios . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.5.3 Ra´ ıces de polinomios y completitud algebraica . . . . . . . . . . . . . . . . . . . . 182 Espacios vectoriales 19 2.1 Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2 Subespacios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.3 Operaciones con subespacios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.4 Sistemas de generadores, rango y bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.5 Cambios de base. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.5.1 Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.5.2 Operaciones elementales con matrices . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.5.3 La matriz del cambio de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.6 Ecuaciones de subespacios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443 Aplicaciones lineales 49 3.1 Generalidades sobre aplicaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.1.1 Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.1.2 Algunos ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.1.3 Algunas propiedades de las aplicaciones lineales . . . . . . . . . . . . . . . . . . . . 51 3.2 Teoremas de isomorf´ de espacios vectoriales . . . . . . . . ıa . . . . . . . . . . . . . . . . . 52 3.2.1 Primer teorema de isomorf´ de espacios vectoriales ıa . . . . . . . . . . . . . . . . . 52 3.2.2 Otros teoremas de isomorf´ . . . . . . . . . . . . . . ıa . . . . . . . . . . . . . . . . . 53 i
  • 3. ii ´ INDICE 3.3 Representaci´n matricial y cambios de base . . . . . . . . . . . . . o . . . . . . . . . . . . . 53 3.3.1 Representaci´n matricial de una aplicaci´n lineal . . . . . . o o . . . . . . . . . . . . . 53 3.3.2 Representaci´n matricial de la composici´n de aplicaciones o o . . . . . . . . . . . . . 54 3.3.3 Cambios de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.3.4 Representaci´n matricial en bases diferentes . . . . . . . . . o . . . . . . . . . . . . . 56 3.4 Espacios de aplicaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 3.4.1 El espacio dual de un espacio vectorial . . . . . . . . . . . . . . . . . . . . . . . . . 58 3.4.2 Endomorfismos de un espacio vectorial . . . . . . . . . . . . . . . . . . . . . . . . . 59 3.4.3 Otros espacios de aplicaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . 59 3.5 Rango de una aplicaci´n . . . . . . . . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . 59 3.6 Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.7 Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 3.7.1 Aplicaciones multilineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 3.7.2 Determinante de una aplicaci´n lineal . . . . . . . . . . . . o . . . . . . . . . . . . . 65 3.7.3 Determinantes de matrices y sus propiedades . . . . . . . . . . . . . . . . . . . . . 664 Formas can´nicas de endomorfismos o 71 4.1 Diagonalizaci´n . . . . . . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . 71 4.1.1 Matrices diagonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 4.2 Autovalores y autovectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 4.3 Subespacios invariantes y matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.3.1 Diagonalizaci´n de endomorfismos y matrices . o . . . . . . . . . . . . . . . . . . . . 75 4.4 La ecuaci´n caracter´ o ıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 4.4.1 C´lculo de autovalores y autovectores . . . . . a . . . . . . . . . . . . . . . . . . . . 76 4.4.2 El polinomio caracter´ ıstico de un endomorfismo . . . . . . . . . . . . . . . . . . . . 76 4.5 Formas can´nicas de endomorfismos nilpotentes . . . . o . . . . . . . . . . . . . . . . . . . . 77 4.6 Formas can´nicas de endomorfismos . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . 83 4.7 El teorema de Cayley-Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 4.8 Polinomio m´ ınimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 865 Espacios con producto escalar 89 5.1 El espacio dual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 5.1.1 Introducci´n . . . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . 89 5.1.2 El espacio bidual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 5.1.3 Anulador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 5.1.4 La aplicaci´n transpuesta . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . 92 5.1.5 La matriz de la aplicaci´n transpuesta . . . . . o . . . . . . . . . . . . . . . . . . . . 92 5.2 Formas bilineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5.2.1 Aplicaciones multilineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5.2.2 Formas bilineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5.2.3 Matriz de una forma bilineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 5.2.4 Formas bilineales sim´tricas y antisim´tricas . e e . . . . . . . . . . . . . . . . . . . . 96 5.2.5 Formas bilineales sim´tricas regulares . . . . . e . . . . . . . . . . . . . . . . . . . . 97 5.2.6 Ortogonalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 5.2.7 Diagonalizaci´n de formas bilineales sim´tricas o e . . . . . . . . . . . . . . . . . . . . 99 5.2.8 Ortonormalizaci´n de Gram-Schmidt . . . . . . o . . . . . . . . . . . . . . . . . . . . 102 5.3 Formas Cuadr´ticas . . . . . . . . . . . . . . . . . . . a . . . . . . . . . . . . . . . . . . . . 103 5.3.1 Diagonalizaci´n de formas cuadr´ticas . . . . . o a . . . . . . . . . . . . . . . . . . . . 103 5.3.2 Formas cuadr´ticas definidas . . . . . . . . . . a . . . . . . . . . . . . . . . . . . . . 104 5.4 Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 5.4.1 Producto escalar en un espacio real . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 5.4.2 Formas sesquilineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 5.4.3 Producto escalar complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 5.4.4 Norma en un espacio vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 5.4.5 Ortogonalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
  • 4. ´INDICE iii 5.4.6 Proyecci´n ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 o 5.4.7 La propiedad del paralelogramo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 5.4.8 El teorema de Riesz-Fr´chet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 e6 Operadores en espacios con producto escalar 113 6.1 Operadores en espacios complejos con producto escalar . . . . . . . . . . . . . . . . . . . . 113 6.1.1 El operador adjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 6.1.2 Representaci´n matricial del operador adjunto . . . . o . . . . . . . . . . . . . . . . 114 6.1.3 Operadores normales, autoadjuntos y unitarios . . . . . . . . . . . . . . . . . . . . 115 6.1.4 Teorema espectral para operadores normales . . . . . . . . . . . . . . . . . . . . . 116 6.1.5 Teorema espectral para operadores autoadjuntos . . . . . . . . . . . . . . . . . . . 118 6.1.6 Teorema espectral para operadores unitarios . . . . . . . . . . . . . . . . . . . . . 119 6.2 Proyectores ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 6.2.1 C´lculo de proyectores ortogonales . . . . . . . . . . . a . . . . . . . . . . . . . . . . 121 6.3 Operadores en espacios vectoriales reales con producto escalar . . . . . . . . . . . . . . . . 123 6.3.1 El operador transpuesto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 6.3.2 Representaci´n matricial del operador transpuesto . . o . . . . . . . . . . . . . . . . 123 6.3.3 Operadores normales, sim´tricos y ortogonales . . . . e . . . . . . . . . . . . . . . . 124 6.3.4 Teorema espectral para operadores sim´tricos . . . . . e . . . . . . . . . . . . . . . . 124 6.3.5 Descomposici´n espectral de operadores sim´tricos . . o e . . . . . . . . . . . . . . . . 126 6.4 Operadores ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 6.4.1 Operadores ortogonales en un espacio de dimensi´n 2 o . . . . . . . . . . . . . . . . 126 6.4.2 Subespacios invariantes de un operador ortogonal . . . . . . . . . . . . . . . . . . . 128 6.4.3 Forma can´nica de un operador ortogonal . . . . . . . o . . . . . . . . . . . . . . . . 1287 Tensores 131 7.1 Una justificaci´n . . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . 131 7.2 Aplicaciones multilineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 7.3 Coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 7.3.1 Coordenadas contravariantes y covariantes . . . . . . . . . . . . . . . . . . . . . . . 135 7.3.2 Coordenadas en relatividad especial . . . . . . . . . . . . . . . . . . . . . . . . . . 138 7.4 Espacios vectoriales y sus duales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 7.5 Producto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 7.5.1 Definici´n de producto tensorial . . . . . o . . . . . . . . . . . . . . . . . . . . . . . 141 7.5.2 Construcci´n del producto tensorial . . . o . . . . . . . . . . . . . . . . . . . . . . . 142 7.5.3 Propiedades del producto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 7.6 Tensores y aplicaciones multilineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 7.7 Cambios de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 7.8 Definici´n de tensores bajo transformaciones . . . o . . . . . . . . . . . . . . . . . . . . . . . 146 7.9 Propiedades de los tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 7.9.1 Tensores sim´tricos y antisim´tricos . . . e e . . . . . . . . . . . . . . . . . . . . . . . 147 7.9.2 Contracci´n de ´ o ındices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 7.9.3 Producto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 7.10 Tensores covariantes antisim´tricos: formas . . . e . . . . . . . . . . . . . . . . . . . . . . . 151 7.11 Tensores y grupos de transformaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 7.12 Espacios con producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 7.13 Aplicaciones entre espacios producto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . 1538 El espacio af´ ın 159 8.1 Introducci´n . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 8.2 Sistemas de referencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 8.3 Transformaciones afines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 8.4 Espacios euclidianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 8.4.1 Isometr´ en espacios euclidianos ıas . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 8.5 El plano euclidiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
  • 5. iv ´ INDICE 8.5.1 Rectas en IR2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 8.5.2 Distancia de un punto a una recta . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 8.5.3 Isometr´ en el plano . . . . . . . . . . . . . . . . . ıas . . . . . . . . . . . . . . . . . 163 8.5.4 Transformaciones de puntos y rectas bajo isometr´ ıas . . . . . . . . . . . . . . . . . 165 8.6 El espacio euclidiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 8.6.1 Rectas en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 8.6.2 Planos en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 8.6.3 Posiciones relativas de rectas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 8.6.4 Posiciones relativas de planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 8.6.5 Distancia de un punto a un plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 8.6.6 Isometr´ . . . . . . . . . . . . . . . . . . . . . . . . ıas . . . . . . . . . . . . . . . . . 169 8.7 Clasificaci´ n de c´nicas . . . . . . . . . . . . . . . . . . . . o o . . . . . . . . . . . . . . . . . 170 8.7.1 Formas can´nicas . . . . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . 171 Problemas 174 Soluciones 206
  • 6. Pr´logo o ´Estas notas de Algebra Lineal responden a cursos desarrollados en la Facultad de Ciencias F´ ısicas de laUniversidad Complutense durante varios periodos. A trav´s de ellos, el plan de estudios ha cambiado y, ecomo consecuencia, la duraci´n de los cursos y su contenido. Hemos procurado que este texto comprenda oel actual temario de la asignatura, aunque ello depender´ en ultima instancia del enfoque particular a ´que cada profesor d´ al tema. Pero adem´s aparecen en ´l otras cuestiones que complementan o aclaran e a ealgunos aspectos de la asignatura y que, aunque pueden ser evitados en una primera lectura, contribuyen,desde nuestro punto de vista, a una mejor comprensi´n del tema tratado. o El contenido se divide en cuatro grandes temas dedicados al estudio de los espacios vectoriales, lasaplicaciones lineales y la teor´ de matrices, los espacios con producto escalar y los operadores en estos ıaultimos espacios. Estos temas van precedidos por una introducci´n con conceptos elementales sobre´ oestructuras algebraicas. El curso se completa con un cap´ ıtulo sobre tensores y algunos conceptos degeometr´ af´ con una aplicaci´n a la clasificaci´n de c´nicas Tambi´n se incluye una colecci´n de ıa ın o o o e oproblemas planteados en clase o problemas de tipo cl´sico similares a los que pueden encontrarse en otros atextos, as´ como problemas propuestos en ex´menes de la asignatura. ı a En cuanto al tema primero de estructuras algebraicas, no todas las nociones expuestas son necesariaspara el curso. En particular, la teor´ de grupos podr´ parecer excesiva y no es nuestro objetivo insistir ıa ıaen ella. Sin embargo, el conocimiento de algunas nociones del grupo de permutaciones es esencial parauna mejor comprensi´n de la teor´ de determinantes y por eso se ha desarrollado con un cierto detalle. o ıaAsimismo, aunque desde luego no se entra en la construcci´n de los n´meros reales (un tema que no es o upropio del ´lgebra) s´ se desarrolla la de los n´meros complejos, pues resulta fundamental en el curso. a ı uAlgunas ideas sobre anillos y cuerpos completan este cap´ ıtulo que se cierra con la primeras nociones sobrepolinomios. Los cap´ ıtulos dedicados a la teor´ de espacios vectoriales, aplicaciones lineales y matrices son funda- ıamentales y forman parte de cualquiera curso b´sico de ´lgebra lineal. En el enfoque que aqu´ se ha dado, a a ılos sistemas lineales aparecen como asociados de forma natural a la teor´ de aplicaciones lineales. Pen- ıasamos que, como el planteamiento de forma independiente ya se ha estudiado en cursos anteriores, merecela pena enfocarlo desde la perspectiva mencionada. Asimismo, los espacios de aplicaciones lineales, enespecial el espacio dual, permiten la introducci´n de nuevos ejemplos de espacios lineales que resultar´n o ade gran utilidad en el resto del curso. El cap´ıtulo dedicado al estudio de las formas can´nicas de endomorfismos puede simplificarse en gran omanera. En particular la falta de tiempo aconseja muchas veces prescindir del estudio de formas can´nicasode Jordan para endomorfismos que no son diagonalizables y limitarse a un estudio de los diagonalizables.Pero no cabe duda de que, aun sin entrar en el detalle de la construcci´n de estas formas de Jordan, s´ o ımerece la pena hacer alg´n comentario sobre su existencia y estructura. u los temas dedicado a espacios con productos escalares son b´sicos en las aplicaciones, en particular aen F´ısica que es el objeto final de los estudiantes a los que van dirigidas estas notas. Algunas cuestionescomo la definici´n de formas sesquilineales pueden ser evitados pasando directamente a las cuestiones orelacionadas con el producto escalar. Pero las formas can´nicas de operadores sim´tricos, unitarios y o eortogonales deber´ figurar en el contenido del curso. ıan El cap´ ıtulo sobre tensores es un tanto singular en la estructura del curso. Parte de su contenidosobrepasa ciertamente el nivel general de estas notas. Pero no es dif´ extraer de ´l las ideas m´s ıcil e aelementales de lo que es un tensor bajo transformaciones. Adem´s dado su car´cter aislado su supresi´n a a ono afectar´ a un curso basado en este texto. ıa v
  • 7. vi ´ INDICE Finalmente se presenta un cap´ ıtulo con cuestiones m´s geom´tricas como los movimientos en los a eespacios eucl´ıdeos y como aplicaci´n la clasificaci´n de c´nicas, sobre el que, sin embargo, no se ha o o oincluido ning´ n problema en esta versi´n. u o Muchas cuestiones que aparecen en esta notas no pueden ser expuesta en el desarrollo del curso, peroesperamos que su lectura ayude, como hemos dicho al principio, a la comprensi´n de todo el temario. o Muchas han sido los fuentes de las que han surgido estas notas. Aparte de la experiencia de los autores(y de los numerosos libros consultados) citaremos la contribuci´n de los profesores del Departamento de oF´ısica Te´rica II de la Facultad de Ciencias F´ o ısicas de la Universidad Complutense que han ense˜ado nesta materia durante diversos cursos. Aunque, como es habitual, los errores y faltas nos correspondanexclusivamente, los aciertos y utilidad de estas notas deben adjudicarse a todos ellos (en particulartambi´n a nosotros). e Alberto Ibort Miguel A. Rodr´ ıguezBibliograf´ ıaLa lista siguiente incluye algunos libros que, bien por su accesibilidad o por su inter´s general nos ha eparecido oportuno incluir, entre ellos, una colecci´n de problemas. Por supuesto, el nivel que presentan oes muy variado y las preferencias de los autores de estas notas solo aparecen reflejadas en algunos deellos.Burgos, J. de, Algebra Lineal, McGraw Hill, Madrid, 1993.Gantmacher, F.R., Th´orie des matrices, Dunod, Paris, 1966. eGel’fand, I.M., Lectures on Linear Algebra, Dover, N.Y. 1989.Hungerford, T.W., Algebra, Holt, Rinehart and Winston, Inc. 1973. o ´Kostrikhin, A.I., Introducci´n al Algebra, McGraw Hill, 2a. edici´n, Madrid, 1993. oNomizu, K., Fundamentals of Linear Algebra, Academic Press, New York, 1974.Rojo, J., Mart´ I., Ejercicios y problemas de ´lgebra lineal, McGraw Hill, Madrid, 1994. ın, aSouriau, J.M., Calcul Lin´aire, Editions Jacques Gabay, 2 ´dition 1992. e e
  • 8. Tema 1Estructuras algebraicas Grupos. Anillos. N´meros enteros. Cuerpos. N´meros racionales. N´ meros reales. u u u N´ meros complejos. Polinomios. u1.1 Notaci´n y teor´ de conjuntos o ıaSe supone que los alumnos se hallan familiarizados con la teor´ elemental de conjuntos. A lo largo de ıaeste texto los conjuntos ser´n denotados habitualmente por letras latinas may´sculas A, B, C, . . . , X, Y, Z. a uLos elementos de un conjunto A se denotar´n por letras latinas min´sculas a, b, c, . . . , x, y, z. El s´ a u ımboloa ∈ A significa que el elemento a pertenece al conjunto A, as´ A = {a ∈ A}. Existe un conjunto que no ıposee ning´n elemento, tal conjunto se llama vac´ y se denota por ∅. u ıo Nota. Aunque no ser´ necesario en este curso, nos gustar´ hacer notar que no todas las cons- a ıa trucciones que pueden hacerse en ´lgebra (incluso a este nivel elemental) conducen a conjuntos. a Por ejemplo la familia formada por todos los conjuntos no es un conjunto (¿Por qu´?). En e este sentido es conveniente tener cuidado al definir conjuntos y utilizarlos. Por ejemplo, si “definimos” el conjunto de los n´meros racionales cuya primera cifra decimal es cero nos u encontramos que no sabemos si el n´mero 1/10 pertenece o no, ya que su expresi´n decimal u o es 0.1 = 0.0¯ por tanto no hemos definido un conjunto. Un ejemplo mucho menos evidente 9, es el siguiente: consideremos el conjunto de los n´meros naturales “interesantes”. Podemos u probar inmediatamente que todo n´mero natural es “interesante”. En efecto, tomemos el u complementario C de este subconjunto. Ciertamente el n´mero 1 es interesante luego no u pertenece a C. Probemos que C = ∅. Si C = ∅ existe un elemento m m´ ınimo en dicho conjunto, luego m es el n´mero natural m´s peque˜o que no es interesante, pero ´sta es desde u a n e luego una propiedad interesante, por tanto m es interesante y C debe ser vac´ ıo. QED f El s´ ımbolo f: A → B (o tambi´n A → B) denotar´ a lo largo del texto una aplicaci´n f del conjunto e a oA, llamado dominio de f , en B, llamado rango de f . Si f : A → B, g: B → C son dos aplicaciones g ◦ fdenotar´ su composici´n. La imagen de a ∈ A por f se denotar´ f (a). Con esta notaci´n definimos la a o a ocomposici´n de aplicaciones como (g ◦ f)(a) = g(f (a)). o El producto cartesiano de dos conjuntos A, B se denotar´ por A × B y se define como A × B = {(a, b) | aa ∈ A, b ∈ B}. La uni´n de dos conjuntos se denotar´ por A ∪ B = {x | x ∈ A ∨ x ∈ B}, y la intersecci´n o a opor A ∩ B = {x | x ∈ A ∧ x ∈ B}. Denotaremos por A B = {a ∈ A | a ∈ B}. As´ A A = ∅. / ı, El cuantificador l´gico ∀ significa “para todo” y ∃ significa “existe”. Tambi´n utilizaremos ∃! que o esignifica “existe un unico”. ´ 1
  • 9. 2 TEMA 1. ESTRUCTURAS ALGEBRAICAS1.2 Grupos1.2.1 Operaciones binarias internasUna operaci´n binaria interna en un conjunto X es una aplicaci´n : X × X → X. Habitualmente la o oimagen por la aplicaci´n de dos elementos x, y ∈ X se denotar´ por (x, y) = x y, y se leer´ “x o a amultiplicado por y” o “x por y”. Escribimos (X, ) para denotar el conjunto X junto con la ley . SiX es un conjunto finito, una operaci´n binaria se puede describir dando su tabla de multiplicar: se ocolocar´ sobre el eje OX los elementos de X y sobre el eje OY de nuevo los elementos de X. En los nodos ao puntos de intersecci´n en el ret´ o ıculo definido por estos puntos, colocaremos los resultados de multiplicarlos correspondientes elementos. Esto es, si X = {x1 , x2 , . . . , xn }, tendremos, x1 x2 ··· xn−1 xn x1 x1 x1 x1 x2 ··· x1 xn−1 x1 xn x2 x2 x1 x2 x2 ··· x2 xn−1 x2 xn . . . . . . .. . . . . . . . . . . xn xn x1 xn x2 ··· xn xn−1 xn xn N´tese que es una aplicaci´n si y s´lo si la tabla queda completamente llena y en cada nodo hay un o o ounico elemento.´Ejemplo 1.2.1 Sea X = {a, b} y la operaci´n binaria interna con tabla de multiplicar o a b a a b b b a La tabla anterior es equivalente a la definici´n de la aplicaci´n , a a = a, a b = b, b a = b, b b = a. o oEjemplo 1.2.2 X = {a, b}. Definiremos la operaci´n binaria interna ⊥ a trav´s de su tabla de multi- o eplicar, ⊥ a b a a a b b bo equivalentemente a ⊥ a = a, a ⊥ b = a, b ⊥ a = b, b ⊥ b = b. Un elemento e ∈ X se dir´ que es neutro por la derecha respecto a si x e = x, ∀x ∈ X. An´logamente a ase dir´ que es neutro por la izquierda si e x = x, ∀x ∈ X . Diremos que e es simplemente neutro si es aneutro por la derecha y por la izquierda. En otros t´rminos un elemento es neutro si su columna y fila en ela tabla de multiplicar es simplemente una copia de X. En el ejemplo 1.2.1 a es neutro. En el ejemplo1.2.2 no hay elemento neutro.Ejercicio 1.2.1 Probar que si (X, ) tiene elemento neutro e, ´ste es unico. e ´ Sea (X, ) un conjunto con producto y elemento neutro e. Diremos que y es un inverso a derecha(izquierda) de x si x y = e (y x = e). Diremos que y es un inverso de x si es inverso a derecha eizquierda.Ejemplo 1.2.3 Sea X = {a, b, c} con la operaci´n binaria interna, o a b c a a b c b b a a c c a b
  • 10. 1.2. GRUPOS 3 Observamos que a es el elemento neutro. b b = a implica que b es un elemento inverso de b.b c = a = c b implica que c es un elemento inverso de b. Diremos que una operaci´n interna es asociativa si (x y) z = x (y z), ∀x, y, z ∈ X. En tal caso o se llamar´ usualmente “producto” en X. aEjercicio 1.2.2 Probar que si es asociativa y x ∈ X tiene inverso, ´ste es unico. Tal elemento se e ´denotar´ habitualmente por x−1 . a Las operaciones de los ejemplos 1.2.1 y 1.2.2 son asociativas, no as´ la del 1.2.3. ı Un conjunto X con una operaci´n asociativa se denomina semigrupo. oEjemplo 1.2.4 IN = {1, 2, 3, . . .} denota el conjunto de los n´meros naturales. Denotaremos por + la uoperaci´n binaria interna definida por la adici´n ordinaria de n´meros naturales. (IN, +) es un semigrupo o o uque no posee elemento neutro. Denotaremos por · la multiplicaci´n ordinaria de n´meros naturales. (IN, ·) o ues un semigrupo con elemento neutro 1. As´ como la tabla de sumar no se obliga a “memorizar” a los ni˜os, la tabla de multiplicar de los ı nn´ meros naturales se hace memorizar a todos los ni˜os del mundo. Es la primera operaci´n interna no u n otrivial que pertenece al acervo cultural de la humanidad. Una operaci´n binaria se dir´ conmutativa si x y = y x, ∀x, y ∈ X. Las operaciones +, · en el o aejemplo 1.2.4 son conmutativas. Las operaciones de los ejemplos 1.2.1 y 1.2.3 son conmutativas pero ladel ejemplo 1.2.2 no lo es. Si es conmutativa su tabla de multiplicar es sim´trica respecto a la diagonal. e Si X posee dos operaciones internas , ⊥, diremos que ⊥ es distributiva respecto de si x (y ⊥ z) =(x z) ⊥ (x z), ∀x, y, z ∈ X. En (IN, +, ·), la suma + es distributiva respecto de ·.1.2.2 Permutaciones y gruposPor muy variadas razones la familia de las permutaciones de una colecci´n finita de elementos forman un oconjunto muy importante. Lo vamos a discutir detalladamente. Consideremos por ejemplo el conjuntoX = {1, 2, . . . , n} de los n primeros n´ meros naturales. Una permutaci´n de 1, 2, . . . , n es una biyecci´n u o oα: X → X. N´tese que α(1) ser´ por tanto un n´mero natural entre 1 y n que podemos denotar por α1 , o a uα(2) ser´ otro denotado por α2 , etc., hasta α(n) = αn . Diremos que la lista de n´meros α1 α2 · · · αn se a uobtiene de la 123 · · · n por una “permutaci´n”, la permutaci´n α. Es convencional escribir la permutaci´n o o oα como una matriz 1 2 ··· n α= α1 α2 · · · αnque es autoexplicativa, esto es, 1 → α1 , 2 → α2 , ... , n → αn . El conjunto de todas las permutaciones del conjunto {1, 2, . . . , n} se denotar´ por Sn . En Sn definimos auna operaci´n binaria interna · como la composici´n de aplicaciones, esto es: o o α · β = α ◦ β, ∀α, β ∈ Sn ,esto es, (α · β)(i) = α(β(i)), i = 1, 2, . . . , n. La operaci´n · es asociativa ya que la composici´n de aplicaciones lo es (¡probadlo!). o o Denotaremos por e la permutaci´n correspondiente a la aplicaci´n identidad, esto es, e(i) = i, i = o o1, 2, . . . , n, o en la notaci´n anterior o 1 2 ··· n e= . 1 2 ··· nClaramente α · e = e · α = α, ∀α ∈ Sn , por tanto e es el elemento neutro de (Sn , ·). Toda permutaci´noα tiene elemento inverso (¡´nico!). En efecto, si α ∈ Sn como α es biyectiva existe la aplicaci´n inversa u oα−1 : X → X, tal que α−1 (i) = j si α(j) = i. Es evidente que α · α−1 = α−1 · α = e.
  • 11. 4 TEMA 1. ESTRUCTURAS ALGEBRAICAS 1 2 3 4 1 2 3 4 1 2 3 4Ejemplo 1.2.5 Sea α = , con α−1 = . Sea β = , 2 4 1 3 3 1 4 2 1 3 4 2entonces, 1 2 3 4 1 2 3 4 1 2 3 4 α·β = · = , 2 4 1 3 1 3 4 2 2 1 3 4y 1 2 3 4 1 2 3 4 1 2 3 4 β·α= · = , 1 3 4 2 2 4 1 3 3 2 1 4luego α · β = β · α y la operaci´n · no es conmutativa. oEjemplo 1.2.6 Tablas de multiplicar de (S2 , ·) y (S3 , ·). Vemos que S2 es conmutativo y S3 no lo es. 1 2S2 = e, τ = . 2 1 · e τ e e τ τ τ e(N´tese que esta tabla de multiplicar coincide, salvo notaci´n, con la tabla del ejemplo 1.2.1). o o Consideremos a continuaci´n el conjunto S3 o 1 2 3 1 2 3 1 2 3 e, τ1 = , τ2 = , τ3 = , 2 1 3 3 2 1 1 3 2 1 2 3 1 2 3 σ1 = , σ2 = . 2 3 1 3 1 2 · e τ1 τ2 τ3 σ1 σ2 e e τ1 τ2 τ3 σ1 σ2 τ1 τ1 e σ2 σ1 τ3 τ2 τ2 τ2 σ1 e σ2 τ1 τ3 τ3 τ3 σ2 σ1 e τ2 τ1 σ1 σ1 τ2 τ3 τ1 σ2 e σ2 σ2 τ3 τ1 τ2 e σ1 Se observa f´cilmente que τi−1 = τi , i = 1, 2, 3 y σ1 = σ2 , σ2 = σ1 . a −1 −1Ejercicio 1.2.3 Escribid la tabla de multiplicar de S4 y S5 .Ejercicio 1.2.4 Probad que el producto en (Sn , ·), n ≥ 3 no es conmutativo.Definici´n 1.2.1 Un conjunto G con una operaci´n binaria interna o o se dir´ que es un grupo si, a i. Posee elemento neutro e ∈ G. ii. La operaci´n es asociativa, y o iii. Todo elemento posee inverso, esto es, ∀x ∈ G, ∃x−1 ∈ G. De todo lo anterior se desprende que (Sn , ·) es un grupo. Dicho grupo se llama el grupo de permuta-ciones de n elementos. Cuando nos refiramos a un grupo (G, ) habitualmente omitiremos la operaci´n y osi no hay riesgo de confusi´n tambi´n omitiremos el s´ o e ımbolo al escribir el producto, esto es, escribiremosxy en lugar de x y. Si el grupo G es finito, llamaremos orden del grupo G al n´mero de sus elementos y se denotar´ por u a| G |. Si G no es finito diremos que | G |= ∞. Por ejemplo | S2 |= 2, | S3 |= 6.Ejercicio 1.2.5 | Sn |= n!.
  • 12. 1.2. GRUPOS 5Definici´n 1.2.2 Un subconjunto H ⊂ G del grupo (G, ·) se dir´ que es un subgrupo si o a i. ∀x, y ∈ H, x · y ∈ H, ii. ∀x ∈ H, x−1 ∈ H. Un subgrupo H de G es a su vez un grupo con la operaci´n inducida de la del grupo G. Sea H = {e}, oH es un subgrupo llamado el subgrupo trivial. ∅ ⊂ G no es un subgrupo. Si H = G, H es un subgrupo.G y {e} se llaman subgrupos impropios (o triviales). Un subgrupo H diferente de {e} y G se dir´ propio. aEjemplo 1.2.7 A3 = {e, σ1 , σ2} ⊂ S3 . A3 es un subgrupo de S3 . En efecto del ejemplo 1.2.6 obtenemosque A3 e σ1 σ2 e e σ1 σ2 σ1 σ1 σ2 e σ2 σ2 e σ1 El subconjunto {e, τ1} ⊂ S3 es un subgrupo. Lo mismo ocurre con {e, τ2 }, {e, τ3 }. Ning´ n otro usubconjunto de S3 es un subgrupo.1.2.3 M´s sobre el grupo de permutaciones aUn ciclo es una permutaci´n α en Sn de la forma o α(k1 ) = k2 , α(k2) = k3 , . . . , α(kr−1 ) = kr , α(kr ) = k1 ,donde {k1 , k2 , . . . , kr } ⊂ {1, 2, . . . , n} y los dem´s elementos no cambian. Tal permutaci´n se denotar´ a o apor α = (k1 k2 · · · kr ) y habitualmente se indica el n´mero de elementos que se permutan c´ u ıclicamente,esto es, se dice que (k1 k2 · · · kr ) es un r–ciclo.Ejemplo 1.2.8 En S3 todo elemento es un ciclo. En S4 no todo elemento es un ciclo. Por ejemplo, la 1 2 3 4permutaci´n α = o es el producto de dos 2–ciclos, α = (12)(34). 2 1 4 3 Llamaremos transposiciones a los 2–ciclos, esto es a los elementos de Sn de la forma (k1 k2). Porejemplo en S3 los elementos τ1 , τ2 y τ3 son transposiciones. Los resultados m´s importantes sobre la aritm´tica de ciclos son: a eProposici´n 1.2.1 Toda permutaci´n admite una descomposici´n ´nica salvo orden en producto de o o o uciclos disjuntos que conmutan entre si. 1 2 3 4 5 6Ejemplo 1.2.9 σ ∈ S6 . σ = = (1)(243)(56). 1 4 2 3 6 5Proposici´n 1.2.2 Toda permutaci´n admite una descomposici´n en producto de transposiciones (que o o ono conmutan en general y que no es ´nica). uEjemplo 1.2.10 σ ∈ S3. σ = (123) = (12)(23) = (23)(13).Proposici´n 1.2.3 La paridad del n´mero de transposiciones en las que se puede descomponer toda o upermutaci´n no depende de la descomposici´n sino s´lo de la permutaci´n. o o o o Se llama paridad o signatura de una permutaci´n al n´mero (σ) = (−1)k , donde k es el n´mero de o u utransposiciones de una descomposici´n de σ ∈ Sn . oProposici´n 1.2.4 La paridad de un producto es el producto de las paridades. o (αβ) = (α) (β).Ejemplo 1.2.11 Todas las transposiciones tienen paridad impar. Un k-ciclo tiene paridad (−1)k−1 . El conjunto de las permutaciones de paridad par forman un subgrupo de Sn llamado el grupo de lasalternaciones o grupo alternado. Se denota habitualmente por An y su orden es n!/2.
  • 13. 6 TEMA 1. ESTRUCTURAS ALGEBRAICAS1.2.4 Homomorfismos de gruposUna aplicaci´n f: G → G entre dos grupos (G, ·), (G , ), se dir´ que es un homomorfismo de grupos si o af (g · h) = f (g) f (h), ∀g, h ∈ G. Si el homomorfismo f es inyectivo se dir´ que es un monomorfismo. Si aes suprayectivo se dir´ que es un epimorfismo y si f es biyectivo se dir´ que es un isomorfismo. a aEjercicio 1.2.6 Denotemos por D3 el grupo de simetr´ de un tri´ngulo equil´tero. Probar que D3 es ıas a aisomorfo a S3 .Ejemplo 1.2.12 Si denotamos por T el grupo de simetr´ de un tetraedro regular, entonces S4 es ıasisomorfo a T . Si f : G → G es un homomorfismo de grupos, llamaremos n´cleo de f el subconjunto de G que se uaplica en el elemento neutro de G y se denota por ker f , ker f = {g ∈ G | f (g) = e }.El conjunto imagen de f se denotar´ habitualmente por im f = {f (g) ∈ G | g ∈ G}. aProposici´n 1.2.5 ker f , im f son subgrupos. o 1 2 3 4Ejemplo 1.2.13 Consid´rese la aplicaci´n i: S3 → S4 definida por i(α) = e o . En- α1 α2 α3 4tonces i es un monomorfismo. La inclusi´n natural j: An → Sn es un monomorfismo. o La asignaci´n a cada permutaci´n de su paridad, : Sn → Z 2 es un epimorfismo debido a la proposici´n o o Z o1.2.4. Un subgrupo H de G se dice normal si gHg−1 ⊂ H, ∀g ∈ G, esto es, si para todo h ∈ H, ghg−1 ∈ Hpara todo g ∈ G. ker f es un subgrupo normal de G.Ejemplo 1.2.14 An es un subgrupo normal de Sn .1.3 Anillos1.3.1 Los n´ meros enteros uEn esta secci´n revisaremos escuetamente los n´meros enteros y la noci´n de anillo. o u o Hemos visto que el conjunto de los n´meros naturales IN tiene una estructura de semigrupo respecto ua la suma (tambi´n con respecto al producto). Podemos plantearnos como extender este conjunto para econvertirlo en un grupo. M´s concretamente, la ecuaci´n x + n = m, n, m ∈ IN no siempre tiene soluci´n a o oen los n´ meros naturales. ¿Podemos extender IN para que la ecuaci´n anterior siempre se pueda resolver? u oHay un procedimiento natural para hacer esto y consiste en a˜adir las ra´ n ıces de esta ecuaci´n a IN. Si odenotamos la ra´ de x + n = m por m − n vemos inmediatamente que m − n = (m + r) − (n + r) para ıztodo r ∈ IN, lo que nos permite introducir una relaci´n de equivalencia en el conjunto de todas las ra´ o ıcesde todas las ecuaciones x + n = m. Denotaremos por (n − m) una de estas clases. Podemos definir lasuma de ra´ ıces como sigue: (m − n) + (m − n ) = ((m + m ) − (n + n )).El elemento neutro de la suma es la ra´ de la ecuaci´n x + n = n, esto es (n − n) que denotaremos por 0. ız oSi m > n existe un n´mero natural r tal que m = n + r y la clase (m − n) la denotaremos simplemente upor r. Si m < n de manera an´loga existe un n´mero natural s tal que n = m + s y la clase (m − n) se a udenotar´ por −s. a El conjunto de ra´ ıces se denotar´ Z y sus elementos se llamar´n n´meros enteros. a Z a u Z = {. . . , −2, −1, 0, 1, 2, . . .}. Z
  • 14. 1.3. ANILLOS 7 Alternativamente los n´meros enteros pueden construirse considerando una relaci´n de equivalencia u oen el producto cartesiano IN × IN como sigue: (n, m) ∼ (n , m ) si y s´lo si n + m = m + n . La clase de oequivalencia que contiene a (m, n) se denotar´ como [m, n]. Definimos la suma en el conjunto de clases acomo [m, n] + [r, s] = [m + r, n + s].Ejercicio 1.3.1 Probad que la operaci´n + est´ bien definida y proporciona una estructura de grupo en o aIN × IN/ ∼. La operaci´n es conmutativa con elemento neutro la clase [m, m]. o Es f´cil comprobar que hay tres tipos de clases: la clase [m, m] que denotaremos por 0; las de tipo a[m + r, m], que denotaremos por r; y, finalmente, las de tipo [m, m + r] que denotaremos por −r. Estomuestra de nuevo que el conjunto de ra´ de la ecuaci´n lineal de primer orden con coeficientes naturales ıces oest´ formado por los elementos del conjunto IN × IN/ ∼. Identificaremos a partir de este momento ambos aconjuntos y los llamaremos indistintamente n´meros enteros. El subconjunto de enteros 0, 1, 2, . . . , se udenominar´n enteros positivos y el subconjunto 0, −1, −2, . . . , se denominar´n enteros negativos. El cero a aes el unico entero positivo y negativo. Diremos que p es menor o igual que q si p − q es positivo y lo ´denotaremos p ≤ q. La relaci´n ≤ es una relaci´n de orden total en Z o o Z. Tenemos la siguiente propiedad fundamental de los n´meros enteros (y de los naturales): uTeorema 1.3.1 Cualquier subconjunto no vac´ de enteros positivos posee un elemento menor o igual ıoque todos los dem´s que se denomina m´ a ınimo del conjunto. Demostraci´ n. Un tal subconjunto contiene un entero positivo n ya que es no vac´ Entonces el o ıo.primer elemento en la lista 0, 1, 2, . . . , n − 1, n contenido en el conjunto tiene la propiedad en cuesti´n. oQED Una propiedad equivalente al teorema anterior es el “principio de inducci´n completa”. oTeorema 1.3.2 Principio de inducci´n completa. Si una proposici´n sobre un n´mero entero positivo n o o ues cierta para n = 0, y su veracidad para todo 0 ≤ k < n implica su veracidad para n, entonces es ciertapara todo n. Demostraci´ n. Llamemos F el subconjunto de n´meros enteros positivos para los cuales la propo- o usici´n es falsa. Si F es no vac´ tomemos el m´ o ıo, ınimo de este conjunto, llam´mosle n0 . Pero la proposici´n e oes cierta para todo k < n0 y por hip´tesis la proposici´n es cierta para n0 . o o QEDProducto de n´ meros enteros. Definimos una operaci´n · en Z como sigue: [m, n] · [r, s] = [mr + u o Zns, ms + nr], o utilizando la notaci´n de ra´ o ıces, n · m = nm; n · (−m) = −(nm); (−n) · (−m) = nm; n · 0 = (−n) · 0 = 0. Omitiremos en lo sucesivo el punto “·” en el producto de n´meros enteros excepto por motivos de uclaridad en la notaci´n. o Existe elemento neutro para el producto de enteros, el 1.Proposici´n 1.3.1 ±1 son los ´nicos enteros que poseen inverso respecto al producto. o u Es inmediato verificar que el producto es asociativo, p(qr) = (pq)r, ∀p, q, r ∈ Z Z,distributivo, p(q + r) = pq + pr,conmutativo, pq = qp,y adem´s a 0 · p = p · 0 = 0.
  • 15. 8 TEMA 1. ESTRUCTURAS ALGEBRAICASDefinici´n 1.3.1 Un anillo es un conjunto A dotado de dos operaciones binarias internas denotadas orespectivamente por + y ·, tales que (A, +) es un grupo Abeliano y (A, ·) es un semigrupo, satisfaci´ndose eadem´s la propiedad distributiva: a x · (y + z) = x · y + x · z, x, y, z ∈ A.Si la operaci´n · es conmutativa se dir´ que el anillo es conmutativo, y si posee elemento neutro respecto o adel producto, se dir´ que A es un anillo con identidad. aEjemplo 1.3.1 (Z +, ·) es un anillo conmutativo con identidad. En Z se satisface adem´s la siguiente Z, Z apropiedad: si pq = 0, entonces, o bien p = 0 o q = 0. Un tal anillo se dice que es un dominio de integridad.Ejemplo 1.3.2 . Consid´rese el conjunto IH = {(q0, q1 , q2 , q3 ) | qi ∈ Z con las operaciones: e Z} (q0 , q1 , q2 , q3 ) + (q0 , q1 , q2 , q3) = (q0 + q0 , q1 + q1 , q2 + q2 , q3 + q3 ), (q0 , q1, q2 , q3 ) · (q0 , q1 , q2, q3 ) = (q0 q0 − q1 q1 − q2 q2 − q3 q3 , q2 q3 − q3 q2, q3 q1 − q1 q3 , q1 q2 − q2 q1 ).IH es un anillo con identidad pero no es conmutativo. IH no es un dominio de integridad.Definici´n 1.3.2 Un subconjunto B ⊂ A de un anillo (A, +, ·) se dir´ que es un subanillo si o a i. a − b ∈ B, ∀a, b ∈ B, ii. a · b ∈ B, ∀a, b ∈ B. Denotamos por −b el inverso de b respecto a la operaci´n +. Se desprende de la definici´n que todo o osubanillo es un anillo.Proposici´n 1.3.2 Si B es un subanillo de Z existe un n´mero natural m ∈ IN tal que B = mZ = o Z u Z{mp | p ∈ Z Z}. Demostraci´n. Si B = {0}, sea m = 0. Si no, el conjunto de elementos mayores que cero en B no opuede ser vac´ Tomemos m el m´ ıo. ınimo de ellos. Por ser B subanillo mZ ⊂ B. Si p ∈ B, aplicamos el Zalgoritmo de la divisi´n por m (ver Teorema 1.3.5) y obtenemos que existe 0 ≤ r < m tal que p = qm + r, opero entonces r = p − qm ∈ B y r es positivo y menor que m. QED Nota. Es suficiente suponer que m − n ∈ B para todo m, n ∈ B ⊂ Z Tal conjunto es Z. autom´ticamente un subanillo. a En lo que sigue discutiremos exclusivamente anillos conmutativos con identidad (aunque no exigiremostal propiedad a los posibles subanillos). La identidad ser´ denotada por 1 o 1A si hubiera peligro de aconfusi´n. o Los elementos invertibles de un anillo A se llaman unidades. El conjunto U(A) = {x ∈ A | ∃x−1 ∈ A}es un grupo llamado el grupo de unidades de A.Definici´n 1.3.3 Ideales. Un ideal de un anillo A es un subanillo I que adem´s satisface xy ∈ I para o atodo x ∈ I, y ∈ A.Corolario 1.3.1 Los ideales de Z son de la forma mZ para alg´n m ∈ Z Z Z u Z.Ejemplo 1.3.3 El anillo de los polinomios Z Z[x]. Sea x un s´ımbolo abstracto (podr´ ıamos tomar por ejemplo en su lugar un cuadro “abstracto” o ellogotipo de una compa˜´ comercial) y consid´rese el conjunto cuyos elementos son objetos de la forma nıa ea0 + a1 x + a2 x2 + · · · + an xn , ai ∈ Z i = 1, . . . , n, n ∈ IN. Los s´ Z, ımbolos x2 , x3 , . . . , xn representanxx, xxx, etc. Los elementos de este conjunto se denominan polinomios, los denotaremos por P (x), Q(x),etc. y al conjunto de todos ellos lo denotaremos por Z Z[x] y lo denominaremos el anillo de los polinomioscon coeficientes enteros. Definimos en este conjunto las operaciones + y · como sigue:
  • 16. 1.3. ANILLOS 9 Si P (x) = a0 + a1 x + · · · + an xn , Q(x) = b0 + b1 x + · · · + bm xm , y n ≥ m, entonces P (x) + Q(x) =(a0 + b0 ) + (a1 + b1 )x + (a2 + b2 )x2 + · · · + (am + bm )xm + am+1 xm+1 + · · · + an xn , y P (x) · Q(x) =a0b0 + (a1 b0 + a0b1)x + (a2 b0 + a1 b1 + a0 b2 )x2 + · · · + an bm xn+m . Utilizando una notaci´n m´s compacta o a n mpodemos escribir P (x) = i=0 ai xi , Q(x) = j=0 bj xj , y   max(n,m) n+m P (x) + Q(x) = (ak + bk )xk , P (x) · Q(x) =  ai bj  xk , k=0 k=0 i+j=ky en la suma bk = 0, para todo k > m. ZZ[x] es un anillo conmutativo con identidad. Cada n´mero entero p define un polinomio cuyo unico u ´t´rmino es el a0 = p. Los enteros se convierten de este modo en un subanillo de Z e Z[x] pero no forman unideal. Consid´rese por el contrario conjuntos como B = {P (x)(1 + x) | P (x) ∈ Z e Z[x]} = (1 + x)ZZ[x] oC = {P (x)(1 + x2) | P (x) ∈ Z Z[x]} = (1 + x2 )Z Z[x]. Tanto B como C son subanillos y adem´s son ideales. a ZZ[x] es un dominio de integridad.1.3.2 Divisibilidad y factorizaci´n de n´ meros enteros o uUn n´ mero entero p se dice que divide (o que es un divisor) de otro entero q si existe un entero r tal que uq = pr. Tambi´n diremos que q es un m´ltiplo de p. Si p divide a q lo indicaremos por p | q. Es evidente e uque todos los m´ltiplos de p son los enteros de la forma rp, r ∈ Z que es un ideal de Z denotado por pZ u Z, Z Zy tambi´n (p). N´tese que todo n´mero entero tiene al menos cuatro divisores ±p, ±1 que llamaremos e o udivisores impropios. Un n´mero entero p se dice que es primo si no posee m´s divisores que los impropios. Si p es primo u a−p tambi´n lo es. Por esta raz´n habitualmente se consideran unicamente los primos positivos y mayores e o ´que 1.Teorema 1.3.3 Teorema fundamental de la aritm´tica. Todo n´mero entero p se puede escribir como e uun producto de n´meros primos. Adem´s dicha escritura es unica excepto por el orden de los factores. u a ´ Demostraci´n. Ver al final de esta secci´n. o o Por esta raz´n se dice que Z es un dominio de factorizaci´n unica (y tambi´n se llama un anillo o Z o ´ efactorial).Teorema 1.3.4 Teorema de Euclides. El conjunto de los primos es infinito. Demostraci´ n. Supongamos que el conjunto P de los n´meros primos fuera finito, digamos P = o u{p1 , p2 , . . . , pN }. Entonces el n´mero p1p2 · · · pN + 1 no est´ en P y en consecuencia no es primo. Pero u aentonces por el teorema fundamental de la aritm´tica este n´mero debe ser divisible por alguno de los e uprimos pi de P lo cual es imposible. QED Dados dos n´meros enteros p, q, consideremos el conjunto S de todos los enteros de la forma rp + sq, ucon r, s ∈ Z Claramente dicho conjunto es un subanillo (de hecho es un ideal). Por tanto hemos visto Z.que S = mZ para alg´n m ∈ Z Dicho m se llamar´ el m´ximo com´n divisor de p y q y se denotar´ o Z u Z. a a u abien m.c.d. (p, q) o simplemente m = (p, q).Ejercicio 1.3.2 Probar que si p es un n´mero primo tal que p | ab entonces p | a o p | b. uEjercicio 1.3.3 Probar que si m | p y m | q, entonces m | (p, q). Probar que si p | p y q | q , entonces(p, q) | (p , q ). Diremos que dos n´meros enteros p y q son primos entre si (p, q) = 1. N´tese que esto es equivalente u oa que existan dos n´meros enteros r, s tales que rp + sq = 1. uEjercicio 1.3.4 Pru´bese que la ecuaci´n px + qy = r, p, q, r ∈ Z tiene soluciones enteras si y s´lo si e o Z, o(p, q) | r.
  • 17. 10 TEMA 1. ESTRUCTURAS ALGEBRAICASTeorema 1.3.5 Algoritmo de la divisi´n. Sean p, q ∈ Z q > 0, entonces existen d, r ∈ Z tales que o Z, Z p = qd + r; 0 ≤ r < q,y adem´s d, r son unicos. a ´ Demostraci´n. Consideremos el conjunto S = {p − dq | d ∈ Z p − dq ≥ 0}. Claramente S = ∅ o Z,(t´mese d = −p2 ). Entonces S tendr´ un m´ o a ınimo (teorema 1.3.1) que denotaremos por r. Necesariamente0 ≤ r < q ya que si r ≥ q, entonces r = q + r , 0 ≤ r < r y r = p − (d + 1)q ∈ S lo cual es absurdo. Unicidad. Supongamos que d , r son dos enteros tales que p = qd + r y 0 ≤ r < q. Entoncesq(d − d ) = r − r. Supongamos que r > r por tanto q(d − d ) > 0, esto es d > d y por tanto d = d + d0 ,d0 > 0. Entonces p = dq + r = q(d + d0 ) + r y por tanto qd0 + r = r , que implica que r > q. Sisuponemos que r > r obtendremos que r > q por tanto la unica posibilidad es que r = r y por tanto ´d=d. QEDTeorema 1.3.6 Algoritmo de Euclides. Dados dos n´meros enteros p, q ∈ Z podemos calcular su m´ximo u Z acom´n divisor a trav´s del siguiente algoritmo: u e p = qd0 + r0 , 0 ≤ r0 < q, q = r0 d 1 + r1 , 0 ≤ r1 < r0 , r0 = r1 d 2 + r2 , 0 ≤ r2 < r1 , ······ rn−2 = rn−1 dn + rn , 0 ≤ rn < rn−1, rn−1 = rn dn+1 , rn+1 = 0.Entonces rn = (p, q). Demostraci´n. En efecto, si d | p y d | q, entonces d | r0 ya que r0 = p − qd0 , por tanto, (p, q) | r0 , opero d | q y d | r0 implica que d | r1 , y as´ sucesivamente, hasta que (p, q) | rn . ı Rec´ıprocamente, est´ claro que rn | rn−1 , pero rn−2 = rn dn+1 + rn , por tanto rn | rn−2 , etc. hasta aque rn | p y rn | q, por tanto rn | (p, q). Por tanto rn = (p, q). QED1.3.3 Congruencias de n´ meros enteros uEn el conjunto de los n´meros enteros Z introducimos una relaci´n de equivalencia como sigue: fijemos u Z oun n´ mero entero positivo n; diremos que p es congruente con q m´dulo n si n | p − q, esto es si ∃r ∈ Z u o Ztal que p − q = rn, o todav´ de otro modo, si q < n como p = rn + q, q es el resto de dividir p por n. ıa Si p es congruente con q m´dulo n, escribiremos p ≡ q (mod n). oEjercicio 1.3.5 Probar que la relaci´n anterior es efectivamente una relaci´n de equivalencia. o o La clase de equivalencia que contiene a p se denotar´ por [p]. Claramente [p] = {p + nr | r ∈ Z a Z}.Efectivamente si p ∈ [p], entonces p ≡ p (mod n), esto es ∃s ∈ Z tal que p − p = ns. Obs´rvese Z etambi´n que [p] = [p + n], por tanto las clases de equivalencia diferentes de n´meros enteros congruentes e um´dulo n son: o [0] = {sn | s ∈ Z [1] = {1 + sn | s ∈ Z . . . , [n − 1] = {n − 1 + sn | s ∈ Z Z}, Z}, Z},esto es, [0] es el conjunto de m´ltiplos de n, [1] es el conjunto de m´ltiplos de n m´s 1, etc. El conjunto u u ade clases de congruencia m´dulo n se denotar´ por Z n , as´ o a Z ı Z n = {[0], [1], [2], . . . , [n − 1]}. ZEn Z n se definen dos operaciones + y · como sigue: Z i. [r] + [s] = [r + s], ii. [r] · [s] = [rs], r, s = 0, 1, . . . , n − 1.
  • 18. 1.4. CUERPOS 11Ejercicio 1.3.6 Probar que las operaciones est´n bien definidas. a (Z n , +, ·) es un anillo conmutativo con identidad [1]. ZEjemplo 1.3.4 El anillo Z 2 posee dos elementos {[0], [1]}. En el anillo Z 3 = {[0], [1], [2]} todo elemento Z Zposee inverso ya que [2][2] = [1]. El anillo Z 4 = {[0], [1], [2], [3]} no es un dominio de integridad ya que Z[2][2] = [0].Ejercicio 1.3.7 Sea p primo, probar que todo elemento no nulo en Z p tiene inverso. Z1.4 Cuerpos1.4.1 El cuerpo de los n´ meros racionales uLos unicos n´meros enteros que poseen inverso respecto a la multiplicaci´n son ±1. Hay un procedimiento ´ u ostandard para construir a partir de un dominio de integridad un nuevo anillo donde todos sus elementosposeen inverso. Ilustraremos esta construcci´n con el dominio de integridad de los n´meros enteros Z o u Z. Sea el conjunto Z × Z ∗ , donde Z ∗ = Z − {0}. Consideremos la siguiente relaci´n de equivalencia Z Z Z Z o(p, q) ∼ (r, s) ⇔ ps = qr. Las propiedades reflexiva y sim´trica son evidentes. Con respecto a la etransitiva, si (p, q) ∼ (r, s), y (r, s) ∼ (t, u), entonces ps = qr, ru = st, y por tanto psu = qru = qst, estoes (pu − qt)s = 0. Como s = 0, pu = qt lo que quiere decir que (p, q) ∼ (t, u). La clase de equivalencia que contiene al par (p, q) se denotar´ por p/q o pq −1 . El conjunto Z × Z ∗ / ∼ a Z Zse denotar´ por Q y sus elementos se llamaran n´meros racionales (o fraccionarios). As´ Q = {p/q : p ∈ a u ıZ q ∈ Z ∗ }. En Q definimos dos operaciones +, · como sigue: Z, Z p r ps + qr p r pr p r i. + = , ii. · = , ∀ , ∈ Q. q s st q s qs q sEjercicio 1.4.1 Probar que (Q, +, ·) es un anillo conmutativo con identidad. Adem´s es un dominio de aintegridad, pero no es un dominio de factorizaci´n unica. o ´ Todo elemento p/q ∈ Q con p = 0 tiene inverso. En efecto (p/q)−1 = q/p ya que p/q · q/p = pq/qp =1/1 = 1. En cada clase de equivalencia p/q ∈ Q hay un unico representante p /q tal que que (p , q ) = 1. ´ Notas. 1. El conjunto Q se obtiene en forma an´loga a como hicimos en la construcci´n de los n´meros a o u enteros resolviendo la ecuaci´n qx = p, q = 0. Las ra´ o ıces de esta ecuaci´n se pueden escribir o en una notaci´n obvia como pq −1 . Los detalles del an´lisis se completan de manera trivial. o a ¿C´mo obtendr´ o ıamos la suma de n´meros racionales siguiendo esta l´ u ınea de razonamiento? 2. La misma construcci´n se puede aplicar al dominio de integridad de los polinomios con o coeficientes en Z El conjunto que se obtiene es el cuerpo de las funciones racionales con Z. coeficientes en Z Z. 3. La construcci´n anterior se puede realizar en cualquier anillo A utilizando un sistema o multiplicativo S. Un sistema multiplicativo es un subconjunto tal que el producto de cua- lesquiera par de elementos pertenece al conjunto. En el conjunto de pares A × S se introduce una relaci´n de equivalencia como anteriormente, esto es (x, s) ∼ (y, t) ↔ xt = ys, x, y ∈ A, o s, t ∈ S. El conjunto cociente se denota por S −1 A y es un anillo (anillo de fracciones de A por S).Definici´n 1.4.1 Un conjunto IK dotado de dos operaciones binarias internas +, · se dir´ que es un o acuerpo si (IK, +, ·) es un anillo con identidad y todo elemento x = 0 tiene inverso x−1 respecto delproducto. Si (IK, ·) es un semigrupo conmutativo el cuerpo IK se dir´ conmutativo. En lo sucesivo y salvo aespecificaci´n contraria trataremos exclusivamente con cuerpo conmutativos. o
  • 19. 12 TEMA 1. ESTRUCTURAS ALGEBRAICASDefinici´n 1.4.2 Un cuerpo IK se dir´ que tiene caracter´ o a ıstica n ∈ IN ∪ {0} si n · 1 = 0, donde 0 es elelemento neutro de la suma (+) y 1 el elemento unidad del producto (·).Ejemplo 1.4.1 (Q, +, ·) es un cuerpo conmutativo de caracter´ ıstica 0.Ejercicio 1.4.2 Probar que si p es primo, (Z p , +, ·) es un cuerpo. ¿Cu´l es su caracter´ Z a ıstica?1.4.2 El cuerpo de los n´meros reales uUn subconjunto IF ⊂ IK del cuerpo IK se dir´ que es un subcuerpo de IK, si es un subanillo y si para atodo elemento x ∈ IF, x = 0, entonces x−1 ∈ IF. Autom´ticamente IF es un cuerpo. Tambi´n se dir´ que a e aIK es una extensi´n de IF. oEjercicio 1.4.3 Probar que Z p no posee ning´ n subcuerpo propio (es decir, distinto de {0}, Z p ). Z u Z Un cuerpo que no posee subcuerpos propios se llama primo.Ejercicio 1.4.4 Probar que Q es un cuerpo primo.El problema de las extensiones de QSea P (x) = a0 +a1 x+· · ·+an xn ∈ Z Z[x], diremos que p/q es una ra´ de P (x) si a0 +a1 p/q+· · ·+an (p/q)n = ız n a + q n−1 pa + · · · + pn a = 0. Es claro que los n´ meros racionales p/q son las ra´0, esto es si q 0 1 n u ıcesde los polinomios de primer grado −p + qx, q = 0. Es tambi´n evidente que hay ecuaciones de segundo egrado que no tienen ra´ ıces racionales, por ejemplo, x2 − 2 = 0, o x2 + 1 = 0. Podemos plantearnospor tanto si existen cuerpos IK, extensiones de Q donde las ecuaciones anteriores tengan soluci´n. El oproblema es que hay much´ ısimos. Existe un cuerpo ´ptimo, extensi´n de Q en el que toda ecuaci´n o o opolin´mica tiene alguna ra´ el cuerpo de los n´meros complejos C. La construcci´n de C se hace en dos o ız: u oetapas. Una primera que no es algebraica y en la que se construye un cuerpo, llamado de los n´meros ureales IR, caracterizado por una propiedad topol´gica (completitud) y una segunda etapa algebraica que odescribiremos posteriormente. La construcci´n de los n´meros reales a partir de los n´meros racionales Q se realiza utilizando concep- o u utos no algebraicos como ya hemos indicado y que por tanto no reproduciremos aqu´ (consultar un curso de √ √ √ ı √an´lisis matem´tico elemental). Como es bien sabido, n´meros como 2, 3, 5+ 17 son n´meros reales a a √ u u 2al igual que n´meros como π, e, e , ... y otros n´meros no racionales como 0.01012012301234012345..., u uetc. Las operaciones de suma y producto de n´ meros reales se denotar´n con los signos convencionales u a+, ·. IR es un cuerpo de caracter´ ıstica cero. Los n´meros reales x ∈ IR que son ra´ u ıces de ecuacionespolin´micas con coeficientes en Z se llamar´n n´meros algebraicos. Todos los racionales son algebraicos, o Z a u √ √ √ √pero tambi´n lo son n´meros irracionales como 2, 3, 2 + 5, etc. e uTeorema 1.4.1 e y π no son algebraicos.1.4.3 N´meros Gaussianos u √ √ √ √Sea d ∈ IN tal que d ∈ Q. Consideremos el conjunto Q( d) definido como Q( d) = {a + b d | a, b ∈ Q}. /√Es f´cil observar que Q( d) es un cuerpo con las operaciones: a √ √ √ (a + b d) + (a + b d) = (a + a ) + (b + b ) d, √ √ √ (a + b d) · (a + b d) = (aa + bb d) + (ab + a b) d.Claramente la identidad para el producto es 1 y √ a −b √ (a + b d)−1 = + 2 d, a2 − db2 a − db2
  • 20. 1.4. CUERPOS 13 √si a ´ b = 0. N´tese que en este caso√ 2 − db2 = 0 ya que si a2 = db2, entonces d = a/b ∈ Q en contra o o a √de la hip´tesis. Obs´rvese que (a + b d)(a − b d) = a2 − db2 y as´ o e ı √ √ 1 a−b d a−b d √ = √ √ = 2 . a+b d (a + b d)(a − b d) a − db2 √ √ √El √conjunto Z d) = {p + q d | p, q ∈ Z es un anillo contenido naturalmente en Q( d). El anillo Z( Z}Z√ d) es un dominio √ √ Z( √ de integridad pero no √ un dominio de factorizaci´n unica. Por ejemplo, (5 − √ es o ´2 5)(5 + 2 5) = 5 = 5 5, (6 + 3 3)(6 − 3 3) = 9 = 3 · 3. √ √ Claramente los n´meros a + b d, a − b d son las ra´ u ıces del polinomio entero x2 − 2ax + (a2 − b2d) = 0.N´tese que podemos permitir d < 0 en toda la discusi´n anterior. o o1.4.4 El cuerpo de los n´ meros complejos uConsideremos el conjunto Z × Z con las operaciones: Z Z (m, n) + (r, s) = (m + r, n + s), (m, n) · (r, s) = (mr − ns, ms + nr), m, n, r, s ∈ Z Z.Con estas operaciones Z × Z es un anillo conmutativo con identidad. El elemento neutro respecto de la Z Zsuma es (0, 0) y la identidad respecto al producto es (1, 0).Proposici´n 1.4.1 El elemento (0, 1) es una ra´ del polinomio x2 + 1 ∈ Z o ız Z[x]. Demostraci´ n. En efecto (0, 1)2 = (0, 1) · (0, 1) = (−1, 0) = −1. o QED √ √ Si denotamos (0, 1) como −1, vemos inmediatamente que Z × Z se puede identificar con Z −1) = √ Z Z √ Z({m + n −1 | m, n ∈ Z An´logamente se pueden definir los enteros Gaussianos Z −d), d > 0. √ Z}. a √ Z( √ anillo Z −1) est´ obviamente contenido en el cuerpo Q( −1) y ´ste a su vez en el cuerpo El Z( √ a eIR( −1) = {a + b −1 | a, b ∈ IR}. √Definici´n 1.4.3 Llamaremos cuerpo de los n´meros complejos C al cuerpo IR( −1) extensi´n del o u √ ocuerpo de los n´meros reales IR. El elemento −1 se denota tradicionalmente por i, as´ que un ele- u ımento z de C se escribir´ como z = a + ib, a, b ∈ IR. El n´mero a se llama la parte real de a y se denota a upor Re z, asimismo el n´mero b se llama la parte imaginaria de z y se denota por Im z. Las operaciones ude suma y producto en C quedan por tanto escritas como: si z = a + ib, z = a + ib , z + z = (a + a ) + i(b + b ), z · z = (aa − bb ) + i(ab + a b). El elemento neutro para la suma es 0 y el neutro para el producto es 1. Tal y como ya indicamos enlos cuerpos gaussianos, el inverso de un n´mero complejo no nulo z, tiene la expresi´n: u o a b z −1 = −i 2 . a2 +b2 a + b2 Un automorfismo de un cuerpo IK es un isomorfismo ϕ: IK → IK, esto es, ϕ(x + y) = ϕ(x) + ϕ(y),ϕ(xy) = ϕ(x)ϕ(y), ∀x, y ∈ IK. Definimos ϕ:C → C como ϕ(a + ib) = a − ib. Habitualmente se denota ϕ(z) = z , (o tambi´n z ∗ ). z ¯ e ¯se llama complejo conjugado de z. Claramente ϕ es un automorfismo de C. N´tese que ϕ(i) = −i. oEjercicio 1.4.5 C tiene solamente dos automorfismos, el automorfismo identidad y ϕ. Lo mismo ocurre √con los cuerpos de n´meros Gaussianos Q( d). uEjercicio 1.4.6 Un cuerpo primo no posee m´s automorfismos que la identidad. a Llamaremos m´dulo de un n´mero complejo al unico n´mero real positivo |z| tal que |z|2 = z z . o u ´ u ¯
  • 21. 14 TEMA 1. ESTRUCTURAS ALGEBRAICASRepresentaciones de los n´ meros complejos uUn n´ mero complejo z = a + ib se puede representar como el punto (a, b) del plano real IR2 , definimos de uesta manera una aplicaci´n C → IR2, z → (Re z, Im z). El m´dulo √ n´mero complejo z se corresponde o o del ucon la norma del vector de coordenadas (a, b) ya que (a, b) = a2 + b2 = |z|. La suma de n´meros ucomplejos corresponde a la suma de vectores en el plano. El producto por contra tiene una interpretaci´n ogeom´trica menos evidente. e Representaci´n polar de los n´meros complejos. Un punto del plano (a, b) = (0, 0) queda un´ o u ıvocamentedeterminado por su norma y el ´ngulo que forma con un eje arbitrario, por ejemplo con el eje OX. As´ a ır = |z|, y tan θ = b/a; θ se llama argumento de z y se denotar´ θ = arg z, θ ∈ [0, 2π). En otras palabras a Im z r2 = (Re z)2 + (Im z)2 , tan θ = , Re zy la inversa Re z = r cos θ, Im z = r sen θ.N´tese de nuevo que la correspondencia z → (r, θ) no est´ bien definida para todo z (para z = 0 no lo o aest´). a Representaci´n trigonom´trica de los n´meros complejos. Hemos obtenido as´ una nueva repre- o e u ısentaci´n de los n´meros complejos (= 0), o u z = r cos θ + ir sen θ.Si w = s cos φ + is sen φ, tenemos z · w = (rs) cos(θ + φ) + i(rs) sen(θ + φ). Por tanto en la representaci´n opolar, la multiplicaci´n de n´meros complejos corresponde al producto de sus m´dulos y la suma de sus o u oargumentos (m´dulo 2π). o Estas propiedades y expresiones se vuelven m´s transparentes si utilizamos la funci´n exponencial. a oLa definici´n precisa de la funci´n exponencial requiere nociones de an´lisis que no corresponden a este o o acurso. En cualquier caso definimos ez como: z n 1. ez = limn→∞ 1 + n . ∞ n 2. ez = n=0 z . n! z = ex (cos y + i sen y) donde z = x + iy. 3. e Las propiedades mas importantes de la funci´n exponencial son: o 1. ez · ew = ez+w . 2. e0 = 1. 3. ez = ez . ¯Ejercicio 1.4.7 Probar las propiedades 1, 2 y 3 utilizando la definici´n 3 de la funci´n exponencial. o o Consecuencia inmediata de lo anterior son las siguientes f´rmulas: o eiθ = cos θ + i sen θ, z = |z|ei arg z .Por tanto z · w = |z| · |w|ei(arg z+arg w) . En particular z n = rn einθ . N´tese que o e2πi = 1,y en general, e2πin = 1. M´s todav´ eiθ = 1 si y s´lo si cos θ = 1 y sen θ = 0, esto es, si y s´lo si a ıa, o oθ = 2πn, n ∈ ZZ.1.4.5 Ra´ ıces n-´simas de la unidad eTratemos de resolver la ecuaci´n z n = 1 en el cuerpo de los n´meros complejos. Una soluci´n a dicha o u oecuaci´n es ciertamente todo n´mero complejo z0 = 0 tal que z0 = 1. Por tanto si z = reθ tenemos que o u n z0 = rn einθ , n
  • 22. 1.5. POLINOMIOS 15es decir rn = 1 y einθ = 1. Por lo tanto r = 1 y nθ = 2πk, k ∈ Z θ = 2πk/n, k = 0, ±1, ±2, . . .. Z,El argumento θ de z0 tiene que estar en [0, 2π) y as´ los valores de k para los que esto ocurre son ık = 0, 1, 2, . . . , n − 1. Las soluciones de la ecuaci´n z n − 1 = 0 ser´n por tanto: o a z0 = 1, z1 = e2πi/n , z2 = e4πi/n , . . . , zn−1 = e2π(n−1)/n .Dichas ra´ ıces determinan un pol´ ıgono regular de n lados inscrito en el c´ ırculo de radio 1 ya que todasellas tienen m´dulo 1. o ıces del polinomio 1 + x + x2 + · · · + xnEjercicio 1.4.8 Hallar las ra´ Si multiplicamos dos ra´ ıces n-´simas entre s´ obtenemos: e ı zk · zl = e2π(k+l)i/n .Por tanto vemos que si k + l ≥ n, entonces k + l = rn + s, 0 ≤ s < n y zk · zl = e2πis/n y as´ zk · zl = zs con ıs ≡ k + l (mod n). Es por tanto conveniente etiquetar las ra´ ıces n-´simas de la unidad con las clases ede congruencia de n´meros enteros m´dulo n, [0], [1], . . . , [n − 1] obteniendo as´ la hermosa f´rmula: u o ı o z[k] · z[l] = z[k+l] ,que nos dice que la aplicaci´n [k] → z[k] es un isomorfismo entre el grupo (Z n , +) y el grupo de ra´ o Z ıcesn-´simas de la unidad. eEjercicio 1.4.9 Probar que si n | m, el conjunto de ra´ ıces n-´simas de la unidad es un subgrupo del econjunto de ra´ m-´simas de la unidad. ıces eEjercicio 1.4.10 Probar que el conjunto de n´meros complejos de m´dulo 1 es un grupo con respecto u oal producto. ¿Tiene este grupo otros subgrupos aparte de las ra´ ıces n-´simas de la unidad? e1.5 Polinomios1.5.1 El anillo de los polinomiosAl igual que construimos el anillo de los polinomios con coeficientes enteros Z Z[x] en el ejemplo 1.3.3, esposible extender tal construcci´n a un anillo cualquiera A y utilizarlo como anillo de coeficientes de los opolinomios. De ahora en adelante “anillo” significar´ “anillo conmutativo con identidad”. Al igual que a ımbolo abstracto y x2 = xx, x3 = xxx, etc. El conjunto A[x]entonces en el ejemplo 1.3.3, x denotar´ un s´ aest´ formado por las expresiones P (x) = a0 + a1 x + a2 x2 + · · · + an xn , donde ai ∈ A, i = 1, . . . , n. Cada a nelemento de A[x] se llamar´ polinomio en x con coeficientes en A. Dado un polinomio P (x) = k=0 an xn , allamaremos grado del polinomio P al n´mero natural n = max{k | ak = 0} y lo denotaremos ∂P . Un upolinomio constante no nulo tiene grado cero. El t´rmino an xn tal que n = ∂P se llama dominante. Un epolinomio se llama m´nico (o unitario) si el coeficiente del t´rmino dominante es 1. o eProposici´n 1.5.1 Propiedades del grado. Si A es un dominio de integridad se verifica: o i. ∂(P Q) = ∂P + ∂Q. ii. ∂(P + Q) ≤ max(∂P, ∂Q). En A[x] se definen de manera natural dos operaciones +, · como en el ejemplo 1.3.3: si P (x) = i ai xi ,Q(x) = j bj xj , entonces,   P (x) + Q(x) = (ak + bk )xk , P (x)Q(x) =  ai bj  xk . k k i+j=kEl anillo A[x] posee como subanillo al propio anillo A (los elementos de A se identifican con los polinomiosde grado cero).
  • 23. 16 TEMA 1. ESTRUCTURAS ALGEBRAICASEjercicio 1.5.1 Consid´rese el conjunto S de sucesiones infinitas (a0 , a1 , . . . , an , . . .) de elementos de eA tales que todos sus t´rminos excepto un n´ mero finito son 0. En este conjunto introducimos dos e uoperaciones (a0, a1 , . . . , an , . . .) + (b0 , b1 , . . . , bn , . . .) = (a0 + b0 , a1 + b1 , . . . , an + bn , . . .), (a0 , a1 , . . . , an , . . .) · (b0, b1 , . . . , bn , . . .) = (a0 b0 , a0b1 + a1 b0 , . . . , an b0 + an−1 b1 + · · · + a0bn , . . .).(S, +, ·) es un anillo. Probar que la correspondencia (a0 , a1 , . . . , an , . . .) → P (x) = k≥0 ak xk es unisomorfismo de anillos. N´tese que (0, 1, 0, . . .) → x. oEjemplo 1.5.1 De acuerdo con lo anterior, adem´s de Z a Z[x], tenemos los anillos Q[x], IR[x], C[x], as´ ıcomo Z n [x], etc. ZEjercicio 1.5.2 Si A es un dominio de integridad, entonces A[x] es un dominio de integridad.1.5.2 Divisibilidad en el anillo de polinomiosLa noci´n de grado de un polinomio permite extender la teor´ de divisibilidad de n´meros enteros a o ıa ulos anillos de polinomios. Un anillo poseyendo una aplicaci´n δ: A → Z + con las propiedades del grado o Zdescritas en la proposici´n 1.5.1 se llama un dominio Eucl´ o ıdeo. Nos concentraremos en las propiedadesde divisibilidad del anillo de polinomios sobre un cuerpo IK. Sean P, Q ∈ IK[x], diremos que P divide a Q si existe R ∈ IK[x] tal que Q = P R. Las unidades delanillo IK[x], esto es sus elementos invertibles, son los polinomios constantes no nulos. Un polinomio sedir´ irreducible si sus unicos divisores son las unidades de IK[x] y ´l mismo multiplicado por unidades. a ´ eLa noci´n de irreducible es equivalente a la noci´n de n´mero primo. o o uEjercicio 1.5.3 Probar que en el anillo Z 4 [x] hay polinomios invertibles no constantes. Z El anillo IK[x] posee la propiedad de factorizaci´n unica, esto es, todo polinomio P (x) se escribe de o ´manera unica como ´ P (x) = aP1 (x) . . . Pr (x),donde a ∈ IK ∗ , Pi (x), i = 1, . . . , r son polinomios irreducibles. Para establecer este resultado, probaremos en primer lugar la extensi´n al anillo IK[x] del algoritmo ode la divisi´n. oTeorema 1.5.1 Algoritmo de la divisi´n. Para todo par de polinomios P (x), Q(x) ∈ IK[x], Q(x) = 0, oexisten dos polinomios D(x), R(x) tales que P (x) = D(x)Q(x) + R(x),con ∂R(x) < ∂Q(x). Adem´s dichos polinomios son unicos. a ´ Demostraci´n. Existencia. Si Q(x) divide a P (x) el resultado es inmediato. Supongamos que no oes as´ Consideremos el conjunto de los n´meros enteros positivos, ı. u S = {∂(P (x) − D(x)Q(x)) | D(x) ∈ IK[x]}.El conjunto S es no vac´ y por el teorema 1.3.1 existe r = min S. Sea entonces D(x) un polinomio tal que ıo∂(P (x) − D(x)Q(x)) = r. Entonces P (x) = D(x)Q(x) + R(x) y ∂R(x) = r. Necesariamente r < ∂Q(x)ya que si r ≥ ∂Q(x), entonces el t´rmino dominante de R(x) ser´ de la forma axr y el de Q(x), bxm con e a ˆ ˆr ≥ m. Pero el polinomio D(x) = b−1axr−m es tal que R(x) − D(x)Q(x) tiene grado menor que r ya e ıa ˆque su t´rmino de orden r ser´ axr − b−1 abxr−m xm = 0. Por tanto P (x) − D(x)Q(x) − D(x)Q(x) = ˆ ˆP (x) − (D(x) + D(x))Q(x) = R(x) − D(x)Q(x) tiene grado menor que r. ˆ ˆ Unicidad. Supongamos ahora que D(x) y R(x) no son unicos, esto es, existen D(x) y R(x) tales que ´ ˆ ˆ ˆ ˆ ˆP (x) = D(x)Q(x) + R(x), ∂ R(x) < ∂Q(x). Entonces, (D(x) − D(x))Q(x) = R(x) − R(x), pero entonces, ˆ ˆ ˆ ∂(D − D) + ∂Q = ∂(R − R) ≤ max(∂ R, ∂R) < ∂Q. ˆ ˆLo cual es imposible a no ser que D − D = 0. En cuyo caso adem´s R = R. a QED
  • 24. 1.5. POLINOMIOS 17M´ximo com´ n divisor de polinomios a uRepetiremos gran parte de la l´ ınea argumental que desarrollamos al definir el m´ ınimo com´n m´ ltiplo y u um´ximo com´n divisor de n´meros enteros. a u uProposici´n 1.5.2 Para todo ideal I = 0 de IK[x] existe un polinomio P (x) tal que I = {Q(x)P (x) | oQ(x) ∈ IK[x]} = (P ). Demostraci´ n. Sea I = 0 un ideal de IK[x] y S = {r = ∂R(x) ∈ Z | R(x) ∈ I}. Es evidente que o ZS = ∅ y por tanto tomemos el elemento m´ ınimo r0 ≥ 0 de dicho conjunto. Si r0 = 0, entonces hay unpolinomio constante R(x) = a en I, pero a = 0, y por tanto R(x) es invertible y entonces I = IK[x]. Portanto I = (1). Supongamos por tanto que r0 > 0. Sea P0 (x) ∈ I tal que ∂P0 = r0 . Supongamos queexiste Q(x) ∈ I tal que Q = RP0, entonces por el algoritmo de la divisi´n existe D(x) y R(x) tal que oQ = DP0 + R con 0 ≤ ∂R < ∂P0 = r0 . Pero entonces P = Q − DP0 ∈ I y su grado es menor que r0 , loque es absurdo. QED Dados dos polinomios P, Q, consideremos todos los polinomios de la forma M P + N Q, M, N ∈ IK[x],denotemos tal conjunto por J . Claramente J es un ideal y por la proposici´n anterior sabemos que existe oun polinomio D tal que J = (D). Diremos que D es el m´ximo com´n divisor de P y Q y se denotar´ a u apor (P, Q) o m.c.d.(P, Q). Una consecuencia inmediata de la definici´n de m´ximo com´n divisor es la o a usiguiente propiedad.Corolario 1.5.1 Sean P, Q ∈ IK[x] y D = (P, Q), entonces existen dos polinomios M, N ∈ IK[x] talesque D = M P + N Q.Ejercicio 1.5.4 Si D | P y D | Q entonces D | (P, Q). Concluir de aqu´ que si P es irreducible y P no ıdivide a Q entonces (P, Q) = 1. Un ideal de un anillo formado por los m´ltiplos de un elemento dado se llama principal. Un anillo utal que todos sus ideales est´n formados por los m´ltiplos de un elemento se llama anillo de ideales a uprincipales. Si adem´s es un dominio de integridad se llama un dominio de ideales principales. Tanto Z a Zcomo IK[x] son por tanto dominios de ideales principales.Ejercicio 1.5.5 Probar el algoritmo de Euclides para polinomios. Esto es, si P (x), Q(x) ∈ IK[x], pro-cedemos iterativamente y construimos: P (x) = D0 (x)Q(x) + R0 (x); ∂R0 < ∂Q, D0 (x) = D1 (x)R0 (x) + R1 (x); ∂R1 < ∂R0 , D1 (x) = D2 (x)R1 (x) + R2 (x); ∂R2 < ∂R1 , ··· Dn−1 (x) = Dn (x)Rn−1 (x),y Rn = 0. Entonces Rn−1 es el m.c.d.(P, Q). La unicidad de la factorizaci´n de un polinomio en factores irreducibles se sigue del siguiente Lema. oLema 1.5.1 Si P (x) ∈ IK[x] es un polinomio irreducible y P (x) | A(x)B(x) entonces o P (x) | A(x) obien P (x) | B(x). Demostraci´ n. Supongamos que P | AB y P no divide ni a A ni a B. Como P no divide a A oy P es irreducible entonces (P, A) = 1, por tanto existen polinomios M, N tales que P M + AN = 1.Multiplicamos la anterior ecuaci´n por B y obtenemos que o P M B + AN B = B,y como P | AB, entonces P | B lo cual es absurdo. QED
  • 25. 18 TEMA 1. ESTRUCTURAS ALGEBRAICASTeorema 1.5.2 Todo polinomio P (x) ∈ IK[x] con ∂P ≥ 1 posee una descomposici´n ´nica en producto o ude factores irreducibles salvo producto por unidades. Demostraci´n. Prob´moslo por inducci´n sobre el grado del polinomio. Supongamos que ∂P = 1. o e oEntonces P (x) = a + bx y P es irreducible. Supongamos a continuaci´n que la hip´tesis es cierta para o otodo k menor que n y prob´moslo para k = n. Sea por tanto P un polinomio de grado n. Si P no posee edivisores no triviales, es irreducible y ya est´. Si P posee un divisor no trivial D1 tendremos P = P1 D1 ay ∂D1 < n, ∂P1 < n, por tanto por hip´tesis de inducci´n, tanto D1 como P1 factorizan como producto o ode factores irreducibles. Por tanto P factoriza como producto de factores irreducibles. Unicidad. Supongamos que P (x) = P1 (x) · · · Pr (x) = Q1 (x) · · · Qs (x) son dos descomposiciones enfactores irreducibles de P (x). Tomemos un factor Pi de la primera descomposici´n, entonces Pi | Q1 · · · Qs oy por tanto por el Lema 1.5.1 Pi debe dividir a alg´n factor Qj , pero Pi es irreducible y por tanto Pi = Qj uexcepto posiblemente una unidad. Repitiendo el proceso para todos los Pi se completa la demostraci´n. oQED1.5.3 Ra´ ıces de polinomios y completitud algebraicaSea P (x) ∈ IK[x] un polinomio arbitrario P (x) = a0 + a1 x + · · · + an xn , ai ∈ IK. Un elemento α ∈ IK sedir´ que es una ra´ de P (x) si a0 + a1 α + a2 α2 + · · · + an αn = 0, esto es si P (α) = 0. a ızTeorema 1.5.3 α es una ra´ de P (x) si y s´lo si (x − α) | P (x). ız o Demostraci´n. Sea α una ra´ de P (x). Dividamos P (x) por (x − α). Entonces P (x) = Q(x)(x − o ızα) + R(x) y 0 ≤ ∂R(x) < 1 y por tanto R(x) debe ser constante o cero. Por otro lado evaluando laanterior igualdad en α obtenemos que R(α) = 0 y por tanto R(x) = 0. QED Consideremos un cuerpo IK y un subcuerpo IF ⊂ IK. Un elemento α ∈ IK se dir´ algebraico sobre aIF si es ra´ de alg´n polinomio P (x) ∈ IF[x]. Un elemento α se dir´ transcendente sobre IF si no es ız u aalgebraico. Un cuerpo IK se dir´ algebraicamente cerrado si todos los elementos algebraicos sobre IK en auna extensi´n cualquiera de IK est´n en IK. Los cuerpos Q y IR no son algebraicamente cerrados. o aTeorema 1.5.4 Todo polinomio P (x) ∈ C[x] de grado mayor o igual a 1 posee al menos una ra´ ız. Demostraci´n. La demostraci´n de este teorema no es puramente algebraica. o oTeorema 1.5.5 Todo polinomio P (x) ∈ C[x] factoriza como producto de factores de grado 1, esto es: P (x) = a(x − α1 )(x − α2 ) · · · (x − αn ),donde a, αi ∈ C, i = 1, . . . , n = ∂P son las ra´ ıces de P (x). Demostraci´n. Por el teorema de factorizaci´n de polinomios, Teorema 1.5.2, todo polinomio o oP (x) ∈ C[x] factoriza como producto de polinomios irreducibles. Veamos que todo polinomio irreduciblesobre C es de grado 1. Supongamos que P (x) es irreducible y de grado ≥ 1, entonces por el Teorema 1.5.4P (x) posee una ra´ α, pero entonces P (x) = (x − α)Q(x) por el teorema 1.5.3 y P (x) no es irreducible. ızQEDEjercicio 1.5.6 Determinar si es cierta o falsa la siguiente proposici´n. Si IK es algebraicamente cerrado oy P (x) ∈ IK[x] es irreducible, entonces ∂P (x) = 1.Corolario 1.5.2 Teorema fundamental del ´lgebra. C es algebraicamente cerrado. a Demostraci´n. Sea P (x) un polinomio sobre C. Por el teorema anterior, Teorema 1.5.5, factoriza ocomo producto de factores de grado uno. Por lo tanto todos los elementos algebraicos sobre C, esto es,ra´ ıces de polinomios sobre C est´n en C. a QED
  • 26. Tema 2Espacios vectoriales Espacios vectoriales. Subespacios. Sistemas de generadores. Dependencia e indepen- dencia lineal. Bases. Matrices.2.1 DefinicionesVeamos algunos ejemplos para introducir la noci´n de espacio vectorial. oEjemplo 2.1.1 Consideremos el conjunto de los n´meros reales. En ´l hay definidas dos operaciones, la u esuma, respecto de la cual es un grupo, y el producto.Ejemplo 2.1.2 Sea ahora V el conjunto de los pares de n´meros reales, (x, y), donde x, y ∈ IR. Podemos udefinir la suma de dos elementos de este conjunto en la manera usual: (x, y) + (x , y ) = (x + x , y + y )Definimos tambi´n el producto de un n´mero real por un par: e u λ(x, y) = (λx, λy)Ejemplo 2.1.3 Sea V = IKn , donde IK es un cuerpo, es decir, el espacio de n-uplas de escalares en IK.Con las operaciones obvias de suma y producto por escalares (ver ejemplo anterior), este espacio tienepropiedades similares a las que exhiben los ejemplos anteriores.Ejemplo 2.1.4 Sea C[0, 1] el conjunto de las funciones continuas definidas en el intervalo [0, 1] de larecta real con valores en IR. La suma de funciones continuas es una funci´n continua. La funci´n que se o oobtiene al multiplicar una funci´n continua por un n´mero real, es de nuevo una funci´n continua. o u oEjemplo 2.1.5 Sea IR[x] el conjunto de polinomios en la variable x. Como la suma de dos polinomios esotro polinomio, y el producto de un n´mero real por un polinomio es tambi´n un polinomio, estamos en u euna situaci´n similar a la de los ejemplos anteriores. De hecho, IR[x] es, en cierto sentido, un subconjunto ode C(IR).Ejemplo 2.1.6 Sea IRn [x] el conjunto de polinomios en la variable x de grado menor o igual a n ∈ IN.Est´ claro que las mismas propiedades que vimos en los ejemplos anteriores aparecen de nuevo aqu´ a ı.Ejemplo 2.1.7 Sea V el conjunto de funciones continuas en IR tales que f (0) = 1. Es f´cil ver que aestamos en un caso diferente. Ahora la suma de dos funciones en V no est´ en V . Si f, g ∈ V , f(0)+g(0) = a2, luego f + g no est´ en V . a 19
  • 27. 20 TEMA 2. ESPACIOS VECTORIALESEjemplo 2.1.8 Supongamos ahora que el conjunto V es el formado por las funciones f (x) que verificanla siguiente ecuaci´n: o d2 f = f (x) sen x dx2En este caso no tenemos, al menos por ahora, una idea clara de cuales son los elementos de este conjunto.En los ejemplos precedentes pod´ ıamos construir de manera expl´ ıcita elementos del conjunto en cuesti´n. oAqu´ solo sabemos que se trata de funciones que se pueden derivar dos veces (digamos que est´n en el ı aconjunto C 2 (IR)), y que su segunda derivada es el producto de la funci´n seno por la funci´n de partida. o oPues bien, a pesar de esta falta de informaci´n, la suma de dos de estas funciones verifica la ecuaci´n, y o oel producto por un n´mero real de cualquier funci´n de V es tambi´n una funci´n de V . u o e o Los anteriores ejemplos son casos particulares de una situaci´n general que pasamos a definir con oprecisi´n. oDefinici´n 2.1.1 Un espacio vectorial sobre un cuerpo IK (los elementos de IK se llamar´n escalares) es o aun conjunto V (cuyos elementos se llamar´n vectores) dotado de dos operaciones. Una de ellas interna a(suma): +: V × V −→ Vrespecto de la que V es un grupo conmutativo. Y una operaci´n externa, el producto por escalares: o ·: IK × V −→ Vque verifica: 1. (λ + µ)v = λv + µv, 2. λ(u + v) = λu + λv, 3. λ(µv) = (λµ)v, 4. 1v = v, donde u, v ∈ V , λ, µ ∈ IK y 1 es la unidad en IK. Es muy sencillo comprobar que todos los ejemplos anteriores son espacios vectoriales reales (sobre elcuerpo IR), salvo el ejemplo 2.1.7. La mayor parte de sus propiedades se derivan de propiedades similaressobre los n´meros reales. Se tiene: uTeorema 2.1.1 Todo cuerpo es un espacio vectorial sobre s´ mismo. ı Demostraci´n. En efecto, las dos operaciones son las que tiene el cuerpo y el producto por escalares ose confunde con la propia operaci´n interna de multiplicaci´n del cuerpo. o o QED Nota. El mismo concepto se puede definir sobre un anillo. Se dice en este caso que se tiene un m´dulo. Debido a que el anillo no es conmutativo en general, es preciso especificar si la o multiplicaci´n externa es por la derecha o por la izquierda. Debido a que, en general, no o tendremos un elemento inverso respecto a la multiplicaci´n, las propiedades de los m´dulos o o son distintas de las de los espacios vectoriales. En este curso no insistiremos en la idea de m´dulo. oEjemplo 2.1.9 Consideremos la ecuaci´n que describe a un oscilador arm´nico (por ejemplo un muelle o oque verifica la ley de Hooke, con constante de recuperaci´n k). El movimiento de la masa m sujeta al omuelle viene descrito por una funci´n x(t) que da la posici´n en funci´n del tiempo. De las leyes de la o o odin´mica newtoniana se deduce inmediatamente que x(t) verifica lo que se llama una ecuaci´n diferencial a olineal de segundo orden: d2 x + ω2 x = 0 dt2con ω 2 = k/m. Las soluciones de esta ecuaci´n forman un espacio vectorial, por un razonamiento osemejante al que hicimos en el ejemplo 2.1.8. Desde un punto de vista del movimiento, lo que estamosdiciendo es que la superposici´n (lineal) de dos movimientos del oscilador arm´nico es otro movimiento o ode este tipo. Todos los movimientos del oscilador arm´nico se obtienen por superposici´n de dos b´sicos, o o alos dados por las funciones sen ωt y cos ωt.
  • 28. 2.2. SUBESPACIOS 21 Los modelos lineales como el anterior son fundamentales en F´ ısica. No todo fen´meno que ocurre en ola Naturaleza es lineal, y de hecho, los no lineales constituyen una clase muy importante. Pero incluso enestos casos, las aproximaciones lineales proporcionan muchas veces informaci´n valiosa sobre el fen´meno o oen cuesti´n. o Consecuencia de las operaciones definidas en un espacio vectorial es la siguiente, una herramientafundamental en el estudio de los espacios vectoriales.Definici´n 2.1.2 Sean x1, . . . , xn elementos de un espacio vectorial y λ1 , . . . , λn escalares del cuerpo IK. oSe llama combinaci´n lineal de los vectores x1, . . . , xn con coeficientes λ1 , . . . , λn al vector: o n λi xi = λ1 x1 + . . . + λn xn i=1Obviamente, toda combinaci´n lineal est´ contenida en el espacio. T´ngase en cuenta que una com- o a ebinaci´n lineal es una suma finita con coeficientes en el cuerpo. Posibilidades de sumas con infinitos osumandos, o de otras con un n´mero finito de coeficientes no nulos, aunque en cantidad variable, llevan a uconceptos m´s avanzados de ´lgebra en los que no entraremos (sumas y productos directos con un n´ mero a a uarbitrario de factores).Ejemplo 2.1.10 Supongamos en IR3 los vectores v1 = (1, 0, 0), v2 = (0, 1, 0) y v3 = (0, 0, 1). Unacombinaci´n lineal de estos tres vectores con coeficientes λ1 , λ2 , λ3 ∈ IR es: o λ1 (1, 0, 0) + λ2 (0, 1, 0) + λ3 (0, 0, 1) = (λ1 , λ2, λ3 )de donde resulta que cualquier vector de IR3 se puede poner como combinaci´n lineal de estos tres vectores, ohecho que determinar´ buena parte de las propiedades de este espacio vectorial. aEjemplo 2.1.11 Si en el espacio de los polinomios en una variable con coeficientes reales, seleccionamoscualquier familia finita del tipo 1, x, x2, . . . , xn , las combinaciones lineales de estos elementos no cubrentodo el espacio, por muy grande que hagamos n.2.2 SubespaciosHemos visto en el ejemplo 2.1.5, como los polinomios formaban un espacio vectorial real, y como lasfunciones continuas (en todo IR) son tambi´n un espacio vectorial. Puesto que los polinomios se pueden einterpretar como funciones continuas, tenemos un espacio vectorial contenido en otro. La situaci´n se opresenta con mucha frecuencia y se encuentra descrita en la siguiente definici´n: oDefinici´n 2.2.1 Sea V un espacio vectorial sobre un cuerpo IK y sea W un subconjunto de V no vac´ o ıo.Se dice que W es un subespacio vectorial de V si: i. u − v ∈ W , ∀u, v ∈ W , ii λu ∈ W , ∀λ ∈ IK.Proposici´n 2.2.1 Si W es un subespacio vectorial de V entonces el conjunto W con las operaciones o+ y ·, inducidas de la suma y el producto por escalares de V , es un espacio vectorial.Ejercicio 2.2.1 Probar la proposici´n anterior 2.2.1 oEjemplo 2.2.1 Consideremos ahora el conjunto de los n´meros complejos. Al ser C un cuerpo, es un uespacio vectorial sobre s´ mismo. El conjunto de los n´meros reales es un subconjunto de C. La pregunta ı ues obvia. ¿Es IR un subespacio vectorial de C? La respuesta no lo es tanto. En efecto, como sabemos, IRes un espacio vectorial sobre IR. Pero aqu´ estamos hablando de IR como un subconjunto de C, es decir, ıcomo los n´meros complejos que tienen parte imaginaria igual a cero. La suma de dos de estos n´ meros u ues otro n´mero del mismo tipo. Pero el producto de un n´mero complejo arbitrario (un escalar de C) u upor un n´mero complejo de parte imaginaria cero (es decir, un n´mero real) no es en general un n´ mero u u ureal. Por tanto IR no es un subespacio vectorial del espacio vectorial complejo C.
  • 29. 22 TEMA 2. ESPACIOS VECTORIALESEjemplo 2.2.2 El conjunto de los n´meros complejos es un espacio vectorial real. No es dif´ probar u ıcilque se cumplen todas las propiedades del caso. Los reales siguen siendo un subconjunto de C que ahoraes un subespacio vectorial (por supuesto real).Ejemplo 2.2.3 Consideremos el espacio tridimensional IR3 . Se trata de un espacio vectorial sobre IRcuyos elementos son las ternas de n´meros reales: u (x1, x2 , x3 ), xi ∈ IR, i = 1, 2, 3El siguiente subconjunto es un subespacio vectorial de IR3 : W = {(x1 , x2 , 0) | x1 , x2 ∈ IR}Pero el subconjunto de IR3 : A = {(x1 , x2 , 1) | x1 , x2 ∈ IR}no lo es. Tampoco es un subespacio el conjunto: S 2 = {(x1 , x2 , x3 ) | x2 + x2 + x2 = 1, xi ∈ IR, i = 1, 2, 3} 1 2 3Se trata de la esfera unidad en IR3 . Los conjuntos como ´ste se llaman variedades, y, aunque no presenten ecaracter´ısticas lineales, su estudio local implica la consideraci´n de espacios vectoriales (en este caso de oplanos). En todo espacio vectorial hay siempre dos subespacios, el espacio total y el vector cero (el elementoneutro del conjunto considerado como grupo abeliano). Pero puede no haber m´s. aEjemplo 2.2.4 Los dos unicos subespacios del espacio vectorial real IR son {0} y IR. La demostraci´n ´ oes la siguiente. Sea W un subespacio vectorial de IR. Entonces, si 0 = x ∈ W , yx ∈ W para todo n´mero ureal y. Como x tiene inverso, se tiene: F = {xy | y ∈ IR} = IRComo F ⊂ W , se tiene: W = IR. Si en W solo tenemos el elemento 0, entonces: W = {0}.Ejemplo 2.2.5 El conjunto de polinomios de grado menor o igual que n ∈ IN es un subespacio propio(es decir distinto del {0} y el total) del espacio vectorial de todos los polinomios. Los subespacios vienen determinados de varias maneras. Hemos visto alguna de ellas, concretamente,en espacios del tipo IKn , en el que una o varias de las componentes de los vectores son iguales a cero.Pero se puede hacer de otras formas.Ejemplo 2.2.6 En Cn se considera el conjunto de vectores tales que: n {(x1 , . . . , xn ) | xi = 0} i=1Se trata de un subespacio propio de Cn . Tambi´n el subconjunto: e n {(x1 , . . . , xn ) | xi = 0, x1 + xn = 0} i=1es otro subespacio, contenido en el anterior. Esta forma de dar subespacios se suele llamar impl´ ıcita. Pero se podr´ definir de una forma expl´ ıan ıcita,es decir, dando las componentes de los vectores. Por ejemplo: {(x1 , . . . , xn ) | x1 = λ1 , x2 = λ1 + λ2 , xn = 0, λ1 , λ2 ∈ C} Como iremos viendo, las posibilidades son muchas.
  • 30. 2.3. OPERACIONES CON SUBESPACIOS 232.3 Operaciones con subespaciosLa familia de subespacios de un espacio vectorial admite una serie de operaciones que pasamos a detallar.Teorema 2.3.1 La intersecci´n de subespacios de un espacio vectorial es un subespacio vectorial. o Demostraci´ n. Sean W1 y W2 dos subespacios de V . Si x, y son dos elementos de la intersecci´n, o oW1 ∩ W2 , ambos est´n en cada subespacio, luego la suma pertenece a ambos y por tanto a la intersecci´n. a oEl mismo argumento se aplica al producto por escalares. N´tese que la intersecci´n de subespacios o ovectoriales nunca es vac´ pues al menos el vector 0 est´ en todos ellos. ıa, a QEDEjemplo 2.3.1 Consideremos el espacio vectorial real de las funciones continuas definidas en IR convalores en IR, C(IR). El conjunto de polinomios con grado menor o igual a n (n un n´mero natural ufijado) es un subespacio vectorial como ya hemos dicho. El conjunto de las funciones continuas que seanulan en x = 0 es un subespacio vectorial de C(IR). La intersecci´n de ambos, es decir, el conjunto de opolinomios de grado menor o igual que n que se anulan en x = 0, es un subespacio vectorial de C(IR). Sin embargo, la uni´n de subespacios vectoriales no es en general un subespacio vectorial. Pero opodemos construir un subespacio de la siguiente forma.Definici´n 2.3.1 Sea S un subconjunto de un espacio vectorial V . Se llama espacio vectorial generado opor S al menor de los subespacios de V que contienen a S. Est´ claro que dicho subespacio ser´ la intersecci´n de todos los subespacios que contienen a S. La a a ointersecci´n no puede ser vac´ pues S est´ en todos ellos, y al menos hay un subespacio que contiene a o ıa, aS que es el espacio total. Pero no es sencillo, en principio, calcular expl´ ıcitamente este subespacio.Ejemplo 2.3.2 Sea el subconjunto del conjunto de polinomios en la variable x: S = {x}, que obviamenteno es un espacio vectorial. Pero est´ claro que W = {λx | λ ∈ IR} s´ es un subespacio vectorial y contiene a ıa S.Definici´n 2.3.2 Sea S un subconjunto de un espacio vectorial. La envolvente lineal de S, lin(S), es el oconjunto de combinaciones lineales que se pueden formar con los elementos de S.Se tiene:Teorema 2.3.2 La envolvente lineal de un subconjunto de un espacio vectorial V es un espacio vectorial(subespacio del espacio vectorial V ).La demostraci´n es evidente. oTeorema 2.3.3 El subespacio generado por un subconjunto de un espacio vectorial es la envolvente lineallin(S), de este subconjunto. Demostraci´ n. Claramente S est´ contenido en lin(S). Sea W un subespacio que contiene a S. o aEntonces, debe contener tambi´n a la envolvente lineal, pues es un subespacio. Por lo tanto lin(S) ⊂ W epara todo W subespacio que contiene a S. De donde lin(S) ⊂ ∩W donde la intersecci´n se refiere a todos olos subespacios que contiene a W . De aqu´ se concluye que el espacio generado por S es la envolvente ılineal de S. QEDEjemplo 2.3.3 El conjunto de matrices 2 × 2 con elementos complejos, es un espacio vectorial complejo.El subespacio generado por los elementos: 1 0 0 1 A= , B= 0 −1 1 0
  • 31. 24 TEMA 2. ESPACIOS VECTORIALESes la envolvente lineal de estos elementos: α β , α, β ∈ C β −αN´tese que es un subespacio propio del espacio de matrices del que hablamos. Sin embargo, existen casos oen los que la envolvente lineal de una familia es el espacio total.Definici´n 2.3.3 Se dice que el subconjunto S del espacio vectorial V es un sistema de generadores de oV si la envolvente lineal de los elementos de S (es decir, el espacio generado por S) es el espacio total V .Ejemplo 2.3.4 En el espacio vectorial de polinomios, la familia S = {1, x, x2 , x3 , . . .} es un sistema degeneradores.Ejemplo 2.3.5 En el espacio de matrices 2 × 2 con coeficientes complejos, la familia: 1 0 1 0 0 −1 0 1 i i S= , , , , 0 1 0 −1 1 0 1 0 i −ies un sistema de generadores. Est´ claro que todo subconjunto es un sistema de generadores de su envolvente lineal. a Con estas nociones definiremos la suma de subespacios. Como hemos dicho, la uni´n de subespacios ono es necesariamente un subespacio.Ejemplo 2.3.6 Consideremos en IR2, los subespacios: W1 = {(a, 0) | a ∈ IR} y W2 = {(0, a) | a ∈ IR}.La uni´n es el conjunto: o W1 ∪ W2 = {(a, 0), (0, b) | a, b ∈ IR}Pero esto no es un espacio vectorial. Pues si sumamos (1, 0) y (0, 1) que est´n en la uni´n, obtenemos a o(1, 1) que no pertenece a la uni´n. oDefinici´n 2.3.4 Se define la suma de dos subespacios W1 y W2 de un espacio vectorial como la envol- ovente lineal de la uni´n de ambos subespacios: o W1 + W2 = lin(W1 ∪ W2 ) La definici´n anterior no es muy util en muchos casos. Sin embargo, se tiene lo siguiente: o ´Teorema 2.3.4 La suma de dos subespacios de un espacio vectorial es: W1 + W2 = {x1 + x2 | x1 ∈ W1 , x2 ∈ W2 } Demostraci´n. Puesto que x1 ∈ W1 y x2 ∈ W2 , ambos est´n en la uni´n y por lo tanto su suma o a oest´ en la envolvente lineal. De aqu´ se tiene la mitad de la igualdad: a ı {x1 + x2 | x1 ∈ W1 , x2 ∈ W2 } ⊂ W1 + W2Adem´s, cualquier vector de la envolvente es una combinaci´n lineal de elementos de la uni´n. Por tanto, a o opodemos separar los vectores que forman la combinaci´n lineal y que pertenecen a W1 por un lado y olos que pertenecen a W2 por otro. Como ambos W1 y W2 son subespacios vectoriales, llegamos a quecualquier elemento de la envolvente se puede poner como suma de un elemento de W1 m´s otro de W2 . aQED En general, los elementos de la suma se pueden poner de varias formas como suma de un vector deW1 y otro de W2 . Dicho de otra manera, la descomposici´n no es unica. Pero a veces s´ lo es. o ´ ıDefinici´n 2.3.5 Se dice que la suma de dos subespacios vectoriales de un espacio vectorial es directa osi cada elemento de la suma admite una unica descomposici´n como suma de un elemento del primer ´ osubespacio m´s un elemento del segundo. Se escribe entonces: W1 ⊕ W2 a
  • 32. 2.3. OPERACIONES CON SUBESPACIOS 25 La caracterizaci´n de sumas directas se puede hacer tambi´n de la forma siguiente: o eTeorema 2.3.5 Sean W1 y W2 dos subespacios del espacio vectorial V . Entonces, la suma de W1 y W2es directa si y solo si W1 ∩ W2 = {0}Demostraci´n. La parte “si” se deduce f´cilmente. Si la intersecci´n es el vector 0, y tenemos dos o a odescomposiciones para un vector v de la suma, v = x1 + x2 = y1 + y2 , entonces: x1 − y1 = y2 − x2 . Peroel primer vector est´ en W1 y el segundo en W2 , luego ambos (que son iguales) est´n en la intersecci´n, a a oluego son cero. De aqu´ se deduce que x1 = y1 y x2 = y2 , luego la descomposici´n es unica y la suma ı o ´es directa. El “solo si” se demuestra por: si v est´ en la intersecci´n, est´ en ambos subespacios. Pero a o aeso quiere decir que v = v + 0 es una descomposici´n v´lida y que v = 0 + v tambi´n lo es. Como la o a edescomposici´n es unica al ser la suma directa, se concluye que v = 0. o ´ QEDEjemplo 2.3.7 Los subespacios W1 = {(a, 0) | a ∈ IR} y W2 = {(0, a) | a ∈ IR} tienen como suma elespacio total IR2 y adem´s la suma es directa. a Los conceptos de suma y suma directa se pueden extender a m´s de dos subespacios, imponiendo la aunicidad de la descomposici´n de cualquier vector de la suma en suma de elementos de cada subespacio. oLas condiciones para la suma directa de m´s de dos subespacios son m´s complicadas de lo que uno a apodr´ suponer: ıaTeorema 2.3.6 La suma de los subespacios Wi , i = 1, 2, 3 del espacio vectorial V es directa si y solo sise cumplen las relaciones W1 ∩ (W2 + W3 ) = {0}, W2 ∩ (W3 + W1 ) = {0}, W3 ∩ (W1 + W2 ) = {0} Demostraci´ n. Supongamos que la suma es directa. Sea x un vector en la intersecci´n W1 ∩ (W2 + o oW3 ). Entonces, x ∈ W1 y x = x2 + x3 , por estar en la suma W2 + W3 . Pero como la descomposici´n esounica: x = x + 0 + 0 y x = 0 + x2 + x3 deben ser la misma, luego x = 0. De forma similar demostrar´´ ıamoslas otras intersecciones. Ahora suponemos que las tres intersecciones mencionadas en el teorema soniguales al vector 0. Sean x = x1 + x2 + x3 = y1 + y2 + y3 dos descomposiciones de un vector x. De manerasimilar a como hicimos la demostraci´n en el caso de dos subespacios, ponemos: o x1 − y1 = y2 − x2 + y3 − x3Pero el vector de la izquierda est´ en W1 y el de la derecha en W2 + W3 , luego est´n en la intersecci´n. a a oComo la intersecci´n es el vector 0 concluimos que x1 = x2 y tambi´n: x2 + x3 = y2 + y3 . Podemos o erepetir el razonamiento con otra pareja: x2 − y2 = y1 − x1 + y3 − x3con lo que al estar ambos en W2 y W1 + W3 , son iguales a 0 y por tanto, x2 = y2 . De la misma forma sedemuestra que x3 = y3 , y la descomposici´n es unica. o ´ QED Si la suma directa de varios subespacios es el espacio total, se dice que este ultimo se descompone ´en suma directa de los subespacios. Cada vector del espacio admite una descomposici´n en suma de ovectores, perteneciente cada uno de ellos a un subespacio. Asimismo, el concepto de suma directa se puede extender a espacios vectoriales, no necesariamentesubespacios de un mismo espacio vectorial.Definici´n 2.3.6 Dados dos espacios vectoriales V1 y V2 definidos sobre un cuerpo IK, se define la suma odirecta de estos dos espacios como el conjunto de expresiones de la forma v1 + v2 (el signo suma tieneun sentido formal aqu´ n´tese que los vectores son de espacios distintos). ı, o
  • 33. 26 TEMA 2. ESPACIOS VECTORIALESLa suma y el producto por escalares se definen de forma natural: (v1 + v2 ) + (w1 + w2 ) = (v1 + w1) + (v2 + w2) λ(v1 + v2 ) = λv1 + λv2 N´tese que se puede introducir tambi´n como el conjunto de pares, es decir, como los elementos del o eproducto cartesiano de V1 y V2. Tambi´n se puede extender a un n´mero arbitrario de factores (finito, e uel caso infinito requiere un an´lisis m´s cuidadoso). a a La ultima operaci´n con espacios vectoriales que vamos a considerar es el espacio cociente. La idea es ´ oclasificar los vectores de un espacio vectorial en clases siguiendo un criterio establecido por un subespaciovectorial elegido. La construcci´n en el caso de espacios vectoriales solo a˜ade la forma de hacer la o nclasificaci´n. Las relaciones de equivalencia, pues de eso se trata aqu´ aparecen en conjuntos arbitrarios o ı,como ya se habr´ estudiado en otros lugares. aDefinici´n 2.3.7 Sea V un espacio vectorial y W un subespacio de V . Dados dos vectores x, y ∈ V , se odice que est´n en la misma clase (respecto de W ), si: a x−y ∈ W Se trata de una relaci´n de equivalencia, como se puede demostrar f´cilmente. Cada clase se escribir´ o a acomo: [x] = x + W = {x + y | y ∈ W }y se dice que x (que es un elemento cualquiera de la clase) es el representante de esa clase. El conjuntode clases se designa por V /W y tiene una estructura de espacio vectorial, definida de la forma siguiente: V /W × V/W −→ V /W (x + W, y + W ) → (x + y) + W IK × V /W −→ V /W (λ, x + W ) → (λx) + WEn las cuestiones relativas a clases de equivalencia es necesario prestar atenci´n al representante elegido. oEs decir, si: x + W = x + W e y + W = y + W , las clases x + y + W y x + y + W deber´ coincidirıan(es decir, x + y y x + y deber´ estar en la misma clase). Lo que es muy sencillo de comprobar. De la ıanmisma forma para el producto por escalares. La idea de espacio vectorial cociente es sin duda ligeramente m´s complicada que las anteriores. aVeremos unos ejemplos para tratar de aclarar su construcci´n y utilidad. oEjemplo 2.3.8 Consideremos el espacio vectorial real V = IR3 y el subespacio W = {(0, 0, z) | z ∈ IR}.Gr´ficamente podemos pensar en V como el conjunto de vectores en el espacio con origen en el origen de acoordenadas, y en W como el eje z. Los elementos del espacio cociente V /W son las clases: (x, y, z) + Wpero podemos elegir un representante sencillo para cada clase: (x, y, z) y (x , y , z ) est´n en la misma aclase si su diferencia est´ en W , es decir, si x = x e y = y . La tercera coordenada es arbitraria, es decir, aen una clase toma todos los valores. El m´s sencillo es obviamente el valor 0, y por lo tanto: a V /W = {[(x, y, 0)] | x, y ∈ IR}Si identificamos vectores (con origen en el origen de coordenadas) con los puntos donde est´ su extremo, aeste espacio es el plano xy. Con m´s precisi´n, cada punto del plano xy est´ en una clase diferente (y en a o acada clase hay un punto del plano xy). Si en un problema dado la coordenada z no aparece, este espaciocociente, o el plano al que es isomorfo (en un sentido que precisaremos m´s adelante) resulta m´s sencillo a ade utilizar.
  • 34. 2.4. SISTEMAS DE GENERADORES, RANGO Y BASES 27Ejemplo 2.3.9 Supongamos ahora que V es el espacio de polinomios en una variable x. Y que W esel subespacio de constantes: W = {λ | λ ∈ IR}. En este caso, dos polinomios son equivalentes (est´n aen la misma clase) si su diferencia es una constante. El representante m´s sencillo de cada clase es el aque tiene el t´rmino de grado cero igual a cero. Como ejemplo de aplicaci´n, la derivada es constante e oen cada clase, es decir, las derivadas de dos polinomios que est´n en la misma clase son iguales. Y si edos polinomios est´n en diferentes clases, sus derivadas son distintas. Considerada la derivada como una aaplicaci´n del espacio de polinomios en s´ mismo, es inmediato ver que no es inyectiva. Pero si se toma o ıcomo espacio inicial este espacio cociente, la derivada (definida como la derivada de cualquier elementode la clase) es inyectiva. Aplicaciones de este resultado aparecer´n m´s tarde. Aqu´ solo diremos que la a a ıderivada se anula en W (y que si la derivada de un polinomio es cero, ese polinomio est´ en W ). a2.4 Sistemas de generadores, rango y basesYa hemos indicado anteriormente lo que es un sistema de generadores de un espacio vectorial. Con unsistema de este tipo podemos construir todos los elementos del espacio vectorial mediante combinacioneslineales. Sin embargo, es posible que un vector pueda expresarse como varias combinaciones linealesdiferentes.Ejemplo 2.4.1 Sea V = IR2 , y el sistema de generadores: S = {(1, 0), (0, 1), (1, 1)}Aunque a´n no hemos visto un m´todo para saber si un sistema de vectores es sistema de generadores u ede un espacio vectorial, admitamos que ´ste lo es. Por otra parte no es muy dif´ comprobarlo usando e ıcildirectamente la definici´n. Un vector como por ejemplo el (1, −1) se puede expresar de muchas formas omediante una combinaci´n lineal de estos vectores. Por ejemplo: o (1, −1) = (1, 0) − (0, 1), (1, −1) = (1, 1) − 2(0, 1) Esto es debido a que este sistema de generadores no es linealmente independiente, concepto queintroducimos a continuaci´n: oDefinici´n 2.4.1 Sea V un espacio vectorial. Se dice que una familia de vectores es linealmente inde- opendiente (l.i.), si toda combinaci´n lineal de vectores de la familia igualada a cero, tiene necesariamente otodos los coeficientes iguales a cero.Ejemplo 2.4.2 Es muy sencillo demostrar que la familia del ejemplo anterior no es linealmente inde-pendiente. Por ejemplo la siguiente combinaci´n lineal es igual a 0 y sin embargo los coeficientes no son oiguales a cero: (1, 0) − (0, 1) − (1, −1) = 0 Cuando una familia de vectores no es linealmente independiente, se dice que es linealmente dependiente(l.d.). Es decir, una familia de vectores de un espacio lineal es linealmente dependiente cuando esposible encontrar una combinaci´n lineal de vectores de esa familia igual a cero, y en la que no todos los ocoeficientes son nulos.Ejemplo 2.4.3 En todo espacio vectorial, toda familia de vectores que contenga al vector 0 es l.d. Enefecto, la combinaci´n lineal trivial: λ.0 es cero para cualquier λ. o Una consecuencia interesante de la d.l. es la siguiente:Teorema 2.4.1 Si los vectores {x1 , . . . , xn }, n > 1 del espacio vectorial V son l.d., alguno de estosvectores se puede poner como combinaci´n lineal de los dem´s. o a
  • 35. 28 TEMA 2. ESPACIOS VECTORIALES Demostraci´n. . Si este conjunto de vectores es l.d., existe una combinaci´n lineal: o o n λ i xi = 0 i=1en la que alg´n λi es distinto de cero. Sea por ejemplo λk = 0, para alg´n k entre 1 y n. Entonces: u u n n 1 λk xk + λi xi = 0 ⇒ xk = − λ i xi λk i=1,i=k i=1,i=kdebido a que existe el inverso de λk . QED Este teorema nos conduce a la siguiente definici´n: oDefinici´n 2.4.2 Se dice que el vector x ∈ V depende linealmente de S (subconjunto de V ), si x puede oexpresarse como una combinaci´n lineal de vectores de S. o Debido al teorema anterior, la envolvente lineal de una familia de vectores puede considerarse generadapor menos vectores de los que en un principio podr´ suponerse. ıaTeorema 2.4.2 Sea S una familia de vectores del espacio vectorial V , y supongamos que S es l.d. Seax un vector de S que depende linealmente de los dem´s vectores de S. Entonces la envolvente lineal de S aes igual a la envolvente lineal de S {x}. La demostraci´n es una consecuencia del teorema sobre dependencia lineal y del hecho de que cada vez oque x aparezca en una combinaci´n lineal de un vector de lin(S), podemos sustituirlo por la combinaci´n o olineal de otros vectores de S seg´n hemos visto en el teorema anterior. u El teorema lleva inmediatamente a la siguiente conclusi´n: oTeorema 2.4.3 Si S es un sistema de generadores de un espacio vectorial V , y el vector x dependelinealmente de los otros vectores de S, entonces, S {x} es tambi´n un sistema de generadores de V . eLa demostraci´n es evidente. oDefinici´n 2.4.3 El rango de una familia de vectores es el n´mero m´ximo de vectores linealmente o u aindependientes que se pueden encontrar en la familia.Veremos m´s adelante como estudiar el rango y como ampliar este concepto a matrices. a Estamos en condiciones de definir lo que es una base de un espacio vectorial. Esto nos permitir´ arelacionar los espacios vectoriales con unos espacios tipo y simplificar´ los c´lculos en muchas ocasiones a aal poder hablar de coordenadas sin necesidad de usar los objetos abstractos del espacio.Definici´n 2.4.4 Se dice que la familia de vectores del espacio vectorial V , B, es una base, si es un osistema de generadores de V y es l.i.Ejemplo 2.4.4 La familia estudiada en un ejemplo anterior {(1, 0), (0, 1), (1, −1)} no es un base de IR2pues no es l.i. Sin embargo, la familia {(1, 0), (0, 1)} s´ es una base. N´tese que se obtiene de la primera ı oeliminando un vector que se pod´ poner como combinaci´n lineal de los otros dos, lo que hace que siga ıa osiendo un sistema de generadores de acuerdo con el teorema demostrado antes. Adem´s es linealmente aindependiente, como se comprueba sin m´s que aplicar la definici´n: a o λ1 (1, 0) + λ2 (0, 1) = (0, 0) ⇒ (λ1 , λ2 ) = (0, 0) ⇒ λ1 = λ2 = 0
  • 36. 2.4. SISTEMAS DE GENERADORES, RANGO Y BASES 29Ejemplo 2.4.5 Consideremos el conjunto de polinomios en una variable x con coeficientes reales. Comoya hemos visto es un espacio vectorial sobre IR. El conjunto: S = {1, x, x2 , . . .}es una base de este espacio. Cualquier polinomio es una combinaci´n lineal de elementos de este conjunto. oAdem´s, el conjunto S es l.i. Cualquier combinaci´n igualada a cero obliga a que todos los coeficientes a osean 0: λ1 xn1 + λ2 xn2 + · · · + λk xnk = 0con todos los naturales ni , i = 1, . . . k distintos entre s´ implica λi = 0, i = 1, . . . k. N´tese que ı, olas combinaciones lineales son sumas de productos de escalares por vectores con un n´mero finito de usumandos. En los dos ejemplos anteriores la situaci´n es muy diferente. En el primero, dos vectores formaban una obase. En el segundo, la base est´ formada por un n´mero infinito de vectores, pero al menos es numerable. a uSi consideramos el espacio de funciones continuas en IR, la existencia de una base, con un n´mero finito uo infinito (numerable o no) de vectores, no resulta f´cil de establecer. En este curso nos limitaremos a abases con un n´mero finito de elementos, aunque en lo referente a otros aspectos, aparecer´n ejemplos de u aespacios que no tienen este tipo de bases. Usando conceptos de teor´ de conjuntos (axioma de elecci´n) ıa oes posible probar que todo espacio vectorial posee una base. Un espacio vectorial tiene en principio muchas bases. Dada una de ellas es posible hacer combinacioneslineales de sus elementos, y si los vectores que resultan son linealmente independientes, forman otra basedistinta de la anterior. Estudiaremos esta situaci´n con m´s detalle m´s adelante. o a a Por ahora, nos limitamos a demostrar el siguiente resultado:Teorema 2.4.4 Sea V un espacio vectorial. Todas las bases de V tienen el mismo cardinal. Este teorema es fundamental. Permite relacionar las bases de un espacio vectorial, y asignar a esteespacio un n´mero natural cuando el cardinal anterior es finito. Desde el punto de vista de las propiedades ualgebraicas del espacio, este n´mero proporciona toda la informaci´n que necesitamos. u oDefinici´n 2.4.5 Se llama dimensi´n de un espacio vectorial V sobre un cuerpo IK al cardinal com´n o o ude las bases de V . Los espacios IKn , de los que hemos visto varios ejemplos, nos dan los prototipos de los espacio vecto-riales de dimensi´n finita sobre el cuerpo IK. Cuando la dimensi´n es infinita hay que prestar atenci´n o o oa otras cuestiones, pero no entraremos en esos detalles aqu´ La demostraci´n la haremos en un espacio ı. ovectorial que admita una base con un n´mero finito de elementos. u Demostraci´ n. Supongamos que el espacio vectorial V tiene una base: B = {v1 , . . . , vn }, con n oelementos. Probaremos que cualquier conjunto de vectores l.i. tiene como m´ximo n elementos. Sea a nS = {u1 , . . . , um } un conjunto de vectores l.i. Entonces: u1 = i=1 λi vi , y alguno de los coeficientesno es cero. Si es, por ejemplo, λ1 = 0, podemos sustituir v1 por u1 y obtener otra base, ya que ser´ un asistema de generadores (al poder despejar v1 en funci´n de u1 y v2 , . . . , vn ) y adem´s es l.i. Si o a n µ1 u 1 + µi vi = 0 i=2entonces, µ1 = 0 implica que los dem´s son cero, ya que son l.i. Si µ1 = 0, u1 ser´ combinaci´n lineal del a ıa oresto, lo que es contradictorio con λ1 = 0. Siguiendo este proceso (cambiando el orden si es necesario)construir´ıamos una base de V : {u1 , . . . , uk , vk+1 , . . . , vn }. En esta base, mediante el mismo razonamiento,podr´ıamos sustituir uno de los vj , digamos, vk+1 , por uk+1 si el coeficiente de vk+1 en el desarrollo deuk+1 en esta base es no nulo (alguno de los coeficientes de los vectores vj es no nulo por razones deindependencia lineal de los vectores ui ). Si seguimos sustituyendo est´ claro que en cada paso tendremos auna base de V , y el n´mero de vectores de S no puede ser mayor que n. u QED Tambi´n podemos enunciar el siguiente resultado: e
  • 37. 30 TEMA 2. ESPACIOS VECTORIALESTeorema 2.4.5 En un espacio vectorial de dimensi´n finita n no hay conjuntos de vectores l.i. con m´s o ade n vectores. Si un conjunto de vectores l.i. en V tiene n elementos linealmente independientes, es unabase.La demostraci´n es inmediata de lo anterior. oTeorema 2.4.6 El rango de un sistema de vectores de un espacio vectorial es la dimensi´n de la envol- ovente lineal de ese sistema Demostraci´n. El rango es el n´mero m´ximo de vectores l.i. La dimensi´n es el cardinal de una o u a obase. Del sistema de vectores podemos retirar los que dependen linealmente de los dem´s hasta quedarnos acon un conjunto l.i., que sigue generando la envolvente. Luego la dimensi´n es igual al rango. o QEDEjemplo 2.4.6 En el espacio complejo C, el vector 1 es una base. La dimensi´n es 1. Cualquier otro on´mero complejo diferente de cero es una base. Siempre se tiene este resultado, la dimensi´n de un cuerpo u oconsiderado como un espacio vectorial sobre s´ mismo es 1. ıEjemplo 2.4.7 Si se considera a C como un espacio vectorial sobre IR, una base es por ejemplo, {1, i}.Pero {1, −1} no lo es. La dimensi´n de C sobre los reales es 2. oEjemplo 2.4.8 La dimensi´n del espacio IKn (producto cartesiano de IK por s´ mismo n veces) sobre IK o ıes justamente n. Podemos elegir la llamada base can´nica: o {(1, 0, . . . , 0), (0, 1, 0, . . . , 0), . . . , (0, . . . , 0, 1)}que es un conjunto l.i., pues de la combinaci´n lineal: o λ1 (1, 0, . . . , 0) + λ2(0, 1, 0, . . . , 0) + · · · + λn (0, . . . , 0, 1) = (0, . . . , 0)se deduce: (λ1 , λ2 , . . . , λn ) = (0, . . . , 0)y por tanto todos los coeficientes son cero. Adem´s, cualquier elemento de este espacio se puede poner acomo combinaci´n lineal de los vectores de este conjunto: o (λ1 , λ2, . . . , λn ) = λ1 (1, 0, . . . , 0) + λ2 (0, 1, 0, . . . , 0) + · · · + λn (0, . . . , 0, 1)luego es una base, y la dimensi´n es n. oDefinici´n 2.4.6 Dada una base B = {u1 , . . . , un } de un espacio vectorial V (de dimensi´n finita) y un o ovector x ∈ V , existe una sola combinaci´n lineal de los vectores de la base que sea igual al vector dado. oSe llaman coordenadas del vector x en la base B a los escalares λ1 , λ2 , . . . , λn tales que: n x= λi ui i=1 Como hemos dicho, las coordenadas est´n un´ a ıvocamente determinadas. Por supuesto si cambiamosla base, cambiar´n. a La correspondencia que se puede establecer, fijada un base, entre un espacio de dimensi´n finita n oy IKn , asignando a cada vector sus coordenadas en esa base, es biyectiva y tiene unas propiedades queser´n estudiadas m´s adelante. a a Dado un espacio vectorial V , se puede hablar de la dimensi´n de sus subespacios, pues ´stos son a su o evez espacios vectoriales sobre el mismo cuerpo. Un resultado importante es el siguiente:Teorema 2.4.7 Sea V un espacio vectorial de dimensi´n finita y W un subespacio de V . Se verifica: o dim W ≤ dim V
  • 38. 2.4. SISTEMAS DE GENERADORES, RANGO Y BASES 31 Demostraci´ n. En efecto, sea e1 un vector de W , no nulo (si W tiene solo el vector nulo, el resultado oes trivial). Si lin{e1 } = W , existir´ un segundo vector en W , e2 , linealmente independiente con el anterior. aSi lin{e1 , e2 } = W , habr´ un tercero, etc. Como V es de dimensi´n finita, el proceso se acaba. En cada a ouno de los pasos, la dimensi´n de W es menor o igual que la de V , lo que demuestra el teorema. QED o Los espacios de dimensi´n finita son m´s sencillos de estudiar que los de dimensi´n infinita y a ellos o a oestar´ dedicada la mayor parte del curso. a La construcci´n de bases no siempre es f´cil, pero veremos un resultado que ayuda. o aTeorema 2.4.8 Teorema de prolongaci´n de la base o Sea V un espacio vectorial de dimensi´n finita igual a n, y W un subespacio de V . Si BW = o{w1 , . . . , wk } es una base de W , se pueden encontrar vectores {uk+1 , . . . , un } tales que el conjunto{w1 , . . . , wk , uk+1 , . . . , un } es una base de V . Demostraci´ n. Sea {w1 , . . . , wm } una base de W . Si W = V , existir´ un vector en V , tal que o aB ∪ {uk+1 } es un conjunto l.i. (si no lo fuera, uk+1 estar´ en W ). Consideremos el espacio Wk+1 = ıalin(B ∪ {uk+1 }). Si este espacio es igual a V , la demostraci´n est´ acabada. Si no lo es, habr´ otro vector o a auk+2 con el que se podr´ razonar como antes. Como la dimensi´n de V es finita, el proceso acaba. Los a ovectores a˜adidos forman junto con los de la base de W inicial, la base ampliada. n QED Como consecuencia del anterior teorema podemos probar:Teorema 2.4.9 Sea V un espacio vectorial de dimensi´n finita. Si W es un subespacio de V , existe un osubespacio U de V tal que: V = W ⊕UDemostraci´n. Sea BW un base de W . Por el teorema de prolongaci´n de la base, podemos construir o ouna base de V , a˜adiendo vectores a BW . Sea BV = {w1 , . . . , wk , uk+1 , . . . , un } esta base. Definiendo nU = lin({uk+1 , . . . , un }), no es dif´ probar que los espacios W y U tienen intersecci´n igual a {0} y su ıcil osuma es V . QED Se dice que W y U son subespacios suplementarios. Dado W la elecci´n de U no es unica. o ´ Las dimensiones de los subespacios construidos a partir de otros por las operaciones estudiadas ante-riormente est´n relacionadas a trav´s de los teoremas siguientes. a eTeorema 2.4.10 Sea V un espacio vectorial de dimensi´n finita, y W1 , W2 dos subespacios de V . En- otonces, dim W1 + dim W2 = dim(W1 + W2) + dim(W1 ∩ W2 ) Demostraci´ n. Sea BW1 ∩W2 = {a1 , . . . , ak } una base del espacio W1 ∩ W2 . Como este espacio oest´ contenido en W1 , podemos ampliar la base y obtener otra de W1 : BW1 = {a1 , . . . , ak , b1 , . . . , bm }. aY como tambi´n est´ contenido en W2 , la podemos ampliar a una base de este subespacio: BW2 = e a{a1 , . . . , ak , c1, . . . , cr }. Consideremos el conjunto de vectores de V : BW = {a1 , . . . , ak , b1 , . . . , bm , c1, . . . , cr }y probemos que es una base del espacio W1 + W2 . En primer lugar es l.i. Construimos una combinaci´n olineal de estos vectores y la igualamos a cero: k m r αi ai + βi bi + γi c i = 0 i=1 i=1 i=1 k m rSean v = i=1 αi ai , v1 = i=1 βi bi y v2 = i=1 γi ci . Entonces, v ∈ W1 ∩ W2, v1 ∈ W1 y v2 ∈ W2 .Como la suma es cero, v2 ∈ W1 , luego v2 ∈ W1 ∩ W2 . Este vector debe poder expresarse como unacombinaci´n lineal de la base de este subespacio. Por tanto v2 = 0. Debido a la independencia lineal de ocada uno de los tres conjuntos de vectores ai , bi , ci concluimos que todos los coeficientes son cero, y portanto el conjunto construido es l.i.
  • 39. 32 TEMA 2. ESPACIOS VECTORIALES Probemos ahora que generan el espacio W1 + W2. Esto es m´s sencillo. Cualquier vector de este aespacio es suma de un vector de W1 m´s un vector de W2. Basta examinar las bases ampliadas de estos asubespacios para ver que cualquier vector de la suma se puede poner como combinaci´n lineal de los ovectores del conjunto l.i. determinado anteriormente. Adem´s todos estos vectores est´n en la suma. a aLuego es una base. Por tanto, la dimensi´n de W1 + W2 es k + m + r lo que demuestra el teorema. QED o Como consecuencia se tiene:Teorema 2.4.11 Si la suma W1 ⊕ W2 es directa, se tiene: dim(W1 ⊕ W2 ) = dim W1 + dim W2 La demostraci´n es inmediata de dim{0} = 0. o Adem´s: aTeorema 2.4.12 Sea V un espacio vectorial de dimensi´n finita, y W un subespacio de V . Entonces, o dim V = dim W + dim(V /W )La demostraci´n es consecuencia del siguiente teorema. o De aqu´ se deduce que la dimensi´n del espacio cociente V /W es igual a la dimensi´n de un subespacio ı o osuplementario de W . Como veremos m´s adelante, el espacio cociente es isomorfo al suplementario de aW (a cualquiera de ellos). Se puede precisar a´n m´s. u aTeorema 2.4.13 Sea V un espacio vectorial de dimensi´n finita, y W un subespacio de V . Fijada una obase de W , BW = {w1 , . . . , wk }, la ampliamos a una base de V : BV = {w1 , . . . , wk , v1 , . . . , vm }, dondedim V = m + k. Entonces, el conjunto de vectores de V /W : BV /W = {v1 + W, . . . , vm + W }es una base de V/W . Demostraci´n. El conjunto BV /W es l.i. Tomamos una combinaci´n lineal e igualamos a cero: o o m λi (vi + W ) = 0 i=1 m mOperando, obtenemos: ( i=1 λi vi )+ W = 0, es decir, la clase cuyo representante es i=1 λi vi , es la clase mcero, o sea, i=1 λi vi ∈ W . Pero los vectores vi no est´n en W , sino en el suplementario, por lo tanto: a m i=1 λi vi = 0, y como son l.i. se concluye que los coeficientes λi son cero. Veamos ahora que son unsistema de generadores. Sea x + W un elemento cualquiera del espacio cociente. Como x ∈ V , se tiene: k m x= xi w i + yi vi i=1 i=1Por tanto: m m x+W = yi vi + W = yi (vi + W ) i=1 i=1que es lo quer´ ıamos demostrar. QED
  • 40. 2.5. CAMBIOS DE BASE. MATRICES 332.5 Cambios de base. MatricesEn lo que sigue el espacio vectorial V es de dimensi´n finita. o Seg´n hemos visto en la secci´n anterior, este espacio admite una base, con un n´mero de vectores u o uigual a la dimensi´n del espacio, y podremos expresar los vectores en funci´n de esta base. Si tenemos o ootra base, las coordenadas cambiar´n. Este es el inconveniente de usar bases en un espacio vectorial, las aexpresiones de los vectores cambian al cambiar la base y hay que prestar mucha atenci´n a la hora deohablar de coordenadas en vez de vectores. Sin embargo, el uso de bases presenta otras muchas ventajas,por lo que trataremos de establecer como cambian las coordenadas al cambiar las bases. Sean B = {u1 , . . . , un } y B = {u1 , . . . , un } dos bases del espacio vectorial V . Como todo vector puedeexpresarse como combinaci´n lineal de los vectores de una base, este resultado es cierto para los vectores ode la base B en funci´n de los vectores de la base B : o u1 = a11 u1 + a21 u2 + · · · + an1 un u2 = a12 u1 + a22 u2 + · · · + an2 un . . . un = a1n u1 + a2n u2 + · · · + ann unes decir: n ui = aji uj j=1 Por lo tanto, si x ∈ V , y su expresi´n en la base B es: o n x= xi ui i=1su expresi´n en la base B ser´: o a n n n x= xi aji uj = aji xi uj i=1 j=1 i,j=1Si ahora pensamos que x tambi´n puede escribirse en la base B : e n x= xi ui i=1llegamos a la igualdad: n n xj uj = aji xi uj j=1 i,j=1Pero la expresi´n en una base es unica, por lo tanto, las coordenadas son iguales y se tiene: o ´ n xi = aij xj , i = 1, . . . n i=1 Es decir, conociendo la relaci´n entre las bases podemos saber como cambian las coordenadas. El ocambio inverso, es decir pasar de las coordenadas en la base B a las coordenadas en la base B tambi´n ees sencillo de expresar. Basta repetir el razonamiento anterior, cambiando el papel de las bases B y B : u1 = b11 u1 + b21 u2 + · · · + bn1un u2 = b12 u1 + b22 u2 + · · · + bn2un . . . un = b1n u1 + b2n u2 + · · · + bnn un
  • 41. 34 TEMA 2. ESPACIOS VECTORIALESo: n ui = bji uj j=1 Repitiendo el proceso llegamos a: n xi = bij xj , i = 1, . . . n j=1 Est´ claro que los escalares aij y bij no pueden ser independientes. La relaci´n que los liga es: a o n n n xi = aij xj = aij bjk xk j=1 i=1 k=1y como esta relaci´n se debe cumplir para todo vector del espacio, o si se quiere para valores arbitrarios ode xi , se tiene: n aij bjk = δik j=1donde δij es un s´ ımbolo (delta de Kronecker) que representa un conjunto de valores de la forma siguiente: 1 si i = j δij = 0 si i = j La expresi´n anterior es un conjunto de ecuaciones (n2 ) que relacionan los coeficientes aij con los bij . o Los c´lculos con estos coeficientes son bastante complicados de escribir. Incluso el c´lculo de los a acoeficientes aij en funci´n de los bij no parece sencillo, aunque en principio es un problema lineal. Un oelemento esencial para estas operaciones que facilita enormemente los c´lculos es la matriz. aEjemplo 2.5.1 Consideremos en IR2[x] dos bases: 1 B = {1, x, x2 }, B = {1, x, (3x2 − 1)} 2y estudiemos como se transforman las coordenadas de un polinomio p(x) = λ1 +λ2x+λ3 x2 . Expresado enla primera base, las coordenadas son los tres n´ meros reales: (λ1 , λ2 , λ3 ). Para calcularlas en la segunda ubase, veamos como se escriben los vectores de la primera base en funci´n de los de la segunda: o 1 = 1 x = x 1 2 1 3 x2 = + − + x2 3 3 2 2luego los escalares aij son: a11 = 1 a21 = 0 a31 = 0 a12 = 0 a22 = 1 a32 = 0 a13 = 1 3 a23 = 0 a33 = 2 3y por lo tanto las coordenadas en la segunda base en funci´n de las coordenadas en la primera son: o 1 λ1 = λ1 + λ3 3 λ2 = λ2 2 λ3 = λ3 3
  • 42. 2.5. CAMBIOS DE BASE. MATRICES 35 Los coeficientes bij se calculan tambi´n f´cilmente: e a 1 = 1 x = x 1 1 3 (3x2 − 1) = − + x2 2 2 2 b11 = 1 b21 = 0 b31 = 0 b12 = 0 b22 = 1 b32 = 0 b13 = − 1 2 b23 = 0 b33 = 3 2y el cambio de coordenadas inverso es: 1 λ1 = λ1 − λ3 2 λ2 = λ2 3 λ3 = λ 2 3 No es dif´ comprobar que los coeficientes aij y bij satisfacen las relaciones estudiadas anteriormente. ıcil Las dos expresiones del polinomio p(x) en estas dos bases son: 1 2 1 p(x) = λ1 + λ2 x + λ3 x2 = λ1 + λ3 + λ2 x + λ3 (3x2 − 1) 3 3 2 A´n en un ejemplo tan sencillo, los c´lculos son tediosos de escribir. El lenguaje de matrices permite u aun mayor aprovechamiento.2.5.1 MatricesDefinici´n 2.5.1 Una matriz es una colecci´n de objetos dispuestos en forma rectangular con un cierto o on´mero de filas y columnas. u En lo que sigue, las matrices estar´n formadas por escalares, pero se les puede encontrar muchas aotras aplicaciones. Los elementos de la matriz se designan por dos sub´ ındices que indican la posici´n que oocupan: el primero la fila y el segundo la columna. As´ el elemento a23 de una matriz est´ en la fila 2 y ı, acolumna 3. La matriz A = (aij ) es la formada por los elementos aij en las posiciones correspondientes.Ejemplo 2.5.2 La siguiente disposici´n es una matriz 2 × 3, es decir, con dos filas y tres columnas: o 2 −1 i A= 1−i 3i 0El elemento 22 es: 3iTeorema 2.5.1 El conjunto de matrices n×m con coeficientes en un cuerpo IK, Mn×m (IK) es un espaciovectorial sobre IK de dimensi´n nm o Demostraci´ n. La suma de matrices se define elemento a elemento, es decir la matriz suma tiene ocomo elementos la suma de los elementos que ocupan la misma posici´n en cada uno de los sumandos. Y el oproducto por escalares consiste en multiplicar cada elemento de la matriz por el escalar. Las propiedadesde espacio vectorial son claras. En cuanto a la dimensi´n, basta encontrar una base con nm elementos. La m´s sencilla es: B = {Eij | o ai = 1, . . . n, j = 1 . . . , m} donde las matrices Eij tienen un 0 en todas las posiciones, salvo en la fila icolumna j donde tiene un 1. No es dif´ ver que es un sistema l.i. y que es un sistema de generadores. ıcilQED Existen muchas operaciones con matrices que iremos estudiando poco a poco. Por ejemplo, se puededefinir la transpuesta de una matriz, que permite construir a partir de una matriz de dimensi´n n × m ootra de dimensi´n m × n: o
  • 43. 36 TEMA 2. ESPACIOS VECTORIALESDefinici´n 2.5.2 Sea A ∈ Mn×m (IK), con elementos (aij ). Se define la matriz transpuesta de A, At , ocomo la matriz en Mm×n (IK) con elementos (bij ), tal que: bij = aji , i = 1, . . . m, j = 1, . . . , n Es decir, se intercambian las filas por las columnas. Las matrices se usan en ´lgebra lineal constantemente, con distinto significado. Hay pues que poner acuidado en su interpretaci´n. o Se puede definir otra operaci´n entre matrices, el producto. Sin embargo, no siempre es posible omultiplicar dos matrices. Para ello el n´mero de columnas de la primera debe ser igual al de filas de la usegunda y la matriz resultante tiene tantas filas como filas ten´ la primera matriz y tantas columnas ıacomo columnas ten´ la segunda. Se ve que no se trata de una operaci´n en Mn×m (IK), sino: ıa o ·: Mn×m (IK) × Mm×k (IK) −→ Mn×k (IK) El m´todo de multiplicaci´n, que es asociativo y distributivo respecto a la suma, consiste en lo e osiguiente. El elemento ij de la matriz producto es la suma de los productos de los elementos de la fila ide la primera matriz por los elementos de la columna j de la segunda. En funci´n de los elementos de olas matrices que se multiplican se tiene la f´rmula: o m cik = aij bjk j=1donde A = (aij ), B = (bij ), C = AB = (cij ) y los ´ ındices se mueven en el rango adecuado.Ejemplo 2.5.3 Sean las matrices A y B:   −1 3 i 0 0 −1 0 A= , B =  2 + 2i −1 1 0  1+i 2 −i 0 −1 0 1 Su producto es: −2 − 2i 1 −1 0 AB = 3 + 4i 1 + 4i 1+i −i Obviamente no se puede cambiar el orden de los factores, no porque se obtenga otro resultado, sinoporque en la mayor´ de los casos ni siquiera se podr´ hacer el producto. ıa a Pero cuando las matrices tienen igual el n´mero de filas y de columnas (en este caso se llaman ucuadradas), la operaci´n anterior es una operaci´n interna en el espacio vectorial de matrices. Con o oella, este conjunto se transforma en un anillo respecto de las operaciones suma y producto, un anillo noconmutativo con elemento unidad (la matriz identidad, unos en la diagonal, es decir cuando i = j, yceros en las dem´s posiciones), que sin embargo no es un cuerpo, porque no siempre existe el inverso. aEsta estructura que mezcla la de espacio vectorial con la de anillo, se llama un ´lgebra, en este caso no aconmutativa con elemento unidad (respecto a la multiplicaci´n). Dentro de ella se pueden seleccionar las omatrices que s´ poseen inverso, y construir un grupo multiplicativo, como hemos hecho con los anillos. ıEl c´lculo del inverso de matrices cuadradas (cuando ´ste existe) no es sencillo. Se dir´ que una matriz a e aes regular cuando tiene inverso. Existe otra forma de ver el producto de matrices. Supongamos que A es una matriz con coeficientes enIK, de dimensi´n n × m y B otra de dimensi´n m × k, de manera que existe el producto AB. Supongamos o oque escribimos la matriz B como una colecci´n de matrices de m filas y una columna (vectores columna): o B = (B1 , B2, . . . , Bk )Entonces, el producto AB se puede leer como una matriz cuyos vectores columna son la multiplicaci´n ode A por los vectores columna de la matriz B: AB = (AB1 , AB2, . . . , ABk )
  • 44. 2.5. CAMBIOS DE BASE. MATRICES 37La demostraci´n es evidente del producto de matrices. Un resultado similar se obtiene con las filas: Si la omatriz A se escribe como una colecci´n de vectores fila (una fila y m columnas): o   A1  A2    A= .   . .  Anel producto AB se puede escribir como:   A1 B  A2 B    AB =  .   . .  An B2.5.2 Operaciones elementales con matricesAunque su motivaci´n no sea excesivamente clara en este punto, vamos a estudiar una serie de manipu- olaciones formales con las filas y las columnas de una matriz. Una operaci´n elemental de filas en una matriz consiste en una de las tres transformaciones siguientes: o 1. Cambiar entre s´ dos filas ı 2. Multiplicar una fila por un escalar no nulo 3. Multiplicar una fila por un escalar no nulo y sumarla a otra filaDe manera similar se definen las operaciones elementales entre columnas.Ejemplo 2.5.4 Sea la siguiente matriz con coeficientes en C:   1 0 −1 2 0 1  0 2 3 2 0 0     1 0 2 −1 1 1  −1 0 1 0 0 0La siguiente matriz se obtiene de ´sta mediante una operaci´n elemental: e o   1 0 −1 2 0 1  0 2 3 2 0 0     1 0 2 −1 1 1  −2 0 −1 1 −1 −1en la que hemos sumado la tercera fila multiplicada por −1 a la cuarta. La matriz que se obtiene esclaramente distinta de la primera. No estamos diciendo que las operaciones elementales dejen invarianteslas matrices. La siguiente matriz tambi´n se obtiene de la primera, mediante el intercambio de la tercera ey cuarta columnas:   1 0 2 −1 0 1  0 2 2 3 0 0     1 0 −1 2 1 1  −1 0 0 1 0 0 El uso de operaciones elementales permite simplificar las matrices llegando a formas m´s sencillas. aOtra cosa es la utilidad, debido a que a´n no hemos visto qu´ relaci´n, desde el punto de vista de las u e oaplicaciones de las matrices al ´lgebra, existe entre matrices obtenidas mediante operaciones elementales. a
  • 45. 38 TEMA 2. ESPACIOS VECTORIALESTeorema 2.5.2 Sea A una matriz en Mn×m (IK). La operaci´n elemental que consiste en intercambiar ola fila i por la fila j permite obtener una matriz igual a Fij A, donde Fij es una matriz cuadrada dedimensi´n n, que tiene ceros en todas las posiciones salvo en las ij y ji y en las kk para todo k = i, j odonde tiene un 1.Por ejemplo, para n = 3, m = 8, la matriz F13 es la siguiente:   0 0 1  0 1 0  1 0 0 Las matrices Fij tienen inverso. Concretamente el inverso coincide con ella misma: Fij Fij = I,donde I es la matriz identidad en dimensi´n n. Resultado nada sorprendente si pensamos que si hacemos oesta operaci´n elemental dos veces, la matriz no cambia. Que se verifica el teorema es f´cil de ver. Cuando o amultiplicamos la matriz Fij por A tomamos una fila de Fij y actuamos sobre una columna de A. Si lafila es distinta de la i o la j, no se produce ning´n cambio, luego se obtiene la misma fila de la matriz A. uSin embargo, cuando usamos la fila i, al multiplicar por una columna cualquiera de A no se obtiene elelemento i de esa columna sino el j. Es decir la fila i de la matriz A es sustituida por la fila j.Ejemplo 2.5.5 La matriz F24 para n = 4 es:   1 0 0 0  0 0 0 1     0 0 1 0  0 1 0 0Su producto por la matriz A del ejemplo anterior es:   1 0 −1 2 0 1  −1 0 1 0 0 0     1 0 2 −1 1 1  0 2 3 2 0 0 Con las columnas ocurre una situaci´n parecida pero ahora las multiplicaciones son por la derecha: oTeorema 2.5.3 Sea A una matriz en Mn×m (IK). La operaci´n elemental que consiste en intercambiar ola columna i por la columna j nos da una matriz igual a AFij , donde Fij es la matriz descrita en elteorema precedente, pero ahora en dimensi´n m. oEjemplo 2.5.6 El producto de la matriz A del ejemplo anterior por la matriz F24 en dimensi´n 6: o   1 0 0 0 0 0  0 0 0 1 0 0     0 0 1 0 0 0  F24 =   0   1 0 0 0 0    0 0 0 0 1 0  0 0 0 0 0 1es:   1 2 −1 0 0 1  −1 0 1 0 0 0     1 −1 2 0 1 1  0 2 3 2 0 0donde las columnas segunda y cuarta.
  • 46. 2.5. CAMBIOS DE BASE. MATRICES 39 La segunda operaci´n elemental es multiplicar una fila (o columna) por un escalar no nulo. Se tiene oel teorema siguiente:Teorema 2.5.4 Sea A una matriz en Mn×m (IK). La operaci´n elemental que consiste en multiplicar la ofila (o columna) i por un escalar λ = 0 nos da una matriz igual a Ki (λ)A (o AKi (λ) para columnas),donde Ki (λ) es la matriz de dimensi´n n (o m para columnas) que tiene ceros en todas las posiciones osalvo en la diagonal, donde tiene 1 excepto en la posici´n ii que tiene λ. oLa demostraci´n es evidente de las reglas del producto de matrices. Estas matrices Ki (λ) tienen inverso, oque es la matriz Ki (λ−1 ). Finalmente la tercera operaci´n se describe de manera similar. oTeorema 2.5.5 Sea A una matriz en Mn×m (IK). La operaci´n elemental que consiste en multiplicar la ofila i por un escalar λ y sumarla a la fila j, nos proporciona una matriz igual a Lij (λ)A, donde Lij (λ) esla matriz de dimensi´n n que tiene ceros en todas las posiciones y unos en la diagonal con la excepci´n o osiguiente: en la posici´n ji aparece λ oUn resultado similar se obtiene para columnas. La matriz a emplear es ahora la transpuesta de Lij (λ) ysuma a la columna j la i multiplicada por λ. La demostraci´n es tambi´n evidente de las reglas del producto. Pero podemos interpretarla de la o eforma siguiente. La matriz A se considera como una matriz de filas:   A1  A2    A= .   .  . An El producto es ahora:    A1 A1  .   .   .   .   .   .   Ai   Ai       .    Lij (λ)A = Lij (λ)  .  =  .   . . .     Aj   λAi + Aj       .   .   .   . . .  An AnEn cuanto a las operaciones con columnas, se considera la matriz A como una matriz de columnasA = (A1 , . . . , Am ) y se tiene: ALt (λ) = (A1 , . . . , Ai , . . . , Aj , . . . Am )Lt (λ) = (A1 , . . . , Ai , . . . , λAi + Aj , . . . Am ) ij ij No es dif´ probar que estas matrices tienen tambi´n inverso (aunque λ sea cero). Concretamente: ıcil e Lij (λ)Lij (−λ) = I Como hemos dicho, el uso de operaciones elementales sobre una matriz permite simplificar la formade ´sta. Se tiene el siguiente resultado. eDefinici´n 2.5.3 Una matriz escal´n reducida por filas es una matriz en la que en cada fila, el primer o oelemento no nulo est´ en una columna situada a la derecha de la columna de la fila anterior en la que aest´ el primer elemento no nulo de esa fila aTeorema 2.5.6 Sea A una matriz rectangular m × n sobre un cuerpo IK. Esta matriz se puede reducirmediante operaciones elementales con filas y columnas a una matriz escal´n. o
  • 47. 40 TEMA 2. ESPACIOS VECTORIALES Demostraci´n. Consiste simplemente en la descripci´n de un algoritmo que permite llegar a ese o oresultado en un n´mero finito de pasos (cosa natural dado el car´cter finito de la matriz). u a Mediante operaciones elementales del tipo cambios de filas, podemos conseguir que el primer elementono nulo de la primera fila est´ en la primera columna no nula de la matriz. Es decir las columnas anteriores eson todas cero. Usando ese primer elemento no nulo en la primera fila, podemos hacer nulos los elementossituados debajo de ´l, utilizando la operaci´n elemental de multiplicar una fila por un escalar y sumar a e ootra. Una vez conseguido esto, colocamos en la segunda fila aquella (descontando la primera) que tieneel primer elemento no nulo en la columna con el menor ´ ındice posible. Mediante operaciones elementalespodemos conseguir que todos los elementos por debajo de ´ste sean nulos. Etc. e QEDEjemplo 2.5.7   1 0 −1 2 0 1  0 2 3 2 0 0     1 0 2 −1 1 1  −1 0 1 0 0 0Vamos a reducirla a la forma escal´n. La primera fila tiene un elemento no nulo en la primera columna. oUtilizamos ´ste para hacer cero el resto de elementos de la primera columna. Multiplicando por −1 y esumando a la tercera, y multiplicando por 1 y sumando a la cuarta, obtenemos:   1 0 −1 2 0 1  0 2 3 2 0 0     0 0 3 −3 1 0  0 0 0 2 0 1La segunda fila sirve a nuestros prop´sitos. Y la tercera tambi´n. Con lo que la matriz ya est´ en forma o e aescal´n. Utilizando otras operaciones elementales, podr´ o ıamos conseguir que los primeros elementos nonulos de cada fila fueran iguales a 1. Multiplicando la segunda y cuarta fila por 1/2 y la tercera por 1/3,tenemos:   1 0 −1 2 0 1  0 1 3/2 1 0 0     0 0 1 −1 1/3 0  0 0 0 1 0 1/2A´n podemos obtener una forma m´s simplificada. Usamos operaciones elementales para eliminar los u aelementos de las columnas que no son cero ni son el primero de la fila no nulo. Este paso no siempre sepuede hacer, debido a que los primeros elementos no nulos de cada fila no est´n escalonados como aqu´ a ı,de uno en uno. Multiplicando la tercera fila por 1 y sumando a la primera, la cuarta por −1 y sumandoa la primera, la tercera por −3/2 y sumando a la segunda, la cuarta por −5/2 y sumando a la segunday la cuarta por 1 y sumando a la tercera se llega a:   1 0 0 0 1/3 1/2  0 1 0 0 −1/2 −5/4     0 0 1 0 1/3 1/2  0 0 0 1 0 1/2No se pueden hacer m´s ceros mediante operaciones elementales de filas. N´tese que las operaciones a oelementales de filas no tienen porqu´ conmutar. Si uno recuerda que en definitiva no son m´s que e aproductos por la izquierda de las matrices explicadas antes, es claro que en general ´stas no conmutan. eLa matriz final se obtiene de la inicial mediante un producto por una matriz que es el producto de lascorrespondientes a las operaciones elementales hechas. Recordando todos los pasos, se tiene:       1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 −1 1 0 1 0  0 1 0 0   0 1 0 −5/2   0 1 −3/2 0   0 1 0 0  0 1 0 0         0 0 1 1  0 0 1 0  0 0 1 0  0 0 1 0  0 0 1 0  0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1
  • 48. 2.5. CAMBIOS DE BASE. MATRICES 41       1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0  0 1 0 0  0 1 0 0  0 1/2 0 0  0 1 0 0  0 1 0 0         0 0 1 0  0 0 1/3 0  0 0 1 0  0 0 1 0   −1 0 1 0  0 0 0 1/2 0 0 0 1 0 0 0 1 1 0 0 1 0 0 0 1 Obs´rvese que el orden de multiplicaci´n es el inverso (claro est´) del orden en el que se han hecho e o alas operaciones elementales. El producto es:   1/6 0 1/3 −1/2  −3/4 1/2 −1/2 −5/4  P =  1/6  0 1/3 1/2  1/2 0 0 1/2Esta es una matriz cuadrada con inverso, que corresponde a una sucesi´n de operaciones elementales. Su oobtenci´n es ciertamente laboriosa. Pero existe una forma mucho m´s sencilla de obtenerla. Supongamos o aque sometemos a la matriz identidad a las mismas operaciones elementales que a A. Al final obtenemoslas matrices anteriores multiplicando a la matriz identidad: P I = P . Por tanto la matriz P se obtienef´cilmente de esta forma. Cada vez que hacemos una operaci´n elemental en la matriz A, hacemos la a omisma en la matriz I. Como hemos visto, no es posible simplificar m´s la matriz haciendo operaciones con filas. Sin embargo, aoperando con las columnas podemos simplificar a´n m´s. Consideremos la matriz: u a   1 0 0 0 1/3 1/2  0 1 0 0 −1/2 −5/4     0 0 1 0 1/3 1/2  0 0 0 1 0 1/2 La primera columna por −1/3 sumada a la quinta, y por −1/2 sumada a la sexta da:   1 0 0 0 0 0  0 1 0 0 −1/2 −5/4     0 0 1 0 1/3 1/2  0 0 0 1 0 1/2La segunda columna por 1/2 sumada a la quinta, y por 5/4 sumada a la sexta da:   1 0 0 0 0 0  0 1 0 0 0 0     0 0 1 0 1/3 1/2  0 0 0 1 0 1/2La tercera columna por −1/3 sumada a la quinta, y por −1/2 sumada a la sexta da:   1 0 0 0 0 0  0 1 0 0 0 0     0 0 1 0 0 0  0 0 0 1 0 1/2Finalmente, la cuarta columna por −1/2 sumada a la sexta da:   1 0 0 0 0 0  0 1 0 0 0 0     0 0 1 0 0 0  0 0 0 1 0 0
  • 49. 42 TEMA 2. ESPACIOS VECTORIALES Ahora tenemos una matriz que multiplica a A por la derecha:   1 0 0 0 −1/3 −1/2  0 1 0 0 1/2 5/4     0 0 1 0 −1/3 −1/2  Q=  0 0    0 1 0 −1/6   0 0 0 0 1 0  0 0 0 0 0 1que es el producto de las operaciones elementales que hemos hecho (ahora en el mismo orden en que lashacemos). Entonces, decimos que hemos obtenido (P AQ) la forma m´s sencilla posible desde el punto ade vista de transformaciones elementales.C´lculo de la inversa de una matriz. a Sea A una matriz cuadrada, de la que suponemos tiene inversa. Haciendo operaciones elementales confilas podemos llegar a la forma m´s sencilla posible seg´n lo dicho anteriormente. Es decir: P A es una a umatriz reducida, concretamente la matriz identidad (si no es as´ A no puede tener inversa, discutiremos ı,esto m´s adelante). Pero, la matriz P es entonces A−1 , la matriz inversa de A, y se obtiene aplicando a ala matriz A las mismas operaciones elementales que nos permitieron pasar de A a la identidad. LuegoP I = P es la matriz inversa de A.Ejemplo 2.5.8 Sea:   2 −1 1 A= 0 1 0  −4 0 1que suponemos tiene inversa. Calcul´ndola mediante operaciones elementales: a   2 −1 1 1 0 0 A= 0 1 0 0 1 0  −4 0 1 0 0 1   2 −1 1 1 0 0  0 1 0 0 1 0  0 −2 3 2 0 1   2 −1 1 1 0 0  0 1 0 0 1 0  0 0 3 2 2 1   2 0 1 1 1 0  0 1 0 0 1 0  0 0 3 2 2 1   2 0 0 1/3 1/3 −1/3  0 1 0 0 1 0  0 0 3 2 2 1   1 0 0 1/6 1/6 −1/6  0 1 0 0 1 0  0 0 3 2 2 1   1 0 0 1/6 1/6 −1/6  0 1 0 0 1 0  0 0 1 2/3 2/3 1/3luego la matriz inversa es:   1/6 1/6 −1/6  0 1 0  2/3 2/3 1/3como se puede comprobar f´cilmente. a
  • 50. 2.5. CAMBIOS DE BASE. MATRICES 432.5.3 La matriz del cambio de baseVeamos una primera aplicaci´n de matrices a la teor´ de espacios vectoriales. Como hemos visto, cuando o ıatenemos dos bases en un espacio vectorial (de dimensi´n finita), podemos hallar las coordenadas de un ovector en una base cuando conocemos las coordenadas en la otra. Si la relaci´n entre los vectores de las obases B = {ui } y B = {ui } es: n ui = aji uj , (2.1) j=1podemos definir una matriz: P = (aij )cuyos elementos sean las coordenadas de los vectores de la primera base en funci´n de los de la segunda, ocuidando el orden de filas y columnas. Sea X ∈ IKn el vector (columna) de coordenadas correspondientea x ∈ V en la base B y X ∈ IKn el correspondiente en la base B . Es decir, en la notaci´n utilizada oanteriormente:     x1 x1  x2   x2      X =  . , X =  .   . .  .  . xn xndonde: n n x= xi ui , x= xi ui i=1 i=1 Teniendo en cuenta las ecuaciones que estudiamos para el cambio de coordenadas: n xi = aij xj , i = 1, . . . n i=1vemos que se pueden escribir, utilizando matrices, como: X = PX El cambio inverso es: n xi = bij xj , i = 1, . . . n i=1luego, si P = (bij ), se tiene: X=P X Como sabemos, los escalares aij y bij no son independientes, sino que verifican: n aij bjk = δik j=1Pero esto no es m´s que la igualdad del producto de matrices P y P con la matriz identidad: a PP = Ies decir, la matriz de cambio de base es una matriz que posee inverso y este inverso es justamente lamatriz de cambio de base en sentido contrario. Veamos un ejemplo de lo dicho.Ejemplo 2.5.9 Se define la traza de una matriz cuadrada como la suma de los elementos de la diagonal.El conjunto de matrices 2 × 2 con coeficientes en C de traza nula es un espacio vectorial complejo. Lasuma de matrices de traza nula es una matriz de traza nula y el producto de escalares por matrices detraza nula es tambi´n una matriz de traza nula. La dimensi´n de este espacio es tres (la dimensi´n del e o o
  • 51. 44 TEMA 2. ESPACIOS VECTORIALESespacio total es 4 como ya sabemos, y la condici´n de traza nula selecciona un subespacio con dimensi´n o o3, como detallaremos en la pr´xima secci´n). Una base es: o o 1 0 0 1 0 0 h= , e= , f= 0 −1 0 0 1 0Cualquier matriz de traza nula es combinaci´n lineal de estas tres matrices: o α β A= = αh + βe + γf γ −α Seleccionemos otra base en este espacio, que tendr´ tambi´n tres elementos. a e 0 1 0 −i 1 0 σ1 = , σ2 = , σ3 = 1 0 i 0 0 −1y calculemos la matriz de cambio de base, que ser´ claramente una matriz 3 × 3. Para ello expresemos alos elementos de la base {h, e, f } en funci´n de los elementos de la base {σ1 , σ2 , σ3 }: o 1 1 h = σ3 , e= (σ1 + iσ2 ), f= (σ1 − iσ2 ) 2 2por lo que la matriz de cambio de base es:   0 1/2 1/2  0 i/2 −i/2  1 0 0y por tanto, si A es cualquier matriz de traza nula, con coordenadas en la base {h, e, f }, dadas porx1 , x2 , x3 , y coordenadas en la base {σ1 , σ2, σ3 }, y1, y2 , y3 , se tiene:      y1 0 1/2 1/2 x1  y2  =  0 i/2 −i/2   x2  y3 1 0 0 x3es decir: 1 y1 = (x2 + x3 ) 2 i y2 = (x2 − x3 ) 2 y3 = x1Es sencillo comprobar que el resultado es correcto: x1 x2 1 0 1 i 0 −i 1 0 A= = (x2 + x3 ) + (x2 − x3 ) + x1 x3 −x1 2 1 0 2 i 0 0 −12.6 Ecuaciones de subespaciosComo dijimos anteriormente, el rango de una familia de vectores en un espacio vectorial es el n´mero um´ximo de vectores l.i. que se pueden encontrar en esa familia. Cuando el espacio es de dimensi´n finita, a oel rango es un n´ mero finito, porque, como hemos visto, no hay conjuntos de vectores l.i. con m´s de n u aelementos, donde n es la dimensi´n del espacio. Ampliamos este concepto a matrices. oDefinici´n 2.6.1 Sea A una matriz con coeficientes en IK con n filas y m columnas. Se define el rango ode A como el rango de sus vectores fila (considerados como vectores del espacio IKn ).
  • 52. 2.6. ECUACIONES DE SUBESPACIOS 45Ejemplo 2.6.1 El rango de la matriz:   2 −1 0 A= 0 1 −1  −2 3 −2es igual a 2, pues es f´cil ver que solo hay dos vectores fila l.i. (la tercera fila es igual a dos veces la asegunda menos la primera). El rango por filas de una matriz es muy f´cil de calcular si est´ en la forma escal´n. En efecto, dada la a a oforma que all´ tienen los vectores fila, basta restar del n´mero total de filas, las filas formadas por ceros. ı uN´tese que desde este punto de vista, lo que estamos haciendo al reducir una matriz a su forma reducida oes establecer combinaciones lineales de vectores (que generan la misma envolvente lineal que los vectoresoriginales, debido a las exigencias que se han hecho sobre las operaciones elementales), y por tanto, unavez llegados a la forma final, basta excluir los vectores que son cero. No parece que las filas hayan de jugar un papel m´s importante que las columnas. Podr´ a ıamos haberdefinido el rango de una matriz como el rango del sistema de vectores formado por sus vectores columnas.Pero ocurre que ambos rangos son iguales.Teorema 2.6.1 El rango del sistema de vectores fila de una matriz y el rango del sistema de sus vectorescolumna son iguales, y es el rango de la matriz por definici´n. oDemostraci´n. Sea A una matriz n × m sobre un cuerpo IK y supongamos que rf y rc son sus rangos opor filas y columnas respectivamente. Por la definici´n de rango por filas, existen rf filas l.i. que podemos osuponer que son las rf primeras. Las dem´s filas dependen linealmente de estas primeras: a rf Fk = λki Fi , k = rf + 1, . . . , n i=1siendo Fi los vectores fila de la matriz A. En componentes: rf akj = λki aij , k = rf + 1, . . . , n, j = 1, . . . m i=1Por lo tanto, las columnas j = 1, . . . , m se puedes poner como: akj arbitrarios cuando k = 1, . . . rf y rfakj = i=1 λki aij cuando k = rf + 1, . . . , n. Definiendo una colecci´n de vectores en IKm : o (1, 0, . . . , 0, λrf +1,1 , . . . , λn,1 ), (0, . . . , 0, 1, λrf +1,r , . . . , λn,r )vemos que la columna j es combinaci´n lineal de ellos (con coeficientes: a1j , . . . , arj ). Por lo tanto oel n´mero de columnas l.i. es menor o igual que rf . Empezando de manera similar por las columnas uobtendr´ ıamos: rc ≤ rf . As´ el rango por filas es igual al rango por columnas. Obtendremos este resultado ı,m´s tarde al estudiar la relaci´n entre determinantes y rangos. a o QED El rango de una matriz puede cambiar al multiplicarlo por otra. Se tiene el siguiente resultado.Teorema 2.6.2 Sean A ∈ Mn×m (IK) y B ∈ Mm×k (IK) dos matrices. Se tienen las desigualdades: r(AB) ≤ r(A), r(AB) ≤ r(B)Demostraci´n. No es nada sorprendente que as´ sea. Como ya hemos visto, multiplicar una matriz o ı(como A) por la derecha por otra matriz, no es m´s que construir otra matriz cuyos vectores columna ason combinaciones lineales de los vectores columna de la inicial. Con estas operaciones uno no puedeconseguir m´s vectores l.i. de los que hab´ Como mucho tendr´ los mismos, luego el rango no puede a ıa. aaumentar. El mismo razonamiento se aplica a los vectores fila cuando multiplicamos por la izquierda.QED Pero si una de las dos matrices tiene inverso (por supuesto es cuadrada), entonces el rango de la otrano var´ ıa:
  • 53. 46 TEMA 2. ESPACIOS VECTORIALESTeorema 2.6.3 Sea A ∈ Mn×m (IK) y un matriz regular B ∈ Mm×m (IK). Entonces: r(AB) = r(A)Si consideramos C ∈ Mn×n (IK) regular, se tiene tambi´n: e r(CA) = r(A)Demostraci´n. La raz´n es evidente del teorema anterior. Al multiplicar por una matriz cuadrada lo o oque estamos haciendo, desde otro punto de vista, es un cambio de base. La dimensi´n de la envolvente olineal no var´ es decir, el rango permanece constante. ıa, QED Los subespacios de un espacio vectorial (de dimensi´n finita), se pueden definir de varias maneras, ocomo ya hemos adelantado en otro punto. La forma impl´ ıcita consiste en escribir los vectores en una base(del espacio total), y someter a las coordenadas a unas ecuaciones lineales homog´neas, es decir igualadas ea cero.Teorema 2.6.4 Consideremos el espacio vectorial de dimensi´n n, IKn . Los vectores x = (x1 , x2 , . . . , xn ) ode este espacio que satisfacen las m ecuaciones: a11 x1 + a12 x2 + · · · + a1n xn = 0 a21 x1 + a22 x2 + · · · + a2n xn = 0 ··· am1 x1 + am2 x2 + · · · + amn xn = 0forman un subespacio vectorial de IKn .La demostraci´n es inmediata debido a la linealidad de las ecuaciones. o El sistema anterior se puede escribir como una ecuaci´n con matrices. Sean las matrices: o     a11 a12 · · · a1n x1  a21 a22 · · · a2n   x2      A= . . . , X =  .   . . . . .  .  . . am1 am2 ··· amn xnLa ecuaci´n se puede escribir como: o AX = 0y de aqu´ es inmediato probar que el conjunto de soluciones es un espacio vectorial, subespacio de IKn . ıLa dimensi´n de este subespacio es f´cil de establecer. La matriz A se puede transformar en una matriz o aescal´n reducida por filas mediante operaciones elementales. Como ´stas son equivalentes a multiplicar o ela matriz por la izquierda por matrices regulares, el sistema de ecuaciones tiene las mismas soluciones: P AX = 0 ⇔ AX = 0De esta forma, el n´mero de ecuaciones que nos queda es justamente el rango de la matriz A. uTeorema 2.6.5 La dimensi´n del subespacio definido por la ecuaci´n AX = 0 es igual a la dimensi´n o o odel espacio (X ∈ IKn ) menos el rango de la matriz A ∈ Mm×n (IK). Para un espacio vectorial arbitrario (no necesariamente IKn ), la situaci´n es la misma. Basta elegir ouna base y emplear coordenadas para encontrarnos en una situaci´n igual a la descrita anteriormente. oVolveremos a estudiar estos aspectos con m´s detalle cuando definamos las aplicaciones lineales. a La otra forma de definir un subespacio es como la envolvente de una familia de vectores. En este casola dimensi´n es clara, es justamente el rango de esa familia de vectores, es decir el n´mero m´ximo de o u a
  • 54. 2.6. ECUACIONES DE SUBESPACIOS 47vectores l.i. que podemos encontrar en esa familia. Cualquier vector del subespacio viene dado como unacombinaci´n lineal de los vectores de la familia que genera el subespacio: o k x∈V ⇔x= λi vi i=1donde S = {v1 , . . . , vk } es la familia generadora de W . T´ngase en cuenta que el vector x no determina eun´ ıvocamente los coeficientes λi . Pero de entre los vectores de S podemos seleccionar un conjuntomaximal de vectores l.i. Este conjunto, como ya hemos dicho muchas veces, genera W . Y no solo eso, esuna base de W . De modo que en funci´n de estos vectores las coordenadas s´ son unicas. o ı ´ Una manera pr´ctica de calcular esta base es la siguiente. Supongamos que tenemos una base en el aespacio vectorial V de partida, B = {u1 , . . . , un } y que los vectores vi que generan el subespacio tienenen esta base unas coordenadas: v1 = b11 u1 + b21u2 + · · · + bn1 un v2 = b12 u1 + b22u2 + · · · + bn2 un . . . vk = b1k u1 + b2k u2 + · · · + bnk un Cualquier vector del subespacio es: k n k x∈W ⇒x= λi vi = bji λi uj i=1 j=1 i=1 nes decir, si x = i=1 xi ui , se tiene: k xj = bji λi i=1que es la expresi´n que deben tener las coordenadas de x para que este vector est´ en W y en la que o eλi toman valores arbitrarios en IK. Estas expresiones son las ecuaciones param´tricas de W . En forma ematricial, la ecuaci´n es: o X = BΛdonde las matrices X, B, Λ son respectivamente:       x1 b11 b12 ··· b1n λ1  x2   b21 b22 ··· b2n   λ2        X =  . , B =  . . . , Λ= .   . .  .. . . . .   . .  xn bm1 bm2 ··· bmn λkEstas ecuaciones tienen cierto parecido con las que dimos anteriormente en forma impl´ıcita (de hecho paraIKn , pero v´lidas en cualquier espacio de dimensi´n n una vez que definamos una base). ¿C´mo pasamos a o ode unas a otras? El proceso se conoce como eliminaci´n de par´metros yendo hacia la primera ecuaci´n o a o(X = BΛ ⇒ AX = 0) o resoluci´n del sistema yendo de la segunda la primera (AX = 0 ⇒ X = BΛ). oAmbos procesos son ya conocidos y no insistiremos en ellos. La segunda ecuaci´n tiene par´metros o aredundantes en general, debido a que los vectores que generan el subespacio no tiene porqu´ ser l.i. Y ela primera puede tener ecuaciones redundantes como hemos dicho ya. En ambos casos la dimensi´n del osubespacio es: 1. De AX = 0 se deduce dim W = n − r(A). 2. De X = BΛ se deduce dim W = r(B)Ya veremos en otra ocasi´n nuevas interpretaciones de estos resultados en relaci´n con las aplicaciones o olineales.
  • 55. 48 TEMA 2. ESPACIOS VECTORIALES
  • 56. Tema 3Aplicaciones lineales Aplicaciones lineales. N´ cleo e Imagen. Representaci´n matricial. Cambios de base. u o Espacios de aplicaciones lineales. Rango. Sistemas de ecuaciones lineales. Determi- nantes. A lo largo de este cap´ ıtulo V, W, . . ., etc., denotar´n espacios vectoriales sobre el cuerpo IK (de carac- ater´ ıstica diferente a 2, p.e., IR, C).3.1 Generalidades sobre aplicaciones linealesLas aplicaciones m´s notables entre espacios vectoriales son aquellas que preservan sus estructuras. Tales aaplicaciones se denominan lineales y sirven a una gran variedad de prop´sitos. En este cap´ o ıtulo vamos aestudiar algunas de sus propiedades y aplicaciones.3.1.1 DefinicionesDefinici´n 3.1.1 Una aplicaci´n f : V → W entre dos espacios vectoriales se dir´ que es lineal si, o o a i. f (x + y) = f (x) + f (y), ∀x, y ∈ V , ii. f (λx) = λf (x), ∀λ ∈ IK. En otras palabras f es un homomorfismo de grupos abelianos (V, +), (W, +) y conmuta con el productopor escalares. Si f es inyectiva diremos que es un monomorfismo de espacios vectoriales, si es suprayectiva, diremosque es un epimorfismo y si es biyectiva diremos que f es un isomorfismo de espacios vectoriales. Si f1 , . . . , fr son aplicaciones lineales de V en W y λ1 , . . . , λr son escalares, definimos la combinaci´n olineal λ1 f1 + · · · + λr fr como una aplicaci´n de V en W dada por o (λ1 f1 + · · · + λr fr )(x) = λ1 f1 (x) + · · · + λr fr (x), ∀x ∈ V.Proposici´n 3.1.1 La combinaci´n lineal de aplicaciones lineales es una aplicaci´n lineal. Lo mismo o o oocurre con la composici´n de aplicaciones lineales. o Demostraci´ n. Efectivamente, si f, g son aplicaciones lineales de V en W y λ, µ dos elementos del ocuerpo IK, hemos definido (λf +µg)(x) = λf (x)+µg(x), ∀x ∈ V . Entonces, (λf +µg)(x+y) = λf (x+y)+µg(x+y) = λ(f(x)+f (y))+µ(g(x)+g(y)) = λf (x)+µg(x)+λf(y)+µg(y) = (λf +µg)(x)+(λf +µg)(y). An´logamente, si f : V → W , g: W → U , son dos aplicaciones lineales, la composici´n g ◦ f: V → U a oes lineal. g ◦ f (x + y) = g(f(x + y)) = g(f (x) + f (y)) = g(f (x)) + g(f (y)) = g ◦ f (x) + g ◦ f (y), y de lamisma forma con el producto por escalares. QED 49
  • 57. 50 TEMA 3. APLICACIONES LINEALES Nota. En la clase VIK de todos los espacios vectoriales de dimensi´n finita sobre el cuerpo IK, o se puede establecer una relaci´n de equivalencia como sigue: V ≈ W si y s´lo si existe un o o isomorfismo f : V → W de espacios vectoriales. Es un ejercicio sencillo comprobar que dicha relaci´n es de equivalencia. o Desde este punto de vista dos espacios vectoriales isomorfos se pueden considerar id´nticos e y el problema de la clasificaci´n de espacios vectoriales consiste en describir el conjunto de o clases de equivalencia VIK / ≈. Como veremos inmediatamente tal conjunto es IN ∪ 0. Dentro de la clase de equivalencia [V ] de un espacio vectorial dado V , se hallan todos aquellos isomorfos a ´l. Desde un punto de vista abstracto, las realizaciones concretas de un espacio e vectorial son irrelevantes pero no as´ desde un punto de vista pr´ctico. ı a3.1.2 Algunos ejemplosEjemplo 3.1.1 Sea V = IK, y λ ∈ IK entonces fλ (x) = λx, es una aplicaci´n lineal. oEjercicio 3.1.1 Probar que toda aplicaci´n lineal de IK en s´ mismo es de la forma descrita en el ejemplo o ıanterior 3.1.1.Ejemplo 3.1.2 Sea V = C. Si consideramos C como un espacio vectorial sobre el cuerpo de los n´meros ureales IR, la aplicaci´n f (z) = z es lineal, pero no si consideramos C como un espacio vectorial sobre C. o ¯Ejemplo 3.1.3 Sea V = IR2 . f (x, y) = (x cos α − y sen α, x sen α + y cos α), α ∈ IR. f denota unarotaci´n de ´ngulo α (f = eiα en notaci´n compleja). o a oEjemplo 3.1.4 Consideremos ahora V = IK[x], f (P ) = P , ∀P ∈ IK[x]. Denotaremos la aplicaci´n o ımbolo D (o tambi´n ∂x ), entonces D2 , D3 , . . ., etc. sonlineal anterior (“tomar la derivada”) por el s´ eaplicaciones lineales debido a la proposici´n 3.1.1 as´ como cualquier combinaci´n lineal de ellas, por o ı otanto L = Dn + λ1 Dn−1 + λ2 Dn−2 + · · · + λn−1 D + λn ,es una aplicaci´n lineal. Un tal objeto se denomina un operador diferencial lineal en IK[x]. oEjemplo 3.1.5 Consideremos de nuevo V = IK[x], y la aplicaci´n f : IK[x] → IK[x], f (P ) = P (x)dx odonde el s´ ımbolo · dx denota la primitiva con t´rmino constante 0. La aplicaci´n lineal P (x)dx e otambi´n se denota por D−1 , esto es, D−1P = P (x)dx. Cualquier potencia de esta aplicaci´n lineal e otambi´n es lineal D−2, D−3 , etc. Una combinaci´n lineal de los operadores Dk , k ∈ Z se denominar´ e o Z, aun operador pseudodiferencial en IK[x].Ejemplo 3.1.6 Sea V = Mn (IK). En el espacio vectorial de las matrices cuadradas la aplicaci´n of : Mn (IK) → Mn (IK), f (A) = At es lineal. Si B ∈ Mn (IK), f (A) = BA es lineal. La siguiente proposici´n proporciona un m´todo sistem´tico y eficaz para la construcci´n de aplica- o e a ociones lineales “a la carta”.Proposici´n 3.1.2 Construcci´n de aplicaciones lineales. Sea V un espacio vectorial y B = {e1, . . . , en } o ouna base de V . Sea W un espacio vectorial. Asociamos a cada elemento ei de B un vector arbitrario n nui ∈ W . Definimos entonces f : V → W como sigue: Si x = i=1 xi ei , f (v) = i=1 xi ui . Entonces laaplicaci´n f es lineal. o Demostraci´n. Es inmediato comprobar que f es lineal. En efecto, si x = o i xi e i , y = i y i e i ,entonces x + y = i (xi + y i )ei y por tanto f(x + y) = i (xi + y i )ui = i xi ui + i i y ui = f (x) + f (y).An´logamente para f (λx). a QED
  • 58. 3.1. GENERALIDADES SOBRE APLICACIONES LINEALES 513.1.3 Algunas propiedades de las aplicaciones linealesDefinici´n 3.1.2 Llamaremos n´cleo de la aplicaci´n lineal f : V → W al subconjunto ker f = {v ∈ V | o u of(v) = 0} = f −1 (0). La imagen de f se denotar´ por im f o bien f(V ). aProposici´n 3.1.3 ker f e im f son subespacios vectoriales. oEjercicio 3.1.2 Probar la proposici´n anterior 3.1.3. oEjercicio 3.1.3 Probar que f 2 = 0 si y s´lo si im f ⊂ ker f . oProposici´n 3.1.4 Una aplicaci´n lineal f : V → W es un monomorfismo si y s´lo si ker f = 0; f es un o o oepimorfismo si y s´lo si f (V ) = W oEjercicio 3.1.4 Probar la proposici´n anterior 3.1.4. oEjemplo 3.1.7 V = IK[x], D: IK[x] → IK[x]. im D = IK[x], y ker D = polinomios de grado cero. 1 0Ejemplo 3.1.8 V = Mn (IK), f (A) = [A, B] = AB − BA. IK = C, n = 2, B = ; ker f = 1 −1 c+d 0 a −2a | c, d ∈ C , im f = | a, b ∈ C . c d b −aEjemplo 3.1.9 Sea V el espacio vectorial V = {0}. Hay una unica aplicaci´n f : {0} → W , y es ´ of(0) = 0W . Esta aplicaci´n se denotar´ habitualmente por 0 → W . Hay tambi´n una unica aplicaci´n o a e ´ of: W → {0}, es la aplicaci´n trivial f (u) = 0, ∀u ∈ W . Tal aplicaci´n se denota habitualmente W → 0. o oProposici´n 3.1.5 1. Si W ⊂ V es un subespacio de V y f : V → U es lineal, entonces f (W ) es un osubespacio de U. 2. Si S es un subconjunto no vac´ de V , lin(f (S)) = f (lin S). ıoEjercicio 3.1.5 Probar la proposici´n anterior 3.1.5. oProposici´n 3.1.6 1. Si f : V → U es un monomorfismo y S es un sistema linealmente independiente, oentonces f (S) es linealmente independiente. 2. Si S es un sistema generador de V y f es suprayectiva, entonces f (S) es un sistema generador deU.Ejercicio 3.1.6 Probar la proposici´n anterior 3.1.6. oProposici´n 3.1.7 Si f : U → V es un isomorfismo y B es una base de V , entonces f (B) es una base ode U . Demostraci´ n. Si f es un isomorfismo, entonces es un monomorfismo. Si B es una base cualquiera ode V , entonces por la proposici´n 3.1.6 f (B) es l.i. Por otro lado, f es tambi´n un epimorfismo, y por la o eproposici´n 3.1.6 f (B) es un sistema generador. Por lo tanto f (B) es una base. o QED Podemos concluir esta cadena de razonamientos con el siguiente teorema.Teorema 3.1.1 Una aplicaci´n lineal f : V → U es un isomorfismo si y solo si para alguna base B de V , of(B) es una base de U.
  • 59. 52 TEMA 3. APLICACIONES LINEALES Demostraci´n. El “s´lo si” es el enunciado de la proposici´n 3.1.7. El “si” se prueba f´cilmente o o o acomo sigue. Sea B = {e1 , . . . , en } una base de V tal que f (B) es una base de U. Supongamos que x ∈ ker f. Entonces f (x) = 0, pero x = xi ei , y por tanto f (x) = xi f(ei ) = 0. iComo los elementos de f (B) son l.i., entonces x = 0, i = 1, . . . , n y por tanto x = 0. Como ker f = 0, fes un monomorfismo. Sea y ∈ U. Como f(B) es un sistema generador de U , existen y i , i = 1, . . . , n tales que y = y i f (ei ), i e ) y y ∈ im f , por tanto f es suprayectiva y por tanto es un epimorfismo. QEDpor lo tanto y = f( y i Del resultado anterior se desprende la siguiente caracterizaci´n de espacios vectoriales isomorfos. oCorolario 3.1.1 Dos espacios vectoriales de dimensi´n finita U y V son isomorfos si y solo si dim V = odim U .3.2 Teoremas de isomorf´ de espacios vectoriales ıa3.2.1 Primer teorema de isomorf´ de espacios vectoriales ıaTeorema 3.2.1 Sea f : V → W una aplicaci´n lineal, entonces: o ¯ i. Existe un isomorfismo f : V / ker f → f (V ), ii. existe un monomorfismo i: f (V ) → W , iii. existe un epimorfismo π: V → V/ ker f , ¯ tales que, f = i ◦ f ◦ π. f V −−→ W −−   π   i V / ker f − − → im f −− ˜ f Demostraci´n. El monomorfismo i es la inclusi´n can´nica, i(w) = w, ∀w ∈ f (V ). o o o El epimorfismo π es la proyecci´n can´nica, π(v) = v + ker f , ∀v ∈ V . o o ¯ El isomorfismo f se define como sigue: ¯ f (v + ker f) = f (v), ∀v ∈ V. ¯ aDebemos comprobar en primer lugar que f est´ bien definida. En efecto, si v +ker f = v + ker f, entonces ¯ ¯v − v ∈ ker f . Por lo tanto f (v) = f (v ), y f (v + ker f ) = f (v + ker f ). Debemos probar adem´s que f a ¯ es lineal, suprayectiva e inyectiva. La prueba de la linealidad de f es ¯rutinaria y la suprayectividad es evidente. ¯ ¯ Calculemos por ejemplo, ker f . Si v + ker f ∈ ker f , entonces f(v) = 0, y por lo tanto v ∈ ker f , yv + ker f = ker f que es el cero del espacio cociente. ¯ ¯ Finalmente calculemos i ◦ f ◦ π(v) = i ◦ f (v + ker f) = i(f (v)) = f(v). QEDCorolario 3.2.1 dim V = dim ker f + dim f (V ). ¯ Demostraci´n. Efectivamente, como f es un isomorfismo, tenemos que dim V / ker f = dim f (V ), opero dim V/ ker f = dim V − dim ker f. QED La composici´n de dos aplicaciones f : U → V , g: V → W se dir´ exacta si ker g = im f. Se tienen las o asiguientes propiedades elementales:Ejercicio 3.2.1 Probar las siguientes afirmaciones. f 1. 0 → U → V es exacta ⇐⇒ f es un monomorfismo. f 2. U → V → 0 es exacta ⇐⇒ f es un epimorfismo. 3. 0 → U → V → W → 0 es exacta ⇐⇒ V /U ∼ W . =
  • 60. ´3.3. REPRESENTACION MATRICIAL Y CAMBIOS DE BASE 533.2.2 Otros teoremas de isomorf´ ıaAdem´s del teorema de isomorf´ anterior existen otros teoremas que permiten identificar espacios vec- a ıatoriales construidos a partir de operaciones suma y cociente. Citaremos dos.Teorema 3.2.2 Sean W ⊂ U ⊂ V un espacio vectorial y dos subespacios contenidos el uno en el otro.Entonces: V/W ∼ = V /U. U/W Demostraci´ n. En primer lugar notemos que U/W es un subespacio de V /W ya que u + W ∈ V /W , o∀u ∈ U . Definamos la aplicaci´n f : V /W → V /U por f (v + W ) = v + U, ∀v ∈ V . Es claro que oesta aplicaci´n est´ bien definida ya que W ⊂ U . Por otro lado la aplicaci´n es suprayectiva y adem´s o a o aker f = {v + W | v ∈ U} = U/W . Entonces por el primer teorema de isomorf´ teorema 3.2.1, ıa, V/W V /W ∼ = = f(V /W ) = V /U. U/W ker f QEDTeorema 3.2.3 Sean U, V dos subespacios de un espacio vectorial. Entonces se verifica: U ∼ U +V = . U ∩V V Demostraci´ n. Definamos la aplicaci´n f : U → (U + V )/V por f (u) = u + V . La aplicaci´n f o o oes suprayectiva. En efecto, si x + V ∈ (U + V )/V , entonces x = u + v, con u ∈ U , v ∈ V . Por tantof(u) = x + V . Si calculamos el n´cleo de f tenemos, u ∈ ker f si f (u) = 0, por tanto u ∈ V , entonces uker f = U ∩ V . Aplicamos el primer teorema de isomorf´ a f y obtenemos el enunciado. ıa QED3.3 Representaci´n matricial y cambios de base o3.3.1 Representaci´n matricial de una aplicaci´n lineal o oSea f : V → W una aplicaci´n lineal entre los espacios vectoriales V, W (ambos sobre IK). Sea BV = o{ej }n una base de V (dim V = n) y BW = {ui }m una base de W (dim W = m). La imagen del vector j=1 i=1ej por f , f (ej ), ser´ una combinaci´n lineal de los vectores de BW , esto es: a o f (ej ) = A1j u1 + A2j u2 + · · · + Amj um , j = 1, . . . , n. (3.1)Los coeficientes Aij , i = 1, . . . , m, j = 1, . . . , n, pueden organizarse como una matriz m × n,   A11 A12 · · · A1n  A21 A22 · · · A2n    A= . . .. . .  . . . . . .  . Am1 Am2 · · · AmnLa primera columna est´ formada por los coeficientes de la imagen de e1 en la base ui ,..., la j-´sima a ecolumna est´ formada por las coordenadas de la imagen del vector ej en la base ui , etc. Si colocamos los avectores ui formando una matriz 1 × m, (u1 , . . . , um ) podemos escribir: (f (e1 ), . . . , f (en )) = (u1 , . . . , um ) · A.Llamaremos a la matriz A la representaci´n matricial de f en las bases BV y BW y en ocasiones por omotivos de precisi´n en la notaci´n escribiremos tambi´n A(f ; BV , BW ) con indicaci´n expresa de las o o e obases respecto de las cuales est´ definida. a
  • 61. 54 TEMA 3. APLICACIONES LINEALES Nota. Es evidente que en la definici´n de la matriz asociada a una aplicaci´n lineal en dos bases o o dadas hay una serie de convenciones arbitrarias, por ejemplo en la ecuaci´n (3.1), podr´ o ıamos haber etiquetado los coeficientes en el desarrollo como sigue: f (ej ) = Aj1 u1 + Aj2 u2 + · · · + Ajm um , j = 1, . . . , n. Podemos mantener la definici´n de A o cambiar filas por columnas. En uno u otro caso algunas o de las expresiones que aparecer´n a continuaci´n adoptar´n formas diferentes. En cualquier a o a caso el conjunto de convenciones que hemos adoptado son consistentes con la notaci´n tensorial o com´nmente aceptada en nuestros d´ (aunque no siempre ha sido as´ y a ella nos atendremos u ıas ı) en todo lo que sigue. La utilidad de la representaci´n matricial de A de f se aprecia mejor si describimos como se transfor- oman las coordenadas de un vector x al tomar su imagen f(x). Si denotamos por xj las coordenadas de x en n mla base ej , x = j=1 xj ej , y si denotamos por y i las coordenadas de f(x) en la base ui , f (x) = i=1 y i ui ,tendremos,   n n n m f (x) = f  xj ej  = xj f (ej ) = xj Aij ui , j=1 j=1 j=1 i=1 m m n j npor tanto i=1 y i ui = i=1 ui lo que implica que y i = j=1 Aij xj . Denotando por X el j x Aij    1  x1 y  .   . vector columna X =  .  y an´logamente con Y =  .  tenemos: . a . n x ym Y = A · X, (3.2)o escribi´ndolo expl´ e ıcitamente:     A11 A12 ··· A1n   y1  A21  x1  .   A22 ··· A2n   . .  . = . . . .. . · .  .  .. . . . . .  ym xn Am1 Am2 ··· AmnLa ecuaci´n anterior Y = AX describe como act´a f sobre las coordenadas de los vectores en unas bases o udadas, pero las bases no son unicas. Estudiaremos a continuaci´n como cambia la ecuaci´n anterior ´ o ocuando cambiamos de bases.3.3.2 Representaci´n matricial de la composici´n de aplicaciones o oConsideremos ahora dos aplicaciones lineales f : U → V y g: V → W . La composici´n de las aplicaciones of y g es de nuevo una aplicaci´n lineal g ◦ f : U → W (proposici´n 3.1.1). Si fijamos bases BU = {ui }, o oBV = {vj } y BW = {wk } de los espacios U, V y W respectivamente, tendremos una representaci´n omatricial A para la aplicaci´n f en las bases BU y BV , una representaci´n matricial B para la aplicaci´n o o olineal g en las bases BU y BW y una representaci´n matricial C para g ◦ f en las bases BU y BW . La opregunta que nos hacemos es ¿qu´ relaci´n existe entre A, B y C? e o Notemos que por definici´n de representaci´n matricial, ecuaci´n (3.1), tenemos para los tres casos: o o o f (ui ) = A1i v1 + A2i v2 + · · · + Ami vm , i = 1, . . . , n (3.3) g(vj ) = B1j w1 + B2j w2 + · · · + Brj wr , j = 1, . . . , m (3.4) g ◦ f (ui ) = C1i w1 + C2i w2 + · · · + Cri wr , i = 1, . . . , n. (3.5)Por lo tanto, desarrollando g ◦ f(ui ) en la ecuaci´n (3.5) tenemos, o g ◦ f (ui ) = g(f(ui )) = g(A1i v1 + A2i v2 + · · · + Ami vm ) m m r m,r = Ali g(vl ) = Ali Bkl wk = Ali Bkl wk , l=1 l=1 k=1 l=1,k=1
  • 62. ´3.3. REPRESENTACION MATRICIAL Y CAMBIOS DE BASE 55y comparando con el segundo miembro de la ecuaci´n (3.5) tendremos o r m,r Cki wk = Ali Bkl wk . k=1 l=1,k=1Como los vectores wk forman una base, tendremos por tanto, m Cki = Bkl Ali , l=1que en lenguaje de matrices, corresponde a la formula: C = BA.Hemos concluido, demostrando as´ el siguiente teorema. ıTeorema 3.3.1 La matriz correspondiente a la composici´n de dos aplicaciones lineales en bases dadas se oobtiene multiplicando las correspondientes matrices de cada una de las aplicaciones en el orden contrarioa su composici´n. o Notas. 1. Este teorema justifica “a posteriori” la definici´n del producto de matrices. El o producto de matrices no es por tanto una operaci´n ex´tica que tiene interesantes (y sorpren- o o dentes) aplicaciones sino que no es m´s que una manera especial de escribir la composici´n a o de aplicaciones y de ello emanan todas sus propiedades. 2. La no conmutatividad del producto de matrices simplemente refleja el hecho de que la composici´n de aplicaciones no es en general conmutativa. oEjercicio 3.3.1 Escribir la matriz que representa a las aplicaciones lineales D y L del ejemplo 3.1.4 enla base {1, x, . . . , xn , . . .}.Ejercicio 3.3.2 Sea V un espacio vectorial de dimensi´n n y α una permutaci´n de n elementos. Con- o osid´rese la aplicaci´n lineal fα : V → V definida por fα (ei ) = eα(i) donde B = {ei }n . Escribir la matriz e o i=1Aα asociada a fα en la base B. Probar que Aα Aβ = Aαβ , ∀α, β ∈ Sn .3.3.3 Cambios de basePunto de vista pasivoEste es el punto de vista que adoptamos en el cap´ ıtulo precedente, secci´n 2.5.3. Sea V un espacio vectorial oen el que cambiamos las bases; la base BV = {u1 , . . . , un } se cambia a la nueva base BV = {u1 , . . . , un }.Los vectores x ∈ V no son alterados, pero sus coordenadas variar´n: a n n x= xi ui = x i ui . i=1 i=1El vector columna X = (xi ) es el vector de las coordenadas antiguas y X = (x i ) es el vector columnade las coordenadas nuevas. La relaci´n entre ambas est´ proporcionada por o a X = P · X, (3.6) ncon ui = j=1 Pji uj como en la ecuaci´n (2.1), esto es, P es la matriz del cambio de base, o (u1 , . . . , un ) = (u1 , . . . , un ) · P.Si escribimos los vectores de la nueva base BV en funci´n de los de la antigua base BV , tendremos o n ui = Qji uj , j=1con Q la matriz inversa de P , y entonces X = Q−1X.
  • 63. 56 TEMA 3. APLICACIONES LINEALES Nota. El punto de vista pasivo es el m´s habitual cuando se trata de describir principios de a invariancia relativista en F´ ısica. En efecto los vectores de un espacio vectorial representan habitualmente “estados” de un sistema f´ ısico y las leyes de la F´ ısica no dependen de la base que escojamos para escribirlas, esto es, son independientes del “sistema de referencia” que utilicemos para describirlas. Hemos de notar que un cambio de base define un isomorfismo φ del espacio vectorial V a trav´s de la ef´rmula (ver proposici´n 3.1.2) o o φ(ui ) = ui , ∀i = 1, . . . n.Debemos interpretar que este isomorfismo no est´ modificando los vectores de V sino solamente los aobservadores, esto es, las bases utilizadas para describir los vectores en coordenadas. N´tese tambi´n que esta correspondencia entre cambios de bases e isomorfismos es biun´ o e ıvoca una vezque fijamos una base dada.Punto de vista activoA veces resulta conveniente adoptar otro punto de vista para discutir los cambios de bases en espaciosvectoriales. Imaginemos ahora que la base BV est´ fijada pero tenemos una transformaci´n lineal φ: V → a oV que cambia los vectores, x → φ(x). Esta transformaci´n lineal enviar´ los vectores ui de la base BV a o alos de un nuevo sistema ui , φ(ui ) = ui . Si la aplicaci´n φ es un isomorfismo, los vectores ui ser´n una o abase BV de V . La representaci´n matricial de φ en la base BV estar´ dada por: o a n φ(ui ) = ui = φji uj . j=1Pero ahora lo que nos importa no es la nueva base, sino el cambio de los vectores. As´ queremos obtener ı,las coordenadas del nuevo vector x = φ(x) respecto de la base BV , esto es: n φ(x) = xi ui . i=1Se obtiene que φ(x) = i xi φ(ui ) = i,j xi φji uj y por tanto, x j = i φji xi , o matricialmente, X = ΦX,donde Φ es la matriz con coeficientes φij . Nota. El punto de vista activo se utiliza cuando estamos interesados en estudiar el efecto de transformaciones en los estados de un sistema f´ ısico y sus propiedades de simetr´ En lo que ıa. sigue, cuando hablemos de cambios de base y cambios de coordenadas estaremos asumiendo el punto de vista pasivo.3.3.4 Representaci´n matricial en bases diferentes oSea f: V → W una aplicaci´n lineal y BV , BW bases respectivamente de V y W . Sea φV : V → V un oisomorfismo en V definiendo una nueva base de V , φV (BV ) = BV y φW : W → W un isomorfismo enW definiendo una nueva base φW (BW ) = BW de W . Denotaremos por vi los vectores de BV , esto esBV = {vi }; an´logamente BV = {vi }, BW = {wj } y BW = {wj }. Adem´s a a n m vi = Pji vj , wl = Qkl wk . (3.7) j=1 k=1La representaci´n matricial de f en las bases BV y BW vendr´ dada por una matriz A definida por o a m f (vi ) = Aki wk , k=1
  • 64. ´3.3. REPRESENTACION MATRICIAL Y CAMBIOS DE BASE 57y en las bases BV y BW , m f(vi ) = Ali wl . (3.8) l=1Por tanto, usando la ecuaci´n (3.7) en la ecuaci´n (3.8) tendremos, o o n n n m f (vi ) = f ( Pji vj ) = Pji f(vj ) = Pji Akj wk , j=1 j=1 j=1 k=1y an´logamente, a m m m Aki wk = Aki Qla wl , k=1 k=1 l=1por tanto m,m n m Aki Qlk wl = Pji Alj wl , k=1,l=1 j=1 l=1y la independencia lineal de los vectores wl implica que m n Aki Qlk = Pji Alj . k=1 j=1En otras palabras, utilizando notaci´n matricial, tenemos, o QA = AP,y despejando A en el primer miembro de la ecuaci´n (esto es, multiplicando por Q−1 por la izquierda), o A = Q−1 AP. (3.9) ˜Ejercicio 3.3.3 Con los isomorfismos φV y φW podemos construir una nueva aplicaci´n lineal f = oφ−1 ◦ f ◦ φV : V → W tal y como nos indica el diagrama adjunto. W ˜ ff V −−→ W −−   φV  φ V Vf −−→ W −− f ˜ Probar que la representaci´n matricial de f en las bases BV y BW es precisamente A . oEjercicio 3.3.4 Probar que el rango de la matriz asociada a una aplicaci´n lineal no depende de las obases en que se escriba. Si particularizamos la situaci´n anterior al caso en que f es un endomorfismo, esto es, una aplicaci´n o olineal f : V → V , podemos fijar la misma base BV en su dominio y en su rango. Cuando cambiemos debase, podemos realizar simult´neamente el cambio en su rango y su dominio con lo que tendremos que las amatrices P y Q de la discusi´n anterior coincidir´n y la f´rmula para el cambio de base de una realizaci´n o a o omatricial A de f , resultar´: a A = P −1 AP. (3.10)En el pr´ximo cap´ o ıtulo discutiremos el problema de determinar la expresi´n matricial m´s sencilla para o aun endomorfismo.
  • 65. 58 TEMA 3. APLICACIONES LINEALES3.4 Espacios de aplicaciones lineales3.4.1 El espacio dual de un espacio vectorialLa proposici´n 3.1.1 nos ense˜´ que las combinaciones lineales de aplicaciones lineales son de nuevo o noaplicaciones lineales. Este hecho nos conduce a considerar como candidatos a nuevos espacios vectorialesconjuntos cuyos elementos son aplicaciones lineales ya que podemos sumarlas y multiplicar por escalares.En particular si consideramos IK como un espacio vectorial de dimensi´n 1 sobre el propio cuerpo IK, olas aplicaciones lineales f : V → IK se llaman covectores o formas lineales sobre V y forman un espaciovectorial.Proposici´n 3.4.1 Sea V un espacio vectorial sobre IK. El conjunto de aplicaciones lineales f : V → IK oforman un espacio vectorial sobre IK denotado por V ∗ llamado el espacio dual de V . Adem´s dim V = adim V ∗ . Demostraci´n. Definimos la suma y el producto por escalares de aplicaciones lineales de la manera ohabitual (ver proposici´n 3.1.1). Con ellas V ∗ se convierte en un espacio vectorial sobre IK tras una ocomprobaci´n rutinaria de las propiedades de la suma y el producto por escalares. o Si B = {e1 , . . . , en } es una base de V , un covector f : V → IK tiene la forma f (x) = i xi λi , dondeλi = f(ei ). Definamos ahora una familia de covectores ei : V → IK, i = 1, . . . , n, como sigue: ei (ej ) = δj , i ∀i, j = 1, . . . , n,equivalentemente ei (x) = xi , donde x = i xi ei . Probemos que el conjunto B ∗ = {e1 , . . . , en } es unabase de V ∗ . Si f ∈ V ∗ , sea λi = f (ei ), entonces f = i λi ei . En efecto, i λi ei (x) = i λi xi = i f (xi ei ) =f (x), y B ∗ es un sistema generador. Probemos que B ∗ es libre. Supongamos que j µj ej = 0, entonces j µj ej (x) = 0 para todo x ∈ V . jTomemos x = ei , entonces 0 = j µj ej (ei ) = j µj δi = µi , y B ∗ es libre. QEDEjercicio 3.4.1 Probar que si f (x) = 0 para todo f ∈ V ∗ , entonces x = 0. Nota. Los espacios vectoriales V y V ∗ tienen la misma dimensi´n, por tanto son isomorfos de o acuerdo con el corolario 3.1.1, pero no hay ning´n isomorfismo can´nico entre ambos. Para u o cada elecci´n de una base B en V tenemos el isomorfismo proporcionado por la aplicaci´n o o φ: V → V ∗ , φ(ei ) = ei .Ejemplo 3.4.1 El espacio IK∗ se puede identificar con IK escogiendo como base el covector f que env´ ıa1 en 1. Si consideramos el espacio vectorial de los polinomios IK[x], cada elemento a de IK define un covectorfa como sigue: fa (P ) = P (a) ∈ IK.Ejercicio 3.4.2 Probar que el conjunto de covectores fai , ai = aj si i = j, i = 1, . . . , n + 1 son l.i.Ejemplo 3.4.2 El espacio (V ∗ )∗ es can´nicamente isomorfo a V . Por un lado dim(V ∗ )∗ = dim V ∗ = odim V , luego (V ∗ )∗ es isomorfo a V . Adem´s hay una aplicaci´n natural φ: V → (V ∗ )∗ definida por a oφ(x)(f ) = f (x), ∀f ∈ V ∗ , x ∈ V . Esta aplicaci´n es un monomorfismo ya que si φ(x) = 0, entonces f (x) = 0, para todo f ∈ V ∗ , por otanto x = 0. Por tanto φ es un isomorfismo.
  • 66. ´3.5. RANGO DE UNA APLICACION 593.4.2 Endomorfismos de un espacio vectorialUna aplicaci´n lineal f de un espacio vectorial V en s´ mismo se denominar´ un endomorfismo de V . El o ı aconjunto de aplicaciones lineales de V , esto es, de endomorfismos de V , se denotar´ por End(V ). a Al igual que ocurre con el espacio dual de V tenemos la siguiente proposici´n. oProposici´n 3.4.2 End(V ) es un espacio vectorial de dimensi´n (dim V )2 . o o Demostraci´ n. La demostraci´n de que End(V ) es un espacio vectorial es una repetici´n del caso o o odel espacio dual. Construyamos una base de End(V ). Sea B = {ei }n , una base de V . Denotemos por i=1ej : V → V las aplicaciones definidas por i ej (ek ) = δk ei , i j ∀i, j, k = 1, . . . , n,esto es, si x = i xi ei , entonces ej (x) = xj ei . La familia de aplicaciones B = {ej | i, j = 1, . . . , n} es una i ˜ ibase de End(V ). Probemos que es un sistema generador. Sea f ∈ End(V ). Entonces f (ei ) = k λki ek , i = 1, . . . , n.Definamos la aplicaci´no n λji ei . j i,j=1 nEntonces, i,j=1 λj ei (x) = i j i i,j λji x ej = i i x ( j λji ej ) = i i x f (ei ) = f (x). ˜ i j El sistema B es l.i. Si i,j µj ei = 0, actuando sobre el vector ek tendremos, i µi ei = 0, y por tanto kµi k = 0, para todo i, k. QED Nota. De manera an´loga se puede definir el espacio vectorial de aplicaciones lineales V → V ∗ , a V ∗ → V , V ∗ → V ∗ , etc. Todos estos espacios vectoriales tienen la misma dimensi´n n2 , si o n = dim V , pero son diferentes. Todos ellos son ejemplos de espacios de tensores de tipo (0, 2), (2, 0), (1, 1) respectivamente como se ver´ m´s adelante. a a3.4.3 Otros espacios de aplicaciones linealesDenotaremos por Hom(V, W ) el conjunto de aplicaciones lineales f : V → W .Proposici´n 3.4.3 El conjunto Hom(V, W ) es un espacio vectorial de dimensi´n dim V dim W . o o La demostraci´n es an´loga a la de la proposici´n 3.4.2. o a oEjercicio 3.4.3 Calcular la dimensi´n de los espacios vectoriales: Hom(V ∗ , W ∗ ), Hom(V, Hom(V, U)) y oHom(End(V ), U ).Ejercicio 3.4.4 Probar que existe un isomorfismo can´nico entre los espacios vectoriales: o Hom(V, Hom(W, U)), Hom(Hom(V ∗ , W ), U)3.5 Rango de una aplicaci´n oRetomamos el concepto de rango ya introducido en la secci´n 2.4 para familias de vectores de un espacio ovectorial V y para matrices en 2.6. Relacionaremos dicho concepto con propiedades de aplicacioneslineales.Definici´n 3.5.1 Si f : V → W es una aplicaci´n lineal, llamaremos rango de f a la dimensi´n de f(V ), o o oo en otras palabras al n´mero de vectores independientes en la imagen de una base cualquiera de V . El urango de una aplicaci´n se denotar´ por r(f ) o m´s expl´ o a a ıcitamente rango(f ).
  • 67. 60 TEMA 3. APLICACIONES LINEALES De la definici´n se deduce inmediatamente que si BV es una base de V , entonces r(f) = r(f(BV )), ya oque f (V ) = lin f (BV ), y por tanto dim f(V ) = r(f (BV )). La relaci´n entre el rango de una matriz A y el rango de una aplicaci´n lineal est´ dada por la siguiente o o aproposici´n. oProposici´n 3.5.1 Si A es una representaci´n matricial de f : V → W , entonces: o o r(f ) = rc (A). Demostraci´n. Recordemos que el rango por columnas de A, rc (A) es el n´mero de vectores columna o ul.i. Es f´cil ver que los vectores columna Aj , Ak son l.i. si y s´lo si f(ej ) y f (ek ) son l.i. En efecto, a oλf (ej ) + µf (ek ) = 0 es equivalente a (λAlj + µAlk )el = 0, lo cual es cierto si y s´lo si λAlj + µAlk = 0. El oargumento anterior nos indica que los vectores columna Aj1 , . . . , Ajr , ser´n l.i. si y s´lo si f (ej1 ), . . . , f(ejr ) a oson l.i., y por tanto la proposici´n queda probada. o QEDCorolario 3.5.1 Si A es equivalente a A, entonces rc (A) = rc (A ). Demostraci´n. En efecto, la dim f(V ) no depende de las bases que escojamos. o QED Nota. El teorema 2.6.1 nos mostr´ que el rango de filas y el rango de columnas de una matriz o coinciden. Por tanto los resultados anteriores se pueden enunciar directamente utilizando el rango de la matriz representando a la aplicaci´n f . En cualquier caso es significativo que o en las demostraciones es el rango por columnas el que aparece de manera natural. ¿C´mo o aparece el rango por filas en este contexto? En primer lugar observaremos que rango de filas de A = rango de columnas de At donde (At )ia = Aai .Nos interesa hallar una aplicaci´n lineal relacionada con f tal que su representaci´n matricial sea At . o oDefinici´n 3.5.2 Sea f : V → W es una aplicaci´n lineal; llamaremos aplicaci´n transpuesta o dual de o o of y se denotar´ por f ∗ a la aplicaci´n f ∗ : W ∗ → V ∗ definida por a o (f ∗ (α))(v) = α(f (v)), ∀α ∈ W ∗ , v ∈ V.Proposici´n 3.5.2 Si A es la representaci´n matricial de f en las bases BV , BW entonces At es la o orepresentaci´n matricial de f ∗ en las bases duales BV , BW . o ∗ ∗ Demostraci´n. En efecto, si BV = {e1, . . . , en }, la base dual BV = {e1 , . . . , en } se define como o ∗ jej (ei ) = δi tal y como vimos en la proposici´n 3.4.1 y de manera an´loga para BW = {u1 , . . . , um } y o a nsu base dual BW = {u1 , . . . , um }. Calculemos f ∗ (ui ) = ∗ ∗ j ∗ i j=1 Aji e , pero por otro lado f (u )(ei ) = i i m n ∗ j ∗u (f(ei )) = u ( j=1 Aji uj ) = Aji . Si evaluamos j=1 Aji e en ei , obtenemos Aij = Aji , y por tantoA∗ = At . QED Por tanto rf (A) = r(f ∗ ).Proposici´n 3.5.3 r(f ) = dim V − dim ker f . o Demostraci´n. En efecto, f : V → W y por el primer teorema de isomorf´ V / ker f ∼ f (V ), o ıa, =entonces dim V − dim ker f = dim f (V ) = r(f ). QED Podemos por tanto ofrecer otra demostraci´n del teorema 2.6.1 ligada a las propiedades y estructura ode las aplicaciones lineales.Teorema 3.5.1 rf (A) = rc (A).
  • 68. 3.6. SISTEMAS DE ECUACIONES LINEALES 61 Demostraci´ n. Tenemos rf (A) = rc (At ) = r(f ∗ ) = dim W ∗ − dim ker f ∗ . o Calculemos ker f ∗ . Si α ∈ ker f ∗ , entonces f ∗ (α) = 0. Por tanto f ∗ (α)(v) = 0, ∀v ∈ V , y entoncesα(f(v)) = 0 para todo v, y as´ α(f (V )) = 0. ı Sea BW una base de W adaptada a f(V ), esto es BW = {u1, . . . , ur , ur+1 , . . . , um }, y {u1 , . . . , ur } esuna base de f (V ) (notemos que entonces rango f = r). Por tanto la condici´n α(f(V )) = 0 implica que oα = λr+1 ur+1 +· · ·+λm um . En efecto, un elemento general de W ∗ tendr´ la forma α = λ1 u1 +· · ·+λm um , apero ui ∈ f (V ), i = 1, . . . , r, por tanto α(ui ) = 0, i = 1, . . . , r, y por tanto λ1 = · · · = λr = 0. Concluimosque dim ker f ∗ = m − r, y as´ rango f ∗ = m − (m − r) = r. ı QED3.6 Sistemas de ecuaciones linealesEn muchas ocasiones los textos de ´lgebra lineal comienzan con una discusi´n de sistemas de ecuaciones a olineales. Hemos pospuesto deliberadamente retrasar tal discusi´n hasta este momento y tratar los sistemas ode ecuaciones lineales como una mera aplicaci´n de la teor´ de aplicaciones lineales. o ıa En cualquier caso, un sistema de m ecuaciones lineales con n inc´gnitas x1, . . . , xn consiste en una ofamilia de ecuaciones a11 x1 + a12 x2 + · · · + a1n xn = b1 a21 x1 + a22 x2 + · · · + a2n xn = b2 . . . am1 x1 + am2x2 + · · · + amn xn = bmcon aij ∈ IK, bi ∈ IK. El problema consiste en determinar cuando existen y cu´les son los valores de ax1 , . . . , xn en IK que satisfacen dichas ecuaciones. Podemos escribir el sistema anterior en forma matricial. Si A denota la matriz m × n definida porA = (aij ), i = 1, . . . , m, j = 1, . . . , n y X, B son las matrices columnas n × 1 y m × 1 respectivamente,     x1 b1  .   .  X =  . , . B =  . , . xn bmtenemos: A · X = B.Si pensamos que X y B son vectores en IK y IKm respectivamente, y A denota una aplicaci´n lin- n oeal f : IKn → IKm en las bases can´nicas, tenemos que el problema de resolver el sistema anterior, es oequivalente a determinar el conjunto f −1 (B). El siguiente teorema resuelve todas estas cuestiones. Denotaremos por (A | B) la matriz que seobtiene a˜adiendo el vector columna B a la matriz A y se llamar´ matriz extendida de A por B. n aTeorema 3.6.1 Rouch´–Frobenius. Dado un sistema de ecuaciones A · X = B, de m ecuaciones con en inc´gnitas, el sistema posee soluci´n si y s´lo si r(A) = r(A | B). Adem´s si X0 es una soluci´n, el o o o a oconjunto de todas las soluciones es X0 + ker A. Demostraci´ n. ⇐) Supongamos que r(A) = r(A | B). Entonces rc (A) = rc (A | B), por tanto odim(lin{A1, A2 , . . . , An }) = dim(lin{A1, . . . , An , B}) lo que quiere decir que B ∈ lin{A1 , . . . , An }, esto esexisten n´meros x0i tales que B = x01 A1 + · · · + x0n An = A · X0 , y el vector X0 es una soluci´n. u o ⇒) Si X0 es una soluci´n de A ·X = B, entonces A · X0 = B y desarrollando el producto por columnas otenemos x01 A1 + x02 A2 + · · · + x0n An = B, luego B ∈ lin{A1, . . . , An }, ⇒ dim(lin{A1 , . . . , An }) =dim(lin{A1, . . . , An , B}) ⇒ r(A) = r(A | B). Finalmente si X0 es una soluci´n, el conjunto de soluciones es X0 + ker A. En efecto, si X1 es otra osoluci´n, A · (X1 − X0 ) = 0 ⇒ X1 − X0 ∈ ker A. o QED
  • 69. 62 TEMA 3. APLICACIONES LINEALESDefinici´n 3.6.1 El sistema A · X = B se dir´ compatible si r(A) = r(A | B) e incompatible en caso o acontrario. Si el sistema A · X = B es compatible, dado que r(A) = dim IKn − dim ker A, el sistema tendr´ una aunica soluci´n si ker A = 0, esto es, si r(A) = dim IKn = n = n´mero de inc´gnitas.´ o u o Podemos resumir la situaci´n como: o – Si r(A) = r(A | B) ⇒ Incompatible. – Si r(A) = r(A | B) ⇒ Compatible Si r(A) = n = n´mero de inc´gnitas ⇒ Compatible determinado u o Si r(A) < n ⇒ Compatible indeterminadoEjemplo 3.6.1 Consideremos un sistema homog´neo, esto es un sistema tal que B = 0. Es obvio que eel sistema siempre tiene una soluci´n, la soluci´n trivial X = 0. El sistema siempre es compatible. El o osistema ser´ compatible determinado cuando r(A) = n´mero de inc´gnitas, en cuyo caso s´lo habr´ una a u o o asoluci´n, la soluci´n trivial. Si hay tantas ecuaciones como inc´gnitas, esto es equivalente a que la matriz o o oA sea invertible. El sistema ser´ compatible indeterminado cuando r(A) < n y las soluciones ser´n todos a alos vectores en el n´cleo de A. u3.7 DeterminantesEl concepto de determinante es tan importante que aunque un tratamiento preciso de esta noci´n requiere oadentrarnos en el ´mbito del ´lgebra tensorial, est´ justificado el esfuerzo adicional que vamos a realizar a a aen las pr´ximas secciones por el gran r´dito que nos ha de reportar en futuras empresas. o e3.7.1 Aplicaciones multilineales mDefinici´n 3.7.1 Si V es un espacio vectorial sobre IK, diremos que una aplicaci´n f: V × · · · ×V → IK o oes m-multilineal si, i. f(x1, . . . , xi + yi , . . . , xm ) = f (x1 , . . . , xi , . . . , xm ) + f (x1 , . . . , yi , . . . , xm ), ii. f (x1 , . . . , λxi , . . . , xm ) = λf (x1 , . . . , xi , . . . , xm ), ∀i = 1, . . . , m, x1 , . . . , xm , y1, . . . ym ∈ V , λ ∈ IK. Nota. Es f´cil comprobar que el conjunto de aplicaciones multilineales es un espacio vectorial a de dimensi´n (dim V )n . o Una aplicaci´n m–lineal f se dir´ que es antisim´trica si, o a e f (xα(1) , . . . , xα(i) , . . . , xα(m) ) = (α)f (x1 , . . . , xi , . . . , xm ),donde α ∈ Sm y (α) es la signatura de la permutaci´n. oDefinici´n 3.7.2 Una aplicaci´n m–multilineal antisim´trica se llama una m–forma lineal. o o e Si f es una aplicaci´n m–multilineal y B = {ei } es una base de V , f queda determinada por sus ovalores sobre las familias de vectores ei1 , . . . , eim , esto es, si xk ∈ V , tendremos que xk = ik xik eik , y kentonces, n f(x1, . . . , xm ) = xi1 . . . xim f (ei1 , . . . , eim ). 1 m i1 ,...,im =1Los n´ meros λi1 i2 ...im = f(ei1 , . . . , eim ) son las coordenadas de f en una cierta base. uEjercicio 3.7.1 Si f es una m–forma lineal, se verifica f (. . . , x, . . . , x, . . .) = 0, para todo x ∈ V .Proposici´n 3.7.1 Una m–forma lineal f en V queda determinada dando sus valores sobre las familias ode vectores ei1 , . . . , eim tales que 1 ≤ i1 < i2 < . . . < im ≤ n, donde B = {ei }n es una base de V . i=1
  • 70. 3.7. DETERMINANTES 63 Demostraci´ n. En efecto, si tomamos una familia cualquiera de m vectores en una base B = {ei }, oej1 , ej2 , . . . , ejm existe una permutaci´n α ∈ Sm tal que 1 ≤ α(j1 ) = i1 < α(j2 ) = i2 < · · · α(jm ) = im ≤ on. En efecto, no hay m´s que tomar la permutaci´n que es la identidad en el complementario del conjunto a o{j1 , j2 , . . . , jm }, y la permutaci´n que env´ j1 al m´ o ıa ınimo de j1 , j2 , . . . , jm ; que env´ j2 al m´ ıa ınimo delconjunto anterior excepto la imagen de j1 , etc. Entonces es evidente debido a la antisimetr´ de f que ıa f (ej1 , . . . , ejm ) = (α)f (ei1 , . . . , eim ).Por tanto f queda determinada sobre familias de vectores satisfaciendo la condici´n del enunciado. QED oEjercicio 3.7.2 Probar que el n´mero de familias de vectores que determinan una m–forma lineal es u n m .Teorema 3.7.1 Si dim V = n todas las n–formas lineales son proporcionales. Demostraci´ n. En efecto, seg´n el ejercicio 3.7.2, el n´mero de familias que determinan una n– o u uforma en un espacio de dimensi´n n es n = 1. Por lo tanto si f es la aplicaci´n definiendo tal forma, o n obasta especificar el n´mero u λ = f (e1 , e2 , . . . , en ),donde B = {ei } es una base cualquiera del espacio V . QED Observemos que si f es una n–forma en un espacio de dimensi´n n, tendremos para cualquier familia ode vectores x1, . . . , xn , que, n f (x1 , . . . , xn ) = x1i1 · · · xnin f (ei1 , . . . , ein ), i1 ,...,in =1pero como f se anula sobre dos vectores id´nticos, en la suma anterior ´ e ındices ik repetidos no contribuir´n ay s´lo quedar´n los t´rminos en que todos los i1 , . . . , in sean diferentes, esto es los etiquetados por las o a epermutaciones de 1, . . . , n, y por tanto: f (x1 , . . . , xn ) = x1α(1) · · · xnα(n) f (eα(1), . . . , eα(n) ). α∈SnPor otro lado debido a la antisimetr´ de f, podemos reorganizar los vectores eα(1) , . . . , eα(n) , en su ıaargumento y llevarlos al orden natural e1 , . . . , en . Para hacer esto podemos utilizar una descomposici´n ocualquiera en transposiciones de α (lo cual es siempre posible debido a la proposici´n 1.2.2). Dado que ocada transposici´n contribuye con un signo menos al valor de f, tras aplicar las transposiciones que oconvierte α en la identidad obtendremos un factor que ser´ la paridad de la permutaci´n α (recordar la a oproposici´n 1.2.3). Por tanto tendremos la siguiente f´rmula para f , o o f (x1 , . . . , xn ) = (α)x1α(1) · · · xnα(n) f (e1 , . . . , en ). (3.11) α∈Sn Si g es otra n–forma tendremos aplicando la f´rmula (3.11) o g(x1 , . . . , xn ) = (α)x1α(1) · · · xnα(n) g(e1, . . . , en ), α∈Sny por tanto si g(e1, . . . , en ) = µ y f(e1 , . . . , en ) = λ = 0, tendremos que µ g(x1, . . . , xn ) = f (x1 , . . . , xn ), λconfirmando de nuevo el resultado del teorema 3.7.1.Definici´n 3.7.3 Una n-forma no nula Ω en un espacio vectorial V de dimensi´n n se llama un volumen o oen V .
  • 71. 64 TEMA 3. APLICACIONES LINEALES Fij´monos que si seleccionamos una base B = {e1 , . . . , en } en V podemos definir un volumen asociado ea esta base a trav´s de la f´rmula e o ΩB (e1 , . . . , en ) = 1.Notemos que aplicando la f´rmula (3.11) obtenemos para tal volumen, o ΩB (x1 , . . . , xn ) = (α)x1α(1) · · · xnα(n) , (3.12) α∈Sndonde xij son las coordenadas del vector xi en la base B. Llamaremos a esta expresi´n el determinante ode los vectores x1 , . . . , xn respecto de la base B. Notemos que el cambio de base s´lo afectar´ el valor o ıade dicha expresi´n en un factor global seg´n el teorema 3.7.1. o uEjercicio 3.7.3 Calcular dicho factor para las bases B , B con matriz de cambio de base P .Ejercicio 3.7.4 Consid´rense en IR2 el volumen Ω definido en la base can´nica i, j por Ω( i, j) = 1. Si e ou1 , u2 son dos vectores, probar que el ´rea del paralelogramo definido por ellos est´ dada por Ω(u1 , u2 ). a aEjercicio 3.7.5 Consid´rese en IR3 el volumen Ω definido en la base can´nica i, j, k por Ω( i, j, k) = 1. e oPru´bese que el volumen del paralelep´ e ıpedo definido por los vectores u1 , u2 , u3 es Ω(u1 , u2 , u3 ). Estos dos ejercicios muestran la raz´n de llamar volumen a una n–forma en un espacio vectorial. oPodemos insistir en el hecho de que todas son proporcionales y por lo tanto multiplic´ndolas por un afactor podemos convertir unas en otras; as´ dada una base podemos siempre normalizar un volumen con ırespecto a la citada base haciendo que Ω(e1 , e2 , . . . , en ) = 1. Notas. 1. Las f´rmulas para el volumen en dimensi´n 2 y 3 obtenidas en los ejercicios 3.7.4, o o 3.7.5, son tambi´n v´lidas en cualquier dimensi´n. En efecto, si definimos en IRn la n–forma Ω e a o tal que en la base can´nica e1 , . . . , en toma el valor 1, entonces si u1 , . . . , un son n vectores en o IRn el volumen (en el sentido de la medida del conjunto con respecto a la medida de Lebesgue en IRn ) del paralelep´ ıpedo definido por ellos (esto es, la envolvente convexa de 0, u1 , . . . , un ) es precisamente Ω(u1 , . . . , un ). La demostraci´n de este hecho utiliza las propiedades de o transformaci´n de la medida habitual en IRn que se estudian en un curso de c´lculo avanzado. o a 2. Puede parecer extra˜o que el volumen de un conjunto de vectores pueda ser negativo. n Tal posibilidad est´ asociada a la orientaci´n de la familia de vectores que utilicemos. Los a o vol´ menes en un espacio vectorial real definen una orientaci´n en dicho espacio como sigue: u o Diremos que dos n–formas Ω, Ω son equivalentes si existe un n´mero real positivo λ ∈ IR+ u tal que Ω = λΩ. Tal relaci´n es claramente una relaci´n de equivalencia con exactamente o o dos clases. Llamaremos una orientaci´n en nuestro espacio vectorial a cada una estas dos o clases que denotaremos por [+] y [−]. Supongamos que Ω ∈ [+], entonces diremos que una base B = {v1 , . . . , vn } est´ orientada positivamente si Ω(v1 , . . . , vn ) > 0 y negativa en caso a contrario. N´tese que si una base est´ orientada negativamente basta intercambiar dos de sus o a vectores para obtener una orientada positivamente. Si utilizamos la base B para identificar V con IKn , la n–forma definida en IKn (en la base can´nica)ola llamaremos volumen can´nico en IKn o tambi´n determinante a secas. Si consideramos entonces o elos vectores a1, . . . , an en IKn y los identificamos con los vectores columna de una matriz llamaremosdeterminante de la matriz al determinante de los vectores a1 , . . . , an , esto es si la matriz n × n A est´ adefinida por   a11 a21 · · · an1  a12 a22 · · · an2    A= . . .. . ,  . . . . . .  . a1n a2n ··· annentonces det A = (α)aα(1)1 · · · aα(n)n (3.13) α∈Sn.
  • 72. 3.7. DETERMINANTES 653.7.2 Determinante de una aplicaci´n lineal oEl determinante de una matriz definido por la f´rmula (3.13) en la secci´n anterior deber´ ser tomado o o ıacomo la noci´n del determinante de una aplicaci´n lineal (o como la expresi´n en unas bases dadas de o o odicho concepto). En realidad el concepto de determinante de una aplicaci´n lineal surge de un modo oligeramente diferente y directamente relacionado con el ejercicio 3.7.3. Sea f : V → W una aplicaci´n lineal entre dos espacios vectoriales V y W de la misma dimensi´n n. o oFijemos un volumen ΩV en V y otro ΩW en W . Definamos una n–forma f ∗ ΩW en V como sigue: (f ∗ ΩW )(x1 , . . . , xn ) = ΩW (f (x1 ), . . . , f (xn )), ∀x1 , . . . , xn ∈ V.(N´tese que si las dimensiones de los espacios vectoriales fueran diferentes f ∗ ΩW no ser´ un volumen o ıaen V ). Por el teorema 3.7.1 tenemos que los vol´menes ΩV y f ∗ ΩW son proporcionales. Llamaremos udeterminante de f a dicho n´mero. uDefinici´n 3.7.4 Se llama determinante de f respecto de los vol´menes ΩV y ΩW al n´mero λ ∈ IK tal o u uque f ∗ ΩW = λΩVy se denotar´ por det(f ; ΩV , ΩW ). a Si f es un endomorfismo de V , llamaremos determinante de f al determinante respecto de cualquiervolumen en V y se denotar´ simplemente por det f. a N´tese que si f : V → V es lineal y ΩV es un volumen, entonces la ecuaci´n, o o f ∗ ΩV = det(f ΩV ), (3.14)define el determinante de f . Si cambiamos el volumen ΩV es lo mismo que multiplicar los dos miembrosde esta ecuaci´n por un mismo n´mero y el factor det f no var´ Dado que det f no depende de la base o u ıa.escogida cuando f es un endomorfismo, ¿cu´nto vale det f? aProposici´n 3.7.2 Sea f : V → V una aplicaci´n lineal y B = {ei }n una base de V . Si A = (aij ) es o o i=1la representaci´n matricial de f en dicha base, entonces, o det f = (α)aα(1)1 · · · aα(n)n . α∈Sn Demostraci´ n. En efecto calculemos det f utilizando la f´rmula (3.14). Calculemos en primer lugar o of ∗ ΩV , para ello todo lo que tenemos que hacer es calcular f ∗ ΩV (e1 , . . . , en ). Pero esto es, por definici´n, o f ∗ ΩV (e1 , . . . , en ) = ΩV (f(e1), . . . , f (en )) = ΩV ai1 1 ei1 , . . . , ain n ein = (α)aα(1)1 · · · aα(n)n ΩV (e1 , . . . , en ). i1 in α∈Sn QED N´tese que hemos obtenido que el determinante de f es simplemente el determinante de una repre- osentaci´n matricial A de f en una base arbitraria y donde el determinante de la matriz A est´ dado por o ala f´rmula (3.13). o 1. En la pr´xima secci´n veremos que este hecho es evidente a partir de las propiedades o o de los determinantes y de las leyes de transformaci´n de las representaciones matriciales de o endomorfismos. 2. En la definici´n de determinante de una matriz A se podr´ haber intercambiado columnas o ıan por filas y escribir dicho determinante exactamente igual que la f´rmula (3.12). Veremos a o continuaci´n que tal convenci´n es irrelevante porque el determinante de una matriz y su o o traspuesta coinciden. El resultado m´s general que no probaremos aqu´ es que el determinante a ı de una aplicaci´n lineal f : V → V y su dual f ∗ : V ∗ → V ∗ coinciden. o
  • 73. 66 TEMA 3. APLICACIONES LINEALES3.7.3 Determinantes de matrices y sus propiedadesSe puede desarrollar directamente la teor´ de determinantes y sus aplicaciones tomando como definici´n ıa ola f´rmula (3.13). A pesar de ello y como veremos a continuaci´n las propiedades de los determinantes re- o osultan transparentes (casi triviales) a partir de la fundamentaci´n conceptual desarrollada en las secciones oprevias.Definici´n 3.7.5 Sea A una matriz cuadrada n × n sobre el cuerpo IK. Llamaremos determinante de A oy lo denotaremos det A (o a veces tambi´n |A|) al n´mero e u det A = (α)Aα(1)1 · · · Aα(n)n . (3.15) α∈Sn En los casos n = 2 y n = 3 es f´cil recordar las expresiones de los determinantes, as´ a ı: a11 a12 = a11 a22 − a12 a21 , a21 a22y a11 a12 a13 a21 a22 a23 = a11 a22 a33 + a12 a23 a31 + a13a21 a32 − a13 a22a31 − a12 a21 a33 − a11 a23 a32 . a31 a32 a33Es claro a partir de la definici´n que el desarrollo del determinante de una matriz n × n tiene n! t´rminos. o ePor tanto la complejidad de su c´lculo aumenta extraordinariamente con el orden de A. aPropiedades de los determinantesProposici´n 3.7.3 La funci´n A → det A definida en el conjunto Mn (IK) tiene las propiedades sigu- o oientes: i. det A es una funci´n multilineal de las columnas de A. o ii. det A es una funci´n antisim´trica de las columnas de A. o e iii. det In = 1. Demostraci´n. Si utilizamos los resultados de la secci´n anterior, en el sentido de que el determi- o onante de A no es m´s que el volumen de los vectores columnas de A entonces las propiedades (i) y (ii) ason triviales. La propiedad (iii) es inmediata a partir de la definici´n del determinante de una aplicaci´n o olineal (3.14) ya que el determinante de la aplicaci´n identidad es 1. o A pesar de ello las propiedades anteriores se pueden probar directamente. i. Supongamos que A = (A1 . . . Ai + B i . . . An ), entonces: |A| = det(A1 . . . Ai + B i . . . An ) = (α)Aα(1)1 · · · (Aα(i)i + Bα(i)i ) · · · Aα(n)n α∈Sn = (α)Aα(1)1 · · · Aα(i)i · · · Aα(n)n + (α)Aα(1)1 · · · Bα(i)i · · · Aα(n)n α∈Sn α∈Sn = det(A1 . . . Ai . . . An ) + det(A1 . . . B i . . . A ). n ˜ ii. Denotemos por A = (A1 . . . Aj . . . Ai . . . An ) la matriz que se obtiene de la A intercambiando lacolumna i con la j. Entonces, ˜ det A = (α)Aα(1)1 · · · Aα(i)j · · · Aα(j)i · · · Aα(n)n α∈Sn = (α)Aα◦τij (1)1 · · · Aα◦τij (j)j · · · Aα◦τij (i)i · · · Aα◦τij (n)n α∈Sn = (β ◦ τij )Aβ(1)1 · · · Aβ(j)j · · · Aβ(i)i · · · Aβ(n)n β∈Sn = − (β)Aβ(1)1 · · · Aβ(j)j · · · Aβ(i)i · · · Aβ(n)n = − det A. β∈Sn
  • 74. 3.7. DETERMINANTES 67 iii. Es evidente a partir de la definici´n 3.15. o QED El siguiente teorema es una reformulaci´n en coordenadas de nuestro teorema fundamental 3.7.1. oTeorema 3.7.2 Sea D: Mn (IK) → IK una funci´n con las siguientes propiedades: o i. D es una funci´n lineal de las columnas de A ∈ Mn (IK). o ii. D es una funci´n antisim´trica en las columnas de A ∈ Mn (IK). o e Entonces existe una constante λ tal que D(A) = λ det A. Demostraci´ n. Es evidente que la funci´n D define una n–forma en el espacio vectorial IKn . Por lo o otanto por el teorema 3.7.1 D es proporcional a la n-forma definida por det A. QEDProposici´n 3.7.4 det A = det At . o Demostraci´ n. Se puede probar directamente de: det At = α∈Sn (α)Aα(1)1 · · · Aα(n)n y como oAα(1)1 · · · Aα(n)n = A1α−1 (1) · · · Anα−1 (n) al ser α → α−1 una aplicaci´n biyectiva de Sn el sumatorio osobre α es igual al sumatorio sobre α−1 . En cualquier caso podemos probarlo utilizando la caracterizaci´n odada por el teorema 3.7.2. Definamos una aplicaci´n D(A) = det At . Probemos que D es lineal en las columnas. Esto es, si oA = (A1 , . . . , Ai + B i , . . . An ), entonces det A = (α)Aα(1)1 · · · (Aα(i)i + Bα(i)i ) · · · Aα(n)n α∈Sn = (α)Aα(1)1 · · · Aα(i)i · · · Aα(n)n + (α)Aα(1)1 · · · Bα(i)i · · · Aα(n)n α∈Sn α∈Sn = D(A1 . . . Ai . . . An ) + D(A1 . . . B i . . . A ).n Del mismo modo que probamos que el determinante es antisim´trico en las columnas de A, proposici´n e o3.7.3 (ii), probamos que D es antisim´trica en las columnas de A. e Finalmente es inmediato probar que D(In ) = 1, y por tanto el coeficiente λ = 1. Seg´n el teorema uanterior 3.7.2, D(A) = det A y por tanto det At = det A. QEDProposici´n 3.7.5 Desarrollo de un determinante por filas y por columnas. Si A = (aij ) es una matriz on × n, entonces: n n det A = (−1)i+j aij Mij (A) = (−1)i+j aij Mij (A), (3.16) j=1 i=1donde Mij (A) es el determinante de la matriz que se obtiene al quitar la fila i y la columna j de la matrizA. Mij (A) se denomina el menor (i, j) de la matriz A o tambi´n el complemento del elemento aij . e Demostraci´ n. La f´rmula anterior se sigue del desarrollo: o o det A = (α)a1α(1) · · · anα(n) = (α)ai1 (a1α(1) · · · aiα(i) · · · anα(n) ) ˆ α∈Sn α ∈ Sn α(i) = 1 + (α)ai2 (a1α(1) · · · ˆiα(i) · · · anα(n) ) + · · · a α ∈ Sn α(i) = 2 + (α)ain (a1α(1) · · · ˆiα(i) · · · anα(n) ) a α ∈ Sn α(i) = n QED
  • 75. 68 TEMA 3. APLICACIONES LINEALESProducto de determinantes e inversa de una matrizTeorema 3.7.3 Dadas dos matrices n × n A y B con coeficientes en IK, se verifica: det(AB) = det A det B. (3.17) Demostraci´n. Podemos demostrarlo f´cilmente utilizando la definici´n 3.14 del determinante. En o a oefecto, si f es un endomorfismo representado por A y g es un endomorfismo representado por B (en lamisma base), entonces det BAΩ = (g ◦ f )∗ Ω = f ∗ ◦ g ∗ Ω = f ∗ (g∗ Ω) = f ∗ (det BΩ) = det Bf ∗ Ω = det B det AΩ. Se puede probar tambi´n directamente utilizando la definici´n 3.13 y manipulando las sumas adecuada- e omente. Otra demostraci´n se puede realizar aplicando el Teorema 3.7.2 a la aplicaci´n D(A) = det(AB) o ocon B fija. QEDEjercicio 3.7.6 Probar la f´rmula (3.17) utilizando la definici´n 3.13 del determinante de una matriz. o oTeorema 3.7.4 La matriz A es invertible si y s´lo si det A = 0. Adem´s det(A−1 ) = (det A)−1. o a Demostraci´n. Si A es invertible, entonces existe una matriz A−1 tal que AA−1 = In . Por tanto, o1 = det In = det(AA−1 ) = det A det A−1 y as´ det(A−1 ) = (det A)−1 . ı Rec´ıprocamente si det A = 0, construimos la matriz cuyo elemento (i, j) es: 1 Bij = (−1)i+j Mji (A). det ACalculemos AB. Tenemos, n (−1)k+j (AB)ij = Aik Bkj = Aik Mjk (A). det A k=1 k=1Si i = j, utilizando el desarrollo del determinante por columnas (3.16), obtenemos, n 1 det A (AB)ii = (−1)i+k Aik Mik (A) = = 1. det A det A k=1Si i = j, entonces (AB)ij = 0 ya que es el desarrollo por columnas del determinante de la matriz A conla columna j reemplazada por la i, esto es con dos columnas iguales, y por tanto 0. QED La demostraci´n anterior nos ha proporcionado de paso una expresi´n expl´ o o ıcita de la inversa de unamatriz: 1 (A−1)ij = (−1)i+j Mji (A). (3.18) det AProposici´n 3.7.6 C´lculo del rango de una matriz. El rango de una matriz A es igual al m´ximo o a ade los ´rdenes de sus menores no nulos, donde llamamos menor de una matriz al determinante de una osubmatriz cuadrada y orden del menor al orden de la submatriz.Ejercicio 3.7.7 Probar la proposici´n anterior. oProposici´n 3.7.7 Regla de Cramer. Dado el sistema lineal de ecuaciones AX = B, si A es invertible osu soluci´n es ´nica y es X = A−1 B. Expl´ o u ıcitamente: a11 ··· b1 ··· a1n a21 ··· b2 ··· a2n . . .. . . .. . . . . . . . an1 · · · bn · · · ann xi = , a11 · · · a1n a21 · · · a2n . . .. . . . . . an1 · · · ann
  • 76. 3.7. DETERMINANTES 69donde el vector B se halla en la columna i del determinante del numerador.Ejercicio 3.7.8 Probar la proposici´n anterior 3.7.7. o
  • 77. 70 TEMA 3. APLICACIONES LINEALES
  • 78. Tema 4Formas can´nicas de endomorfismos o Diagonalizaci´n. Autovectores y autovalores. Subespacios invariantes. Ecuaci´n carac- o o ter´ ıstica. Endomorfismos nilpotentes. Formas can´nicas de endomorfismos. Teorema o de Cayley-Hamilton. Polinomio m´ ınimo4.1 Diagonalizaci´n oSea V un IK-espacio vectorial de dimensi´n finita, IK = IR,C. Un endomorfismo de V , f ∈ End(V ) es ouna aplicaci´n lineal de V en V . o Sabemos que dada un base de V , B = {u1 , . . . , un }, se asocia a un endomorfismo f una matriz A,construida de la forma siguiente (ver 3.3.1): n f (ui ) = aji uj , A = (aij ) = A(f, B) j=1Las columnas de A son las coordenadas de los vectores im´genes de la base B, expresadas en esta base. a Si cambiamos de base: B = {ui } −→ B = {ui }con matriz cambio de base P : n ui = Pji uj , P = (Pij ), det P = 0, j=1la matriz A cambia a una matriz A = M (f, B ) dada por: A = P AP −1 . (4.1)La f´rmula anterior corresponde a la f´rmula (3.9) cuando la aplicamos al mismo cambio de bases tanto o oen el dominio como en el rango de f. N´tese que si ambas bases est´n referidas a una tercera (como por ejemplo, en el caso de IRn , con las o abases B y B escritas en la base can´nica): o n n ui = qji ej , ui = qji ej , j = 1, . . . , n j=1 j=1se tienen dos matrices:     q11 ··· q1n q11 ··· q1n  . . ,  . . , Q= .. .  . Q = .. .  . qn1 ··· qnn qn1 ··· qnn 71
  • 79. 72 ´ TEMA 4. FORMAS CANONICAS DE ENDOMORFISMOSen las que las columnas son las coordenadas de los vectores de las bases B y B en la tercera base {ei }.La matriz de cambio de base es ahora muy sencilla: el cambio de base de B a {ei } viene dado por Q y elde {ei } a B por: (Q )−1 , luego el de B a B es P = (Q )−1 Q De acuerdo con estas ideas, el objetivo de este tema es encontrar una base B en la cual la matrizA(f, B) sea lo m´s sencilla posible. a Es muy f´cil persuadirse que si utilizamos cambios de bases diferentes en el dominio y en el rango de ala aplicaci´n f es posible hallar una expresi´n para f de la forma o o Ir 0 , (4.2) 0 0donde r es el rango de f . En efecto, basta tomar una base {u1 , . . . , us } del n´cleo de f y extenderla a todo uV , as´ B = {v1 , . . . , vr , u1 , . . . , us }, con r = r(f ) y r + s = dim V . Tomemos los vectores f (v1 ), . . . , f (vr ) ıque forman una base de im f y completemos dicha base hasta obtener una base B de V . Es obvio que lamatriz asociada a f en estas dos bases es la descrita en (4.2). Por el contrario si estamos describiendo nuestro endomorfismo f desde una base dada, nos interesar´ aaveriguar como cambia la forma de sus matrices asociadas bajo las transformaciones (4.1). Diremos que dos matrices A y A son equivalentes o conjugadas si existe una matriz invertible Ptal que A = P AP −1 . Dicha relaci´n es de equivalencia. Desde un punto de vista asociado a la teor´ o ıade grupos la relaci´n anterior corresponde a la conjugaci´n por el grupo general lineal GL(n, IK) en el o oconjunto de matrices Mn (IK). El problema que estamos planteando consiste en buscar un elemento lom´s sencillo posible en la ´rbita de A bajo la acci´n por conjugaci´n del grupo general lineal. a o o o El problema de determinar formas can´nicas de endomorfismos consiste en describir el espacio cociente, oesto es las clases de equivalencia, del conjunto de matrices con respecto a la relaci´n de equivalencia oanterior.4.1.1 Matrices diagonalesDefinici´n 4.1.1 Una matriz diagonal A ∈ Mn (IK) tiene todos sus elementos cero salvo los de la diag- oonal:   a11  ..  A= . . annUna matriz diagonal A queda definida por las f´rmulas: o 0 si i=j Aij = , aii si i=jo equivalentemente Aij = aii δij , y la representaremos habitualmente como A = diag(a11 , . . . , ann ). Aceptaremos que ´sta es la forma m´s sencilla de escribir un endomorfismo en una base adecuada. e aSin embargo no siempre es posible encontrar un base en la cual el endomorfismo en cuesti´n venga orepresentado por una matriz diagonal. En este caso, nos veremos obligados a contentarnos con unarepresentaci´n tambi´n sencilla (forma can´nica de Jordan) pero no diagonal. o e oDefinici´n 4.1.2 Diremos que un endomorfismo f es diagonalizable si existe una base del espacio vec- otorial tal que la matriz asociada a f en dicha base es diagonal. De manera an´loga podemos decir que una matriz es diagonalizable si existe una matriz equivalente aa ella que es diagonal. 1 1Ejemplo 4.1.1 Consideremos la matriz A = . Estudiemos como cambia bajo conjugaci´n. Si o 0 1 a bP = es una matriz invertible ad − bc = 0, entonces A = P −1AP es, c d 1 d −b 1 1 a b 1 ad + dc − bc d2 A = = 2 . ad − bc −c a 0 1 c d ad − bc −c ad − bc − cd
  • 80. 4.2. AUTOVALORES Y AUTOVECTORES 73Por tanto A ser´ diagonalizable solamente si c = d = 0 lo cual es imposible ya que P ha de ser invertible. aEjercicio 4.1.1 Probar que el operador D en el espacio de polinomios no es diagonalizable. Probar quecualquier operador diferencial en el espacio de polinomios no es diagonalizable.Ejercicio 4.1.2 Probar que si f es diagonalizable cualquier potencia de f tambi´n lo es. e4.2 Autovalores y autovectoresEn la descripci´n de un endomorfismo juegan un papel crucial los vectores cuya imagen por f es propor- ocional a ellos mismos.Definici´n 4.2.1 Sea f ∈ End(V ). Se dice que λ ∈ IK es un autovalor (valor propio) de f si existe un ovector v ∈ V, v = 0 tal que: f (v) = λv. (4.3)En este caso, se dice que v es un autovector (vector propio) de f con autovalor λ. Es evidente que cuantos m´s autovectores encontremos para un endomorfismo, m´s f´cil resultar´ a a a adescribirlo. As´ para el endomorfismo identidad todos los vectores son autovectores con autovalor 1. ıDefinici´n 4.2.2 El espectro de f es el conjunto de sus autovalores: o σ(f) = {λ ∈ IK | λ autovalor de f }. N´tese que dado un autovector, existe un unico autovalor asociado a ´l (obviamente), pero a cada o ´ eautovalor puede corresponderle m´s de un autovector. aEjemplo 4.2.1 Consid´rese el endomorfismo f definido en un espacio vectorial V de dimensi´n 3 a e otrav´s de la asignaci´n: e o f (v1 ) = v1 + v2 + v3 , f (v2 ) = v2 + v3 , f(v3 ) = v3 ,donde v1 , v2, v3 forman una base de V . Si resolvemos la ecuaci´n f (u) = λu, encontramos que necesari- oamente λ = 1 y u = v3 . Por tanto σ(f ) = {1}.Ejercicio 4.2.1 Probar que si f r = 0 para alg´n r > 0, entonces σ(f ) = {0}. uEjercicio 4.2.2 Probar que si f 2 = f y f = 0, entonces σ(f ) = {1, −1}. Dado un endomorfismo f diremos que un subespacio W es invariante si f (W ) ⊂ W .Proposici´n 4.2.1 Sea f ∈ End(V ). Para cada autovalor λ, se define el conjunto: o Vλ = {v ∈ V | f (v) = λv}.Se tiene que Vλ es un subespacio de V invariante bajo f . El espacio Vλ se puede definir como: Vλ = ker(f − λ1V ),donde 1V es la aplicaci´n identidad en V . o Demostraci´ n. La demostraci´n es evidente. La combinaci´n lineal de autovectores correspondi- o o oentes a un mismo autovalor es un autovector de ese autovalor. Y por supuesto, f(Vλ ) ⊂ Vλ ya que siv ∈ Vλ , f (f (v)) = f (λv) = λf (v). QED La proposici´n anterior (4.2.1), nos dice que los espacios de autovectores son invariantes. No todo osubespacio invariante de V es de este tipo. El siguiente resultado establece la relaci´n que existe entre los subespacios invariantes Vλ . o
  • 81. 74 ´ TEMA 4. FORMAS CANONICAS DE ENDOMORFISMOSProposici´n 4.2.2 Si λ1 , . . . , λr son autovalores distintos de f ∈ End(V ), la suma de los subespacios oVλi , i = 1, . . . , r es directa. Demostraci´n. Basta probar que si un vector pertenece a la suma de estos subespacios, se puede oescribir de forma unica como suma de vectores cada uno en un subespacio. Sea v ∈ Vλ1 + · · · + Vλr , ´v = v1 + · · · + vr , con vi ∈ Vλi . Probar la unicidad de la descomposici´n es equivalente a probar que si ov = 0, cada uno de los vectores vi es cero. Lo hacemos por inducci´n en r. Sea r = 1. El resultado es oinmediato. Supongamos que es cierto para r − 1. Tenemos, (para r): v1 + · · · + vr = 0Aplicando f a los dos miembros de esta igualdad: f (v1 ) + · · · + f (vr ) = 0,y como vi es un autovector de autovalor λi : λ1 v1 + · · · + λr vr = 0,de donde, restando la ecuaci´n anterior multiplicada por λr : o (λ1 − λr )v1 + · · · + (λr−1 − λr )vr−1 = 0.Pero ahora estamos en las condiciones del caso r − 1, por lo tanto: (λi − λr )vi = 0, i = 1, . . . , r − 1.Al ser todos los autovalores λi distintos, los vectores vi son cero (i = 1, . . . , r), lo que implica que vr = 0.Luego la suma es directa (lo que lleva, en particular, a que las intersecciones entre estos subespacios sereduzcan a {0}). QED N´tese que el subespacio correspondiente al autovalor 0 es el n´cleo de f . Por tanto un endomorfismo o uf ser´ invertible si y s´lo si el cero no est´ en su espectro. a o a4.3 Subespacios invariantes y matricesSi se tiene un subespacio invariante de un endomorfismo (del tipo Vλ o cualquier otro), en bases adaptadasa este subespacio las matrices que representan al endomorfismo tienen una forma especial.Proposici´n 4.3.1 Sea f ∈ End(V ) y W ⊂ V un subespacio de V invariante bajo f . Entonces, existe oun base de V , B, en la que la matriz de f tiene la forma: A B A(f, B) = . 0 C Demostraci´n. Sea BW una base de W que se ampl´ a una base de V . En esta base, la matriz o ıaes la dada en la proposici´n, porque las im´genes de los vectores de la base BW est´n contenidas en el o a asubespacio W que es invariante, por tanto sus coordenadas sobre el resto de la base B son cero. QED Cuando se dispone de un subespacio invariante bajo f, es posible definir una aplicaci´n lineal obtenida oa partir de f del espacio cociente V /W en s´ mismo: ı ˜ f: V /W −→ V /W v+W −→ f (v) + W o ˜ a La aplicaci´n f est´ bien definida y es lineal (debido al car´cter de subespacio invariante de W ). Sea aBW = {w1 , . . . , wr } una base de W y B = {w1 , . . . , wr , u1 , . . . , us } la base ampliada de V . Como hemosvisto en temas anteriores, una base del espacio cociente V /W es: BV /W = {ui + W | i = 1, . . . , s}. En labase B, la matriz de la aplicaci´n f es la dada por el teorema, es decir: o
  • 82. 4.3. SUBESPACIOS INVARIANTES Y MATRICES 75 r f (wi ) = aji wj , i = 1, . . . , r j=1 r s f (uk ) = bjk wj + cjk uj , k = 1, . . . , s j=1 j=1 o ˜con lo que la matriz de la aplicaci´n f en la base BV /W es: r s s s ˜ f (uk + W ) = f (uk ) + W = bjk wj + cjk uj + W = cjk uj + W = cjk (uj + W ) j=1 j=1 j=1 j=1 ˜Por lo tanto, la matriz de f en la base BV /W es igual a C. Si el subespacio W en el teorema anterior tiene dimension r, entonces A ∈ Mr (IK), C ∈ Mn−r (IK) yB ∈ Mr×(n−r) (IK). Si W es un subespacio invariante puede ocurrir que exista un suplementario U quetambi´n sea invariante. En tal caso la proposici´n anterior nos dice que existe una base tal que la matriz e oasociada a f tiene la forma: A 0 . 0 CTodav´ mas. Si V se puede descomponer como una suma directa de subespacios invariantes Wi , i = ıa1, . . . , N , V = W1 ⊕ · · · ⊕ WN , f (Wi ) ⊂ Wi , entonces podemos construir una base tal que la matrizasociada a f tiene la forma:   A1  A2    A= .. ,  .  ANy el orden de la matriz Ai es la dimensi´n de Wi . Tales matrices se dir´ que son diagonales por cajas. o a4.3.1 Diagonalizaci´n de endomorfismos y matrices oEl siguiente teorema establece una condici´n necesaria y suficiente para la existencia de una base en la oque el endomorfismo f viene representado por una matriz diagonal, es decir, una condici´n para que f osea diagonalizable.Teorema 4.3.1 Sea f ∈ End(V ). f es diagonalizable si y solo si existe una base de V formada porautovectores de f . Demostraci´ n. Si existe una base de autovectores: B = {u1 , . . . , un }, sus im´genes mediante f son o af(ui ) = λi ui , i = 1, . . . , n, por lo que la matriz asociada es:   λ1  ..  A(f, B) =  . . λnY en sentido contrario es igualmente sencillo. Si la matriz asociada es diagonal, los elementos de ladiagonal son justamente los autovalores, y los vectores de la base los vectores correspondientes. QED
  • 83. 76 ´ TEMA 4. FORMAS CANONICAS DE ENDOMORFISMOS4.4 La ecuaci´n caracter´ o ıstica4.4.1 C´lculo de autovalores y autovectores aSea f ∈ End(V ), y B una base de V . Sea A la matriz asociada a f en la base B. Los autovalores yautovectores de f se pueden calcular en la base B en la forma siguiente: f (v) = λv,implica que Aˆ = λˆ, v vdonde v es el vector de IKn que representa a v ∈ V en la base B. Resolver esta segunda ecuaci´n es ˆ oequivalente a resolver el sistema homog´neo de ecuaciones: e (A − λI)ˆ = 0. v (4.4)Este sistema poseer´ soluciones no triviales si y solo si a det(A − λI) = 0, (4.5)tal y como mostramos en el cap´ ıtulo anterior. La ecuaci´n anterior, (4.5), se denomina la ecuaci´n de autovalores o ecuaci´n caracter´ o o o ıstica, y nospermite encontrar los autovalores de un endomorfismo como ra´ del polinomio det(A − λI). Para cada ıcessoluci´n de esta ecuaci´n, se calcula el (o los) autovector correspondiente usando de nuevo la ecuaci´n o o o(4.4).4.4.2 El polinomio caracter´ ıstico de un endomorfismoSea A ∈ Mn (IK). Se define el polinomio caracter´ ıstico de A como: pA (λ) = det(A − λI) (4.6)Es un polinomio de grado n y el coeficiente del t´rmino de mayor grado es (−1)n . e Sea f ∈ End(V ). Se define el polinomio caracter´ ıstico de f como el polinomio caracter´ ıstico de lamatriz de f en cualquier base y lo denotaremos por pf . En efecto, es muy sencillo demostrar que elpolinomio no depende de la base ya que: det(A − λI) = det(P AP −1 − λI) = det(P (A − λI)P −1 ) = det(A − λI)donde A es la matriz de f en otra base y P es la matriz de cambio de base. De acuerdo con la ecuaci´n de autovalores se tiene: oProposici´n 4.4.1 λ ∈ IK es autovalor de f si y s´lo si λ es ra´ del polinomio caracter´ o o ız ıstico, es decir,pf (λ) = 0.Ejercicio 4.4.1 Probar que si el polinomio caracter´ ıstico no posee t´rmino independiente el endomor- efismo no es invertible.Ejemplo 4.4.1 Notemos que si f es un endomorfismo de un espacio vectorial V complejo tal que enuna cierta base su matriz asociada A tiene coeficientes reales, A ∈ Mn (IR), entonces si λ es un autovalor, a¯tambi´n lo ser´ λ. e Dada una ra´ del polinomio caracter´ ız ıstico, existen dos n´meros asociados a ella: uno es la multi- uplicidad algebraica como ra´ de ese polinomio. El otro es la dimensi´n del espacio invariante Vλ . A ız oeste ultimo lo llamaremos multiplicidad geom´trica. Es decir, la multiplicidad geom´trica de una ra´ del ´ e e ızpolinomio caracter´ ıstico es la dimensi´n de ker(f − λ1V ). En general estos dos n´meros son distintos. o uPero se tiene:
  • 84. ´4.5. FORMAS CANONICAS DE ENDOMORFISMOS NILPOTENTES 77Proposici´n 4.4.2 Sea f ∈ End(V ), λ ∈ IK ra´ del polinomio caracter´ o ız ıstico de f, pf (λ). Entonces, lamultiplicidad algebraica de λ es mayor o igual que la multiplicidad geom´trica de λ. e Demostraci´ n. Sea λ0 ∈ IK una ra´ del polinomio caracter´ o ız ıstico, pf (λ0 ) = 0 y sea Vλ0 el subespacioinvariante asociado a λ0. Construimos una base de Vλ0 y la ampliamos a una base de V . La matriz de fen esta base es, como ya sabemos, Prop. (4.3.1): A B . 0 CEs f´cil probar que el polinomio caracter´ a ıstico de f es el producto de los polinomios caracter´ ısticos de Ay C, debido a las propiedades de los determinantes: pf (λ) = det(A − λI) det(C − λI)Pero A es una matriz diagonal (porque la base de Vλ0 est´ formada por autovectores de f ), y su polinomio a ıstico es: (λ0 − λ)s , donde s = dim Vλ0 , que es la multiplicidad geom´trica de λ0 :caracter´ e pf (λ) = (λ0 − λ)s det(C − λI)Por tanto, la multiplicidad algebraica de λ0 es mayor o igual que la geom´trica (= s). e QED Consecuencia de estos resultados es el siguiente teorema, que da un criterio suficiente para la diago-nalizaci´n de un endomorfismo (o una matriz): oTeorema 4.4.1 Si f ∈ End(V ), dim V = n, tiene polinomio caracter´ ıstico con n ra´ ıces distintas, en-tonces f es diagonalizable. Demostraci´ n. El espectro de f es: σ(f ) = {λ1 , . . . λn }, con todos los autovalores λi distintos. Los oautovectores correspondientes son l.i., pues est´n en subespacios invariantes distintos, luego forman una abase de V , y por tanto f es diagonalizable. En este caso: V = Vλ1 ⊕ · · · ⊕ Vλn .Las multiplicidades algebraica y geom´trica coinciden para cada autovalor y son iguales a 1. e QED La condici´n anterior no es una condici´n necesaria para la diagonalizaci´n. En efecto, la matriz o o odiag(λ, . . . , λ) es diagonal y todos sus autovalores coinciden.4.5 Formas can´nicas de endomorfismos nilpotentes oComo paso previo al estudio de las formas can´nicas de endomorfismos de un espacio vectorial V de odimensi´n finita sobre C, estudiaremos en primer lugar las de los endomorfismos nilpotentes. La raz´n o oest´ en que el estudio de estos endomorfismos se puede hacer sobre los subespacios invariantes de V , aasociados a un autovalor (aunque no est´n formados unicamente por autovectores), y en ellos, los en- e ´domorfismos (f − λ1V ) son nilpotentes. El limitarse a C viene dado por la propiedad de ser un cuerpoalgebraicamente cerrado (propiedad que no tiene IR, recordad 1.5.3). Esta propiedad hace que la sumade las multiplicidades algebraicas de las ra´ ıces del polinomio caracter´ ıstico sea igual al grado de estepolinomio es decir a la dimensi´n del espacio V , lo que ser´ decisivo en la construcci´n de las formas o a ocan´nicas que nos proponemos estudiar. oDefinici´n 4.5.1 Sea f ∈ End(V ). Se dice que f es nilpotente de grado r, si f r = 0 y f r−1 = 0. o Los autovalores de un operador nilpotente son todos iguales a cero: f (v) = λv ⇒ 0 = f r (v)v = λr v ⇒ λ = 0por lo que un operador nilpotente no es diagonalizable, a no ser que sea igual a 0. Sin embargo, para cadaoperador nilpotente existe una base en la cual ´ste adopta una forma particularmente sencilla. Antes de ediscutir la situaci´n general estudiemos brevemente que ocurre con un endomorfismo nilpotente de grado o2, esto es, f 2 = 0.
  • 85. 78 ´ TEMA 4. FORMAS CANONICAS DE ENDOMORFISMOSEjemplo 4.5.1 Si f 2 = 0, resulta evidente que im f ⊂ ker f . En efecto, si v = f (u), entonces f (v) =f 2 (u) = 0. Supongamos que el rango de f es r. Entonces, dim ker f = n−r, donde n = dim V , y r ≤ n−r.Sea {u1 , . . . , ur } una base de im f. Ampliemos esta base hasta obtener una base de ker f , esto es a˜adimos nlos vectores ur+1 , . . . , un−r . Tomemos vectores anti-im´genes de los u1 , . . . , ur que denotaremos por vi , aesto es f (v1 ) = u1 , . . . , f (vr ) = ur . El conjunto {u1 , . . . , ur , ur+1 , . . . , un−r , v1 , . . . , vr } es una base de V .En dicha base la matriz A que representa a f tiene la forma:   0 0 Ir A =  0 0 0 . 0 0 0Es posible reordenar los vectores de la base como {u1 , v1 , . . . , ur , vr , ur+1 , . . . , un−r } y entonces la ex-presi´n de la matriz asociada es: o   0 1  0 0     ..   .     0 1  A=  .   0 0   0     ..   .  0Un endomorfismo f tal que f 2 = 0 e im f = ker f , se dice que es un endomorfismo vertical.Teorema 4.5.1 Todo operador nilpotente f ∈ End(V ) induce una descomposici´n del espacio V en osubespacios invariantes. En cada uno de ellos se puede encontrar una base en la que el endomorfismorestringido a ese subespacio tiene como matriz la siguiente:   0 1 0 0 ··· 0  0 0 1 0 ··· 0     . . . . .   . . . . .   . . . . .   0 0 0 0 ··· 1  0 0 0 0 ··· 0 Demostraci´n. Sea f ∈ End(V ), f r = 0. Construimos los espacios im´genes de los operadores o af k, k = 0, 1, . . . , r: Uk = im f k = f k (V )es decir: U0 = V, U1 = f (V ), . . . , Ur−1 = f r−1 (V ), Ur = {0},que est´n contenidos unos en otros formando un cadena de subespacios: a {0} = Ur ⊂ Ur−1 ⊂ · · · ⊂ U1 ⊂ U0 = V.N´tese que f (Ui−1) = Ui y que, por tanto, f(Ur−1 ) = {0}, es decir: o Ur−1 ⊂ ker f.Sin embargo, no tienen porque ser iguales. Construimos una base del subespacio m´s peque˜o no trivial, Ur−1 y la ampliamos a una base del a nsubespacio siguiente y as´ sucesivamente. Sea dr−1 = dim Ur−1 y una base de Ur−1 : ı (r−1) (r−1) {u1 , . . . , udr−1 }
  • 86. ´4.5. FORMAS CANONICAS DE ENDOMORFISMOS NILPOTENTES 79Todos estos vectores son anulados por f : (r−1) f (ui ) = 0, i = 1, . . . , dr−1 Al ser el subespacio Ur−1 la imagen mediante f del subespacio Ur−2, para cada vector de esta basede Ur−1 existe un original (o varios) en Ur−2 , es decir, existen vectores: (r−2) (r−2) u1 , . . . , udr−1 ∈ Ur−2tales que: (r−2) (r−1) f (ui ) = ui , i = 1, . . . , dr−1 Podemos demostrar que todos estos vectores est´n en Ur−2 (pues Ur−1 ⊂ Ur−2 ) y que son linealmente aindependientes. Para ello construyamos una combinaci´n lineal e igual´mosla a cero. o e dr−1 (r−1) (r−2) (αi ui + βi ui )=0 i=1y aplicando f : dr−1 (r−1) (r−2) (αi f (ui ) + βi f(ui )) = 0 i=1 (r−1) (r−2) (r−1) Como los vectores ui ∈ Ur−1 ∈ ker f y f (ui ) = ui , se tiene: dr−1 (r−1) β i ui =0 i=1que es una combinaci´n lineal de vectores de una base igual a cero, luego los coeficientes son nulos: o βi = 0, i = 1, . . . dr−1De manera inmediata se prueba que tambi´n los coeficientes αi son todos iguales a cero. e Este conjunto de vectores linealmente independientes en Ur−2 se puede ampliar a una base de estesubespacio: (r−1) (r−1) (r−2) (r−2) (r−2) (r−2) {u1 , . . . , udr−1 , u1 , . . . , udr−1 , vdr−1 +1 , . . . , vsr−2 }donde sr−2 = dr−2 − dr−1 . (r−2) En principio, los vectores vi se pueden elegir con cierta arbitrariedad. Podemos usar ´sta para e (r−2)escogerlos en el n´cleo de f. Las im´genes de estos vectores vi u a est´n en Ur−1 , luego se pueden escribir aen una base de este espacio: dr−1 (r−2) (r−1) f (vk )= µik ui , k = dr−1 + 1, . . . , sr−2 i=1con lo que los vectores: dr−1 (r−2) (r−2) (r−2) uk = vk − µik ui , k = dr−1 + 1, . . . , sr−2 i=1est´n en el n´cleo de f . En efecto: a u dr−1 (r−2) (r−2) (r−2) f (uk ) = f (vk )− µik f (ui ) = 0, k = dr−1 + 1, . . . , sr−2 i=1
  • 87. 80 ´ TEMA 4. FORMAS CANONICAS DE ENDOMORFISMOS (r−2) (r−1)pues: f (ui ) = ui . No es dif´ comprobar que estos vectores son tambi´n l.i. con el resto y que ıcil epor tanto tenemos una base de Ur−2: (r−1) (r−1) u1 , ..., udr−1 , (r−2) (r−2) (r−2) u1 , ..., udr−1 , ..., usr−2que verifica: (r−1) (r−2) (r−1) (r−2) f (ui ) = 0, f(ui ) = ui , f (uj ) = 0, i = 1, . . . , dr−1 , j = dr−1 + 1, . . . , sr−2 . Esta misma construcci´n se puede hacer en Ur−3 . Como Ur−2 ⊂ Ur−3 y f (Ur−3 ) = Ur−2, existen o (r−3)vectores ui ∈ Ur−3 tales que: (r−3) (r−2) f (ui ) = ui , i = 1, . . . , sr−2Estos vectores forman con los anteriores un sistema de vectores de Ur−3 que es linealmente independiente.Se amplia a una base de Ur−3 usando vectores en ker f. Todas estas cuestiones se demuestran de la mismaforma que se hizo en el paso anterior. Y as´ sucesivamente hasta acabar la cadena. De esta forma, construimos una base del espacio V que ıpodemos ordenar como: (r−1) (r−1) u1 , ..., udr−1 , (r−2) (r−2) (r−2) u1 , ..., udr−1 , ..., usr−2 , (r−3) (r−3) (r−3) (r−3) u1 , ..., udr−1 , ..., usr−2 , ..., usr−3 , . . .. . . .. . . .. . . .. . . . . . . . . (0) (0) (0) (0) (0) u1 , ..., udr−1 , ..., usr−2 , ..., usr−3 , . . . , us0 (j) (j+1) Las propiedades m´s importantes de esta base son: en cada columna, f (uk ) = uk a . Por tanto,los vectores de cada columna generan un subespacio de V invariante bajo f . El espacio total V es sumadirecta de todos ellos. El primer vector de cada columna est´ en ker f , es decir, es un autovector de f a(los dem´s no son autovectores): a V = V1 ⊕ · · · ⊕ Vs0 Como todos los espacios son invariantes, la matriz est´ formada por cajas (cuadradas) en la diagonal: a   A1 0 0 · · · 0  0 A2 0 · · · 0    A= . . . .. .   . . . . . . . .  . 0 0 0 ··· As0 Cada caja Ai tiene la siguiente forma. La base de Vi es: (r−k) (r−k−1) (0) {ui , ui , . . . , ui }y como: (j) (j+1) (r−k) f (ui ) = ui , f(ui )=0la caja i (correspondiente al subespacio =Vi ) es:   0 1 0 0 ··· 0  0 0 1 0 ··· 0     . . . . .   . . . . .   . . . . .   0 0 0 0 ··· 1  0 0 0 0 ··· 0
  • 88. ´4.5. FORMAS CANONICAS DE ENDOMORFISMOS NILPOTENTES 81como se dec´ en el enunciado del teorema. El orden de cada caja coincide con la dimensi´n de los ıa osubespacios Vi . QED N´tese que todas las cajas corresponden al mismo autovalor, 0, el unico que tiene el endomorfismo o ´nilpotente. El orden de la primera caja es r, el orden de nilpotencia del endomorfismo. El orden de lasdem´s cajas es menor o igual a r y hay que calcularlo en cada caso. a Esta forma de la matriz del endomorfismo nilpotente f se llama forma can´nica de Jordan de f . oEjemplo 4.5.2 Sea f ∈ End(V ), V = IR4 . Supongamos que la matriz de f en la base can´nica es: o   0 0 1 1  0 0 0 1  A=  0 0 0  1  0 0 0 0y que deseamos hallar una base en la cual f tenga la forma can´nica del teorema anterior. Calculemos olas potencias sucesivas de esta matriz:   0 0 0 1  0 0 0 0  A2 =    0 0 0 0 , A = 0 3 0 0 0 0Se trata de un endomorfismo nilpotente de orden 3. La cadena de subespacios que aparece en el teorema es: U3 = {0} ⊂ U2 = im f 2 = f (U1 ) ⊂ U1 = im f = f (U0 ) ⊂ U0 = IR4 Calculemos U1 :      0 0 1 1 x z +t  0 0 0 1  y   t    =   0 0 0 1  z   t  0 0 0 0 t 0luego:      1  0       4  0 , 1 U1 = f (IR ) = lin    0   1      0 0 El espacio U2 es:     0 0 0 1 x t  0 0 0 0  y   0    =   0 0 0 0  z   0  0 0 0 0 t 0luego:    1      0  U2 = f(U1 ) = lin    0       0 De acuerdo con el teorema, seleccionamos una base en el espacio Ur−1 = U2 . Escogemos el vectorcalculado antes:   1 (2)  0  u1 =  0   0
  • 89. 82 ´ TEMA 4. FORMAS CANONICAS DE ENDOMORFISMOS (1) (1) (2)y ahora calculamos una base de U1 . El primer vector de la base es u1 , tal que f(u1 ) = u1 . Entonces:     z+t 1  t   0       t = 0  0 0por ejemplo:   0 (1)  1  u1 =   1  0 (2) (1) Ahora deber´ ıamos ampliar este conjunto {u1 , u1 } a una base de U1 . Pero ya lo es. Solo nos queda (0) (1)U0 . Buscamos un vector de U0 = IR4 , u1 tal que f (u(0) ) = u1 :     z+t 0  t   1       t = 1  0 0por ejemplo:   0 (0)  0  u1 =   −1  1y completamos la base con un vector de ker f , l.i. con los anteriores. Las ecuaciones de ker f son z = t = 0.Elijamos:   0 (0)  1  u2 =    0 0y por la tanto, la base de todo el espacio es:   1 (2)  0  u1 =     0  0  0 (1)  1  u1 =     1  0   0 0 (0)  0  (0)  1  u1 =    −1  u2 =  0   1 0 Hay dos subespacios invariantes:           1  0 0    0      1   0      0 1 V1 = lin  ,     1  ,  −1  , V2 =   .  0      0        0 0 1 0Las cajas correspondientes en la matriz son:   0 1 0 V1 →  0 0 1 , V2 → (0) 0 0 0
  • 90. ´4.6. FORMAS CANONICAS DE ENDOMORFISMOS 83y la forma can´nica de la matriz es: o   0 1 0 0  0 0 1 0   J =  0 0 0 0  0 0 0 0 La matriz de cambio de base (de la encontrada a la inicial) est´ formada por los vectores de la base: a   1 0 0 0  0 1 0 1  P =  0  1 −1 0  0 0 1 0y se tiene por tanto: A = P JP −14.6 Formas can´nicas de endomorfismos oVeamos ahora como podemos encontrar para un endomorfismo cualquiera un forma can´nica similar a la oanterior, la forma can´nica de Jordan de un endomorfismo. o Para ello, lo primero es descomponer el espacio en una serie de subespacios, a cada uno de los cualesse asocia un endomorfismo nilpotente cuya forma can´nica conocemos. oDefinici´n 4.6.1 Sea f ∈ End(V ), λ ∈ σ(f ) ⊂ IK. Se dice que el vector v ∈ V, v = 0 es un vector opropio generalizado de V si existe un entero positivo r tal que: (f − λ1V )r v = 0 Los vectores propios generalizados no son en general autovectores, aunque todo autovector es unvector propio generalizado (con r = 1).Definici´n 4.6.2 Se definen los espacios invariantes generalizados como: o Nλ = {v ∈ V | ∃r ≥ 0, (f − λ1V )r v = 0} Se tiene el siguiente resultado sobre las propiedades de estos espacios.Proposici´n 4.6.1 Con las notaciones anteriores, o i. Nλ es un subespacio vectorial de V r ii. f − λ1V es nilpotente en Nλ : (f − λ1V )|Nλ = 0 para alg´n entero positivo r. u iii. Nλ es invariante bajo f . Demostraci´ n. La primera propiedad es muy sencilla de probar. Si v1 y v2 son dos vectores de Nλ oque son anulados por f − λ1V elevado a las potencias r1 y r2 respectivamente, cualquier combinaci´n olineal de estos vectores es anulada por ese operador elevado al mayor de r1 y r2 . En cuanto a la segunda,basta considerar los exponentes que se necesitan para anular los vectores de una base de Nλ y coger elmayor de todos ellos. Finalmente, la tercera se prueba como sigue. Sea v ∈ Nλ ,con: (f − λ1V )r v = 0para alg´n entero positivo r. Como f − λ1V conmuta con f , se tiene: u f ((f − λ1V )r v) = 0 ⇒ (f − λ1V )r f(v) = 0y por tanto, Nλ es invariante bajo f. QED El punto m´s importante es que estos espacios invariantes generalizados forman una suma directa. Y ano s´lo eso. Si el cuerpo es algebraicamente cerrado (por ejemplo C, o si se trata de IR, si todas las ra´ o ıcesdel polinomio caracter´ ıstico est´n en IR) la suma directa de estos espacios cuando se consideran todos los aautovalores es igual al espacio total. Probaremos un resultado preliminar.
  • 91. 84 ´ TEMA 4. FORMAS CANONICAS DE ENDOMORFISMOSProposici´n 4.6.2 Si µ ∈ IK, µ = λ, entonces la restricci´n de f − µ1V al subespacio Nλ, (f − µ1V )|Nλ o otiene inverso. Demostraci´n. El subespacio Nλ es invariante bajo f −µ1V . Veamos que el n´cleo de (f − µ1V )|Nλ o ues igual a {0}, o lo que es lo mismo, (f − µ1V ) ∩ Nλ = {0}. Sea v ∈ Nλ tal que (f − µ1V )v = 0. Aplicandof − λ1V a v: (f − λ)(v) = f (v) − λv = (µ − λ)vSi v = 0 la aplicaci´n es inyectiva. Si v = 0, entonces es un autovector de f − λ1V con autovalor µ − λ. oPero f − λ1V es nilpotente en Nλ , de donde µ = λ en contra de la hip´tesis. o QED Como ocurr´ con los subespacios Vλ , los subespacios Nλ asociados a autovalores distintos, forman ıauna suma directa.Proposici´n 4.6.3 Sean λ1 , . . . , λm autovalores de f distintos. Entonces, los subespacios Nλ1 , . . . , Nλm oforman una suma directa. Demostraci´n. Como en el teorema para los subespacios Vλ , lo haremos por inducci´n en m. Para o om = 1 es trivialmente cierto. Supongamos que es correcto para m − 1. Para el caso m, consideremos lasuma: v1 + · · · + vm = 0, vi ∈ Nλi , i = 1, . . . , my demostremos que cada vi es igual a 0. Para ello, como vm ∈ Nλm , existe un entero positivo s tal que: (f − λm 1V )s vm = 0Aplicando a la suma de vi este operador: (f − λm 1V )s v1 + · · · + (f − λm 1V )s vm−1 = 0que es el caso m − 1 (recordando que los espacios Nλi son invariantes). Por la hip´tesis de inducci´n: o o (f − λm 1V )s vi = 0, i = 1, . . . , m − 1Pero hemos demostrado que el operador f − λm 1V era inyectivo en Nλi , con i = 1, . . . , m − 1 por ser losautovalores distintos. Por tanto, vi = 0, i = 1, . . . , m − 1, lo que implica que tambi´n vm = 0. e QED Hemos visto que la multiplicidad geom´trica de un autovalor, la dimensi´n del subespacio Vλ , era e osiempre menor o igual que la algebraica. Para los subespacios Nλ se tiene el siguiente resultado.Teorema 4.6.1 Si nλ0 es la multiplicidad algebraica de λ0 ∈ σ(f ), dim Nλ0 = nλ0 Demostraci´n. Al ser Nλ0 un subespacio invariante bajo f, podemos definir la restricci´n de f a o o ˆ ˜este subespacio, f = f|Nλ0 y la aplicaci´n inducida en el espacio cociente V /Nλ0 , f. Hemos estudiado ola forma que toma la matriz de f en una base adaptada a al subespacio Nλ0 , lo que implica que lospolinomios caracter´ısticos de estas tres aplicaciones est´n relacionados por: a pf (λ) = pf (λ)pf (λ) ˆ ˜El grado de pf (λ) es la dimensi´n del subespacio Nλ0 , por tanto, si: ˆ o dim Nλ0 < nλ0 ız ˜ ˜entonces, λ0 es ra´ de pf (λ), es decir, autovalor de f , de donde existe un autovector v0 + Nλ0 ∈ V /Nλ0 : ˜ f (v0 + Nλ0 ) = f (v0 ) + Nλ0 = λ0 v0 + Nλ0es decir: (f − λ1V )(v0 ) ∈ Nλ0
  • 92. 4.7. EL TEOREMA DE CAYLEY-HAMILTON 85 Esto quiere decir que existe un entero positivo, s tal que: (f − λ1V )s+1 (v0 ) = 0y por lo tanto, v0 ∈ Nλ0 ⇒ v0 + Nλ0 = 0lo que es contradictorio con el car´cter de autovector. Por lo tanto, al ser dim Nλ0 ≤ nλ0 , como ya ahab´ıamos demostrado anteriormente, concluimos que ambas son iguales. QED En cada uno de los espacios Nλ , f es igual a un endomorfismo nilpotente m´s la aplicaci´n identidad a opor λ: f |Nλ = gλ + λ1Nλ Como hemos demostrado la existencia de un base donde gλ toma la forma can´nica de Jordan, oest´ claro que en esa base f ser´ la forma can´nica de Jordan de un endomorfismo nilpotente m´s la a a o aaplicaci´n identidad por el autovalor correspondiente. Esta ser´ la forma de Jordan del endomorfismo o af. Para acabar, s´lo nos queda probar que la suma de los subespacios Nλ cubre todo el espacio V . Esto os´lo es cierto si las ra´ o ıces del polinomio caracter´ ıstico est´n en el cuerpo IK (los factores irreducibles adel polinomio tienen grado 1). El resultado es cierto en C siempre y en IR si no hay ra´ ıces complejas.Enunciamos el teorema para C.Teorema 4.6.2 Sea V un C-espacio vectorial de dimensi´n finita n. Sea f ∈ End(V ) y σ(f ) = o{λ1 , . . . , λm } el espectro de f . Existe una base de V en la cual f tiene la forma can´nica de Jordan: odiagonal por cajas y cada caja del tipo:   λ 1 0 0 ··· 0  0 λ 1 0 ··· 0     . . . . .   . . . . .   . . . . .   0 0 0 λ ··· 1  0 0 0 0 ··· λ T´ngase en cuenta que a un s´lo autovalor pueden estar asociadas varias cajas. e o Demostraci´ n. Por ser C un cuerpo algebraicamente cerrado: o n = n1 + · · · + nmdonde ni es la multiplicidad algebraica de λi . Los subespacios invariantes generalizados Nλ1 , . . . , Nλmasociados a los autovalores de f forman una suma directa. Pero dim(Nλ1 ⊕ · · · ⊕ Nλm ) = n1 + · · · nm = nluego: V = N λ1 ⊕ · · · ⊕ N λm ,y en cada subespacio se tiene el resultado demostrado anteriormente. QED En espacios vectoriales reales puede ocurrir que: n1 + · · · + nm < n y no se pueda poner la matriz enla forma can´nica de Jordan. Sin embargo, si se pasa a un espacio vectorial complejo, es posible hacerlo. o Si los endomorfismos nilpotentes f − λ1V son cero, el endomorfismo es diagonalizable. En casocontrario no lo es.4.7 El teorema de Cayley-HamiltonSi q(λ) es un polinomio con coeficientes en IK y f ∈ End(V ), donde V es un IK-espacio vectorial dedimensi´n finita, se puede definir el endomorfismo q(λ): o q(λ) = am λm + · · · + a1 λ + a0 −→ q(f ) = am f m + · · · + a1 f + a0 1V
  • 93. 86 ´ TEMA 4. FORMAS CANONICAS DE ENDOMORFISMOSLos operadores 1V , f, . . . , f m no pueden ser todos independientes (para m suficientemente grande ya quedim End(V ) = n2 ) y por tanto existe una combinaci´n lineal, con coeficientes no todos nulos, igual a ocero. Es decir, existe q(λ) tal que q(f ) = 0. El teorema de Cayley-Hamilton establece la existencia de un polinomio de grado n = dim V que anulaal endomorfismo.Teorema 4.7.1 Sea V un C-espacio vectorial de dimensi´n finita y f ∈ End(V ). Entonces, el polinomio ocaracter´ ıstico de f anula a f : pf (f ) = 0 Demostraci´n. Si n = dim V y f = g + λ1V , donde g es un endomorfismo nilpotente de una caja, o ıstico es: (λ0 − λ)n , que anula a f :el polinomio caracter´ pf (f ) = (λ0 1V − f)n = (λ0 1V − g − λ0 1V )n = (−g)n = 0 Sea ahora f un endomorfismo arbitrario de V . De acuerdo con la forma can´nica de Jordan, en ocada caja f tiene la forma anterior, y el polinomio caracter´ ıstico de f es el producto de los polinomioscaracter´ ısticos asociados a cada caja. Si fi = f |Ni , el polinomio caracter´ıstico en Ni anula a fi : pfi (fi ) = 0lo que implica que el polinomio caracter´ ıstico de f anula tambi´n a las restricciones fi y por lo tanto a ef (al ser suma directa). QED El resultado es tambi´n cierto en IR, incluso aunque el polinomio caracter´ e ıstico tenga ra´ complejas ıcesy no exista una forma can´nica de Jordan. o4.8 Polinomio m´ ınimoDe acuerdo con el teorema de Cayley-Hamilton, el polinomio caracter´ ıstico anula a f . Sin embargo, noes, en general, el polinomio de menor grado entre los que anulan a f .Proposici´n 4.8.1 El conjunto If = {q ∈ IK[λ] | q(f ) = 0} es un ideal en IK[λ]. oLa demostraci´n es inmediata. If es no vac´ al contener al polinomio caracter´ o ıo ıstico. Todos los ideales en IK[λ] son principales, por lo que existe un polinomio de grado m´ ınimo en If ytodo otro polinomio del ideal es m´ltiplo de ´ste. u eDefinici´n 4.8.1 Se llama polinomio m´ o ınimo de f ∈ End(f ) al polinomio de menor grado entre los queanulan a f . Se elige con el coeficiente de mayor grado igual a 1. Veamos ahora cual es el polinomio m´ ınimo de los endomorfismos nilpotentes. Sea f ∈ End(V ) unendomorfismo nilpotente y n = dim V . El polinomio caracter´ ıstico de f es p(λ) = (−λ)n , pero si f es degrado de nilpotencia r, 1 ≤ r ≤ n, el polinomio m´ ınimo es: mf (λ) = λr Hay que se˜ alar que si r = 1 el endomorfismo f es cero (y trivialmente diagonalizable), mientras que nsi r > 1 no es diagonalizable. De acuerdo con lo demostrado para la forma can´nica de Jordan, si f es un endomorfismo nilpotente ode varias cajas, el orden de nilpotencia de f es la dimensi´n de la mayor de las cajas, n´mero que coincide, o ucomo acabamos de ver, con el grado del polinomio m´ ınimo: n = n1 + · · · + nk , n1 ≥ · · · ≥ nk ≥ 1, mf (λ) = λn1 Para un endomorfismo cualquiera, en cada subespacio invariante generalizado Nλ0 , el operador f −λ0 1V es nilpotente de grado n0 , donde n0 es la dimensi´n de la mayor de las cajas de este endomorfismo oen la forma can´nica de Jordan. Por lo tanto, el polinomio m´ o ınimo de (f − λ0 1V )|Nλ es: (λ − λ0 )n0 . Para que f sea diagonalizable en Nλ0 , las cajas deben tener dimensi´n 1 y por lo tanto el polinomio om´ınimo debe ser λ − λ0 . Hemos demostrado el siguiente resultado:
  • 94. 4.8. POLINOMIO M´ INIMO 87Proposici´n 4.8.2 Sea V un C-espacio vectorial de dimensi´n finita y f ∈ End(V ). El endomorfismo o of es diagonalizable si y s´lo si las ra´ o ıces del polinomio m´ ınimo tienen multiplicidad igual a 1. N´tese que las ra´ del polinomio m´ o ıces ınimo, seg´n hemos visto al analizar la forma can´nica de Jordan u ocoinciden con los autovalores, es decir con las ra´ del polinomio caracter´ ıces ıstico. Los polinomios m´ ınimoy caracter´ ıstico tienen la mismas ra´ıces pero en general distintas multiplicidades.
  • 95. 88 ´ TEMA 4. FORMAS CANONICAS DE ENDOMORFISMOS
  • 96. Tema 5Espacios con producto escalar El espacio dual. Formas bilineales. Diagonalizaci´n. Ortogonalidad. Formas cuadr´ti- o a cas. Formas sesquilineales. Producto escalar. El producto escalar aparece como una estructura adicional en la teor´ de espacios vectoriales. Aunque ıalos resultados expuestos se consideran solo en espacios de dimensi´n finita, muchos de ellos pueden ser oaplicados a espacios de dimensi´n infinita. Se estudian primero las formas bilineales, para pasar despu´s o ea las sim´tricas definidas positivas (en el caso de espacios reales) o sesquilineales en el caso de espacios ecomplejos).5.1 El espacio dualRepasaremos en primer lugar nociones del espacio dual ya introducidas en el Tema 3.5.1.1 Introducci´n oSea V un IK-espacio vectorial de dimensi´n finita, con IK = IR, C. Sea L(V, IK) el espacio vectorial de los ohomomorfismos de V en IK. Su dimensi´n es igual a la dimensi´n de V (pues dim IK = 1). o oDefinici´n 5.1.1 Se llama a V ∗ = L(V, IK) el espacio dual de V . Los elementos de V ∗ se llaman formas olineales: ω ∈ V ∗, ω: V → IK, linealProposici´n 5.1.1 dim V ∗ = dim V . oEs una consecuencia inmediata de la definici´n del espacio dual. Introducimos ahora una base especial oen el espacio dual: la base dual.Proposici´n 5.1.2 Sea B = {u1, . . . , un } una base de V . El conjunto de formas que verifican: o u∗ (uj ) = δij , i i, j = 1, . . . nes una base de V ∗ , llamada la base dual de B. Demostraci´ n. Las formas lineales quedan definidas al dar las im´genes de los vectores de una base. o aVeamos que son linealmente independientes. Sea: n λ i u∗ = 0 i i=1 89
  • 97. 90 TEMA 5. ESPACIOS CON PRODUCTO ESCALARAl aplicar la forma lineal del miembro izquierdo de esta ecuaci´n a los vectores de la base B se obtiene: o n n λi u∗ (uj ) = i λi δij = λj = 0, j = 1, . . . , n i=1 i=1luego son linealmente independientes. Al ser n formas (n = dim V ∗ ), son una base. QED Dado un vector del espacio V , sus coordenadas en una base B se calculan haciendo actuar las formasde la base dual correspondiente sobre el vector: n n n x ∈ V, x= xi ui , u∗ (x) = j xi u∗ (ui ) = j xi δij = xj i=1 i=1 i=1 Una notaci´n muy empleada para la acci´n de las formas sobre los vectores es: o o x, ωen la que se pone de manifiesto el car´cter lineal de la actuaci´n de ω, y a la vez las propiedades de a oespacio lineal de V ∗5.1.2 El espacio bidualSe define el espacio bidual de un espacio vectorial V como el dual de su dual: V ∗∗ = (V ∗ )∗ = L(V ∗ , IK)es decir, los elementos del bidual son las aplicaciones lineales de V ∗ en IK. Existe un isomorfismo natural entre un espacio y su bidual (en dimensi´n finita), definido de la forma osiguiente: φ: V → V ∗∗ x → φ(x): V ∗ → IK . ω → φ(x)(ω) Ahora bien: ω: V → IK , x → ω(x)lo que sugiere la definici´n de φ como: o φ(x)(ω) = ω(x)o, en la segunda notaci´n: o ω, φ(x) = x, ω Veamos que φ es un isomorfismo. La aplicaci´n est´ bien definida. Adem´s, es lineal: o a a φ(x + y)(ω) = ω(x + y) = ω(x) + ω(y) = φ(x)(ω) + φ(y)( ω)lo que es cierto para toda forma ω. Por tanto: φ(x + y) = φ(x) + φ(y)De la misma forma: φ(λx)(ω) = ω(λx) = λω(x) = λφ(x)(ω)es decir: φ(λx) = λφ(x) Tambi´n se tiene que φ es biyectiva. Demostremos que su n´cleo es trivial. e u φ(x)(ω) = 0 ⇒ ω(x) = 0, ∀ω ∈ V ∗pero eso quiere decir que x = 0. Por tanto, φ es inyectiva. Como las dimensiones del espacio inicial (V )y final (V ∗∗ ) coinciden, la aplicaci´n es biyectiva y tenemos un isomorfismo. o No existe un isomorfismo natural (como ´ste) entre un espacio y su dual. M´s adelante estudiaremos e acomo definir tal isomorfismo cuando V est´ dotado de un producto escalar. a
  • 98. 5.1. EL ESPACIO DUAL 915.1.3 AnuladorSea S un subconjunto de V .Definici´n 5.1.2 El anulador de S es un subespacio de V ∗ dado por: o S 0 = {ω ∈ V ∗ | ω(x) = 0, ∀x ∈ S} Es f´cil ver que S 0 es un subespacio: a ω, ω ∈ S 0 , (ω + ω )(x) = ω(x) + ω (x) = 0 ω ∈ S 0 , λ ∈ IK, (λω)(x) = λ(ω(x)) = 0 Si S ∗ ⊂ V ∗ , el anulador de este subconjunto estar´ en V ∗∗ , que hemos visto que es isomorfo de una ıaforma natural a V . (S ∗ )0 = {α ∈ V ∗∗ | α(ω) = 0, ∀ω ∈ S ∗ } Usando el isomorfismo, se suele identificar V con V ∗∗ y definir el anulador de S ∗ como: (S ∗ )0 = {x ∈ V | ω(x) = 0, ∀ω ∈ S ∗ } Si W es un subespacio de V , el anulador del anulador de W coincide con W , como es f´cil deducir de alas definiciones anteriores. Adem´s se tiene el siguiente resultado: aProposici´n 5.1.3 Si W es un subespacio de V , entonces: o dim W 0 = dim V − dim W Demostraci´ n. Sea BW = {u1, . . . , uk } una base de W , y ampliemos esta base a una de V : o B = {u1 , . . . , uk , uk+1 , . . . , un } Construyamos la base dual: B ∗ = {u∗ , . . . , u∗ , u∗ , . . . , u∗ }. 1 k k+1 n Demostremos ahora que el conjunto: BW 0 = {u∗ , . . . , u∗ } es una base de W 0 . Cada elemento de ∗ k+1 neste conjunto est´ en W 0 , pues: a u∗ (ui ) = 0, j = k + 1, . . . , n, i = 1, . . . , k jal ser bases duales. Adem´s, sea ω ∈ W 0 . Entonces: a ω(ui ) = 0, i = 1, . . . , kComo ω es un elemento del dual, se puede escribir en la base B ∗ : n ω= λi u∗ i i=1y usando el que ω es un elemento de V ∗ : ω(ui ) = λi = 0, i = 1, . . . , k ∗Por lo tanto ω es una combinaci´n lineal de los elementos de BW 0 , que forman una base. La relaci´n o oentre las dimensiones es ahora inmediata. QED
  • 99. 92 TEMA 5. ESPACIOS CON PRODUCTO ESCALAR5.1.4 La aplicaci´n transpuesta oLas aplicaciones entre espacios vectoriales se pueden llevar a sus duales. Sea f : V → V un homomorfismode espacios vectoriales. Sean V ∗ y V ∗ los espacios duales de V y V respectivamente.Definici´n 5.1.3 La aplicaci´n transpuesta de f es: o o f t: V ∗ →Vdonde: f t (ω )(x) = ω (f (x)), ∀ω ∈ V ∗ , ∀x ∈ V Tambi´n podemos escribir: e x, f t (ω ) = f (x), ω La aplicaci´n f t est´ bien definida y es lineal. En efecto, dado ω , f t (ω ) es una aplicaci´n lineal de o a oV en IK: f t (ω1 + ω2 )(x) = (ω1 + ω2 )(f (x)) = ω1 f (x) + ω2 (f (x)) = f t (ω1 )(x) + f t (ω2 )(x) f t (λω )(x) = (λω )(f (x)) = λ(ω f (x)) = λf t (ω )(x)5.1.5 La matriz de la aplicaci´n transpuesta oVeamos que relaci´n existe entre las matrices de una aplicaci´n y su transpuesta. Sean B y B bases de o oV y V y B∗ , B ∗ sus bases duales respectivamente. Sean n = dim V , n = dim V . Sean Af = (aij ) y Af t = (bij ) las matrices de f en las bases B, B y de f t en las bases duales B ∗ , B ∗ .Entonces: n n f (ui ) = aji uj , f t (ui∗ ) = bji u∗ j j=1 j=1 Los elementos de las matrices que representan a f y f t se pueden calcular de la formas siguiente: n n n uj∗ (f (ui )) = uj∗ ( aki uk ) = aki uj∗ (uk ) = aki δjk = aji k=1 k=1 k=1De forma similar: n n f t (uj∗ )(ui ) = bkj u∗ (ui ) = k bkj δki = bij k=1 k=1 Pero, por la definici´n de aplicaci´n transpuesta: o o f t (uj∗ )(ui ) = uj∗ (f (ui ))y por tanto: aji = bijy las matrices (en las bases duales) son transpuestas una de la otra: Af t = At f Si usamos notaci´n vectorial para las aplicaciones lineales, sea: o         x1 a11 · · · a1n ω1 b11 ··· b1n  .   . . , Ω =  . ,  . .  X =  .  , Af =  . . . .  .  .  . Af t = .. .  . xn an 1 · · · an n ωn bn1 ··· bnn
  • 100. 5.1. EL ESPACIO DUAL 93donde X son las coordenadas de x ∈ V en una base B y Ω son las coordenadas de ω en la base dual B∗ .Entonces, ω(x) = Ωt Xen el sentido de producto de matrices. La acci´n de los homomorfismos f y f t se escribe con matrices: o X = Af X, Ω = Af t ΩPor tanto, usando nuevamente la definici´n de la aplicaci´n transpuesta, se tiene: o o (Af t Ω )t X = (Ω )t Af Xes decir: (Ω )t At t X = (Ω )t Af X fy como el resultado debe ser cierto para todo vector x y toda forma ω , se tiene el resultado anterior: At t = Af f Entre los n´cleos e im´genes de f y ft existen las siguientes relaciones: u a ker f t = (Im f)0 , Im f t = (ker f )0 En efecto, probemos la primera de ellas. Si ω ∈ ker f t , se tiene f t (ω ) = 0, es decir: ω (f (x)) = 0, ∀x ∈ Vlo que quiere decir: ω (x ) = 0, ∀x ∈ Im fo sea: ω ∈ (Im f )0 Supongamos ahora que ω ∈ (Im f )0 . Siguiendo el camino anterior a la inversa, concluimos queω ∈ ker f t y por tanto la primera relaci´n queda demostrada. La segunda se demuestra de forma similar. oSea ω ∈ im f t . Entonces, existe ω ∈ V ∗ tal que: f t (ω ) = ω. Por tanto: ω(x) = ω (f(x)).Si x ∈ ker f , ω(x) = 0, y por tanto ω ∈ (ker f )0 . Es decir, im f t ⊂ (ker f )0 .Pero: dim im f t = n − dim ker f t = n − dim(im f )0 = n − (n − dim im f) = n − dim ker f = dim(ker f )0 ,lo que prueba la igualdad de ambos subespacios.Ejemplo 5.1.1 Sea V = IR2 [x] = lin{1, x, x2 }. La base dual viene dada por las tres formas: 1 E1 (p) = p(0), E2 (p) = p (0), E3 (p) = p (0), ∀p ∈ V 2Est´ claro que son tres elementos de dual, y que: a Ei (pj (x)) = δij , i, j = 1, 2, 3donde: p1 (x) = 1, p2 (x) = x, p3 (x) = x2
  • 101. 94 TEMA 5. ESPACIOS CON PRODUCTO ESCALARCualquier polinomio se escribe en esta base como: p(x) = E1 (p) + E2 (p)x + E3 (p)x2Se considera ahora la aplicaci´n derivada en V : o D: V → V p(x) → p (x)que tiene como matriz en la base dada:   0 1 0  0 0 2  0 0 0La aplicaci´n transpuesta verifica: o D t (ω )(p) = ω (Dp)Sustituyendo ω por los elementos de la base: Dt (E1 )(p) = E1 (Dp) = p (0) = E2 (p) Dt (E2 )(p) = E2 (Dp) = p (0) = 2E3 (p) t D (E3 )(p) = E3 (Dp) = p (0)/2 = 0por lo que la matriz de la aplicaci´n transpuesta en la o base dual es:   0 0 0  1 0 0  0 2 05.2 Formas bilinealesSe estudian en esta secci´n las formas bilineales, especialmente las sim´tricas y se introducen las aplica- o eciones multilineales en forma general.5.2.1 Aplicaciones multilinealesDefinici´n 5.2.1 Sean V1, . . . , Vn , W IK-espacios vectoriales. Se dice que la aplicaci´n: o o ϕ: V1 × . . . × Vn → Wes multilineal si es lineal en cada variable separadamente: ϕ(x1 , . . . , xi + xi , . . . , xn ) = ϕ(x1 , . . . , xi , . . . , xn ) + ϕ(x1 , . . . , xi , . . . , xn ) ϕ(x1 , . . . , λxi , . . . , xn ) = λϕ(x1 , . . . , xi , . . . , xn ) El conjunto de las aplicaciones multilineales forma un espacio vectorial: L(V1 , . . . , Vn ; W ).5.2.2 Formas bilinealesDefinici´n 5.2.2 Una forma bilineal es una aplicaci´n multilineal de V × V en IK, donde V es un o oIK-espacio vectorial Una forma bilineal es pues: ϕ: V × V → IKtal que: ϕ(x + y, z) = ϕ(x, z) + ϕ(y, z) ϕ(x, y + z) = ϕ(x, y) + ϕ(x, z) ϕ(λx, y) = λϕ(x, y) ϕ(x, λy) = λϕ(x, y)
  • 102. 5.2. FORMAS BILINEALES 95para x, y, z ∈ V, λ ∈ IK. El conjunto de formas bilineales es un espacio vectorial, y cuando la dimensi´n ode V es finita, la de L(V, V ; IK) = L2 (V ) es igual a la de V elevada al cuadrado.Proposici´n 5.2.1 Sea V un IK-espacio vectorial de dimensi´n n. Sea: o o L2 (V ) = {ϕ: V × V → IK, ϕ bilineal}Entonces, L2 (V ) es un IK-espacio vectorial. Si B = {u1 , . . . , un } es una base de V y B ∗ = {u∗ , . . . , u∗ } 1 nsu base dual, entonces, el conjunto de formas bilineales: ϕij (x, y) = x, u∗ y, u∗ , i j i, j = 1, . . . , nes una base de L2 (V ) que por tanto, tiene dimensi´n n2 . o Demostraci´ n. Es muy sencillo probar que ϕij es una forma bilineal. Probemos que son l.i. Sea: o n λij ϕij = 0 i,j=1Aplicando esta expresi´n a los elementos de la base de V : o n n n ( λij ϕij )(uk , ul ) = λij uk , u∗ ul , u∗ = i j λij δki δlj = λkl i,j=1 i,j=1 i,j=1luego: λij = 0, i, j = 1, . . . n Veamos ahora que generan todo el espacio L2 (V ): Sea ϕ ∈ L2 (V ). Esta forma queda fijada calculandosus valores sobre una base de V (al ser bilineal). Es decir: ϕ(ui , uj ) = aij . En efecto: n n n ϕ(x, y) = ϕ( xi ui , y j uj ) = aij xi yj i=1 j=1 i,j=1 Construimos ahora la forma bilineal: n ϕ(x, y) = ˜ aij x, u∗ y, u∗ i j i,j=1que es una combinaci´n lineal de las formas ϕij . Es inmediato ver que es igual a ϕ. En efecto, calculando olos valores sobre una base: n n ϕ(uk , ul ) = ˜ aij uk , u∗ ul , u∗ = i j aij δki δlj = akl i,j=1 i,j=1 QED5.2.3 Matriz de una forma bilinealComo hemos visto antes, los escalares aij = ϕ(ui , uj ) determinan de manera unica a la forma bilineal. ´Definici´n 5.2.3 Se llama matriz de una forma bilineal en una base B = {u1 , . . . , un } a la matriz cuyos oelementos son los escalares ϕ(ui , uj ).
  • 103. 96 TEMA 5. ESPACIOS CON PRODUCTO ESCALAR De esta manera, los valores que toma la forma bilineal sobre vectores x, y, de coordenadas en la baseB:       x1 y1 a11 · · · a1n  .   .   . , X =  . , . Y =  . , . A= . . . .  . xn yn an1 · · · annvienen dados por: ϕ(x, y) = aij xi yj = X t AY ij Como la correspondencia entre formas bilineales y matrices n × n es biun´ıvoca, tenemos establecidoun isomorfismo entre estos dos espacios vectoriales. Toda matriz cuadrada representa una forma bilinealen una base dada de V . N´tese que esta es otra utilizaci´n de las matrices aparte de la ya considerada o ode representar aplicaciones lineales. Evidentemente, cuando cambiamos de base, la matriz de la forma bilineal cambia (como ocurr´ con ıalas matrices que representaban homomorfismos). Veamos como es este cambio. Sean B, B dos bases del espacio vectorial V : B = {u1 , . . . , un }, B = {u1 , . . . , un }con la matriz de cambio de base P : n ui = Pji uj , i = 1, . . . , n j=1 En las coordenadas, el cambio de base es: n xi = Pij xj , X = PX j=1por tanto: ϕ(x, y) = X t AY = (P X )t AY = (X )t P t AP Y = (X )t A Yy se tiene la relaci´n: o A = P t AP Hay que se˜ alar la diferencia que aparece con respecto al caso de matrices que representan homomor- nfismos (o en particular endomorfismos). All´ es la inversa de la matriz P la que aparece en esta relaci´n, ı omientras que aqu´ es la transpuesta la que juega ese papel. ı5.2.4 Formas bilineales sim´tricas y antisim´tricas e eDefinici´n 5.2.4 Sea ϕ: V × V → IK una forma bilineal. Se dice que ϕ es sim´trica si: o e ϕ(x, y) = ϕ(y, x), ∀x, y ∈ VSe dice que ϕ es antisim´trica si: e ϕ(x, y) = −ϕ(y, x), ∀x, y ∈ V.Proposici´n 5.2.2 Si ϕ es una forma bilineal sim´trica, la matriz que representa a ϕ en cualquier base o ees una matriz sim´trica. e
  • 104. 5.2. FORMAS BILINEALES 97 Demostraci´ n. Sea B una base de V . Entonces: o aij = ϕ(ui , uj ) = ϕ(uj , ui ) = ajies decir: At = A QEDEs tambi´n evidente que si la matriz asociada a una forma bilineal es sim´trica en una base, lo es e een todas y la forma bilineal correspondiente es sim´trica. e De forma similar se concluye que una forma bilineal es antisim´trica si y solo si su matriz en cualquier ebase es antisim´trica. Las formas sim´tricas forman un subespacio vectorial del espacio de las formas e ebilineales. Las formas antisim´tricas forman tambi´n un subespacio vectorial e e El espacio L2 (V ) se descompone en suma directa de formas bilineales sim´tricas y antisim´tricas: e e L2 (V ) = A(V ) ⊕ S(V )y las dimensiones de estos dos subespacios son: 1 1 dim A(V ) = n(n − 1), dim S(V ) = n(n + 1) 2 25.2.5 Formas bilineales sim´tricas regulares eSea ϕ: V × V → IK una forma bilineal sim´trica. eDefinici´n 5.2.5 Se define el radical de ϕ como el subespacio de V dado por: o rad ϕ = {x ∈ V | ϕ(x, y) = 0, ∀y ∈ V } Es inmediato probar que rad ϕ as´ definido es un subespacio de V . ıDefinici´n 5.2.6 Se dice que ϕ es regular (no degenerada) si su radical es el vector 0. oDefinici´n 5.2.7 Se llama rango de la forma bilineal sim´trica ϕ a: o e ran(ϕ) = dim V − dim rad ϕProposici´n 5.2.3 Sea ϕ una forma bilineal sim´trica de rango r. Sea A la matriz de ϕ en una base o eB. Entonces: ran ϕ = ran A Demostraci´ n. Sea W un subespacio complementario a rad ϕ: o V = W ⊕ rad ϕy sea B una base adaptada a esta descomposici´n: o B = {u1 , . . . , ur , ur+1 , . . . , un } La matriz de ϕ en la base B es: C 0 0 0donde C es una matriz r × r que probaremos que tiene determinante distinto de cero. Construyamos una combinaci´n lineal de las r columnas de C igual a cero: o     ϕ(u1 , u1 ) ϕ(u1 , ur )  . .   . .  λ1  .  + · · · + λr  . =0 ϕ(ur , u1 ) ϕ(ur , ur )
  • 105. 98 TEMA 5. ESPACIOS CON PRODUCTO ESCALARes decir: λ1 ϕ(ui , u1 ) + · · · + λr ϕ(ui , ur ) = 0, i = 1, . . . , ro, usando las propiedades de bilinealidad de ϕ: ϕ(ui , λ1 u1 + · · · + λr ur ) = 0, i = 1, . . . , rComo consecuencia, el vector v = λ1 u1 + · · · + λr ur est´ en el radical, pues: a ϕ(ui , v) = 0, i = 1, . . . , n Sin embargo, v ∈ W por lo que v = 0. Como los vectores u1 , . . . , ur son l.i., se concluye queλ1 = · · · = λr = 0 y las columnas de C son l.i. lo que asegura que el rango de A es igual a r. QED El cambio de base no modifica el rango de la matriz (pues det P = 0), por lo que la dimensi´n del oradical (y por tanto el rango de la forma bilineal) es igual al rango de la matriz que representa a ϕ encualquier base. Ve´moslo de otra forma. Sea r = ran(A), siendo A la matriz de ϕ en una base arbitraria. Las acolumnas de la matriz A tienen n − r relaciones lineales linealmente independientes: λ11 ϕ(ui , u1 ) + · · · + λ1n ϕ(ui , un ) = 0 . . . λn−r,1ϕ(ui , u1) + · · · + λn−r,n ϕ(ui , un ) = 0con i = 1, . . . , n. Aplicando las propiedades de ϕ: ϕ(ui , λ11u1 + · · · + λ1n un ) = 0 . . . ϕ(ui , λn−r,1 u1 + · · · + λn−r,n un ) = 0Por tanto, los vectores: {λ11u1 + · · · + λ1n un , . . . , λn−r,1u1 + · · · + λn−r,n un } son una base del radical deϕ que tiene dimensi´n n − r (son linealmente independientes, anulan a una base y no hay m´s vectores o al.i. con estas propiedades). QED Con este resultado es inmediato demostrar la siguiente proposici´n: oProposici´n 5.2.4 Sea ϕ: V × V → IK una forma bilineal sim´trica. Entonces: o e ϕ regular ⇔ det A = 0donde A es la matriz de ϕ en una base de V .5.2.6 OrtogonalidadSea ϕ una forma bilineal sim´trica en un IK-espacio vectorial V . eDefinici´n 5.2.8 Se dice que x, y ∈ V son ortogonales (x ⊥ y) respecto ϕ si ϕ(x, y) = 0. oDefinici´n 5.2.9 Se dice que x ∈ V es is´tropo (siempre respecto ϕ) si ϕ(x, x) = 0. o oDefinici´n 5.2.10 Si U es un subespacio de V , el subespacio ortogonal a U es: o U ⊥ = {x ∈ V | ϕ(x, y) = 0, ∀y ∈ U} Veamos dos propiedades de la relaci´n de ortogonalidad. o
  • 106. 5.2. FORMAS BILINEALES 99Proposici´n 5.2.5 Sea ϕ una forma bilineal sim´trica regular en V y U un subespacio de V . Entonces: o e dim V = dim U + dim U ⊥ . Demostraci´ n. Sea B una base de V (de dimensi´n n), y o o BU = {u1 , . . . , um } una base de U . Lasecuaciones de U ⊥ son:     b11 · · · b1n x1  . . . A . .   .   . . . =0 bm1 · · · bmn xndonde bij son las coordenadas de los vectores de la base BU en la base B y A es la matriz de la formabilineal ϕ en la base B. Tenemos un sistema de ecuaciones que define U ⊥ : BAX = 0. El rango de la matriz BA es igual alrango de la matriz B, ya que la matriz A es regular. Por lo tanto, la dimensi´n del espacio de soluciones de oeste sistema es el n´mero de inc´gnitas, que es n, menos el de ecuaciones que es m, siendo m justamente u ola dimensi´n de U . o QEDProposici´n 5.2.6 Sea ϕ una forma bilineal sim´trica regular en V y U un subespacio de V . Si ϕ|U es o eregular, entonces: V = U ⊕ U⊥ Nota: Aunque ϕ sea un forma regular en V , esto no quiere decir que lo sea en cualquier subespacio. Demostraci´ n. Veamos que la intersecci´n de U y U ⊥ es igual al vector 0. o o Si x ∈ U ∩ U ⊥ , entonces ϕ(x, y) = 0, ∀y ∈ U, ya que x est´ en U ⊥ . Como x tambi´n pertenece a a eU, se deduce que x est´ en el radical de la forma ϕ restringida a U (pues est´ en U y anula a todos los a avectores de U): x ∈ rad ϕ|U Pero esta forma es regular, luego su radical es el vector nulo y por tanto x = 0. Es decir: U ∩ U ⊥ = {0} Como adem´s se tiene por la proposici´n anterior: a o dim V = dim U + dim U ⊥concluimos que: V = U ⊕ U ⊥. QED5.2.7 Diagonalizaci´n de formas bilineales sim´tricas o eComo ya hemos visto, al cambiar la base la matriz asociada a una forma bilineal cambia. Podemosintentar buscar una base en la cual la matriz sea lo m´s sencilla posible. Demostraremos a continuaci´n a oque, para las formas bilineales sim´tricas, siempre es posible encontrar una base en la cual la matriz sea ediagonal.Proposici´n 5.2.7 Sea V un IK-espacio vectorial de dimensi´n n y ϕ: V × V → IK una forma bilineal o osim´trica de rango r. Entonces, existe una base de V , B = {u1 , . . . , un } en la cual se tiene: e ϕ(ui , uj ) = 0, i=j ϕ(ui , ui ) = ci , i = 1, . . . , nAdem´s: a c1 , . . . , cr = 0, cr+1 = . . . = cn = 0
  • 107. 100 TEMA 5. ESPACIOS CON PRODUCTO ESCALAREn el caso complejo, la base se puede escoger de forma que: c1 = · · · = cr = 1En el caso real, existe un n´mero entero mayor o igual que cero, p, tal que: u c1 = · · · = cp = 1, cp+1 = · · · = cr = −1En este caso, se llama signatura de la forma bilineal ϕ al par (p, q), con q = r − p. Demostraci´n. El problema se puede reducir al caso regular. Sea: o V = W ⊕ rad ϕEn una base adaptada a esta descomposici´n, la matriz de la forma bilineal es: o B 0 A= 0 0con det B = 0 y por tanto ϕ|W regular. Supongamos entonces que ϕ: V × V → IK es una forma bilineal sim´trica regular. Sea u1 un vector ede V tal que: ϕ(u1 , u1 ) = c1 = 0. Al menos existe un vector con estas caracter´ ısticas. Si no fuera as´ la ı,forma bilineal ser´ cero. En efecto, es inmediato probar que: ıa 1 ϕ(x, y) = (ϕ(x + y, x + y) − ϕ(x, x) − ϕ(y, y)) 2lo que permite expresar una forma bilineal en t´rminos de sus valores sobre la diagonal de V × V (el econjunto de pares con las dos componentes iguales). Sea W1 = lin{u1 }. Como ϕ es regular, (y ϕ|W1 tambi´n) se tiene: e ⊥ V = W1 ⊕ W1Al ser ϕ|W1 regular, se puede probar que ϕ|W1 tambi´n es regular. ⊥ e ⊥ ⊥ Si no fuera as´ existir´ un vector x ∈ W1 , tal que ϕ(x, y) = 0, ∀y ∈ W1 . En este caso, ϕ(x, y) = ı, ıa0, ∀y ∈ V , ya que: ϕ(x, y) = ϕ(x, y1) + ϕ(x, y2 ) = 0 ⊥donde y1 ∈ W1 , y2 ∈ W1 , y ϕ no ser´ regular en V . ıa ⊥ Consideremos ahora un segundo vector u2 en el espacio W1 , tal que: ϕ(u2 , u2 ) = c2 = 0 y con-struyamos el subespacio: W2 = lin{u1 , u2 }.La forma bilineal ϕ es tambi´n regular en W2 (pues su matriz asociada en la base {u1 , u2 } es diagonal y elos valores en la diagonal son c1 , c2 que son distintos de cero). Por tanto: ⊥ V = W2 ⊕ W2 . Como el espacio es de dimensi´n finita, podemos seguir este proceso hasta construir una base de V : o{u1 , . . . , un }, que satisface las condiciones del teorema. Si IK = C, podemos tomar otra base: 1 1 √ u1 , . . . , √ un , c1 cnque hace que la matriz asociada tenga todos los elementos de la diagonal iguales a 1. Si estamos en IR, se puede tomar como base: 1 1 u1 , . . . , un , |c1 | |cn |
  • 108. 5.2. FORMAS BILINEALES 101y en ella los elementos de la diagonal de la matriz asociada son iguales a ±1. QED En el caso real, el n´mero de +1 y −1 en la diagonal (para una matriz diagonal, lo que hemos llamado usignatura de la forma bilineal) no depende de la base elegida (hay muchas bases en las cuales la matrizes diagonal y est´ formada por ±1 y 0). Es claro que el n´mero de ceros, que es igual al rango de la a uforma bilineal, no cambia al cambiar de base. No es tan evidente que la signatura sea un invariantecaracter´ ıstico de la forma bilineal. Se tiene el siguiente teorema:Teorema 5.2.1 Teorema de Sylvester. (Ley de inercia). La signatura de una forma bilineal sim´trica ereal es un invariante. Demostraci´ n. Sean {u1 , . . . un }, {u1 , . . . un } dos bases de V con las siguientes propiedades: o ϕ(ui , uj ) = 0, i=j ϕ(ui , uj ) = 0, i=j ϕ(ui , ui ) = 1, i = 1, . . . , p ϕ(ui , ui ) = 1, i = 1, . . . , p ϕ(ui , ui ) = −1, i = p + 1, . . . , r ϕ(ui , ui ) = −1, i = p + 1, . . . , r ϕ(ui , ui ) = 0, i = r, . . . , n ϕ(ui , ui ) = 0, i = r, . . . , n Demostremos que p = p . Para ello, supongamos primero que p > p. Sea {u1∗ , . . . , un } la base dual ∗de {u1 , . . . un }. El sistema de ecuaciones: ∗ x, uk = 0, k = p + 1, . . . , rtiene soluciones no triviales cuando nos restringimos a x ∈ lin{up+1 , . . . , ur }. En efecto, se trata de unsistema con r − p ecuaciones y r − p inc´gnitas, y r − p < r − p al ser p > p. Sea x una de esas soluciones. oSi escribimos x en la base {ui }, resulta ser una combinaci´n lineal de los vectores: {up+1 , . . . , ur }. Si olo hacemos en la base {ui }, es una combinaci´n lineal de: {u1 , . . . , up , ur+1 , . . . , un }, pues verifica el osistema anterior (basta recordar como se escrib´ las coordenadas de un vector en una base usando la ıanbase dual). Es decir: x = y + z, y ∈ lin{u1 , . . . , up }, z ∈ lin{ur+1 , . . . , un }.El valor que toma la forma bilineal ϕ sobre x es: ϕ(x, x) = ϕ(y, y) + ϕ(z, z) + 2ϕ(y, z) = ϕ(y, y) ≥ 0.Sin embargo, ϕ(x, x) < 0pues x ∈ lin{up+1 , . . . , ur }. Por lo tanto, p ≤ p . De manera similar probar´ ıamos que p ≤ p y con-cluir´ ıamos que p = p . QED En el caso real, existen tipos de formas bilineales sim´tricas particularmente interesantes. eDefinici´n 5.2.11 Sea ϕ una forma bilineal sim´trica definida sobre un espacio vectorial real de di- o emensi´n n. Se dice que ϕ es definida positiva si o ϕ(x, x) > 0, ∀x ∈ V, x = 0En este caso, el rango de la forma bilineal es n y la signatura es (n, 0). Se dice que ϕ es definida negativasi ϕ(x, x) < 0, ∀x ∈ V, x = 0En este caso, el rango de la forma bilineal es tambi´n n y la signatura es (0, n). e Se puede hablar tambi´n de formas semidefinidas positivas o negativas, cuando las desigualdades no eson estrictas.
  • 109. 102 TEMA 5. ESPACIOS CON PRODUCTO ESCALAR5.2.8 Ortonormalizaci´n de Gram-Schmidt oDel apartado anterior se deduce inmediatamente que una forma bilineal sim´trica real definida positiva etiene como matriz asociada en una base apropiada, la matriz identidad. Se dice entonces que la basecorrespondiente es ortonormal. El proceso de ortonormalizaci´n de Gram-Schmidt es una forma particular ode construir bases ortonormales a partir de una base cualquiera para formas bilineales definidas positivas.Proposici´n 5.2.8 (Gram-Schmidt.) Sea V un IR-espacio vectorial de dimensi´n finita n. Sea ϕ ∈ o oS2 (V ) definida positiva y B = {e1 , . . . , en } una base de V . Entonces, existe una base de V , B ={u1 , . . . , un } tal que: i.- lin{e1 , . . . , er } = lin{u1 , . . . , ur }, ii.- ϕ(ui , uj ) = δij , i, j = 1, . . . , n, es decir, B es una base ortonormal. Demostraci´n. Se define el primer vector de la base B como: o 1 u1 = e1 ϕ(e1 , e1 )que cumple las dos condiciones del teorema, pues ϕ es definida positiva. El segundo vector se obtienecomo una combinaci´n lineal de u1 y e2 . Sea: o u2 = e2 − λ21 u1donde λ21 es un n´mero real a fijar. Para ello imponemos que u2 sea ortogonal a u1: u ϕ(u1 , e2 − λ21 u1 ) = ϕ(u1 , e2 ) − λ21ϕ(u1 , u1 )de donde se deduce: λ21 = ϕ(u1, e2 ) Si ahora definimos: 1 u2 = u2 ϕ(u2 , u2 )los vectores u1 , u2 verifican las condiciones del teorema. Supongamos que de esta forma hemos construido los vectores u1, . . . , ur que verifican las condicionesdel proceso de ortonormalizaci´n de Gram-Schmidt. Buscamos ur+1 como una combinaci´n lineal de o oer+1 y de los ya construidos u1 , . . . , ur : r ur+1 = er+1 − λr+1,j uj j=1 Imponiendo las condiciones ϕ(ur+1 , ui ) = 0, i = 1, . . . , r, se obtienen los par´metros λij : a r r 0 = ϕ(er+1 , ui ) − λr+1,j ϕ(uj , ui ) = ϕ(er+1 , ui ) − λr+1,j δji j=1 j=1lo que nos da la soluci´n: o λr+1,i = ϕ(er+1 , ui )es decir: r ur+1 = er+1 − ϕ(er+1 , ui )ui i=1 Normalizando el vector ur+1 (es decir, dividiendo por la ra´ cuadrada de ϕ(ur+1 , ur+1 )) obtenemos ızel vector ur+1 . Este vector cumple las condiciones del teorema como es f´cil observar (n´tese que er+1 a ono depende linealmente de u1 , . . . , ur ). El proceso termina al ser V un espacio de dimensi´n finita. o QED
  • 110. ´5.3. FORMAS CUADRATICAS 1035.3 Formas Cuadr´ticas aDada una forma bilineal sim´trica, ϕ, se verifican las identidades siguientes (identidades de polarizaci´n) e oque permiten expresar los valores que toma ϕ sobre cualquier par de vectores en funci´n de los que toma osobre la diagonal (como ya hemos usado anteriormente). 1 ϕ(x, y) = [ϕ(x + y, x + y) − ϕ(x, x) − ϕ(y, y)] 2 1 ϕ(x, y) = [ϕ(x + y, x + y) − ϕ(x − y, x − y)] 4Su demostraci´n es inmediata sin m´s que desarrollar. o aDefinici´n 5.3.1 Sea V un IK-espacio vectorial. Una aplicaci´n: Q: V → IK es una forma cuadr´tica o o asi: a) Q(λx) = λ2 Q(x)y la aplicaci´n ϕQ : V × V → IK, definida por: o 1 b) ϕQ (x, y) = [Q(x + y) − Q(x) − Q(y)] 2es una forma bilineal sim´trica. e A cada forma cuadr´tica le corresponde una forma bilineal sim´trica, y viceversa, dada una forma a ebilineal sim´trica podemos construir un forma cuadr´tica mediante: e a Qϕ (x) = ϕ(x, x) Se tiene: Q → ϕQ → QϕQ = Q Se dice que una forma cuadr´tica es definida positiva, etc, si la correspondiente forma bilineal lo es. aSi A es la matriz de la forma bilineal ϕQ en una base B, se dice que A es la matriz de la forma cuadr´tica aen esa base. La expresi´n de Q(x) es entonces: o Q(x) = X t AXy por supuesto, At = A. Es decir, la matriz asociada a una forma cuadr´tica en cualquier base es asim´trica. e5.3.1 Diagonalizaci´n de formas cuadr´ticas o aEl problema de reducir una forma cuadr´tica a una suma de cuadrados (en C) o a una suma y diferencia ade cuadrados (en IR) es el de encontrar una base en la cual la forma bilineal sim´trica asociada tenga euna matriz diagonal con ±1 y 0 en la diagonal. Ya hemos visto que eso es siempre posible. Veamos ahora un m´todo pr´ctico de hacerlo, el m´todo de Lagrange. La forma cuadr´tica Q se e a e aescribe en una base dada como: n Q(x) = aik xi xk i,k=1donde aik = aki . La idea del m´todo es la de completar cuadrados. Supongamos que existe un elemento ede la diagonal no nulo, ajj = 0. Entonces, Q se puede escribir como: n 2 1 Q(x) = aji xi + Q1 (x), ajj i=1
  • 111. 104 TEMA 5. ESPACIOS CON PRODUCTO ESCALARdonde Q1 es otra forma cuadr´tica. Lo importante es que el primer sumando es el cuadrado de una suma a(salvo un factor que se puede incluir extrayendo su ra´ cuadrada, o la de su valor absoluto si estamos en ızIR) y que Q1 no depende de xj . Basta desarrollar el cuadrado y restarlo de Q(x) para comprobarlo. Deesta forma podemos seguir el procedimiento con Q1(x) que depende de n − 1 variables, hasta acabar eldesarrollo. Podr´ ocurrir que en alg´n momento, ninguno de los elementos de la diagonal fuera distinto ıa ude cero. Supongamos entonces que aii = 0, i = 1, . . . , n. Existir´ un elemento ajh = 0. La descomposici´n a oque podemos hacer ahora es: n 2 n 2 1 1 Q(x) = (ajk + ahk )xk − (ajk − ahk )xk + Q2 (x) 2ajh 2ajh k=1 k=1 ndonde Q2 (x) es una forma cuadr´tica que no depende de xj , xh , y las formas lineales k=1 (ajk + ahk )xk , a n k=1 (ajk − ahk )xk son linealmente independientes. Basta desarrollar para comprobar estas afirmaciones,pero es f´cil darse cuenta que no se trata m´s que de una generalizaci´n de la siguiente (y evidente) a a oidentidad: 1 1 2xy = (x + y)2 − (x − y)2 2 2 Al descomponer en suma de cuadrados (o suma y diferencia), las formas lineales que aparecen (elevadasal cuadrado) en la descomposici´n son linealmente independientes (en el primero de los supuestos es trivial, opues dependen de un n´mero de variables distinto cada vez; en el segundo se puede comprobar como se uha dicho anteriormente). Esta formas lineales dan el cambio de base, o al menos parte de ´l, pues la eforma puede no ser regular (con radical no nulo) y aparecer menos de n cuadrados en la suma. En esteultimo caso no es dif´ completarlas con otras formas l.i. hasta tener la expresi´n de la nueva base en la´ ıcil oque la forma cuadr´tica es diagonal. a5.3.2 Formas cuadr´ticas definidas aSi una forma cuadr´tica (o una forma bilineal sim´trica) est´ escrita en una base arbitraria, no es posible a e adeducir si es definida positiva o no de una inspecci´n de los elementos de la matriz, como es el caso en oel que esta matriz es diagonal. Sin embargo se puede dar un criterio sencillo que permite averiguar estapropiedad mediante el c´lculo de los menores principales (los determinantes de las matrices que est´n a aconstruidas sobre la diagonal, tomando los elementos de las r primeras filas y r primeras columnas hastahacer una matriz cuadrada r × r).Proposici´n 5.3.1 Sea Q una forma cuadr´tica definida sobre un espacio vectorial real, y A su matriz o aen una base B. Entonces, Q es definida positiva si y solo si los menores principales de A, D1 , D2 , . . . , Dnson todos mayores que cero.Proposici´n 5.3.2 Sea Q una forma cuadr´tica definida sobre un espacio vectorial real, y A su matriz o aen una base B. Entonces, Q es definida negativa si y solo si los menores principales de A, verifican: D1 < 0, D2 > 0, . . . , (−1)n Dn > 0 No demostraremos estas propiedades.5.4 Producto escalarDe entre todas las formas bilineales sim´tricas, las definidas positivas presentan unas propiedades particu- elares que las hacen apropiadas para las aplicaciones en F´ısica (junto con las pseudodefinidas Lorentzianas).
  • 112. 5.4. PRODUCTO ESCALAR 1055.4.1 Producto escalar en un espacio realDefinici´n 5.4.1 Un producto escalar en un espacio vectorial real V es una forma bilineal sim´trica o edefinida positiva. Es decir: ( , ): V × V → IRcon las propiedades: i) (x, y) = (y, x), x, y ∈ V ii) (x + y, z) = (x, z) + (y, z), (λx, y) = λ(x, y), x, y, z ∈ V, λ ∈ IR iii) (x, x) ≥ 0, ∀x ∈ V, (x, x) = 0 ⇔ x = 05.4.2 Formas sesquilinealesEsta definici´n no puede extenderse a espacios complejos, pues el concepto de forma bilineal sim´trica o edefinida positiva no se puede establecer all´ Sin embargo, una aplicaci´n similar a ´sta puede definirse ı. o een espacios complejos, sustituyendo la propiedad de bilineal por otra.Definici´n 5.4.2 Sea V un espacio vectorial complejo. Una forma sesquilineal es una aplicaci´n: o o φ: V × V → Cque verifica: i) φ(x, y) = φ(y, x), x, y ∈ V ii) φ(x, y + z) = φ(x, y) + φ(x, z), φ(x, λy) = λφ(x, y), x, y, z ∈ V, λ ∈ C Debido a la primera propiedad se tiene: ¯ φ(λx, y) = λφ(x, y),es decir, la aplicaci´n no es bilineal. Solo es lineal en la segunda variable, pero no en la primera (se trata ode una convenci´n, en otros lugares la definici´n se hace de modo que la aplicaci´n es lineal en la primera o o ovariable). La teor´ de formas sesquilineales es muy similar a la de formas bilineales sim´tricas reales. Si el ıa eespacio es de dimensi´n finita, podemos escribir la aplicaci´n en una base dada. Es f´cil ver (siguiendo o o aen todo la teor´ de las formas bilineales), que la expresi´n es: ıa o φ(x, y) = X + AYdonde X, Y son los vectores de Cn que representan a x, y ∈ V en esa base y X + representa la transpuestaconjugada de una matriz. Debido a la primera propiedad de las formas sesquilineales, la matriz A verifica: A+ = A(las matrices con esta propiedad se llaman herm´ ıticas). En efecto: φ(x, y) = X + AY = (X + AY )+ = Y + A+ X = Y + AX, ∀X, Y ∈ Cn Al igual que en el caso real las matrices sim´tricas estaban asociadas a las formas bilineales reales, en eel caso complejo las matrices herm´ ıticas est´n asociadas a las formas sesquilineales. Si el espacio es real, auna forma sesquilineal es simplemente una forma bilineal sim´trica (al ser el conjugado de un n´ mero e ureal igual a s´ mismo). ı Si se cambia la base, la matriz de una forma sesquilineal cambia. Como se puede comprobar f´cilmente a(siempre teniendo como gu´ las formas bilineales sim´tricas), si P es la matriz de cambio de base (es ıa edecir la que expresa los vectores de la segunda base en funci´n de los de la primera) se tiene: o A = P + AP Lo que hace particularmente interesantes a las formas sesquilineales es que los valores que toman sobrela diagonal (es decir sobre los pares (x, x)), son reales (basta usar la primera propiedad y comprobar queφ(x, x) es igual a su complejo conjugado). Debido a esto, se puede establecer para las formas sesquilinealesla propiedad de ser definida positiva (o negativa).
  • 113. 106 TEMA 5. ESPACIOS CON PRODUCTO ESCALARDefinici´n 5.4.3 Sea φ una forma sesquilineal sobre un espacio complejo. Se dice que φ es definida opositiva si φ(x, x) ≥ 0, ∀x ∈ V, φ(x, x) = 0 ⇔ x = 05.4.3 Producto escalar complejoAhora podemos definir un producto escalar en un espacio vectorial complejo.Definici´n 5.4.4 Sea V un espacio vectorial complejo. Un producto escalar en V es una aplicaci´n o osesquilineal definida positiva. Es decir, ( , ): V × V → Ccon las propiedades: i) (x, y) = (y, x), x, y ∈ V ii) (x + y, z) = (x, z) + (y, z), (λx, y) = λ(x, y), x, y, z ∈ V, λ ∈ C iii) (x, x) ≥ 0, ∀x ∈ V, (x, x) = 0 ⇔ x = 0 El producto escalar real puede considerarse como un caso particular del complejo, por lo que en lossiguientes apartados, nos referiremos de forma sistem´tica al caso complejo, considerando al real incluido aen nuestras afirmaciones.5.4.4 Norma en un espacio vectorialUna norma en un espacio vectorial permite asignar a cada vector una longitud.Definici´n 5.4.5 Una norma en un espacio vectorial V es una aplicaci´n: o o · : V → IRque verifica: a) x ≥ 0, ∀x ∈ V, x =0⇔x=0 b) λx = |λ| x , λ ∈ C, x ∈ V c) x + y ≤ x + y , x, y ∈ V La tercera propiedad se conoce como desigualdad triangular. La definici´n es la misma en el caso real. oEn el caso complejo, se toma el m´dulo de λ, que es un n´mero real, y en el caso real, el valor absoluto o ude λ (que es un n´mero real). u Una norma no est´ relacionada, en principio, con un producto escalar. Sin embargo, dado un producto aescalar siempre es posible definir una norma a partir de ´l. Es decir, un producto escalar nos permite edefinir la longitud de un vector. La norma asociada a un producto escalar se define como: x = (x, x), x∈VProposici´n 5.4.1 Si ( , ) es un producto escalar, la aplicaci´n o o · definida anteriormente, es unanorma en V . Demostraci´n. La propiedad a) de las normas es inmediata a consecuencia de ser definido positivo oel producto escalar (como forma bilineal sim´trica en el caso real o como forma sesquilineal en el caso ecomplejo). La propiedad b) es: λx 2 ¯ = (λx, λx) = λλ(x, x) = |λ|2 x 2de donde: λx = |λ| x . La tercera propiedad, la desigualdad triangular es algo m´s dif´ de demostrar. Veremos que es una a ıcilconsecuencia de la desigualdad de Cauchy-Schwarz que demostramos a continuaci´n. o
  • 114. 5.4. PRODUCTO ESCALAR 107 Desigualdad de Cauchy-Schwarz: |(x, y)| ≤ (x, x)(y, y), x, y ∈ V Para demostrarlo, consideremos el producto escalar del vector λx − µy por s´ mismo. Se obtiene un ın´ mero real mayor o igual que cero: u ¯ (λx − µy, λx − µy) = |λ|2 (x, x) + |µ|2 (y, y) − λµ(x, y) − λ¯(y, x) ≥ 0 µ Como la desigualdad es cierta para todo los escalares λ, µ, elegimos: λ = (x, y), µ = (x, x) |(x, y)|2 (x, x) + (x, x)2 (y, y) − 2(x, x)|(x, y)|2 ≥ 0es decir: |(x, y)|2 ≤ (x, x)(y, y)lo que demuestra la desigualdad de Cauchy-Schwarz. Esta desigualdad es estricta si y s´lo si los vectores ox, y son linealmente independientes. La desigualdad triangular es ahora inmediata: 2 x+y = (x + y, x + y) = (x, x) + (y, y) + (x, y) + (x, y) = (x, x) + (y, y) + (x, y) + (x, y) 2 2 ≤ x + y +2 x yde donde se deduce: x+y ≤ x + y QED5.4.5 OrtogonalidadLa relaci´n de ortogonalidad definida para formas bilineales sim´tricas, se extiende a formas sesquilineales o esin ning´n problema. uDefinici´n 5.4.6 Sea V un espacio vectorial (real o complejo) y ( , ) un producto escalar en V . Se dice oque dos vectores son ortogonales con respecto a este producto escalar si (x, y) = 0. Al ser un producto escalar, la matriz asociada en cualquier base es regular y el unico vector que es ´ortogonal a todo el espacio es el vector 0. Dada una base cualquiera en un espacio vectorial (de dimensi´n finita) con un producto escalar, es oposible construir una base ortonormal (es decir, (ui , uj ) = δij , i, j = 1, . . . n), utilizando, por ejemplo,el m´todo de Gram-Schmidt (el hecho de ser una forma sesquilineal no afecta para nada al desarrollo. eSimplemente hay que prestar atenci´n a los complejos conjugados). o Sea B = {u1 , . . . , un } una base ortonormal en un espacio V de dimensi´n finita dotado de un producto oescalar. Los coeficientes de cualquier vector en esta base se pueden calcular f´cilmente: a n x ∈ V, x= xi ui i=1Haciendo el producto escalar de uj por x se tiene: n n n (uj , x) = (uj , xi ui ) = xi (uj , ui ) = xi δji i=1 i=1 i=1es decir: xi = (ui , x), ∀i = 1, . . . , n
  • 115. 108 TEMA 5. ESPACIOS CON PRODUCTO ESCALARy por tanto: n x= (ui , x)ui i=1 En una base ortonormal, la matriz asociada a un producto escalar es la matriz identidad, es decir: n (x, y) = xi yi ¯ i=1 En lo que se refiere a subespacios, se tiene:Proposici´n 5.4.2 Sea V un espacio vectorial de dimensi´n finita sobre IR o C. Sea W un subespacio de o oV y W ⊥ su ortogonal (definido de la forma ya establecida en el estudio de formas bilineales sim´tricas). eEntonces: V = W ⊕ W ⊥. Se dice que W ⊥ es el complemento ortogonal de W . Las propiedades de ortogonalidad son fundamen-tales en la descripci´n de espacio dotados de un producto escalar. N´tese que en bases ortogonales todos o olos productos escalares son el mismo.5.4.6 Proyecci´n ortogonal oSea V un espacio vectorial (real o complejo) con un producto escalar. Sea W un subespacio propio deV , y W ⊥ su complemento ortogonal. Todo vector de V se puede poner de manera unica como la suma ´de dos vectores ortogonales entre s´ ı: x = y + z, x ∈ V, y ∈ W, z ∈ W ⊥ .Debido a que y, z est´n definidos un´ a ıvocamente por x podemos definir las siguientes aplicaciones: P1 : V → V P2 : V → V . x → y x → z Las aplicaciones P1 y P2 , que son claramente lineales, se llaman las proyecciones ortogonales sobre Wy W ⊥ respectivamente. Estas aplicaciones verifican las siguientes propiedades:Proposici´n 5.4.3 Si P1 y P2 son las proyecciones ortogonales sobre los espacios W y W ⊥ se tiene: o a) P1 + P2 = 1V 2 2 b) P1 = P1 , P2 = P2 , P1 P2 = P2 P1 = 0 c) (P1 x, x ) = (x, P1 y), (P2 x, x ) = (x, P2x ), x, x ∈ V Demostraci´n. Si x = y + z, de acuerdo con la descomposici´n V = W ⊕ W ⊥ : o o y = P1 (x), z = P2 (x)y por tanto: x = y + z = P1 (x) + P2 (x) = (P1 + P2 )(x), ∀x ∈ Ves decir la suma de los proyectores ortogonales es igual a la identidad en V . Adem´s, de P1 (x) = y ∈ W , se deduce: a 2 2 P1 (x) = P1 (y) = y = P1(x) ⇒ P1 = P1De la misma manera se prueba para P2 Tambi´n es f´cil de probar la otra propiedad: e a 2 P1 P2 = P1 (1V − P1 ) = P1 − P1 = 0
  • 116. 5.4. PRODUCTO ESCALAR 109y de igual forma P2 P1 = 0. Finalmente: (P1x, x ) = (y, y + z ) = (y, y ) = (y + z, P1 (x )) = (x, P1 (x ))y de la misma forma para P2 . QED Veamos ahora como se escribe la proyecci´n ortogonal en una base ortonormal adaptada a la descom- oposici´n de subespacios. Sea V un espacio vectorial de dimensi´n finita n, y W un subespacio propio de o odimensi´n r, Sea B = {e1 , . . . , en } una base ortonormal de V en la cual queremos calcular las matrices oque representan a P1 y P2 . Sea B = {u1, . . . , un } una base ortonormal de V , de forma que {u1 , . . . , ur }sea una base (tambi´n ortonormal) de W . El teorema de ampliaci´n de la base permite obtener este resul- e otado. Aunque en principio est´ establecido para bases no necesariamente ortonormales, el procedimiento ade Gram-Schmidt nos asegura que la situaci´n anterior es correcta. Como consecuencia, el resto de los ovectores de la base B , es decir: {ur+1 , . . . , un } son un base (tambi´n ortonormal) de W ⊥ . Supongamos eque los vectores de la base B tienen como coordenadas en la base B los vectores columna de Cn (o IRnsi el espacio es real): U1 , . . . , Un ∈ Cn Sea x un vector de V y X ∈ Cn sus coordenadas en la base B. Entonces: r r y = P1 (x) = (ui , x)ui = (Ui+ X)ui i=1 i=1es decir, en coordenadas: r r Y = (Ui+ X)Ui =( Ui Ui+ )X i=1 i=1y por tanto, la matriz asociada a P1 es: r Ui Ui+ i=1T´ngase en cuenta que ambas bases son ortonormales para poder deducir este resultado. La matriz que erepresenta a P2 en esta misma base es: n Ui Ui+ i=r+1y se tiene: n Ui Ui+ = In i=1siendo In la matriz identidad en dimensi´n n. o Un resultado de gran utilidad en muchos campos (en particular en espacios de dimensi´n infinita) es oel teorema de la proyecci´n ortogonal. La pregunta que se puede uno plantear es: dado un vector de un oespacio vectorial con un producto escalar cu´l es el vector de entre todos los de un subespacio que mejor aaproxima a este vector. La respuesta es que es la proyecci´n ortogonal del vector sobre el subespacio. oTeorema 5.4.1 Sea V un espacio vectorial de dimensi´n finita y x ∈ V . Sea W un subespacio de W . oLa norma del vector x − w, donde w ∈ W , toma su valor m´ ınimo cuando w es la proyecci´n ortogonal ode x sobre W . Demostraci´ n. De acuerdo con el resultado sobre descomposici´n ortogonal de V referida al sube- o ospacio W , x = y + z donde y ∈ W, z ∈ W ⊥ . Entonces x−w = y +z −w = y −w + z ⊥pues y − w ∈ W , z ∈ W . Esta expresi´n es m´ o ınima cuando el primer sumando es cero: y − w = 0, ypor lo tanto: w = PW (x). QED
  • 117. 110 TEMA 5. ESPACIOS CON PRODUCTO ESCALAR5.4.7 La propiedad del paralelogramoHemos visto anteriormente que todo producto escalar da lugar a una norma asociada a ´l. La pregunta eque surge es si toda norma deriva de un producto escalar. La respuesta es no. Existe una propiedadsencilla que caracteriza a las normas que provienen de un producto escalar.Teorema 5.4.2 1) Sea · una norma que proviene de un producto escalar, es decir: x = (x, x)Entonces: 2 2 2 2 x+y + x−y =2 x +2 y 2) Sea · una norma que verifica: 2 2 2 2 x+y + x−y =2 x +2 y Entonces, · deriva de un producto escalar, que se escribe como: 1 2 2 2 2 (x, y) = x+y − x−y + i( x − iy − x + iy ) 4 La demostraci´n de la primera parte es inmediata. Basta escribir la definici´n de la norma en t´rminos o o edel producto escalar. La demostraci´n de la segunda parte es m´s complicada y necesita argumentos de o acontinuidad en n´meros reales. No la haremos aqu´ u ı.5.4.8 El teorema de Riesz-Fr´chet eComo hemos tenido ocasi´n de estudiar, no existe un isomorfismo can´nico entre un espacio (de dimensi´n o o ofinita) y su dual. Sin embargo, si el espacio tiene un producto escalar, podemos establecer una corre-spondencia (que es un isomorfismo cuando el cuerpo es IR) entre ambos espacios usando este productoescalar asignando a cada forma lineal un vector del espacio original. Sea V un espacio vectorial (sobre IK = IR o IK = C) de dimensi´n finita, con un producto escalar. La oaplicaci´n: o ωx : V → IK y → (x, y)es una aplicaci´n lineal (con reales o complejos), es decir un elemento del dual, ωx ∈ V ∗ . El teorema de oRiesz-Fr´chet asegura que el resultado inverso es tambi´n cierto. e eTeorema 5.4.3 Dada una forma ω ∈ V ∗ existe un ´nico vector xω ∈ V tal que: u ω(y) = (xω , y), ∀y ∈ V Demostraci´n. Sea {u1 , . . . , un } una base ortonormal de V . Entonces: o n n n ω(y) = ω( (ui , y)ui ) = (ui , y)ω(ui ) = (ω(ui )ui , y) i=1 i=1 i=1y por lo tanto, el vector: n xω = ω(ui )ui i=1verifica el teorema. Veamos que es unico, aunque en la expresi´n anterior parezca depender de la base ´ oelegida. Supongamos que ω(y) = (x, y) = (x , y), ∀y ∈ V Entonces: (x − x , y) = 0, ∀y ∈ V
  • 118. 5.4. PRODUCTO ESCALAR 111Pero el unico vector ortogonal a todo el espacio es el vector 0, por tanto, x = x . ´ QED La correspondencia: ψ : V → V x → ωxes un isomorfismo de espacios vectoriales reales: ψ (x + y)(z) = (z, x + y) = (z, x) + (z, y) = ψ (x)(z) + ψ (y)(z)Adem´s: a ψ (λx)(z) = (z, λx) = λ(z, x) = λψ (x)(z)En espacios complejos aparece un conjugado.
  • 119. 112 TEMA 5. ESPACIOS CON PRODUCTO ESCALAR
  • 120. Tema 6Operadores en espacios con productoescalar Operadores en espacios complejos. Operador adjunto. Operadores autoadjuntos y uni- tarios. Proyectores ortogonales. Teorema espectral. Operadores en espacios reales. Operadores sim´tricos y ortogonales. e Al igual que cuando hablamos de diagonalizaci´n de endomorfismos, haremos aqu´ una distinci´n o ı oentre el caso real y complejo. Como veremos, el caso complejo es m´s simple que el real, y muchos de los aresultados que obtengamos en este caso ser´n aplicables en el real. a6.1 Operadores en espacios complejos con producto escalarEn toda esta secci´n V ser´ un espacio vectorial complejo de dimensi´n finita, dotado de un producto o a oescalar.6.1.1 El operador adjuntoLlamaremos operadores (lineales) a los endomorfismos de V . Para cada operador en V introducimos unoperador asociado.Definici´n 6.1.1 Sea A: V → V un operador. El operador adjunto se define como un operador A+ : V → oV que verifica: (x, Ay) = (A+ x, y), ∀x, y ∈ V. Veamos que tal operador existe. Para cada x ∈ V , definimos la siguiente forma lineal: V → Cy → (x, Ay)Por el teorema de Riesz-Fr´chet, existe un unico vector z ∈ V tal que: e ´ (x, Ay) = (z, y), ∀y ∈ VLa correspondencia x → z de V en V es lineal. Sean x, x ∈ V y consideremos la forma lineal: y → (x + x , Ay) = (x, Ay) + (x , Ay)Existe un unico z ∈ V tal que: ´ ˜ (x + x , Ay) = (˜, y), z ∀y ∈ Ves decir: (x, Ay) + (x , Ay) = (z, y) + (z , y) = (z + z , y) 113
  • 121. 114 TEMA 6. OPERADORES EN ESPACIOS CON PRODUCTO ESCALARde donde: z = z+z ˜ En cuanto al producto por escalares: Sean x ∈ V, λ ∈ C y consideremos: ¯ y → (λx, Ay) = λ(x, Ay)Existe un unico z ∈ V tal que: ´ ˜ (λx, Ay) = (˜, y), z ∀y ∈ Vy por tanto: ¯ ¯ λ(x, Ay) = λ(z, y) = (λz, y)de donde: z = λz ˜ La operaci´n de tomar adjuntos (pasar de A a A+ ) tiene las siguientes propiedades, que se pueden odemostrar f´cilmente: a 1) (A+ )+ = A 2) (A + B)+ = A+ + B + ¯ 3) (λA)+ = λA+ 4) (AB) = B + A+ + Por ejemplo, la propiedad 1): (x, Ay) = (A+ x, y) = (y, A+ x) = ((A+ )+ y, x) = (x, (A+ )+ y)relaci´n que debe ser cierta para todo x, y ∈ V , lo que demuestra 1). Las propiedades 2) y 3) son oinmediatas. En cuanto a 4): (x, ABy) = ((AB)+ x, y) = (A+ x, By) = (B + A+ x, y)6.1.2 Representaci´n matricial del operador adjunto oVeamos como obtener la representaci´n matricial del operador adjunto a partir de la del operador original. oSea V un espacio vectorial complejo de dimensi´n finita dotado de un producto escalar y B = {u1 , . . . , un } ouna base ortonormal de V . Sea A la matriz de A en la base B, es decir, A = (aij ): n Aui = aji uj , i = 1, . . . , n i=1 Sea A la matriz del operador adjunto, A = (aij ). Se tiene: (x, Ay) = (A+ x, y), ∀x, y ∈ V En particular: (ui , Auj ) = (A+ ui , uj ), ∀i, j = 1, . . . , n +y sustituyendo las expresiones de Auj y A ui : n n (ui , akj uk ) = ( aki uk , uj ) k=1 k=1 n n akj (ui , uk ) = aki (uk , uj ) ¯ k=1 k=1 n n akj δik = aki δkj ¯ k=1 k=1
  • 122. 6.1. OPERADORES EN ESPACIOS COMPLEJOS CON PRODUCTO ESCALAR 115 aij = aji ¯es decir: A = A+la matriz del operador adjunto es la matriz transpuesta conjugada (la matriz adjunta) del operadorde partida (el s´ımbolo + significar´ indistintamente operador adjunto o matriz transpuesta conjugada, adependiendo a qui´n est´ aplicado). N´tese que este resultado es solo cierto cuando la base en la que e e oest´n escritos los operadores es ortonormal. Si no es as´ la relaci´n es m´s complicada y hace intervenir a ı, o ala matriz del producto escalar. En estas bases que no son ortonormales, la matriz de A+ no es A+ , loque puede inducir a cierta confusi´n si no se presta atenci´n. o o Recordando como se calculaban las coordenadas de un vector en una base ortonormal, podemosencontrar una expresi´n de los elementos de matriz de un operador en bases de este tipo. En efecto, o n n n (ui , Auj ) = (ui , akj uk ) = akj (ui , uk ) = akj δik = aij k=1 k=1 k=1es decir: aij = (ui , Auj )6.1.3 Operadores normales, autoadjuntos y unitariosTeniendo en cuenta las relaciones entre A y A+ se pueden definir clases especiales de operadores. Sea(V, ( , )) un espacio vectorial complejo con producto escalar, y A un operador en V .Definici´n 6.1.2 Se dice que el operador A es normal si conmuta con su adjunto: o AA+ = A+ ADefinici´n 6.1.3 Se dice que el operador A es autoadjunto si coincide con su adjunto: o A+ = ADefinici´n 6.1.4 Se dice que el operador A es unitario si: o AA+ = A+ A = 1V Los operadores autoadjuntos verifican: (x, Ay) = (Ax, y),y en bases ortonormales vienen representados por matrices herm´ ıticas (o autoadjuntas): A+ = A. Los operadores unitarios verifican: (Ax, Ay) = (x, y),y en bases ortonormales, sus matrices son unitarias, es decir: AA+ = A+ A = In . Es inmediato comprobar que los operadores autoadjuntos y unitarios son normales. Existen operadoresnormales que no son autoadjuntos ni unitarios. Nuestro inter´s se centra en los operadores autoadjuntos ey unitarios. Sin embargo, es m´s conveniente, y no implica ning´n esfuerzo adicional, estudiar los a uoperadores normales y luego restringirnos a estos dos casos.
  • 123. 116 TEMA 6. OPERADORES EN ESPACIOS CON PRODUCTO ESCALAR6.1.4 Teorema espectral para operadores normalesNuestro objetivo es probar que los operadores normales son diagonalizables, es decir existe una base delespacio formada por autovectores, y adem´s esta base es ortonormal. Para ello demostraremos unos alemas previos que se verifican para operadores m´s generales. aProposici´n 6.1.1 Sea V un espacio vectorial complejo de dimensi´n finita y A, B dos endomorfismos o ode V , tales que AB = BA. Entonces, existe un vector no nulo y ∈ V que es autovector de A y B. Demostraci´n. Al ser V un espacio complejo de dimensi´n finita, el polinomio caracter´ o o ıstico delendomorfismo A tiene al menos una ra´ (teorema fundamental del ´lgebra). Es decir, existe al menos ız aun autovector de A, x ∈ V : Ax = λx, x ∈ V, x = 0, λ ∈ CComo A y B conmutan, los vectores Bx, B 2 x, . . . son tambi´n autovectores de A con el mismo autovalor: e AB k x = B k Ax = λB k x, k = 0, 1, 2, . . .Consideremos la sucesi´n de autovectores x, Bx, B 2 x, . . .. No pueden ser todos linealmente independi- oentes, pues el espacio es de dimensi´n finita (podr´ ocurrir que hubiera n = dim V vectores l.i. Entonces o ıael vector x se dice que es un vector c´ ıclico para A. La teor´ de vectores c´ ıa ıclicos es muy importantesobre todo en el caso de espacios de dimensi´n infinita, pero no la trataremos aqu´ Supongamos pues o ı).que B r+1 x depende linealmente de los anteriores. El subespacio que generan {x, Bx, . . . , B r x} es unsubespacio invariante bajo B, formado por autovectores de A de autovalor λ. Restringiendo B a estesubespacio, vemos que existe en ´l un autovalor de B, que por lo anterior tambi´n lo ser´ de A. QED e e a La siguiente proposici´n trata con espacios con producto escalar. oProposici´n 6.1.2 Sea V un espacio complejo de dimensi´n finita, con producto escalar. Sea A un o ooperador en V . Entonces, si S es un subespacio de V invariante bajo A (AS ⊂ S), el subespacioortogonal V ⊥ es invariante bajo A+ : A+ (S ⊥ ) ⊂ S ⊥ Demostraci´n. Sea y ∈ S ⊥ . Por la definici´n de operador adjunto: o o (x, A+ y) = (Ax, y)Si x ∈ S, al ser S invariante, Ax ∈ S, luego: (x, A+ y) = (Ax, y) = 0de donde A+ y ∈ S ⊥ . QED Enunciemos ahora el teorema espectral:Teorema 6.1.1 Sea V un espacio vectorial complejo de dimensi´n finita dotado de un producto escalar. oSea A un operador normal en V . Entonces, existe una base ortonormal de V formada por autovectoresde A. Demostraci´n. Al ser A normal, A conmuta con su adjunto, luego por la primera de las dos oproposiciones demostradas previamente, A y A+ tienen un autovector com´n: u Ax = λ1 x, A+ x = µx Como (x, Ay) = (Ax, y), se tiene: (x, Ax) = (x, λ1 x) = λ1 (x, x) = (A+ x, x) = (µx, x) = µ(x, x), ¯es decir: ¯ µ = λ1 .
  • 124. 6.1. OPERADORES EN ESPACIOS COMPLEJOS CON PRODUCTO ESCALAR 117 Sea x u1 = ||x||un autovector de norma 1 (vector unitario) de A y A+ . El subespacio S1 = lin{u1 } es invariante bajo Ay bajo A+ . Por lo tanto, haciendo uso de la segunda proposici´n, S1 es invariante bajo A (y bajo A+ ). o ⊥ ⊥ . Buscamos all´ un autovector com´ n a A y A+ (supongamos queConsideramos la restricci´n de A a S1 o ı ude norma 1): ¯ Au2 = λ2 u2 , A+ u2 = λ2u2 Adem´s: a (u1 , u2 ) = 0 Se construye el subespacio S2 = lin{u1 , u2 } y se continua el proceso, que debe acabar al ser elespacio de dimensi´n finita. De esta forma se obtiene una base formada por autovectores de A que son oortonormales. N´tese que es tambi´n una base de autovectores de A+ . o e QED Estudiaremos ahora una serie de resultados relacionados con este teorema espectral. Lo primero quedemostraremos es que la existencia de bases ortonormales caracteriza a los operadores normales.Proposici´n 6.1.3 Sea V un espacio vectorial complejo de dimensi´n finita dotado de producto escalar. o oSea A un operador en V y sea B = {u1 , . . . , un } una base ortonormal de V formada por autovectores deA. Entonces A es un operador normal. Demostraci´ n. Calculemos las coordenadas de la imagen de ui mediante el operador A+ en la base oB: n n n n n A+ ui = (uj , A+ ui )uj = (Auj , ui )uj = (λj uj , ui )uj = ¯ λj (uj , ui )uj = ¯ ¯ λj δji uj = λi ui j=1 j=1 j=1 j=1 j=1 ¯luego ui es tambi´n un autovector de A+ con autovalor λi . Entonces: e AA+ ui = |λi |2ui = A+ Aui , i = 1, . . . , nluego AA+ = A+ A al coincidir en una base. QED El resultado sobre la existencia de una base ortonormal formada por autovectores se puede enunciaren t´rminos de matrices. eProposici´n 6.1.4 Sea A una matriz compleja n × n, normal, es decir: o AA+ = A+ AEntonces, existe una matriz unitaria U tal que: U + AUes una matriz diagonal Demostraci´ n. Se considera a A como la matriz de un cierto operador en una base ortonormal o{e1 , . . . , en }. Entonces A+ viene representado en esa base por la matriz A+ . Por tanto, por las hip´tesis odel teorema, A es un operador normal. Al existir una base ortonormal formada por autovectores de A,{u1 , . . . , un } la matriz de cambio de base es: n ui = Uji ei j=1 Por tanto, la matriz de A en la base {ui } se obtiene de la matriz A mediante la expresi´n: o U −1 AU
  • 125. 118 TEMA 6. OPERADORES EN ESPACIOS CON PRODUCTO ESCALARy es obviamente diagonal, al estar formada la nueva base por autovectores de A. La matriz de cambio de base es unitaria. Esto es cierto siempre que se pasa de una base ortonormala otra: U U + = U + U = InEn efecto: n n n n n δij = (ui , uj ) = ( Uik ek Ujl el ) = ¯ Uik Ujl (ek , el ) = ¯ Uik Ujl δkl = ¯ Uik Ujk k=1 l=1 k,l=1 k,l=1 k=1es decir, la matriz U es unitaria, y: U + AUes una matriz diagonal. QED El teorema espectral se puede establecer diciendo que todo operador normal se puede llevar a unaforma diagonal mediante una transformaci´n unitaria. o6.1.5 Teorema espectral para operadores autoadjuntosPuesto que un operador autoadjunto es normal, los teoremas anteriores se aplican a este tipo de oper-adores. Sin embargo, podemos decir algo m´s de ellos. aProposici´n 6.1.5 Los autovalores de un operador autoadjunto son reales. o Demostraci´n. o Sea λ un autovalor de A con autovector x. Entonces: ¯ (Ax, x) = λ(x, x) = (x, Ax) = λ(x, x)de donde ¯ λ = λ. QED Podemos establecer el siguiente teorema espectral:Teorema 6.1.2 Sea V un espacio vectorial complejo de dimensi´n finita con producto escalar. Sea A oun operador autoadjunto en V . Entonces, los autovalores de A son reales y existe una base ortonormalde V formada por autovectores de A. El resultado inverso es:Teorema 6.1.3 Sea V un espacio vectorial complejo de dimensi´n finita con producto escalar. Sea A un ooperador en V con autovalores reales tal que existe una base ortonormal de V formada por autovectoresde A. Entonces A es autoadjunto. Demostraci´n. o De acuerdo con el teorema espectral para operadores normales, al existir una base ortonormal de Vformada por autovectores de A, A es normal. Al tener los autovalores reales: ¯ A+ uk = λk uk = λk uk = Auk , k = 1, . . . , nluego A = A+ y A es autoadjunto. QED El resultado para matrices es:Proposici´n 6.1.6 Sea A una matriz herm´ o ıtica (autoadjunta). Entonces A es diagonalizable medianteuna matriz unitaria, y la matriz diagonal es real. La demostraci´n sigue las l´ o ıneas del caso normal.
  • 126. 6.2. PROYECTORES ORTOGONALES 1196.1.6 Teorema espectral para operadores unitariosUn operador unitario es tambi´n normal. Sus autovalores tienen m´dulo unidad. e oProposici´n 6.1.7 Los autovalores de un operador unitario tienen m´dulo 1. o o Demostraci´ n. Sea λ autovalor de A con autovector x. Entonces: o Ax = λx ⇒ A+ Ax = λA+ x = |λ|2 xy por tanto: |λ| = 1 QEDTeorema 6.1.4 Sea V un espacio vectorial complejo de dimensi´n finita con producto escalar. Sea A oun operador unitario en V . Entonces, los autovalores de A tienen m´dulo igual a 1 y existe una base oortonormal de V formada por autovectores de A. El resultado inverso es:Teorema 6.1.5 Sea V un espacio vectorial complejo de dimensi´n finita con producto escalar. Sea A oun operador en V con autovalores de m´dulo unidad tal que existe una base ortonormal de V formada opor autovectores de A. Entonces A es unitario. Demostraci´ n. El operador A es normal. Al tener los autovalores de m´dulo igual a 1: o o ¯ A+ Auk = λk λk uk = |λk |2 uk = uk , k = 1, . . . , nluego AA+ = A+ A = 1V yA es unitario. QED El resultado para matrices es:Proposici´n 6.1.8 Sea A una matriz unitaria. Entonces A es diagonalizable mediante una matriz ounitaria, y la matriz diagonal tiene elementos de m´dulo 1 en la diagonal. o Los operadores unitarios relacionan bases ortonormales entre s´ Conservan longitudes y ´ngulos. ı. a De la relaci´n U U + = In se deduce que el determinante de una matriz unitaria (y por lo tanto de un ooperador unitario) tiene m´dulo igual a 1: o 1 = det(U U + ) = det U det U + = | det U |2 ¯pues det U t = det U y det U = det U . Los operadores unitarios forman un grupo respecto a la composici´n de operadores. Se le llama el ogrupo unitario (U (n)). El subconjunto de operadores unitarios con determinante igual a 1 es un subgrupode ´ste, (SU (n)). Por ejemplo, U (1) son los n´meros complejos de m´dulo 1 (es decir, la circunferencia e u ounidad).6.2 Proyectores ortogonalesSea V un espacio vectorial complejo de dimensi´n finita con producto escalar. Sea A un operador normal oen V , con espectro σ(A) = {λ1 , . . . , λr }, λi = λj , i = j, i, j = 1, . . . , r, r ≤ n Los subespacios invariantes: Vi = ker(A − λi 1V ), i = 1, . . . , r
  • 127. 120 TEMA 6. OPERADORES EN ESPACIOS CON PRODUCTO ESCALARson ortogonales entre s´ ı: Vi ⊥ Vj , i=jcomo consecuencia del teorema espectral, pues corresponden a autovalores distintos. Adem´s su suma es ael espacio total: V = V1 ⊕ · · · ⊕ Vr . De esta forma podemos definir los proyectores sobre cada uno de los subespacios invariantes, general-izando los proyectores ortogonales que estudiamos en la descomposici´n de V en suma de un subespacio oy su ortogonal: x ∈ V, x = x1 + · · · + xr Pi : → V x → xi La familia de proyectores Pi verifica una serie de propiedades que se conocen como el teorema dedescomposici´n espectral. oTeorema 6.2.1 Los proyectores ortogonales P1 , . . . , Pr asociados a un operador normal A en un espaciovectorial complejo V de dimensi´n finita con producto escalar, verifican las siguientes propiedades: o1) Pi+ = Pi2) Pi Pj = δij Pi3) P1 + · · · + Pr = 1V4) λ1 P1 + · · · + λr Pr = A Demostraci´n. Los proyectores ortogonales son idempotentes y autoadjuntos: o Pi2 x = Pi xi = xi (x, Pi y) = (x, yi ) = (xi , yi ) = (xi , y) = (Pi x, y) Adem´s: a Pi Pj (x) = Pi (xj ) = 0, i=j En cuanto a su suma: (P1 + · · · + Pr )x = P1 x + · · · + Pr x = x1 + · · · + xr = x, ∀x ∈ Vluego es la identidad en V . Finalmente: (λ1 P1 + · · · + λr Pr )x = λ1 P1 x + · · · + λr Pr x = = λ1 x1 + · · · + λr xr = Ax1 + · · · + Axr = A(x1 + · · · + xr ) = Ax QED La expresi´n: o A = λ1 P1 + · · · + λr Prse conoce como la descomposici´n espectral del operador A. o La descomposici´n espectral de un operador permite caracterizarlo de la forma siguiente. oProposici´n 6.2.1 Sea V un espacio vectorial complejo de dimensi´n finita dotado de un producto es- o ocalar, y A un operador en V . Supongamos que existe una familia de proyectores ortogonales (idempotentesy autoadjuntos), {P1 , . . . , Pr } y un conjunto de escalares (distintos), {λ1, . . . , λr } que verifican: 1) Pi Pj = 0, i = j 2) P1 + · · · + Pr = 1V 3) λ1 P1 + · · · + λr Pr = Aentonces, A es normal.
  • 128. 6.2. PROYECTORES ORTOGONALES 121 Demostraci´ n. o r r r r r AA+ = ( λi Pi )( ¯ λj Pj+ ) = ¯ λi λj Pi Pj = ¯ λi λj δij Pi = |λi |2 Pi = A+ A i=1 j=1 i,j=1 i,j=1 i=1 Los escalares λi son los autovalores de A, y los autovectores son de la forma Pi x con x ∈ V . En efecto: r r APi (x) = λj Pj Pi x = λj δij Pi x = λi Pi x j=1 j=1Veamos que no hay otros autovalores. Sea λ ∈ C tal que existe x ∈ V distinto de cero y: Ax = λx r r Ax = λi Pi x = λ Pi (x) i=1 i=1es decir: r (λi − λ)Pi x = 0 i=1 Aplicando Pk : r r (λi − λ)Pk Pi x = (λi − λ)δik Pi x = (λk − λ)Pk x = 0 i=1 i=1 Por tanto, Pk x = 0 o bien λ = λk . En el segundo caso, λ es uno de los escalares que ten´ ıamos. En elprimero, si la relaci´n es cierta para todo k = 1, . . . , r, entonces x = 0. o QED Los operadores autoadjuntos y unitarios se caracterizan de forma similar:Proposici´n 6.2.2 En las condiciones de la proposici´n anterior, si los escalares {λ1 , . . . , λr } son reales, o oA es autoadjunto. Demostraci´ n. De acuerdo con la primera proposici´n A es normal. Al tener todos sus autovalores o oreales es autoadjunto. QEDProposici´n 6.2.3 Si los escalares {λ1, . . . , λr } son de m´dulo 1, A es unitario. o o6.2.1 C´lculo de proyectores ortogonales aYa hemos estudiado como calcular un proyector conociendo una base ortonormal del subespacio sobre elque proyecta. Si {e1, . . . , en } es una base ortonormal del espacio V y {u1 , . . . , un } es una base ortonormalde autovectores del operador A, los espacios Vi , i = 1, . . . , n estar´n generados por los vectores: a V1 = lin{u1, . . . , un1 } (6.1) V2 = lin{un1 +1 , . . . , un1 +n2 } (6.2) ... (6.3) Vr = lin{un1 +···+nr−1 +1 , . . . , un } (6.4)donde ni es la dimensi´n del espacio Vi . Por tanto, el proyector Pi sobre el subespacio o Vi = lin{un1 +···+ni−1 +1 , . . . , un1 +···+ni−1 +ni },se puede calcular como: n1 +···+ni + Pi = Uk Uk , k=n1 +···+ni−1 +1
  • 129. 122 TEMA 6. OPERADORES EN ESPACIOS CON PRODUCTO ESCALARdonde Ul son las coordenadas del vector ul en la base {ei }. N´tese que la acci´n de un proyector es: o o n1 +···+ni Pi (x) = (uk , x)uk . k=n1 +···+ni−1 +1 En esta notaci´n se tiene: o n In = Ui Ui+ , i=1la descomposici´n espectral de la identidad, y o n A= λi Ui Ui+ , i=1la descomposici´n espectral del operador A (o de su matriz A en la base {ei }). o Existen otras formas de calcular proyectores ortogonales. Veremos una de ellas que usa los polinomiosinterpoladores de Lagrange.Proposici´n 6.2.4 Sea V un espacio vectorial complejo de dimensi´n finita con un producto escalar. o o nSea A un operador normal en V y A = i=1 λi Pi su descomposici´n espectral. Entonces, los proyectores oortogonales Pi son iguales a: Pi = ϕi (A), i = 1, . . . , rdonde los polinomios p(λ) vienen definidos por: (λ − λ1 ) · · · (λ − λi−1 )(λ − λi+1 ) · · · (λ − λr ) ϕi (λ) = , i = 1, . . . , r (λi − λ1 ) · · · (λi − λi−1 )(λi − λi+1 ) · · · (λi − λr ) Demostraci´n. Se tiene: o λ − λj A − λ j 1V ϕi (λ) = , ϕi (A) = λi − λj λi − λj j=i j=i Pero no es dif´ calcular el valor de estos polinomio sobre A: ıcil n n ϕi (A) = ϕi ( λj Pj ) = ϕi (λj )Pj j=1 j=1debido a las propiedades de los proyectores ortogonales. Como: ϕi (λj ) = δijse obtiene el resultado buscado. QED De la demostraci´n anterior se deduce que para cualquier polinomio p(λ), el valor que toma sobre el ooperador A es: n p(A) = p(λj )Pj j=1 Se puede extender a funciones anal´ ıticas (es decir, que admiten un desarrollo en serie que es convergenteen un entorno del punto considerado): n f (A) = f (λj )Pj j=1lo que permite calcular valores de funciones sobre operadores (normales).
  • 130. 6.3. OPERADORES EN ESPACIOS VECTORIALES REALES CON PRODUCTO ESCALAR 1236.3 Operadores en espacios vectoriales reales con producto es- calarLas mismas cuestiones que se suscitaron en relaci´n con los espacios complejos dotados de un producto oescalar ser´n estudiadas aqu´ Como veremos, las dificultades principales provienen del hecho que no a ı.todo operador en un espacio real posee autovalores (se entiende reales). La extensi´n del cuerpo base o(noci´n que se puede definir rigurosamente) a los n´meros complejos, permitir´ aligerar esta secci´n. Sin o u ıa oembargo nos mantendremos en el campo real en todo lo posible.6.3.1 El operador transpuestoEn analog´ con el operador adjunto, definiremos aqu´ el operador transpuesto. Es este un nombre ya ıa ıusado en relaci´n con el espacio dual. De hecho, utilizando el teorema de Riesz-Fr´chet, ambos conceptos o ecoinciden. Sin embargo, para evitar problemas de interpretaci´n el operador transpuesto se entender´ en o ala forma que sigue.Definici´n 6.3.1 Sea V un espacio vectorial real con producto escalar, y A un operador en V . Se define oel operador transpuesto de A, At como el ´nico operador que verifica: u (x, Ay) = (At x, y) Para demostrar la existencia y unicidad de este operador, basta aplicar el teorema de Riesz-Fr´chet, etal y como hicimos en el caso complejo para el operador adjunto. Las propiedades del operador transpuesto son similares a las del adjunto: 1) (At )t = A 2) (A + B)t = At + B t 3) (λA)t = λAt 4) (AB)t = B t At6.3.2 Representaci´n matricial del operador transpuesto oQueremos obtener la representaci´n matricial del operador transpuesto At dada la del operador A. Sea oV un espacio vectorial real de dimensi´n finita dotado de un producto escalar y B = {u1 , . . . , un } una obase ortonormal de V . Sea A la matriz de A en la base B, es decir, A = (aij ): n Aui = aji uj , i = 1, . . . , n i=1 De lo estudiado para la expresi´n de los elementos de matriz del operador A se tiene: o aij = (ui , Auj )y si A es la matriz del operador transpuesto, aij = (ui , At uj )como (ui , Auj ) = (At ui , uj ) = (uj , At ui )se concluye: aij = ajies decir: A = Atla matriz del operador transpuesto es la matriz transpuesta del operador de partida cuando la base es ımbolo t denota tanto el operador transpuesto como la matriz transpuesta.ortonormal. El s´
  • 131. 124 TEMA 6. OPERADORES EN ESPACIOS CON PRODUCTO ESCALAR6.3.3 Operadores normales, sim´tricos y ortogonales eEn el caso real, los operadores m´s interesantes ser´n los sim´tricos (an´logos a los autoadjuntos) y a a e aortogonales (an´logos a los unitarios). aDefinici´n 6.3.2 Se dice que el operador A es normal si conmuta con su transpuesto: o AAt = At A.Definici´n 6.3.3 Se dice que el operador A es sim´trico si coincide con su transpuesto: o e At = A.Definici´n 6.3.4 Se dice que el operador A es ortogonal si: o AAt = At A = 1V . Los operadores sim´tricos verifican: e (x, Ay) = (Ax, y)y en bases ortonormales vienen representados por matrices sim´tricas: e At = A Los operadores ortogonales verifican: (Ax, Ay) = (x, y)En bases ortonormales, sus matrices son ortogonales, es decir: AAt = At A = In Es inmediato comprobar que los operadores sim´tricos y ortogonales son normales. Sin embargo en eel caso real no estudiaremos los operadores normales. La raz´n es que los operadores sim´tricos tienen o etodos sus autovalores reales y su estudio es muy similar al caso complejo. Pero los ortogonales no lostienen reales en general (con m´s precisi´n no tienen autovalores en general )y por lo tanto requerir´n a o aun estudio especial.6.3.4 Teorema espectral para operadores sim´tricos eEl principal problema que surge en relaci´n con el caso complejo es probar que los autovalores de un ooperador sim´trico son reales (aunque no sea muy precisa, utilizaremos esta terminolog´ para expresar e ıael que las ra´ ıces del polinomio caracter´ ıstico pueden no ser reales, en cuyo caso no son autovalores deloperador).Proposici´n 6.3.1 Sea V un espacio vectorial real de dimensi´n finita con producto escalar. Sea A un o ooperador normal en V . Si x ∈ V es un autovector de A con autovalor λ, entonces x es autovector de Atcon el mismo autovalor. Demostraci´n. o||(At −λ1V )x||2 = ((At −λ1V )x, (At −λ1V )x) = ((A−λ1V )(At −λ1V )x, x) = ((At −λ1V )(A−λ1V )x, x) = 0y por tanto: (At − λ1V )x = 0 QED Al igual que en el caso complejo, si un subespacio es invariante bajo un operador A, su complementoortogonal lo es bajo el operador transpuesto. El teorema espectral para operadores sim´tricos se puede enunciar como sigue: e
  • 132. 6.3. OPERADORES EN ESPACIOS VECTORIALES REALES CON PRODUCTO ESCALAR 125Teorema 6.3.1 Sea V un espacio vectorial real de dimensi´n finita con producto escalar. Sea A un ooperador sim´trico en V . Entonces, existe una base ortonormal de V formada por autovectores de A. e Demostraci´ n. Demostramos en primer lugar que las ra´ o ıces del polinomio caracter´ ıstico de A sontodas reales. Para ello, consideremos el polinomio m´ ınimo de A, m(λ). Los factores irreducibles de estepolinomio que tiene los coeficientes reales, son de grado 1 o 2. Demostremos que no pueden ser de grado2. Si tuviera un factor irreducible de este grado: m(λ) = [(λ − a)2 + b2 ]m1 (λ)donde b = 0. El polinomio m´ ınimo anula al operador, es decir, m(A) = 0. Entonces ∀x ∈ V se tiene: m(A)x = 0 ⇒ [(A − a1V )2 + b2 1V ]m1 (A)x = 0 Sea y = m1 (A)x. Entonces: [(A − a1V )2 + b2 1V ]y = 0 Calculemos el producto escalar: ([(A − a1V )2 + b2 1V ]y, y) = ((A − a1V )2 y, y) + (b2 y, y) = ((A − a1V )y, (A − a1V )y) + b2 (y, y) = = ||(A − a1V )y||2 + b2 ||y||2 = 0. Como b = 0, ||y|| = 0, es decir y = 0. En consecuencia, el operador m1 (A) es cero, y por tanto m(λ)no ser´ el polinomio m´ ıa ınimo. No hay factores de grado 2, y por consiguiente los autovalores son reales. El argumento es ahora igual que en el caso complejo. Se toma un autovector de A y se construyesu subespacio ortogonal, que es invariante bajo At = A. En este espacio ortogonal se construye otroautovector y se sigue el proceso hasta tener una base ortonormal de V formada por autovectores de A.QED El resultado inverso es tambi´n cierto. eTeorema 6.3.2 Sea V un espacio vectorial real de dimensi´n finita con un producto escalar. Sea A un ooperador en V , tal que existe una base ortonormal de V formada por autovectores de A. Entonces A essim´trico. e Demostraci´ n. Sea {u1 , . . . , un } la base ortonormal. Entonces: o Auk = λk uk Ahora bien, n n n n At uk = (ui , At uk )ui = (Aui , uk )ui = λi (ui , uk )ui = λi δik ui = λk uk i=1 i=1 i=1 i=1y por lo tanto, At = A QED Las matrices que intercambian las bases ortonormales son ortogonales (la demostraci´n es id´ntica a o ela hecha en el caso complejo). Se tiene el resultado siguiente para matrices:Teorema 6.3.3 Toda matriz sim´trica (real) es diagonalizable por una transformaci´n ortogonal. e o Demostraci´ n. Una matriz sim´trica se puede considerar como la matriz de un operador sim´trico o e een una base ortonormal. Pasando a la base ortonormal de autovectores la matriz que representa aloperador es ahora diagonal y la matriz de cambio de base es ortogonal: P t APes diagonal. QED
  • 133. 126 TEMA 6. OPERADORES EN ESPACIOS CON PRODUCTO ESCALAR6.3.5 Descomposici´n espectral de operadores sim´tricos o eAl igual que los operadores normales, los operadores sim´tricos admiten una descomposici´n espectral. e o Sea A un operador sim´trico en un espacio vectorial real de dimensi´n finita dotado de un producto e oescalar. Sea σ(A) = {λ1 , . . . , λr } el espectro de A. Sean Vi = ker(A − λi 1V ) los subespacios invariantes.Entonces: V = V1 ⊕ · · · ⊕ Vry los subespacios son ortogonales entre s´ al corresponder a autovalores distintos. ı, Existe entonces una familia de proyectores ortogonales (sim´tricos e idempotentes) que adem´s verif- e aican: 1) Pi Pj = 0, i = j 2) P1 + · · · + Pr = 1V 3) λ1 P1 + · · · + λr Pr = A El c´lculo de proyectores ortogonales se hace igual que en el caso complejo, bien en una base dada, o aempleando polinomios interpoladores. La descomposici´n espectral permite identificar a los operadores sim´tricos: o e Si dado un operador A en un espacio vectorial real de dimensi´n finita con un producto escalar, oexiste una familia de proyectores ortogonales (sim´tricos e idempotentes) que verifican las anteriores epropiedades para una familia de escalares (reales) distintos, entonces A es sim´trico y esos escalares son esus autovalores. La multiplicidad del autovalor λi es la dimensi´n del espacio Pi V . o6.4 Operadores ortogonalesEl ultimo tipo de operadores en espacios con producto escalar que vamos a estudiar son los operadores ´ortogonales. En este caso, al no ser (en general) todas las ra´ ıces del polinomio caracter´ıstico reales, nopodremos encontrar una base formada por autovectores. Sin embargo, existen bases en las que estosoperadores adoptan formas sencillas. Son estas formas can´nicas las que vamos a discutir. Comen- ozaremos por el caso de dimensi´n 2 y veremos como los dem´s se reducen a ´ste. La raz´n es que los o a e ofactores irreducibles del polinomio caracter´ ıstico (un polinomio con coeficientes reales) son de grado 1 o2. Recordemos que los operadores ortogonales vienen representados por matrices ortogonales en basesortonormales: At A = In De esta relaci´n se deduce que el determinante de una matriz ortogonal (y por lo tanto de un operador oortogonal) es igual a ±1. Los operadores ortogonales con determinante igual a +1 se llaman rotaciones. El conjunto de operadores ortogonales forma un grupo respecto a la composici´n de operadores. Se ole llama el grupo ortogonal (O(n)). El subconjunto de operadores ortogonales con determinante igual a1 es un subgrupo de ´ste, (SO(n)). e6.4.1 Operadores ortogonales en un espacio de dimensi´n 2 oSea V un espacio vectorial real de dimensi´n 2 con producto escalar y A un operador ortogonal en este oespacio: AAt = At A = 1VProposici´n 6.4.1 En las condiciones anteriores, existe una base ortonormal de V en la que el operador oA tienen como matriz una de las siguientes: cos θ − sen θ 1 0 1) , 2) sen θ cos θ 0 −1 En el primer caso, el determinante de la matriz es 1. En el segundo es −1. Demostraci´n. Sea o a b A= c d
  • 134. 6.4. OPERADORES ORTOGONALES 127la matriz de A en una base ortonormal. Entonces: At A = I 2y operando: a c a b a2 + c2 ab + cd 1 0 = = b d c d ab + cd b 2 + d2 0 1es decir: a2 + c2 = b2 + d2 = 1 (6.5) ab + cd = 0 (6.6) 2 2 Si a + c = 1 podemos encontrar un n´mero real θ en el intervalo [0, 2π) tal que: u a = cos θ, c = sen θ 2 2Razonando igual con b + d = 1: b = cos θ , d = sen θSustituyendo estos valores en la tercera ecuaci´n: o cosθ sen θ + sen θ cos θ = 0 sen(θ + θ ) = 0es decir, θ =θ o θ =π−θ En el primer caso, la matriz del operador es: cos θ − sen θ A= sen θ cos θes decir, el tipo 1). En el segundo caso: cos θ sen θ A= sen θ − cos θ En el primer caso no hay ning´n vector invariante (salvo, obviamente el vector cero). Se trata de uuna rotaci´n de ´ngulo θ en sentido antihorario (positivo). Su determinante es igual a 1. Toda matriz o aortogonal 2 × 2 de determinante igual a 1 tiene esta forma (con distintos valores de θ) en cualquier baseortogonal. Sin embargo, la segunda matriz tiene un vector invariante con autovalor igual a 1 (o el operadorcorrespondiente): cos θ − λ sen θ det = λ2 − 1 = 0 sen θ − cos θ − λtiene como soluciones λ = ±1. Sea u1 el autovector de autovalor 1 y norma 1: Au1 = u1Escojamos un vector unitario, u2 , ortogonal a u1 . Estos dos vectores son l.i. y forman una base ortogonalen V . En ella la matriz de A tiene la forma: 1 α 0 βdebido a que u1 es autovector de autovalor 1. Pero esta matriz debe ser ortogonal (y tener determinateigual a −1). Por lo tanto, β = −1 y α = 0. Es decir, el segundo vector (elegido como ortogonal a u1 ) esjustamente el autovector de autovalor −1. En este caso, tenemos una base ortonormal de autovectores deloperador A. Esta es la segunda de las formas can´nicas de las que habla la proposici´n. En la base {u1 , u2 } o ose observa que este operador representa una reflexi´n. Hay una recta que permanece invariante (punto oa punto) la asociada al autovector u1 . El resto de vectores sufre una reflexi´n con respecto a esta recta o(en particular el u2 que simplemente cambia de signo). Toda matriz ortogonal (2 × 2) de determinantenegativo es el producto de una matriz que representa una rotaci´n (con determinante positivo) por la omatriz de la segunda forma can´nica que aparece en la proposici´n. o o QED
  • 135. 128 TEMA 6. OPERADORES EN ESPACIOS CON PRODUCTO ESCALAR6.4.2 Subespacios invariantes de un operador ortogonalSea V un espacio real de dimensi´n finita dotado de un producto escalar, y A un operador ortogonal en oV.Proposici´n 6.4.2 Los autovalores de A (en caso de que existan) son iguales a ±1. o Demostraci´n. Si λ ∈ IR es un autovalor de A, sea x un autovector con ese autovalor. Entonces: o (Ax, Ax) = λ2 (x, x) ⇒ λ2 = 1 QED Pero podr´ ocurrir que no tuviera ning´n autovalor. Al ser los autovalores las ra´ ıa u ıces del polinomiocaracter´ıstico, un polinomio con coeficientes reales, las ra´ ıces complejas aparecen siempre a pares (unay su compleja conjugada). Por tanto, en dimensi´n impar siempre existen autovalores reales (al menos ouno, igual a +1 ´ −1). En este caso, siempre hay un subespacio invariante de dimensi´n 1. En general o ose tiene el resultado siguiente:Proposici´n 6.4.3 Sea V un espacio vectorial real de dimensi´n finita, con un producto escalar y A un o ooperador ortogonal. Entonces, existe un subespacio invariante de V de dimensi´n 1 ´ 2. o o Demostraci´n. Se considera el polinomio caracter´ o ıstico de A que se puede descomponer en factoresirreducibles (algunos posiblemente repetidos) de grados 1 ´ 2: o p(λ) = p1 (λ) · · · pr (λ) Como p(A) = 0, consideremos un vector x ∈ V tal que existe un n´mero j ∈ {1, . . . , r} y; u p1 (A) · · · pj (A)x = 0, p1 (A) · · · pj−1 (A)x = 0Sea y = p1 (A) · · · pj−1 (A)x. Entonces: pj (A)y = 0Si el grado de pj (λ) es igual a 1: (A + b1V )y = 0 ⇒ Ay = −byy existe un subespacio de dimensi´n 1, generado por y, invariante bajo A. o Pero si el grado de pj (λ) es igual a 2, entonces: (A2 + aA + b1V )y = 0y {y, Ay} generan un subespacio invariante de dimensi´n 2. En efecto: o Ay ∈ lin{y, Ay}, A(Ay) = A2 y = −aAy − by ∈ lin{y, Ay} QED6.4.3 Forma can´nica de un operador ortogonal oCon lo dicho anteriormente podemos construir una base de V donde un operador ortogonal adopta unaforma sencilla. Basta considerar un subespacio invariante (que siempre existe, de dimensi´n 1 o 2) y odescomponer el espacio en una suma de ese subespacio m´s su complementario ortogonal (que tambi´n a eser´ invariante). aTeorema 6.4.1 Sea V un espacio vectorial real de dimensi´n finita, dotado de un producto escalar y oA un operador ortogonal en V . Entonces, existe una base ortonormal de V en la que la matriz querepresenta al operador tiene la forma:
  • 136. 6.4. OPERADORES ORTOGONALES 129   1  ..   .     1     −1     ..   .     −1     cos θ1 − sen θ1     sen θ1 cos θ1     ..   .     cos θr − sen θr  sen θr cos θrEs decir, el espacio se descompone en la suma de subespacios invariantes de dimensi´n 1 ´ 2. o o El n´mero de autovalores +1 y −1 coincide con sus respectivas multiplicidades. En cada bloque 2 × 2 uno hay autovalores, pero las ra´ ıstico son e±iθj y el n´mero de estos bloques ıces del polinomio caracter´ upara un mismo valor de θj coincide con la multiplicidad de estas ra´ ıces. Por ejemplo, en dimensi´n 3 siempre hay un autovalor real (al menos) que es igual a +1 o a −1. Si el odeterminante es +1, hay un autovalor igual a +1. Se trata de una rotaci´n, cuyo eje (conjunto de vectores oinvariantes) viene dado por el autovector correspondiente al autovalor 1. Hay un segundo subespacio dedimensi´n 2 (salvo casos degenerados) invariante bajo la rotaci´n, y que no contiene ning´n autovector. o o uEs el (´nico) espacio ortogonal al eje. u
  • 137. 130 TEMA 6. OPERADORES EN ESPACIOS CON PRODUCTO ESCALAR
  • 138. Tema 7Tensores Aplicaciones multilineales. Coordenadas contravariantes y covariantes. Producto tenso- rial. Cambios de base. Tensores y grupos de transformaciones. Tensores sobre espacios con producto escalar. El tema que se expone a continuaci´n contiene una introducci´n a tensores. Su dificultad es superior o oa la media de los temas anteriores y solo presenta los tensores desde un punto de vista algebraico,perdi´ndose por consiguiente una visi´n m´s geom´trica (y quiz´s m´s intuitiva) de este concepto, debido e o a e a aa la no inclusi´n de campos tensoriales. o7.1 Una justificaci´n oEjemplo 7.1.1 Las ecuaciones de la din´mica newtoniana a El movimiento de un punto material (con m = 1) viene descrito en la mec´nica newtoniana por un asistema de ecuaciones diferenciales: d2 x = fx (x, y, z, t) dt2 d2 y = fy (x, y, z, t) dt2 d2 z = fz (x, y, z, t) dt2 La raz´n de reunirlas en una notaci´n vectorial proviene de sus propiedades de transformaci´n frente o o oal cambio de sistema de referencia. Un cambio de este tipo mezcla las coordenadas y las componentes dela fuerza en la manera en que lo hacen los cambios de base de un espacio vectorial: d2 r = F (r, t) dt2Ejemplo 7.1.2 Las ecuaciones de Maxwell Las ecuaciones de Maxwell del campo electromagn´tico relacionan los campos el´ctrico (E) y magn´ti- e e eco (B) con las cargas (ρ) y corrientes (j). Una forma de escribirlas en una notaci´n compacta es la osiguiente (tomamos c = 1): ∂µ F µν = −4πj ν ∂µ Fνρ + ∂ρ Fµν + ∂ν Fρµ = 0donde F µν es el llamado tensor del campo electromagn´tico. Sus componentes, es decir, los valores de eF µν (y Fµν , que son distintos como estudiaremos m´s adelante), cuando los ´ a ındices µν recorren los valores0, 1, 2, 3 (n´tese que empezamos a numerar en 0), son los siguientes: o F 00 = F 11 = F 22 = F 33 = F00 = F11 = F22 = F33 = 0 131
  • 139. 132 TEMA 7. TENSORES F 01 = −F 10 = −F01 = F10 = Ex F 02 = −F 20 = −F02 = F20 = Ey F 03 = −F 30 = −F03 = F30 = Ez F 12 = −F 21 = F12 = −F21 = Bz F 31 = −F 13 = F31 = −F13 = By F 23 = −F 32 = F23 = −F32 = Bxque se pueden disponer como una matriz:     0 Ex Ey Ez 0 −Ex −Ey −Ez  −Ex 0 Bz −By   Ex 0 Bz −By  F µν =   −Ey −Bz , Fµν =  0 Bx   Ey −Bz 0 Bx  −Ez By −Bx 0 Ez By −Bx 0 Adem´s, ∂0 = ∂t , ∂1 = ∂x , ∂2 = ∂y , ∂3 = ∂z y j 0 = ρ, j 1 = jx , j 2 = jy , j 3 = jz . En la notaci´n a oE, B, ρ, j, la primera de las ecuaciones de Maxwell se escribe como: E = 4πρ ∂E − ×B = −4π j ∂t La segunda es: B = 0 ∂B + ×E = 0 ∂t Las ventajas de utilizar el objeto F µν son, en parte, las de manejar de forma sencilla los cambios desistemas de referencia. Como veremos, F µν ser´ un tensor de segundo orden, 2 veces contravariante, y aesto determina de forma un´ ıvoca sus propiedades de transformaci´n bajo cambios de base (concretamente olos asociados a la teor´ de la relatividad). ıaEjemplo 7.1.3 Energ´ cin´tica de rotaci´n de un s´lido r´ ıa e o o ıgido Consideremos un s´lido r´ o ıgido que supondremos descrito por un sistema de n part´ ıculas de masas mi ˙con posiciones ri , y velocidades vi = ri . La energ´ cin´tica es la suma de las energ´ cin´ticas de cada ıa e ıas epart´ ıcula , es decir: n 1 2 T = mi vi 2 i=1 Si el s´lido gira en torno a un eje (supongamos que no hay movimiento de traslaci´n) de vector unitario o oe (constante), podemos definir una velocidad angular, ω (en la direcci´n del eje de rotaci´n) tal que: o o vi = ω × ri , i = 1, . . . , n El momento angular de una de las part´ ıculas es mi ri × vi y el total es la suma: n L= mi ri × vi i=1 Sustituyendo vi de la expresi´n anterior: o n L= mi ri × (ω × ri ) i=1
  • 140. ´7.1. UNA JUSTIFICACION 133y operando: n L= mi (|ri |2 ω − (ri .ω)ri ) i=1 Escribamos las coordenadas de ri y ω en un sistema de referencia ortonormal como: ri = (xi1, xi2 , xi3 ), ω = (ω1 , ω2 , ω3 ) Entonces, el momento angular se escribe en coordenadas como: 3 n 3 n Lk = mi (ωk |ri |2 − xik xij ωj ) = ωj mi (δkj |ri |2 − xik xij ), k = 1, 2, 3 j=1 i=1 j=1 i=1y si definimos: n Ikj = mi (δkj |ri |2 − xik xij ) i=1podemos escribir: 3 Lk = Ikj ωj j=1 Se llama tensor de inercia a un objeto cuyas componentes en el sistema de referencia en el que estamostrabajando son Iij . Los valores expl´ ıcitos que toman estas componentes son: n n n I11 = mi (x2 i2 + x2 ) i3 I22 = i=1 mi (x2 i1 + x2 ) i3 I33 = mi (x2 + x2 ) i1 i2 i=1 i=1 n n n I12 = I21 = − mi xi1 xi2 I13 = I31 = − i=1 mi xi1 xi3 I23 = I32 = − mi xi2 xi3 i=1 i=1que corresponden a los momentos de inercia respecto a los ejes coordenados y a los opuestos de losproductos de inercia. La energ´ cin´tica de rotaci´n del sistema es: ıa e o 3 3 1 1 T = Li ωi = Iij ωi ωj 2 2 i=1 i,j=1que resulta ser una forma cuadr´tica en la velocidad angular. a Los cambios de coordenadas en este sistema vienen dados por transformaciones entre bases ortonor-males (en el producto escalar usual de IR3) que preservan la orientaci´n, es decir por rotaciones (adem´s o ade por traslaciones, que no son lineales y no ser´n tratadas aqu´ Uno puede imaginar transformaciones a ı).de coordenadas m´s generales, pero, dado que trabajamos con un s´lido r´ a o ıgido, ´stas deben conservar ea´ngulos, distancias y orientaci´n. o Si R es la matriz de la rotaci´n: o 3 xij = Rjk xik k=1 Las nuevas componentes del tensor de inercia son: n Ikj = mi (δkj |ri |2 − xik xij ) i=1y sustituyendo: n 3 3 n Ikj = mi (δkj |ri |2 − Rkl Rjs xil xis )) = Rkl Rjs mi (δkj |ri |2 − xil xis i=1 l,s=1 l,s=1 i=1 3 = Rkl Rjs Ils l,s=1
  • 141. 134 TEMA 7. TENSORES Esta regla de trasformaci´n para el tensor de inercia es la que justifica el nombre de tensor dado a oeste conjunto de cantidades Iij .7.2 Aplicaciones multilinealesConsideremos los espacios vectoriales E1 , . . . , En , F sobre un cuerpo IK, y una aplicaci´n ϕ: o ϕ: E1 × · · · × En → Fque verifica: ϕ(v1 , . . . , λvi + λ vi , . . . , vn ) = λϕ(v1, . . . , vi , . . . , vn ) + λ ϕ(v1 , . . . , vi , . . . , vn )para cualquier ´ındice i = 1, . . . , n, λ, λ ∈ IK. Se dice que ϕ es una aplicaci´n multilineal. o (i) (i) Supongamos que los espacios Ei , F, i = 1, . . . , n son de dimensi´n finita y que Bi = {u1 , . . . , udi } oson bases de Ei respectivamente y B = {u1 , . . . , ud } es una base de F . Veamos como se puede escribir laaplicaci´n multilineal referida a estas bases: o d1 dn d1 dn (1) (1) (n) (n) (1) (n) (1) (n) ϕ(v1 , . . . , vn ) = ϕ( xi1 ui1 , . . . , xin uin ) = ··· xi1 . . . xin ϕ(ui1 , . . . , uin ) i1 =1 in =1 i1 =1 in =1Es decir, la aplicaci´n multilineal queda determinada por el valor que toma sobre las bases de los espacios o (1) (n)Ei . La expresi´n ϕ(ui1 , . . . , uin ) representa un vector de F , que se podr´ escribir en la base de F dada: o a d (1) (n) ϕ(ui1 , . . . , uin ) = ti1 ...in i ui i=1y por tanto: d1 dn d (1) (n) ϕ(v1 , . . . , vn ) = ··· ti1 ...in i xi1 . . . xin ui i1 =1 in =1 i=1 Estos valores ti1 ...in i son un conjunto de d1 . . . dn d escalares, que, obviamente, dependen de las baseselegidas. Si cambiamos las bases, la expresi´n de ϕ cambiar´. Sean P1 , . . . , Pn las matrices de cambio de base o aen cada uno de los espacios vectoriales considerados, que pasan de Bi a Bi . Es decir: di (i) (i) xji = (Pi−1 )ji ki xki , i = 1, . . . , n ki =1y tambi´n, en el espacio F , el cambio de base de B a B es: e d ui = Pji uj j=1Sustituyendo en la expresi´n de ϕ: o d1 dn d (1) (n) ϕ(v1 , . . . , vn ) = ··· ti1 ...in i xi1 . . . xin ui = i1 =1 in =1 i=1 d1 dn d d1 dn d −1 (1) −1 (n) ··· ti1 ...in i (P1 )i1 j1 xj1 . . . (Pn )in jn xjn Pji uj = i1 =1 in =1 i=1 j1 =1 jn =1 j=1 d1 dn d d1 dn d −1 −1 (1) (n) ··· ··· (P1 )i1 j1 . . . (Pn )in jn Pji ti1 ...in i xj1 . . . xjn uj j1 =1 jn =1 j=1 i1 =1 in =1 i=1
  • 142. 7.3. COORDENADAS 135y por lo tanto: d1 dn d −1 −1 tj1 ...jn j = ... (P1 )i1 j1 . . . (Pn )in jn Pij ti1 ...in i i1 =1 in =1 i=1 Como se ve, la transformaci´n guarda un cierto parecido con la encontrada para el tensor de inercia ode nuestro primer ejemplo. Concretamente, si tenemos dos espacios Ei y el espacio F es igual al cuerpoIK, la transformaci´n es: o d1 d2 −1 −1 tj1 j2 = (P1 )i1 j1 (P2 )i2 j2 ti1 i2 i1 =1 i2 =1 Las diferencias que se observan ser´n explicadas m´s adelante. a a7.3 Coordenadas7.3.1 Coordenadas contravariantes y covariantesEn muchas de las aplicaciones de la teor´ de tensores se trabaja con espacios en los que hay definido ıaun producto escalar. Adem´s, todos los espacios Ei son iguales a un espacio vectorial V . Supongamos aadem´s que el espacio F es el cuerpo IK. Con esto, las aplicaciones multilineales (formas multilineales) ade las que habl´bamos en la secci´n anterior, son ahora: a o ϕ: V × · · · × V → IKy en una base de V , B = {u1 , . . . un }, se escriben como: d1 dn ϕ(v1 , . . . , vn ) = ··· ti1 ...in xi1 . . . xin (1) (n) i1 =1 in =1N´tese que hemos colocado en alto los ´ o ındices de las coordenadas de los vectores vi , es decir: di vi = xj uj = xj uj j=1expresi´n en la que hemos introducido una simplificaci´n (convenio de Einstein). Suprimimos los signos o ode suma, y suponemos que cuando dos ´ ındices son iguales en una expresi´n y uno est´ arriba y otro o aabajo, hay una suma impl´ıcita sobre el rango correspondiente: ϕ(v1 , . . . , vn ) = ti1 ...in xi1 . . . xin (1) (n)Mientras nos acostumbramos a este convenio, usaremos el signo de suma de vez en cuando. Como hemos dicho, suponemos que en V hay un producto escalar, de manera, que en, por ejemplo,la base que estamos considerando, se tiene: (ui , uj ) = gij , i, j = 1, . . . , npudiendo escribir gij como una matriz, cuyo determinante es distinto de cero. Asociada a esta base, ıproca, Br = {u1 , . . . , un }, que verifica:vamos a introducir otra, la base rec´ (ui , uj ) = δ ij , i, j = 1, . . . , n La base rec´ ıproca est´ determinada un´ a ıvocamente por la base de partida. En efecto, escrita en la basede partida: n ui = λki uk k=1
  • 143. 136 TEMA 7. TENSORESy multiplicando por uk se tiene: n n (ui , uj ) = λki (uk , uj ) = λki gkj = δ ij k=1 k=1tenemos pues un sistema en el que las inc´gnitas son λij y la matriz de coeficientes es gij , luego el sistema otiene soluci´n unica. Desde el punto de vista de representaci´n matricial, la matriz de los coeficientes λij o ´ oes la inversa (transpuesta) de la matriz correspondiente a gij , y la llamaremos: λij = g ij .Se tiene la identidad: g ki gkj = δ ij Buscamos ahora la relaci´n que existe entre las coordenadas en una base y en su rec´ o ıproca. Este esun problema trivial de cambios de base. Sea v ∈ V , tal que: n n v= xi ui = xi ui i=1 i=1Entonces, si ui = g ji uj : xi = gik xk , xi = g ik xk Las coordenadas en la base de partida se llaman coordenadas contravariantes del vector. Las coorde-nadas en la base rec´ ıproca se llaman coordenadas covariantes. Obviamente, hay que fijar una base paraempezar a discutir estos t´rminos. e Si los vectores de la base tienen norma unidad, las coordenadas contravariantes se obtienen trazandolas paralelas a estos vectores (en la forma usual en que se descompone un vector como suma de otrosdos), mientras que las coordenadas covariantes se obtienen trazando las perpendiculares a los vectoresque forman la base. Nota. Si la base de partida es una base ortonormal, gij = δij , la base rec´ ıproca coincide con la de partida y las coordenadas contravariantes y covariantes son iguales. Supongamos ahora que cambiamos la base B a una base B . La base rec´ ıproca cambia tambi´n, de eBr a Br . Sea: ui = P ji ujel cambio de base. Para la base rec´ ıproca se tendr´: a ui = gji uj = g ji P kj uk = g ji P kj gmk u m = Qmi u mdonde gij es la matriz del producto escalar en la base B : Qmi = gmk P kj g jiPero no es dif´ darse cuenta que estas dos matrices P y Q son transpuestas inversas una de la otra: ıcil δ lm = (ul , um ) = (Qil u i , P km uk ) = Qil P km (u i , uk ) = Qil P km δ ikes decir, Qil P im = δ lm Todo lo anterior se puede establecer en t´rminos de matrices. La unica justificaci´n para emplear e ´ o´ındices aqu´ es la facilidad con que se extienden estas nociones al caso de tensores arbitrarios (con m´s ı ade uno o dos ´ındices). Sean G, G−1 , G , G −1 las matrices del producto escalar en las bases B, Br , B , Brrespectivamente. Sea P la matriz del cambio de base de B a B (es decir, las columnas de P son lascoordenadas de los vectores de la base B en la base B ) y Q la de Br a Br . De acuerdo con lo que hemos
  • 144. 7.3. COORDENADAS 137visto, G es tambi´n la matriz de cambio de base de B a Br y G la del cambio de B a Br . El siguiente ediagrama puede contribuir a aclarar la situaci´n: o P B −−→ B −−     G G Br − − → Br −− Qde donde se deduce que la matriz: G P = QGes la de cambio de base de B a Br . Por tanto, como al mismo tiempo la matriz G es la de una formabilineal, su cambio es: G = (P −1 )t GP −1es decir: G P = (P −1 )t G = QGde donde: Q = (P −1 )tcomo quer´ıamos probar. Las coordenadas contravariantes y covariantes no cambian de la misma manera al cambiar la base(se entiende, como hemos visto, que solo hay un cambio de base, de B a B . Los cambios en las basesrec´ ıprocas son consecuencia de este): j x i = P ij xj , xi = (P −1 ) i xj Nota. En todo lo anterior, lo fundamental ha sido el hecho de que el producto escalar es una forma bilineal no degenerada. Por ejemplo, no hemos hecho uso de la propiedad de ser definido positivo (salvo cuando hemos hablado de bases ortonormales). Por tanto lo anterior se puede hacer tambi´n con formas bilineales no degeneradas, lo que permite usar estos conceptos e cuando no hay un producto escalar estricto, como en relatividad especial. Veamos un ejemplo en IR2 para ilustrar estas ideas.Ejemplo 7.3.1 Sea la base de IR2 (con el producto escalar usual): 1 1 B= u1 = , u2 = 1 0que no es ortonormal. La matriz del producto escalar (y su inversa) en esta base es: 2 1 1 −1 G= , G−1 = 1 1 −1 2es decir: g11 = 2, g12 = g21 = 1, g22 = 1, g11 = 1, g12 = g 21 = −1, g 22 = 2 ıproca se obtiene imponiendo la condici´n: (ui , uj ) = δ ij : La base rec´ o 0 1 Br = u1 = , u2 = 1 −1o, directamente: u1 = g 11 u1 + g21 u2 , u2 = g 12u1 + g22 u2La relaci´n entre coordenadas contravariantes y covariantes es: o x1 = x1 − x2 x2 = −x1 + 2x2
  • 145. 138 TEMA 7. TENSORES Si ahora pasamos a una nueva base: −1 1 −2/3 1/3 B = u1 = , u2 = , Br = u1 = , u2 = 1 2 1/3 1/3 La matriz del producto escalar en estas bases es: 2 1 5/9 −1/9 G = , (G )−1 = 1 5 −1/9 2/9y la matriz de cambio de base (de B a B , y de Br a Br ) es: −1/3 −2/3 1 −2 P = , Q= 2/3 1/3 2 −1siendo Q la inversa transpuesta de P . Se pueden comprobar las relaciones: G P = QG, G = (P −1 )t GP −1 Como ejemplo concreto de coordenadas de un vector, sea: −1 x= ∈ IR2 1Sus coordenadas en las diferentes bases usadas, aparecen en la siguiente tabla: B Br B Br Contravariantes 2, 1 −4/3, 5/3 Covariantes 5, 3 −1, 77.3.2 Coordenadas en relatividad especialSeg´n los postulados de la relatividad especial, la velocidad de la luz es una constante en todos los usistemas inerciales, y el intervalo fundamental, la cantidad que se conserva al cambiar de sistema inercial,es: c2 t2 − r2donde c es la velocidad de la luz, que escogeremos igual a 1. Supongamos un sistema unidimensional. Para describir sus coordenadas espacio-temporales, usaremosun vector de IR2, x = (x0 , x1), dado por sus coordenadas en una base {e0 , e1 }. Las transformaciones decoordenadas admisibles en este espacio, desde un punto de vista de la teor´ que estamos estudiando son ıalas que dejan invariantes la forma bilineal sim´trica no degenerada: e ϕ(x, y) = x0 y 0 − x1 y 1que, sin embargo, no es un producto escalar, pues no es definida positiva. Esta forma bilineal tiene en labase que estamos considerando, la siguiente representaci´n matricial: o g00 = 1, g01 = g10 = 0, g11 = −1y el intervalo fundamental es: ϕ(x, y) = gµν xµ y ν Diremos que una base es ortonormal respecto esta forma bilineal si la representaci´n matricial es la odada (diagonal (1, −1)). Calculemos las transformaciones lineales (homog´neas) que dejan invariantes la forma bilineal (es edecir, que cambian las bases ortonormales entre s´ ı). Sea: Λ 00 Λ 01 Λ= Λ 10 Λ 11
  • 146. 7.3. COORDENADAS 139la matriz de una transformaci´n lineal en IR2 en la base can´nica. Si la forma bilineal anterior es invariante o obajo esta transformaci´n, entonces: o Λt KΛ = Kdonde: 1 0 K= 0 −1es la matriz de la forma bilineal. Las ecuaciones que verifica Λ son: (Λ00 )2 − (Λ10 )2 = 1, (Λ11 )2 − (Λ01 )2 = 1, Λ00 Λ01 − Λ10 Λ11 = 0Podemos parametrizar los coeficientes de la matriz por: Λ00 = cosh t, Λ10 = senh t, Λ01 = η senh t, Λ11 = η cosh tdonde = ±1, η = ±1. Este conjunto de matrices forma un grupo, L, que llamaremos el grupo de Lorentz en 1 + 1 (unadimensi´n temporal y otra espacial). Como se ve det Λ = ±1 y |Λ00 | ≥ 1. Se divide en cuatro subconjuntos oseg´ n los valores del determinante y de la componente Λ00 : u L↑ + = {Λ ∈ L | det Λ = 1, Λ00 ≥ 1} L↓ + = {Λ ∈ L | det Λ = 1, Λ00 ≤ 1} L↑ − = {Λ ∈ L | det Λ = −1, Λ00 ≥ 1} ↓ L− = {Λ ∈ L | det Λ = −1, Λ00 ≤ 1} El primer subconjunto, Ll↑ es un subgrupo de L, el subgrupo ortocrono propio, y consiste en las +transformaciones que dejan invariantes el sentido del tiempo y no cambian la orientaci´n del espacio. Al osegundo pertenece la transformaci´n: o 1 0 P = 0 −1que cambia la coordenada espacial por su negativa (paridad). Al cuarto pertenece: −1 0 T = 0 1que cambia la coordenada temporal por su negativa (inversi´n temporal). o Este tipo de transformaciones ser´n los cambios de base (los cambios de sistema de referencia) admis- aibles. Las leyes de la f´ ısica, de acuerdo con el principio de relatividad tendr´n la misma forma en todos alos sistemas relacionados por las matrices del grupo L (sistemas inerciales). Aunque no dispongamos de un producto escalar, podemos definir una base rec´ ıproca de la B ={u0 , u1 }: Br = {u0 , u1 }con las propiedades: ϕ(ui , uj ) = δj , i, j = 0, 1 i De acuerdo con lo visto en el caso del producto escalar, la relaci´n entre las coordenadas en la base oinicial, xµ = (x0 , x1 ) (coordenadas contravariantes) y en la base rec´ ıproca xµ = (x0 , x1 ) (coordenadascovariantes) es: xµ = gµν xνes decir: x0 = x0 , x1 = −x1
  • 147. 140 TEMA 7. TENSORES El vector posici´n es un vector contravariante de forma natural, escrito en la base de partida. Sin oembargo consideremos el siguiente objeto: ∂µ = (∂0 , ∂1 )donde: ∂ ∂µ = ∂xµEl colocar los ´ ındices como sub´ ındices viene dado por la siguiente ley de transformaci´n. Supongamos oque cambiamos de sistema inercial de acuerdo con la expresi´n: o x µ = Λµν xνdonde Λ es una de las transformaciones admisibles de las que hablamos antes. Entonces: ∂ ∂xν ∂ ∂ µ = = (Λ−1)ν µ ∂x ∂x µ ∂xν ∂x νque es, como hemos dicho antes, la transformaci´n de las coordenadas covariantes. o Esta expresi´n se puede escribir tambi´n de la siguiente forma. De acuerdo con la restricci´n que o e overifica Λ: Λt KΛ = Kde donde: (Λ−1 )t = KΛK −1o, en coordenadas: (Λ−1 )ν µ = gµρ Λρ gρσ = Λµν σy, por tanto, la transformaci´n es: o ∂ ∂ µ = Λµν ∂x ∂x νDe esta forma, podemos decir que el vector posici´n se transforma de manera contravariante, mientras el ovector gradiente lo hace de forma covariante. Volveremos m´s tarde a este ejemplo. a7.4 Espacios vectoriales y sus dualesNo siempre dispondremos de un producto escalar en un espacio vectorial para poder definir coordenadascontravariantes y covariantes. Pero es muy frecuente en el estudio de lo que llamaremos tensores, laaparici´n de formas lineales (es decir, de aplicaciones del espacio vectorial en el cuerpo). Supongamos oque tenemos una aplicaci´n multilineal de un producto V × V × · · · × V × V ∗ × V ∗ × · · · × V ∗ en el cuerpo oIK donde est´ construido V , siendo V ∗ el espacio dual de V . a Nota. El espacio final puede ser otro espacio vectorial y no necesariamente el cuerpo IK. Pero aqu´ nos limitaremos a este caso. ı Seg´n hemos visto antes, seleccionando bases en los espacios vectoriales que forman el producto ucartesiano, es posible definir un conjunto de coordenadas asociada a la aplicaci´n multilineal (o forma omultilineal, si se quiere). En este caso particular que estamos tratando, consideremos una base B ={u1 , . . . , un } de V y su base dual en V ∗ : B ∗ = {u∗1 , . . . , u∗n } con la propiedad ya conocida: u∗i (uj ) = δ ij ıprocas. N´tese que aqu´ las bases B y B ∗ lo son desimilar a la que usamos para definir las bases rec´ o ıdiferentes espacios.
  • 148. 7.5. PRODUCTO TENSORIAL 141 Supongamos que hacemos simult´neamente los cambios de base: a n n ui = P ji uj , u∗i = (P −1 )ij u ∗j j=1 j=1lo que asegura que las nuevas bases tambi´n son duales una de la otra, como ya sabemos: e n n n n u ∗i (uj ) = P ik u∗k ( (P −1 )lj ul ) = P ik (P −1 )lj u∗k (ul ) k=1 l=1 k=1 l=1 n n n = P ik (P −1)lj δl = k P ik (P −1)kj = δ ij k=1 l=1 k=1 Por tanto, las coordenadas contravariantes (asociadas a vectores del espacio inicial) se transforman conP mientras que las covariantes (asociadas a vectores del espacio dual) se transforman con la transpuestainversa de P . ¿C´mo podemos relacionar esta definici´n con la dada anteriormente para las bases rec´ o o ıprocas?Supongamos que tenemos en V un producto escalar (necesario para poder definir la base rec´ ıproca).Sea Br = {u1 , . . . , un } la base rec´ ıproca de B. Seg´n el teorema de Riesz-Fr´chet, si ω es una forma u elineal, existe un unico vector xω de V tal que: ´ ω(y) = (xω , y), ∀y ∈ V Dada una forma de la base dual, u∗i , veamos cual es su correspondiente vector en V : u∗i (y) = (v i , y), ∀y ∈ VUsando y = uk : u∗i (uk ) = (v i , uk ) = δ ikque es justamente la definici´n de la base rec´ o ıproca, por lo que la correspondencia (el isomorfismo entreel espacio dual y el espacio de partida proporcionado por el teorema de Riesz-Fr´chet) es: e u∗i −→ ui Es decir, las coordenadas (covariantes) de una forma en el espacio dual, son las coordenadas covariantesdel vector correspondiente (seg´n Riesz-Fr´chet) en el espacio de partida (en la base rec´ u e ıproca). Si hay unproducto escalar, ambos conceptos coinciden. En el caso de que no lo haya, se entender´n las coordenadas acovariantes como las de las formas en la base dual. Como hemos dicho antes, este resultado se extiendeal caso en el que tengamos una forma bilineal sim´trica no degenerada (como en relatividad). e7.5 Producto tensorialIntroducimos en esta secci´n una definici´n formal de producto tensorial. Los conceptos que aqu´ aparecen o o ıson de dificultad superior al resto de los temas, por lo que pueden suprimirse en una primera lectura.7.5.1 Definici´n de producto tensorial oEn esta secci´n discutiremos la relaci´n entre aplicaciones multilineales y tensores, bas´ndonos en una o o adefinici´n m´s rigurosa del concepto de tensor. o a Sean V1 , . . . , Vn espacios vectoriales de dimensi´n finita sobre un cuerpo IK. Se consideran las aplica- ociones multilineales: ϕ: V1 × · · · × Vn → Wdonde W es otro espacio vectorial sobre IK. Es decir, se tienen los pares (ϕ, W ) formados por unaaplicaci´n multilineal y el espacio de llegada. o
  • 149. 142 TEMA 7. TENSORES Dadas dos parejas (ϕ, W ) y (ϕ , W ), se puede estudiar si tiene soluci´n el siguiente problema: encon- otrar una aplicaci´n lineal f de W en W tal que: f ◦ ϕ = ϕ : o ϕ V1 × · · · × Vn −→ W ↓ W La respuesta es que no siempre es as´ Sin embargo, se puede demostrar que existe una pareja (ψ, T ), ı.que verifica: dada cualquier aplicaci´n multilineal, ϕ: V1 × · · · × Vn → W , existe una unica aplicaci´n o ´ olineal, ϕ∗ : T → W , tal que: ϕ∗ ◦ ψ = ϕ A esta aplicaci´n multilineal, ψ (o al espacio T ) se le llama producto tensorial de los espacios oV1 , . . . , Vn . Aunque no entraremos en detalles, el espacio tensorial es unico (salvo isomorfismo). ´ La correspondencia entre las aplicaciones multilineales ϕ y las aplicaciones lineales ϕ∗ es unica. Por ´eso, el espacio producto tensorial sustituye en cierto sentido al espacio producto cartesiano y transformalas aplicaciones multilineales de V1 × · · · × Vn en W en aplicaciones lineales de T en W .7.5.2 Construcci´n del producto tensorial oEn esta secci´n construiremos expl´ o ıcitamente un modelo de producto tensorial. Para ello, se considera elespacio vectorial libre sobre el conjunto de generadores V1 × · · ·× Vn . Es decir, todos los elementos de esteconjunto se consideran linealmente independientes y, usando el cuerpo IK, se construyen sus combinacioneslineales para dar lugar a un espacio vectorial, que llamaremos M . Para aclarar la situaci´n, si (x1 , . . . , xn ) oe (y1 , . . . , yn ) son elementos de V1 × · · · × Vn , entonces, (x1 , . . . , xn ), (y1 , . . . , yn ) y (x1 + y1 , . . . , xn + yn )son elementos de M , sin que el ultimo sea la suma de los dos primeros, siendo por tanto diferente de ´(x1 , . . . , xn ) + (y1 , . . . , yn ). Dado que no utilizaremos esta notaci´n en el futuro, no insistiremos aqu´ sobre ella. Baste decir o ıque tendremos que indicar si trabajamos en el producto cartesiano o en M , para saber como son laspropiedades de sus elementos, ya que los escribimos igual. Consideremos en M el subespacio vectorial generado por todos los elementos de M de la forma: (x1 , . . . , xi + xi , . . . , xn ) − (x1 , . . . , xi , . . . , xn ) − (x1 , . . . , xi , . . . , xn ) (x1 , . . . , λxi , . . . , xn ) − λ(x1 , . . . , xi , . . . , xn )y el espacio vectorial cociente M/N . La inclusi´n i: V1 ×· · ·×Vn → M no es una aplicaci´n lineal, pero la composici´n de i con la proyecci´n: o o o oπ: M → M/N , ψ = π ◦ i es una aplicaci´n multilineal: o ψ (x1 , . . . , xn ) = [x1 , . . . , xn ] ∈ M/NEn efecto: ψ (x1 , . . . , xi + xi , . . . , xn ) = [x1 , . . . , xi + xi , . . . , xn ] = [x1 , . . . , xi , . . . , xn ] + [x1 , . . . , xi , . . . , xn ] = ψ (x1 , . . . , xi , . . . , xn ) + ψ (x1 , . . . , xi , . . . , xn ) ψ (x1 , . . . , λxi , . . . , xn ) = [x1 , . . . , λxi , . . . , xn ] = λ[x1 , . . . , xi , . . . , xn ] = λψ (x1 , . . . , xi , . . . , xn ) Ya tenemos un par (ψ, M/N ) de los que estamos estudiando. Consideremos otro par cualquiera (ϕ, W )y busquemos una aplicaci´n lineal ϕ∗ : M/N → W , que compuesta con ψ d´ ϕ. La aplicaci´n multilineal o e oϕ asigna a cada elemento del espacio producto cartesiano V1 × · · · × Vn un elemento del espacio W . Portanto, como los elementos del producto cartesiano son un sistema de generadores del espacio M , podemosdefinir una aplicaci´n h de V1 × · · · × Vn (como sistema de generadores de M ) en W , con valores iguales oa los dados por ϕ, y extenderla de forma lineal a todo M . Evidentemente: h ◦ i = ϕ.
  • 150. 7.5. PRODUCTO TENSORIAL 143 La aplicaci´n h, siendo lineal, vale cero sobre los elementos de N , y por consiguiente se puede factorizar oa trav´s del espacio cociente M/N , por una aplicaci´n, tambi´n lineal, ϕ∗ : e o e h = ϕ∗ ◦ πde manera unica. ´ Como ψ = π ◦ i, se tiene: ϕ = h ◦ i = (ϕ∗ ◦ π) ◦ i = ϕ∗ ◦ ψque es lo que quer´ıamos probar (la unicidad de ϕ∗ proviene del hecho de que la imagen de ψ genera todoel espacio cociente M/N ). Se llama a M/N el espacio producto tensorial de los espacios vectoriales V1 , . . . , Vn : V1 ⊗ · · · ⊗ Vny a los elementos de este espacio se les llama tensores y se escribe: ψ (x1, . . . , xn ) = x1 ⊗ · · · ⊗ xn . N´tese que no todos los elementos del espacio producto tensorial se escriben de esta forma. Lo que oes cierto es que los tensores de este tipo generan (linealmente) todo el espacio producto tensorial, con loque un tensor arbitrario es combinaci´n lineal de elementos de este tipo, por ejemplo expresiones como: o x⊗y+z⊗v Las propiedades m´s elementales de este s´ a ımbolo (⊗) son: x ⊗ (y + z) = x ⊗ y + x ⊗ z (x + y) ⊗ z = x ⊗ z + y ⊗ z λ(x ⊗ y) = (λx) ⊗ y = x ⊗ (λy)7.5.3 Propiedades del producto tensorialSi V1 , . . . , Vn son espacios vectoriales de dimensiones d1 , . . . , dn , entonces el producto tensorial es unespacio vectorial de dimensi´n: o d1 × · · · × dnN´tese la diferencia con el producto cartesiano, donde la dimensi´n es la suma de las dimensiones. o o La demostraci´n se basa en un estudio del producto tensorial con el cuerpo IK. Sea V un espacio ovectorial sobre IK y construyamos el producto tensorial: V ⊗ IK. A cada elemento de V se le hacecorresponder un elemento de IK: x ∈ V −→ x ⊗ 1 Se trata de una aplicaci´n lineal que es adem´s un isomorfismo. Una base de V ⊗ IK est´ formada o a apor los tensores ui ⊗ 1 donde los vectores de V , ui , forman una base de V . Por lo tanto la dimensi´n de oV ⊗ IK es igual a la dimensi´n de V . o La generalizaci´n de este resultado es la f´rmula anterior para el c´lculo de la dimensi´n de un o o a oproducto tensorial. (k) Si Bk = {ui } es una base de Vk , entonces: (1) (n) {ui1 ⊗ · · · ⊗ uin }es una base del producto tensorial. Por tanto, cualquier tensor puede ponerse como: d1 ,...,dn (1) (n) t= ti1 ...in ui1 ⊗ · · · ⊗ uin i1 =1,...,in =1
  • 151. 144 TEMA 7. TENSORES Si se hace un cambio de base en cada uno de los espacios Vi dado por: dk (k) (k) (k) ui = Pji uj j=1el cambio en las coordenadas del tensor es: d1 ,...,dn i1 ...in (1) (n) t = Pi1 j1 . . . Pin jn tj1 ...jn j1 =1,...,jn =1 La propiedad que m´s nos interesa aqu´ para relacionar los tensores con las aplicaciones multilineales a ıes la siguiente. Sean V1 , V2 , V3 tres espacios vectoriales sobre un cuerpo IK. Se tiene: L(V1, L(V2 , V3 )) ≈ L2 (V1 , V2 ; V3 ) ≈ L(V1 ⊗ V2, V3 )donde L son las aplicaciones lineales entre los dos espacios que se muestran y L2 son las aplicacionesbilineales del producto cartesiano de los dos primeros espacios en el tercero. Demostremos esta propiedad. La primera propiedad es muy sencilla. Sea: ϕ: V1 × V2 → V3una aplicaci´n bilineal. Si fijamos x ∈ V1 , podemos construir una aplicaci´n lineal: o o ϕ: V1 → L(V2 , V3 ), ˜ ϕ(x) = ϕx ˜mediante: ϕx : V2 → V3, ϕx (y) = ϕ(x, y) Entonces, a cada aplicaci´n bilineal ϕ le hacemos corresponder la aplicaci´n lineal ϕ. Y viceversa, o o ˜consideremos una aplicaci´n lineal: o ˜ φ: V1 → L(V2 , V3 )Definimos un aplicaci´n bilineal de V1 × V2 en V3 : o φ: V1 × V2 → V3 , ˜ φ(x, y) = φ(x)(y) Esta es la correspondencia inversa de la anterior y por tanto, se da el isomorfismo del que se hablaba. En cuanto al otro isomorfismo, el que relaciona las aplicaciones bilineales con aplicaciones lineales delproducto tensorial en un espacio vectorial, se trata simplemente de asociar a cada aplicaci´n bilineal de oV1 × V2 en V3 la aplicaci´n lineal dada por el car´cter universal del producto tensorial: o a V1 × V2 −→ V1 ⊗ V2 ↓ V3 Evidentemente los resultados se generalizan a un n´mero arbitrario de espacios y a aplicaciones umultilineales.7.6 Tensores y aplicaciones multilinealesHemos visto en las secciones precedentes como a cada aplicaci´n lineal del producto tensorial en un oespacio vectorial se le puede asignar una aplicaci´n multilineal del producto cartesiano en el espacio en ocuesti´n. Es decir, los tensores no son aplicaciones multilineales, ni se puede establecer un isomorfismo oentre estos dos espacios vectoriales de forma inmediata. Sin embargo, supongamos que el espacio de llegada de las aplicaciones multilineales en cuesti´n, es oel cuerpo IK. Lo que realmente se tiene es un isomorfismo entre las formas multilineales y las formaslineales del espacio producto tensorial. Como los espacios vectoriales (siempre de dimensi´n finita) y sus o
  • 152. 7.7. CAMBIOS DE BASE 145espacios duales son isomorfos (aunque no sea de forma can´nica) se puede establecer una relaci´n entre o otensores y formas multilineales. Si adem´s tenemos un producto escalar, el teorema de Riesz-Fr´chet a epermite establecer este isomorfismo de forma can´nica (lo que es tambi´n cierto aunque la forma bilineal o eque genera el producto escalar no sea definida positiva, aunque s´ no degenerada). ı Dado un tensor x1 ⊗ · · · ⊗ xn en el espacio producto tensorial V1 ⊗ · · · ⊗ Vn , y una forma bilinealsim´trica no degenerada en cada uno de los espacios Vk , ϕk , con coordenadas en las bases Bk de Vk dadas epor: (k) (k) (k) ϕk (ui , uj ) = gijdefinimos una forma multilineal: φ: V1 × · · · × Vn → IKasociada a este tensor mediante: φ(y1 , . . . , yn ) = ϕ1 (x1 , y1 ) · · · ϕ(xn , yn )y podemos trabajar indistintamente con tensores o formas multilineales. Veamos la relaci´n entre las ocoordenadas de φ y el tensor t = x1 ⊗ · · · ⊗ xn en unas bases dadas de V1 , . . . , Vn . Supongamos que elegimos como tensores t los de una base del espacio tensorial: (1) (n) t(i1 ...in ) = ui1 ⊗ · · · ⊗ uin La forma bilineal correspondiente aplicada a n vectores de las bases anteriores es: (1) (n) (1) (1) (n) (n) (1) (n) φ(i1 ...in ) (uj1 , . . . , ujn ) = ϕ1 (ui1 , uj1 ) · · · ϕ(uin , ujn ) = gi1 j1 . . . gin jn7.7 Cambios de baseSupongamos que en cada uno de los espacios Vi hacemos un cambio de base como dijimos antes: dk (k) (k) (k) ui = Pji uj j=1 Veamos como cambian las formas multilineales y como cambian los tensores. Sea: ϕ: V1 × · · · × Vn : → IKuna forma multilineal, y sea su expresi´n en la base de partida: o d1 ,...,dn (1) (n) ϕ(x1, . . . , xn ) = ϕi1 ...in xi1 · · · xin i1 ,···,in =1donde: dk (k) (k) (1) (n) xk = xik uik , ϕ(ui1 , . . . , uin ) = ϕi1 ...in ik =1 Bajo el cambio de base, d1 ,...,dn d1 ,...,dn d1 dn (1) (n) (1) (n) ϕ(x1 , . . . , xn ) = ϕi1 ...in xi1 · · · xin = ϕi1 ...in (P (1))−11 xj1 · · · i1 j (P (n) )−1 n xjn in j i1 ,···,in =1 i1 ,···,in =1 j1 =1 jn =1y, por lo tanto: d1 ,...,dn (n) ϕi1 ...in = ϕi1 ...in (P (1))−11 · · · (P (n) )−1in ϕj1 ...jn j1 i jn i1 ,···,in =1
  • 153. 146 TEMA 7. TENSORES Si recordamos como cambian las coordenadas de un tensor t ∈ V1 ⊗ · · · ⊗ Vn : d1 ,...,dn (1) (n) t i1 ...in = Pi1 j1 . . . Pin jn tj1 ...jn j1 ,...,jn =1vemos como unas lo hacen con la matriz de cambio de base y otras con la inversa traspuesta, como era deesperar dada la dualidad entre estos dos objetos. Si las matrices son ortogonales, el cambio es el mismo(pues (P −1 )t = P ). En este sentido, las aplicaciones multilineales (con valores en el cuerpo) son una delas formas posibles de representar los tensores.7.8 Definici´n de tensores bajo transformaciones oDefinici´n 7.8.1 (Tensores en un espacio vectorial V ) Un tensor de rango p = r + s, r veces con- otravariante y s veces covariante, definido sobre un IK-espacio vectorial V de dimensi´n n, es un objeto ocon nr+s componentes referidas a una base de V , B y a la base dual en V ∗ , que se escribir´ como: a ti1 ...ir j1 ...jsy que est´n relacionadas con las componentes en otra base mediante la expresi´n: a o tji11...jsr = Pk1 · · · Pkr (P −1 )l1 · · · (P −1 )ls tk11...lsr ...i i 1 i r j1 js l ...kdonde se emplea el convenio de Einstein de la suma. La matriz P es la matriz de cambio de base, de B a una nueva base B (y las duales en las coordenadascovariantes). El orden de los ´ındices es fundamental (salvo en casos de simetr´ como veremos m´s tarde). Supone- ıa amos que los ´ ındices contravariantes van antes que los covariantes, cuando los escribimos como hemoshecho arriba. Sin embargo, cuando hablemos de subir y bajar ´ ındices, hay que prestar atenci´n a la oposici´n relativa de unos y otros. oEjemplo 7.8.1 Los tensores de rango 1 y de tipo (1, 0) (es decir, una vez contravariante) son simplementelos vectores del espacio V . La ley de transformaci´n es la que conocemos al cambiar de base: o t i = Pk tk i Los tensores de rango 1 y tipo (0, 1) (es decir 1 vez covariante) son los elementos del dual: ti = (P −1 )k tk i Los tensores de tipo (0, 2) son formas cuadr´ticas (del tipo del tensor de inercia) y su regla de atransformaci´n es: o tj1 j2 = (P −1)l1 (P −1 )l2 tl1 l2 j1 j2 Si representamos el tensor tj1 j2 por una matriz T , la ley de transformaci´n es simplemente: o T = (P −1 )t T (P −1)o, llamando Q = P −1: T = Qt T Quna expresi´n bien conocida. o Los tensores de tipo (1, 1) son, en un sentido que se puede precisar completamente, isomorfos aendomorfismos. Aqu´ nos limitaremos a mostrar la ley de transformaci´n: ı o tji = Pk (P −1 )l tk i j lque, escrita como antes en t´rminos de matrices, se lee: e T = P T P −1tambi´n conocida. e
  • 154. 7.9. PROPIEDADES DE LOS TENSORES 147Ejemplo 7.8.2 En todo espacio de tensores de tipo (1, 1) existe un tensor definido en cualquier basepor: i1 δi2 = 1 i1 = i2 i1 δi2 = 0 i1 = i2 Veamos que es un tensor: δii1 = Pj1 (P −1)j2 δj2 = Pji1 (P −1 )j2 = δi2 2 i1 i 2 j1 1 i 1 i1Se llama el tensor de Kronecker (delta de Kronecker) y aparece constantemente en las operaciones contensores. Sea Tsr el conjunto de tensores de rango p = r + s, r veces contravariante y s veces covariantes. Sesuele escribir tambi´n: e Tsr = V ⊗ · · · ⊗ V ⊗ V ∗ ⊗ · · · ⊗ V ∗y se llama a este conjunto el producto tensorial de r veces el espacio V y s veces el espacio V ∗ . El s´ ımbolo⊗ se llama producto tensorial, como ya hemos visto. Pues bien, Tsr es un espacio vectorial sobre IK de dimensi´n nr+s . Las combinaciones lineales de otensores de tipo (r, s) (donde la suma se entiende componente a componente y el producto por escalaresmultiplicando cada componente por el escalar) son tambi´n tensores de este tipo (como es f´cil de de- e amostrar). En cuanto a la dimensi´n, basta considerar tensores que tienen en una base dada todas sus ocomponentes igual a cero salvo una igual a 1. Hay evidentemente nr+s tensores de este tipo, son lineal-mente independientes y generan todo el espacio Tsr . Sea B = {u1 , . . . , un } una base de V y B ∗ = {u∗1 , . . . , u∗n } su base dual. Obviamente, el escalar1 ∈ IK es una base de T00 ≈ IK. La base B lo es de T01 ≈ V y B ∗ de T10 ≈ V ∗ . En un espacio Tsr la base, que contiene nr+s vectores (tensores de rango p = r + s), se designa por: ui1 ⊗ · · · uir ⊗ u∗j1 ⊗ · · · ⊗ u∗jsy por tanto, un tensor se escribir´ como: a t = ti1 ...ir ui1 ⊗ · · · uir ⊗ u∗j1 ⊗ · · · ⊗ u∗js j1 ...js De esta forma, la ley de transformaci´n se explica como un cambio de base simult´neo en cada una o ade las copias de los espacios V y V ∗ .7.9 Propiedades de los tensoresEstudiaremos en esta secci´n tres propiedades de los tensores de rango arbitrario en un espacio vectorial oV.7.9.1 Tensores sim´tricos y antisim´tricos e eSea ti1 ...ir un tensor de tipo (r, s), y consideremos el objeto que se define a partir de ´l mediante una j1 ...js epermutaci´n de los ´ o ındices contravariantes entre s´ (o de los covariantes entre s´ ı ı): σ(i1 ...i ) ti1 ...ir = tj1 ...js r ˆj ...j 1 sdonde σ es un elemento del grupo de permutaciones Sr .: σ(i1 . . . ir ) = (iσ(1) . . . iσ(r) ) ˆ Este objeto t es tambi´n un tensor del mismo tipo que t, y en general distinto de t. La demostraci´n e oconsiste simplemente en comprobar sus propiedades de transformaci´n, aunque es bastante laboriosa de oescribir. Ve´mosla en un caso sencillo, para tensores de tipo (2, 0), y en el caso no trivial, cuando a σ(1) = 2, σ(2) = 1
  • 155. 148 TEMA 7. TENSORESEntonces: ti1 i2 = tiσ(1) iσ(2) = ti2 i1 ˆy la regla de transformaci´n es: o t i1 i2 = t i2 i1 = Pj2 Pj1 tj2 j1 = Pj1 Pji2 ˆj1 j2 ˆ i2 i1 i1 2 tlo que demuestra que es un tensor de tipo (2, 0). Igual se hace para ´ ındices covariantes. Lo que no se puede hacer es permutar un ´ ındice contravariantecon otro covariante. Estos ´ındices est´n referidos a distintas bases (una y su dual) en diferentes espacios ay no tiene sentido la operaci´n, no obteni´ndose un tensor. o e Esta operaci´n da lugar a las siguientes definiciones. oDefinici´n 7.9.1 Se dice que el tensor ti1 ...ir de tipo (r, 0) es un tensor sim´trico, si para toda operaci´n o e odel grupo Sr sobre sus ´ ındices contravariantes, el tensor resultante es igual al original. Evidentemente, la misma definici´n se puede establecer para un tensor de tipo (0, s), e incluso para otensores mixtos (tipo (r, s)), refiri´ndose a cada conjunto de ´ e ındices contravariantes y covariantes. La suma de tensores sim´tricos de tipo (r, 0) y el producto por escalares de estos tensores lleva a eun tensor del mismo tipo. El conjunto de tensores sim´tricos es un subespacio vectorial del espacio de etensores. Si la dimensi´n del espacio de tensores T r era nr , no es dif´ probar que la dimensi´n del o ıcil osubespacio de tensores sim´tricos S r es justamente: e n+r−1 rBasta simplemente contar las coordenadas independientes.Ejemplo 7.9.1 Consideremos los tensores sim´tricos de tipo (2, 0). La ecuaci´n que verifican es: e o ti1 i2 = ti2 i1 Si el espacio es IR3 , la dimensi´n de T 2 es 9, y la de estos tensores sim´tricos es 6. o e Los tensores sim´tricos de tipo (3, 0) verifican: e ti1 i2 i3 = ti2 i1 i3 = ti3 i2 i1 = ti1 i3 i2 = ti3 i1 i2 = ti2 i3 i1 En este caso, si el espacio es IR3 forman un subespacio de dimensi´n 10. Y los de tipo (4, 0) tienen odimensi´n 15. o Las formas bilineales sim´tricas son un ejemplo de tensores de tipo (0, 2) sim´tricos (en particular, el e eproducto escalar). De forma similar se definen los tensores totalmente antisim´tricos. eDefinici´n 7.9.2 Se dice que el tensor ti1 ...ir de tipo (r, 0) es un tensor totalmente antisim´trico (o o ealternado), si, para toda operaci´n del grupo Sr sobre sus ´ o ındices contravariantes, se tiene: tiσ(1) ...iσ(r) = (−1)ε(σ) ti1 ...irdonde ε(σ) es la paridad de la permutaci´n. o Los tensores antisim´tricos forman tambi´n un espacio vectorial y la dimensi´n es: e e o n r Veamos algunos ejemplos.
  • 156. 7.9. PROPIEDADES DE LOS TENSORES 149Ejemplo 7.9.2 El conjunto de tensores antisim´tricos de tipo (2, 0) verifican: e ti1 i2 = −ti2 i1 En IR3 tienen dimensi´n 3. N´tese que 3 + 6 = 9. De hecho se tiene en cualquier espacio V : o o T 2 = S 2 ⊕ A2 La dimensi´n de los tensores antisim´tricos de tipo (3, 0) en IR3 es 1. Es decir, salvo un factor, solo o ehay un tensor de tipo (3, 0) totalmente antisim´trico. Esto tambi´n es generalizable. En un espacio de e edimensi´n n s´lo existe (salvo un factor) un tensor de tipo (n, 0) totalmente antisim´trico. Y no existe o o ening´ n tensor de tipo (r, 0), con r > n, totalmente antisim´trico en un espacio de dimensi´n n. u e o Veamos como se transforma un tensor antisim´trico de orden n: e ti1 ...in = a i1 ...in i1 ...indonde a ∈ IK y verifica: 1...n = −1en una base dada. Veamos como cambia este tensor al cambiar la base. i1 ...in = Pj1 · · · Pjin i1 n j1 ...jny por tanto, 1...n = Pj1 · · · Pjn 1 n j1 ...jn = − det P Por lo tanto, estos tensores se transforman con el determinante. Veremos m´s adelante una aplicaci´n a ode este resultado. N´tese tambi´n que el caso de tensores de segundo orden es el unico en el que se verifica que todo o e ´tensor es suma de un tensor sim´trico m´s otro antisim´trico. En ´rdenes mayores esto es incorrecto. La e a e oraz´n es que existen tensores con simetr´ intermedias (por ejemplo, sim´tricos en dos ´ o ıas e ındices, pero no enel resto,y verificando relaciones m´s complicadas entre las coordenadas). El espacio total se descompone aen suma directa de estos tensores de simetr´ intermedias en los que no entraremos aqu´ pero que juegan ıas ı,un papel fundamental, por ejemplo en la teor´ de representaciones de grupos. ıa7.9.2 Contracci´n de ´ o ındicesLa segunda operaci´n que vamos a considerar afecta a tensores de tipo mixto, y contrariamente a la o r−1primera no act´a en el espacio de tensores de tipo (r, s) sino que pasa de Tsr a Ts−1 . Desde un punto de uvista m´s riguroso, habr´ que considerar el conjunto: a ıa ∞ T = Tsr r,s=0el ´lgebra tensorial, pero no entraremos aqu´ en estos detalles. a ı Sea ti1 ...ir un tensor de tipo (r, s) y definamos: j1 ...js ˆi ...i i ...i iik ...ir−1 tj1 ...jr−1 = tj1 ...jk−1ijl ...js−1 1 s−1 1 l−1 Se dice que el tensor ˆ se ha obtenido por contracci´n de dos de los ´ t o ındices del tensor t. Obviamentela operaci´n se puede extender a m´s ´ o a ındices y contraerlos sucesivamente. N´tese que la contracci´n se o ohace con ´ındices contravariantes y covariantes. No se contraen ´ ındices del mismo tipo. Desde el punto devista del espacio y su dual lo que se est´ haciendo es actuar con uno de los espacios V ∗ sobre uno de los aV . Que el resultado de esta operaci´n es un tensor es tambi´n consecuencia de la ley de transformaci´n. o e o
  • 157. 150 TEMA 7. TENSORESEjemplo 7.9.3 Consideremos un tensor de tipo (1, 1), ti . Contrayendo sus dos ´ j ındices, obtenemos otrotensor, de tipo (0, 0) es decir, un escalar: tr t = ti iSe le llama la traza del tensor t. En particular, para el tensor de Kronecker, la traza es la dimensi´n del oespacio V . Se dice que un tensor de tipo (1, 1) es de traza nula si tr t = 0. Todo tensor de tipo (1, 1) se puedeescribir de la siguiente forma (de manera unica): ´ ti = ai + (tr t)δj j j idonde ai es un tensor de traza nula. jEjemplo 7.9.4 Sea el tensor Rλ de tipo (1, 3). Un tensor contra´ a partir de ´l es: µνρ ıdo e λ rµν = Rλµν N´tese que, en principio: o Rλµν = Rλ λ µλνSin embargo, si el tensor R es totalmente sim´trico en sus ´ e ındices covariantes, se tiene: Rλ = Rλ = Rλ λµν µλν µνλ7.9.3 Producto tensorialLa tercera operaci´n con tensores a estudiar es el producto tensorial. Con ella, a partir de dos tensores ode tipos (r, s) y (r , s ) podemos construir un tercer tensor de tipo (r + r , s + s ). Sean: a ∈ Tsr , b ∈ TsrEntonces, el objeto definido por sus componentes en una base como: i1 ...ir ir+1 ...i ir+1 ...i cj1 ...js js+1 ...jr+r = ai1 ...ir bjs+1 ...jr+r s+s j1 ...js s+ses un tensor que se llama el producto tensorial de los tensores a y b. La demostraci´n es otra vez la ley ode transformaci´n al cambiar de base. o Esta operaci´n permite establecer una aplicaci´n entre el producto tensorial Tsr ⊗ Tsr y el espacio de o o r+rtensores: Ts+s ; que esta aplicaci´n es lineal e inyectiva no ser´ desarrollado en detalle aqu´ o a ı.Ejemplo 7.9.5 Consideremos dos tensores sobre un espacio vectorial V , ai de tipo (1, 0) y bi de tipo(0, 1). Construimos el producto tensorial de estos dos tensores, que es un tensor de tipo (1, 1): ti = ai bj jSi ahora contraemos los dos ´ ındices del tensor t, obtenemos un escalar: c = ai bi Seg´n la idea de contracci´n que hemos introducido, no es posible contraer dos tensores de tipo (1, 0). u oSin embargo, consideremos un tensor de tipo (0, 2), gij . Podemos hacer el producto tensorial de g pordos tensores de tipo (1, 0), xi e y i , es decir por dos elementos del espacio V de partida: gij xk y lSi ahora contraemos el ´ ındice i con el k y el j con el l: gij xi y j
  • 158. ´7.10. TENSORES COVARIANTES ANTISIMETRICOS: FORMAS 151obtenemos un escalar. Si g es sim´trico y definido positivo (es decir, la matriz que representa a este etensor de segundo orden es definida positiva), tenemos un producto escalar en V . Dada una forma cuadr´tica no degenerada de determinante g, la ley de transformaci´n para g es: a o g = (det P )2 go sea: |g | = | det P | |g|Por tanto, |g| no es un escalar. Tampoco es un tensor alternado de orden n para transformacionesgenerales, pero s´ para aquellas que tienen el determinante positivo, pues entonces: ı |g | = det P |g|En este caso, |g|(e1 ⊗ e2 · · · ⊗ en )a es el elemento de volumen correspondiente a la m´trica g, donde el esub´ındice a significa la antisimetrizaci´n de este tensor. o Finalmente consideremos el caso de un tensor de tipo (1, 1) multiplicado tensorialmente por otro detipo (1, 0): ti xk jy hagamos la unica contracci´n posible (´ ´ o ındices jk): yi = ti xj jque es de nuevo un tensor de tipo (1, 0). Esto sugiere la relaci´n entre los tensores de tipo (1, 1) y los oendomorfismos de V de la que habl´bamos antes. Se tiene el isomorfismo de espacios vectoriales: a L(V ) ≈ T11 N´tese que, usando el producto tensorial y tomando combinaciones lineales, uno puede construir ocualquier tipo de tensor a partir de tensores de tipo (1, 0) y (0, 1) y escalares.7.10 Tensores covariantes antisim´tricos: formas eLos tensores covariantes totalmente antisim´tricos se pueden interpretar como aplicaciones lineales del eespacio vectorial de tensores contravariantes (del mismo orden) en el cuerpo IK. Si tj1 ...js es uno de estostensores, al aplicarlo a un tensor como xi1 ...is , es decir, al hacer el producto tensorial y luego contraertodos los ´ ındices, se obtiene un escalar: ti1 ...is xi1 ...is ∈ IK El conjunto de tensores covariantes de orden s totalmente antisim´tricos es un subespacio vectorial edel espacio Ts y se llama Λs , conjunto de formas de orden s. Un tensor de este tipo se llama una s-forma.La dimensi´n de estos espacios ya la hemos calculado antes, y tambi´n hemos visto c´mo no hay s-formas o e ocon s > n. La suma directa de espacios vectoriales: n Λs s=0se llama ´lgebra exterior de V . Se toma Λ0 = IK. a Cuando se trabaja con tensores alternados, se usa el s´ ımbolo ∧ para describir el producto tensorialalternado. Dentro de las relaciones que hemos visto hay entre aplicaciones multilineales y tensores, las formasson aplicaciones multilineales alternadas. La unica forma de dimensi´n n (linealmente independiente) ´ oque hay, se le llama elemento de volumen (el determinante de la teor´ de matrices) y se escribe: ıa e1 ∧ · · · ∧ en
  • 159. 152 TEMA 7. TENSORES En el ´lgebra exterior es posible definir otra operaci´n , que relaciona los tensores alternados de tipo a o(0, k) y los de tipo (0, n − k) definidos sobre un espacio con una m´trica gij . Si i1 ,...in es el unico tensor e ´alternado de orden n, con valor 12...n = −1, se define: 1 i1 ...ik ( t)ik+1 ...in = |g| i1 ...in t k! Se tiene: ( t) = (−1)k(n−k) sgn(g)t7.11 Tensores y grupos de transformacionesSeg´n hemos visto hasta ahora, los elementos que necesitamos para la construcci´n de tensores (al menos, u ode los que estamos hablando en estas ultimas secciones), son: un espacio vectorial de dimensi´n finita ´ oy los cambios de base en dicho espacio. Las transformaciones que pasan de unas bases a otras, sonlas que forman el grupo general lineal del espacio V , GL(V ), es decir cualquier automorfismo de V . Ent´rminos de matrices, se trata de las matrices regulares n×n, que forman el grupo general lineal GL(n, IK) e(obviamente isomorfo al anterior GL(V )). Sin embargo, muchas veces, no interesa hacer cambios de basetan generales. Por ejemplo si tenemos un producto escalar, puede ser util hacer cambios de base que ´conserven la orientaci´n o los ´ngulos que forman los vectores de la base entre s´ O, en relatividad o a ı.especial, las transformaciones que resultan aceptables son aquellas que conservan el intervalo espacio-temporal constante, pues son las que relacionan los sistemas inerciales entre s´ En general, el conjunto ı.de transformaciones que se usan en cada caso, forman un grupo (pues si no, no se podr´ hablar de atransformaciones inversas etc.) y se dice que un tensor lo es bajo ese grupo de transformaciones. Porejemplo, consideremos el espacio IRn con su producto escalar usual y las transformaciones ortogonalescon determinante positivo. Los tensores de este espacio (es decir los objetos que cambian adecuadamenteal cambiar la base mediante una rotaci´n) son los tensores cartesianos de este espacio. Es posible que si oempleamos otra transformaci´n que no sea una rotaci´n, el tensor no se comporte como tal. o o i Por ejemplo, pensemos en el tensor de Kronecker δj , cuyas componentes son las mismas en cualquierbase. Si queremos definir un tensor con esa misma propiedad, pero de tipo (0, 2), es decir gij , concomponentes iguales a 1 si los ´ındices son iguales y a 0 si los ´ ındices son distintos, vemos que podemoshacerlo para cualquier base: gij = (P −1 )k (P −1 )l gkl i jo escritos como matrices (supongamos que el ´ ındice contravariante numera a las filas): G = (P −1 )t G(P −1 ) Si queremos que tanto G como G sean la matriz identidad, las matrices que permiten pasar de unasbases a otras, verifican: P tP = P P t = Ies decir, son las matrices ortogonales. Podemos decir que este tensor sim´trico lo es bajo el grupo eortogonal, pero no bajo el grupo general lineal. Pensemos ahora en un tensor en IR2 de tipo (0, 2), antisim´trico y escojamos 12 = −1 (lo que fija eel tensor, pues 11 = 22 = 0, 21 = − 12 ). Si ahora cambiamos las base con una transformaci´n P , otendremos como antes: −1 k ij = (P )i (P −1 )l kl jpara que no var´ al cambiar de base. Por tanto: ıe P t JP = Jdonde: 0 −1 J= 1 0 Curiosamente, puede comprobarse como las transformaciones que tienen esta propiedad son las delgrupo general lineal que tienen determinante igual a 1, es decir, el grupo especial lineal, SL(2, IR).
  • 160. 7.12. ESPACIOS CON PRODUCTO ESCALAR 153Teniendo en cuenta lo que hemos dicho sobre la interpretaci´n de volumen de esta 2-forma, no es extra˜ o o nque se diga que las transformaciones del grupo SL(2, IR) conservan el volumen (en este caso un ´rea al aser en dimensi´n 2). o7.12 Espacios con producto escalarSi el espacio vectorial V est´ dotado de un producto escalar, esto quiere decir que existe un tensor ade segundo orden de tipo (0, 2), sim´trico definido positivo, y que es invariante, teniendo las mismas ecomponentes en cualquier base. Por tanto, como ya hemos dicho, las transformaciones permisibles sonlas que verifican: P t GP = G El producto escalar nos permite hacer uso del teorema de Riesz-Fr´chet, identificando de forma ecan´nica el espacio dual con el espacio V , a trav´s del tensor m´trico gij . En efecto: o e e ω ∈ V −→ v ∈ Vtal que: ω(x) = (v, x)o, en t´rminos de tensores: e ωi xi = gij v i xjes decir: ωi = gij v jPodemos interpretar esto de dos formas. O bien, como el isomorfismo entre el espacio V y su dual, ocomo la expresi´n de un mismo vector de V en bases distintas, en realidad las bases rec´ o ıprocas de las queya hab´ ıamos hablado al introducir las coordenadas covariantes y contravariantes. Haci´ndolo as´ ω es lo e ı,mismo que v pero escrito en otra base y escribiremos: vi = gij v jEsta operaci´n se denomina bajar ´ o ındices y se hace a trav´s del tensor m´trico. Como tambi´n hemos e e edicho, no es necesario tener una forma bilineal definida positiva para hacer esto. Basta con que sea nodegenerada. La operaci´n inversa, subir ´ o ındices, se realiza con el inverso del tensor m´trico: e gik gkj = δ ijy es: vi = gij vj Esta operaci´n se puede hacer todas las veces que se quiera en tensores de tipo arbitrario. Cada vez oque se baje o suba alg´n ´ u ındice aparece un tensor m´trico g (o su inverso). e N´tese que el producto escalar de dos vectores de V se escribe simplemente como: o gij xi y j = xi yi = xi yi7.13 Aplicaciones entre espacios producto tensorialSean V, W, V , W espacios vectoriales sobre un cuerpo IK. Sean f y g aplicaciones lineales: f: V → V , g: W → W Si construimos los productos tensoriales V ⊗ W y V ⊗ W , es posible definir una aplicaci´n lineal oentre estos dos espacios, que se llamar´ producto tensorial de las aplicaciones f y g: a f ⊗ g: V ⊗ W → V ⊗ W
  • 161. 154 TEMA 7. TENSORESde la siguiente forma: (f ⊗ g)(v ⊗ w) = f (v) ⊗ g(w)para cualquier par de vectores v ∈ V , w ∈ W . La aplicaci´n se extiende linealmente a todos los elementos ode V ⊗ W . Tambi´n se puede definir para productos tensoriales de m´s de dos espacios. e a Veamos como se relaciona la representaci´n matricial de las aplicaciones producto tensorial con las omatrices de las aplicaciones que forman el producto. Lo haremos en el caso sencillo del producto de dosaplicaciones. Sean BV = {v1 , . . . , vn }, BW = {w1 , . . . , wm }, BV = {v1 , . . . , vn }, BW = {w1 , . . . , wm }, bases de V ,W , V , W respectivamente. Sea A = (aij ) la matriz que representa a la aplicaci´n lineal f en las bases oBV y BV y B = (bij ) la que representa a g en las bases BW y BW . Es decir: n m f (vi ) = aj i vj , i = 1, . . . , n, g(wi ) = bj i wj , i = 1, . . . , m j=1 j=1 De acuerdo con la definici´n de producto tensorial, una base de V ⊗ W es: o BV ⊗W = {vi ⊗ wj , i = 1, . . . , n, j = 1, . . . , m}y una base de V ⊗ W es: BV ⊗W = {vi ⊗ wj , i = 1, . . . , n , j = 1, . . . , m } Lo unico que tenemos que decidir es como ordenar esta base. Hay dos formas naturales de hacerlo, ´bien fijando el ´ ındice del vector vi y dejando variar el de wj o viceversa. Supongamos que el orden es: {v1 ⊗ w1 , v1 ⊗ w2 , . . . , v1 ⊗ wm , v2 ⊗ w1 , . . . , v2 ⊗ wm , . . . , vn ⊗ w1 , . . . , vn ⊗ wm } Seg´n la definici´n de la aplicaci´n f ⊗ g: u o o (f ⊗ g)(vi ⊗ wj ) = f (vi ) ⊗ g(wj )y sustituyendo las expresiones de estos vectores, se tiene:     n m (f ⊗ g)(vi ⊗ wj ) =  a ki v k  ⊗  blj wl  k=1 l=1Aplicando las propiedades del producto tensorial n m (f ⊗ g)(vi ⊗ wj ) = aki blj vk ⊗ wl k=1 l=1 La aplicaci´n lineal f ⊗ g viene dada en las bases BV ⊗W y BV ⊗W por la “matriz” aij bkl cuyas opropiedades tensoriales estudiaremos m´s adelante, pero que, en cualquier caso, puede escribirse como una averdadera matriz, adoptando el orden anteriormente elegido para las bases de estos espacios tensoriales.Se tiene que la matriz de f ⊗ g, la cual llamaremos producto tensorial de las matrices A y B es:  1  a 1 B a12 B · · · a1n B  a21 B a22 B · · · a2n B    A⊗B =  . . . . . .   . . .  n n n a 1 B a 2 B · · · a nBque tiene las dimensiones y propiedades correctas como se puede comprobar f´cilmente. El objeto aij bkl aes obviamente un tensor de cuarto orden, dos veces contravariante y dos veces covariante, pues es elproducto tensorial de dos tensores de segundo orden. Por tanto sus propiedades de transformaci´n son olas adecuadas a estos tensores. Restringi´ndonos al caso V = V , W = W , ´stas son: e e a i j b k l = P i i (P −1 )j j Qk k (Q−1 )ll aij bklsiendo P la matriz de cambio de base en V y Q la matriz de cambio de base en W .
  • 162. 7.13. APLICACIONES ENTRE ESPACIOS PRODUCTO TENSORIAL 155Ejemplo 7.13.1 El siguiente ejemplo proporciona una interesante aplicaci´n en el estudio de las part´ o ıcu-las elementales. Cuando se tiene un sistema compuesto de dos part´ ıculas de spin s y s el sistema presentaun spin que depende de los de las part´ıculas que lo forman. De acuerdo con la teor´ cu´ntica, los valores ıa aque pueden tomar s y s son n´meros enteros o semienteros, positivos (0, 1/2, 1, 3/2, . . .). Sea V el espacio ude los estados de spin de la part´ ıcula 1 y W el de los estados de la part´ıcula 2. El espacio de estados delsistema 1 + 2 es justamente el producto tensorial de los espacios V y W y los operadores de spin en esteespacio se obtienen de la forma siguiente: S3 ⊗W = S3 ⊗ IW + IV ⊗ S3 V V W V Wdonde S3 , S3 son los operadores (tercera componente) de spin en cada uno de los espacios V y W . Consideremos bases en las que estos operadores son diagonales (es decir, bases de autovectores): usV = |sV , sV , 3 3 usW = |sW , sW 3 3 ındices sV , sW var´ en los conjuntos:donde los ´ 3 3 ıan {sV , sV − 1, . . . − sV + 1, −sV }, {sW , sW − 1, . . . − sW + 1, −sW } V Wrespectivamente. Estos ´ ındices son, adem´s, los autovalores de los operadores S3 , S3 que por tanto se aescriben como:   sV 3  sV − 1   3   sV − 2  V  3  S3 =  ..   .     −sV + 1 3  −sV 3   sW 3  sW − 1   3   sW −2  W  3  S3 =  ..   .     −sW + 1  3 −sW 3 El producto tensorial es ahora muy sencillo, puesto que los operadores son diagonales (identificamosoperadores con matrices para mayor sencillez de notaci´n): o   sV 3  ..   .     sV   3   sV − 1   3   ..   .  V S3 ⊗ IW =    sV − 1   3   ..   .     −sV   3   ..   .  −sV 3
  • 163. 156 TEMA 7. TENSORES   sW 3  ..   .     −sW   3   sW   3   ..   .  W IV ⊗ S3 =    −sW   3   ..   .     sW   3   ..   .  −sW 3y por tanto:   sV + sW 3 3  ..  S3 ⊗W = S3 ⊗ IW + IV ⊗ S3 =  V V W .  −sV − sW 3 3y los n´ meros intermedios dependen de las dimensiones de los espacios V y W . Hay que tener en cuenta uque la dimensi´n de V es 2sV + 1 y la de W es 2sW + 1, con lo que la dimensi´n de V ⊗ W es el producto o o(2sV + 1) × (2sW + 1). No es dif´ demostrar que: ıcil s V +sW V W (2s + 1) × (2s + 1) = 2s + 1 s=|sV −sW | Mediante un cambio de base es posible reordenar los valores de s3 que corresponden a un mismo spin.Los elementos de la matriz de cambio de base se conocen como coeficientes de Clebsch-Gordan.Ejemplo 7.13.2 Veamos un ejemplo sencillo. Supongamos que tenemos V = W = C2 y por tantosV = sW = 1/2. En este caso, el producto tensorial tiene dimensi´n 4. El operador de la tercera ocomponente de spin es: (1/2) 1/2 0 S3 = 0 −1/2y el correspondiente al producto tensorial es: (1/2)⊗(1/2) 1/2 0 1 0 1 0 1/2 0 S3 = ⊗ + ⊗ 0 −1/2 0 1 0 1 0 −1/2     1/2 1/2  1/2   −1/2  =  +   −1/2   1/2  −1/2 −1/2   1  0  =    0  −1 La matriz de coeficientes de Clebsch-Gordan, que no describiremos aqu´ pasa de esta matriz a la ı,forma:   0  1     0  −1que tiene dos cajas una correspondiente a spin 0 y otra a spin 1.
  • 164. 7.13. APLICACIONES ENTRE ESPACIOS PRODUCTO TENSORIAL 157Ejemplo 7.13.3 Otro ejemplo, en el que aparece un producto de spins distintos, es el caso 1/2 por 1.Ahora tenemos V = C2 , W = C3 . El producto tensorial tiene dimensi´n 6. Los operadores de la tercera ocomponente de spin son:   1 0 0 (1/2) 1/2 0 (1) S3 = , S3 =  0 0 0  0 −1/2 0 0 −1 El producto tensorial es:     1 1 (1/2)×(1) 1/2 0 1 0 S3 = ⊗ 1 + ⊗ 0  0 −1/2 0 1 1 −1     1/2 1  1/2   0       1/2   −1  =  +   −1/2   1       −1/2   0  −1/2 −1   3/2  1/2     −1/2  =    1/2     −1/2  −3/2 De nuevo, la matriz de coeficientes de Clebsch-Gordan pasa a la forma:   1/2  −1/2     3/2     1/2     −1/2  −3/2que tiene dos cajas, una correspondiente a spin 1/2 y otra a spin 3/2.
  • 165. 158 TEMA 7. TENSORES
  • 166. Tema 8El espacio af´ ın El espacio af´ Sistemas de referencia. Transformaciones afines. Espacios euclidianos. ın. Isometr´ ıas. C´nicas. o8.1 Introducci´n oEn este breve cap´ ıtulo introduciremos algunas nociones elementales del espacio af´ junto con la clasi- ın,ficaci´n de c´nicas. Usaremos en este tema flechas para designar a los elementos del espacio vectorial y o odistinguirlos de los puntos (aunque tambi´n trataremos de usar min´sculas y may´sculas con este fin). e u uAdem´s, el producto escalar de dos vectores u y v se notar´ por u · v y su producto vectorial, en IR3 , ser´ a a ael usual, denotado por u × v.Definici´n 8.1.1 Sea V un espacio vectorial sobre un cuerpo IK. Un par (X, ϕ) formado por un conjunto oX y una aplicaci´n ϕ: o ϕ: X × X −→ Ves un espacio af´ sobre V si se verifican las siguientes propiedades: ın 1) ϕ(P, R) + ϕ(Q, P ) + ϕ(R, Q) = 0, P, Q, R ∈ X 2) ∀P ∈ X, ∀v ∈ V, ∃Q ∈ X tal que ϕ(P, Q) = vEjemplo 8.1.1 El ejemplo m´s inmediato de espacio af´ es el que se obtiene tomando X = V y a ındefiniendo ϕ como: ϕ(x, y) = y − xEl espacio af´ puede considerarse en este caso como un espacio vectorial sin un origen preferido. ın A los elementos de X se les llama puntos y a los de V vectores. Denotaremos en general: −→ − P Q = ϕ(P, Q)8.2 Sistemas de referenciaSupongamos que V es un espacio vectorial de dimensi´n finita. Un sistema de referencia en un espacio oaf´ (X, ϕ) con espacio vectorial base V de dimensi´n finita n, es un conjunto de puntos (elementos de ın o −→ −X) {P0 , P1 , . . . , Pn } tal que los vectores P0 Pi son una base de V . Se dice que P0 es el origen del sistemade referencia. De esta forma, cualquier punto P del espacio X se puede escribir referido al origen P0 como: n −→ − −→ − P0 P = λi P0 Pi i=1 159
  • 167. 160 TEMA 8. EL ESPACIO AF´ IN Dos sistemas de referencia est´n relacionados por una traslaci´n (que pasa de un origen a otro) y por a oun cambio de base en V . Sean: {P0, P1 , . . . , Pn }, {Q0 , Q1 , . . . , Qn } − → −−dos sistemas de referencia en el espacio af´ X. El vector Q0P0 se puede escribir en la base: ın −− −→ −− −→ {Q0 Q1 , . . . Q0 Qn }como: n −− −→ −− −→ Q0 P0 = ai Q0 Qi i=1mientras que los vectores de la primera base se escriben en funci´n de los de la segunda: o n −→ − − → −− P0 Pi = aji Q0 Qj j=1 El cambio de base viene especificado por una matriz en Mn (IK), (aij ), la matriz de cambio de baseen V y un vector en IKn , (ai ) que da la relaci´n entre los or´ o ıgenes. Dado un punto P referido al sistema con origen en P0: n n n n n n −→ − −→ − −− −→ −− −→ −− −→ P0 P = λi P0 Pi = λi aji Q0 Qj = aji λi Q0 Qj = λj Q0 Qj i=1 i=1 j=1 j=1 i=1 j=1 Entonces, − → −− − − → −→ − Q0 P = Q0 P0 + P0 Pcon lo que nos queda la expresi´n: o   n n n n −→ − −− −→ −− −→ ai + −− −→ Q0 P = aj Q0 Qj + λi Q0 Qi = aij λj  Q0 Qi j=1 i=1 i=1 j=18.3 Transformaciones afinesDados dos espacios afines, (X1 , ϕ1 ) y (X2 , ϕ2 ) sobre los espacios vectoriales V1 y V2 respectivamente,consideremos una aplicaci´n entre X1 y X2 : o f : X1 −→ X2 Esta aplicaci´n induce otra entre V1 y V2 definida de la forma siguiente. Fijado P en X1, consideremos o −− → −− − − −− →su imagen f(P ) ∈ X2 . Para todo Q ∈ X1 , al vector P Q ∈ V1 se le hace corresponder el vector f (P )f (Q) ∈V2 . Por la segunda propiedad de los espacios afines, esta aplicaci´n esta bien definida para todo vector ode V1 : ˜ f : V1 −→ V2Si x ∈ V1 , existe un unico Q ∈ X1 tal que: ´ − −→ x = PQEntonces: ˜ −− − − −− → f(x) = f (P )f (Q) ˜Teorema 8.3.1 Si f es lineal, no depende del punto P elegido para definirla.Se dice en este caso que f es una aplicaci´n af´ Si el espacio af´ inicial y final coinciden y la aplicaci´n o ın. ın oaf´ ϕ es biyectiva se llama transformaci´n af´ ın o ın.
  • 168. 8.4. ESPACIOS EUCLIDIANOS 161Definici´n 8.3.1 Una traslaci´n de vector x ∈ V transforma un punto P ∈ X en otro Q ∈ X tal que: o o −→ − x = PQSe tiene el siguiente teorema de estructura de las transformaciones afinesTeorema 8.3.2 Cualquier transformaci´n af´ se puede escribir como un producto de una transfor- o ınmaci´n af´ que deja invariante un punto dado (que se puede elegir arbitrariamente) y una traslaci´n. o ın o Las transformaciones afines tienen en sistemas de referencia afines una expresi´n matricial dada por: o A a In a A 0 = 0 1 0 1 0 1cuando las coordenadas del punto P se escriben como:   x1  .   .   .   xn  1La matriz A es una matriz n × n de determinante distinto de cero. El vector a ∈ V representa unatraslaci´n y A la transformaci´n af´ o o ın: A 0 0 1que deja una punto fijo.8.4 Espacios euclidianosDefinici´n 8.4.1 Un espacio euclidiano es un espacio af´ con un espacio vectorial real dotado de un o ınproducto escalar. El producto escalar en V permite definir una distancia entre los puntos de X: − −→ P, Q ∈ X, d(P, Q) = P Q Las bases ortonormales de V llevan a sistemas de referencia ortonormales en X. Las transformacionesque pasan de unos a otros est´n formadas por traslaciones y transformaciones ortogonales. a8.4.1 Isometr´ en espacios euclidianos ıasDefinici´n 8.4.2 Una aplicaci´n af´ es una isometr´ si la aplicaci´n lineal asociada conserva el pro- o o ın ıa oducto escalar (es decir, es ortogonal). No es dif´ probar que las isometr´ conservan la distancia, son biyectivas y en sistemas de referencia ıcil ıasortonormales vienen representadas por traslaciones y matrices ortogonales. Se dice que una isometr´ es un movimiento del espacio euclidiano si la parte ortogonal de la trans- ıaformaci´n tiene determinante igual a 1, es decir es una rotaci´n. La isometr´ es el producto de una o o ıatraslaci´n por una transformaci´n ortogonal. En un sistema de referencia ortonormal, la isometr´ viene o o ıadeterminada por una matriz: A a 0 1donde: AAt = In , a∈V
  • 169. 162 TEMA 8. EL ESPACIO AF´ IN Si (xi ) son las coordenadas del punto en este sistema de referencia, las del punto transformado son:       x1 a1 x1  .   .   .  .   .   .   A . = .   . =  xn   an   xn  1 0 1 1Una vez elegido el punto fijo, la descomposici´n en rotaci´n y traslaci´n es unica. o o o ´8.5 El plano euclidianoSea IR2 dotado del producto escalar usual (es decir, la base can´nica es ortonormal) y el espacio af´ o ınX = IR2 .8.5.1 Rectas en IR2Supongamos fijado un origen, P0 , en el espacio af´ X = IR2 . Una recta es el conjunto de puntos de IR2 , ınP , que verifican la ecuaci´n: o −→ − − − −→ P0 P = P0 P1 + λv, λ ∈ IR El vector v da la direcci´n de la recta mientras que P1 es un punto dado de la recta. Supongamos o −− −→ −− −→que tenemos un sistema de referencia af´ {P0, u, w} (con u = P0 P1 y w = P0 P2 ). Si (x, y) son las ın: −→ −coordenadas de un punto Q (es decir, P0 Q = xu + y w), las ecuaciones param´tricas de la recta se pueden eescribir como: x = x0 + λv1 y = y0 + λv2 El par´metro λ se puede eliminar de las ecuaciones y obtener la forma impl´ a ıcita: x − x0 y − y0 = v1 v2 Dados dos puntos del plano, existe una unica recta que pasa por ellos. Sean Q1 y Q2 los puntos de ´coordenadas (x1 , y1) y (x2 , y2 ). La recta que pasa por esos dos puntos es: x − x1 y − y1 = x1 − x2 y1 − y2 Por un punto pasa un haz de rectas, de ecuaci´n: o x − x0 = k, k ∈ IR y − y0adem´s de la recta y = y0 . a8.5.2 Distancia de un punto a una rectaSea la recta r ≡ v = v0 + λty el punto P , en un sistema de referencia af´ ortonormal, con origen en P0. Queremos calcular la ındistancia del punto a la recta, entendida como la m´ınima distancia del punto P a los puntos de la recta.La distancia se define a partir de la norma derivada del producto escalar. La distancia entre dos puntosP , Q, de coordenadas en el sistema de referencia af´ ortonormal dadas por: (x1 , y1), (x2, y2 ) es: ın d(P, Q) = (x1 − x2 )2 + (y1 − y2 )2
  • 170. 8.5. EL PLANO EUCLIDIANO 163 −→ − −→ −En lenguaje vectorial, sea w = P0P y v = P0 Q los vectores del punto P y un punto cualquiera Q de larecta r respectivamente. La distancia es entonces: w − v = w − v0 − λt Sea n un vector unitario perpendicular al vector que define la recta (solo hay dos, elijamos cualquiera).Los vectores t/ t|| y n forman una base ortonormal en el plano. Por tanto, el vector w − v0 se puedeescribir en esta base como: 1 w − v0 = t · (w − v0 ) t + n · (w − v0 )− = at + bn → n t 2 Por tanto la distancia (al cuadrado) es: d(P, Q)2 = (a − λ)t + bn 2 = |a − λ|2 + |b|2y ser´ m´ a ınima cuando: 1 λ=a= t · (w − v0 ) t 2 Para este valor de λ la distancia es simplemente: d(P, Q) = |b| = n · (w − v0 )es decir, como ya sab´ ıamos, la proyecci´n sobre el vector normal de un vector que une el punto P con un opunto cualquiera de la recta. Si las coordenadas de t en la base en la que estamos trabajando son (t1 , t2 ),el vector n se puede tomar como: 1 n= (−t2 , t1 ) t2 + t2 1 2y por tanto, la distancia es: 1 d(P, Q) = (−t2 , t1 ) · (w − v0 ) t2 1 + t2 2 Si la recta se expresa como: ax + by + c = 0el vector direcci´n es: (b, −a) y un punto sobre ella tiene como coordenadas (0, −c/b) (si b = 0). Por otanto, la distancia es: |ax1 + by1 + c| d(P, r) = √ a2 + b2 √N´tese que el vector normal (unitario) a una recta escrita en la forma anterior es n = (a, b)/ a2 + b2 , ocon lo que la ecuaci´n de la recta se puede escribir como: o n·v =ky el valor absoluto de k resulta ser la distancia al origen. Una recta es un subespacio af´ de dimensi´n 1. El equivalente en espacios vectoriales es el n´ cleo de ın o uuna forma lineal no nula.8.5.3 Isometr´ en el plano ıasDe acuerdo con lo visto anteriormente, las isometr´ en IR2 se descomponen en el producto de una ıasrotaci´n (propia si det = 1 o impropia si det = −1) y una traslaci´n. Por lo tanto la clasificaci´n de las o o oisometr´ es la siguiente. ıasTeorema 8.5.1 Las isometr´ en IR2 se clasifican en los siguientes tipos: ıas
  • 171. 164 TEMA 8. EL ESPACIO AF´ IN 1. Traslaciones. Eligiendo adecuadamente el sistema de referencia (ortonormal), todas las trasla- ciones son del tipo: x = x+a y = y donde a ∈ IR, correspondiendo a = 0 a la identidad. 2. Rotaciones propias. x = x cos θ − y sen θ y = x sen θ + y cos θ con 0 ≤ θ < 2π, que dejan invariante el origen de coordenadas. Tambi´n θ = 0 corresponde a la e identidad. 3. Reflexiones respecto una recta. Como hemos visto, toda rotaci´n impropia pod´ ser llevada a o ıa 1 0 la forma: . Por tanto: 0 −1 x = x y = −y 4. Reflexiones respecto una recta y traslaci´n en la direcci´n de esa recta. o o x = x+a y = −y con a = 0. Los tipos 1,2,3,4 no son equivalentes y cualquier isometr´ puede ser llevada a uno de ellos definiendo ıaadecuadamente el sistema de referencia. Si son distintos de la identidad, el tipo 1 no tiene puntos fijos yes un movimiento (conserva la orientaci´n), el 2 tiene un un punto fijo (y es tambi´n un movimiento). o eLos tipos 3 y 4 no son movimientos. El 3 tiene una recta fija (punto a punto) y el 4 no tiene puntos fijos. Demostraci´n. La matriz asociada a una isometr´ es: o ıa   m n a  p q b  0 0 1donde la matriz m n p qes ortogonal. Por tanto podemos elegir una base ortonormal en IR2 , de forma que esta matriz se puedaponer como una de las dos formas siguientes: cos θ − sen θ 1 0 , sen θ cos θ 0 −1dependiendo de su determinante (±1). En el primer caso (rotaci´n propia) se tiene: o   cos θ − sen θ a  sen θ cos θ b  0 0 1Si θ = 0: x = x + a, y =y+by pasando a otro sistema de referencia con: u = x cos α − y sen α, v = x sen α + y cos α
  • 172. 8.5. EL PLANO EUCLIDIANO 165 √con c = a2 + b2 , tan α = −b/a se obtiene el tipo 1: u = u + c, v =vLa matriz de la isometr´ es: ıa   1 0 c  0 1 0  0 0 1y no hay puntos fijos (c = 0). Si a = b = 0, no hay traslaci´n y se tiene una rotaci´n o o propia con punto fijo en el origen:   cos θ − sen θ 0  sen θ cos θ 0  0 0 1 Supongamos ahora que θ = 0 y (a, b) = (0, 0). En este caso podemos estudiar la existencia de puntosfijos: x cos θ − y sen θ + a = x x sen θ + y cos θ + b = yEl determinante de la matriz de coeficientes de este sistema lineal es: cos θ − 1 − sen θ det = 2(1 − cos θ) sen θ cos θ − 1es decir, si θ = 0 existe un unico punto fijo, de coordenadas: ´ a b sen θ b a sen θ − , + 2 2(1 − cos θ) 2 2(1 − cos θ)que se puede tomar como centro de la rotaci´n, trasladando el origen de coordenadas. De esta forma la otraslaci´n desaparece y tenemos nuevamente una isometr´ de tipo 2. Si θ = 0 se obtiene nuevamente o ıauna traslaci´n. No hay puntos fijos. o Cuando la rotaci´n es impropia, existe un sistema de referencia en el que la matriz es: o   1 0 a  0 −1 b  0 0 1Si a = b = 0 no hay traslaci´n y obtenemos una reflexi´n respecto a una recta que es invariante (tipo 3). o oSi (a, b) = (0, 0), podemos eliminar b mediante una traslaci´n: o b u = x, v=y− 2y obtenemos una transformaci´n de tipo 4: o u = u + a, v = −vsi a = 0 (si a = 0 es de tipo 3). QED8.5.4 Transformaciones de puntos y rectas bajo isometr´ ıasLas rotaciones propias giran los puntos del plano un ´ngulo θ. Si P = (x, y) es uno de esos puntos, su apunto transformado P = (x , y ) viene dado por: x = x cos θ − y sen θ, y = x sen θ + y cos θ
  • 173. 166 TEMA 8. EL ESPACIO AF´ IN −− −→ −− −→Por tanto, dado un vector v = P1 P2 , (con P1 = (x1 , y2 ), P2 = (x2, y2 ) el vector transformado v = P1 P2es: v = (x2 − x1 , y2 − y1) = (x2 − x1 ) cos θ − (y2 − y1 ) sen θ, x2 − x1 ) sen θ + (y2 − y1 ) cos θ)es decir, el vector v se transforma con una rotaci´n R en el espacio vectorial: o v = Rv Como consecuencia de estas transformaciones, una recta que pase por el punto P = (x0 , y0 ) = v0 yque tenga como vector t, se transforma en otra recta: v = v0 + λt −→ v = Rv0 + λRt0Si la recta se representa en la forma n · v = c, la ecuaci´n transformada es: o (Rn) · v = ces decir, el vector normal gira con la rotaci´n y la distancia al origen es la misma. o En una reflexi´n respecto a una recta r, la imagen de un punto se puede calcular as´ Sea P = o ı.(x0 , y0 ) = v0 un punto del plano, y la recta: n · v = c. El punto P = (x0 , y0 ) sim´trico de P respecto de ela recta r, verifica que el punto A de coordenadas: 1 x0 + x0 y 0 + y 0 (v0 + v0 ) = , 2 2 2est´ sobre la recta r, es decir: a n · (v0 + v0 ) = 2cy adem´s el vector v0 − v0 es paralelo a n: a v0 − v0 = µnDe estas dos relaciones podemos despejar las coordenadas de P : 2 v0 = v0 − µn, µ= (nv0 − c) n 2llegando a la expresi´n: o 2 v0 = v0 − (n · v0 − c)n n 2Si la recta pasa por el origen, c = 0 y se tiene: 2n · v0 v0 = v0 − n n 2 Una traslaci´n consiste simplemente en la suma de un vector constante. Por tanto una recta se oconvierte en otra recta con el mismo vector de direcci´n y sus puntos trasladados por ese vector constante. o Las isometr´ tambi´n se pueden interpretar como cambios en el sistema de referencia, (al igual que ıas eocurre con las aplicaciones lineales y los cambios de base en los espacios vectoriales).8.6 El espacio euclidianoEl espacio af´ que estudiaremos en esta secci´n es el que tiene como como conjunto de puntos y espacio