$
$
Las matrices simétricas \(S\) se definen por la propiedad fundamental de ser iguales a su propia traspuesta. Gilbert Strang las describe como los “reyes del álgebra lineal” debido a que poseen propiedades matemáticas excepcionales que las hacen ideales para una vasta gama de aplicaciones en ciencia e ingeniería. Desde una perspectiva práctica, estas matrices son la base para el estudio de las formas cuadráticas y la optimización. En campos como el aprendizaje profundo y la ciencia de datos, se utilizan para representar funciones de pérdida que deben ser minimizadas, donde la naturaleza de la matriz (si es definida positiva) determina si el sistema tiene un mínimo global estable. Además, son esenciales en estadística para construir matrices de covarianza, las cuales describen la relación y varianza entre múltiples conjuntos de datos.
9.1 Definicion
Decimos que \(S \in \mathcal{M}_{n\times n} \) es Simétrica si \(S=S^⊤\)
9.2 Autovalores Reales
Sea \(S \in \mathbb{R}^{n \times n}\) una matriz simétrica. Sea \(\lambda\) un valor propio de \(S\) y \(x\) su vector propio asociado no nulo. Entonces:
Los autovalores de \(S\) son todos reales: \[\lambda_i \in \mathbb{R} \quad \forall i=1\dots n\]
- Prueba
- Aunque \(S\) es real, inicialmente permitimos que \(\lambda \in \mathbb{C}\) y \(x \in \mathbb{C}^n\).
Partimos de la ecuación fundamental: \(Sx = \lambda x\). Si tomamos el conjugado complejo, considerando que \(S\) es una matriz real (\(\overline{S} = S\)):
\(\overline{Sx} = \overline{\lambda x} \implies S\ \overline{x} = \overline{\lambda}\ \overline{x}\)
Ahora, aplicamos la transpuesta a esta ecuación conjugada
\((S\ \overline{x})^\top = (\overline{\lambda}\ \overline{x})^\top \implies \overline{x}^\top S^\top = \overline{\lambda}\ \overline{x}^\top\)
Dado que por hipótesis la matriz es simétrica (\(S^\top = S\)), la expresión queda: \(\overline{x}^\top S = \overline{\lambda}\ \overline{x}^\top\)
Multiplicamos la expresión resultante por el vector propio original \(x\) a la derecha
\((\overline{x}^\top S)\ x = (\overline{\lambda}\ \overline{x}^\top) x \implies \overline{x}^\top (Sx) = \overline{\lambda} (\overline{x}^\top x)\)
Sustituimos la definición original \(Sx = \lambda x\) en el lado izquierdo
\(\overline{x}^\top (\lambda\ x) = \overline{\lambda} (\overline{x}^\top x) \implies \lambda (\overline{x}^\top x) = \overline{\lambda} (\overline{x}^\top x)\)
La expresión \(\overline{x}^\top x\) representa el producto interno de \(x\) consigo mismo en \(\mathbb{C}^n\), lo cual equivale a la norma al cuadrado del vector: \(\overline{x}^\top x = \|x\|^2\). Como un vector propio \(x\) es, por definición, distinto del vector nulo (\(x \neq 0\)), entonces \(\|x\|^2 > 0\) y entonces podemos dividir ambos lados por esta cantidad. Finalmente obtenemos: \[\lambda = \overline{\lambda}\] En el cuerpo complejo, un número que es igual a su conjugado es, por definición, un número real.
9.3 Ortogonalidad de Autovectores
Sea \(S \in \mathbb{R}^{n\times n} \) una matriz simétrica. Sea \(\lambda\) un valor propio de \(S\) y \(x\) su vector propio asociado no nulo. Entonces:
Los autovectores correspondientes a autovalores distintos son ortogonales entre si:
\[ \begin{rcases} Sq_1 = \lambda_1 q_1 \\ Sq_2 = \lambda_2 q_2 \\ \lambda_1 \neq \lambda_2 \end{rcases} \implies q_1 \perp q_2 \]
- Prueba
- Sean \(q_1, q_2\) autovectores de \(S\) con \(\lambda_1 \neq \lambda_2\).
\(S q_1 = \lambda_1 q_1 \implies (S q_1)^\top = \lambda_1 q_1^\top \implies q_1^\top S = \lambda_1 q_1^\top\)
Multiplicando por \(q_2\) a la derecha: \(q_1^\top S q_2 = \lambda_1 q_1^\top q_2\)
Sustituyendo \(S q_2 = \lambda_2 q_2\): \(\lambda_2 q_1^\top q_2 = \lambda_1 q_1^\top q_2 \implies (\lambda_2 - \lambda_1) q_1^\top q_2 = 0\)
Dado que \(\lambda_1 \neq \lambda_2\), necesariamente \(q_1^\top q_2 = 0\). Por lo tanto, los autovectores son ortogonales.
9.4 Teorema Espectral para Matrices Simétricas
Sea \(S \in \mathcal{M}_{n \times n}: S = S^\top\), existe una base ortonormal de autovectores, lo que permite una diagonalización mediante una matriz ortogonal \(Q\):
\[S = Q \Lambda Q^\top = \sum_{i=1}^{n} \lambda_i q_i q_i^\top\]
9.5 Factorización Espectral
(Strang 2018 Lec 2 ’4)
La descomposición \(Q \Lambda Q^T\) es una variante específica de la diagonalización aplicada exclusivamente a matrices simétricas. Para una matriz cuadrada \(S \in \mathbb{R}^{n \times n}\) que es simétrica (es decir, \(S = S^T\)), el Teorema Espectral (Sección 9.4) establece que \(S\) es ortogonalmente diagonalizable. La expresión se define formalmente como:
\[S = Q \Lambda Q^T\]
9.6 Componentes de la Factorizacion
- La Matriz de Autovalores
- \(\Lambda\) es una matriz diagonal (todos los elementos fuera de la diagonal principal son nulos) que contiene los autovalores \(\lambda_1, \lambda_2, \dots, \lambda_n\) correspondientes a cada autovector en \(Q\).
\[\Lambda = \begin{pmatrix} \lambda_1 & 0 & \dots & 0 \\ 0 & \lambda_2 & \dots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & \lambda_n \end{pmatrix}\]
- La Matriz Ortogonal
- \(Q\) es una matriz ortogonal cuyas columnas son los autovectores de \(S\). Al ser ortogonal, cumple la propiedad \(Q^T = Q^{-1}\), lo que implica que \(Q Q^T = I\).
Las columnas de \(Q\) forman una base ortonormal del espacio euclídeo. Esto implica que cada columna tiene norma unitaria (\(\|q_i\| = 1\)) y es ortogonal a las demás (\(q_i \cdot q_j = 0\) para \(i \neq j\)). Geométricamente, \(Q\) opera como una isometría (rotación o reflexión).
9.7 Interpretación Geométrica
Si visualizamos la matriz \(A\) como una transformación lineal, la descomposición \(Q \Lambda Q^T\) desglosa la operación en tres etapas cinemáticas:
| \(Q^T\) | Realiza un cambio de base del vector de entrada al sistema de coordenadas definido por los autovectores (rota el espacio). |
| \(\Lambda\) | Aplica un escalamiento (dilatación o contracción) en cada una de estas nuevas direcciones según los valores \(\lambda_i\). Representa el factor de escala de la transformación lineal a lo largo de sus ejes principales. |
| \(Q\) | Devuelve el vector al sistema de coordenadas original mediante la rotación inversa. |
9.8 Interpretación como Suma de Rango 1
La identidad \(S = Q \Lambda Q^\top\) puede expandirse utilizando la multiplicación columna-fila como una suma de matrices de rango 1: \[S = \lambda_1 q_1 q_1^\top + \lambda_2 q_2 q_2^\top + \dots + \lambda_n q_n q_n^\top\]
Cada término \(\lambda_i q_i q_i^\top\) representa la proyección del espacio sobre la dirección del autovector \(q_i\), escalada por \(\lambda_i\). 1
En aplicaciones de ciencia de datos, esta expansión permite identificar las componentes que capturan la mayor varianza del sistema, descartando aquellas con autovalores despreciables.↩︎