9 Matrices Simétricas

Las matrices simétricas \(S\) se definen por la propiedad fundamental de ser iguales a su propia traspuesta. Gilbert Strang las describe como los “reyes del álgebra lineal” debido a que poseen propiedades matemáticas excepcionales que las hacen ideales para una vasta gama de aplicaciones en ciencia e ingeniería. Desde una perspectiva práctica, estas matrices son la base para el estudio de las formas cuadráticas y la optimización. En campos como el aprendizaje profundo y la ciencia de datos, se utilizan para representar funciones de pérdida que deben ser minimizadas, donde la naturaleza de la matriz (si es definida positiva) determina si el sistema tiene un mínimo global estable. Además, son esenciales en estadística para construir matrices de covarianza, las cuales describen la relación y varianza entre múltiples conjuntos de datos.

9.1 Definicion

Decimos que \(S \in \mathcal{M}_{n\times n} \) es Simétrica si \(S=S^⊤\)

9.2 Autovalores Reales

Sea \(S \in \mathbb{R}^{n \times n}\) una matriz simétrica. Sea \(\lambda\) un valor propio de \(S\) y \(x\) su vector propio asociado no nulo. Entonces:

Importante

Los autovalores de \(S\) son todos reales: \[\lambda_i \in \mathbb{R} \quad \forall i=1\dots n\]

Prueba

Aunque \(S\) es real, inicialmente permitimos que \(\lambda \in \mathbb{C}\) y \(x \in \mathbb{C}^n\).

Partimos de la ecuación fundamental: \(Sx = \lambda x\). Si tomamos el conjugado complejo, considerando que \(S\) es una matriz real (\(\overline{S} = S\)):

\(\overline{Sx} = \overline{\lambda x} \implies S\ \overline{x} = \overline{\lambda}\ \overline{x}\)

Ahora, aplicamos la transpuesta a esta ecuación conjugada

\((S\ \overline{x})^\top = (\overline{\lambda}\ \overline{x})^\top \implies \overline{x}^\top S^\top = \overline{\lambda}\ \overline{x}^\top\)

Dado que por hipótesis la matriz es simétrica (\(S^\top = S\)), la expresión queda: \(\overline{x}^\top S = \overline{\lambda}\ \overline{x}^\top\)

Multiplicamos la expresión resultante por el vector propio original \(x\) a la derecha

\((\overline{x}^\top S)\ x = (\overline{\lambda}\ \overline{x}^\top) x \implies \overline{x}^\top (Sx) = \overline{\lambda} (\overline{x}^\top x)\)

Sustituimos la definición original \(Sx = \lambda x\) en el lado izquierdo

\(\overline{x}^\top (\lambda\ x) = \overline{\lambda} (\overline{x}^\top x) \implies \lambda (\overline{x}^\top x) = \overline{\lambda} (\overline{x}^\top x)\)

La expresión \(\overline{x}^\top x\) representa el producto interno de \(x\) consigo mismo en \(\mathbb{C}^n\), lo cual equivale a la norma al cuadrado del vector: \(\overline{x}^\top x = \|x\|^2\). Como un vector propio \(x\) es, por definición, distinto del vector nulo (\(x \neq 0\)), entonces \(\|x\|^2 > 0\) y entonces podemos dividir ambos lados por esta cantidad. Finalmente obtenemos: \[\lambda = \overline{\lambda}\] En el cuerpo complejo, un número que es igual a su conjugado es, por definición, un número real.

9.3 Ortogonalidad de Autovectores

Sea \(S \in \mathbb{R}^{n\times n} \) una matriz simétrica. Sea \(\lambda\) un valor propio de \(S\) y \(x\) su vector propio asociado no nulo. Entonces:

Importante

Los autovectores correspondientes a autovalores distintos son ortogonales entre si:

\[ \begin{rcases} Sq_1 = \lambda_1 q_1 \\ Sq_2 = \lambda_2 q_2 \\ \lambda_1 \neq \lambda_2 \end{rcases} \implies q_1 \perp q_2 \]

Prueba

Sean \(q_1, q_2\) autovectores de \(S\) con \(\lambda_1 \neq \lambda_2\).

\(S q_1 = \lambda_1 q_1 \implies (S q_1)^\top = \lambda_1 q_1^\top \implies q_1^\top S = \lambda_1 q_1^\top\)

Multiplicando por \(q_2\) a la derecha:
\(q_1^\top S q_2 = \lambda_1 q_1^\top q_2\)

Sustituyendo \(S q_2 = \lambda_2 q_2\):
\(\lambda_2 q_1^\top q_2 = \lambda_1 q_1^\top q_2 \implies (\lambda_2 - \lambda_1) q_1^\top q_2 = 0\)

Dado que \(\lambda_1 \neq \lambda_2\), necesariamente \(q_1^\top q_2 = 0\). Por lo tanto, los autovectores son ortogonales.

Prueba Alternativa

Sea \(\lambda\) un valor propio de \(S\). El subespacio propio asociado es \(S_{\lambda}= \mathcal{N}(S-\lambda \mathbb{I} ) \) y sabemos que este subespacio es ortogonal a la imagen de \( (S-\lambda \mathbb{I} )^\top \).

Por lo tanto, \(S_{\lambda} \perp \text{Im}(S-\lambda \mathbb{I} )\). Veamos que \(\text{Im}(S-\lambda \mathbb{I} )\) contiene al resto de los autovectores de \(S\).

Supongamos que existe otro vector propio \(y \in \mathbb{R} ^m: Sy=\mu y\) con autovalor \(\mu \in \mathbb{R} , \mu\neq\lambda\).

Entonces \((S-\lambda \mathbb{I} )y=Sy-\lambda \mathbb{I} y = \mu y - \lambda y = (\mu-\lambda)y\).

Por lo tanto \(y \in \text{Im}(S-\lambda \mathbb{I} )\)

9.4 Teorema Espectral para Matrices Simétricas

Sea \(S \in \mathcal{M}_{n \times n}: S = S^\top \implies\) existe una base ortonormal de \( \mathbb{R} ^n\) formada por autovectores de \(S\). (Armentano 2026 clase 8)

Factorización Espectral

Para una matriz cuadrada \(S \in \mathbb{R}^{n \times n}\) que es simétrica (es decir, \(S = S^T\)), el Teorema Espectral (Sección 9.4) establece que existe una base ortonormal de autovectores. Esta base permite una diagonalización de \(S\) mediante una matriz ortogonal \(Q\). (Strang 2018 Lec 2 ’4)

\[S = Q \Lambda Q^\top = \sum_{i=1}^{n} \lambda_i q_i q_i^\top\] La descomposición \(Q \Lambda Q^T\) es una variante específica de la diagonalización aplicada exclusivamente a matrices simétricas.

Componentes de la Factorizacion

La Matriz de Autovalores: \(\Lambda\) es una matriz diagonal (todos los elementos fuera de la diagonal principal son nulos) que contiene los autovalores \(\lambda_1, \lambda_2, \dots, \lambda_n\) correspondientes a cada autovector en \(Q\).

\[\Lambda = \begin{pmatrix} \lambda_1 & 0 & \dots & 0 \\ 0 & \lambda_2 & \dots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & \lambda_n \end{pmatrix}\]

La Matriz Ortogonal: \(Q\) es una matriz ortogonal cuyas columnas son los autovectores de \(S\). Al ser ortogonal, cumple la propiedad \(Q^T = Q^{-1}\), lo que implica que \(Q Q^T = I\).

Las columnas de \(Q\) forman una base ortonormal del espacio euclídeo. Esto implica que cada columna tiene norma unitaria (\(\|q_i\| = 1\)) y es ortogonal a las demás (\(q_i \cdot q_j = 0\) para \(i \neq j\)). Geométricamente, \(Q\) opera como una isometría (rotación o reflexión).

Interpretación Geométrica

Si visualizamos la matriz \(A\) como una transformación lineal, la descomposición \(Q \Lambda Q^T\) desglosa la operación en tres etapas cinemáticas:

\(Q^T\)	Realiza un cambio de base del vector de entrada al sistema de coordenadas definido por los autovectores (rota el espacio).
\(\Lambda\)	Aplica un escalamiento (dilatación o contracción) en cada una de estas nuevas direcciones según los valores \(\lambda_i\). Representa el factor de escala de la transformación lineal a lo largo de sus ejes principales.
\(Q\)	Devuelve el vector al sistema de coordenadas original mediante la rotación inversa.

Interpretación como Suma de Rango 1

La identidad \(S = Q \Lambda Q^\top\) puede expandirse utilizando la multiplicación columna-fila como una suma de matrices de rango 1: \[S = \lambda_1 q_1 q_1^\top + \lambda_2 q_2 q_2^\top + \dots + \lambda_n q_n q_n^\top\]

Cada término \(\lambda_i q_i q_i^\top\) representa la proyección del espacio sobre la dirección del autovector \(q_i\), escalada por \(\lambda_i\). ¹

En aplicaciones de ciencia de datos, esta expansión permite identificar las componentes que capturan la mayor varianza del sistema, descartando aquellas con autovalores despreciables.↩︎