3 Productos Matriciales, Factorización CR

Este capítulo explora la dualidad en la interpretación de la multiplicación matriz-vector y la estructura fundamental de una matriz a través de sus columnas.

3.1 Multiplicación de Matrices por vector \(Ax\)

Sea \(A \in \mathcal{M}_{m \times n}\) una matriz que podemos denotar por sus filas como \(A_{i*}\), por sus columnas como \(A_{*j}\) o por sus entradas \(a_{ij}\). Sea \(x = (x_1, x_2, \dots, x_n)^\top \in \mathbb{R}^n\) un vector columna. Entonces, el producto \(Ax\) puede interpretarse de varias maneras (Strang 2018 Lec. 1).

Perspectiva de Filas

En esta interpretación, el resultado es un vector en \(\mathbb{R}^m\) donde cada componente es el producto interno (también llamado producto punto) entre una fila de la matriz \(A\) y el vector \(x\).

\[ \begin{bmatrix} - & A_{1*} & - \\ - & A_{2*} & - \\ & \vdots & \\ - & A_{m*} & - \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} = \begin{bmatrix} \sum_{j=1}^n a_{1j}x_j \\ \sum_{j=1}^n a_{2j}x_j \\ \vdots \\ \sum_{j=1}^n a_{mj}x_j \end{bmatrix} = \begin{bmatrix} \langle A_{1*} , x \rangle \\ \langle A_{2*} , x \rangle \\ \vdots \\ \langle A_{m*} , x \rangle \end{bmatrix} \]

Perspectiva de Columnas

Alternativamente, el producto \(Ax\) puede verse como una combinación lineal de las columnas de la matriz \(A\), donde los coeficientes son las componentes del vector \(x\):

\[ \begin{bmatrix} | & | & & | \\ A_{*1} & A_{*2} & \dots & A_{*n} \\ | & | & & | \\ \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} = x_1 A_{*1} + x_2 A_{*2} + \dots + x_n A_{*n} = \sum_{j=1}^n x_j A_{*j} \]

Nota

El vector resultante \(b = Ax\) reside necesariamente en el subespacio generado por las columnas de la matriz \(A\). De otra manera, el vector solución \(x\), muestra como expresar el termino independiente \(b\) como combinación lineal de las columnas de \(A\). Para algunos \(b\), esto es imposible porque no estan en el espacio generado por las columnas de \(A\).

La interpretación como combinacion lineal de las columnas de \(A\) es un pilar central del curso, ya que permite visualizar el producto como un movimiento dentro del subespacio generado por las columnas de la matriz.

Otra manera de visualizar el producto \(Ax\) en la perspectiva de columnas, es que, tomando un vector aleatorio \(x\) de \(\mathbb{R}^n\), obtenemos un vector en el espacio generado por las columnas de \(A\), \(C(A)\). A su vez, si pensamos en \(A\) como la matriz que representa a una cierta transformación lineal \(T: \mathbb{R}^n \to \mathbb{R}^m\), entonces \(C(A)\) corresponde al subespacio \(\text{Im}(T)\).

Es facil ver como consecuencia de lo anterior, que la dimension del espacio generado por \(A\) coincide con su rango. \(\dim C(A) = \dim \text{Im}(t) = \text{rango}(A)\)

Ejemplo
En este ejemplo, las primeras igualdades corresponden a la interpretacion usual en el cálculo, donde cada entrada de la matriz resultante es el producto punto entre las filas de la matriz \(A\) y el vector \(x\). La última igualdad, corresponde a la interpretacion de \(Ax\) como combinacion lineal de las columnas de \(A\). (Strang 2019, 1.1) \[ \begin{bmatrix} 2 & 3 \\ 2 & 4 \\ 3 & 7 \\ \end{bmatrix} . \begin{bmatrix} x_1 \\ x_2 \\ \end{bmatrix} = \begin{bmatrix} \langle A_{1*} , x \rangle \\ \langle A_{2*} , x \rangle \\ \langle A_{3*} , x \rangle \\ \end{bmatrix} = \begin{bmatrix} 2x_1+3x_2 \\ 2x_1+4x_2 \\ 3x_1+7x_2 \end{bmatrix} = x_1\begin{bmatrix}2 \\ 2 \\ 3\end{bmatrix} + x_2\begin{bmatrix}3 \\ 4 \\ 7\end{bmatrix} \]

3.2 Multiplicación de Matrices \(AB\)

La interpretación del producto \(Ax\) como una combinación lineal de columnas se extiende de manera natural al producto de dos matrices \(A \in \mathbb{R}^{m \times n}\) y \(B \in \mathbb{R}^{n \times p}\). Existen dos perspectivas fundamentales para descomponer esta operación.

Perspectiva de Columnas

Si denotamos las columnas de \(B\) como \(B_{*1}, B_{*2}, \dots, B_{*p}\), el producto \(AB\) puede visualizarse como una colección de productos matriz-vector: \[ AB = A \begin{bmatrix} | & | & & | \\ B_{*1} & B_{*2} & \dots & B_{*p} \\ | & | & & | \\ \end{bmatrix} = \begin{bmatrix} | & | & & | \\ AB_{*1} & AB_{*2} & \dots & AB_{*p} \\ | & | & & | \\ \end{bmatrix} \]

Bajo esta óptica, cada columna de \(AB\) es una combinación lineal de las columnas de \(A\), donde los coeficientes de la \(j\)-ésima combinación provienen de la \(j\)-ésima columna de \(B\).

Observación: Esto muestra que el espacio columna del producto está contenido en el espacio columna de la matriz de la izquierda: \(C(AB) \subseteq C(A)\).

Perspectiva de Suma de Productos Exteriores

Al multiplicar \(A \in \mathbb{R}^{m \times n}\) por \(B \in \mathbb{R}^{n \times p}\), cada columna \(k\) de \(A\) se encuentra exclusivamente con la fila \(k\) de \(B\).

\[\begin{align} AB &= \begin{bmatrix} | & | & & | \\ A_{*1} & A_{*2} & \cdots & A_{*n} \\ | & | & & | \end{bmatrix} \begin{bmatrix} - & B_{1*} & - \\ - & B_{2*} & - \\ & \vdots & \\ - & B_{n*} & - \end{bmatrix} \\ &= \begin{bmatrix} | \\ A_{*1} \\ | \end{bmatrix} \begin{bmatrix} - & B_{1*} & - \end{bmatrix} + \begin{bmatrix} | \\ A_{*2} \\ | \end{bmatrix} \begin{bmatrix} - & B_{2*} & - \end{bmatrix} + \cdots + \begin{bmatrix} | \\ A_{*n} \\ | \end{bmatrix} \begin{bmatrix} - & B_{n*} & - \end{bmatrix} \end{align}\]

El producto de la columna \(k\) de \(A\) (\(m \times 1\)) por la fila \(k\) de \(B\) (\(1 \times p\)) genera una matriz completa de tamaño \(m \times p\).

\[A_{*k} B_{k*} = \begin{bmatrix} A_{1k} \\ A_{2k} \\ \vdots \\ A_{mk} \end{bmatrix} \begin{bmatrix} B_{k1} & B_{k2} & \cdots & B_{kp} \end{bmatrix} = \begin{bmatrix} A_{1k}B_{k1} & A_{1k}B_{k2} & \cdots & A_{1k}B_{kp} \\ A_{2k}B_{k1} & A_{2k}B_{k2} & \cdots & A_{2k}B_{kp} \\ \vdots & \vdots & \ddots & \vdots \\ A_{mk}B_{k1} & A_{mk}B_{k2} & \cdots & A_{mk}B_{kp} \end{bmatrix}\]

Este producto, denominado producto exterior, produce una matriz donde todas las columnas son múltiplos de la columna \(A_{*k}\) y todas las filas son múltiplos de la fila \(B_{k*}\), lo que define una matriz de rango 1.

La matriz final \(AB\) es simplemente la suma de estos \(n\) bloques de construcción de rango 1 (Strang 2018 Lec. 1, ’7):

\[\begin{align} AB &= \sum_{k=1}^{n} A_{*k} B_{k*} \\ \\ &= A_{*1} B_{1*} + A_{*2} B_{2*} + \dots + A_{*n} B_{n*} \\ \\ &= \sum_{k=1}^{n} \begin{bmatrix} A_{1k}B_{k1} & A_{1k}B_{k2} & \cdots & A_{1k}B_{kp} \\ A_{2k}B_{k1} & A_{2k}B_{k2} & \cdots & A_{2k}B_{kp} \\ \vdots & \vdots & \ddots & \vdots \\ A_{mk}B_{k1} & A_{mk}B_{k2} & \cdots & A_{mk}B_{kp} \end{bmatrix} \end{align}\]

donde:

\(A_{*k}\) es la \(k\)-ésima columna de \(A\).
\(B_{k*}\) es la \(k\)-ésima fila de \(B\).

Cada término \(A_{*k} B_{k*}\) genera una matriz donde todas las columnas son múltiplos de \(A_{*k}\) y todas las filas son múltiplos de \(B_{k*}\).

Veamos por qué el elemento \((AB)_{ij}\) de la matriz resultante es idéntico en ambos métodos.

La entrada \((i,j)\) de la \(k\)-ésima matriz de la suma es exactamente \(A_{ik}B_{kj}\). Al sumarlas todas, recuperamos la fórmula estándar: \(\sum_{k=1}^{n} A_{ik} B_{kj}\) .

En el método de productos internos (filas por columnas), tenemos: \[(AB)_{ij} = \sum_{k=1}^{n} a_{ik} b_{kj}\] En la suma de productos exteriores, el elemento \((i,j)\) de la \(k\)-ésima matriz \(A_{*k} B_{k*}\) es precisamente \(a_{ik}b_{kj}\). Al sumar las \(n\) matrices, obtenemos exactamente la misma sumatoria para cada entrada de la matriz final. ¹

Nota

Desde el punto de vista computacional, multiplicar una matriz \(m \times n\) por una \(n \times p\) requiere \(mnp\) multiplicaciones, independientemente del orden o la perspectiva utilizada.

3.3 Teorema de Factorización \(A = CR\)

(Strang 2019, 1.1) Sea \(A \in \mathbb{R}^{m \times n}\) una matriz de rango \(r\). Existen una matriz \(C \in \mathbb{R}^{m \times r}\), y una matriz \(R \in \mathbb{R}^{r \times n}\) tales que: ² \[A = CR\]

La matriz \(C \in \mathbb{R}^{m \times r}\) se construye seleccionando las primeras \(r\) columnas linealmente independientes de \(A\).
La matriz \(R \in \mathbb{R}^{r \times n}\) contiene los coeficientes necesarios para reconstruir todas las columnas de \(A\) a partir de la base \(C\). Notablemente, \(R\) se encuentra a menudo en forma escalonada reducida (o contiene un bloque identidad \(I_r\)).

Ejemplo:

(Strang 2018 Lec. 1 ’20)

\[ A = \begin{pmatrix} 2 & 1 & 3 \\ 3 & 1 & 4 \\ 5 & 7 & 12 \end{pmatrix} = \begin{pmatrix} 2 & 1 \\ 3 & 1 \\ 5 & 7 \end{pmatrix} . \begin{pmatrix} 1 & 0 & 1 \\ 0 & 1 & 1 \end{pmatrix} \]

Observaciones:

Las columnas de \(C\) forman una base de \(C(A)\).
Las filas de \(R\) forman una base de \(C(A^\top)\).

3.4 Igualdad del Rango por Filas y Columnas

Un pilar del álgebra lineal es que \(\dim C(A) = \dim C(A^\top) = r\). La factorización \(A=CR\) ofrece una prueba constructiva:

Las columnas de \(C\) son una base de \(C(A)\) por construcción (\(\dim C(A)=r\)).
De la igualdad \(A = CR\), se observa que cada fila de \(A\) es una combinación lineal de las filas de \(R\) (los coeficientes de dicha combinación se encuentran en las filas de \(C\)). Como \(R\) tiene \(r\) filas independientes, el espacio fila tiene dimensión \(r\), igual a la dimensión del espacio de columnas.

Observar: (Strang 2018 Lec. 1 ’29)

Rango de columnas de \(A\) = # columnas de \(C\) = rango de filas de \(A\) = # filas de \(R\) = \(\text{rango}(A) = r\)
Obtenemos las columnas de \(A\) como combinaciones lineales de las columnas de \(C\), utilizando como coeficientes los elementos de las columnas correspondientes de \(R\).
Obtenemos las filas de \(A\) como combinaciones lineales de las filas de \(R\), utilizando como coeficientes los elementos de las filas correspondientes de \(C\).

Esta visión de sumar piezas de rango 1 es un pilar de las grandes factorizaciones del curso. La factorización \(LU\) resta sucesivamente matrices de rango 1 para eliminar entradas, y la factorización SVD y Descomposición Espectral, reconstruyen la matriz original sumando sus componentes más importantes de mayor a menor valor singular/autovalor.↩︎
Esta factorización permite la reducción de dimensionalidad. Si \(r \ll n\) y \(r \ll m\), la matriz puede almacenarse utilizando \(r(m + n)\) coeficientes en lugar de \(mn\). Esto es la base conceptual de técnicas de compresión y de aproximación de matrices de bajo rango en ciencia de datos.↩︎