Cálculo TRES

§ 10

Regla de la cadena

Lema

Aproximación lineal

Sea $U\ne \emptyset $ un abierto de $\mathbb{R}^n$, $p_0\in U$ y $F:U\to \mathbb{R}^m$ una función diferenciable en $p_0$. Sea \(D_{p_0}F\) la derivada de $F$ en $p_0$.

Demuestra que existe una función con valores vectoriales, definida en una bola centrada en $p_0$, $E:B_r(p_0) \to \mathbb{R}^m$ tal que

  1. para todo $p\in B_r(p_0)$, $F(p)=F(p_0)+D_{p_0}F(p-p_0)+E(p)$,
  2. $\lim_{p\to p_0}\frac{\| E(p)\|}{\| p-p_0 \|}=0$.

    Sugerencia: define $E(p)=F(p)-F(p_0)-D_{p_0}F(p-p_0)$ y prueba que el límite que se pide es cero.

La parte \(F(p_0)+D_{p_0}F(p-p_0)\) se llama la aproximación lineal de \(F\) en \(p_0\).

Al ser \(U\) abierto exsite un \(r>0\) tal que \(B_r(p_0)\subseteq U\). Para \(p\in B_r(p_0)\) definimos \(E(p)=F(p)-F(p_0)-D_{p_0}F(p-p_0)\). Es claro que para \(p\in B_r(p_0)\) se satisface \[ F(p)=F(p_0)+D_{p_0}F(p-p_0)+E(p) \] Además \[ \frac{\|E(p)\|}{\|p-p_0\|}=\frac{\|F(p)-F(p_0)-D_{p_0}F(p-p_0)\| \|}{\|p-p_0\|} \] por lo que \(\lim_{p\to p_0}\frac{\|E(p)\|}{\|p-p_0\|}=0\) se sigue de Definición 7.2 (también ver la Nota 7.3).

Teorema

Sean $U \subset \mathbb{R}^n$ y $V\subseteq \mathbb{R}^m$ subconjuntos abiertos y $G:V \to \mathbb{R}^n$, $F:U \to \mathbb{R}^k$ tal que $G(V)\subseteq U$ (para que $F\circ G$ esté bien definida). Supongamos que $q_0\in V$, $G$ es diferenciable en $q_0$ y $F$ es diferenciable en $G(q_0)$.

ComposicionFun

Entonces $F\circ G$ es diferenciable en $q_0$ y $$ D_{q_0}(F\circ G)=(D_{G(q_0)}F)(D_{q_0}G) $$ donde en la última igualdad se puede pensar como multiplicación de matrices o como composición de funciones lineales.

  1. Denota $p_0=G(q_0)$. Primero vamos a probar que existe una función continua \(K\) tal que \[ F(p)=F(p_0)+D_{p_0}F(p-p_0)+\|p-p_0\|K(p) \] para \(p\) cercano a \(p_0\) y con \(K(p_0)=0\).

    Ya que $F$ es diferenciable en $p_0$, \(F\) admite una aproximación lineal (Lema 13.1) y podemos escribir \[ F(p)=F(p_0)+D_{p_0}F(p-p_0)+E(p) \] para \(p\) cercano a \(p_0\) y donde la función \(E\) satisface \[ \lim_{p\to p_0} \frac{\|E(p)\|}{\|p-p_0\|}=0. \]

    Ahora definimos $$ K(p)=\left\{ \begin{array}{cc} \frac{E(p)}{\|p-p_0\|} & p\ne p_0 \\ 0 & p=p_0 \end{array} \right. $$ Es claro que \(K\) está definida para \(p\) cercano a \(p_0\) y es continua para todo \(p\ne p_0\). Además es continua en \(p_0\) pues \[ \lim_{p\to p_0}\|K(p)\|=\lim_{p\to p_0}\frac{\|E(p)\|}{\|p-p_0\|}=0=K(p_0). \] Finalmente de la definición de \(K\) y la aproximación lineal para \(F\) se sigue, para \( p\ne p_0\) \begin{eqnarray*} F(p)&=&F(p_0)+D_{p_0}F(p-p_0)+E(p)\\ &=&F(p_0)+D_{p_0}F(p-p_0)+\|p-p_0\|\frac{E(p)}{\|p-p_0\|}\\ &=&F(p_0)+D_{p_0}F(p-p_0)+\|p-p_0\|K(p) \end{eqnarray*}

    Si queremos visualizar la situación tenemos algo asi:

    AproxLineal

  2. Como segundo paso vamos a probar que para $q$ cercano a $q_0$: \begin{equation}\label{Eqn:ReglaCadena1} F(G(q))= F (G (q_0))+ (D_{p_0}F)( G(q)-G(q_0)) + \|G(q)-G(q_0)\| K(G(q)) \end{equation}

    Ya que \(G\) es continua en \(q_0\) (al ser diferenciable en \(q_0\)) si \(q\) está cercano a \(q_0\) entonces \(G(q)\) está cercano a \(G(q_0)=p_0\).

    ContinuidadG

    Por lo tanto podemos utilizar el inciso (1) para obtener (tomando \(p=G(q)\)) \[ F(G(q))= F (G (q_0))+ (D_{p_0}F)( G(q)-G(q_0)) + \|G(q)-G(q_0)\| K(G(q)) \]

  3. Como tercera parte, usando un argumento similar al del inciso (1), ahora usando que \(G\) es diferenciable en \(q_0\) se cumple que podemos escribir \begin{equation}\label{Eqn:ReglaCadena2} G(q)-G(q_0)=D_{q_0}G(q-q_0)+ \| q-q_0\|\tilde{K}(q) \end{equation} para \(q\) cercano a \(q_0\) donde $\tilde{K}$ es una función continua con $\tilde{K}(q_0)=0$.
  4. Ahora, substituyendo \eqref{Eqn:ReglaCadena2} en \eqref{Eqn:ReglaCadena1} tenemos que para \(q\) cercano a \(q_0\) se cumple \begin{eqnarray*} F(G(q))&= &F (G (q_0))+ (D_{p_0}F)(D_{q_0}G)(q-q_0)\\ &+& \|q-q_0\|(D_{p_0}F)(\tilde{K}(q)) + \|G(q)-G(q_0)\| K(G(q)) \end{eqnarray*} de lo cual se sigue que \begin{eqnarray*} F(G(q))-F(G(q_0))-(D_{p_0}F)(D_{q_0}G)(q-q_0)&=& \|q-q_0\|(D_{p_0}F)(\tilde{K}(q))\\ &+& \|G(q)-G(q_0)\| K(G(q)) \end{eqnarray*} por lo tanto, al tomar norma y dividir por \(\|q-q_0\|\) (para \(q\ne q_0\)) se sigue que \begin{eqnarray*} 0\leq \frac{\|F(G(q))-F(G(q_0))- (D_{p_0}F)(D_{q_0}G)(q-q_0) \|}{\|q-q_0 \|} &\leq & \| (D_{p_0}F)(\tilde{K}(q))\| \\ &+& \frac{\| G(q)-G(q_0)\|}{\|q-q_0\|}\| K(G(q))\| \end{eqnarray*} donde en la última desigualdad se uso la desigualdad del triángulo.

  5. Como penúltimo paso vamos a probar que los límites de las funciones que aparecen en el lado derecho de la desigualdad anterior son cero. Es decir \begin{eqnarray} \lim_{q \to q_0} \| (D_{p_0}F)(\tilde{K}(q))\|&=&0 \label{Eqn:AuxReglaCadenaLimite1}\\ \lim_{q \to q_0} \frac{\| G(q)-G(q_0)\|}{\|q-q_0\|}\| K(G(q))\|&=& 0 \label{Eqn:AuxReglaCadenaLimite2} \end{eqnarray}

    Prueba de \eqref{Eqn:AuxReglaCadenaLimite1}:

    La prueba de \eqref{Eqn:AuxReglaCadenaLimite1} es sencilla pues al ser \(D_{p_0}F\) una función lineal es continua por lo tanto \begin{eqnarray*} \lim_{q\to q_0} D_{p_0}(\tilde{K}(q))&=& D_{p_0}(\lim_{q\to q_0}\tilde{K}(q))\\ &=& D_{p_0}(\tilde{K}(q_0))\\ &=& D_{p_0}(0)\\ &=&0. \end{eqnarray*} por lo tanto el primer límite se sigue simplemente tomando normas en el límite anterior.

    Prueba de \eqref{Eqn:AuxReglaCadenaLimite2}:

    El segundo límite es un poco más complicado pero se sigue de la siguiente manera. Por \eqref{Eqn:ReglaCadena2} tenemos que para \(q\) cercano a \(q_0\) se cumple \[ G(q)-G(q_0)=D_{q_0}G(q-q_0)+ \| q-q_0\|\tilde{K}(q) \] por lo que al tomar norma y dividir por \(\|q-q_0\|\) (para \(q\ne q_0\)) se sigue que \begin{eqnarray*} \frac{\|G(q)-G(q_0)\|}{\|q-q_0\|}&=&\frac{\| D_{q_0}G(q-q_0)+ \|q-q_0\|\tilde{K}(p)\|}{\|q-q_0\|} \\ &\leq & \frac{\|D_{q_0}G(q-q_0)\|}{\|p-p_0\|}+\frac{\|q-q_0\|\|\tilde{K}(q)\|}{\|q-q_0\|} \\ &\leq & \frac{\|D_{q_0}G(q-q_0)\|}{\|p-p_0\|}+\|\tilde{K}(q)\| \end{eqnarray*} Ahora aplicamos el Ejercicio 3.41 para obtener \(\|D_{q_0}G(q-q_0)\|\leq \|D_{q_0}G\|_2\|p-p_0\|\) y al tomar esta cota en las desigualdades anteriores se sigue que \[ \frac{\|G(q)-G(q_0)\|}{\|q-q_0\|}\leq \|D_{q_0}G\|_2+\|\tilde{K}(q)\|. \] Para terminar el segundo límite, usando la desigualdad anterior llegamos a \[ 0\leq \frac{\| G(q)-G(q_0)\|}{\|q-q_0\|}\| K(G(q))\|\leq (\|D_{q_0}G\|_2+\|\tilde{K}(q)\|)\|K(G(q))\| \] ahora usando que \(G,K\) y \(\tilde{K}\) son continuas con \(K(G(q_0))=K(p_0)=0, \tilde{K}(q_0)=0\) se sigue de la ley del sándwich que \[ \lim_{q\to q_0} \frac{\| G(q)-G(q_0)\|}{\|q-q_0\|}\| K(G(q))\|=0. \]

  6. Finalmente, usando \begin{eqnarray*} 0\leq \frac{\|F(G(q))-F(G(q_0))- (D_{p_0}F)(D_{q_0}G)(q-q_0) \|}{\|q-q_0 \|} &\leq & \| (D_{p_0}F)(\tilde{K}(q))\| \\ &+& \frac{\| G(q)-G(q_0)\|}{\|q-q_0\|}\| K(G(q))\| \end{eqnarray*} y los límites \eqref{Eqn:AuxReglaCadenaLimite1} y \eqref{Eqn:AuxReglaCadenaLimite2} se sigue de la ley del sándwich que \[ \lim_{q\to q_0} \frac{\|F(G(q))-F(G(q_0))- (D_{p_0}F)(D_{q_0}G)(q-q_0) \|}{\|q-q_0 \|}=0 \] por lo que \(F\circ G\) es diferenciable en \(q_0\) y \(D_{q_0}F\circ G=(D_{p_0}F)(D_{q_0}G)\).

Nota

Aplicación práctica de la regla de la cadena

La regla de la cadena dice algo sencillo: la derivada de una composición es el producto de las derivadas. Esto es algo que ya se había visto en el caso de funciones de una variable, pero ahora se generaliza a funciones de varias variables.

En la práctica, la regla de la cadena se utiliza para calcular derivadas parciales de funciones que se definen como composiciones. Vamos a ver que la regla de la cadena nos dice que la derivada de una composición de funciones se puede pensar como la suma de todas las razones de cambio de la función con con respecto a todas las variables indeterminadas.

Por ejemplo si tenemos una función \(u\) de tres variables \(x,y,z\) y cada una de estas variables es a su vez función de otras tres variables \(r,s,t\), entonces podemos pensar \[ u=u(x,y,z)=u(x(r,s,t),y(r,s,t),z(r,s,t)) \]

El problema es encontrar las derivadas parciales de \(u\) con respecto a \(r,s,t\). Pero al variar \(r\) varian \(x,y,z\) y al variar \(x,y,z\) varia \(u\). La idea es que todas estas variaciones se van encadenando, por lo que \[ \frac{\partial u}{\partial r}=\frac{\partial u}{\partial x}\frac{\partial x}{\partial r}+\frac{\partial u}{\partial y}\frac{\partial y}{\partial r}+\frac{\partial u}{\partial z}\frac{\partial z}{\partial r}. \] Para recordar la fórmula nota que en el lado derecho aparecen las diferenciales de todas las variables originales de \(u\), en este caso \(x,y,z\), y que éstas diferenciales parece que se van cancelando con la diferencial de la variable que estamos tomando, en este caso \(r\), por ejemplo \(\frac{\partial u}{\partial x}\frac{\partial x}{\partial r}\) se puede pensar como \(\frac{\partial u}{\partial r}\) y así con los demás términos.

Vamos a usar la regla de la cadena para probar la fórmula anterior y otras similares.

Al pensar \(u\) como una función que depende de las variables \(r,s,t\) podemos escribir \(u\) como la composición de dos funciones, en concreto \(F:\mathbb{R}^3 \to \mathbb{R}^3\) dada por \(F(r,s,t)=(x(r,s,t),y(r,s,t),z(r,s,t))\) y \(G:\mathbb{R}^3 \to \mathbb{R}\) dada por \(G(x,y,z)=u(x,y,z)\). Entonces \(u=G\circ F:\mathbb{R}^3 \to \mathbb{R}\) y usando la regla de la cadena se tiene que \[ D_{(r,s,t)}u = D_{F(r,s,t)}G D_{(r,s,t)}F. \] Por separado tenemos \begin{eqnarray*} D_{(r,s,t)}u=[\partial_ru,\partial_su,\partial_tu],\\ D_{F(r,s,t)}G=[\partial_xu,\partial_yu,\partial_zu],\\ D_{(r,s,t)}F = \left[\begin{matrix} \partial_rx & \partial_sx & \partial_tx\\ \partial_ry & \partial_sy & \partial_ty\\ \partial_rz & \partial_sz & \partial_tz \end{matrix}\right]. \end{eqnarray*} Las matrices del lado derecho de la regla de la cadena se ven como: \begin{eqnarray*} [\partial_xu,\partial_yu,\partial_zu]\left[\begin{matrix} \partial_rx & \partial_ry & \partial_rz\\ \partial_sx & \partial_sy & \partial_sz\\ \partial_tx & \partial_ty & \partial_tz \end{matrix}\right] \end{eqnarray*} La primera entrada de la multiplicación anterior es \[ \partial_xu\partial_rx + \partial_yu\partial_ry + \partial_zu\partial_rz \] e igualando a la primera entrada de \(D_{(r,s,t)}u\) se obtiene: \[ \partial_ru = \partial_xu\partial_rx + \partial_yu\partial_ry + \partial_zu\partial_rz \] y escribiendo lo anterior con toda la notación de derivadas parciales se obtiene: \[ \frac{\partial u}{\partial r}=\frac{\partial u}{\partial x}\frac{\partial x}{\partial r}+\frac{\partial u}{\partial y}\frac{\partial y}{\partial r}+\frac{\partial u}{\partial z}\frac{\partial z}{\partial r}. \]

Ejercicio

Este ejercicio es una especie de recíproco del Lema 10.1.

Sea $U\ne \emptyset $ un abierto de $\mathbb{R}^n$, $p_0\in U$ y $F:U\to \mathbb{R}^m$ una función.

Supongamos que existe una bola abierta $B_r(p_0)\subseteq U$, una función $\tilde{E}:B_r(p_0) \to \mathbb{R}^m$ y una función lineal $L:\mathbb{R}^n \to \mathbb{R}^m$ que satisfacen

  1. para $p\in B_r(p_0)$, $F(p)=F(p_0)+L(p-p_0)+\tilde{E}(p)$
  2. $$ \lim_{p \to p_0} \frac{\|\tilde{E}(p)\|}{\|p-p_0\|}=0 $$
Entonces $F$ es diferenciable en $p_0$ y \(L\) es la derivada de \(F\) en \(p_0\).

Ejercicio

Considera las funciones $G: \mathbb{R}^3 \to \mathbb{R}^2$, $F:\mathbb{R}^2 \to \mathbb{R}^2$ dadas por \begin{eqnarray*} G(x,y,z)&=&(g_1(x,y,z),g_2(x,y,z)), \\ F(u,v)&=&(f_1(u,v), f_2(u,v) ) \end{eqnarray*} donde \begin{eqnarray*} g_1(x,y,z)&=&xy,\\ g_2(x,y,z)&=&yz, \\ f_1(u,v)&=&u^2-v^2,\\ f_2(u,v)&=&u+v. \end{eqnarray*} Define $H:\mathbb{R}^3 \to \mathbb{R}^2$ por $H(x,y,z)=F(G(x,y,z))$.

  1. Escribe las funciones coordenadas de $H$ como $$H(x,y,z)=(h_1(x,y,z), h_2(x,y,z))$$ Calculando directamente la composición, encuentra las fórmulas para $h_1$ y $h_2$.
  2. Usando la regla de la cadena calcula las parciales $\partial_x h_i,\partial_y h_i, \partial_z h_i$, $i=1,2$.
  3. Verifica que las fórmulas que se obtienen en el inciso (2) son iguales a las que se obtienen al calcular directamente las parciales de $h_1$ y $h_2$ usando las fórmulas del inciso (1).

Ejercicio

Considera las funciones $F:\mathbb{R}^3\to \mathbb{R}^2$ y $G:\mathbb{R}^3\to \mathbb{R}^3$ dadas por $$ F(x,y,z)=(x^2+y+z, 2x+y+z^2), \quad G(u,v,w)=(2uv^2w^2,w^2\sen(v),u^2e^v) $$

  1. Encuentra la matriz de derivadas parciales $D_{(x,y,z)}F$ y $D_{(u,v,w)}G$.
  2. Define $H=F\circ G$. Usa la regla de la cadena para calcular la matriz derivada parciales $D_{(u,0,w)}H$.

  1. Las matrices de derivadas parciales se obtienen colocando en la i-ésima fila el gradiente de la i-ésima función coordenada. De esta forma \begin{align*} D_{(x,y,z)}F =& \begin{pmatrix} 2x & 1 & 1\\ 2 & 1 & 2z \end{pmatrix},\\ D_{(u,v,w)}G =& \begin{pmatrix} 2v^2w^2 & 4uvw^2 & 4uv^2w\\ 0 & w^2\cos(v) & 2w\sen(v)\\ 2ue^v & u^2e^v & 0 \end{pmatrix}, \end{align*}
  2. Primero calculamos $G(u,0,w) = (0,0,u^2)$. Por la regla de la cadena $D_{(u,0,w)}H = D_{G(u,0,w)}F D_{(u,0,w)}G$, evaluamos cada una de las matrices en el punto dado para obtener \begin{align*} D_{(u,0,w)}G =& \begin{pmatrix} 0 & 0 & 0\\ 0 & w^2 & 0\\ 2u & u^2 & 0 \end{pmatrix}, D_{G(u,0,w)}F =& \begin{pmatrix} 0 & 1 & 1\\ 2 & 1 & 2u^2 \end{pmatrix}, \end{align*} al multiplicar estas matrices se deduce que \begin{equation*} D_{(u,0,w)}H = \begin{pmatrix} 0 & 1 & 1\\ 2 & 1 & 2u^2 \end{pmatrix} \begin{pmatrix} 0 & 0 & 0\\ 0 & w^2 & 0\\ 2u & u^2 & 0 \end{pmatrix} = \begin{pmatrix} 2u & w^2 + u^2 & 0\\ 4u^3 & w^2+2u^4 & 0 \end{pmatrix}. \end{equation*}

Ejercicio

Considera la función $G:\mathbb{R}^2 \to \mathbb{R}^2$ dada por $$ G(x,y)=(x+y,2x-y ) $$

  1. Encuentra una función lineal, $f:\mathbb{R}^2 \to \mathbb{R}$ tal que, si $h=f\circ G$, entonces $$ \partial_x h(x,y)=2, \quad \partial_y h(x,y)=1 $$
  2. Encuentra una función clase $C^1$, $f:\mathbb{R}^2 \to \mathbb{R}$ tal que, si $h=f\circ G$, entonces $$ \partial_x h(x,y)=2x+y, \quad \partial_y h(x,y)=x-y $$

Ejercicio

  1. Considera la función $I:\mathbb{R}^3\to \mathbb{R}^3$ dada por $I(x,y,z)=(x,y,z)$. Demuestra que $$ D_{(x,y,z)}I=\left[ \begin{array}{ccc} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{array} \right] $$
  2. Encuentra todas las funciones diferenciables en $\mathbb{R}^3$, $F:\mathbb{R}^3 \to \mathbb{R}^3$, para las cuales $$ D_{(x,y,z)}F=\left[ \begin{array}{ccc} x & 0 & 0 \\ 0 & y & 0 \\ 0 & 0 & x \end{array} \right] $$
  3. Sean $p,q,r:\mathbb{R}\to \mathbb{R}$ funciones continuas en todo $\mathbb{R}$. Encuentra todas la funciones diferenciables, $G:\mathbb{R}^3 \to \mathbb{R}^3$, para las cuales $$ D_{(x,y,z)}G=\left[ \begin{array}{ccc} p(x) & 0 & 0 \\ 0 & q(y) & 0 \\ 0 & 0 & r(z) \end{array} \right] $$

Ejercicio

Sean $G:\mathbb{R}^m \to \mathbb{R}^n$, una función de clase $C^1$ en $\mathbb{R}^m$, con funciones coordenadas $G(q)=(g_1(q),\dots, g_n(q))$ y sea $f:\mathbb{R}^n \to \mathbb{R}$ una función de clase $C^1$ en $\mathbb{R}^n$ y sea $h=f\circ G$. Usa la regla de la cadena para demostrar que el gradiente de $h$ es una combinación lineal de los gradientes de las $g_k$, en específico: $$ \nabla_{q_0} h= \sum_{k=1}^n \partial_{p_k}f(G(q_0)) \nabla_{q_0}g_k $$ nota que $\partial_{p_k}f(g(q_0))$ es escalar y $\nabla_{q_0}g_k$ es vector.