Cálculo TRES

§ 11

Gradiente y derivada direccional

Definición

Sea $U\ne \emptyset$ un abierto de $\mathbb{R}^n$ y $f:U\to \mathbb{R}$.

Dado un vector $u\ne 0$, la derivada direccional, a lo largo de $u$, de $f$ en el punto $p$ se define como $$ \lim_{h \to 0} \frac{f(p+hu)-f(p)}{h} $$ Se denota $\partial_uf(p)$. La fórmula para calcularlo es $$ \partial_uf(p)= \langle \nabla_pf, u \rangle $$ la cual se demuestra más adelante.

Notas.

  1. La idea es que la derivada direccional \(\partial_uf(p)\) está midiendo la razón de cambio de la función \(f\) cuando estamos parados en \(p\) y nos empezamos a mover en la dirección \(u\).
  2. Imagina que estás parado en el punto \(p\) y dibujas un círculo de radio \(1\) centrado en \(p\). En problema es encontrar el vector \(u\), sobre el círculo, para la cual \(\partial_uf(p)\) sea: máximo, mínimo, cero. EL \(u\) para el cual es máximo nos da la dirección para la cual la función crece más rápido, el que da el mínimo es donde la función decrece más rápido y donde da cero es donde la función no varia (ó existe un punto crítico, los cuales veremos más adelante).

Proposición

Sea $U\ne \emptyset$ un subconjunto abierto de $\mathbb{R}^n$ y $f:U\to \mathbb{R}$ una función diferenciable en $p_0\in U$.

Para todo \(u=(u_1,\dots, u_n)\in \mathbb{R}^n\) se tiene que \[ \partial_uf(p_0)=\sum_{i=1}^n \partial_{x_i}f(p_0)u_i. \]

Sea $r>0$ tal que $B_r(p_0)\subseteq U$. Nota que para todo vector $v$ con $\|v\|< r$, $p_0+v \in U$. .Fija $u\ne 0$. Nota que si \(h\) es pequeño (específicamente \(|h|< r/\|u\| \)) \(p_0+ hu \in U\) y \(f(p_0+hu)\) tiene sentido.

Ya que \(f\) es diferenciable en \(p_0\) podemos tomar la aproximación lineal de \(f\) alrededor de \(p_0\): \begin{equation}\label{Eqn:Aux1DerDireccional} f(p)=f(p_0)+\langle \nabla_{p_0}f, p-p_0 \rangle + E(p) \end{equation} donde \(p\in B_r(p_0)\) y \(\lim_{p\to p_0}\frac{E(p)}{\|p-p_0\|}=0\).

Aplicando la aproximación lineal anterior con los puntos de la forma \(p=p_0+tu\) obtenemos \begin{equation}\label{Eqn:Aux2DerDireccional} f(p_0+tu)= f(p_0)+ \langle \nabla_{p_0}f, tu \rangle + E(p_0+tu) \end{equation} donde tenemos que \[ \lim_{t\to 0}\frac{|E(p_0+tu)|}{|t|}=0 \] el cual se obtiene del límite \(\lim_{p\to p_0}\frac{E(p)}{\|p-p_0\|}=0\) a lo largo de la curva \(p_0+tu\).

De la ecuación \eqref{Eqn:Aux2DerDireccional} obtenemos \[ \frac{f(p_0+tu)-f(p_0)}{t}=\langle \nabla_{p_0}f, u \rangle + \frac{E(p_0+ut)}{t} \] tomando límite llegamos a $$ \partial_uf(p_0)=\lim_{t\to 0} \frac{f(p_0+tu)-f(p_0)}{t}=\langle \nabla_{p_0}f, u \rangle $$

Ejercicio

Para las funciones dadas, calcula: $\nabla_{(x,y)}f$; $\langle \nabla_{(x,y)} f, u \rangle$; $\partial_{u}f(p)$.

  1. $f(x,y)=x^2-y^2$, $u=(\sqrt{3}/2,1/2)$, $p=(1,0)$.
  2. $f(x,y)=e^x\cos(y)$, $u=(0,1)$, $p=(0,\pi/2)$.
  3. $f(x,y)=y^{10}$, $u=(0,-1)$, $p=(1,-1)$.
  4. $f(x,y)=$ distancia de $(x,y)$ a $(0,3)$, $u=(1,0)$, $p=(1,1)$.

Comenzamos por calcular las derivadas parciales de $f$: \begin{equation*} \partial_x f = 2x, \quad \partial_y f= -2y \end{equation*} por lo tanto $\nabla_{(x,y)}f = (2x,-2y)$.

Ahora, \begin{equation*} \langle \nabla_{(x,y)},u \rangle = \langle (2x,-2y), (\sqrt{3}/2,1/2) \rangle = \sqrt 3 x - y. \end{equation*} De esta manera \begin{equation*} \partial_u f(p) = \langle \nabla_p f, u \rangle = \sqrt{3} \cdot 1 - 0 = \sqrt 3. \end{equation*}

Se realiza el mismo proceso que en el inciso anterior, al calcular las derivadas parciales se obtiene \begin{equation*} \partial_x f = 0, \quad \partial_y f = 10y^9; \quad \nabla_{(x,y)}f = (0,10y^9). \end{equation*} De aquí \begin{equation*} \langle \nabla_{(x,y)}f,u \rangle = \langle (0,10y^9) , (0,-1) \rangle = -10y^9, \end{equation*} finalmente al trabajar en el punto $p=(1,-1)$ \begin{equation*} \partial_u f(p) = \langle \nabla_{p}f , u \rangle = -10(-1)^9 = 10. \end{equation*}

Ejercicio

Para $f(x,y)=3x^2+2y^2$, encuentra la dirección (vector unitario) en la cual la gráfica de la función está:

  1. más inclinada,
  2. en la cual se mantiene nivelada,
si estes parade en el punto $(1,2)$.

Primera parte.

Un vector unitario arbitrario \(u\), se puede escribir como \(u(\theta)=(\cos(\theta), \sen(\theta))\), con \(\theta\in [0,2\pi)\). La primera parte del problema pide encontrar \(\theta^*\) tal que \[ \partial_{u(\theta)}f(1,2)\leq \partial_{u(\theta^*)}f(1,2) \] para cualquer \(\theta\).

Calculando directamente obtenemos \begin{eqnarray*} \partial_{u(\theta)}f(1,2)&=& \partial_xf(1,2)\cos(\theta)+\partial_yf(1,2)\sen(\theta)\\ &=& (6(1))\cos(\theta)+(4(2))\sen(\theta)\\ &=&6\cos(\theta)+8\sen(\theta) \end{eqnarray*} Por lo tanto, tenemos que maximizar \[ \max_{\theta \in [0,2\pi]}\{ 6\cos(\theta)+8\sen(\theta) \} \] Para lo cual definimos \(h(\theta)=6\cos(\theta)+8\sen(\theta)\) y usamos cálculo 1 para maximizar. Tenemos \begin{eqnarray*} h'(\theta)=-6\sen(\theta)+8\cos(\theta) \\ h'(\theta)=0 \Leftrightarrow \frac{4}{3}=\frac{8}{6}=\tan(\theta) \end{eqnarray*} Por lo que \(\theta^*=\arctan(4/3)\) es un punto crítico para \(h\).

InterseccionYZ

Para saber si en \(\theta^*\) se alcanza máximo o mínimo o punto de inflexión usamos el criterio de la segunda derivada: \begin{eqnarray*} h''(\arctan(4/3))&=& -6\cos(\theta^*)-8\sen(\theta^*)\\ &=& -6 \frac{3}{5}-8\frac{4}{5}\\ &=& -\frac{18+32}{5}\\ &=& -10< 0 \end{eqnarray*}

Por lo tanto, si estamos en el punto \((1,2)\), en la dirección \[u=(\cos(\theta^*),\sen(\theta^*))=(\frac{3}{5}, \frac{4}{5})\] la función crece más rápido y por lo tanto la gráfica está más inclinada.

Segunda parte.

Para la segunda parte debemos de encontar un \(\theta_0\in [0,2\pi)\) tal que \[ 0=\partial_{u(\theta_0)}f(1,2)=6\cos(\theta_0)+8\sen(\theta_0) \] lo cual es equivalente a \(\arctan(\theta_0)=-\frac{3}{4}\).

Por lo tanto la dirección donde la gráfica permanece nivelada es \[ u=(\cos(\theta_0), \sen(\theta_0))=(-\frac{4}{5}, \frac{3}{5}). \]

Observación: los vectores que se obtienen en la primera y segunda parte son ortogonales.

Ejercicio

¿ Cual es el gradiente de una función de una variable? ¿ Cuál son las dos posibles direcciones de $u$ (unitario ) al calcular la derivada direccional de $f$ a lo largo de $u$ ?

Proposición

Sea \(U\subseteq \mathbb{R}^n\) un abierto y \(f:U\to \mathbb{R}\). Si \(f\) es diferenciable en \(p_0\) y \(\nabla_{p_0}f\ne 0\) entonces \(f\) crece más rápidamente en la dirección de \(\frac{1}{\|\nabla_{p_0}f\|}\nabla_{p_0}f\).

Es decir \[ \max_{\|u\|=1}\{ \partial_u f(p_0) \}=\partial_{u^*}f(p_0) \] donde \(u^*=\frac{1}{\|\nabla_{p_0}f\|}\nabla_{p_0}f\).

De manera similar también se tiene que \[ \min_{\|u\|=1}\{ \partial_u f(p_0) \}=\partial_{u_*}f(p_0) \] donde \(u_*=-\frac{1}{\|\nabla_{p_0}f\|}\nabla_{p_0}f\).

Por la Proposición 11.2 tenemos \[ \partial_uf(p_0)=\langle \nabla_{p_0}f, u\rangle \] por Cauchy-Schwartz \[ \langle \nabla_{p_0}f, u\rangle= \|\nabla_{p_0}f\| \|u\| \cos(\alpha)=\|\nabla_{p_0}f\| \cos(\alpha) \] donde \(\alpha\) es el ángulo entre \(\nabla_{p_0}f\) y \(u\). Ya que \(|\cos(t)|\leq 1\) para todo \(1\) vemos que el máximo se alcanza cuando \(\cos(\alpha)=1\), es decir cuando \(\alpha =0\). Por lo tanto el máximo se alcanza cuando \(u\) apunta en la misma dirección de \(\nabla_{p_0}f\) y ya que \(\|u\|=1\) concluimos que el máximos se alcanza en \(u^*=\frac{1}{\|\nabla_{p_0}f\|}\nabla_{p_0}f\).

Para el mínimo tenemos que se alcanza cuando \(\cos(\alpha)=-1\), es decir cuando \(\alpha=\pi\). Por lo tanto se alcanza cuando \(u\) y \(\nabla_{p_0}f\) tiene direcciones opuestas, es decir el mínimo se alcanza en \(u_*=-\frac{1}{\|\nabla_{p_0}f\|}\nabla_{p_0}f\)

Ejercicio

Sea \(U\subseteq \mathbb{R}^2\) abierto y \(f:U\to \mathbb{R}\) una función diferenciable en \(p_0\in U\). Sean \(u^*,u_0\) vectores unitarios para los cuales, si estamos sobre \(p_0\), \(f\) crece más rapidamente en la dirección \(u^*\) y \(f\) es constante en la dirección \(u_0\).

Si \(\nabla_{p_0}f\ne 0\), prueba que \(\langle u^*, u_0\rangle =0\).

En términos de derivadas direccionales lo anterior se puede escribir como \begin{eqnarray*} \max_{\|u\|=1}\{\partial_uf(p_0) \}&=&\partial_{u^*}f(p_0)\\ \partial_{u_0}f(p_0)&=&0. \end{eqnarray*}

Por la Proposición tenemos que \(u^*=\frac{1}{\|\nabla_{p_0}f\|}\nabla_{p_0}f\).

Usando la fórmula de la Proposición \(\partial_{u_0}f(p_0)=0\) se puede escribir como \[ 0=\langle \nabla_{p_0} f, u_0 \rangle \] Se sigue que \(\langle u^*, u_0\rangle =0\).

Ejercicio

Encuentra la dirección $u$ ( $\|u\|=1$) para la cual al moverse en la dirección de \(u\):

  1. $f$ crece más rápidamente si estás parado en $(1,2)$.
  2. \(f\) permance constante si estás parado en \((1,2)\).
  1. $f(x,y)=e^{x-y}$,
  2. $f(x,y)=\sqrt{5-x^2-y^2}$,
  3. $f(x,y)=ax+by$.

Ejercicio

Asume que \(U\subseteq \mathbb{R}^2\) es un abierto, $f,g:U\to \mathbb{R}$ son funciones lineales, tal que $\nabla_{p_0} f$ es perpendicular a $(3,2)$ con su longitud igual a 1 y $\nabla_{p_0}g$ es paralelo a $(3,2)$ con su longitud igual a $5$. Encuentra $\nabla_{p_0}f$, $\nabla_{p_0}g$, $f$ y $g$.

Ejercicio

Si $f(0,1)=0, f(1,0)=1$ y $f(2,1)=2$, encuentra $\nabla_{(x,y)}f$ suponiendo que $f(x,y)=Ax+By+C$.

El conocer la forma que toma la función así como sus valores en tres puntos distintos nos dan un sistema linenal en las variables $A,B,C$, \begin{align*} A \cdot 0 + B + C =& 0,\\ A + B \cdot 0 + C =& 1,\\ A \cdot 2 + B + C =& 2 \end{align*} Si al tercer renglón se le resta 2 veces el segundo renglón y una vez el primer renglón entonces se obtiene el sistema equivalente \begin{align*} B + C =& 0,\\ A + C =& 1,\\ -2C =& 0. \end{align*} De aquí deducimos que $C=0=B$ y $A=1$, por lo que la función $f$ está dada por $f(x,y) = x$. Ahora calculamos sus derivadas parciales \begin{equation*} \partial_x f =1, \quad \partial_y f = 0; \quad \nabla_{(x,y)} f = (1,0). \end{equation*}

Ejercicio

¿ Qué funciones tienen los siguientes gradientes?

  1. $(2x+y,x)$,
  2. $(e^{x-y},-e^{x-y})$,
  3. $(y,-x)$.
  4. \((\frac{x}{x^2+y^2+z^2},\frac{y}{y^2+x^2+z^2}, \frac{z}{x^2+y^2+z^2} )\).

Supongamos que existe una función $f$ cuyo gradiente es $(2x+y,x)$, es decir \begin{equation*} \partial_x f = 2x + y, \quad \partial_y f = x. \end{equation*} Integramos respecto a la variable $x$ y tenemos que \begin{equation*} f(x,y) = x^2 + xy + g(y), \end{equation*} donde, como la notación lo indica, $g$ es una función que depende únicamente de la variable $y$ y es constante respecto a la variable $x$. Si se calcula ahora la derivada parcial respecto a $y$ y utilizamos nuestra hipótesis se tiene que \begin{equation*} x = \partial_y f = x + g'(y), \end{equation*} es decir, $g'(y)'=0$ lo cual significa que es una función constante. Con ello concluimos que dicho gradiente le corresponde a la familia de funciones de la forma $f(x,y) = x^2 + xy + c, \quad c \in \mathbb{R}$.

Se afirma que no existe ninguna función $f$ con gradiente $(y,-x)$. Veremos dos formas de mostrar ésto:

Idea 1. Aplicaremos el mismo procedimiento que en el inciso anterior. De existir tal función entonces $\partial_x f = y$ por lo que $f(x,y) = xy + g(y)$. Al calcular la derivada parcial respecto a $y$ e igualar con la expresión propuesta se tiene que $-x = x + g'(y)$ o equivalentemente $-2x = g'(y)$ lo cual es absurdo, pues la función $g$ es independiente de la variable $x$. Adicionalmente, si integramos respecto a la variable $y$ entonces $g(y) = -2xy + c$ y $f(x,y) = -xy$, pero $\partial_x -xy = -y \neq y$, lo cual es una contradicción.

Idea 2. Veamos que si $f$ tiene el gradiente propuesto entonces es de clase $C^2$, \begin{align*} \partial_{x^2}^2 f =& 0,\\ \partial_{y^2}^2 f =& 0,\\ \partial_{xy}^2 f =& -1,\\ \partial_{yx}^2 f =& 1. \end{align*} Se sabe que si una función es de clase $C^2$ entonces sus derivadas parciales mixtas de orden 2 son iguales y en este caso no es así, lo cual es una contradicción.

Ejercicio

Una función $f:\mathbb{R}^n \to \mathbb{R}$ se llama par si $f(-p)=f(p)$, para toda $p\in \mathbb{R}^n$.

  1. Sea $f:\mathbb{R} \to \mathbb{R}$ una función par, de una variable y diferenciable en el origen. Demuestra que $f'(0)=0$.
  2. Sea $f:\mathbb{R}^n \to \mathbb{R}$ una función par, diferenciable en el origen. Demuestra que $\nabla_{0}f=0$.

    Sugerencia: usa el inciso anterior.

  3. Sea $g:\mathbb{R}^2\to \mathbb{R}$ una función diferenciable en el origen. Supón que existen dos vectores ortonormales (es decir, unitarios y ortogonales)$u$,$v$, tales que \begin{eqnarray*} g(tu)=g(-tu), \quad g(tv)=g(-tv),\quad \forall t\in \mathbb{R}. \end{eqnarray*} Demuestra que $\nabla_{(0,0)}g=0$.

    Sugerencia: comienza probando que $\partial_ug(0,0)=0$ y $\partial_{v}g(0,0)=0$.

  1. Si $f(p) = f(-p)$ para toda $p$ entonces sus cocientes diferenciales en $p=0$ deben ser iguales \begin{align*} \frac{f(t) - f(0)}{t-0} =& \frac{f(-t) - f(0)}{t - 0},\\ =& \frac{f(t) - f(0)}{-t},\\ =& - \frac{f(t) - f(0)}{t}, \end{align*} al tomar el límite cuando $t \to 0$ de ambos lados se tiene que $f'(0) = - f'(0)$ y claramente $f'(0) = 0$.
  2. Para el i-ésimo vector canónico definimos $g(t) = f(te_i)$ por lo que el cociente diferencial correspondiente a la derivada parcial de $f$ respecto a la i-ésima variable en $0$ es \begin{align*} \frac{f(0 + te_i) - f(0)}{t} = \frac{g(t) - g(0)}{t}. \end{align*} Como $f$ es par, entonces $g(t) = f(te_i) = f(-te_i) = g(-t)$ para toda $t$, asímismo, dado que $f$ es diferenciable en $0$ entonces sus derivadas parciales en $0$ existen y $g$ es diferenciable en $0$. Finalmente, dado que $g$ es par entonces por el primer inciso $\partial_{x_i}f(0) = g'(0) = 0$. Si se repite el mismo argumento con cada una de las variables se concluye que $\nabla_{0}f = 0$.
  3. Realizaremos un proceso similar a los incisos anteriores para demostrar que $\partial_u g(0,0) = \partial_v g(0,0) = 0$ y con ello que el gradiente también se anula.

    Comenzamos por definir funciones $h_1,h_2:\mathbb{R} \to \mathbb{R}$ como $h_1(t) = g(tu)$ y $h_2(t) = g(tv)$. Como se vió en el inciso anterior, al definir $h_1$ y $h_2$ de esta manera se tiene que éstas son funciones pares y son diferenciables en $0$ pues las derivadas direccionales en $0$ en las direcciones $u$ y $v$ existen y \begin{equation*} \frac{g(tu) - g(0,0)}{t} = \frac{h_1(t)-h_1(0)}{0}; \quad \frac{g(tv)-g(0,0)}{t} = \frac{h_2(t)-h_2(0)}{t}, \end{equation*} es decir, $h_1'(0)=0=h_2'(0)$. Escrito de otra forma $\partial_u g(0,0) = 0 = \partial_v g(0,0)$.

    Como $u,v$ son ortonormales entonces son una base para $\mathbb{R}^2$, en particular sabemos que existen escalares $a_x,b_x,a_y,b_y \in \mathbb{R}$ tales que $e_1 = a_x u + b_x v$ y $e_2 = a_y u + b_y v$. Las derivadas direccionales en la dirección de $e_1$ y $e_2$ no son más que las derivades parciales respecto a $x$ y $y$ por lo que \begin{align*} \partial_x g (0,0) =& \partial_{e_1} g (0,0),\\ =& \langle \nabla_{(0,0)} g , e_1 \rangle,\\ =& \langle \nabla_{(0,0)} g , a_x u + b_x v \rangle,\\ =& a_x \langle \nabla_{(0,0)} g , u \rangle + b_x \langle \nabla_{(0,0)} g, v \rangle,\\ =& a_x \partial_u g(0,0) + b_x \partial_v g(0,0),\\ =& 0. \end{align*} De manera análoga $\partial_y g(0,0) = a_y \partial_u g(0,0) + b_y \partial_v g(0,0) = 0$ y se concluye que $\nabla_{(0,0)}g = 0$.

Ejercicio

Considera la función \(f(x,y)=3x^2+2y^2\). Encuentra la curva \(\gamma(t)\), en el plano \(xy\), para la cual \(f(\gamma(t))\) crece a la razón más rápida y que al tiempo \(t=0\) pasa por \((1,2)\). Es decir, existe un \(\lambda >0 \) tal que, para toda \(t\) \begin{equation}\label{Eqn:AuxCurvasMayorCrecimiento} \lambda \nabla_{\gamma(t)}f =\gamma'(t) \end{equation} La razón de la ecuación anterior es: \(\gamma'(t)\) representa el vector tangente a la curva en \(\gamma(t)\) y \(\nabla_{p}f\) es el vector que apunto en la dirección donde \(f\) crece más rapidamente (Proposición 11.6). Por lo tanto \(\gamma'(t)\) debe de apuntar en la dirección donde \(f\) crece más rápidamente.

Tenemos que \(\nabla_{(x,y)}f=(6x,4y)\). Si dentamos las entradas de \(\gamma\) como \(\gamma(t)=(x(t),y(t))\). Por lo tanto la ecuación \eqref{Eqn:AuxCurvasMayorCrecimiento} se puede escribir como el siguiente sistema de ecuaciones \begin{eqnarray*} \lambda 6x(t)=x'(t) \\ \lambda 4y(t)=y'(t) \end{eqnarray*}

Dada una constante \(k\), la solución más general de la ecuación diferencial \(g'(t)=k g(t)\) es \(g(t)=ce^{kt}\), donde \(c\) es una constante. Por lo tanto una solución del sistema es \(x(t)=c_1e^{\lambda 6 t}, y(t)=c_2e^{\lambda 4 t}\).

Finalmente, queremos que \(\gamma(0)=(1,2)\). Substituyendo en las fórmulas para \(x\) y \(y\) llegamos \[ 1=x(0)=c_1e^{\lambda 6 (0)}=c_1,\quad 2=y(0)=c_2e^{\lambda 4 (0)}=c_2 \] Por lo tanto la curva que buscamos es \(\gamma(t)=(e^{\lambda 6 t},2e^{\lambda 4 t} )\).

La curva \(\gamma\).

PlanoXY

Los valores de \(f\) sobre la curva \(\gamma\).

SobreSuperficie