You are on page 1of 60

Apuntes de calculo diferencial en una y varias

variables reales

Eduardo Liz Marzan

Febrero de 2016
Indice general

1. Preliminares 1
1.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. La relacion de orden en el conjunto de los numeros reales. . . . . . . . . . . . . . 1
1.3. El valor absoluto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4. Funciones reales de variable real. . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2. Lmites y continuidad de funciones de una variable 5


2.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2. Lmite de una funcion en un punto. . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3. Continuidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.4. Lmites en infinito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.5. Calculo de lmites. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.6. Algunos teoremas para funciones continuas. . . . . . . . . . . . . . . . . . . . . . 9

3. Derivacion de funciones de una variable 11


3.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.2. El problema de la tangente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.3. Derivada de una funcion en un punto. . . . . . . . . . . . . . . . . . . . . . . . . 12
3.4. Funcion derivada. Derivadas sucesivas. . . . . . . . . . . . . . . . . . . . . . . . . 14
3.5. Propiedades de las derivadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.6. Calculo de derivadas en algunos casos especiales. . . . . . . . . . . . . . . . . . . 16
3.7. La regla de LHopital. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.8. Extremos locales de una funcion. . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.9. El teorema del valor medio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.10. El teorema de Taylor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

4. Introduccion a las funciones vectoriales 27


4.1. Funciones vectoriales de una variable. Curvas en R2 y R3 . . . . . . . . . . . . . . 27
4.2. Campos escalares y vectoriales. Curvas de nivel . . . . . . . . . . . . . . . . . . . 29
4.3. Nociones basicas de topologa en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 30

5. Continuidad y calculo diferencial de funciones de varias variables 33


5.1. Lmites y continuidad de funciones de varias variables. . . . . . . . . . . . . . . . 33
5.2. Derivadas parciales y plano tangente. . . . . . . . . . . . . . . . . . . . . . . . . . 35
5.3. Diferenciabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5.4. Regla de la cadena. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.4.1. Regla de la cadena: una variable independiente . . . . . . . . . . . . . . . 39
5.4.2. Regla de la cadena: varias variables independientes . . . . . . . . . . . . . 41
5.5. Derivacion implcita. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.6. Derivadas parciales de orden superior. . . . . . . . . . . . . . . . . . . . . . . . . 43
5.7. Extremos locales y globales de un campo escalar. . . . . . . . . . . . . . . . . . . 45
5.8. Extremos condicionados. Multiplicadores de Lagrange. . . . . . . . . . . . . . . . 50

Referencias 55
Introduccion

Se recogen aqu los apuntes de la asignatura Calculo I adaptada a los grados iniciados en el
curso 2010/2011. En lo que respecta a las titulaciones de Ingeniera de la energa e Ingeniera de
los recursos mineros y energeticos en la Universidad de Vigo, el grado tiene tres asignaturas cuya
docencia corresponde al area de Matematica Aplicada. En el primer cuatrimestre se imparten
Algebra Lineal y Calculo I, y en el segundo cuatrimestre Calculo II.
La primera parte del calculo (a la que corresponden estos apuntes) se dedica al estudio de la
continuidad y diferenciabilidad de funciones de una y varias variables reales y sus aplicaciones. A
su docencia se dedican 40 horas de aula (teora y problemas) y 10 horas de laboratorio (practicas
de ordenador y problemas).

Estas notas no pretenden sustituir ni a los apuntes de clase ni a los libros de la bibliografa
(que incluyen mucho mas material, en particular muchos mas dibujos y ejemplos), sino servir
de ayuda para que los alumnos tengan el material del curso organizado.

Agradezco la cuidadosa lectura y las observaciones de Guillermo Garca Lomba, que han
ayudado a pulir versiones anteriores.
Captulo 1

Preliminares

1.1. Introduccion.
En la primera parte del curso se estudia el calculo en una variable real, con lo que el conjunto
protagonista es el de los numeros reales, que denotaremos por R. En este captulo preliminar
recordaremos algunas cuestiones importantes que se utilizan en los temas siguientes, como la
relacion de orden total de los numeros reales, el valor absoluto y el concepto de funcion.

1.2. La relacion de orden en el conjunto de los numeros reales.


Una caracterstica fundamental en el conjunto R de los numeros reales es que existe una
relacion de orden total compatible con las operaciones. En particular, se cumplen las siguientes
propiedades:

1. Si x y y z R entonces x + z y + z.

2. Si x y y > 0 entonces x y.

3. Si x y y < 0 entonces x y. En particular, x y = x y.

4. Si 0 < x < y entonces 0 < 1/y < 1/x.

Intervalos.
La relacion de orden permite definir los intervalos, que son los subconjuntos de numeros
reales que usaremos mas habitualmente. Si a, b son dos numeros reales tales que a < b, se definen
los siguientes intervalos:

(a, b) = {x R / a < x < b} (Intervalo abierto de extremos a y b).

[a, b] = {x R / a x b} (Intervalo cerrado de extremos a y b).

[a, b) = {x R / a x < b}.

(a, b] = {x R / a < x b}.


2 Captulo 1. Preliminares

Observaciones:

1. Estos dos ultimos se llaman intervalos semiabiertos o semicerrados.

2. Todos estos tipos de intervalos se llaman intervalos finitos o acotados. Los intervalos ce-
rrados y acotados [a, b] se llaman tambien intervalos compactos.

Existen otros intervalos infinitos o no acotados:

Abiertos: (a, ) = {x R / x > a}, (, b) = {x R / x < b}.

Cerrados: [a, ) = {x R / x a}, (, b] = {x R / x b}.

Observese que R = (, ) tambien es un intervalo no acotado.

1.3. El valor absoluto.


Se define el valor absoluto de un numero real x como

x si x 0
|x| =
x si x < 0

Propiedades

1. |x| 0, x R y ademas |x| = 0 x = 0.

2. |x| = | x|, x R.

3. |x y| = |x| |y|, x, y R.

4. |x + y| |x| + |y|, x, y R.

5. Si r > 0 entonces |x| r r x r x [r, r].

La propiedad 5 permite caracterizar el intervalo [x0 r, x0 + r] centrado en x0 R y de


radio r > 0 en terminos del valor absoluto:

x [x0 r, x0 + r] |x x0 | r.

Cualquier intervalo acotado [a, b] se puede escribir de esta manera sin mas que tomar x0 el punto
medio (x0 = (a + b)/2) y r la mitad de la longitud del intervalo (r = (b a)/2).
Lo mismo se obtiene para intervalos abiertos utilizando la desigualdad estricta.
1.4. Funciones reales de variable real. 3

1.4. Funciones reales de variable real.


Las funciones reales de variable real son el objeto principal de los primeros temas del curso.
En esta seccion repasamos algunos conceptos relacionados.
Sea D un subconjunto de R. Una funcion real de variable real (en adelante nos referiremos
a ella unicamente como funcion) es una correspondencia f : D R que asigna a cada numero
x D un unico numero f (x) R que se llama imagen de x. El conjunto D se llama dominio
de definicion de f . Por ejemplo, el dominio de definicion de la aplicacion f (x) = ln(x) es
D(f ) = (0, ). Entenderemos que el dominio D(f ) es un intervalo o una union de intervalos. En
particular, para las funciones que se obtienen como potencias de otras, el dominio de definicion
solo incluira el conjunto de puntos donde la base es positiva. Por ejemplo, si f (x) = (x + 1)x1
entonces D(f ) = {x R / x + 1 > 0} = {x R / x > 1} = (1, ).
Se llama imagen de f o rango de f al conjunto f (D) = {f (x) / x D}. La grafica de f es
el subconjunto de R2 definido por G = {(x, f (x)) / x D(f )} .

Composicion de funciones. Sean f : D1 R, g : D2 R. Si f (D1 ) D2 entonces se puede


definir la composicion (g f ) : D1 R como (g f )(x) = g(f (x)), x D1 .
Por ejemplo, si f (x) = x2 + 1 y g(x) = ln(x), se define (g f ) : R R como

(g f )(x) = g(f (x)) = ln(x2 + 1), x R.

Funciones inversas.
Se dice que dos funciones f : D1 R, g : D2 R son inversas si (g f )(x) = x, x D1
y (f g)(y) = y, y D2 . Si f y g son inversas, se denota g = f 1 .
Por ejemplo, las funciones f (x) = ex y g(x) = ln(x) son inversas ya que

g(f (x)) = ln(ex ) = x, x R ; f (g(y)) = eln(y) = y, y (0, ).

En general, aunque una funcion f : D R tenga inversa, no es sencillo calcularla. Por


ejemplo, la funcion f : R R definida por f (x) = x + ex tiene inversa pero no se puede
encontrar una expresion sencilla para ella. En ocasiones, saber que la funcion tiene inversa
tambien es util, aunque no se pueda calcular explcitamente. Las funciones que tienen inversa
se llaman funciones inyectivas. Se caracterizan por la siguiente propiedad: f es inyectiva si y
solo si para cualquier par de numeros reales distintos x, y D sus imagenes f (x), f (y) tambien
son distintas. Por ejemplo, la funcion f : R R definida por f (x) = x2 no es inyectiva ya que
f (1) = f (1) = 1.
Una funcion f : I R definida en un intervalo real I es estrictamente creciente si para
cualquier par de numeros reales distintos x, y I se cumple que x < y = f (x) < f (y). Diremos
que f es estrictamente decreciente si x < y = f (x) > f (y). Las funciones estrictamente
crecientes o decrecientes se llaman funciones estrictamente monotonas. Es inmediato probar
que toda funcion estrictamente monotona es inyectiva y por tanto tiene inversa. Por ejemplo, la
funcion f (x) = x+ex mencionada antes es claramente creciente ya que x < y = x+ex < y +ey .
Las graficas de f y f 1 son simetricas respecto de la recta y = x. Es consecuencia de que
y = f (x) x = f 1 (y), y por tanto el punto (x, y) esta en la grafica de f si y solo si el punto
(y, x) esta en la grafica de f 1 .
4 Captulo 1. Preliminares

En la figura se muestran las graficas de f (x) = cos(x) y su inversa f 1 (x) = arccos(x). Se


ha restringido f al intervalo [0, ]. El dominio de definicion de f 1 es el intervalo [1, 1], que es
la imagen de f . Observese que los puntos (0, 1) y (, 1) estan en la grafica de f , mientras que
(1, 0) y (1, ) estan en la grafica de f 1 .
y

y = arccos(x) y=x

x
1 1

y = cos(x)
1

Figura 1.1: Graficas de f (x) = cos(x) y su inversa f 1 (x) = arccos(x).


Captulo 2

Lmites y continuidad de funciones


de una variable

2.1. Introduccion.
En este captulo se introducen los conceptos de lmite de una funcion en un punto y de
lmite en infinito. La nocion de lmite conduce a la importante definicion de continuidad. Al
final del tema se enuncian varios teoremas importantes que dependen de forma esencial de la
continuidad.

2.2. Lmite de una funcion en un punto.


El concepto de lmite permite, entre otras cosas, calcular el valor al que se aproxima una
funcion cuando x se aproxima a un punto concreto x0 . Por ejemplo, la funcion f (x) = sen(x)/x
no se puede evaluar en x0 = 0 pero el calculo de lmites permite deducir que f (x) se aproxima
a 1 cuando x tiende a 0.
Para definir el concepto de lmite en un punto x0 es necesario que la funcion este definida
en las proximidades de x0 , es decir, en un intervalo (x0 r, x0 ), en (x0 , x0 + r), o en ambos,
donde r es un numero positivo.

Lmites laterales.
Sea f una funcion real. Si x0 es un numero real tal que f esta definida en un intervalo
(x0 r, x0 ) para algun r > 0 entonces diremos que existe el lmite por la izquierda de f en
x0 si ocurre una de las siguientes posibilidades:

1. lm f (x) = y0 [ > 0, > 0 / x (x0 , x0 ) = |f (x) y0 | < ] .


xx
0

Esto quiere decir que f (x) se aproxima a y0 cuando x se aproxima a x0 por la izquierda.

2. lm f (x) = [ M > 0, > 0 / x (x0 , x0 ) = f (x) > M ] .


xx
0
6 Captulo 2. Lmites y continuidad de funciones de una variable

Esto quiere decir que f toma valores arbitrariamente grandes cuando x se aproxima a x0
por la izquierda.

3. lm f (x) = [ M > 0, > 0 / x (x0 , x0 ) = f (x) < M ] .


xx
0

Esto quiere decir que f toma valores arbitrariamente pequenos (negativos con valor abso-
luto grande) cuando x se aproxima a x0 por la izquierda.

Si no sucede ninguna de las situaciones anteriores, diremos que no existe el lmite por la izquierda
de f en x0 .
De modo completamente analogo (cambiando (x0 , x0 ) por (x0 , x0 +)) se define el lmite
por la derecha de f en x0 si f esta definida en un intervalo de la forma (x0 , x0 + r) para algun
r > 0. Se denota lm f (x).
xx+
0
Lmite.
Sea x0 R y sea f una funcion definida en los intervalos (x0 r, x0 ) y (x0 , x0 + r) para
algun r > 0. Se dice que existe el lmite de f en x0 si existen los lmites laterales y coinciden,
es decir, lm f (x) = lm f (x).
xx
0 xx+
0
Por ejemplo, consideremos la funcion f : (, 0) (0, ) R definida por f (x) = 1/|x|.
Existe lm f (x) = ya que 1/|x| toma valores arbitrariamente grandes y positivos cuando x se
x0
aproxima a cero tanto por la derecha como por la izquierda.

Asntotas verticales.
Si alguno de los lmites laterales de f en un punto x0 es o entonces se dice que la
recta vertical x = x0 es una asntota vertical a la grafica de f .

Si lm f (x) = , la recta x = x0 es una asntota vertical a la grafica de f por la


xx
0
izquierda

Si lm f (x) = , la recta x = x0 es una asntota vertical a la grafica de f por la


xx+
0
derecha.

Por ejemplo, la recta x = 0 es una asntota vertical por la derecha a la grafica de la funcion
f : (0, ) R definida por f (x) = ln(x).

2.3. Continuidad.
Sea f : I R una funcion definida en un intervalo abierto I. Se dice que f es continua en
un punto x0 I si existe el lmite de f en x0 y ademas

lm f (x) = f (x0 ).
xx0

Si f no es continua en x0 , diremos que f tiene una discontinuidad en x0 . Consideraremos


dos tipos distintos de discontinuidades:
2.3. Continuidad. 7

1. Discontinuidad de salto. Se produce cuando existen los lmites laterales de f en x0 pero


no coinciden. Se dice que el salto es finito si los dos lmites laterales son finitos. Si alguno
de ellos es infinito, diremos que el salto es infinito.

2. Discontinuidad esencial. Se produce cuando no existe alguno de los lmites laterales de


f en x0 .

Para que haya una discontinuidad en un punto x0 no es preciso que x0 este en el dominio de
f . Basta que f este definida a ambos lados y que los lmites laterales no coincidan o alguno de
ellos no exista.

Ejemplos:

1. Sea f : R R definida por



sen(x) si x 0
f (x) =
ln(x) si x > 0.

Existe una discontinuidad de salto infinito en x0 = 0, ya que

lm f (x) = sen(0) = 0 ; lm f (x) = lm ln(x) = .


x0 x0+ x0+

2. Sea f : R R definida por



sen(x) si x 0
f (x) =
sen(1/x) si x > 0.

Existe una discontinuidad esencial en x0 = 0 ya que no existe lm f (x) = lm sen(1/x).


x0+ x0+

Se dice que una funcion es continua en un conjunto A si es continua en todos los puntos de A.

Algunos ejemplos de funciones continuas.


Las funciones mas comunes son continuas en sus dominios de definicion. Por ejemplo:

Las funciones polinomicas p(x) = a0 + a1 x + a2 x2 + + an xn , donde a0 , a1 , . . . , an R,


son continuas en R.

Las funciones racionales (cocientes de polinomios) r(x) = p(x)/q(x) son continuas en su


dominio de definicion, es decir, en el conjunto de los numeros reales x tales que q(x) 6= 0.

La funcion exponencial ex es continua en R y ln(x) es continua en (0, ).

Las funciones trigonometricas sen(x), cos(x), tg(x) y sus inversas arcsen(x), arccos(x),
arctg(x) son continuas en sus respectivos dominios de definicion.

Los ejemplos anteriores, combinados con las propiedades que enunciamos a continuacion,
permiten probar la continuidad de muchas funciones.
8 Captulo 2. Lmites y continuidad de funciones de una variable

Propiedades.

1. La composicion de funciones continuas es una funcion continua. Por ejemplo, la funcion


f (x) = e| cos(x)| es continua en R ya que f (x) = f1 (f2 (f3 (x))), donde f1 (x) = ex , f2 (x) = |x|
y f3 (x) = cos(x) son continuas.

2. Si f y g son funciones continuas en x0 entonces las funciones (f +g) y (f g) son continuas en


x0 . La funcion f /g es continua en x0 si g(x0 ) 6= 0. Por ejemplo, la funcion f (x) = ex /(x1)
es continua para todo x 6= 1.

2.4. Lmites en infinito.


Sea f una funcion definida en el intervalo (a, ) para algun a R. Diremos que existe el
lmite de f en si ocurre una de las siguientes posibilidades:

1. lm f (x) = y0 [ > 0, M > 0 / x > M = |f (x) y0 | < ] . Es decir, y0 es el lmite


x
de f cuando x tiende a infinito si f (x) se aproxima a y0 cuando x se hace suficientemente
grande.

2. lm f (x) = M > 0, M 0 > 0 / x > M 0 = f (x) > M . Es decir, si f (x) toma


 
x
valores arbitrariamente grandes cuando x se hace suficientemente grande.

3. lm f (x) = M > 0, M 0 > 0 / x > M 0 = f (x) < M .


 
x

Si no sucede ninguna de las situaciones anteriores, diremos que no existe el lmite de f en


infinito.
De modo completamente analogo se define el lmite de f en si f esta definida en (, b)
para algun b R.

Si y0 R es el lmite de f en , entonces la recta horizontal y = y0 es una asntota


horizontal de la grafica de f .

Ejemplos:

1. lm ex = , lm ex = 0. Por tanto, la recta y = 0 es una asntota horizontal de la grafica


x x
de f en , pero f no tiene una asntota horizontal en porque crece indefinidamente.

2. lm (1 + x)/x = lm (1 + x)/x = 1. En consecuencia, la recta y = 1 es una asntota


x x
horizontal de la grafica de f en y .

3. No existe lm sen(x). La grafica de la funcion sen(x) es periodica y no tiene asntotas.


x
2.5. Calculo de lmites. 9

2.5. Calculo de lmites.


Las siguientes propiedades son utiles para el calculo de lmites:

1. Sean f y g dos funciones. Supongamos que existen lm f (x) R y lm g(x) R (x0


xx0 xx0
puede ser ). Entonces:

a) lm (f (x) + g(x)) = lm f (x) + lm g(x).


xx0 xx0 xx0
   
b) lm (f (x) g(x)) = lm f (x) lm g(x) .
xx0 xx0 xx0
   
c) lm (f (x)/g(x)) = lm f (x) / lm g(x) , si lm g(x) 6= 0.
xx0 xx0 xx0 xx0

    lm g(x)
xx0
d ) lm f (x)g(x) = lm f (x) , si lm f (x) > 0.
xx0 xx0 xx0

Algunas de las propiedades anteriores se pueden extender al caso en que alguno de los
lmites es , teniendo en cuenta las relaciones formales + = , = ,
= si > 0, = si < 0, = .
 
2. Si g es continua y existe lm f (x) entonces lm g(f (x)) = g lm f (x) .
xx0 xx0 xx0
 
Por ejemplo, lm ln(x + 1) = ln lm (x + 1) = ln(1) = 0.
x0 x0

3. Si lm f (x) = 0 y g esta acotada en un entorno de x0 entonces lm (f (x) g(x)) = 0. Por


xx0 xx0
ejemplo, lm sen(x)/x = 0, ya que sen(x) esta acotada y lm 1/x = 0.
x x

En muchos caso el calculo de lmites conduce a indeterminaciones. Las mas usuales son
( ), /, 0/0, 0 , 1 , 0 y 00 .

2.6. Algunos teoremas para funciones continuas.


En esta seccion se recogen cuatro resultados muy utiles basados en la continuidad. Son
resultados muy intuitivos que se deducen del siguiente teorema:

Teorema 2.1 Sea I un intervalo real y f : I R una funcion continua. Entonces su conjunto
imagen f (I) = {f (x) / x I} tambien es un intervalo. Ademas, si I = [a, b] es un intervalo
compacto entonces f ([a, b]) = [c, d] tambien es un intervalo compacto.

Como consecuencias de este resultado se tienen los siguientes teoremas importantes:

Teorema 2.2 (Teorema de los valores extremos) Sea f : [a, b] R una funcion continua.
Entonces existen m, M R tales que m = mn f (x), M = max f (x).
x[a,b] x[a,b]
10 Captulo 2. Lmites y continuidad de funciones de una variable

Por ejemplo, sea f : [0, 2] R definida por f (x) = x4 2x2 . Se puede probar que

mn f (x) = f (1) = 1 ; max f (x) = f (2) = 8.


x[0,2] x[0,2]

Este resultado no tiene por que ser cierto si f no es continua o no esta definida en un
intervalo compacto. Por ejemplo, la funcion f : (0, 2) R definida por f (x) = 1/x es continua
pero no existe max f (x) ya que lm f (x) = .
x(0,2) x0+

Teorema 2.3 (Teorema de los valores intermedios) Sea f : [a, b] R una funcion con-
tinua. Sean m = mn f (x), M = max f (x). Para cualquier c tal que m < c < M existe al
x[a,b] x[a,b]
menos un numero x [a, b] tal que f (x) = c.

Teorema 2.4 (Teorema de Bolzano) Sea f : [a, b] R una funcion continua.


Si f (a) f (b) < 0 entonces existe al menos un numero x [a, b] tal que f (x) = 0.

El teorema de Bolzano es una buena herramienta para probar la existencia de ceros de una
funcion. (Diremos que c es un cero o una raz de f si f (c) = 0.)
Por ejemplo, la funcion continua f (x) = ex x4 tiene al menos un cero en el intervalo [1, 2]
ya que f (1) = e 1 > 0 y f (2) = e2 16 < 0.

Teorema 2.5 (Teorema de punto fijo) Si f : [a, b] [a, b] es una funcion continua entonces
existe al menos un punto fijo de f en [a, b], es decir, x [a, b] / f (x) = x.

En la practica, para determinar la existencia de un punto fijo se suele considerar la funcion


g(x) = f (x) x. Evidentemente, los puntos fijos de f coinciden con los ceros de g. Por tanto, si
g es continua en [a, b] y g(a) g(b) < 0 entonces f tiene un punto fijo en (a, b).
Por ejemplo, la funcion continua f (x) = ex2 tiene al menos un punto fijo en [0, 1] ya que si
definimos g(x) = f (x) x entonces g(0) = f (0) 0 = e2 > 0 y g(1) = f (1) 1 = e1 1 < 0.
Captulo 3

Derivacion de funciones de una


variable

3.1. Introduccion.
En este captulo se introduce el concepto de derivada de una funcion en un punto y algunas
de sus propiedades, como la regla de la cadena. El calculo diferencial es la herramienta mas eficaz
para obtener propiedades de una funcion como sus intervalos de crecimiento, decrecimiento,
concavidad y convexidad. Tambien tiene importantes aplicaciones al calculo de lmites (y por
tanto de asntotas) y a la aproximacion de funciones por otras mas sencillas.

3.2. El problema de la tangente.


Una de las aplicaciones del calculo de lmites, que conduce al concepto de derivada, es la
definicion precisa de lo que se entiende por recta tangente a una curva en un punto. La idea
intuitiva de que la tangente es la recta que toca en un unico punto a la curva funciona bien con
algunas curvas, como la circunferencia, pero en general es bastante ambigua en otras situaciones.
Para la curva de la figura 3.1, la recta en trazo discontinuo solo toca una vez a la grafica, mientras
que la de trazo continuo la toca dos veces. Sin embargo, esta ultima es la recta tangente.
La definicion correcta de recta tangente se basa en que la pendiente de la recta tangente a
una curva en el plano (x, y) representa la razon de cambio instantaneo de y con respecto a x.
Si f es una funcion, la razon promedio de cambio en un intervalo [x0 , x0 + h] de longitud h
viene dada por el cociente de incrementos

y f (x0 + h) f (x0 )
= .
x h
Por tanto, tiene sentido definir la razon de cambio instantanea como

f (x0 + h) f (x0 )
lm . (3.1)
h0 h
12 Captulo 3. Derivacion de funciones de una variable

Figura 3.1: Ilustracion del concepto de recta tangente.

Para cada h > 0, el cociente de incrementos representa la pendiente de la recta que pasa
por los puntos (x0 , f (x0 )) y (x0 + h, f (x0 + h)). Estas rectas cortan a la grafica de f en dos
puntos y se aproximan cuando h tiende a cero a la recta tangente a la grafica de f en el punto
(x0 , f (x0 )). Por tanto, si el lmite definido en (3.1) existe, se puede definir de forma precisa la
recta tangente en x0 como la recta que pasa por (x0 , f (x0 )) y tiene como pendiente dicho lmite.
La razon de cambio instantanea definida por (3.1) conduce al concepto de derivada de una
funcion en un punto.

3.3. Derivada de una funcion en un punto.


Consideremos una funcion f : I R, donde I es un intervalo abierto (acotado o no). Se
dice que f es derivable en un punto x0 I, si existe el siguiente lmite y es finito:

f (x0 + h) f (x0 )
lm .
h0 h
En caso de que exista, se llama derivada de f en x0 y se denota por f 0 (x0 ). Si el lmite
no existe o es infinito, diremos que f no es derivable en x0 o que no existe la derivada de f en x0 .

Una definicion equivalente de f 0 (x0 ) se obtiene tomando h = x x0 :

f (x0 + h) f (x0 ) f (x) f (x0 )


f 0 (x0 ) = lm = lm .
h0 h xx 0 x x0
Ejemplo:
La funcion f (x) = x2 es derivable en todo punto x R y ademas

f (x + h) f (x) (x + h)2 x2 h2 + 2xh


f 0 (x) = lm = lm = lm = lm (h + 2x) = 2x.
h0 h h0 h h0 h h0
3.3. Derivada de una funcion en un punto. 13

Ecuacion de la recta tangente.


Como hemos comentado antes, la derivada de f en x0 representa la pendiente de la recta
tangente a la grafica de f en el punto (x0 , f (x0 )). Por tanto, la ecuacion de dicha recta tangente
es
y f (x0 ) = f 0 (x0 )(x x0 ).
Por ejemplo, la funcion f (x) = x2 es derivable en x0 = 1 y f 0 (1) = 2. Por tanto, la ecuacion
de la recta tangente a la grafica de f en el punto (1, 1) es y 1 = 2(x 1). Las graficas de f y
la recta tangente R se representan en la figura 3.2.

y
y = x2

y = 2x 1

1
x
1

Figura 3.2: Grafica de f (x) = x2 y su recta tangente en el punto (1, 1).

Derivadas laterales.
Tambien se pueden definir las derivadas laterales de f en x0 . Se llama derivada por la
izquierda de f en x0 , y se denota f 0 (x
0 ), al siguiente lmite:

f (x0 + h) f (x0 )
f 0 (x
0 ) = lm ,
h0 h
siempre que este exista y sea finito.
Analogamente, se define la derivada por la derecha f 0 (x+
0 ) tomando el lmite por la derecha.

Propiedad. f es derivable en x0 si y solo si existen f 0 (x 0 + 0 0 +


0 ) y f (x0 ) y ademas f (x0 ) = f (x0 ).

Ejemplo: La funcion f (x) = |x| no es derivable en x0 = 0 ya que


f (0 + h) f (0) |h| h
f 0 (0 ) = lm = lm = lm = 1
h0 h h0 h h0 h
f (0 + h) f (0) |h| h
f 0 (0+ ) = lm = lm = lm = 1.
h0 + h h0 + h h0 h+
14 Captulo 3. Derivacion de funciones de una variable

En caso de que una funcion f este definida en un intervalo compacto [a, b], la derivada de
f en a se entiende como la derivada por la derecha y la derivada de f en b se entiende como la
derivada por la izquierda.

3.4. Funcion derivada. Derivadas sucesivas.


Sea f : I R una funcion. Se dice que f es derivable en I si es derivable en todos los
puntos de I. En este caso se puede definir la funcion derivada de f :

f 0 : I R
x 7 f 0 (x)

Si la funcion f 0 es a su vez derivable en I entonces se define la derivada segunda (o derivada


de orden 2) de f como f 00 (x) = (f 0 )0 (x), x I. En general, si n 2, existe la derivada de
orden n 1 de f y f n1) es derivable en I entonces se define f n) (x) = (f n1) )0 (x), x I. En
este caso, se dice que f es n veces derivable en I y f n) se llama derivada n-esima de f en I.
Por convenio, se define f 0) (x) = f (x).
Se dice que una funcion es de clase C n en I y se denota f C n (I) si f es n veces derivable
en I y la funcion f n) es continua.
Si f tiene derivadas de todos los ordenes entonces se dice que f es de clase C (se denota
f C (I) y se lee f es de clase clase C infinito).
Por ejemplo, la funcion f (x) = ex es de clase C en R ya que existen todas las derivadas
sucesivas de f . De hecho, f n) (x) = ex , n N.

Observacion. Toda funcion derivable es continua. Sin embargo, no toda funcion continua es
derivable. Por ejemplo, la funcion f (x) = |x| es continua en R pero no es derivable en x = 0.

Derivacion de funciones definidas a trozos.


El siguiente resultado simplifica el estudio de la derivabilidad en funciones definidas a trozos:

Proposicion 3.1 Sea f una funcion continua en un punto x0 y derivable en los intervalos
(x0 r, x0 ) y (x0 , x0 + r) para algun r > 0. Supongamos que existen lm f 0 (x) y lm f 0 (x).
xx
0 xx+
0
Entonces f es derivable en x0 si y solo si lm f 0 (x) = lm f 0 (x). Ademas, en ese caso,
xx
0 xx+
0
0
f 0 (x 0) = lm f (x) y por tanto f0 es continua en x0 .
xx0

Por ejemplo, consideremos la funcion f : R R definida por

x2 si x 0

f (x) =
x2 si x > 0

Claramente f es derivable para todo x 6= 0 y



2x si x < 0
f 0 (x) =
2x si x > 0
3.5. Propiedades de las derivadas. 15

Como lm f 0 (x) = lm f 0 (x) = 0, se deduce que f es derivable en x = 0 y f 0 (0) = 0. Por tanto


x0 x0+
f 0 esta definida y es continua en R:

2x si x 0
f 0 (x) =
2x si x > 0

Ahora, como

00 2 si x < 0
f (x) =
2 si x > 0

es claro que lm f 00 (x) = 2 6= lm f 00 (x) = 2 y por tanto no existe f 00 (0). En consecuencia,


x0 x0+
f C 1 (R) pero f 6 C 2 (R)

3.5. Propiedades de las derivadas.


Sean f : I R, g : I R dos funciones derivables en un punto x0 I. Entonces:

1. (f + g) es derivable en x0 y (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ).

2. (f ) es derivable en x0 y (f )0 (x0 ) = f 0 (x0 ), R.

3. (f g) es derivable en x0 y (f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ).

4. Si g(x0 ) 6= 0, (f /g) es derivable en x0 y

f 0 (x0 )g(x0 ) f (x0 )g 0 (x0 )


(f /g)0 (x0 ) = .
(g(x0 ))2

Regla de la cadena.
Se conoce con el nombre de regla de la cadena a la formula para la derivada de la composicion
de dos funciones.
Sean f : D1 R, g : D2 R tales que f (D1 ) D2 . Si f es derivable en x0 y g es derivable
en f (x0 ) entonces (g f ) es derivable en x0 y ademas

(g f )0 (x0 ) = g 0 (f (x0 )) f 0 (x0 ).

Ejemplo.
La funcion f (x) = ln(x2 + 1) se puede escribir como f (x) = g(h(x)), con g(x) = ln(x) y
h(x) = x2 + 1. Por tanto, f es derivable en R y

1 2x
f 0 (x) = g 0 (h(x))h0 (x) = 2x = 2 , x R.
x2 +1 x +1
16 Captulo 3. Derivacion de funciones de una variable

3.6. Calculo de derivadas en algunos casos especiales.


Derivadas de funciones implcitas
En algunas ocasiones la variable y no esta expresada como una funcion explcita de x (es
decir, y = f (x)), sino de forma implcita mediante una expresion F (x, y) = 0. En general no es
posible despejar y en funcion de x, pero muchas veces se puede calcular la derivada de y respecto
de x utilizando derivacion implcita.
Por ejemplo, consideremos la curva definida implcitamente por la ecuacion ex+y + y 2 x = 1.
Vamos a calcular su recta tangente en el punto (0, 0).
Escribiendo y = y(x) y aplicando la regla de la cadena, se tiene
ex+y + y 2 x = 1 = (1 + y 0 (x))ex+y + 2xy(x)y 0 (x) + y 2 (x) = 0.
Para x = y = 0, se obtiene y 0 (0) = 1, y por tanto la ecuacion de la recta tangente en (0, 0) es
y = x.

Figura 3.3: Graficas de la curva ex+y + y 2 x = 1 y su recta tangente y = x en el punto (0, 0).

Derivadas de funciones inversas.


Supongamos que f es derivable y estrictamente monotona en un intervalo I. Entonces
f tiene inversa y f 1 tambien es derivable. Denotemos y = f (x). Teniendo en cuenta que
f f 1 (x) = x, por la regla de la cadena se tiene:
0 1
f f 1 (x) = f 0 (f 1 (x)) (f 1 )0 (x) = 1 = (f 1 )0 (x) = .
f 0 (f 1 (x))
Por ejemplo, si f (x) = tg(x), se tiene que f 1 (x) = arctg(x) y f 0 (x) = 1 + (tg(x))2 . Por
tanto, la derivada de la funcion arco tangente es:
1 1 1
(f 1 )0 (x) = = = .
f 0 (f 1 (x)) 1 + (tg(arctg(x)))2 1 + x2
3.7. La regla de LHopital. 17

3.7. La regla de LHopital.


En esta seccion nos saltamos el orden usual por dos razones: la primera es que la regla de
LHopital es la aplicacion de las derivadas mas relacionada con el tema anterior. De hecho es
probablemente el metodo mas efectivo para el calculo de lmites en el caso de indeterminaciones.
El segundo motivo es que no se incluye la demostracion del teorema y eso nos permite dejar el
teorema del valor medio para mas adelante.

Teorema 3.1 (Regla de LHopital) Sea x0 R. Sean f y g dos funciones definidas y deri-
vables en los intervalos (x0 r, x0 ) y (x0 , x0 + r) para algun r > 0, de tal manera que g no se
anula en esos intervalos. Supongamos que se cumplen las siguientes condiciones:
(a) lm f (x) = lm g(x) = 0 o lm f (x) = lm g(x) =
xx0 xx0 xx0 xx0

(b) Existe lm (f 0 (x)/g 0 (x)) = l (l puede ser finito o infinito).


xx0

Entonces existe lm (f (x)/g(x)) y


xx0

f (x) f 0 (x)
lm = lm 0 .
xx0 g(x) xx0 g (x)

El resultado del teorema sigue siendo cierto si x0 = y las funciones f y g son derivables
en intervalos de la forma (a, ) o (, b). Tambien se aplica para el calculo de lmites laterales
en caso de que f /g solo este definida a la izquierda o a la derecha de x0 .

Ejemplos.
1. Como lm sen(x) = lm x = 0, se puede aplicar la regla de LHopital para calcular
x0 x0

sen(x) cos(x)
lm = lm = cos(0) = 1.
x0 x x0 1

2. Es importante que el lmite del cociente de las derivadas exista. Por ejemplo,
x + 2 sen(x) x 2 sen(x)
lm = lm + lm = 1 + 0 = 1,
x 1+x x 1 + x x 1 + x

pero no se puede aplicar la regla de LHopital porque el lmite del cociente de las derivadas
es lm (1 + 2 cos(x)), que no existe.
x

Ordenes de crecimiento
Hay muchas funciones que tienen lmite infinito en infinito. Sin embargo, tambien es im-
portante la magnitud del crecimiento. Por ejemplo, es sabido que el crecimiento exponencial es
mas rapido que el crecimiento logartmico.
Sean f , g dos funciones tales que lm f (x) = lm g(x) = . La regla de LHopital ayuda
x x
a decidir cual de ellas crece mas rapido. Diremos que f y g tienen el mismo orden de crecimiento
18 Captulo 3. Derivacion de funciones de una variable

cuando cuando x tiende a infinito si lm (f (x)/g(x)) = c > 0. Si lm (f (x)/g(x)) = diremos


x x
que el orden de crecimiento de f en infinito es mayor que el de g.

Los siguientes ordenes de crecimiento en infinito estan ordenados de mayor a menor:


1. Crecimiento exponencial: f crece exponencialmente cuando x tiende a infinito si existen
constantes a > 0 y c > 0 tales que lm (f (x)/eax ) = c.
x

2. Crecimiento superlineal: f crece superlinealmente cuando x tiende a infinito si existen


constantes a > 1 y c > 0 tales que lm (f (x)/xa ) = c.
x

3. Crecimiento lineal: f crece linealmente cuando x tiende a infinito si existe una constante
c > 0 tal que lm (f (x)/x) = c.
x

4. Crecimiento sublineal: f crece sublinealmente cuando x tiende a infinito si existen cons-


tantes a (0, 1) y c > 0 tales que lm (f (x)/xa ) = c.
x

5. Crecimiento logartmico: f tiene crecimiento logartmico cuando x tiende a infinito si existe


una constante c > 0 tal que lm (f (x)/ ln(x)) = c.
x

6
ex x2
5
x
4

3
x
2

1 ln(x)

0 1 2 3 4 5

Figura 3.4: Graficas de funciones con distintos ordenes de crecimiento.

Por ejemplo, veamos que el crecimiento sublineal es mas rapido que el logartmico usando
la regla de LHopital. En efecto,
xa axa1
lm = lm = lm axa = , a > 0.
x ln x x x1 x
3.8. Extremos locales de una funcion. 19

3.8. Extremos locales de una funcion.


Las siguientes aplicaciones que veremos del calculo diferencial se dirigen en primer lugar al
estudio cualitativo de las funciones, con especial atencion al crecimiento, decrecimiento, conca-
vidad y convexidad. Pero, ademas, los teoremas que se incluyen en esta seccion tienen muchas
otras aplicaciones.
Empezamos recordando los conceptos de maximo y mnimo local de una funcion.
Sea D un subconjunto de R y f : D R una funcion. Se dice que f alcanza un maximo
local en un punto x0 D si existe un numero r > 0 tal que f (x) f (x0 ) para todos los puntos
x D tales que |x x0 | < r.
Analogamente, f alcanza un mnimo local en un punto x0 D si existe un numero r > 0
tal que f (x) f (x0 ) para todos los puntos x D tales que |x x0 | < r.

Observaciones:

1. En cualquiera de los dos casos anteriores se dice que f tiene un extremo local en x0 .

2. El extremo es estricto si las desigualdades que relacionan f (x) y f (x0 ) son estrictas.

3. El extremo es absoluto si las desigualdades f (x) f (x0 ) o f (x) f (x0 ) se cumplen para
todo x D.

En virtud del teorema de los valores extremos (Teorema 2.2), si f : [a, b] R es una
funcion continua entonces siempre se alcanzan el maximo y el mnimo absolutos, es decir, existen
x1 , x2 [a, b] tales que f (x1 ) f (x) f (x2 ), x [a, b].
El siguiente resultado facilita la busqueda de los extremos locales de una funcion.

Teorema 3.2 (Teorema del extremo local) Sea f : I R una funcion derivable en un
intervalo abierto I. Si f tiene un extremo local en un punto x0 I entonces f 0 (x0 ) = 0.

Demostracion. Supongamos que f 0 (x0 ) > 0. Entonces

f (x) f (x0 )
lm = f 0 (x0 ) > 0.
xx0 x x0
En consecuencia, los terminos (f (x) f (x0 )) y (x x0 ) tienen el mismo signo en un intervalo
(x0 r, x0 + r) para algun r > 0. Por lo tanto, f (x) > f (x0 ) si x > x0 y f (x) < f (x0 ) si x < x0 .
Esto quiere decir que f no puede alcanzar un extremo local en x0 .
El razonamiento si f 0 (x0 ) < 0 es completamente analogo. Por tanto, la unica posibilidad
para que f tenga un extremo local en x0 es que f 0 (x0 ) = 0. t
u

Observaciones:

1. Este teorema solo proporciona una condicion necesaria para la existencia de extremos. El
hecho de que f 0 (x0 ) = 0 no garantiza que f tenga un extremo en x0 . Por ejemplo, la
funcion f : R R definida por f (x) = x3 no tiene ningun extremo local y sin embargo
f 0 (0) = 0.
20 Captulo 3. Derivacion de funciones de una variable

2. El teorema solo se puede aplicar en intervalos abiertos. Si f esta definida en un intervalo


compacto [a, b], el teorema se puede usar en el intervalo (a, b). En los extremos del intervalo
se debe estudiar directamente la posible existencia de extremos. Por ejemplo, la funcion
f (x) = x2 definida en el intervalo [1, 1] tiene tres extremos locales: un mnimo local en
x = 0 y maximos locales en x = 1 y en x = 1.
Una de las consecuencias del teorema del extremo local es el teorema de Rolle.

Teorema 3.3 (Teorema de Rolle) Sea f : [a, b] R una funcion derivable. Si f (a) = f (b)
entonces existe al menos un punto x0 [a, b] tal que f 0 (x0 ) = 0.

Demostracion. Si f es constante en [a, b] entonces f 0 (x) = 0, x (a, b). En otro caso, el


mnimo y el maximo absolutos de f en [a, b] son distintos. Como f (a) = f (b), necesariamente
uno de ellos se alcanza en un punto x0 (a, b). El teorema 3.2 garantiza que f 0 (x0 ) = 0. t
u

Como consecuencia del teorema de Rolle se puede relacionar el numero de ceros de una
funcion derivable f con el numero de ceros de f 0 .

Corolario 3.1 Sea f : I R una funcion derivable definida en un intervalo real I. Entre dos
ceros consecutivos de f existe al menos un cero de f 0 .

Demostracion. Sean c1 < c2 dos ceros consecutivos de f . Entonces f : [c1 , c2 ] R es derivable


y f (c1 ) = f (c2 ). Por el teorema de Rolle, existe al menos un punto x0 (c1 , c2 ) tal que f 0 (x0 ) = 0.
t
u
Como consecuencia de este resultado, si f 0 tiene n ceros en I entonces f no puede tener
mas de (n + 1) ceros en I. En particular, si f 0 no tiene ceros en I entonces f no puede tener mas
de uno.
Ejemplo. Veamos que la funcion f (x) = 2ex x 3 tiene exactamente una raz positiva. En
efecto,
f 0 (x) = 2ex 1 = 0 ex = 1/2 x = ln(1/2).
Como ln(1/2) = ln(2) < 0, f 0 no tiene races en (0, ) y por tanto f no puede tener mas de
una raz positiva. Por otra parte, como f (0) = 1 < 0, f (1) = 2e 4 > 0, el teorema de Bolzano
permite afirmar que f tiene un cero en el intervalo (0, 1).

3.9. El teorema del valor medio.


Una de las consecuencias principales del teorema de Rolle es el teorema del valor medio.

Teorema 3.4 (Teorema del valor medio) Sea f : [a, b] R una funcion derivable. Enton-
ces existe al menos un punto x0 (a, b) tal que f (b) f (a) = f 0 (x0 )(b a).

Demostracion. La prueba de este resultado consiste en aplicar el teorema de Rolle a la dife-


rencia entre f y la recta que pasa por (a, f (a)) y (b, f (b)). En efecto, sea g : [a, b] R definida
por  
f (b) f (a)
g(x) = f (x) f (a) + (x a) .
ba
3.9. El teorema del valor medio. 21

Como g es derivable y g(a) = g(b) = 0, existe un x0 (a, b) tal que g 0 (x0 ) = 0. Por tanto,
f (b) f (a) f (b) f (a)
g 0 (x0 ) = f 0 (x0 ) = 0 = f 0 (x0 ) = .
ba ba
t
u
A continuacion se obtienen algunas consecuencias de este resultado. Incluiremos las pruebas
de alguno de ellos.

Corolario 3.2 (Intervalos de crecimiento y decrecimiento) Sea f una funcion derivable


en un intervalo (a, b).
(a) Si f 0 (x) > 0, x (a, b) entonces f es estrictamente creciente en (a, b).

(b) Si f 0 (x) < 0, x (a, b) entonces f es estrictamente decreciente en (a, b).

Demostracion. Probaremos el apartado (a): Sean x, y (a, b) tales que x < y. Tenemos que
demostrar que f (x) < f (y).
Aplicando el teorema del valor medio en el intervalo [x, y] se deduce la existencia de un
punto x0 (x, y) tal que f (y) f (x) = f 0 (x0 )(y x). Entonces:

f 0 (x0 ) > 0 = f (y) f (x) > 0 = f (x) < f (y).

t
u
Recordemos que toda funcion estrictamente creciente o decreciente en un intervalo (a, b) es
inyectiva en (a, b) y por tanto se puede definir su inversa f 1 .

Corolario 3.3 (Determinacion de maximos y mnimos locales) Sea f : I R una fun-


cion definida en un intervalo abierto I. Supongamos que f es dos veces derivable en un entorno
de un punto x0 I y f 0 (x0 ) = 0.
(a) Si f 00 (x0 ) > 0 entonces f alcanza un mnimo local estricto en x0 .

(b) Si f 00 (x0 ) < 0 entonces f alcanza un maximo local estricto en x0 .

Demostracion. Como antes, probaremos el primer apartado. Como f 00 (x0 ) > 0, la funcion f 00
toma valores positivos en un intervalo (x0 r, x0 + r) para algun r > 0. Por el corolario 3.2,
f 0 es estrictamente creciente en (x0 r, x0 + r). En consecuencia, f 0 (x) > f 0 (x0 ) = 0 si x > x0
y f 0 (x) < f 0 (x0 ) = 0 si x < x0 . Por tanto, f es estrictamente decreciente en (x0 r, x0 ) y es-
t
trictamente creciente en (x0 , x0 +r). Esto quiere decir que f tiene en x0 un mnimo local estricto.u

El ultimo de los corolarios que veremos sirve para determinar los intervalos de concavidad
y convexidad de la grafica de una funcion.
Recordamos estos conceptos. Sea f : I R una funcion derivable en un intervalo I. En
este caso se puede definir la recta tangente a la grafica de f en cada punto (x0 , f (x0 )), x0 I.
Se dice que la funcion es convexa en I si la grafica de f queda por encima de cualquier recta
tangente a dicha grafica en los puntos del intervalo I. Si la grafica de f queda por debajo de cual-
quier recta tangente a dicha grafica en los puntos del intervalo I se dira que f es concava en I.
22 Captulo 3. Derivacion de funciones de una variable

Si f es convexa a un lado de x0 y concava a otro se dira que f tiene en x0 un punto de inflexion.

El ejemplo tpico de funcion convexa en R es f (x) = x2 , mientras que el de funcion concava


es f (x) = x2 . Ambas se muestran en la figura 3.5.

4
-2 -1 1 2
3
-1
2
-2
1

-3
-2 -1 1 2

-1
-4

Figura 3.5: Graficas de x2 y x2 .

Corolario 3.4 (Concavidad y convexidad) Sea f : I R una funcion dos veces derivable
en un intervalo abierto I.

(a) Si f 00 (x) > 0, x I entonces f es convexa en I.

(b) Si f 00 (x) < 0, x I entonces f es concava en I.

(c) Si f tiene en x0 un punto de inflexion entonces necesariamente f 00 (x0 ) = 0.

Demostracion. Probemos el apartado (a). Para ello, escogemos un punto x0 I; tenemos que
demostrar que la grafica de f queda por encima de la recta tangente a dicha grafica en el punto
(x0 , f (x0 )). Recordemos que la ecuacion de la recta tangente es y = r(x) = f (x0 )+f 0 (x0 )(xx0 ).
Por tanto, debemos probar que

f (x) > f (x0 ) + f 0 (x0 )(x x0 ), x I.

Como f 00 (x) > 0, x I, se deduce que f 0 es estrictamente creciente en I. Distinguimos los


casos x > x0 y x < x0 .
Por el teorema del valor medio, para cada x > x0 existe un punto c (x0 , x) tal que
f (x) f (x0 ) = f 0 (c)(x x0 ). Como f 0 es creciente y c > x0 , f 0 (c) > f 0 (x0 ) y por tanto:

f (x) f (x0 ) = f 0 (c)(x x0 ) > f 0 (x0 )(x x0 ) = f (x) > f (x0 ) + f 0 (x0 )(x x0 ).

El caso x < x0 se resuelve de forma completamente analoga. t


u
3.10. El teorema de Taylor. 23

3.10. El teorema de Taylor.


Sea f : I R una funcion definida en un intervalo real I. El teorema de Taylor establece
la forma de aproximar la funcion f por un polinomio en un entorno de un punto x0 I. El
caso mas sencillo consiste en aproximar por la recta tangente a la grafica de f en (x0 , f (x0 )), es
decir, por el polinomio de grado uno p1 (x) = f (x0 ) + f 0 (x0 )(x x0 ). Observese que p1 (x) es el
unico polinomio de grado 1 que cumple las relaciones p1 (x0 ) = f (x0 ), p01 (x0 ) = f 0 (x0 ).
La recta tangente es una primera aproximacionde la funcion f en un entorno del punto
x0 . Cabe esperar que podamos mejorar esta aproximacion si imponemos condiciones adicionales
al polinomio (y por tanto incrementamos su grado).
Para una funcion n veces derivable en I se define el polinomio de Taylor de grado n de
f centrado en x0 al unico polinomio pn (x) de grado menor o igual que n que satisface las n + 1
n)
ecuaciones pn (x0 ) = f (x0 ), p0n (x0 ) = f 0 (x0 ), . . . , pn (x0 ) = f n) (x0 ). Su expresion abreviada es
la siguiente:
n
X f k) (x0 )
pn (x) = f (x0 ) + (x x0 )k .
k!
k=1

Es decir,

f 00 (x0 ) f n) (x0 )
pn (x) = f (x0 ) + f 0 (x0 )(x x0 ) + (x x0 )2 + + (x x0 )n .
2! n!
Por ejemplo, si f (x) = ex y x0 = 0, el polinomio de Taylor de grado 3 de f centrado en cero es:

f 00 (0) 2 f 000 (0) 3 x2 x3


p3 (x) = f (0) + f 0 (0)x + x + x =1+x+ + ,
2! 3! 2 6
ya que f (0) = f 0 (0) = f 00 (0) = f 000 (0) = e0 = 1.
Usando este polinomio, podemos aproximar ex en puntos proximos a cero. Por ejemplo,

e = e1/2 p3 (1/2) = 1+1/2+1/8+1/48 = 1.64583. La calculadora proporciona e = 1.64872,
con lo que las dos primeras cifras decimales son correctas.

El teorema de Taylor permite estimar el error cometido cuando aproximamos una funcion
por el polinomio de Taylor.

Teorema 3.5 (Teorema de Taylor) Sea f : [a, b] R una funcion derivable n + 1 veces
y sea x0 [a, b]. Entonces, para cada x [a, b], existe un numero c entre x0 y x tal que
f (x) = pn (x) + rn (x), donde

f n+1) (c)
rn (x) = (x x0 )n+1 .
(n + 1)!

El termino rn (x) se llama resto del polinomio de Taylor de grado n de f centrado en


x0 y proporciona el error cometido en la aproximacion ya que |f (x) pn (x)| = |rn (x)|, x I.
24 Captulo 3. Derivacion de funciones de una variable

Por ejemplo, el polinomio de Taylor de grado tres de f (x) = sen(x) centrado en x0 = 0 es


p3 (x) = x x3 /6. El error cometido al aproximar sen(1/2) por p3 (1/2) es

f iv) (c)  1 4
|r3 (1/2)| = , c (0, 1/2).

4! 2

Dado que |f iv) (c)| = | sen(c)| 1, c (0, 1/2), se tiene que:

1
| sen(1/2) p3 (1/2)| = |r3 (1/2)| = 0.00260417.
4! 24
De hecho p3 (1/2) = 1/2 1/48 = 0.479167 y la calculadora proporciona sen(1/2) = 0.479426.

Finalizamos el tema con dos aplicaciones del teorema de Taylor para obtener condiciones
precisas para la existencia de extremos locales y puntos de inflexion de una funcion f suficien-
temente regular (con suficientes derivadas sucesivas).

Corolario 3.5 (Criterio para la existencia de extremos) Sea f : I R una funcion de


clase C n en un intervalo abierto I. Sea x0 I tal que f 0 (x0 ) = 0 y sea n el orden de la primera
derivada de f que no se anula en x0 , es decir f k) (x0 ) = 0 si 1 k < n y f n) (x0 ) 6= 0.

(a) Si n es par y f n) (x0 ) > 0 entonces f es tiene un mnimo local estricto en x0 .

(b) Si n es par y f n) (x0 ) < 0 entonces f es tiene un maximo local estricto en x0 .

(c) Si n es impar entonces f no tiene un extremo local en x0 .

Demostracion. Demostramos el apartado (a). El polinomio de Taylor de grado n 1 de f


centrado en x0 es

f 00 (x0 ) f n1) (x0 )


pn1 (x) = f (x0 ) + f 0 (x0 )(x x0 ) + (x x0 )2 + + (x x0 )n1 = f (x0 ),
2! (n 1)!

ya que f k) (x0 ) = 0 si k < n. Por el teorema de Taylor, existe un c entre x0 y x tal que

f n) (c)
f (x) = pn1 (x) + rn1 (x) = f (x0 ) + (x x0 )n .
n!

Como n es par y f n) (x0 ) > 0, se cumple que (x x0 )n > 0 y f n) (c) > 0 para x 6= x0 en un
entorno (x0 r, x0 + r) de x0 . Por tanto,

f n) (c)
f (x) = f (x0 ) + (x x0 )n > f (x0 ), x (x0 r, x0 ) (x0 , x0 + r).
n!
De aqu se deduce que f tiene en x0 un mnimo local estricto. t
u
3.10. El teorema de Taylor. 25

Corolario 3.6 (Criterio para la existencia de puntos de inflexion) Sea f : I R una


funcion de clase n en un intervalo abierto I. Sea x0 I tal que f 00 (x0 ) = 0 y sea n el orden de la
primera derivada de f mayor que dos que no se anula en x0 , es decir f k) (x0 ) = 0 si 2 k < n
y f n) (x0 ) 6= 0. Entonces f tiene un punto de inflexion en x0 si y solo si n es impar.

Ejemplo.
Consideremos la funcion f (x) = x4 x3 .

f 0 (x) = 4x3 3x2 = 0 x = 0 o x = 3/4


f 00 (x) = 12x2 6x = 0 x = 0 o x = 1/2.

Para x = 0 se tiene que f 0 (0) = f 00 (0) = 0, f 000 (0) = 6 6= 0. Por tanto, f tiene en x = 0 un
punto de inflexion.
Para x = 3/4 se tiene que f 0 (3/4) = 0, f 00 (3/4) = 9/4 > 0. Por tanto, f tiene en x = 3/4
un mnimo local estricto.
Para x = 1/2 se tiene que f 00 (1/2) = 0, f 000 (1/2) = 6 6= 0. Por tanto, f tiene en x = 1/2 un
punto de inflexion.

La grafica se muestra en la figura 3.6.

0 1/2 3/4 x

Figura 3.6: Grafica de f (x) = x4 x3 : tiene puntos de inflexion en (0, 0) y (1/2, 1/16), y
alcanza un mnimo local en x = 3/4.
26 Captulo 3. Derivacion de funciones de una variable
Captulo 4

Introduccion a las funciones


vectoriales

4.1. Funciones vectoriales de una variable. Curvas en R2 y R3 .


Sea I un intervalo real. Una funcion f : I Rn se llama funcion vectorial de una variable.
Para cada t I, f (t) es un vector de Rn y por tanto se puede escribir en la forma

f (t) = (f1 (t), f2 (t), . . . , fn (t)),

donde fi : I R es una funcion escalar para i = 1, 2, . . . , n. Las funciones fi se llaman funciones


componentes de f .
Por ejemplo, la funcion f : [0, 2] R2 dada por f (t) = (cos(t), sen(t)) es una funcion
vectorial con valores en R2 . Sus componentes son f1 (t) = cos(t) y f2 (t) = sen(t).
Las funciones componentes permiten extender facilmente los conceptos de lmite, continui-
dad y derivada. Sea t0 R tal que f esta definida en los intervalos (t0 r, t0 ) y (t0 , t0 + r) para
algun r > 0. Diremos que existe el lmite de f cuando t tiende a t0 si existe el lmite de cada
una de las componentes. En este caso, se define
 
lm f (t) = lm f1 (t), lm f2 (t), . . . , lm fn (t) .
tt0 tt0 tt0 tt0

Una funcion f es continua en t0 I si existe el lmite de f cuando t tiende a t0 y ademas


lm f (t) = f (t0 ). Es evidente que f es continua en t0 si y solo si todas sus componentes son
t0
continuas en t0 .
Se dice que f : I Rn es derivable en un punto t0 si lo es cada una de sus componentes;
en ese caso, la derivada de f en t0 es

f (t) f (t0 )
f 0 (t0 ) = f10 (t0 ), f20 (t0 ), . . . , fn0 (t0 ) = lm

.
tt0 t t0

Por ejemplo, la derivada de f (t) = (cos(t), sin(t)) es f 0 (t) = ( sen(t), cos(t)).


28 Captulo 4. Introduccion a las funciones vectoriales

Curvas y vector tangente


La grafica de una funcion vectorial f : I Rn es el conjunto de puntos {(t, f (t)) / t I} y
por tanto es un subconjunto de Rn+1 . En los casos n = 2 y n = 3, es habitual representar solo
los puntos f (t) Rn en lugar de la grafica.
Sea f : I Rn una funcion continua definida en un intervalo real I. El conjunto

C = {f (t) = (f1 (t), f2 (t), . . . , fn (t)) / t I}

se llama curva en Rn y se dice que la funcion f es una parametrizacion de la curva.

Ejemplos:
La funcion f : [0, ] R2 dada por f (t) = (cos(t), sin(t)) describe la curva plana

C = {(cos(t), sin(t)) / t [0, ]},

que es una semicircunferencia de centro (0, 0) y radio 1 en R2 . Otraposible parametrizacion



de la misma curva es g : [1, 1] R dada por g(t) = t, 1 t2 . En este caso, la curva
se recorre en sentido contrario.

La funcion f : [0, ) R3 definida por f (t) = (cos(t), sen(t), t) describe una curva en R3
llamada helice circular, que se enrolla en un cilindro circular de radio 1.
Si f : I Rn es derivable en t0 y f 0 (t0 ) 6= (0, 0, . . . , 0) entonces f 0 (t0 ) es un vector tangente
a la curva C en el punto f (t0 ). El vector tangente indica en que sentido se recorre la curva (su
orientacion) y permite definir la recta tangente a la curva C en el punto f (t0 ) como la recta que
pasa por f (t0 ) y tiene la direccion de f 0 (t0 ), es decir, su ecuacion parametrica es

x(t) = f (t0 ) + t f 0 (t0 ), t R.

Por ejemplo, la funcion f : [0, 2] R2 dada por f (t) = (cos(t), sin(t)) define la circunferencia
de centro (0, 0) y radio 1 en R2 y su derivada en cada punto t es f 0 (t) = ( sen(t), cos(t)). Para

t0 = /4, f (/4) = (1/ 2, 1/ 2) y el vector tangente es f 0 (/4) = (1/ 2, 1/ 2). Por tanto
las ecuaciones parametricas de la recta tangente son
1t

x(t) =


2
(x(t), y(t)) = (1/ 2, 1/ 2) + t(1/ 2, 1/ 2)
1+t
y(t) =


2

Despejando t se obtiene la ecuacion cartesiana y = x + 2.
Cuando n = 2 o n = 3, una curva se puede pensar como la trayectoria que sigue una
partcula. Si denotamos por r(t) = (x(t), y(t), z(t)) el vector de posicion en un instante t, entonces
el vector tangente v(t) = r0 (t) = (x0 (t), y 0 (t), z 0 (t)) es el vector velocidad y a(t) = v 0 (t) = r00 (t) =
(x00 (t), y 00 (t), z 00 (t)) es el vector aceleracion.
Las derivadas de funciones vectoriales de una variable tienen propiedades similares a las
de las derivadas escalares con respecto a la suma y el producto por escalares. En el caso del
4.2. Campos escalares y vectoriales. Curvas de nivel 29

producto de funciones, se cumple una regla analoga a la de funciones escalares de una variable,
pero en terminos del producto escalar. Notese que si f : I Rn y g : I Rn son dos funciones
vectoriales entonces su producto escalar (f g) es una funcion escalar (f g) : I R definida
n
X
por (f g)(t) = f (t) g(t) = fi (t)gi (t).
i=1
Si f : I Rn y g : I Rn son dos funciones vectoriales derivables entonces se tienen las
siguientes propiedades:
1) f + g es derivable y (f + g)0 (t) = f 0 (t) + g 0 (t).
2) f es derivable y (f )0 (t) = f 0 (t), R.
3) El producto escalar (f g) es derivable y (f g)0 (t) = f 0 (t) g(t) + f (t) g 0 (t).

4.2. Campos escalares y vectoriales. Curvas de nivel


Sea D un subconjunto de Rn , con n > 1. Una funcion f : D Rp es una funcion de varias
variables reales. El conjunto D se llama dominio de definicion de f .
En el caso particular p = 1, una funcion f : Rn R se suele llamar campo escalar (o
funcion escalar de varias variables). Por ejemplo, la funcion que asigna a cada punto (x, y, z)
de un recinto tridimensional D su temperatura es un campo escalar T : D R3 R llamado
campo de temperaturas.
Si p > 1, una funcion f : D Rn Rp se llama funcion vectorial de varias variables.
Especialmente en el caso p = n, la funcion vectorial f : D Rn Rn suele llamarse campo de
vectores. En el caso de R2 es un campo de vectores en el plano y en el de R3 es un campo de
vectores en el espacio.
Una funcion f : D Rn Rp se puede expresar en funcion de sus componentes:
f (x) = f (x1 , x2 , . . . , xn ) = (f1 (x1 , x2 , . . . , xn ), f2 (x1 , x2 , . . . , xn ), . . . , fp (x1 , x2 , . . . , xn )).
Para cada k = 1, 2, . . . , p, la componente fk : Rn R es un campo escalar.
Por ejemplo, la funcion f : R2 R3 definida por f (x, y) = (x + y, exy , sen(x y)) tiene tres
componentes f1 (x, y) = x + y, f2 (x, y) = exy , f3 (x, y) = sen(x y).
La grafica de una funcion f : D Rn Rp se define como el conjunto
G(f ) = {(x, f (x)) / x D} .
Notese que los puntos de la grafica son de la forma
(x, f (x)) = (x1 , x2 , . . . , xn , f1 (x1 , x2 , . . . , xn ), f2 (x1 , x2 , . . . , xn ), . . . , fp (x1 , x2 , . . . , xn )) Rn+p ,
y por tanto la grafica de f es un subconjunto de Rn+p .
Por ejemplo, la grafica de la funcion f : R2 R definida por f (x, y) = x2 + y 2 es el para-
boloide definido por la ecuacion z = x2 + y 2 en R3 . En general, las graficas de funciones de R2
en R son difciles de representar; para dimensiones mayores, la grafica de una funcion de varias
variables f : Rn Rp estara en un espacio de dimension mayor que 3 y por tanto no se podra
representar.
30 Captulo 4. Introduccion a las funciones vectoriales

Curvas de nivel
Si f : D R2 R es un campo escalar definido en un dominio D del plano, se definen sus
curvas de nivel como los conjuntos de puntos sobre los que f toma el mismo valor, es decir, si
K R, la curva de nivel K es

CK = {(x, y) R2 / f (x, y) = K}.

Ejemplos tpicos de curvas de nivel son los mapas topograficos, donde cada curva de nivel
se corresponde con los puntos que tienen la misma altura, y los mapas de presion, donde cada
curva de nivel (isobara) representa los puntos donde la presion atmosferica es la misma.
Por ejemplo, las curvas de nivel de la funcion f : R2 R definida por f (x, y) = x2 + y 2
solo tienen sentido para K = r2 > 0 y son circunferencias de centro (0, 0) y radio r:

CK = {(x, y) R2 / x2 + y 2 = K = r2 }.

Cada curva de nivel representa la interseccion de la grafica de f con el plano z = K paralelo


al plano horizontal z = 0.

4.3. Nociones basicas de topologa en Rn .


En esta seccion generalizaremos a Rn algunos conceptos que en R proporcionan de forma
natural los intervalos y el valor absoluto.
El papel de un intervalo real (x0 r, x0 + r) centrado en x0 R y radio r > 0 lo juega en
Rn la bola abierta de centro P Rn y radio r > 0, que se define como el conjunto de puntos de
Rn cuya distancia a P es menor que r, es decir,

B(P, r) = {x Rn / kx P k < r} ,
q
donde k(x1 , x2 , . . . , xn )k = x21 + x22 + + x2n .
Por ejemplo, en R2 la bola abierta de centro (0, 0) y radio r esta formada por los puntos
que quedan dentro de la circunferencia de centro (0, 0) y radio r, es decir:

B((0, 0), r) = (x, y) R2 / x2 + y 2 < r2 .




Las bolas abiertas permiten definir el interior y la frontera de un conjunto de Rn .


Sea A un subconjunto de Rn . Se dice que P A es un punto interior de A si existe alguna
bola abierta centrada en P que queda dentro de A, es decir, si

r > 0 / B(P, r) A.

El conjunto de los puntos interiores de A se llama interior de A y lo denotaremos por Int(A).


Diremos que un conjunto A es abierto si todos sus puntos son interiores. Por ejemplo, las
bolas abiertas en Rn son conjuntos abiertos.
Los puntos de A que no estan en el interior se llaman puntos frontera. Tambien puede haber
puntos de la frontera de A que no pertenecen a A. Diremos que un punto P Rn es un punto de
4.3. Nociones basicas de topologa en Rn . 31

la frontera de A si cualquier bola abierta centrada en P contiene puntos de A y puntos que no


estan en A. El conjunto de puntos frontera se llama frontera de A y lo denotaremos por Fr(A).
Por ejemplo, la frontera de la bola abierta de centro (0, 0) y radio r es la circunferencia de centro
(0, 0) y radio r:
Fr(B((0, 0), r)) = (x, y) R2 / x2 + y 2 = r2 .


Diremos que un conjunto A es cerrado si contiene a todos los puntos de su frontera. Por
ejemplo, el cuadrado unidad I 2 en R2 es cerrado:

I 2 = [0, 1] [0, 1] = (x, y) R2 / 0 x 1, 0 y 1 .




En general, los conjuntos cerrados que manejaremos estan definidos por desigualdades no es-
trictas y los conjuntos abiertos estan definidos por desigualdades estrictas (observese la analoga
con los intervalos abiertos y cerrados).
Diremos que un subconjunto A de Rn esta acotado si existe una constante positiva K tal
que kxk K, x A.
Diremos que un subconjunto A de Rn es compacto si esta acotado y es cerrado. Los
conjuntos compactos de Rn juegan el papel de los intervalos compactos [a, b] de R.
Ejemplos:

El cuadrado unidad I 2 descrito anteriormente es compacto.

El cuadrante positivo A = {(x, y) R2 / x 0, y 0} no es compacto porque no esta


acotado.

La bola abierta de centro (0, 0) y radio r no es compacta porque no es cerrada.


32 Captulo 4. Introduccion a las funciones vectoriales
Captulo 5

Continuidad y calculo diferencial de


funciones de varias variables

5.1. Lmites y continuidad de funciones de varias variables.

Consideremos una funcion vectorial f : D Rn Rp definida en un subconjunto abierto


D de Rn . Sea P un punto de D o de su frontera. Diremos que L Rp es el lmite de f cuando x
tiende a P si f (x) se aproxima a L cuando x se aproxima a P . Esta definicion se puede escribir
en terminos de normas y es muy similar a la de lmite de funciones escalares de una variable:

lm f (x) = L [ > 0, > 0 / kx P k < , x 6= P = kf (x) Lk < ] .


xP

Al igual que pasaba con las funciones vectoriales de una variable, si f : Rn Rp y P Rn


entonces existe el lmite de f en P si y solo si existen los lmites en P de cada una de las compo-
nentes f1 (x), f2 (x), . . . , fp (x). Por tanto, podemos restringir nuestro estudio a campos escalares.

Lmites direccionales
Una de las diferencias fundamentales es que el lmite de una funcion de una variable en un
punto x0 R existe si y solo si existen los lmites laterales y coinciden. Sin embargo, las posibles
formas de aproximarse a un punto en Rn son infinitas.
Esta observacion resulta util como criterio para probar que el lmite en P no existe: basta
encontrar dos direcciones de tal forma que los lmites de f (x) cuando x tiende a P a lo largo de
esas direcciones sean distintos. Estos lmites se llaman lmites direccionales.
Por ejemplo,
x2 y 2
lm
(x,y)(0,0) x2 + y 2

no existe porque cuando nos aproximamos a (0, 0) a lo largo de los dos ejes de coordenadas la
34 Captulo 5. Continuidad y calculo diferencial de funciones de varias variables

funcion se aproxima a valores diferentes:

x2 y 2 x2
lm = lm = lm 1 = 1.
(x,y)(0,0) x2 + y 2 x0 x2 x0
y=0

x2 y 2 y 2
lm = lm = lm (1) = 1.
(x,y)(0,0) x2 + y 2 y0 y 2 y0
x=0

En el siguiente ejemplo estos dos lmites coinciden y consideramos las rectas y = x que
pasan por (0, 0):
2xy
lm
(x,y)(0,0) x + y 2
2

no existe porque cuando nos aproximamos a (0, 0) a lo largo de las rectas y = x con distintos
valores de la funcion se aproxima a valores diferentes:

2xy 2x2 2
lm 2 2
= lm 2 2
= .
(x,y)(0,0) x + y x0 (1 + )x 1 + 2
y=x

Para = 1, el lmite vale 1 mientras que para = 1 el lmite vale 1.

Continuidad
El concepto de continuidad para funciones de varias variables es similar al de funciones
de una variable. Sea f : D Rn Rp una funcion definida en un conjunto abierto D y sea
P D. Se dice que f es continua en P si existe el lmite de f en P y ademas

lm f (x) = f (P ).
xP

Diremos que f es continua en D si es continua en todos los puntos de D.


Es claro que f (x) = (f1 (x), f2 (x), . . . , fp (x)) es continua en P si y solo si todas sus compo-
nentes son continuas en P . Por ello podemos centrarnos en campos escalares.

Las propiedades relacionadas con la continuidad para funciones de varias variables son
similares a las de las funciones de una variable:

1. La composicion de funciones continuas es una funcion continua.

2. Si f : Rn R y g : Rn R son funciones continuas en P entonces las funciones (f + g)


y (f g) son continuas en P . La funcion f /g es continua en P si g(P ) 6= 0.

ex+y
Por ejemplo, la funcion f (x, y) = es continua para todos los puntos de R2 que no
xy 1
estan sobre la hiperbola xy = 1.
5.2. Derivadas parciales y plano tangente. 35

5.2. Derivadas parciales y plano tangente.


Para definir el concepto de diferenciabilidad de funciones de varias variables, comenzaremos
con campos escalares en R2 .
Sea f : R2 R un campo escalar. Se llama derivada parcial de f (x, y) respecto a la
variable x a la funcion que resulta de considerar la variable y constante y aplicar la derivacion
f
usual respecto de x. Se representa por o fx . La derivada parcial respecto de y se define de
x
modo analogo.
Por ejemplo, si f (x, y) = x3 y + xy 2 ln(xy) entonces:

f 1 f 1
= 3x2 y + y 2 ; = x3 + 2xy .
x x y y

Formalmente, la derivada parcial de f respecto de x en un punto (x, y) se define como

f f (x + h, y) f (x, y)
(x, y) = lm .
x h0 h
La derivada parcial de f respecto de x en el punto (x0 , y0 ) representa la tasa de cambio
instantanea de f en la direccion paralela al eje x, cuando y0 se mantiene constante. Por ejemplo,
si la funcion temperatura T (t, x) depende del tiempo t y del desplazamiento en la direccion de x,
entonces la derivada parcial de T respecto de t en el punto (t0 , x0 ) representa la tasa de cambio
de la temperatura con el tiempo manteniendo constante la posicion.
La interpretacion geometrica es la siguiente: denotemos por z = f (x, y) la grafica de f ;
entonces la derivada parcial respecto de x en un punto (x0 , y0 ) representa la pendiente de la
recta tangente a la curva z = f (x, y0 ) en el punto (x0 , y0 , f (x0 , y0 )), es decir, la pendiente de la
tangente a la curva interseccion de la grafica de f con el plano y = y0 .
De modo analogo, la parcial respecto de y en el punto (x0 , y0 ) representa la pendiente de la
tangente a la curva interseccion de la grafica de f con el plano x = x0 .
Si existen las derivadas parciales respecto de x y de y en un punto (x0 , y0 ) entonces el vector
fila  
f f
f (x0 , y0 ) = (x0 , y0 ), (x0 , y0 ) R2
x x
se llama vector gradiente de f en (x0 , y0 ).

Plano tangente.
La interpretacion geometrica de las derivadas parciales motiva la idea de definir el plano
tangente a la superficie z = f (x, y) definida por la grafica de un campo escalar f : R2 R
en un punto (x0 , y0 , z0 ) como el plano que pasa por (x0 , y0 , z0 ) y contiene a las rectas tangentes
definidas por (f /x)(x0 , y0 ) y (f /y)(x0 , y0 ) respectivamente.
Recordemos que la ecuacion de la recta tangente a la grafica de una una funcion f : R R
en un punto (x0 , f (x0 )) es y f (x0 ) = f 0 (x0 )(x x0 ). La ecuacion del plano tangente es similar:

f f
z z0 = (x0 , y0 ) (x x0 ) + (x0 , y0 ) (y y0 ), z0 = f (x0 , y0 ).
x y
36 Captulo 5. Continuidad y calculo diferencial de funciones de varias variables

Notese que si hacemos y = y0 entonces la interseccion del plano tangente con el plano y = y0
es precisamente la recta tangente a la interseccion de la grafica de f con dicho plano.
Por ejemplo, calculemos la ecuacion del plano tangente a la grafica de f (x, y) = x2 + y 2 + y
en el punto (1, 0, 1). Como fx (x, y) = 2x, fy (x, y) = 2y + 1, resulta:

z 1 = fx (1, 0)(x 1) + fy (1, 0)(y 0) = 2(x 1) + y 2x + y z = 1.

La ecuacion del plano tangente a f en el punto (x0 , y0 , z0 ), donde z0 = f (x0 , y0 ), tambien


se puede escribir en la forma:

z = f (x0 , y0 ) + f (x0 , y0 ) (x x0 , y y0 ).

5.3. Diferenciabilidad.
El plano tangente motiva la idea para extender el concepto de funcion diferenciable en un
punto a funciones de varias variables. Recordemos que una funcion f : R R es derivable en un
punto x0 si la recta tangente y = r(x) es una buena aproximacion de la grafica de f en puntos
cercanos a (x0 , f (x0 )):
f (x) f (x0 ) f (x) [f (x0 ) + f 0 (x0 )(x x0 )]
lm = f 0 (x0 ) lm = 0
xx0 x x0 xx0 x x0
f (x) r(x)
lm =0
xx0 x x0
De alguna manera esto quiere decir que, cuando x tiende a x0 , f (x) se aproxima a r(x) con
mayor rapidez.
Para funciones f : R2 R una funcion sera diferenciable en un punto (x0 , y0 ) si el plano
tangente en el punto (x0 , y0 , f (x0 , y0 )) es una buena aproximacion de la grafica de f . Por analoga
con el caso anterior, se tiene que f es diferenciable si existen las derivadas parciales fx (x0 , y0 ),
fy (x0 , y0 ) y ademas:
f (x, y) [f (x0 , y0 ) + f (x0 , y0 ) (x x0 , y y0 )]
lm = 0.
(x,y)(x0 ,y0 ) k(x, y) (x0 , y0 )k
Si ocurre esto, se define la diferencial de f en (x0 , y0 ) como el vector gradiente:
 
f f
Df (x0 , y0 ) = f (x0 , y0 ) = (x0 , y0 ), (x0 , y0 ) .
x y
Se dice que f : R2 R es diferenciable en P = (x0 , y0 ) R2 si existen las derivadas
parciales en P y el lmite anterior es 0. Una condicion suficiente mas facil de comprobar es la
siguiente:

Teorema 5.1 (Condicion suficiente de diferenciabilidad) Sea A un subconjunto abierto


de R2 y sea f : A R un campo escalar. Si existen las derivadas parciales en todo punto de A
y son continuas entonces f es diferenciable en todos los puntos de A.
5.3. Diferenciabilidad. 37

En general, sea f : Rn R y P Rn . Si existen las derivadas parciales y son continuas


entonces f es diferenciable en P . Se define la diferencial de f en P como el vector gradiente
 
f f f
Df (P ) = f (P ) = (P ), (P ), . . . , (P ) .
x1 x2 xn

Por ejemplo, si f : R3 R esta definida por f (x, y, z) = xyz sen(xy) + z entonces el


gradiente en (x, y, z) es

f (x, y, z) = (yz y cos(xy), xz x cos(xy), xy + 1) .

Para el punto P = (/2, 1, 1),


   
f , 1, 1 = 1, , + 1 .
2 2 2

Por el momento hemos definido el concepto de diferencial para campos escalares. Si queremos
extender este concepto a funciones vectoriales f : Rn Rp , usaremos de nuevo las componentes
f1 , f2 , . . . , fp .
Recordemos que si f : R Rp entonces la derivada se defina como el vector formado por
las derivadas de las componentes. Escribiremos esta diferencial como vector columna:

f10 (x0 )

f20 (x0 )
Df (x0 ) = f 0 (x0 ) = .

..
.
fp0 (x0 )

Si f : Rn Rp y P Rn entonces diremos que f es diferenciable en P si cada una de las


componentes de f es diferenciable en P . Se define la diferencial de f en P como la matriz cuyas
filas son los vectores gradiente de cada una de las componentes:

f1 f1 f1
x1 (P ) x2 (P ) xn (P )
f1 (P )
f2 f2 f2
f2 (P )
x1 (P ) x2 (P ) xn (P )


Df (P ) = = .

..
. .. .. .. ..
. . . .

fp (P )

fp fp fp
x1 (P ) x2 (P ) xn (P )

Observese que si f : Rn Rp entonces la diferencial en cada punto es una matriz con p


filas y n columnas. Esta matriz tambien se llama matriz jacobiana o matriz de las derivadas
parciales. Cada elemento aij = fi /xj (P ) representa la tasa de variacion instantanea de la
componente fi respecto de la variable xj en el punto P .
Ejemplo: Sea f : R3 R2 definida por f (x, y, z) = (xyz, sen(xy) + z). Vamos a calcular
la diferencial de f en el punto (0, 1, 2). Para ello necesitamos las derivadas parciales de las
componentes f1 (x, y, z) = xyz, f2 (x, y, z) = sen(xy) + z.
38 Captulo 5. Continuidad y calculo diferencial de funciones de varias variables

f1 f1 f1
= yz ; = xz ; = xy ;
x y z
f2 f2 f2
= y cos(xy) ; = x cos(xy) ; = 1.
x y z
Entonces:
!
yz xz xy
 
2 0 0
Df (x, y, z) = = Df (0, 1, 2) = .
y cos(xy) x cos(xy) 1 1 0 1

Propiedades.
1. Si f : Rn Rp es diferenciable en P entonces f es continua en P .
2. Si f : Rn Rp y g : Rn Rp son funciones diferenciables en P y , R entonces
(f + g) es diferenciable en P y D(f + g)(P ) = Df (P ) + Dg(P ).

5.4. Regla de la cadena.


Como en el caso de funciones escalares de una variable, una herramienta fundamental del
calculo de la diferencial es la regla de la cadena.
Sean f : Rn Rp , g : Rp Rq dos funciones. Si f es diferenciable en P y g es diferenciable
en f (P ) entonces (g f ) es diferenciable en P y ademas
D(g f )(P ) = Dg(f (P ))Df (P ).
Notese que el producto de matrices esta bien definido porque Dg(f (P )) tiene p columnas y
Df (P ) tiene p filas.
Ejemplo: Sea f : R3 R2 definida por f (x, y, z) = (xyz, sen(xy) + z). Sea g : R2 R2 definida
por g(u, v) = (uv 2 , v eu ). Vamos a calcular la diferencial de g f en el punto (0, 1, 2). Por la regla
de la cadena, teniendo en cuenta que f (0, 1, 2) = (0, 2), se tiene:
D(g f )(0, 1, 2) = Dg(0, 2)Df (0, 1, 2).
Ya hemos calculado  
2 0 0
Df (0, 1, 2) = .
1 0 1
A continuacion calculamos Dg(0, 2).
Du (uv 2 ) Dv (uv 2 )
   2   
v 2uv 4 0
Dg(u, v) = = = Dg(0, 2) =
Du (v eu ) Dv (v eu ) v eu eu 2 1
Finalmente,
    
4 0 2 0 0 8 0 0
D(g f )(0, 1, 2) = Dg(0, 2)Df (0, 1, 2) = = .
2 1 1 0 1 5 0 1
5.4. Regla de la cadena. 39

5.4.1. Regla de la cadena: una variable independiente


Sea f : R3 R un campo escalar y c : R R3 una curva diferenciable en R3 . Consideremos
la funcion f sobre la curva, es decir, g(t) = f (c(t)). Denotemos c(t) = (x(t), y(t), z(t)).
Entonces, por la regla de la cadena,
f f f
g 0 (t) = f (c(t)) c0 (t) = (c(t)) x0 (t) + (c(t)) y 0 (t) + (c(t)) z 0 (t).
x y z

La formula g 0 (t) = f (c(t)) c0 (t) se extiende de forma natural al caso g(t) = f (c(t)), con
f : Rn R y c : R Rn . En este caso, se tiene la relacion
f 0 f 0 f 0
g 0 (t) = x1 (t) + x2 (t) + + x (t).
x1 x2 xn n
Las variables x1 , x2 , . . . , xn son variables dependientes y t es la variable independiente.

Ejemplo. Un cilindro circular recto vara de tal manera que su radio r crece a razon de 3 cm/hora
y su altura decrece a razon de 5 cm/hora. Calcular la tasa de variacion de su volumen cuando
r = 3 cm y h = 4 cm.
El volumen es V (r, h) = r2 h. El radio r y la altura h son variables dependientes y t es la
variable independiente (el diagrama de dependencias se muestra en la figura 5.1).
Las tasas de variacion son r0 (t) = 3, h0 (t) = 5. Entonces:

V 0 V 0
V 0 (t) = r (t) + h (t) = 2rhr0 (t) + r2 h0 (t) = 6rh 5r2 .
r h
Para r = 3 y h = 4, V 0 (t) = 72 45 = 27, es decir, el volumen crece a la razon de 27
cm3 /hora.

V
@
@
Variables dependientes r h

Variable independiente t t

Figura 5.1: Diagrama de dependencias para el volumen.

A continuacion veremos dos aplicaciones de la regla de la cadena: la relacion entre el gra-


diente y las curvas de nivel y las derivadas direccionales.
Gradiente y curvas de nivel.
Consideremos un campo escalar en el plano f : R2 R.

Proposicion 5.1 Si f es diferenciable en (x0 , y0 ) entonces el gradiente de f en (x0 , y0 ) es


ortogonal a la curva de nivel que pasa por (x0 , y0 ).
40 Captulo 5. Continuidad y calculo diferencial de funciones de varias variables

Demostracion. Sea c(t) = (x(t), y(t)) la curva de nivel que pasa por (x0 , y0 ). Para un cierto
t0 , c(t0 ) = (x0 , y0 ) y por tanto el vector tangente a la curva de nivel en (x0 , y0 ) es c0 (t0 ).
Como g(t) = f (c(t)) = K para una constante K, usando la regla de la cadena se tiene:

0 = g 0 (t) = f (c(t)) c0 (t) .

Para t = t0 , c(t0 ) = (x0 , y0 ) y por tanto:

f (x0 , y0 ) c0 (t0 ) = f (c(t0 )) c0 (t0 ) = 0.

Esto quiere decir que el gradiente de f en (x0 , y0 ) es ortogonal a la curva de nivel. t


u

Usando que el gradiente es un vector normal, la ecuacion de la recta tangente a la curva de


nivel en el punto (x0 , y0 ) se puede expresar en la forma

f (x0 , y0 ) (x x0 , y y0 ) = 0.

Este resultado se puede aplicar al calculo de la recta tangente a una curva dada en forma
implcita.
Ejemplo. Calcular la recta tangente a la circunferencia x2 + y 2 = 2 en el punto (1, 1).
La circunferencia es una curva de nivel del campo f (x, y) = x2 +y 2 . En este caso, f (1, 1) =
(2, 2) y por tanto la ecuacion es

(2, 2) (x 1, y 1) = 0 y = 2 x.

Gradiente y derivadas direccionales.


Sean f : Rn R un campo escalar, P Rn y u Rn un vector unitario, es decir kuk = 1.
Se considera la recta y(t) = P + tu que pasa por P y tiene la direccion de u. Sea g(t) = f (P + tu)
la accion del campo f sobre la recta. Se define la derivada direccional de f en P segun el
vector u como g 0 (0) = f (P ) u. La derivada direccional mide la tasa de cambio de f en la
direccion de u.
Por ejemplo, la derivada direccional de f (x, y) = x2 y + y 3 en el punto (2, 1) en la direccion
de u = (1, 1) es
 
u 1/2 11
D~u f (2, 1) = f (2, 1) = (4, 7) = ,
kuk 1/ 2 2
ya que f (x, y) = (2xy, x2 + 3y 2 ).

Direccion de maximo crecimiento. Sea f : Rn R un campo escalar diferenciable. Si


f (P ) 6= 0 entonces el maximo valor de la derivada direccional se alcanza para el vector unitario
en la direccion del gradiente
f (P )
u= .
kf (P )k
Es decir, el gradiente de f apunta en la direccion de Rn en la que f crece mas rapidamente.
5.4. Regla de la cadena. 41

La demostracion de esta propiedad para n = 2 se basa en la formula del producto escalar.


La derivada direccional en la direccion de un vector unitario u es

f (P ) u = kf (P )k kuk cos() = kf (P )k cos(),

donde es el angulo entre f (P ) y u. Claramente, la derivada direccional alcanza su maximo


valor cuando cos() = 1, es decir, cuando u apunta en la direccion y sentido del gradiente.
Observese que el mismo razonamiento indica que la direccion de crecimiento mnimo es
la opuesta del gradiente, es decir, f (P ). As, el valor maximo de la derivada direccional es
kf (P )k y el mnimo es kf (P )k.
Para n arbitrario, la propiedad se basa en que para x, y Rn se cumple siempre que

x y kxk kyk,

y la igualdad solo se cumple cuando x e y tienen la misma direccion y sentido (es decir, y = x,
con > 0).

Ejemplo. Hallar la direccion de maximo crecimiento del campo escalar f (x, y) = x2 + y 2 en el


punto (1, 1).
f (x, y) = (2x, 2y) = f (1, 1) = (2, 2).

La direccion de maximo crecimiento es la del vector unitario v = (1/ 2, 1/ 2).

En fsica, una de las aplicaciones es que el campo electrico es ortogonal a las curvas equi-
potenciales. En el siguiente ejemplo vemos otra aplicacion al flujo de calor.

Ejemplo. Consideremos una placa cuadrada [0, 5] [0, 5] y supongamos que la temperatura en
un punto (x, y) es T (x, y) = x2 + y 2 /4. Calcular en que sentido ira el flujo de calor C(x, y) en el
punto (2, 4).
Teniendo en cuenta que el calor fluye de puntos de mayor temperatura a puntos de menor
temperatura y lo hace en direccion perpendicular a las isotermas, se tiene que

C(x, y) = k T (x, y),

donde k es una constante llamada conductividad termica del medio. En este caso T (x, y) =
(2x, y/2) y por tanto
C(2, 4) = k T (2, 4) = k(4, 2).
 
2 1
Por tanto, el calor fluye en el sentido del vector unitario u = , .
5 5

5.4.2. Regla de la cadena: varias variables independientes


Supongamos que z = f (x, y), donde x e y dependen de u y v, es decir, z = f (x(u, v), y(u, v)).
Si f es diferenciable y existen las derivadas parciales de x = x(u, v) e y = y(u, v) respecto
de u y v entonces se pueden calcular las derivadas parciales de z respecto de u y v del siguiente
modo:
42 Captulo 5. Continuidad y calculo diferencial de funciones de varias variables

z f x f y z f x f y
= + ; = + .
u x u y u v x v y v
En este caso, el diagrama de dependencias sera el mostrado en la figura 5.2:
z
@
@
Variables dependientes x y
A A
 A  A
Variables independientes u v u v

Figura 5.2: Diagrama de dependencias para dos variables dependientes y dos independientes.

Estas formulas se extienden de manera natural al caso de un numero arbitrario de variables


dependientes y variables independientes: si y = f (x1 , x2 , . . . , xn ) y xi = xi (u1 , u2 , . . . , up ) para
cada i = 1, 2, . . . , n, entonces, para cada j = 1, 2, . . . , p,

y f x1 f x2 f xn
= + + + .
uj x1 uj x2 uj xn uj

5.5. Derivacion implcita.


Ya hemos descrito en la seccion 3.6 del captulo 3 como derivar de forma implcita una
expresion F (x, y) = 0, donde y = y(x). Este proceso se puede generalizar a funciones de mas
variables dependientes e independientes utilizando la forma general de la regla de la cadena.
Describimos el proceso para una expresion con tres variables x, y, z en las que una de
ellas se despeja en funcion de las otras dos (z = z(x, y)). En este caso tenemos una expresion
F (x, y, z) = 0 que define implcitamente una funcion z : R2 R dada por z = z(x, y). Es posible
calcular las derivadas parciales de z respecto de x e y sin necesidad de despejar z (lo cual es a
veces imposible).
En este caso, el diagrama de dependencias sera el mostrado en la figura 5.3:
F
@
@
x y z
A
 A
x y

Figura 5.3: Diagrama de dependencias para derivacion implcita.

Teniendo en cuenta que F es la funcion cero en el conjunto que nos interesa, las parciales
de F con respecto a x e y deben ser cero tambien. Por tanto, usando la regla de la cadena:
5.6. Derivadas parciales de orden superior. 43

F F z z F /x


+ = 0 = =
x
z x x F /z

F F z z F /y

+ = 0 = = .
y z y y F /z

Ejemplo. Sabiendo que la expresion xy 2 + z 2 + sen(xz) = 1 define implcitamente una funcion


z = f (x, y) en un entorno de (x, y) = (0, 1) con z > 0, calcular f (0, 1).

Se considera la funcion auxiliar F (x, y, z) = xy 2 + z 2 + sen(xz) 1.

F F F
= y 2 + z cos(xz) ; = 2xy ; = 2z + x cos(xz) .
x y z
Por tanto,
z y 2 + z cos(xz) z 2xy
= ; = .
x 2z + x cos(xz) y 2z + x cos(xz)
Para x = 0, y = 1, se tiene que z 2 = 1 y por tanto (como z > 0), z = 1. As,
 
z z
f (0, 1) = (0, 1), (0, 1) = (1, 0).
x y

5.6. Derivadas parciales de orden superior.


f
Sea f : Rn R un campo escalar. Si las derivadas parciales x i
son funciones derivables
entonces se pueden definir las derivadas parciales segundas (o de segundo orden). Se define la
derivada parcial segunda de f respecto de xi y de xj como

2f
 
f
= .
xj xi xj xi

Ejemplo. Sea f (x, y) = xy + x2 y 2 + yex entonces

f f
= y + 2xy 2 + yex ; = x + 2x2 y + ex .
x y
Por tanto, las derivadas parciales segundas son:

2f 2f
   
f 2 x f
= = 2y + ye ; = = 1 + 4xy + ex ;
x2 x x yx y x
2f 2f
   
f 2 f
= = 2x ; = = 1 + 4xy + ex .
y 2 y y xy x y

Un campo f : Rn R es de clase C 1 si existen las derivadas parciales primeras y son


continuas. Si existen las derivadas parciales segundas y son continuas, se dice que f es de clase
44 Captulo 5. Continuidad y calculo diferencial de funciones de varias variables

C 2 . De modo analogo se definen las derivadas de orden superior a 2 y las funciones de clase C k
para k > 2.
Por ejemplo, para la funcion del ejemplo anterior,
3f 2f 3f 2f
   
2 x x 2 x
= yex .
 
= = 2y + ye = 4y + e ; = = 2y + ye
yx2 y x2 y x3 x x2 x
Para funciones de clase C 2 , las derivadas cruzadas no dependen del orden de derivacion:
Teorema 5.2 (Teorema de las derivadas cruzadas) Sea f : Rn R un campo escalar de
clase C 2 . Entonces, para cada par de variables independientes xi , xj , se cumple que
2f 2f
= .
xj xi xi xj

Este teorema se extiende a derivadas de orden superior. Si una funcion es de clase C k su


derivada parcial kesima con respecto de k variables es independiente del orden de derivacion.

Matriz hessiana.
Sea f : Rn R un campo escalar de clase C 2 . Se llama matriz hessiana de f a la matriz
2f
cuadrada Hf (x) de tamano n n que tiene en el lugar (i, j) la derivada parcial segunda ,
xi xj
es decir,
2f 2f 2f

2 x1 x2 x1 xn
x1
2f 2f 2f


x2 x1 x2 2
x2 xn
Hf (x) = .

.
.. .
.. . .. .
..



2f 2f 2f
xn x1 xn x2 x2 n

En cada punto P Rn ,
2f 2f 2f

x21
(P ) x1 x2 (P ) x1 xn (P )

2f 2f 2f


x2 x1 (P ) x22
(P ) x2 xn (P )

Hf (P ) = Mnn (R) .

.. .. .. ..

. . . .

2f 2f 2f
xn x1 (P ) xn x2 (P ) x2
(P )
n

En virtud del teorema de las derivadas cruzadas, Hf (P ) es una matriz simetrica.


La forma cuadratica : Rn R definida por (x) = xt H0 x, donde H0 = Hf (P ), se llama
diferencial segunda de f en P .
Por ejemplo, para la funcion f (x, y) = xy + x2 y 2 + yex del ejemplo anterior, la matriz
hessiana es
2
2f

f
2y 2 + yex 1 + 4xy + ex
!
x2 xy
Hf (x, y) = 2 = .
f 2f 1 + 4xy + ex 2x2
yx 2 y
5.7. Extremos locales y globales de un campo escalar. 45

La matriz hessiana en el punto (0, 1) es


!
3 2
Hf (0, 1) = .
2 0

La diferencial segunda de f en (0, 1) esta definida por


! !
3 2 x
(x, y) = (x, y) = 3x2 + 4xy.
2 0 y

Recordemos que una forma cuadratica en Rn es una aplicacion : Rn R definida por


n
X
(x) = xt Ax = aij xi xj ,
i,j=1

donde A = (aij ) Mnn (R) es una matriz simetrica.


La clasificacion de formas cuadraticas permite establecer la siguiente clasificacion de matri-
ces simetricas: Sea A Mnn (R) una matriz simetrica. Diremos que

A es definida positiva si xt Ax > 0 , x 6= 0,

A es definida negativa si xt Ax < 0 , x 6= 0,

A es indefinida si existen dos vectores x, y Rn tales que xt Ax > 0 , y t Ay < 0.

Si A es simetrica y |A| =
6 0 entonces se puede determinar si A es definida positiva, definida
negativa o indefinida analizando el signo de los menores principales de la matriz.

Teorema 5.3 Supongamos que A es simetrica y |A| =


6 0. Entonces:

(a) Si todos los menores principales de A son positivos entonces A es definida positiva.

(b) Si los menores principales de orden impar son negativos y los de orden par son positivos
entonces A es definida negativa.

(c) En cualquier otro caso, A es indefinida.

Utilizaremos este resultado en la siguiente seccion.

5.7. Extremos locales y globales de un campo escalar.


Recordemos que los extremos locales de funciones escalares de una variable se detectan
igualando a cero la derivada primera, y en la mayora de los casos se determina si es maximo
local o mnimo local utilizando el signo de la derivada segunda. Por ejemplo, f (x) = x2 alcanza
un mnimo local en x = 0 porque f 0 (0) = 0 y f 00 (0) > 0, lo que quiere decir que la recta tangente
a la grafica de f en (0, 0) es horizontal y que f es convexa.
46 Captulo 5. Continuidad y calculo diferencial de funciones de varias variables

Estos argumentos se pueden generalizar a campos escalares en Rn . En primer lugar, intro-


ducimos la definicion de maximo y mnimo local.
Sea f : D Rn R un campo escalar definido en un subconjunto D de Rn . Se dice
que f alcanza un maximo local en un punto P D si existe un entorno B0 de P tal que
f (x) f (P ), x B0 .
La definicion de mnimo local se obtiene cambiando el sentido de la desigualdad en la
definicion anterior. Diremos que P es un punto de extremo local para f si f alcanza en P un
maximo local o un mnimo local.
Observacion: Un entorno del punto P se puede definir como la interseccion de una bola abierta
centrada en P con el dominio de definicion D.

Teorema 5.4 (Condicion necesaria de extremo local) Sea f : D Rn R un campo


escalar de clase C 1 definido en un subconjunto abierto D de Rn . Si f alcanza en P D un
extremo local entonces f (P ) = (0, 0, . . . , 0).

Notese que si f : R2 R es un campo escalar en el plano, la condicion anterior es equivalente


a decir que el plano tangente a la grafica de f en el punto (P, f (P )) es paralelo al plano horizontal
XY . (Esta dado por la ecuacion z = z0 , donde z0 = f (P ).)
Por tanto, los extremos locales de f se buscaran entre los puntos que tienen gradiente cero
o aquellos donde f no es diferenciable. Estos puntos se llaman puntos crticos de f .
Si f (P ) = (0, 0, . . . , 0) pero f no alcanza un extremo en P , entonces se dice que f tiene
en P un punto de silla. En estos puntos, la grafica de f crece en algunas direcciones cerca de
P y decrece en otras. En la figura 5.4 se presentan cuatro ejemplos en los que f tiene un punto
crtico en (0, 0): dos extremos locales y dos puntos de silla.
Observacion: El teorema solo vale para conjuntos abiertos. Si el dominio de definicion de f no
es abierto, el resultado se puede usar para encontrar los puntos crticos del interior de D. Los
posibles extremos locales en la frontera hay que determinarlos de otro modo.

Ejemplo. Calcular los puntos crticos de la funcion f : R2 R dada por f (x, y) = 4x3 12xy+y 2 .

y = x2
 
2
f (x, y) = (12x 12y, 12x + 2y) = (0, 0)
6x = y

Por tanto,
x2 = y = 6x = x2 6x = 0 = x(x 6) = 0.

Las unicas races reales son x = 0, x = 6. Como y = x2 , se obtienen los puntos crticos (0, 0) y
(6, 36).

Al igual que las derivadas segundas de f permiten obtener condiciones suficientes para
asegurar que un punto crtico es un maximo o un mnimo local para funciones de una variable,
la diferencial segunda juega ese papel para campos escalares en Rn . La razon es que si la mejor
aproximacion de grado 2 para una funcion f : R R cerca de un punto x0 es el polinomio de
5.7. Extremos locales y globales de un campo escalar. 47

10 10
0
0
-10
-10
0

300

-100

200

-200

100

-300

0
-10

-10
0
0

10 10

Mnimo: f (x, y) = x2 + y2 Maximo: f (x, y) = x2 y 2

2 2
1 1
0 0
-1
-1
-2
-2

20

-20

-2 -2
0 0
2 2

Silla clasica: f (x, y) = x2 y 2 Silla de mono: f (x, y) = x3 3xy 2

Figura 5.4: En las cuatro graficas (0, 0) es un punto crtico de f . En las superiores f alcanza en
(0, 0) un extremo local y en las inferiores sendos puntos de silla.

Taylor p2 (x) = f (x0 ) + f 0 (x0 )(x x0 ) + (1/2)f 00 (x0 )(x x0 )2 , para funciones f : Rn R la
mejor aproximacion de grado 2 viene dada por
1
f (x) q(x) = f (P ) + f (P ) (x P ) + (x P )t (Hf (P )) (x P ).
2
Por tanto, cuando f (P ) = (0, 0, . . . , 0), lo que determina el signo de f (x) f (P ) para puntos x
proximos a P es el signo de la forma cuadratica (x) = xt Hx, donde H = Hf (P ) Mnn (R).

Teorema 5.5 (Criterio de la derivada segunda para extremos locales) Sea f un cam-
po escalar de clase C 2 definido en un subconjunto abierto D de Rn . Supongamos que P D es
un punto crtico de f , es decir, f (P ) = (0, 0, . . . , 0).

1. Si la matriz H = Hf (P ) es definida positiva entonces f alcanza en P un mnimo local.

2. Si la matriz H = Hf (P ) es definida negativa entonces f alcanza en P un maximo local.


48 Captulo 5. Continuidad y calculo diferencial de funciones de varias variables

3. Si el determinante de H no es cero y la matriz H = Hf (P ) es indefinida entonces f


alcanza en P un punto de silla.

Ejemplo. Calcular los extremos locales del campo escalar f : R2 R definido por

f (x, y) = 4x3 12xy + y 2 .

Ya hemos visto que los puntos crticos son (0, 0) y (6, 36). La matriz hessiana es
2
2f

f !
x2 xy 24x 12
Hf (x, y) = 2 = .
f 2f 12 2
yx 2
y

Para (0, 0), los menores principales son



0 12
1 = 0 ; 2 = |Hf (0, 0)| = = 144 < 0.

12 2

Por tanto, Hf (0, 0) es indefinida y f tiene un punto de silla en (0, 0).


Por otra parte, para (6, 36),

144 12
1 = 144 > 0 ; 2 = |Hf (6, 36)| = = 144 > 0.

12 2

Como Hf (6, 36) es definida positiva, f alcanza un mnimo local en (6, 36).

Observacion: Los puntos crticos de f para los que |Hf (P )| =


6 0 se llaman puntos crticos no
degenerados. Los puntos crticos degenerados se suelen examinar directamente. Por ejemplo,
la silla de mono de la figura 5.4 es punto crtico degenerado. Para deducir que es un punto de
silla basta observar que f restringida a la recta y = 0 es la funcion escalar f (x, 0) = x3 , que es
una funcion creciente, por lo que no puede haber ni un maximo ni un mnimo local en (0, 0).

Maximos y mnimos globales.


Sea f : D Rn R un campo escalar definido en un conjunto D de Rn . Sea P D. Se
dice que f alcanza en P su maximo global (o maximo absoluto) en D si f (P ) f (x), x D.
De modo analogo se define el mnimo global (cambiando de sentido la desigualdad). El siguiente
resultado es similar al de existencia de extremos absolutos en intervalos compactos de R.

Teorema 5.6 (Existencia de extremos globales) Sea f : D Rn R un campo escalar


definido en un conjunto D de Rn . Si D es compacto y f es continua entonces f alcanza en D
su maximo global y su mnimo global.

Para localizar los etremos absolutos de f se siguen estos pasos:

1. Localizar los puntos crticos de f en el interior de D.


5.7. Extremos locales y globales de un campo escalar. 49

2. Hallar los extremos de f considerada como funcion definida en la frontera de D.

3. Calcular el valor de f en todos los puntos crticos y seleccionar el mayor y el menor.

Ejemplo. Calcular los extremos globales del campo escalar f (x, y) = x2 + 3x + y 2 + 1 en la region

D = (x, y) R2 / (x + 1)2 + y 2 1 .


La region D representa un disco cerrado de centro (1, 0) y radio 1. Por tanto D es com-
pacto.
En primer lugar, calculamos los puntos crticos de f en el interior de D.

3
f (x, y) = (2x + 3, 2y) = (0, 0) x = , y = 0.
2

El unico punto crtico en el interior de D es (3/2, 0).


En la frontera, como y 2 = 1 (x + 1)2 , se tiene:

g(x) = f (x, y) = x2 + 3x + 1 + (1 (x + 1)2 ) = x2 + 3x + 2 x2 2x 1 = x + 1, x [2, 0].

Como g es creciente, el mnimo se alcanza para x = 2 y el maximo para x = 0. Los extremos


locales de f en la frontera se alcanzan en (2, 0) y (0, 0).
Finalmente, como

5
f (3/2, 0) = , f (2, 0) = 1 , f (0, 0) = 1 ,
4

se deduce que el maximo global se alcanza en (0, 0) y el mnimo global se alcanza en (3/2, 0).
y

x
2 3/2 0

Figura 5.5: Dominio D y los puntos crticos de f en el interior y la frontera.


50 Captulo 5. Continuidad y calculo diferencial de funciones de varias variables

5.8. Extremos condicionados. Multiplicadores de Lagrange.


En muchas ocasiones hay que maximizar o minimizar una funcion sujeta a ciertas restric-
ciones; es lo que se conoce con el nombre de extremos condicionados. Por ejemplo, queremos
hallar el maximo valor que toma una funcion f : R2 R entre todos los puntos (x, y) que tienen
norma 1. Una de las tecnicas mas efectivas para abordar este tipo de problemas es el metodo de
los multiplicadores de Lagrange. Para motivarlo, consideremos el siguiente ejemplo:

Ejemplo. Calcular el punto de la recta y = 2 x mas proximo a (0, 0).

y
y =2x

r=3

x
r=2
r=1

Figura 5.6: Grafica de y = 2 x y las curvas de nivel x2 + y 2 = r.

La funcion que hay que minimizar es el cuadrado de la distancia de (x, y) a (0, 0), es decir,

f (x, y) = x2 + y 2 . Trazamos las circunferencias x2 + y 2 = r de centro (0, 0) y radio r, que son
las curvas de nivel de f . En la figura 5.6 se observa que para valores pequenos de r (r = 1/2,
r = 1) las curvas de nivel no intersecan a la recta, lo cual quiere decir que no hay puntos de la
recta a esa distancia de (0, 0); para valores grandes (r = 3), hay dos puntos de interseccion, pero
hay puntos de la recta dentro del disco de radio r, lo que indica que hay puntos de la recta que

distan del origen menos que r. El mnimo corresponde a la primera curva de nivel que corta a
la recta, que coincide con la circunferencia centrada en el origen que es tangente a la recta.
Para calcular el valor de r, observese que un vector perpendicular a las curvas de nivel es
el gradiente f (x, y) = (2x, 2y). Por otra parte, la recta y = 2 x es una curva de nivel de la
funcion g(x, y) = x + y, y por tanto g(x, y) = (1, 1) debe ser perpendicular a la recta. Como
f y g son perpendiculares a la recta en el punto P = (x0 , y0 ) donde se alcanza el mnimo,
deben tener la misma direccion; por tanto, debe existir un escalar R tal que

f (x0 , y0 ) = g(x0 , y0 ).

De aqu se deduce que 2x0 = 2y0 = y por tanto x0 = y0 .


Como el punto esta sobre la recta, se cumple que y0 = 2x0 y, en consecuencia, x0 = y0 = 1.
5.8. Extremos condicionados. Multiplicadores de Lagrange. 51

El punto donde la distancia es mnima es (x0 , y0 ) = (1, 1) y la menor distancia posible es


2 (de ah que el nivel correspondiente sea r = 2, como se observa en la figura).
Este ejemplo se generaliza a campos escalares en Rn para definir el metodo de los multipli-
cadores de Lagrange.

Teorema 5.7 (Teorema de los multiplicadores de Lagrange)


Supongamos que f : Rn R y g : Rn R son dos funciones de clase C 1 y

g(x1 , x2 , . . . , xn ) 6= (0, 0, . . . , 0) si g(x1 , x2 , . . . , xn ) = 0.

Si P Rn es un punto de maximo o mnimo local de f sujeto a la restriccion g(x1 , . . . , xn ) = 0,


entonces existe un R tal que
f (P ) = g(P ).

Ejemplo 5.1 Calcular los valores maximos y mnimos de la funcion f (x, y) = x2 + 2y 2 sujetos
a la restriccion x2 + y 2 = 1.
Definimos g(x, y) = x2 + y 2 1, de modo que la restriccion se convierte en g(x, y) = 0. La
ecuacion de los multiplicadores es:
(
2x = 2x
f (x, y) = g(x, y) (2x, 4y) = (2x, 2y)
4y = 2y.

De la primera ecuacion se obtiene que x = 0 o = 1. De la segunda se obtiene que y = 0 o


= 2. Por tanto las unicas posibilidades son [x = 0, = 2] e [y = 0, = 1].
Para x = 0, como x2 + y 2 = 1, se obtienen los puntos (0, 1) y (0, 1). Para y = 0 se obtienen
los puntos (1, 0) y (1, 0).
Para determinar cuales son los valores maximos y mnimos, evaluamos f en esos puntos:

f (0, 1) = f (0, 1) = 2 ; f (1, 0) = f (1, 0) = 1 .

Por tanto, los maximos locales se alcanzan en (0, 1) y (0, 1), y los mnimos locales en (1, 0) y
(1, 0).

Observacion: El metodo de los multiplicadores de Lagrange se puede usar para determinar los
extremos globales de una funcion en un conjunto compacto; en primer lugar se calcularan los
puntos crticos en el interior igualando el gradiente a cero y luego se usara el metodo de los
multiplicadores para determinar los extremos en la frontera.
52 Captulo 5. Continuidad y calculo diferencial de funciones de varias variables

Calculo de extremos con varias restricciones.

El metodo de los multiplicadores se extiende al calculo de extremos de una funcion sujeta


a varias restricciones. El resultado general es el siguiente:

Teorema 5.8 Sean f y g1 , g2 , . . . , gk funciones de clase C 1 definidas en Rn . Si P Rn es un


punto de maximo o mnimo local de f sujeto a las restricciones
g1 (x1 , . . . , xn ) = 0
g2 (x1 , . . . , xn ) = 0
..
.
gk (x1 , . . . , xn ) = 0,
entonces existen 1 , 2 , . . . , k R tales que
f (P ) = 1 g1 (P ) + 2 g2 (P ) + + k gk (P ).

Ejemplo 5.2 Calcular las alturas maxima y mnima de la curva interseccion del plano x+y+z =
0 con la esfera x2 + y 2 + z 2 = 1.

Tenemos que encontrar los extremos de la funcion f (x, y, z) = z restringidos a la interseccion


del plano con la esfera, es decir, sujetos a las restricciones
g1 (x, y, z) = x + y + z = 0 ; g2 (x, y, z) = x2 + y 2 + z 2 1 = 0 .
Segun el resultado anterior, en los puntos de extremo deben existir , R tales que f (x, y, z) =
g1 (x, y, z) + g2 (x, y, z). Por tanto:
f (x, y, z) = g1 (x, y, z) + g2 (x, y, z) (0, 0, 1) = (1, 1, 1) + (2x, 2y, 2z)

+ 2x = 0
+ 2y = 0 2x = 2y = 1 2z .
+ 2z = 1

Es claro que 6= 0 y por tanto x = y. Como x + y + z = 0, se obtiene que z = x y = 2y.


Sustituyendo en la ecuacion x2 + y 2 + z 2 = 1, tenemos :
1
1 = x2 + y 2 + z 2 = y 2 + y 2 + (2y)2 = 6y 2 = y = .
6

Siy = 1/ 6, entonces x = 1/ 6, z = 2/ 6. Si y = 1/ 6, entonces x = 1/ 6,
z = 2/ 6. Por tanto los puntos de extremo son
   
1 1 2 1 1 2
P1 = , , ; P2 = , , .
6 6 6 6 6 6

En consecuencia, la altura maxima es z = 2/ 6 y la mnima es z = 2/ 6.
5.8. Extremos condicionados. Multiplicadores de Lagrange. 53

Condicion suficiente para la existencia de extremos condicionados.

Hay que tener en cuenta que el metodo de los multiplicadores de Lagrange detecta puntos de
tangencia, que pueden corresponder a mnimos, maximos o puntos de silla. Si la funcion objetivo
f es continua y el conjunto de puntos que cumplen las restricciones es compacto, entonces se
alcanzan el mnimo y el maximo absolutos, de modo que para saber a que puntos corresponden
de entre los que cumplen la ecuacion de multiplicadores, basta evaluar f en cada uno de ellos y
escoger los valores extremos. En otros casos se puede usar el siguiente criterio:

Proposicion 5.2 Sean f, g1 , g2 , . . . , gk funciones de clase C 2 definidas en Rn . Supongamos que


para un punto P Rn existen 1 , 2 , . . . , k R tales que

f (P ) = 1 g1 (P ) + 2 g2 (P ) + + k gk (P ).

Se considera la funcion definida por F (x) = f (x)(1 g1 (x)+2 g2 (x)+ +k gk (x)). Denotemos
por U = Ker (Dg(P )) = {x Rn / Dg(P ) x = 0} , donde g : Rn Rk es la funcion definida por
g(x) = (g1 (x), g2 (x), . . . , gk (x)). Sea H = HF (P ) la matriz hessiana de F en P y : U R la
forma cuadratica definida en U por (x) = xt Hx.
Si es definida positiva entonces P es un mnimo local de f restringido a la condicion
g(x) = (0, 0, . . . , 0).
Si es definida negativa entonces P es un maximo local de f restringido a la condicion
g(x) = (0, 0, . . . , 0).
Si es indefinida y no degenerada entonces P es un punto de silla.

El siguiente ejemplo es una adaptacion de un problema sugerido por Roberto Agromayor


Otero, antiguo alumno de la asignatura.
Ejemplo 5.3 Se desea multiplicar por 8 la presion de un gas en 3 etapas con un coeficiente de
compresion ri > 0 en cada una de ellas, de modo que r1 r2 r3 = 8.
Sabiendo que la potencia que consumen los compresores viene dada por
1 3
r1 + r23 + r33 ,

P =
3
calcular los coeficientes de compresion r1 , r2 , r3 que minimizan la potencia consumida.
Por simplificar, denotamos x = r1 , y = r2 , z = r3 . La funcion objetivo es el consumo de
potencia
1 3
x + y3 + z3 .

P (x, y, z) =
3
Claramente P es un campo escalar de clase C 2 definido en el conjunto abierto

D = {(x, y, z) R3 / x > 0, y > 0, z > 0}.

Usamos el metodo de multiplicadores de Lagrange para calcular el mnimo de P sujeto a la


restriccion
g(x, y, z) = xyz 8 = 0.
54 Captulo 5. Continuidad y calculo diferencial de funciones de varias variables

Planteamos la ecuacion de multiplicadores:


2 3
x = yz

x = xyz

2 2 2
P (x, y, z) = g(x, y, z) (x , y , z ) = (yz, xz, xy) y 2 = xz y 3 = xyz

2
3
z = xy z = xyz,

donde hemos multplicado la primera ecuacion por x, la segunda por y y la tercera por z.
Por tanto,
x3 = y 3 = z 3 = x = y = z.
Juntando esta condicion con la restriccion xyz = 8 se obtiene

x3 = y 3 = z 3 = 8 = x = y = z = 2.

Veamos que los coeficientes de compresion r1 = r2 = r3 = 2 minimizan la potencia consumi-


da. Para ello consideramos el punto (2, 2, 2) y aplicamos la condicion suficiente para extremos
condicionados.
En primer lugar, de la ecuacion x2 = yz se obtiene 4 = 42 y por tanto = 1. Definimos
la funcion
1 3
x + y 3 + z 3 xyz + 8.

F (x, y, z) = P (x, y, z) g(x, y, z) =
3
Teniendo en cuenta que F (x, y, z) = (x2 yz, y 2 xz, z 2 xy), calculamos la matriz hessiana:

2x z y 4 2 2
HF (x, y, z) = z 2y x = HF (2, 2, 2) = 2 4 2 .
y x 2z 2 2 4

Los menores principales de HF (2, 2, 2) son 1 = 4, 2 = 12, 3 = 0, que no permiten clasificar


el punto crtico. Restringimos la forma cuadratica al subespacio

U = Ker (g(2, 2, 2)) = Ker (4, 4, 4) = (x, y, z) R3 / x + y + z = 0 = {(x, y, x y) / x, y R} .




Para los vectores de U la forma cuadratica se expresa como:



4 2 2 x
(x, y, x y) = (x, y, x y) 2 4 2 y =
2 2 4 x y

= 4x2 + 4y 2 + 4(x y)2 4xy 4x(x y) 4y(x y) =


  
2 2 12 6 x
= 12x + 12y + 12xy = (x, y) .
6 12 y

Como los menores principales de la matriz resultante son 1 = 12 > 0, 2 = 108 > 0, es
definida positiva y en el punto (2, 2, 2) se alcanza el mnimo de la potencia P (x, y, z) condicionado
a la igualdad xyz = 8.
Referencias

Gerald L. Bradley y Karl J. Smith, Calculo de una y varias variables (dos volume-
nes), Prentice Hall, 1998.

Serge Lang, Calculo, Addison-Wesley Iberoamericana, 1990.

Jerrold E. Marsden y Anthony J. Tromba, Calculo vectorial, 5a. ed., Pearson,


2004.

Jon Rogawski, Calculo: Varias variables, Reverte, 2012.

James Stewart, Calculo. Conceptos y contextos, 4a. ed., Thompson, 2010.

You might also like