Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Calculo 3 curvas d nivel

583 views

Published on

calculo vectorial.

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

Calculo 3 curvas d nivel

  1. 1. NOTAS DE CLASE CÁLCULO III Doris Hinestroza Diego L. Hoyos 1
  2. 2. Índice general 1. Funciones Vectoriales 5 1.1. El Espacio Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2. Funciones Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2.1. Operaciones algebraicas. . . . . . . . . . . . . . . . . . . 8 1.2.2. Límites, derivadas e integrales. . . . . . . . . . . . . . . 9 1.2.2.1. Teoremas básicos . . . . . . . . . . . . . . . . . 10 1.3. Curvas y Tangentes . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.4. Longitud de arco y reparametrización de una curva. . . . . . . 14 1.5. Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.5.1. Triedro de Frenet . . . . . . . . . . . . . . . . . . . . . . 19 1.5.2. El vector aceleración. . . . . . . . . . . . . . . . . . . . 20 1.5.3. *Ecuaciones de Frenet para una curva plana. . . . . . . 21 2. Campos Escalares en R2 y R3 24 2.1. Gráfica de z = f(x, y). Curvas y superficies de nivel. . . . . . . 24 2.1.1. Superficies cuádricas. . . . . . . . . . . . . . . . . . . . . 31 2.2. Límites y Continuidad . . . . . . . . . . . . . . . . . . . . . . . 31 2.3. Funciones Diferenciables . . . . . . . . . . . . . . . . . . . . . . 34 2.3.1. Derivadas parciales . . . . . . . . . . . . . . . . . . . . . 34 2.3.2. Superficies parametrizadas . . . . . . . . . . . . . . . . . 35 2.3.3. El plano tangente . . . . . . . . . . . . . . . . . . . . . . 38 2.3.4. El concepto de diferenciabilidad . . . . . . . . . . . . . . 39 2.4. La Regla de la Cadena . . . . . . . . . . . . . . . . . . . . . . . 44 2.4.1. El vector gradiente . . . . . . . . . . . . . . . . . . . . . 46 2.5. Derivadas Direccionales . . . . . . . . . . . . . . . . . . . . . . 48 2.6. Máximos y Mínimos. . . . . . . . . . . . . . . . . . . . . . . . . 51 2.6.1. Criterio para determinar extremos de funciones de dos variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 2.6.2. Extremos condicionados. . . . . . . . . . . . . . . . . . 55 2.7. *Temas de Lectura . . . . . . . . . . . . . . . . . . . . . . . . . 65 2.7.1. Campos Escalares y Campos Vectoriales . . . . . . . . . 65 2
  3. 3. 2.7.2. Derivada en una dirección de un campo escalar en Rn . Derivadas direccionales y parciales. . . . . . . . . . . . . 66 2.7.3. Diferenciabilidad de un campo escalar en Rn . . . . . . . 68 2.7.4. Regla de la cadena para campos escalares en Rn . . . . . 71 2.7.5. Derivada en una dirección de un campo vectorial. Deriva- da direccional . . . . . . . . . . . . . . . . . . . . . . . . 73 2.7.6. Diferenciabilidad de un campo vectorial . . . . . . . . . 74 2.7.7. Regla de la cadena para campos vectoriales. . . . . . . . 76 2.7.8. Fórmula de Taylor de orden dos para campos escalares . 80 2.7.9. Naturaleza de un punto crítico teniendo como criterio los valores propios de la matriz Hessiana . . . . . . . . . . . 82 2.7.10. Criterio para determinar extremos de funciones de dos variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 2.7.11. Ley de la conservación de la energía. Campos conservativos 85 3. Integrales Múltiples 87 3.1. Integrales Dobles . . . . . . . . . . . . . . . . . . . . . . . . . . 87 3.1.1. Propiedades de la Integral doble . . . . . . . . . . . . . 88 3.1.2. Integración en regiones más generales . . . . . . . . . . 89 3.1.3. Cálculo de integrales dobles: áreas y volúmenes. . . . . . 91 3.1.4. Cambio de variable . . . . . . . . . . . . . . . . . . . . 95 3.1.4.1. La fórmula del cambio de variable . . . . . . . 97 3.2. Integrales Triples . . . . . . . . . . . . . . . . . . . . . . . . . . 101 3.2.1. Regiones más generales . . . . . . . . . . . . . . . . . . 102 3.2.2. Cambio de variable en integrales triples. . . . . . . . . . 104 3.2.2.1. Coordenadas cilíndricas. . . . . . . . . . . . . . 105 3.2.2.2. Coordenadas esféricas. . . . . . . . . . . . . . . 106 3.3. Aplicaciones de las integrales múltiples. . . . . . . . . . . . . . 107 3.3.1. Momentos y centros de masa. . . . . . . . . . . . . . . . 107 3.3.2. Densidad y masa. . . . . . . . . . . . . . . . . . . . . . . 109 3.3.3. Momento de Inercia. . . . . . . . . . . . . . . . . . . . 112 3.3.4. Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . 116 3.3.4.1. Valores esperados . . . . . . . . . . . . . . . . 116 4. Integrales de Línea. Áreas de Superficies e Integrales de Su- perficie 117 4.1. Integral de Línea . . . . . . . . . . . . . . . . . . . . . . . . . . 117 4.1.1. Propiedades de la Integrales de línea . . . . . . . . . . 119 4.2. El concepto de trabajo como integral de línea . . . . . . . . . . 121 4.3. Campos conservativos y funciones potenciales . . . . . . . . . . 123 4.4. El teorema de Green . . . . . . . . . . . . . . . . . . . . . . . . 124 4.5. Área de una superficie . . . . . . . . . . . . . . . . . . . . . . . 130 4.6. Integral de superficie . . . . . . . . . . . . . . . . . . . . . . . . 133 3
  4. 4. 4.6.1. Integral de superficie de una función escalar . . . . . . . 133 4.6.2. Integral de superficie de un campo vectorial . . . . . . . 134 4
  5. 5. Capítulo 1 Funciones Vectoriales En este cap´ítulo combinaremos el álgebra lineal y los métodos fundamentales del cálculo para estudiar algunas aplicaciones de las curvas y algunos problemas de Mecánica. 1.1. El Espacio Rn El espacio Rn es el conjunto de todas las n-uplas de números reales: Rn = {(x1, x2, ..., xn) : xi ∈ R, i = 1, 2, 3, ...n)} . Los elementos de Rn se le llaman vectores. En Rn definimos la suma de vectores y producto por escalares. Si −→a = (x1, x2, ..., xn) y −→ b = (y1, y2, ..., yn) entonces −→a + −→ b es el elemento de Rn dado por −→a + −→ b = (x1 + y1, x2 + y2, ..., xn + yn). Para cada escalar λ ∈ R, el vector λ−→a es definido por λ−→a = (λx1, λx2, ..., λxn). El producto escalar entre dos vectores de Rn está definido por −→a · −→ b = n i=1 xiyi. Recordemos algunas propiedades del producto escalar: 5
  6. 6. −→a · −→ b = −→ b · −→a (−→a + −→ b ) · −→c = −→a · −→c + −→ b · −→c −→ λa · −→ b = λ −→a · −→ b = −→a · −→ λb La longitud o norma de un vector de Rn es definida por ||−→a || = √ −→a .−→a = (x1) 2 + (x2) 2 + ... + (xn) 2 o ||−→a ||2 = −→a · −→a . La distancia entre −→a y −→ b se define por dist(−→a , −→ b ) = −→a − −→ b , para cada −→a y −→ b ∈ Rn Propiedades importantes de la definición de longitud o norma son las siguientes: ||−→a || ≥ 0, ∀−→a ∈ Rn ||λ−→a || = |λ| ||−→a || ||−→a + −→ b || ≤ ||−→a || + || −→ b || −→a · −→ b ≤ ||−→a || || −→ b || El ángulo θ entre los vectores −→a y −→ b está dado por la relación. cos θ = −→a · −→ b −→a −→ b En el caso que −→a y −→ b ∈ R3 definiremos otro producto entre vectores conocido como producto vectorial que se denota por −→a × −→ b y lo definimos como −→a × −→ b = i j k x1 x2 x3 y1 y2 y3 = (x2y3 − x3y2, x3y1 − x1y3, x1y2 − x2y1). 6
  7. 7. Recordemos algunas propiedades del producto vectorial −→a × −→ b ⊥ −→a y −→a × −→ b ⊥ −→ b −→a × −→ b = − −→ b × −→a (−→a + −→ b ) × −→c = −→a × −→c + −→ b × −→c −→a × −→ b × −→c = (−→a · −→c ) −→ b − −→a · −→ b −→c (λ−→a ) × −→ b = λ −→a × −→ b = −→a × λ −→ b (−→a × −→ b ) · −→c = −→a · −→ b × −→c . La norma de −→a × −→ b está dada por ||−→a × −→ b || = ||−→a || || −→ b ||sen θ donde θ es el ángulo comprendido entre estos vectores. 1.2. Funciones Vectoriales Una −→ F : J → Rn donde J es un conjunto de números reales, se llama función vectorial. El valor de la función −→ F en t lo designaremos corrientemente por −→ F (t). Puesto que −→ F (t) ∈ Rn −→ F (t) = (f1(t), f2(t), ..., fn(t)) donde cada fi es una función real fi : J → R, i = 1, 2, ...n. Las funciones fi son llamadas las componentes de la función vectorial −→ F . As´í, cada función vectorial da origen a n funciones reales f1, f2,...,fn. Indicaremos esta relación por −→ F = (f1, f2,..,fn). Llamamos a la variable t el parámetro de la función. La ecuación −→x = −→ F (t) donde −→x = (x1, x2, ..., xn) ∈ Rn , nos permite definir las ecuaciones x1 = f1(t) x2 = f2(t) ... xn = fn(t) llamadas ecuaciones paramétricas con parámetro t. En algunos casos representaremos las funciones vectoriales como combinación lineal de la base usual en Rn . Por ejemplo cuando n = 2 algunas veces uti- lizaremos la representación −→ F (t) = (x(t), y(t)) = x(t)i + y(t)j donde i = (1, 0) 7
  8. 8. y j = (0, 1) y cuando n = 3 utilizaremos −→ F (t) = (x(t),y(t),z(t)) =x(t)i + y(t)j+z(t)k donde i = (1, 0, 0), j = (0, 1, 0), k =(0, 0, 1). Ejemplo 1.2.1 Consideremos el caso de la ecuación de una recta que pasa por el punto P0 = (a, b, c) y tiene vector director −→a = (l, m, n) . Las ecuaciones paramétricas de la recta están dadas por x = a + lt, y = b + mt, z = c + nt. Estas variables las podemos escribir en forma vectorial de la siguiente manera −−→ F(t) = (x(t), y(t), z(t)) = (a+lt, b+mt, c+nt) = (a, b, c)+t(l, m, n) = P0 +t−→a , donde el parámetro t ∈ R. As´í, la ecuación vectorial de la recta define la función vectorial −→ F (t) = P0 + t−→a . Ejemplo 1.2.2 Si consideramos las ecuaciones paramétricas dadas por x = cos t y y = sent, 0 ≤ t ≤ 2π, obtenemos la función vectorial −→ F (t) = cos ti + sen tj. La norma o longitud de −−→ F(t) para cada t está dada por −→ F (t) = cos2 t + sen2t = 1. El vector −→ F (t) describe una circunferencia de radio 1 en sentido contrario a las manecillas del reloj dando una vuelta completa cuando t aumenta de 0 a 2π. 1.2.1. Operaciones algebraicas. Las operaciones algebraicas de los vectores pueden aplicarse para las funciones vectoriales. Sean −→ F , −→ G, funciones vectoriales definidas sobre un dominio común y f una función real, entonces definimos las funciones −→ F + −→ G, f −→ F , −→ F · −→ G, mediante −→ F + −→ G (t) = −−→ F(t) + −−→ G(t), f −→ F (t) = f(t) −→ F (t), −→ F · −→ G (t) = −→ F (t) · −→ G(t). 8
  9. 9. (El producto aqu´í considerado es el de producto escalar). Observemos que el producto escalar de funciones vectoriales es una función real. Además en el caso de que −→ F y −→ G tengan sus valores en R3 podemos definir el producto vectorial −→ F × −→ G (t) = −→ F (t) × −→ G(t). 1.2.2. Límites, derivadas e integrales. Los conceptos fundamentales de l´ímite, continuidad, derivadas e integral pueden generalizarse naturalmente para funciones vectoriales. Si −→ F = (f1, f2,..,fn) es una función vectorial y L = (l1, l2, ..., ln) ∈ Rn , definimos el l´ímite por l´ım t→a −→ F (t) = L ⇐⇒ l´ım t→a f1(t) = l1, l´ım t→a f2(t) = l2, l´ım t→a fn(t) = ln siempre que los l´ímites existan. Diremos que −→ F es continua en a si l´ım t→a −→ F (t) = −→ F (a). Es decir, −→ F es continua en a si y solo si cada componente es continua en a. Si una función vectorial continua está definida en el intervalo [a, b], entonces ca- da componente real es continua en [a, b] y por lo tanto integrable. As´í podemos definir b a −→ F (t)dt = b a f1(t)dt, b a f2(t)dt, ..., b a fn(t)dt Igualmente, la derivada −→ F (t) de una función vectorial −→ F (t) se define exacta- mente de la misma forma que la derivada de una función real, es decir −→ F (t) es diferenciable en t, si −→ F (t) = l´ım h→0 −→ F (t + h) − −→ F (t) h existe. De acuerdo a la definición del l´ímite para funciones vectoriales podemos decir que la función vectorial −−→ F(t) es diferenciable si y sólo si cada componente es diferenciable. En este caso −→ F (t) = (f1(t), f2(t), ..., fn(t)) Diremos que −→ F es continua, derivable o integrable en un intervalo si cada com- ponente lo es. De acuerdo a estas definiciones muchos de los resultados sobre l´ímites, continuidad, derivación e integración de funciones reales son válidos para las funciones vectoriales. 9
  10. 10. Denotaremos las derivadas por −→ F (t) = Dt −→ F = d −→ F dt . En el caso de n = 2, si −→ F (t) = (x(t), y(t)) = x(t)i + y(t)j, −→ F (t) = Dt −→ F = d −→ F dt = dx dt , dy dt = dx dt i + dy dt j. En el caso de n = 3, si −→ F (t) = (x(t), y(t), z(t)) = x(t)i + y(t)j+z(t)k, −→ F (t) = Dt −→ F = d −→ F dt = dx dt , dy dt , dz dt = dx dt i + dy dt j+ dz dt k. 1.2.2.1. Teoremas básicos Teorema 1.2.1 Si −→ F , −→ G, funciones vectoriales y f una función real son diferenciables, entonces lo mismo ocurre con las funciones −→ F + −→ G, f −→ F , −→ F · −→ G, y tenemos ( −→ F + −→ G) = −→ F + −→ G (f −→ F ) = f −→ F + f −→ F −→ F · −→ G = −→ F · −→ G + −→ F · −→ G Si −→ F y −→ G tienen valores en R3 , entonces −→ F × −→ G = −→ F × −→ G + −→ F × −→ G Demostración. Vamos a demostrar la segunda propiedad. Las demás se prue- ban de manera similar. (f −→ F ) = ((ff1) , (ff2) , ..., (ffn) ) = (f f1 + ff1, f f2 + ff2, ..., f fn + ffn) = f (f1, f2, ..., fn) + f(f1, f2, ..., fn) = f −→ F + f −→ F El siguiente es un teorema muy importante y caracteriza las funciones vectori- ales que tienen longitud constante. 10
  11. 11. Teorema 1.2.2 Una función vectorial −→ F (t) diferenciable tiene longitud con- stante en un intervalo abierto I, si y sólo si −→ F (t)· −→ F (t) = 0. Esto significa que los vectores −→ F (t) y −→ F (t) son perpendiculares para cada t ∈ I. Demostración. Vamos inicialmente a suponer que la longitud de −→ F (t) es constante. Definamos la función g(t) = || −→ F (t)||2 = −→ F (t) · −→ F (t). De acuerdo a la hipótesis g(t) = c para todo t ∈ I donde c es una constante. Por lo tanto g (t) = 0 en I. Como g es un producto escalar, tenemos que g (t) = −→ F (t) · −→ F (t) + −→ F (t) · −→ F (t) = 2 −→ F (t) · −→ F (t) = 0, entonces −→ F (t) · −→ F (t) = 0 en I. Para mostrar el rec´íproco consideremos que −→ F (t) · −→ F (t) = 0 en I y definamos g(t) = −→ F (t) 2 . Derivando g(t) tenemos que g (t) = 2 −→ F (t) · −→ F (t) y aplicando la hipótesis tenemos que g (t) = 0 para todo t ∈ I. As´í la longitud de −→ F (t) es constante. Los siguientes teoremas se demuestran teniendo en cuenta las propiedades de los vectores y los teoremas básicos de derivadas de una variable como la regla de la cadena y los teoremas fundamentales del cálculo. Teorema 1.2.3 (Regla de la cadena para funciones vectoriales). Sea −→ G = −→ F ◦ u donde −→ F es una función vectorial y u es una función real. Si u es continua en t y −→ F es continua en u(t) entonces G es continua en t. Además si u es diferenciable en t y −→ F es diferenciable en u(t) entonces −→ G es diferenciable en t y −→ G (t) = −→ F (u(t))u (t). Teorema 1.2.4 (Primer Teorema Fundamental del Calculo para funciones Vectoriales) Sea −→ F : [a, b] → Rn una función vectorial continua y definamos −→ A(t) = t a −→ F (s)ds, a ≤ t ≤ b Entonces −→ A existe y −→ A (t) = −→ F (t). Teorema 1.2.5 (Segundo Teorema Fundamental del Calculo para funciones Vectoriales). Supongamos que la función −→ F tiene derivada continua −→ F en un intervalo I. Entonces para cada t ∈ I tenemos t a −→ F (s)ds = −→ F (t) − −→ F (a) 11
  12. 12. o −→ F (t) = −→ F (a) + t a −→ F (s)ds. 1.3. Curvas y Tangentes A las funciones vectoriales diferenciables las llamaremos curvas y las denotare- mos con la letra −→r en lugar de la letra −→ F . Así, una curva en Rn es una función −→r : I → Rn diferenciable; la curva es regular, si −→ r (t) = −→ 0 para todo t. A no ser que se diga lo contrario, nuestras curvas siempre serán regulares. También llamaremos curva o trayectoria al rango o conjunto imagen de la función −→r , esto es, al conjunto C definido por C = {−→x : −→x = −→r (t) para algún t ∈ I}. En este caso, la función −→r se denomina parametrización de C, y diremos que la curva C está descrita paramétricamente (o parametrizada) por −→r . Cuando n = 2 ó 3 podemos representar geométricamente la curva. Por ejemplo, en el caso de n = 3, la curva descrita por −→r (t) = P +t−→a es una l´ínea recta que pasa por el punto P y tiene vector director −→a . Observación 1.3.1 El gráfico de cualquier función real y = f(x) puede ser dado en forma paramétrica mediante las ecuaciones: x = t y = f(t) o en forma vectorial como −→r (t) = (t, f(t)). Definición 1.3.1 La derivada −→ r (t0) de una curva −→r en t0 está ligada al con- cepto de tangencia, como en el caso de una función real. Formamos el cociente de Newton −→r (t0 + h) − −→r (t0) h , 12
  13. 13. Investigamos el comportamiento de este cociente cuando h → 0. El cociente es el producto del vector −→r (t0 + h) − −→r (t0) por el escalar 1/h. Observemos que el numerador es paralelo a este cociente. Si hacemos que h → 0 tenemos que l´ım h→0 −→r (t0 + h) − −→r (t0) h = −→ r (t0) suponiendo que este l´ímite exista. La interpretación geométrica sugiere la sigu- iente definición. Definición 1.3.2 Sea C la curva parametrizada por −→r = −→r (t). Si la derivada −→ r existe y no es nula, la ecuación de la recta tangente que pasa por el punto −→r (t0) y tiene vector director −→ r (t0) está dada por −→r (t) = −→r (t0) + t −→ r (t0). El vector −→ r (t0) se llama vector tangente a C en −→r (t0). Ejemplo 1.3.1 Recta. Consideremos la función vectorial −→r (t) = P + t−→a , siendo −→a = −→ 0 , tenemos que −→ r = −→a , as´í que la recta tangente coincide con la curva de −→r . Ejemplo 1.3.2 Circunferencia. Si −→r (t) describe una circunferencia de radio R y centro en el punto P, entonces ||−→r (t) − P|| = R. El vector −→r (t) − P geométricamente representa un vector que va desde el punto P al punto −→r (t). Puesto que este radio vector tiene longitud constante, tenemos que −→r (t) − P y su derivada (−→r (t) − P) = −→ r (t) son perpendiculares y por lo tanto el radio vector es perpendicular a la recta tangente. As´í pues, para una circunferencia la definición de tangente coincide con aquella dada en la geometríáa elemental. Puede pensarse que la curva C es la trayectoria de una partícula que se mueve en el espacio a medida que transcurre el tiempo t, así, −→r (t) es la posición de la partícula en el tiempo t. −→ r (t) es entonces la velocidad de la partícula, que también denotamos −→v (t). La norma de la velocidad −→v (t) se denomina 13
  14. 14. rapidez de la curva y se denota v(t). La segunda derivada −→ r (t) es la aceleración de la curva y se denota −→a (t). Si conocemos la aceleración de una partícula en un tiempo t y si también sabe- mos su velocidad y su posición en un tiempo específico t0, entonces podemos conocer su velocidad y su posición en cualquier tiempo t, como se muestra en el siguiente ejemplo. Ejemplo 1.3.3 Se sabe que la aceleración de una partícula que se mueve en el espacio está dada por −→a (t) = 2t −→ i + sent −→ j + cos 2t −→ k . Si su velocidad y posición en t = 0 están dados por −→v (0) = −→ i y −→r (0) = −→ j , hallar su posición en cualquier tiempo t. Solución. Puesto que −→a (t) = −→ v (t), entonces −→v (t) = −→a (t)dt = (2t −→ i +sent −→ j +cos2t −→ k )dt = t2−→ i −cost −→ j +1 2 sen2t −→ k +−→c , donde la constante −→c = (c1, c2, c3). Por un lado −→v (0) = (0, −1, 0)+(c1, c2, c3) = (c1, c2−1, c3) y por otro lado, −→v (0) = (1, 0, 0), de tal manera que c1 = 1, c2 = 1 y c3 = 0, y la velocidad es entonces −→v (t) = (t2 +1) −→ i +(1−cost) −→ j + 1 2 sen2t −→ k . Ya podemos hallar su posición puesto que −→r (t) = −→v (t)dt = ( t3 3 + t) −→ i + (t − sent) −→ j − 1 4 cos 2t −→ k + (c1, c2, c3) y puesto que por hipótesis −→r (0) = (0, 1, 0), y por otro lado −→r (0) = (c1, c2, −1 4 + c3) tenemos que la posición en un tiempo t está dada por −→r (t) = ( t3 3 + t) −→ i + (t − sent + 1) −→ j + (1 4 − 1 4 cos 2t) −→ k . 1.4. Longitud de arco y reparametrización de una curva. Sea C una curva parametrizada por −→r = −→r (t), t ∈ [a, b]. Si reemplazamos t por una función diferenciable h : [c, d] → [a, b], creciente o decreciente de otra variable u, t = h(u), obtenemos una nueva parametrización de −→r de la forma −→α (u) = −→r (h(u)), esto es, la composición de r con h. Nota: A veces, para simplificar la notación y cuando no haya peligro de con- fusión, denotaremos la reparametrización −→α con la misma letra −→r y en lugar de escribir t = h(u) escribimos t = t(u) así: −→r (u) = −→r (t(u)); lo mismo para la inversa u = h−1 (t) escribimos u = u(t). Si h es creciente, diremos que el cambio de parámetro preserva la orientación y si h es decreciente, diremos que 14
  15. 15. h invierte la orientación. Ejemplo 1.4.1 Sabemos que la ecuación y = √ 1 − x2, x ∈ [−1, 1] repre- senta la mitad superior de un círculo de radio 1. Podemos parametrizar di- cho semicírculo por −→r (t) = (t, √ 1 − t2), t ∈ [−1, 1] con orientación del punto (−1, 0) al punto (1, 0). Escribiendo t = t(u) = cos u obtenemos la reparametrización −→r (u) = (cos u, √ 1 − cos2 u) = (cos u, sen u). Si tomamos u ∈ [0, π] = [arc cos(1), arc cos(−1)] obtenemos una reparametrización que in- vierte la orientación pues en dicho intervalo cos es decreciente. La longitud de una curva −→r = −→r (t) para t ∈ [a, b] se define por L(−→r ) = b a || −→ r (t)||dt En los casos n = 2 y n = 3, esto es, cuando −→r (t) = (x(t), y(t)) y −→r (t) = (x(t), y(t), z(t)), sus longitudes son L(−→r ) = b a x (t)2 + y (t)2dt y L(−→r ) = b a x (t)2 + y (t)2 + z (t)2dt Por ejemplo, en el círculo −→r (t) = (acost, asent), para t ∈ [0, 2π], tenemos que −→r (t) = (−asent, acost) y || −→ r (t)|| = a por lo que su longitud es L(−→r ) = 2π 0 adt = 2πa y en el caso de la hélice −→r (t) = (acost, asent, bt), su longitud desde el punto (1, 0, 0) hasta el punto (1, 0, 2π) es 2π 0 a2 + b2dt = 2π a2 + b2. Nótese que al reparametrizar una curva, ni su forma ni su longitud cambian. Esto último se deduce del hecho de que haciendo t = h(u) y suponiendo h creciente d c −→ α (u) du = d c −→ r (h(u))h (u) du = d c || −→ r (h(u))||h (u)du = b a −→ r (t) dt 15
  16. 16. El estudiante puede hacer algo análogo para h decreciente. Sin embargo, escribiendo −→r (u) = −→r (t(u)) se tiene que d−→r du = d−→r dt dt du lo que muestra que su rapidez sí cambia por el factor dt du ; incluso la velocidad puede invertir su sentido en el caso en que t = t(u) sea decreciente pues en este caso dt du < 0. Pregunta: Se podrá reparametrizar una curva cualquiera de tal manera que su rapidez sea constante? La respuesta es sí, como veremos a continuación. Sea −→r = −→r (t), t ∈ [a, b] una curva cualquiera, y sea s = s(t) = t a −→ r (u) du. s = s(t) se denomina función longitud de arco y mide la longitud de −→r desde a hasta t. Puesto que ds dt = −→ r (t) > 0, s(t) es una función creciente y como s(a) = 0 y s(b) = L (su longitud total), su inversa t = t(s) es creciente con dominio [0, L]. Utilizando esta inversa como cambio de parámetro, obtenemos la parametrización −→r (s) = −→r (t(s)) en donde el parámetro es la longitud del arco s. La velocidad de esta parametrización es d−→r ds = d−→r dt dt ds Como dt ds = 1 ds dt = 1 −→ r (t) , tenemos que d−→r ds = 1. Así vemos que cuando la curva está parametrizada por longitud de arco, su rapidez es constante e igual a 1. Recíprocamente, si −→r = −→r (t) es una curva tal que −→ r (t) = 1, entonces s = t 0 −→ r (u) du = t 0 du = t, es decir el parámetro t es la longitud del arco s. Hemos demostrado el siguiente teorema: Teorema 1.4.1 Una curva −→r = −→r (t) está parametrizada por longitud de arco si y solo si −→ r (t) = 1. Ejemplo 1.4.2 Parametrizar por longitud de arco el círculo de radio a, −→r (t) = (a cos(t), a sen(t)),t ∈ [0, 2π]. Tenemos que −→ r (t) = (−a sen(t), a cos(t)) y −→ r (t) = a. Así, s = t 0 −→ r (u) du = t 0 a du = at. Despejando t tenemos que t = s a y reemplazando obtenemos −→r (s) = (a cos( s a ), a sen( s a )) es la parametrización pedida. 16
  17. 17. 1.5. Curvatura La curvatura es el concepto más importante de la teoría de curvas y mide qué tanto se dobla una curva en un punto determinado. Puesto que la forma como se dobla una curva tiene que ver con su concavidad, es apenas natural pensar que la segunda derivada tiene que estar involucrada, esto es, la razón de cambio del vector tangente. Definiremos inicialmente la curvatura de una curva parametrizada por la longitud de arco s y luego deduciremos una fórmula para la curvatura de una curva con cualquier parámetro t. Definición 1.5.1 Sea C una curva parametrizada por −→r = −→r (s) donde s = t 0 −→ r (u) du. Definimos la curvatura de C por k(s) = −→ r (s) (1.1) Ejemplo 1.5.1 Calcular la curvatura del círculo de radio a, −→r (t) = (a cos t, asent). En el ejemplo anterior vimos que la parametrización por longitud de arco del círculo es −→r (s) = (a cos( s a ), a sen( s a )). Tenemos entonces que la segunda derivada de −→r es −→ r (s) = − 1 a cos( s a ), − 1 a sen( s a ) y por lo tanto k(s) = −→ r (s) = 1 a . Nota. Esta definición solo es válida para curvas parametrizadas por longitud de arco y no sirve como definición de curvatura de una curva con cualquier parámetro t (es decir, escribir k(t) = −→ r (t) ). Para ver porqué esto es así, vea el ejercicio y la observación al final de esta sección. En principio, si queremos calcular la curvatura de una curva con cualquier parámetro t, deberíamos primero reparametrizarla por longitud de arco y aplicar la ecuación 1.1 como se hizo en el ejemplo anterior. Esto no es práctico por la dificultad en el cálculo de la integral involucrada o porque a menudo es muy difícil o virtualmente imposible invertir dicha integral. Para encontrar una fór- mula de la curvatura con cualquier parámetro t, definamos el vector tangente unitario de una curva parametrizada por −→r = −→r (t) así: −→ T (t) = −→ r (t) −→ r (t) (1.2) Reparametrizando entonces por longitud de arco, tenemos que −→r (s) = −→r (t(s)) donde t = t(s) es la inversa de la función longitud de arco s = s(t); se tiene en- 17
  18. 18. tonces también que el vector tangente unitario tiene la forma −→ T (s) = −→ T (t(s)). Entonces −→ r (s) = −→ T (s) y la segunda derivada de −→r es −→ r (s) = −→ T (s) = d −→ T dt dt ds = −→ T (t) −→ r (t) y puesto que la curvatura es la norma de este vector, tenemos que k(t) = −→ T (t) −→ r (t) . (1.3) Esta fórmula nos permite calcular la curvatura de una curva cualquiera sin tener que reparametrizarla por longitud de arco. Podemos encontrar una fórmula más sencilla que sólo involucre r y sus derivadas (y no el vector −→ T ) dada en el siguiente teorema. Teorema 1.5.1 k(t) = −→ r (t) × −→ r (t) −→ r (t) 3 (1.4) Demostración. Escribiendo v(t) = −→ r (t) tenemos que −→ r (t) = v(t) −→ T (t); derivando obtenemos −→ r (t) = v (t) −→ T (t) + v(t) −→ T (t) . Entonces −→ r × −→ r = v −→ T × v −→ T + v −→ T = vv −→ T × −→ T + v2−→ T × −→ T = v2−→ T × −→ T Por lo tanto −→ r × −→ r = v2 −→ T × −→ T = −→ r 2 −→ T −→ T sen(π/2) puesto que −→ T es perpendicular a −→ T . Y como −→ T = 1 se tiene que 18
  19. 19. −→ r × −→ r = −→ r 2 −→ T . Dividiendo a ambos lados de esta última ecuación por −→ r 3 se obtiene la fór- mula deseada. La curvatura de una curva con cualquier parámetro t está bien definida por la ecuación 1.3, en el sentido de que es independiente de la parametrización elegida, es decir, que para calcular la curvatura no interesa qué parametrización tomemos. Esto se demuestra de la siguiente manera: si −→α es una reparametrización de −→r , esto es,−→α (u) = −→r (h(u)) con h(u) = t y llamamos kα,kr,Tαy Tr a las curvaturas y al vector tangente unitario en las dos parametrizaciones, entonces: kα(u) = −→ Tα(u) −→ α (u) = −→ Tr(h(u))h (u) −→ r (h(u))h (u) = −→ Tr(t) −→ r (t) = kr(t) Note que si en la ecuación 1.3 hacemos t = s obtenemos la ecuación 1.1. Puede probarse fácilmente que si la curvatura de una curva es cero en todos sus puntos, dicha curva es una linea recta, que es efectivamente lo que nos dice la intuición. Para ello notemos que como la curvatura es independiente de la parametrización, podemos suponer −→ r (t) = 1. Si k = 0, entonces por la ecuación 1.1 debe ser −→ r (t) = 0. Integrando entre t0 y t se obtiene que −→ r (t) = −→ r (t0) e integrando de nuevo obtenemos −→r (t) − −→r (t0) = (t − t0)−→r (t0) esto es, −→r (t) = (t − t0)−→r (t0) + −→r (t0) que ciertamente es una línea recta. 1.5.1. Triedro de Frenet Para una curva −→r = −→r (t) definimos el vector normal unitario por −→ N(t) = −→ T (t) −→ T (t) (1.5) Note que −→ N ⊥ −→ T puesto que T = 1. Definimos también el vector binormal por −→ B(t) = −→ T (t) × −→ N(t) 19
  20. 20. vector que es perpendicular tanto a −→ T como a −→ N. La tripla −→ T , −→ N , −→ B se de- nomina triedro de Frenet y juega un papel central en el estudio de la geometría de curvas. El plano generado por el par −→ T , −→ N se denomina plano osculador . El plano generado por el par −→ N , −→ B se denomina plano normal. El plano generado por el par −→ T , −→ B se denomina plano rectificante. Las ecuaciones de dichos planos en un punto −→r (t0) son plano osculador: (−→x − −→r (t0)) · −→ B(t0) = 0. plano normal: (−→x − −→r (t0)) · −→ T (t0) = 0. plano rectificante: (−→x − −→r (t0)) · −→ N (t0) = 0. 1.5.2. El vector aceleración. Si escribimos −→v = −→ r y v = −→ r , tenemos que −→v = v −→ T . Derivando a ambos lados de esta ecuación, obtenemos: −→ v = −→a = v −→ T + v −→ T Como −→ T = −→ T −→ N = kv −→ N, entonces −→a = v −→ T + kv2−→ N 20
  21. 21. Escribiendo aT = v y aN = kv2 tenemos que la aceleración es una combinación lineal de los vectores −→ T y −→ N de la forma −→a = aT −→ T + aN −→ N , lo que nos dice que el vector aceleración está siempre sobre el plano osculador. Podemos encontrar expresiones para aT y aN en términos solamente de las derivadas de −→r así: −→v · −→a = v −→ T · v −→ T + kv2−→ N = vv −→ T · −→ T + kv3−→ T · −→ N = vv Así, aT = v = −→v · −→a v = −→ r · −→ r −→ r . Para aN , observemos que aN = kv2 = −→ r × −→ r −→ r 2 −→ r 3 = −→ r × −→ r −→ r . El estudiante puede demostrar fácilmente que también se tiene que −→a 2 = a2 T + a2 N . 1.5.3. *Ecuaciones de Frenet para una curva plana. Las ecuaciones de Frenet expresan la variación de los vectores −→ T y −→ N en tér- minos de ellos mismos y desempeñan un papel fundamental en el estudio de la geometría de las curvas. Deduciremos estas ecuaciones en el caso de una curva plana. De la ecuación 1.5 obtenemos −→ T = −→ T −→ N y reemplazando −→ T por lo dado en la ecuación 1.3 tenemos que −→ T = vk −→ N (1.6) donde v = −→ r . Esta es la primera ecuación de Frenet. Por otro lado como −→ N = 1 tenemos que −→ N ⊥ N y como la curva es plana, entonces −→ N es paralelo a −→ T y por lo tanto existe un escalar λ tal que −→ N = λ −→ T . Al multiplicar a ambos lados de esta ecuación por −→ T , obtenemos que λ = −→ T · −→ N . Por otro lado, derivando la ecuación −→ T · −→ N = 0 obtenemos −→ T · −→ N + −→ T · −→ N = 0 lo que es equivalente a kv −→ N · −→ N + −→ T · −→ N = 0 por la primera ecuación de Frenet (ecuación 1.6) y así, λ = −→ T · −→ N = −vk, y obtenemos la segunda ecuación de Frenet 21
  22. 22. −→ N = −vk −→ T (1.7) Las ecuaciones 6 y 7, llamadas Ecuaciones de Frenet se pueden escribir en la forma matricial −→ T −→ N = −→ r 0 k −k 0 −→ T −→ N Ejercicio Demostrar que si una curva tiene curvatura k = 1 a (constante) entonces es un círculo de radio a (con centro en algún punto −→ P ). Puesto que la curvatura es independiente de la parametrización, podemos suponer v(t) = −→ r (t) = 1. Para demostrar que −→r es un círculo de radio a con centro en −→ P , debemos probar que −→r (t) + a −→ N(t) = −→ P pues entonces −→r (t) − −→ P = −a −→ N(t) y así, −→r (t) − −→ P = a, como se observa en la figura abajo. Para ver esto, observe que d dt (−→r (t) + a −→ N(t)) = −→ r (t) + a −→ N (t). Pero la se- gunda ecuación de Frenet (ecuación 1.7) es −→ N (t) = − 1 a −→ T (t), por lo tanto −→ r (t) + a −→ N (t) = −→ T (t) − a. 1 a −→ T (t) = 0 y por lo tanto −→r (t) + a −→ N(t) =constante. Llamando −→ P a dicha constante, se tiene lo que se quiere demostrar. Observación. 22
  23. 23. Se definió la curvatura de una curva parametrizada por longitud de arco como la norma del cambio en el vector tangente (ecuación 1.1). Esta definición no funciona para una curva con cualquier parámetro t. Para ver esto basta observar que −→ r (t) = 2 (constante) para la parábola −→r (t) = t, t2 , lo que significaría que la parábola es un círculo!! 23
  24. 24. Capítulo 2 Campos Escalares en R2 y R3 Una función de n variables ó campo escalar, es una función f : U ⊆ Rn → R. Si (x1, x2, . . . , xn) ∈ U, su imagen por f es un número real xn+1 = f(x1, x2, . . . , xn). En este curso solo estudiaremos los casos n = 2 y n = 3 y entonces escribire- mos z = f(x, y) y w = f(x, y, z) respectivamente. U es el dominio de f y es un subconjunto del plano ó del espacio. Ejemplo 2.0.2 Hallar el dominio de f(x, y) = x ln y. Es claro que xpuede tomar cualquier valor real, mientras que ysolo puede tomar valores positivos; por lo tanto el dominio de f es el conjunto U = {(x, y)|x ∈ R, y ∈ R+ }, esto es, el semiplano superior del plano R2 . Ejemplo 2.0.3 Hallar el dominio de f(x, y) = 1 − x2 − y2. Puesto que 1 − x2 − y2 ≥ 0, f solo puede ser calculado en los puntos del disco x2 + y2 ≤ 1. 2.1. Gráfica de z = f(x, y). Curvas y superficies de nivel. La gráfica de una función de dos variables es un subconjunto de R3 y se define por Graf(f) = {(x, y, f(x, y))|(x, y) ∈ U} ⊂ R3 La gráfica de z = f(x, y) la denominamos superficie. Dibujar "a mano" una su- perficie es difícil y lo mejor es recurrir a un computador. Sin embargo, podemos hacernos una idea de cómo es una superficie (o por lo menos las más utilizadas en la práctica), viendo las curvas que se forman al cortar la superficie con planos paralelos a los planos coordenados, llamadas trazas. En particular, las trazas 24
  25. 25. con planos paralelos al plano xy se denominan curvas de nivel, que se obtienen intersectando la gráfica de f con los planos z = c (constante), esto es, la curva de nivel en el nivel c es el subconjunto del plano definido por Lf (c) = {(x, y)|f(x, y) = c} ⊂ R2 Para las trazas con planos paralelos a los planos coordenados xz y yz hacemos y = c y x = c. Veamos algunos ejemplos. Ejemplo 2.1.1 Sea f : R2 → R definida por z = f(x, y) = x2 + y2 . Dado un número real c, la curva de nivel al nivel c de f está dada por Lf (c) = {(x, y) : x2 + y2 = c}. Claramente si c < 0, Lf (c) = ∅ (vacío); si c = 0, Lf (c) = {(0, 0)}; para cualquier c > 0, los conjuntos de nivel son circunferencias con centro en el origen de radio √ c. La figura muestra las circunferencias concéntricas En el ejemplo anterior, las curvas de nivel son círculos que se expanden a medida que aumentamos el valor de c. En la siguiente gráfica, a la derecha vemos una imagen tridimensional de estos círculos; cada uno de ellos está sobre el plano z = c. 25
  26. 26. Sin embargo, esto no es suficiente. Necesitamos ver las trazas con los planos coordenados yz y xz. Para ver el corte con el plano yz, hacemos x = 0 en la función f; tenemos entonces que dicho corte es la parábola z = y2 . Igualmente, para el corte con el plano xz, hacemos y = 0 para obtener la parábola z = x2 . Abajo puede verse la gráfica de dicha función, llamada paraboloide. Ejemplo 2.1.2 Hagamos la gráfica de la función z = f(x, y) = x2 + y2. Las curvas de nivel están dadas por el conjunto Lf (c) = {(x, y) : x2 + y2 = c} = {(x, y) : x2 + y2 = c2 } esto es, círculos concéntricos de radio c. 26
  27. 27. Observe que esta gráfica aparentemente es igual a la del paraboloide, sin em- bargo la gráfica de f no es un paraboloide como lo muestran los cortes con los otros planos coordenados: Si x = 0, obtenemos z = y2 = |y|, esto es, las dos rectas z = y y z = −y. De la misma manera, si y = 0 obtenemos las rectas z = x, y z = −x. Vemos la gráfica abajo, que evidentemente es un cono. Ejemplo 2.1.3 Veamos ahora la función z = y2 − x2 . Las curvas de nivel son las hipérbolas y2 −x2 = c, como se observa en la figura abajo. 27
  28. 28. Note que en el caso c = 0 obtenemos la hipérbola degenerada x2 = y2 que corresponde a las dos rectas y = x y y = −x. El corte con el plano yz es la parábola z = y2 y el corte con el plano xz es la parábola z = −x2 . Esta gráfica se llama paraboloide hiperbólico o silla de montar y tiene el aspecto que se muestra abajo. Ejemplo 2.1.4 Veamos la gráfica de la superficie dada por la ecuación z = y2 . Observe que en la ecuación no aparece la variable x; esto significa que x toma 28
  29. 29. todos los valores reales. Superficies de este tipo se llaman cilindros. ¿Cuales son las curvas de nivel? Su gráfica puede verse abajo. Para el caso de una función de tres variables w = f(x, y, z), su gráfica se define por el conjunto Grf(f) = {(x, y, z, f(x, y, z))|(x, y, z) ∈ U} ⊂ R4 Por supuesto no podemos hacer un dibujo de ella por estar en el espacio cu- atridimensional R4 . Sin embargo tenemos el concepto de superficie de nivel definido de forma análoga al de curva de nivel así: Sf (c) = {(x, y, z) |f(x, y, z) = c} ⊂ R3 y aunque no podamos despejar z explícitamente en términos de x y de y, sí podemos encontrar las trazas con los planos coordenados. Veamos ejemplos de esto. Ejemplo 2.1.5 Consideremos la función de tres variables w = f(x, y, z) = x2 + y2 + z2 . La superficie de nivel en el nivel 1 es el conjunto {(x, y, z) : x2 +y2 +z2 = 1}. Haciendo z = c, obtenemos círculos x2 +y2 = 1−c2 de radio√ 1 − c2 por lo que debemos tener −1 ≤ c ≤ 1. En la figura abajo se muestran estas curvas. 29
  30. 30. De la misma manera obtenemos círculos al cortar la superficie con planos par- alelos a los otros dos planos coordenados. La figura obtenida es una esfera de radio 1. Ejemplo 2.1.6 Las superficies de nivel de la función f(x, y, z) = x2 + y2 − z2 es el conjunto de nivel {x, y, z) : x2 +y2 −z2 = c}. El lector no tendrá dificultad en comprobar que las gráficas que se muestran abajo corresponden a c = 1, c = 0, c = −1 respectivamente, llamadas hiperboloide de una hoja, doble cono e hiperboloide de dos hojas. 30
  31. 31. Observemos que la gráfica de una función de dos variables puede verse como la superficie de nivel de una función de tres variables. Si f : Ω ⊂ R2 → R, recordemos que la gráfica de f es Gf = {(x, y, z) ∈ R3 : z = f(x, y), (x, y) ∈ Ω} Gf = {(x, y, z) ∈ R3 : (x, y) ∈ Ω, z − f(x, y) = 0 } = Lg(0) donde g(x, y, z) = z − f(x, y). Así la gráfica de una función de dos variables es una superficie de nivel de una función de tres variables. 2.1.1. Superficies cuádricas. Consideremos las funciones de tres variables sobre R3 que son de tipo polinomial f(x, y, z) = Ax2 + By2 + Cz2 + Dxy + Exz + Fyz + Hx + Iy + Jz + K, donde A, B, C, D, E, F, G, H, I, J, K son constantes. Si A, B.C, D, E, F no son simultáneamente cero las superficies de nivel Lf (c) = {(x, y, z) ∈ R3 : Ax2 +By2 +Cz2 +Dxy+Exz+Fyz+Hx+Iy+Jz+K = c se llaman superficies cuádricas. Si A = B = C = D = E = F = 0, tenemos que la superficie de nivel de f determina como superficie un plano dado por Hx + Iy + Jz + K = c En general estas superficies cuádricas pertenecen a nueve tipos diferentes: El elipsoide, el hiperboloide de una hoja, el hiperboloide de dos hojas, el cono, el paraboloide elíptico, el paraboloide hiperbólico, el cilindro elíptico, el cilindro hiperbólico. 2.2. Límites y Continuidad Utilizamos la notación l´ım (x,y)→(x0,y0) f(x, y) = L para indicar que podemos aprox- imar la función f(x, y) tanto como queramos a un número L siempre y cuan- do tomemos (x, y) suficientemente cerca del punto (x0, y0) pero con (x, y) = 31
  32. 32. (x0, y0). En otras palabras, f(x, y) está cerca de L si (x, y) está cerca de (x0, y0) y entre más cerca esté (x, y) de (x0, y0), más cerca está f(x, y) de L. Esto sig- nifica que podemos tomar la distancia entre f(x, y) y L tan pequeña como queramos siempre y cuando la distancia entre (x, y) y (x0, y0) sea lo suficien- temente pequeña. Tenemos entonces la equivalencia l´ım (x,y)→(x0,y0) f(x, y) = L ⇔ l´ım ||(x,y)−(x0,y0)||→0 |f(x, y) − L| = 0 que podemos escribir también en la forma f(x, y) → L cuando (x, y) → (x0, y0)⇔|f(x, y) − L| → 0 cuando (x − x0)2 + (y − y0)2 → 0. Así, el límite de una función de dos variables se reduce al límite usual del cálculo de una variable, y es por esta razón que las propiedades usuales de los límites unidimensionales también son válidas para límites de funciones de dos variables. Claramente se ve que la definición anterior de límite es válida para cualquier campo escalar en Rn , con solo reemplazar la pareja (x, y) por un vector −→x ∈ Rn y la pareja (x0, y0) por cualquier vector −→a ∈ Rn . Las propiedades de los límites y de la continuidad las resumimos en los sigu- ientes teoremas: Teorema 2.2.1 Si l´ım−→x →−→a f(−→x ) = b y l´ım−→x →−→a g(−→x ) = c, entonces 1. l´ım−→x →−→a (f(−→x ) + g(−→x )) = b + c, 2. l´ım−→x →−→a λf(−→x ) = λb para todo escalar λ, 3. l´ım−→x →−→a f(−→x )g(−→x ) = b · c, 4. l´ım−→x →−→a |f(−→x )| = |b| , Definición 2.2.1 Diremos que un campo escalar f es continuo en −→a si l´ım−→x →−→a f(−→x ) = f(−→a ). Así como con las funciones de una sola variable, también son continuas las sumas, productos y cocientes de funciones continuas (una vez que, en el último caso, se evite la división entre cero). Teorema 2.2.2 Si una función g de n-variables es continua en −→a y una fun- ción f de una variable es continua en g(−→a ), entonces la función compuesta f ◦ g, definida por (f ◦ g)(−→x ) = f(g(−→x )) es continua en −→a . 32
  33. 33. Decir que f es continua sobre un conjunto U significa que f(−→x ) es continua en cada punto del conjunto. Para calcular un límite, existe la dificultad de que (x, y) puede aproximarse a (x0, y0) por muchos caminos, (contrario al caso unidimensional en el cual solo existen dos caminos de acercamiento: por la izquierda y por la derecha) y para que el límite exista, debe ser el mismo para todos los caminos de acercamiento. Es claro entonces, que el límite no existe si por dos caminos distintos se ob- tienen límites diferentes, como se ve en el siguiente ejemplo. Ejemplo 2.2.1 Para probar que l´ım (x,y)→(0,0) x2 − y2 x2 + y2 (que es de la forma 0 0 ) no existe, observamos resultados distintos si nos acercamos al origen por el eje x y por el eje y así: Acercamiento por el eje x: tomamos y = 0 l´ım (x,0)→(0,0) f(x, 0) = l´ım x→0 x2 x2 = 1 Acercamiento por el eje y: tomamos x = 0 l´ım (0,y)→(0,0) f(0, y) = l´ım y→0 −y2 y2 = −1 Son continuas las funciones f(x, y) = x, f(x, y) = y, todos los polinomios de la forma f(x, y) = aijxi yj y en general todas las posibles combinaciones de sumas, productos, cocientes y composiciones de las funciones elementales, con excepción posiblemente de los puntos en donde los denominadores sean cero o el límite no exista. Por ejemplo, la función F(x, y) = cos(x3 − 4xy + y2 ) es continua en todo punto del plano, puesto que la función g(x, y) = x3 −4xy +y2 es continua (como un polinomio) en toda su extensión y también f(t) = cos t es continua para todo número t ∈ R. Por supuesto, la función dada en el ejemplo anterior no es continua en el origen. Ahora introducimos algunos conceptos relativos a conjuntos en el espacio de Rn . Sean −→a ∈ Rn y r > 0. El conjunto B(x; r) = {−→x ∈ Rn : −→x − −→a < r}. se llama una n-bola abierta de radio r y centro −→a . En el espacio R2 , una bola abierta es el “interior” de un c´írculo; en R3 es el interior de una esfera. Un punto −→a es un punto interior de un conjunto U si existe una bola abierta B(−→a ; r) contenida en U. Todos los puntos interiores de U forman el interior de U. Por otra parte, −→a es un punto frontera de U si toda bola abierta con centro en −→a contiene puntos que pertenecen a U y otros que no pertenecen. Todos los puntos de frontera de U forman la frontera de U. Finalmente, un conjunto 33
  34. 34. es abierto si todos sus puntos son interiores y un conjunto es cerrado si contiene todos sus puntos frontera. Por ejemplo en los números reales , R, los tipos más sencillos de conjuntos abiertos son los intervalos abiertos. La unión de dos o más intervalos abiertos es también abierto. El intervalo [a, b] es un intervalo cerrado. El conjunto U = (x, y) : x2 + y2 ≤ 1 es un conjunto cerrado en R2 . 2.3. Funciones Diferenciables De la misma manera que la existencia de una recta tangente está íntimamente relacionado con el concepto de diferenciabilidad de una función de una variable, la existencia de un plano tangente, que definiremos más adelante, tiene que ver con el concepto de diferenciabilidad de una función de dos variables. Para llegar a este concepto definiremos inicialmente las derivadas parciales. 2.3.1. Derivadas parciales Si en una función de dos variables z = f(x, y) consideramos una variable, por ejemplo y, como constante, obtenemos una función que depende exclusiva- mente de la variable x. Así, si escribimos y = y0 (constante) y h(x) = f(x, y0), la derivada h (x0) se denomina derivada parcial de f con respecto a x en el punto (x0, y0) y se denota ∂f ∂x (x0, y0) ó ∂f ∂x |(x0,y0). De la misma manera, si es- cribimos g(y) = f(x0, y), entonces la derivada parcial de f con respecto a y en el punto (x0, y0) será la derivada g (y0) y se denota ∂f ∂y (x0, y0) ó ∂f ∂y |(x0,y0). Notación. Si las derivadas parciales se calculan en un punto genérico (x, y), escribimos ∂f ∂x y ∂f ∂y en lugar de ∂f ∂x (x, y) y ∂f ∂y (x, y). Estas derivadas también se denotan fx y fy ó, Dxf y Dyf. Recordemos que la definición usual de derivada es h (x0) = l´ım x→0 h(x0 + x) − h(x0) x Al escribir dicha fórmula en términos de f obtenemos ∂f ∂x (x0, y0) = l´ım x→0 f(x0 + x, y0) − f(x0, y0) x (2.1) De la misma manera tenemos que 34
  35. 35. ∂f ∂y (x0, y0) = l´ım y→0 f(x0, y0 + y) − f(x0, y0) y . (2.2) Puesto que las derivada parciales son también funciones de las variables x y y, podemos también derivarlas parcialmente para obtener derivadas parciales de segundo orden denotadas como se muestra a continuación: ∂ ∂x ∂f ∂x = ∂2 f ∂x2 , ∂ ∂y ∂f ∂y = ∂2 f ∂y2 , ∂ ∂x ∂f ∂y = ∂2 f ∂x∂y , ∂ ∂y ∂f ∂x = ∂2 f ∂y∂x . Las derivadas parciales que involucran las dos variables x y y se denominan derivadas parciales mixtas. Un hecho importante es que bajo ciertas condiciones estas derivadas mixtas son iguales como lo dice el siguiente teorema. Teorema 2.3.1 Si las derivadas parciales mixtas son continuas en un conjunto abierto U que contiene un punto (x0, y0), entonces ∂2 f ∂x∂y (x0, y0) = ∂2 f ∂y∂x (x0, y0). Las derivadas parciales de z = f(x, y) se interpretan geométricamente como las pendientes de las tangentes a las curvas intersección de la gráfica de f con los planos x =constante y y =constante como se observa en las gráficas abajo. 2.3.2. Superficies parametrizadas En el capítulo anterior definimos curva (parametrizada) en el espacio como una función −→r : I ⊆ R → R3 . En este caso, como el dominio es un subconjunto de 35
  36. 36. la recta real, tenemos un solo parámetro que denotamos con la letra t y escribi- mos −→r (t) = (x(t), y(t), z(t)). Análogamente tenemos el concepto de superficie parametrizada como una función −→r : U ⊆ R2 → R3 . Como el dominio es un subconjunto del plano, tenemos ahora dos parámetros que denotamos con las letras u y v, y escribimos −→r (u, v) = (x(u, v), y(u, v), z(u, v)) x, y y z son por supuesto, funciones de U en R. Las ecuaciones x = x(u, v), y = y(u, v), z = z(u, v) son las ecuaciones paramétricas. La gráfica abajo ilustra la situación. Ejemplo 2.3.1 1. El cilindro. Un cilindro de radio a se puede parametrizar en la forma −→r (u, v) = (a cos u, a sen u, v), u ∈ [0, 2π], −∞ < v < ∞ La secuencia siguiente muestra cómo se transforma el rectángulo [0, 2π]× [0, 1] en el cilindro. 2. La esfera. Para la parametrización de la esfera observe la gráfica abajo. 36
  37. 37. En el triángulo rectángulo OAB se tiene que x = h cos θ y y = h sen θ y en el triángulo rectángulo OBC se tiene que z = a cosϕ. Pero de nuevo en OBC se tiene que h = a sen ϕ, de manera que las ecuaciones paramétricas de la esfera son x = a cos θ sen ϕ y = a sen θ sen ϕ z = a cosϕ en donde θ ∈ [0, 2π] y ϕ ∈ [0, π]. Así la función −→r tiene la forma −→r (θ, ϕ) = (a cos θ sen ϕ, a sen θ sen ϕ, a cos ϕ) 3. La gráfica de z = f(x, y). Análogo a la parametrización de la gráfica de una función de una variable y = f(x) como la curva −→r (t) = (t, f(t)), la gráfica de una función de dos variables z = f(x, y) se puede ver como una superficie parametrizada solo con tomar x = u, y = v, z = f(u, v), esto es, −→r (u, v) = (u, v, f(u, v)) 4. Ejercicio (para los curiosos). Pruebe que una parametrización del hiperboloide de una hoja x2 +y2 −z2 = 1 está dada por las ecuaciones x = cos u coshv y = sen u cosh v z = senh v 37
  38. 38. para u ∈ [0, 2π], −∞ < v < +∞. 2.3.3. El plano tangente En una superficie parametrizada, −→r (u, v) = (x(u, v), y(u, v), z(u, v)) con (u, v) ∈ U, las rectas u = u0 (constante) y v = v0(constante) se convierten por la acción de −→r en las curvas sobre la superficie −→r (u) = −→r (u, v0) y −→r (v) = −→r (u0, v) como se observa en la gráfica abajo. Dichas curvas se denominan curvas coordenadas. Los vectores tangentes en el punto u0 y v0 son respectivamente −→ r (u0) = ∂−→r ∂u (u0, v0) y −→ r (v0) = ∂−→r ∂v (u0, v0) y se definen por ∂−→r ∂u (u0, v0) = ∂x ∂u (u0, v0), ∂y ∂u (u0, v0), ∂z ∂u (u0, v0) ∂−→r ∂v (u0, v0) = ∂x ∂v (u0, v0), ∂y ∂v (u0, v0), ∂z ∂v (u0, v0) Si dichos vectores son linealmente independientes, entonces generan un plano que pasa por el punto −→r (u0, v0) denominado plano tangente, con vector normal ∂−→r ∂u (u0, v0) × ∂−→r ∂v (u0, v0). Por lo tanto, si −→r (u0, v0) = (x0, y0, z0), la ecuación del plano tangente en ese punto es (x − x0, y − y0, z − z0) · ∂−→r ∂u (u0, v0) × ∂−→r ∂v (u0, v0) = 0 38
  39. 39. En el caso particular en el que tenemos la gráfica de z = f(x, y), con la parametrización −→r (x, y) = (x, y, f(x, y)) tenemos que ∂−→r ∂x × ∂−→r ∂y = 1, 0, ∂f ∂x × 0, 1, ∂f ∂y = − ∂f ∂x , − ∂f ∂y , 1 . Si escribimos z0 = f(x0, y0), la ecuación del plano tangente es z = f(x0, y0) + ∂f ∂x (x0, y0)(x − x0) + ∂f ∂y (x0, y0)(y − y0) (2.3) 2.3.4. El concepto de diferenciabilidad Recordamos inicialmente el concepto de diferenciabilidad para una función de una variable y = f(x), para luego, de forma análoga, abordar el caso z = f(x, y). Diferenciabilidad de y = f(x). Sabemos que en el caso de una función de una variable de la forma y = f(x), la derivada de f en un punto x0 se define como f (x0) = l´ım x→0 f(x0 + x) − f(x0) x en caso de que dicho límite exista. Si esto último es cierto, la pendiente de la recta secante está cercana a la pendiente de la tangente si x es pequeño así: f(x0 + x) − f(x0) x ≈ f (x0) 39
  40. 40. El error cometido en la aproximación está dado por ε = f(x0 + x) − f(x0) x − f (x0) Entre más pequeño sea x, menor es el error. La expresión anterior se puede escribir en la forma f(x0 + x) − f(x0) x = f (x0) + ε donde ε → 0 cuando x → 0. Si escribimos y = f(x0 + x) − f(x0), obtenemos la ecuación y = f (x0) x + ε x (2.4) donde ε → 0 cuando x → 0. Si escribimos x = x0 + x, entonces f(x) = f(x0)+ y y la ecuación 2.4 toma la forma f(x) = f(x0) + f (x0)(x − x0) + ε(x − x0) donde ε → 0 cuando x → x0. Podemos escribir entonces f(x) ≈ f(x0) + f (x0)(x − x0) si x está cerca de x0. Entre más cerca esté x de x0 más pequeño es el error cometido en la aproximación . La expresión de la derecha en la aproximación anterior es lineal en x, esto es, la función L(x) = f(x0) + f (x0)(x − x0) es una linea recta. Así, f(x) ≈ L(x) cerca de x0 y esta es exactamente la idea de diferenciabilidad: Una función y = f(x) es diferenciable en un punto x0, si el incremento en y, y se puede escribir como en la ecuación 2.4, es decir, si localmente (esto es, en cualquier vecindad de x0) se puede aproximar por una recta, más específi- camente, por la recta tangente en x0; hablando claro, si localmente, la gráfica de f es "casi" una recta. En un computador se puede comprobar esto. Dibuje la gráfica de, por ejemplo, f(x) = x2 con un programa de cálculo simbólico (MuPad por ejemplo) y haga 40
  41. 41. zoom cerca del origen de coordenadas. Se dará cuenta de que entre mayor sea el zoom, la gráfica de la parábola será cada vez más recta. Esto no sucede por ejemplo con la función f(x) = |x| pues no importa qué tan cerca se esté del origen, la gráfica de f siempre se verá como una punta (dos rectas). El primer sumando en el miembro derecho de la ecuación 2.4 se denomina diferencial de f y se denota df o más comúnmente dy, así, la diferencial en cualquier x es dy = f (x) x y se toma generalmente como una aproximación para y; entre más pequeño sea x mejor es la aproximación. Diferenciabilidad de z = f(x, y). De la misma manera como la diferenciabilidad de una función de una variable y = f(x) tiene que ver con la existencia de una función lineal (una recta) L(x) que aproxima a f en una vecindad de un punto x0, la diferenciabilidad de z = f(x, y) en un punto (x0, y0) tiene que ver con la existencia de una función lineal (un plano) L(x, y) que aproxima a f en una vecindad de (x0, y0), esto es, algo como f(x, y) ≈ A + Bx + Cy. Para encontrar tal aproximación, le aplicamos el mismo análisis anterior a las derivadas parciales, ecuaciones 2.1 y 2.2, y obtenemos formas análogas a la ecuación 2.4 para los incrementos parciales f(x0 + x, y0) − f(x0, y0) = ∂f ∂x (x0, y0) x + ε1 x f(x0, y0 + y) − f(x0, y0) = ∂f ∂y (x0, y0) y + ε2 y donde ε1 y ε2→ 0 cuando x y y→ 0. Tenemos así aproximaciones lineales para los incrementos parciales. Parece nat- ural pensar que el incremento de f en ambas variables simultáneamente, pueda aproximarse por la suma (ya que necesitamos que la aproximación sea lineal) de las dos aproximaciones parciales. Esto no siempre sucede, pero cuando es así, tenemos nuestra definición de diferenciabilidad: Una función de dos variables z = f(x, y) es diferenciable en (x0, y0), si el 41
  42. 42. incremento de z, z = f(x0 + x, y0 + y) − f(x0, y0) puede escribirse en la forma z = ∂f ∂x (x0, y0) x + ∂f ∂y (x0, y0) y + ε1 x + ε2 y (2.5) donde (ε1, ε2) → (0, 0) cuando ( x, y)→ (0, 0). Si escribimos x = x0 + x y y = y0 + y, entonces la ecuación 2.5 toma la forma f(x, y) = f(x0, y0)+ ∂f ∂x (x0, y0)(x−x0)+ ∂f ∂y (x0, y0)(y−y0)+ε1(x−x0)+ε2(y−y0) (2.6) donde (ε1, ε2) → (0, 0) cuando (x, y) → (x0, y0). La ecuación 2.6 explica el concepto de forma clara: si escribimos L(x, y) = f(x0, y0) + ∂f ∂x (x0, y0)(x − x0) + ∂f ∂y (x0, y0)(y − y0) tenemos entonces la aproximación lineal f(x, y) ≈ L(x, y) en una vecindad de (x0, y0). Note que la función L es precisamente el plano tangente en el punto (x0, y0) (vea de nuevo la ecuación 2.3). Tenemos así, que f es diferenciable si puede linealizarse localmente, esto es, si en una vecindad de un punto (x0, y0) la gráfica de f se ve “casi” plana, siendo dicho plano precisamente el plano tangente. Los dos primeros términos de la derecha de la ecuación 2.5 se denomina la diferencial de f y se denota df o más comúnmente dz así: dz = ∂f ∂x (x0, y0) x + ∂f ∂y (x0, y0) y y es una aproximación para el incremento z. Si le aplicamos esta definición a las variables independientes x y y obtenemos que dx = ∂x ∂x x + ∂x ∂y y = x y de la misma manera, dy = y. Por esta razón, es común que la diferencial en cualquier punto (x, y) se escriba en la forma dz = ∂f ∂x dx + ∂f ∂y dy. (2.7) Nota. A veces, por abuso de notación, la ecuación 2.7 se escribe 42
  43. 43. dz = ∂z ∂x dx + ∂z ∂y dy Si fes diferenciable en (x0, y0), de la ecuación 2.6 se deduce de forma inmediata que f es continua en dicho punto pues claramente f(x, y) → f(x0, y0) cuando (x, y) → (x0, y0). Contrario a lo que sucede en el caso de una variable en el que la existencia de la derivada es suficiente para garantizar la existencia de la recta tangente, para una función de dos variables la sola existencia de las derivadas parciales no implica la existencia del plano tangente. Por ejemplo, la función f(x, y) = xy x2 + y2 si (x, y) = (0, 0) 0 si (x, y) = (0, 0) no es diferenciable en (0, 0) pues aunque ∂f ∂x (0, 0) = ∂f ∂y (0, 0) = 0, la función no es continua en (0, 0). Abajo se muestra su gráfica generada por MuPad para x [−0.01, 0.01] y y [−0.01, 0.01]. −0.4 0.010 0.005 −0.005 x 0.005 y 0.000 0.000−0.005 −0.010 −0.010 −0.2 0.0z 0.2 0.4 0.010 El teorema siguiente establece las condiciones suficientes para la diferenciabil- idad. Teorema 2.3.2 Si las derivadas parciales de z = f(x, y) existen y son contin- uas en (x0, y0) entonces fes diferenciable en dicho punto, es decir, z puede escribirse como en la ecuación 2.5. 43
  44. 44. 2.4. La Regla de la Cadena Sea z = f(x, y) un campo escalar diferenciable en un conjunto abierto U ∈ R2 , y supongamos que x = x(t) y y = y(t) son funciones diferenciables de t. Se tiene entonces que z = z(t) = f(x(t), y(t)), esto es, tenemos la composición z(t) = f ◦ h(t) donde h es la función vectorial definida por h(t) = (x(t), y(t)). El teorema siguiente establece la forma como se calcula la derivada z (t): Teorema 2.4.1 En las condiciones del comentario anterior, se tiene que dz dt = ∂f ∂x dx dt + ∂f ∂y dy dt (2.8) Demostración. Puesto que f es diferenciable se tiene que z = ∂f ∂x x + ∂f ∂y y + ε1 x + ε2 y donde (ε1, ε2) → (0, 0) cuando ( x, y) → (0, 0). Dividiendo ambos miembros de la ecuación por t y tomando el límite cuando t → 0 obtenemos dz dt = ∂f ∂x l´ım t→0 x t + ∂f ∂y l´ım t→0 y t + l´ım t→0 ε1 x t + l´ım t→0 ε2 y t (2.9) donde (ε1, ε2) → (0, 0) cuando ( x, y) → (0, 0). Por un lado, l´ım t→0 x t = dx dt y l´ım t→0 y t = dy dt . Por otro lado, l´ım t→0 x = l´ım t→0 x(t + t) − x(t) = 0 puesto que x = x(t) es una función continua (por ser diferenciable). De la mis- ma manera, l´ım t→0 y = 0, lo que significa que l´ım t→0 ε1 = l´ım t→0 ε2 = 0 por lo que la ecuación 2.9 se convierte en la ecuación 2.8. Nota. A veces, por abuso de notación, la regla de la cadena se escribe así: dz dt = ∂z ∂x dx dt + ∂z ∂y dy dt En el caso en que x y y sean funciones diferenciables de dos variables s y t, x = x(s, t), y = y(s, t), entonces z = z(s, t) = f(x(s, t), y(s, t)) y las derivadas parciales de z con respecto a s y t están dadas por: 44
  45. 45. ∂z ∂s = ∂z ∂x ∂x ∂s + ∂z ∂y ∂y ∂s ∂z ∂t = ∂z ∂x ∂x ∂t + ∂z ∂y ∂y ∂t (2.10) Podemos utilizar la regla de la cadena para encontrar dy dx en el caso en que la ecuación F(x, y) = k defina y como función implícita de x. Derivando a ambos lados de la ecuación F(x, y(x)) = k (aplicando la ecuación 2.8 obtenemos ∂F ∂x dx dx + ∂F ∂y dy dx = 0 Así tenemos que dy dx = − ∂F ∂x ∂F ∂y . (2.11) Análogamente, si la ecuación F(x, y, z) = k define z como función implícita de x y y, podemos encontrar fórmulas para las derivadas parciales de z con respecto a x y y aplicando las fórmulas dadas por las ecuaciones 2.10 a la ecuación F(x, y, z(x, y)) = k para obtener ∂z ∂x = − ∂F ∂x ∂F ∂z ∂z ∂y = − ∂F ∂y ∂F ∂z Ejercicio. Si z(t) = f(x(t), y(t)), calcular d2 z dt2 . Tenemos que dz dt = ∂z ∂x dx dt + ∂z ∂y dy dt . Derivando a ambos lados de esta ecuación, aplicando la regla de la derivada de un producto, obtenemos: d2 z dt2 = d dt ∂z ∂x dx dt + ∂z ∂x d2 x dt2 + d dt ∂z ∂y dy dt + ∂z ∂y d2 y dt2 (2.12) Para las derivadas con respecto a t de ∂z ∂x y ∂z ∂y , debemos aplicar de nuevo la regla de la cadena (ecuación 2.8) porque ∂z ∂x y ∂z ∂y son funciones de x y y y estas a su vez son funciones de t así: d dt ∂z ∂x = ∂2 z ∂x2 dx dt + ∂2 z ∂y∂x dy dt 45
  46. 46. d dt ∂z ∂y = ∂2 z ∂x∂y dx dt + ∂2 z ∂y2 dy dt reemplazando estas dos expresiones en la ecuación 2.12, asumiendo que las derivadas parciales mixtas son iguales y reduciendo términos semejantes, obten- emos la expresión d2 z dt2 = ∂2 z ∂x2 dx dt 2 + 2 ∂2 z ∂x∂y dx dt dy dt + ∂2 z ∂y2 dy dt 2 + ∂z ∂x d2 x dt2 + ∂z ∂y d2 y dt2 La regla de la cadena para una función de tres variables w = w(t) = f(x(t), y(t), z(t)) tiene una forma análoga a la ecuación 2.8: dw dt = ∂w ∂x dx dt + ∂w ∂y dy dt + ∂w ∂z dz dt (2.13) 2.4.1. El vector gradiente Observe que la ecuación 2.8 puede escribirse en la forma dz dt = ∂f ∂x , ∂f ∂y · dx dt , dy dt El vector ∂f ∂x , ∂f ∂y se denomina gradiente de fen (x, y) y se denota f, así: f = ∂f ∂x , ∂f ∂y Nota. La notación f significa f(x, y). Si calculamos el gradiente en un punto (x0, y0) escribimos f(x0, y0) = ∂f ∂x (x0, y0), ∂f ∂y (x0, y0) Si escribimos −→r (t) = (x(t), y(t)), entonces −→r (t) = dx dt , dy dt y la ecuación 2.8, calculada en un punto t0, toma la forma dz dt |t=t0 = d dt |t=t0 f(−→r (t)) = f(−→r (t0)) · −→ r (t0) (2.14) Podemos utilizar la forma de la regla de la cadena como la expresa la ecuación 2.14 para probar que el vector gradiente de z = f(x, y) en un punto P = (x0, y0) es perpendicular a la curva de nivel f(x, y) = k que pasa por P. Para ver esto, 46
  47. 47. supongamos que dicha curva de nivel está descrita por la función vectorial −→r (t) = (x(t), y(t)) que pasa por P en un tiempo t0, esto es, P = −→r (t0) = (x0, y0). Es claro entonces que debe ser f(x(t), y(t)) = f(−→r (t)) = k. Derivando a ambos lados de esta ecuación tenemos que d dt f(−→r (t)) = 0 (2.15) Aplicando la fórmula 2.14 para el lado izquierdo de la ecuación 2.15 en el punto P, tenemos que f(x0, y0) · −→ r (t0) = 0 lo que prueba lo afirmado. La gráfica abajo ilustra la situación. De la misma manera, el vector gradiente de una función de tres variables w = F(x, y, z) en un punto P = (x0, y0, z0) es perpendicular a la superfi- cie de nivel S definida por la ecuación F(x, y, z) = k que pasa por P. Si −→r (t) = (x(t), y(t), z(t)) es cualquier curva sobre S que pasa por P en un tiem- po t0, entonces F(−→r (t)) = k y de nuevo F(x0, y0, z0) · −→ r (t0) = 0 (2.16) 47
  48. 48. Como la ecuación 2.16 es válida para todas las curvas sobre S que pasan por P, resulta natural definir el plano tangente a S en el punto P como el plano que pasa por P(x0, y0, z0) y que tiene por vector normal el gradiente F(x0, y0, z0), por lo que su ecuación será (−→x − P) · F(P) = 0 siendo su expresión cartesiana ∂F ∂x (x0, y0, z0)(x − x0) + ∂F ∂y (x0, y0, z0)(y − y0) + ∂F ∂z (x0, y0, z0)(z − z0) = 0. (2.17) Observe que como la gráfica de una función de dos variables z = f(x, y) puede verse como la superficie de nivel F(x, y, z) = 0 donde F(x, y, z) = f(x, y) − z, al aplicar la ecuación 2.17 a esta F en particular, obtenemos la ecuación 2.3. 2.5. Derivadas Direccionales Recordemos que la derivada parcial con respecto a x de una función de dos variables z = f(x, y) se define por ∂f ∂x (x0, y0) = l´ım t→0 f(x0 + t, y0) − f(x0, y0) t Esta es la misma ecuación 2.1 en donde hemos reemplazado x por t. Esta expresión puede escribirse en la forma ∂f ∂x (x0, y0) = l´ım t→0 f((x0, y0) + t(1, 0)) − f(x0, y0) t Si escribimos −→x0 = (x0, y0) y −→ i = (1, 0) obtenemos 48
  49. 49. ∂f ∂x (−→x0) = l´ım t→0 f(−→x0 + t −→ i ) − f(−→x0) t De la misma manera, escribiendo −→ j = (0, 1) la derivada parcial con respecto a y se escribe ∂f ∂y (−→x0) = l´ım t→0 f(−→x0 + t −→ j ) − f(−→x0) t Esta forma de expresar las derivadas parciales muestran que dichas derivadas se calculan tomando la variación de f a lo largo de las rectas −→α (t) = −→x0 + t −→ i y −→ β (t) = −→x0 + t −→ j , esto es, rectas paralelas a los ejes coordenados que pasan por −→x0. Podemos pensar en generalizar esto, calculando la variación de f a lo largo de cualquier recta que pase por −→x0, esto es, una recta de la forma −→r (t) = −→x0 + t−→u donde −→u es un vector unitario cualquiera. Esto nos conduce al concepto de derivada direccional en la dirección de un vector unitario −→u en un punto −→x0, denotada D−→u f(−→x0) y definida de la manera natural D−→u f(−→x0) = l´ım t→0 f(−→x0 + t−→u ) − f(−→x0) t (2.18) y se puede interpretar geométricamente como la pendiente de la tangente de la curva de intersección de la gráfica de f con un plano perpendicular al plano coordenado xy en el punto −→x0. Es claro entonces que 49
  50. 50. ∂f ∂x (−→x0) = D−→ i f(−→x0) ∂f ∂y (−→x0) = D−→ j f(−→x0) esto es, las derivadas parciales son las derivadas direccionales en las direcciones −→ i y −→ j , que corresponden a las pendientes de las tangentes de las curvas de intersección de la gráfica de f con planos perpendiculares al plano coordenado xy paralelos a los planos coordenados xz y yz respectivamente, como se explicó en la sección 2.3.1. Una forma sencilla de calcular la derivada direccional en la dirección de un vector unitario −→u de una función f la da el siguiente teorema: Teorema 2.5.1 D−→u f(−→x0) = f(−→x0) · −→u (2.19) Demostración. Si llamamos −→r (t) = −→x0 + t−→u a la recta que pasa por −→x0 con vector director −→u , entonces −→r (0) = −→x0 y −→ r (0) = −→u . Entonces d dt |t=0f(−→r (t)) = l´ım t→0 f(−→r (t)) − f(−→r (0)) t = l´ım t→0 f(−→x0 + t−→u ) − f(−→x0) t = D−→u f(−→x0) Pero, por la regla de la cadena (ecuación 2.14) se tiene que d dt |t=0f(−→r (t)) = f(−→r (0)) · −→ r (0) = f(−→x0) · −→u lo que demuestra el teorema. Nota. Observe que la definición de derivada direccional (ecuación 2.18) ó su expresión en términos del gradiente (ecuación 2.19) es válida para cualquier campo escalar f definido en Rn . La derivada direccional de un campo escalar f en un punto −→x0 en la dirección de un vector −→u (unitario), representa la tasa de cambio de f en dicho punto en la dirección dada. Podemos preguntarnos por la dirección en la cual dicha tasa de cambio es máxima ó mínima. Podemos encontrar la razón de cambio máxima y mínima de f a partir de la ecuación 2.19. Puesto que −→u = 1, D−→u f(−→x0) = f(−→x0) · −→u = f(−→x0) cos θ 50
  51. 51. dónde θ es el ángulo entre f(−→x0) y −→u . Puesto que el coseno oscila entre −1 y 1, la razón máxima se obtiene cuando cos θ = 1, esto es θ = 0, es decir, cuando −→u y f(−→x0) tienen la misma dirección y es mínima cuando cos θ = −1, esto es θ = π, es decir, cuando −→u y f(−→x0) tienen direcciones opuestas. Resumiendo, la derivada direccional máxima se obtiene en la dirección del gradiente, esto es, −→u = f f y su valor es D f || f|| f = f ; la derivada direccional mínima se obtiene en la dirección opuesta al gradiente y su valor es − f . 2.6. Máximos y Mínimos. 1. f(−→a ) es un valor máximo global de f en U si f(−→a )≥f(x, y) para todo (x, y) ∈ U. 2. f(−→a ) es un valor mínimo global de f en U si f(−→a )≤f(x, y) para todo (x, y) ∈ U. 3. f(−→a ) es un valor extremo global de f en U si es un valor máximo global o mínimo global. Son válidas las mismas definiciones, sustituyendo la palabra global por local en (1) y (2), cuando las desigualdades se cumplen en alguna vecindad abierta de −→a . La definición es una generalización natural de las mismas nociones para fun- ciones de una sola variable; y aún más, las generalizaciones para funciones de tres y más variables son claras. Teorema 2.6.1 (Existencia de máximo o mínimo)) Si f es continua en un dominio cerrado y acotado U, entonces f alcanza tanto un valor máximo global como un mínimo global en U. A continuación definiremos lo que son puntos frontera, puntos críticos y puntos singulares. 1. Puntos frontera. Vea la sección 2.2 2. Puntos críticos. Decimos que −→a es un punto crítico si es interior en U donde f es diferenciable y f(−→a ) = 0. En dicho punto, el plano tangente es horizontal. 3. Puntos singulares. Decimos que a es un punto singular si es interior en U donde f no es diferenciable (por ejemplo, un punto de la gráfica donde f tiene una esquina aguda). 51
  52. 52. Teorema 2.6.2 (Condiciones necesarias para los extremos) Sea f una función definida en un conjunto U que contiene a −→a . Si f(−→a ) es un valor extremo, entonces −→a deberá ser un punto frontera de U, o un punto crítico de f, o un punto singular de f. Demostración. Supongamos que −→a = (x0, y0) no es punto frontera ni singular (por lo que −→a será un punto interior en el que f existe) y veremos si f(−→a ) = −→ 0 Puesto que f tiene un valor extremo en (x0, y0), la función g(x) = f(x, y0) tiene un valor extremo en x0. Además, g es diferenciable en x0 puesto que f lo es para (x0, y0) y por lo tanto, por el teorema del punto crítico para funciones de una variable, g (x0) = fx(x0, y0) = 0 En forma análoga, la función h(y) = f(x0, y) tiene un valor extremo en y0 y satisface la expresión h (x0) = fy(x0, y0) = 0 El gradiente es cero, ya que ambas derivadas parciales son 0. Ejemplo 2.6.1 Encuentre el valor máximo o mínimo local de f(x, y) = x2 − 2x + y2 /4. Solución La función dada es derivable en todo el plano xy. Por lo tanto, los únicos puntos críticos posibles son los puntos críticos que se obtienen al igualar a cero fx(x, y) y fy(x, y). Pero fx(x, y) = 2x − 2 y fy(x, y) = y/2 son iguales a cero sólo cuando x = 1 e y = 0. Falta por decidir si (1, 0) es un máximo, un mínimo o nada de esto. Pronto desarrollaremos un instrumento para esto, pero por ahora debemos proceder con un poco de ingenio. Obsérvese que f(1, 0) = −1 y que f(x, y) = x2 − 2x + y2 4 = x2 − 2x + 1 y2 4 − 1 = (x − 1)2 + y2 4 − 1 ≥ −1 Por lo tanto, f(1, 0) es en realidad un mínimo global de f. No hay valores máximos locales. Ejemplo 2.6.2 Encuentre los valores máximo o mínimo locales de f(x, y) = −x2 /a2 + y2 /b2. Solución. Los únicos puntos críticos se obtienen al igualar a cero fx(x, y) = −2x/a2 y fy(x, y) = 2y/b2 . Esto produce el punto (0, 0) que no da máximo ni mínimo (vea la figura 11). Se llama punto de silla. Debe notarse que en toda vecindad de (0, 0) hay puntos en los que f(x, y) < f(0, 0), y otros puntos en los que f(x, y) > f(0, 0). La función dada no tiene extremos locales. Este ejemplo ilustra la dificultad de que f(x0, y0) = 0 no garantiza que exista un extremo local en (x0, y0). Por fortuna, existe un criterio regular para decidir lo que sucede en un punto crítico. El próximo teorema es un análogo a la prueba de segunda derivada para funciones de una variable. 52
  53. 53. 2.6.1. Criterio para determinar extremos de funciones de dos variables Teorema 2.6.3 [Condiciones suficientes para los extremos] Supóngase que f(x, y) tiene segundas derivadas parciales continuas en una vecindad de −→a ∈ R2 y que f(−→a ) = 0. Sea A = ∂2 f(−→a ) ∂x2 , B = ∂2 f(−→a ) ∂x∂y , C = ∂2 f(−→a ) ∂y2 y sea Hf(−→a ) la matriz definida por Hf(−→a ) = A B B D Escribamos D(−→a ) = det(Hf(−→a )). Entonces 1. Si D(−→a ) > 0 y ∂2 f(−→a ) ∂x2 > 0, entonces tiene un mínimo relativo en −→a . 2. Si D(−→a ) > 0 y ∂2 f(−→a ) ∂x2 < 0, entonces tiene un máximo relativo en −→a . 3. Si Si D(−→a ) < 0, entonces tiene un punto silla en −→a . 4. Si D(−→a ) = 0, el criterio no decide nada. Nota. La matriz Hf(−→a ) se denomina matriz hessiana de f en −→a . Para su demostración, remitimos al lector al apéndice. Sin embargo, podemos ver de manera intuitiva porqué es cierto. D es D(−→a ) = ∂2 f(−→a ) ∂x2 · ∂2 f(−→a ) ∂y2 − ∂2 f(−→a ) ∂x∂y 2 Para los casos 1 y 2, en los cuales D(−→a ) > 0, se tiene entonces que ∂2 f(−→a ) ∂x2 · ∂2 f(−→a ) ∂y2 > ∂2 f(−→a ) ∂x∂y 2 ≥ 0, por lo que las dos derivadas ∂2 f(−→a ) ∂x2 y ∂2 f(−→a ) ∂y2 deben tener el mismo signo. Así, si ∂2 f(−→a ) ∂x2 > 0, se tiene concavidad hacia arriba en las direcciones de ambos ejes, por lo que se puede sospechar que en −→a existe un mínimo. Y si ∂2 f(−→a ) ∂x2 < 0, se tiene concavidad hacia abajo en la dirección de ambos ejes, por lo que se puede sospechar la existencia de un máximo en −→a . En el caso 3, en el cual D(−→a ) < 0, el producto de las dos derivadas ∂2 f(−→a ) ∂x2 y ∂2 f(−→a ) ∂y2 debe ser negativo y por lo tanto deben tener signos opuestos; de tal manera que tenemos concavidad hacia arriba en la dirección de uno de los ejes y concavidad hacia abajo en la dirección del otro, por lo que sospechamos un punto silla en −→a . Se deja al estudiante comprobar la parte 4. 53
  54. 54. Ejemplo 2.6.3 Encuentre los extremos, si los hay, de la función f(x, y) = 3x3 + y2 − 9x + 4y. Solución. Puesto que fx(x, y) = 9x2 −9 y fy(x, y) = 2y +4, los puntos críticos que se obtienen al resolver las ecuaciones simultáneas fx(x, y) = fy(x, y) = 0 son (1, −2) y (−1, −2).Ahora bien, fxx(x, y) = 18x, fyy(x, y) = 2 y fxy(x, y) = fyx(x, y) = 0. Por lo tanto, en el punto crítico (1, −2) tenemos D(1, −2) = fxx(1, −2)fyy(1, −2) − f2 xy(1, −2) = 18(2) − 0 = 36 > 0 Además, fxx(1, −2) = 18 > 0, por lo que según el teorema anterior, f(1, −2) = −10 es un valor mínimo local de f. En la comprobación de la función dada en otro punto crítico (−1, −2) encontramos que fxx(−1, −2) = −18, fyy(−1, −2) = 2 y fxy(−1, −2) = 0, lo cual produce D(−1, −2) = −36 < 0. Entonces, (−1, −2) es un punto de silla y f(−1, −2) no es valor extremo. Ejemplo 2.6.4 Encuentre los valores máximo y mínimo de f(x, y) = 2x2 + y2 − 4x − 2y + 5 en el conjunto cerrado U = {(x, y)| x2 + y2 /2 ≤ 1}. Solución. Como fx(x, y) = 4x − 4 y fy(x, y) = 2y − 2, el único punto crítico posible es (1, 1). Sin embargo, este punto está fuera de U, entonces puede ser ignorado. La frontera de U es la elipse x2 + y2 /2 = 1, que se puede describir paramétricamente por x = cos t, y = √ 2 sen t, 0 ≤ t ≤ 2π Deseamos maximizar o minimizar la función de una variable g(t) = f(cos t, √ 2 sen t), 0 ≤ t ≤ 2π Por la regla de la cadena, g (t) = ∂f ∂x dx dt + ∂f ∂y dx dt = (4x − 4)(−sen t) + (2y − 2)( √ 2 cos t) = (4 cos t − 4)(−sen t) + (2 √ 2 sen t − 2)( √ 2 cos t) = 4 sen t − 2 √ 2 cos t Haciendo g (t) = 0 obtenemos tan t = √ 2/2 con los dos soluciones t1 = arctan( √ 2/2) y t2 = π + t1. De donde g(t) tiene los cuatro puntos críticos 0, t1, t2 y 2π en el intervalo [0, 2π]. Estos, a su vez, determinan los tres pun- tos (1, 0), (2/ √ 6, 2/ √ 6) y (−2/ √ 6, −2/ √ 6) en la frontera de U. Los valores correspondientes de f son f(1, 0) = 3, f 2 √ 6 , 2 √ 6 ≈ 2,101, f −2 √ 6 , −2 √ 6 ≈ 11,899 Luego, concluimos que el valor mínimo de f en U es 2.101 y el valor máximo es 11.899. 54
  55. 55. Ejemplo 2.6.5 Encuentre la distancia mínima entre el origen y la superficie z2 = x2 y + 4. Solución. Sea P(x, y, z) un punto cualquiera de la superficie dada. El cuadra- do de la distancia entre el origen y P es d2 = x2 + y2 + z2 . Busquemos las coordenadas de P que hagan que d2 (y por lo tanto d ) sea mínima. Puesto que P pertenece a la superficie, sus coordenadas satisfacen la ecuación de ésta. Sustituyendo z2 = x2 y + 4 en d2 = x2 + y2 + z2 resulta d2 como función de dos variables x e y d2 = f(x, y) = x2 + y2 + x2 y + 4 Para obtener los puntos críticos, hacemos fx(x, y) = 0 y fy(x, y) = 0, con lo que se obtiene 2x + 2xy = 0 y 2y + x2 = 0 Por eliminación de y entre esas ecuaciones, se tendrá 2x−x3 = 0. Por lo tanto, x = 0 o x = ± √ 2. Sustituyendo estos valores en la segunda ecuación se obtiene y = 0 e y = −1. Luego, los puntos críticos son (0, 0), ( √ 2, −1) y (− √ 2, −1). Para probar cada uno de ellos, necesitamos fxx(x, y) = 2 + 2y, fyy(x, y) = 2, fxy(x, y) = 2x y D(x, y) = fxxfyy − f2 xy = 4 + 4y − 4x2 . Puesto que D(± √ 2, −1) = −8 < 0, ni ( √ 2, −1) ni (− √ 2, −1) producen un extremo. Sin embargo, D(0, 0) = 4 > 0 y fxx(0, 0) = 2 > 0; por lo tanto, (0, 0) produce la distancia mínima. Sustituyendo x = 0 e y = 0 en la expresión de d2 , obtenemos d2 = 4. Luego, la distancia mínima entre el origen y la superficie dada es 2. 2.6.2. Extremos condicionados. Ahora distinguimos entre dos clases de problemas. Encontrar el valor mínimo de f(x, y) es un problema de extremo libre. Encontrar el mínimo de f(x, y) sujeto a una condición g(x, y) = 0 es un problema de extremo condicionado o de extremo restringido. El ejemplo 2.6.5 de la sección anterior fue un proble- ma de extremo condicionado. Se nos pidió encontrar la distancia mínima entre la superficie z2 = x2 y + 4 al origen. Formulamos el problema de minimizar d2 = x2 + y2 + z2 sujeta a la restricción z2 = x2 y + 4. Manejamos el problema sustituyendo el valor de z2 de la restricción en la expresión de d2 y después resolvimos el problema de valor extremo libre que resultó. Sin embargo, con frecuencia sucede que no es fácil despejar una de las variables en la ecuación de restricción y, aún cuando pueda lograrse, puede ser más práctico otro método. Este es el método de multiplicadores de Lagrange. El método de Lagrange proporciona un recurso algebraico para encontrar los puntos extremos restringidos. Si p0 es un extremo restringido, entonces la curva de nivel y la restricción son tangentes en dicho punto. Las gráficas abajo ilustran esta situación. 55
  56. 56. Dichas curvas tienen una recta tangente común y, por consecuencia, tienen una perpendicular común. Pero en cualquier punto de una curva de nivel, el vector gradiente f es perpendicular a ella (ver sección 2.4.1) y en forma similar g es perpendicular a la curva de restricción g(x, y) = 0, pues dicha curva puede verse como curva de nivel de la función z = g(x, y). Por lo tanto, f y g son paralelos en p0, es decir, f(p0) = λ0 g(p0) para algún número no nulos λ0. Esto sugiere la siguiente formulación del método de Lagrange. Método de multiplicadores de Lagrange. Si un campo escalar f(x1, x2, ..., xn) tiene un extremo (máximo o mínimo) sujeto a la restricción g(x1, x2, ..., xn) = 0, entonces existe un escalar λ tal que f = λ g en dicho punto extremo. El número λ se llama multiplicador de Lagrange. 56
  57. 57. Teniendo en cuenta el método de multiplicadores de Lagrange observemos que podemos formar la siguiente función L(x1, x2, ..., xn, λ) = f(x1, x2, ..., xn) − λg(x1, x2, ..., xn) conocida como función de Lagrange. En este caso los puntos extremos son puntos críticos de L y por lo tanto las derivadas parciales de la función L son cero en estos puntos. Ejemplo 2.6.6 Encuentre el punto del plano 2x − 2y + z = 4 que esté más próximo al origen. Solución. Se desea minimizar la distancia d = x2 + y2 + z2 sujeta a 2x − 2y+z−4 = 0. Para facilitar el problema se minimiza el cuadrado de la distancia d2 = x2 + y2 + z2 . La función de Lagrange será L(x, y, z, λ) = x2 + y2 + z2 − λ (2x − 2y + z − 4) Luego, el sistema de ecuaciones de Lagrange es ∂L ∂x = 2x − 2λ = 0, ∂L ∂y = 2y + 2λ = 0, ∂L ∂z = 2z − λ = 0, ∂L ∂λ = −2x + 2y − z + 4 = 0 Si se sustituyen los valores de 2x, 2y y z de las tres primeras ecuaciones en la cuarta, se obtiene −2λ − 2λ − λ 2 + 4 = 0, o − 9 2 λ + 4 = 0, o λ = 8 9 Por tanto, x = 8/9, y = −8/9 y z = 4/9, as´í (8/9, −8/9, 4/9) es el punto requerido, y la distancia de dicho punto al origen es 64 + 64 + 16 81 = 4 · 4 + 4 + 1 81 = 4 · 1 9 = 4 3 Ejemplo 2.6.7 ¿ Cual es el área máxima que puede tener un rectángulo si la longitud de su diagonal es 2? Solución. Coloque el rectángulo en el primer cuadrante con dos de sus lados a lo largo de los ejes coordenados; entonces, el vértice opuesto al origen tendrá como coordenadas (x, y), siendo positivas x e y. La longitud de su diagonal será x2 + y2 = 2 y su área xy. Entonces podemos formular el problema como 57
  58. 58. maximización de f(x, y) = xy sujeta a la restricción g(x, y) = x2 + y2 − 4 = 0. Formando la función de Lagrange L(x, y, λ) = xy − λ x2 + y2 − 4 llegamos al sistema de ecuaciones ∂L ∂x = y − 2λx = 0, ∂L ∂y = x − 2λy = 0, ∂L ∂λ = 4 − x2 − y2 = 0 Si multiplicamos la primera ecuación por y y la segunda por x, obtenemos y2 = 2λxy y x2 = 2λxy, por lo que y2 = x2 . De la tercera ecuación para y2 = x2 encontramos x = √ 2 e y = √ 2; y sustituyendo estos valores en x − 2λy = 0, y − 2λx = 0 resulta λ = 1/2. Entonces, la solución del sistema , conservando positivas x e y, es x = √ 2, y = √ 2, λ = 1/2.Concluimos que el rectángulo de máxima área con diagonal 2 es el cuadrado cuyos lados miden√ 2. Su área es 2. Observación 2.6.1 El definir la función de Lagrange tiene su ventaja cuando tenemos que hallar los extremos de una función f(x1, x2, ..., xn) sujetos a m restricción g1(x1, x2, ..., xn) = 0, g2(x1, x2, ..., xn) = 0, ..., gm(x1, x2, ..., xn) = 0 donde suponemos m < n. La función de la Lagrange en este caso está definida por L (x1, x2, ..., xn, λ1, λ2, ..., λm) = f(x1, x2, ..., xn) + λ1g1(x1, x2, ..., xn) +λ2g2(x1, x2, ..., xn) + ... + λmgm(x1, x2, ..., xn) Ejemplo 2.6.8 Hallar el máximo de la función f(x, y, z) = x + y + z sobre la curva determinada por el plano x + 2y + 3z = 0 y el cilindro x2 + y2 = 1 Solución:Observemos que las funciones que se determinar para definir las re- stricciones son g1(x, y, z) = x + 2y − z y g2(x, y, z) = x2 + y2 − 4. Entonces la función de Lagrange es definida por L(x, y, z, λ1, λ2) = x + y + z + λ1(x + 2y − z) + λ2 x2 + y2 − 1 Calculando las derivadas parciales e igualando a cero para hallar los puntos críticos de L obtenemos (1) ∂L ∂x = 1 + λ1 + 2λ2x = 0 (2) ∂L ∂y = 1 + 2λ1 + 2λ2y = 0 (3) ∂L ∂z = 1 − λ1 = 0 (4) ∂L ∂λ1 = x + 2y − z = 0 (5) ∂L ∂λ2 = x2 + y2 − 1 = 0 58
  59. 59. Al tomar λ1 = 1 (de (3)) en (1) obtenemos λ2x = −1, o sea que x = −1/λ2. Similarmente, (2) nos da y = −3/(2λ2). Substituyendo en (5) tenemos 1 (λ2) 2 + 9 4 (λ2) 2 = 1 as´í que (λ2) 2 = 13/4, λ2 = ± √ 13/2. Por tanto x = 2√ 13 , y = 3√ 13 y de (4) tenemos z = x + 2y = 5√ 13 . Los valores que le corresponden para la función f son 2 √ 13 3 √ 13 5 √ 13 = 10 √ 13 . El valor máximo de f es 10√ 13 . Ejemplo 2.6.9 Utilizar el software MuPad para hallar el máximo de la función f(x, y) = x3 − xy + y2 + 3 con la restricción x2 + 2y2 = 1. Hacer las gráficas que muestren que los extremos se obtienen en los puntos en donde las curvas de nivel son tangentes a la curva de restricción. Solución. Definimos las funciones f y g como sigue: F:=x^3-x*y+y^2+3-z x3 − xy + y2 − z + 3 g:=x^2+2*y^2-1 x2 + 2y2 − 1 Dibujamos la superficie que corresponde a F en z = 0: plot( plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2)) 59
  60. 60. Recordemos que las curvas de nivel se obtienen intersectando la superficie con planos z = constante. Abajo se ve un ejemplo para z = 3,5: plot( plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2), plot::Surface([x,y,3.5],x=-1.2..1.2,y=-1.2..1.2,Color=RGB::Yellow), plot::Implicit3d(F|z=3.5, x =-1.2..1.2, y=-1.2..1.2,z=3.45..3.55)) Resolvemos el sistema f(x, y) = λ g(x, y) g(x, y) = 0 que corresponde al sistema 60
  61. 61.    3x2 − y = 2λx −x + 2y = 4λy x2 + 2y2 = 1 tt:=numeric::solve([3*x^2-y=2*λa*x,-x+2*y=4*λ*y,x^2+2*y^2=1],[x,y,λ]) [x = 0.2359 - 0.5446 i, y = -0.7918 - 0.0811 i, λ = 0.5562 - 0.1777 i], [x = 0.2359 + 0.5446 i, y = -0.7918 + 0.0811 i, λ = 0.5562 + 0.1777 i], [x = 0.9468, y = -0.2275, λ = 1.5403], [x = 0.5440, y = 0.5933, λ = 0.2707], [x = -0.9853, y = -0.1207, λ = -1.5392], [x = -0.3106, y = 0.6721, λ = 0.6155] Como se ve, se tienen dos soluciones complejas y cuatro reales. Aislamos las cuatro reales en la siguiente tabla: table(1=tt[3],2=tt[4],3=tt[5],4=tt[6]) 1 2 3 4 x = 0,9468 y = −0,2275 λ = 1,5403 x = 0,5440 y = 0,5933 λ = 0,2707 x = −0,9853 y = −0,1207 λ = −1,5392 x = −0,3106 y = 0,6721 λ = 0,6155 Reemplazando los valores de x y y en la función f(x, y), obtenemos los cuatro valores: table(1=F|(x=0.9468,y=-0.2275,z=0),2=F|(x=0.5440,y=0.5933,z=0), 3=F|(x=-0.9853,y=-0.1207,z=0),4=F|(x=-0.3106,y=0.6721,z=0)) 1 2 3 4 4,1158 3,1902 1,9390 3,6305 La gráfica siguiente muestra las cuatro curvas de nivel y la curva de restricción con los puntos de tangencia en donde se encuentran los extremos. plot(plot::Implicit2d(F|z=4.1158,x=-2..2,y=-2..2), plot::Implicit2d(g,x=-2..2,y=-2..2,Color=RGB::Black), plot::Implicit2d(F|z=3.1902,x=-2..2,y=-2..2,Color=RGB::Green), plot::Implicit2d(F|z=3.6305,x=-2..2,y=-2..2,Color=RGB::Red), plot::Implicit2d(F|z=1.939,x=-2..2,y=-2..2,Color=RGB::Brown), plot::Point2d([0.94,-0.22],Color=RGB::Blue), plot::Point2d([0.54,0.59],Color=RGB::Green), 61
  62. 62. plot::Point2d([-0.98,-0.12],Color=RGB::Brown), plot::Point2d([-0.31,0.67],Color=RGB::Red)) Las cinco gráficas siguientes muestran la superficie con su restricción y las curvas de nivel correspondientes a los cuatro valores anteriores, viéndose clara- mente que los extremos se obtienen en los puntos de tangencia. plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t), (cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1), plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2), plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue)) plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t), (cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1), 62
  63. 63. plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2), plot::Implicit3d(F|z=4.1158, x =-1.2..1.2, y=-1.2..1.2,z=4.1..4.2), plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue), plot::Implicit3d(F|z=4.1158,x=-2..2,y=-2..2,z=0..0.1)) plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t), (cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1), plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2), plot::Implicit3d(F|z=3.1902, x =-1.2..1.2, y=-1.2..1.2,z=3.1..3.2), plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue), plot::Implicit3d(F|z=3.1902,x=-2..2,y=-2..2,z=0..0.1)) plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t), (cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1), 63
  64. 64. plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2), plot::Implicit3d(F|z=1.939, x =-1.2..1.2, y=-1.2..1.2,z=1.9..2), plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue), plot::Implicit3d(F|z=1.939,x=-2..2,y=-2..2,z=0..0.1)) plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t), (cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1), plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2), plot::Implicit3d(F|z=3.6305, x =-1.2..1.2, y=-1.2..1.2,z=3.6..3.7), plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue), plot::Implicit3d(F|z=3.6305,x=-2..2,y=-2..2,z=0..0.1)) Tenemos entonces el máximo z = 4,1158 en el punto (0,9468, −0,2275) y el mínimo z = 1,9390 en el punto (−0,9853, −0,1207). 64
  65. 65. Observe en este ejemplo que existen otros dos puntos de tangencia en donde no hay extremos; esto demuestra que la condición de tangencia de la curva de nivel con la curva de restricción para la existencia de un extremo, es solamente una condición necesaria pero no suficiente. 2.7. *Temas de Lectura 2.7.1. Campos Escalares y Campos Vectoriales En este capítulo consideramos las funciones de subconjuntos U ⊂ Rn (n > 1) a Rm (m ≥ 1) . Cuando m = 1, las funciones f : U ⊂ Rn → R −→x → f(−→x ) −→x = (x1, x2, ..., xn), le llamaremos campos escalares o funciones de varias vari- ables. Un campo escalar asigna a cada vector −→x un número real f(−→x ) ∈ R. Cuando m > 1, definiremos los campos vectoriales como funciones −→ F : U ⊂ Rn → Rm −→x → −→ F (−→x ) −→ F (−→x ) = (f1(−→x ), f2(−→x ), ..., fm(−→x )) donde cada una de las componentes de −→ F , fi : U ⊂ Rn → R son campos escalares o funciones de varias variables. Hablaremos de un campo vectorial sobre Rn cuando −→ F : U ⊂ Rn → Rn . Un campo vectorial asigna a cada vector −→x un vector −→ F (−→x ) ∈ Rm . Ver la figura en caso de campo vectorial sobre R2 y R3 respectivamente. 65
  66. 66. De acuerdo a la definición de campo vectorial, podemos inicialmente hacer un análisis de los campos escalares que naturalmente extenderemos a los campos vectoriales. Veamos algunos ejemplos de campos escalares y campos vectoriales: Ejemplo 2.7.1 En el plano xy el dominio natural de f(x, y) = y − x2 x2 + (y − 1)2 es U = {(x, y) : y ≤ x2 } − (0, 1). Ejemplo 2.7.2 Si z = f(x, y) = 1 3 36 − 9x2 − 4y2 y observemos que z ≥ 0. El dominio de f es el conjunto U = {(x, y) : 36 − 9x2 − 4y2 ≥ 0}. Ejemplo 2.7.3 En el caso de z = y2 − x2 , el dominio U = R2 . Definición 2.7.1 El rango de una función de varias variables f : U → R o campo vectorial −→ F : U ⊂ Rn → Rm es el conjunto representado por Rf o R−→ F definido por Rf = {f(−→x ) ∈ R : −→x ∈ U} o R−→ F = { −→ F (−→x ) ∈ Rm : −→x ∈ U} respectivamente. Definición 2.7.2 Dada una función de varias variables o campo escalar f : U ⊂ Rn → R, la gráfica de f es definida como el conjunto Gr(f) = {(x1,x2, ..., xn, xn+1) : xn+1 = f(x1,x2, ..., xn), (x1,x2, ..., xn) ∈ U}. De esta definición podemos observar que la gráfica de f está en Rn+1 . Si n = 1, tenemos una función real cuya gráfica está en el plano, mientras que si n = 2, la gráfica se encuentra en R3 . En este último caso diremos que la gráfica es una superficie. 2.7.2. Derivada en una dirección de un campo escalar en Rn . Derivadas direccionales y parciales. Sea f : U ⊂ Rn → R un campo escalar y −→a un punto interior a U. Deseamos estudiar la variación de f cuando nos desplazamos desde −→a a un punto próximo. En general, la variación de f dependerá de la dirección en la cual nos movemos 66
  67. 67. a partir de −→a . Supongamos que se presenta esa dirección mediante un vector −→y . Esto es, supongamos que nos movemos desde −→a hacia otro punto −→a + −→y , siguiendo el segmento de recta que une −→a con −→a + −→y . Cada punto de este segmento tiene la forma −→a + t−→y , donde t es un número real. Mantengamos t = 0 pero lo bastante pequeño para que −→a + t−→y ∈ U y definamos el cociente de diferencias f(−→a + t−→y ) − f(−→a ) t El numerador de este cociente pone de manifiesto el cambio de la función cuando nos desplazamos desde −→a a −→a +t−→y . El cociente denomina a su vez el promedio de variación de f en el segmento de recta que une −→a a −→a + −→y . Nos interesa el comportamiento de esa cociente cuando t → 0. Definición 2.7.3 Sea f : U ⊂ Rn → R un campo escalar y −→a un punto interior a U y −→y ∈ Rn un punto arbitrario.. La derivada de f en a con respecto a −→y se representa con el símbolo f (a; −→y ) y se define f (a; −→y ) = l´ım t→0 f(−→a + t−→y ) − f(−→a ) t cuando tal límite existe. En particular, cuando −→y es un vector unitario, es decir −→y = 1, la distancia entre a y a + t−→y es |t|. En tal caso el cociente de diferencias representa el promedio de variación de f por unidad de distancia a lo largo del segmento de recta que une a con a + −→y y la derivada f (a; −→y ) se denomina derivada direccional. Además, si −→y = −→ek (el vector k -ésimo coordenado unitario) la derivada direccional f (a; −→ek) se denomina derivada parcial respecto a ek y se denota por ∂f ∂xk (−→a ). Ejemplo 2.7.4 En R2 los vectores coordenados unitarios son los vectores i y j. Si a = (x0, y0) las derivadas parciales f (−→a ; i) y f (−→a ; j) también se escriben f (−→a ; i) = ∂f ∂x (x0, y0) = fx(x0, y0), f (−→a ; j) = ∂f ∂y (x0, y0) = fy(x0, y0) En 3 , los vectores coordenados unitarios son los vectores i, j y k. Si a = (x0, y0, z0) las derivadas parciales f (a; i), f (a; j) y f (a; k) se escriben respectivamente como ∂f ∂x (x0, y0, z0) = fx(x0, y0, z0), ∂f ∂y (x0, y0, z0) = fy(x0, y0, z0), ∂f ∂z (x0, y0, z0) = fz(x0, y0, z0) 67
  68. 68. De acuerdo a la definición de derivada en una dirección, las derivadas parciales fx(x0, y0) y fy(x0, y0) pueden expresarse fx(x0, y0) = l´ım h→0 f(x0 + h, y0) − f(x0, y0) h para y = y0 fijo fy(x0, y0) = l´ım h→0 f(x0, y0 + h) − f(x0, y0) h para x = x0 fijo En lugar de calcular fx(x0, y0) y fy(x0, y0) en forma directa a partir de las definiciones, lo usual es encontrar fx(x0, y0) y fy(x0, y0) mediante las reglas ordinarias de derivación; después se sustituyen x = x0 e y = y0. Ejemplo 2.7.5 Si f(x, y) = x2 sen (xy2 ), encuentre fx(π 4 , 1) y fy(π 4 , 1). Solución. ∂f ∂x (x, y) = 2x sen (xy2 ) + x2 · cos(xy2 ) · y2 = 2x sen (xy2 ) + x2 y2 cos(xy2 ) ∂f ∂y (x, y) = x2 cos(xy2 ) · 2xy = 2x3 y cos(xy2 ) Sustituyendo x = π 4 y y = 1 se calculan fx( π 4 , 1) = 2 · π 4 sen π 4 · 12 + π 4 2 · 12 · cos π 4 · 12 = √ 2(π2 + 8π) 32 fy( π 4 , 1) = 2 · π 4 3 · cos π 4 · 12 = √ 2 64 π3 2.7.3. Diferenciabilidad de un campo escalar en Rn . Definición 2.7.4 Un campo escalar f : U → R , donde U es un conjunto abierto de Rn es diferenciable en si existe un vector f(−→a ) ∈ Rn tal que l´ım−→ h →0 f(−→a + −→ h )−f(−→a )− f(−→a )· −→ h −→ h = 0. (2.20) Si definimos E(a; h) = f(−→a + −→ h )−f(−→a )− f(−→a )· −→ h −→ h , tendríamos de acuerdo a la definición, f es diferenciable en −→a si y sólo si l´ım−→ h →0 E(−→a ; −→ h ) = 0 68
  69. 69. Podemos escribir f(−→a + −→ h ) − f(−→a ) − f(−→a ) · h = h E(−→a ; −→ h ), o equivalentemente, f(−→a + −→ h ) = f(−→a ) − f(−→a ) · h + h E(−→a ; −→ h ), El vector f(−→a ) le llama el gradiente de f en −→a y al producto de f(−→a ) · h se le llama la diferencial de f en −→a . Teorema 2.7.1 Si f : U → R es diferenciable en −→a , entonces es continua en −→a . Demostración. Puesto que f es diferenciable en a tenemos que l´ım−→ h →0 E(−→a ; −→ h ) = 0. Además f(−→a + −→ h )=f(−→a )− f(−→a )· −→ h + h E(−→a ; −→ h ), y tomando el limite cuando −→ h → 0 tenemos que l´ım−→ h →0 f(−→a + −→ h ) =f(−→a ). Por lo tanto f es continua en −→a . Teorema 2.7.2 Sea f derivable en −→a . Entonces la derivada de f en −→a en la dirección del vector unitario −→y = (y1, y2, · · · yn) y f (−→a ; −→y )= f(−→a )·−→y = n k=1 ∂f(−→a ) ∂xk yk Demostración. Si −→y = 0 claramente f(−→a )·−→y = 0 y f (−→a ; −→y )=0 . Por consiguiente consideremos −→y = 0 . Como f es diferenciable en −→a tenemos que para h con |h < r f(−→a + −→ h )=f(−→a )+ f(−→a )· −→ h + −→ h E(−→a ; −→ h ), donde l´ımh→0 E(−→a ; h) = 0 . Si tomamos |t| < r , entonces −→ h = t−→y con t = 0 cumple que −→ h <r y por lo tanto f(−→a + t−→y )−f(−→a )= f(−→a )·t−→y + |t|E(−→a ; −→y ). 69

×