Calculo numerico chappra
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Calculo numerico chappra

on

  • 424 views

libro de calculo para ingenieria

libro de calculo para ingenieria

Statistics

Views

Total Views
424
Views on SlideShare
424
Embed Views
0

Actions

Likes
0
Downloads
29
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Calculo numerico chappra Document Transcript

  • 1. MÉTODOS NUMÉRICOS PARA INGENIEROS Con aplicaciones en computadoraspersonales
  • 2. MÉTODOS NUMÉRICOS PARA INGENIEROS Con aplicacionesen computadoraspersonales Steven C. Chapra, Ph.D. Professorof Civil Engineering Texas A&M University Raymond P. Canale, Ph.D. Professor of Ci.vil Engineering The University of Michigan Traducción: CarlosZapata S. Ingeniero Electricista, UDLA Diplomado enCiencias de la Computación, Fundaci6nArturoRosenblueth Alfredo CortésAnaya LicenciadoenCienciasFísico-Matemiticas, UMSNH MaestroenCiencias de la Computaci6n, IIMAS,UNAM Revisión técnica: FernandoVeraBadillo IngenieroCivil,Universidad La Salle Jefe del DepartamentodeMatemlticasAplicadas, Universidad La Salle McGRAW-HILL MÉXICO BOGOTA BUENOS AIRES CARACAS GUATEMALA LISBOA MADRID NUEVA YORK PANAMA SAN JUAN SANTIAGO SÁ0 PAUL0 AUCKLAND HAMBURG0 LONDRES MONTREAL NUEVADELHI PARíS SANFRANCISCO SINGAPUR ST.LOUIS SIDNEY TOKIO TORONTO
  • 3. METODOS NUMÉRICOS PARA INGENIEROS Con aplicaciones en computadoras personales Prohibida la reproducción total o parcial de esta obra, por cualquier medlo, sin autorizactón escrita del editor DERECHOS RESERVADOS (9 1987, respecto a la primera edición en español por LIBROS McGRAW-HILL DE MCXICO. S. A. DE C. V. Atlacomulco 499-501, Fracc. Industrial San Andrés Atoto 53500 Naucalpan de Juárez, Edo. de México Miembro de la Cámara Nacional de la lndustrla Editorial, Reg. Núm. 465 ISBN 968-451-847-1 Traducido de la primera edlclon en Inglés de Numerical Methods for Engineers with Personal Computer Applications Copyright @ MCMLXXXV, by McGraw-Hill, Inc., U.S. A ISBN 0-07-010664-9 1234567890L.M.437 ImpresoenMexicoPunted InMexico Esta obra se terminó de imprimir en febrero de 1988 en Talleres Gráficos Continental, S. R. deC. V. Calz. Tlalpan No. 4620 col. Niño Jesús Delegación Tlalpan 1408 México, D.F. Se tiraron 2 600 ejemplares
  • 4. C O N T E N I D O PREFACIO PARTE I LOS METODOSNUMERICOS Y LAS COMPUTADORAS PERSONALES I.1 Motivación 1.2 Fundamentosmatemáticos 1.3 Orientación Capítulo 1 Modelosmatemáticos Problemas Capítulo 2 La programación en las computadoras personales 2.1 Antecedenteshistóricos 2.2 Desarrollodeprogramas 2.3 Desarrollodeunprogramapara el problemadelparacaidista 2.4 Estrategiasdeprogramación Problemas Capítulo 3 Aproximaciones y errores 3.1 Cifrassignificativas 3.2 Exactitud y precisión 3.3 Definicionesdeerror 3.4Erroresderedondeo 3.5 Erroresdetruncamiento 3.6 Errornuméricototal 3.7 Erroresporequivocación,deplanteamiento e incertidumbre en los datos Problemas xi 1 4 7 11 19 21 22 24 46 52 56 63 64 66 67 72 77 95 96 98
  • 5. Vi CONTENIDO- EPILOG0 PARTE I 1.4 ElementosdeJuicio 1.5 Relacionesyfórmulasimportantes 1.6 Métodosavanzadosyalgunasreferenciasadicionales PARTE II RAíCES DEECUACIONES II.1 Motivación 11.2 Fundamentosmatemáticos 11.3 Orientación Capítulo 4 Métodos queusan intervalos 4.1 Métodosgráficos 4.2 Métododebisección 4.3 Métododelareglafalsa 4.4 Búsquedasconincrementosdeterminandouna aproximacióninicial Problemas Capitulo 5 Métodos abiertos 5.1 Iteracióndepuntofijo 5.2 MétododeNewton-Raphson 5.3 Métodode la secante 5.4 Raícesmúltiples Problemas EPiLOGO PARTE II 11.4 Elementos¿e juicio 11.5 Relacionesyfórmulasimportantes 11.6 Métodosavanzadosyalgunasreferenciasadicionales PARTE 111 SISTEMAS DEECUACIONESALGEBRAICAS LINEALES III.1 Motivación 111.2 Fundamentosmatemáticos 111.3 Orientación Capítulo 7 Eliminacióngaussiana 7.1 Solucióndepocasecuaciones 7.2 Eliminacióngaussianasimple 1o1 106 107 109 112 114 119 119 123 132 139 140 145 146 152 158 163 167 171 172 177 180 183 186 1 89 197 199 199 203 206 21 5 219 219 227
  • 6. EPILOG0 PARTE IV 7.3 Desventajasde los métodosdeeliminación 7.4 Técnicasdemejoramientoenlassoluciones 7.5 Resumen Problemas Capítulo 8 Gauss-Jordan, inversión de matrices y Gauss-Seidel 8.1 MétododeGauss-Jordan 8.2 Inversióndematrices 8.3 MétododeGauss-Seidel Problemas Capítulo 9 Casos de la parte 111: Sistemas de ecuaciones Caso 9.1 Distribuciónderecursos(Ingenieríaengeneral) , Caso 9.2 Cálculodedistribucióndetemperaturas Caso 9.3 Análisisdeunaarmaduraestáticamentedeterminada Caso 9.4 Corrientes y voltajesencircuitosresistivos Caso 9.5,Dinámica de partículas y cuerposrígidos Problemas algebraicas lineales (Ingenieríaquímica) (Ingenieríacivil) (Ingenieríaeléctrica) (Ingenieríamecánica) PARTE 111 111.4 Elementosde juicio 111.5 Relaciones y fórmulasimportantes 111.6 Métodosavanzados y algunasreferenciasadicionales AJUSTE DE CURVAS IV.1 Motivación IV.2 Fundamentosmatemáticos lV.3 Orientación Capítulo 1O Regresión con mínimos cuadrados 10.1 Regresiónlineal 10.2 Regresiónpolinomial 10.3 Regresiónlinealmúltiple Problemas Capitulo 11 lnterpolación 1l. 1 Polinomiosdeinterpolacióncondiferencias divididasdeNewton 11.2 PolinomiosdeinterpolacióndeLagrange 11.3 Comentariosadicionales 11.4 lnterpolaciónsegmentaria(spline) Problemas 236 244 252 254 259 259 262 268 276 279 280 283 287 291 293 295 301 304 304 307 310 315 319 321 336 342 345 349 350 363 368 370 383
  • 7. vi¡¡ CONTENIDO EPiLOGO PARTE V Capítulo 12 Casosde la parte IV: Ajustedecurvas 387 Caso 12.1 Modelodeingenieríadeventadeproductos (Ingenieriaen 387 Caso 12.2 Regresiónlineal y modelosdemográficos (Ingenieríaquímica) 391 Caso 12.3 Ajuste decurvasen el diseñodeunmástil parabarco (Ingenieria 395 Caso 12.4 Ajuste decurvas en laestimacióndelacorriente RMS (Ingenieríaca) 399 Caso 12.5 Regresiónlinealmúltipleen el análisisdedatos experimentales(Ingenieríamecánica) 402 Problemas 404 PARTE IV IV.4 Elementosde juicio IV.5 Relaciones y fórmulasimportantes IV.6 Métodosavanzados y algunasreferenciasadicionales INTEGRACION V. 1 Motivación V.2 Fundamentosmatemáticos V.3 Orientación 409 41 1 41 1 415 422 424 Capítulo 13 FórmulasdeintegracióndeNewton-Cotes 429 13.1 Regladel 431 13.2 Reglade 443 13.3 Integraciónconintervalosdesiguales 455 13.4 Fórmulasdeintegraciónerta 458 Problemas 461 Capítulo 14 IntegracióndeRomberg y cuadratura gaussiana 465 14.1 Integraciónde 465 14.2 Cuadraturagaussiana 474 Problemas 484 Capítulo 15 Casos de laparte V: Integración 487 Caso 15.1 Análisisdemovimientodeefectivos(Ingenieríaengeneral) 488 Caso 15.2 El usodeintegralesparadeterminarlacantidad total decaloren los materiales(Ingenieríaquímica) 490 Caso 15.3 Fuerzaefectivasobreelmástildeunvelerodecarreras (Ingeniería 492 Caso 15.4 Determinacióndelacorriente RMS medianteintegración numérica(Ingenieríaeléctrica) 496 Caso 15.5 Integraciónnuméricaen el cálculodeltrabajo (Ingenieríaánica) 499 Problemas 503
  • 8. CONTENIDO i X EPiLOGO PARTE V V.4 Elementosdeiuicio V.5 Relacionesyfórmulasimportantes V.6 Métodosavanzadosyalgunasreferenciasadicionales PARTE VI ECUACIONES DIFERENCIALES ORDINARIAS VI.1 Motivación V1.2 Fundamentosmatemáticos V1.3 Orientación Capítulo 16 Métodosde un paso 16.1 Métodode Euler 16.2 Modificacionesymeiorasalmétodode Euler 16.3 MétodosdeRunge-Kuttc 16.4 Sistemasdeecuaciones Problemas Capítulo 17 Métodos de pasos múltiples 17.1 Unenfoque simple depasosmúltiples:Métodode Heun sin principio 17.2 Fórmulasdeintegración 17.3 Métodosdepasos múltiples deordensuperior Problemas Capítulo 18 Casos de la parte VI: Ecuaciones diferenciales ordinarias Caso 18.1 Modelosmatemáticosparaproyectosdeventade computadoras(Ingenieriaengeneral) Caso 18.2 Diseñodeunreactorparaproducciónfarmacéutica (Ingenieríaquímica) Caso 18.3 Deflexióndel mástil de unvelero(Ingeniería civil) Caso 18.4 Simulacióndeunacorrientetransitoriaenuncircuitoeléctrico Caso 18.5 El péndulooscilante(Ingenieríamecánica) Problemas (Ingenieríaeléctrica) EPiLOGO PARTE VI V1.4 Elementosde juicio V1.5 Relacionesyfórmulasimportantes V1.6 Métodosavanzadosyalgunasreferenciasadicionales BlBUOGRAFiA iNDlCE 509 51 1 51 1 51 5 519 522 527 528 550 564 570 573 574 588 594 600 603 604 608 61 3 61 5 61 8 622 541 625 627 627 631 635
  • 9. P R E F A C I O Para el ingeniero modernoel hecho de “ir a la par con su profesión” im- plica inevitablementeel uso de las computadoras.Hay pocas disciplinas, o dicho sea de otra forma, pocas actividadescotidianasque de alguna manera no tienen contacto con estas máquinas tan poderosasy rápidas. Ciertamente, las computadoras hansidopor años un aliado de la inge- nieríaal desempeñar millaresde tareas, tanto analíticas como prácticas, enel desarrollo de proyectos y la solucióndeproblemasenformamás eficiente. En consecuencia, cuanto mása fondo y más tempranose fami- liarice el estudiante de ingeniería con su terminal o su computadora pel. sonal, mejorserá su formación. Pero, ¿desde cuándo?, y ¿qué tan a fondodebesereste contacto? Los profesores de ingenieríareconocen desde hace mucho tiempo la im- portanciadelentrenamientoenlosprimerossemestres enla tecnología de las computadoras. Tradicionalmente este entrenamiento abarcabacom- putadorasgrandes(mainframes) y un lenguaje de programación de alto nivel como el FORTRAN. Desafortunadamente,es frecuente que a los estudianteslesresulte difícil aplicarsusnuevashabilidades a proble- mas de otras materias. Esto se debe a una variedad de factores, de entre loscualesno carece deimportancia la preparaciónnecesariaparausar sistemas con máquinas grandes.Como resultado, muchos estudiantes de ingenieríanoexplotanbienlacapacidaddesolucióndeproblemasque tienenlascomputadorashastaqueestánadentrados ensu educación. Creemos que la revoluciónde la microelectrónica nos dala oportuni- daddeintegrarla computación de una manera más efectiva enel salón de clases. Debido a su bajo costo y conveniencia, las computadorasper- sonales pueden aumentar la capacidad del estudiante de ingeniería para resolver problemas durante sus añosescolares. Sin embargo, para explo- tar esta oportunidad al máximo es necesaria una innovación de los cursos de introducción a la computación. Por ejemplo, a través de los años se ha desarrollado en las universidades’deTexas A&M y Michigan una rees- tructuración en dos etapas. Hay un “primer cursode computación” dedi- cado a orientar al estudiante al equipocomputacionaldisponible y al
  • 10. Xii PREFACIO desarrollo de habilidades firmes dentro dela programación. El “segundo curso de computación” está planeado para reafirmar estas habilidadesy mostrarel empleode lasolu&n deproblemas en ingeniería. El presente libro emanó del segundo curso. Se eligióel tema de los métodosnuméricos como puntoprincipalporsusmuchasaplicaciones a la ingeniería. Ya sea quelosingenieros utilicensoftware comercial o propio, creemos que es esencial una base sólida en los métodosnuméri- cos para la aplicación efectiva de las computadoras en la solución de pro- blemasdeingeniería. Desafortunadamente,los métodosnuméricos se presentan durante elúltimo año de licenciatura o a nivel de posgradua- dos, años después del punto donde pudieron habersido herramientasúti- les, instructivas y creativasparaelfuturoingeniero. Por consigu.iente,hemos elaborado este libro de tal forma que pueda enseñarse en los extremos inferior o superior de la carrera de ingeniería a nivel de licenciatura. Un aspecto de este plan se hace notar en la orga- nización y enel alcance dellibro,queestádivididoenseispartes.Laparte I tratadelmaterialintroductorio e incluyeinformaciónsobreprogramación y análisis de aproximación y error. Las cinco partes restantes están dedica- das a las áreas de métodos numéricos, que tienen importancia directa para el candidato a ingeniero: raíces de ecuaciones no lineales, ecuaciones alge- braicaslineales,ajustedecurvas(regresióneinterpolación),integración y ecuacionesdiferencialesordinarias.Excluimostemas como los valores ca- racterísticosy las ecuaciones diferenciales parciales, que tiene mayor impor- tanciapara los estudiantesdeposgrado. Junto con este materialhemosincorporado ciertas características adi- cionales en la elaboración de este libro, para hacerlo más accesible a lec- tores tanto de losprimeros como de los últimosniveles de licenciatura. Incluyen: 1. Recuadros. Nos hemos empeñado enincluir derivaciones importan- tes y análisis de error, conel fin de enriquecer la presentación. Sin embargo, algunas veces tal material representa un escollo parael es- tudiante novato. En consecuencia, hemos apartado en recuadros el material matemático más complicado. Muchos estudiantesencontra- rán quepuedenaplicar los métodosnuméricos sin tener que domi- narcompletamente el materialcontenido en losrecuadros. 2. Material introductorioy fundamentos matemáticos. Cada parte del li- broincluyeunaseccióndeintroducción.Después de unabreve ex- posición al problemamatemáticogeneralque va aestudiarse, se suministra una motivación describiendocómo podría enfocarseel pro- blema en ausencia decomputadoras,y dónde se plantea este proble- maenla práctica de la ingeniería. En seguida se efectúa una revisión delos conceptos matemáticosnecesariosparacomprender el tema por estudiar. Por ejemplo, se revisa álgebra matricial antes del estu- dio de ecuaciones algebraicas lineales, y estadística antes del estudio
  • 11. PREFACIO xiil de regresión.Por último, se presentan un esquema y los objetivos de estudio de cada parte, como orientaciónpara el lector. 3. Epilogos. Así como la introduccih estáplaneadaparadaruna mo- tivación y una orientación, incluimos un epílogo alfinal de cada partedellibroparaconsolidar ios conceptos reciénadquiridos. Un detalleimportantedeesteepílogo es una seccióndedicada a los elementos de juicio necesarios para la elección de los métodos numéricosapropiadospara un problemaenparticular. Además, se resumenalgunasfórmulasimportantes y se citanreferenciaspara métodosavanzados. 4. Presentaciones secuenciales y gráficas. Cada parteprincipaldellibro consta de trescapítulos:dosdedicados a la teoría y uno al estudio de casos. Siempre que es posible, los capítulos de teoría se estructu- ranen forma secuencial, esto es, primero se presentanlos plantea- mientos más directosy elementales. Dado que muchos de los métodos más avanzados se construyen sobre los más simples, la intención de este desarrollo es proporcionarun sentido de evolución de lastécni- cas. Adicionalmente hemos desarrollado representaciones gráficas para complementarlas descripciones matemáticas en la mayor parte de los planteamientoscontenidos enellibro. Hemos encontradoqueesta orientación visual es particularmente efectiva para proporcionar una mayor comprensióna los estudiantes de los primeros niveles de licen- ciatura. 5. Estudio de casos. En cadapartedellibro se incluyen casos para de- mostrar lautilidad práctica de los métodos numéricos. Se realizó un gran esfuerzo para darejemplos de los cursos iniciales de las carreras de ingeniería. Cuando esto no es posible, se hansuministrado bases teóricas y motivaciónpara los problemas. 6. Software. Se disponede un paquete de softwaredenominado NU- MERICOMP que muestra algunos métodos numéricosque se cubren enel texto: bisección,eliminación gaussiana, interpolación de Lagrange, regresión lineal, la regla trapezoidal y el método de Euler. Estos pro- gramas proporcionanal estudiantelos criterios de programaciónnece- sarios para cada una de las partes del libro. El software está diseñado para utilizarse con facilidad.Los estudiantes también pueden emplear- loparaverificar los resultados de sus propios esfuerzos de programa- ción. Aunque el paquete es opcional, pensamos que puede lograrse un progreso más rápidocuandose emplean ellibro y el softwarecon- juntamente;se puede conseguira través de McGraw-Hill para lascom- putadoraspersonales IBM-PC y APPLE 11. Unaversión profesional de NUMERICOMP puede adquirirse directamente de EnginCompSoft- ware, Inc., 15 Research Dr., Ann Arbor, MI 48103.
  • 12. Finalmente, nos hemos esforzado conscientemente en hacer este li- bro tan sencillo al usuario como seaposible, por lo que nos empefiamos en mantener nuestras explicaciones con una orientacióndirecta y prácti- ca. Aunque nuestraintención primaria es presentar a los estudiantes una sólida introducción a los métodos numéricos, un objetivo subordinado ha sido hacerde esta introducción una experiencia agradable. Creemos que los estudiantes que disfruten los métodos numéricos, las computadoras y las matemáticas, serán al final mejores ingenieros.Si nuestro libro alienta el entusiasmo por estas materias, consideraremos nuestro esfuerzo como un éxito. AGRADECIMIENTOS Queremos agradecer las revisiones hechas por los profesores Ted Cad- man (Universityof Maryland), Lee W. Johnson(VirginiaPolytechnic and State University),Richard Noble (University of Colorado),Satish Ramadh- yani (Purdue University), Howard Wicke (Ohio University) y Thomas C. Young (Clarkson University). Extendemos nuestra gratitud a la Texas A&M University y a la Universityof Michigan por proporcionarnos apoyo secretarial y gráfico y el tiempo necesario para preparar estelibro. En par- ticular, Donald McDonald y Roy Hann de Texas A&M apoyaron cons- tantemente este esfuerzo.Obtuvimossugerencias y buenasideas de nuestros colegas Bill Batchelor, Harry Jones,Bill Ledbetter, James Mar- tin y Ralph Wurbs. Jeanne Castro ideóla organización gráfica de los capí- tulos. También Vanessa Stipp, con la ayuda de Kathy Childers, Cindy Denton y Frances Kahlich, hicieron una excelente labor al mecanografiar el manuscrito. Este libro se experimentó en clase durante cuatro semestres, princi- palmente con alumnos de segundo año en Texas A&M y durante dos semestres con alumnosde todoslos niveles de licenciatura en Michigan. Durante este tiempo, muchosde los alumnos nos ayudarona comprobar la exactitud matemáticay a enriquecer la comprensión de este libro. Lisa Olson leyó el texto completo varias veces y preparó los programas en FOR- TRAN. Tad Slawecki proporcionó una ayuda excelente en cuantoal soft- ware complementario. Además, Marla lsenstein, Luis Garcia, Sijin “Tom” Lee y Rick Thurman hicieron contribuciones notables. También debemos agradecer a Kiran Verma, Dave Damstra y a B. J. Clark de McGraw-Hill su supervisión y aliento. Ursula Smith efectuó un trabajo impecable en la edición de pruebas del libro. Finalmente, nos gustaría agradecer a nuestras familias, amigos y colegas, quienes sopor- taron comprensivamente la gran cantidad de horas “robadas”, necesa- rias para completar esta obra. Steven C. Chapra Raymond P.Canale
  • 13. P A R T E U N O LOSMÉTODOS NUMÉRICOS Y LAS COMPUTADORAS PERSONALES '), 7, I.1 MOTIVACI~N Los métodos numéricos son técnicas mediante las cuales es posible formular problemas de tal for- maquepuedan resolverse usandooperaciones aritméticas. Aunque hay muchos tipos de métodos numéricos, todos comparten una característica co- mún: Invariablemente los métodos numéricos Ile- van a cabo un buen número de tediosos cálculos aritméticos. No es raro que con el desarrollo de computadoras digitales eficientes y rápidas, el pa- pel de los métodos numéricos en la solución de pro- blemas de ingeniería haya aumentado considera- blementeen losúltimos años. I. 1 . l Métodos anteriores a la aparición de la computadora Más allá de sólo proporcionar un aumento en la potencia de cálculo, la disponibilidad general de las computadoras (especialmente de las compu- tadoras personales)y su asociación con los méto- dosnuméricos, ha tenido una influenciamuy significativa en el proceso de solución de proble- mas de ingeniería. Antes del uso de la computa- dora había tres métodos diferentes que los inge- nieros aplicaban a la solución de problemas: 1. Primero, se encontraban las soluciones de al- gunosproblemasusando métodos exactos o analíticos. Con frecuencia estas soluciones re- sultaban útiles y proporcionaban una compren- sión excelente del comportamiento de algunos sistemas. Sin embargo, las soluciones analiti- cas pueden encontrarse sólo para unaclase Ii- mitada de problemas. Estos problemas incluyen aquellosquepuedenaproximarse mediante modelos lineales y también aquellos quetienen una geometríasimple y pocas dimensiones. En consecuencia, las soluciones anabjticas tienen valor práctico limitado, porque la mayor par- te de los problemas reales no son lineales,e implican formas y procesos complejos.
  • 14. 2 MÉTODOS NUMÉRICOS PARA INGENIEROS 2.Para analizar el comportamiento de los sistemasse usaban solu- ciones gráficas. Éstas tomaban la forma de grafoso nomogramas. Aunque las técnicas gráficas a menudopueden emplearse parare- solver problemas complejos, IQS resultados no sonmuy precisos. Es más, las soluciones gráficas (sinla ayuda de una computadora)son tediosas en extremo y difíciles de implementar. Finalmente,las técni- cas gráficas están limitadas a aquellos problemas que puedan des- cribirse usando tres dimensiones o menos. 3. Para implementar los métodos numéricos se utilizaban calculado- ras manuales y reglas de cálculo. Aunque en teoría estas aproxi- macionesdeberían ser perfectamenteadecuadas para resolver problemas complicados, en la práctica se presentan algunas difi- cultades. Los cálculos manuales sonlentos y tediosos. Además no existen resultados consistentes debido a que surgen equivocacio- nes cuando se efectúanlastareasmanualmente. Antesdel uso de la computadora, se gastaba mucha energía en la técnica misma de solución, en vez de aplicarla sobre la definición del problema y su interpretación (Fig. 1.1~).Esta situación desafortunada existía debidoal tiempoy trabajomonótonoque se requeríanpa- ra obtener resultados numéricos con técnicas que no utilizaban a la computadora. Hoy en día, las computadoras y los métodos numéricos proporcionan unaalternativapara cálculostan complicados. AI usar lacompu- tadora para obtener soluciones directamente, se pueden aproximar los cálculos sin tener que recurrir a suposiciones de simplificación o técnicas deficientes.Aunque dichas suposiciones son aún extremada- mente valiosas tanto para resolver problemas comopara proporcionar una mayor comprensión, los métodos numéricos representan alternati- vas queamplíanconsiderablementela capacidadparaconfrontar y resolver los problemas; como resultado, se dispone de más tiempo para aprovecharlas habilidades creativas personales. Por consiguiente, es posible dar más importancia a la formulación de un problema, a la interpretación de la solución y a su incorporación al sistema total, o conciencia“holística” (Fig. 1 . 1 b). 1.1.2 Los métodosnuméricosy la práctica delaingeniería Desde finales de la década de 1940, la multiplicacióny disponibilidad de las computadoras digitales ha llevado a una verdaderaexplosión en cuanto al uso y desarrollo de los métodos numéricos. Al principio, este crecimiento estaba algo limitado por el costo de acceso a com- putadoras grandes (rnainfiames),por lo que muchos ingenieros conti- nuaban usando simples planteamientos analíticosen una buena parte
  • 15. LOS METODOSNUMÉRICOS Y LAS COMPUTADORASPERSONALES ..___3 Formulac4dn Exposici6n a fondo de 1. rdaci6n del problema con las leyes fundamentales fundamentales Metodos muy elaborados Mdtodo num6rico y frecuentemente complcador para hacer manelable el problema lnterpretacidn lhmitado por una Anll~oma fonda holisticamente y permite pensar desarrollar la intulmdn: se puede estudtar la FIGURA 1.1 Lastresfases en la solución de problemas de ingenieríaen a) laera anterioralas computadoras y b) la era de las cornputadoras. Los tamaños de los recuadros indi- can el nivel de importancia que se dirige a cada fase en el salón de clases. Las corn- putadoras facilitan la implementaciónde técnicas de solucion y así permiten un mayor cuidado sobrelos aspectos creativos de la formulación de problemas y la interpreta- ción de resultados. de su trabaio. No es necesario mencionar que la reciente evolución de computadoras personales de baio costo, ha dado a mucha gente un fácilaccesoapoderosascapacidades de cómputo. Además existeun buen número de razones por las cuales se deben estudiarlosmétodosnuméricos: 1. Los métodos numéricos son herramientas extremadamente pode- rosas para lasolución de problemas.Son capaces de manejarsis- temas deecuacionesgrandes,nolinealidades y geometrías complicadas que son comunes en la prácticade la ingenieríay que, a menudo, son imposibles de resolver analíticamente. Por l o tan- to, amplían la habilidad de quien los estudia para resolver pro- blemas. 2. En el transcurso de su carrera, es posibleque el lectortengala ocasión de usar software disponible comercialmente que conten-
  • 16. 4 MÉTODOS NUMÉRICOS PARA INGENIEROS ga métodos numéricos. El uso inteligente de estos programas de- pende delconocimiento de lateoría básica enla que se basan estos métodos. 3. Hay muchos problemas que no puedenplantearse al emplear pro- gramas “hechos”. Si se está versado en los métodosnuméricos y sees un adepto de la programación de computadoras, enton- cesse tiene la capacidad de diseñar programas propios para re- solver los problemas, sin tener que comprar unsoftware costoso. 4. Los métodosnuméricos son un vehículo eficiente para aprender a servirse de las computadoras personales.Es bien sabido que una manera efectiva de aprender a programar las computadoras es al escribir los programas. Comolos métodos numéricos, ensu ma- yor parte están elaborados para implementarse en computado- ras, resultan ideales para este propósito. Aúnmás, están especial- mente adaptados parailustrar la potencia así como las limitaciones de las computadoras. Cuando el lector implemente con buen re- sultado los métodosnuméricos en una computadora personal y los aplique para resolver problemas que de otro modo resultan intratables, entonces tendrá una demostración tangible de cómo pueden ayudarlelas computadoras para su desarrollo profesional. AI mismo tiempo, aprenderá a reconocer y controlar los errores de aproximación que son inesperables de los cálculos numéricos a granescala. 5. Los métodos numéricos son un medio para reforzar su compren- sión de las matemáticas. Porque una función de los métodos nu- méricos es la de reducir las matemáticas superiores a operaciones aritméticas básicas, ya que profundizanen los temas que de otro modo resultan oscuros. Esta alternativa aumenta su capacidad de comprensiónyentendimiento en la materia. 1.2 FUNDAMENTOSMATEMÁTICOS Cada parte de este libro requiere de algunosantecedentes matemá- ticos. En consecuencia, el material introductorio de cada parte inclu- ye una sección, como la que el lector está leyendo en este momento, de fundamentos matemáticos. Debido Q que la parte I en sí está dedi- cada al material básico sobre las matemáticasy la computación, la presentesección noabarca la revisión dealgúntema matemático específico. En su lugar, se presentan los temas delcontenidoma- temático que se cubre en este libro. Estos se resumen en la figura 1.2, y son:
  • 17. LOS MÉTODOS NUMÉRICOS Y LASCOMPUTADORASPERSONALES 5 FIGURA 1.2 Resumen de los métodosnuméricos que se cubren eneste libro.
  • 18. 6 MÉTODOS NUMÉRICOS PARA INGENIEROS 1. Rakes deecuaciones (Fig. 1.24. Estos problemas están re- lacionados con el valor de una variable o de un parámetro que satisface una ecuación. Son especialmente valiosos en proyectos de ingeniería donde confrecuencia resulta imposible despejar ana- líticamente parámetros de ecuaciones de diseño. 2. Sistemas de ecuaciones algebraicas lineales (Fig.1.2b). En esencia, estos problemas son similares a los de raíces de ecua- cionesen el sentido de que están relacionados con valores que satisfacen ecuaciones. Sin embargo, a diferencia de satisfacer una sola ecuación, se busca un conjunto devaloresque satisfaga simultáneamente a un conjunto deecuacionesalgebraicas. Las ecuaciones lineales simultáneas surgenen el contexto deuna variedad de problemasy en todas las disciplinas de la ingeniería. En particular,se originan a partir de modelos matemáticos de sis- temas grandes de elementos interconectados, como:estructuras, circuitos eléctricos y redes de fluio de fluidos, aunque también pueden encontrarse en otras áreasde los métodosnuméricos como el aiuste de curvas. 3. Ajuste de curvas (Fig. 1.24. Con frecuencia se presentará la oportunidad de ajustar curvas a un conjuntode datos representados por puntos. Las técnicas que se han desarrollado para este fin pue- den dividirse endos categorías generales: regresión e interpolacion. La regresión se emplea cuando hay un grado significativo de error asociado a los datos; frecuentemente los resultados experimentales son de esta clase. Para estas situaciones, la estrategia es encontrar una curva que represente la tendencia general de los datos sin ne- cesidad de tocar los puntos individuales. En contraste, la interpola- ción se maneja cuando el objetivo es determinar valores intermedios entre datos que esténrelativamentelibres de error. Tal esel caso de la información tabulada. Para estassituaciones, la estrategia es ajustar una curva directamente a través de los puntos y usar esta curva para predecir valores intermedios. 4. Integración (Fig.l.2d).Tal como se representa, una interpre- tación física de la integración numérica es la determinación del área bajo la curva. La integracióntiene muchas aplicaciones pa- ra el ingeniero práctico, empezando por la determinación de los centroides de objetos con formas extravagantes hasta el cálculo de cantidadestotales basadas en conjuntos de medidas discretas. Adicionalmente las fórmulas de integración numérica juegan un papel importante en la solución de las ecuaciones en diferencias. 5 . Ecuaciones diferencialesordinarias.(Fig. 1.2e). Las ecuaciones diferenciales ordinarias tienen un enorme significado
  • 19. LOS METODOSNUMERICOS Y LASCOMPUTADORASPERSONALES 7 en la práctica de la ingeniería. Esto se debe a que muchas leyes físicas están expresadas en tefminos de la razónde cambio de una cantidad más que en términos de su magnitud. Entre los ejemplos se observan desde los modelos de predicción demográfica (razón de cambio de la población) hasta la aceleración deun cuerpo en descenso (razón de cambio de la velocidad). 1.3 ORIENTACI~N Resultaútilesta orientación antes de proceder a la introducción de los métodos numéricos.Lo que sigue está pensado como unavista pa- norámica del material contenido en la parte l. Se incluyen además algunos objetivos como ayuda para concentrarel esfuerzo del lector alestudiar el material. 1.3.1 Alcanceycontenido La figura 1.3 es una representación esquemáticadel material conteni- do en la parte I. Se ha elaborado este diagrama para darleun pano- rama global de esta parte del libro. Se considera que un sentido de "imagen global" resulta importante para desarrollar una verdadera comprensión de los métodos numéricos. AI leer un texto, es posible que frecuentemente se pierda uno en los detalles técnicos. Siempre que el lector perciba que está perdiendo la "imagen global" regrésese a la figura 1.3 para orientarse nuevamente.Cada parte de este libro incluye una figura similar. Esta figura sirve también como una breve revisión previa del mate- rial que se cubre en la parte I. El capítulo 1 está diseñado para orien- tarle a los métodos numéricosy para darleuna motivación mostrándole cómo pueden usarse estas técnicas en el proceso de elaborar mode- los matemáticos aplicados a la ingeniería. El capítulo 2 es una intro- ducciónyuna revisiónde los aspectosdecomputaciónque están relacionados con los métodosnuméricos y presenta las habilidades de programación que se deben adquirir para explotareficientemen- te la computadora. El capítulo 3 se ocupa delimportantetemadel análisis de error, que debe entenderse bien para eluso efectivo de los métodosnuméricos. 1.3.2 Metasy objetivos Estúdiese los objetivos. AI terminm la parte I el lector deberá estar preparado para aventurarse en los métodos numéricos. En general,
  • 20. 8 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA 1.3 Representación de la organización del material en la parte I: Los métodos numéricos y las computadoras personales. habrá adquirido una noción fundamental de la importancia de las com- putadoras y el papel de las aproximaciones y los errores en la imple- mentación y desarrollo de los métodos numéricos. Adicionalmente a estas metas generales, deberá dominar cada uno delos objetivos es- pecíficos de estudio que se enuncianen la tabla 1 . 1 .
  • 21. LOS MhODOS NUMERICOS Y LAS COMPUTADORASPERSONALES 9 TABLA 1.1 Obietivos de estudio especificos para la parte I 1. 2. 3. 4. 5. 6. 7. 8. 9. 1o. 11. Entender la diferencia entre error de truncamiento y de redondeo Entender el concepto de cifras significativas Conocer la diferencia entre exactitud y precisión Apreciarla utilidad del error relativo Conocer la diferencia entre el error relativo verdadero E" y el error relativo aproximado eo; darse cuenta de cómo este último puede emplearse en conjunci6n con un error aceptable especificado con anterioridad E , para terminar un cálculo Ser capaz de relacionar el error relativo con cifrassignificativas Ser capaz de aplicar las reglas de redondeo explicadas enel recuadro 3.1 Comprender cómo se usa la serie de Taylor para aproximar funciones Comprender la naturaleza de la aproximación y los términos residuales de la serie de Taylor Conocer la relación que existeentrelas diferencias finitas y las derivadas Familiarizarse con los elementos de juicio que se describen enel epílogo de laparte I Objetivos en computación. AI completar la parte I el lector se habrá familiarizado con el software (NUMERICOMP)disponible para este libro. Deberá saber qué programas contieney algunas de sus capa- cidades de graficación. También deberátener las habilidades de pro- gramaciónnecesariasparadesarrollarsoftwarepropiocon los métodos numéricos de este libro. Deberá ser capaz de desarrollar pro- gramas en términos de los algoritmos o diagramas de fluio dados. Podrá guardarsu software en dispositivos de almacenamiento, como discos flexibles o cinta magnbtica. Finalmente, el lector habrá desa- rrollado la capacidad de documentarsus programas de tal forma que los usuarios puedan emplearlos eficientemente.
  • 22. C A P í T U L O U N O MODELOS MATEMÁTICOS ¿Por qué se debendominar los métodosnuméricos y la programación de computadoras para resolver los problemas? Adem6s del hecho deque a diario se observa que las computadoras intervienen enlasactividades m6s comunes de lavida diaria, dhabr6algunacontribución esencial que estasmAquinas, con sus capacidades decididamente sobrehumanas,pue- dan hacer a las tareas y retos de los ingenieros? Es totalmente factible, y con el material contenido en este capítulo, se tratar6 de orientar al lec- tor y motivarlo haciauna posibilidad cuando menos. Primero se aplicael concepto de modelos matemáticos para ayudar a definir lo que se entiende por métodos numéricos y para ilustrar cómo pueden facilitar la solución de problemas en ingeniería. Paraesto, se des- arrolla aquíel modelo matemático deun proceso físico y se resuelve con un métodonuméricosencillo. El mundo físico, con toda su complejidad,puede parecer abrumador e impredecible, Tradicionalmente,la tarea del científico ha sido la de iden- tificar los patrones reproduciblesy las leyes que gobiernaneste caos. Por ejemplo, sobre la base de sus observaciones, Newton formuló su segun- da ley del movimiento, queafirma que la velocidad de cambio dela can- tidaddemovimientode un cuerpocon respecto al tiempoesigual a la fuerza resultante que actúa sobreél.Considerandolas maneras excesiva- mente complejas en que las fuerzas y los objetos interactúan en la tierra, estaleyhaprobadoserunageneralizaciónválida. Además de que estas leyes proveen de discernimiento, los ingenieros pueden aplicarlas para formular solucionesa problemas prácticos. Porejem- plo,los conocimientos científicosse usan rutinariamente por los ingenie- ros en el diseño de,elementostales como estructuras, mhquinas, circuitos eléctricos y sustancias químicas sintéticas. Desdelaperspectivadel dise- ño de ingeniería,estos conocimientos sonmuy útiles cuando se expresan en formade un modelomatem6tico. Un modelo matemático puede definirse, de una manerageneral, co- mo una formulacióno ecuación que expresalas características fundamen- tales de un sistema o proceso fisico en términos matemáti'cos. Los modelos
  • 23. 12 MÉTODOS NUMÉRICOS PARA.INGENIEROS se clasifican desde simples relaciones algebraicas hasta grandesy compli- cados sistemas de ecuaciones diferenciales. Recordando nuevamente a Newton para este ejemplo,la expresión matemática,o modelo, desu se- gunda ley es la bien conocida ecuación F = ma [1.11 donde F es la fuerza neta que actúa sobre el cuerpo (en dinas, o gramo- centímetro por segundo cuadrado),m es la masa del objeto (en gramos), y a es su aceleración (en centímetros por segundo cuadrado). La ecuación (1.1)tiene varias características habitualesde los mode- los matemáticos del mundo físico. 1. Describe un sistema o procesonatural en términosmatemáticos. 2. Representa unaidealización y una simplificaciónde la realidad. Es decir, ignora los detalles insignificantes del proceso natural y se concentra en sus manifestaciones elementales. Es por esto que la segunda ley no incluye los efectos de la relatividad,quetienenunaimportan- cia mínima cuando se aplicanaobjetos y fuerzas que interactúan sobre o alrededorde la tierra aescalas visibles a los sereshuma- nos. 3. Finalmente, conduce a resultadospredecibles y, en consecuencia, pue- de emplearse para propósitosde predicción. Por ejemplo,si se cono- cen la fuerza aplicada sobre un objeto y su masa, entonces puedeusarse la ecuación (l.1)para predecir la aceleración. Como tiene unaforma algebraica sencilla, puede despejarse directamente F m a = - De este modo, la aceleración puede calcularse fácilmente. Sin em- bargo, los modelos matemáticos de otros fenómenos físicos pueden ser mucho más complejos y no pueden resolverse exactamente o requieren de técnicas matemáticas más complejas que la simple álgebra para suso- luci6n. Para ilustrar unmodelo de este tipo pero más complicado, se puede usar la segunda ley de Newton para determinar la velocidad final de un cuerpo en caídalibre cerca de la superficie terrestre. El cuerpo en descen- so será un paracaidista como se muestra en la figura 1.1.Para este caso puede crearse un modelo al expresar la aceleración como la razón de cambio de la velocidad con respecto al tiempo (dv/dtj y sustituir en la
  • 24. MODELOSMATEMÁTICOS 13 FIGURA 1.1 Representaciónde las fuerzas que actúan sobreun paracaidista en des- censo. FD es la fuerza hacia abaiodebido a la atracción de la grave- dad. Fu. es la fuerzahacia arribadebido a la resistencia del aire. ecuación (l.1) paradar dv dt m - = F u31 donde u es la velocidad en centímetros porsegundo). Así, la masa multi- plicada porla razón de cambio dela velocidad es igual a la suma de fuer- zasqueactúansobreel cuerpo. Si lafuerzatotal es positiva, el objeto acelera. Si esnegativa, el objeto sufreuna desaceleración. Si lafuerza neta es cero, lavelocidaddel objeto permanecerá a un nivel constante. Para un cuerpo que cae dentro del perímetro de latierra (Fig. l.1), la fuerza total está compuesta por dos fuerzas contrarias:la atracción ha- cia abajo debida a la gravedad F D y la fuerza hacia arriba debida a la re- sistenciadelaire Fu. Si a lafuerza hacia abajo se leasigna un signopositivo, se puedeusar la segunda leyparaformularlafuerzadebida a lagravedad como donde g es la constante de gravitación, o la aceleración debida a la gra- vedad, queesaproximadamente igual a 980 cm/s2.
  • 25. 14 MÉTODOS NUMÉRICOS PARAINGENIEROS La resistencia del aire puede formularse de diferentes maneras. Una aproximación sencilla es suponer que es linealmente proporcionala la ve- locidad, como en donde c es una constante de proporcionalidad llamada el coeficiente de arrastre (en gramos por segundo).Así, a mayor velocidad de caída, ma- yor es la fuerza hacia arriba debida a la resistencia del aire. El parámetro c toma en cuenta las propiedades del objeto descendente, talescomo la forma o la aspereza de su superficie, que afectanla resistencia del aire. Para este caso, c podría ser una función del tipo de traje o la orientación usadaporelparacaidistadurantelacaídalibre. La fuerzatotal es la diferenciaentrelasfuerzashacia abajo y hacia arriba. Portanto, las ecuaciones (1.3)a (1.6)pueden combinarse para dar dv dt m- = mg - cv o, dividiendocadaladoentre m, dv C dt m ” - 9 - - v La ecuación (1.8)es un modelo que relacionala aceleración de un cuer- po que cae a las fuerzas que actúan sobre él. Es una ecuación diferencia[ porque está escrita en términosde la razón de cambio diferencial (dv/dt) de la variable que nos interesa predecir. Por esta razón a veces se deno- mina ecuación en diferencias. Sin embargo, en contraste con la solución dada porla segunda ley de Newton en la ecuación(1.2),la soluciónexacta de la ecuación (1.8)para la velocidad del paracaidista quecae, no puede obtenerseusando simples manipulaciones algebraicasy operacionesarit- méticas. Envez de eso, deberánaplicarselas técnicas delcálculopara obtener una solución exacta. Por ejemplo, siel paracaidista inicialmente está en reposo (u = O en t = O), se puede usarelcálculopararesolver la ecuación (1.8),así EJEMPLO 1.1 Solución analítica al problema del paracaidista que cae Enunciado del problema: un paracaidista con una masa de 68 100 g sal- tade un aeroplano. Aplíquese la ecuación (1.9)paracalcular la veloci-
  • 26. MÉTODOS MATEMATICOS 15 FIGURA 1.2 Soluciónanalítica al problema del paracaidista que cae según se calcula enel ejemplo l. l. La velocidad aumenta con el tiempo y se aproxima asintóticamente o una velocidad final. dadantes de abrir el paracaídas. El coeficiente de arrastre c es aproximadamente igual a 12 500 g / s . Solución: al sustituir los valores de los parámetros en la ecuación (1.9) se obtiene I 980(68,100) v (t) = [I - e-t12.500/68.1001f 12,500 1 = 5339.0 (1 - e-0 18355t ) al dar varios valores de t se obtienen las velocidades para dicho tiempo: los resultados se presentan a continuación t, S v, cm/s O O 21640.5 4 2776.9 6 3564.2 10 4487.3 12 4749.0 X 5339.0 a 4109.5
  • 27. 16 MÉTODOS NUMERICOS PARA INGENIEROS De acuerdo al modelo, el paracaidista acelera rápidamente (Fig. 1.2).Se llega a una velocidad de 4 487.3cm/s (161.5km/h) despu6s de 10 s. Nótese también que después deun tiempo suficientemente grande se al- canza una velocidad constante (llamadavelocidad final) de 5339.0cm/s (192.2km/h). Esta velocidad es constante porque después de un tiem- po suficiente, la fuerza de gravedad estará en equilibrio con la resistencia del aire. Por lo tanto, la fuerza total es cero y cesa la aceleración. A la ecuación (1.9)se le llama una solución analítica o exacta porque satisface exactamente la ecuación diferencial original. Desafortunadamen- te, hay muchos modelos matemáticos que no puedenresolverse exacta- mente. En muchos de estos casos,la única alternativa es la de desarrollar una solución numérica que se aproxime a la solución exacta. Como se mencionó con anterioridad, los métodos numéricos son aquellos en los que se reformula el problema matemático paraque se puedaresolver me- diante operacionesaritméticas. Esto puede ilustrarse para la segunda ley de Newton notándose que se puede aproximar la razón de cambio de la velocidad conrespecto al tiempomediante (Fig. 1.3) [1.10] FIGURA1.3 USO de una diferenciafinita paraaproximarlaprimeraderivadade v con respecto a t.
  • 28. METODOS MATEMATICOS 17 donde Au y At son diferencias enla velocidad y el tiempo calculadas so- breintervalosfinitos, u(t,) es lavelocidadeneltiempoinicial t,, y u(t,+I) es la velocidadalgúntiempo más tarde t,, Laecuación (l.10)es una diferencia finita diuida enel tiempo ti. Puede sustituirseenla ecuación (1.8)paradar Estaecuaciónpuedeordenarseotra vez paradar u(t1+1) = U@¡) + 9 - -u(ti) &+I - ti) [ : I [1.12] Y así, la ecuacióndiferencial (1.8)se transforma enuna ecuación qGe puederesolversealgebraicamentepara u(ti+J . Si se da un valorinicial para la velocidad en un tiempo ti,se puede calcular fácilmente u en t!, Este nuevo valor de u en ti+lpuede emplearse para extender el cálculo de u en ti+2 y así sucesivamente. Por lo tanto, en cualquiertiemporde la trayectoria, Nuevovalor - valoranteriorvalorestimuladoincremento de u + de lapendiente x deltiempode u - EJEMPLO 1.2 Soluciónnumérica al problema del paracaidistaquecae Enunciado del problema: efectuarel mismo cálculo que en el ejemplo l.1 perousando la ecuación (1.12)paracalcular u(t) con un incremento de tiempo igual a 2 s. Solución: alprincipio de los cSlculos (tl =O), la velocidaddel paracai- dista uft,) es igual a cero. Conestainformación y los valoresde los pa- rámetros del ejemplo l.l, la ecuación (l.12)se puede usar para estimar v (ti+1)en ti+l = 2 s. Para el siguienteintervalo (de t = 2 a 4 S), se repiteelcálculoconel re- sultado, ~ ( 4 )= 1960 + 980 - ___ [ 68l2500100(1960+ = 3200.5 cmis
  • 29. 20 MÉTODOS NUMÉRICOS PARA INGENIEROS significat~voasociadocon los puntos de los datos. i) Los sistemas grandes de ecuaciones. las no linealidades 51 las geometrías com- plicadas son comunes enla práctica de la ingeniería y fáciles de resolver analí- ticamente j) Los modelosmatemáticos no sepueden usar nunca con propósitos depre- dicción. 1.2 Léanse las siguientes descripciones de problemase identifíquese qué área de los métodos numéricos (según lo señalado enla Fig. 1.2)se relaciona con su solución. Una persona pertenece a una cuadrilla de reconocimiento topográfico y debe determinar el área deun terreno limitado por dos caminos y una corriente que serpentea Un ingeniero es responsable de la determinación de losflujos en una gran red de tuberías interconectadas entre sí para distribuir gas natural a una serie de comunidadesdiseminadasen un área de 20 km2 Para el problema del paracaidista que cae. se debe decidir el valor del coefi- ciente de arrastre para que un paracaidista de 90 kg de masa no exceda los 160km/h en los primeros 10 S después de haber saltado. Deberá hacer esta evaluación sobre la base. de la solución analítica [Ec. (1.9)]. La información se empleará para diseñar un tra~edesalto. Un investigador efectúa experimentos para encontrar la caída de voltaje a tra- vés de una resistencia como una función de la corriente. Hace las mediciones de la caída de voltaje para diferentes valores de la corriente Aunque hay al- gún error asociado con sus datos, al91-aficar los puntos. éstos le sugieren una relación curvilínea. Debe derwar una ecuación que caracterice esta relación. Un ingeniero mecánico tiene que desarrollar un sistemade amortiguamiento para un auto decarreras. Puede usar la segunda ley de Newton para tener una ecua- ción para predecir la razón de cambio en la posición de la rueda delantera en respuesta a fuerzas externas. Debe calcular el movimiento de la rueda. como una función del tiempo después de golpear contra un tope de 15 cm a 240 km/h. Un administrador tiene que calcular el ingreso anual requerido en un periodo de 20 años para un centro de entretenimientos que se va a construir para un cliente. El préstamo puede hacerse a una tasa de interés del 17.6"; Aunque para hacer este estimado. la información está contenida en tablas de econo- mía, sólo aparecen listados los valores paratasasde interés del 15 y 20% 1.3 Proporciónese un ejemplo de un problema de ingeniería donde sea oportuno cada uno delos siguientes tipos de métodos numéricos. En IO posible. remitasr el ejem- plo de las experiencias del lector en cursos y en conferencias u otras experiencias profesionales que haya acumulado hasta la fecha. a) Raíces deecuaciones b) Ecuaciones algebraicas lineales c) Ajuste de curvas: regresión d) Ajuste de curvas: interpotación el Integración fi Ecuaciones diferenciales ordinaria5
  • 30. C A P I T U L O D O S LA PROGRAMACION EN LAS COMPUTADORAS PERSONALES Los métodos numéricos combinan dos en las herramientas más impor- tantes en el repertorio de la ingeniería: matemáticasy computadoras. Los métodos numéricos se pueden definir (sin ser muy exacto) como las ma- temáticas por computadora. Las buenas técnicas de programación aumen- tan la habilidad para aplicar los conocimientos de los métodos numéricos. En particular, las potencialidades y limitaciones de las técnicas nu- méricas se aprecian mejor cuando se usan estos métodos para resolver los problemas de ingeniería utilizando como herramientauna compu- tadora. Al usar este libro se obtiene la posiblidad de desarrollar los propios programas. Debido ala gran disponibilidad de computadoras personales y dispositivos de memoria magnética, los programas se pueden conser- var y usar durante toda la carrera. Por lo tanto, uno de los principales objetivos de este texto es que el lector obtenga programas útiles y de alta calidad. Este texto contiene características especialesque maximizan esta po- sibilidad. Todas las técnicas numéricasvan acompañadas de material pa- ra una implementación efectiva en la computadora. Además, se dispone de programas suplementarios para seis de los métodos más elementales discutidos enel libro. Estos programas, desarrollados para computadoras personales (IBM-PC y Apple 11), pueden servir como base para una bi- blioteca de programas propios. Este capítulo presenta una información preliminar que tiene utilidad siempre y cuando se desee usar este texto como base para el desarrollo de programas. Está escrito bajo la suposición de que ya se ha tenido una experiencia previa en la programación de computadoras. Debido a que ellibro no está enfocado hacia un curso de programación, se estudian únicamente aquellos aspectos que definen el desarrollo de programas de análisis numérico. También se propone proporcionarcriterios específicos para la evaluación de los esfuerzos del lector.
  • 31. 22 METODOS NUMÉRICOS PARA INGENIEROS 2.1 ANTECEDENTES HISTóRICOS En el sentido más amplio, una computadora se puede definir como un dispositivo que ayuda acalcular. Con base en esta definición, una de las computadoras más antiguas es el ábaco. Descubierto en el antiguo Egip- to y en China, se compone de cuentashiladas sobre alambresen un marco rectangular (Fig. 2.la). Las cuentas se usan para guardar potencias de10 (unidades, decenas, centenas, etc.) durante un cálculo. Cuando se emplea con destreza, el ábaco puede competir en velocidad con una calculadora de bolsillo. Aunque los dispositivos manuales tales comoel ábaco aceleran la ve- locidad en los cálculos, las máquinas extienden aún más las capacidades humanas para estos cálculos.Estimuladospor la revoluciónindustrial, los científicos del siglo XVII desarrollaron la primera de tales computadoras mecánicas. Blas Pascal inventó, en 1642,una máquina para sumar (Fig. 2.lb). AI final de ese siglo, Gottfried Leibnitz desarrolló una calculadora mecánica que podía multiplicar y dividir. Aunque en los siglos siguientes se desarrollaron otros instrumentos de cálculo, no fuesino hasta la década de 1940cuando surgieron las com- putadoras electrónicas. Se originaron, inicialmente para proyectosmilita- res en la segunda guerra mundial, erandispositivos de investigación para un solo propósito. Estas máquinas, con nombres comoENIAC Y EDSAC, usaron tubos al vacío como componentes electrónicos básicos. Aunque eran caras, lentas y a menudo desconfiables, estas computadoras de la primera generación auguraban un procesamiento de datos agran escala. Aunque algunas máquinas de la primera generación, en especial la UNIVAC,se vendieron a nivel comercial, no fue sino hastala década de 1960 que las computadoras estuvieron disponibles para una gran canti- dad de científicos e ingenieros. Esto se debió al desarrollo de los transis- tores y de algunos dispositivoselectrónicos de estadosólido que suplieron a los tubos al vacío creando computadoras que, entre otras cosas, eran más confiables. Aunque el uso de estas computadoras se extendió, su acceso era algunas veces limitado ya que las máquinas seguían siendo muy caras para quela mayoría de los profesionistas las obtuvieran indivi- dualmente.Por lo tanto, los ingenierosdebíanasociarsecon grandes organizaciones talescomo universidades, oficinas gubernamentales, cor- poraciones o firmas consultoras para tener acceso a las computadoras. Sin embargo, a la mitad de la década de 1960 y principios de la dé- cada de1970un adelanto en la técnica alteró dramáticamente esta situa- ción. En particular, el reemplazo de los transistores por circuitos integrados ha producido un gran poder computacional en el medio profesional de los ingenieros. Un circuito integrado, o CI, consiste en una pastilla delga- da de silicón donde se han colocado miles de transistores. El resultado práctico de esta innovación ha sido en dos aspectos. Primero, en el nú- cleo de la máquina o la parte central de las computadoras, las velocida-
  • 32. LA PROGRAMAC16NEN LAS COMPUTADORASPERSONALES 23 FIGURA 2.1 Evolución de los dispositivos de cálculo: a)ábuco; b)calculadora de Pas- cal; c) supercomputadora y d) microcomputadora o computadora per- sonal (los incisos b y c con permiso de IBM; el inciso d con permiso de AppleComputer,Inc.). des y la capacidaddememoriason muy grandes. Segundo, y más importante en el contextoactual,las computadoras personales que soncon- venientes, pequeñas, rápidas y confiablesse están produciendo en masa y a precios razonables.Como se expresóen un artículo de la revistaScien- tificAmerican: “Las microcornputadoras dehoy día a un costo talvez de $300 dólares, tienen más capacidad de cómputo que las primeras com- putadoraselectrónicasgigantescas ENIAC. Son 20 veces másrápidas,
  • 33. 24 MÉTODOS NUMÉRICOS PARA INGENIEROS CUADRO 2.1 Comparación de sistemascomunes de cómputo* Longitud Cifrasde significa-palabraCostodecálculo,almacena- Sistema tivas bits(dólares) ciclosls miento (K) Calculadora O 25-3501-2 Microcomputadora 7-1 O 7-1 6 100-5000 106-1 o7 16-256 Minicornputadora 7-1 O 16-32 15,000-1 20,000 106-1 o7 128-51 2 Cornputadoras 7-1 4 32 100,000-1 o,ooo,ooo+ 106-1 o* 8000-32,000 prograrnable grandes * Condensodo de AuerbochComputer Technology Reports, Agosto 1983. tienenunamemoriamayor,sonmilesdevecesmás confiables, consu- menla energíade un bulboenvezdeladeuna locomotora,ocupan 1/30O00 de volumen y cuestan 1/10 O00 parte. Se pueden obtener por unaordenpostal o encualquiertiendaespecializada” (Noyce, 1977). Lascomputadoraspersonales se agrupan,por lo general enunade dos categorías que a veces no están biendelimitadas:micro y minicom- putadoras. Las rnicrocornputadoras sonaquellascuyafunciónprincipal está contenida enunasolapastilladecircuitointegrado.Comúnmente cuestan unos miles de dólares.Las minicomputadoras son un término más imprecisoque se refiere a computadorasquesonmáspotentesque las micros pero caen aún dentro de las posibilidades de compra de algunas personas y pequeñascompañías.Ambostiposdecomputadorasestán encontrasteconcomputadorasgrandes, o supercornputadoras, que se manejan en intervalos de millones de dólares y sus propietariosson, por lo general, organizaciones o compañías muy grandes. El cuadro 2.1 re- sume lainformacióngeneralsobrevariostiposdecomputadoras. Larevoluciónenelcampodelestadosólidohaabiertolaspuertas en el área computacional a cada ingeniero.Sin ernhnrgo, no importa qué tipo de computadora se use, ésta sólo tiene utilidadsi se le proporcionan instrucciones precisas. A estas instrucciones se les conoce como progra- mas.Lassiguientesseccionescontieneninformaciónqueserá útil para el desarrollodeprogramasdealtacalidadpara utilizar los métodos nu- méricos. 2.2 DESARROLLODE PROGRAMAS El material de este capítulo está organizado alrededor de cinco temas, es- quematizados en lafigura 2.2, requeridos para la elaboración y cuidado deprogramasdealtacalidad.Estecaljitulocontieneseccionesque cu- bren cadaunode estos pasos.Estematerialincluye un casodeestudio dondecadaunode los pasosseaplicaparadesarrollar un programa y resolverelproblemadelparacaidista.Despuésdeasimilar este material,
  • 34. LA PROGRAMACldNEN LAS COMPUTADORASPERSONALES 25 el estudiante debe estar mejor preparado para desarrollar programas de altacalidadpara los métodos delrestodellibro. 2.2.1 Diseño de algoritmos Se puede ahora empezar con el proceso de desarrollar programas para una computadora. Un programa es simplemente un conjunto de instruc- ciones para la computadora. Todos los programas que se necesitan co- rrerenuna computadoraparticular,en conjunto se lesllama software. FIGURA 2.2 Cinco pasos necesarios para producir y dar soporte a programas de al- ta calidad .Las flechas hacia atrás indican que los primeros cuatro pasos se pueden ir meiorando conforme se gane experiencia.
  • 35. 26 MÉTODOS NUMERICOSPARAINGENIEROS Un algoritmo es una secuencia l6gica de pasos necesarios paraejecu- tar una tarea específicatal como la solución de un problema. Losbuenos algoritmos tienen ciertas características. Siempre deben terminardespuk de unacantidadfinita de pasos y deben ser lomás general posible para tratarcualquier caso particular. Los buenosalgoritmosdebenser deter- minísticos; esto es, no debendejarnada al azar. Los resultadosfinales no pueden ser dependientes de quién esté usando el algoritmo. En este sentido, un algoritmo esanálogo a una receta. Doscocineros que prepa- ran independientemente unabuenarecetadeben obtener dos platillos idénticos. La figura2 . 3 ~muestra un algoritmo para la solución de un problema simplequesumados números. Dos programadoresquepartandeeste algoritmopuedendesarrollardosprogramasconestilos diferentes. Sin FIGURA 2.3 a) Algoritmo y b) diagramade fluio para la solucióndel problema de una sumasimple.
  • 36. LA PROGRAMACldNEN LAS COMPUTADORASPERSONALES 27 embargo, dados los mismos datos, los programas deben arrojar los mis- mosresultados. Una forma alternativade representarun algoritmo es medianteun dia- grama de flujo. Estaesunarepresentaciónvisual o gráficadelalgoritmo que emplea una serie de bloques y flechas. Cada bloque enel diagrama representaunaoperaciónparticular o un paso enelalgoritmo. Las fle- chas indican la secuencia en que se implementan las operaciones. La fi- gura 2.4 ilustra ocho tipos de bloques y flechas que conformanla mayor parte de las operaciones que se requierenen laprogramacióndeuna computadora personal. Lafigura 2.3b muestraun diagrama de flujo para el problemasimpledesumardosnúmeros. Los diagramasdeflujotienen unautilidadparticularpara bosquejar algoritmoscomplicados. En estos casos, un bosquejo gráfico puede serútil para visualizar el flujo lógico del algoritmo. En este texto, se hanincluidodiagramasdeflujoparala ma- yor partede los métodosimportantes. Se puedenusarestosdiagramas como basepara el desarrollodesuspropiosprogramas. 2.2.2 Composición de un programa Después de confeccionarun algoritmo, el paso siguiente es expresarlocomo una secuencia de declaracionesde programación llamado código. Esim- portante resistir la tentación de escribir el códigoantesdequeelproble- maen su totalidad esté claramente definido y la técnica de solución y el algoritmo hayan sido cuidadosamente diseñados. Lasdificultades que más comúnmente encuentran los programadoressin experiencia se deben por lo general a lapreparaciónprematura de un código que no abarque un plan o unaestrategia total, para la solucióndelproblema. Después que se ha diseñado un buen algoritmo, el código se escribe en un lenguaje de alto nivel para una computadora.Se han desarrollado cientos de lenguajes de programación de altonivel desde que la era de las computadoras empezó. Entre ellos, haytresquetienenimportancia paracomputadoras personales: BASIC, FORTRAN y PASCAL. FORTRAN, es la construccióndefórmulatranslation(traducciónde fórmulas),y se desarrolló enla década de 1950. Debido a que fue expre- samente diseñado para cálculos, hasidoel lenguaje más usado en la in- geniería y la ciencia. BASIC, es la contracción de beginner’s all-purpose symbolic instruc- tion code (clave de instrucciones simbólicas de propósito general para prin- cipiantes),fuedesarrolladoenla década de 1960. Requiere unacantidad pequeña de memoria y es relativamente simple de implementar.En con- secuencia es uno de los lenguajes másusadosenlas computadorasper- sonales; sin embargo, el BASIC no es tanflexible como el FORTRAN y a veces no es conveniente paraprogramasgrandes o complejos. El PASCAL, que debesu nombre al científico francés BlasPascal, esun lenguajeestructuradoquesedesarrolló enla década de 1970. Los pro- gramasescritos en Pascalpara una computadoradeterminadapueden
  • 37. 28 METODOS NUMERICOS PARA INGENIEROS FIGURA 2.4 Símbolos utilizados en diagramas de fluio.
  • 38. LA PROGRAMACldN EN LASCOMPUTADORASPERSONALES 29 ser corridos fácilmente en otra. Aunque el Pascal es másdifícilde apren- derqueel BASIC y el FORTRAN, sufuerzasugierequesuimportancia crecerá en el futuro. Esto es verdad para la programación avanzadaa gran escala. BASIC y FORTRAN son convenientes para programas simplesy cortos que son suficientes parala implementación de los métodos numéricosde estelibro.Por lo tanto, se ha optadoporlimitarlaspresentacionesdel texto,a programas en estos lenguajes. BASICes unaalternativaobvia por su amplia disponibilidad.Se ha incluido el FORTRAN por su signifi- cado continuo enel trabajo de ingeniería. Aunque este libro hace énfasis enlas computadoras personales, puedeusarseporaquéllosquetienen acceso a máquinas más grandes y en conjunción con cualquier lenguaje dealtonivel.Con este espíritu, los programas y diagramasdeflujoson lo suficientementesimples como paraquepuedanservirdebaseenel desarrollodeprogramasparaaquéllosquesonexpertosen Pascal. Una descripción completa delBASIC y el FORTRAN, obviamente va más allá del alcance de este libro. Además, el número de dialectos dispo- niblesen cada lenguajecomplicaaúnmássudescripción.Por ejemplo, existen más de 10 dialectos derivados del BASIC. Sin embargo, limitan- do ladiscusión a lo fundamental, se puede cubririnformaciónsuficiente de forma tal que se pueda entender e implementar efectivamenteel ma- terialrelacionadocon la computadora enel resto dellibro. Enlafigura 2.5 SF! presentan los códigos en FORTRAN y BASIC pa- ra sumar dosnúmeros, mostrando las diferencias estructurales principales entre los dos lenguajes, el etiquetado y el espaciamientode código. En BASIC, cada instrucción se escribe con un número. En contraste,en FOR- TRAN se etiquetancon un número sólo aquéllasinstruccionesque re- quierenidentificación.Por ejemplo, lainstrucciónque tiene la etiqueta número 1 en la versión FORTRAN de la figura 2.5 se llama una declara- SIC c I FIGURA 2.5 Programadecomputadora en FORTRANy BASIC para el problemade la suma simple.
  • 39. 30 METODOS NUMERICOSPARAINGENIEROS ción FORMAT. Especifica la forma en que seva a introduciro a imprimir una línea particular. Por lo tanto, se debe etiquetar con un número para que la computadora pueda distinguirla de otras declaracionesFORMAT. Las declaraciones FORTRAN se deben numerar para otros casos pero la mayor parte, por lo general van sin numerar. Otra diferencia entre los dos lenguajes es el espaciamiento de cada línea; en BASIC, por lo general el espaciamiento no tiene importancia. Por ejemplo, la línea 10 se pudo haber escrito de las siguientes formas 10 A = 25 1OA=25 10 A = 25 y la computadora debe interpretar todas las formas como equivalentes. En contraste, los términos en FORTRAN se deben alinear en columnas específicas. Las reglas sobre la alineación provienen del hecho de queel FORTRAN se introducía originalmenteen una computadora usandolec- tora de tarjetas. Aunque las tarjetas se emplean menos frecuentemente hoy en día, las reglas de espaciamiento por lo general se han conservado. A las 80 columnas de la tarjeta perforada se les llama campos de la tarjeta. Los campos de la tarjeta se agrupan por partes para diferentes propósitos. Estos se ilustran en la forma de codificación de la figura 2.6. Una forma de codificación es un pedazo de papel donde se puedeescri- bir y verificar un programa para revisarlo de errores antes de introducirlo a la computadora. Nótese que también contiene80 columnas al igual que una tarjeta perforada. También obsérvese que cada una delas partes de los campos se usa para propósitos particulares. Aparte de la estructura, los dos lenguajes tienen otras diferencias así como fuertessimilitudes. En el cuadro 2.2 se delinean éstas. Este cuadro muestra comparaciones en paralelo deseis elementos principalesde pro- gramacióc que tienen importancia directa en el uso de los métodos nu- méricos. Estos son: 1. Constantes y variables. Se debenseguirciertasreglasparaexpresar números y nombres simbólicos en los dos lenguajes. Como se puede ver en el cuadro 2.2 ésta es un área en donde elBASIC y el FOR- TRAN son muy diferentes. 2.Entrada-salida. Éstas son instrucciones mediante las cuales se trans- mite información de y hacia la computadora. He aquíotra área donde los lenguajes muestran diferenciasconsiderables.Aunque la mayor parte de los lenguajes modernos mejoran esta situación, históricamente las capacidades de entrada-salidadel BASIC, han sido muy limitadas. En constraste, las declaraciones FORMAT del FORTRAN son herramientas muy potentes para etiquetary espaciar la salida. Sin embargo, son de las declaraciones de programación más difícilespara un novato y aun para un experto.
  • 40. 32 METODOS NUMÉRICOS PARA INGENIEROS CUADRO 2.2 Referencia rápida: comparación de FORTRAN y BASIC. FORTRAN y BASIC son lenguajes de computadora fáciles de aprender y de practicar, en general son los primeros lenguajes de programación que se les enseña a los estudiantes de ingeniería. Como sucede con muchoslenguajes de programación, existen varios aspectos que hacen dificil entender su uso. La siguiente comparación resulta del intento de bosquejar las diferencias generales y las similitudes entre FORTRAN y BASIC y a la vez servir de referencia rápida y como recordatorio. Se pueden consultar otras fuentes para los detalles referentes Q cada uno de los lenguajes. Este resumen se limita y se enfoca a la vez al material que tiene importancia directa con los metodos numéricosy con los programas descritos en el texto. FORTRAN BASIC CONSTANTES Y VARIABLES (Representan los números y caracteres usados a lo largo del programa) Constantes Son valores positivos o negativos,(excluyendo las comas o los símbolos especiales) que se mantienen inalterados a lo largo del programa. EnterosConstantesnuméricas sonconstantes que no contienenpuntosonnúmerosenteros o reales con punto decimal: decimal: 1, -2, 100 1, -2.0, 0.001,100 Constantes reales: contienenpunto decimal: 1.o, -2., 0.001 Exponenciales sonconstantesescritasen notación científica. Por ejemplo, los números: -12 000,0.000 006 8, 386 O00 O00 se expresan ennotación científica como: -12 x lo3,6.8 x 3.86 x 10’ y se pueden escribiren FORTRAN y BASIC como: -12E3, 6.8E-6, 3.86E8 Constantes alfanuméricas y cadenas de caracteres representan letras, números y símbolos que se usanenestetexto para etiquetar. Las cadenas de caracteres tienenotras aplicaciones,incluyendo el USO de expresiones de relación. En FORTRAN se encierrancomo: En BASIC se encierran como: ‘JOHN DOE’, ’INTRODUCE B’ “VALOR DE A =”, “8/5/48”
  • 41. LA PROGRAMACldNEN LAS COMPUTADORASPERSONALES 33 CUADRO 2.2 Referencia rápida: comparación de FORTRAN y BASIC. (cont.) FORTRAN Variables numéricas representan cantidades que pueden cambiar de valor. Se usan para estas variables los nombres simbólicos, que deben empezar con una letra y no pueden contener símbolos especiales. Nombres de variables Nombres de variables consistende uno aseis caracteres, desde constan dedos caracteres (mós en algu- la A a la Z y del O a 9: nos dialectos) dela A a la Z y del O al 9: Variables enteras AA, X, N1 representanvaloresenteros y empiezanrepresentanvalores reales o enteros. con las letras I a la N: N,KOUNT, lNDl Variables reales representanvaloresreales y empiezan con las letras A a la H y O a la Z: X, COUNT, VEL1 Variables de caracteres o cadenas representan cadenas alfanuméricas y de caracteres. Se usan nombres simbólicos. .El tratamiento de las cadenas de caracteres varía considerablemente entre diferentes versiones Declaración CHARACTER Cadenas variables son de la forma:terminancon $. La longitud de la varia- CHARACTER * n vorl,vor2 ble es limitada. A$, N1$ donde n es la longitud específica dela cadena de caracteres seguidapor una lista de variables. Por ejemplo, CHARACTER * 4 NOMBRE1,NOMBRE2 Arreglos son variables con subíndiceque almacenan un conjunto de valores envectores de una dimensión y en matrices multidimensionales. El espacio de almacenamiento suficiente para un número dado de elementos se especifica mediante ~~ Declaración DlMENSldN Declaración DIM DIMENSION A(n),ISUM(n,,n2) DIM A(n), IS(nl,n2) Se permiten hastasietesubindices que La declaración DIM, en general se limita a deben ser enteros positivos. arreglos bidimensionales; las n pueden Los arreglos no dimensionados generan ser variables. un error. Los arreglosnodimensionados suponen un valor den = 10.
  • 42. 34 M~TODOSNUMÉRICOS PARA INGENIEROS CUADRO 2.2. Referenciarápida:comparacióndeFORTRAN y BASIC. (cant.) FORTRAN BASIC La declaración DIG-ENSION se debe co- La declaración DIM se debe colocar antes locar antes de cualquier declaración de la primera línea dondelavariable ejecutable. dimensionada se va a usar. En caso de no ir, supone el valorn = 10. El redi- mensionamiento generaa unmensaje de error. Las variables definidas en la declaración DIMENSION (esto es,A o ISUM)tienen la misma regla de las variables numéri- cas "esto es, el arreglo A debe conte- ner valores reales, mientras que el arreglo ISUM debe contener valores enteros. ENTRADAlSALlDA qué medios se transmite información a y desde un programa), Declaraciones de formato especifican la longitud y la posición de cada uno de los datos, que se vana leer o a imprimir. Aunque en laentraday salida de da- Aunque existe Io declaración de formato tos existe formato libre, el FORTRAN para lectura o impresión de datos, las estándar, en general impone un for- versiones recientes de BASIC no lo em- mato de lectura o impresión. pleon. Entrada especifica los medios por los cuales se transmitendatos al programa Declaración READ permitenintroducirdatos alprograma durante su ejecución: READ f varl,vur2,. . . , vur, donde f esun código de formato que especifica el tipo, disposición y, en algu- nos casos, el dispositivo usado para leer los valores de var], var2, . . ., varn. Por ejemplo: READ (5,2)A,B donde el 2 es la etiqueta donde está la declaración FORMAT correspondiente y el 5 especifica que los datos se obten- drán de unalectora de tarjetas. Declaración DATA son declaraciones no ejecutables que defi- nen el valor inicial de una variable. Tienen laformageneral. Declaración INPUT Permitenintroducir datos at programa durante su ejecución: In INPUT varl,vur2,. . . , var, donde Ines el número de líneas donde está la declaración INPUT y var,, var2, . . ., var, son los nombres de las varia- blescuyosvalores se vanaleer. Por ejemplo: 10 INPUT A,B Cuando se ejecutaestainstrucciónse deben introducir los valores de A y B en undispositivo,tal como el teclado. DeclaracionesREDlDATA consiste de una declaración READ asocia- da a una declaración DATA que contie- ne los valores que se van a leer, como:
  • 43. LA PROGRAMACldN EN LASCOMPUTADORASPERSONALES 35 CUADRQ 2.2 Referencia rápida: comparación de FORTRAN y BASIC.(cont.). FORTRAN BASIC DATA var,, , . .,var,,lvalor,, 10 READA,B,C,Z . . .,valor,,/ donde var es el nombre de la variable y valor es una constante. Por ejemplo: 90 DATA5,0.001,88,1 E-6 DATA A,B,C,Z/5.,0.001,88.,1.E-6/ Salida esel medio por el cual se transmiten datos del programa. DeclaraciónWRITE Declaración PRINT se usa comúnmente para imprimir datos. se usa comúnmente para imprimirdatos. Su formageneral es: Su formageneral es: WRITE fvarl, . . . , vur, In PRINT varl, . . . , var, Por ejemplo: WRITE (6,2)A,B Por ejemplo: 10PRINTA,B donde (6,2) es el código de formato, el Enel momento que esta declaración 2 es la etiqueta de la declaración FORMAT se ejecuta, los valores de A y B se impri- correspondiente y el 6 especifica que los men en un dispositivo tal como la panta- datos se imprimirán en una impresora. lla o unaimpresora. IcA1cu10s (Operaciones que usan expresiones matemáticas)1 Declaracionesde asignación se usan para asignar un valoraunavariable: XM=3.281 indica a la computrdora que asigne el valor 3.281 a lavariable XM; A=XM+5 indica a la computadora que sume 5 a XM y le asigne el resultado (en este caso, 8.281) alavariable A; A=A+40 indica alacomputadora que sume 40 a A y le asigne el resultado (en este caso, 48.281) ala variable A. El valor anterior de A se destruye enel proceso. Nóteseque,aunque A = A + 40 no es una expresión matemática válida, tiene un significado especial dentro de la computadora. AI signo de igual en la declaraciónde asignación se le puededar un significado de "se reemplaza por", como en: A se remplazapor A+40 + - Operadores aritméticos sonsímbolos usados para representar operaciones matemáticas: Suma Resta + - ...
  • 44. 36 MÉTODOS NUMÉRICOS PARA INGENIEROS CUADRO 2.2 Referenciarápida:comparacióndeFORTRAN y BASIC. (cont.). FORTRAN BASIC * Multiplicación * i División i ** Exponenciación **, ?,A (El signode exponenciación dependedel tipo de BASIC) Si una expresiónaritméticatuvieratodos los operadores, el orden en que se efectuaríansería: primero, todas las exponenciaciones deizquierda a derecha en BASIC, Applesoft y Microsoft, y de derecha a izquierdaen FORTRAN; a continuacidntodaslasmultiplicacionesydivisiones de izquierda a derecha, y finalmentetodaslassumasyrestas de izquierda a derecha. Cuando una expresiónpresentaparéntesis, laformade efectuarlos es del másinterno al más externo. x = $0 + 3":- "y4 45 X=(((A+B)-R**3)/33-Y**4/45)**.5 X=(((A+B)-RA3)/33-YA4/45)A.5 CONTROL (Dirigen el flujo del programa mediante saltos, transferencias y reasignacianes) Dedaración GO TO especificaunsalto incondicional aun número de líneaespecífico: GO TO 200 .EQ. .NE. .IT. .LE. .GT. .GE. .AND. .OR. Operadores lógicos se usan para comparar los valores de , .Igual a diferente de menor que menor o igual que mayor que mayor o igual que lógica dosexpresiones: - < > < < = > > = - AND OR Declaración lógica If se utilizan para la toma de decisiones, de acuerdo al valor verdadero a falso que tenga una expresión lógica IF(N.GT.l .OR.N.LT.3)N=2 IF(N.GE.l) GOTO 10 IF(N>l)OR(N<3)THEN N=2 IF N>=l THEN 10 En los ejemplos anteriores, si la expresión lógica se cumple, seejecuta la transferencia o la asignación. En el primer ejemplo, si N es mayorque 1 a
  • 45. LA PROGRAMACldNEN LAS COMPUTADORASPERSONALES 37 CUADRO 2.2 Referencia rápida: comparación de FORTRAN y BASIC. (cont.). FORTRAN BASIC menor que 3, entonces N se iguala a 2 y el control pasa a la siguiente línea. En el segundo, si N es mayor o igual a 1, el programo se transfiere a la línea 1O. En cualquier caso, si la expresión es falsa, no se ejecuto la transferencia o reasignación y el control se pasa a la siguiente línea. Ciclos permiten repetir cálculos con una cantidad mínima de declaraciones Ciclos con IF lógico repiten calculos que se controlan con base en la declaración IF: 1 0 X=Y(I)*Z(I-1) IF(X.LT.O)GO T O 50 GO TO 10 1=1+1 50 X=-X 10 X=Y(I)*Z(I-1) 20 IF X<O THEN 50 30 I=!+l 40 GO T O 10 50 X=-X Ciclos controlados por un indice Ciclos DO CiclosFORlNEXT DO In I=j,n,k FOR I = i T O n STEP k In C O N T I N U E In NEXT I donde In es el número de línea de la ú h a declaración del ciclo, ies el valor inicial del contador, n es el valor final o terminal y k es el incremento dado a la variable I para que.varíe desde j hasta n. Después de terminar el ciclo, valor de n + k siempre y cuando Isea múltiplo de n. SUBPROGRAMAS: FUNCIONES Y SUBRUTINAS (ejecutan una proposición o un conjunto de proposiciones que se repiten varias veces a lo largo de un programa) , I tiene el Funciones intrínsecas operaciones matemáticas o trigonométricas que se emplean comúnmente. ~~ ~ son funciones construidas internamente o funciones de biblioteca que realizan SIN Seno cos T A N Coseno ALOG o LOG Tangente Logaritmo natural o de base e ALOG o LOGIO EXP Logoritmo común o de base 10 Exponencial SQRT Raíz cuadrada ABS Valorabsoluto I N T El entero más grandeque Es menor o igu:?! a x SIN cos TAN L O G EXP SQR ABS INT
  • 46. 38 METODOS NUMÉRICOS PARAINGENIEROS CUADRO 2.2 Referencia rápida: comparacióndeFORTRAN y BASIC.(cont.). FORTRAN SOL. donde x es el argumento de la función. Nótese que la listaanteriorno está completa.Dependiendode la versióndel compiladorpueden existirmás funcio- nes intrínsecas. Funciones definidas por el usuario son funcionesdefinidas por el programador. Declaración de funciones son de la forma: narnbre(xl, . . . ,xn) = f donde nombre es el nombre de la fun- ción (se puede dar cualquier nombre); x , , . . .,x,,son variablesnuméricas que no tienensubíndice y f es unaexpre- siónaritméticaquedependede x , ,. . .,x,,. Las declaraciones de funciones van antes de laprimera proposiciónde ejecutable. Se puedenpasar variosargumentosen unadeclaración de unafunción. Las otras variables dentrode lafunción tie- nen el mismo valor que en el programa principal en el punto donde se llama la función. TRIG(X,Y)=SIN(X)-LOG(Y) A=5 )'&&B=10 S=TRIG(A,B) Declaración DEF son de laformageneral: in DEF FNa(x) = f donde In es el número de línea, a es cualquier letra del alfabeto, x es una variable numérica (sinsubíndice) y f es una expresión aritmética que es función de x . La declaración DEF va antes de ejecutar dichafunción. Se puede pasar sólo argumentos en una declaración DEF. Lasotras variables dentro de la función tienen el mismo va- lor que enel programa principal enel punto donde se llamaa la función. 10 DEF FNT(X)=SIN(X)-LOG(B) r 70A=580 E= 10 990 S=FNT(AJ Subprogramas Function se parecen alas declaraciones de funcio- nes en la ejecución pero, como su nom- bre lo indica, son programas, esto es, consisten de varias líneas. Los subpro- gramas tipofunctionson de lo forma general: FUNCTION name(xl,. . . x2j nombre = f RETURN donde todos los valores que toma la funciónsonaquellos que se definen a1 llamaradicha Función.
  • 47. LA PROGRAMACldN EN LAS COMPUTADORASPERSONALES 39 CUADRO 2.2 Referenciarápida:comparacióndeFORTRAN y BASIC. (cont.). FORTRAN BASIC A= 5 B=10 S=TRIG (A.B) FUNCTION TRIG(X,Y) RETURN TRIG=SIN(X)-LOG(Y) Nótese quelas constantes y las variables que no se pasan como argumentosde- ben definirse dentro dela función o pa- sarse por una declaración COMMON. Subrutinas son subprogramas que consisten de un conjunto de proposiciones que realizan una tarea en particular. Contienen una declaración RETURN que regresa al punto donde se llamó a la subrutina. Las subrutinas se llaman con una decla- ración CALL de la forma: Call nombre (arg,,org,,. . .,arg,) donde nombre es el nombre de la subru- tina y org,,. . ., org, son los n argu- mentos (variables o constantes) que se pasan a la subrutina. La subrutinava después del programa principal y empieza conuna declaración SUBROUTINE, de la forma: Las subrutinas se llaman con una decla- ración GOSUB de la forma: In, GOSUB Inn donde In, es el númerodelínea de la declaración GOSUBy In2 es el número de línea donde empieza la subrutina. La primera línea de la subrutina puedeir en cualquier lugar dentro del programa. donde nombredebe ser el mismo al Ila- mar dicha subrutina conla proposición CALL. Una vez dentro de la subrutina, las proposiciones se ejecutan ensecuencia hasta que se encuentra una declaración RETURN, después de lo cual regresa a la si- guiente línea de donde está la subrutina. Se pasana y desde la subrutinoúnica- Todos los valores se pasan a y desde la mentelos valoresqueaparecencomosubrutina. argumentos de la misma:
  • 48. 40 MÉTODOS NUMÉRICOS PARA INGENIEROS CUADRO 2.2. Referenciarápida:comparacióndeFORTRAN y BASIC. (cont.) FORTRANBAS IC CALL SUM (X.Y,Z) - 200GOSUB 800 END 500 END SUBROUTINE SUM (A,B,C) 800Z=X+Y C=A+B 850 RETURN RETURN Nóteseque lasconstantes y las varia- bles que no se pasan comoargumentos se deben definir dentro dela subru- tina o pasarseconunadeclaración COMMON. DOCUMENTACI~N (le permiteincluirinformación para el usuario de los programas) las declaraciones de documentación son instruccionesnoejecutables. DeclaracióndecomentarioDeclaración REM Consistedelcarácter C o delsímbolo * enConsistede la declaración REM seguida C aquí se puede teclear cualquier 1 O REMaquí se puede teclearcualquier la columna 1 seguido por unmensaje: por unmensaje: mensaje. mensaje. 3. Cálculos. Las operaciones matemáticas son muy similares en ambos lenguajes. Aunquela nomenclatura es un poco diferente,las ecuacio- nes escritas en los dos lenguajes casi son idénticas. 4. Control. Estas declaracionesseusanpara dirigirla secuencia lógica de las instrucciones en el programa. Para los m6todos numéricos, es suficiente con tres tipos: la declaración GO TO, el IF lógico y los ci- clos. Aunque hay pequeñas diferencias en la nomenclatura de ambos lenguajes, las declaraciones son muy similares en operación. 5. Subprogramas. Como lo indica el nombre, sonminiprogramas dentro del programa principal. Se diseñan para ejecutar declaraciones que se repiten muchas veces a lo largo del programa. En vez de reescribir los miniprogramas muchas veces dentro del programa, se pueden es- cribir sólo una vez e invocarse con una declaración simplecuando sea necesario. Estos .subprogramas, que incluyen las subrutinas, funcio- nes definidas por el usuario y funciones predefinidas, son otro caso
  • 49. 0 7 8 f q LA PROGRAMACIóN EN LASCOMPUTADORASPERSONALES donde FORTRAN y BASICdifieren significativamente. Lasdiferen- cias estriban en la manera en que se pasainformación entre el cuerpo principal del programa y los subprogramas. Como se muestra en el cuadro 2.2. los argumentos de los subprogramas FORTRAN actúan como ventanaspara controlar el paso de informacih.Este es un ejem- plo que muestra al FORTRAN como un lenguaje más complicado y. enconsecuencia.máspotenteque el BASIC. 6. Documentación. Estas declaraciones permiten incluir información en- focada al usuario dentro del programa. En resumen, el FORTRAN es un poco más flexible y más poderoso aunque también es más difícil de aprender que el BASIC. Sin embargo. ya que éste sedesarrolló originalmente como unaversión simplificada del FORTRAN. los dos lenguajes muestran varias similitudes. Aunque cada uno de ellos tiene sus reglas que deben respetarse en cuanto a estilo. su vocabulario y gramática son lo suficientemente similares como para per- mitir una traducción fácil de la mayor parte de los programas de un len- guaje a otro. Por10 tanto, en estelibro todo el código para computadora se presenta en formato doble como el de la figura 2.5.Aunque algunas veces signifique que se olvidarán características peculiares de uno u otro lenguaje, esto permitirá alcanzar un conocimiento de los dos lenguajes FORTRAN y BASIC. 2.2.3 Rastreo y prueba Después de escribir el código del programa. se debe probar para buscar los errores, a los que seles llamabugs. AI proceso de localizar y corregir los errores se les conocecomo rastreo. Pueden ocurrirvarios tipos de erro- res cuando se programa encualquier lenguaje. Los errores desintaxis violan las reglas del lenguaje como la ortografía. la formación de los números. los números delínea y otras reglas específicasa cadalenguaje. Estos errores a menudo resultan al teclear cosas raras. Por ejemplo. la declaración en BASIC 30A = 5/(0.2+ 4 * SIN (2* Y1 generaría un error de sintaxis inmediato porque los paréntesis no se en- cuentran por parejas. Los errores más difíciles de detectar están asociados con la lógica y con la construcción de los programas y pueden ocurrir sin interrupciones de sintaxis. Por lo tanto, se debe tener especial cuidado y asegurarse de que el programahace lo quese le pide. Porejemplo.supóngase que. se deseansumar los enterosentre 1 y 10 y luego dividirlos entre 10 (esdecir. calcular su promedio). Loscódigos en FORTRAN y BASIC de- ben ser
  • 50. 42 MÉTODOS NUMÉRICOS PARA INGENIEROS FORTRAN s = o DO40 I = 1, 10 S = S + I 40 CONTINUE A = S/I WRITE (6, 1)A BASIC 1 o s = o 20 FOR I = 1 TO 10 3 O S = S + I 40 NEXT I 5C A = S/l 60PRINT A obteniendo como resultado A = 5.mientras que el resultado esperado era A = 5.5.Lasintaxis está perfecta. pero hay un error de lógica que la computadora jamás podrá detectar porque no hay forma deobservar- lo. Una manera de eliminar este tipo de error es la de imprimir durante el programa los valores de las variables que no se requieran en la forma final del programa. Por ejemplo. si se ha escrito WRITE f V O ~ I ,. . . , vorn in PRINT vorl, . . . , V O ~ , con los resultados A = 5 e I = 11,probablemente se notará que el error estriba en que el valor de I se incrementa al salir del ciclo. Los erroresdeeste tipo a menudoson muy dificiles de detectar en programas muy grandeso muy complejos. Porlo tanto, es una buena práctica verificar manualmente si es posible, los resultados dadospor ' el programa y probarlos en casos especiales. Estopuede hacerse con lápiz, papel y una calculadora. Los errores asociados con la lógica o con la fi- nalidad de un programa. no con la gramática, se les conoce como erro- res de semántica. Estos ocurren. por lo general durante la ejecución del programa y se les conoce también como erroresen el momento de /aco- rrida (run time errors). Es absolutamentenecesaria la técnica de impri- mir los valores de las variables intermedias para verificar la lógica de un programa y evitar errores de semántica en programas muy grandes. Elrastreo y la prueba de los programas sefacilita empleando un buen estilo de codificación,Esto puede implicar que el disefio de los programas consista de varias partes pequeñas. A este tipo de estilo de programa- ción se le conoce como programación modular. Cada parte esespecifica e identifica fácilmente lastareas a ejecutar. Las subrutinas son medios apro- piados para tal modularización. El programa principal (oel programa que las llama) puede, entoncesser simplemente un director que guía cada una de las partes en un esquema lógico. De esta manera. si los programas no funcionan perfectamente, se puede aislar y localizar el problema más rápidamente. Por ejemplo. se pueden escribir subrutinas para c,ada una de las siguientes tareas: 1. Leerdatos. 4. Ejecutar algoritmos numéricos. 2. Mostrar datos. 5. Mostrar los resultados enuna tabla. 3. Mostrarun carácter para 6. Mostrar los resultados enuna gráfica. información.
  • 51. LA PROGRAMACIóN EN LAS COMPUTADORASPERSONALES 43- Cada unade estas subrutinas realiza una tarea limitada y aislada que se puede programary rastrear separadamente. Esto simplifica mucho eltra- bajo total. comparado con el rastreo de todo el programa simultáneamente. Después de probar los módulos, todo el programa se debe sujetar a una prueba total del sistema. Para un programa de métodos numéricos, se debe realizar una serie de cálculos y debe compararse con casos donde se conozcapreviamente lasolución exacta. Algunas veces sedispone de la soluciónanalítica lacual esaceptablepara estos propósitos.Talfue el caso delparacaidista (recuérdenselos ejemplos 1.1. y 1.2). En otros casos, el programadordeberealizarcálculosmanualesconunacalcula- dora de bolsillo para comprobar que el programa lleva a resultados con- fiables. En cualquier caso, elprograma se sujetará a unagranvariedad de pruebas para asegurarse de que funcionará confiablemente bajo todas las condicionesde operación posibles. Unicamente hastaentonces el pro- grama estará listo para ser usado en la solución de problemas de ingeniería. 2.2.4 Documentación Despuésde que el programa ha sido rastreadoy probado, se debe docu- mentar. La documentación es la inclusión de comentarios que le permi- ten al usuario implementar el programa más fácilmente. Recuérdese que junto con otras personas que pueden usar sus programas, el programa- dor mismo es un “usuario”. Aunque un programa parezca simpley claro cuando está reciénhecho y se guarda en la mente, después de pasar cierto tiempo el mismo códigopuede parecer inaccesible.Por lo tanto, sedebe incluir suficiente información para permitirlea los usuariosentendere im- plementarinmediatamentetalesprogramas. Esta tarea exhibeaspectosinternos y externos. La documentaciónin- terna consiste dealgún análisis o explicación que se inserta a lo largo del códigodelprogramaparaladescripción de cómo trabaja cada una de las secciones del mismo. Es importante en casos donde se va a modificar el programa. Esta documentaciónse debe incluir tan prontocomo se ter- mine una parte del programa, en lugar de hacerlo hasta el final, para evi- tar la pérdida del concepto en el diseño original que se tuvo en el desarrollo delprograma.Ladocumentacióninterna se mejoraconsiderablemente con el uso de nombres mnemónicos apropiados para las variables. Estos nombrespuedensermásdifícilesdecodificarquelosnombres peque- ños, pero la ventaja de sermásinformativos,porlogeneral hace que valga la pena el esfuerzo adicional.Utilizar nombres mnemónicosconve- nientes, incluyeen esencia eluso de nombres convencionales o est6n- dares o abreviaciones comunes paravariables. Ladocumentaciónexternaexplicalasinstrucciones como mensajes e información impresa suplementaria diseñada para auxiliaral usuario en la implementación de los programas. Los mensajes impresos se supone queayudan a que los resultadosesténbienpresentados y accesibles al usuario. Esto implica el uso correcto de espacios, líneas en blanco o ca-
  • 52. 44 MÉTODOS NUMÉRICOS PARA INGENIEROS racteres especiales que ilustren la secuencia lógica y la estructura de los resultados de un programa. Los resultados bien presentados simplifican la detección de errores y aumentan la comprensión de los mismos. La información suplementaria puede variar desde una hoja hasta un manual para el usuario. La figura 2.7 muestra un ejemplo de una forma FIGURA 2.7 Formato simple de una página para la documentación de un programa. Esta página se debe guardar en una carpeta con un listado del programa.
  • 53. LA PROGRAMACI~NEN LAS COMPUTADORASPERSONALES 45 de documentación simpleque se recomienda para preparar cada unode los programas a desarrollar. Estas formas se pueden mantener enun cua- derno denotas para tener unareferencia rápida parala biblioteca de pro- gramas. El manual del usuario para una computadora es un ejemplo de una documentación accesible.Este manual indica cómo correr el sistema y los programas de operación en disco de la computadora. 2.2.5 Almacenamiento y mantenimiento Los pasos finales en el desarrollo de un programa son el almacenamiento y mantenimiento del mismo. El mantenimiento involucra acondicionar el programa e incluso hacerle cambios que lo hagan accesible a problemas reales. Después de varias corridas, estos cambios pueden hacer al pro- grama más fácil de usar y más aplicable a mayor cantidad de problemas. El mantenimiento se facilita conuna buena documentación. El almacenamiento se refiere a la manera en que los programas se guardan para uso posterior. Antes del advenimiento de las computado- ras personales, no había formas simples de almacenar copias de trabajo de programas realizados.Loslistados de código, de hecho se guardaban, pero tenían que teclearse de nuevo para usos posteriores. Las cajasde tarjetas FIGURA 2.8 Disco flexible.
  • 54. 46 MÉTODOS NUMERICOSPARAINGENIEROS - perforadas se podían guardar, pero paraun programa decualquier mag- nitud resultaban difíciles de manejar y susceptibles a deteriorarse. Como se menciona al principio de este capítulo, los dispositivos de almacenamientomagnéticohanmejoradosustancialmente la habilidad de retener programas. Un dispositivocomún de almacenamiento esel disco flexible. mostrado en la figura 2.8. Los discos flexibles son un medio ba- rato para almacenar programas y datos. Aunque los discos flexibles tie- nen una granutilidad. también tienen algunas desventajas. Por unaparte, su tiempo de acceso es muy lento; por otra, se deben manejary se deben guardar con mucho cuidado. Dado que pueden borrarse muy fácilmen- te, siempre se debe teneruna copia de cada uno de ellos. Además,cuando se termina un programa de computadora, se debe imprimir inmediata- mente y almacenarlo con la documentación correspondiente. Estas im- presiones pueden ser útiles en el caso no deseado, peroposible, de que el disco y su copia se destruyan. 2.3 DESARROLLODE UN PROGRAMA PARA EL PROBLEMADELPARACAIDISTA Ahora se usará el material de las secciones previas para escribir un pro- grama en BASIC y en FORTRAN para el problema del paracaidista. Es- tos programas son un ejemplo ideal porque contienen todoslos elementos -entrada-salida, ciclos, decisiones, cálculos y subprogramas- que con- forman al programa en el resto del capítulo. Recuérdese que el problema del paracaidistaes equivalente ala solu- ción de la ecuación (l.12): r -7 donde v es la velocidad en un tiempo posterior v(tJ es la velo- cidad en el tiempo actual ti, g es la aceleración de la gravedad (igual a) 980 cms/s2, c es el coeficiente de rozamiento, m es la masa del para- caidista y At = ti+l - ti. El término entre corchetes es el valor actual del promedio de cambio de velocidad respecto al tiempo [Ec. (1.8)].Si se conoce la velocidad inicial del paracaidista v (ti)la ecuación (2.1)se pue- de resolverrepetidamenteparavalores de v(ti+J, como se hizo en el ejemplo l.2. Con esta información como antecedente, ahorase puede desarrollar un algoritmo para el problema. En este punto, se podría desarrollar un algoritmo bien detallado. Sin embargo, con la práctica que se tiene, difí- cilmente se podría. En lugar de ello, se empezará con una versión gene- ral simple, agregándole detalles poco a poco en forma secuencia1 para expandir la definición. Entonces, cuando se haya obtenido una versión
  • 55. LA PROGRAMACldN EN LAS COMPUTADORAS PERSONALES 47 FIGURA 2.9 Diagrama de fluio de un programa simple para el problema del paracaidista.
  • 56. 48 MÉTODOS NUMÉRICOS PARA INGENIEROS final. se puede proceder a escribir el programa. En programación. este método de iniciar en general e ir avanzando hacia lo específico se le co- noce como esquema de análisis descendente. Entre otras cosas. es efi- ciente porque,engeneralesmuchomás fácil eliminar errores si los algoritmos y los programas se escriben en pasos simples y se van verifi- cando conforme se avanza. Un algoritmo muy simple para realizar los cálculos del ejemplo 1.2 puede escribirse con palabras de la siguiente manera: introducir los da- tos. calcular la velocidad, imprimir la respuesta y repetir hasta quese hayan calculado tantos valores como seanecesario. Este algoritmose puede expresar de manera más formal con un diagrama de flujo. La figura 2.9 muestra un procedimiento detalladode la implementación de los cálculos. El diagramade flujo consiste de tres conjuntos de declaraciones: 1. Introducir variables y constantes 2. Inicializar todas las variables 3. Hacer unciclo iterativo que calcule e imprimalas respuestas Con base al diagrama de flujo, se puedeescribir ahora un programa. Las versiones en FORTRAN y BASIC se muestran en la figura 2.10.NÓ- tese que para laversicin en BASIC, se usan incrementos de 10 para eti- quetar los números de línea. Esto se hace para prever la posibilidad de T0=0 v0=0 H=Z t4=t 0 C = t 2 5 0 0 I M1681 O 0 T=TO 'V=v o U R I T E < 6 , I > T , V FORMAT(2( ' ' , F 1 0 . 3 > ) I=O T=T+H W R I T E ( 6 , l ) T , V I = I + t I F ! I . L T . H jC O T O2 0 0 S T O P EtiC) 2 0O 'V=V+C 98 O-C*V,'l'l >*H FIGURA 2.1O Programas FORTRAN y BASIC para el problema del paracaidista. Estos programasduplican los cálculosmanuales del ejemplo 1.2. . ". .
  • 57. LA PROGRAMAC16NEN LAS COMPUTADORASPERSONALES 49 insertar nuevas líneas de código en refinamiento subsecuentes del pro- grama. Aunque el ejercicio mencionado anteriormente ciertamentees un pro- grama válido para el problema del paracaidista, por ningún medio explo- ta todas las posibilidades de programación ni en FORTRAN ni en BASIC. Para demostrar como se pueden emplear líneas adicionales, para desa- rrollar una versión mejor, ahora se refinará el programa. Muchas de las modificaciones e insercionessiguientes representan una técnica de programación más eficiente y más sencilla de ejecutar.Sin embargo, cierto material se enfoca hacia propósitos didáctico5 para de- mostrar el uso de ciertasdeclaraciones. El siguiente análisis muestra directamente la versión en BASIC. Ya que losprogramas de la figura 2.11 están escritos en paralelo, es muy fácil extender el análisis a la versión FORTRAN. El programa dela figura 2.11 tiene nuevas características. Lasprinci- pales son: 1. 2. El programa calcula ahora la velocidadpara tres valores diferentes del coeficiente de rozamiento y de la masa. La habilidad de realizar cálculosrepetitivos es una delas ventajas de las computadoras. Dentro del diseño en ingeniería, a menudo esútil realizar una serie de cálcu- los varias veces con valores diferentesde los coeficientes para valorar la sensibilidad del modelo a estos cambios. Esto se hace en este caso, realizando los cálculosdel ejemplo 1.2con el coeficientede rozamiento variando 2 10%.De esta manera, los tres casos usados en el pro- grama son parael caso del coeficientede rozamiento original (12500 g/s), el coeficiente de rozamiento más el 10 por ciento (13750 g/s) y el coeficiente de rozamiento menos el 10 por ciento (11250 g/s). El cálculo repetitivo se lleva a cabo agregando un ciclo iterativo (lí- neas 3080 a la 3390).Cada vez que el programa pasa a través del ciclo, se usa un coeficiente de rozamiento diferente para calcular la velocidad. Nótese también que el coeficiente de rozamiento y la ma- sa se usan como variables con subindicesC(K) y M(K). Por lo tanto, se les asigna una dimensión en la línea 3040. El programa tiene ahora un esquema iterativomás preciso. Además de agregar el ciclomayor para los tres casos dec y de m (líneas3080 a la 3390),se han usado dos ciclos para calcular el valor actual de u. Se hace así porque pudiese ser que no se deseeimprimir una res- puesta después de cada paso. Esto seríaespecialmentecierto si se usara un paso muy pequeño, por ejemplo 0.01 S , para obtener resul- tados más exactos. Para calcular desde t = O hasta 20 S , se requeri- rían 20/0.01ó 2 O00 números. Ya que se requiereun valor para cada 2 S que esquemetice razonablementela caída del paracaidista, se han usado dos ciclos anidados de forma tal que el programa imprima re- sultados en tiempos intermedios.Un ciclo anidado es aquelciclo que
  • 58. 50 MÉTODOS NUMÉRICOS PARAINGENIEROS F C PRDCRRMR LEGIBLE RL USURRIO C DEL PARPCP,IDISTP. c En FDRTRBN p a s a EL PROBLEMQ C C CIVILEHCINEERIHC C CDLLECE STATION, TEXnS 77843 C c sc cuwRn c TEXPS a w UNIVERSITY ................................................C FUHCIOH PPlRP CRLCULURDV/DT ................................................DVDT(C.V,N)-980-C.V/M ................................................C PRDCRRMR PRINCIPRL ................................................ €UD ................................................C SUBRUTINR p a w IMPRIMIR EL ENCP,BEZPDO ................................................SUBRDUTIHE LRBEL VRITE(6, I > RETURN END I FORMIIT( '-':SDLUCION Paun LP, VELOCIDAD DE c a l w GEL PmmaIDIsTfi ................................................C SUBRUTINR PRWLEER DRTDS ................................................SUBROUTINE INPUT(TO,TI,VO,U,P> RERD <5.2>10 TIEMPO zHIclaL ( S E G ) (S.Z)TI TIEMPO FIHAL(SEG) VELDCIDRD INIClPL (CM/SEC> RD(S.2)VO RD<5 , 2 >H ~~ MRCNITUD DEL IHCREIEUTO (SEC) IMPRIME EL IHTERVPlLO ( S E C ) C C C C RE, REI RE! RERD(S , 2 )P 2 FORtlPIT<F 6 . 2 ) C VERIFICL LP, RPlCHITUD DEL IHCRENEHTO E IMPRIME EL IHTERVIILO IF <P.CE.W.IIND.P.NE.O> COTO 222U URIlE(6,3> 3 FDRNPIT('EL IWTERVLLD DESE SER MRVOR D IGURL P LO MPIGNITUD 22: *DELINCREMENTO Y NO PUEDEVPLER CERO') C C C 2 0 RETURN END ..............................................SUBRUTIN0 PRRR RERLIZRR CfiLCULOS ..............................................SUBRDUTIHE CILC(TO,T1,VO,H,P) REM. M DIMEHSIOU C < 2 O ) , l M Z O ) NC-IHT(P/HI DVOT(C.V,M)-SBO-C.Y~M HP-IHTl(Tl-TO>/P> DO 3370 K-1.20 REIID<S,4)C(K) IF (C<K).EP.O.) COTO 3390 REIID (S.4IJUK) CICLO PP,RR CRLCULRRV CDU DIFERENTES C Y M LEEELCOEFICIENTEDEFRICCIDU LEE LIImen 4 FOR11RT<FIO.O) VERIFICPIQUELR (1181 SE1 CERD I F ( ~ l K > . C T . O . O ) C O T D3220 S FORMRT('-','LR NASR DEBE SER M(IV0R PUE CERO', VRITE(6,5> COTO 3390 C INICIPLIZI( TIEMPO Y VELDCIDRD 3200 r-To 6 C C 3340 3360 1170 3390 v-vo VRITE(6.6) FDRIIPIT(, , , 4 Y , ' T tSEC>'.1OX,'V ( YRITE(6.7>T.V DO 31601-1,NP INPRIME E L CICLO CICLO DE CP,LCULD C O N T I k RETURN END CWSEC INTERVALO FIGURA 2.1 1 Versiones FORTRANy BASIC legibles al usuario del programa de la caída delparacaidista.
  • 59. LA PROGRAMACldNEN LAS COMPUTADORASPERSONALES 51 contiene otrodentro de sí mismo. En este ejemplo, el ciclointerno (líneas3320 a la 3350) realiza los cálculos usandoel tamaño de paso deseado (línea2100). Después de NC iteraciones de este ciclo (don- de NC se calcula internamenteen la línea 3050),se imprime una res- puesta. El procedimiento se repiteNP veces (donde NP se calcula internamenteen la línea 3060) mediante el cicloexterno (líneas3300 a la 3370). Nótesetambiénqueenvez de especificar elnúmerode pasos (N, especificado enla línea 130 enlasversionessimples de la figura 2.10), ahora sólo se introducenlostiemposinicial y final (lí- neas 2040 y 2060) y se usan las líneas 3050 y 3060 para determinar internamente el númeroapropiadode pasos. 3. El programa muestra ahora un esquemade etiquetado mbs descripti- vo.Se incluyen declaraciones de documentaciónal principio del pro- grama, los mensajes de salida, por ejemplo las líneas 1030 a la 1080 y las entradas más descriptivas, por ejemplo las líneas2040 a la 2130. 4. El programa está modularizado. Nótese que el programaconsiste de una serie de subrutinas que realizan tareas bien definidas. El progra- ma principal sirve como supervisor para dirigir cada una de las parte dentrode un esquema lógico. 5. Se incluyen los diagnósticos para indicaral usuario que Se ha cometi- do un error. Los diagnósticos son declaracionesenelprogramaque imprimenparaelusuario un mensajedescriptivo, siha ocurrido un error. Las líneas3160 a la 3210 representan un diagnóstico que veri- fica si la masa es cero.Si asífuese, la ecuación dela línea 210 realiza- ríaunadivisiónpor cero. Si lamasa es menor o igual a cero, la lines 3170 transfiere el control a la línea 3180, queimprimeel mensaje: LA MASA NO DEBE SER MENOR O IGUAL A CERO Deformasimilar,lalínea 2150 examinaque elintervalo de impre- sión sea mayorqueel tamaño del paso. Si no es así, se imprimen los mensajes de laslíneas 2170 a la 2190 y el programatransfiere el control a lalínea 2100 y pide un nuevo tamaño de paso. Las anteriores no son mas que cincode varias modificaciones quese han hecho para incrementar las capacidades del programa.Se debe verificar línea por línea para entender a fondo cómo contribuye cada una de las declaraciones enel programa total. Lafigura 2.12 muestrauna corrida. En esta figura se introduce un error intencionalmente enelintervalo de impresión para demostrar lascapacidadesde diagnósticos del programa. El análisis deestas corridas junto conla figura 2.11 deben sugerir algunas alternativas para empezar a obtener resultados claros y con un esquema descriptivo.
  • 60. 52 MÉTODOS NUMERICOS PARA INGENIEROS FIGURA 2.1 2 2.4 Texas A&MUnwerstty Depto Ingentería Cwl College Stahon. Texas 77843 DESCRlPClON Este programa calcula la velocidad vertical de caída de un paracatdtsta en functón del tiempo REQUISITOSESPECIALES: Se pueden usar hasta 20 coeficientes diferentes de rozamiento REQUISITOSESPECIALES- y masas para calcular la uelocldad REFERENCIA Métodos numértcos para Ingenieros con dphcaciones en computadoras personales, 1986 (Mc-Graw-Hill. México),Cap 2 SOLUCION PARA LA VELOCIDAD Dt CAlCA DEL PARACAIDISTA MASS IGI-68100 TIEMPOINICIAL lSEG1 10 TILMPOR FINAL (SEGI 123 TISECIVICMISECI O O 7 1 w n VFLOCIOADINICIALICMlSEGl 456 MAGNITUD DEL INCREMENTO 32 IMPRIME EL INTERVALOISEGI = 3 EL (NTERVALO NO DEBE SER MAYOR O IGUAL QUE LA MAGNITUD DEL INCREMENTO Y N O DEBE VALER CERO MAGNITUD DEL INCREMENTO - 8 IMPRIME EL INTERVALOSEGI = 26 COEFICIENTE DE FRlCClONIG'SEGI TECLEA UN CERO) 65 (PARA TERMINAR EL CALCULO MASAIGI = 23 TlSEGlVICMiSLGl TISECIVlCMlSECl O 0 2 1960 6 382516572 4312851689 10 4488 10732 14 472373869 164776.20838 18 4807 48987 20 4826 13934 8 4240 49528 12 463572918 DRAGCOEFFICIENTEIG.SECI ENTERLEROi=12500 IT0 TERMINATE COMPUTATION 4 6 8 10 12 14 16 20 18 3%;4699 4482 42869 4796 89686 4995 92151 5201 60276 5121 88278 5252 05696 5283 98906 3985 55437 DRAGCOEFFICIENT(GlSECl I T 0 TERMINATE COMPUTATION ENTER ZERO1= 11250 MASSIGI= 68100 TlSEClVICMiSECI O O 2 1960 4327242291 6 4151.22591 6 4739.6755 105133.70342 12 14 5397 5459 5574 21 576 16 569251452 20 185771 72778 5824.76927 DRAGCOEFFICIENTIGISECI ENTER ZERO1= O (TO TERMINATE COMPUTATION Documentación del orograma legible al usuario del problema del paracaidista, incluye corrtda del programa. ESTRATEGIAS DE PROGRAMACIóN Este librobrindaalestudiosodiversos medios, decálculoconel fin de convertirlateoríade los métodosnuméricos en herramientasprácticas para la soluci6n de problemas de ingeniería,Estos medios incluyen 1) discos
  • 61. LA PROGRAMACldNEN LAS COMPUTADORASPERSONALES 53 queguardan a losprogramas, 2) programas, 3) algoritmos y 4) diagra- mas de flujo. El propósito de esta sección es eldedescubrir la forma en que cada una de estos medios complementa a los otros a lo largo del li- bro. Laestrategiaglobal se ilustraenlafigura 2.13. Tal vezal comprar este libroel lector también adquirió un disco para computadora. A este disco se le conocerá con el nombredeNUMERI- COMP, correrásobreunacomputadora IBM-PC (o cualquiercompati- ble) o sobre una APPLE 11. El disco contiene seisprogramasescritosen BASIC: bisección, eliminación Gaussiana, regresión lineal, interpolación Meta: Resolver los problemas de ingenieríausando una computadora y los métodos numéricos FIGURA 2.13 Estrategia empleada en el texto para integrar las computadoras personales y los métodosnuméricos en la solución deproblemasde ingeniería.
  • 62. 54 MÉTODOS NUM~RICOSPARA INGENIEROS de Lagrange, regla trapezoidal y el método de Euler. Los programas re- presentan una colección de métodos numéricos simples, pero muy úti!es para cada una de las partes de este libro. Con muy poca preparación puede usarse NUMERICOMP para la solución de problemas. Esto se debe prin- cipalmente a que los programasestánescritos en un lenguajelegible y claro, además que proporciona todala información necesaria para su ope- ración. Ademásdetener utilidad inmediata, el disco ofrece un ejemplo concreto de programasbienescritosquesepueden usar como modelo para programas escritos porel usuario. Finalmente,los programas se pue- denusarparaverificarlaexactitudde los resultados en los esfuerzosde programacióndelusuario. Cada unode los programas se ilustra completamente enel capítulo que le corresponde dentro del libro.Las ilustraciones muestran talcomo se veríanenunapantalla, los datosque se requieren, los resultados de los cálculosy una gráfica de los resultados. Estas ilustracionesse generan usando NUMERICOMP en la solución de un problema determinado.Se incluyen algunos ejercicios en cada unode los capítulos para reforzar la habilidad en el manejo de los discos del usuario en su propia computadora. Se danloscódigosdeambas versiones. FORTRAN y BASIC para los mismos métodos. Estosprogramascontienen los algoritmosfunda- mentales con esquemas simples de entrada y salida de datos y con poca documentación. Por lo que no son muy claros ensu exposición. Una de las tareas será la de modificar estos programas de forma tal que sean un poco más claros, usando los recursos y la técnica individual de cada pro- gramador. Una vez que esto se haya llevadoa cabo, se tendrá unaherra- mientaque se aproximará a los programassuplementarios. Los seis programas del disco NUMERICOMP son para los métodos básicos de cada una de las partesdellibro. No son, necesariamente los más eficientescomputacionalmente hablando sobrelos existentes. Por lo tanto se han incluido diagramasde flujo o algoritmos parala mayor parte de los otros métodos numéricos del libro. Se puedenusarestosdiagra- mas y algoritmos con la destrezade programación propia del usuario, para escribirprogramasdecualquierotrode los métodos expuestos. EJEMPLO 2.1 Gráficas por computadora Enunciado del problema: el propósito de este ejemplo es el defamiliari- zarse con los programas opcionalesNUMERICOMP disponibles con el texto FIGURA 2.14 a) Título de los programas NUMERICOMP que acompañan al texto. b) Menúprincipal de NUMERICOMP. c) Menúpara BISECCION,d) La pantalla muestra cómo se introduce una función para BISECCION; la función en estecaso es la ecuación (1.9), que calcula la velocidad de caída del paracaidista.e) La pantalla muestra unagráfica de la velocidad contra el tiempopara el paracaidista, como lo calcula NUMERICOMP.
  • 63. LA PROGRAMAC16NEN LAS COMPUTADORASPERSONALES 55 FIGURE 2.14
  • 64. 56 MoODOS NUMERICOS PARA INGENIEROS y usar las capacidadesgráficas de NUMERICOMP para trazarfunciones. Si el libro se compró sin estos programas, entonces se deben buscar for- maspararealizar tareas similaressobre la computadora.Esto se puede llevar a cabo con la ayuda de los programas dados porel sistema o pue- de requerirse que se desarrollen los propios. La habilidad en el trazo de funciones es muy importante ya que la forma de resolver un prob!zma de métodos numéricos se facilita mucho cuando se usa en coordinación congráficaspor computadora. Solución: insértese el discoNUMERICOMPen launidad de discos y córrase el programa de acuerdoa las instrucciones delManual del usuario. La pantalla debe producir un esquema similar al de lafigura 1.14~1. Simplemente es la presentación del programa. Tecléese RETURN para continuar. La pantalla debe mostrar ahora un menú de selección princi- pal como se muestraenlafigura 2.14b.El menú contiene unalista de seisprogramasincluyendounaopción que termina la sesión. Se usará cada uno de estos programas en el momento apropiado dentro del libro, cuando se haya visto previamentela teoría de cada uno de los métodos. Por ahorase usará 19 opción de grdficas por computadora dentro delpro- grama de BISECCION para gráficarla velocidad del paracaidista entun- ción del ti9mpo. Para hacerlo, simplemente se introduce el programa de BISECCION mediante laopción 1.La pantalla, automáticamentedebe mostrar un patrón similar al de la figura 2.14~después de algunos movi- mientos del disco.Sólo se requieren usar lasopciones 1, 3 y 4 para grafi- car funciones. Selecciónese la opción 1 para introducir la función usando la ecuación (1.9) con m = 68 100g, c = 12 500 g/s y g = 980 cm/s (Fig. 2.14d). Regrésese al menúprincipal y escójase laopción 3 para graficarla función. Antesde trazar la gráficase deben dar valores mínimo y máximo para x y paraf(x) que corresponden al tiempo y a la veloci- daden este caso. Los valorespara x y f ( x ) estándadospordefinición enlaprimer columna (en este caso son cero). Pruébense variosvalores para los ejes x y paraf(x) (incluyendo valores negativos) para familiari- zarse con el diseño y operaci6n de la opción de graficación. Enlafigura 2.14e se muestraunagráficaquemuestrael esquema de lavelocidad como funcióndeltiempo. La opción de graficación dada por este programa tendrá muchosotros usos para visualizar mejor los resultados de la aplicación de los métodos numéricos y la computación enla solucióndeproblemasdeingeniería. Estosusos se exploran en las secciones subsecuentesdel texto. PROBLEMAS 2.1 Escríbanselasdeclaraciones BASIC y FORTRAN equivalentesa cada una de las siguientesexpresiones:
  • 65. LA PROGRAMACldN EN LAS COMPUTADORAS PERSONALES 57 2.2 2.3 2.4 2.5 xlsenl -b - -x - 1 2a b) y=- c) x = I) Si A y Z tienen elmismo signo, entonces reemplácese 2 por Q. Escríbanse las declaracionesBASIC y FORTRAN para realizar la siguienteoperación S = 2 xi2 Para i = 3, 6, 9,. . ., 21. Dado el siguienteprograma 10 A = 10.1 20 B = 3.1416 30 Z = 1.1 40 PRINT X1 ¿Cuál será elresultado que se imprima, si se insertanlassiguientes expresiones entre las líneas 30 y 40? a) 35 X1 = A"Z/B b) 35 X1 = A' (Z/B) cj 35 X1 = A'B - B**B/Z + 2'2 d) 35 X1 = ((A'Z) - B/Z)'*Z)/(B - Z) e) 32 J = INT(A* *Z/B - 2) 36 X1 = J'A Dado el programadelproblema 2.3, escríbase el código de la línea 35 que eva- luarálassiguientes expresiones algebraicas: a' - 4 6 x1 = 2 7 XI = a - d z / 5 + 6(a + 2)2'3 - - b La figura para este problema muestra la página de una bitácora de un automóvil. Cada renglón representa una visita a la gasolinera en la que el tanque se llena de gasolina. La página tiene, además columnas para la fecha, el kilometraje mar- cado porel odómetro, la cantidad de gasolina y su costo. Escríbase un programa, diseñado de forma tal que acepte datos de entrada bajo este esquema y calcule los kilómetros recorridos por litro y el costo por ki16- metro de acuerdo a cada intervalo entre llenado y llenado. Debe imprimir una tabla con tres columnas que conforman la fecha, los kilómetros por litroy el costo por litro.
  • 66. 58 MÉTODOSNUMÉRICOS PARA INGENIEROS FIGURADELPROBLEMA 2.5 2.6 Se invierteunacantidaddedinero P en una cuenta cuyos intereses se reinvierten alfinaldel periodo. El monto futuro F, conuna tasa deinterés i después de n periodos se puede determinarfácilmentecon la fórmula siguiente: F = P (1 + i)" Escríbase un programa que calcule el monto futurodeuna inversión. Los datos de entrada deben incluirla cantidadinicial P,la tasa de interés i (como fracción decimal), y el número de a6os n para los cuales se va a calcular el monto futuro. La salida debe incluir también estos valores. Incluyendo, en forma de tablael monto futuro para cada uno de los años, hasta el n-ésimo año. Correr el programa para P = $ 1 000.00, i = 0.1 y n = 20 años. 2.7 Escríbase un programa para calcularlas raíces reales de la ecuación cuadrática ax' + bx + c = O donde a, b y c son coeficientes reales. La fórmulaparacalcular las raíces es la fórmulacuadrática
  • 67. LA PROGRAMAC16NEN LAS COMPUTADORASPERSONALES 59 -b f X = 2a Nótese que sila cantidad dentro del signo de laraíz cuadrada es negativa enton- ces las raíces son complejas. También ocurre una división por cero si a = O. Disé- ñese el programa de forma tal que contemple estas contingencias imprimiendo un mensaje de error. También, inclúyasealgo de documentación a lo largodel programa y etiquétense las salidaspara hacer el programalegible. Repítanse los cálculos paravalores diferentes de a, b y c, tantas veces como elusuario desee. Efectúense pruebas para los casos: a) a = l b = 4 c = 2 b) a = O b = -4 c = 2.3 c) a = l h = 2- c = 2.3 2.8 La función exponencial e"se puedeevaluarmediante la serieinfinita: Escribase un programa para implementar esta fórmula que calcule los valores ex agregando un término cada vez a la serie. En otras palabras, calcúlese e impríma- se la secuencia ex = 1 e x = l + x e X = l + x + - X* 2 hasta la orden de término prefijado. Para cada caso, calcúlese el porcentaje de errorrelativo dado por % error = solución real - solución aproximada soluciónreal 100% Utilícese la funcióndebibliotecaparacalcular exy determinar la"solución real". El progrma debe imprimir la solución aproximada y el error en cada paso. Se pue- de emplear una función definida porel usuario para calcular el error. y usar ciclos para simplificar los cálculos tanto como sea posible. Para probarlo, utilicese el pro- grama para calcular exp(0.5) desde elprimer término de la serie hasta el término x2"/20!. Interprétense los resultados. 2.9 En economía se dispone de fórmulasparacalcular los pagos anuales debidos a un préstamo. Supóngase que se desea pedir un préstamo de Ppesos para pagar- lo en n pagos anuales con una tasa de interés ¡. La fórmula para calcular el pago anual, A, es. A1 = P i(1 + i)" (1 + i)" - 1
  • 68. 60 METODOS NUMERICOSPARA INGENIEROS Escríbase un programa para calcular A,. Pruébese con P = $10 O00 y una tasa de interés del20 por ciento. (i = 0.20).Hágase el programa detal forma quese puedan evaluar tantosvalores de n como se desee. Calcúlenselos resultados para n = 1, 2, 3, 4 y 5. 2.10 Junto con los cálculos de los pagos anuales por préstamos, como se hizo en el problema 2.9, las fórmulas de economía se puedenemplear para determinar los pagos anuales correspondientes a otros tipos de flujo de efectivo. Por ejemplo, supóngase que existe un gasto que crece de manera uniforme a un promedio G conforme avanza el tiempo. A estos pagosse les conoce como series degradiente aritméticas. La fórmula de economía que calcula un pago anual equivalente para este tipo de flujo de efectivo es n 1Ahora, supóngase que se pide un préstamo de P = $10 O00 con un interés del 20% (i = 0.20)y se compra un nuevo sistema de cómputo. El costo de manteni- miento de la computadora crece de acuerdoa la serie de gradiente aritmética con unatasa de G = $50/año/año. Junto con estos dos costos (esto es, flujos de efectivo negativos para los pagos del préstamoy del mantenimiento),también se obtendrán beneficios o flujos de efectivo positivos con el uso del sistema.El apro- vechamiento en consulta y el uso de la computadora se pueden tasar conun valor anual de A, = $4 000. Por lo tanto, el valor neto A, como propietario de la má- quina sobre una base anual, se puede calcular como beneficios menos costos, o A N = AB- A, - A2 Por lo tanto, si A, es positivo, la computadora está generando ganancias sobre una base anual. Si A, es negativo, se está perdiendo dinero. Desarróllese, rastréese,pruébese y documéntese un programa que calcule ANEl programa se debe diseñar de tal forma que el usuario pueda introducir co- mo datos las variables P, i, G, A, y n. Úsese el programa para estimar A, con el nuevo sistema de cómputo para n = 1,2, 3, 4 y 5. Esto es, evalúense las ga- nancias si el sistema se posee de l a 5 años. Grafíquese AN contra n (si es posi- ble se puedeusar la computadora para hacerla gráfica). Determíneseel plazo que se debe poseerel sistema para empezara ganar dinero. (Nota:la información adi- cional para este problema se puede obtener del primer caso del capítulo 6). 2.11 Impleméntese el programa de la figura 2.11.Efectúense las modificaciones nece- sarias de tal forma que sea compatible conel lenguaje usado enla computadora. Una vez que el programa se encuentre en la computadora, pruébese duplicando los cálculos de la figura 2.12.Repítanse los cálculos con pasos de tamaño1y 0.5. Compárense los resultados con la solución analítica obtenida anteriormente en el ejemplo 1.1.?.Mejorano empeoran los resultados al hacer el tamaño del pasomás pequeño?. Explíquense los resultados. 2.12 El siguiente algoritmo está diseñado para determinarla calificación final de un cur- so, que consiste en exámenes parciales. tareas y examenfinal: Paso 1: Introducir el número del curso y el nombre. Paso 2: Introducir los factores de peso: para exámenes parciales REP) para ta- reas (PT) y para el examen final (PEF)
  • 69. LA PROGRAMACl6NEN LAS COMPUTADORASPERSONALES if)Zfji3fi51*1 Paso 3: Paso 4: Paso 5: Paso 6: Paso 7: Paso 8: Paso 9: Paso 10: Paso 11: Introducir las calificaciones de los exámenes parciales y determinar la calificación promedio (CEP). Introducir las calificacionesde las tareas y determinar la calificación pro- medio (CT) . Si ésta esla última calificación, ir al paso 8;de otra manera, continuar. Determinar la calificación promedio (CP) mediante PEP CEP + PT * CT PEP PT CP = Ir al paso 10. Introducir la calificación del examen final (CEF). Determinar la calificación promedio (CP) mediante PEP CEP + PT CT + (PEF) (CEF) PEP + PT + (PEF) CP = Imprimir el número del curso, nombre y calificación promedio Detener los cálculos. a) Escríbaseun programa basado en este algoritmo b) Rastréese y pruébese usando los datos: PEP = 35;PT = 25; PEF = 40; Exá- menesparciales = 100, 98, 83, 76, 100; tareas = 96, 94, 83, 100, 77, y examen final = 88. c) Prepárese una pequeña documentación para el programa. 2.13 La figura para este problema muestra el reverso de una hoja de estado de cuenta de cheques. El banco ha elaborado esta hoja para ayudar en el balance de una cuenta de cheques.Si se observa bien, se podr6realizar un algoritmo. Desarrólle- se, rastréesey documéntese un programa que obtengael saldo actual dela cuen- ta de cheques basado en el esquema de la figura. Se pueden usar los números de la figura para probar el programa. 2.14 Escríbase, rastréese y documéntese un programaquedetermine las estadísticas del deporte preferido. Escójase cualquiera desde futbol hasta el lanzamiento de bolos. Si el lector practica deportes eninteriores elabórese uno para el propio equipo. Diséñese el programa de forma tal que sea legible y muestre información intere- sante a cualquiera (por ejemplo,al entrenador o jugador) que pueda usarse para evaluar el rendimiento de los jugadores. 2.15 Úsese la opción de graficación del programa BISECCIÓN (en el disco NUMERI- COMP) para trazar varias funciones de cualquiertipo. Pruébense funciones poli- nominales y trascendentes cuyo comportamiento sea difícil de visualizar antes de graficarlas. Úsense varias alternativas para ambos ejesx y y para facilitar la explo- ración. Háganse copias permanentes de los trazos si se tiene una impresora. 2.16 Se debe lograr la capacldad de graticar funciones de una forma parecida a como lo hace el programa BISECCIÓN. Prográmese la computadora de una manera apropiada para lograrlo. Si la computadora no tiene un sistema operativo cuyos programas puedan ayudar, entonces se deben escribir, usando las capacidades de la misma. ?.
  • 70. 62 METODOS NUMÉRICOSPARAINGENIEROS EL ÁREA DE ABAJO SE PROPORCIONA PARAAYUDAR EN EL SALDODEL TALONARlO CHEQUESPORCOBRAR NO CARGADOSALESTADODE CUENTA 4 58 O050466 IS4446S 329464 74I4463 O015046 I 33134 60 685 ~ FIGURADELPROBLEMA 2.13 MES Abrl I I p ~ SALDO NUEVO COMO SE MUESTRA EN 643.S4 ESTEESTADODECUENTA SUMA DEPóSITOSQUE NO 250.00 CUENTA ESTANEN ESTEESTADODE 22. IS TorAL S RESTA TOTAL DE CHEQUES POR COBRAR SALDO DEL TALONARIO 600.52 DESPUÉS DERESTARLA CARGADESERVICIODEL MES ACTUAL Y SUMAR LOS INTERESESDEVENGADOS ( s b l o LASCUENTAS AFAVORDELSALDO El programa se debe guardar en un disco de memoria magnética. Documéntese este programa después de rastrearlo y examinarlo cuidadosamente. Déjese listo para poder modificarlo de acuerdo a los requisitos del libro, conforme se avance 2.17 Apréndase la manera de hacer copias permanentes de las gráficas del problema 2.16 si se Tiene una impresora.
  • 71. C A P í T U L O T R E S APROXIMACIONES Y ERRORES Debido a que la mayor parte de los métodos expuestos en este libro son muy claros en su descripción y en sus aplicaciones, resulta tentador en este momento ir directamente al cuerpo principal del texto y averiguar el uso de estastécnicas. Sin embargo, ya que los errores son parte intrín- seca en el entendimiento y uso efectivo de los métodos numéricos, se ha escogido este capítulo para desarrollar este tema. La importancia de los errores se menciona por primeravez con el pro- blema delparacaidista, en el capítulo 1. Recuérdesequesedeterminó la velocidad de caída del paracaidista analítica y numéricamente. Aun- que con la técnica numérica se obtuvo una solución cercana a la real (la analítica), hubo cierta discrepanciao error, debido aq1.le los métodos nu- méricosson sólo una aproximación. La mayor parte de las técnicas desarrolladas en este libro tienen la característica de poseer errores. Esto puede parecer contradictorio a pri- mera vistaya que no coincidecon la imagen que setiene de un buen mecanismo de ingeniería. Los estudiantes y pasantes deingeniería luchan constantemente para limitar este tipo de errores en sus trabajos. Cuando hacen un examen o realizan tareas, son sancionados mas no premiados por sus errores. En la práctica profesional, los errores pueden resultar cos- tosos y en algunas ocasiones catastróficos.Se puede perder hasta la vida si una estructura o un dispositivo llega a fallar. Aunque la perfección es una meta digna de alabarse, es difícil,si no imposible, alcanzarla. Por ejemplo, a pesar de que el modelo obtenido mediante la segunda ley de Newton es una aproximación excelente. en la práctica jamás predecirá exactamente la caída del paracaidista. Algunos fenómenos, tales como la velocidad del viento y alguna pequena variación en la resistencia del airecambiarán totalmente la predicción,Si estas desvia- ciones se comportan bajo un patrón constante ya sea subiendo o bajando. bastará con formular un nuevo modelo. Sin embargo, si su distribución es aleatoria pero se agrupamuy próxima alrededor de la predicción, entonces las desviaciones pueden calificarse como insignificantes y el modelo nueva- mente se considerará adecuado. Las aproximaciones numéricas pueden in-
  • 72. 64 MÉTODOS NUMÉRICOS PARA INGENIEROS 3.1 troducirerroressimilaresenelanálisis.Nuevamentelapregunta es: ¿qué errorpuedeconsiderarsetolerable? Estecapítulocubrevariosaspectosqueidentifican,cuantifican y mini- mizan estoserrores. Enlasprimeras secciones se revisalainformación referente a lacuantificacióndeloserrores.Enseguidaseestudiandosde los erroresmás comunes: errores de redondeo y erroresdetruncamiento. Los errores de redondeose deben a que la computadorasólo puede repre- sentarcantidadescon un númerofinito dedígitos. Los errores de trunca- miento representanladiferenciaentreunaformulaciónmatemáticaexacta de un problema y la aproximación dada por un método numérico. Final- mente, se discuten los errores sin relacionarloscon ningún método nu- mérico en especial. Incluyendoerrorespor equivocación, erroresen la formulacióndemodelos y la incertidumbre enla obtención de datos. CIFRAS SIGNIFICATIVAS En este libro se analizan casi exclusivamente aproximaciones que se relacio- nanconel manejo de números. En consecuencia, antesde discutir los erro- res asociados con los métodos numéricos, esútil repasar algunosconceptos básicos referentes a la representación aproximada de los números mismos. Cuando seemplea un número en un cálculo, debehaberseguridad quepuedausarseconconfianza.Por ejemplo, la figura 3.1 muestra un velocímetro y el odómetro (contador de kilometraje) deun automóvil. Con un simple vistazo al velocímetro puede verse que el automóvil viajaa una velocidadcomprendidaentre 48 y 49 km/h. Ya que la flecha está más FIGURA 3.1 El velocímetro y el odómetro de un automóvil ilustranel concepto de ci- fras significativas.
  • 73. APROXIMACIONES Y ERRORES 65 alládelamitaddelas marcasdelindicador, se puedeasegurarque el automóvil viaja aproximadamentea 49 km/h. Este resultado casies verí- dico ya que dos o más lecturas individualesal indicador llevana la misma conclusión. Sin embargo, supóngase que se desea obtener una cifra de- cimal más en la estimación de la velocidad. En este caso, alguien puede decir48.7, mientras que otro podrá decir48.8 km/h. Por lo tanto, debi- do a los límites del instrumento, únicamente se pueden usar dos dígitos con confianza. Las estimacionesdeltercerdígito (o más) sólo se pueden calcu- lar someramente. Seríaridículo afiimar, con base al velocímetro, que el auto- móvil está viajandoa una velocidad de 48. 764 213 8 km/h. En contraste, el odómetro muestra hasta seis dígitos confiables. De la figura 3.1 se puede concluir que el automóvil ha recorridoun poco menos de87 324.5 km du- rante su uso. En este caso el séptimo dígito (y los siguientes) sedesconocen. El concepto de cifras o digitos significatiuos se hadesarrolladopara designar formalmentela confiabilidadde un valor numérico. El número decifrassignificativas es el númerodedígitos,más un dígitoestimado que se puedausarconconfianza.Por ejemplo, el velocímetro y el odó- metro de lafigura 3.1 estimanhastatres y sietecifrassignificativas res- pectivamente.Los ceros no siempre son cifras significativas ya que pueden usarsesóloparaubicar el puntodecimal. Los números 0.000018 45 0.000184 5 0.001 845 tienen cuatro cifras significativas. Cuando se incluyen ceros en números muy grandes, no se ve clarocuantos ceros sonsignificativos, sies que los hay. Por ejemplo, enelvalor nominal, el número 45 300 puede tener tres, cuatro o cincodígitossignificativos,dependiendo si los ce- ros se conocen conexactitud.Laincertidumbre se puede desechar usandolanotacióncientífica en donde 4.53 X lo4, 4.530 X lo4 y 4.530 O x lo4 muestranque el númerotiene tres, cuatro y cin- co cifrassignificativas. El concepto decifrassignificativastienedosimplicacionesimportan- tes enel estudio de los métodosnuméricos. 1. Como sedijoenelproblemadelparacaidista, los métodosnuméri- cos obtienenresultadosaproximados.Por lo tanto, se deben desa- rrollarcriteriosparaespecificarquétanprecisosson los resultados obtenidos.Una manera de hacerlo esen términos de cifras significati- vas. Por ejemplo, se puede decidir que la aproximación es aceptable siempre y cuando sea correcta hasta cuatro cifras significativas -es- to es, debeexistirseguridadquelasprimerascuatrocifrasson co- rrectas.
  • 74. 66 MÉTODOS NUMÉRICOS PARAINGENIEROS 2. Aunque ciertas cantidades tales como T , e, o firepresentan números específicos, no se pueden expresar exactamente conun número fini- to de dígitos. Por ejemplo, el número T es igual a 3.141 592 653 589 793 238 462 643 . hasta el infinito. Debido a que las computadoras personales sólo re- tienen aproximadamente diez cifras significativas(comúnmentevarían entre 7 y 14, como se puede ver en el cuadro 2.l),tales números jamás se podrán representar exactamente. A la omisión del resto de cifrassignificativas se le conoce como error de redondeo. Los erroresde redondeoy el uso de cifras significativaspara expresar la exactitud de un número se estudian con más detalle en las siguientes secciones. Además, el concepto de cifrassignificativas tiene mucha im- portancia en la definición de exactitud y precisión en la siguiente sección. 3.2 EXACTITUD Y PRECISIóN Los errores asociados con loscálculos y medidas se pueden caracterizar observando SU precisión y exactitud. La precisión se refiere a 1)el núme- ro de cifras significativas que representan una cantidad o 2) la extensión en las lecturas repetidas de un instrumento que mide alguna propiedad física. La exactitud se refiere a la aproximación de un número o de una medida alvalor verdadero que se supone representa. Estos conceptos se pueden ilustrar gráficamente usando una analo- gía con un buen tirador al blanco. Los agujeros en el centro del tiro al blanco de cada esquema de la figura 3.2 se pueden imaginar como las predicciones en una técnica numérica, mientras que el centro del blanco de cada esquema representala verdad. La inexactitud (conocida también como sesgo)se define como un alejamiento sistemático de la verdad. Por lo tanto, aunque las balas en la figura 3 . 2 ~están más juntas que las de la figura 3.2~1,los dos casos son igualmente inexactos ya que ambos se centran en la esquina superior izquierda del blanco. La precisión, por el otro lado se refiere a la magnitud del esparcimiento de las balas. Por lo tanto, aunque las figuras 3.2b y 3.2d son igualmente exactas (esto es. igualmente centradas respectoal blanco), la última es más precisaya que las balasestán en un grupo más compacto. Los métodos numéricos deben ser lo suficientemente exactos o sin sesgos paraque cumplan los requisitos de un problemaparticular de inge- niería. También deben ser lo suficientemente precisos para el diseño en la ingeniería. En este libro se usa el término error para representarla ine- xactitud y la imprecisión de las predicciones. Con estos conceptos como antecedentes, ahora se puedendiscutir los factores que contribuyen al error en los cálculos numéricos.
  • 75. APROXIMACIONESY ERRORES 67 FIGURA 3.2 Un ejemplo de un buentirador ilustrael conceptode exactitud y preci- sión. o) Inexacto e impreciso; b) exacto e impreciso;c) inexacto y preci- so; d) exacto y preciso. 3.3 DEFINICIONES DE ERROR Los errores numéricos se generan conel uso de aproximaciones para re- representar las operaciones y cantidades matemáticas.Estos incluyen erro- resdetruncamiento, que resultan de representar aproximadamente un procedimiento matemático exacto, y los errores de redondeo, que resul- tan de representar aproximadamente números exactos. Para los dos ti- posdeerrores, la relación entre el resultadoexacto o verdadero y el aproximado está dada por Valor verdadero = valor aproximado + error [3.11 reordenando la ecuación (3.l),se encuentra queel error numérico es igual a la diferenciaentre el valor verdadero y el valor aproximado, esto es E, = valor verdadero - valoraproximado D.21
  • 76. 68 MgTODOS NUMeRICOSPARA INGENIEROS EJEMPLO 3.1 Cálculo de errores Enunciado del problema: supóngase que se tiene que medir la longitud de un puente y de un remache, obteniéndose 9 999 y 9 cm, respectiva- mente. Silos valores verdaderos son10 O00 y 10 cm, calcúlesea) el error y b) el errorrelativoporcentual de cada caso. Solución: a) Elerrorenlamedicióndel puentees [Ec. (3.2)] E, = 10 O00 - 9999 = 1 cm y parael remache es de E,= 1 0 - 9 = l c m b) El errorrelativoporcentualparaelpuenteesde [Ec. (3.3)] 1 E” = 100% = 0.01 % 10 O00 y parael remache esde €, = -100% = 10% 10 Por lo tanto, aunqueambasmedidastienen un error de 1 cm, elerror relativoporcentual del remache esmuchomás grande. Se puede con- cluir que se ha hecho un buen trabajo enlamedidadel puente, mientras que la estimaciónpara el remache dejamuchoque desear. donde E, se usapara denotar elvalor exacto delerror. Se incluyeel subíndice v paradar a entenderquesetratadel“verdadero”error.Como ya se mencionó brevemente, esto contrastacon los otros casos, donde se debeemplearunaestimación“aproximada” del error. Un defecto en esta definición es que no toma en consideración el or- dendemagnituddelvalorqueseestáprobando.Por ejemplo, un error de un centímetroesmuchomássignificativo si seestámidiendo un re- mache que un puente. Una manera de medir las magnitudes de lascanti- dadesque se estánevaluandoesnormalizarelerrorrespecto al valor verdadero. como en Errorrelativofracciona1 = error valorverdadero
  • 77. APROXIMACIONES Y ERRORES 69 donde, como ya se dijo en la ecuación (3.2)error = valor verdadero - valor aproximado. El error relativo también se puede multiplicar por el 100%para expresarlo como error verdadero valor verdadero E , = 100% donde E, denota el error relatioo porcentual. Nótese que en las ecuaciones (3.2)y (3.3)E y E tienen un subíndice u que significa la normalización del error al valor verdadero. En el ejemplo 3.1, se utilizó el valor verdadero. Sin embargo, en las situaciones realeses a veces difícil contar con tal infornación. Para los métodos numéricos, elvalor verdadero únicamente se conocerá cuando se habla de funciones que se puedan resolver analíticamente. Porlo general este seráel.casocuando se estudie el comportamiento teórico de una técnica en particular. Sin em- bargo, en aplicaciones reales, obviamente no se conocela respuesta verda- dera a priori. En estos casos, normalizar el error es una alternativa, usando la mejor estimación posible del valor verdadero, esto es, a la aproximación misma, como error aproximado valor aproximado €a = 100% donde el subíndice a significa que el error está normalizado a un valor aproximado. Nótese también que en aplicaciones reales, la ecuación (3.2) no sepuede usar para calcularel término del error para la ecuación (3.4).Uno de los retos a que se enfrentan los métodos numéricos es el de determinar estimaciones del error en ausencia de conocimiento delos valores verda- deros. Por ejemplo, ciertos métodos numéricosusan un esquema iterati- uo para calcular resultados. En tales esquemas, sehace una aproximación en base a la aproximación anterior. Este proceso se repite varias veces, o de forma iterativa, para calcular sucesivamente más y mejores aproxi- maciones. En tales casos, el error a menudose calcula como la diferencia entre la aproximación previa y la actual. Por lo tanto, el error relativo por- centual está dado por €a = aproximaciónactual - aproximación previa aproximación actual 100% [3.5] - En capítulos posteriores se explicarán con detalle éstey otros esquemas para expresar errores. El signo de las ecuaciones (3.2)hasta la (3.5)puede ser positivo o negativo. Si la aproximación es mayor que el valor verdadero (o la apro- ximación previa es mayor quela aproximación actual),el error es negati- vo; si la aproximación es menor que el valor verdadero, el error es positivo. También, en las ecuaciones (3.2)a la (3.5),el denominador puede ser
  • 78. 70 METODOS NUMÉRICOS PARA INGENIEROS menor de cero, lo que puedellevar a un error negativo. A menudo. cuando se realizan cálculos, puede noimportar mucho el signo del error sinomás bien que su valor absoluto sea menor que una tolerancia prefijada E,. Por lo tanto, a menudo es útil emplear el valor absoluto de las ecuaciones (3.2)a la (3.5).En tales casos, los cálculos se repiten hasta que Si se cumple la relación anterior, entonces se considera que el resultado obtenidoestádentrodel nivel aceptable, fijado previamente, E,. Es también conveniente enfocar estos erroreshacia el número de ci- fras significativas en la aproximación. Se puede demostrar (Scarborough. 1966)que si el siguiente criterio se cumple, puede tenerse la seguridad que el resultado es correcto en al menos n cifrassignificativas. [3.7] EJEMPLO 3.2 Estimación del error para métodos iterativos Enunciado del problema: en matemáticas, a menudo se pueden repre- sentar las funciones mediante una serie infinita. Por ejemplo, la función exponencial se puede calcular usando: [E3.2.1] Mientras más términos se le agreguen a la serie. la aproximación se acer- cará más y más al valor de ex.A la ecuación (E3.2.1)se le llama expan- sión en series de Maclaurin. Empezando con el primer término, ex = 1,y agregando un término a la vez, estímese elvalor de e"'. Después que se agregue cada térmi- no, calcúlense los errores relativos porcentuales real y aproximado. usando las ecuaciones (3.3)y (3.5),respectivamente.Nóteseque el valor real es eo = 1.648721 271. Agréguense términos hasta que elvalor abso- luto del error aproximado e, sea menor al criterio preestablecido. f , que contempla tres cifrassignificativas. Solución: en primer lugar, la ecuación (3.7)se puede emplear para de- terminar el criterio de error que asegura un resultado correcto en al me- 1 nos tres cifrassignificativas: es = (0.5 X 102-3)%= 0.05% Por lo tanto, se agregarán términos a la serie hasta que E, sea menor que este nivel.
  • 79. APROXIMACIONES Y ERRORES 71 La primera estimación es iguala la ecuación (E3.2.1)con un sólo tér- mino. Por lo tanto la primer estimación es igual a l. La segunda estima- ción se obtieneagregando el segundo término, como sigue: e x = l + x y para x = 0.5 = 1 + 0.5 = 1.5 Querepresenta un errorrelativoporcentualde [Ec. (3.3)] 1.648721271 - 1.5 = 9.029% €" = 1.648721271 La ecuación (3.5)determina una estimación aproximada del error, dado por: 1.5 - 1 Eo = 1.5 100%= 33.3% Ya que E, no es menor que elvalor prefijado, E$, los cálculos continúan agregandootro término, x2 / 2! y repitiendo los cdlculosdeerrores. El proceso se continúa hasta que eo < E,. Todos los cálculos se pueden re- sumirde la siguiente manera. Términos Resultado E" 9% EL7 5% 1 39.3 2 9.02 33.3 3 1.625 1.44 7.69 4 1.645833333 O. 1751.27 5 1.648437500 0.0172 O. 158 6 1.648697917 0.00142 0.0158 Así, después de que los seis términosse incluyen, el error estimado baja de E, = 0.05%, y el cálculotermina. Sin embargo, nótese que en vez de tres cifras significativas, ¡el resultadose mejora al llegar a cinco cifras! Esto se debe a que, para este caso, las ecuaciones (3.5)y 3.7) son con- servativas,esto es, aseguran que los resultados sonpor lo menos tan bue- nos como lo especifican. Aunque, como se analiza en el cápítulo 5, este no es siempreel caso para la ecuación (3.5),y es ciertocasisiempre. Con las definicionesanteriorescomoantecedente,sepuedeproceder ahora sobrelos dos tipos de error ligados directamente conlos métodos nu- méricos. Estos son los errores de redondeo y los erroresdetruncamiento.
  • 80. 72 METODOS NUMERICOS PARA INGENIEROS 3.4 ERRORES DE REDONDEO Como ya se ha mencionado, los errores de redondeo se deben a que las computadorassólo guardan un número finito de cifras significativas durante un cálculo. Las computadoras realizanestafuncióndemanerasdiferentes. Por ejemplo,si sólo se guardan siete cifras significativas, la computadora puede almacenary usar K como K = 3.141 592,omitiendolos términos restantes y generando un errorde redondeo,[de la ecuación (3.2)]: E, = 0.000 O00 65. Laanterioresunadelasvariasformasqueutilizaunacomputadora para redondear números. Esta técnica de retener sólo los primeros siete términos se lellamó “truncamiento”enel ambiente de computación. De preferencia se lellamará de corte paradistinguirlode los errores de trunca- mientodiscutidosen la próxima sección. Un corteignora los términos res- tantes de la representación decimal completa. Por ejemplo, el octavo dígito significativoeneste caso es 6. Por lo tanto K se representa de manera más exacta como3.141 593que como3.141 592 obtenido medianteun corte, ya que el valor está más cercano del valor verdadero. Esto se puede visuali- zardelasiguiente manera, si K seaproximapor K = 3.141 593, elerror de redondeo sereduce a: E, = 0.000 O00 35. Las computadoras se pueden desarrollar para redondear números de acuerdo a reglasde redondeo,como laquese acabademencionar.Sin embargo, esto agrega costo computacional por lo que algunas computado- rasusanelcorte directo. Este enfoque se justifica bajo la suposición de que elnúmerodecifrassignificativasen la mayor parte de las computadoras es muchomayorqueelerrorde redondeo dado por un corteusualmente in- significante.Estasuposiciónsesustentaenelsiguiente ejemplo. Los errores de redondeo asociados con el ejemplo 3.3 son impercep- tibles en todos los casos cuando se comparan conel error de truncamiento en t = 12 S que es (véanse los ejemplos 1.1 y 1.2): 4749.0 - 4995.9 E, = 4749.0 100 = -5.20% EJEMPLO 3.3 Efectos del error de redondeo en los cálculos del problema del para- caidista Enunciado del problema: repítanse los cálculos del ejemplo 1.2, usando tres, cuatrocinco y seiscifrassignificativas.
  • 81. APROXIMACIONES Y ERRORES 73 CUADRO 3.1 Comparacibn del problema del paracaidista usan- do una cantidad diferente de cifras significativas,con un tamaño de paso igual a2 s. Los cálculos se reali- zan con el número de cifras significativas indicadas. VELOCIDAD, cmls (cifras significativas) Tiempo, S 3 4 5 6 O O O 0.0 0.0 2 1960 1960 1960.0 1960.00 4 3200 3200 3200.4 3200.46 6 3980 3985 3985.5 3985.54 8 4470 4482 4482.3 4482.41 10 ’. 4780 4796 4796.8 4796.88 12 4980 4995 4995.8 4995.91 Solución: usando tres cifras significativas, u(2) se calculará como en el ejemplo 1.2: u(2) = 1960 Con tres cifras significativas, el valor de u(4) = 3 200.5se representará como 3 200. Los cálculos continúan de la siguiente manera: u(6) = 3 980 u(8) = 4 470 u(10) = 4 780 u(12) = 4 980 El resto de los cálculos resueltos están en el cuadro 3.1. El valor numérico de t = 12 S y hasta 10 cifras significativas es de 4 995.921508. Por lo tanto, usando tres, cuatro,cinco y seis cifras signi- ficativasse producenlos errores relativos porcentuales de redondeo0.32, 0.018, 0.002 4 y 0.000 23, respectivamente. Ya que la mayorparte de las computadoras tienenentre 7 y 14 cifras significativas, los errores de redondeo parecerían no ser muy importan- tes. Sin embargo, hay dos razonesdel porqué pueden resultar críticos en algunos métodos numéricos: 1. Ciertos métodosrequierencantidadesextremadamentegrandespara obtener una respuesta. Además, estos cálculos a menudo dependen entre sí. Esto es, los cálculos posterioresson dependientes delos an- teriores. En consecuencia, aunque un error de redondeo individual
  • 82. 74 MÉTODOS NUMERICOSPARAINGENIEROS puedeser muy pequeño, el efecto deacumulación enel transcurso de lagran cantidaddecálculospuedesersignificativo. 2. El efecto del redondeo puede ser exageradocuando se llevan a cabo operaciones algebraicas que emplean númerosmuy pequeños y muy grandes almismo tiempo. Ya queeste caso se presenta en muchos métodos numéricos, elerrorde redondeo puederesultardemucha importancia. EJEMPLO 3.4 La importancia de las cifras significativas de los cálculos algebraicos Enunciado del problema: determínesela diferencia de dos números gran- des: 32 981 108.123 4 y 32 981 107.998 9.En seguida, repítanse los cálculosperoincrementando elminuendoen un 0.001%. Solución: la diferenciadelosnúmeroses 32 981 108.123 4 -32 981 107.998 9 0.124 5 Ahora, incrementandoel minuendo en un 0.001% se obtiene el número 32 981 437.934 5, y la diferencia es: 32 981 437.934 5 -32 981 107.998 9 329.935 6 que es considerablemente diferentede la primera. De aquí que una mo- dificación en el minuendo, aparentemente insignificante, provoca una gran diferenciaen el resultado. Los tipos de errores mencionados hasta ahora pueden tener dificulta- desparaciertosmétodosnuméricos.Estos se discutenenlassiguientes secciones dellibro. 3.4.1 Reglas deredondeo Las reglas para redondear números en cálculos manuales se analizan en el recuadro 3.1y se ilustran en el ejemplo 3.5. Estas reglasno se aplican normalmente cuandose realizan cálculos extensospor computadora. Sin embargo, ya que se usan cálculos manuales a lolargodel texto, se han incluido estas reglascomo punto de referencia para cálculos posteriores.
  • 83. APROXIMACIONES Y ERRORES 75 RECUADRO 3.1 Reglas de redondeo Las siguientes reglas dan la pauta a seguirenel redon- deo de números cuando se realizan cálculos a mano. 1. En el redondeo, se conservan las cifras significativas y el resto se descarta (fig. B3.1).El últimodígito que se conserva se aumenta en uno siel primer dí- gito descartado es mayor de 5. De otra manera se deja igual. Si elprimerdígito descartado es 5 o es 5 seguido de ceros, entonces elÚltimodígito reteni- do se incrementa en 1, sólo si es impar. 2. En la suma y en la resta, el redondeo se lleva a cabo de forma tal que el último dígito retenido en la res- puesta corresponda al último dígito m6s significativo de los números que estdn sumando o restando. N6- tese que un dígitoen la columna de las centésimas es m6s significativo que uno de la columna de las mi- lésimas. 3 . Para lamultiplicación y para ladivisiónel redondeo es tal que la cantidad de cifras significativas delresul- ultimo Primer digito digito 5.6170 431 tad0 es igual al número más pequeño de cifras signi- ficativas que contiene la cantidad en la operación. 4. Para combinaciones de las operaciones aritméticas, existen dos casos generales. Se puede sumar o res- tar el resultado de las multiplicaciones o de lasdivi- siones. Multiplicación multiplicación ( diviión ) (divizón )o también se pueden multiplicar o dividir los resulta- dos de lassumas y las restas: En ambos casos, se ejecutan las operaciones entre paréntesis y el resultado antes de proceder con otra operación, en vez de redondear Únicamente el resul- tado final. Digitas Digitos retenidos o descartadas significativas FIGURA B3-1. Ilustración de los dígitos retenidos y descartadosde un número con cin- co cifras significativas. EJEMPLO 3.5 Ilustraciones de las reglas de redondeo Los siguientes ejemplos tienen por objeto ilustrar las reglas de redondeo analizadasenel recuadro 3.1 1. Errores de redondeo 5.6723 ”+ 5.67‘ 3 cifrassignificativas
  • 84. 76 METODOS NUMERICOS PARA INGENIEROS 10.406 ”+ 10.41 4 cifrassignlficativas 7.3500 -7.4 2 cifrassignificativas 88.21650 -.+ 88,216 5 cifrassignificativas 1.25001 1.3 2 cifrassignificativas 2. Sumas y restas. (Nota: lasúltimascifrasmássignificativas que se re- tienen, estánennegritas) : a) Evalúese 2.2 - l.768 2.2 - 1.768 = 0.432 +0.4 b) Evalúese 4.68 x lop7 + 8.3 x - 228 x lop6.La eva- luación deeste cálculose facilita expresando los números conun mismo exponente: 0.004 68 x + 8.3 x - 2.28 x De esta manera, se puede ver claramente que el 3 es elúltimodígito significativoreteniendo, por lo que la respuesta se redondea de la si- guiente manera: 6,02468 x -6.0 x 3. Multiplicación y división: a) Evalúese 0.0642 X 4.8 0.0642 X 4.8 = 0.308 16 ”-+ 0.31 b) Evalúese 945 f 0.3185 945 0.3185 = 2 967.0329 67 . . . -”+ 2 970 4. Combinaciones: a) Evalúese [15.2(2.8 x + [(8.456 x + 0.1771 Primero, efectúense lamultiplicación y la división que estándentro de los corchetes: [4.256 X 10.~1+ [4.777 401 . . . + ‘10.~1 Ahora, antesde sumar, se redondeanlascantidades encerradas: y despuéssúmese y redondéese el resultado:
  • 85. APROXIMACIONES Y ERRORES 77 I 9.08 X 10-3-A9.1X 10-3 6.740X 10-5- 8.7X 10-7 b) Evalúese 2.672X lo3+ 5.8 Antes de realizar las sumas y las restas, se expresan los números del nu- merador y del denominador de manera que estén elevadosal mismo ex- ponente. 674 X 10-7- 8.7 X 10-7 2.672 x lo3 + 0.0058 x lo3 Ahora se hace la suma y la resta: 665.3X 2.6778 x lo3 1 y seredondea: 665 X 10-7 2.678X lo3 finalmente, se divide y se redondea el resultado: 2.483 196. . . X lo-*"+ 2.48x 3.5 ERRORES DE TRUNCAMIENTO Los errores de truncamiento son aquellos que resultan al usar una aproxi- mación en lugar de un procedimiento matemático exacto. Por ejemplo, en el capitulo 1 se aproximó la derivada de la velocidad de caída de un para- caidista mediante la ecuación de diferencia divididade la forma [€c. (l.lo)]: Se introdujo un error de truncamiento en la solución numérica ya que la ecuación de diferencias sólo aproxima el valor verdadero de la deriva- da (Fig. 1.3).Además para obtener conocimiento de las características
  • 86. 78 MÉTODOS NUMERICOSPARAINGENIEROS de estoserroresseregresa a la formulaciónmatemáticausadaamplia- mente en los métodos numéricos para expresar funciones en forma poli- nomial:La serie de Taylor. 3.5.1 Serie de Taylor Enel ejemplo 3.2 se usauna serie infinitaparaevaluarunafunciónen un valor específico de lavariable independientex. De manera similar, la seriedeTaylordaunaformulaciónparapredecirelvalordelafunción en x,+lentérminos de lafunción y de susderivadasenunavecindad al punto x,. Envez de presentar en conjunto la serie de Taylor, se obtendrá más conocimiento de lamisma construyéndola términoa término. Por ejem- plo, elprimertérminodelaserie es: Estaigualdad, conocida como aproximacióndeorden cero, indica que el valor def en el nuevo punto esel mismo que el valor en el punto ante- rior.Esteresultado se lograintuitivamente ya que si xi y xi+ están muy próximasunade la otra, entonces esigualmenteposibleque el nuevo valor sea probablemente similaral anterior. La ecuación (3.9)da una estimación perfecta silafunción que se va a aproximar es una constante. Sin embargo, si la función cambia en todo el intervalo, entonces se requieren los términos adicionalesde la serie de Taylor para obtener unamejor aproximación. Por ejemplo, la aproxima- ción aprimerorden se obtienesumandootrotérmino al anteriorpara obtener: [3.10] El término adicional de primer orden consiste de la pendiente f' (xi) mul- tiplicada por la distancia entre xiy xi+l.Por lo tanto, la expresión ahora representa una línea rectay es capaz de predecir un incremento o un de- cremento de lafunción entre xi y x ~ + ~ . Aunque la ecuación (3.10)puede predecir un cambio, sólo es exacta paraunalínearecta o esdedirecciónlineal. Por lo tanto, se leagrega a la serie un término de segundo orden para obteneralgo sobre la curva- turade la función si es que la tiene: [3.11] De manera similar, se pueden agregar términos adicionales para desarro- llarla expansióncompletade la seriedeTaylor:
  • 87. APROXIMACIONESY ERRORES 79 +m(xi+l- Xj)3 + . . . + -f(,)(Xi) 3! (Xii-1 - xi)" + R"n! [3.12] Nótese que debido a quela ecuación (3.12) es unaserie infinita, el signo igual reemplaza al de aproximación usado en las ecuaciones (3.9)a la (3.11). Seincluye un término residual para considerartodos los términos desde n + 1 hasta el infinito: f'"+"(h)R, = (n + l)! (Xi+1 - Xi),+] [3.13] donde el subíndice n indica que el residuo es dela aproximación a n-esimo orden y ( es un valorcualquiera de x que se encuentra en xi y xi+ La inclusión de dentro de la serie esdemucha importancia al grado que se dedica una sección completa (sección 3.5.2)para su estudio. Por ahora, essuficiente darsecuenta queexiste estevalor que da una estima- ción exacta del error. Frecuentemente es convenientesimplificar la serie de Taylor definiendo un paso h = - xi y expresando la ecuación (3.12)como: en donde el término residual es ahora: [3.15] EJEMPLO 3.6 Aproximaciones de un polinomio mediante la serie de Taylor. Enunciado del problema: úsense términos en la serie de Taylor de cero a cuarto orden para aproximar la función:
  • 88. 80 METODOSNUMERICOSPARAINGENIEROS desde elpunto xi = O y con h = 1. Esto es, predecirelvalor de la fun- ciónen xi+ = 1. Solución: ya que se tratadeunafunción conocida, se puedencalcular valoresde f (x) O y 1. Los resultados (Fig. 3.3) indicanquelafunción empiezaen f (O) = 1.2 y continúahaciaabajohasta f (1) = 0.2. Por lo tanto, elvalor que se tratadepredecires 0.2 La aproximaci6n en serie deTaylor de orden cero es [Ec. (3.9)1: Como se puede verenlafigura 3.3, la aproximacióndeorden cero es una constante. El errordetruncamiento en este caso es [recuérdese la ecuación (3.2)]: E” = 0.2 - 1.2:- 1.0 en x = 1. x = O, como: Para n = 1, laprimerderivada se debedeterminar y evaluaren FIGURA3.3 La aproximación de {(x) = -0.1 x4 - 0 . 1 5 ~ ~-0.5~’- 0 . 2 5 ~+ 1.2 en X = 7 mediante series de Taylor de orden cero, de primero y se- gundo orden.
  • 89. APROXIMACIONESY ERRORES 81 I Laaproximaciónaprimerorden es[Ec. (3.10)] f ( x i + l )E 1.2 - 0.25h que se puede usar para calcularf (1)= 0.95. Por consiguiente,la aproxi- mación empieza a coincidir conla trayectoria de la función como la pen- diente de una línea recta (Fig.3.3).De esta manera el error de truncamiento se reduce a: E, = 0.2 - 0.95 = -0.75 en x = 1.Para n = 2, se evalúa la segundaderivadaen x = O: f”(0)= -1.2(0.0)*- 0.9(0.0)- 1.0 = -1.0 y de acuerdo a la ecuación (3.11): f ( x i + l ) 1.2 - 0.25h - 0.5h2 y, sustituyendo h = 1 f(1)= 0.45 Al incluirse la segunda derivadase añade una curvatura descendente que proporcionauna estimación mejor, como se muestra en la figura 3.3. El errordetruncamiento se reducea 0.2 - 0.45 = - 0.25. Los términos adicionales mejoranaún m6s la aproximación. En efec- to, incluyendo la terceray la cuarta derivada, se obtiene la ecuación original: f ( q + l ) = 1.2 - 0.25h - 0.5h2- 0.15h3- 0.10h4 donde eltérminoresidual es: ya que laquintaderivada de un polinomio de cuartoordenes nula, R4 = O. Por consiguiente, la expansiónenseriedeTaylorhastalacuarta derivadaproduceunaaproximación exacta en x = 1. En general,la expansión en serie de Taylor de n-ésimo ordenes exacta para un polinomio de n-ésimo orden. Para otras funciones continuas di- ferenciables, como las exponencialeso senoidales, no se obtiene una estima-
  • 90. 82 MhODOS NUMERICOS PARA INGENIEROS ción exacta medianteun número finito de términos. Cada uno de los términos adicionales contribuye al mejoramiento de la aproximación, aunque sea con poco. Esto se muestra en el ejemplo 3.7. Seobtendría un resultadoexacto, únicamente si seagrega un númeroinfinito detérminos. Aunque lo anterior se cumple, elvalor práctico de la serie de Taylor estriba, enlamayorpartedelos casos, enel usode un númerofinito de términosquedaránunaaproximación lo suficientemente cercana a la solución verdadera para propósitos prácticos. La decisión sobre cuán- tos términos se requieren para obtener una “aproximación razonable”se basa eneltérminoresidualdela expansión. Recuérdese que eltérmino residualesdelaforma general de la ecuación (3.15).Esta fórmula tiene dos grandes desventajas. Primero [ no se conoce exactamente sino que sólo se sabe queestáentre xi y xi+ Segundo, para la evaluación de la ecuación (3.15)se requiereevaluar la (n + 1)-ésima derivada de f(x). Para hacerlo, se necesita conocer f(x) . Pero, siya se conoce f(xj, ¡enton- ces no hay razón para realizar la expansión en series de Taylor en primer lugar! A pesardeestedilema, la ecuación (3.15)aúnresulta útil parala eva- luación de errores de truncamiento. Esto se debea que tiene control sobre el término h de la ecuación. En otraspalabras, se puededecidirquétan lejos de x se desea evaluarf(x) y se puede controlarla cantidad de térmi- nosincluidosenla expansión. Por lo tanto, la ecuación (3.15)se expre- sa, usualmente como: R, = O(hntl) donde la nomenclatura O(h + I) significa que el error de truncamiento es de orden h,+ Esto es, el erroresproporcional al paso h a la (n + 1) -enésima potencia. Aunque esta aproximación noimplica nada relacionado conlasderivadasquemultiplica h ,+es extremadamente útil al evaluar el errorrelativode los métodosnuméricosbasadosenlas expansiones en serie de Taylor. Por ejemplo, siel error es O (hj,y se reduce a la mi- tadel paso, entonces elerror se reducirá a la mitad. Por otro lado. siel errores O(h2)y se reduce a lamitadel paso, entonces elerror se redu- cirá a unacuarta parte. EJEMPLO 3.7 Uso de la serie de Taylor para aproximar una función que tiene un númeroinfinito de derivadas. Enunciado del problema:úsense los términosde la seriedeTaylorcon n = O hasta 6 paraaproximar: f (x) = cos x
  • 91. APROXIMACIONESY ERRORES 83 en x = a / 3 (60O)en base alvalor def (x)y de sus derivadas alrededor delpunto x = a / 4 (45). Nóteseque esto significaque h = a / 3 - a / 4 = a / 1 2 . Solución: como en el ejemplo 3.6,el conocimiento dela función original implicaque se puede conocer elvalor exacto de f (a / 3 ) = 0.5. Laaproximacióndeorden cero es [Ec. (3.9)]: f(d3) = COS ( d 4 ) = 0.707 io6781 querepresenta un errorrelativoporcentual de: E” = 0.5 - 0.707106781 loo^ = “41,49g 0.5 Para la aproximación de primer orden, se suma el término que con- tiene a laprimer derivada,donde f’(x) = - sen x: f(:) COS (3-Sen(:)(g) = 0.521986659 quetiene un errorrelativoporcentualde E, = - 4.40. tiene a la segundaderivada,donde f’ ’ (x) = - cos x: Enla aproximaciónde segundoorden, se incluye el término quecon- con un errorrelativoporcentual de E, = -0.449. Por lo tanto, al agre- garmástérminos a laserie se obtieneunamejoraproximación. Este proceso se puede continuar,los resultados se muestran en el cua- dro 3.2. Nótesequelasderivadasnunca se acercan a cero, como es el CUADRO 3.2 Aproximaciones mediante la serie deTaylor de f (x) = cos x en x I 3 alrededor delpunto x 14. Los ~ valores se muestran para varios brdenesde apro- I xirnaci¿n (m). Orden n f”(x) P(nI3) C” O cos x 0.707106781-41.4 1 -sin x 0.521986659 2 -4.4 “cos x 0.497754491 3 0.449 sin x 0.499869147 4 2.62 x cos x 0.500007551 5 -sin x 0.500000304 6 -cos x 0.4999999882.40 x -1.51 X 10-3 -6.08 X 10-5
  • 92. 84 MÉTODOS NUMÉRICOS PARA INGENIEROS casodelpolinomiodelejemplo 3.6. Sin embargo,cada término que se le agrega a la serie produce una mejor aproximación. Nótese también que la mayor aproximación se consigue con los primeros términos. En este caso, en el momento que se le agregó el tercer término, el error se redujo al 2.62 x lo-*%, lo que significa que se haalcanzado el 99.9738% del valor exacto. Por consiguiente, si se le agregan más términos a la serie el error decrece, pero la mejoría será mínima. En general, se puede suponer queel error de truncamientodisminu- ye agregando términos a la serie de Taylor. Además, si h es lo suficiente- mentepequeño,entonces los términos de primero y segundoorden influyen desproporcionadamente en el porcentaje del error. Esta propie- dad se ilustra en el ejemplo siguiente. 3.5.2 El residuo delaexpansión en la serie de Taylor Antes de demostrar cómo se usa la serie de Taylor en la estimación de errores numéricos, se debeexplicar por qué seincluye el argumento [ en la ecuación (3.15).Envez de presentar una derivación matemática ge- neral se desarrollará una exposición más simple basada en una interpre- tación geométrica. En seguida se puede extender este caso específico a una formulación más general. Supóngase que se truncóla expansión en seriede Taylor [€c. (3.14)l después del término de orden cero para obtener: f(Xi+l) = f(x0 En la figura 3.4 se muestra un bosquejo de esta predicción de orden ce- ro. El residuo o error de esta predicción, que se muestra también en la figura, consiste de la serie infinita de términos que fueron truncados: Ro = f’(xi)h + -h2 + -h3 + . . .f”(Xi) f’”(X.) 2! 3! Es obvio que tratar el residuo de esta serie infinita con este formato es inconveniente. Se puede obtener unasimplificación truncando el resi- duo mismo, de la siguiente manera: Ro 2 f’(xi)h [3.16] Aunque, como se mencionó en la sección previa, los términos de las de- rivadas de ordeninferior cuentan mucho más enel residuo que los térmi- nos de las derivadas de ordensuperior, este resultado todavíaes inexacto, ya que se han despreciado los términos de segundo orden y de órdenes
  • 93. APROXIMACIONES Y ERRORES 85 FIGURA 3.4 Representacióngráfica de unapredicciónde la serie deTaylorcon residuo. superiores. Esta “inexactitud” se denota mediante el símbolo de aproxi- mación a la igualdad ( =) empleado en la ecuación (3.16). Una simplificación alterna que realiza la aproximación a una equiva- lencia está basada en el esquema gráfico. Nótese que en la figura 3.4 el error Lo pudo haberse determinado si se hubiera sabido la posición del valor exacto. Obviamente este valor es desconocidoya que de otra ma- nera no sehubiese requerido dela expansión en serie de Taylor.Sin em- bargo, el teorema delvalor medio del cálculo ofrece una forma de rehacer el problema para evitar en forma parcial este dilema. El teorema del oalor medio diceque si una función f (x)y su primera derivadasoncontinuassobre un intervalo [x, xi+J, entonces existe al menos un punto sobrela función que tiene una pendiente,dada por f’ (E), que es paralelaa la línea que une f’(xi)con f’(xi+1).El parámetro 4 marca el valor x donde ocurre la pendiente (Fig. 3.5).Se puede hacer una ilustración tangible de este teorema en el hecho de que si se viaja entre dos puntos con una velocidad promedio, habrá al menos un mo- mentodurante el curso del viaje en el quese mueva a esavelocidad promedio. Al hacer uso de este teorema resulta fácil darse cuenta, como seilustró en la figura 3.5,que la pendiente f’(4)es igual a cociente Roentre h, o:
  • 94. 84 METODOS NUMÉRICOS PARA INGENIEROS FIGURA 3.5 Representación gráfica del teorema del valor medio. que se puede reordenar para obtener: Por lo tanto, seha obtenido el término de orden cerode la ecuación (3.15). Los términos de órdenes superiores son una extensión lógicadel razona- miento usado para derivar la ecuación (3.17),basado en la forma general del teorema extendido delvalor medio (Thomas y Finney, 1979).Por lo tanto, la versión de primer orden es: [3.18] En este caso, el valor de 4 conforma el valor de x que corresponde a la derivada de segundo orden que hace exacta a la ecuación (3.18).Los términos de orden másalto se pueden desarrollar de la ecuación (3.15). 3.5.3 Uso de la serie de Taylor para estimar los errores de truncamiento Aunque la serie de Taylor es extremadamente útil en la estimación de errores de truncamiento a lo largo de este libro, puede que aún no esté muy claro cómo la expansión puede aplicarse en estos momentos a los métodos numéricos. En realidad, esto ya se hizo en el ejemplo del para-
  • 95. APROXIMACIONESY ERRORES a7 caidista. Recuérdese que el objetivo de los ejemplos l.1y l.2 fue el de predecir la velocidad en función del tiempo.Esto es, se deseaba determi- nar u (t). Como se especificó en la ecuación (3.12),u (t)se puede expan- dir en la serie de Taylor como: Ahora, truncando la serie después del término con primera derivada, se obtiene: La ecuación (3.20) se puede resolver para: [3.21] " Aproximación de Error primerorden detruncamiento La primera parte de la ecuación (3.21) es exactamentela misma relación que se usó para aproximar la derivada del ejemplo 1.2 [Ec. (1.lo)].Sin embargo, con el esquema de la serie de Taylor se ha obtenido una esti- mación del error de truncamiento asociadocon esta aproximación de la derivada.Usando las ecuaciones (3.13)y (3.21) seobtiene: O ~-R1 - O(tii.1 - ti) ti+1 - ti [3.22] [3.23] Por lo tanto, la estimación de la derivada [Ec. (1.10)o !a primera parte de la Ec. (3.21)]tiene un error de truncamiento deorden t,+ - ti. En otras palabras, el error en la aproximación usando derivadas debe ser proporcional al tamaño del paso. Por lo tanto, si éstese divide a la mitad, entonces se espera queel error de la derivada, se reduzca ala mi- tad. 3.5.4. Diferenciación numérica A la ecuación (3.21) se le conoce con un nombre especial en el análisis numérico, se le llarr,a diferencias diuididas finitas. Se puede representar
  • 96. 88 MÉTODOS NUMÉRICOS PARA INGENIEROS generalmente como: O [3.24] [3.25] donde a Aj,se le conoce como la primera diferencia hacia adelante y a h se le llama tamaño del paso, esto es, la longitud del intervalo sobre el cual se hace la aproximación. Se le llama diferencia "hacia adelante" ya que usa los datos i e i -t 1para estimar la derivada (Fig. 3.6~1).AI térmi- no completo Af,/h se le conoce como primera diferencia dividida finita. Esta diferencia dividida hacia adelante no es sino una de tantas que se pueden desarrollar mediante la serie de Taylor para la aproximación de derivadas numéricas. Por ejemplo,las aproximaciones a primeras de- rivadas, utilizando las diferencias hacia atrás o las diferencias centrales se pueden desarrollar de una manerasimilar a la de la ecuación (3.24).Las primerasusan a (Fig. 3.6b),mientras que las segundasusan infor- mación igualmente espaciada alrededor del punto donde está estimada la derivada (Fig.3 . 6 ~ ) .Las aproximaciones más exactasde la primer de- rivada se pueden desarrollar incluyendo en la serie de Taylor términos de orden más alto. Finalmente, todas las versiones anterioresse pueden desarrollar para derivadas de segundo orden,tercer orden y órdenes su- periores. Las siguientes secciones analizan brevemente estos casos, ilus- trando cómo se deriva cada uno de ellos. Aproximaciones a la primera derivada con diferencias hacia atrás. La serie de Taylor se puede expandir hacia atrás para calcular un valor anteriorsobre el valor actual, dada por: [3.26] Truncando la ecuación después de la primer derivada y ordenando los términos se obtiene: [3.27] donde el error es O (h) y V f, indica la primer diferencia dividida hacia atrús. Véase lafigura 3.6b para una representación gráfica,. Aproximaciones a la primer derivada con diferencias centrales. Una tercera forma de aproximar la primer derivada es restar la ecuación (3.26)
  • 97. APROXIMACIONESY ERRORES 89 FIGURA 3.6 Gráfica de aproximaciones con diferencias divididas tinitas de la prime- ra derivada, a) hacia adelante, b) haciaatrás y c) centrales.
  • 98. 90 MÉTODOS NUMERICOS PARA INGENIEROS de la expansión en serie de Taylor hacia adelante: para obtener que se puede resolver para or [3.28] [3.29] La ecuación (3.29)es una representación de las diferencias centrales (o centradas) de la primera derivada. Nótese que el error de truncamiento es del orden de h2 en contraste con las diferencias divididas hacia adelan- te y hacia atrás, las cuales fueron de orden h. Por lo tanto, elanálisis de la serie de Taylor ha llevado a la información práctica de que la diferencia central es la representación más exactade la derivada (Fig.3 . 6 ~ ) .Por ejemplo, si se parte el tamaño del paso a la mitad usando diferencias hacia atrás o hacia adelante, el error se reducirá aproximadamente a la mitad, mientras que para diferencias centrales, el error se reduce a la cuarta parte. Aproximaciones a derivadas de orden más alto usando diferencias fini- tas. Junto ala primer derivada, la expansión de la serie de Taylor se puede usar parauna estimación numérica de las derivadas de ordensuperior. Para hacerlo, se escribe una expansión en serie deTaylor hacia adelante para f (xj+*)en términos de f (xi)de la siguiente forma: f(Xi+2) = f k i ) + f'(XiI(2h) + - f"(xi)(2h)Z + 2 [3.30] La ecuación (3.28) se puedemultiplicar por 2 y restarse de la ecuación (3.30)para obtener: . . . que se puede resolver para: [3.31]
  • 99. APROXIMACIONESY ERRORES 91 A esta relación se lellamadiferenciasdiuididasfinitas hacia adelante de segundo orden. Se puedenusarprocedimientossimilaresparaobtener lasversioneshaciaatrás y centrales. Las aproximaciones a tercer orden delasdiferenciasdivididashacia adelante, haciaatrás y centrales tam- bién pueden obtenerse (Fig. 3.7 a la 3.9).En todos los casos, las diferen- ciascentradas danuna mejoraproximación. Fórmulasde exactitud para diferencias de orden superior.Todas las esti- maciones anteriores truncaron las estimaciones dadas porla serie de Taylor después de algunos términos. Las fórmulas de más exactitud se pueden desarrollarincluyendotérminosadicionales.Por ejemplo, la expansión hacia adelante [Ec. (3.28)jse puederesolver para: [3.32] FIGURA 3.7 Fórmulas de diferencias divididas finitas hacia atrás. Se presentan dos versiones para cada derivada. La segunda forma incluye más términos de la serie de Taylor y, por lo tanto, esmás exacta.
  • 100. 92 MÉTODOS NUMÉRICOS PARA INGENIEROS I FIGURA 3.8 Fórmulas de diferencias divididas finitas haciaadelante. Se presentan dosversiones paracadaderivada. La segunda forma incluye más términos de la serie de Taylor, ypor lo tanto, esmás exacta. En contraste con la ecuación (3.24),se puede retener el término de se- gundo orden sustituyendo la ecuación (3.31)en la ecuación (3.32)para obtener: o agrupando términos Nótese que la inclusión del término con segunda derivada ha dado una exactitud O (h’). Se pueden desarrollar versiones mejoradas similares pa-
  • 101. APROXIMACIONESY ERRORES 93 FIGURA 3.9 Fórmulas de diferencias divididas finitas centrales.Se presentan dos ver- siones para cada derivada. La segunda forma incluye más términos de lo serie de Taylor y, por lo tanto, es más exacta. ra diferencias hacia atrás y centrales así como para las aproximaciones de derivadas de orden superior. Las fórmulas se resumen en las figuras 3.7 hasta la 3.9. El siguienteejemplo ilustra la utilidad de las mismas en la estimación de derivadas. En esta sección sólo se han cubierto algunas de las formas con que la serie de Taylor es útil en el análisi numérico. Sin embargo, este mate- rial tiene como propósito inicial ayudar en la estimación y el control de errores de truncamiento. Muchosde los métodos numéricos de este libro se basan en la representación de aproximaciones simples, de órdenesin- feriores en vez de expresiones matemáticas complicadas. Ya que la ex- pansión enla serie de Taylor da una estructura mediantela cual se separan componentes de orden inferior y superior, se demostrará a lo largo del texto que éste esun vehículo para profundizaren los métodos numéricos.
  • 102. 94 MÉTODOS NUMÉRICOS PARAINGENIEROS EJEMPLO 3.8 Aproximaciones de derivadas usando diferencias divididas finitas Enunciado del problema: úsense aproximaciones de diferencias finitas hacia adelantey hacia atrás de O (h) y centradas, deO (h'), paraestimularlapri- meraderivada de: f(x) = - 0 . 1 ~ ~- 0 . 1 5 ~ ~- 0 . 5 ~ ~- 0 . 2 5 ~+ 1.2 en x = 0.5 usando un tamaño de paso h = 0.5. Repetirloscálculos usando h = 0.25.Nótese que la derivadase puede calcular directamen- te como: f'(x) = - 0 . 4 ~ ~- 0 . 4 5 ~ ~- 1 . 0 ~- 0.25 y se puedeusarparacalcular elvalor exacto de f' (0.5) = - 0.912 5. Solución: para h = 0.5, se puedeusar lafunciónparadeterminar: x,-1 = o f(Xj-1) = 1.2 Xi+! = 1.0 f(xj+J = 0.2 xi = 0.5 !(X¡) = 0.925 Estos datosse pueden usar para calcular la diferencia dividida haciaade- lante [Ec.(3.24)]: f'(0.5) = 0.2 - 0.925 O.5 = -1.45 E, = 58.9% la diferenciadivididahaciaatrás [ € c .(3.27)]: f '(0.5) = 0.925 - 1.2 0.5 -0.55 E, = 39.7% y la diferenciadivididacentral [Ec. (3.29)]: Para h = 0.25, los datos son: xi-1 = 0.25 f(xi-1) = 1.10351563 x, = 0.50 f ( x , )= 0.925 Xi+l -- 0.75 f(xi+l)= 0.636328 13 que se pueden usar paracalcular la diferencia divididahacia adelan- te: f'(0.5) = 0.636 328 13 - 0.925 -"1.155 = E" = 26.5% 0.25
  • 103. APROXIMACIONESY ERRORES 95 la diferenciadivididahacia atrás: f'(0.5)= 0.925 - 1.103 515 63 0.25 = -0.714 E" = 21.7% y la diferenciadividida,central 0.636 328 13 - 1.103515 63 f ' ( 0 . 5 ) ~ 0.5 = -0.934 E, -2.4% Para los dos tamaños depaso, las aproximacionesde diferenciascentra- les son másexactas que las diferencias hacia atrásy hacia adelante. Tam- bién, comolo predijo el análisis de la serie de Taylor,la división del intervalo endospartesigualesdividealamitadelerrordelasdiferenciashacia atrás y hacia adelante,y a la cuarta parte el error de las diferencias centrales. 3.6 ERROR NUMÉRICO TOTAL El errornuméricototal es lasumade los errores de redondeo y de trunca- miento. Desde el problema del paracaidista (ejemplo 3.3)se descubrió que laúnicaformademinimizar los erroresderedondeoesladeincrementar elnúmerodecifrassignificativasdela computadora.Más aún, se notó que los errores de redondeo crecen conforme aumenta el número de cálculos. En contraste, el ejemplo 3.8 demostróque laestimaciónporderivadas se puedemejorardisminuyendoeltamañodel paso. Ya que un decremento enel tamaño del paso lleva a un incremento en los cálculos, los errores de truncamientodecrecenconformeelnúmerodecálculosaumenta.Porlo tanto, seencara elsiguientedilema:laestrategiadedisminuir un compo- nentedelerrortotalllevaalincrementodelotro.En un cálculo es concebi- ble disminuir el tamaño del paso para minimizarlos errores de truncamiento sólo para descubrir que al hacerlo, ¡los errores de redondeo empiezan a dominar la solución y el error totalcrece!. Por lo tanto, el remedio se con- vierteenproblema (Fig. 3.10).Un reto que debe encararse es el de de- terminarun tamaño apropiado de paso paraun cálculo en particular. Sería bueno escoger unagrancantidaddetamañosde paso paradisminuirla cantidad de cálculos y los errores de redondeo, sinincurrirenla pena de un error mayor de truncamiento. Si el error total es el que se muestraen lafigura 3.10, elproblemaesidentificarelpuntodondeelprovechodis- minuye, es decir donde los errores de redondeo empiezan a negarlos be- neficiosobtenidoscon unareducciónenel tamaño del paso En casosreales, sin embargo,estoscasosnosoncomunes ya que la mayor parte de las computadoras manejan suficientes cifras significativas de formatalque los erroresderedondeonoinfluyen. No obstante, algunas vecesocurren,haciendopensar enuna especiede"principiosdeincerti- dumbre numérica", que coloca un límite absoluto sobre la exactitud que se puedeobtenerusandociertosmétodosnuméricosconcomputadora.
  • 104. 96 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA 3.1O Representacióngráfica de lasventajas y desventajasentreerrores de re- dondeo y truncamiento que en ocasiones influyen en el curso de un me- todo numérico. Aquí se muestrael punto óptimo, donde el error de redondeo comienza a negar los beneficios dados por la reducción del tamaño del paso. Debido a estas restricciones, hay limitaciones en la estimación de erro- res. Por lo tanto, la estimación de errores en el análisis numérico es, has- ta cierto punto, un arte que depende en gran parte de las soluciones de prueba-error, además de la intuición y experiencia del analista. Aunque eneste capítulo se ha tratadoun tipo de problema numérico "la solución de una ecuación diferencial ordinaria- las conclusiones an- teriores tienen una relevancia general en muchas delas otras técnicas del libro. Sin embargo, debe de hacersehincapié en que aunqueel tema es, hasta cierto punto, un arte, hay unavariedad de métodos quelos analis- tas pueden usar para cuantificar y controlar los errores en un cálculo. La elaboración de estas técnicas jugará un papel prominente en las páginas siguientes. 3.7 ERRORESPOR EQUIVOCACIÓN, DE PLANTEAMIENTO E INCERTIDUMBRE EN LOS DATOS Aunque las siguientes fuentesde error no están conectadas directamente con la mayor parte de ios métodos numéricos de este libro, en algunas ocasiones pueden tenergran importanciaen el esfuerzo por hacer un mo- delo exitoso. Por lo tanto, se deben tener siempre en mente cuando se apliquen técnicas numéricas en el contexto de problemas del mundo real.
  • 105. APROXIMACIONESY ERRORES 97 3.7.1 Erroresporequivocación A todos les son familiares los errores por torpezao por equivocación, En los primeros años de la computación, los resultados numéricos erróneos fueron atribuidos algunas vecesal mal funcionamiento de la computado- ra misma. Hoy día, esta fuente de error es muy improbable y la mayor parte de las equivocaciones se pueden atribuir aerrores humanos. Las equivocaciones ocurren a cualquiernivel del proceso de modela- ción matemática y pueden contribuir con todaslas otras componentesdel error. Se pueden evitar únicamente conel conocimiento de los principios fundamentales y con el cuidado sobre la aproximación y diseño de la so- lución a un problema. Las equivocaciones, por lo general se pasan por alto en la discusión de un método numérico. Esto sin duda prueba el hecho de que los errores de torpeza son, hasta cierto punto, inevitables. Sinembargo, recuérdese que hay ocasiones en que su aparición se puede minimizar. En particular, los buenos hábitos de programación que se bosquejaron en el capítulo 2, son extremadamente útiles para disminuir las equivocaciones. Además, hay for- mas muy simples de verificar cuando un método numérico está trabajando correctamente. A lo largo del texto, se estudian algunas formas de verificar los resultados de uncálculo numérico. 3.7.2 Errores de formulación Los errores de formulación o de modelamiento degeneran en lo que se podría considerar como un modelo matemático incompleto. Un ejemplo de un error de formulación imperceptible es el hecho de que la segunda ley de Newton no explica los efectos relativísticos. Esto no desvirtúa la validez de la solución del ejemplo 1.1ya que estos errores son rnínimos en las escalas de tiempo y espacio de la caída del paracaidista. Sin embargo, supóngase quela resistencia del aire no es linealmente proporcional a la velocidad de caída, comoen la ecuación (1.6),sino que es unafuncióndel cuadrado de la velocidad. Si estefuese el caso, las soluciones analíticas y numéricas obtenidas en el primer capítulo serían falsas debido al error en la formulación. En algunos casos de estudio del resto del libro se incluyen algunas consideraciones adicionalesde los errores de formulación. Se debe estar conciente de estos problemas, y darse cuenta que si se está usando un modelo deficiente, ningún método numérico ge- nerará los resultados adecuados. 3.7.3 Incertidumbre en los datos Algunas veces se introducen erroresen un an3lisis debido ala incertidumbre de los datos físicos sobre los que se basa el modelo. Por ejemplo, supón- gase que se desea probar el modelo del paracaidista haciendo saltos re- petidosindividualmente y luegomidiendo la velocidad después de un
  • 106. 98 MÉTODOS NUMÉRICOS PARA INGENIEROS intervalo de tiempo específico. Indudablemente se asociará con cada me- dición una incertidumbre. ya que el paracaidista caerá más rápidamente en unos saltos que en otros. Estos errores pueden mostrar inexactitud e imprecisión. Si los instrumentos constantementesubestiman o sobreesti- man las mediciones de la velocidad. se estará tratando conun instrumento inexacto o desviado. Por el otro lado, si las medidas son casualmenteal- tas y bajas entonces se trata de unacuestión de precisión. Los errores de medición se pueden cuantificar sumando los datos con una o más estadisticasbien conocidas, que generan tanta información como sea posible, observando las características específicas de los datos. Estas estadísticas descriptivas a menudo son seleccionadas para presentar 1) la posición del centro de distribución de los datos y 2) el grado de espar- cimiento de los datos. Comotales dan una medida dela desviación e im- precisión,respectivamente. En el capítulo 10 seretoma el temade caracterización de incertidumbre en los datos. Aunque se debeestar conciente de los errores por equivocación. erro- res de formulación e incertidumbreen los datos, los métodos numéricos usados para construir modelos pueden estudiarse, en la mayor parte de loscasos independientemente de estos errores.Por lo tanto, enia mayor parte de este libro se supondrá que nohay erroresde torpeza. que el mo- delo es adecuadoy que se está trabajando sin errores en las mediciones de los datos. Bajo estas condiciones. se puedenestudiar losmétodos nu- méricos sin complicaciones. PROBLEMAS 3.1 ¿Cuántas cifrassignificativashay en cada uno de los siguientesnúmeros'? a) 0.84 X 10' fl 0.046 00 b) 84.0 g) 0.00460 c) 70 h) 8.00 x 10' d) 70.0 i) 8.0 X lo3 e) 7 j) 8 000 3.2 Redondéense los siguientes números atrescifrassignificativas a) 8.755 d) 5.555 x 10" b) 0.368 124 X 10' e) 0.999 500 c) 4 225.0002 3.3 Efectúense lassiguientes sumas y restas y escríbanse los resultadoscontodaslas cifrassignificativas necesarias. ai 0.004 23 + (25.1 x 1 0 ~ " )+ (10.322 x 10 b) 5 068 - 2.4
  • 107. APROXIMACIONES Y ERRORES 99 C) (4.68 X lo6)- (8.2 X 10') d ) (9.8 X - (8.696 X i r 5 ) e) (7.7 X - (5.409 X + (7.0 X 3.4 Efectúense las siguientes multiplicaciones y divisiones y escríbanse los resultados con todas lascifrassignificativas necesarias. a) (8.38X lo5) X (6.9 X b) (8.38 x lo4)x (6.90 x c) 87 619/(0.008 71 x 99999) d ) (2.06 x 111)/888 el (0.4 O00 x 0.020 00) (0.010 O0 x 0.800) 3.5 Efectúese cada una de las siguientes operaciones combinadas y escríbanse los re- sultados con todas lascifrassignificativas necesarias. a) 6.80(4.0 x 10~6)- 22 (8.06 x b) (14 x 10 + 555 - 80.8) x (2.000 1 - 0.004) C) 486 X 10-6 - 4.45 X 10-5 (7.777 X 103) + 9.6 dl 4.81 x (6.9134 x lo3)+ 32.26 - 6.7845 x 10~6 58.6 (12 x 10~6)- (208 x (1801) 4 468.94 x 3.6 En el ejemplo 3.2 se usó la serie infinita: para aproximar ex. a) Demuéstrese que esta expansión en serie Maclaurin es un caso especial de la expansiónen serie de Taylor [Ec. (3.1411con x, = O y h = x. b) Úsese la serie de Taylor para estimar f(x) = e-' en x , , ~= 2 para tres casos diferentes: x, = 0.5, 1.0y 1.5. Empléense los términos de orden cero, primero, segundo, y tercero,además calcúlese leul paracadacaso. 3.7 La expansión en serie de Maclaurin para el cos x es: x2 x4 x6 x8 2! 4! 6! 8! cosx="-+"-+- Iniciando con el primer término, COS x = 1. agréguense los términos uno a uno para estimar 'COS (T / 3).Después que se agregue cada uno delos términos, calcú- lense los errores porcentualesrelativos. exactos y aproximados. Usese una calcula- dora de bolsillo para determinar elvalor exacto. Agrégueme términos hasta que
  • 108. 1O0 METODOSNUMERICOSPARAINGENIEROS el valorabsoluto del error aproximado falle bajocierto criterio de error, consideran- do dos cifrassignificativas. 3.8 Repítanse los cálculos del problema 3.7,pero ahora usando la serie de Maclaurin para el sen x: x3 xs x7 3! 5! 7! s e n x = x--- + + y estímese el sen (H / 2) 3.9 Úsense los términos en serie de Taylor de ceroa tercer orden para estimar f (3)para f(xj = 25x3 - 6x2 + 7x - 88 usando como puntobase x = 2. Calcúlese el error relativo porcentual correcto pa- ra cada aproximación. 3.10 Úsense los términos en la serie de Taylor de orden cero al cuarto para estimar f (4) para f (x)= In x usando como punto base x = 1.Cálculese el error relativo porcentual correcto para cada aproximación. 3.11 Úsense los términos en serie de Taylor de orden cero al cuarto para estimar f (2) paraf (x)= e-x usando como punto base x = 1.Calcúlese el error relativo por- central correcto e, para cada aproximación. 3.12 Úsense aproximaciones de diferencias de O (h)hacia atrás y hacia adelante y una aproximación central de O (h2) para estimar la primera derivada de la función mencionada en el problema 3.9. Evalúese la derivada en x = 2.5 usando un tamaño de paso deh = O.25. Compárense los resultados conel valorcorrecto de la deriva- da en x = 2.5. Interprétense los resultadosen base al término residual de la serie de Taylor. 3.13 Úsense aproximaciones con diferencias hacia atrás, centrales y hacia adelante de, O (h’) para estimar la segunda derivada de la función vista en el problema 3.9. Hágase la evaluación en x = 2.6 usando un tamaño de paso de h = 0.2. Compá- rense las estimaciones con elvalor correcto de la segunda derivada en x = 2.6. lnterprétense los resultados en base al término residual de la serie de Taylor.
  • 109. EPíLOGO: PARTE I 1.4 ELEMENTOS DE JUICIO Los métodos numéricos son científicos en el senti- do de que representantécnicas sistemáticas para resolver problemas matemáticos. Sin embargo, hay cierto grado de arte, juicios subjetivos y términos me- dios, asociados con su usoefectivoen la práctica de ingeniería. Para cada uno de los problemas, la confrontación es con varias técnicasnuméricasal- ternativas y con muchos tipos de computadoras. Por lo tanto, la elegancia y la eficiencia de los dife- rentes enfoques de los problemas es muy indivi- dualista y se relaciona conla habilidad de escoger prudentemente entre todas las opciones. Desafor- tunadamente, como sucede con cualquier proce- so intuitivo, los factores que influyenen esta elección son difíciles de comunicar.Estas habilida- des pueden ser comprendidas y afinadas amplia- mente sólo por los programadores expertos. Sin embargo, ya queestas habilidades juegan un pa- pel muy importante en la implementación efecti- vade los métodos, se ha incluido esta sección como una introducción a algunos de los elemen- tos de juicio que se deben considerar cuando se seleccione un método numérico y las herramien- tas para su implementación. Aunque no se espe- ra que en la primer ocasión se capten todos los beneficios, si se tiene la esperanza de que estos análisis influyan en la orientación cuando se pre- sente el material subsecuente. También se espera que si se enfrentan alternativasy algunos elemen- tos de juicio en el restodel libro,se consultará nue- vamente este material. La figura 1.4 ilustra siete factores o elementos de juicio que se deben tener en cuenta cuandose se- lecciona un método numérico para un problema enparticular. l. Tipodeproblemamatemático.Comoya se mencionó en la figura 1.2, en este libro se discu- ten varios tipos de problemas matemáticos: a. Raíces deecuaciones b. Sistemas de ecuaciones algebraicas lineales si- multáneas
  • 110. 102 MÉTODOS NUMÉRICOS PARA INGENIEROS ajuste de curvas d. Integración numérica e. Ecuaciones diferenciales ordinarias Probablemente el lector ya tenga algunos conocimientos básicos sobre la aplicación delos métodos numéricos al enfrentar alguno delos pro- blemas de la figura1.4. Los métodos numéricos se necesitaránya que los problemas no se pueden resolver eficientementeusando técnicas ana- líticas. Se debe estar consciente de que las actividades profesionales involucran, eventualmente, problemas en las áreas anteriores (Fig. 1.4). Por lo tanto, el estudio de los métodos numéricos y la selección de un equipo de cómputo'deben,al menos considerar estos problemas básicos. Los problemas más avanzados pueden requerir de habilidades en el manejo de soluciones de sistemas de ecuaciones algebraicas no lineales simultáneas, ajuste de curvas de varias variables, optimiza- FIGURA 1.4 Siete consideraciones para escogerun métodonumérico en la solucióndeproblemasdeingeniería.
  • 111. EPiLOGO PARTE I 103 ción de parámetros, programación lineal, problemas de valores pro- pios yecuacionesdiferencialesparciales. Estas áreasrequierende mayores esfuerzos computacionales y de métodos avanzados que no se cubren en este texto. Se pueden consultar algunas referencias ta- les como: Carnahan, Luther y Wilkes (1969); Hamming(1 973); Rals- tonyRabinowitz (1978) paraproblemasquevan más allá del contenido deeste libro. Además, alfinal de cada parte deeste texto, se incluye un breve resumen y referencias para los métodos avanza- dos para encaminarle en el estudio de consecución de métodos nu- méricos adicionales. 2. Tipo, disponibilidad, precisión,costo y velocidad de una computa- dora. Se tiene la oportunidad de trabajar con cuatro herramientas diferentes de cómputo (recuérdeseel cuadro 2.1). Que van desde una calculadora de bolsillo hastauna supercomputadora. De hecho, cual- quiera de las herramientas quese pueden usaren la implementación de un método numérico {incluyendo papel y>lápiz, que noestán in- cluidos en el cuadro). En general no s e trata de ultimar capacidades, sino costos, conveniencia, velocidad, seguridad, repetibilidad y pre- cisión. Aunque cada una delas herramientas enumeradasen el cua- dro 2.1 seguirán teniendo utilidad, los grandes avances recientes en el funcionamiento de las computadoras personales ya hantenido re- percusión en la profesión de ingeniero. Se espera que esta revolu- ción se siga extendiendo conforme los avances tecnológicos continúen, ya que las computadoras personalesofrecen un excelente término me- dio entre conveniencia, costo, precisión, velocidad y capacidad de almacenamiento. Más aún, se pueden aplicar útilmente a la mayor parte de los problemas prácticos de ingeniería. Las técnicas de este libro, por lo tanto, se escogieron expresamente para que sean com- patibles con esta clasede computadoras. 3. Costo en el desarrollo de programas contra el costo del software contra el costo del tiempo de ejecución, Una vez que se hayan identi- ficado los tipos de problemas matemáticos a resolver yel sistema de cómputo hayasido seleccionado, será apropiado considerar los cos- tos del software y del tiempo de ejecución. El desarrollo de progra- mas puede representar un esfuerzo adicional en muchos proyectos de ingeniería y por lo tanto ser de un costo significativo. A este res- pecto, es particularmente importante que seesté bien familiarizado con los aspectos teóricos y prácticos de los métodos numéricos rele- vantes. Se puede disponer de una cantidad limitada de programas desarrollados profesionalmente a alto costo para la solución de pro- blemas de ingeniería. Sin embargo, estos programas se deben usar con mucho cuidado, ya que en general no se esta familiarizado con la lógica delos mismos. Alternativamente, se puede disponer de pro- gramas de utilería general a bajo costo (tales como los que vienen
  • 112. 104 MÉTODOS NUMÉRICOS PARA INGENIEROS con este texto) para implementar métodos numéricos que se pueden adaptar fácilmente a una variedadmuy amplia de problemas. El cos- to del desarrollo de programas yel costo del softwarese puede recu- perar enel momento de la ejecución si los programas se han escrito y probado eficientemente. 4. Características de los métodos numéricos. Cuando el costo de los componentes electrónicos de una computadora y de sus programas es alto, o si la disponibilidad de la computadora está limitada (p. ej., ensistemas de tiempo compartido), la manera de escoger cuidado- samente el método numéricoayudara a adaptarse a tal situación. Por el otro lado, si el problema aún se encuentra en una etapa experi- mental yel acceso y costo de una computadora notienen problemas, entonces puede ser apropiado seleccionar un método numérico que siempre trabaje aunque quizás no sea, computacionalmente hablan- do, muy eficiente. Los métodosnuméricosdisponibles para resolver un tipo particular de problema, involucrantodos los factores mencio- nados,ademásde: a. Cantidad de condiciones o de puntos iniciales. Algunos de los mé- todos numéricos para encontrar raíces de ecuaciones o en la so- lución de ecuacionesdiferenciales,requierenqueelusuario es- pecifiquealgunascondiciones o puntosiniciales. Los métodos simples requieren, en general de un valor, mientras que los méto- dos complicados pueden requerirmás de un valor.Se deben con- siderar los elementos de juicio; las ventajasde métodos complicados que son computacionalmente eficientes pueden compensar los re- querimientos de múltiples puntosiniciales. Se debe echar mano delaexperienciayde los juicios paracadaproblema en par- ticular. b . Velocidad de convergenciu. Ciertos métodos numéricos convergen más rápido que otros. Sin embargo, la convergencia rápida puede requerir de máspuntosiniciales y de programación más compleja que la de un método con convergencia más lenta. Nuevamente se debe hacer uso de juicios para la selección de cierto método. ¡los más rápidosno siempreson los mejores! c . fstabilidad. Algunos métodos numéricos para encontrar raíces de ecuaciones o soluciones de sistemas de ecuaciones lineales, en al- gunos casos pueden divergir en vez de converger a la respuesta correcta. iPor quése debe toleraresta posibilidad si se ha diseña- do o se ha planeado bien el problema? La respuesta es que estos métodos pueden ser altamente eficientes cuando funcionan. Por lo tanto, surgen nuevamente los elementos de juicio. Se debe de- cidir si los requisitos del problema justifican el esfuerzo necesario para aplicar un método que no siempre funciona.
  • 113. EPíLOGO PARTE I 105 d. Exactitudy precisión. Algunos métodos numéricos, simplemente son más exactos y precisos que otros. Como ejemplos se tienen las di- ferentes ecuaciones disponibles para la integración numérica. En general, se puede mejorarel funcionamiento de métodos de poca exactitud disminuyendo el tamaño del paso o aumentando el nú- mero detérminos sobre un intervalo dado. 2Qué será mejor, usar un método con poca exactitud y con tamaños de paso pequeños o usar un método con altaexactitud y tamaños de paso grandes? Esta pregunta se debe analizar paso por paso considerando los factores adicionales tales como el costo y la facilidad de progra- mación. Además se deben tomar en consideración los errores de redondeo cuando se usan en forma repetida métodos de bajaexac- titud y el número de cálculos crece demasiado. Aquílas cifras sig- nificativas quemaneja la computadorapueden ser el factor decisivo. e . Alcance de las aplicaciones. Algunos métodosnuméricos sólo se pueden aplicara cierta clase de problemaso a los problemas que satisfacen ciertas restricciones matemáticas. Otros métodos no tie- nen estas restricciones. Se debe evaluar si vale la pena el esfuerzo de desarrollar programas que empleentécnicas apropiadas úni- camente para un número limitado de problemas.El hecho de que tales técnicas pueden usarse ampliamente, indica quetienen ven- tajas que a menudo son menos que las desventajas. Obviamente, deben evaluarse los elementos de juicio. f . Requisitos especiales. Algunas técnicas numéricas intentan incre- mentar la exactitud y la velocidad de convergencia usando infor- mación especial o adicional. Un ejemplosería el uso de valores estimados o valores teóricos de los errores para el mejoramiento de la exactitud. Sin embargo, estas mejorías, en general noseIle- van a cabo sin inconvenientes como el aumento enel costo de cóm- puto y el incremento en la complejidad del programa. g . Esfuerzos requeridos de programación. Los esfuerzos para mejo- rar la velocidad de convergencia, estabilidady exactitud pueden ser creativos e ingeniosos. Cuando se pueden hacer mejoras sin aumentar la complejidad en la programación,entonces se puede considerar que estas meioras son elegantes y probablemente en- cuentren uso inmediato en la ingeniería. Sin embargo, si requie- ren de programasmás complejos, otra vezse deben enfrentar los elementos de juicio que pueden o no favoreceral nuevo método. Se ve claro queel análisis anterior relacionado con la forma deesco- ger un método numérico se reduce sólo a costo y exactitud. Los cos- tos son los que están involucradoscon el tiempo de cómputo y el
  • 114. 106 MÉTODOSNUMÉRICOS PARA INGENIEROS desarrollo de programas. La exactitud apropiada es una cuestión de éticay de juicio profesional. 5. Comportamiento matemático de las funciones, ecuaciones o da- tos. AI seleccionar un método numérico en particular,el tipo de com- putadora y el tipo deprogramas, se debe tomarencuentala complejidad de las funciones y de las ecuaciones o datos. Las ecua- ciones simples y los datos uniformes se pueden manejar apropiada- mente con algoritmos numéricos simples y con computadoras baratas. Sucede lo contrario con las ecuaciones complicadas y los datos que contienendiscontinuidades. 6. Facilidad de aplicación (iAccesible al usuario?). Algunosmétodos numéricos son fáciles de aplicar y otros difíciles. Esto se debe tomar en cuenta cuando se escoge un método sobre otro. Esta misma idea se aplica a las decisiones referentes al costo en el desarrollo de pro- gramas, contra programas desarrollados profesionalmente. El con- vertir un programa difícil en uno que sea accesible al usuario puede ser de considerable esfuerzo.Las formas de hacerlose mencionan en el capítulo 2 y se elaboran a lo largo del libro. Además los progra- mas de NUMERICOMPque acompañan a este texto son un ejemplo de programación accesible al usuario. 7. Mantenimiento. Los programas para resolver problemas de inge- niería requierenmantenimiento porque durantelas aplicaciones ocu- rren dificultades, invariablemente. El mantenimiento puede requerir un cambio enel código del programao la expansión dela documen- tación. Los programas simples y los algoritmos numéricos son más fá- ciles de mantener. Los siguientes capítulos involucran el desarollo de varios tipos de métodos numéricos para una variedad de problemas matemáticos. Se dan en cada capítulovariosmétodosalternativos. Se presentan estos métodos (en vez de un método escogido por los autores) ya que no existe uno que sea "el meior" de todos. N o hay métodos "mejores" ya que existen tantos elementos de juicio que se deben tomar en consideración cuandose aplica un método a proble- mas prácticos. AI final de cada parte del libro se presenta una tabla que resalta los elementos de juicio involucrados en cada método. Es- ta tabla debe ayudara seleccionar un procedimiento numérico apro- piado para cada problema en particulardentrode un contexto. I.5 RELACIONES Y FóRMULAS IMPORTANTES El cuadro 1.2 resume la información más importante que se analizó en la parteI . El cuadro se puede consultar para tener un acceso rápi- do a las relaciones y fórmulas más importantes. El epílogo de cada parte del libro contiene estos resúmenes.
  • 115. EPiLOGO PARTE I- 107 CUADRO 1.2 Resumende la información importante presentada enla parte 1. Definiciones deerror Error verdadero = valor verdadero - valor aproximado Errorrelativovalorverdadera - valoraproximado porcentual verdadero % = Errorrelativo,aprox.actual - aprox.previa porcentual oproximado Criterios de poro Terminar los cálculoscuando: 100% valor verdadero €0 = 100% aproximación actuol €0 < 6, donde es es elerrorrelativoporcentual deseado,especificado directamente o calculado en términosdelnúmerodeseado de cifrassignificativas n = (0.5 X lo2-")% Serie de Taylor Expansiónen la serie de Taylor 2! 3! n! f(x,+,) = /(X,) + f'(x,)h + -h2 f Y X J +-f'"(x) h3 + . , . I fcn)(X!)hn + R, donde Residuo O R, = O(h"+') Diferenciación numérica Primeradiferencia f ( X , + l ) - f(x,) dividida finlta hacia f'(XJ = + O(h)h adelante (Otras diferencias divididas se resumen de la fig. 3.7 a la 3.9.) 1.6 MÉTODOS AVANZADOS Y ALGUNAS REFERENCIAS ADICIONALES El epílogo de cada parte del libro también incluye una sección enca- minada afacilitar y fomentar estudios adicionales delos métodos nu-
  • 116. 108 MÉTODOS NUMÉRICOS PARA INGENIEROS méricos. Esta sección dará algunas referencias sobre el tema así co- momaterial relacionadocon métodosmás avanzados.* Para extender los antecedentes mencionados en la parte I, existen nu- merosos manuales sobre programación de computadoras.Resultaría difícil mencionar todos los libros y manuales excelentes correspondien- tes a lenguajes y computadoras especificas. Además, probablemente ya se tenga material de contactos previos con la programación. Sin embargo, si ésta es la primer experiencia con computadoras, Bent y Sethares (1982) proporcionanunabuenaintroducción a BASIC. McCraken (1965))Merchant (1979)y Merchant, Sturgel (1977)son otros libros útiles sobre FORTRAN. El maestro o los compañeros de semestres avanzados del usuario deben poder darle unconsejo acer- ca de buenos libros de referencia para las máquinas y los lenguajes disponiblesen laescuela. También para el análisis de error, cualquier libro de cálculointroduc- tori0 incluira material suplementario relacionado con temas tales CO- mo la serie de Taylor. Los textos de Swokowski (1979)y Thomas y Finney (1979) proporcionan discusiones legibles de estos temas. Finalmente, aunque se espera que este libro sirva lo suficiente, siem- pre es bueno consultar otras fuentescuando se intenta conocer a-fondo un nuevo tema. Ralston y Rabinowitz(1978)y Carnahan, Luther y Wilkes (1969) ofrecen textos comprensibles de la mayor parte de los méto- dos numéricos, incluyendomuchos métodos avanzados que van más allá del alcance deeste libro. Otros libros útiles sobre el tema son Ge- rald y Wheatley (1984))James, Smith y Wolford (1977),Stark (1970)) Rice (1 983, Hornbeck (1975) y Cheney y Kincaid (1980). * Aquíúnicamente se hacereferenciaaestoslibros,unabibliografíacompleta se encontrará al final del texto.
  • 117. PART’E I ~ ~ DOS RAKES 11.1 DE ECUACIONES . . a Desde hace años, se aprendió a uiar la fórmula cuadrática: pura resolver f(x) = ax2 + bx + c = O ~ [11.2] A los valores calculados con la ecuiación (11.1) se les llama “raíces” de la ecuación (11.2).Éstos re- presentan los valores de x que hacen la ecuación (11.2)igual a cero. Por IS tanto, se puede definir la raiz de una ecuación como el valor de x que hace f (x) = O. Por esta razón, algunas veces a las raíces se les conoce comoceros de la ecuación. Aunque la fórmula cuadrática es útil para resol- ’ ver la ecuación (ll.2), hay muchas funciones dife- rentes que no se pueden resolver de manera tan fácil. En estos casos, los métodos numéricos des- critos en los capítulos 4 y 5 proporcionan medios eficientes para obtener la respuesta. , 13 II. 1 .l Métodos empleados antes de la era de la computadora pura determinar raíces. Antes deladvenimientode las computadoras digitales, había una serie de métodos para encon- trar las raíces de ecuaciones algebraicas o trascen- dentales. Para algunos casos, lasraíces se podían obtener con métodos directos, como se hace con la ecuación (11.1). Aunque había ecuaciones como ésta que se podían resolver directamente, había muchas otras que no lo eran. Por ejemplo, hasta una función aparentemente simple tal,como f (x) = e-” - x no se puede resolver analíticamente. En estos casos, la única alternativaes una técnica de solución aproximada. I _ ,A”.” -x/ .; ?.., L . U n método para obtener unasolución aproxima- da es la de graficar la función y determinar dón-
  • 118. 110 MÉTODOS NUMÉRICOS PARA INGENIEROS de cruza al eje x. Este punto, que representa el valor de x para el cual f (x) = O, es la raíz. Las técnicas gráficas se discuten al principio de los capítulos 4 y 5. Aunque los métodos gráficos son útiles en la obtención de estimacio- nes aproximativas de las raíces, están limitadaspor la carenciade pre- cisión. Una aproximación alternativa es usar la técnica de prueba y error. Esta"técnica" consiste enescojer un valor de x y evaluar si f (x) es cero. Si no es así (como sucederá en la mayor parte de los casos), se hace otra conjetura y se evalúa nuevamente f(x) para de- terminar si el nuevo valor da una mejor estimación de la raíz. El pro- ceso se repitehasta que se obtenga un valor que genere una f (x) cercana a cero. Estos métodosfortuitos,obviamentesonineficientes e inadecuados para las exigencias en la práctica de la ingeniería. Las técnicas des- critas en la parte Ill representan alternativas que no sólo aproximan sino emplean estrategias sistemáticas para encaminarse a la raíz ver- dadera.Además, se adaptanidealmentealaimplementación en computadoras personales.Tal como se presenta en las páginas siguien- tes, la combinación de estos métodos sistemáticos con la computado- ra hacen de la solución de la mayorparte delos problemas sobreraíces deecuacionesunatareasimpleyeficiente. 11.1.2 Raícesdeecuaciones y su práctica en laingeniería Aunque las raíces de ecuaciones caben dentro de otro contexto, fre- cuentemente aparecen enel área de diseño en ingeniería. El cuadro 1 1 . 1 muestra un conjunto de principios fundamentales que se utilizan frecuentemente en trabajos dediseño. Las ecuacionesmatemáticas o los modelos derivados de estos principios se emplean en la predic- ción de las variables dependientes en función de las variables inde- pendientes y de los parámetros. Nótese queen cada caso, las variables dependientes refleian el estado o funcionamiento del sistema, ya sea que los parámetros representen sus propiedades o su composición. Un ejemplo de tales modelos se presenta en la ecuación derivada de la segunda ley de Newton, usada en el capítulo 1 para la velocidad delparacaidista: [11.31 Donde la velocidadv es la variable dependiente,el tiempo t es la va- riable independiente y g la constante gravitacipnal, el coeficiente de rozamiento c y la masa m son parámetros. Si se conocen los paráme-
  • 119. RAíCES DE ECUACIONES 111 CUA,DRO 11.1 Principiosfundamentales usados en los problemas de diseño en ingeniería Principio VariableVariable fundamental dependiente independiente Parámetros Balance decalor Temperatura Tiempo y Las propiedades Dosición térmicas del material y la geometría del sistema Balance de material Concentración o tiempo y cantidad de posición masa Balance de la Magnitud y Tiempo y fuerza dirección de posición fuerzas para establecer el equilibrio Balance de Cambios en los Tiempo y la energía estados de la posición energía cinética y potencial del sistema Leyes deNewtonAceleración, Tiempo y del movimiento velocidad o posición posición El comportamiento químico del material, masa coeficientes de transferencia y la geometría del sistema Resistencia del material, propiedades estructurales y la configuración del sistema. Propiedades térmicas, masa del material y la geometría del sistema Masa del material, geometría del sistema y parámetros disipativos tales comola fricción o el rozamiento. Leyes de Corriente y Tiempo Propiedades Kirchhoff voltajeen los eléctricas del circuitos sistema,tales como eléctricos la resistencia, capacitanciae inductancia. tros, la ecuación (11.3)se puede usar para predecir la velocidad del paracaidista como una función del tiempo. Estos cálculos se pueden llevar a cabo directamente ya que v se expresa explicitamente como una función del tiempo.Esto es, está aislada a un lado del signo igual.
  • 120. 112 MÉTODOS NUMERICOSPARAINGENIEROS 11.2 Sin embargo, supóngase que se tiene que determinar el coeficiente de rozamiento paraun paracaidista de una masa dada, para alcan- zarunavelocidad prescrita enun periodo dado de tiempo. Aunque la ecuación (11.3)proporciona una representación matemática de la interrelación entre las variables del ,modelo y los parámetros, no se puede resolver explícitamente para el coeficiente de rozamiento. Pruébese. No hay forma de reordenar la ecuación para despejar c de un lado del signo igual. En estos casos, se dice que c es implicita. Esto representa un dilema real, ya que muchos de los problemas de diseñosen ingeniería, involucran la especificación de las propieda- des o la composición de un sistema (representado por sus paráme- tros) para asegurar que funciona de la manera deseada (representada por sus variables). Por lo tanto, estos problemas a menudo requieren que se determinen sus parámetros de forma explícita. La solución del dilema las proporcionan los métodos numéricos para raíces de ecuaciones.Pararesolver el problemausando métodos numéricos es conveniente cambiar la ecuación(11.3).Esto se hace res- tando la variable dependiente v de ambos lados de la ecuación, ob- teniendo: V [11.4] Por lo tanto, el valor de c que cumple f (c) = O, es la raíz de la ecua- ción. Este valor también representa el coeficiente de rozamiento que soluciona el problema de diseño. La parte I 1 de este libro analiza una gran variedad de métodos nu- méricos y gráficos para determinar raíces de relaciones tales como la ecuación (11.4).Estas técnicas se pueden aplicar a los problemas de diseño en ingeniería basados en los principios fundamentales deli- neados en el cuadro II.1 así como tantos otros problemas que se afron- tanfrecuentemente en laprácticadelaingeniería. FUNDAMENTOS MATEMÁTICOS En la mayor parte delas áreas mencionadas en este libro, en general existen algunos prerrequisitos de fundamentos matemáticos necesa- rios para conocer a fondoel tema. Por ejemplo, los conceptos de es- timación de errores y la expansión en serie de Taylor, analizadas en el capítulo 3, tienen importancia directaen el análisis de raíces de ecua- ciones. Adicionalmente, antes de este punto se mencionaron los tér-
  • 121. RAlCES ECUACIONES 113 minos de ecuaciones"algebraicas"y "trascendentales".Puede resultar útil definir formalmente estos términos y discutir como se re- lacionancon esta partedellibro. Por definición, unafunción dada pory = f (x)es algebraica si se pue- de expresar de la siguiente manera: fnyn + fn-1yn-1 + . . . + f i y + fo = o [11.5] donde las f son polinomios en x. Los polinomios son un caso simple de funciones algebraicas que se representan generalmente como: {(x) = a0 + UlX + * * . + a,x" C11.61 donde las a sonconstantes. Algunos ejemplosespecíficosson: {(X) = 1 - 2 . 3 7 ~+ 7 . 5 ~ ~ Y f(x) = 5x2 - x3 + 7x6 [11.7] [11.8] Una función trascendental es una que no es algebraica. Incluye fun- ciones trigonométricas, exponenciales, logaritmicas y otras menos fa- miliares. Algunos ejemplosson: f(x) = e-' - x [11.9] f(x) = sen x [11.10] f(x) = In x2 - 1 p1.1 1J Las raíces de las ecuaciones puedenser realeso complejas. Un ejem- plo simple de raícescomplejas es el caso para el cual el término b2 - 4 ac de la ecuación (II.1 ) es negativo. Por ejemplo, dado el po- linomio de segundo orden: f(x) = 4x2 - 16x + 17 La ecuación (11.1) se puede usar para determinar que las raíces son: 16 V(-16)2 - 4(4) (17) 16 * mX = 2 (4) -- 8 Por lo tanto,unaraíz es: x = 2 + ; ;
  • 122. 114 METODOS NUMERICOSPARAINGENIEROS 11.3 y la otra es: x = 2 - , i1 en donde i = J-" Aunque hay algunos casos donde las raíces complejas de las funcio- nes no polinomiales son de interes,ésta situación es menos común que para polinomios. Por lo tanto, los métodos estándar para encontrar raíces, en general caenen dos áreas de problemas parecidas en prin- cipio,perofundamentalmente diferentes: l. l a determinación de raíces realesde ecuaciones algebraicasy tras- cendentales. Estas técnicas se diseñaron para determinar el valor de una raízsimple de acuerdo a un conocimiento previo de su po- sición aproximada. 2. l a determinación ¿e todas las rakes reales y complejas de un po- linomio. Estos métodos se diseñaron específicamente para polino- mios. Determinan sistemáticamente todas las raíces del polinomio en lugarde simplemente una, dada una posiciónaproximada. Este libro está enfocado al área del primer caso.Los métodos diseña- dos expresamente para polinomios no se analizan ya que van más allá del alcance de este libro. Sin embargo, enel epílogo al final de laparte I I se recomiendanalgunas referencias para estas técnicas. Antes de proceder con los métodos numéricos para determinar raí- ces de ecuaciones, seráútil dar algunasorientaciones. El siguiente ma- terial es una introducción a los temas de la parte ll. Además, se han incluido algunos objetivos que orientarán al lector en sus esfuerzos al estudiar el material. 11.3.1 Campodeacción yavance La figura 1 1 . 1 es una representación esquemática de la organización de la parte It. Examine esta figura cuidadosamente, iniciando en la parte de arriba y avanzandoen el sentido de las manecillas del reloj. Después de esta introducción, el capítulo 4 desarrolla los métodos que usanintervalos para encontrarraíces. Estos métodos empiezan con suposiciones que encierran o que contienen a la raíz y reducensiste- máticamente el ancho del intervalo. Se cubren dos métodos: el de bi-
  • 123. RAiCES DE ECUACIONES 11s sección y el de la regla falsa. Los métodos gráficos proporcionan conocimiento visual de las técnicas. Se desarrollan formulaciones es- peciales para ayudar a determinar cuanto esfuerzo computacionalse requiere para estimar la raíz hasta un nivelde precisiónpreviamente especificado. En el capítulo 5 se cubren los métodos abiertos. Estos métodos tam- biéninvolucraniteraciones sistemáticas de prueba y error pero no
  • 124. 116 MÉTODOS NUMERICOSPARAINGENIEROS requieren que la suposicióninicial encierre a la raíz. Se descubrirá que estos métodos, en general son más eficientes computacional- mente que los métodos que usan intervalos, pero no siempre traba- jan. Se analizan los métodos de la iteración de punto fijo, el método de Newton-Raphson y el método de la secante. Los métodos gráficos proporcionanconocimiento en los casos donde los métodosabier- tos no funcionan. Se desarrollan las fórmulas que proporcionan una idea de qué tan rápido un método abierto converge a la raíz. El capítulo 6 extiende los conceptos anteriores a los conceptos actua- les de la ingeniería. Los casos de estudio se emplean para ilustrar las ventajas y las desventajas de cada uno de los métodos y para pro- porcionar conocimiento sobre las aplicaciones de las técnicas en la práctica profesional.Los casos del capítulo 6 también resaltan los ele- mentos de juicio (estudiadosen la parte I) asociados con cada uno de los métodos. Se incluye un epílogo al final de la parte II. Éste contiene una compa- ración detallada delos métodos discutidos en los capítulos 4 y 5. Esta comparación incluye una descripción delos elementos de juicio rela- cionados con el uso correcto de cada técnica.En esta sección se pro- porcionatambién un resumende las fórmulasimportantes,con referencias a algunos métodos numéricos que van más allá del alcance de este texto. Ciertas capacidades automáticas de cálculose integran dediferentes maneras en la parteII. En primer lugar, programasen NUMERICOMP legibles para el usuario del método de bisección disponible para la Apple I 1 y la IBM PC. Pero también se dan los códigos en FORTRAN Y BASIC para el método de bisección directamente en el texto. Con estosetiene la oportunidad de copiar y aumentar el código para im- plementarlo en su propia computadorapersonal o supercomputadora. Se incluyen los algoritmos y diagramas de flujo para la mayor parte de los otros métodos expuestos en el texto. Este material puede servir de base para el desarrollo de un paquete de programación y apli- carloauna serie deproblemasdeingeniería. 11.3.2 Metas y objetivos Objetivos de estudio. Después de terminar la parte 11, se debe tener la suficiente información para aprovecharsatisfactoriamente una am- plia variedad de problemas de ingeniería que se relacionan con las raíces de ecuaciones. En términos generales se dominarán las técni- cas, se habrá aprendido a valorarsu confiabilidad y se tendrá la ca- pacidaddeescoger el mejor método (o métodos)paracualquier problema en particular. Además de estasmetas globales, se deben
  • 125. RAíCES DE ECUACIONES 117 asimilar los conceptos específicos de el cuadro 11.2 para comprender mejor el materialde laparte It. Objetivos de computación. El libro proporciona algunos programas simples, algoritmos y diagramas de fluio para implementar las técni- cas analizadas en la parte II. Como herramientas de aprendizajeto- dos ellos tienen gran utilidad. Los programas opcionalesson legibles para el usuario. Incluye méto- dodelabisecciónparadeterminar las raíces realesde las ecua- ciones algebraicas y trascendentales. Las gráficasasociadascon NUMERICOMP le facilitarán al lector visualizar el comportamiento de la función en análisis. Los programas se pueden usar para deter- minar convenientementelas raíces de las ecuaciones a cualquier gra- do deprecisión. Es fácilde aplicar NUMERICOMP pararesolver muchos problemas prácticosy se puede usar para verificarlos resul- tados de cualquier programa que el usuario desarrolle porsí mismo. También se proporcionan directamente en el texto los programas en FORTRAN y BASIC para los métodosdebisección y para la itera- ción simple de punto fijo. Además,se proporcionan algoritmos y dia- gramas de fluio generales para la mayor parte delos otros métodos de la parte 11. Esta información permitirá aumentar la biblioteca de programas del usuario que sean más eficientes que el método de la bisección. Por ejemplo, puede desearsetener sus propios programas para los métodos de la reglafalsa, Newton-Raphson y de la secante, que en general sonmás eficientes que el métododebisección. CUADRO 11.2 Obietivos de estudio específicos de la parte II 1. Entender la interpretación gráfica de una raíz 2. Conocer la interpretación gráfica del método de la regla falsa y por qué,en general, es superior al método de bisecciones. 3. Entender las diferencias entre los métodos que usan intervalos y los métodos abiertos para la localización de las raíces. 4. Entender los conceptos de convergencia y de divergencia. Usar el método de lasdos curvas para proporcionar una manifestación visual de los conceptos. 5. Conocer por qué los métodos que usan intervalos siempre convergen, mientras que los métodos abiertos algunas veces pueden divergir. 6. Entender que la convergencia en los métodos abiertos esmás probable si el valor inicial está cercano a la raíz. 7. Entender el concepto de convergencia lineal y cuadrática y sus implicaciones en la eficiencia de los métodos de iteraciones de punto fijo y de Newton- Raphson. 8. Saberlas diferencias fundamentales entre los métodos de la regla falsa y la secante y cómo se relaciona su convergencia. 9. Entender los problemas que contienen lasraíces múltiples y las modificaciones que se les pueden hacer para resolverlos a medias.
  • 126. C A P í T U L OC U A T R O MÉTODOS QUE USAN INTERVALOS En este capítulo sobre raíces de ecuaciones se analizan los métodos que aprovechan el hecho de que una función, típicamente,cambia de signo en la vecindad de una raíz.A estas técnicasse les llamamétodos que usan intervalos porque se necesita de dos valores iniciales para laraíz. Como su nombre lo indica, estos valores deben “encerrar”o estar uno de cada lado de laraíz. Los métodos particulares descritos sobre este punto em- plean diferentes estrategias para reducir sistemáticamente el tamaño del intervalo y así, converger a la respuesta correcta. Como preámbulo de estas técnicas, se discutirán los métodosgráfi- cos para graficar funcionesy sus raíces. Además dela utilidad de los mé- todosgráficosparadeterminarvaloresiniciales,tambiénsonútilespara visualizar las propiedades de las funcionesy el comportamiento delos mé- todosnuméricos. 4.1 MÉTODOS GRÁFICOS Un métodosimplepara obtener unaaproximación a laraíz de la ecua- ción f (x) = O consiste engraficarlafunción y observar en dondecruza el eje x. Este punto, que representa elvalorde x paraelcual f (x) = O, proporcionaunaaproximacióninicial de laraíz. EJEMPLO 4.1 Métodos gráficos Enunciado del problema: empléense gráficas para obtener unaraíz apro- ximada de lafunción f (x) = e-x - x. Solución: se calculan los siguientesvalores:
  • 127. 120 METODOS NUMERICOS PARA INGENIEROS X f(x) 0.0 1.000 0.2 0.619 0.4 0.270 0.6 -0.051 0.8 -0.351 1.o -0.632 Estos puntos se muestran en la gráfica dela figura 4.l.La curva resultan- te cruza al eje x entre 0.5 y 0.6. Un vistazo a la gráfica proporciona una aproximada estimación de laraíz de 0.57, que se acerca a la raíz exacta de 0.567 143 28. . ., que se debedeterminarconmétodos numéricos. La validez de la estimación visual se puede verificar sustituyendosu valor enla ecuación originalpara obtener: f(0.57) = e-057- 0.57 = -0.004 5 lacual se acerca a cero FIGURA 4.1 Metodo gráfico para la solución de ecuacionesalgebraicas y trascen- dentales. Representaciónde flx) = e-x -x contra x. La raíz corres- ponde al valor dex donde f(x) = O, esto es, el punto donde lafunción cruza el eje x. Una inspección visual de la gráfica muestra un valor aproximado de 0.57.
  • 128. METODOS QUE 121 FIGURA 4.2 Ilustraciónde las formas que puede tener una raíz en un intervalo pres- crito por los límites infe- rior, x, y superior x,. Los incisos a) y b) indican que siAx,) y f (x,) tienen el mismo signo, entonces no habrá raíces dentro del intervaloo habrá un número par de ellas. Los incisos c) y d) indican signosopuestos en los extremos,entonces ha- brá un número impar de raícesdentrodelin- tervalo. que sif ( 4 Y Ax,) t'lenen Las técnicas gráficas tienen un valor práctico limitado ya que no son precisas. Sin embargo, los métodos gráficosse pueden usar para obtener aproximaciones de la raíz. Estas aproximaciones se pueden emplear co- mo valores iniciales paralos métodosnuméricos analizados eneste capí- tulo y en el siguiente. Porejemplo, los programas de NUMERICOMP que acompañan este texto le permiten graficar funciones sobre un rango es- pecífico. Esta gráficapuede hacerse seleccionando un par de valores ini- ciales de un intervalo donde está contenida laraíz antes de implementar el m&& num6rico.l a posibilidad de graficar aumenta considerablemente lautilidad de losprogramas. Las interpretaciones geQmétricas, además de proporcionar aproxima- ciones iniciales de la raíz, son herramientas importantes en el asimilamiento delaspropiedades de lasfuncionespreviendolasfallasdelosmétodos numéricos. Por ejemplo, lafigura 4.2 muestra algunas formas diferentes enlasquelaraíz puede encontrarse en un intervalo definido porun lími- te inferior x, y un límite superior x,. La figura 4.2b bosqueja el caso don- de los valores positivo y negativo de f (x)y f (x,)tienen signos opuestos respecto al eje x, encierrantresraícesdentrodelintervalo. En general, si f (x,)y f (x,)tienen signos opuestos, existe un número impar de raíces dentro del intervalo definido porlos mismos. Como se indica en la figura 4.2a y c, si f (x,)y f (x,) tienen elmismo signo, nohay raíces o hay un númeropar de ellasentrelosvalores dados. Aunque estas generalizacionessonusualmenteverdaderas,existen casos en queno se cumplen.Por ejemplo, las raices múltiples, esto es, funciones tangencialesal eje x (Fig.4 . 3 ~ )y las funciones discontinuas(Fig. 4.3b) pueden no cumplir estos principios.Un ejemplo deuna función que tieneuna raízmúltiple es la ecuacióncúbica f (x) = (x - 2)(x - 2) (x - 4). Nótese quex = 2 anula dos vecesal polinomio, de ahí quea x se le conozca como raíz múltiple. Al final del capítulo 5, se presentan técni- casqueestándiseñadas expresamente paralocalizarraícesmúltiples. La existencia de casos deltipomostradoenlafigura 4.3 dificultael desarrollode algoritmos generales que garanticenla localización de todas las raíces en el intervalo. Sin embargo, cuando se usanlos métodos expuestos enlassiguientesseccionesenconjunciónconesquemasgráficos,sonde granutilidadenlasolución de problemasdemuchas raíces, fre- cuentemente se presentan enel área deingeniería y matemáticasapli- cadas. I EJEMPLO 4.2 Uso de gráficasporcomputadoraparalocalizarraíces Enunciado del problema: las gráficas por computadora pueden informar y acelerarlos esfuerzos para localizar raíces de unafunción. Este ejemplo se desarrollóusando los programasdeNUMERICOMPdisponiblescon .J
  • 129. 122 METODOSNUMERICOSPARAINGENIEROS FIGURA 4.3 Ilustracióndealgunas excepciones de los casos generales mostradosen lafigura 4.2.a) Pueden ocurrir raícesmúltiples cuandolafunción es tangencia1 al eje x. En estecaso, aunque los extremos son de signos opuestos, hay unnúme- ropar de raícesenel intervalo. b)Las funciones discontinuasendonde losextremostienensig- nos opuestos también contienen un númeropar de raíces. Se requieren estrategias especiales pa- radeterminar lasraíces enestoscasos. FIGURA 4.4 Escalamientoprogresivo def (x) = sen 1Ox + cos 3x mediante la computadora. Estas gráficas interactivas le permiten al analista determinar que exis- ten dos raíces entre x = 4.2 y x = 4.3. el texto. Sin embargo, de esta manera esposible entender cómo la grafi- cación por computadora ayuda a localizar raíces. La función: !(x) = sen lox + cos 3x tiene varias raíces sobre el r.qngo de x = -5 hasta x = 5. Empléese la opción de graficacióndel programa paraprofundizar en el comportamiento de esta función. Solución: Como se ilustró en el ejemplo 2.1, se puede usar NUMERI- COMP para graficar funciones. En la figura 4.4a se muestra la gráfica de f(x)desde x = -5 hasta x = 5.La gráfica muestra la existenciade varias
  • 130. MÉTODOS QUE 123 raíces, incluyendo posiblemente una doble alrededorde x = 4.2 en don- de f (x) parece ser tangente al eje x. Se obtiene una descripción más de- talladadelcomportamiento de f (x) cambiando el rangodegraficación desde x = 3 hasta x = 5, como se muestraenlafigura 4.4b. Finalmen- te, enlafigura 4.4c, se acorta la escala vertical a f (x) = -0.15 y f (x) = 0.15 y lahorizontal a x = 4.2 y x = 4.3. Estagráficamuestra clara- mente queno existe una raíz en esta regióny que, en efecto, hay dos raí- ces diferentesalrededorde x = 4.229 y x = 4.264. Las gráficasporcomputadoratienengranutilidadenelestudio de los métodos numéricos. Esta habilidad también puede aplicarse en otras materias así como enlasactividadesprofesionales. 4.2 MÉTODO DE BlSECClÓN Cuando se aplicaron las técnicas gráficas, enel ejemplo 4.1, se observó (Fig. 4.1) que f (x) cambió de signo hacia ambos lados de laraíz.En ge- neral, si j (x) es real y continua enelintervalode x1 a x, y f(xl)y f(x,) tienensignos opuestos, esto es, FIGURA 4.5 Algoritmo de la biseccion. -"l.." .... . . _" - "...
  • 131. 124 MÉTODOSNUMÉRICOS PARA INGENIEROS entonces hay, al menos una raíz real entre x, y x,. LOSmétodos de búsqueda incremental se aprovechan de esta carac- terística para localizar un intervalodonde la función cambie de signo. Por lo tanto, la localización del cambio de signo (y por ende, de la raíz), se logra más exactamente dividiendo el intervalo en una cantidad definida de subintervalos. Se rastrea cada uno de estossubintervalos para encon- trar el cambio de signo. El proceso se repite y la aproximación a la raíz mejora cada vez más a medida que los subintervalos se dividen en inter- valos más y más pequeños. Seestudia más sobre e¡ tema de búsquedas incrementales en la sección 4.4. El método de bisección, conocido también como de cortebinario. de partición en dos intervalos iguales o método de Bolzano, es un método de búsqueda incremental donde el intervalo se divide siempre en dos. Si la función cambia de signo sobre un intervalo, se evalúa el valor de la función en el punto medio. La posición de la raíz se determina situán- dola en el punto mediodel subintervalo dentro del cual ocurreun cambio de signo. El proceso se repite hasta obtener una mejor aproximación.La figura 4.5 muestra un algoritmo para la bisección y en la figura 4.6 se muestra un bosquejo gráfico del método. EJEMPLO 4.3 Bisección , Enunciado del problema: úsese el método de la bisección para determi- ;nar la Paíz de'j(x) =e "x - x. Solución: Recuérdesede acuerdo a la gráfica de la función (Fig.4.1)que la raíz se encuentra entre O y 1.Por lo tanto, el intervalo inicial se puede escoger desde x/ = O hasta x, = 1.Por consiguiente, la estimación ini- 'cia1 de la raíz se sitúa en el punto medio de este intervalo: i O + l X, = -= 0.5 2 Esta estimación representa un error de (elvalor exacto es 0.567 14329. , .) E, = 0.567 143 29 - 0.5 = 0.067143 29 o, en términos relativos: = I 143 29 1100% = 11.8% 0.567 143 29
  • 132. METODOS QUEUSANINTERVALOS 125 FIGURA 4.6 Gráficadel método de bisección. Esta gráfica incluye las primeras tres iteraciones del ejemplo 4.3. donde el subíndicev indica que el errores con respectoal verdadero. Ahora se calcula: f(0)f(0.5) = (1)(0.10653) = 0.106 53 que es mayor de cero, y por consiguiente no hay cambio de signo entre x/ y x,. Y por lo tanto, laraíz se encuentra dentro del intervalo x = 0.5 y x = 1.Ellímiteinferior se redefine como x, = 0.5, y la aproximación a laraízenla segundaiteración se calcula como: 0.5 + 1.0 2 = 0.75 le,/ = 32.2%
  • 133. 126 MÉTODOS NUMERICOS PARA INGENIEROS 5 El proceso se puede repetir para obtener aproximaciones más exactas. Por ejemplo, la terceraiteración es: f(0.5)f(0.75) -0.030 < O Por lo tanto, laraíz está entre 0.5 v 0.75: x, = 0.75 0.5 + 0.75 2 = 0.625 /E,[ = 10.2% Y la cuarta iteración es: f(0.5)f(0.625)= -0.010 < O Por lo tanto, laraíz está entre 0.5 y 0.625: x, = 0.625 El método se puede repetir para alcanzar mejores estimaciones.La figura 4.6 muestra una gráfica de las primeras tres iteraciones. En el ejemplo anterior, se puede observar queel error real no dismi- nuye con cada iteración. Sin embargo,el intervalo dentro del cual se lo- caliza la raíz se divide ala mitad en cada pasodel proceso. Comose estu- diaráen la próxima sección, la longituddelintervaloproporciona una aproximación exacta del límite superior del error en el método debisección. 4.2.1 Criterios de paro y estimación de errores El ejemplo 4.3 finaliza con la opción de repetir el método para obtener una aproximación más exacta de la raíz. Ahora se debe desarrollar un criterio objetivo para decidir cuando debe terminar el método. el error se encuentre por debajo de algún nivel prefijado. Se puede ver en el ejemplo 4.3, que el error relativo bajó de un 11.8a un 4.69% du- rante los cálculos. Puede decidirse que el método termine cuando seal- cance un errormásbajo,porejemplodel 0.1%.Esta estrategia es inconveniente ya que la estimación del erroren el ejemplo anteriorse ba- só en el conocimiento del valor exacto de laraíz de la función. Este no Una sugerencia inicial puede ser de que terminen los cálculos cuando .
  • 134. METODOS 127 es el caso de una situación real ya que no habría motivo para usar elmé- todo siya se supiese laraíz. Por lo tanto, se requiere estimarel error de manera tal que no incluya el conocimientoprevio de laraíz.De maneraanáloga a como se ve en la sección 3.3, se puede calcular el error relativo aproximado € , d ela si- guientemanera [recuérdese la ecuación (3.5)]: donde es laraíz de la iteraciónactual y xYteriores elvalordela raíz de la iteraciónanterior. Se usaelvalorabsolutoya que, en general importa sólo lamagnitudde E , sin considerar su signo. Cuando I E, I es menorque un valorpreviamente fijado, quedefineelcriterio de paro, el programa se detiene. EJEMPLO 4.4 Estimación del error para el método de la bisección Enunciado del problema:úsese la ecuación (4.2) paraestimarelerror delasiteracionesdelejemplo 4.3. Solución: las primeras dos estimaciones de laraízenel ejemplo 4.3 fue- ron 0.5 y 0.75. Sustituyendo estos valoresenla ecuación (4.2)se obtiene: 0.75 - 0.5 lea' = 1 0.75 1100% = 33.3% Recuérdese queel error exacto para la raíz estimada de O.75 es del 32.2%. De esta manera, E, es mayor que E , . Este comportamientose muestra en lasotrasiteraciones Iteraci6n Xr I 4 ?fío /%It O h 1 0.5 2 3 4 5 11.8 O.75 32.2 33.3 0.625 10.2 20.0 0.56250.819 11.1 0.593754.695.3
  • 135. 128 MÉTODOS NUMÉRICOS PARAINGENIEROS FIGURA 4.7 Errores delmétodode bisección. Se grafican los errores verdadero y aproximado contra el número de iteraciones. Estosresultados,juntocon los de lasiteracionessubsiguientes se resu- menenlafigura 4.7. Lanaturaleza“desigual”delerrorreal se debe a queparaelmétodode la bisección laraíz exacta se encuentra en cual- quier lugar dentro del intervalo.Los errores verdaderoy aproximado son casi igualescuando el intervalo está centrado sobrela raíz. Cuando la raíz se encuentra cerca de un extremo.del intervalo, entonces los errores son muy diferentes. I Aunque el error aproximado no proporciona una estimación exacta delerror verdadero, lafigura 4.7 sugiereque E , capta la dirección des- ,endente de E,. Además, la gráficamuestraunacaracterística muy inte- resante; que E, siempre es mayor que E,. Por lo tanto, cuando E, es menor que E, los cálculos se pueden terminar con la confianza de saber que laraíz es al menos tan exacta como elnivel específicoprefijado. Aunquesiempre es dañinoaventurarconclusiones generales de un sólo ejemplo, se puededemostrarque E, siempreserámayorque E, en
  • 136. METODOS QUE USAN INTERVALOS 129 el método de bisección. Esto se debe a que cada vez que se encuentra una aproximación a laraíz usando bisecciones como x, = (xr+ (x,)/2, se sabe que laraíz exacta cae en algún lugar dentro de intervalo (x, - xr)/2= b / 2 . Por lo tanto, laraíz debe situarse dentro de f A x/2 de la aproximación (Fig. 4.8). Por ejemplo cuando se terminó el ejemplo 4.3 se pudo decir definitivamente que: X, = 0.562 5 -+ 0.062 5 FIGURA 4.8 Tres formas diferentes en que un intervalo puede agrupar a la raíz. En a) el valor verdadero cae en el centro del intervalo, mietras que en b) y c) el valor se acerca a uno de los extremos. Nótese que la diferencia entre el valor verdaderoy el punto medio del intervalojamás sobrepasa la longitud media del intervalo, o Ax/2. FIGURA 4.9 Esauema gráfico del porqué la estimación del error en el método de bi- sección (Ax/2) esequivalente a laestimaciónactualdelaraíz (xrnueuo) menos la estimación anterior de la raíz
  • 137. 130 MÉTODOS NUMÉRICOS PARA INGENIEROS Debido a que A x/2 = xnUevo- Xanierior (Fig. 4.9), la ecuación (4.2) proporciona un límitesuperior exacto sobre elerror real. Para que se rebase este límite, laraíz reai tendría que caer fuera del intervalo que la contiene, lo cual, pordefiniciiin jamás ocurriráenelmktododebisec- ciijn. El ejemplo 4.7 muestra otras técnicas de localización de raíces que no siempre se portantan eficientes. Aunque el método de bisección, en general es más lento que otrosmétodos, la elegancia del análisis de error, ciertamente es un aspectopositivo que puede hacerlo atractivo paracier- tas aplicaciones de la ingeniería. 4.2.2 Programación del método de bisección Elalgoritmodelafigura 4.5: ahora se presenta en un programaque se muestraenlafigura 4.10. El programausaunafuncicin (línea 100)que facilita la localizaciónde laraíz y lasmodificaciones a la función. Ade: más, se incluye la línea 200 para verificar la posibilidad de divisiones por cero durante la evaluacióndelerror.Tal caso se presenta cuando el in- tervaloestácentrado respecto al origen. En este caso, la ecuación (4.2) es infinita. Si esto ocurre, el programa salta sobre la evaluación del error para esa iteraci6n. El programa de la figura 4.10 no es muy legible para el usuario; está diseñado únicamente para calcular la respuesta, elusuario debe hacerlo más fácil de usar y de entender. Dentro del paquete de NUMERICOMP asociado con este texto se proporciona un ejemplo de un programa legi- blealusuariopara encontrar raíces de ecuaciones. El siguienteejemplo F<X )nEXPC -X )-X 1 ~ .Ut& F N F I 1 E X P I -. X J -- R E I D < S , l ) X L ~ X U ~ E S , l U F O R M I T < 3 F l O . O , I S ) 1 1 , : ~ INPIJT ~ L , X I J . F ~ ,IM-" AR-FC XL )*F< XU ) 1 2 r j IF FN F i X L ) FN FCXLII , = XL,XU = límites inferiot'y XR-( XL+XU )/2 I F( L R . C E . O . 0 ) COTO 3 1 0 DO 240 N I G ! , I M W-F<XL )*F(XR > I Fí I f i . E P . O . 0 ) COTO 300 l d 0 1F AA = O THEN 300 I F <&A. LT. O , O )XU=XR 17G IF AA ,. ( 6 1Hb.N XIJ = YR XN-< XL+XU )/2 I F (fifi.CT,O.O)XL-XR 180 16 Ah .I c:) THEN XL = XU I F< X N . E Q . O . O X O T O 230 Efi-ABS< < XN-XR )LXN )*1 00 211:l E A = A B 5 ( 1 h N - XRI / XNI f I F <EA.LT.ES)COTO280 1< I ü XR = estimacióninicial de la (Función a la cual se le va a calcular la raíz)Y 1 2 0 NR = (XL + klJ) I c- i k FOR N I Y TI.¡ 111 1st) AA = F N F(XI.) * F NF ( k R ) O THEN 310 superior ES = error porcentual aceptable IM= numero máximo de Iteraciones. 190 kN = i k L + XU1 / 2 (Verifica si XL y XU encierran una raiz) 230 XR-XN 240 CONTINUE 2 ~ o ~ n f i ~ ( '';NO S EE N C U N T R OL f + . R I I Z ' ) P'nj PRINT "NO SF ENCON'TRU L A R A I ? " 3 F O R M A T < '' , 2 F 1 0 . 3 ) 2eo MRITE(6,4!XN.Efi.NI 4 F O R U R T ( ', 2 F 1 0 . 3 , 1 5 ) 3 6 , r PRINT "ILA R A I L E I A C I A FS =":X.R EA = error porcentual COTO 3 1 0 3 0 0 U R I T E ( 6 , S ) X R 5 FORMnT(' ' , ' L AR A 1 Z EX(ICT0 ES = ' , F l 0 . 3 ) (Prueba de error) 3 1 0 STOP raíz A.AOAH = LN M R I T E ( 6 . 2 ) 74*:,NEXT N I U R I T E < C , 3 ) X R , E f i lol:, PRINT YR,€A COTO 3 1 0 (Evaluaciónparadetermcnar que subintervalo contiene a laraizl XN = nueva aproximación aL/O GUTO 31o .!:u, PRINT kN.EA.NI .. ._.. 2"o c.010 310 la raíz ilir END calculado END FIGURA 4.10 Programapara el método de bisección.
  • 138. METODOS QUE 131 muestra el uso de NUMERICOMP para encontrar raíces. También propor- ciona una buena referencia para valorary examinar los programas del usuario. EJEMPLO 4.5 Localización de raícesusando la computadora Enunciado del problema: asociado con los programas de NUMERICOMP, se encuentra un programa legible al usuario sobre el métodode bisección. Se puedeusaresteprogramapararesolver un problema de diseño asociado con el ejemplo del paracaidista analizado en el capítulo 1. Co- mo se recordará, la velocidad del paracaidista está dada, enfuncióndel tiempo, de lasiguiente manera: [E4.5.1] donde u es la velocidaddelparacaidistaencentímetrospor segundo, g es la constante gravitacionalcuyovalor es 980 cm / s2, m es la masa del paracaidista cuyo valores 68 100 g y c es el coeficiente de rozamien- to. Enel ejemplo l.1 se calculó la velocidad del paracaidista en función del tiempo para valores dadosde m,c y g. Sin embargo, supóngase que se desea controlar el movimiento del paracaidista de tal forma que se al- cance una velocidad prefijada en caída libre despuésde un tiempo dado. En este caso, se debe seleccionar un valor apropiado de c que satisfaga los requisitos de diseñocuando se mantengan constantesm,g, t y u. Una ojeada a la ecuación a (E4.5.1)muestra quec no se puede calcular explí- citamente en función de lasvariables conocidas. Supóngase que se de- sea que la velocidaddelparacaidista alcance un valorde 4 O00 cm/s después de7 s. De esta manera, se debe determinarun valor de c tal que: [E4.5.2] con t = 7 S y u = 4 O00 cm/s. Solución: para implementar el método de BISECCIÓN, se requiere ob- tener un intervaloinicialque contenga alvalor de c quesatisfaga la ecuación (E4.5.2).Es conveniente seleccionar este intervalo conjuntamente con la opción de graficación de BISECCIÓN que viene con el disco (op- ción 3). El programapregunta los valoresmínimo y máximo de x y de f (x) generando lagrdficamostradaenlafigura 4.1l a despuésque se han introducido las dimensionesde la gráfica. Puede verse que existe una raíz entre 10 O00 y 15 O00 g/s. El programa BISECCIÓN pregunta porun límite máximo de iteracio- nes permitido, un error de convergencia E , y un límite inferior y superior
  • 139. 132 MÉTODOS NUMERICOS PARA INGENIEROS FIGURA 4.1 1 a) Gráfica de la ecuación (E 4.5.2)b)Resultados para determinar el coe- ficiente de rozamiento usando BISECCION enel problemadelpara- caidista. para la raíz. La figura 4.1lb muestra estos valores, junto con la raíz cal- culada de 11643.14g / s. Nótese que con 16iteraciones se obtiene un valor aproximado a laraíz con un error menor de E,. Más aún, la com- putadora muestra una verificación del error de: f(11643.14) = 1.025391X lo-' para confirmar los resultados. Si la exactitud que se requiere no se hubie- ra alcanzado con el número especificado de iteraciones, entonces el al- goritmo habría terminado después de 30 iteraciones. Estos ;esultados están basados enel algoritmo simple del método de BISECCION con el uso'de rutinas de entraday salida legibles al usuario. El algoritmo usado es similar al de la figura 4.10. El usuario debe estar listo para escribir sus propios programas sobre el método de bisección. Si tiene los programas de NUMERICOMP, entonces los puede usar co- mo modelo y para verificar que sus programas sean adecuados. I 4.3 MÉTODO DE LA REGLAFALSA Aunque el método debisección es una técnica perfectamenteválida para determinar raíces, su enfoquees relativamente ineficiente. Una alternati-
  • 140. METODOS QUE USAN INTERVALOS 133 va mejorada es ladel método de lareglafalsaestábasadoenunaidea paraaproximarse en forma máseficiente a laraíz. Un defecto del método debisecciónesque aldividir el intervalo xI a x, enmitades iguales, no se toma en consideración lamagnitudde f(x()y de f(x,).Por ejemplo, si f(XI) está mucho más cerca de cero que f (xu),es lógico que laraíz se encuentra más cerca de xIque de x, (Fig. 4.12). Este método alternativo aprovecha laideade unir los puntos con una línearecta. La intersección de esta línea conel eje x proporcionauna mejor estimación de la raíz.El reemplazamiento dela curva por una línea recta dauna“posiciónfalsa”de la raíz,de aquí el.nombrede método de la reglafalsa o en latín, regula falsi. También se le conoce como méto- do de interpolaci6nlineal. Con el uso detriángulos semejantes (Fig. 4.12), la intersecciónde la línearecta y el eje x se puedecalcularde la siguiente manera: que se puede resolverDara (véaseel recuadro4.1 para mayores detalles) FIGURA 4.12 Esquema gráfico del método de la regla falsa. La fórmula se deriva de los triángulos semejantes (áreas sombreadas). ~ ~ ” ~ . - ~ .I - l _ . . * _ ” , ~ - . . ” l l ” ” . ” ”-. ^ _ , ~ . -”.. -.”
  • 141. 134 METODOS NUMtRICOSPARA INGENIEROS RECUADRO 4.1 Derivacióndelmétodo de lo regla falso Multiplicandoencruzla ecuación (4.3) se obtiene: sumando y restando x, del lado derecho: Dividiendo entre - f (x"): xuf(x1) - x,f(xu) f(X/) - f(xu) xr = x, = xu- f(xu>(x/- xu) f (XI) - f(xJÉsta es unaformadel método de la regla falsa. Nótese que esto permite cualcular laraíz x, en función de los 1:- que es igual a la ecuación (4.4).Se usa esta forma ya que manera alternativa, expandiéndola: analizadoen el capítulo 5. mites inferior, Y superiorxu. Se puede Ordenar de una es directamente con el método de la secante Esta es lafórmula de laregla falsa. El valor de xr, calculado con la ecua- ción (3.4), reemplazaa uno de los dos valores, x, o a x, queproduzca un valordelafunción que tenga elmismosigno de f (x,). De esta ma- nera, los valores xly x, siempre encierran a laraíz. El proceso se repite hasta que la aproximación a la raíz sea adecuada. El algoritmo es idénti- co al de la bisección (Fig.4.6)con la excepción de que la ecuación (4.4) se usa en los pasos 2 y 4. Además, se usan los mismos criterios de paro [(Ec. (4.2)] para detener los cSlculos.
  • 142. b M ~ O D O SQUE USAN INTERVALOS 135 Solución: como enel ejemplo 4.3, inícieme los cálculos con los valores iniciales x, = O y x, = 1. Primeraiteración: x, = o j(x,>= 1 X, = 1 f(x,) = -0.632 12 El errorrelativoreal se puedeestimar como: 1 4 = 0.567 143 29 - 0.6127 I loo% = 8.0% 1 0.567 143 29 1 Segunda iteración: Por lo tanto, laraíz se encuentra dentro delprimersubintervalo y x, se convierte enellímite superior de la siguiente iteración, x, = 0.6127. x/= o f h ) = 1 x, = 0.612 7 f(x,) -0.070 8 X, = 0.612 7 - -0.070 8(0 - 0.612 7) 1 - (-0.070 8) = 0.572 19 E, = 0.89% El erroraproximado se puede calcular como: I 4 = 0.572 19 - 0.612 7 = 7.088 I 0.572 19 Se puedenllevar a cabo iteraciones adicionales para mejorar la estima- cióndelaraíz. Puede emitirse una opinión más completa sobre la eficiencia relativa de los métodos de bisección y de la regla falsa al observar lafigura 4.13 que muestra gráficas del error relativo porcentual de los ejemplos 4.3 y 4.6, Nótese cómo el error decrece mucho más rápidamente parael mé-
  • 143. 136 METODOS NUMÉRICOS PARA INGENIEROS FIGURA 4.13 Comparación de errores relativos de los métodos de la regla falsa y de btsecciones para f (x) = e' - x. todo de la regla falsa que para el de bisecciones ya que el primero es un esquema más eficientepara lalocalizaciónde raíces. Recuérdese que en el método de bisecciónelintervaloentre x/y x, decrece durante los cálculos. Por lo tanto, el intervalo dado por A x/ 2 = ~ x, - x,!,'2 proporciona unamedidadelerroren estas aproximacio- nes. Estenoesel caso paraelmétodode lareglafalsaya queuno de los extremospuede permanecer fijo a lo largode los cálculos, mientras que el otro converge a laraíz. Como enel caso, del ejemplo 4.4 donde el extremo inferior xise sostuvo en cero, mientras que x, convergió a la raíz.En tales casos, el intervalono se acorta, sinoque se mantiene más o menos constante. El ejemplo 4.6 sugiereque la ecuación (4.2)representa un criterio deerror muy conservador. De hecho, la ecuación (4.2) constituyeuna aproximación dela discrepancia dela iteraciónpreuia. Esto se debe a que para cada caso, tai como enel ejemplo 4.6, donde el método converge rápidamente (porejemplo, elerror se reducecasi unaordendemagni-
  • 144. METODOS 137 tud por iteración), la iteraciónactual es unaaproximaciónmucho mejor alvalorrealdelaraízqueelresultadodelaiteraciónprevia xYterior.Por lo tanto, el numerador de la ecuación (4.2)representa la di- ferencia dela iteración previa.En consecuencia,hay confianza que cuando se satisface la ecuación (4.2), laraíz se conoce conmayorexactitud su- perando la toleranciapreestablecida.Sin embargo, como se veenla si- guiente sección, existen casos donde la regla de la posición falsa converge lentamente. En estos casos la ecuación (4.2)no es confiable y se debe desarrollar un criteriodiferentede paro. 4.3.1 Desventajasdelmétododelareglafalsa Aunque el método de la regla falsa pareciera siempre ser el mejor de los que usan intervalos,hay casos donde funciona deficientemente.En efec- to, como enel ejemplo siguiente, hay ciertos casos donde el método de biseccióndamejoresresultados. EJEMPLO 4.7 Un caso donde el método de bisecciónes preferible alde4a'reglafalsa Enunciado del problema: úsense los métodos de bisección y de la regla falsaparalocalizar laraíz de: entre x = O y x = 1.3. Solución: usando bisección, losresultados se resumen como: 1 O 1.3 0.65 35 2 0.65 1.3 - 0.975 2.533.3 30.975 1.3 1.1375 13.814.3 4 0.975 1.1375 1.05625 5.6 7.7 5 0.975 1.05625 1.O15625 1.64.0 De esta manera, después de cinco iteraciones.El error verdadero se reduce a menos del 2%. Con laregiafalsaseobtiene un esquema muy diferente
  • 145. 138 METODOS NUMERICOS PARA INGENIEROS 1 O 1.3 0.09430 90.6 2 0.09430 1.30.18176 81.848.1 3 0.18176 1.3 0.26287 73.730.9 4 0.26287 1.30.3381 1 66.222.3 5 0.33811 1.3 0.40788 59.217.1 ~~~ ~ Después de cinco iteraciones,el error verdadero se ha reducidoai 59%.Ade- más, nóteseque 1 E, 1 < 1 eV 1 . De estaforma, el erroraproximado es engañoso. Se puede obtenermayor información examinando unagráfica de la función. En la figura 4.14 la curva viola una hipótesis sobre la cual I FIGURA 4.14 Gráfica de la función f(x) = x" - 1 , ilustración de la convergencia lenta del método delareglafalsa.
  • 146. MhODOS QUE 139 se basa la regla falsa; esto es, si f (x1)se encuentra mucho miis cerca de cero que f (x,), entonces laraíz se encuentra más cerca a x1 que x, (re- cuérdese la figura 4.12). De acuerdoa la gráficade esta función,la inver- sa es verdadera. El ejemplo anterior ilustra que en general no es posible hacer gene- ralizacionesrelacionadascon los métodos de obtención de raíces. Aun- que un método como el de laregla falsa, en generalessuperiar al de bisección, hay, invariablemente casos especiales que violanlas conclu- siones generales. Por lo tanto, además deusarla ecuación (4.2),los re- sultados se pueden verificar sustituyendo la raíz aproximada en la ecuación originaly determinarsi el resultado se acerca a cero. Estas pruebasse de- benincorporarentodos los programas que localizan raíces. 4.3.2 Programa para el método de la regla falsa Se puededesarrollardirectamente un programapara lareglafalsa a partir del código del métodode bisección de la figura 4.10. La única mo- dificación es la de sustituir la ecuación (4.4)en las líneas 130 y 190. Ade- más, la prueba contracero sugerida en la última sección, también se debe incorporar enel código. 4.4 BúSQUEDASCONINCREMENTOS DETERMINANDOUNA APROXIMACIóNINICIAL Ademásdeverificarunarespuestaindividual, se debedeterminar si se han localizado todas las raíces posibles.Como se mencionó anteriormen- te, en general, unagráficadelafunciónayudaráen esta tarea. Otra opción es incorporar unabúsqueda incrementalal principio delprogrma. Consiste enempezaren un extremode laregióndeinterés y realizar evaluacionesde la funcióncon pequeños intervalos a lo largodela re- gión. Cuando lafuncióncambiade signo, se suponeque unaraíz cae dentro del incremento. Los valores dex de los extremosdel intervalopue- denservirdevaloresinicialesparauna de las técnicas descritasen este capituloqueusanintervalos. Un problema aunado a los métodos de búsquedas incrementales es el de escoger lalongituddel incremento. Si lalongitud es muy pequeña, labúsquedapuedeconsumirdemasiado tiempo. Por el otro lado, sila longitud es muy grande, existe la posibilidadde que las raícesmuy cerca- nas entresí pasen desapercibidas (Fig.4.15). El problema se combina con
  • 147. 148 , METODOSNUMÉRICOS PARA INGENIEROS FIGURA 4.15 Casos donde las raíces se pueden brincar debidoa que las longitudes de los intervalos en los métodos de búsquedas incrementalesson de- masiado grandes. Nótese quela últirna raízes múltiple y se iba a brin- car independientemente de la longitud del incremento. la posible existencia de raíces múltiples. Un remedio parcial para estos casos en calcular la primera derivada de la función f' (x) en los extremos del intervalo. Si la derivada cambia de signo, entonces puede existir un máximo o un mínimo en ese intervalo,lo que sugiere una búsqueda más minuciosa para detectar la posibilidad de una raíz. Aunque estas modificaciones, o el empleo deun incremento muy fi- nopueden solucionar enparte el problema,sedebeaclararque los métodos sencillos tales como el de búsqueda incremental no son infali- bles. Se debe tener conocimiento de otras informaciones que profundi- cen en la localización de raícesa fin decomplementar las técnicas automáticas. Esta información se puede encontrar graficando la función y entendiendo el problema físico de donde se originó la ecuación. PROBLEMAS Cálculos a mano 4.1 Determínenselasraícesreales de: f(x) = - 0 . 8 7 4 ~ ~+ 1 . 7 5 ~+ 2.627 a) GrSrficamente b) Usando la fórmulacuadrática c) Usando el método de bisección hasta tres iteraciones para determinar la raíz m& alta.Empléensecomovaloresiniciales xi = 2.9 y x, = 3.1.Calcúlese elerror es- timado ea y el errorverdadero E,, despuésdecadaiteración.
  • 148. METODOS QUE USAN INTERVALOS 141 . . 4.2 4.3 4.4 4.5 4.6 4.7 Determínense las raíces reales de f(x) =-2.1 + 6 . 2 1 ~- 3 . 9 ~ '+ 0 . 6 6 7 ~ ~ a) Gráficamente b) Usando bisección para localizar la raíz más pequeña. Empléense como valores iniciales x, = 0.4 y x, = 0.6 e itérese hasta que el error estimado F, se encuentre abajo de t , = 4% Determhense las raíces reales de: f(x) = -23.33 + 7 9 . 3 5 ~ " 8 8 . 0 9 ~ ~+ 4 1 . 6 ~ ~- 8 . 6 8 ~ ~+ 0 . 6 5 8 ~ ~ a Gráficamente b) Usando bisección para determinar laraíz más alta para es = 1 W . Empléese co- mo valores iniciales x, = 4.5 y x , = 5. c) Realícense los mismos cálculos de b) pero usando el método de la regla falsa. Determínense las raíces reales de: f(x) = 9.36 - 21.963~+ 16.2965~'- 3 . 7 0 3 7 7 ~ ~ a) Gráficamente b) Usando el método de la reglafalsa con unvalor de es correspondiente a tres' cifrassignificativas para determinar laraíz más baja. Localícese la primer raíz diferente de cero de tanx = 1.1.x donde x está en radia- nes. Úsese una técnica gr6fica y bisección con valores iniciales O. l y O.G. Realícen- se los cálculos hasta que E, sea menor del es = 10%.Verifíquense también los errores sustituyendo la respuesta final en la ecuación original. Determínese laraíz real de In x = 0.5 a) Gráficamente b) Usando el método de bisección con tres iteraciones y valores iniciales x) = 1 y x, = 2. c) Usando el método dela regla falsa con tres iteraciones y los mismos valores ini- ciales del inciso anterior. Determínese laraíz real de: 1 - 0 . 6 ~ f(x) = X i a) Analíticamente b) Gráficamente C)Usando el método dela regla falsa con tres iteraciones y valores iniciales de 1.5 y de 2.0. Calcúlese el error aproximado E, y el error verdadero E, después de ca- da iteración.
  • 149. 142 MÉTODOS NUMÉRICOS PARA INGENIEROS 4.8 Encuéntrese laraíz cuadrada positiva de 10 usando el método de lareglafalsa con E, = 0.5 % . Empléense los valoresiniciales de x, = 3 y x, = 3.2. 4.9 Encuéntrese laraízpositivamás pequeña dela función (x está dada en radianes): x' 1 sen XI = 4 usando el método dela regla falsa. Para localizarlaregión en que cae la raíz,pri- mero grafíquese la funciónparavalores de x entre O y 4. Realícense los cálculos hasta que eo haga que se cumpla es = 1 B. Verifíquese la respuesta final sustitu- yéndolaen la funciónoriginal. 4.10 Encuéntrese laraízrealpositiva de: !(x) = x4 - 8 . 6 ~ ~- 35.51~'+ 464x - 998.46 usando el método de laregla falsa. Úsese unagráficaparadeterminar los valores iniciales y realizar los cálculos con e, = O. 1 % . 4.11 Determínese laraízreal de: f(x) = x3 - 100 a) Analíticamente b) Con el método de lareglafalsa con es = 0.1 % 4.12 La velocidaddelparacaidista está dadapor la fórmula: donde g = 980. Para un paracaidista de masa m = 75 O00 g calcúlese el coefi- cientederozamiento c con u = 3600 cm/s en t = 6 s. Úseseelmétodo de lareglafalsa paradeterminar c con es = O. 1 %. Problemas para resolver con computadora 4.13 Vuélvase a programar lafigura 4.10 de forma tal que sea máslegible al usuario. Entreotras cosas: a) Documéntese indicando la funciónde cada secciór. b) Etiquétense las entradas y lassalidas c) Agréguese unaprueba que verifique si los valoresiniciales x, y x,, encierran a laraíz. d) Agréguese unapruebadeverificaciónpara que laraíz obtenida se sustituyaen la ecuación originalpara comprobar si el resultado final se ace:ca a cero. 4.14 Pruébese el programa del problema 4.13 duplicando los cálculos del ejemplo 4.3. 4.15 Úsese el programa del problema 4.13 pararepetirdesde el problema 4.1 al 4.6.
  • 150. MÉTODOS QUE 143 4.16 Repítanse los problemas 4.14 y 4.15 usando los programas de NUMERICOMP dis- ponibles con el texto. Úsense las capacidades gráficas de este programa para verifi- car los resultados. 4.17 Úsense los programasdeNUMERICOMP para encontrar las raíces reales de dos funciones polinomiales cualesquiera. Grafíquense las funciones sobre un rango de- finido para obtener los límitesinferior y superior de las raíces. 4.18 Repítase el programa 4.17 usando dos funciones trascendentales 4.19 En este problema se usan solamente las capacidades gráficas de los programas NU- MERICOMP disponiblescon el texto. LOSprogramas trazan la función sobre inter- valos más y más pequeños para incrementar la cantidad de cifras significativasque se quieraestimar una raíz. Empiécese con f(x) = e-' sen (10 x). Grafíquese la funcióncon un rango a escala completa desde x = O hasta x = 2.5. Estímese laraíz. Trácese nuevamente la funciónsobre el rango x = 0.5 a x = 1.0.Estí- mese laraíz. Finalmente, grafíquese la función sobre un rango de 0.6 a 0.7. Esto permiteestimar laraíz con dos cifrassignificativas. 4.20 Desarrólleseun programa legible al usuario para el método de la regla falsa basado en la sección 4.3.2. Pruébese el programa con el ejemplo 4.6. 4.21 Úsese el programadelproblema 4.20 paraprobar los cálculos del ejemplo 4.7. Realícense corridas de 5, 10,15 y más iteraciones hasta que elerrorrelativo porcentualsea menor delO.1%. Grafíquense los errores relativos porcentualesapro- ximados contra el número de iteraciones sobre papel semilogarítmico.Interpréten- se los resultados.
  • 151. C A P í T U L O C I N C O MÉTODOS ABIERTOS En los métodos del capítulo anterior que usan intervalos, laraíz se en- cuentra dentro del mismo, dado porun límite inferior y otro superior. La aplicación repetida de estos métodos siempre genera aproximacionesmás y más cercanas ala raíz. A tales métodos seles conoce comoconuergen- tes ya que se acercan progresivamente a laraíz a medida que crece el número de iteraciones (Fig. 5.la). FIGURA 5.1 Esquema gráfico de las diferencias fundamentales entrelos métodos que usan intervalos a) y los métodos abiertosb) y c) en la localización deraí- ces.Ena), que ilustra elmétodo debisección, la raíz está registrada dentro del intervalo dodo por x, y x,. En contraste, con los métodos abiertos, ilustrados en b) y c), se usa una fórmula para proyectarxi a xi+, con un esquema iterativo. De esta manera, el método puede divergirb) o con- verger c) rápidamente, dependiendo del punto inicial.
  • 152. 146 MÉTODOS NUMÉRICOS PARA INGENIEROS En contraste con éstos, los métodos abiertos que se describen en este ca- pítulo, se basanenfórmulasquerequierende un solo valor x o de un par de ellos pero que nonecesariamenteencierran a la raíz. Como tales, algunas veces diuergen o se alejan dela raíz a medida quecrece el núme- ro de iteraciones (Fig. 5.lb). Sin embargo, cuando los métodos abiertos convergen (Fig. 5.IC),en general lo hacen mucho más rápido que los mé- todos que usan intervalos.Se empieza el análisis de los métodos abiertos con unaversiónsimple que es útil parailustrarsuforma general y tam- bién parademostrar el concepto de convergencia. 5.1 ITERACIóN DE PUNTOFIJO Como se mencionó anteriormente,los métodosabiertosempleanunafór- mulaqueprediceunaaproximación a laraíz.Talfórmula sepuededesa- rrollarparalaiteracióndepunto fijo,rearreglando laecuación f(x)=O de talformaque x quede delladoizquierdo de la ecuación: x = [5.11 Estatransformaciónsepuedellevar a cabo mediante operaciones alge- braicas o simplemente agregando x a cada lado de la ecuación original. Por ejemplo: x 2 - 2 x + 3 = o sepuedereordenarpara obtener: x2 + 3 í! x=”- mientrasquesen x = O puedetransformarseenlaformadelaecuación (5.1)sumándole x a ambosladospara obtener: x = senx + x La utilidad de laecuación (5.1)es que proporciona una fórmula para predecir un valor de x en función de x. De esta manera, dada un aproxi- macióninicial a la raíz, xi, la ecuación (5.1)se puedeusarparaobtener unanuevaaproximación xi+l,expresada porlafórmulaiterativa: Como con otras fórmulas iterativas del libro,el error aproximado de esta ecuación se puedecalcularusandoelestimador de error [Ec. (3.5)1:
  • 153. MhODOS ABIERTOS 147 EJEMPLO 5.1 Iteración de puntofijo Enunciadodelproblema:úseseiteración de puntofijoparalocalizar la raíz de f(x) = e “x “x. Solución: lafunción se puede separardirectamente y expresarse enla forma de ecuación (5.2)como = e-”.Empezandocon un valor ini- cial de x,,=-O, se puedeaplicarestaecuacióniterativa y calcular: I Iteraci6n. i X O 1 2 3 4 5 6 7 8 9 10 O 1.oooooo 0.367879 0.692201 0.500473 0.606244 0.545396 0.57961 2 0.5601 15 0.571 143 0.564879 1O0 76.3100.0 35.1171.8 22.146.9 11.838.3 6.8917.4 2.205.90 1.243.48 O.7051.93 0.3991.1 1 3.8311.2 I Deesta manera, cada iteración acerca cada vez más alvalorestimado con elvalorverdadero de laraíz, o sea 0.567 143 29. RECUADRO 5.1 Convergencia de la iteración de punto fiio AI analizar la figura 5.3, se debe notar que la iteración de punto fijo converge si en laregión de interés g’ ( x ) < 1. En otras palabras, la convergencia ocurre silamagnitud de la pendiente de g ( x ) es menor que la pendiente de la líneaf(x ) = x. Esta observaciónse puede demostrar teóri- camente. Recuérdese que la ecuación aproximada es: Xi+l = g(xi) Supóngase que la solución verdadera es: x, = S(&) Restando estas dos ecuaciones se obtiene: xr - Xi+l = g(xJ - g(xJ [B5.1.1] En el cálculo, existe un principio llamado teorema del valor medio (sección3.5.2).Dice que si una función g ( x ) y su primeraderivadason continuas sobre un intervalo a < x <b, entonces existe un valor de x = { dentro del intervaloparael que: [B5.1.2] El lado derecho de esta ecuación es la pendiente de la lí- nea que une ag ( a ) y g ( b ) , De esta manera, el teorema del valor medio dice que hay al menos un punto entre a y b que tiene una pendiente, denotada por S({), que es paralelaa la línea que une g(a)con g(b) (Fig. 3.5). Ahora, si se hace a = xi y b = x, el lado derecho de la ecuación (B5.1.2)se puede expresar como:
  • 154. 148 MÉTODOS NUMÉRICOS PARA INGENIEROS S k r ) - g(xJ = (xr - Xi) g ‘ ( 8 Por consiguiente,si g’ ( ) < 1, entonces los errores de- crecen. con cada iteración. Si g’ ( < ) > l, entonces los donde 4 se encuentra enalguna Parte dentro de x, Y x,. errores crecen. Nótesetambién que sila derivada es posi- Este resultado se puede sustituir en la ecuación (B5.1.2) tiva,los emores serán positivos, y por lo tanto, la solucióo para obtener: iterativaserá monótona (Figs. 5.3a y c). Si la derivada es [B5.1,31 negativa, entonces los errores oscilarán (Figs. 5.3b y d). Un corolario de este análisisdemuetra que cuando Si elerrorverdaderoparalaj-ésimaiteración se definecomo:el método converge, el error es casi proporcional a y me- nor que el error delpaso anterior. Por esta razón, la itera- X, - xi+1 = (X, - xi) S’([) Et,! = x, - xi ción de puntofijo se dice que es linealmenteconuergente. entonces la ecuación (B5.1.3)se convierte en: Et,i+l = S’(() Et,¡ 5.1.1 Convergencia Nótese que el error relativo exacto en cada iteración del ejemplo 5.1 es casi proporcional (porun factor de 0.5a 0.6) al error dela iteración ante- rior. Esta propiedad,conocida como convergencia lineal, es característi- ca de la iteración de punto fijo. En el recuadro 5.1 se presenta una base teóricapara esta observación. FIGURA 5.2 Dos métodos gráficos alternativos paro determinar la raíz de f(x) = e ‘-x. a) Raíz en el punto donde ésta cruza aleje x; b) raíz en la intersección de las funciones componentes. -
  • 155. METODOS ABIERTOS 149 Además de la “velocidad” de convergencia, se debe hacer hincapié en estemomentosobre la“posibilidad” de convergencia. Los conceptos de convergencia y de divergenciase pueden ilustrar gráfi- camente. Recuérdese que enla sección 4.1 se graficóunafunciónpara visualizar su estructuray su comportamiento(Ej.4.1).Esta función se vuel- ve a graficarenlafigura 5.2a. Un planteamientográficodiferente es el desepararlaecuación f ( x ) = O endospartes, como en: f l k ) = f2 (x) Entonces las dos ecuaciones: Y1 = fl(4 r5.31 Y Y2 = f2 (x) P.41 se pueden graficar porseparado (Fig.5.2b). Los valores dex correspon- dientes a las intersecciones de estas funciones representan las raíces de f(x) = o. EJEMPLO 5.2 El método gráfico de dos curvas Enunciado del problema: sepárese la ecuación e “x - x = O endospar- tes y determínese suraíz gráficamente. Solución: reformúlese la ecuación como yl = x y y2= e -’. Calcúlense los siguientesvalores: X Y1 Y2 0.0 0.0 1.O00 0.2 0.2 0.819 0.4 0.4 0.670 0.6 0.6 0.549 0.8 0.8 0.449 1.o 1.o 0.368 Estos puntos se gráfican en la figura 5.2b. La intersecciónde las dos cur- vas indica una aproximación dex = 0.57, que correspondeal punto donde la curvaoriginal en lafigura 5 . 2 ~cruzaal eje x.
  • 156. 150 METODOS NUMERICOS PARA INGENIEROS El método de las dos curvas se puede usar ahora para ilustrar lacon- vergencia y divergenciade la iteración de puntofijo. Enprimerlugar,la ecuación (5.1) se puedeexpresar como un par de ecuaciones: y , = x y y2= g (x). Estasdos ecuaciones se pueden gra- ficar por separado. Tal fue el caso de las ecuaciones (5.3)y (5.4) las raí- ces de f(x) = O sonigualesalvalordela abscisa enla intersección de las doscurvas. Enlafigura 5.3se graficanlafunción y , = x y cuatro esquemas diferentesde la función y2= g(x). FIGURA 5.3 Esquema gráficode la convergenciaa)y b) y la divergencia c) y d) de la iteración de punto fino. A las grafips a) y c) seles conoce como patrones monótonos, mien- tras que a b) y d) seles conoce.como patrones oscilatorios o en espiral. Nótese que la convergencia se obtiene cuando 1 g’(x) 1 < 1. __I__ _LI_I_-^.. ~
  • 157. MnODOS ABIERTOS lb1 Enelprimer caso (Fig. 5.3~4,elvalorinicial x, se usaparadetermi- narelpuntocorrespondientealacurva yz, [xg,g(xo)].El punto [x1,xl] se encuentra moviendo la curva y1 a la izquierda y horizontalmente.Es- tos movimientossonequivalentesa laprimeraiteracióndelmétodo de punto fijo: De esta manera, enla ecuación y enla gráfica se usa un valorinicial x. para obtener laaproximación xI. La siguienteiteraciónconsiste en mo- versealpunto [xl,g (xl)]b después a [x2,x2]. Estaiteración es equiva- lentea la ecuación: Lasoluciónenlafigura 5.3a es convergente ya que la aproximación de x se acerca mása laraíz con cada iteración. Lo mismo se cumplepara lafigura 5.3b. Sin embargo, éste no es el caso para las figuras 5 . 3 ~y d, en donde las iteraciones divergen de la raíz. Nótese que la convergencia ocurreúnicamentecuandoelvalordelapendientede y2 = g ( x ) es me- nor alvalor de la pendiente de yI = x, esto es, cuando 19' ( x ) I c 1. Enel recuadro 5.1 se presenta una derivación teórica de este resultado. 5.1.2 Programaparalaiteración de punto fijo El algoritmopara la computadora de la iteracióndepuntofijoes extre- madamente simple. Consisteen un ciclo que calcula iterativamente nue- vas aproximaciones junto con una declaración lógica que determina cuando se hacumplidoelcriterio de paro. FORTRAN f 1 so I70 2 a 1 0 a F O R M h T C ', Z F I 0 . 3 , I S f U R I T E ~ 6 . 3 ? X N , E A , N I STOP END BASIC 1X I I Iü 1213 130 140 150 160 1.70 180 I90 200 210 220 ,lFunc16n a la que se desea calcular la raizl ES = errorporcentualaceptable XN = aproximact6n a laraíz INPUrXR.ES. Ill FORNI = 1 TU In I F XN = 0, THEN 170 XN = FN FCXR) IM = numeromaxmodeiteraclones E A = AB5 ( I X N - XR) I XN) e-. EA = aproximaci6nporcentualdel I FE A = ES THEN 210 -(pruebade 1W error NEXT NI PRINT"NO SE ENCONTRO L A R A I L " END P R I N TX N . E A . N I XR = XN NINI - I FIGURA 5.4 Programa parala iteración de punto fijo.Nótese que este algoritmo general es similar al de los métodos abiertos.
  • 158. 152 METODOS NUMERICOS PARA INGENIEROS En la figura 5.4se presentanlos programas enFORTRAN Y BASIC para el algoritmo. Se pueden programar de manera similar otros métodos abier- tos,simplementecambiando la fórmula iterativa (declaración 130). 5.2 MÉTODO DE NEWTON-RAPHSON Tal vez, dentro delas fórmulas paralocalizar raíces, la fórmula de Newton- Raphson (Fig. 5.5), sea la más ampliamente usada. Si el valor inicial de la raíz-es x,, entonces se puede extender una tangente desde el punto [x;, f (xi)].El punto donde esta tangente cruza al eje x representa una aproximación mejorada a la raíz. El método de Newton-Raphson se puede derivar geométricamente (una forma de hacerlo es mediante el uso de la serie de Taylor, descrita en el recuadro 5.2).Como en la figura 5.5, la primera derivada en x es equivalente a la pendiente. que se puede reordenar para obtener: a la que se conoce como fórmula de Newton-Raphson. FIGURA 5.5 Esquemagráfico del métododeNewton-Raphson. Se extrapolauna tangentea la función enel punto xi [esto es, f'(x;)] hasta el eje x pa- ra obtener una estimación de la raíz en x,+ !. _l__l ~~.~~
  • 159. METODOS ABIERTOS 153 EJEMPLO 5.3 Método de Newton-Raphson Enunciadodelproblema:úseseelmétododeNewton-Raphsonpara calcular laraíz de e "x - x empleando elvalorinicialde x. = O. Solución: laprimeraderivada de lafunción se puedeevaluar como: f'(x) = -e-x - 1 que se puede sustituir, junto con lafunciónoriginalen la ecuación (5.6) para dar: p i - xi h Xi+l = xi - -e-x' - - J , 1 Empezandoconelvalorinicial x. = O, se puede aplicar la ecuación ite- rativaparacalcular: O 1O0 0.500000000 11.8 0.566311003 0.147 0.567143165 0.0000220 0.567143290 <10 Deesta manera, el planteamientoconvergerápidamente a laraíz real. Nótese que el error relativo en cada iteración decrece mucho más rápido que comolo hace la iteración de punto fijo (compárese con el ejemplo5.1). 5.2.1 Criterios de paro y estimación de errores Como con los otros métodos de localización de raíces, la ecuación (3.5) se puede usar como un criterio deparo. Además, la derivación delméto- docon la seriedeTaylor(recuadro 5.2) proporciona un conocimiento teórico relacionado con la velocidaddeconvergenciaexpresado como: Ei+ = O (Ei*).De esta forma, elerrordebesercasiproporcional al cua- drado del error anterior.En otras palabras,el número de cifras significati- vas se duplica aproximadamenteen cada iteración. Este comportamiento se examina enel siguiente ejemplo.
  • 160. 154 METODOS NUMERICOS PARA INGENIEROS RECUADRO5.2 Derivación y análisis del error del método de Newton-Raphson a partir de la serie de Taylor Además de laderivación geométrica [ecuaciones (5.5) y 0 = f(Xi) + f'(Xi) (xr - Xi) (5.6)],el método de Newton-Raphson se puede derivar también con eluso de la serie Taylor. Esta derivación al- f"(O ternativa es muyútil en el sentido de que muestra laDe- + 2(xr- X,)' [B5.2.3] netración en la velocidad de convergencia del método. L~ ecuación (B5.2.2) se puede restar de la ecuación puede representar como: Recuérdese delcapítulo 3 que la serie de Taylor se (85.2.3) para obtener: f"(47 + -(x~+I- X¡)' [B5.2.1] 2 L [B5.2.4] en donde t: se encuentraen parte de1intervaloen- Ahora, notando que el es igual a la diferencia entre tre xiy xi+,. Truncando la serie de Taylor después de la primera derivada, se obtiene unaversión aproximada: xi+l y elvalor real, x, como en: f(Xi+l) -- f(Xi) + f '(Xi)(X¡+l - Xi) Ev.i+l=xr"xi+l En la intersección con el eje x,f(xi+,) debe ser igual a ce- ro, o: y la ecuación (B5.2.4)se puede expresar como: 0 = f(Xi) + f '(Xi)(Xi+l - Xi) [B5.2.2] [B5.2.5] L que se puede resolver para: que es idéntica a la ecuación (5.6).De esta forma, se ha derivado el método de Newton-Raphson usando la serie de Taylor. Además de la derivación, la serie de Taylor se puede usar para estimarel error de la fórmula. Esto se puede lo- grar alutilizar todos los términos de la ecuación B5.2.1 con el resultado exacto. Por esta situación xi+l= x,, en donde x, es elvalor exacto de laraíz.Sustituyendo este valor, junto con f(x,) = O en la ecuación (B5.2.1)se obtiene: Si se supone que hay convergencia, entonces xi y t: se deberían aproximar a laraíz x,, y la ecuación (B5.2.5) se puede reordenar para obtener: [B5.2.6] De acuerdo a la ecuaci6n (B5.2.6)el errores casi propor- cional al cuadrado del error anterior. Esto significa que el número de cifras decimales correctas se duplica aproxi- madamente en cada iteración. A este comportamientose lellama conoergencia cuadráfica. El ejemplo 5.4 ilustra esta propiedad. EJEMPLO 5.4 Análisis de error en el método de Newton-Raphson Enunciado del problema: como se dedujo enel recuadro 5.2, el método de Newton-Raphson es convergente cuadráticamente. Esto es, el error es aproximadamente proporcional al cuadrado del error anterior, dado por: CE5.4.11
  • 161. MÉTODOS ABIERTOS 1SS Examínese esta fórmula y véase si es aplicable a los resultados del ejem- plo 5.3. Solución: laprimeraderivada de !(x) = e ”x es: f ‘(x) = --e-’- 1 que se puedeevaluaren x,= 0.567 143 29 para dar: f’(0.567143 29) = -1.567143 29 Lasegundaderivada es: fff(x)= e-x que se puede evaluar, para obtener: f’(0.567143 29) = 0.567143 29 Estos resultadosse pueden sustituir en la ecuación (E5.4.1)para obtener: 0.567 143 29 EV l + l,’ =- Z(”1.567 143 29) E v , i 2 O € , , i t 1-- 0.180 95 E,,i2 Del ejemplo 5.3, el error inicial fue de Et,0= 0.567 143 29, que se pue- de sustituirenla ecuacióndelerrorpara obtener: E,,l 0.18095(0.56714329)2 = 0.058 2 que se acerca al error real de = 0.067 143 29. Enla siguiente iteración: Ev,2 0.180 95(0.06714329)2 = 0.000 815 8 que también se compara favorablemente con el error real de 0.000 832 3. Enla tercera iteración: = 0.180 95(0.000832 = 0.000 O00 125 que es exactamente elerrorobtenidoenel ejemplo 5.3. Laestimación del error mejora de esta manera ya que está más cercano a laraíz, xi y 4 se aproximanmejormediante x, [recuérdese la suposición manejada alderivarla ecuación (B5.2.6)a partir de la ecuación (B5.2.5),en el re- cuadro 5.21. Finalmente: Eu,4= 0.18095(0.000 O00 125)2= 2.83 X De esta manera este ejemplo ilustra que el error en el método de Newton- Raphson es en este caso, de hecho, casi proporcional (por un factor de O. 180 95) al cuadradodelerroren la iteraciónanterior.
  • 162. 156 MÉTODOS NUMÉRICOS PARA INGENIEROS 5.2.2 Desventajas delmétodo de Newton-Raphson Aunque el método de Newton-Raphson en general esmuy eficiente,hay situacionesen que se porta deficientemente. Un casoespecial-raíces múltiples- se analiza al final del capítulo. Sin embargo, aun cuando se trate de raíces simples, se encuentran dificultades, como en el siguiente ejemplo. EJEMPLO 5.5 Ejemplo de una función que converge lentamente con el método de Newton-Raphson Enunciado del problema: determínese laraíz positiva de f(x) = x10 - 1 usando el método de Newton-Raphson con un valor inicial de x = 0.5. Solución: la fórmula del método de Newton-Raphson es en este caso: que se puede usar para calcular: O 0.5 1 51.65 2 46.485 3 41.8365 4 37.65285 5 33,887565 De esta forma, después de la primera predicción deficiente, el método converge a laraíz 1,pero con una velocidad muy lenta. Además de la convergencia lenta, debida a la naturaleza de la fun- ción, se puedenoriginar otras dificutades,como se ilustra en la figura 5.6. Por ejemplo, la figura 5.6a muestra el caso dondeun punto de inflexión -esto es, f'(x) = 0- ocurre en la vecindad de una raíz. Nótese que las iteraciones que empiezan en x divergen progresivamente de la raíz. En la figura 5.6b se ilustra la tendencia del método de Newton-Raphson a oscilar alrededor de un punto mínimo o máximo local. Tales oscilaciones persisten, o, como en la figura 5.6b, se alcanza una pendiente cercana a cero, después de lo cual la solución se aleja del área de inter&. En la figura 5.6c, seilustra como un valor inicial cercano a una raíz puede sal-
  • 163. METODOS ABIERTOS 157 taraunaposiciónvariasraíceslejos.Estatendenciadealejarsedel área de interés se debe a que se encuentran pendientes cercanas acero. Ob- viamente, unapendiente cero Lf'(x)= O] es un realdesastrequecausa
  • 164. 158 METODOS NUM~RICOSPARA INGENIEROS 5.3 una división por cero en la fórmula de Newton-Raphson [Ec. (5.6)]Gráfi- camente (Fig. 5.6d), esto significa que la solución se dispara horizontal- mente y jam& toca al eje x. La única solución en estoscasos es la de tenerun valor inicial cerca- no a la raíz. Este conocimiento, de hecho,lo proporciona el conocimien- to físico del problema o mediante el uso de herramientas tales como las gráficas que proporcionan mayor claridad en el comportamiento de la so- lución. Esto sugiere tambiOn que se deben diseñar programas eficientes que reconozcan la convergencia lenta o la divergencia. La siguiente sec- ción está enfocada hacia estos temas. 5.2.3 Programa para el método de Newton-Raphson Con sólo sustituir la línea 130 de la figura 5.4, se obtiene el método de Newton-Raphson.Nótese, sin embargo, que el programa se debetam- bién modificar para calcular la derivada. Estose puede llevar a cabo sim- plemente incluyendo una función definida por el usuario. Además, de acuerdoa las discusiones anteriores sobrelos problemas potenciales delmétodo de Newton-Raphson,el programa se debe modi- ficar incorporándole algunos rasgos adicionales: 1.Si es posible, se debe incluir una rutina de graficación dentro del pro- - grama. 2.A1 final de los cálculos, la aproximación a la raíz siempre se debe susti- tuir en la función originalpara calcular en qué casosel resultado se acerca a cero.Esta prueba protege contraaquéllos casos donde se observa con- vergencia lenta u oscilatoria, la cual puede llevar a valores pequeños de E,, mientras que la solución puede estar aún muy lejos de una raíz. 3.El programa siempre debeincluir un límite m6ximosobre el número per- mitido de iteracionesparaestarprevenidoscontra las oscilaciones y la convergencia lenta,o las soluciones divergentespersistirán intermina- blemente. MÉTODO DE LA SECANTE Un problema fuerte enla implementación del método deNewton-Raphson es el de la evaluación de la derivada. Aunque esto no esun inconvenien- te para los polinomios y para muchas otras funciones,existen algunasde éstas cuyas derivadas pueden ser extremadam-ente difíciles de evaluar. En estos casos, la derivada se puede aproximar mediante una diferencia divida, como (Fig. 5.7):
  • 165. METODOS ABIERTOS 159 FIGURA 5.7 Esquemagráfico del métodode la secante. Esta técnica es similar a la del método de Newton-Raphson(Fig.5.5) en el sentidode que una apro- ximación a la raíz se calcula extrapolando una tangente de la función hasta el eje x. Sin embargo, el método de lasecante usa una diferencia en vezde la derivada para aproximar la pendiente. Estaaproximación se puede sustituirenla ecuación (5.6)obteniendo la ecuacióniterativa: La ecuación (5.7)es la fórmula para elmétodo de la secante. Nótese que el planteamiento requiere de dos puntos inicialesde x. Sin embargo, de- bido a que no se requiere que f(x) cambie de signoentre estos valores, a estemétodono se le clasifica como aquellosque usanintervalos. EJEMPLO 5.6 EL método de la secante Enunciado del problema: úsese el método de la secante para calcular la raíz de f ( x ) = e-x - x. Empiécesecon los valoresinicialesde x-1 = o y x0 = 1.0.
  • 166. 160 METODOS NUMERICOS PARA INGENIEROS Solución: recuérdeseque laraíz reales 0.567 143 29 . Primeraiteración: "0.632 12(0 - 1) 1 "("0.63212) x 1 = 1 - = 0.612 70 / € , I = 8 . 0 8 Segunda iteración: x0 = 1 f(xo) -0.632 12 x1 = 0.61270 f(x1) = -0.070 81 (Nótese que las dos aproximaciones se encuentran del mismo lado que la raíz.) x2 = 0.612 70- "0.070 81 (1-0.612 70) -0.632 12 - (-0.070 81) = 0.563 84 (E,( = 0.58% Terceraiteración: x1 = 0.61270 f(x1) = -0.070 81 x2 = 0.563 84 f(x2) = 0.005 18 x3 = 0.563 84 - 0.005 18 (0.612 70-0.563) 84 "0.070 81 - (0.005 18) = 0.567 17 IE,/ = 0.0048% 5.3.1 Diferencias entre los métodos de la secante y de la regla falsa Nótese la similitud entre los métodos de la secante y de la regla falsa. Por ejemplo,las ecuaciones (5.7)y (4.4)son idénticas término a término. Am- basusan dos estimaciones iniciales, para calcularuna aproximación a la pendiente dela función que se usa para proyectar hacia eleje x una nue- va aproximación a la raíz. Sin embargo, existe una diferencia crítica entre ambos métodos y éstaestribaenlaformaen que uno de los valores ini- ciales se reemplaza porla nueva aproximación.Recuérdeseque en el mé- todo de la regla falsa, laGltima aproximación de laraíz reemplaza a aquel valorcuyafunciónteníaelmismosignode f ( x l ) .En consecuencia, las
  • 167. METODOS ABIERTOS 161 dosaproximacionessiempreencierran a laraíz. Por lo tanto, en todos los casos prácticos,el método siempre convergeya que la raíz se encuen- tra dentro del intervalo. En contraste, el mdtodo de la secante reemplaza los valoresenuna secuencia estricta,con el nuevovalor xi+lse reem- plaza a xiy xireemplaza a xi-l.Como resultado de ésto, los dos valores pueden caer de un mismo lado de la raíz. En algunos casos, ésto puede provocardivergencia. EJEMPLO 5.7 Comparación de la convergencia en los métodos de la secante y la’ regla falsa. Enunciado del problema: úsense los métodos de la secante y de la regla falsa para calcular laraíz de f(x) = In x. Háganse los cálculos con los va- lores iniciales x/= xi-l . 0.5 y x, = xi= 5.0. 1 ,’ Solución: enel método de laregla falsa, usando la ecuación (4.4)y los criteriosde obtención de laraízenel intervalo mediante el reemplazo de los valores correspondientes en cada aproximación, se generan las siguien- tes iteraciones: I lteraciin X I XU x , 1 9.5 5.8 1.8546 2 e s 1.8546 1.2163 3 e s 1.2163 1.@585 Como se puede ver (Figs. 5.8a y c), las aproximaciones convergen a la raíz real = 1. En el método de la secante usando la ecuación (5.7) y el criterio se- cuencialparareemplazarlasaproximaciones se obtiene: 1 0.5 5.@ 1.8546 2 5.8 1.8546 -4.18438 Comose muestraenlafigura 5.8d, el comportamiento del método es divergente. t
  • 168. 162 METODOS NUMERICOS PARA INGENIEROS FIGURA 5.8 Comparación entre los métodos de la regla falsa y de la secante. Las primeras iteracionesa) y b) de ambos métodosson idénticas. Sin em- bargo, en las segundas c) y d), los puntos usados son diferentes. En consecuncia, el método de lasecante puede divergir, como lo mues- tra dl. Aunque el método dela secante sea divergenteen algunos casos, cuan- do converge lo hace más rápido que elmétodo de la regla falsa. Por ejem- plo, enlafigura 5.9, que se basaen los ejemplos 4.3,4.6, 5.3 y 5.6,se muestra la superioridad del métodode la secante. La inferioridad delmé- todo de la regla falsa ;e debe a que un extremo permanece fijo y de esta maneramantiene a laraíz dentrodelintevalo.Esta propiedad, que es unaventajaporquepreviene la divergencia,es una desventaja en rela- ción a la velocidad de convergencia; esto hace que la aproximación con diferencias divididas sea menos exacta que la derivada. 5.3.2 Programa para el método de la secante Como con los otros métodos abiertos,se obtiene un programa del méto- do de la secante simplemente modificandola línea 110, de tal forma que se puedan introducir dos valores inicialesy sustituyendo la ecuación (5.7) enlalínea 130 de lafigura 5.4.
  • 169. METODOS ABIERTOS 163 FIGURA 5.9 5.4 Comparación de los errores relativos porcentuales t y para cada uno de los métodos en la determinación de las raíces de f(x) = e-x - x. Además, las opciones sugeridas en la sección 5.2.3para el método de Newton-Raphson se pueden aplicar al programa de la secante para obtener tales ventajas. RAíCES MÚLTIPLES Una raiz múltiple corresponde a un punto donde unafunción es tangen- cia1al eje x. Por ejemplo, dos raíces repetidas resultan de: f(x)= (x - 3)(x - l)(x - 1) f(x)= x3 - 5x2 + 7x - 3 o, multiplicandotérminos, La ecuación tiene una raíz doble porque un valor de x anula dos térmi- nos de la ecuación (5.8).Gráficamente, esto significa que la curva toca
  • 170. 164 MÉTODOS NUMERICOS PARA INGENIEROS FIGURA 5.10 Ejemplos de raíces múl- tiples tangentes al eje X. Nótesequelafunción no cruza el eje en casos de mu!tiplicidad par a)y c), mientrasque para multiplicidad imparsí lo hace b). tangencialmente al eje x enlaraíz doble. Véase lafigura 5.10~en x = 1. Nótese que lafunción toca al eje pero no locruzaenlaraíz. Una raiz triple corresponde al caso en que un valorde x se anulaen trestérminosde la ecuación, como en: f(x) = (x - 3)(x - l)(x - l)(x - 1) o, multiplicando, )(X) = x4 - 6x3 + 1 2 ~ '- 1 0 ~+ 3 Nótese que el esquema gráfico (Fig.5.10bJ indica otra vez que la función es tangencia1al eje enlaraíz pero que en este caso sí cruzael eje. En general, la multiplicidad impar de raíces cruza el eje, mientras quela mul- tiplicidad par no lo cruza. Porejemplo, la raíz cuádruple en la figura 5 . 1 0 ~ nocruzael eje. Las raíces múltiples ofrecen ciertas dificultadesa los métodos numéri- cos expuestos enla parte 11: l. El hecho de que lafunción no cambia de signoenunaraíz de multi- plicidadparimpideeluso de los métodos confiables que usan inter- valos, discutidosenelcapítulo 4. De esta manera, de los métodos incluidoseneste texto, los abiertostienen lalimitación de que pue- dendivergir. 2. Otroposibleproblema se relacionacon el hechodequeno sólo f(x) se aproxima a cero. Estosproblemas afectana los métodos de Newton- Raphson y al de la secante, los que contienen derivadas (oaproxima- ciones a ella) en el denominador de sus respectivas fórmulas. Esto pro- vocaría una división entrecero cuandola solución se acerque a la raíz. Unaformasimpledeevitar estosproblemas,que se ha demostrado teóricamente (Ralstony Rabinowitz, 1978),se basa en el hecho de que f(x).Por lo tanto, si severifica flx) contra cero, dentrodelprograma, entonceslos cálculos se pueden terminar antes de quef'(x) llegue a cero. 3. Se puededemostrarque el métododeNewton-Raphson y elde Id secante convergenen forma lineal, en vez de manera cuadrática,cuan- do hay raíces múltiples (Raltsony Rabinowitz, 1978). Sehan propuesto algunas modificaciones para aliviar este problema. Ralstony Rabino- witz (1978) proponen que se haga un pequeño cambio enla formu- laciónparaqueretorne su convergencia cuadrática, como: f (x,1 f '(Xi) xi+l= xi - m- en donde m es la multiplicidad de laraíz (esto es, m = 2 parauna raíz doble, m = 3 para una raíz triple, etc.). De hecho, puede resultar insatisfactorio porque presupone el conocimiento de lamultiplicidad delas raíces.
  • 171. METODOS ABIERTOS 165 Otra alternativa, también sugerida por Ralston y Rabinowitz (1978), es la de definir una nueva función u(x),que es el cociente de la función y su derivada, esto es: [5.10] Se puede demostrar que esta función tiene raíces en las mismas posicio- nes que la función original. Por lo tanto, la ecuación (5.10) se puedesusti- tuir en la ecuación (5.6)y de esta forma desarrollar una formaalternativa del método de Newton-Raphson: Se puede derivar la ecuación (5.10),obteniendo: [5.11J [5.12] Se pueden sustituir las ecuaciones (5.10)y (5.12) en la ecuación (5.11) [5.13] EJEMPLO 5.8 Método de Newton-Raphsonmodificado para el cálculo de raíces múltiples. Enunciado del problema: úsenselos dos métodos, el estándar y el modi- ficado de Newton-Raphson para evaluar laraíz múltiple de la ecuación (5.9), con un valor inicial de xo= O. Solución: la primera derivada de la ecuación (5.9) esf(x) = 3x2- lox + 7, y por lo tanto, el método de Newton-Raphson para esteproblema [Ec. (5.6)]es: xi3- 5Xi2+ 7xi - 3 3xi* - loxi + 7 Xi+l = x, - que se puede resolver iterativamente para obtener:
  • 172. 166 MÉTODOS NUMÉRICOS PARA INGENIEROS i Xi 1 € “ I Ojo O 0 1O0 1 0.42857142957 2 0.68571428631 3 0.83286540017 4 0.913328983 8.7 5 0.9557832934.4 6 0.9776551012.2 Como ya se habíaanticipado, el métodoconvergelinealmentehasta el valorverdadero de 1.O. Para el caso delmétodomodificado,lasegundaderivada es f” ( x ) = 60 x - 10, y larelacióniterativa es[Ec. (5.13)]: (Xi3 - 5xi2 + 7xi - 3) (3Xi2 - loxi + 7) Xi+l = xi - (3xi2- lOxi + 7)2- (xi3 - 5xi2 + 7x, - 3) (6xi - 10) que se puede resolverpara obtener: i xi lk”l O 0 1O0 1 l.105263158 1 1 2 1.003081664 0.31 3 1.O00002382 0.00024 De esta forma, el método modificado converge cuadráticamente.Se pue- denusarambosmétodosparabuscar laraízsimpleen x = 3. Usando un valorinicial de xo= 4 se obtienen los siguientesresultados: i Estándar, cy Modificado l t ~ l o 4 (33%) 4(33%) - 1 3.4(13%) 2.636 363 637(12%) 2 3.1 (3.3%) 2.820 224 720(6.0%) 3 3.008 695652 (0.29%) 2.961 728211 (1.3%) 4 3.000 074 641 (2.5X 2.998 478 719 (0.051%) 5 3.000000 O06 (2x 2.999 997 682 (7.7X De esta forma, ambos métodos convergenrápidamente,siendo el méto- do estándar más eficiente.
  • 173. METODOS ABIERTOS 167 El ejemploanterior ilustra los factoresdemayorimportanciainvolu- crados al escoger el método de Newton modificado. Aunque es preferible en raícesmúltiples,algunasvecesesmenoseficiente y requiere más es- fuerzo computacionalque el método estándar parael caso de raíces sim- ples. Se debenotarque se puededesarrollarunaversiónmodificadadel método dela secante para raícesmúltiples sustituyendola ecuación (5.10) enla ecuación (5.7).La fórmula resultantees (Ralstony Rabinowitz,1978): PROBLEMAS Cálculos a mano 5.1 Úsese el método de Newton-Raphson para determinar laraízmayor de: f(x) = - 0 . 8 7 5 ~ ~+ 1 . 7 5 ~+ 2.625 Empléese un valorinicial de xi = 3.l. Realícese los cálculos hasta que E,, sea me- nordel E, = 0.01%. Tambiénverifíquense los errores enla respuesta final. 5.2 Determínenselasraícesreales de: f(x) = -2.1 + 6 . 2 1 ~- 3 . 9 ~ ~+ 0 . 6 6 7 ~ ~ a) Gráficamente b) Usando el método de Newton-Raphsonhastaque = 0.01% 5.3 Empléese el métododeNewton-Raphsonparadeterminarlasraícesreales de: !(X) = -23.33 + 79.35~- 8 8 . 0 9 ~ ~-k 4 1 . 6 ~ ~- 8 . 6 8 ~ ~+ 0 . 6 5 8 ~ ~ usando elvalorinicial de a) xi= 3.5;b) x= 4.0 y c) x,= 4.5. Pruébense y úsense los métodos gráficos para explicar cualquierpeculiaridaden los resultados. 5.4 Determínese laraízreal menor de: f(x) = 9.36 - 21.963~+ 16.2965~~- 3.70377~~ a) Gráficamentg b) Usando el método de la secante, hasta un valorde es, correspondienteatres cifrassignificativas. 5.5 Localícese laraízpositiva de: f(x) = 0 . 5 ~- sen x
  • 174. 168 MÉTODOS NUMERICOS PARA INGENIEROS !(x) = 9.36 - 21.963~+ 16.2965x2 - 3.70377x3 5.6 5.7 5.8 5.9 5.10 5.11 5.12 5.13 donde x está dada en radianes. Usese un método gráfico y después calcúlese tres iteracionesconelmétodo de Newton-Raphsoncon un valorinicial de xi= 2.0 paracalcular laraíz. Repítanse los cálculos pero con un valorinicial de xi= 1.0. Úsese el métodográficoparaexplicar los resultados. Encuéntrese laraízrealpositiva de: f(x) = x4 - 8 . 6 ~ ~- 3 5 . 5 1 ~ ~+ 4 6 4 ~-- 998.46 usandoel método de la secante. Empléense losvaloresinicialesde xi., = 7 y xi= S y calcúlense cuatro iteraciones. Calcúlese E, e interprétense los resultados. Realícenselos mismos cálculos del problema5.6 pero usando el método de Newton- Raphson, con un valorinicial de x,= 7. Encuéntrese laraíz cuadrada positiva de 10 usando tres iteraciones con: a) El método de Newton-Raphson, con un valorinicialde xi= 3. b) El método de la secante, convaloresiniciales de = 3 y x,=3.2. Determínese laraízreal de: 1 - 0 . 6 ~ f(x) = X usando tres iteraciones y el método de la secante con valores iniciales xi., - 1.5 y xi = 2.0. Calcúlese elerroraproximado E, despuésde la segunda y la tercera iteración. Determínese laraízreal de: !(x) = x3 - 100 con el método dela secante, con es= 0.1% . Determínese laraízrealmayor de: x3 - 6x2 + llx - 6 a) Gráficamente b) Usandoel método de bisección (dos iteraciones, XI= 2.5 y X,= 3.6). C) Usandoel método de lareglafalsa (dos iteraciones, X/= 2.5 Y X,= 3.6). d) UsandoelmétododeNewton-Raphson(dos iteraciones, xi= 3.61. e) Usando el método de la secante (dos iteraciones, x;-l= 2.5 y X,= 3.6). Úsese el método de Newton-Raphson paradeterminar todas las raíces de :(x) = x2+ 5.78 x - 11.4504 con e,= 0.001%. Determínese laraízrealmás pequeña de:
  • 175. MÉTODOS ABIERTOS 169 a) Gráficamente b) Usando el método de bisección (dos iteraciones, x,= 0.5 y xu= 1.1). c) Usando el método de la raglafalsa (dos iteraciones, x,= 0.5 y x,= 1.1). d) Usando el método de Newton-Raphson (dos iteraciones, xi= 0.5). e) Usando el método de la secante (dos iteraciones, xi-,= 0.5 y xi= 1.1). 5.14 Determínese laraízpositiva realmás pequeña de: f ( x )= 4X4 - 2 4 . 8 ~ ~+ 57.04~'- 56.76~+ 20.57 a) Gráficamente b) Usando el método disponiblemás eficiente. Empléense los valores'inicia- les de x, = x , . ~= 0.5 y x, = x, = 1.5 y realícense los cálculos hasta que E,= 15% 5.15 Determínense las raíces de !(X) = x3 - 3 . 2 ~ ~- 1 . 9 2 ~+ 9.216 a) Gráficamente b) Usando el método disponiblemás eficiente con E,= 0.1% 5.16 Repítase el problema 4.12, pero usando el método de Newton-Raphson 5.17 Repítase el problema 4.12, pero usando el método de la secante. Problemas relacionados con la computadora 5.18 Desarróllese un programaparael método de Newton-Raphson basado en la figura 5.4 y en la sección 5.2.3. Pruébese el programa duplicando los cSlcu- los del ejemplo 5.3 5.19 Úsese elprogramadesarrolladoenelproblema 5.18 y duplíquense los cálcu- los del ejemplo 5.5. Determínese laraíz usando un valorinicial de xi= 0.5. Realícense 5, 10, 15 o más iteraciones hasta que el errorrelativo porcentual exacto sea menor del O.1B.Grafíquense los errores relativos porcentuales exac- to y aproximado contra el nlirnero de iteraciones sobre papel semilogarítmico. Interprétense los resultados. 5.20 Úsese el programa desarrollado en el problema 5.18 para resolver los problemas 5.1 al 5.5. En todos los casos, realícense los cálculos dentro de la tolerancia de E S = 0.001%. 5.21 Desarróllese un programapara el método de la secante basado en lafigura 5.4 y en la sección 5.3.2. Pruébese el programa duplicando los cálculos del ejemplo 5.6. 5.22 Úsese el programa desarrollado enelproblema 5.21 para resolver los proble- mas 5.6, 5.9 y 5.10. En todos los casos, realícense los cálculos dentro de la tolerancia de es= 0.001%.
  • 176. C A P í T U L O S E I S CASOS DE LA PARTE DOS: RAíCES DE ECUACIONES La finalidad de este capítulo es la de usar los procedimientos numéricos analizados en los capítulos 4 y 5 para resolver problemas reales de inge- niería. Los métodos numéricos son importantesen la práctica ya quefre- cuentemente los ingenierosencuentranproblemasqueno se pueden plantear desde un punto de vista analítico. Por ejemplo, algunos mode- los matemáticos quese pueden resolver analíticamente no son aplicables en los problemas prácticos. Debidoa esto, se debenusarmodelosmás complicados. En estos casos, es conveniente implementarun método nu- mérico que se pueda usar en una microcomputadora.En otros casos, los problemas requerirán soluciones explícitas enecuaciones muy complica- das (recuérdese la sección 11.1.2 y el ejemplo 4.5). Los siguientes casos de estudio son una muestra de aquellos que en forma rutinaria se encuentran durantelos estudios superiores o de licen- ciatura. MAS aún, son problemas representativosde aquéllos que se en- contraránenlavida profesional. Los problemas van desde laingeniería económica en general, hasta las especialidadesde la misma: química, ci- vil, eléctrica y mecánica. Estos casos deestudioilustranalgunosde los factores de másimportanciaentrelas técnicas numéricas. Por ejemplo, el caso 6.1 hace uso de todos los métodos, con excep- ción del método de Newton-Raphson para analizar puntos de equilibrio que resulteneconómicos.El método de Newton-Raphson nose usó porque la función en an6lisis es difícil de derivar. Entre otrascosas, en el ejemplo se demuestra como puede divergirel método de la secante, sielvalor inicial no se encuentra lo suficientemente cerca de laraíz. El caso 6.2 tomado de la ingeniería química, muestraun ejemplo ex- celente de cómo se pueden aplicar los métodos para la búsqueda de raí- ces de fórmulas quese presentan en la práctica de la ingeniería. Además, este ejemplo demuestrala eficiencia del método de Newton-Raphsoncuan- do se requiere un grannúmerodecálculosenlalocalizaciónde la raíz. LOScasos 6.3, 6.4 y 6.5 son problemas de ingeniería de diseño, to- mados del área de civil, eléctrica y mecánica. El caso 6.3aplica tres mé- todos diferentes para determinar las raícesde un modelo de crecimiento
  • 177. 172 METODOS NUMÉRICOSPARAINGENIEROS demográfico. En el cuso 6.4,se realiza un análisis semejante deun circui- to eléctrico. Finalmente, el caso 6.5analiza las vibraciones de un auto- móvil. Además de analizar la eficiencia de cada uno de los métodos, este ejemplo tiene una característica adicional, que es la de ilustrar cómo los métodos gráficos sirven de ayuda en el proceso delocalización de raíces. CASO 6.1 ANALISISDE PUNTO DE EQUILIBRIO (INGENIERíAENGENERAL) Antecedentes: en la práctica de la ingeniería óptima se requiere que los proyectos, productos y la planificación de los mismos sean enfocados de tal manera queresulten económicos. Porlo tanto, aun ingeniero conex- periencia deben serle familiares los análisis de costos. El problema que se trata en esta sección se conoce como “problema de puntos de equili- brio”. Se usa para determinar el punto en el cual dos alternativas tienen valores equivalentes. Estos problemas se encuentran en todos los cam- pos dela ingeniería. Aunque el problema se enfoca en términos persona- les, se puede tomar como prototipo de otros problemas de análisis de puntos de equilibrio,que se encuentran a menudoen la vida profesional. Se está considerando la compra de una o dos microcomputadoras: La “Micro-uno’’y la “Micro-dos”. En el cuadro 6.1se encuentran resu- midas algunas características, los costos aproximados y los beneficios de cada una de ellas. Si se puedepedir un préstamo con un interés del 20% (i = 0.20), ¿cuánto tiempo se deberá poseer las máquinas, de manera que tengan un valor equivalente? En otras palabras, ¿cuál es el punto de equilibrio medido en años? Solución: como es común en problemasde economía,se tiene una mez- cla de costos presentes y futuros. Por ejemplo, en la figura 6.1se mues- tra que la compra de la Micro-uno involucra un gasto inicial de $3 000. Además de este desembolso,también se requiere dinero para el mante- CUADRO6. l Costos y beneficios de dos microcomputadoras.Los signos negativos in- dican un costoo una perdida mientras que un signo positivo indica una ganancia COMPUTADORA Micro-unoMicro-dos Costo decompra, $ -3000 Incrementoenelmantenimiento del costo por año,$/año/año -200 Ganancias y beneficiosanuales, $/año 1000 -1 0,000 -50 4000
  • 178. FIGURA 6.1 Diagramade fluio de efectivos de costos y beneficiasde laMicro-uno. La abscisa muestra el número de años que se posee la computadora. El fluio de efectivos se mideen lo ordenada, con los beneficios positivos y los costos negativos. nimiento anual de la máquina. Debidoa que estos costos tiendena aumen- tar a medida que la máquina se usa más y más, se supone que los Costos de mantenimiento crecen linealmente con el tiempo. Por ejemplo, alre- dedor del décimoaño se requieren $2 O00 anuales para mantenerla má- quina en condicionesde trabajo (Fig.6.1).Finalmente y además de estos costos se deben deducir beneficios del propietario dela computadora.Las gananciasy las prestaciones derivadas dela Micro-unose caracterizan por un ingresoanualconstante de $1 000. Para valorar las dos opciones estos costos se deben convertir en me- didas comparables. Una manerade hacerlo es expresandotodos loscos- tos individualescomo si fuesen pagosanuales, estoes, el costo equivalente por año sobretoda lavida útil de la computadora. Las ganancias y las prestaciones yase encuentran en este formato.Se puede disponerde las fórmulas deeconomía para expresar los costos de compray de manteni- miento de la misma forma. Por ejemplo, el costo de la compra inicial se puedetransformarenunaserie de pagos anuales mediante la fórmula (Fig. 6.2~): A, = P i(1 + i)" (1 + i)" - 1 en donde A, es el montodelpago anual, P es el costo dela compra, i es la tasa de interés y n es el número de años. Por ejemplo, el pago
  • 179. 174 M~TODOSNUMERICOS PARA INGENIEROS FIGURA 6.2 Esquemagráficodel uso deunafórmuladeeconomía, a) Tranforma- ción de un pago en una serie de pagos anuales equivalentes usando la ecuación (6.1)y b)transformación de una serie de gradiente aritmético en una serie de pagos anuales equivalentes usando la ecuación (6.2). inicial de la Micro-uno es de$-3 000, en dondeel signo negativoindica pérdidas. Si la tasa de interés es del 20% (i = 0.2), entonces: Ap = -3000 O.Z(l.2)" 1.2"- 1 Por ejemplo, si los pagos iniciales se extienden hasta 10 años (n = lo), se puede usar esta fórmula para calcular que el pago anual equivalente sería de $-715.57 por año. A los costos de mantenimiento seles conoce comoserie de gradiente aritmético porque crecen a un promedio constante. La conversión de es- tas series a una tasa anual A se puede calcular con la fórmula: en dondeG es la tasa de crecimientoen el mantenimiento. Como se puede ver en la figura 6.26 esta fórmula transforma el costo de mantenimiento creciente en una serie equivalente de pagos anuales constantes. Estas ecuaciones se pueden combinarde forma tal que se pueda ex- presar el valor de cada computadoraen términos de una serie uniforme de pagos Por ejemplo, para la Micro-uno:
  • 180. A,= -3 O00 0.2(1.2)" -200 ["1 1+ 1 O00 1.2" - 1 0.21.2" - 1 valor total = -costo de compra - costode mantenimiento + ganancias en donde A, denota el valor anual total. Agrupando términos, esta ecua- ción se puedesimplificar: -600( 1.2)"200n A, = +1.2" - 1 1.2" - 1 ~6.31 Sidespués de poseer la Micro-uno durante dosaños se decide descartar- la, entonces sustituyendon = 2 en la ecuación (6.3)resultará que el cos- to es de$1055por año. Si la computadorase descarta después de poseerla 10 años (n = lo),la ecuación muestra un costo de $330 por año. De manera similar, para la Micro-dosse puede desarrollar una ecua- ciónparael costo anual, dadapor: -2 OOO(1.2)" + A, = 50n + 3750 1.2" - 1 1.2" - 1 ~6.41 Los valoresde la ecuación (6.4) para n = 2 y n = 10 sonde $-2 568 y $ +1461 por año, respectivamente. De estamanera, aunque la Micro- dos es más costosa en base a periodos cortos, si se posee por periodos largos, no sólo es más barata, sino que producirá ganancias al propieta- rio. Enlafigura 6.3a se muestran las ecuaciones (6.3)y (6.4)para varids valoresde n. La identificación del punto enel que las dos máquinas tienen valores iguales indica cuando la Micro-dos vienea ser la mejor compra. Gráfica- mente, esto corresponde a la intersección de lasdoscurvasenlafigura 6.3~1.Desde un punto de vista matemático, elpuntodeequilibrio es el valor de n para el que las ecuaciones(6.3)y (6.4)son equivalentes, estoes: -600(1.2)" + 200n -- -2 OOO(1.2)" + 50n +3 750 1.2" - 1 1.2" - 1 1.2" - 1 1.2" - 1 pasando todos los términos de un lado, el problema se reduce a encon- trar la raíz de la función: -1 400( 1.2)" f(n) = - 150n + 3 750 = O 1.2" - 1 - 1.2" - 1 ~6.51 Nótese que debidoa la formaen que se ha derivado la ecuación,la Micro- uno es más efectiva en cuanto a costos cuando f (n) < O y la Micro-dos lo es cuando f (n) > O (Fig. 6.3b). Las raíces de la ecuación (6.5) no se pueden determinar analíticamente. Por el otro lado,los pagos anuales equi- valentessonfáciles de calculardadauna n. De esta forma, como enel
  • 181. 176 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA 6.3 a) Curvas del costo neto de las computadorasMicro-uno[Ec. (6.3)]y Micro-dos[Ec. (6.4)]. b) La función de punto de equilibrio [Ec. (6.5)J. estudio de la sección 11.1.2y el ejemplo 4.5,los aspectos considerados en la elaboración de este problema crean la necesidad de un planteamiento numérico. Las raíces de la ecuación (6.5)se pueden calcular usando algunos de los métodos numéricos descritos en los capítulos 4 y 5. Se pueden aplicar los métodos que usan intervalos y el método de la secante con un esfuerzo mínimo, mientrasque el método deNewton-Raphson es em- barazoso ya que consume muchotiempo al determinar df/dn de la ecua- ción (6.5). En base a la figura 6.3,se sabe quela raíz se encuentra entre n = 2 y n = 10. Estos valores se pueden usar en el método de bisección. L a bi- sección de intervalos se puede llevar a cabo 18 veces para obtener un resultado en donde E, sea menor de 0.001%.El punto de equilibrio ocu- rre a los n = 3.23 años. Este resultado se puede verificar sustituyéndolo en la ecuación (6.5)para ver que f (3.23) = O. Sustituyendo n = 3.23 ya sea en la ecuación (6.3)o en la (6.4)se muestra que en el punto de equilibrio el costo de cualquiera de ellas es
  • 182. CASOS LA PARTEDOS:íCES DE ECUACIONES 177 de $542 por año. Másallá de este punto, la Micro-doses másefectiva en cuanto a costos. Por consiguiente,si se piensa comprar una máquina y poseerlapormás de 3.23 años, la Micro-doses la mejor compra. El método de la regla falsa se puede aplicar fácilmente a este proble- ma. Se obtieneuna raízsimilar después de 12 iteraciones enelmismo intervalo inicial de2 a 10. Por otrolado, el método de la secante conver- ge a unaraíz de -24.83 con elmismointervaloinicial.Sin embargo, si el intervalo se reduce desde 3 hasta 4, entonces el método de la secante converge a 3.23 en sólo cinco iteraciones. Es interesantenotarque el método de la secante tambiénconvergeenformarápida siel intervalo iniciales de 2 a 3, el cual no encierraa la raíz. Estos resultados son típicos de losfactoresdeimportanciaque se debentomarenconsideración y que se estudian posteriormente en el epílogo. Entonces el mejor método numéricoparaesteproblema depende deljuicioemitidorespecto a los factores de importancia, tales como eficiencia numérica, costo de las compu- tadoras y laconfiabilidaddel método. CASO 6.2 LEYES DE LOS GASESIDEALES Y NO IDEALES (INGENIERíA QUíMICA) Antecedentes: la ley de los gases ideales estádada por: en donde p es la presión absoluta, V es el volumen y n es el número de moles. R es la constante universal de los gases y T es la temperatura ab- soluta. Aunque esta ecuaciónla usan ampliamente los ingenieros y cien- tíficos, sólo es exacta sobre un rango limitado de presión y temperatura. Más aún, la ecuación (6.6)es más apropiada para algunos gases quepa- ra otros. Una ecuaciónalternativa del estadode los gasesestádada por: r6.71 a la que se le conoce con elnombre de ecuación de van der Waals. u = V / n es elvolumenmolal y a y b son constantes empíricas que de- penden de un gasenparticular. Un proyecto de ingeniería química requiere quese calcule exactamente elvolumenmolal (u) del bióxido de carbono y del oxígeno para combi- naciones diferentes de la temperatura y de la presión, detalformaque se pueda seleccionar una vasija apropiadaque los contenga. Asimismo, esimportanteexaminar que tanbien se apegacadagas a laley de los
  • 183. 178 METODOSNUMERICOS PARA INGENIEROS gases ideales, comparandolos volúmenes molales calculados conlas ecua- ciones (6.6)y (6.7).Se proporcionan los siguientesdatos: R = 0.082 054 1 . atm/(mol . K) a = 3.592 b = 0.042 67 bióxido de carbono a = 1.360 b = 0.031 83 Las presiones de interés en el diseño son de 1,10y 100 atm. para com- binaciones de la temperatura de 300, 500 y 700°K. Solución: los volúmenes molares de ambos gases se calculan con la ley de los gases ideales, con n = 1.Por ejemplo, si p = 1atm y T = 300°K, entonces: RT = 0.082 054 I atm 300 K n P mol. K I atm v = - = - v = 24.616 2 l/mol Estos cálculos se repiten para todas las combinaciones de presión y tem- peratura y se presentan en el cuadro 6.2. Los cálculos del volumen molar a partir de la ecuación de van der Waals se pueden llevar a cabo usando cualquier método numérico que encuentre raíces de los estudiados en los capítulos 4 y 5, de la siguiente manera: CUADRO6.2 Cálculos del volumen molar del caso de estudio 6.2 VolumenmolalVolumenmolalVolumenmolal (leyde los (vanderWaals)(vander TemperaturaPreridngasesideales)bióxidodeWaals)oxígeno K atm llmol carbonollmolllmol 300 1 10 1O0 500 1 10 1O0 700 1 10 1O0 24.6162 24.5126 2.4616 2.3545 0.2462 0.0795 41.027040.982 1 4.10274.0578 0.41030.3663 57.437857.41 79 5.74385.7242 0.57440.5575 24.5928 2.4384 0.2264 41.O259 4.1016 0.4116 57.4460 5.7521 0.5842
  • 184. CASOSDE LA PARTE DOS:RA~CESDE ECUACIONES 179 En este caso,la derivada def (u) se determina fácilmentey es convenien- te implementar el uso del método de Newton-Raphson. La derivada de f respecto a u está dada por: a 2ab f’(U) = p - - + - 3 u3 El método de Newton-Raphson se describe mediante la ecuación (5.6) como: la cual se puede usaren el cálculo de la raíz. Por ejemplo, usando el valor inicial de 24.616 2,el volumen molal del bióxido de carbono a 300°K y a 1atm se calcula como 24.512 6 I/mol. Este resultado se obtuvo des- pués de dos iteraciones y con un E,, menor de O.O01%. En el cuadro 6.2 semuestran resultados similares para todaslas com- binaciones de presión y de temperatura para ambos gases. Se observa que los resultados obtenidos con la ecuación de van der Waals difieren en ambos gases de los de la ley de los gases ideales, de acuerdo a los valores específicosde p y de T. Más aún, ya que algunos de estos resul- tados son significativamente diferentes, el diseño de las vasijas que con- tendrán a los gases sería muy diferente, dependiendo de qué ecuación de estado se haya usado. En este caso,al usar el método de Newton-Raphson se examinó una ecuación del estado gaseoso complicada. Los resultados variaron signifi- cativamente en varios casos usandola ley de los gases ideales. Desde un punto de vista práctico, el método de Newton-Raphson fue apropiado en este casoya que f’(u) fue fácil de calcular. De esta manera, se pueden explotar las propiedades derápida convergencia delmétodo de Newton- Raphson. Además de demostrar su potencia en un simple cálculo, el método de Newton-Raphson ilustra en este caso de estudio lo atractivo que es cuando se requiere unagran cantidad de cálculos. Debido ala velocidad de las microcomputadoras, la eficiencia de cada uno de los métodos en la solución de la mayor parte de raíces de ecuaciones sevuelve indistin- guible en un cálculo simple. Aun la diferencia de decenas entre el méto- do eficiente de Newton-Raphson y el método poco. refinadode bisección no significa una gran pérdida de tiempo cuando serealiza un solo cálcu- lo. Sin embargo, supóngase que se desea calcular una raíz millones de veces para resolver un problema. En este caso, la eficiencia del método puede ser un factor decisivo al escogerlo. Por ejemplo, supóngase que es necesario diseñarun sistema de con- trol automático computarizado de un proceso de producción de sustan- cias químicas. Este sistema requiere una aproximación exacta de volúmenes
  • 185. 180 MÉTODOS NUMERICOS PARA INGENIEROS molales con basea un medio esencialmente continuo para fabricarconve- nientemente el producto final.Se instalan calibradores que proporcionan lecturasinstantáneas dela presión y la temperatura. Se debenobtener evaluaciones deu para toda la variedad de gases que se usan en elproceso. Para estas aplicaciones,los métodos que usan intervalos, talescomo eldebisección o de laregla falsa, posiblemente consuman mucho tiem- po. Además, los valores iniciales quese requieren con estos métodos ge- nerarían un retraso enel procedimiento. Este inconveniente igualmente afecta al método dela secante, que también necesita dos valores iniciales. En contraste,el método de Newton-Raphson requiere 6nicamenteun valor inicial de la raíz. Se puede usar la ley de los gases ideales paraobte- ner este valor al iniciodel proceso. Después, suponiendo que el tiempo empleado sea lo bastante corto como para que la presión y la temperatu- ra novaríenmuchodurante los cálculos, la solución de laraíz anterior se puede usarcomo valor inicial de lasiguiente.De esta forma, se tendría disponible de forma automáticaun valor aproximadocercano a la solución, requisito indispensable en la convergencia del método de Newton-Raphson. Todas estas consideraciones favorecerán de manera considerable al método de Newton-Raphsonen estos problemas. CASO 6.3 DINÁMICA DEL CRECIMIENTODEMOGRÁFICO (INGENIERíA CIVIL) Antecedentes: la dinámica del crecimiento demográfico es de importan- ciaen todos los planes de estudio de ingeniería. Los progamas de cons- trucción y dedistribuciónderecursosenproyectos a gran escala, tales como el abastecimientodeagua y sistemasdetransportedependenen granmedidadelas tendencias dela población. Además, lastendencias deotrotipode poblaciones, tales como los microbios,sonimportantes en muchos procedimientos de ingeniería,como en el tratamientode ba- sura, enel manejo dela fermentación y enla elaboracióndeproductos farmacéuticos. Los modelos de crecimientoen un grupo de microbios suponen que el promedio de cambio dela población (p)es proporcional a la población existente en un tiempo (t): Lapoblación crece en un medio enel queexistealimentosuficientede manera que k no es una función de la concentración. (Véaseel caso 12.2 que muestraun ejemplo en donde k dependedel nivel alimenticio.)Cuan- doel alimento no escasea, el crecimiento se limita sólo porel consumo deproductostóxicos o de espacio, si esque el tamaño de la población crece demasiado. Con el tiempo, estos factores retardan la tasa de creci-
  • 186. CASOS DE DOS: RAiCESDE ECUACIONES 181 miento de la población y la detienen completamente cuando ésta alcanza unadensidadmáximade pmex.En este caso, se modificala ecuación an- teriorde la siguiente manera: en donde las unidades de K sonlitrosporcélulapordía.Estaecuación diferencial se puedeintegrar de formaanalítica dando: en donde p(t = O) = po.A la ecuación (6.9) se le conoce como el mo- delo de crecimientologístico. Como se muestra en la figura 6.4,este mo- delo genera unacurva de p(t) enformade S. Como se puede ver, el modelosimula un crecimiento inicial lento, seguidopor un periodode crecimiento rápido y finalmente,un crecimiento limitadoa una densidad demográfica muy alta. Como ejemplo de aplicación de este modelo en el área de la ingenie- ría civil, considérese el crecimiento de una población bacteriológica enun lago. El crecimiento se comporta como lodefine la ecuación (6.9). La población es pequeñaen la primavera del año en donde f = O,p(f = O) = 10 célulasporlitro.Essabidoque la poblaciónalcanzaunadensidad de 15 O00 células Dorlitro cuando t = 60 días y que la tasa de crecimien- FIGURA 6.4 Un modelo logístico de crecimiento demográfico. El modelo simuiaun crecimiento inicial lento, después una aceleración en éI mismo seguido por un periodo de nivelación en una densidad poblacional alta.
  • 187. 182 METODOS NUMÉRICOS PARA INGENIEROS to K esde 2 X litrosporcélulapor día. Se requierecalcularla den- sidad de la población bacterial cuando t = 90 días. Si su número excede de 40 O00 células por litro,entonces la calidad estándar del aguarequie- rela implementación de algún procedimiento para disminuirlas y prote- ger a las personas que se introduzcanal agua. Solución: sustituyendo la informaciónconocida enla ecuación (6.9)se obtiene: 15O00 = Pm6x I [6.10] lacualtiene sólo unaincógnita, pmdx.Si la ecuación (6.10)se pudiera resolverpara pmAx,entonces p(t = 90) se podríadeterminarfácilmente de la ecuación (6.9).Sinembargo,yaque pmsxes implícita,nosepuede obtenerdirectamentedelaecuación (6.10).Por lo tanto, se debe usar un método numérico delos capítulos 4 y 5. No se usará el método de Newton- Raphson ya queladerivadadelaecuación (6.10)es difícil dedeterminar. Sin embargo,se pueden aplicar fácilmente los métodos de bisección, de la reglafalsa y de la secante. Con un errorrelativodel 0.01% los valores ini- ciales dados de 60 O00 y 70 O00 células por litro generan las siguientes apro- ximacionesde pmsx. Método empleado Resultado lteracioner Bisección 63 198 1 1 Regla falsa 63 199 5 Secante 63 200 4 Nótese que los métodos delareglafalsa y de la secante convergen a la mitaddel númerodeiteraciones del métododebisección. Ahora, de la ecuación (6.9),con pmdx= 63 200: 63 200 P(90) = = 58 930 células por litro e-2x10-6(63 200)(90) Este nivel demográfico sobrepasa ellímite estándar en cuanto a calidad del agua que es de 40 O00 células por litro y por lo tanto, se debe tomar algunamedida de corrección. Este ejemplo, ilustrala eficiencia computacional relativa de tres mé- todos diferentes para encontrar raícesde ecuaciones en un problema de diseño de ingeniería civil. Sin embargo, como se menciona anteriormen- te, el esquema general tiene unaaplicaciónampliaentodos los campos
  • 188. CASOS DELAPARTE DOS: RAiCESDE ECUACIONES 183 de la ingeniería que tengan que ver conelcrecimientodeorganismos, incluyendo a los humanos. CASO 6.4 DISEÑODE UNCIRCUITO ELÉCTRICO (INGENIERíA ELÉCTRICA) Antecedentes: losingenieroselectrónicos usan a menudo laley deKir- choff para estudiar el comportamiento de los circuitos eléctricos en esta- do estacionario (que no varíanconel tiempo). Enel caso 9.4 se analiza el comportamiento de estos estados estacionarios. Otrotipo de proble- mas son los de corriente momentánea e implica a los circuitos dondesú- bitamente suceden cambios temporales. Esta situación ocurre cuando se cierraelinterruptor de lafigura 6.5. En este caso, despuésdecerrar el interruptor hayun periodo de ajuste hastaque se alcanza un estado esta- cionario. La longitud de esteperiodo de ajusteestárelacionadaconlas propiedades dealmacenamientode carga del capacitor y con el almace- namiento de energía dentro del inductor. El almacenamiento de energía puede oscilar entre estos dos elementos durante un periodo transitorio. Sin embargo, la resistencia enel circuito disipa la magnitud de las oscila- ciones. El flujo de corriente a través de la resistencia causa una caída de vol- taje (V,) dado por: VR = iR en donde i es la corriente y R es la resistencia del circuito. Cuando las uni- dades deR e i son ohm y amperes, respectivamente,entonces la unidad de V es elvolt. De manera semejante, un inductor resiste el cambio enla corriente, de forma tal que la caídadevoltaje (V,) alcruzarlo es de: di vr = L- dt , . A Interruptor -Batería y'; v0 - - 7-4 ,a Capacitor Inductor ' + + Resistencia FIGURA 6.5 Un circuito eléctrico. Cuando se cierra el interruptor, la corriente experi- menta una serie de oscilaciones hasta que se alcance un nuevo estado estacionario.
  • 189. 184 MÉTODOS NUMÉRICOS PARAINGENIEROS _l_____-~__lll."""~"" .~ donde t = O, q = qo = VoC,y Vo es el voltaje enla batería.La ecua- ción (6.11) describe lavariación de la carga enel capacitor enfunción del tiempo. Lasolución q(t) se gráficaenlafigura 6.6. Un problema de diseño típico en ingeniería eléctrica, puede necesitar que se determinala resistencia apropiada para disipar energía a una velo- cidad constante, con los valores de L y C conocidos. En este caso se su- ponequelacargasedebedisiparal 1% desuvalororiginal (q/q,, = 0.01) en t = 0.05 S , con L = 5 H y C = lO-"F. en donde L es lainductancia.Cuandolasunidadesde L e i sonhenrios y amperes, launidadde V, es elvolt y launidadde t es el segundo. Lacaídadevoltaje a travésdelcapacitor (V,)dependedelacarga (4) sobreelmismo: 9 vc = c en donde C es la capitancia. Cuando las unidades de carga se expresan en culembios, launidad de C es el faradio. La segunda ley de Kirchoff indica que la suma algebraica de las caí- dasdevoltajeen un circuitocerrado es cero. Despuésdecerrar el inte- rruptor se tiene: di clt C L - + R i + - = O9 Sin embargo, la corrienteestádada enfuncióndela carga como: I = -. d9 dt Por lo tanto: Esta es una ecuación diferencial ordinariade segundo orden quese pue- de resolverusando los métodosde cálculo. Lasoluciónestádada por: FIGURA 6.6 La carga enun capaci- tor en función del tiem- po que se presenta enseguidade cerro:el interruptoren lafigura 6.5.
  • 190. CASOS DEA DOS: RAiCESDE ECUACIONES 185 Solución: es necesarioresolver para R la ecuación (6.11),usando los va- lores conocidos de q , qo,L y C. Sin embargo, se debe emplear un mé- todo numérico ya que R es una variable implícita de la ecuación (6.11). Se usará el método de bisección para este propósito. Los otros métodos estudiados enlos capítulos 4 y 5también son apropiados, aunqueel mé- todo de Newton-Raphson tiene desventajas debido a quela derivada de la ecuación (6.11)es muy complicada. Reordenando la ecuación (6.11) se obtiene: o, usando los valores numéricos dados: f(R)= e-o.oo5Rcos(d2000 - 0.01R20.05) - 0.01 C6.121 Examinando esta ecuación puede verse que un rango inicial razonable de R es de O a 400 Q (ya que 2 O00 - 0.01R2 debe ser mayor de ce- ro). La figura 6.7, gráfica de la ecuación (6.12),lo confirma. Con vein- FIGURA 6.7 Gráfica de la ecuación (6.12)usada en la obtención de valores iniciales de R que encierren a la raíz.
  • 191. 186 MÉTODOSNUMERICOS PARA INGENIEROS CASO 6.5 Iresorteirnasa 'ncorriente circuito LR FIGURA 6.8 Ejemplos de tres oscila- dores armónicos.Lasfle- chas doblesindican las oscilaciones de cada sistema. FIGURA 6.9 tiún iteracionesdelmétodo de bisección se obtiene R = 328.1515, con un errormenor al 0.000 1%. De esta forma, se puede especificaruna resistencia con este valor en el diagrama de lafigura 6.5 y esperarque ladisipación sea consisten- tecon los requisitosdelproblema.Esteproblemadediseño no se puederesolvereficientemente sinusarlos métodos de loscapítulos 4 y 5. ANALISIS DE VIBRACIONES (INGENIERIA MECANICA) Antecedentes: las ecuaciones diferencialesse usan a menudo para mo- delar el comportamiento de sistemas en ingeniería. Uno de tales mode- los, que se aplicaampliamente enlamayorpartede los campos de la ingeniería, es el oscilador armónico. Algunos ejemplos bdsicos deloscila- dor armónico son elpéndulosimple,unamasaatada a un resorte y un circuito eléctrico inductor-capacitor (Fig.6.8).Aunque estos son sistemas físicos muy diferentes,sus oscilaciones se pueden describir mediante un mismo modelo matemático. De esta manera, aunque este problemaanaliza el diseño de un amortiguador paraun automóvil, el comportamientoge- neral se aplica a unagranvariedaddeproblemasentodoslos campos de la ingeniería. Como se ilustraenlafigura 6.9, un conjuntoderesortessostienen un auto de masam. Los amortiguadores presentan una resistenciaal mo- vimientodelautolacual es proporcional a la velocidadvertical (movi- miento ascendente-descendente)delmismo.Laalteracióndelequilibrio del auto provoca que el sistema oscile como x@).En un momento cual; quiera, las fuerzas que actúan sobre la masa m son la resistencia de los resortes y la capacidaddeabsorber el golpe de losamortiguadores. La Un auto de masa m.
  • 192. CASOS DE LA PARTE DOS: RAfCES DE ECUACIONES 187 resistencia de los resortes es proporcional a la constante de los mismos (k) y a la distancia al punto de equilibrio (x): Fuerzadelresorte = "kx [6.13] en donde el signo negativo indica que la fuerza de restauración regresa al auto a su posición de equilibrio. La fuerza de amortiguación está dada por: dx dt Fuerza de amortiguación = "c- en donde c esun coeficiente de amortiguamiento y dx/dt es la velocidad vertical. Elsigno negativoindica que la fuerza de amortiguación actúa en dirección opuesta a la velocidad. Las ecuacionesde movimiento parael sistema están dadas por la se- gunda ley de Newton (F = ma), que en este problema está expresada como: d2x dx dt dt m - -- "c - + ( - W Masa x aceleración = fuerza de amortiguación + fuerzadelresorte O d2x c dx k-+"-+"X=o dt2 m dt m Esta es una ecuacióndiferencial ordinaria de segundo ordenque se pue- de resolver con los métodos del cálculo. Por ejemplo, si el auto encuen- tra por casualidad un hoyo en el camino en t = O de tal forma que se desplazadel punto de equilibrio x = x. y dx/dt = O, entonces: x(t) = e-"' (xocos pt + donde n = c/(2m), p = - sen pt) n P [6.14] dk/m-c2/(4m2) v k/m > c2/(4m2).La ecuación (6.14) proporcionala velocidad vertical del auto enfunción del tiempo. Los valores de los parámetrosson c = 1.4por lo7g/s, m = 1.2 por lo6g y k = 1.25por lo99/s2. Si x. = 0.3. las consideracio- nes de diseño enla ingeniería mecánica requieren que se denlos estima- dos en las tres primeras ocasiones que el auto pase a través del punto de equilibrio.
  • 193. 188 MÉTODOS NUMÉRICOS PARAINGENIEROS Solución: este problema de diseño se puede resolver usando los méto- dos numéricos de Tos capítulos 4 y 5. Se prefieren los métodos que usan intervalos y el de la secante ya que la derivada de la ecuación (6.14) es complicada. Lasaproximacionesa los valores iniciales seobtienenfácilmente con base a la figura 6.10. Este caso de estudioilustra cómo los métodos gráficos proporcionan a menudo información muy importante para apli- car satisfactoriamente los métodos numéricos. La gráfica ilustra que este problema es complicado debido a la existencia de varias raíces, por lo que en este caso, se debenusar intervalos pequeños para evitar traslapes de raíces. En el cuadro 6.3se enlistan los resultados obtenidos porlos métodos de bisección, la regla falsa y la secante, con un criterio de paro del O. 1%. Todos los métodos convergen rápidamente. Como era de esperarse,los métodos de la regla falsa y de la secante son más eficientes que el de bi- sección. Nótese que para todoslos métodos los errores relativos porcentuales aproximados son mayores que los errores reales. De esta forma, los re- sultados son exactosal menos hasta el criterio de paro,el O. 1%. Sin em- bargo, puede observarse también que el método de la regla falsa y el de FIGURA 611O Gráficode lo posición de un amortiguador respecto altiempodespués que lo rueda del auto cae enun hoyo delcamino. ". " ..
  • 194. CASOS 189 CUADRO6.3 Resultados obtenidosal usar los m6todos de bisecciin, regla falsay de la secantepa- ra localizar las primeras tres raíces delas vibraciones de un amortiguador. Seu d un crfterio de paro del 0.1 para obtener estos resultados. N6tese quelos valores exac- tos de las raíces son0.055 209 532 9, 0.1 54 178 13y 0.253 146 726 ~ -~ ERRORRELATIVO PORCENTUAL ValorinicialValorinicialAproximaciinNúmerode MBtodo inferiorsuperior a la M ~ Z iteracionesAproximadoVerdadero Bisección 0.0 o.1 0.0552246 11 0.0880.027 0.1 0.2 0.1541992 10 0.0630.014 0.20.3 Regla 0.0 0.1 0.0552095 5 0.002 0.0001 falsa o.1 0.2 O. 1541790 40.069 0.0006 0.2 0.3 0.2531475 40.043 0.0003 Secante 0.0 o.1 0.0552095 5 0.038 0.0001 o.1 0.20.1541780 5 0.020 0.0001 0.2 0.3 0.2531465 5 0.017 0.0001 la secante son muy conservadoresen esta relación. Recuérdese el aná- lisis de la sección 4.3 en que elcriterio de paroconstituye esencial- mente una aproximación a la diferencia conla iteración anterior. De esta forma, para esquemas deconvergenciarápida como los métodos Cte la reglafalsa y de la secante, la mejora enexactitudentredositeraciones sucesivas es tangrandeque E" será, en general, muchomenor que E,. El significadoprácticode este comportamientoes de poca importancia cuando se va a determinar sólo una raíz. Sin embargo, si se requiere cal- cualar variasrakes, la convergenciarápida viene a ser una propiedadmuy valiosa como paratomarlaencuenta cuando se escoge un método en particular. PROBLEMAS Ingeniería en general 6.1 Usando los programaspropios,reprodúzcanselos cálculos realizados en el caso 6.1. 6.2 Realícense los mismos cálculos del caso de estudio 6.1, pero usandouna tasa de interés del 17% (i = 0.17). Si es posible, úsense los programaspropios para determinar los puntos de equilibrio. De otra manera, úsese cualquiera de los mé- todos analizados enlos capítulos 4 y 5 y realícense los cálculos. Justifíquese el uso del método escogido. 6.3 Enel caso 6.1, determínese el número de años que se debe poseer laMicro dos para que genere ganancias. Esto es, calcúlese elvalor de n en el cual A, de la ecuación (6.4) sea positivo.
  • 195. 190 METODOSNUMERICOS PARA INGENIEROS 6.4 Usando un esquema similar al del caso 6.1,se puede desarrollarla siguiente ecua- ción para determinar el costo anual neto de una microcomputadora: 175n-3000(1.2), A" +- + 5000 12" - 1 12" - 1 Encuéntrese el valor de n tal que A, sea cero. 6.5 Supóngasequesedeseacomprar un automóvil y est6 limitado adosopciones. Como enel caso 6.1, el costo anual neto de poseer cualquiera delos dos vehicu- los está compuesto por el costo de compra, costo de mantenimientoy de las ga- nancias: Modelode lu/o Modelo econ¿mico Costo de compra, $ -15,000 -5000 Costo de mantenimiento, $/año/aiio -400-200 Ganancias anuales y beneficios, $ 7500 3000 Si la tasa de interés es del 12.5% (i = 0.125),calcular el punto de equilibrio (n) para los automóviles. 6.6 Si se compra una pieza de equipo en$20 O00 en abonos, pagando $5O00 duran- te 5años. ¿Qué tasa deinterés se está pagando?La fórmula que relacionael costo actual (P),los pagos anuales (A),el número de años (n)y la tasa de interés es: A = P i(l + i)" (1+ i)" 6.7 Debido a que las tablas de economía se desarrollaron hace mucho tiempo, no se programaron para las tasas altas de interés que prevalecen hoy en día. Además, no se planearon para manejar tasasde interés fraccionarias. Comoen el problema siguiente, se puedenusar métodos numéricos para deteminarlas estimaciones eco- nómicas en estas situaciones. Un nuevo centro dediversiones cuesta $10 millones de pesosy produce una ganancia de $2 millones. Si la deuda se debe pagar en 10 años ¿a qué tasa de interés debe hacerse el préstamo? El costo actual (P), el pago anual (A) y la tasa de interés (i)se relacionan entre sí mediante la siguiente fórmula: P (1 + i)" - 1- A -- i ( l + i)" donde n es el número de pagos anuales. Para este problema, P 10000000 A 2000000 "- = 5 Por lo tanto, la ecuación se transforma en: (1 + i ) ' O - 1 5 = i(1 - i)
  • 196. CASOS LAPARTE DOS: RAiCES DE ECUACIONES 191 La tasa de interés que satisface esta ecuación se puede determinar encontrando laraíz de: j(i) = (1 + ¡)'O - 1 i ( l + i) - 5 a) Dibújese j(i) contra i y para obtener unaestimacióngráfica de laraíz. b) Cacúlese i usando el método de bisección (contar las iteraciones). c) Calcúlese i usando el método de la reglafalsa (contra las iteraciones) En los incisos (b)y (c) úsense los valoresiniciales de i = 0.1 y 0.2. Obténgase un niveldel errordel 2% en ambos casos. Ingeniería química 6.8 Usando losprogramas propios, realícense los cálculos del caso 6.2. 6.9 Ejecútense los mismoscálculosdel caso 6.2, pero con el alcoholetílico (a = 12.02 y b = 0.084 07) a una temperatura de 350" K y una p de 1.5 atm. Compárense los resultados con los de la ley de los gases ideales. Si es posible, úsense los pro- gramas propios para determinar el volumen molar. De otraforma, úsense cualquier- ra de los métodos numéricos analizadosen los capítulos 4 y 5 pararealizarlos cálculos. Justifíquese el método escogido. 6.1 O Repítase el problema 6.9 con óxido nitroso (a = 3.782 y b = 0.044 15) a una temperatura de 450" K y una p de 2 atm. 6.11 La temperatura (en gradosKelvin) de un sistema, varíadurante el díade acuer- do con: T = 400 + 200 COS ~ 27rt 1440 en donde t se expresa en minutos. La presiónsobre el sistema esta dada por p = e-t'1440. Desarróllese un programa que calcule el volumenmolardel oxi- geno en intervalos de un minuto a lolargodel día. Grafíquense los resultados. Si se tiene capacidad gráfica en la computadora grafíquense los datos. Si no es así, grafíquense los resultados a intervalos de 60 minutos. Los antecedentes de este problema se pueden econtrar en el caso 6.2. 6.12 En ingeniería química, los reactores de flujo (es decir, aquéllos en que un fluido va de un extremo al otro con una mezcla mínima a lo largo del eje longitudinal) se usan a menudo para convertir reactivos en productos. Se ha determinado que la eficiencia de la conversión se puede mejorar a veces reciclando una parte del flujodel producto de manera que regrese a la entrada para un paso adicional a travésdel reactor (Fig. P6. 12). La tasa de reciclaje se define como: R = volumen de fluido regresado a la entrada volumen de fluido que deja el sistema Supóngase que se est&procesando una sustancia químicaA para generarun pro- ducto B. Para el caso en que B de acuerdo a una reacción autocatalítica.
  • 197. 192 MÉTODOS NUMERICOS PARA INGENIEROS FIGURA P6.12 Representaciónesquemática de un reactor de fluioconreciclaje. (esto es, en la que uno de los productos actúa como catalizador o de estimulante en la reacción), o A + B - B + B se puede demostrar que una tasa óptima de reciclaje debe satisfacer en donde X,, es la fracción del reactante A que se convierteal producto B. La ta- sa óptima de reciclaje corresponde aun reactor de tamaño mínimo, necesario para alcanzar elnivel de conversión deseado. Úsese el método de bisección para determinar las tasas de reciclaje necesarias que minimicen al tamaño del reactor en conversiones fraccionales de U) X,, = 0.99 b)X, = 0.995 c)XA/ = 0.999 6.13 En un proceso químico, el vapor de agua (HzO)se calienta a una temperatura lo suficientementealta para que unaporción significativa del agua sedisocie o se rompa enpartesparaformaroxígeno (O,) ehidrógeno (Hz): Si se supone que es la única reacción que se lleva a cabo, la fracción molar (x) de HzO que se separa puede representarse como: k, = - 1 - x [P6.13] en donde k, es la constante de equilibrio de la reacción y pt es la presi6n total de la mezcla. Si pt = 2 atm. y k, = 0.045 68, determínese el valor de x que satisfa- ce a la ecuación (P6. 13). Ingeniería civil 6.14 Usando los programaspropios,repítanse los cálculos del caso 6.3
  • 198. CASOS DE LA PARTE DOS: RAíCESDE ECUACIONES 193 6.15 Efectúense los mismos cálculos del caso 6.3, pero con una tasa de crecimiento de 1.5 por lo6litros por célula por día. 6.17 La concentración de la bacteria contaminante C en un lago decrece de acuerdo a la relación: Determínese el tiempo requerido para que la bacteria se reduzca a 10, usando a) un médoto gráfico y b) el métododeNewton-Raphson. 6.18 Muchos campos de la ingeniería requieren estimaciones exactas, de la población. Por ejemplo, para la transportación, los ingenieros consideran necesario determi- nar por separado la tendencia del crecimiento demográfico de una ciudad y de lossuburbiosadyacentes. La población delárea urbana declina en función deltiempo de acuerdo con mientras que la población suburbana crece, de acuerdo a en donde Pu,m6x,k,, Pu,mín,, Ps,max,Poy k, son parámetros derivados de forma empírica. Determínese el tiempo y los valores correspondientes deP,(t) y de P,(t)cuan- do las poblaciones son iguales. Los valores de los parámetros son Pu,,,&= 60 000; k, = 0.04 año"; Pu,mín= 12 000; Ps,mdix= 5 O00 y k, = 0.06 año"'Para obtener las soluciones,úsese a) un método gráfico y b) el métodode la regla falsa. 6.19 El movimiento deunaestructurasedefinemediante la siguienteecuaciónpara una oscilación amortiguada: y = 10e-kfcos wt donde k = 0.5 y w = 2. a) osese el método gráfico, para obtener unaestimación inicial del tiempo necesa- rio para que el desplazamiento baje hasta 4. b) Úsese el método de Newton-Raphson para determinar laraíz hasta un E, = 0.01%. c) Úsese el método de la secante para determinar laraíz hasta un es = 0.01%.
  • 199. 194 METODOS NUMtRICOS PARA INGENIEROS- 6.20 La figura P6.20 muestra un canal abierto de dimensionesconstantes con un área transversal A. Bajo condiciones de flujo uniforme, se cumple la siguiente relación basada en la ecuación de Manning: 23 Q = "( ) su2 n B + 2y, [P6.7] en donde Q es el flujo, y, es la profundidadnormal, B es el ancho del canal, n es un coeficiente derugosidadusado para medir los efectos de lafriccióndel materialen el canal y S es la pendiente del canal. La ecua- ción se usa en ingeniería de fluidos y recursos de agua para determinar la profun- didad normal. Si este valor es menor que la profundidadcrítica: FIGURA P6. 20. en donde g es la aceleración de lagravedad (980cm/s2),entonces el flujo es sub- crítico. Úsese un método gráfico y el método de bisecciónparadeterminar y,, si Q = 14.15 m3/s; B = 4.572 m;n = 0.017 y S = 0.001 5. Señálese siel flujo es sub o supercrítico. Ingenieríaeléctrica 6.21 Úsense los programaspropios para repetir los cálculosdel caso 6.4. 6.22 Efectúense los mismos cálculos del caso 6.4 suponiendo que la carga se debe disi- paral 2% de su valororiginalen 0.04 s. 6.23 Efectúense los mismoscálculosdel caso 6.4, determinando el tiempo necesario para que el circuitodisipeel 10% suvalor original, dado R = 300 Q C = lop4 F y L = 4 H . 6.24 Efectúense los mismos cálculos del caso 6.4 determinando elvalor de L necesa- rio para que elcircuitodisipe al 1% de su valororiginalen t = 0.05 S, dado R = 300 Q y c = F. 6.25 Una corriente oscilatoriaen un circuito eléctrico se describemediante I = 1Oe" sen(27rt) en donde t está dado en segundos. Determínense todos los valores de t tales que I = 2. Ingeniería mecánica 6.26 Usando los programas propios, repítanse los cálculos realizadosen el caso 6.5. 6.27 Efectúense los mismos cálculos del caso 6.5, usando c = 1.5 por lo7 g/s, k = 1.5 por lo9 g/s2 y m = 2 por lo6g.
  • 200. CASOS LAPARTE DOS: RAíCESDE ECUACIONES 195 6.28 Efectúense los mismos cálculos del caso 6.5, pero determinando el valor de k de forma tal que la primera raíz seencuentreen t = 0.08 s. 6.29 Efectúense los mismos cálculos del caso 6.5, perodeterminando el valor de m de tal forma que la primera raíz se encuentre en t = 0.04 s. 6.30 Efectúense los mismos cálculos del caso 6.5 pero determinando el valor de c de tal formaque la segunda raíz seencuentreen t = 0.2 s. 6.31 Léanse todos los casos del capítulo 6. En base a la lectura y a la experiencia obte- nida, concíbase un caso de estudio en cualquier campo dela ingeniería. Esto im- plica la posibilidad de modificar o expresar de forma diferente alguno delos casos anteriores. Sin embargo, también puede ser totalmente original. AI igual que los ejemplos anteriores, se debe redactar desdeel contexto de los problemas de inge- niería y debe demostrar el uso de los métodos numéricos en la solución de raíces de ecuaciones. Descríbanse los resultados empleando los casos anteriores como modelo.
  • 201. EPíLOGO: PARTE II 11.4 ELEMENTOS DE JUICIO El cuadro 11.3 proporciona un resumen de los fac- tores de mayor importancia quese emplean en la solución de raíces deecuacionesalgebraicasy trascendentales. Aunque los métodos gráficoscon- sumen tiempo, son muy útiles para comprenderel comportamiento de la función y para identificar valores inicialesy problemas potenciales,como las raíces múltiples. Par lo tanto, si el tiempo lo permi- te, un bosquejo rápido (o mejor aún, una gráfica por computadora) ayuda arelacionar información útil asociada al comportamiento de la función. Los métodos numéricosse dividen en dos catego- rías generales: métodos que usan intervalosy mé- todos abiertos. Los primeros requieren dos valores iniciales quecontenganalaraíz. Esta conten- ción" se respeta a medida que la solución avan- za, y de esta forma, estos métodossiempre son convergentes. Sin embargo, tiene el inconvenien- te que la velocidad de convergencia es demasia- do lenta. De los métodos que usan intervalos, el método de la regla falsa, en general, esel méto- do de preferencia ya que en la mayor parte de los problemas converge muchomás rápido queel método de bisección. # I Los métodos abiertos se distinguen de los que usan intervalos en que requieren informaciónúnicamen- te de un punto (o de dos, pero que no contengan a la raíz necesariamente)para extrapolar unanue- va aproximación a la raíz. Esta propiedad es una espada de doble filo. Aunque conduce a una con- vergencia más rápida, también permitela posibi- lidad de divergencia.En general, la convergencia de los métodos abiertos depende parcialmente de la calidad del valor inicial. Entre más cercano se encuentre éste de la raíz, más probable es que con- verja alamisma. De los métodos abiertos, el de Newton-Raphson se usa más a menudo, debido a su propiedad de convergencia cuadrática. Sin embargo, su mayor desventaja estriba en que la derivada de la fun-
  • 202. 198 METODOS NUMÉRICOS PARA INGENIEROS I - e C S O O M ._ W 3 z m O U .- i O C + 2 N
  • 203. EPíLOGO PARTE I I 199 11.5 11.6 ción se debe obtener de forma analítica. Para algunasfunciones esto es impráctico. En estos casos, el método de la secante proporciona una alternativa viable empleandoun método dediferencias finitas para representar la derivada. Debido a la aproximación, la velocidad de convergencia del método de la secante es menor que la del método deNewton-Raphson. Sin embargo, amedidaquelaaproximación a la raízse hace más y más exacta, la aproximación a la derivada se convierte en una mejor representaciónde la derivada exacta y la ve- locidad de convergencia aumenta rápidamente. En el caso de raíces múltiples, se puede usar el método de Newton-Raphson modificado para alcanzar una convergencia rápida. Sin embargo, este método requiere de una expresión analítica de la primera y la segunda de- rivadas. Todos los métodos numéricos son fáciles de programar sobre unami- crocomputadora y requieren de un tiempo mínimo para determinar una raíz. En base a esto, se concluye que los métodos tales como la bisección son suficientes para propósitos prácticos. Esto sería verda- dero si se estuviese interesado únicamente en una raíz de una ecua- ción. Sin embargo, existen muchos casos dentro de la ingeniería en donde se requiere encontrar varias raíces en cuyo caso la velocidad viene a ser un factor muy importante. Enestos casos, los métodos lentos consumenmuchotiempoy por lo tanto se vuelvencostosos.Porel otro lado, los métodos rápidos pueden divergir ylos retardos ocasio- nados por esto se pueden volver también costosos. Algunos algorit- mos pretenden aprovecharlas ventajasde ambos métodos, empleando inicialmente un método que use intervalos para acercarse a la raíz y en ese momento cambiar a un método abierto para refinar rápida- mente la raíz. Mientrasse use sólo un método o una combinación de ellos, los factores a tomarse en consideración entre la convergencia y la velocidadson la baseen la elección del método para localizar raíces. RELACIONES Y FóRMULAS IMPORTANTES El cuadro 11.4 resume la información más importante que se analiza en la parteII.Este cuadro se puede consultar para tener acceso rápi- do a alguna relación o fórmulaimportante. MÉTODOS AVANZADOS Y ALGUNAS REFERENCIAS ADICIONALES Los métodos de este capítulo han sido limitados para determinar las raíces de una ecuación algebraicao trascendental, basados enel co-
  • 204. 200 METODOS NUMERICOS PARA INGENIEROS CUADRO 11.4 Resumen de la informacidn más importante presentada en la parte I1 Mdtodo Interpretación Errores y Formulación gráfica criterios deparo MOtodos que usanintervalos: Bisección Regla falsa xr = -x/i-xu 2 Criterio de paro: Newton-Raphson Métodos abiertos: Secante Criterio de paro: nueva pesada Criterio de paro: 1x;+;,+; x, 1 Error: E,,.l : 100% Ie, = O(€?) Criterio de paro:
  • 205. EPíLOGO PARTE II 201 nocimiento previo de su posición aproximada. Existen otras técnicas para deteminar raíces complejas y todas las raíces de un polinomio. Algunasreferenciasrecomendables al respectosonRalstonyRabi- nowitz (1978) y Carnahan, Luthery Wilkes (1969). James, Smith y Wolford (1977) y Gerald y Wheatley (1984) resumen algunos de los métodosy proporcionan sus programas. En cuanto a técnicas específicasel método de Newton-Raphsonse pue- de usar enciertos casos para localizarraíces complejasen base a una aproximación inicial compleja. Ya que la mayor parte de las compu- tadoras no llevan acabo operaciones complejas, algunas veces el mé- todo se ve limitado. Sin embargo, Stark (1970) ilustra una manera de eludir este dilema. El método de Mulleres parecido al método de la regla falsasólo que este usa interpolación cuadrática, en vez de lineal, para localizar la raíz. Este planteamiento se puede emplearen la determinacióntanto de raíces complejas como de reales (Muller, 1956; Gerald y Whea- tley, 1984; Rice, 1983). Existen varios métodos para determinar todas las raíces de un poli- nomio. El método de Bairstow requiere una buena aproximación ini- cial para la localización eficiente de raíces(Gerald y Wheatley, 1984 y James, Smith y Wolford, 1977). El método de Graeffe (Scarborough, 1966 y James, Smith y Wolford, 1977) y el algoritmo de/cociente de diferencias (QD) (Henrichi, 1964 y Gerald y Wheatley, 1984) deter- minan todas las raícessin una aproximación inicial.Ralston y Rabino- witz (1978) y Carnahan, LutheryWilkes (1969) contienentambién análisis de los métodos mencionados anteriormente, así como de las otrastécnicas para lalocalizaciónde lasraíces de un polinomio. En resumen, el análisis anterior va enfocado a proporcionaral lector formas de explorar más a fondo los temas. Además, todas las refe- renciasanteriores proporcionan descripciones de lastécnicasbási- cas cubiertas enla parte II. Es importante quese consulten estas fuentes de información para ampliarel conocimiento de los métodos numéri- cosen lalocalizaciónderaíces.* * El autor hace aquísólo una referencia alos libros, al final del texto se presenta una bibliogra- fíacompleta.
  • 206. 104 MhODOS NUMERICOS PARA INGENIEROS cuatro o más ecuaciones la solución se torna difícil y se debe utilizar una computadora. Históricamente, la imposibilidad de resolverestos sistemas a mano, excepto sistemas muy pequeños, limitóel alcance de problemas dirigidosamuchasaplicaciones de ingeniería. Antes del usode las computadoras, las técnicas para solucionar siste- mas de ecuaciones algebraicaslineales requerían mucho tiempoy eran muy difíciles. Estos planteamientoscreaban restricciones sobre la crea- tividad ya que los métodos eran difíciles de implementar y de enten- der. Be ahí que se hacía hincapié enlastécnicas,acosta de otros aspectos del proceso de solución al problema,tales como la formula- ción y la interpretación (recuérdese la figura 1.1 yelanálisis que la acompaña). El advenimiento de computadoras personales de fácil acceso hacepo- sible y práctica la solución de grandes sistemas de ecuaciones alge- braicas lineales. De esta manera, se pueden plantear problemas más complejos y más realistas. Además, habrá más tiempo de examinar las habilidades creativas ya que se hará más hincapie en la formula- cióneinterpretacióndelproblema. FIGURA 1 1 1 . 1 Dos tiposdesistemasque pueden ser modelados usando sistemas de ecua- ciones algebraicas lineales: a) sistema macrovariable que involucra un conjunto acoplada decomponentes finitas y b)sistema microvariable que involucra continuidad.
  • 207. SISTEMAS ECUACIONES ALGEBRAICASLINEALES 205 I II. 1 . 2 Ecuacionesalgebraicas linealesy su práctica en la ingeniería Muchas de las ecuaciones fundamentales de la ingeniería se basan en las leyes de conservación (recordarel cuadro 1 1 . 1 ) . Algunas canti- dades familiares que forman partede estas leyes sonla masa,la fuerza, la energía y el momento. En términos matemáticos, estos principios llevan a ecuaciones de equilibrio que estudian el comportamiento del sistema; estas ecuaciones consideran las incógnitas a obtener del mo- delo matemático: los niveles o respuestas de la cantidad que se está modelando, las propiedades o características del sistema, y los estímulos externos que actúan sobre el sistema. Como unejemplo,laconservacióndelamasa se puede usar para formular un balance de masa en un conjunto de reactores químicos (Fig. Ill.1 a). En este caso la cantidad que se modela es la masa de la sustancia en cada reactor. Las propiedades del sistema son las ca- racterísticasde la reacción de lasustancia además delos tamaños de los reactores y la velocidad de flujo. Losestímulos externosson los suministros de sustancias al sistema. En la parte anterior del libro,se ve cómo sistemas de un solo compo- nente generan una ecuación que se puede resolver con las técnicas de localización de raíces.Los sistemas con componentes múltiples ge- neran un conjunto de ecuaciones matemáticas acopladas que deben resolverse simultáneamente. Las ecuaciones están acopladas porque las partes individuales delsistema influyensobre otras partes. Por ejem- plo, en la figura 1 1 1 . 1 a, el reactor 4 recibe sustancias de los reactores 2 y 3. En consecuencia, su respuesta depende de la cantidad de sus- tanciade estos reactores. Cuando estas dependenciasse expresan en forma matemática, las ecua- ciones resultantes,a menudo, son de la forma algebraica de la ecuación (Ill.1). Las x, usualmente, miden las magnitudes y respuestas de los componentes individuales. Con la figura Ill.la como ejemplo, x, pue- de medir la cantidad de masa en el primer reactor, x:, la del segun- do, etcétera. Las a, representannormalmente las propiedades y características que se refieren a las iteraciones entre las componen- tes. Por ejemplo, lasa en la figura Ill.1 a pueden reflejar lasvelocida- des de flujo de masa entre los reactores. Finalmente, las c representan los estímulos externos que actúan sobreel sistema, talcomo los sumi- nistros de sustancias enla figura 111.1a. Los casos de estudio en el ca- pítulo 9 muestran otros ejemplos de tales ecuaciones, derivadas de laprácticadelaingeniería. Los problemas de componentes múltiples como los tipos anteriores re- sultan demodelosmatemáticos discretos (macro-) o continuos
  • 208. 206 MÉTODOS NUMÉRICOSPARA INGENIEROS -__ 111.2 (micro-) (Fig. 1 1 1 . 1 ) . Los problemasdevariables discretasimplican componentes finitos acoplados como las armaduras (caso9.3))reactores (Fig. III.la) y circuitos eléctricos (caso 9.4). Estos tipos de problemas usan modelos que proporcionan a grandes rasgosel comportamien- to de un sistema en función de ciertas variables. Por el contrario, los problemas microescalados intentan describir las características de los sistemas con una base continua o semicontinua. La distribución de sustanciasobre un reactorrectangular alargado (Fig. III.1 b)es un ejemplo de un modelo de variable continua.Las ecua- ciones diferenciales derivadas de las leyes de conservación especifi- can la distribución de la variable dependiente para tales sistemas (caso 9.2). Estas ecuaciones diferencialesse pueden resolver numéricamente para convertirlasa unsistema equivalente de ecuaciones algebrai- cassimultáneas. La solución de este conjunto deecuacionesrepre- senta unaimportanteaplicación enel áreadeingenieríapara los métodos de los capítulos siguientes. Estasecuaciones están unidas por- que las varihbles en cierta posición dependen de las variables de re- giones adyacentes. Por ejemplo, la concentracióna la mitad del reactor es una función de la concentración en regiones adyacentes. Se pue- den desarrollar ejemplos similares para la distribución de la tempe- ratura o delmomento. Además de los sistemas físicos, las ecuaciones algebraicas lineales si- multáneas también aparecen en una variedad de contextos en pro- blemas matemáticos.Esto resultacuando se requiere que las funciones matemáticas satisfagan varias condicionesde manerasimultánea. Ca- da condición da como resultado una ecuación quecontiene coeficientes conocidos y variables incógnitas.Las técnicas expuestas en esta par- te se pueden usar para encontrar los coeficientes de los sistemascuando las ecuaciones sean linealesy algebraicas. El análisis de regresión (ca- pítulo 10)y la interpolación cúbica segmentaria (spline, capítulo l l) son algunas de las técnicas ampliamente usadas que utilizan ecuacio- nes simultáneas. FUNDAMENTO§MATEMÁTICOS En todas las partes de este libro se requieren algunos fundamentos matemáticos. Son últiles, en la parte Ill, la notación matricial y el ál- gebra, ya que ofrecen una forma concisa de representar y manipular sistemas de ecuaciones algebraicas lineales. Si se está familiarizado con las matrices, puede pasarse por alto la sección 111.3. Para quie- nes noestánfamiliarizados o requieren una repasada, el siguiente materialproporcionaunabreveintroducciónaltema.
  • 209. SISTEMAS ECUACIONESALGEBRAICASLINEALES 207 111.2.1 Notación matricial Una matriz-constade un arreglo rectangular de elementos represen- tados por un símbolo simple. Como se puede ver en la figura 111.2, [A]es la notación abreviada para la matriz y uiirepresenta un ele- mentoindividual delamatriz. Al conjunto horizontal de elementosse le llama renglón y al conjunto vertical se le llama columna. El primer subíndice i siempre denota el número del renglón en quese encuentra el elemento. El segundo sub- índice j denota la columna. Porejemplo,elelemento 023 estáenel renglón 2 y en la columna 3. La matriz de la figura 111.2 tiene m renglones y n columnas y se dice que es dimensión m por n (o m X n). Se le conoce como una matriz m por n. Las matrices con dimensión m = 1 en el renglón, tales como [B] = [b,b2. . . b"] seles llama vectores renglón. Nótese que por simplicidad, se omite elprimersubíndice. Las matrices con dimensiónn = 1 en lacolumna, tales como FIGURA 111.2 Una matriz.
  • 210. 208 MÉTODOS NUMERICOS PARA INGENIEROS se les conoce como vectores columna. Por simplicidad se omite el se- gundo subíndice. A las matrices donde m = n se les llama matrices cuadradas. Por ejem- plo, una matriz 4 por 4 es a11 a12 a13 a14 [Al = a21 a22 023 024 [:: 2 2: 24 Se le llama diagonal principal de la matriz a la diagonal consistente de los elementos a,,,aZ2,q 3 y ad4. Las matrices cuadradas son particularmente importantes en la solu- ción de sistemas de ecuaciones lineales simultáneas. Para tales siste- mas, el número de ecuaciones (correspondiente a los renglones) y el número de incógnitas (correspondientea las columnas)deben ser iguales en orden para que sea posible unasolución única. Porconsiguiente, las matrices cuadradas se encuentran al trabajar con tales sistemas. Al- gunos tipos especiales de matrices se describen en el recuadro 1 1 1 . 1 . RECUADRO 1 1 1 . 1 Tipos especiales de matrices cuadradas Hay algunas formas especiales de matrices cuadradas Nótese que se deian en blanco los bloques grandes de que son importantes y se deben mencionar: elementos que son cero. Una matriz simétrica es aquelladonde ai; = qij para Una matriz identidad es una matriz diagonaldonde to- toda i ytoda ;. Por ejemplo, dos los elementos de ladiagonal principal son iguales a 1 , como en [A] = [i 1a] [/I = r l l 11 11 es una matrizsimétrica 3 por 3. Una matriz diagonal es una matriz cuadradadonde to- tiene propiedades a la unidad. dos loselementos fuera de la diagonal principal son iguales a cero, como en El símbolo [I] denota la matriz identidad. Esta matriz Una matriz triangular superior es aquella dondetodos sus elementos baio la diagonal principalson cero, como [all all a13 a141 [Al = I a23a33 a34 IL (7441
  • 211. SISTEMAS ECUACIONES ALGEBRAICASLINEALES 209 Una motriz triangular inferior es aquella donde todos cero, conlaexcepción de una banda centradasobre sus elementos arribadeladiagonalprincipal son ce- la diagonalprincipal: ro, como Una motriz banda tienetodos los elementosiguales a le da un nombre especial, motr;z tr;d;agonal, La matriz anterior tiene un ancho de banda de 3 y se 111.2.2 Reglas deoperaciónsobre matrices Ahora que se ha especificado lo que significa una matriz, se pueden definir algunas reglas de operación que gobiernansu uso. Dos matri- ces m por n son iguales, si y sólo si, cada elemento de la primera es igual a cada elemento de la segunda; esto es [A] = [B]si a;, = bjjpa- ra toda i, j. La suma de dos matrices, [A]y [B],se realiza sumando los elementos correspondientes de cada matriz. Los elementos de la matriz [C]re- sultante se calculan como: p a r a i = 1 , 2 , . . ., m y i = 1 , 2, - .. , n. De formasimilar, la resta de dos matrices, [E]y [F], se obtiene restan- do los términos correspondientes, como: d..= e.."..'I 'I 'I para i = 1 , 2, . . . ,my j = 1 , 2, . . . , n. De la definición anterior, se sigue inmediatamente quela suma y la resta se puede llevara ca- bo sólo entrematrices que tienenlas mismas dimensiones. Lasuma y la restasonconmutativas: Y
  • 212. 210 MÉTODOS NUM~RICOSPARAINGENIEROS La suma y la restatambién son asociativas, esto es, La multiplicación de una matriz [A]por un escalar g se obtiene multi- plicando cada elemento de [A] por g, como en El producto dedos matrices se representa como [C]= [A][B],en don- de los elementos de [C]se definen como (véaseel recuadro 111.2 donde se expone el conceptosimpledelamultiplicaciónmatricial) n k= 1 C;; = a r k bk; [111.2] Donde n = la dimensión de las columnas de [A]y la dimensión de los renglones de [B]. RECUADRO 111.2 Método simple para multiplicardosmatrices Aunque la ecuación (111.2)está bien definida para im- plementarse en una computadora, noes la forma más simple de visualizar la mecánica de multiplicación de dos matrices. En seguida se presenta una expresión más tangible sobre este concepto. Supóngase que se desea multiplicar [A] por [B] y obtener [C]: Una forma simple de representar el cálculo de [C]es elevar [B],como en Ahora la respuesta [C]se puede calcular enel espacio vacante deiado por[B]. Este formato tiene utilidad por- que alinea los renglones apropiados y las columnas que se van a multiplicar. Por ejemplo,de acuerdo a la ecua- ción (111.2)el elemento c1 se obtienemultiplicandoel primer renglón de [A]por la primera columna de [B]. Esto es equivalente a sumar el producto de y bl,, al producto de y b , ,como 912 7=22 For io tanto, cl,,es igual a 22. El elemento c2,,se pue- de calcular en unaforma similar, como
  • 213. SISTEMAS DE ECUACIONESALGEBRAICASLINEALES 211 14".:',[A]+ 8 6 x 5 + 6 ~ 7 = 8 2 +[C] o 4 Nótese queeste método esclarece el porqué es impo- sible multiplicar si el número de columnasde la prime- ra matriz no es igual al número ¿e renglonesde la El calculo se puede continuar deesta manera, siguien- segunda. Nótese cómo demuestra que el orden de la do la alineación de renglones y columnas, para obte- mdtiplicación coincide también. De la misma manera ner el resultado: ilustra estos puntos el problema 7.3. Esto es, el elemento cji se obtiene sumando el producto de elemen- tos individualesdel i-ésimo renglón de la primera matriz,en este caso [A],por la i-ésima columna de la segunda [B]. De acuerdo aesta de- finición, la multiplicación de dos matrices sólo se puede realizar si la primera matriz tiene tantas columnas como renglones la segunda. Por lo tanto, si [A] es una matriz m por n, [B] deberá ser una matriz n por p. En este caso, la matriz [C]resultante tendrá dimensión m por p. Sin embargo, si [B]fuese una matriz p por n, la multiplicación no se podría llevar a cabo. La figura 111.3 muestra una forma fácil de verificar si se pueden multiplicar dos matrices. Si las dimensiones de las matrices son compatibles, la multiplicacion matricial es asociativo: FIGURA 111.3 Una manera simple de comprobar si es posible multiplicar dos matrices.
  • 214. 212 MhODOS NUMÉRICOS PARA INGENIEROS y distributiva: Sin embargo, en generalla multiplicaciónno es conmutativa: [AI[Bl + [BI[AI Estoes,el orden de multiplicación es importante. Aunque la multiplicación es posible, la división matricial aún no está definida. Sin embargo, si una matriz [A]es cuadrada, hay otra ma- triz [A]", llamada la inversa de [A],tal que [A][A]" = [A]"[A] = [I] [111.3] De esta forma, lamultiplicación de una matriz por su inversa, es aná- loga a la división, en el sentido de que un número dividido por sí mis- mo es igual a uno. Esto es, la multiplicación de una matriz por su inversa es iguala la matriz identidad(recuérdese el recuadro 111.1). La inversa de unamatriz cuadrada bidimensional se puede represen- tar simplemente como: 1 [A)" = e2 -a12 0 1 1 a22 - a12 9 1 [- 9 1 al,] [111.4] Las matrices de dimensión mayor son mucho más difíciles de expre- sar.Lasección 8.2 se dedica a estudiar una técnica quecalculala inversa de talessistemas. Las operaciones finales de las matricesque tienen utilidad en este aná- lisis son las de transposición y de matriz aumentada. La transpuesta de una matriz comprende la transformación de sus renglones en co- lumnasy sus columnas en renglones.Latranspuesta de la matriz:
  • 215. SISTEMAS ECUACIONES ALGEBRAICASLINEALES 213 denotada por [AlT,se definecomo: En otras palabras, el elemento a;;de latranspuesta es igualalele- mento ai;de la matriz original, o ai = ai;. La matriz transpuesta tie- ne una gran variedad defunciones enel álgebra matricial. Una ventaja simple es la de permitir escribir un vector columna como vector fila. Porejemplo, si: entonces en donde el superíndice T denota transposición. Esto puede ahorrar espacio al escribir un vector columna en un manuscrito. Además, la matriz transpuestatiene una gran variedad deaplicaciones en las ma- temáticas. Una matriz aumentada es el resultado de agregarle una columna(o más columnas) a la matriz original. Por ejemplo, supóngase que se tiene una matriz: Si se deseaaumentarestamatriz [A] con una matrizidentidad(re- cuérdese el recuadro Ill.1 ), entonces se obtiene una matriz 3 por 6 dimensional, dada por:
  • 216. 214 MhODOS NUMERICOS PARA INGENIEROS- Esta expresión tiene utilidad cuandose desea realizar un conjunto de operaciones idénticas sobre dos matrices. De esta forma, se pueden llevar a cabo las operaciones sobre unamatriz aumentada en vez de hacerlo sobre dos matricesindependientes. 111.2.3 Representaciónenformamatricial de sistemas de ecuaciones algebraicas lineales Debe ser claro que las matrices proporcionan una notación concisa en la representación de ecuaciones simultáneas lineales. Por ejemplo, la ecuación (111.1) se puede expresar como: donde [A] es una matriz cuadrada n por n decoeficientes: [Al = [C]es unvector columna n por 1 de constantes: [C]T = [Cl c2c3 . . . cn] y [Aes un vectorcolumna n por 1 de incógnitas: [XIT= [x1x2x3 . . xn] Recuérdese la definición de la multiplicación matricial [Ec. (111.2)o re- cuadro 111.21 para comprobar laequivalencia de las ecuaciones(111.1) y (111.5).También, nótese que la multiplicación matricial (111.5)es vá- lida ya que el número de columnas (n)de laprimermatriz ([A])es igualalnúmeroderenglones (n) dela segunda matriz ([A). En esta parte del libro se resuelve la ecuación (111.5)para [A.Una manera formal de obtener una solución usando álgebra matricial es la de multiplicar cada lado de la ecuación por la inversa de [A]para obtener: Ya que [A]” [A]es la matriz identidad, la ecuación anterior se con- vierte en: [XI = [Al”[Cl 1 [111.6]
  • 217. SISTEMAS ECUACIONES ALGEBRAICASLINEALES 215 Por lo tanto, la ecuaciónse ha resuelto para [A.Este es otro ejemplo del juego de la matriz inversa similar a la división en el algebra ma- tricial. Finalmente, algunasveces es útil aumentar [A]con [C].Por ejemplo, si n = 3 elresultado es una matriz 3 por 4 dimensional, dada por: [111.7] Expresar de esta manera la ecuacióntiene utilidad, ya que varias de las técnicas en la solución de sistemas lineales hacen operacionesidén- ticas a una fila de coeficientes y a la constante correspondiente del lado derecho. Comose expresó en la ecuación (lll.7), se pueden rea- lizar algunas operaciones sobre un renglón de la matriz aumentada en lugar de hacerlo separadamente sobre la matriz de coeficientes y el vectordel lado derecho. 111.3 Antes de considerar los métodos numéricos,es útil mencionar alguna orientación adicional. A continuación se muestra superficialmente el material analizado en la parte Ill. Además, se han formulado algu- nos objetivos para ayudar a enfocarlos esfuerzos cuando se estudie el material. 111.3.1 Metasyavances En la figura 111.4 se proporciona un esquema de la parteIll. El capitu- lo 7 muestra la técnica fundamental en la solución de sistemas alge- braicoslineales:laeliminacióngaussiana.Antesdeentrar en los detalles de esta técnica, se incluye una sección que menciona algu- nos métodos simples para sistemas pequeños. Esto se hace con el fin de dar una ideavisual y debido a que uno delos métodos -la elimi- nacióndeincógnitas- es la base de la eliminación gaussiana. Después de presentar los antecedentes,se analiza laeliminación gaus- siana simple. Se inicia con esta versión ya que permite la elaboración del método completo sin mayores complicaciones. Después,en las siguientes sec- ciones, se analizan posibles problemasque usen el método simple presentando ciertas modificacicnes que minimiceny eviten estos pro- blemas. AI final del capítulo, se dedica un recuadro a una formamuy
  • 218. 216 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA 111.4 Esquema deorganizaciónde la parte Ill: Sistemas de ecuaciones alge- braicas lineales. eficiente de la eliminación gaussiana que puede ser usado en siste- mas tridiagonales. En el capítulo8 se empieza con el análisis del método de Gauss-Jordan. Aunque esta técnica es muy parecida a la eliminación gaussiana, se analiza porque permite calcular la matriz inversa que tiene una utili- dad inmensaen laingeniería.
  • 219. SISTEMAS DE ECUACIONES ALGEBRAICAS LINEALES 217 La eliminación gaussiana y el método de Gauss-Jordan son métodos directos. AI final del capítulo 8 se estudia un método diferente cono- cido como método de Gauss-Seidel. Éste es parecido a los métodos de aproximación de raíces de ecuaciones quese estudiaron en el ca- pitulo 5. Esto es, la técnica implica dar una aproximación inicial a la soluciónymedianteiteracionesobtenerun valor meiorado. En el capítulo 9 se demuestra como se pueden aplicar los métodos en la solución de problemas. Así como en otras partes del libro, se examinan aplicaciones extraídasde todos los campos de la ingeniería. Finalmente, al terminar la parte Ill se incluye un epílogo. Este repaso incluye el análisis de los elementos de juicio importantes en la imple- mentación de los métodos en la ingeniería práctica. En esta sección también se resumen las fórmulas de mayor importancia y los méto- dos avanzados relacionados conlas ecuaciones algebraicas lineales, por lo que se pueden usar para estudiar antes de un examen o como repaso cuandose tenga necesidad de utilizar las ecuaciones algebrai- caslinealesen lavidaprofesional. Las capacidades de cómputo automático se integran en la parte Ill en una variedad de formas. Primero, en NUMERICOMP,se encuen- tran disponibles programas amables conel usuario de la eliminación gaussiana para la microcomputadora Apple-ll eIBM-PC.También se proporcionan los programas en FORTRAN y BASIC de la eliminación gaussiana directamente en el texto. Esto le da al usuario la oportuni- dad de copiary aumentar los programas para implementarlos en su microcomputadora o supercomputadora. También se incluyen los dia- gramas de flujo o los algoritmos en la mayor parte de los métodos descritosen el libro. Este materialpuedeformarlabasede un pa- quete de programas que el mismo usuario puede desarrollar y apli- car a una gran cantidad de problemas de ingeniería. 111.3.2 Metas y objetivos Objetivos de estudio. AI terminar la parte Ill, el usuario debe ser ca- paz de resolver la mayor parte de problemas que impliquen utilizar ecuaciones algebraicas lineales y poder visualizar las aplicaciones de estas ecuaciones en todos los campos de la ingeniería. El usuario de- be hacerlo posible por dominar variastécnicas yvalorar la confiabi- lidadde lasmismas. Debe entenderlasventajasydesventajas involucradas en la selección del "mejor" método (o métodos)en cual- quier problema particular. Además de estos objetivos generales, se deben asimilar y dominar los conceptos específicos enumerados en el cuadro 1 1 1 . 1 .
  • 220. 218 MÉTODOS NUMÉRICOS PARA INGENIEROS Objetivos de c6rnputo. El objetivo fundamental en cuanto a cómputo, es el de ser capaz de usar en forma satisfactoria un programa para resolver sistemas de ecuaciones algebraicas lineales.Debe quedar cla- ro el uso de los programas de NUMERICOMP,o también saber có- mo copiary usar el programa de laeliminacihn gaussianasimple dado en el texto. Estos programas le permitirán manejar adecuadamente muchos problemas prácticos que impliquen utilizar varias ecuaciones algebraicas lineales simultáneas.A medida quese avance en los pro- blemas que contengan más ecuaciones, se pueden usar los progra- mas, diagramas defluio y algoritmos proporcionados en la parte Ill. Eventualmente, se puede incorporar a los programas el pivoteo parcial, el cálculo de determinantes y la evaluación de condiciones. También se pueden obtenerlos programas paralos métodos de Gauss-Jordan y de Gauss-Seidel. CUADRO 111.1 Objetivos de estudiosespecíficos de la parte 111 1 . Entender las interpretaciones gráficas de sistemas mal condicionados y su rela- 2 . Entender por qué se le llama "simple" a la primera versión de la eliminación 3. Familiarizarse conla terminología: eliminación hacia atrás, sustitución hacia atrás, 4 . Entender los problemas de divisiónpor cero, errores de redondeo y mal condi- 5 . Saber cómo evaluar la condición del sistema. 6. Saber cómo calcular determinantes usando la eliminación gaussiana. 7. Entender las ventajas del pivoteo; entenderlas diferencias entreel pivoteo par- 8. Saber cómo aplicarlas técnicasde corrección de errorespara mejorar las soh- 9 . Entender por qué las matrices banda son relativamente eficientes ensu solución. 1O . Saber la diferencia fundamental entrela eliminación gaussianay el método Gauss- 1 1 .Entender cómo seusa el método deGauss-Jordan para calcular la matriz inversa. 12 . Saber interpretar los elementos de la matriz inversa en la evaluación de las in- 13. Comprender el uso de la matriz inversa en la evaluación de la condición del 14 . Entender por qué el método deGauss-Seidel es particularmente apropiado pa- 15 . Entender par qué el valor de la diagonal de un sistema de ecuaciones influye 1 6. Entender la razón existente detrás del concepto relajación;saber dónde es más ción con el determinante del sistema. gaussiana. normalización, ecuación pivotal y pivote. cionamiento. cial y el pivoteo total. ciones. Jordcn. cágnitas en ingeniería. sistema. ra sistemas grandes de ecuaciones. en que el método pueda ser resuelto mediante el método de Gauss-Seidel. apropiada la subrelajación y dónde la sobrerelajación.
  • 221. C A P í T U L O S I E T E 7.1 ELIMINACIóN GAUSSIANA En estecapítulo se analizanlas ecuaciones algebraicaslinealessimultá- neas que en general se puedenrepresentar como: allxl + a12x2+ * + al,x, = c1 a21x1 + a22x2 + . . . + a2,xn= c2 anlxl+ 0~2x2+ * - * + a,,x, = c, endondelas a soncoeficientesconstantes y las c son constantes. A la técnica quese describe en este capítulose le conoce como elimi- nación gaussiana porque involucra una combinación de ecuaciones a las que se leseliminanlasincógnitas.Aunqueéste es unodelosmétodos más antiguos en la soluciónde ecuacionessimultáneas,permanece hasta nuestros díascomo uno de los algoritmosde mayor importancia.En par- ticular, es fácil de programary de aplicar con el uso de microcomputadoras. SOLUCIÓN DE POCASECUACIONES Antes de entrar a los métodos que usan computadora,se describen algu- nos que son apropiados enla solución de pequeños grupos de ecuacio- nessimultáneas (n I3) quenorequierendeunacomputadora.Estos son los métodos gráficos,la regla de Cramery la eliminación de incógnitas. 7.1 .l Método gráfico Se obtiene unasolucióngráfica de dos ecuaciones representándolas en coordenadas cartesianas con un eje correspondiente a x1y el otro a x2. Ya que elproblemaesparasistemaslineales, cada ecuación representa
  • 222. 220 METODOS NUMÉRICOS PARA INGENIEROS unalínea recta. Esto puedeilustrarsefácilmenteporlas ecuaciones ge- nerales: QlXl + a12xz = c1 a21x1 + a22x2 = c2 Ambas ecuaciones se puedenresolverpara x2: De esta manera, las ecuaciones seencuentranahora en la forma de lí- neas rectas; esto es, x2 = (pendiente)x1 + intersección.Estaslíneas se pueden graficar en coordenadas cartesianas con x2como la ordenada y x1como la abscisa. Los valores de x1y x2enla intersección de las líneas representan la solución. EJEMPLO 7.1 El método gráfico para dos ecuaciones Enunciado del problema:úsese el métodográficopararesolver 3x1 + 2x2 = 18 [E7.1.1] -x1 + 2x2 = 2 [E7.1.2] Solución: sea x1la abscisa. AI resolver la ecuación (E7.1.1) para x2: que, al graficarse en la figura 7.1, da una línea recta con una intersección en 9 y pendientede -3/2. La ecuación (E7.1.2) se puederesolverparax2: x2 = (1/2)x, + 1 lacualtambién se grafica enlafigura 7.1. La solución es la intersección delasdoslíneasen x1 = 4 y x2 = 3. Esteresultado se puedeverificar sustituyendoestosresultados enlas ecuaciones originalespara obtener: 3(4) + 2(3) = 18 I -4 + 2(3) = 2
  • 223. ELlMlNAClONGAUSSIANA 221 De esta manera, los resultados son equivalentes a los lados derechos de las ecuaciones originales. FIGURA 7.1 Solución gráfica de un conjunto de dosecuaciones algebraicas linea- les simultáneas. la intersección ¿e las líneas representa la solución. Para tres ecuaciones simultáneas, cada ecuación representaun plano en el sistema de coordenadastridimensional. El punto en donde se intersec- tenlostresplanosrepresenta la solución. Más alládetres ecuaciones, los métodos gráficos no funcionany, por consiguiente, la solución deecuac- ciones algebraicastiene muy poco valorpráctico.Sin embargo, algunas veces resultan útiles para visualizarpropiedadesde la solución. Porejem- plo, lafigura 7.2 muestratres casos que se puedenabordarcuando se desea resolver un conjunto de ecuaciones lineales. La figura 7.2a mues- trael caso en que la dos ecuaciones representan dos líneas paralelas. En estos casos, no existe solución ya que las dos líneas jamás se cruzan. La figura 7.2b representa el caso enque las doslíneas coinciden. En este caso existe un número infinito de soluciones. A estos dos tipos de siste- mas se lesllama singular. También los sistemasquesoncasisingulares causan problemas (Figura 7 . 2 ); a estos sistemas se les k m a mal condi- cionados. Gráficamente, indican que elpunto exacto de intersección de ambasrectases muy difícil devisualizar. Como se veenlas siguientes
  • 224. 222 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA 7.2 Esquema gráfico de sistemas malcondicionados: a) nohay solución, b) hay una infinidadde soluciones y c) un sistema mal condicionadoen donde las pendientes son muy parecidas en el punto de intersección yes difícil de detectar fácilmente la solución. secciones,los sistemas mal condicionados también tienen problemas cuan- do ?e encuentran en la soluciónnuméricade ecuaciones lineales. 7.1.2 Determinantes y laregladeCramer La reglade Crameres otra técnica de solución aplicablea pocas ecuacio- nes. Antes de describir estemétodo, se menciona brevementeel concep- to de determinantes, que se usanenla implementaciónde la reglade Cramer. Además, el determinante es útil enla evaluacióndemal condi- cionamiento de unamatriz. Determinantes. Se puedeilustrar un determinante medianteun conjun- to de tres ecuaciones: o. enformamatricial: en donde [A]es lamatriz de coeficientes: all a12 a13
  • 225. ELlMlNAClONGAUSSIANA 223 El determinante D de este sistema se forma con los coeficientes dela ecua- ción, de la siguiente manera: Aunqueeldeterminante D y lamatriz [A]se componen de los mismos elementos,tienen conceptos matemáticos completamente diferentes. Para denotar lamatriz se usan corchetes y para los determinantesse usan ba- rras verticales. En contraste con una matriz,el determinantees un núme- ro. Por ejemplo, elvalordel determinantedesegundo orden: D = all a12 (a21 se calculamediante: Enel caso de tercer orden [Ec. (7.2)],se puede calcular elvalordel de- terminante como: en donde a los determinantesde 2 por 2 se lesllama menores. EJEMPLO 7.2 Determinantes Enunciado del problema: calcúlense los valores de los determinantesde lossistemasrepresentadosenlasfiguras 7.1 y 7.2. Solución: para lafigura 7.1: Para lafigura 7.2~1: -1/2 1 -1 1 1 = 1-1,2 11 = -(l)2 - 1(%) = o
  • 226. 224 MÉTODOS NUMÉRICOSPARAINGENIEROS I Para lafigura 7.2b: I Para lafigura 7 . 2 ~ : Enel ejemplo anterior, los sistemas singulares tienen un valor de ce- ro. Además, elresultadoindicaqueelsistemacasisingular (Fig. 7 . 2 ~ ) tiene un determinante cercano a cero. Estas ideas se seguirán manejan- do posteriormente enlos análisis de mal condicionamiento (sección 7.3.3). Regla de Cramer. Estaregladicequecadaincógnita de un sistema de ecuaciones algebraicas linealesse puede expresarcomo el cociente de dos determinantescon el denominador D y con el numeradorobtenido de D reemplazando la columna de coeficientes de la incógnitaencuestión porlasconstantes cl, c2, . . . , c,. Por ejemplo, x1 se calcula como: EJEMPLO 7.3 Regla de Cramer Enunciadodelproblema:úsese lareglade Cramerpararesolver: 0.3~1+ 0.52~2+ x3 = -0.01 0 . 1 ~ 1+ O.3X2 + O.5X3 = -0.44 Solución: el determinante D se puedeescribir como [Ec. (7.2)]: D = 0.3 0.52 1 0.5 1 1.9 0.1 0.3 0.5
  • 227. ELlMlNAClON GAUSSIANA 225 Los menores son: 1 1.9 = 10.3 0.5 0.5 1.9 0.1 0.5 0.5 1 A3 = 10.1 0.3 = l(0.5)- 1.9(0.3)= -0.07 = 0.5(0.5)- 1.9(0.1)= 0.06 = 0.5(0.3)- l(O.1) = 0.05 Éstos se pueden usar para evaluarel determinante,como enla ecuación (7.4): D = 0.3(-0.07) - 0.52(0.06)+ l(0.05)= -0.002 2 Aplicando la ecuación (7.5),la solución es: -0.01 0.52 1 0.67 11.9 I-o.44 I 0.032 78 -0.002 2 -0.002 2 x1 = -=.- = -14.9 0.3 -0.01 1 0.5 0.67 1.9 0.3 0.52-0.01 10.5 1 O.67 1O.l -0.043 56 = 19.8 x3 = -- "0.002 2 -0.002 2 Para más de tres ecuaciones, la regla de-Crameres imprdctica ya que a medida quecrece el número de ecuaciones, los determinantesse vuel- ven dificiles de evaluara mano. Por consiguiente,se usan otras alternati- vasmás eficientes.Algunas de estasalternativas se basanenlaúltima técnica cubierta en este libro que no usa computadora,la eliminación de incógnitas. 7.1.3 La eliminación de incógnitas La eliminación de incógnitas mediante la combinación de ecuaciones es un esquema algebraic0 que se puede ilustrarpara un conjunto de ecua- ciones:
  • 228. 226 MhODOS NUMÉRICOS PARA INGENIEROS c7.61 La estrategia básicaes multiplicar lasecuaciones por constantespara que una de las incógnitasse elimine al combinar las dosecuaciones. El resul- tado es unaecuaciónque se puederesolverpara la incógnita restante. Estevalor se puedesustituirencualquieradelas ecuaciones originales paracalcular la otravariable. Por ejemplo, la ecuación (7.6)se puedemultiplicarpor a21y la ecua- ción (7.7) por all paradar: Restando la ecuación (7.8) de la ecuación (7.9),se eliminael término x1 de la ecuaciónpara obtener: que se puederesolverpor [7.10] La ecuación 7.10 se puede sustituirenla ecuación (7.6),que se puede resolverpor [7.11] Nótese que las ecuaciones (7.10) y (7.11) se calculandirectamentepor la regla de Cramer, que establece: 1°C: :;;IXI = - c1a22 - a12c2- alla22 - (3112a21
  • 229. ELIMINACION GAUSSIANA 227 EJEMPLO 7.4 Eliminación de incógnitas Enunciado del problema: úsese la eliminación de incógnitas para resol- ver (recuérdese el ejemplo 7.1): 3x1 + 2x2 = 18 -x1 + 2x2 = 2 Solución: usando las ecuaciones (7.11) y (7.10) 2(18) - 2(2) 3(2) - 2(-1) x1 = = 4 3(2) - (-1)18 3(2) - 2(-1) x2 = = 3 las cuales son consistentescon la solución gráfica (Fig. 7.1) La eliminación de incógnitas se puede extender a sistemas con más de dos o tres ecuaciones. Sin embargo, los cálculos numerosos que se requieren para sistemas grandes vuelven rnuy tedioso al método como para realizarlo a mano. Sin embargo, como se describe en la siguiente sección, el método se puede formalizar y programar fácilmente en una microcomputadora. 7.2 ELIMINACIóN GAUSSIANA SIMPLE En la secciónanterior,se usa la elirninación de incógnitaspararesol- ver un par de ecuaciones simultáneas. El procedimiento consta de dos pasos: 1. Se manejan las ecuaciones para eliminar una incógnita de una ecua- ción. El resultado de este paso de eliminación es una sola ecuación con una incógnita. 2. Por consiguiente, esta ecuación se puede resolver directamente y el resultado se sustituyehaciaatrás en las ecuaciones originales para encontrar la incógnita restante. Este comportamiento básico se puede extender a sistemas grandes de ecuacionesdesarrollando un esquema sistemático paraeliminar incóg- nitas y sustituir hacia atrás. La eliminación gaussiana es una delas técni- cas más comunes.
  • 230. 228 MhODOS NUMÉRICOS PARA INGENIEROS 7.2.1 Algoritmo para la eliminación gaussianasimple Se incluye en esta secciónla técnica sistemática de eliminación haciaade- lante y la sustitución hacia atrás que comprende la eliminación gaussia- na. Aunque estas técnicasse adaptan perfectamentea las condiciones de implementación sobre una microcomputadora,se requieren algunasmo- dificaciones para obtenerun algoritmo legible. En particular, el programa debe evitar divisiones por cero. Al método siguiente se le llama elimina- ción gaussiana"simple" porque no evitaestascontingencias. Enlas si- guientesseccionesse muestran algunos rasgos adicionales necesarios para tener un programa efectivo. El procedimiento estáplaneadopara resolverun conjunto de n ecua- ciones: allxl + ~112x2+ a13x3+ * * + al,xn = c1 C7.1201 a21x1+ a22x2 + ~ 1 ~ ~ x 3+ ' * * + aZnxn= c2 [7.12b] [7.12c] Como en el caso de solución de dos ecuaciones, el método para n ecua- ciones consiste de dos fases: la eliminación delas incógnitasy su solución mediantesustituciónhaciaatrás. Eliminaciónhacia adelante de incógnitas. La primera fase reduce elcon- juntode ecuaciones a un sistematriangularsuperior(Fig. 7.3).El paso inicial del procedimiento consiste en dividir la primera ecuación[Ec. 7.12a1 porel coeficiente de laprimer incógnita, all: a12 x1 + " x 2 + * . + " x , = - Q l n c1 a11 al1 all A este procedimiento se le conoce como normalización y tiene como fi- nalidad convertir el primer coeficiente de la ecuación normalizada en 1. En seguida se multiplica la ecuación normalizada por el primercoe- ficiente de la segundaecuación [Ec. (7.12b)],a21: [7.13] Nótesequeelprimertérmino de laprimera ecuaciónes ahora idéntico alprimertérmino de la segunda ecuación. Por consiguiente, se puede eliminarlaprimeraincógnita de la segundaecuaciónrestando la ecua- ción (7.13)de la (7.12b) para obtener
  • 231. ELlMlNAClON GAUSSIANA 229 FIGURA 7.3 Esquema gráficode lasdos partes del método de eliminación gaussia- na. La eliminación hacia adelante reducela matriz de coeficientes a una forma triangular superior. Después, se usa la sustitución hacia atrás pa- ra encontrar las incógnitas. O ahax? + * * * + ahnxn= c$ en donde el apóstrofo indica que los elementos han cambiado sus valo- resoriginales. El proceso se repite hasta que se elimina la primera incógnita de las ecuacionesrestantes. Por ejemplo, la ecuación normalizadase multiplica por a31 y elresultado se resta de la tercera ecuación para obtener a&x2 + aj3x3 + * . + a&,x,,= c$ Repitiendoel procedimiento parael resto de ecuaciones da como resul- tado elsiguientesistemamodificado: [7.14a] [7.14b] [7.14c] [7.14d]
  • 232. 230 METODOS NUMERICOS PARA INGENIEROS De ahora en adelante, a la ecuación (7.12a)se le llama ecuación pivotal y a all se lellama pivote. En seguida se repite el proceso para eliminarla segunda incógnitade las ecuaciones (7.14~)hasta la (7.14d).Para hacerlo, se usa como ecua- ción pivotal la ecuación (7,14b)normalizándolay dividiéndola por el pi- votea'22. Multiplicando la ecuación normalizada por a'32 y restando el resultado a la ecuación (7.14~)se elimina la segunda incógnita. Repitien- do el proceso conlas ecuaciones restantes se obtiene: a"n3x3 + * . + axnx,= c: en donde el apóstrofe doble indica que los coeficientesse han modifica- do dos veces. El procedimiento se puedecontinuarusando las ecuaciones restan- tes como pivotales. La operación finalde esta secuencia es ladeusarla (n- 1)-ésimaecuaciónparaeliminar el términode la n-ésima ecua- ción. En ese momento elsistema se transforma en un sistematriangular superior (recuérdese el recuadro 111.1). [7.15a] [7.15b] [7.15c] [7.15dj Sustitución hacia atrás. La ecuación (7.15d)se puede resolver para x,: 1 17.161 Este resultadose puede sustituir en la (n-1)-ésima ecuacióny resolverse éstapara x,,~- El procedimientoserepiteevaluandolas x restantes, éste se puederepresentarmediante la fórmula:
  • 233. ELlMlNAClON 231 [7.17] para i = n-1, n-2, . . . , 1. EJEMPLO 7.5 Eliminacióngaussianasimple Enunciadodelproblema:úsese la eliminacióngaussianapararesolver: 3x1 - 0.1~2- 0.2~3= 7.85 0.1~1+ 7x2 - O.3X3 = -19.3 0 . 3 ~ ~- 0 . 2 ~ ~+ lox3 = 71.4 [E7.5.lj [E7.5.2] rE7.5.31 Efectúense 10scálculosconseiscifrassignificativas. Solución: la primera parte del procedimientoes la eliminación haciaade- lante. La normalización de la ecuación (€7.5.1)se lleva a cabo dividién- dolapor el elemento pivotal, obteniendo: XI - 0,033 333 3x2 - 0.066 666 7x3 = 2.616 67 [E7.5.4] En seguida,multiplíquesela ecuación (E7.5.4)por 0.1 y t6stese el resul- tado de la ecuación (E7.5.2)se tiene: 7.003 33x2 - 0.293 333x3 = -19.561 7 [E7.5.5] Por lo tanto almultiplicarla ecuación (E7.5.4)por O.1 y al restarla a la ecuación (E7.5.3)se elimina xl. Despuésdeestas operaciones, el con- juntode ecuaciones es 3x1 -- o.lx, - 0.2X3 = 7<65 rE7.5.61 7.003 33x2 - 0.293 333x3 = -19.561 7 [E7.5.7] -0.190 000x2 + 10.020 Ox3 = 70.615 O [E7.5.8] Paraterminar la eliminaciónhaciaadelante xp debe desaparecer de la ecuación (E7.5.8).Para llevarlo a cabo, normalícese la ecuación (E7.5.7) dividiéndolapor 7.003 33: x2 - 0.041 884 8x3 = -2.793 20 [E7.5.9] Después,multiplíquese la ecuación (€7.5.9)por -0.190 O00 y réstese el resultado de la ecuación (E5.7.8). Con esto se elimina x2de la tercera ecuación y reduce el sistema a la formatriangularsuperior,dada por:
  • 234. 232 METODOS NUMÉRICOS PARA INGENIEROS 3x1 - O.lx, - 0,2~3= 7.85 7.003 33x2 - 0.293 333x3 = -19.561 7 [E7.5.10] 10.012 Oxg = 70.084 3 [E7.5.11] Ahora se puedenresolverestas ecuaciones porsustituciónhacia atrás. Enprimer lugar, la ecuación (E7.5.11)se puede resolver, dando: x3 = 7.00003 [E7.5.12] Esteresultado se puede sustituirenla ecuación (E7.5.10),para dar: 7.003 33x2 - 0.293 333(7.000 03) = -19.561 7 que se puederesolverpara x2 = "2.500 O0 [E7.5.13] Finalmente, las ecuaciones (E7.S.12) y (E7.5.13)se puedensustituiren la ecuación (E7.5.6)para dar: 3x1 - 0.1(-2.500 00) - 0.2(7.00003) = 7.85 que se puederesolver para: x1 = 3.000 O0 Aunquehay un pequeiio error de redondeo enla ecuación (E7.5.E ) , los resultadosson muy cercanos a lasoluciónexactade x1 = 3, x2 = -2.5 y xg = 7. Estosepuedeverificarsustituyendolasrespuestasenel con- junto de ecuaciones originales,para dar: 3(3) - 0.1(--2.5) - 0.2(7.00003) = 7.84999 = 785 0.1(3) + 7("2.5) - 0.3(7.00003) = -19.300 O = -19.3 0.3(3) - 0.2(-2.5) + lO(7.00003) = 71.4003 = 71.4 7.2.2 Programadelmétodode eliminación gaussiana simple La figura 7.4 muestra los programas de la eliminación gaussiana simple. Los programasconstan de cuatro partes: entradade dabs, eliminación hacia adelante, sustituciónhaciaatrás e impresiónde datos. Nótese que la matriz de coeficientes se aumenta por las constantes del ladoderecho. Esta informaciónse almacena enlamatriz A. Ya que estamatriz es aumen-
  • 235. ELlMlNAClON GAUSSIANA 233 tada, el hecho de que susdimensionesseande 15 por 16 significa que el programa puede manejar hasta15 ecuaciones simultáneas de esta forma. FORTRAN sun-0 I-N-NN I P = I + l [)O 1 2 2 0J = I P , H SLlN-SUM+A( I , J >*X( J , 1220 CONTINUE 1240CONTINUE RETURli END ~ ~ I ~ = ~ ~ ~ l , ~ ~ - s u M ~ , ' a ~ l , I ~ Elim1nac16n hacia adelante Sustracci6nhaciaatrAs FIGURA 7.4 Programas FORTRAN y BASIC delmétododeeliminacióngaussiana simple. Nótese también que se ha programado el cuerpo principal del algorit- mo como una subrutina. Se hizo asíporque ademásde la solución direc- ta de los problemas de ingeniería, la eliminación gaussiana tambihn tiene utilidadformandoparte de otrosalgoritmos. Enlaúltima parte de este capítulo se desarrollan técnicas de corrección de erroresquerequieren unasubrutinaparalaelimiflacióngaussiana. Además, enelcapítulo 10 se necesita resolver ecuaciones algebraicas linealescomo parte de la téc- nicadeajustedecurvasllamadaregresiónmúltiple y polinomial.
  • 236. 234 METODOS NUMÉRICOS PARA INGENIEROS FIGURA 7.5 Tres paracaidistas encaídc libre conectados por cuerdas de peso despreciable. 7 . Pr El programa de lafigura 7.4 no es legible al usuario. Enel problema 16 alfinaldel capítulo, se presenta la tarea de hacer un bosquejo del .ogramaparahacerlofácilde Gsar y de entender. EJEMPLO 7.6 Solución de ecuaciones algebraicas lineales usando computadora Enunciado del problema:los programas de NUMERICOMP contienen uno que implementala eliminación gaussiana enun programa legibleal usua- rio. Se puede usar este programa para resolver problemas asociados con el ejemplo del paracaidista discutido enel capítulo 1.Supóngase que un grupo de tres paracaidistas se conecta por medio de cuerdas muy ligeras mientras caen a unavelocidadde 5 m/s (Fig. 7.5).Calcúlese la tensión en cada sección dela cuerda y la aceleración del grupo, dada la siguiente información: Paracaidista Masa, kg Coeficientesderozamiento, kg/s 170 2 60 14 3 40 17 .~.." . . ~ . . Solución: los cuerpos de los paracaidistas se muestranenlafigura 7.6. Considerandolasfuerzas en direcciónvertical y usando la segunda ley de Newton se obtieneun conjunto de tres ecuaciones lineales simultáneas: mlg - T - clu = mla m2g + T'c2u - R = m2a Estas ecuaciones tienen tres incógnitas: a, T y R.Después de sustituir¡os valores conocidos, las ecuaciones se pueden expresaren forma matricial (ya que g = 9.8 m/s2).
  • 237. 236 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA 7.7. (Continuación)b) Prueba de exactitud obtenida al sustituir la solución enlas ecuaciones originales para comprobar que los resultados son iguales a lasconstantes del vector de términos independientes original. Los resultados anterioresse basan en un algoritmo simple del méto- do de la eliminación gaussiana con rutinas legiblesal usuario sobreentra- da y salida de datos. El algoritmo empleado es similar al de lafigura 7.4. El usuario debe ser capaz de escribir un programa para el método de la eliminación gaussiana. Si ya lo tiene, use el programa anterior para com- probar la exactituddelpropio. 7.3 DESVENTAJASDE LOSMÉTODOS DE ELIMINACIóN A pesar de que existenmuchossistemas de ecuaciones que se pueden resolver con la eliminación gaussiana simple. Hay algunas desventajas que se deben de analizarantes de escribir un programaqueimplemente el método. Aunque elsiguientematerialhablaGnicamentedelmétodode eliminación gaussiana simple, esta información también es importante para otras técnicas de eliminación. 7.3.1 División entre cero La razónprincipalporla que se le ha llamado “simple” al método ante- rior, es porquedurantelas fases deeliminación y sustituciónesposible queocurraunadivisiónentre cero. Por ejemplo, si se usael método de eliminacióngaussianasimplepararesolver el sistema:
  • 238. ELlMlNAClON GAUSSIANA 237 lanormalización de laprimer ecuaciónimplicaunadivisiónentre all = O. El problema se presentatambién cuando el coeficiente es muy cercano a cero. Se ha desarrollad? una estrategia del pivote0 para evitar parcial- menteestosproblemas.Este se describeenla sección 7.4.2. 7.3.2. Errores deredondeo Aun cuando la solucióndelejemplo 7.5 se acerca mucho a la solución real, hayuna pequeña diferencia enel resultadode x3 [Ec. (E7.5.12)]. Esta diferencia, quesignifica un errordel -0.000 43%, se debe al uso de seis cifras significativas durante los cálculos. Si se hubieran usado más cifrassignificativas,elerror se habríareducidoaún más. Si se hubieran usado fracciones envez de decimales(y por consiguientese hubieran evi- tadoloserrores de redondeo), la respuestahabríasido exacta. Sin em- bargo, ya que las microcomputadoras manejansólo un número limitado de cifrassignificativas ( = lo), puedenocurrirloserroresde redondeo y se debenconsiderar al evaluar los resultados. EJEMPLO 7.7 Efecto de los errores de redondeo en la eliminación gaussiana Enunciado del problema: resuélvaseelmismn problema del ejemplo7.5, usandotrescifrassignificativasduranteloscálculos. Solución: la eliminación de x1de la segunda y tercera ecuación y la eli- minaciónde x2 de la tercera llevaalsiguientesistematriangular: 3x1 - 0.1~2- 0.2~3= 7.85 7.00~2- 0.293~3= -19.6 9.99~3= 70.1 Compárese este sistema con el obtenido previamente usando seis cifras significativas [ecuación(E7.5.10)hasta la (E7.5.121. Sepuede usarla sus- tituciónhaciaatráspararesolverel sistema, obteniendo: x1 = 3.17 I E , ~ = 5.7% x2 = -2.51 I E, 1 = 0.4% x3 = 7.02 1 E , I = 0.29%
  • 239. 238 METODOSNUMERICOS PARA INGENIEROS Sustituyendoestosvalores enlas ecuaciones originales se obtiene: 3(3.17) - 0.1(-2.51) - 0.2(7.02) = 8.36 # 7.85 0.1(3.17) + 7(-2.51) - 0.3(7.02) = -19.4 # -19.3 0.3(3.17) - 0.2(-2.51) + lO(7.02) = 71.7 # 71.4 Aunque el uso de tres cifras significativas dentro del ejemplo7.7 hace del mismo un ejemplo fuerade la realidad, el problema de los errores de redondeo sí es real y puede serde mucha importanciaal resolver grandes cantidadesde ecuaciones. Esto se debe a quecadaresultado depende de todos los resultados anteriores. Por consiguiente,un error enlos pri- meros pasos tiendea propagarse,esto es, causa erroresen los siguientes pasos. Es muy complicadoespecificar el tamañodelsistema en donde los errores deredondeo vienen a ser significativos ya que dependen del tipo de computadoray de las propiedades del sistema. Una reglamuy general es la de suponer quelos errores de redondeo son de importancia cuandose tratadesistemas de 25 a 50 ecuaciones. En cualquier evento, siempre se deben sustituir las respuestas en las ecuaciones originales y verificar si ha ocurrido un error sustancial.Sin embargo, como se menciona más ade- lante lamagnitud de los coeficientesmismos puede influir en los errores al buscar un resultado aceptable. 7.3.3 Ill-Sistemas mal condicionados La obtención de la solución depende de la condicióndel sistema. Enla sección 7.1.1 se muestra un esquema gráfico de la condición de un siste- ma. En sentido matemático, los sistemas bien condicionados son aque- llos en los que un cambio en uno o más coeficientes provoca un cambio similarenla solución. Los sistemas mal condicionados sonaquellos en donde cambios pequeños en los coeficientes provocan cambios grandes enla solución. Una interpretación diferente del mal condicionamientoes que un rangoamplioderespuestaspuedesatisfaceraproximadamente al sistema. Ya que los errores de redondeo pueden inducir cambios pe- queños en los coeficientes, estos cambios artificiales pueden generar errores grandes enla solución de sistemas mal condicionados como se ilustra en elsiguiente ejemplo. EJEMPLO 7.8 b Ill-Sistemas mal condicionados Enunciado del problema:resuélvase el siguientesistema:
  • 240. ELlMlNAClON GAUSSIANA 239 x1 + 2x2 = 10 [E7.8.1] 1 . 1 ~ 1+ 2x2 = 10.4 [E7.8.2] Después, resuélvase nuevamente, conel coeficiente de x1de la segunda ecuaciónmodificadolevemente a 1.05. Solución: usandolas ecuaciones (7.10)y (7.11), la solución es: 2(10) - 2(10.4) l(2) - 2(1.1) l(10.4) - 1.1(10) l(2) - 2(1.1) x1 = = 4 x2 = = 3 Sin embargo, conelcambioalcoeficiente a21de 1.1 a 1.05, el resulta- docambiadrásticamente a: 2(10) - 2(10.4) l(2) - 2(1.05) x1 = = 8 l(10.4) - 1.05(10) l(2) - 2(1.05) x2 = = 1 Nótese que la razón principal de la diferencia entre los dos resultados es que el denominador representa la diferencia de dos nfimeros casi iguales. Como se explica previamente enel ejemplo3.4,estas diferencias sonmuy sensitivas a pequeñas variacionesen los números quese están manejando. En este punto, se podríasugerirquelasustitucióndelosresultados en las ecuaciones originales alertaríaal lector enel problema. Desafortu- nadamente, este no esel caso en sistemas mal condicionados. La sustitu- cióndevalores erróneos de x1 = 8 y x2 = 1 enlas ecuaciones (E7.8.1) y (€7.8.2) lleva a: 8 + 2(1) = 10 = 10 1.1(8) + 2(1) = 10.8 = 10.4 Porlo tanto, aunque x1 = 8 y x2 = 1 nosonlassolucionesrealesal pro- blemaoriginal, la prueba de errorescasiigual, lo quepuedeprovocar el error al hacercreerquelassolucionesson correctas. Como se hizo previamente enla sección de métodos gráficos, se puede desarrollar una representación visual del mal condicionamiento grafican- dolas ecuaciones (E7.8.1)y (E7.8.2) (recuérdeselafigura 7.2).Debido a quelaspendientesdelaslíneassoncasiiguales,visualmentees difícil de ver exactamente donde se intersectan. Esta dificultad. visual se refleja
  • 241. 240 MÉTODOS NUMÉRICOS PARA INGENIEROS cuantitativamenteen los resultados inciertos del ejemplo 7.8. Esta situa- ción se puede caracterizar matemáticamente escribiendo las dosecuacio- nes en su forma general: Dividiendola ecuación (7.18)por a12y la ecuación (7.19)por aZ2y or- denando términos se obtienenlasversionesalternativasdelformato de unalínearecta [x?= (pendiente)x1 + intersección]. a21 c2 x1 + " a22 x2 = " a22 Por consiguiente, silas pendientessoncasiiguales, entonces: - = -all 021 012 a22 o, multiplicandoencruz: alla22 = a21a12 que se puedeexpresartambién como: alla22 - a12~21= 0 r7.201 Ahora, recordandoque all a22- a12a21es el determinantedelsis- temabidimensional [Ec. (7.3)],se puedeobtener la conclusióngeneral deque un sistema mal condicionado es aquelenque su determinante se aproxima acero. En efecto, siel determinante es exactamente igual a cero, las dos pendientes son idénticas, lo que produce de forma indis- tinta o ningunasolución o un númeroinfinitode ellas, como enel caso delsistemasingularmostrado enlafigura 7.21y b. Es difícil especificar qué tan cerca debe estar el determinantede cero de maneraqueindique mal condicionamiento.Estosecomplicapor el hecho de queun determinante puede cambiarsu valor simplementemul- tiplicando una o más ecuaciones por un factor escalar sin alterar la solu- cicin. Por consiguiente, el determinante esun valor relativo que se modifica conlamagnitudde los coeficientes.
  • 242. ELlMlNAClONGAUSSIANA 241 EJEMPLO 7.9 Efecto de escalamiento enel determinante Enunciadodelproblema:evalúeseeldeterminantedelossistemas Si- guientes: a) Del ejemplo 7.1: 3x1 + 2x2 = 18 [E7.9.1] -x1 + 2x2 = 2 [E7.9.2] b) Del ejemplo 7.8: x1 + 2x2 = 10 [E7.9.3] 1.lxl + 2x2 = 10.4 [E7.9.4] c) Repítase b) multiplicandolas ecuaciones por 10. Solución: a) El determinantede las ecuaciones (E7.9.1)y (E7.9.2)quees un sis- tema bien condicionado, es: D = 3(2) - 2(-1) = 8 b) El determinantede las ecuaciones (E7.9.3)y (E7.9.4),quees un sis- tema mal condicionado, es: D = l(2) - 2(1.1) = -0.2 c) Los resultadosde a) y de b) parecen corroborar el argumentodeque los sistemasmal condicionados tienen determinantescercanos a cero. Sin embargo, supóngase queel sistema mal condicionadob) se multi- plicapor 10, para obtener: 10x1 + 20x2 = 100 11x1 + 20x2 = 104 La multiplicación de una ecuación por una constante no tiene efecto en la solución. Además, aún está mal condicionado. Esto se puede verificar multiplicando por unaconstante que no tenga efecto enla solución gráfi- ca. Sin embargo, el determinanteresulta muy afectado. 1 D = lO(20) - 20(11) = -20 No sólo se han elevadodos órdenes de magnitud,sinoqueeldetermi- nante es el dobledelsistema bien condicionado a ) .
  • 243. 242 MÉTODOS NUMÉRICOS PARAINGENIEROS Como se ilustra en el ejemplo anterior, la magnitud de los coeficien- tes interpone un efecto de escalamiento que complica la relación entre la condición del sistema y el tamaño del determinante. Una manera de evitar parcialmente esta dificultad es la de escalar las ecuaciones de for- ma tal que el elemento máximo de cualquier renglón sea 1. EJEMPLO 7.1O Escalamiento Enunciado del problema: escálenselos sistemas de ecuaciones del ejem- plo 7.9a un valor máximo de 1y calcúlense de nuevo sus determinantes. Solución: a) En el sistema bien condicionado, el escalamientogenera XI+ 0.667~2= 6 -0.5x1 + x2 = 1 cuyo determinante es: l(1) - 0.667(-0.5) = 1.333 b) En el sistema mal condicionado, el escalamientogenera: 0.5X1 + X2 = 5 0.55~1+ X:, = 5.2 cuyo determinante es: 0.5(1)- l(0.55) = -0.05 c) En el último caso, e! escalamiento modifica el sistema de la misma forma que b).Por lo tanto, el determinante también es 0.05,y el es- calamiento no afecta. En la sección anterior (sección 7.1.2),se dijo que el determinante es difícil de evaluar para más de tres ecuaciones simultáneas. Por lo tanto, parece ser que noexiste una manera práctica de determinar la condición de un sistema. Sin embargo, como se muestra en el recuadro 7.1, existe un algoritmo simpleque resulta de la eliminación gaussiana y que se puede usar en la evaluación del determinante. Además del planteamiento usado en el ejemplo anterior para calcu- lar la condición de un sistema, existen otras formas de hacerlo. Por ejem- plo, existen métodos alternativos para la normalización de elementos (dase
  • 244. ELlMlNAClON GAUSSIANA 143 Stark, 1970).Además, como seveenelcapítulosiguiente(sección 8.2.2), la matriz inversa puede usarse en la evaluación de la condición de un sis- tema. Finalmente, unapruebasimple (pero queconsumemuchotiem- po) consisteenmodificar un poco loscoeficientes y repetirlasolución. Si estas modificaciones generan resultados drásticamente diferentes, el sis- temaprobablementeestámalcondicionado. Como se puede deducir del análisis anterior, definitivamente no exis- te un métodosimpleparaevaluarelmalcondicionamiento.Enlaelimi- RECUADRO 7.1 Evaluación de determinantesusando la eliminacion gaussiana En la sección 7.1.2,se dijo que la evaluación de los de- terminantes por expansión de menores era impráctica para conjuntos grandes de ecuaciones. De esta forma, se concluye que la regla de Cramer sólo es aplicablepa- ra sistemas pequeños. Sin embargo, como se dijo en la sección 7.3.3,el determinantetiene sentido cuando va- lorala condición de un sistema. Por lo tanto, sería útil poseer un método práctico para calcular esta cantidad. Afortunadamente,la eliminación gaussiana propor- ciona unaformasimple de hacerlo. El método se basa en el hecho de que el determinantede la matriz triangu- lar se puede calcular simplemente con el producto de los elementos de su diagonal: D = a11a22a33. . . ann [B7.1.1] La validez de ,estafórmula se puede ilustrar en sistemas de 3 por 3: en donde el determinante se puede evaluar como [re- cuérdese la ecuación (7.4)] o, evaluando por menores (esto es, los determinantes 2 por 2). D = a11a22m - a d o ) + a d o ) = a11a~~a33 Recuérdese que el paso de eliminación progresiva de la eliminación gaussiana genera un sistema triangu- lar superior. Ya que el valor del determinante se puede evaluarsimplemente al final de este paso: D = a11a&a&. . . a?;') [B7.1.2] en donde los superíndices indican que los elementos se han modificado durante el proceso de eliminación. Por lo tanto, se puede aprovechar el esfuerzoque se ha he- cho al reducir elsistema a su formatriangular,y por aña- didura obtener una aproximación al determinante. Hay una pequeña modificación en elplanteamien- to anterior cuando el programa usa pivote0 parcial (sec- ción 7.4.2).En este caso, el determinante cambia de signo cada vez que un renglón se usa como pivotal. Una manera de representar esto es modificando la ecuación (B7.1.2): D = alla&?a:3. . . ak-l)(-l)p [B7.1.3] en donde p representa el número de veces en que los renglones se usan como pivotales. Esta modificación se puede incorporar de forma simple enun programa: úni- camente se toma en cuenta el número de pivoteos que se llevan a cabo durante los c6lculos y después se usa la ecuación (B7.1.3)pata evaluar el determinante.
  • 245. 244 MÉTODOS NUMÉRICOS PARA INGENIEROS nacióngaussiana.serecomiendaescalar el determinante como en el ejemplo 7.10. Afortunadamente,la mayor parte de las ecuaciones alge- braicas obtenidas de problemasde ingeniería por naturaleza son sistemas bien condicionados.Además, algunas de las técnicas desarrolladas en la siguientesecciónayudan a aliviarel problema. 7.4 TÉCNICAS DE MEJORAMIENTOEN LAS SOLUCIONES LESsipientzs técnicas se puedenincorporar al algoritmo de la elimina- c i h gaussianasimpleparaevitaralgunasdelasdesventajasanalizadas en la secciónprevia. 7.4.1 Uso de más cifras significativas El remedio más simpleparaelmal condicionamiento es el deusar más cifrassignificativasen los cálculos (compárenselos ejemplos 7.5 y 7.7). Si la computadora tienela capacidad de extenderel tamaño de las cifras significativas aumentando el tamaño de la palabra, esta característicare- ducemucho el problema. 7.4.2 Pivoteo Como se dijoal principio de la sección 7.3,los problemas obvios ocurren cuando un elementopivotal es cero, debido al paso de normalización lo cual origina una división por cero. Estos problemasse obtienen cuando el ele- mento pivotal es cercano a cero envez de ser exactamente igual, por lo que silamagnituddel elemento pivotal es pequeño comparado con los otros elementos, entonces se introducenerrores de redondeo. Por lo tanto, antes de normalizar cadarenglón, es ventajoso determi-. nar el coeficiente mayor disponible.Entonces se pueden intercambiarlos renglones de tal forma que el elemento mayor sea el pivotal. A este mé- todo se le conoce conelnombre de piuoteo parcial. Si se buscatanto en las columnas como en los renglones el elemento mayor y se intercam- bian, entonces el procedimiento es de piuoteo total. El pivoteototal se usa muy raramente en programas elementales, ya que el intercambio de columnas cambiael orden de las x y, por consiguiente,aumenta la com- plejidad delos programas, generalmente,sin justificación.El siguiente ejem- plo ilustra la ventaja del pivoteo parcial. Además de evitar la división por cero, elpivoteotambiénminimizaelerror de redondeo. Como tal, sirve también como remedioparcial almal condicionamiento. EJEMPLO 7.1 1 Pivoteo parcial Enunciadodelproblema:úsese la eliminacióngaussianapararesolver:
  • 246. ELlMlNAClON GAUSSIANA 245 0.000 3x1 + 3.000 0x2 = 2.000 1 1.0000x1 + 1.000 0x2 = 1.000 o Nótesequeenestaformaelprimer elemento pivotal, all = 0.000 3, es muy cercano a cero. Despuésrepítanseloscálculosconpivote0parcial pero invirtiendo el orden de las ecuaciones. La solución exacta es x1 = 1/3 y x2 = 2/3. Solución: normalizando laprimer ecuación se obtiene: x1 + 10 000x2 = 6 667 lacual se puedeusarparaeliminar x1de la segunda ecuación: -9 999x2 = -6 666 que se puederesolver para: x2 = 2/3 Esteresultado se puede sustituirenlaprimer ecuación y evaluar xl: 2.000 1 - 3(2/3) 0.000 3 x1 = [E7.11.1] Sin embargo, el resultado es muy sensitivoal número de cifras significati- vasincluidasenel cálculo: Valor absoluto del error relativo Cifras porcentual significativas x? X1 ¿e x1 3 0.667 -3.33 1 099 4 0.6667 0.000 1O0 5 0.66667 0.300 O0 10 6 0.666 667 0.330O00 1 7 0.666666 7 0.333 O00 O o.1 Nóteseque la soluciónpara x1 dependemuchodelnúmerode ci- fras significativas.Esto se debe a que enla ecuación (E7.11.1), se resta- ron dos números casi iguales (recuérdeseel ejemplo3.4). Por el otrolado, si se resuelvenlas ecuaciones en orden inverso, se normalizaelrenglón conel elemento pivotal mayor. Las ecuaciones son:
  • 247. 246 METODOS NUMERICOS PARAINGENIEROS 1.000 Ox1 + 1.000 ox* = 1.000o 0.000 3x1 + 3.000 0x2 = 2.000 1 La normalización y laeliminaciónproduce x2 = 2/3. Para cantidades di- ferentes de cifras significativas, x1se puede calcular de laprimera ecua- ción,como: [E7.11.2] Este caso es mucho menos sensitivo al número de cifras significativas en los cálculos: Cifras significativas x2 X1 0.667 0.333 0.666 7 0.333.3 0.66667 0.333 33 0.666667 0.333 333 0.666666 7 0.333 3333 Valor absoluto del error relativo porcentual de x1 0.1 0.01 0.001 0.000 1 0.000 o1 De esta forma, la estrategiapivotalesmuchomássatisfactoria. Los programas de NUMERICOMP de propósitos generales queacom- paiían este libro, incluyena menudo una estrategia pivotal.La figura 7.8 muestra un algoritmoparaimplementarestaestrategia.Esteprograma se puede integrar al de la figura 7.4 para incorporar el pivote0 parcialen los programasdelusuario. 7.4.3 Escalamiento En la sección 7.3.3 se dedujo que el escalamiento influye enla estandari- zación del valor del determinante.Más allá de esta aplicación,tiene utili- dadenlaminimizaciónde los erroresde redondeo paraaquellos casos en donde alguna de las ecuaciones de un sistema tiene unos elementos mucho más grandes que otros. Estas situacionesse encuentran frecuen- temente en la ingeniería cuando se usan ampliamente unidades diferen- tes en el desarrollo de ecuaciones simultáneas. Porejemplo, en problemas de circuitos eléctricos, los voltajes desconocidos se puedenexpresar en
  • 248. ELlMlNAClON GAUSSIANA 247 FORTRAN BASIC 303r) ?O90 3140 3150 &=RP IF ( 6 - B P . G E . O . X O T O 308U . . .I .I= I CONTINUE I F ( J J - K . E O . O . 0 ) COTO 3150 .. - O0 3140 J-K,Nl f i ( J J , J > - R ( K , J ) TE=&< J J . J ) CONTINUE A f K, J )=TE CONTINUE RETURN END 31:103 . m = t 302hj B : AB', 1 A l I .t.. I I 3ü:xj FOR 1 = I + I TLJ N 3ü4<:, I W = ABS I A ( I .I., # ) 305.> IF P - BF' . =- ü THEN 3ü8U :üad E c BF' otrascolumnascontraelpivotel 31171'1 .I.) = I K = representaelrengldnpivotal (Almacena el valor absoluto del pivote actual) ICiclo que compara los elementos de las ~ . .. . 3 0 8 o biEx r I ~C.1'90 I F J.1 -- I, *: ü THLN 3150 3 1 1 0 I€ = A l ..IJ. ..I1 313ü A l b ~ d )= 1E 3140 N t k l J (Si no es asl, este ciclo -, . - (Sielpivoteescogido es el mayor, entonces regresa al programa principal) 3150 Rtll.lFIN lntercambia los renglones1 a continuar c o n laeliminacidnl (Regresa al programaprincipal FIGURA 7.8 Programa en FORTRAN y BASIC para implementar el pivoteo parcial. unidades que varían desde microvolts hasta kilovolts. Se pueden encon- trar ejemplos similares en todoslos campos de la ingehiqría. Mientrasca- daunadelas ecuaciones sea consistente, técnicamentdel sistemaserá correcto y tendrá solución. Sin embargo, eluso de unidades completa- mente diferentes puede generar coeficientes de magnitudes que difieran ampliamente entre sí. Esto puede tener un impacto sobre el error de re- dondeo ya que afecta al pivoteo, como se puedeverenelsiguiente ejemplo. EJEMPLO 7.12 Efectos del escalamiento en el pivoteo y el redondeo Enunciadodelproblema: a ) Resuélvaseel siguiente conjunto deecuacionesusando la eliminación gaussiana y la estrategiadelpivoteo: 2x1 + 100 000x2 = 100 O00 x1 + x2 = 2 b) Repítase la solución anterior después de escalar las ecuaciones detal formaqueelcoeficientemáximoen cada renglón sea 1. En ambos casos, reténganse sólo tres cifras significativas. Nótese que las respues- tascorrectasson x1 = 1.O00 02 y x2 = 0.999 98 o, contrescifras significativas,x1 = x2 = 1.00.
  • 249. 248 MÉTODOS NUMÉRICOS PARA INGENIEROS Solución: a) Sin escalar,,se aplicalaeliminaciónhaciaadelante y se obtiene: 2x1 + 100000x2 = 100 O00 -50 000x2 = -50 O00 I quesepuederesolverporsustituciónhacia atrás, para obtener: x:, = 1.00 x1 = 0.00 Aunque x2es correcta, x1tiene un 100% de errordebido al redon- deo. b) El escalamientotransformalas ecuaciones originales en: 0.000 02x1 + x2 = 1 x1 + x2 = 2 Por lo tanto, se debeaplicar el pivote0 a los renglones y colocar el valormayorsobrela diagonal. IC1 + x:, = 2 0.000 02x1 + x2 = 1 Laeliminaciónhaciaadelante genera: x1 + x2 = 2 x1 = 1.00 que se puederesolver para: ~ ~ x1 = x:, = 1 ~ De esta forma, el escalamientoproduceunarespuesta correcta. AIigual que enel ejemplo anterior, el escalamientoaquítiene utilidad para minimizar los errores deredondeo. Sin embargo, se debe notar que el escalamiento mismollevaimplícito un error de redondeo. Por ejem- plo, dada la ecuación: 2x1 + 300 OOOXZ = 1 y usandotrescifrassignificativas,elescalamiento produce: 0.000 006 67x1 + x2 = 1
  • 250. ELlMlNAClON GAUSSIANA 249 Por lo que e l escalamiento introduce un error de redondeo en el primer coeficiente. Por esta razón, algunas veces se sugiere que el escalamiento sólo se emplee en casos donde realmente sea necesario, esto es, cuando el sistema involucre coeficientes de magnitudes muy diferentes. 7.4.4 Correccióndeerrores En algunos casos, el pivote0 parcial y el escalamiento no son suficientes para asegurar resultadosprecisos. Por ejemplo, recuérdese el ejemplo 7.7, que tenía los elementos mayores en la diagonal, pero que debido a los errores de redondeo,la solución final aún presentaba errores. Estos erro- res, en general se pueden reducir con el siguiente procedimiento. Consi- dérese un sistema de ecuaciones lineales de la forma: [7.21] anlxl+ aax2 + * * + a,,x, = c, Supóngasequese tiene un vectorsoluciónaproximado dado por kl, kz, . . . , k,,.Estos resultados se sustituyenen la ecuación (7.21),para dar: [7.22] Ahora supóngase que la soluciónexacta xlrxz, . . . , x, se expresa en función de 21, 2 2 , . . . , k,, y de los factores de corrección Ax,, Ax2, . . . , Ax,, endonde [7.23] x, = R, + Ax, -. -. ." . .
  • 251. 250 METODOSNUMERICOS PARA INGENIEROS Si estosresultados se sustituyenenla ecuación (7.21) da como conse- cuencia el siguientesistema: Ahoralaecuación (7.22) se puederestarde la ecuación (7.24) para obtener: allAxl + a12Ax2 + * * + alnAx,= c1 - El = El azlAxl + a22Ax2 + * * + az,Ax, = c~- E2 = €2 [7.25] anlAxl+ ~ ~ ~ 2 6 x 2+ * + a,,Ax,, = c, - E, = E, Este sistema en sí mismo es un conjunto de ecuaciones lineales simultá- neas que sepuederesolverobteniendoconello los factoresde correc- ción. Estosfactores se pueden aplicar para mejorar la solución especificada porla ecuación (7.23). EJEMPLO 7.13 Uso de las ecuaciones de errorparacorregir los deredondeo Enunciado del problema: recuérdese que enel ejemplo 7.7 seusala eli- minacióngaussianacontrescifrassignificativaspara resoher 0.1~1+ 7x2 - 0 . 3 ~ 3= -19.3. O.3X1 - 0.2~2+ 10x3 71.4 , Debidoalnúmerolimitadodecifrassignificativas,lasolucióndifierede la verdadera (x1 = 3, x2 = -2.5, x3 = 7) en:
  • 252. ELlMlNAClON 251 x1 = 3.17 E, 5.7% x2 = -2.51 E , = 0.4% x3 = 7.02 E, = 0.29% Úsenselas ecuaciones delerrorpararefinar estas aproximaciones. Solución: la sustitución de las soluciones en el conjunto originalde ecua- ciones produce el vectordetérminosindependientes: [elT= [8.36 -19.4 71.71 que no es igualalvalor real. Por lo tanto, se puede desarrollar un vector de error: Ahora, se puedegenerar un conjunto de ecuaciones error [Ec. (7.25)]: 3AX1 - 0.1Ax2 - 0.2Axs = -0.51 O.lAx1 + 7AX2 - 0.3Ax3 = 0.1 O.3Ax1 - 0.2A~2+ 1OAx3 = -0.3 que se puederesolver (usandotrescifrassignificativas de formatal que existaconsistenciacon elproblema original),para obtener: [AX]' = [-0.1710.015 7 -0.02461 los cuales se puedenusarparacorregirlas soluciones, dando: XI = 3.17 - 0.171 = 3.00 x2 = -2.51 + 0.015 7 -2.49 x3 = 7 O2 - 0.024 6 = 7.00 que se aproximanmuchomás a la soluciónverdadera Ecuaciones del error en los programas. Se puedenintegrarlas ecua- ciones del error en los programas de la eliminacióngaussiana.En la figu- ra 7.9 se delinea un algoritmoquerealizaesta tarea. Nótese que para hacer más efectiva la corrección de sistemas altamente mal condiciona-
  • 253. 252 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA 7.9 Algoritmode eliminacióngaussianaqueincluyecorreccióndeerrores. dos, las E enla ecuación (7.25)se deben expresaren aritmética de doble precisión. Esto se hace fácilmente en FORTRAN pero en algunas imple- mentaciones de BASIC no esposible hacerlo. 7.5 RESUMEN En resumen, estecapítulose ha dedicado a la eliminación gaussiana, el método fundamentalen la solución de sistemas deecuacionesalgebraicas lineales.Aunqueéstaes unadelas técnicas másantiguasdesarrolladas para este propósito,aún es un algoritmo muy efectivo enla obtención de solucionesdemuchosproblemas de ingeniería.Ademásde suutilidad práctica, proporciona un contexto enel estudiogeneraldetemastales como los erroresde redondeo, escalamiento y condicionamiento. Las respuestasque se obtienenmedianteelmétodo de eliminación gaussiana se pueden verificar sustituyéndolas en las ecuaciones origina- les. Sin embargo, esto no siempre representa unapruebaconfiablesiel sistemaestá mal condicionado. Por lo tanto, si se sospecha de un error de redondeo, entonces sedebecalcularalgunamedida de la condición tal como e l determinante del sistemaescalado. Dos opciones que amino- ran los erroresde redondeo sonelusodelpivote0parcial y eluso de
  • 254. ELlMlNAClON GAUSSIANA 253 más cifras significativasen los cálculos. Si el problema parece ser sustan- cial, la corrección de errores (sección 7.4.4)se puede usar algunas veces para mejorar la solución. Existen otros planteamientos y variaciones de la eliminación gaussia- na para satisfacerlas necesidades particulares. Por ejemplo, como se ex- plica en el recuadro 7.2, se puede formularuna versión muy eficiente de la eliminación gaussiana para sistemas tridiagonales. El capítulo 8 se encarga de mostrar dos métodos diferentes,el de Gauss-Jordany Gauss- Seidei. RECUADRO 7.2 Sistemas de banda: el caso tridiagonal Una matrizbanda es una matriz cuadrada que tiene todos soluciones en diferencias finitas de ecuaciones diferencia- sus elementos iguales a cero, con excepción de una ban- les parciales. Además hay otros métodos numéricos tales da centrada sobre la diagonalprincipal (recuérdese Ill.1). como la interpolacióncúbica segmentaria (sección 11.4) En el caso en que el ancho de banda es 3, a lamatriz se que requieren la solución de sistemas tridiagonales. le conoce con un nombre especial: matriz tridiagonal. Los Un sistematridiagonal es aquél en el que los coefi- sistemas tridiagonales se encuentran frecuentemente en cientes están ordenados enforma tridiagonal, como en: la ciencia y en la ingeniería. Por lo general resultan de las d3X2 + e3x3 + f3x4 Nótese que se ha cambiado la notación de los coeficien- tes delsistematridiagonal de las a y las c a las d, e, f y g. Esto se hizo para evitar el almacenamiento de cantida- des grandes de ceros en la matriz de a. Esta modificación que ahorra espacio, es muy ventajosa ya que el algoritmo resultante requiere menos espacio en memoria. Como era de esperarse,los sistemas bandados sepue- den resolver con una técnica similar a la eliminacióngaus- siana. Sin embargo, debido a la estructuraúnicadel I " I O I " - " FORTRAN c sistema, la implementación del algoritmo dela eliminación gaussiana se puede simplificar mucho y las soluciones se obtienen deuna manera muy eficiente. Para el sistema tridiagonallos pasos de eliminación progresivase simplifi- can ya que la mayor parte de sus elementos son cero. En seguida las incógnitasrestantes se evalúan por sustitución hacia atrás. El algoritmo completo se expresa de forma concisa en los programas siguientes:
  • 255. 254 MÉTODOS NUMÉRICOS PARA INGENIEROS PROBLEMAS Cálculos a mano 7.1 Escríbase el siguiente conjunto de ecuaciones ennotaciónmatricial: Escríbase la transpuesta de la matriz. 7.2 Algunasmatrices se definen como: 1 5 6 4 0 5 [Al = [2 1 3 1 [Bl = [;;;]4 3 1 [Cl= [a] 5 4 3 6 [GI = [ 8 6 41 Respóndase a lassiguientespreguntasde acuerdo a las matrices anteriores: o) ¿Cuáles sonlas dimensiones de lasmatrices? b) Identifíquenselasmatrices cuadradas, columna y renglón. c) Cuáles son los valores de los elementos: 012 b23 d32 e22 112 912 d) Efectúense lassiguientes operaciones 7.3 Se definentresmatrices como: a) Efectúense todas lasmultiplicacionesposibles que se pueden llevar a cabo b) Usese el método del recuadro 111.2 para justificar por qué las parejas restan- eptre parejas de estas matrices. tes no se pueden multiplicar
  • 256. ELlMlNAClON GAUSSIANA 255 7.4 7.5 7.6 7.7 7.8 c) Úsense los resultados de a) e ilústresepor qué es importanteelorden de lasmultiplicaciones. Úsese el método gráfico para resolver: 4x1 - 6x2 = " 2 2 -xl + 12x2 = 58 verifíquense los resultadossustituyéndolos en las ecuaciones originales Dado elsistema de ecuaciones: o.75X1 + xp = 14.25 1 . 1 ~ ~+ 1 . 6 ~ ~= 22.1 a) Resuélvase gráficamente. b) Enbase a lasolucióngrAfica,'qué se espera acerca de la condición del sistema? c) Resuélvase por eliminación de incógnitas. d) Verifíquense las respuestas sustituyéndolasen las ecuaciones originales. Para el conjunto de ecuaciones: a) Calcúlese su determinante. b) Usese la regla de Cramer y resuélvase para las x. c) Sustitúyanse los resultadosen la ecuación original y compruébenselos mismos. Dadaslas ecuaciones: 0 . 5 ~ 1- x2 = -9.5 0.28~1- 0.5~2= -4.72 a) Resuélvanse gráficamente. b) Después de escalarse, calcúlese su determinante. c) En base a a) y b) ¿qué se puede esperar de la condicióndelsistema? d) Resuélvanse poreliminación de incógnitas. e) Resuélvanse otra vez, pero modificando all a 0.55. Interprétense los resul- tados de acuerdo al análisis de mal condicionamiento de la sección 7.1.1. Dado el sistema "12x1 + x2 - 7x3 = -80 x1 - 6x2 + 4x3 = 13 -2x1 - x2 + = 92
  • 257. 256 MÉTODOS NUMÉRICOS PARA INGENIEROS a) Resuélvase con el uso de la eliminacióngaussiana simple. Muéstrense todos b) Sustitúyanse los resultados enlas ecuaciones originales y compruébense las los pasos de los cálculos. respuestas 7.9 úsese la eliminación gaussiana para resolver: 4x, + 5x2 - 6x,{ = 28 ZX, - 7x3 = 29 - 5 ~ 1 - 8x2 = -64 Empléese el pivoteo parcialy compruébense las respuestas sustituyéndolasen las ecuaciones originales. 7.10 Úsese la eliminación gaussiana para resolver: 3x2 - 13~,$= -50 Zx, - 6x2 + x:( = 44 4x, + 8x,: = 4 Empléese el pivoteo parcial. Compruébense las respuestassustituyéndolas en las ecuaciones originales. 7.11 Repítase el ejemplo 7.6 con el coeficiente de rozamiento al doble. 7.12 Resuélvase el siguientesistematridiagonal: 5x, + 4x2 = 25 4x, - 3x, + 7x,3 = 3 x2 - 6x3 + 4x4 = 17 12x,, + 2x, = 36 7.13 Efectúense los mismoscálculosdel ejemplo 7.6, pero usando cinco paracaidistas conlassiguientes características: Paracaidista Masa, kg Coeficientesde rozamiento, kgls 1 60 15 2 80 14 3 75 18 4 75 12 5 90 10 Los paracaidistas tienen unavelocidad de 10 m/s
  • 258. ELlMlNAClON GAUSSIANA 257 Problemas para resolver con una computadora 7.14 7.15 7.16 7.17 7-18 7.19 7.20 7.21 7.22 Escríbase un programageneralparamultiplicardosmatrices, esto es, [X] = [y][Zl donde [X]es m por n y [Zl es n por p. Pruébese elprogramausando Escríbase un programa que genere la transpuestadeunamatriz. Pruébese con Reprográmese la figura 7.4 de tal forma quesea más legibleal usuario. Entre otras cosas: a) Intégrese lafigura 7.8 al programa de tal forma que éste realice pivote0 b) Documéntese el programa para identificar cada sección. c) Etiquétese la entrada y la salida. d) Escálense las ecuaciones de talforma que el coeficiente mayor en cada parcial. renglón sea 1. Calcúlese el determinante como una medidadela condi- cióndelsistema (opcional). Pruébese el programa desarrollado en el problema 7.16 duplicando los cálculos del ejemplo 7.5 y 7.6. Úsese el programa desarrollado enelproblema 7.16 y repítanse los problemas 7.8 al 7.11. Repítanse los problemas7.17 y 7.18 usando los programas de NUMERICOMP disponiblescon el texto. Usese también NUMERICOMPpara realizar una prueba de error para cada problema. Desarróllese un programa para sistemas tridiagonales legiblesal usuario y basán- dose enel recuadro 7.2. Pruébese el programa desarrolladoen el problema 7.20 resolviendo el problema 7.12. Resuélvase el problema 7.13 usando los programas desarrolladosen el problema 7.16.
  • 259. C A P í T U L O O C H O GAUSS-JORDAN, INVERSIóN DE MATRICES Y GAUSS-SEIDEL En estecapítulo se describendosmétodosadicionalespararesolver ecuacioneslineales simultáneas.El primero deellos, el método de Gauss- Jordan es muy similaral de la eliminación gaussiana. El motivo principal para introducir estatécnica, estriba en que proporcionauna forma simple y conveniente de calcular la inversa de unamatriz.Lainversatiene un gran númerodeaplicaciones enla ingeniería.Estemétodotambién proporciona los mediosparaevaluar la condiciónde un sistema. El segundo de ellos,el método de Gauss-Seidel es fundamentalmente diferente al deeliminacióngaussiana y al de Gauss-Jordan porque es un método de aproximaciones iteratiuas.Esto es, emplea un valor inicial y mediante iteraciones obtieneuna aproximación másexacta a la solución. El método de Gauss-Seidel se adapta, en particular a grandessistemas de ecuaciones. En estos casos, los métodosdeeliminaciónestán su- jetos a los errores de redondeo. Ya que elerrorenelmétodo de Gauss-Seidel se puede controlar mediante el número de iteraciones,los errores de redondeo no tienen quever con estatécnica. Sin embargo hay ciertos casosen que el método de Gauss-Seidelno converge a la respuesta correcta. Se discutenenlassiguientespáginasestos y otros elementos dejuiciopara escoger entre laeliminación y los metodositerativos. 8.1 MÉTODO DE GAUSS-JORDAN El método de Gauss-Jordan es una variación de la eliminación gaussiana. La principal diferencia consiste en que el método de Gauss-Jordan cuando se eliminaunaincógnitano sólo se elimina de las ecuaciones siguientes sino de todas las otrasecuaciones. De esta forma, el paso de eliminación generauna matrizidentidadenvezde una matriz triangular (Fig. 8.1). Por consiguiente,no es necesario emplear la sustitución hacia atrás para obtener la solución. El método se ilustra mejorcon un ejemplo.
  • 260. 260 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA 8.1 Esquema gráfico delmétodo de Gauss-Jordan. Compárese con la figura 7.3 y nótese la diferencia entreeste método y el de eliminación gaussiana. LOS asteriscosindicanqueelvector de términosindependientes se ha modificado varias veces. EJEMPLO 8.1 Método de Gauss-Jordan Enunciado del problema: úsese el método de Gauss-Jordan para resol- ver el mismo sistema del ejemplo 7.5: 3x1 - 0.1~2- 0.2~3= 7.85 0.1~1+ 7x2 - 0.3~3= -19.3 0.3~1- 0.2~2+ 10x3 = 71.4 Soluci6n: en primer lugar, se expresan los coeficientes y el vector de tér- minos independientes como una matriz aumentada: [os 3 -0.1 -0.2 7 -0.3 -19.3 0.3 -0.2 10 71.4 En seguida se normaliza el primer renglón dividiéndolo por el pivote 3, para obtener:
  • 261. GAUSS-JORDAN,INVERSldN DE MATRICES Y GAUSS-SEIDEL 261 1 -0.033 333 3 -0.066 666 7 I 2.616 67 0.1 7 -0.3 I -19.3 0.3 -0.210 I 71.4 1I El término x1se puedeeliminardelsegundorengónrestando 0.1 ve- ces el primerodelsegundorenglón. Deuna manerasimilar,restando 0.3 veces el primero del tercer renglón se eliminaeltérminocon x1 del tercer renglón: [ [Oo "0.190 O00 10.020o ~ 70.615 O 1 1 -0.033 333 3 -0.066 666 7 I 2.616 67 O 7.00333-0.293 333 I -19.561 7 O -0.190 O00 10.020 O ~ 70.615 O 1En seguida, se normaliza el segundo renglón dividiendolo entre 7.003 33: 1 -0.033 333 3 -0.066 666 7 ~ 2.61667 -0.041 8848 1 "2.793 20 Reduciendolostérminos en x2 de laprimera y la tercera ecuación se obtiene: 1 O -0.068 062 9 I 2.523 561 O 1 -0.041 884 8 ~ -2.793 20 o o 10.012 o I 70.084 3 El tercerrenglón se normalizadividiéndoloentre 10.012 O: 1 O -0.068 062 91 2.523 56 O 1 -0.041 884 81 -2.793 O 0 1 Finalmente, los términoscon x3 se puedenreducirdelaprimera y se- gundazcuaciónpara obtener: 1 o o ~ 3.000 O0 O 1 O I 2.500 O 1 O O 1 ~ 7.000 03 1De esta forma, como se muestra en la figura 8.1:lamatriz de coeficientes se ha transformadoenlamatrizidentidad y la solución se ha obtenido en el vector de términos independientes. Nótese que nose necesita susti- tuciónhaciaatrásparaobtenerlasolución.
  • 262. 262 MÉTODOS NUMÉRICOS PARA INGENIEROS Todo el materialdelcapítulo 7 relacionadocon las ventajas y desventajas de la eliminación gaussiana se aplican también al método de Gauss-Jordan. Por ejemplo, se puedeusar una estrategia similar al pivoteo para evitar divisiones por cero y reducir el error de redondeo. Aunque los métodosdeGauss-Jordan y de eliminación gaussiana pueden parecer casi idénticos, el primero requiere aproximadamente de 50 % menosoperaciones.Por lo tanto, la eliminación gaussiana es el método simple por excelenciaen la obtención de soluciones exactas alas ecuaciones lineales simultáneas. Una de las principales razones paraincluir en estecapítulo el método de Gauss-Jordan, es la de proporcionar un método directo de obtener la matriz inversa, tal como se describe en la sección 8.2 8.1.1 Algoritmo del método de Gauss-Jordan Enla figura 8.2 se muestra un algoritmo del método de Gauss-Jordan sin pivote0 parcial. Un esquema con pivoteomuy parecido al que muestra en la figura 7.10 se puede incorporar a este algoritmo. 8.2 INVERSIóN DE MATRICES Enla introduccióna las operacionesconmatrices(sección 111.2.2) se mencionaque si una matriz es cuadrada, entonces existeotramatriz, [A]- I , llamada la matriz inversa de [A],para el cual[Ec. (111.3)]: [A][A]" = [A]" [A] = [I] También sedemuestraque la inversa se puede usarpararesolver un conjunto de ecuaciones simultáneas, si se toma [Ec. (111.6)J: [XI= [Al" [CI @.11 La aplicación de la inversa ocurre cuando esnecesario resolver varios sistemas de ecuaciones de la forma: que difieren únicamente en el vector de términos independientes [C].En vez de resolver cada sistema por separado, unaalternativadiferente consiste en determinar la inversa de la matriz de coeficientes. Entonces, se puede usar la ecuación (8.1)paraobtener las soluciones,simplemente multi- plicando la matriz [A] por el vector de términosindependientescorres- pondiente [C].Ya que la multiplicación matricial es mucho más rápida que la inversión, el consumo de tiempo se lleva a cabo sólo una vez y después se obtienen las soluciones adicionales de una manera eficiente. También,comosemencionaen la sección 8.2.1, los elementos de la inversa son extremadamente útiles en sí mismos.
  • 263. FI dl G V( IGUI e flu¡ 'auss ,te0 1.2 Di( ?Imeí .dan, cial. 'O( SI ira d 0 in ma de pi-
  • 264. 264 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA 8.3 Esquemagráfico del métodode Gauss-Jordan,con inversiónde matrices. Con el método de Gauss-Jordan se puedecalculardirectamente la inversa. Para hacerlo, lamatriz de coeficientes se aumenta con una ma- triz identidad (Fig. 8.3).Posteriormente se aplicael métodode Gauss- Jordan para reducirla matriz de coeficientesa la matriz identidad. Cuando se completa esta tarea, el lado derecho de lamatriz aumentada contiene lamatriz inversa.Esta técnica seilustraenel ejemplosiguiente. EJEMPLO 8.2 El uso del método de Gauss-Jordan en el cálculo de la matriz inversa Enunciadodel problema: determínese la matriz inversa del sistema resuelto en el ejemplo 7.5. Obténgase la solución multiplicando [A]-1Por el vec- tor de términosindependientes: [CIT = [ 7.85 -19.3 71.4 1. Además, obténgase la solución para un vector de términos independientes diferente: [CIT = [2050 151. Solución: auméntese lamatriz de coeficientes con unamatriz identidad: 3 -0.1 -0.2 I 1 o o 0.3 -0.2 10 j O O 1 -0.3 I O 1 O] Usando all como pivote, elrenglón 1 se normaliza y se usaparaelimi- nar a x1 de los otrosrenglones 1 -0.033 333 3 -0.066 666 7 I 0.333 333 O 7.003 33 -0.293 333 1-0.033 333 3 o -0.190 O00 10.020 o ~ -0.0999999 o 1
  • 265. GAUSS-JORDAN, INVERSldN DEMATRICES Y GAUSS-SEIDEL 265 En seguida, se usa aZ2como pivote y xpse elimina de los otros renglones 1 O -0.068057 , 0.3331750.004739329 0 O 1 -0.041706 1 ~ -0.004739330.142 180 o o 10.012 1 I -0.100900.0270142 O 11 Finalmente, se usa a33como pivote y x3se elimina de los renglones res- tantes: 1 O O I 0.3324890.004922970.00679813 0 0 1 I "0.010 077 9 0.002 698160.099 880 1 1O 1 O I -0.005 164 40.142 293 0.004183 46 Por lo tanto, lainversa es: 0.332 489 0.004 922 97 0.006 798 13 -0.005 164 4 0.142 293 0.004 183 46 "0.010 077 9 0.002 698 16 0.099 880 1 Ahora, la inversa se multiplica por el primer vector de términos indepen- dientes, obteniendo la solución: x1 = 7.85(0.332489) - 19.3(0.00492297) + 71.4(0.006798 13) = 3.000 411 81 x2 = 7.85(-0.005164 4) - 19.3(0.142293) + 71.4(0.004183 46) - 2.488 096 40 x3 = 7.85(-0.010077 9) - 19.3(0.00269816) + 71.4(0.099 880 1) = 7.000 25314 La segundasolución,simplementese obtiene realizando otras multiplica- ciones, como: x1 = 20(0.332489) + 50(0.00492297) + 15(0.006 798 13) = 6.997 90045 x2 = í!O(-0.005 164 4) + 50(0.142 293) + 15(0.004 183 46) = 7.074 113 9 X3 = 20(-0.010 O77 9) + 50(0.002 698 16) + 15(0.099880 1) = 1.431 55150
  • 266. 266 MÉTODOS NUMÉRICOS PARA INGENIEROS 8.2.1 Cálculos estírnulo-respuesta Como sedijo enla sección III.1.2,muchos de los sistemaslinealesde ecuaciones usados en ingeniería se derivan de las leyes de conservación. La expresión matemática de estas leyes es un tipo de ecuaciónes de ba- lancequeaseguraque se conserve unapropiedadenparticular; masa, fuerza, calor, momento u otras. Enelequilibrio de fuerzas de una estruc- tura, laspropiedadespuedentener componentes horizontales y vertica- lesdelasfuerzas queactúansobrecadanodode la estructura (véase el caso de estudio9.3).Para un balance de masas, las propiedades pueden ser la masa en cada reactor de un proceso químico. Existen ejemplos si- milaresen otroscamposde la ingeniería. Se puede escribir una ecuación simple de balance para cada una de las partes delsistema,generandoun conjunto de ecuaciones que definen el comportamientodelsistema completo. Estas ecuaciones se interrela- cionan o se acoplandemaneraque cada ecuaciónincluyeuna o más delasvariablesdelasotras ecuaciones. En muchas ocasiones, los siste- masson lineales, y por lo tanto, dela forma exacta que se hatratado en estecapítulo: Ahora, en ecuaciones de balance, los términos de la ecuación (8.2) tieneninterpretaciónfísicadefinida.Por ejemplo, los elementos-de [X] representan los valoresdelasvariablesque se estánequilibrandopara cada unadelaspartesdel sistema. Enelequilibrio de fuerzas de la es- tructura, representan las fuerzas verticales y horizontales de cada miem- bro. Enel balance de masas, son las masas de sustancia química en cada uno de los reactores. En cualquier caso, representan las respuestas o es- tadosdelsistemaqueestátratando de determinar. El vector [C]de términos independientes contiene aquellos elemen- tos del balance que son independientes del comportamiento delsistema, esto es, son constantes. Como tales, representanlasfuerzasexternas o los estímulosquemanejan al sistema. Finalmente, lamatriz [A]de coeficientes contiene, en general los pa- rámetros que expresancomo interactúael sistemao su acoplamiento. Por consiguiente, la ecuación (8.2)se puedereexpresar como: [Iteraciones] [respuestas] = [estímulos] Ahora, como se havistoen este capítulo, existen muchas formas de re- solver la ecuación (8.2).Sin embargo, elusodelamatrizinversalleva a un resultado particularmente interesante. La solución formal [Ec. (8.1)] se puedeexpresar como:
  • 267. GAUSS-JORDAN,INVERS16N Y GAUSS-SEIDEL 267 o (recordandola definiciónde multiplicaci6n matricial del recuadro111.2): De esta forma, se ha encontrado que lamatrizinvertida misma, además de proporcionar unasolución,tiene propiedadesmuy útiles. Esto es, ca- da uno de sus elementos representa la respuesta deuna parte simple del sistema a un estímulounitarioencualquierpartedelmismo. Nótese que estas formulaciones son lineales y, por lo tanto, se cum- plela superposición y la proporcionalidad.Lasuperposiciónindicaque si un sistema está sujeto a varios estímulos diferentes (lasc), las respues- tas se pueden calcular individualmentey sumarse los resultados paraob- tener la respuesta total. Laproporcionalidadindicaque si se multiplica el estímuloporunacantidad genera unarespuestarespecto al estímulo multiplicadaporlamisma cantidad.Deesta forma, el coeficiente all' es una constante deproporcionalidadqueproporcionaelvalorde x1 debido alnivelun'ttario cl. Este resultado es independiente de los efectos de c2 y c3 sobre xl, los cuales se reflejansobre aA12y aA13respectiva- mente. Por lo tanto, se puedellegar a la conclusióngeneraldeque el elemento a-llj de la matriz invertida representa el valor de x1debido a la cantidadunitariade cj. Usando el ejemplode la estructura, el elemento aAgde lamatrizinversa representa lafuerzaenelmiembro i debido a una fuerza externa individual en el nodo. j. Aun para sistemas pequeños, los comportamientosde las interacciones estímulo respuesta individuales no son obvios. Porlo que, la matriz inversa proporciona una técnica potente para comprender las interrelaciones de partes componentes de sistemas complicados.Esta potencia se demuestra enel caso deestudio 9.3. 8.2.2 La inversa y el malcondicionamiento Además de sus aplicacionesa la ingeniería,la inversa también suministra una maneradediscernircuando los sistemasestán mal condicionados. Existentresmétodosparaestepropósito: 1. Escalar lamatriz decoeficientes [A],detalformaqueel elemento mayor en cada renglón sea 1.Si los elementos de [A]-'son varias órdenes demagnitudmásgrandesquelos elementos de lamatriz original, entonces probablementeéstaesté mal condicionada. 2. Multiplicarlainversaporlamatrizde coeficientes original y estimar siel resultado se encuentra cerca de lamatriz identidad. Si no lo es- tá, entonces haymal condicionamiento.
  • 268. 268 MÉTODOS NUMÉRICOS PARA INGENIEROS 3. Invertirlamatrizinvertida y estimar siel resultadoestá lo suficiente- mente cerca de lamatriz original. Si no lo está, nuevamente el siste- ma está mal condicionado. 8.2.3 Algoritmo para la inversión matricial El algoritmo de la figura 8.2 se puede modificar para calcularla matriz in- versa.Estoimplica,aumentar lamatriz de coeficientesconuna matriz identidad al principio del programa. Además, alguno de los indices que manejan un ciclo se debe aumentar aldoblepara que los cálculos se Ile- ven a cabo en todas las columnas de la matriz decoeficientes aumentada. Si se incorporaelpivote0parcialenelalgoritmo de Gauss-Jordan, entonces serequierenalgunasmodificacionesadicionales.Esto se debe a que cada vez que un renglón de lamatrizusa un pivote, lacolumnd de lamatriz inversasedebeajustardeformasimilar. La figura8.4ilustra este fenómeno. Por ejemplosi el renglón 3 se usa como pivote o se mueve a la posiciónentre los renglones 1 y 2, se modifica también el “significado”o “interpretación” del renglón2 dela matriz invertida. Envez de indicar el efecto de un cambio unitariode c2 sobre las x, se debeindicar el efecto de un cambiounitariode c3 sobrelas x. Además de las características anteriores, el programa debe diseñarse para que calcule las soluciones de un gran número de vectores de térmi- nos independientes, como se menciona al principio de la sección8:2. Esto se puede llevar a cabo, simplemente colocando un ciclo después de cal- cularlamatrizinversa.Este ciclo puede llevar a usar un vector de térmi- nos independientes, puede entoncesmultiplicarseporlamatriz [A]-’pa- ra obtenerla solución. El procedimientose continúa hasta queel usuario indiqueque no requieremás soluciones. FIGURA 8.4 Esquemagráfico del cambio que se produce en los elementos de la matriz inversa resultante al mover un renglón de la matriz de coeficientes. 8.3 MÉTODO DE GAUSS-SEIDEL Los métodos deeliminacióndirectaanalizadosenlas secciones previas se puedenusarpararesolveraproximadamente de 25 a 50 ecuaciones lineales simultáneas. Esta cantidada veces se puede aumentarsiel siste-
  • 269. GAUSS-JORDAN,INVERS16N DE MATRICES Y GAUSS-SEIDEL 269 maestábien condicionado, si se emplea la estrategiapivotal, si se usan las ecuaciones delerror o silamatriz es disprsa. Sin embargo, debido a loserroresde redondeo, losmétodos de eliminaciónalgunas veces son inadecuados para sistemas muy grandes. En este tipo de problemas, sepuedenusarlos métodos iterativos o deaproximaciónconalguna ventaja. En el capítulo 5 se usan tipos similares detécnicaspara obtener raíces deuna ecuacion. Aquellos planteamientos consistenenelusode un va- lorinicial a partirdel cual, medianteuna técnica sistemáticaseobtiene una mejoraproximación a laraíz.Debido a que en estapartedeltexto se enfrenta un problema similar "la obtención de valores para satisfacer simultáneamenteun conjunto de ecuaciones- se espera que puedan ser útiles talesmétodosdeaproximacióndentro de este contexto. La razónporlacuallos métodositerativossonútilesenla disminu- ción de los erroresde redondeo en sistemas, se debe a que un método de aproximación se puede continuar hasta que converja dentro de algu- na tolerancia de error previamenteespecificada.De esta forma, el redon- deonoes un problema, ya que se controla elniveldeerror aceptable. El método de Gauss-Seidel es el método iterativo más usado.Supón- gaseque se hadado un conjuntode n ecuaciones: si los elementos de la diagonal son diferentes de cero, la primera ecuación se puederesolverpara xl, la segundapara x2,etcétera, lo quelleva a: [8.3a] [8.3b] [8.3c] cn- anlxl- an2x2- * - X" = an,n-&-1 [8.3d] ann Ahora, se puede empezarel proceso de solución usando un valor ini- cialparalas x. Lasolución trivial puedeservirdevalor inicial, esto es, todas las x valen cero. Estos ceros se puedensustituir en la ecuación (8.3a), que se puede usarparacalcular un nuevovalorde x1 = c1 / all. Lue-, go, se sustituyeelnuevovalorde xl, con x3,...,x,,aunen cero, enla ecuación (8.3b)con lacual se calcula un nuevovalorde x2.Este proce- so se repite en cada una de las ecuaciones hasta llegara la ecuación (8.3d)
  • 270. 270 MÉTODOS NUMÉRICOS PARA INGENIEROS la cual calcula un nuevo valor de x,. En seguida se regresa a la primera ecuación y se repite todo el proceso hasta que la solución converja bas- tante cerca de los valores reales. La convergencia se puedeverificar usando el criterio [recuérdese la ecuación (3.5)]: - . E . = a,1 1 I x{ 1'100% < Es ~8.41 para toda i en donde j y j - 1denotan la iteración actual y la anterior. EJEMPLO 8.3 Método de Gauss-Seidel Enunciado del problema: úsese el método de Gauss-Seidely resuélvase el sistema del ejemplo 7.5 y 8.1: 3x1 - 0.1~2- 0.2~3= 7.85 0.1~1+ 7x2 - O.3X3 = -19.3 0.3~1- 0.2~2+ 10x3 = 71.4 Recuerdese que la solución real es x1 = 3, x2 = -2.5 y x? = 7. Solución: en primer lugar. se despejan cada una de las variables sobre la diagonal: 7.85 + 0.1~2+ 0.2~3 3 x1 = -19.3 - 0.1~1+x2 = 7 71.4 - 0.3~1+ 0.2~2 10 x3 = [E8.3.1] [E8.3.2] [E8.3.3] Suponiendo que x2 y x3 son cero, la ecuación (E8.3.1) puede usarse para calcular: 7.85 3 x1 = - = 2.616 666 667 Este valor,juntocon el de = O, puede sustituirse en la ecuación (E8.3.2)obteniendo: -19.3 - 0.1(2.616666 667) + O ="2,794 523 810 x2 = 7
  • 271. GAUSS-JORDAN,INVERSIóN DEMATRICES Y GAUSS-SEIDEL 271 La primera iteración se completa sustituyendo los valores de xI y x2cal- culadosenla ecuación (E8.3.3),obteniendo: 71.4- 0.3(2.616 666 667)+ 0.2("2.794 523810) 10 x3 = = 7.005 609 524 Enla segunda iteración, se repiteelmismo procesoobteniendo: 7.85+ 0.1(-2.794 523 810)+ 0.2(7.005 609 524) 3 x1 = = 2.990 556 508)l e u (= 0.31% -19.3 - O.l(Z.990 556 508)+ 0.3(7.005 609 524) 7 x2 = = -2.499 624 684( E " I = 0.015% 71.4- 0.3(2.990 556 508)+ 0.2(-2.499 624 684) x3 = 10 = 7.000 290 81l ~ v l= 0.004 2% El método, por lo tanto, converge a la solución real. Para mejorar las so- luciones se debenaplicaralgunasiteracionesmds.Sinembargo,en este problema, no se debería saber la respuesta a priori. Por consiguiente, la ecuación (8.4)proporciona un medioparaestimarelerror: 2.990 556 508- 2.616 666 667 €0, I = 2.990 556 508 100 = 12.5% -2.499 624 684- (-2.794 523810) -2.499 624 684%,2 = 100= 11.8% -u, J I 7.000290811 I*"" I 7.000 290 811- 7.005 609 524I6. I ) = = 0.076% Nótese que, aligual que cuando se determinanraícesdeuna ecuación, la formulacionestales como la ecuación (8.4),engeneraldanuna eva- luación conservadora de la convergencia. Deesta manera, cuando fun- cionan, aseguranqueelresultadoseconozca al menos dentrode la toleranciaespecificadapor E,.
  • 272. 272 METODOS NUMÉRICOS PARA INGENIEROS Nótese que el método de Gauss-Seidel, a medida que secalcula un nue- vo valor x, este mismo se usa inmediatamente en la siguiente ecuación que a su vez determina una nuevax. De esta forma, si la solución es con- vergente, se empleala mejor aproximación posible. Un planteamiento di- ferente, al cual se le conoce como iteración de Jacobi, usa una táctica un poco diferente. En vez de usar el Qltimovalor calculado de las x,usa la ecuación (8.3)para calcular un nuevo valor de x en base a la aproxi- mación anterior de las x.De esta forma, al generar un nuevo valor no se usa de inmediato sino que se almacena para la siguienteiteración. La diferencia entre los métodos de Gauss-Seidel y la iteración de Ja- cobi se muestra enla figura 8.5.Aunque existen algunos casos en donde el método de Jacobi converge más rápido,el uso de la Gltima aproxima- ción disponible convierte al método de Gauss-Seidel en el método pre- ferido. 8.3.1 Criterios deconvergenciaen el métododeGauss-Seidel Nótese que el método de Gauss-Seidel es similar en proceso al método simple de iteración de punto fijo usado en la sección 5.1en la solución de raíces de una ecuación. Recuérdese quela iteración de punto fijo tie- ne dosproblemas fundamentales: l)algunas veces no converge y 2) cuar.- do lo hace, es a menudo, muy lento. El método de Gauss-Seideltambién puede tener estas fallas. FIGURA 8.5 Esquema gráficode la diferenciaentre a) el métodode Gauss-Seidel y b) el metododeiteracióndeJacobi, en la solución de ecuaciones algebraicas lineales simultáneas.
  • 273. GAUSS-JORDAN,NVERSIóN Y GAUSS-SEIDEL 273 Una condición de convergencia es que los coeficientes sobre la dia- cJonalde cada una delas ecuaciones sea mayor quela suma de los otros coeficientes enla ecuación. Una expresión cuantitativade este criterio es: I b i r l =-wJL,I ~3.51 En donde la sumatoria varía desde j = 1 hasta n , excluyendo j = i. La ecuación (8.5)es un criterio de convergencia suficiente pero no necesa- rio. Esto es, aunque el método trabaje algunas veces sin que la ecuación (8.5)se cumpla, se garantiza la convergencia siempre y cuando (8.5)si se cumpla.A los sistemas donde secumple la ecuación (8.5)se les cono- ce como diagonalmente dominantes.Afortunadamente, muchos proble- mas de ingeniería de importanciapráctica llenan esterequisito. 8.3.2. Mejoramiento enla convergencia usando relajación La relajación representa una pequeña modificación del método de Gauss- Seidel y está diseñada para aumentar la Convergencia. Después que ca- da nuevo valor de x se calcula usando la ecuación (8.3),el valor se mo- difica mediante un promedio pesado de los resultados de las iteraciones anteriores y actuales: X,nUeLo -- AX,nueL'o + (1- ~ ) x , ~ a s a ~ ~ o P .61 en donde X es un factor de peso al cual se le asigna un valor entre-Oy 2. Si X = 1,(1- X ) es igual a cero y el resultado permanece inaltera- do. Sin embargo, si a X se le asigna un valor entre O y 1,el resultado es un promedio pesado de los resultados previos y actuales. A este tipo de modificación se le conoce como sobrerrelajación.Por lo general, esta opción se emplea paraconvertir un sistema divergente en uno convergente. Si X se encuentra entre1y 2 se considera otro peso enel valor actual.. En este ejemplo, existe una suposición implicita de que el nuevo valor se mueve en la dirección correcta hacia la solución real pero con una ve- locidad muy lenta. De esta forma, el peso agregado a X intenta mejorar la aproximación empujándola hacia la real. Porlo que estetipo de modi- ficación, al cual se le llama sobrerrelajación,está diseñado para acelerar la convergencia de un sistema que ya es convergente. La elección de un valor adecuado deX es un problema altamente es- pecífico y a menudo se determina por prueba y error. En general es ine- cesario en la solución de un sistema. Sin embargo, siel sistema bajo estudio se va a resolver varias veces, entonces puede ser de gran importancia una buena elección de X. Algunos ejemplos son los sistemas muy grandes de ecuaciones diferenciales parcialesque a menudotratan de modelar cam- bios en sistemas de variable continua (recuérdese el sistema a rnicroesca- la mostrado en la figura 1II.lb). El segundo caso de estudio del capítulo 9 muestra un ejemplo del empleo dela relajación dentro de un contexto de problemas de ingeniería.
  • 274. 274 MÉTODOS NUMÉRICOS PARAINGENIEROS 8.3.3 Algoritmo del método de Gauss-Seidel En lafigura 8.6se muestraun algoritmo del método de Gauss-Seidel con relajación.Nótese que este algoritmo no estágarantizado para obtener resultados adecuados si las ecuaciones no son de tipo diagonalmente do- minante. Una manera demodificar el algoritmo para tomar un poco en cuenta esta desventaja es la de buscar los coeficientes de cada ecuación durante cada una delas iteraciones e identificar el mayor de ellos. La ecuación en turno se resuelve para el va!or de x asociadacon el coeficiente. En el siguiente cálculo, se rastrean los coeficientes de los valores restantes de x y se encuentra el coeficiente mayor. La ecuación se resuelve para el valor correspondiente de x. Procediendode esta manera,seaumentan al máximo las opor- tunidades de alcanzar unadominanciadiagonal. Sin embargo el es- quemano garantiza éxito en sistemas de alta divergencia.Porotra parte,no sería fácil de programar un algoritmo queimplementeeste esquema 8.3.4 ProblemasdecontextoenelmétododeGauss-Seidel Además deevitar el problema del redondeo, el método de Gauss-Seide! tiene otras ventajas quelo hacen particularmente atractivo en el contexto de ciertosproblemas de ingeniería. Porejemplo,cuando lamatriz en cuestión sea muy grande y muy dispersa (esto es, que la mayor parte de los elementos son ceros,los métodos deeliminación gastan una grancan- tidad de memoria para almacenar los ceros. En el recuadro 7.2, se muestra como puede evitarse este problema si la matriz de coeficientes es banda. Para sistemas diferentes, no es fácil evitar el uso de cantidades grandes de memoria, cuando se usan méto- dos deeliminación. Ya que todas las computadoras tienen una cantidad finita de memoria, esta ineficiencia puede llegar a ser una restricción real en el tamaño del sistema para el que, los métodos de eliminación resul- tanprácticos. Aunque un algoritmo general como el de la figura (8.6)está propen- sa a la misma restricción, la estructura de las ecuaciones de Gauss-Seidel [€c.(8.3)]permitedesarrollar programas concisos para sistemas espe- cíficos. Ya que en la ecuación (8.3)se necesita almacenar sólo los coefi- cientesdiferentes decero, es posible ahorrargrandescantidades de memoria.Aunqueestoimponemayorcostoen la inversión de desa- rrollo de programas, las ventajas a largo plazo son sustanciales cuando se manejansistemas grandes sobre los que se pueden realizar varios procesos. Los sistemas macro-y microvariables pueden generar matrices grandes y dispersaspara las cuales se utilizael método de Gauss- Seidel. En el caso de estudio 9.2 se trabaja un pocomás sobreestos puntos.
  • 275. FIGURA 8.6 Diagrama de fluio del métodode Gauss-Seidel con rela- jación. 275
  • 276. 276 MÉTODOS NUMÉRICOS PARA INGENIEROS PROBLEMAS Cálculos a Mano 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 Úsese el método de Gauss-Jordan para resolver el problema 7.6 Determínese la matriz inversa del problema 7.6. Compruébenselos resultados mul- tiplicando [A] por[A]" y obténgase lamatriz identidad. Usando el método de Gauss-Jordan, repítase el problema 7.9 Determínese la matriz inversa del problema 7.9. Compruébense los resultadosve- rificando que [A][A]" = [!] . Evítese el uso de la estrategia del pivoteo. Usando el método de Gauss-Jordan, conpivoteo parcial, calcúlese lamatriz in- versadelproblema 7.10. Ordenando la inversadetal forma, que los renglones y las columnas conformenla secuencia de la matriz original anterior al pivoteo (véase lafigura 8.4 y el análisis de la sección 8.2.3). Úsese el método de Gauss-Jordan para resolver: 10x1 - 3x2 + 6x3 = 24.5 1x1 + 8x2 - 2x3 = -9 "2x1 + 4x2 - 9x3 -50 Determínese lamatriz inversadelproblema 8.6. Úsese la inversapararesolver el problemaoriginal así como para resolver el caso adicional en donde el vector de términos independientes es [CIT= [110 55 - 1051. Resuélvase el problema 8.6 usando el método de Gauss-Seidel con un criterio de paro del E, = 10 % . Resuélvase el problema 7.8 usando el método de Gauss-Seidel con un criterio de paro del t, = 10 % . - 6 ~ 1+ 12x3 = 60 4x1 - x2 - x3 = -2 6x1 + 8x2 = 4 4
  • 277. GAUSS-JORDAN, INVERSldN DEMATRICES Y GAUSS-SEIDEL 277 8.12 Resuélvase el siguiente conjunto de ecuaciones: usando a) eliminación gaussiana, b) el método de Gauss-Jordan y c) el método de Gauss-Seidel (es = 5 % ). 8.13 Resuélvase el siguientesistema de ecuaciones: usando a) eliminación gaussiana, b) el método de Gauss-Jordan y C) el método de Gauss-Seidel (E, = 5 % ). Problemas relacionados con la computadora 8.14 Desarróllese un programa amable con el usuario para el método de Gauss-Jordan, basado en lafigura 8.2. Agréguese un esquema similaral mostradoen lafigura 7.10 empleando pivoteoparcial. 8.15 Pruébese el programa del problema anterior duplicandolos cálculos delejemplo8.1 8.16 Repítanse los problemas 7.6 y 7.8 hasta el 7.11 usando los programas desarrolla- dos enel problema 8.14. 8.17 Desarróllese un programa amable con el usuario para el método de Gauss-Jordan, coninversión de matrices y pivoteo parcial.Inclúyanse dentro delprogramalas características sugeridasen la sección 8.2.3. 8.18 Repítanse los problemas 8.5 y 8.7 usando los programas desarrolladosen el pro- blema anterior. 8.19 Desarróllese un programa amable con el usuario para el método de Gauss-Seidel basado en la figura 8.6.Hágase de tal forma que compruebe el criterio de conver- gencia expresado por la ecuación (8.5). Además, inclúyaserelajación como en la ecuación (8.6). 8.20 Pruébese el programadesarrolladoen el problemaanterior usando un duplicado del ejemplo 8.3. 8.21 Usando elprogramadel problema 8.19,repítanse los problemas8.8hastael 8.11.
  • 278. C A P í T U L ON U E V E CASOS DE LAPARTE TRES: SISTEMAS DE ECUACIONES ALGEBRAICAS LINEALES El propósito de este capítulo, es el de usar los procedimientos analizados en los capítulos 7 y 8 en la solución de sistemas de ecuaciones algebrai- cas lineales en algunas aplicaciones de ingeniería. Estos métodos numé- ricossistemáticos,son de importanciapráctica ya que losingenieros encuentran frecuentementeproblemas que implican la solución de siste- mas de ecuaciones demasiado grandes para resolverse a mano. Los al- goritmos numéricos son particularmente convenientes en estas aplicaciones ya quepuedenimplementarseenmicrocomputadoras. Entre otras cosas, los casos de estudio se han elaborado de manera que proporcionen ilustraciones reales de las características yfactores de importancia mencionados en los capítulos teóricos. Por ejemplo, el caso 9.1 muestra una ilustración simple decómo usar las ecuaciones algebrai- cas lineales para satisfacerde forma simultánea cierta cantidad decondi- ciones independientes.Además, seusa ectecaso de estudio para mostrar la utilidad de la matriz inversa como una herramienta analítica, dentro del contexto de estos problemas. Aunquese ha tomado este ejemplodel cam- po de la ingeniería general, la idea básica tiene importancia en una gran variedadde contextos técnicos y analíticos. El caso 9.2, tomado de laingenieríaquímica, es un ejemplo de un sistema de variable continua (o microvariable).El caso de estudioilustra cómo se pueden emplear las diferencias finitas enlatransformación de ecuaciones diferenciales en algebraicas. Al hacerlo así, se puedenusar losmétodosdesolucióndesarrolladosenloscapítulos 7 y 8 y obtener las soluciones.Aunque el ejemplo pertenece a la predicción detempera- turas en sólidos, se utilizael planteamiento general para simularla distri- bución continua de muchas otras variables de la ingeniería tales como la velocidad, lafuerza y la masa. En contraste, los casos 9.3, 9.4 y 9.5 analizansistemas de variable discreta (o macrovariable).El caso 9.3hace hincapié en el uso de la ma- triz inversaenla determinación delcomplejo de las reacciones al aplicar cargas a unaestructura. El caso 9.4 es un ejemplodel uso delasleyes de Kirchhoff en el cálculo de corrientes y voltajes en un circuito de resis-
  • 279. 280 MÉTODOS NUMÉRICOS PARA INGENIEROS tencias. Finalmente, el caso 9.5 muestra cómo se emplean las ecuacio- nes lineales para determinar la dinámica de partículas y cuerpos rígidos. CASO 9.1 DISTRIBUCIóN DE RECURSOS(INGENIERíA ENGENERAL) Antecedentes: todos los campos de la ingeniería enfrentan situacionesen las que ladistribución correcta de recursos es un problema critico. Estas situaciones se presentan al organizarinventarios de construcción, distri- bución de productos y recursos enla ingeniería.Aunque los problemas siguientes tienen que ver con la fabricaciónde productos, el análisis ge- neraltieneimportanciaen un ampliopanoramadeotrosproblemas. Un ingenieroindustrialsupervisalaproduccióndecuatrotiposde computadoras. Se requieren cuatro clases de recursos -horas-Hombre, metales, plásticos y componentes electrónicos- enla producción. En el cuadro 9.1 se resumen las cantidades necesarias para cada uno de estos recursos enla produccióndecadatipode computadora. Si se dispone diariamente de 504 horas-hombre, 1970 kg de metal, 970 kg de plástico y 601 componentes electrónicos, ¿cuántascomputadoras de cada tipo se puedenconstruirpordía?. Solución: la cantidad total producida de cada computadora está restrin- gida al total de recursos disponiblesen cada categoría diariamente. Estos recursostotales se distribuyen entre los cuatrotiposdecomputadoras. Sea xl,x,,x,,y x4la cantidad total de computadoras producidas dia- riamentedecada clase. Se sabe que la cantidadtotal de horas-hombre disponibles diariamente es de 504. Por lo tanto, la sumadelasdistribu- ciones de horas-hombre enla produccióndecadaunadelas computa- dorasdebesermenor o igual que 504. Por lo tanto (usando los datos del cuadro 9.l), 3x1+ 4x2 + 7x3 + 20x4 5 504 r9.11 Delamisma manerapara los metales, plásticos y componentes: 20x1 + 25x2 + 40x3 + 50x4 5 1970 10x1 + 15x2 + 20x3 + 22x4 5 970 loxl + 8x2 + lox3 + 15x4 5 601 Cada una de estas ecuaciones se debe satisfacer de forma simultánea de otra manera, se acabaría uno o más de los recursos necesarios en la pro- ducción de los cuatro tipos de computadoras. Silos recursos disponibles, representadospor el vectordetérminosindependientesde las ecua- ciones anteriores,se reducen todosa cero simultáneamente,entonces se
  • 280. CASOS DE LAPARTE TRES: SISTEMASDEECUACIONESALGEBRAICASLINEALES 281 CUADRO 9.1 Recursos necesarios para producir cuatro tipos de computadoras Horas/Metales PlásticosComponen- hombre, kglcompu- kglcompu- tes, unida- Compu- kglcompu- tadoratadora deslcompu- tadora 1 3 201010 2 4 2515 a 3 7 40 2010 4 20 50 2215 puede reemplazar el signo menor o igual por el de igual. En este caso, la cantidad total de cadatipo de computadoraproducida se puedecalcu- lar resolviendo un sistema de. ecuacionesde 4por 4 usando los métodos de los capítulos 7 y 8. Ya que este sistema no es diagonalmente dominante, el método de Gauss-Seidel puede divergir. Sin embargo, se puede aplicar la elimina- ción gaussiana o el método de Gauss-Jordany calcular: x1 = 10 x2 = 12 x3 = 18 = 15 Esta información se usa en el cálculo de las ganancias totales.Por ejem- plo, supóngase quelas ganancias correspondientes a cada computadora están dadas por p1,p2,p3,y p4.La ganancia total asociada con un día de actividad (P)está dada por p = PlXl + P2X2 + P3X3 + P4x1 P.51 Se sustituyen los resultados de x,= 10,x2= 12,x,= 18 y x4= 15 en la ecuación (9.5)y se calcula una ganancia de (usando los coeficien- tes del cuadro 9.2): P = 1 OOO(l0) + 700 (12) + 1 lOO(18) + 400(15) = 44 200 CUADRO 9.2 Ganancias correspondientesa cada una de las cuatro computadoras. Computadora $I computadora 1 2 3 Ganancias 1 O00 700 1 100
  • 281. 282 MÉTODOS NUMERICOS PARA INGENIEROS De esta forma, se puede obtener una ganancia de $44 200 diarios, con los recursosespecificados enel problema. Ahora, supóngasequeexiste laposibilidad de aumentarcualquie- ra de los recursos disponibles. Un objetivoeseldevalorarquérecursosse debenescogerde talformaquegenerenlamayorganancia.Unamanera de hacerlo es el de incrementar cada uno de los cuatro recursos individual- mente, calcularlasganancias y posteriormentecomparar los resultados. Una alternativamás simple se basa en la matriz inversa, que se puede calcularusando el métodode Gauss-Jordan, como: [ 1 -0.081 7 0.0396 -0.146 5 0.191 8 [A]" = 0.1066 -0.225 6 0.408 5 0.010 7 -0.136 8 0.172 8 "0.190 9 -0.113 7 0.088 8 -0.021 3 0.007 1 0.0089 Cada uno de los elementos aij~'indicaelcrecimientoenlacomputadora i debido al crecimientounitariodelrecurso j. Por ejemplo, el elemento alyl especifica un incrementounitariode 0.039 6 delacomputadora 1 cuan- doseagrega un kilogramodemetal.Nótesequealgunosde los coeficientes son negativos, indicando que un incremento unitario en algunos recursos ba- jalaproduccióndeesetipodecomputadora. Ahora,con esta información como antecedente,se puede llevara cabo un evaluación rápida sobre los beneficios obtenidos al incrementar cada uno de los recursos multiplicandolos elementos de cada columna por la gananciaunitariadelcuadro 9.2. Por ejemplo, enlaprimera columna: API = -0.081 7(1 000) + 0.1066(700) - 0.136 8(1100) +0.088 8(400) = -122.04 en donde A Pj es el incremento en gananciasdebido a un incremento al recursoj . De esta forma, un incremento unitario enhoras-hombrebaja en $122.04 las ganancias. Se pueden llevar a cabo cálculos similaresso- bre los otros recursos, para obtener: Ap2 = $ 63.24 A% = $-67.70 AP4 = $ 77.78 De esta forma, un incrementode componentes 0' = 4 genera una mayor ganancia, seguida por el aumento en los metales 0'= 2). El análisis indi- ca tambiénque un incremento en losplásticos 0' = 3) genera pérdidas. El problema anterior es una variación del análisis general sobre eco- nomíaconocidocorno modelo de entrada-salida. Este ejemplo, difiere de la aplicación clásica de esta técnica enla cuantificación de transferen- cia de materialentre los sectores dela economía. Sin embargo, el USO de la matriz inversa profundiza en interacciones complejas de sistemasli- neales y es muy representativo del proceso del modelo de entrada-salida.
  • 282. CASOS DELAPARTE: ECUACIONES ALGEBRAICASLINEALES 283 Como tal, ayuda a ilustrar cómo los métodos numéricos aumentanla com- prensión al manejarsistemasacoplados muy grandes. CASO 9.2 CALCULO DEDISTRIBUCIóNDETEMPERATURAS (INGENIERíA QUíMICA) Antecedentes: la mayorpartedelosdiferentescamposde la ingeniería manejan distribuciones de temperatura en materiales sólidos. Estos pro- blemas son tan variadoscomo la distribuciónde temperaturaen un cono de proareentrante y la temperatura de un río bajo una planta de energía productora de hielo. La distribución de temperatura en estadoestaciona- riobidimensional se defineporlaecuación de Laplace: a2T a2T - + - = oax2 ay2 ~9.61 en donde Tes la temperaturay x y y son las coordenadas. Las derivadas de la ecuación (9.6)se aproximan usando diferencias finitas(véasela sec- ción 3.5.4).La figura9.1 muestra una malla bidimensional,esquema útil enlas aproximaciones desarrolladas para la ecuación (9.6). Las aproxi- macionespordiferenciasdivididas de lasderivadas son: aT AT ?;+l,j - T.,- =" - dxAxAx y de manerasimilar, En seguida,suponiendo que A x = A y, la ecuación de Laplace se pue- deaproximar como: T +1,j + T - I,, + T,j+ 1 + T,j- 1 - 4T,j = O P .71 lacual es aplicable a cada nodo i , j de lafigura 9.1. Parece serque al aplicar la ecuación (9.7) a cadanodoresulta un sistema de ecuaciones acopladas, ya que la temperatura envarias posiciones aparece enmás deuna ecuación. Esto produce un sistemade ecuaciones algebraicas li- neales simultáneas, que se puedenresolverusando los métodos descri- tos en los capítulos 7 y 8. Considérese la placa plana de lafigura 9.2 Los lados de la placa se mantienen a temperaturasconstantesde O" y loooC, como se muestra
  • 283. 284 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA 9.1 Malla bidimensional que se usa enel desarrollo de aproximaciones por diferencias finitas dela temperatura sobre una placa plana. FIGURA 9.2 Placaplana en donde se mantienen los iodos a temperaturas constantes de O' y 100°C, como se indica en lafigura.
  • 284. CASOS DE LAPARTE TRES: SISTEMASDE ECUACIONES ALGEBRAICASLINEALES 285 enla figura. La distribución de la temperatura dentro de la placa se pue- de aproximar en nueve puntos internos aplicando la ecuación de Lapla- ce en cada punto. Esto genera el siguiente conjunto de ecuaciones dado en notaciónmatricial: r - 4 1 0 1 0 0 0 0 0 1 - 4 1 0 1 0 0 0 0 0 1 - 4 0 0 1 0 0 0 1 0 0 - 4 1 0 1 0 0 o 1 o 1 - 4 1 o 1 o 0 0 1 0 1 - 4 0 0 1 0 0 0 1 0 0 - 4 1 0 0 0 0 0 1 0 1 - 4 1 L o o o o o 1 o 1 - 4 T2 IT3 I T 2 i I T22T23 ITH I -100 -100 -200 O O -100 O O -100 Solución: se observaque elsistemaresultante de ecuaciones es diago- nalmente dominantey, por lo tanto, compatible conel método de Gauss- Seidel delcapítulo 8. En este caso, se garantiza la convergencia ya que se satisface la ecuación (8.5).Se aseguratambiénexactitudyaque los errores de redondeo no son problema en el método de Gauss-Seidel. Usan- douna E , = 0.05% después de 13 iteraciones se obtienen los resultados siguientes: FIGURA 9.3 Distribución de la temperatura sobreunaplaca plana, calculadacon el método de Gauss-Seidel.
  • 285. 286 MÉTODOS NUMERICOSPARAINGENIEROS Los resultados se muestran en la figura 9.3. La simulaciónse lleva a cabocon el método estándarde Gauss-Seidel. Debido a que estesistema es convergente,la relajación puede servir para acelerar la convergencia.Por lotanto, serepiten dos veces más los cálculos, usando X = 1.25 y X = 1.5. Los resultados, que se grafican en la figura 9.4, sugieren un valor de X en la vecindad de 1.25.Usando las técnicas descritas en el capitulo 11 (nótese que se puedeusar un bosquejo para obtener un valor aproxima- do),se ajusta una ecuación cuadrática alos puntos dela figura (9.4).Esta ecuación es: n = 96A2 - 236A + 153 en donde n es el número deiteraciones correspondiente aun valor parti- cular de X. Se puededeterminar un mínimo derivandola ecuación y ob- teniendo: FIGURA 9.4 Gráfica delnúmero de iteracionescontra X,elcoeficiente de relajación. Los trespuntos proporcionados como datos sugieren un número mínimo de iteraciones en la vecin- dad de X = 1.25. Ajustando una parábola a los datos, se puede calcular que el nú- mero mínimo de iteraciones corresponde al valor de X = 1.23.
  • 286. CASOSDE TRES: SISTEMASDEECUACIONESALGEBRAICASLINEALES 287 dn dA " - 192A - 236 Elmínimo se encuentra cuando dn / dh es cero, locualllevaalpunto donde la pendiente de lafigura 9.4 es nula. En este caso, se determina un valor de h = 1.23Volviendo a realizar los cálculos con estecoeficien- tederelajación se obtiene la soluciónensólo ocho iteraciones. De esta forma, si se van a realizarmáscálculosparaesteproblema en particular, se debeemplearunavalorde h = 1.2 para alcanzar los resultados más eficientes.En este caso, el ahorro de tiem- po en un solo cálculo es despreciable. Sinembargo,en la simulación múl- tiple de sistemasgrandes, la elección acertada deh posiblemente redituará ahorrossustanciales. Este tipo de procedimientose puede extendera problemas máscom- plejos queincluyen esquemas geométricos irregulares. Los problemas prác- ticos de este tipo requieren algunas capacidades de cálculo automáticas, pero, excepto en casos desistemasextremadamente grandes, una mi- crocomputadorallenarátodoslosrequisitos. CASO 9.3 ANALISIS DE UNA ARMADURA ESTATICAMENTE DETERMINADA (INGENIERíA CIVIL) Antecedentes: un problemadeimportanciaeningenieríaestructural es el de encontrar las fuerzas y reacciones asociadas con una armadura es- táticamente determinada. La figura 9.5 muestra un ejemplo de tales ar- maduras. FIGURA 9.5 Fuerzas que actuánsobreunaarmadura estáticarnente determinada.
  • 287. 288 MÉTODOS NUMÉRICOS PARAINGENIEROS Las fuerzas ( F ) representan ya sea las tensiones o lascompresiones de los elementos dela estructura. Las reacciones externas (H2V2 V,) sonfuerzasquecaracterizan cómo interacciona la armaduracon la su- perficie quela soporta. El gozne del nodo2 puede transmitir fuerzas hori- zontalesy verticalesa la superficie, mientras queel rodillo del nodo 3 sólo transmite fuerzas verticales. Se observa que el efecto de la carga externa de 1 O00 kg se distribuye a todos los elementos de la armadura. Solución: este tipodeestructuras se puedendescribir como un sistema de ecuaciones algebraicaslineales acopladas. En la figura 9.6 se mues- tran los diagramas de cuerpo libre sobre cada nodo. La suma de las fuer- zasenlas direccionesvertical y horizontaldebeser cero en cada nodo, ya que el sistema se encuentra en reposo. Por lo tanto, para el nodo 1: XFV= O = -Flsen 30" - F3sen60" + F1," P.91 para el nodo 2: XFv= O = Flsen 30" + Fz,u + VZ [9.11] para el nodo 3: XFv = O = F3sen 60" + F3,"+ V3 [9.13] FIGURA 9.6 Diagramas de cuerpo libre en los nodos de laarmadura estáticamente determinada.
  • 288. CASOSDE TRES: SISTEMASDEECUACIONESALGEBRAICASLINEALES 289 en donde Fj,hes la fuerza horizontal externa aplicada al nodo i (una fuer- za positivava de izquierda a derecha) y F;,"es lafuerzavertical externa aplicada al nodo i (unafuerzapositivavadearriba hacia abajo). De esta manera, en este problema, la fuerza hacia abajo de 1 O00 kg sobre el no- do 1corresponde a F,," = - 1000. En este caso lasfuerzasrestantes Fj,v,F;,hson cero. Nótese que la dirección de las fuerzas y reacciones inter- nas son desconocidas. La aplicación correcta de la segunda ley de New- tonrequiereGnicamentequelassuposicionesrelacionadasconlas direcciones sean consistentes. Si las direccionesno se toman correctamente, entonces la solución será negativa. También nótese que en este proble- malasfuerzasde todoslos elementos se suponequeestán entensión y que actúan jalando a lavez a los nodos adyacentes. Este problema se puedeescribir como el siguientesistemadeseis ecuaciones conseis in- cógnitas: - 0.866 O -0.5 O 0 0 0.5 O 0.866 O O O -0.866 -1 O -1 o o -0.5 O 0 o -1 o O 1 0.5 O 0 0 O O -0.866 O O -1 Nótese que, como seformulaenla ecuación (9.14), i O - -1000 - 0 o- E9.141 J parcial para evitar divisiones porcero sobre loselementos de la diagonal. Empleando una estrategia de pivoteo, el sistema se puede resolver usan- dolas técnicas de eliminación analizadas en los capítulos 7 y 8. Sin em- bargo, debido a queesteproblemaes un caso deestudioidealpara demostrar la utilidad de la matriz inversa, seusa el método de Gauss-Jordan para obtener: y lamatrizinversa es: [A]-1 = 0.866 0.5 O 0 0 0 0.25 -0.433 O O 1 O -0.5 0.866 O O O O -1 O -1 o -1 o -0.433 -0.25 O -1 O O 0.433-0.75 O O O -1 se requiere-pivote0 Ahora, supóngase que el vector de términos independientes representa las fuerzas horizontalesy verticales aplicadas externamentea cada nodo, como:
  • 289. 290 MÉTODOS NUMÉRICOS PARAINGENIEROS Debido aque las fuerzas externas no tienen efecto sobrela matriz de coe- ficientes, el método de Gauss-Jordan no senecesita implementar una y otra vez para analizar el efecto de las fuerzas externas diferentes sobre la ar- madura. Envez de esto, todo lo que se tiene que hacer es multiplicar la matriz inversa por cada uno delos vectores de términos independien- tes para obtener soluciones alternativas diferentes. Por ejemplo, podría desearse estudiar el efecto de las fuerzas horizontales producidas por el viento que sopla de izquierda a derecha. Si la fuerza eólica se puede re- presentar como dos fuerzas puntuales de 1O00 kg cada una sobre los nodos 1y 2 (Fig.9.7),entonces el vector de términos independientes es: [Vector de términos independiente^]^ = [1O00 O 1 O00 O O O] que se puede multiplicar por lamatriz inversa para dar: Fl = 866 F 2 = 250 F3 = -500 H* = -2000 v2 = -433 v. = 433 Para un viento de derecha, Fj,h = -1 000, F3,h = -1000, y todas las demás fuerzas externas son cero, resultando: FI = -866 F2 = -1250 F3 500 H, = 2000 v, = 433 v, = -433 Losresultados indican que los vientos han tenido marcados efectos dife- rentes sobre la estructura. Ambos casos se muestran en la figura 9.7. Los elementos individuales de la matriz invertida tienen también utilidad directa en el esclarecimientode las interacciones carga-respuestade la es- tructura. Cada uno de los elementos representa el cambio de una de las variables hacia un cambio unitario de uno de las cargas externas.Por ejem- plo, e] elemento aG1 indica que la tercera incógnita F3) cambiará 0.866 "~ FIGURA 9.7 Dos casos de carga que muestran a) vientos de izquierda y b) vientos dederecha.
  • 290. CASOSDEASES 291 debido a la carga unitaria de la segunda carga externa F1,”).De esta for- ma, sila cargaverticalenelprimernodo se aumenta en uno, entonces F3se incrementa en 0.866. El hecho de que los elementos sean cero in- dica que ciertas incógnitaspermanecen inalteradas por alguna de lascar- gas externas. Por ejemplo, a = O significaque F, nosealterapor cambiosen FZ,h.Estahabilidaddeaislar interacciones tiene unacantidad deaplicaciones enla ingenieríaincluyendo la identificacióndeaquellos componentes que son más sensibles a las cargas externas y, por lo tanto estánmáspropensos a lafalla. El planteamiento anterior vienea ser particularmente útil cuando se apli- ca a estructuras complejas. Enla práctica de la ingenieria puede necesi- tarse la solución de estructuras con cientos o talvezmiles de elementos estructurales. Las ecuacioneslineales son una herramienta útil enla com- prensióndelcomportamiento de estasestructuras. CASO 9.4 CORRIENTESY VOLTAJESENCIRCUITOSRESISTIVOS (INGENIERíA ELÉCTRICA) Antecedentes: un problema comúnen la ingeniería eléctrica es aquel que implicala determinación de corrientes y voltajes envarias posiciones de ley de corriente de Kirchhoffy laley de Ohm. La ley de la corriente dice que la sumaalgebraicadetodaslascorrientessobre un nododebeser cero (Fig. 9.8a), o il Nodo i, circuitos complejos deresistencias. Estos problemas se resuelvencon la ” I . ‘2 Cik = O [9.16] endondetodaslascorrientesqueentran al nodo tienen signo positivo. a) Y Rif 1: LaleydeOhmdice que la corriente a travésdeunaresistenciaestá .”.,‘ ’ ” , * - dada enfuncióndelcambio de voltaje y de la resistencia (Fig. 9.8b), ‘i/ b) FIGURA 9.8 Represen- tación esquemáticade la a)leyde la corrientede Kirchhoff y b)leyde Ohm. 3 R = l O R 2 R = 5 R v, = 200 v R = 5 nO R & = o v R = l 5 R R = 2 0 R 6 [9.17] FIGURA 9.9 Solucióndelcircuito deuna resistencia usando ecuaciones algebraicas linealessirnul- táneas.
  • 291. 292 MÉTODOS NUMÉRICOSPARA INGENIEROS 3 2 1 154 '65 c- -4 5 6 FIGURA 9.10 Direccionesen las cuales se supone quecircula la corriente. Solución: los problemas de este tipo generan sistemas de ecuaciones al- gebraicas lineales simultáneasya quelosciclosdentro de un circuito es- tán acoplados conlos otros. Porejemplo, considérese el circuito mostrado en la figura 9.9. Se desconoce la magnitud y la dirección de las corrientes asociadas con este circuito. Esto no presenta gran dificultad ya que sim- plemente se supone una dirección para cada corriente. Si la solución re- sultante de laley de Kirchhoff es negativa, entonces la dirección dada es incorrecta. Por ejemplo, lafigura 9.10 muestralas corrientes supuestas. Dadas estas ecuaciones, las cuatro ecuaciones de las corrientes para cada nodoestándadas por: iI2 + + = O i&- is2 - i.54 = o i43 - i32 = o i54 - i43 = O y lasseis ecuaciones delvoltaje como: 200 - v, . v 5 - v4 . v5 - v,= 5 154 - 15 152 = - 10 en donde la corriente fluye del voltaje más alto almás bajo. Estas ecua- ciones sonequivalentes a la siguientenotaciónmatricial: 1 1 0 0 0 1 0 0 0 0 o o 0 - 1 1 - 1 o o o o 0 - 1 1 0 0 0 0 0 0 0 0 0 - 1 1 0 0 0 0 0 0 0 1 0 o O 0 o 1 - 1 o o 5 0 0 0 0 0 1 0 0 0 0 0 5 0 0 0 0 1 - 1 0 O O 0 1 5 0 O 0 O 1 - 1 0 0 0 0 2 0 0 0 0 0 1 o o o O 0 1 0 1 o 0 - 1 I O O O O = o ZOO O O O O
  • 292. CASOSDE 293 V = 153.85 i’=169.23 V = 200 : c 8 li = 146.15 I/= 123.08 V = O FIGURA 9.11 Solución de voltajes y corrientesobtenidos usando un método de eliminación. que representa un sistema de 10 ecuaciones con 10 incógnitas. Aunque es impráctico resolver este sistemaa mano, se puede resolver fácilmente usando un métododeeliminacióntal como la eliminacióngaussiana o el métodode Gauss-Jordan. De esta manera, la solución es: i12 = 6.153 8 ¡a = -6.153 8 V4 = 146.15 ¡32 = -1.538 5 i52 = -4.615 4 V, = 123.08 iS4 = -1.538 5 V3 = 153.85 i43 = - 1.538 5 V2 = 169.23 Por lo tanto, con una interpretación apropiadade los signos en los resul- tados, lafigura 9.11 muestralascorrientes y los voltajesenelcircuito. Evidentemente se obtendríanmayoresventajas si se usaranalgoritmos numéricos y microcornputadoras en esteproblema. CASO 9.5 DINÁMICA DE PARTíCULAS Y CUERPOS RíGIDOS FIGURA 9.12 Tres bloques conectados por cuerdos de pe- so despreciable sobreun plano inclinado. (INGENIERíA MECANICA) Antecedentes: la dinámica del movimiento de partículasy de los cuerpos rígidos juega un papel muy importante en muchos problemasde mecáni- ca y otros campos de la ingeniería.Estemovimiento se puededescribir mediante las leyes de Newton. La aplicación de las leyesde Newton para partículas simplesgenera dos ecuaciones. Sin embargo, si algunas partí- culas del sistema afectana otras, entonces se puede generar un gran nú- merode ecuaciones simultáneas. Por ejemplo, considérese el sistema mostrado en la figura 9.12. Hay tres bloques atados por una cuerdade peso despreciable apoyados sobre unasuperficielisainclinada45O respecto a lahorizontal.El coeficiente de fricción entre el plano y la masa de 100 kg es de 0.25 y entre las ma- sas de 50 y 20 kg es de 0.375. Solución: en la figura 9.13 se muestran los diagramasde cuerpo libre de los tres bloques. Las unidades de las fuerzas son newtons (kilogramos por
  • 293. 294 MÉTODOS NUMÉRICOS PARA INGENIEROS T R 100 X 9.8 = 980 50 x 9.8 = 490 20 X 9.8 = 196 FIGURA 9.13 Diagramas de cuerpo libre para los bloques sobre un planoinclinado. metro por segundo al cuadrado), m es la masa en kilogramos y a es la aceleración en metros por segundo al cuadrado.Sumando fuerzas en direcciónparalela al plano y usando la segunda ley de Newton (F = ma), 692.96 - 173.24 - T = lOOa 346.48 - 129.93 + T - R = 50a 138.59 - 51.97 + R = 2 0 ~ o. en forma matricial: Resolviendo este sistemacon eliminación gaussiana, se obtiene: a = 4.840 5 m/s2 T = 36.667 1N R = 10.190 6 N El expresar las ecuaciones del movimiento enforma matricial es un planteamientogeneral y adaptableparaproblemas de este tipo. Aunque el problema que se resolvió aquí fue fácil, el caso de estudio sirve para ilustrar el planteamientogeneral e inspirar, al menoseso se espera. las aplicaciones a problemasmás difíciles. Cuando se jun- tan con un métodonumérico y unamicrocomputadora, son una herramientamuy útil quesepuede usaren una granvariedad de problemascomplejos.
  • 294. CASOSDE DE ECUACIONESALGEBRAICASLINEALES 295 PROBLEMAS Ingenieríaen general 9.1 Repítanse los cálculos del caso 9.1 usando los programas propios. 9.2 Efectúense los mismos cálculos del caso 9.1, cambiando los totales de horas- hombre, metales, plásticos y componentes a 856 h,3 050 kg, 1450 kg y 948 unidades respectivamente. 9.3 Un ingenierosupervisala producción de trestipos de automóviles. Se requieren tres clases de materiales "metal, plástico y caucho- para la producción. La cantidad necesaria para producir cada automóvil es de Auto- Metalr Plirtiro, Cauchor móvil kglauto kglauto kglauto 1 1500 25 1O0 2 1700 33 120 3 1900 42 160 Si se dispone de un totalde 106 toneladas de metal, 2.17 toneladas de pltistico y 8.2toneladas de caucho diariamente, ¿cuántos automóvilesse pueden producir pordía?. 9.4 Un ingeniero requiere 4 800 m3 de arena, 5 810 m3 de gravafina y 5 690 m3 de gravagruesapara la construcción de un proyecto. Existentres bancos donde se pueden obtener estos materiales. La composición en cada banco es de: ~~~ Banco Arena Grava fina, Grava TO 010 010 gruesa O/o banco 1 52 30 banco 2 2050 banco 3 2520 18 30 55 ¿Cuántos metros cúbicos se debe tomar de cada banco para cumplir con lasnecesi- dades del ingeniero? Ingenieríaquímica 9.5 Repítanse los cálculos del caso 9.2 con los programas propios. 9.6 Efectúense los mismos cálculos del caso 9.2 cambiando la temperatura de la pared a 200°C.
  • 295. 296 MÉTODOS NUMÉRICOS PARAINGENIEROS 9.7 Usando elmismo planteamientodel caso 9.2,calcúlese ladistribución de tempera- tura en una varilla calentada en ambos extremos, como se muestra en la figura P9.7. Aplíquese la formaunidimensionalde la ecuación (9.6): d2T dx2 -__-- 0 en donde x es la distancia a lo largo de lavarilla. Grafíquese Tcontra x. FIGURA P9.7 Una varilla unidimensional se mantieneoislado a una temperaturaconstante en sus extremos. Los puntos indican las posiciones en donde debe aplicarse la forma unidi- mensional de la ecuaciól (9.6)para calcular la distribución de la temperatura a lo largo de la varilla. 9.8 Repítase el problema 9.7 incluyendounapérdida de caloren la ecuación: en donde r es el coeficiente depérdidade calor, igual a 0.01 cm -’y lalongitud de lavarilla es de 10 cm. Grafiquese T contra x. 9.9 La figura P9.9 muestratres reactores ligados por tubos.Como se puede ver. la ve- locidadde transferencia desustanciasquímicas a través de los tubos es igual a la velocidad de flujo (Q,conunidades de metroscúbicospor segundo) mul~iplicada por la concentración del reactor del cual surge el flujo (c. con unidades de miligra- mos por metro cúbico). Si el sistema es estacionario, la transferencia en cada reac- tor balancea la transferencia de salida. Por ejemplo. enel reactor 1. (entrada) = (salida), o: 500 + Q21C2 = Q12C1 + Q 1 3 ~ 1 o, usando las velocidades de flujo especificadas como en lafigura € 9 . 9 : 500 + 2 0 ~ 2= 8 0 ~ 1+ 4 0 ~ 1 en donde 500 es una entrada directa (miligramospor segundo). Desarróllenseecua- ciones de balance de masas comparables para cada unode los otros reactores y resuélvanse las tres ecuaciones algebraicas lineales simultáneas para la concentra- ciónen los reactores.
  • 296. CASOSDE LA PARTETRES:SISTEMASDE ECUACIONES ALGEBRAICASLINEALES 297 FIGURA P9.9 Tres reactoresligadosportubos. La velocidad de transferenciade masa a lo largo de cada tubo esigual al producto del fluio Q y la concentración c del reactor donde se origina el fluio. 9.10 Empleando el mismo planteamiento básico del problema 9.9, determínese la con- centración de cloruro en cada uno de los Grandes Lagos con la información de la figura P9.10. Ingeniería civil 9.11 Repítanse los cálculos del caso 9.3 con los programaspropios.
  • 297. 298 MÉTODOS NUMÉRICOS PARA INGENIEROS 9.12 Efectúense los mismos cálculos del caso 9.3cambiando el ángulo del nodo 2 a 40° y eldel nodo 3 a 55”. I I i 9.13 Efectúense los mismosdálculosdel caso 9.3,con la estructura mostrada en la figu- 45 45 ra P9.13. ..~.”. . IP 9.14 Efectúense los mismos cálculos del caso 9.3,con la estructura de lafigura P9.14. FIGURAP9.13. 500180 FIGURAP9.14. Ingeniería eléctrica 9.15 Repítanse los cálculos del caso 9.4,usando losprogramas propios. 9.16 Efectúense los mismoscálculosdel caso 9.4,cambiando la resistencia entre los no dos 3 y 4 a 15 Q y cambiando el voltaje V6 a 50 V. 9.17 Efectúense los mismoscálculosdel caso 9.4.con el circuitomostradoen la figura P9.17. FIGURA P9.18.
  • 298. CASOS DELAARTE ECUACIONES ALGEBRAICASLINEALES 299 Ingenieríamecánica 9.19 9.20 9.21 9.22 9.23 Repítanse los cálculos del caso 9.5, usando los programas propios. Efectúense los mismos cálculos del caso 9.5, cambiando el ángulo a 55O respecto a la horizontal. Efectúense los mismos cálculos del caso 9.5, cambiando el coeficiente de fricción de la masa de 100 kg a 0.5 y el de las masas de 50 y 25 kg a 0.25. Efectúense los mismoscálculosdel caso 9.5, cambiando las masas de 100, 50 y 20 kg a 45, 20 y 80 kg, respectivamente. Efectúense los mismos cálculos del caso 9.5, para el sistema mostrado en la figura P9.23. 9.24 Efectúense los mismos cálculos del caso 9.5, con elsistemamostradoen 13 figura P9.24. (los ángulosson de 45'). 9.25 Léanse todos los casos del capítulo 9. En base a la lectura y a la experiencia elabó- rense los propios casos en cualquier campo de la ingeniería. Esto puede implicar modificar o reexpresar alguno de ellos; sin embargo, pueden ser también totalmen- te originales. Como los ejemplos de este libro, se deben inspirar en el contexto de la ingeniería y se debe demostrar el uso de los métodos numéricos para solucionar sistemas de ecuaciones algebraicas lineales. Escríbanse los resultados usando los casos de este capítulo como modelos. FIGURA P9.24.
  • 299. EP[LOGO: PARTE Ill 111.4 ELEMENTOS DE JUICIO En el cuadro 111.2 semuestraunresumen de los ele- mentos de juicio implicados en la solución de ecuacio- nes algebraicas lineales simultáneas.Hay tres métodos; gráfico, regla deCramer y manipulación algebraica que están limitadas a pocas ecuaciones (n I3) y por lo tanto tienen poca utilidad práctica en la solución de problemas. Sin embargo, estas técnicas son herramien- tasdidácticasmuyútilesen la comprensióndelcom- portamientodesistemaslinealesen general. Los métodos numéricos mismos se dividen en dos cate- gorías generales: métodos exactos y métodos aproxi- mados. Como su nombre lo indica, los primeros obtienensolucionesexactas. Sin embargo, ya que se venafectados por los erroresde redondeo, en algu- nas ocasiones ofrecen resultados erróneos. La magni- tud del error de redondeo varía de sistema a sistema y dependede unaserie de factores. Estos incluyen las dimensiones del sistema, su condición y si la matriz de coeficientes es dispersa o completa. Además, la preci- sión de la computadora influyeenel error de redon- deo. En general,se escogen los métodos exactos para resolverpocasecuaciones(estoes,aquellossistemas menores de 50 ecuaciones). Se usancomúnmente dos métodos; la eliminación gaussiana y el método de Gaus-Jordan. Se recomien- da emplearlaestrategia de pivote0encualquier implementaciónque se haga de estosmétodossobre unacomputadora. Con la ayuda de estaestrategia, los errores de redondeo disminuyen y se evitan pro- blemas como la divisiónpor cero. Aunque en todos los demássentidossoniguales,laeliminacióngaussiana es preferible a Gauss-Jordan,ya que la primera esun 50% más rápida. Sin embargo, elmétodo de Gauss- Jordan sigue siendo útil ya que se puede modificar un poco de manera quese pueda obtener la matriz inver- sa como beneficio adicional enlos cálculos. Aunque los métodos de eliminación tienen una granuti- lidad, eluso de toda lamatrizdecoeficientespuede ser un factor lirnitante cuandose trata de sistemas muy grandes y dispersos. Esto se debe a que grandes por- ciones de memoriaen la computadora deben almace- nar ceros sin sentido. Para sistemas en formade banda, existen métodos disponiblespara la implementación de la eliminación gaussiana sin tener que almacenar la ma- triz de coeficientes completa. En el recuadro7.2 sedes-
  • 300. 302 MÉTODOS NUMÉRICOS PARA INGENIEROS U C Cc.- E.-J m
  • 301. EPíLOGO PARTE Ill 303 U O o U e, i 2 O u) " N O u) O O O - a, a, o ?ul VI 3 s
  • 302. 304 MÉTODOS NUMÉRICOS PARA INGENIEROS cribe un algoritmo muy simple para llevar a cabo lo anterior en sistemas es- peciales con forma de banda; el caso tridiagonal. AI método que se describe en este libro se le conoce con el nombre de Gauss- Seidel. Es diferente del método exacto en cuanto a que éste emplea un es- quema iterativo en la obtención progresiva de aproximaciones más cerca- nas a la solución. Por lo tanto, el efecto del redondeo es un punto discutible dentro del método de Gauss-Seidel, ya que lasiteraciones se pueden pro- longar tanto como sea necesario para obtener la precisión deseada. Ade- más, la versión del método de Gauss-Seidel puede desarrollarse de manera que se pueda ahorrar espacio en memoria para sistemas dispersos. Por lo tanto, el método de Gauss-Seideles el método preferencial ensistemas gran- des de ecuaciones (loo),en donde los errores de redondeo y los requisi- tos dealmacenamientovienena ser un problemasignificativopara las técnicas exactas. LadesventajadelmétododeGauss-Seidel es que no siempre converge a la solución exacta o algunas veces lo hace de manera muy lenta. Unicamen- tees confiable para aquellos sistemas dominantes diagonalmente. Sin em- bargo, se dispone de los métodos de relajación que a veces ignoran estas restricciones. Además, ya que muchos sistemas algebraicos lineales origina- dos de problemas físicos muestran dominancia diagonal, el método de Gauss- Seideltienegranutilidadenlasolucióndeproblemasdeingeniería. Enresumen, se conjuntanunaseriedefactoresenlaseleccióndeuna técnica para resolver un problema en particular que involucre ecuaciones algebraicaslineales. Sin embargo,comoya se mencionó, el tamaño y ladispersióndelsistemasonfactoresparticularmenteimportantesal determinarlaelección. 111.5 RELACIONES Y FóRMULAS IMPORTANTES Cada una de laspartes de este libro contiene una sección que resume las fórmulas de mayor importancia. Aunque la parte Ill no menciona fórmulas simples, se ha usado el cuadro 111.3 para resumir los algoritmos que se han cubierto. La tabla proporciona una visión global que resulta útil en la revi- siónyenlaclarificaciónde las diferenciasprincipalesentre los métodos. 111.6 MÉTODOS AVANZADOS Y ALGUNAS REFERENCIAS ADICIONALES Los métodos de estetexto se han limitado a las técnicas más simples en la solucióndeecuacioneslinealessimultáneas.
  • 303. EPíLOGO PARTE 111 305 d II IIII * " * " s t fi -"_ "_ m N N I l l I -SN x- ,x- 8( 5 " & -
  • 304. 306 MÉTODOS NUMÉRICOS PARA INGENIEROS Existenotrosmgtodosque uscin elmismocontexto de los problemasasícomo también otros que tratan sobre valores propios y ecuaciones simultáneas no li- neales. Descomposición LU (Llamadotambién método de Cholesky o método de Crout) es una técnicaparticularmenteeficienteenlasolucióndealgunosproblemas que se hanmencionado enlaparte Ill. Se encuentranbuenasdescripciones y algoritmos de computadora para este método en James, Smith y Wolford (1 977) y Gerald y Wheatley (1984). Existenuna variedad de tkcnicas para determinar los valores propios. James, Smith y Wolford (1977); Gerald y Wheatley (1984)y Hornbeck (1975)propor- cionan una introducción al tema. El temasetrata más a fondo en Ralston y Ra- binowitz (1978); Householder (1964) y en Wilkonson (1965). Las ecuaciones simultáneas no lineales a veces se pueden resolver usan- do el método de Gauss-Seidel. Además, una versión multidimensional ofre- ceunesquema más eficiente, aunque más complicadodelmétodode Newton-Raphson. Enlos libros de Carnahan,Luther y Wilkes (1 969); Ge- rald y Wheatley ( 1 984) y James, Smith y Wolford (1977)se analizan los métodos. El libro de Ortega y Rheinboldt (1970)ofrece un trabajo muy completoacercadeltema. En resumen, la información anterior intenta introducir al lector en estu- diosposterioresmás profundos sobre el tema y áreas afines. En todas las referencias anteriores se proporcionan descripciones de las técnicas básicas de la parte Ill. Además, Ralston y Rabinowitz (1 978) proporcio- nan un análisis más profundo y en Stark (1970) se incluye un estudio de temas tales como el mal condicionamiento.El lector debe consultar estas fuentes alternativas para complementar el material de este libro y enri- quecer sus conocimientos sobreecuacionesalgebraicas lineales simul- táneas.* 'Aqui sólo se hace referenciaa los libros por autor; al finaldel texto se halla una bibliografía completa.
  • 305. ’ ! P A R T E C ~ J A T R O -AJUSTE DE CURVAS x IV.1 M O T I V A C I ~ N A menudo se proporcionan datosmediante .un conjunto de puntos discretos. Sin embargo, a ve- ces se requieren estimaciones de puntos entre esos valores discretos. Esta parte del libro describe al- gunas técnicas de ajuste de curvas de manera que con tales datos se obtengan aproximaciones inter- medias. Además, aveces se requiere una versión simplificada de una función muy complicada. Una manera de hacerloes la de calcular valores de la función en’un conjunto de valoresdiscretosa lo largo del rango deinterés. Después se puede ob- tener una función mas simple ajustando estos va- lores: A estas dos apticaciones seles conoce con el nombre de ajuste de curvas. Hay dos esquemas generales en el ajuste de cur- vas que se distinguen entre sí en base a la canti- dad deerrorasociadacon los datos.Primero, donde los datos muestran un grado significativo de’erroro “ruido”, la estrategia es derivar unacur- va simple que repre.senteel comportamiento ge- neral de los datos. Ya que cada punto in’dividual puede estar incorrecto, no es necesario intersec- ,tar cada punto individual puedeestar incorrecto, no es necesario intersectar cada uno de ellos. En vez de esto, la curva se diseña de tal manera que siga un patrón sobre los puntos tomados como un todo. A un procedimientode esta naturaleza se le conoce conel nombre de regresión con mínimos cuadrados (Fig. IV.la). Segundo, donde se conoce que los datos son muy exactos, el proceso es ajustar una curvao una se- rie de curvas que pasenexactamente por cadauno de los puntos. Estos datos generalmentese derivan de tablas. Algunos ejemplos son los valores de la densi- dad del agua y de la capacidad de calor delos gases como una funciónde latemperatura. A la estimación de valores entre puntos discretos conocidos sele co- noce con el nombre de interpolación(Fig.IV.l b y c).
  • 306. 308 ____- - MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA IV.l Tres intentos de ajustar la "mejor"curva a troves de los cinco dotos o) regresión con mínimos cuadrados, b) interpolación lineal y c) interpolación curvilínea. IV.l. l . Métodosde ajuste de curvas antes del uso dela microcomputadora El método más simple de ajustar una curva a unconjunto de datos esel de trazar los puntos y unirlos con una línea recta. Aunque esta es una alternativa válida y se utiliza cuando se requiere hacer esti- maciones rápidas, los resultados son dependientes,desde un punto de vista subjetivo,dela personaquetrazalacurva. Por ejemplo, en la figura IV.l se muestran diferentes trazos sobre un mismo conjunto de datos hechos por tres estudiantes. El primero no intenta conectar los puntos, en vez de eso caracteriza el crecimiento
  • 307. AJUSTE DE CURVAS 309 de los datosmedianteunalínearecta(Fig. IV.l .a). El segundo estudiante usó segmentos de línea recta o interpolación lineal en la conexión de los puntos (Fig. IV.l h ) . Esta técnica es muy común en ingeniería. Si los valores se acercan realmente al caso lineal y están espaciados muy cerca entre sí, entonces esta aproximación ofrece una estimación adecuada en muchos cálculos de ingeniería. Sin embargo, en donde la relación subyacente es altamente curvilínea o en donde los datos están muy separados entre sí, se pueden introducir errores significativos enla interpolación lineal.El tercer estudiante usó curvas que intentancapturar el comportamiento sugerido por los datos (Fig. IV.l c). Un cuarto o quinto estudiante desarrollaría un ajustediferente. Obviamente, la meta aquí es la de desarrollar métodos sistemáticos yobjetivos con el propósito de derivar tales curvas. IV.1.2 Ajuste decurvas en ingeniería El primer enfrentamiento del ingeniero con el ajuste de curvas pudo ser el de determinar un valor intermedio de datos contenidos en una tabla por ejemplo, de tablas de interés en la economía o de tablas de vapor en termodinámica. A lo largo de la profesión de un inge- niero, frecuentementese presentan ocasiones en las que se deben cal- cularvaloresintermediosde estas tablas. Aunque muchas de las fórmulas utilizadas ampliamente en ingeniería ya han sido tabuladas, existe otra gran cantidad delos que no tienen aplicación al hacerlas de esta forma. Los casos especiales y los pro- blemas nuevos de contexto requieren a menudo quese obtengan da- tos propios y que se desarrollenrelacionespredictivas,tambiér! propias. Se pueden encontrar, en general, dos tipos de aplicaciones cuando se ajustan datos experimentales: el análisis de tendencias y laprueba dehipótesis. El análisis de tendencias representa el proceso de usar el patrón de los datos y hacer predicciones. Para los casos en que los datos se mi- den con alta precisión, se pueden usar polinomios de interpolación. Los datos imprecisos, en general, se analizan con regresión de míni- mos cuadrados. El análisis de tendencias se puede usar para predecir o pronosticar valores de la variable dependiente. Esto a veces involucra extrapolar más allá de los límites de los datos observados o interpolar dentro del rango de datos. Generalmente,en todos los campos de la ingenieria se encuentra este tipo de problemas. Una segunda aplicación a la ingeniería del ajuste de curvas experi- mentales es la prueba de hipótesis. Aquí se compara un modelo ma- temático existente con los datos medidos. Si los coeficientes del mo-
  • 308. 310 MÉTODOS NUMÉRICOS PARAINGENIEROS delo se desconocen, a veces es necesario determinar valores que se ajusten mejor a los datos observados. Por el otro lado, si las estima- ciones de los coeficientes delmodelo se encuentran disponibles puede ser apropiado comparar los valores predecidos del modelo con los valores observados y así probar laeficiencia del método. A menudo, se comparan modelos alternos y se selecciona "el mejor" en base a observacionesempíricas. Además de las aplicaciones anteriores a la ingeniería,el ajuste de cur- vas es importante en otros métodos numéricostales como la integra- ción y la solución aproximada de ecuaciones diferenciales. Finalmente, los métodos de ajuste de curvas se pueden usar para derivar funcio- nessimples y aproximar funciones complicadas. IV.2 FUNDAMENTOS MATEMÁTICOS Los fundamentos matemáticos necesarios para la interpolación se en- cuentran en las expansiones de la serie de Taylor y diferencias dividi- das finitas introducidos en el capítulo 3. En la regresión con mínimos cuadrados se requieren conocimientos de estadística. Si el lector está familiarizado con los conceptos de media, desviación estándar, su- ma residualde cuadrados ydistribución normal, entonces puede omitir las siguentes paginas eir directamente a la secciónIV.3. Si no conoce estos conceptos o si necesita recordarlos, entonces se recomienda leer el siguientematerial comounabreveintroduccióna estos temas. IV.2.1 Estadísticasimple Supóngaseque enun curso de ingeniería se hacenvariasmedidas de una determinada cantidad. Por ejemplo, el cuadro IV.l contiene 24 lecturas del coeficiente de expansión térmica de un acero estruc- tural. AI observar estos valores, proporcionan una cantidad limitada de información, esto es, el rango de valores va desde un mínimo de CUADRO IV. 1 Coeficientes obtenidos al medir la expansión térmica de un acero estructural ( x 1O-6 pulg/pulg/°F) 6.495 6.625 6.635 6.655 6.665 6.51 5 6.625 6.775 6.755 6.61 5 6.575 6.555 6.565 6.435 6.395 6.655 6.595 6.71 5 6.485 6.605 6.505 6.555 6.71 5 6.685
  • 309. AJUSTE DE CURVAS 311 6.395 hasta un máximo de 6.775.Se puede profundizaren el conoci- miento de los mismos agrupando los datos en una o mas medidas es- tadísticas conocidas que proporcionen tanta información como sea posible acerca decaracterísticas específicasdel conjunto de datos.Estas medidas estadísticas descriptivas se seleccionan más a menudo para representar 1 ) la posición central de la distribución de datos y 2) el grado de dispersióndelconjunto dedatos. La medida estadística más común es la medida. La media (y)de una muestra se define como la suma de los datos individuales (y;)dividi- do en La por el númerodepuntos (n), o: .. . [IV.l] dondela sumatoria va desde i = 1 hasta n. medida mas común de la dispersión de una muestra es la desvia- ción estándar (sJ, enfunción de la media: [IV.2] I I en donde S es la suma total de los cuadros de los residuos entre los puntosy la media, esto es: S, = c (y, - [IV.3] Por lo tanto, si las medidas individuales se dispersan muy lejos de la media, S, (y, por lo tanto sy) crecerá. Si se agrupan muy cerca de la media entonces la desviación estándar será pequeña. La dispersión también se puede representar por el cuadrado de la desviación es- tándar,alacuál se le llamavarianza: [IV.4] Nótese que el denominador en ambos casos es n - l. Esto toma en consideración que un promedio derivado previamente de los datos (estoes, la media) se usó para determinar S,. Formalmente, se dice que se pierde un grado ¿e Iibedad. Otra justificación de dividir por n - 1 es que no hay dispersión en un solo dato. Por lo tanto, en el casodonde n = 1, laecuación (IV.4) proporciona unresultado sin sentido o infinito.
  • 310. 312 METODOS NUMERICOS PARA INGENIEROS Una medidaestadística final quetiene utilidad en la cuantificación de la dispersión de los datos es el coeficiente de variación (c. v). Esta me- dida estadística es el cociente de la desviación estándar dela media. Como tal, proporciona una media normalizada de la dispersión. A menudo se multiplica esta cantidad por 100, de tal manera que se pueda expresar en forma porcentual: [ ; IC.V. = = 100% [IV.5] Nóteseque elcoeficiente devariación essimilaralerrorrelativo porcen- tual (tu)mencionadoen la sección 3.3. Es decir, el cociente de una medida de error (S,,) entre una estimación del valor verdadero (a. EJEMPLO IV.l Tratamiento estadístico sencillo de una muestra Enunciadodelproblema: calcúlense lamedia,varianza,desvia- ción estándar y coeficiente de variación de los datos del cuadro IV.l. Solución: los datos se suman (cuadro IV.2) y los resultados se usan para calcular [Ec.(lV.l)]: - 158.400 24 = 6.6 Como enel cuadro IV.2, la suma de los cuadrados de los residuos es 0.217 00, que se puede usar en el calculo de la desviación están- dar [Ec.(lV.2)]: II sy = ,/T= 0.097 733 I 1 y la varianza[Ec.(lV.4)]: S’, = 0.009435 y los coeficientes de variación [Ec.(lV.S)]: C.V. =0.097 33100% = 1.47% 6.6
  • 311. AJUSTE DE CURVAS 313 Cuadro IV.2 Cálculos para la obtenciónde las medidas estadísticas e histogra- ma delas lecturas del coeficiente de expansión térznica INTERVALO Limite límite I Y; (Y; - 7,’ Frecuencia inferior Superior 6.395 6.435 6.485 6.495 6.505 6.515 6.555 6.555 6.565 6.575 6.595 6.605 6.615 6.625 6.625 6.635 6.655 6.655 6.665 6.685 6.715 6.715 6.755 6.775 6.36 6.40 6.40 6.44 0.042 025 0.027 225 0.013 225 0.011 025 0.009 025 0.007 225 0.002 025 0.001 225 0.000625 0.000025 0.000025 0.000225 0.000625 0.000625 0.001 225i0.003 025 0.003025 0.004 225 0.007 2251 6.48 6.524 6 7 8 2 3 6.52 6.56 6.56 6.60 9 10 11 12 13 14 15 16 17 18 19 20 5 6.60 6.64 3 6.64 6.68 21 22 23 0.013 225) 0.013 225 3 6.68 6.72 0.024 025 0.030 625 6.72 6.76 6.76 6.8024 z 158.400 0.217 O00 IV.2.2 La distribución normal La característica final que se menciona en este análisis es la distribu- ción de datos, es decir, elcomportamientoconelcual los datos se distribuyen alrededor de la media. Un histogrurnu proporciona una representación visual simplede ladistribución. Como el cuadro IV.2, un histograma se construye ordenando los datos en intervalos. Los intervalos se grafican sobre eleje ¿e las abscisas y la frecuencia de ocurrencia de estos se grafica en el eje de las ordenadas. Por lo tari- to, cinco de las medidas caen dentro del intervalo6.60 y 6.64. Como en la figuraIV.2, el histograma sugiere que la mayor parte delos da- tosse agrupan cerca de la media. Si se tiene un conjunto grande de datos, a menudo el histograma se transforma de un diagrama de barras en una curva suave. La curva
  • 312. 314 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA IV.2 Uso de un histograma para delinear la distribución de los datos. A medidaque el número de puntos aumenta, el histograma tiende a una curva uniforme y sin discon- tinuidades llamada distribución normal. simétrica y homogénea sobrepuesta a la figura IV.2 muestra una de estas curvas características; la distribución normal. Si se proporciona- ran medidas adicionales suficientes,entonces el histograma eneste caso en particular, tendería eventualmente a la distribución normal. los conceptos de media, desviación estándar, suma residual de cua- drados y distribuciónnormal tiene una gran importancia dentro de la ingeniería. Un ejemplo muy simple essu uso en lacuantificación de la confiabilidad que se le puede atribuir a un dato particular. Si unacantidad está distribuidanormalmente, el rangodefinidopor y -S, a y + S, abarcará aproximadamente el 68% del número to- tal de datos. De la misma manera, el rango definido por y - í's, a y + 2 S,, abarcará aproximadamente el 95% Por eiemplo,en los coeficientes de expansión térmica del cuadroIV.1 (y = 6.6 y S, 0.097 133),se puededecir que aproximadamente el 95% de los datos se encuentra entre 6,405 734 y 6.794 266. Si al- guien dijo que se midió un valor de 7.35, entonces se puede esperar que este dato sea erróneo. lo anterior es sólo un ejemplo muy simple de cómo se pueden usar las estadísticas para dar juicios acerca de la certeza de los datos. Es- tos conceptos también tienen importancia directaen el análisis de mo- delos de regresión. Se puede consultarcualquierlibro bdrsico de estadística (por ejemplo, Ang y Tang, 1975, o Laping, 1983) para ob- tener informaciónadicionalsobre el tema.
  • 313. AJUSTE DE CURVAS 315 IV.3 ORIENTACION Antes de pasar a los métodos numéricos en el ajuste de curvas, pue- de ser útil una orientación. Lo que sigue está enfocado a dar una vi- sión general del material analizado en la parte IV. Además, se han formulado algunos objetivos para ayudar al aprendizaje dellector cuando estudie el material.
  • 314. 316 MÉTODOS NUMÉRICOS PARAINGENIEROS IV.3.1 Avance y alcance En la figura IV.3 se muestra una visión global del material que se cu- bre en la parte IV. El capítulo 70 se dedica a la regresión con mínimos cuudrudos. Primero se aprenderá a ajustar “la mejor” línea recta a través de un conjunto de datos inciertos. A esta técnica se le conoce con el nombre deregresión lineal. Además del análisis sobreel cálcu- lo de la pendiente y punto de intersección de la línea recta, se pre- sentan también métodos cuantitativos y visuales para la evaluación delavalidezde los resultados. Además de ajustar una línea recta, se estudiatambién una técnica general paraajustar “al meior” polinomio. Por lo tanto, se aprende- rá a derivar un polinomio cuadrático, cúbicoo de orden superior que seajuste de manera adecuada a los datos inciertos. La regresión li- neal es unsubconjunto de este esquemamásgeneral, al cual se le conoce con el nombre de regresiónpolinornial. Finalmente, elúltimo tema cubierto enel capítulo 10 es la regresión lineal múltiple. Que está diseñada para casos en que la variable de- pendiente y sea una función lineal de dos o más variables indepen- dientes xl, x2, ..., x,. Este esquema tiene una utilidad especial en la evaluación de datos experimentales en donde la variable de interés depende deun conjunto de factores. En el capítulo 7 7 se describeunatécnicaalternativa de ajuste de curvas a laque se le llamainterpolación, Como se dijoante- riormente,lainterpolación se usa para estimularvaloresinterme- dios entredatosconocidos.En el capítulo 11 se derivanpolinomios que cumplen este propósito. Se introduce el conceptobásicode interpolaciónpolinominalusandorectas y parábolasparaconec- tarpuntos.Después, se desarrolla un procedimientogeneral para ajustar un polinomiode n-ésimo orden. Se presentandosformatos diferentes para expresar estos polinomios en forma de ecuaciones. Es preferible el primero de ellos,llamado polinornio de interpola- ción deNewton,cuando se desconoce el ordencorrectodelpoli- nomio. El segundo, llamado polinornio de interpolación de Lagrunge tiene algunasventajas cuando el ordendelpolinomio se conoce deantemano. La Última seccióndelcapítulo 11 se dedicaaunatécnica diferente en el ajuste preciso de datos. Esta técnica, llamada interpolación seg- rnenturia (en inglés spline),ajusta los datos a polinomios pero porin- tervalos. De ahí que sea particularmente útil cuando se ajusten datos que en general son homogéneos,pero muestrancambioslocales abruptos.
  • 315. AJUSTE DE CURVAS 317 En el capitulo 72 se desarrollan casos de estudio que ilustran la utili- dad de los métodos numéricos dentro de contextos de la ingeniería. Se muestran algunos ejemplos tanto de la ingeniería en general co- mo de las cuatro ramas más importantes de la misma: química, civil, eléctricay mecánica. Finalmente, se incluye un epílogo al final de la parte IV. Este incluye un resumen de las fórmulas y conceptos más importantes relaciona- dos con elajuste de curvas, así como un análisis de los factores de mayor importanciaentre las técnicas y sugerenciaspara estudios pos- teriores. En la parte IV se incluyen algunas opciones de cálculo por computa- dora. Primero, el paquete de programas NUMERICOMPque acom- paña al texto contiene programas que son legibles al usuario sobre regresión lineal e interpolaciónde Lagrange. Alternativamente,se in- cluyen en el texto programas escritos en FORTRAN y en BASIC. Esto le proporciona al lector la oportunidad de copiar el programa para implementarlo en su propia microcomputadora o supercomputado- ra. También se incluyen los diagramas de fluio y los algoritmos para la mayor parte delos métodos descritos en el texto. Este materialpuede servir de base en la construcciór! de un paquete de programas que el lector puede desarrollar y aplicar a los problemas de ingeniería. IV.3.2 Metasy objetivos Objetivos de estudio. Después de terminar la parte IV, el lector debe haber aumentado en gran medida sus capacidades en el ajuste de cur- vas con datos. En general, se deben dominar lastécnicas, se debe haber aprendido a valorar la confiabilidad delas respuestas yser ca- paz de escoger el mejor método (o métodos) para cualquier proble- ma. Además de estas metas generales, se deben asimilar y dominar los conceptosespecíficos del cuadro IV.3. Objetivos decómputo. El lector debe tener un conjunto de progra- mas simples decomputadora, algoritmosy diagramasde flujo queimplementen los métodos analizados en laparte IV. Todos ellos comoherramientasdeaprendizaje. El paquete opcional de programas NUMERICOMP,incluye los pro- gramas de regresión lineal de interpolación de Lagrange. Las gráfi- cas asociadas con este paquete le ayudarán al lector a visualizar el problema además delas operaciones matemáticas asociadas. Las grá- ficas son una parte crítica en la apreciación sobre la validez de una regresión. También proporcionan una guía relacionada conel orden
  • 316. 318 MÉTODOS NUMfRICOS PARA INGENIEROS CUADRO IV.3 Objetivos deestudiosespecíficosde la parte IV 1 . Entender la diferencia fundamental entreregresión einterpolaciónydarse cuenta que elconfundirlos puedeacarrear serios problemas. 2. Entender la derivación de la regresión lineal con mínimos cuadradosy ser capaz devalorar la confiabilidad del ajuste usando gráficas a apreciaciones cuan- titativas. 3. Saber linealizar datos para llevara cabo transformaciones. 4. Entender lassituacionesen dónde es apropiado usar regresiónpolinomial 5. Entender que hay uno y sólo un polinomio de grado n o menor que pasa exac- 6. Saber como derivar el polinomiodeinterpolaciónde Newton de primer orden. 7. Entender laanalogía entreel polinomio de Newton y la expansión de la serie de Taylor y cómo se relacionancon el error de truncamiento. 8. Reconocer que las ecuaciones deNewton y de Lagrange sonmeramente formulaciones diferentesdelmismo polinomio de interpolación y de enten- der sus respectivasventajas y desventoias. 9. Observar que se obtienenresultadosmásexactos si los puntosusados para interpolación se centranalrededor y cerca de la incógnita. 10. Reconocer que los puntosnotienen porqué estarigualmente espaciados nienningún orden enparticular para los polinomios de Newton y de La- o múltiple. tamente a través de los R + 1 puntos. grange. utilidad. 1 1 Conocer el por qué las fórmulas de interpolación igualmente espaciados tienen 12. Reconocerlaslimitaciones y lasincertidumbresasociadas con la extrapolación. 13. Entender por quélasfuncionessegmentariastienenutilidad para datos con áreas locales de cambiossignificativos. correcto de una interpolación polinomialy si es confiable efectuar la extrapolación. El paquete es muy fácil de aplicarse en la solución de problemas prácticos y se puede usar en laverificación de los resulta- dos de cualquier programa que el lector haya desarrollado por sí mismo. Además, se incluyen los programas de computadora, los algoritmos o los diagramas de flujo para la mayor parte de los métodos de la parte IV. Esta información le permitirá ai lector expander su bibliote- ca de programas incluyendo técnicas que van más allá de la regre- sión lineal y de la interpolación de Lagrange. Por ejemplo, puedeser útil, desde un punto de vista profesional, tener un paquete de pro- gramas que incluya regresión polinomial, polinomio de interpolación de Newtone interpolación cúbicasegmentaria (delinglés cubic spline).
  • 317. C A P í T U L O D I E Z REGRESI~N CONMíNIMOS CUADRADOS Cuando se asocia un error sustancial con los datos, la interpolación poii- nomial es inapropiada y puede llevar a resultados no satisfactorioscuan- do se usaparapredecirvaloresintermedios. Los datosexperimentales a menudo son de este tipo. Por ejemplo, enlafigura 10. la se muestran siete datos obtenidos experimentalmente que muestran una variación sig- nificativa.Lainspecciónvisualde los datossugiereunarelaciónpositiva entre y y x. Es decir, la tendencia totalindicaque a valores mayores de y se le asocian valores mayores a x. Ahora, si se ajusta un polinomio in- terpolante desexto orden a estos datos (Fig. lO.lb), pasará exactamente por todos los puntos. Sin embargo, debido a la variabilidad de los datos, la curva oscila ampliamenteen los intervalos entre puntos. En particular, los valores interpolados x = 1.5 y x = 6.5 parecen ir más allá d e l rango sugeridopor los datos. Una estrategia más apropiada en estoscasos es la de obteneruna fun- ciónaproximada que ajuste “adecuadamente”el comportamiento o la tendencia general delos datos,sin coincidir necesariamente con cada punto en particular. La figura 10.ICmuestra una linearecta que puede usarseen la caracterización de latendencia delos datossin pasar sobreningún punto en particular. Unamanera de determinarlalínea de la figura 1 0 . 1 ~es inspeccio- narvisualmente los datosgraficados y luegotrazarla “mejor” línea a travésde los puntos.Aunque este enfoque recurre al sentidocomún Y esválidoparacálculos“asimplevista” es deficiente ya quees arbitrario. Es decir, a menos que los puntosdefinanunalínearecta perfecta (en cuyo caso la interpolaciónsería apropiada), cadaanalista trazarárectasdiferentes. Lamaneradequitarestasubjetividad es considerar un criterioque cuantifiquela suficiencia del ajuste. Una forma de hacerlo es obtener una curva que minimice la diferencia entre los datosy la curva. En este capí- tulo se analiza un métodoparallevar a cabo esteobjetivo al que se le llama regresión con minimos cuadrados.
  • 318. 320 MÉTODOS NUMÉRICOS PARA INGENIEROS FIGURA 1O. 1 a) Muestra de datos con un error significativo. b) Ajuste polinomial con oscilaciones que violan el rango de los datos, c) se obtienen resultados más satisfactorios usando el ajustedemínimos cuadrados.
  • 319. REGRESldN CON MíNIMOS CUADRADOS 321 10.1 REGRESIóNLINEAL Ei ejemplo más simple de una aproximación por mínimos cuadrados es el ajuste de una línea recta a un conjunto de parejas de datos observa- das: (x1,yl), (xp,y2), ...,(x,,,y,,). La expresión matemática de una línea rectaes: y = a0 + alx + E [10.1] en donde a. y al son coeficientes que representan la intersección con el eje de las abscisas y la pendiente, respectivamente y E es el error o resi- duo entre el modelo y las observaciones, que se puede representar reor- denando la ecuación (10.1)como: E = y - a0 - alx Por lo tanto, el error o residuo es la diferencia entre el valor real de y y el valor aproximado, a. + a, x, predichopor la ecuaciónlineal. 10.1.1 Criterio para un mejor” ajuste Una estrategia que obtiene la “mejor” línea a través de los puntos debe minimizar la suma de los errores residuales, como en: / / i=1 i=l [10.2] Sin embargo, estecriterio es inadecuado, como se puedever en la figura 10.2a, en donde semuestra la línea recta que ajusta dos puntos. Obvia- mente, la mejor línea ajustada esaquella que conecte ambos puntos. Sin embargo, cualquier línea que pasa por el punto medio de la línea que los conecta (excepto unalínea perfectamente vertical)genera un valor mí- nimo en la ecuación (10.2)igual a cero ya que los errores se cancelan. Otro criterio sería minimizar la suma de los valores absolutos de las diferencias,esto es: n n 1 6 1 = 2 I M - a0 - alxil i= 1 i= 1 En la figura 10.21se muestra por qué este criterio también es inadecua- do. Con los cuatro puntos mostrados, cualquier línea recta que se en- cuentre dentro de las líneas punteadas minimiza el valor absoluto de la suma. Por lo que estecriterio aún no produceel mejor ajusteque sea único. Una tercera estrategia en el ajuste de una línea óptima es el criterio de minimax. En este método, la línea se escoge de tal manera que mini- mice la distancia máxima a la que se encuentraun punto de la linea rec-
  • 320. 322 MbODOS NUMÉRICOS PARA INGENIEROS" FIGURA 10.2 Ejemplos de algunos de los criterios de "meior ajuste" que son inade- cuados en la regresión: a) minimización de la suma de los residuos; b) minimizaciónde la suma de los valores absolutosde los residuosy c) mi- nimización del error máximo de cualquier punto individual. ta.Comose muestra en lafigura lo.&, está estrategia está mal condicionada pararegresión ya que influye de maneraindebida sobre un punto externo, aislado,cuyoerror es muy grande. Se debe notar que el criterio minimax algunas veces estábien condicionado paraajustar una función simple a una función complicada (Carnahan, Luther y Wilkes, 1969). Una estrategia que ignora las restricciones anteriores es la de minimi- zar la suma delos cuadrados de los residuos, S,, de la siguiente manera: n n S, = 2E? = (yi- a0 - alxi)2 ¡=1 i=l E10.31
  • 321. REGRESIóN CON MíNIMOS CUADRADOS 323 Este criterio tiene muchasventajas, incluyendoel que ajusta una linea única a un conjunto dado de datos. Antes deanalizar estas propiedades, se mues- tra un métodoquedetermina los valoresde a. y al que minimizanla ecuación (10.3). 10.1.2 Ajuste deunarectautilizando mínimos cuadrados Paradeterminar los valoresdelas constantes a. y al, se derivala ecua- ción (10.3)conrespecto a cadaunodelos coeficientes: Nóteseque se hansimplificadolossímbolosdelasumatoria; a menos queotra cosa se indique,todaslassumatorias van desde i = 1 hasta n. Igualando estas derivadas a cero, se genera un mínimo S,. Si se hace así', las ecuaciones anteriores se expresarán cómo: Ahora, considerandoque C a. = nao,las ecuaciones se pueden expre- sar como un conjunto de dosecuaciones lineales simultáneas con dosin- cógnitas (aoy al): nao + C xial = yi [10.4] [10.5] A estas ecuaciones se les conoce como ecuaciones normales.Se pueden resolversimultáneamente y obtener [(recuérdese la Ec. 7.10)]: [10.6] Este resultado se puede usar junto conla ecuación (10.4)para obtener: en donde v y X sonlamedid¿+de lll__..... .". . . [10.7] y y x, respectivamente.
  • 322. 324 MÉTODOS NUMÉRICOS PARAINGENIEROS EJEMPLO 1O.1 Regresión lineal Enunciadodelprblema: ajústese unalínearecta a los valores x y y de lasprimeras doscolumnasdelcuadro 10.l. CUADRO 1O. 1 Cálculos para el análisis del error del ajuste lineal 1 0.5 8.5765 0.1687 2 2.5 0.8622 0.5625 3 2.0 2.0408 0.3473 4 4.0 0.3265 0.3265 5 3.5 0.0051 0.5896 6 6.0 6.6122 0.7972 7 5.5 4.2908 0.1993 c. 24 22.7143 2.9911 - Solución: sepuedencalcularlassiguientescantidades: n = 7 2 xjyj = 119.5 xf = 140 24 7 2yi = 24 J = - = 3.428 571 429 Usandolas ecuaciones (10.6)y (10.7), an = 3.428 S71 429 - 0.839 285 714(4) = 0.071428 57 Por lo tanto, el ajusteconmínimoscuadrados es: y = 0:071 428 57 + 0.839 285 7 1 4 ~ La línea, juntocon los datos, se muestra enla figura 10.1~.
  • 323. REGRESldN CON MíNIMOS CUADRADOS 325 10.1.3 Cuantificación del error enla regresión lineal Cualquier línea recta diferentea la que se calculó en el ejemplo 10.1 ge- nera una mayor suma de cuadradosde los residuos. Porlo tanto, la línea esúnica y en términosdelcriterioescogido es “la mejor” línea a través de los puntos. Se puede derivar un gran número de propiedades adicio- nales deeste ajuste, examinando más de cerca la manera como se calcu- laron los residuos. Recuérdese que la suma de los cuadrados se define como [Ec. (10.3)]: I S, = 2 (yi - a. - alxi)* 110.81 Nótese lasimilitud entre las ecuaciones (IV.3)y (10.8).Enelprimer caso, los residuos representabanla diferencia entrelos datosy una aproxi- mación simple de la medida de la tendencia central; la media. En la ecuación (10.8),los residuos representanel cuadrado dela distancia vertical entre los datos y otra medida de la tendencia central; la línea recta (Fig. 10.3). La analogía se puede extender más paracasos en donde 1) la dispersión de los puntos alrededorde la recta son de magnitud similar a lo largo del rango entero delosdatos y 2) ladistribución de estospuntosalrededor de la línea es normal. Se puede demostrar que si este criterio se cumple, la regresión con mínimos cuadrados proporciona la mejor(esdecir, la más probable) aproximación de a. y al (Draper y Smith, 1981). A esto se le conoce como principio de probabilidad máxima dentro de la estadística. Además, si este criterio se cumple, una “desviación estándar”de la línea deregresión se puededeterminar como [compárece conla Ec. (IV.2)]: i= 1 FIGURA 10.3 El residuo en la regresiónlinealrepresenta el cuadradode la distancia verticalentreunpunto y la línearecta.
  • 324. 326 M~TODOSNUM~RICOSPARA lNGENlEROS [10.9] en donde sy,x se llama error estándar de la aproximación.Lanotación consubíndice “y/x” indicaque el error es para un valorpredichode y correspondiente a un valorparticular de x. También, nótesequeahora ladivisión es por n - 2 ya que se usan dosaproximacionesobtenidas de los datos; a. y a, paracalcular S; por lo tanto, se han perdidodos grados de libertad.Como con el análisis de desviación estándar en lasec- ción IV.2.1,otrajustificaciónde dividir por n - 2 es que no existeuna “dispersión de los datos”alrededordeunalínearecta que conecta dos puntos.Deesta manera, para el caso cuando n = 2, la ecuación (10.9) noproporciona un valordeinfinitoelcual no tiene sentido. Así como con la desviación estándar,el error estándx de la aproxima- cióncuantifica ladispersión de los datos. Sin embargo, cuantificala dispersión alrededor de la linea de regresión, como se muestra en la figura 10.4, contrario a la desviaciónestándaroriginal, S, quecuantifica la dispersión alrededor de la media. Los conceptos anteriores se pueden emplear para cuantificarla “efi- ciencia”del ajuste. Esto es particularmente útil enla comparación de va- riasregresiones (véase la Fig. 10.5).Parahacerloseregresa a losdatos originalesy se determina la suma de los cuadrados alrededorde la media para la variable dependiente (en este caso,y). Se le puede llamar a esto
  • 325. REGRESldN CON MíNIMOS CUADRADOS 327 FIGURA 10.5 Ejemplos de la regresiónlinealcon a) erroresresidualespequeños y b) grandes. lasumatotalde los cuadrados, S,. Esta es lacantidad de dispersiónen la variable dependiente que existe antes de la regresión. Después de Ile- var a cabo la regresiónlineal, se puedecalcular S,, que es la5uma de los cuadradosde los residuos alrededorde la linea de regresión. Este pre- senta la dispersión que existe despuésde la regresión. La diferencia entre lasdos cantidades, o St - S, cuantifica la mejora enla reduccióndel error debidoal modelo de la línea recta. Esta diferenciase puede norma- lizar al errortotal y obtener: [10.10] endonde r es el coeficiente de correlación y r2 es el coeficiente de de- terminación. Para un ajuste perfecto, S, = O y r2 = l, indicando que la línearectaexplicael 100 % de lavariabilidad. Si r2 = O, entonces el ajustenorepresenta mejorías.
  • 326. 328 MhODOSNUMÉRICOS PARA INGENIEROS EJEMPLO 10.2 Estimación de los errores en el ajuste por mínimos cuadrados lineal Enunciadodelproblema:calcúlese la desviaciónestándar total, elerror estándar de la aproximación y el coeficiente decorrelación de los datos del ejemplo 10.1. Solución: lassumatorias se muestranenel cuadro 10.1. L.a desviación estándar total es [Ec.(IV.2)] y el errorestándar de la aproximaciónes IEc. (10.9)]: por lo tanto, ya que S , , < S,, el modeloderegresiónlineales acepta- ble. El alcance dela mejoríasecuantificamediante [Ec. (10.lO)l 22.714 3 - 2.991 1)-2 = 22.714 3 = 0.868 O r = = 0.932 Estos resultados indican que el 86.8% de laincertidumbreoriginal se ha explicadomediante el modelolineal. Antes de proceder con el programa de computadora parael método de regresión lineal, son necesarios algunos comentarios.Aunque el coe- ficiente de correlación proporcionaun medio fácil de medir la efectividad del ajuste, se debe tener cuidado de no atribuirle significado garantizado. El que r esté “cercano”a 1, no significa que el ajuste sea necesariamente “bueno”. Por ejemplo, es posible obtener un valorrelativamentealto de r cuando la relación mencionada entre y y x ni siquiera es lineal. Draper y Smith (1981) proporcionan una guía y material adicional que sirve para valorar los resultados de una regresión lineal. Además, como mínimo, se debe inspeccionar siempre una gráfica de los datos con una línea de re- gresión cuando se ajusten curvas de regresión. Como se verá en la siguien- te sección, los programasdeNUMERICOMPcontienenestas opciones. 10.1.4 Programadecomputadoraparalaregresión lineal Es relativamente sencillo desarrollarun programa parala regresión lineal. La figura 10.6 muestra las versiones en FORTRAN y BASIC. Ya que las opciones gráficasdeunamicrocomputadora
  • 327. REGRESION 329 FORTRAN BASIC DATA SX/O./,SU/O./,XZ/O./,XY/O./ 100 FORHAT (I5 120 Do 170 I=l,N 139 READ(5,2)X,Y 140 fOiWAT(2F10.0) 150 READ(5rl)N 110 9!=SX*X 160 sY=sv+Y I79 x2=X2+x~x 1BO sY=xY+x'Y 190 XY=SX/N CONTINUE 200 YM=SY/N 210 kl=(N~XY-SX~SY)/(N.X2-sX*Sx) 229 .?,O=YM-Al*XH 230 WRITE(6t3)AOrAl FORMAT(' *,2F10.3) STOP mn INPUT N FOR I = 1 TO N X = independentvariable INPUT X . Y Y = dependentvariable N = number of data points sx = sx + x SX = sum of X's SY = S Y + Y SY = sum of Y's x2 = x2 + x I x- X Y = X Y + X O Y X2 = sum of square of X's NEXT I __2_____ X Y = sum of product of X andY X t l = SX / N XM = meanof X's YM = SY / N A I = (N :X Y - sx t S Y ) (N m , YM=meanofY's x2 - sx :SX) PRINT ClO.61 END i A l = slope A0 = interceptA 0 = YM - Al I XH FIGURA 10.6 Programas FORTRAN y Basic para la regresión lineal. son muy variadas,no se incluyengráficasdeestosprogramas.Sin em- bargo, como se mencionó anteriormente,esta opción es importante para el uso e interpretación efectiva de la regresión y se incluye en el paquete suplementario de NUMERICOMP. Si la computadora que el lector usa, tiene la posibilidad de graficaciónse recomienda quese expandan los pro- gramas de tal manera quese incluya una gráfica dey contra x que mues- tre los datos y la línea de regresión. La inclusión de gráficas aumenta en gran medida la utilidad de los programas dentro delcontexto de solución deproblemas. EJEMPLO 10.3 Regresión lineal usando la computadora Enunciado del problema: el paquete de programas NUMERICOMP aso- ciado a este texto incluye un programa legibleal usuario que implementa la regresiónlineal.Esteprogrdmasepuedeusar enla solucióndelpro- blema de pruebadehipótesis asociado conelparacaidistaanalizadoen el capítulo 1.Se dio un modelo matemático teórico parala velocidad del paracaidistamediante la fórmula [Ec. (1.9)]:
  • 328. 330 MÉTODOS NUMÉRICOS PARA INGENIEROS en donde u es la velocidad en centímetros porsegundo,g es la constante de aceleración gravitacional de 980 cm/s’, m es la masa del paracaidis- ta e igual a 68 100 g , y c es el coeficiente defricción de 12 500 g/s. Co- mosedescribeenelejemplo l . l ,el modelopredice la velocidaddel paracaidista en función del tiempo.En el ejemplo2.1 se muestra una gráfica de lavariacióndelavelocidadenfuncióndel tiempo. Un modelo empírico para la velocidad del paracaidista está dado por la siguientefórmula: v(t) = [ ]t c 3.75 + t [E10.3.1] Supóngase quese desea probar y comparar la suficienciadeestos dos modelos matemáticos. Esto se puede llevara cabo midiendo la velo- cidad verdadera del paracaidista en intervalos detiempo conocidosy compa- rando los resultados con la velocidad predicha por cada uno de los modelos. Se tiene un grupodedatosmedidosexperimentalmente los que se listanenla columna a) delcuadro 10.2. Las velocidadescalculadas de cada modelo se listanenlas columnas b) y c). CUADRO 10.2 Velocidades medidas y velocidades calculadas para la caída del paracaidas Tiempo, S V Calculada, Medida V Calculada, cmls cmls [ecuación cmls [ecuación (1.9)] (E10.3.l)l ( 4 ( 4 ( 4 1 2 3 4 5 6 7 9 10 11 12 13 14 15 a 100 o 163 O 230 O 275 O 310 O 356 O 390 O 415 O 429 O 450 O 460 O 455 o 460 O 490 O 500 O 895.3 1 640.5 2260.7 2776.9 3 206.5 3 564.1 4109.5 4315.6 4 630.1 4749.0 4847.9 4 930.3 3861.7 4487.2 4998.8 1 124.0 1 857.0 2 372.9 2755.6 3 050.9 3 285.5 3 476.6 3 635.1 3 768.7 3981.6 4143.7 3 882.9 4067.8 4211.0 4 271.2 Solución: lavalidez de los modelos se puede probar graficando las velo- cidadesmedidascontra la velocidadcalculadapor el modelo. Se usala regresión lineal enel cálculo de lalínea recta y se gráfica. Esta línea ten-
  • 329. REGRESldN CON MíNIMOS CUADRADOS 331 FIGURA 10.7 a) Resultados obtenidos usando regresión lineal en la comparaciónde valores medidos contra el modelo teórico calculado mediante la ecua- ción (1.9). b) Resultados obtenidos usando regresión lineal en la comparación de valores medidos contra el modelo empírico calculado con la ecuación (E10.3.1). drá una pendiente de1 y una intersección en O siel modelo coincide con los datos perfectamente. Cualquierdesviaciónde estos valores se usará como indicación de ser poco confiableel modelo. Enlafigura 1 0 . 7 ~ ~se grafica lalínea y los datosde la regresiónde la columna a) contra las columnasb) y c) respectivamente. Estas graficas indican que la regresión lineal entre los datosy cada uno de los modelos es bastante aceptable. Ambosmodeloscoincidenconlosdatoscon un coeficientedecorrelaciónmayorde 0.99. Sin embargo, el modelo descrito por la ecuación (1.9)conforme el criterio de prueba es mucho mejor que eldescritopor (E10.3.1)ya que la pendiente y la intersección estdnmás cerca de 1 y de O. Por lo tanto, aunque cada una de las gráficasse describe muy bien mediante una línea recta, la ecuación (1.9) es un modelomejorqueel de la ecuación (E10.3.1). La prueba y selección de modelos sonmuy comunes y de extremada importancia en actividades llevadasa cabo en todos los campos de la in- geniería.El material presentado previamenteen este mismo capítulojun- to con el paquete NUMERICOMP y los programas del usuario le permiten a ésteresolvermuchosproblemasdeestetipo.
  • 330. 332 MÉTODOS NUMERICOS PARA INGENIEROS FIGURA 10.8 a) Datosmal condicionados en la regresión lineal con mínimos cuadra- dos. 6)Indicación dequeunaparábola es preferible. 10.1.5 Aplicaciones delaregresión lineal;linealizaciónde relaciones no lineales La regresión lineal proporciona una técnica muy poderosa para ajustar datos a una “mejor” línea. Sin embargo, se ha predicho que la relación entre las variablesdépendiente e independiente eslineal. Este no es siempre el caso, y el primer paso en cualquier análisis de regresión es el de trazar y visualizar los datos para decidir si es correcto o aceptable el aplicar un modelo lineal. Por ejemplo, en la figura 10.8se muestran algunos datos que, obviamente son curvilíneos. En algunos casos, técnicas como la re- gresión polinomial, descrita en la sección 10.2serán apropiadas.En otros, se puedenhacer transformaciónesque expresenlos datos de manera que sean compatibles con la regresión lineal. Un ejemplo es el modelo exponencial: y = aleblX [lo.111
  • 331. REGRESIóN 333 FIGURA 10.9 a) Ecuaciónexponencial, b)ecuación de potenciasy c) ecuación del pro- medio de crecimiento de saturación. Las partes d),e) y fl sonversiones linealizadas de aquéllas, lascualesson transformaciones simples. en donde al y bl son constantes. Estemodelo se usaen muchos cam- pos de la ingeniería caracterizando cantidades quecrecen (b,positiva) o que decrecen (b,negativa en un promedio proporcionala su magnitud. Por ejemplo, el crecimiento poblacionaly la disminución radiactivo mues- tran este comportamiento.Como se muestra en la figura (10.9a),la ecua- ción, representaunarelaciónlineal(para bl . O) entre y y x. Otroejemplo de un modelonolineal es la ecuación elevada a una potencia: y = agxb2 [lo.121
  • 332. 334 MÉTODOSNUMÉRICOS PARA INGENIEROS en donde a2 y b2son coeficientes. Este modelo tiene una amplia aplica- ción en todos los campos de la ingeniería. Como se muestra en la figura 10.9b, la ecuación (para b2 # O o 1) es no lineal. Un tercer ejemplo de un modelo no lineal es la ecuación de prome- dio de crecimiento de saturación: X y = a3- b3 + X [10.13] en donde a3 y b3son coeficientes constantes. Este modelo, que es parti- cularmente útil enla caracterización de crecimientospoblacionales bajo condicioneslimitantes,tambiénrepresentaunarelaciónnolinealentre y y x (Fig. 10.94 que nivela, o “satura”conforme x crece. Las técnicas de regresión no lineal se usan para ajustar directamente estas ecuaciones a los datos experimentales. Sin embargo, una alternati- va mássimple es ladeusar manipulacionesmatemáticas y transformar las ecuaciones a la forma lineal. En seguida se puede aplicar la regresión linealsimpleparaajustarlas ecuaciones a los datos. Por ejemplo, la ecuación (10.11)se puedelinealizarmediante loga- ritmosnaturales y obtener: In y = In al + blx In e Pero, ya que In e = 1, se tiene: In y = In al + blx [10.141 Por lo tanto una gráfica semilogarítmicade In y contra x genera una línea rectacon una pendientede bly una intersecciónde In al (Fig. 10.9d). La ecuación (10.12)se puedelinealizartomadologaritmosdebase 10 y obtener: log y = b2log x + log a2 [lo.151 De esta forma, una gráfica logarítmica de log y contra log x genera una línearectaconunapendiente de b2 y unaintersecciónde log a2 (Fig. 10.9e). La ecuaci6n (10:13) se linealizainvirtiéndola, y se obtiene: [10.16] Y a3 x a3 Por lo tanto, unagráficade l / y contra l/x serálineal,conpendiente b3/a3y unaintersecciónde l/a3 (Fig. lO.9j). Estos modelos,en sus estados transformados,se ajustan usando regre- siónlinealparaevaluarlos coeficientes constantes. Después se pueden transformar a su estado original y usarse para propósitos predictivos. En el ejemplo 10.4 se ilustra esteprocedimientopara la ecuación (10.12). Además los casos 12.2 y 12.3 proporcionan ejemplos de este tipo de cálculos aplicados a problemasdeingeniería.
  • 333. REGRESION 335 Ejemplo 10.4 Linealización de unaecuacióndepotencias Enunciado del problema: ajústesela ecuación (10.12)a los datos del cua- dro 10.3usando una transformación logaritmica de esos datos. CUADRO 10.3 Datos para ajustar en la ecuación de potencia X Y log x log Y 1 0.5 O -0.301 2 1.7 0.301 0.226 3 3.4 0.477 0.534 45.7 0.602 0.753 5 8.4 0.699 0.92:! Solución: en la figura 10.10~~se muestra una gráfica de los punto origi- nales en su estado sin transformación. En la figura 10.10bse muestra una FIGURA 10.10 a) Gráfica de datos sin transformación, junto con la ecuación de poten- cias que ajusta los datos. b)Gráfica de los datos transformados, usados al determinar los coeficientes de la ecuación de potencias.
  • 334. 336 MÉTODOS NUMÉRICOS PARA INGENIEROS ~ gráficalog-logde los datostransformados.Laregresiónlinealde los da- tos transformadoslogarítmicamntegenera la ecuación: log y = 1.75log X - 0.300 Por lo tanto, la intersección, log a2, esigual a -0.300, porconsiguien- tetomando el mando el antilogaritmo,a2 = = 0.5. Lapendien- tees b2 = 1.75. Como consecuencia la ecuación de potencias es: y = O . ~ X ' . ~ ~ Esta curva, como lo muestra la figura 10.lob, indica un ajuste aceptable. 1O. 1.6 Comentarios generales sobre la regresión lineal Antes de continuar conla regresión curvilínea y múltiple, se debe recalcar la naturaleza introductoria del material anterior sobre regresión lineal.Se ha enfocado en la forma simple y eluso práctico de las ecuaciones para ajustar datos. Se debeestar conciente dequeexisten aspectos teóricos de regresión que tienen importancia en la solución de problemas pero que van más allá del alcance de este libro. Porejemplo, existen algunas hipó- tesis estadísticas inherentes al procedimiento de mínimos cuadrados lineales tales cómo: 1. x tiene un valor fijo; no es aleatorio y se midesinerror 2. Los valores de y sonvariables aleatorios independientesy tienen to- daslamismavarianza. 3. Losvalores de y para una x dada deben estar distribuidos de manera uniforme. Estashipótesissonimportantes enel desarrollo y uso correctode la re- gresión.Por ejemplo, laprimera hipótesis, 1) significaquelas x deben estarlibresdeerror y la segunda 2) que laregresiónde y contra x no es lamismaquelade x contra y (pruébeseel problema 10.4 alfinaldel capítulo). Se sugiere consultar otras referencias talescomo Draper y Smith (1981) y de esta forma apreciar aspectos y matices de la regresión que vanmás alládel alcance de estelibro. 10.2 REGRESIóN POLINOMIAL Enla sección 10.1 se desarrolla un procedimientoqueobtiene la ecua- cióndeunalínea rectausandoelcriteriodemínimos cuadrados. Aigu-
  • 335. REGRES16N 337 nosdatosdeingeniería,aunquemuestren un marcadopatrón como el de lafigura 10.8, se representan pobremente mediante unalínea recta. En estos casos, se ajustamejor unacurva a los datos. Como se analiza enla sección anterior, un métodoparallevar a cabo esteobjetivoes el de usar transformaciones. Otra alternativaes ajustar polinomiosa los da- tos usandoregresiónpolinomial. El procedimiento de mínimos cuadradosse puede extender fácilmente y ajustardatos a un polinomiodem-ésimogrado: y = a0 + alx + a2x2+ * * + a,xm En este caso, la sumade los cuadradosde losresiduos es [compárese con la Ec. (10.3)]: n Sr= (yi - a. - alxi - a2x? - * . - amx?)2 [10.17] i= 1 Siguiendo elmismo procedimiento dela sección anterior, se toma la de- rivada de la ecuación (10.17)con respecto a cada uno de los coeficientes delpolinomio,para obtener: Estas ecuaciones se puedenigualar a cero y reordenarde tal forma queseobtenga el siguienteconjuntode ecuaciones normales:
  • 336. 338 MÉTODOS NUMÉRICOS PARA INGENIEROS en dondetodaslassumatorias van desde i = 1 hasta n. Nótesequelas m + 1ecuaciones anterioressonlineales y tienen m + 1 incógnitas:ao. al, ..., a,. Los coeficientes delasincógnitas se puedencalculardirecta- mente de los datos observados. Por lo tanto, el problema de determinar polinomios de gradom con mínimos cuadradoses equivalentea resolver un sistemade m + 1 ecuaciones linealessimultáneas. Los métodos de solución de estos sistemas se analizanen los capítulos 7 y 8. Así como en la regresión lineal, el error enla regresión polinomial se puedecuantificarmediante el errorestándarde la aproximación: %/x = u'".- n - (m + 1) [10.19] en donde m es elordendelpolinomio.Estacantidad se dividepor n- ( m + 1) ya que se usaron m + 1 coeficientes - a. , al,...,am- derivadosde los datosparacalcular S; por lo tanto, se hanperdido m + 1gradosdelibertad.Ademásdelerror estándar, se puedecalcular también el coeficiente de correlación en la regresión polinomial de la mis- ma maneraquepara el caso lineal: r2 = S" - Sr S" Ejemplo 10.5 Regresión polinomial Enunciado del problema: ajústese un polinomio de segundo orden a los datosdelasdoscolumnasdelcuadro 10.4. Solución: de los datos dados: m - 2 x, = 15 2,xp = 979 n = 6 y, = 152.6 xx,y, = 585.6 - x = 2.5 x' = 55 2 x'y, = 2 488.8 I 5 = 25.433 x? = 225 Por lo tanto, las ecuaciones linealessimultáneas son: 6ao + 15al + 55a2 = 152.6 15ao + 55al + 225a2= 585.6 55ao + 225a1 + 979a2= 2 488.8
  • 337. REGRESldN CON MíNIMOS CUADRADOS 339 CUADRO 10.4 Cálculos del análisis de error de un aiurte cuadráticocon mínimos cuadrados. O 2.1 544.44 O. 143 32 1 7.7 31 4.47 1.O02 86 213.6 140.03 1.08158 327.2 3.12 0.804 91 440.9 239.22 0.61 9 51 5 61.1 1 272.11 0.094 39 c. 152.62513.393.746 57 I Resolviendoestas ecuaciones conalgunadelas técnicas como laelimi- 1 nacióngaussiana se obtiene: 1 a0 = 2.47857 I al = 2.35929 ' a2 = 1.86071 1 Por lo tanto,la ecuación cuadrática con mínimos cuadrados en este caso es: y = 2.478 57 + 2.359 29x + 1.860 71x2 El error estándar de la aproximación,basadoenlaregresiónpolinomial es [Ec. (10.191: sy/x = E= 1.12 El coeficientededeterminación es: 2 513.39 - 3.746 57 r2 = 2 513.39 = 0.998 51 y el coeficientedecorrelación es: r = 0.999 25 Estos resultados indican que el 99.851% de la incertidumbre originalse ha explicadomediante el modelo. Esteresultadoapoya la conclusión de que la ecuación cuadrática representaun ajuste perfecto, como es evi- dente enlafigura 10.11.
  • 338. 340 MÉTODOS NUMERICOS PARA INGENIEROS FIGURA 10.11 Ajuste de un polinomiode segundo orden. FIGURA 10.12 Algoritmopara implernentarlaregresiónpolinomial.
  • 339. REGRESldN CUADRADOS 341 SUBROUTINE POLREG(X,P,A) DIMEIiSION X(15),Y(15).A(15.161 IP=Io*1 2030 FOR L = 1 TO N 2000 FOR I = 1 TO I O + 1 2010 FOR J = 1 TO IO + 1 2020K = I + J - 2 IO = order of regression ccnnoN N,IO polynolnsal N = number of data oolnts 2050 2060 2090 2100 DO 2100 I=l,IP DO 2060 J=l,IP K=I+J-2 W 2050 L=l,N A(I,Jl=A(I.Jl+X(L)~~K CONTINUE CONTINUE ~~ 2040 A ( I , J ) = A ( I , J ) + x ( L ) 2050 NEXT L 2070 FOR L = 1 TO N 2060 NEXT J 2080 A ( I , I O + 2 ) = A ( I , I O + Y ( L ) t X ( ¡ ) ( 1 - 1 ) K- (Determlnatlon of coefficlents of normal equations and storage In matrix A l (Deterrnlnation of 2) +, " 2090 NEXT L " .. right hand side constants M) 2090 L=l,N ' 2100 NEXT I IR=lP+l 2 11O RETURN CONTINUE A ~ 1 , I R ~ = A ~ I . I R ~ + Y ~ L I ~ X ~ L ~ ~ ~ ~ I - l ~ CONTINUE RETURN END and storage In last for normal equations column of rnatrlx A l FIGURA 10.13 Subrutinasen FORTRAN y BASIC que calcula las ecuaciones normales, de la regresión polinomial, en forma matrical. 10.2.1 Algoritmo para la regresión polinomial En la figura 10.12 se muestra un algoritmo sobrela regresión polinomial. Nótese que la tarea principales la obtención delos coeficientes de lasecua- ciones normales[Ec. (10.la)].(Lassubrutinas que llevan a cabo esta tarea se presentan enlafigura 10.13).En seguida se pueden aplicar los méto- dos de los capítulos 7 y 8 enla solución de estas ecuaciones simultáneas para esos coeficientes. Un problema potencial quese presenta conla implementación polino- mial es que algunasveces las ecuaciones normales estánmal condiciona- das. Esto se cumple en particular cuandolos sistemasson muy grandes. En estos casos, los coeficientescalculadossonaltamentesusceptiblesa los errores de redondeoy, por lo tanto, los resultados resultan inexactos. Entre otrascosas, este problema está relacionado con e!hecho de que parapo- linomios de órdenes superiores las ecuaciones normales pueden tenercoe- ficientes muy grandes y muy pequeños almismo tiempo. Esto se debe a que los coeficientes son sumatorias de los datos elevados a potencias. Aunque algunas de las estrategias para amortiguarlos errores de redon- deo analizadas enel capítulo 7, tales como el pivote0 y las ecuaciones de error, pueden ayudar a remediar parcialmente este problema, una al- ternativa más simple es usaruna computadora de alta precisión. Este es un caso dondelasmicrocomputadoraspuedenrepresentardesventajas en la implementación efectiva de este método numéricoen especial. Afor- tunadamente, la mayor parte de los problemasprácticosestdnlimitados apolinomiosdeordeninferior en los que los erroresde redondeo, en general, son despreciables. En situaciones dondese requiera polinomios de orden superior, se disponedeotrasalternativasparaciertostiposde datos. Sin embargo, estos métodos (talescomo los polinomiosortogona- les) van más allá del alcance de este libro. El lector debe consultar textos sobre regresión tales como el Draper y Smith (1981)para obtener infor- maciónrelacionadacon el problema y susposiblesalternativas.
  • 340. 342 METODOS NUMÉRICOS PARA INGENIEROS 10.3 REGRESIóNLINEALMúLTIPLE Una extensión útil en la regresión lineal es el caso en que y es una función lineal de doso más variables. Por ejemplo, y pudiera ser una fun- ción lineal de x1 y x2, de la forma: Tal ecuación es útil particularmente cuando seajustan datos experimen- tales en donde la variable que se está analizando, a menudo es función de otras dosvariables. En este casobidimensional, la “línea” de regresión viene aser un “plano” (Fig. 10.14). Como con los casos anteriores,los “mejores”valores de los coeficientes se determinan agrupando la suma de los cuadrados de los residuos: n Sr = (yi --‘a0 - alxl,¡ - ~ 2 , ~ ) 2 i=l y derivando con respecto a cada uno de los coeficientes: [10.20] Los coeficientes que generan la suma mínima de los cuadrados de los residuos se obtienen igualando cada unade las derivadas parciales a cero y expresando la ecuación (10.20)como un conjuntodeecuaciones li- neales simultáneas, de la forma: o como una matriz:
  • 341. REGRESldN CON MíNIMOS CUADRADOS 343 FIGURA 10.14 CUADRO 10.5 Esquema grafico de la regresión lineal múltiple en donde y es una fun- ción lineal de X I y X?. EJEMPLO 10.6 Regresión linealmúltiple Enunciado del problema:lossiguientesdatos se calcularon de la ecua- ción y = 5 + 4x1 - 3x2. 2 O O 5 1 2.5 10 1 2 9 3 O 4 7 6 2 3 27 Úseseregresiónlinealmúltipleparaestos datos. Cilculos necesariospara desarrollar las ecuaciones normales del eiemplo10.6 Y X I x2 x: x f x1x2 XI Y *2Y 5 O 0 0 10 O 2 O 1 4 0 1 0 9 2.5 2 2 20 6.25 10 O 1 3 45 22.518 1 34616 9 3 36 0 0 277 2 491418954 24 12 4 18 E 54 16.51476.255448243.5
  • 342. 344 MÉTODOS NUMERICOS PARA INGENIEROS Solución: las sumatorias necesarias para desarrollar la ecuación (10.21) se calculan en el cuadro 10.5.Sustituyéndolas enla ecuación (10.21)se obtiene: [;{.5 :::5 g]54 [a2 = [g.51 que se puede resolver usando un método comola eliminación gaussiana para obtener: a. = 5 al = 4 a2 = -3 los cuáles son consistentes con la ecuación original de donde sederiva- ron los datos. La regresión lineal múltiple se puede formular en el caso más general como: y = a0 + alxl + a2x2 + * * . + a,xm en dondelos coeficientes que minimizan la suma delos cuadrados delos residuos se determinan resolviendo el sistema: El error estándar de la aproximación para regresiónli formula de la siguiente manera: [10.22] neal múltiple se y el coeficiente de correlación se calcula como en la ecuación (10.10). Aunque existenciertos casos en donde una variable es linealmente dependiente de dos o más variables diferentes, la regresión lineal múlti-
  • 343. REGRES16N CON MíNIMOS CUADRADOS 345 pletieneutilidadadicionalenlaobtención de ecuaciones de potencias de la forma general: Tales ecuaciones son extremadamente útilescuando se ajustan datosex- perimentales. Además, para usar la regresión lineal múltiple, lasecuacio- nes se transforman tomando su logaritmopara obrener: log y = log a0 + allog x1 + a2 log x2 + * + a, log x,,, Estatransformación es similar a las que se usanenla sección 10.1.3y el ejemplo 10.4paraajustarunaecuación de potencias en donde y era una función de una variable simple x. Enel caso de estudio 12.5se pro- porciona un ejemplodeestaaplicación. PROBLEMAS Cálculos a mano 10.1 Dados los datos 0.95 1.42 1.54 1.32 1.15 1.47 1.46 1.47 1.92 1.85 1.74 1.65 2.39 1.82 2.06 1.55 1.63 1.95 1.25 1.35 1.05 1.78 1.71 2.14 2.27 determínese a) la media, b) la desviación estándar, c) lavarianza y d) el coeficiente de variación. 10.2 Constrúyase un histograma de los datos delproblema 10.1.Usese un rango de 0.6 a 2.4 con intervalos de 0.2. 10.3 Dados los datos 52 6 18 21 26 28 32 39 22 28 24 27 27 33 2 12 17 34 29 31 34 43 36 41 37 43 38 46 determínese a) la media. b) la desviación estándar, c) la variara y d) el coeficiente de variación. e)Constrúyase un histograma.k e s e un intervalo de O a 55 con incrementosde 5.fl Supo- niendo que ladistribución es normal y que la aproximación de la desviación estándar es
  • 344. 346 MÉTODOS NUMÉRICOS PARA INGENIEROS- 10.4 10.5 10.6 10.7 10.8 10.9 válida, calcúlese el intervalo (es decir,los valores inferior y superior) que abarqueel 68% de las lecturas. Determínese si ésta es una aproximación válida para los datos de este problema. Utilicela regresión con mínimos cuadrados para ajustar una línea recta a: x I 1 3 5 7 10 12 13 16 1820 y 1 3 2 6 5 8 7 1 0 9 1 2 1 0 J w t o con la pendiente y la intersección, calcúlese el error estándar de la aproximación y el coeficiente de correlación. Grafíquense los datos y la línea de regresión. En seguida repítase el problema, pero ahorax contra y; es decir,intercámbiense las variables. Inter- prétense los resultados. Úsese regresión de mínimos cuadrados para ajustaruna línea recta a: x 1 4 6 8 10 14 16 20 22 24 28 28 34 36 38 y 1 30 18 22 28 14 22 16 8 20 8 14 14 O 8 Junto con la pendiente y la intersección, calcúlese el error estándar de la aproximación y el coeficiente de correlación. Grafíquense los datos y la línea de regresión. Si alguien realizó una medida adicional de x = 30, y = 30, ¿se esperaría basándose en una obser- vación visual y en el error estándar, quela medida fuese válida o inválida? Justifíquense las conclusiones. Empléese regresión con mínimos cuadrados para ajustar una línea rectaa los datos: x+ O 2 4 4 8 12 16 20 24 28 30 34 10 12 18 22 20 30 26 30 26 28 22 20 a) Junto con la pendiente y la intersección. calcúlese el error estándar dela aproximación y el coeficiente de correlación. Grafíquense los datos y la línea recta. Valórese el ajuste. b) Repítase el cálculo de a) pero usando regresión polinomial para ajustar una parábola a los datos. Compárense los resultados con los de a). Ajústese un modelo de promedio de crecimiento de saturacijn a' x I 1 2 2.5 4 6 8 8.5 y I 0.4 0.7 0.8 1.0 1.2 1.3 1.4 Grafíquense los datos y la ecuaciqn. Ajústese una ecuación de potenciasa los datos del problema 10.7.Grafíquense los datos y la ecuación. Ajústese una parábola a los datos del problelna 10.7.Grafíquense los datos y la ecuación.
  • 345. REGRESION CON CUADRADOS 347 10.10 Ajústese unaecuacióndepotencias a: x 1 2.5 3.5 56 7.5 10 12.5 15 17.5 20 y I 5 3.4 21.6 1.2 0.8 0.6 0.4 0.3 0.3 Grafíquese y contra x además de la ecuación de potencias 10.11 Ajústese un modeloexponencial a: x I 0.05 0.4 0.8 1.2 1.6 2.0 2.4 y I 550 750 1000 1400 2000 2700 3750 Grafíquense los datos y la ecuación en papel estándary semilogarítmico. Analícense los resultados. 10.12 Ajústese una ecuación de potencias a los datos del problema 10.11.Grafíquense los da- tos y la ecuación. 10.13 Ajústese una parábola a los datos del problema 10.11.Grafíquense los datos y la ecuación. 10.14 Dados los datos: x 1 5 10 15 20 25 30 35 40 45 50 y I 17 25 30 33 36 38 39 40 41 42 Úsese regresión con mínimos cuadrados para ajustar a) a una línea recta, b) a una ecua- ción de potencias, c) a una ecuación de promedio de crecimiento de saturación y d) a una parábola. Grafíquense los datos junto con todaslas curvas. ¿Alguna de ellas es me- jor? Si es así justifíquese. 10.15 Ajústese a unaparabolaa: x 1 O 2 4 69 11 13151719232528 y I 1.2 0.6 0.4 -0.2 O -0.6 -0.4 -0.2 -0.4 0.2 0.41.2 1.8 Calcúlense los coeficientes, el error estándar dela aproximación y el coeficiente de corre- lación. Grafiquense los resultados y valórese el ajuste. 10.16 Úsese regresión lineal múltiple paraajustar: X l I O 1 2 0 1 2 X2 y 1912 11 24 2215 2 2 4 4 6 6 Calcúlense los coeficientes, el error estándarde la aproximación y el coeficiente decorrelacihn.
  • 346. 348 MÉTODOS NUMERICOS PARA INGENIEROS 10.17 10.18 10.19 10.20 10.21 10.22 10.23 10.24 Usese regresiónlinealmúltiplepara ajustar: x1 x2 1 1 2 2 3 3 4 4 18 12.825.720.6 35.0 29.845.540.3y 1 2 1 2 1 2 1 2 Calcúlense los coeficientes, el error estándar de la aproximación y el coeficiente de corre- lación. Problemasrelacionadoscon la computadora Desarrólleseun programa legible al usuario para regresión lineal basado en la figura 10.6. Entreotras cosas: a) Agréguense instrucciones que documenten el programa. b) Háganse másdescriptivas las operaciones de entrada salida y orientadas al usuario. C) Calcúlese e imprímaseel error estándar de la aproximación [Ec.(10.9)]y el coeficiente de correlación [la raíz cuadrada de la ecuación (10.10)]. d) (Opcional)Inclúyase una gráfica por computadora delos datos y de la línea de regresión. e) (OpcionalInclúyase una opción que permita analizar ecuaciones deltipo exponencial, de potencias y depromediode crecimiento de saturación. Desarróllese un programa que sea legible al usuario para regresión polinomialbasado en las figuras 10.12 y 10.13.Pruébese el programa repitiendo los cálculos del ejemplo 10.5. Desarróllese un programa que sea legible al usuario para la regresión múltiple basado en lafigura 10.12, pero con lamatriz especificada como la ecuación (10.22).pruébese el progrmarepitiendo los cálculos del ejemplo 10.6 Repítanse los problemas 10.4 y 10.5 usando el programadelproblema 10.18 Úsese el paquete de programas NUMERICOMP para resolver los problemas 10.4, 10.5 y 10.6a Repítanse los problemas 10.9, 10.13 y 10.15 usando el programa del problema 10.19. Repítanse los problemas 10.16 y 10.17 usando el programadelproblema 10.20
  • 347. C A P í T U L O O N C E Confrecuenciasetienenqueestimarvaloresintermediosentrevalores conocidos. El método más común empleado para este propósitoes la in- terpolaciónpolinominal. Recuérdese que la fórmulageneral de un polinomioden-ésimo or- den es: f(x) = a0 + a1x + a2x2+ * + anxn [11.1] Para n + 1 puntos, existeuno y sólo un polinomio de n-ésimoorden o menor que pasaa través de todos los puntos. Por ejemplo, hay sólo una línea recta (esdecir, un polinomio de primer orden) queconecta dos puntos (Fig. 11.la). De manera similar hay sólo una parábolaque conecta a tres puntos (Fig. 11.lb). El polinomio de interpolaciónconsisteendetermi- narelÚnicopolinomio de n-ésimoorden que se ajusta a los n + 1 pun- tos dados. Este polinomio proporciona una fórmula para calcularlos valores intermedios. Aunque existe unoy sólo un polinomio de n-ésimo orden que se ajusta a los n + 1 puntos, existenunagranvariedaddefórmulasmatemáticas FIGURA 1 1 . 1 Ejemplos de interpolación polinomial:a) Primer orden (lineal),conexión de dos puntos; b) conexión de tres puntos, segundo orden (cuadrática o parabólica) y c) conexión de cuatro puntos, tercer orden(cúbico).
  • 348. 350 MÉTODOS NUMÉRICOS PARA INGENIEROS mediante las cuales se puede expresar este polinomio. En este capítulo, se estudian dos técnicas alternativas que est6n bien condicionadas para implementarse en una microcomputadora. Estos son los polinomios de Newton y los de Lagrange. 11.1 POLINOMIOS DE INTERPOLACIÓNCON DIFERENCIAS DIVIDIDAS DE NEWTON Como ya se dijo, existe una variedad de maneras diferentes de expresar un polinomio de interpolación. El polinomio de interpolacióncondife- rencias diuididas de Newton, entre otros, es la forma más popular además de la más útil. Antes de presentar la ecuación general, se examinan las ver- siones de primero y segundo orden debido a sufácil interpretación visual. 11.l. 1 Interpolación lineal La forma más simple de interpolación es la de conectar dos puntos con una línea recta. Este método, llamado interpolación lineal,se muestra en la figura 11.2. Usando triángulos semejantes, se tiene: FIGURA 11.2 Esquema gráfico de la interpolación lineal. Las áreossombreadas mues- tran triángulos semejantes usados en la derivación de la fórmula de in- terpolaciónlineal [€c. (1 1.2)].
  • 349. INTERPOLACldN 351 que se puedereordenar como: [11.2] lacual es unafórmuladeinterpolaciónlineal. La notación fl(x) indica que se trata de un polinomio de interpolacióndeprimer orden. Nótese que además de representar la pendiente de la línea que conecta los dos puntos, eltérmino Lf(xl)-f (xo)]/(xl- xo)es una aproximación de di- ferencias divididasfinitas a laprimeraderivada [recuérdesela ecuación (3.24)].En general, entre máspequeño sea el intervalo entre lospuntos, más exacta será la aproximación. Esta característica se demuestra en el ejemplo, siguiente. EJEMPLO 1 l . 1 lnterpolaciónlineal Enunciado del problema: calcúlese el logaritmo natural de 2 (In 2) usan- do interpolación lineal. Primero, llévense a cabo los cálculos interpolan- do entre In 1 = O y In 6 = 1.791 759 5. Despuésrepítanse el procedimiento,perousando un intervalomás pequeño desde In 1a In 4 (1.386 294 4). Nóteseque elvalorrealde In 2 = 0.693 147 18. Solución: usando la ecuación (11.2),unainterpolaciónlinealde x = 1 a x = 6 da: f,(2) = 0 + 1.791 759 5 - O 6 - 1 (2 - 1) = 0.358 351 90 la cual representa un error porcentualde = 48.3%.Usando el intervalo más pequeño desde x = 1 a x = 4 da: fi(2)= 0 + 1.386 294 4 - O 4 - 1 (2 - 1) 0.462 098 13 Por lo tanto, usandoelintervalomás pequeño reduce elerrorrelativo porcentual a E, = 33.3%.Ambasinterpretaciones se muestranen la fi- gura 11.3,juntocon lafunción verdadera. 1 l. 1.2 interpolación cuadrática El errorenelejemplo 11.1se debe a que se aproximó unacurva me- diante una línearecta. Por consiguiente,una estrategia que mejora la apro-
  • 350. 352 MÉTODOS NUMÉRICOS PARAINGENIEROS FIGURA 11.3 Dos interpolaciones lineales para aproximar In 2. Nótese cómo el intervalo más pe- queño proporciona una mejor aproximación. ximación es la de introducir cierta curvatura en la línea que conecta a los puntos. Si se dispone de tres datos: lo anterior se puede llevar a cabo conun polinomio de segundo orden (llamado también polinomio cua- drático o parábola). Una manera conveniente para este caso es: Nótese que aunque la.ecuación (11.3)parezca diferente de la ecuación general de un polinomio [Ec. (11.l)], las dos ecuaciones son equivalen- tes. Esto se puede demostrarsi se multiplican lostérminos de la ecuación (11.3)y obtener: A(x) = bo + blx - blxo + b2X2 + bzxoxl - ~ ~ x x O- b2XXI o, agrupando términos: f2(x) = a0 -t alx + a2x2 en dónde:
  • 351. INTERPOLACI6N 353 De esta manera, las ecuaciones (11.1)y (11.3)son fórmulas alternativas equivalentes del Único polinomio de segundo grado que une a los tres puntos. Se puedeusar un procedimiento simple para determinar los valores de los coeficientes. Para bo, se usa la ecuación (11.3) con x = x0 y se obtiene bo = f (xo) [11.4] Sustituyendo la ecuación (11.4) en la ecuación (11.3) y evaluando en x = x1 se obtiene: [11.5] Y por último, las ecuaciones (11.4) y (11.5)se sustituyen en la ecuación (11.3),y se evalúa ésta en x = x2 y seobtiene: [11.6] Nótese que, al igual que en el caso de interpolación lineal, bl aún re- presenta la pendiente de la línea que une los puntos x0 y xl. Por lo tan- to, los primeros dos términos de la ecuación (11.3)son equivalentes a la interpolación de x. a xl, como ya se especificó anteriormenteen la ecuación (11.2).El Gltimo término, b2(x- xo)(x- xl),introduce la cur- vatura de segundo orden en la fórmula. Antes de ilustrar como se usa la ecuación (11.3), sedebe examinar la forma del coeficiente b2. Es muysimilar a la aproximación por dife- rencias divididas finitas de la segunda derivada introducida previamente en la ecuación (3.31).Por io tanto. la ecuación (11.3)empieza a mani- festar una estructura muy similar a la serie de Taylor. Esta observación se explora con más detalle cuando se relacione el polinomio de Newton con la serie de Taylor en la sección 11.1.4.Pero primero, se muestra có- mo se usa la ecuación (11.3)para interpolar entre tres puntos. EJEMPLO 11.2 Interpolación cuadrática Enunciado del problema: ajústese el polinomio de segundo orden a los tres puntos usados en el ejemplo 11.1: x0 = 1 f(xo) = o XI = 4 f(x1) = 1.386294 4 x2 = 6 f ( ~ 2 )= 1.791759 5
  • 352. 354 MÉTODOS NUMÉRICOS PARAINGENIEROS úsese el polinomio para evaluar In 2. Solución:aplicando la ecuación (11.4)da: Las ecuaciones (1l .5) generan : y la ecuación (11.6)da: 1.791 759 5-1.386 294 4 "o.426 098 13 b2 = 6-4 = - 0.051873 116 6 . 1 Sustituyendo estos valores en la ecuación (11.3)se obtiene la fórmula cuadrática: f 2 ( ~ ) O + 0.462 098 1 3 ( ~- 1)- 0.051 873 1 1 6 ( ~- l)(x- 4) que se evalúa en x = 2 y se obtiene f2(2) = 0.565 84436 lo que representa un error porcentual del .E" = 18.4%.Por lo tanto, la curvatura introducida por la fórmula cuadrática (Fig. 11.4)mejora la in- terpolación comparada con los resultados obtenidos al usar una línea recta en el ejemplo 11.1y la figura 11.3. 11.1.3 Forma general de los polinomios de interpolación de Newton El análisis anterior se puede generalizar en el ajuste de un polinomio de n-ésimo orden a los n + 1puntos. El polinomio den-ésimoorden es: j n ( X ) = bo + bl(x - ~ g )+ * * * + b,(x - XO)(X- XI) . . . (X - Xn-l) [11.7] Como se hizo anteriormente con las interpolaciones lineales y cuadráti- cas, se usan los puntos en la evaluación de los coeficientes bo. b l , . . . . b,. Se requieren n + 1 puntos para obtener un polinomio de n-ésimo orden: x(),xl, , . . , x,. Usando estos datos, con las ecuaciones siguien- tes se evalúan los coeficientes: [11.8] [11.9]
  • 353. lNTERPOLACl6N 355 FIGURA-11.4 uso de la interpolación cuadratica para calcular In 2.Se incluye también la interpo- lociónlineal de x = 1 a 4 para comparación. b 2 = f b 2 , x17 x01 [11.10] en donde las evaluaciones de la función entre corchetes son diferencias divididas finitas. Por ejemplo, la primera diferencia divididafinita se re- presenta generalmente como: [ll.121 La segunda diferencia diuididafinita, que representa la diferencia de dos primeras diferencias dividas finitas, se expresa generalmente como: [11.13]
  • 354. 356 MÉTODOS NUM~RICOSPARAINGENIEROS Estas diferenciasse usan para evaluar los coeficientes de lasecuacio- nes (11.8)a la (1l.ll),los cualesse sustituyen en la ecuación (11.7) pa- ra obtener el polinomiodeinterpolación: FIGURA 11.5 [11.15] Al cual se lellama polinomio de interpolación con diferencias divididas de Newton. Se debe notar que no es necesario que los datos usados en la ecuación (11.15)estén igualmente espaciados o que los valores de la abscisanecesariamenteseencuentrenenordenascendente,como se ilus- traenelsiguiente ejemplo. Tambiénnótesequelasecuaciones (11.12) a la (11.14)son recursivas, esto es, las diferencias de orden superior se com- ponen de diferenciasde orden inferior (Fig. 11.5).Esta propiedadse apro- vechará al desarrollar un programa eficiente para la computadora enla sección 11.1.5 queimplementeeste método. Esquema gráfico de la naturaleza recursiva de una diferencia dividida finita. EJEMPLO 11.3 Polinomios de interpolacion de Newtoncon diferencias divididas Enunciado del problema: enel ejemplo 11.2, se usaron los puntos en x. = 1, xi = 4 y x2 = 6 paracalcular In 2 conuna parábola. Ahora, agregando un cuartopunto [x3 = 5; f(x3)= 1.609 437 91, calcúlese In 2 con un polinomio de interpolacióndeNewtoncondiferenciasdivididas detercer orden. Solución: el polinomiodetercer orden, ecuación ( 11.3) con n = 3, es
  • 355. INTERPOLACI6N 357 las primeras diferencias divididas del problema son [Ec. (11.12)J fkl, x01 = 294 - o = 0.462 098 13 4 - 1 1.791 759 5 - 1.386 294 4 = o.2o2 732 55 f k 2 , x11 = 6 - 4 1.609 437 9 - 1.791 759 5 = o.182 321 6o f[X3, x21 = 5 - 6 Las segundas diferencias divididas son [Ec.(11.13)] 0.202 73255 - 0.46209813 6 - 1 f k 2 , x19 x01 = = - 0.051 873 116 0.182 321 60 - 0.202 73255 5 - 4 fix39 x27 x11 = = - 0.020 410950 La tercera diferencia dividida es [Ec. (11.14)]con n = 31 -0.020 410 950 - (-0.051 873 116) 5 - 1 f b 3 , x2, x19 x01 = = 0.007 865 541 5 FIGURA 11.6 USOde interpolación cúbica para aproximar In 2. " " ~ - _ I .._" "X.L.1 I -."l"""-.-.---
  • 356. 358 METODOS NUMÉRICOS PARA INGENIEROS Los resultadospara f[xl,xo],f[x2,xl,xo]y f[x3,x2,xl,x"] representan los coeficientesbl, b2y b3dela ecuación (11.7).Juntocon bo = f(xo)= 0.0 la ecuación (11.7) da f3(~) = O + 0.462 09813 (X - 1) - 0.051 873 116(X " 1 ) (X - 4) + 0.007 865 541 5(x- l)(x - 4)(~- 6) conlaquesepuedeevaluar f3(2) = 0.628 768 69 lo que representa un error relativo porcentual del t u = 9.3%.El polino- mio cúbicocompleto se muestraenlafigura 11.6.- 11.1.4 Errores en los polinomios interpolantes de Newton Nótese que la estructura de la ecuación (1l.15)es similar a la expansión de la serie de Tayloren el sentido de quelos términos agregadossecuen- cialmente consideran el comportamiento de orden superior dela función representada. Estos términosson diferencias divididas finitasy, por lo tanto, representan aproximaciones a lasderivadasdeordensuperior. En con- secuencia, como sucede con la serie de Taylor, si la función representati- va es un polinomio de n-ésimo orden, el polinomio interpolante den-ésimo ordenbasado en n + 1 puntosllevará a resultados exactos. También, como enel caso de la seriede Taylor, se puedeobtener unaformulacióndelerrordetruncamiento. Recuérdese dela ecuación (3.13)que elerrordetruncamientoen la seriedeTaylor se expresa en formageneral cómo: f'"'(S) (x,+1- xi)"+'R,,= (n-+ 1)! en donde 4 es un punto cualquiera dentro del intervalo [x,,x,,,),Una re- lación an6loga del error en un polinomio interpolante de n-ésimo orden estádada por: .. [11.16] en donde 4 es un punto cualquiera dentro del intervalo quecontiene las incógnitas y los datos. Parauso de estafórmula lafunciónencuestión debe ser conociday diferenciable.Y usualmente, esteno es el caso. Afor- tunadamente, existeuna fórmula alternativa que no requiere conocimiento
  • 357. lNTERPOLACl6N 359 previo de la función. Envez de ello, se usaunadiferenciadivididafinita queaproxima la (n + 1)-ésima derivada: en donde f[x, x,, x,-1 ,. . . , xo]es la (n + 1)-ésima diferenciadividi- da. Yaque la ecuación (1l.17) contiene la incógnita)(x), ésta nose pue- deresolver y obtener el error. Sin embargo, si se disponede un dato adicional f(x,+J, la ecuación (11.17) daunaaproximacióndelerror como: EJEMPLO 11.4 Estimación del error en el polinomiodeinterpolaciónde Newton Enunciado del problema: úsesela ecuación (11.18) para calculare! error del polinomio de interpolación de segundo orden del ejemplo112 . Usense los datosadicionales f(x3) = f(5) = 1.609 437 9 para obtener los re- sultados. Solución: recuérdese que en el ejemplo 11.2 el polinomiodeinterpola- cióndesegundoordenproporcionóunaaproximaciónde f(2) = 0.565 844 346, querepresenta un errorde 0.693 147 18 - 0.565 844 346 = O. 127 302 835.Si no se sabe elvalor verdadero, como es enla ma- yorparte de los casos, se puede usarla ecuación (1l.18),junto con el valoradicionalen x3,paracalcular el error, como O R2 = 0.007 865 541 5 (X - l)(x - 4 ) ( ~- 6) en donde el valor de la diferencia dividida finita de tercer ordense calcu- ló previamente enel ejemplo 11.3. Estarelación se evalúa en x = 2 y se obtiene: R2 = 0.007 865 541 5 (2 - 1)(2 - 4)(2 - 6) = 0.062 924 332 quees delmismoordenqueelerrorverdadero
  • 358. 360 MÉTODOS NUMÉRICOS PARA INGENIEROS 11.1.5 Programa de computadora para el polinomio de interpolación de Newton Son tres las propiedades que hacen delpolinomio de interpolación de Newton un método extremadamente atractivo para usarse en una computadora: 1. Como enla ecuación (11.7),las versiones de orden superiorse pue- den desarrollar secuencialmente agregandoun término simplea la si- guiente ecuación de orden inferior. Esto facilitala evaluación de varias versiones de orden diferente enelmismo programa. Esta capacidad es muy útil cuando no seconoce a priori el orden del polinomio. Agre- gando nuevos términossecuencialmente,puede determinarse cuán- dosealcanza un puntode retorno, es decir, cuándo al agregar un término de orden superior no se mejora significativamentela aproxi- mación o en ciertos casos se disminuye. Lasecuacionesde error ana- lizadasenelpunto (3)sonútilesaldefinir un criterioobjetivoen la determinacióndeestepuntodetérminos decrecientes. 2. Las diferenciasdivididasfinitas que constituyen los coeficientes del polinomio [Ec. (11.8) a la (11.1l)] se calculan con una relación re- cursiva.Esto es, como enla ecuación (11.14) y lafigura 11.5, las diferencias de orden inferior se usan para calcular las diferencias de orden superior. Usando la información previamente determinada,los coeficientes se calculan eficientemente.El programa dela figura 11.7 contiene este esquema. ORTRA ASIC DIMENSION F X C 1 0 , l O ) ~ X ~ l O ) READ<5 , l )N 1 FORRLTC I S ) DO 140 I - $ . N READ<S,2)X<I ) , F X <I , 1 ) 2 FORMAT<2F1 U ~ 0 ) 140 CONTINUE M-N-1 DO 2 0 0J - I , M NP-N- J K=J+T DO 190 I=l,NP F x ( I , K ) - ~ F X ~ I + l , J ) - F ~ ~ I , J ~ ) ~ ~ X ( I + J ) - % ~ I ) ~ 190CONTINUE 200 CONTINUE DO 230J=t,N 3FORMRTC. - , F 1 0 . 3 ) W R I T E ( 6 , 3 > F X ( I , J ) 2 3 0 CONTINUE RERD<S,2)XI F A - l . Y.0, DO 340 J-V.N Y-Y+FX< 1 , J >+Fa WRITE(6,3)Y FA-FR*<XI-X( J i ) EAnFArFX<1, JP > JP-J+l WRITEC6,J)EA IF CJ.GE.N)COTO350 340 CONTINUE 350 STOP END F h l N T EA I E X I . I F FIGURA 11.7 Programaparacomputadoradelpolinomiointerpolante de Newton
  • 359. INTERPOLACldN 361 3. Laecuacióndeerror [Ec. (11.18)]se expresa entérminosdelasdi- ferencias divididas finitas que yase han calculado para determinar los coeficientesdelpolinomio.Por lo tanto, si se guardaestainforma- ción, se calculaelerroraproximado sinvolver a calcularestas can- tidades. Todas las características anterioresse pueden aprovechar e incorpo- raren un programageneralparacomputadoraqueimplementeelpoli- nomio de Newton (Fig. 11.7).Aligual que todoslos programas del libro, esta versión no se documenta. Además, no incluye el error aproximado mencionado en el punto (3).Una de las tareas esla de hacereste progra- mamáslegiblealusuario (véase elproblema 11.11) y queincorpore la ecuación de error. La utilidad de esta ecuación se demuestraenel ejem- plosiguiente. EJEMPLO 11.5 Uso de la estimación de error para determinar el orden apropiado de interpolación Enunciadodel problema: después de incorporarel error [Ec. 11.181, uti- lícese el programa de computadora dado en lafigura 11.7 y la siguiente informaciónparaevaluar f(x) = In x en x = 2. x f(x)= In x 1 O 4 1.386 294 4 61.791 759 5 5 1.609 437 9 3 1.O9861 23 1.5 0.405 465 11 2.5 0.916 290 73 3.5 1.252 763 O Solución: losresultados de emplear elprograma de lafigura 11.7 para obtener la solución se muestranen la figura 11.8. Enla figura 11.9 se representa el error aproximado,junto con el error verdadero (basadoen el hecho deque In 2 = 0.693 147 18).Nótesequeelerrorcalculado y el verdadero son similaresy su coincidencia mejoraa medida quecrece el orden. Dela gráfica se puede concluir que las versiones de quinto or- den llevan a una buena aproximación y que los términos de orden supe- riornoprecisansignificativamentelapredicción. Este ejercicioilustra también la importancia de la posición y orden de los puntos. Por ejemplo, las aproximacionesde orden superior al tercero mejoranmáslentamente ya que los puntosque se le agregan(en x = 4 , 6 y 5) estándistantes y a un ladodel punto en cuestión en x = 2.
  • 360. 362 MÉTODOS NUMÉRICOS PARAINGENIEROS -a Number of data potnts FIGURA 11.8 Salida del programa BASIC para evaluar In 2. La aproximación de cuarto orden muestra mayor mejoría porque elnue- vo punto en x = 3 está más cerca de la incógnita. Sin embargo, el decre- mento en el error más dramático estáasociado conla inclusión del término dequintoordenusando los datos en x = 1.5. No sólo estepuntoestá cerca de la incógnita sino tambiénse encuentra al lado opuesto de la ma- yor parte de los puntos. En consecuencia, el error se reduce casi una or- den de magnitud. El significado dela posición y secuencia de los datos pueden también ilustrarsealusar los mismosdatospara obtener unaaproximaciónpara In 2, pero considerando los puntosenuna secuencia diferente. Enla fi- gura 11.9 se muestran los resultadosparael caso enque se inviertenel ordende los puntosoriginales, esto es, x. = 3.5, x1 = 2.5, x2 = 1.5, etc. Debido a que los puntos iniciales en estecaso se encuentranmás cerca y espaciados a los lados de In 2, el error decrece mucho más rápidamen- teque enla situaciónoriginal.Medianteeltérmino de segundo orden, elerror se hareducido a un nivelrelativoporcentualdemenosdel E, = 2%. Se pueden emplear otras combinaciones para obtener diferentesprome- dios de converqencia. El ejemplo anterior ilustra la importancia de escoger los puntos base. Como es obvio, los puntosdebenestartan cerca como sea posiblede lasincógnitas.Estaobservacióntambiénsenotaporsimpleexamendela ecuacióndeerror [Ec. (11.17)]. Suponiendo que la diferenciadividida
  • 361. FIGURA 11.9 11.2 Errores relativos porcentuales en la aproximación de In 2 en función del ordendelpolinomiodeinterpolación. finita no varía demasiadoa lo largo del rango de datos, entonces el error es proporcional al producto:(x - xo)(x - xl) . . . (x - x,,).Obviamen- te, mientrasmás cercanos estén los puntosbase a las x, menorserá la magnitud de este producto. POLINOMIOS DE INTERPOLACIÓNDE LAGRANGE El polinomio de interpolación de Lagrange, simplemente es una refor- mulación del pqlinomio de Newton que evita los cálculos de las diferen- ciasdivididas.Este se puederepresentar concretamente cómo: en donde: [11.19]
  • 362. 364 MÉTODOS NUMÉRICOS PARAINGENIEROS [11.20] endonde I’I denota el “producto de.”. Porejemplo, la versiónlineal (n = 1)es: I y la versión de segundo orden es: [11.21] [11.22] Al igual que el método de Newton,la versión de Lagrange tiene un error aproximado, dado por: n La ecuación (11.19)se deriva directamente del polinomio de New- ton (recuadro 11.1).Sin embargo, la razón fundamental de la formula- ción de Lagrange se puede comprender directamente notando que cada término Li(x)será 1en x = x,y O en todos los demás puntos. Por lo tan- to, cada producto LJx) f(xi)toma un valor de f(x,)en el punto x,.For consiguiente la sumatoria de todos los productos, dada por la ecuación (11.19)es el Único polinomio de n-ésimo orden que pasa exactamente por los n + 1puntos. RECUADRO 1 1 . 1 Derivación delaformadeLagrange directamente del polinomio de interpolación deNewton El polinomio deinterpolación de Lagrange se puedederi- var directamente de la formulación de Newton. Se hará esto en el caso de primer orden, f [XI, x03 = f(XI) - f (xo, x1 - x0 fdx) = f(x0) + (x - xO)f[Xl, x01 [B11.1.1] sepuede reformular como: Para derivar la forma de Lagrange, se reformulan las di- ferencias divididas. Por ejemplo, la primera diferencia di- f b l , x03 = ___f(x1) + ~ f (x01 [B11.1.2] vidida. x1 - x0 x0 - XI
  • 363. INTERPOLACldN 365 a la cual se le conoce con elnombre de forma simétrica. Finalmente, agrupando términos similares y simplifican- Sustituyendo la ecuación (B11.1,2) en la ecuación do, se llega a la forma de Lagrange, (B1l.l.l)se obtiene EJEMPLO 11.6 Polinomios de interpolación de Lagrange Enunciado del problema: úsese un polinomio de interpolaciónde Lagrange de primero y segundo orden paraevaluar In 2 en base a los datos dados en el ejemplo 11.2: x0 = 1 f(xo) = o XI = 4 !(XI) = 1.386 294 4 x2 = 6 f ( ~ 2 )= 1.791759 5 Solución: el polinomio de primer ordenes [Ec. (11.21)] y, por lo tanto, la aproximación en x = 2 es 2 - 4 2 - 1 f l k ) = ~ O+"- l " 44 - 1 1.386 294 4 = 0.462 098 1 De manera similar, el polinomio de segundo orden se desarrolla como [Ec. (11.22)]: + (2 - 1)(2- 4) (6 - 1)(6 - 4) 1.791 759 5 = 0.565 844 37 Como se esperaba, ambosresultados coinciden muy de cerca con los que se obtuvieron previamente usando la interpolación polinomialde Newton.~
  • 364. 366 MÉTODOS NUMÉRICOS PARA INGENIEROS En resumen, paralos casos en dondeel orden del polinomio se des- conozca, el método de Newton tiene ventajas debido a que profundiza en el comportamiento delas diferentes fórmulas de orden superior. Ade- más, la aproximación del errordada porla ecuación (1l.18),en general, puede integrarse fácilmente en los cálculos de Newton ya que la aproxi- mación usa una diferencia dividida (Ejemplo 11.5).De esta forma, des- de el punto de vista de cálculo, a menudo,se prefiere el método de Newton. Cuando se va a llevar a cabo sólo una interpolación, ambos méto- dos, el de Newton y el de Lagrange requieren de un esfuerzo decálculo similar. Sin embargo, la versión de Lagrange esun poco másfácil de pro- gramar. También existen casos en dondela forma de Newton es mássus- ceptible a los errores de redondeo (Ruckdeschel, 1981).Debido a esto y a que no requiere calcular y almacenar diferencias divididas, la forma de Lagrange se usa, a menudo, cuandoel orden del polinomio se cono- ce a priori. EJEMPLO 11.7 Interpolación deLagrange usando computadora Enunciado del problema: en el paquete NUMERICOMP que acompaña a este textose encuentra un programa legible al usuario que implementa la interpolación de Lagrange. Se puede usar este paquete para llevar a cabo un problema de análisis asociado con el problema de paracaidista. Supóngase que se ha desarrolladoinstrumentación para medir la veloci- dad del paracaidista. Los datos medidos para una pruebaparticular son: Tiempo, Velocidad medida S v, cmls 1 800 3 2 310 5 3 090 7 3 940 13 4 755 El problema es determinar la velocidaddelparacaidista en t = 10 S y llenar el gran espacio de medidas entre t = 7 y t = 13s. Se sabe que el comportamiento delos polinomios de interpolación puede ser inespe- rado. Por lo tanto, se construyen los polinomios de órdenes 4, 3, 2 y 1 y se comparan los resultados. Solución: el programa NUMERICOMP se usa para construir los polino- mios de interpolación de cuarto, tercero, segundo y primer orden. Los resultadosson
  • 365. INTERPOLACldN 367 COEFICIENTEDE: Ordendel cuartotercer segundo primer cero calculado de polinomioorden ordenorden orden orden v para t = 10 S 4 -1.7630244.87501-392.871813.625-663.8675430.195 3 -4.49858676.093751.2392581742.6564874.838 2 -36.14584858.75-300.10354672.81 1 135.83332989.1675 Valor El polinomio de cuarto ordeny los datos de entrada segrafican como se muestra en la figura 11.loa. Es evidente en esta gráfica que el valor aproximado de y en x = 10es mayor que la tendencia total de los datos. FIGURA 11.10 Gráficas generadas por computadora, las cuálesmuestran a) interpolación de cuar- to orden; b) de tercer orden c) de segundo orden y d) de primer orden.
  • 366. 368 MÉTODOS NUMÉRICOS PARA INGENIEROS Enlafigura 11.10b a la d se muestrangráficas de los resultadosde los cálculos delos polinomios de interpolación de tercero, segundo y pri- mer orden. Se nota que al disminuir el orden del polinomio de interpola- ción se disminuyeelvalor aproximado dela vecindad a t = 10 s. Las gráficas de los polinomios de interpolación indican quelos polinomios de orden superior tiendena descomponer la tendencia de los datos. Estosu- giere que los polinomios de primero o segundo grado son más apropia- dos en este análisis en particular. Se debe recordar, sin embargo, que ya que se tratadedatosinciertos, la regresiónpodríasermás apropiada. 11.3 COMENTARIOSADICIONALES Antes de proceder con la siguiente sección, se deben mencionar dos te- masadicionales: la interpolacióncondatosigualmenteespaciados y la extrapolación. Ya que los métodos deNewton y Lagrange son compatibles con los datos espaciados en forma arbitraria, el lector debe preguntarse por qué se aborda el caso de los datosigualmenteespaciados (recuadro 11.2). Antes del advenimiento de las computadoras digitales, estos métodostu- vierongranutilidadenlainterpolacióndetablas condatosigualmente espaciados. De hecho se desarrolló un esquema conocido como tabla de diferenciasdivididas para facilitar la implementación de estas técnicas (la figura 11.5 es un ejemplodeestas tablas). Sin embargo, y debido a que las fórmulas son un subconjunto de los esquemas de Newtonde Lagrangecompatiblescon la computadora y ya que se dispone de muchas funciones tabularescomo rutinas de biblio- teca, la necesidad de puntos equiespaciados se fue perdiendo. Por esta razón, se han incluido en esta parte del libro por su importancia en partes posterioresdel mismo. En particular, se pueden emplearenla derivación de fórmulas de integraciónnuméricaqueempleancomúnmentedatos equiespaciados (capítulo 13). Ya quelasfórmulasdeintegración numé- rica tienen importancia en la solución de ecuaciones diferenciales ordinarias. el material del recuadro 11.2 también tiene importanciaen el capítulo 17. RECUADRO 11.2 lnterpolación con puntos igualmente epaciados Si los datos se encuentran igualmente espaciadosy en or- En donde h es el intervalo, o tamaño del paso, entre los den ascendente, entonces la variable independiente su- datos. En base a esto, las diferencias divididas finitas se pone valores de pueden expresar en forma concisa. Porejemplo, la segun- da diferencia dividida es
  • 367. INTERPOLAC16N 369 que se puede expresar como ya que x, - x1 = x1 - x2 = (xo- x?)/2 = h. Ahora recuérdese que la segunda diferencia dividida hacia ade- lante A2j(xo)es igual al numerador de la [Ec. (3.3111. A2f(x0) = f(x0) - 2f(xJ + f(x2) Por lo tanto, la ecuación (B11.2.1)se puede representar mediante: o. en general. [B11.2.2] Usando la ecuación (Bll.2.2),el polinomio de interpola- ción de Newton [Ec. (11.15)]se puede expresar enel ca- so de datos igualmente espaciados como A"f (x0)+- n !h" (X - XO)(X - xo - h) {X - xo - (n - 1)h) + R n [B11.2.3] en donde el residuo es el mismo de la ecuación (11.16). Esta ecuación se conoce como fórmula de Newton ofórmula hacia adelante de Newton -Gregory. Esta se puedesim- plificar más aún definiendo una nueva cantidad, (Y: X" h (y=- Esta definición se puedeusar para desarrollar la siguiente expresión simplificada de los términosen la ecuación (8112.3): los cuales pueden sustituirse en la ecuación (B11.2.3) para dar (a - n + 1) + R, [B11.2.4] en donde Esta notación concisa tieneutilidad en la derivación y aná- lisis de error de las fórmulas de integración del capítulo 13. Además de la fórmula hacia adelante, existen tam- bién lasfórmulas centrales y hacia atrásdeNewton- Gregory. Se puedeconsultar Carnahan, Luthery Wilkes (1969)para mayor información acerca dela interpolación de datos igualmente espaciados. La extrapolación es el proceso de calcular un valor de f(x)que cae fuera delrangode los puntosbase conocidos, xo,x1 ,. . . , x, (Fig. 11.11). En una sección anterior,se dijo que la interpolación más exacta usualmente se obtiene cuando las incógnitas caen cerca de lospuntos base. Obvia- mente, esto no sucede cuando las incógnitascaen fuera del rango, y por lo tanto, elerrorenla extrapolaciónpuedeser muy grande. Como se
  • 368. 370 MÉTODOS NUMÉRICOSPARAINGENIEROS FIGURA 1 1 . 1 1 Ilustración de las posiblesdivergenciasdeunapredicciónextrapolada. La extrapalación se basa en el ajuste de una parabola a través de los primeros tres puntos. muestra en la figura 11.11,la naturaleza abierta-en-los-extremosde la ex- trapolación representa un paso en la incógnita porque el proceso extien- de la curva más a116 de la región conocida. Como tal, la curva verdadedra diverge fácilmente de la predicción. Por lo tanto, se debe tener cuidado extremo en casos donde se deba extrapolar. El caso de estudio 12.1en el capítulo siguiente muestra un ejemplo del riesgo que se corre al pro- yectarse más allá de los límites de los datos. 11.4 INTERPOLACIÓN SEGMENTARIA (SPLINE) Enla sección anterior se usaron polinomios de n-ésimo orden para in- terpolar entre n + 1puntos.Porejemplo, en ochopuntos,se deriva un polinomio perfecto de séptimo orden. Esta curva captura todos los ser- penteos (al menos considera hasta derivadas de séptimo orden) sugeri- dos por los puntos. Sin embargo, existen casos endonde estas funciones pueden llevar a resultados erróneos. Una alternativa es la de aplicar poli- nomios de orden inferior a subconjuntos de datos. Estos polinomios co- nectados se llamanfuncionesde interpolación segmentaria (en inglés, spline functions).
  • 369. INTERPOlAC16N 371 Por ejemplo,las curvas de tercer orden empleadas para conectar ca- da par de datos se llaman funciones deinterpolación cúbica segmentaria (del inglés cubic splines). Estas funciones tienen la propiedad adicional de que las conexiones entre ecuaciones cúbicas adyacentes son visual- mente suaves. Superficialmente parece que la aproximación segmentaria de tercer orden es inferior a la expresión de séptimo orden. El lector puede preguntarse por qué la interpolación segmentaria siempre es preferible. FIGURA 1 l. 12 Representación visual de una situaciónen dondela interpolación seg- mentaria (spline) es meior a la interpolación polinomial de orden supe- rior. La función muestra unsalto abrupto en x = O. En losincisos a) al c) se muestra que el cambio abrupto indica oscilaciones con la inter- polación polinomial. Encontraste y debido a que se limita a curvas de tercer orden con transiciones suaves, la interpolaciónsegmentaria d)pro- porciona una aproximación mucho más aceptable.
  • 370. 372 METODOS NUMERICOSPARA INGENIEROS Enlafigura 11.12 se ilustra un caso en donde la interpolación seg- mentaria se lleva a cabo mejorqueconpolinomiosdeordensuperior. Este es el caso donde una función es generalmente suave pero muestra un cambio abrupto en algún lugar de la región de interés.La figura 11.12 es un caso extremode este cambio y sirveparailustrarel punto. Enlasfiguras 11.12~hasta la 11.12~se ilustra cómo los polinomios de orden superior tienden a balancearse a través de oscilaciones bruscas enla vecindad de un cambio abrupto. En contraste la interpolación seg- mentaria también conecta a los puntos, pero como está limitada a cam- bios de tercer orden, las oscilacionesse mantienen mínimas. De ahí que la interpolación segmentaria proporcione una aproximación superior del comportamientodelasfuncionesquetienencambioslocalesabruptos. El concepto de interpolación segmentaria se originó de la técnica de uso de una lámina de plástico delgada (llamadacuruigrufo, en inglés spli- ne) eneltrazodecurvassuaves a travésde un conjuntodepuntos. El proceso se muestra enla figura 11.13sobre un conjuntode cinco tachuelas (datos).En esta técnica, el dibujantecoloca papel sobreun tablero de ma- dera y clava tachuelas en el papel (y enel tablero) enla posición de los datos. Al pasar un hilo entre las tachuelas resulta una curva cúbica sua- ve. De ahí que se haya adoptadoel nombre de “interpolaciónsegmenta- ria” (en inglés“cubicspline”)parapolinomiosdeestetipo. En esta secciónse utilizan primero funciones lineales simples parain- troducir algunosconceptos y problemas básicosasociadoscon la interpo- lación segmentaria. Despuésse deriva un algoritmo para ajustar polinomios FIGURA 1l. 13 Técnica de dibujo para trazar curvas suaves utilizando un curvígrafo, da- dos una serie de puntos. Nótese como la unión de un punto a otro se realiza mediante diferentes tipos de curvas. A este tipo de interpolación de punto Q punto (segmentaria)se conoce como interpolación segmen- taria natural (natural spline).
  • 371. INTERPOLACldN 373 de segundo orden a los datos. AI final, se presenta material sobre inter- polacióncúbica segmentaria, la cuál es laversiónmáscomún y útil en la práctica de la ingeniería: 11.4.1 Interpolación segmentaria lineal Laconexiónmássimpleentre un par de puntosesunalínea recta. Se pueden definir los polinomios interpolantes de primer orden medianteun conjunto de puntos ordenados y definirse como un conjunto de funcio- neslinealesqueunen a los puntos: en donde mi es la pendiente de lalínearectaqueunelospuntos: r11.231 Estas ecuaciones se usanen la evaluación de funciones de cualquier punto entre x. y x,, localizando primeroel intervalo dentro del que se en- cuentra el punto. Después se usala ecuación apropiada y se determina el valor funcional dentro del intervalo. Obviamente,el método es idénti- co a la interpolaciónlineal. EJEMPLO 11-8 lnterpolación segmentaria de primer orden Enunciado del problema: ajústense los datosdelcuadro 11.1 coninter- polaciónsegmentariadeprimer orden. Evalúese lafunciónen x = 5. CUADRO 11.1 Datospor aiustar con funciones segmentarias X {(x) 3.0 2.5 4.5 1.o 7.0 2.5 9.0 0.5
  • 372. 374 METODOS NUMERICOS PARA INGENIEROS Solución: los datos se pueden usar para determinar las pendientes entre puntos. Por ejemplo, enelintervalode x = 4.5 a x = 7 la pendiente se puedecalcularusando la ecuación (1123): I m = 2.5 - 1.0 7.0 - 4.5 = 0.60 Los pendientessobre los otrosintervalos se pueden calcular, y los po- linomios de primerorden se graficanenlafigura ll.4a. El valorpara x = 5 es 1.3. Unainspecciónvisualsobrelafigura 11.14~1indicaque laprincipal desventaja de los polinomios de primer orden es que noson uniformes. En esencia, en los puntos donde coinciden los polinomios (llamados no- dos), la pendientecambiaabruptamente. En términos formales, la pri- mera derivada de la función es discontinua en estos puntos. Esta deficiencia se supera conel uso de polinomios de orden superior, que aseguranuni- formidad en los nodos igualando derivadas enesos puntos, como se mues- traenlasiguiente sección. 11.4.2 lnterpolación cuadratica segmentaria Para asegurar que las m-ésimas derivadas sean continuas en los nodos, se debe usar un polinomiode al menos (m + 1)-ésimoorden. Los poli- nomios de tercer ordeno cúbicos se usan más frecuentementeen la práctica asegurandocontinuidad enlaprimera y segunda derivada. Aunque las derivadasdeordensuperiorseandiscontinuas al usarsepolinomios de tercer orden,en general,no se detectan visualmente y por ende, se ignoran. La interpolación cúbica segmentaria se estudia en una secciónsubse- cuente. Antes de ésta seilustrael concepto deinterpolacióncuadrática segmentaria usando polinomiosde segundo orden. Estos “polinomiosma- dráticos” tienen laprimeraderivadacontinuaen los nodos. Aunque los polinomios cuadráticos no garantizan segundas derivadas iguales enlos no- dos, sirven muy bien para demostrar el procedimiento general en el de- sarrollodepolinomiosinterpolantessegmentariosdeordensuperior. El objetivo de los polinomios cuadráticoses el de obtener un polino- mio de segundo orden para cada uno de los intervalos entre los puntos. El polinomio paracada uno de los intervalosse representa generalmente como: fi(x)= aix2-t bix + ci [11.24j
  • 373. INTERPOLAC16N 375 FIGURA 1l. 14 Ajustecon interpolaciónsegmentariasobreunconjunto de cuatro pun- tos. a) interpolación segmentaria lineal;b)interpolación segmentaria cua- drática y c) interpolación cúbica segmentaria, con un polinomio cúbico interpolante que también aparece en la gráfica. Se haincluidolafigura 11.15paraayudar a clarificarlanotación. Para los n + 1puntos (i = O, 1,2,. . . , n), existen n intervalos, y por lo tan- to, 3n incógnitas constantes por evaluar (lasp, las b y las c).Por lo tanto, se requieren 3n ecuaciones o condiciones para evaluar las incógnitas.Es- tas son: 1. Los valores de las funciones deben ser iguales en los nodos interio- res. Esta condiciónserepresentamediante: [11.25] [11.26]
  • 374. 376 METODOSNUMERICOS PARA INGENIEROS FIGURA 11.15 Notación usadaen la derivación de interpolación segmentaria cuadráti- ca. Nótese que hay n intervalosy n + 1 puntos. El ejemplo que se mues- traes para n = 3. para i = 2 hasta n. Como se usan sólo los nodos interiores, las ecuacio- nes (11.25) y (11.26) proporcionancadauna n - 1condiciones, con un total de 2n - 2. 2. La primera y la última función deben pasar a través de los puntos fi- nales. Esto agregados ecuaciones adicionales: [11.27] [11.28] con un total de 2n - 2 + 2 = 2n condiciones. primeraderivada enla ecuación (11.22)es: 3. Las primeras deriuadas en los nodos interiores deben ser iguales. La f '(x) = 2ax + b Por lo tanto, la condición se representa generalmente cómo: íkblxi+ bi-l = 2aixi+ bi E11.291 para i = 2 hasta n. Esto proporcionaotras n - 1 condicionescon un totalde 2n + n - 1 = 3n - 1. Debido a que hay 3n incógnitas, se tiene una condición menos. A menos que exista una información adicional en relación a las funciones o sus derivadas, se debe escoger
  • 375. INTERPOLACI~N 377 arbitrariamente una condición para calcular eficientemente las cons- tantes. Aunque existen algunas alternativas diferentesque se pueden hacer, aquí se escoge la siguiente: 4. Se supone que la segunda derivada es cero en el primer punto. Ya que la segunda derivada de la ecuación (11.24) es 2a,esta condición se expresa matemáticamente cómo: al = O [11.30] La interpretación visual de esta condición es que los primeros dospun- tos se conectarán medianteunalínea recta. EJEMPLO 11.9 Interpolacion cuadráticasegmentaria Enunciado del problema: ajústense polinomios cuadráticos-por segmen- tos a los datos usados en el ejemplo 11.8 (Cuadro 11.1). Usense los re- sultadosparacalcularelvalorpara x = 5. Solución: en este problema, se tienencuatrodatos y n = 3 intervalos. Por lo tanto, se debendeterminar 3(3)= 9 incógnitas. Las ecuaciones (11.25)y (11.26) llevana 2(3) - 2 = 4 condiciones. 20.25~1~+ 4.5bl + c1 = 1.0 2 0 . 2 5 ~+ 4.5b2 + c2 = 1.0 49a2 + 7b2 + c2 = 2.5 49a3 + 7b3 + c3 = 2.5 Pasando laprimera y laúltima función por los valores iniciales y finales agrega dos más: [Ec. (11.27)] gal + 3bl + c1 = 2.5 y [Ec. (11.28)] 81a3 + 9b3 + c3 = 0.5 Lacontinuidad de lasderivadas crea adicionalmente 3 - 1 = 2 [Ec. (11.29)]:
  • 376. 378 MÉTODOS NUMÉRICOS PARA INGENIEROS Finalmente, la ecuación (11.30)especifica que al = O. Ya queesta ecuación especifica al exactamente, el problema se reduce aresolver ocho ecuaciones simultáneas. Estas condiciones se pueden expresar en forma matricial como 4.5 1.0 0.0 0.0 0.0 0.0 0.0 0.0 3.0 1.0 0.0 0.0 1.0 0.0 0.0 0.0 o.o 20.25 49.00 o.O o.o 0.0 -9.00 14.00 0.0 0.0 4.5 1.0 7.0 1.0 0.0 0.0 0.0 0.0 0.0 0.0 -1.0 0.0 1.0 0.0 0.0 0.0 o.o 49.00 o.o 81.00 o.o - 14.00 0.0 0.0 0.0 0.0 0.0 0.0 7.00 1.00 0.0 0.0 9.00 1.00 0.0 0.0 -1.00 0.0 1.0 1.0 2.5 2.5 2.5 0.5 o.o o.o Estas ecuaciones se resuelven usando las técnicas de la parte 111 con los resultados: al = O bl = "1 c1 = 5.5 a2 = 0.64 b2 = -6.76 c2 = 18.46 a3 = -1.6 b3 = 24.6 ~3 = -91.3 los cuales se sustituyen en las ecuaciones cuadráticas originales desarro- llando la relación siguiente para cada intervalo: fI(X) = "x + 5.5 3.0 5 x 5 4.5 f2(x) = 0 . 6 4 ~ ~- 6.76~+ 18.46 4.5 5 X 5 7.0 f3(~)= -1.6~' + 24.6~- 91.3 7.0 5 X 5 9.0 la predicción para x = 5 es, por lo tanto f2(5) = 0.64(5)' - 6.76(5)+ 18.46 = 0.66 El ajuste polinominal segmentario totalse muestra en la figura 11.14b. Nótese que hay dos inconvenientes enelajuste: 1)la línea recta que une los primeros dos puntosy 2) el polinomio del último intervalo parece ser- pentear demasiado alto. Los polinomios segmentarios cúbicos de la si- guiente sección no muestran estos incovenientes y como consecuencia, en general son mejores métodos de interpolaciónsegmentaria. 11.4.3 lnterpolaciónsegmentaria El objetivo de la interpolación cúbica segmentaria es obtener polinomios de tercer orden para cada uno delos intervalos entre nodos, dela forma fi(x) = aix3+ bix2+ cix + di [11.31]
  • 377. INTERPOLACldN 379 Por lo tanto, para los n + 1 puntos (i = O, 1, 2,. . . , n ) ,existen n inter- valos y. por lotanto, 4 n incógnitas constantespor evaluar. Como sehizo parapolinomios cuadrájicos, ahora se requierede 4n condicionespara evaluarlasincógnitas.Estas son: 1. Los valores de la función deben seriguales en los nodos interiores (2n - 2 condiciones). 2. La primera y la última funciones deben pasar a través de los puntos finales (2 condiciones). 3. Las primeras derivadas en los nodos interiores deben seriguales (n - 1 condiciones). 4. Las segundas derivadas en los nodos interiores deben ser iguales (n - 1 condiciones). 5. Las segundas derivadas enlos nodos finales son cero (2condiciones). La interpretación visual de la condición 5 es que la función sea una línea recta en los nodosfinales.Debido a la especificación de estacondición es que se le llama interpolación segmentaria “natural”.Se le da este nombre ya que el polinomio interpolante se comporta de manera natural en este esquema (Fig. 11.13). Si elvalordela segundaderivadaenlos nodos finales fuese diferente de cero (es decir, existe alguna curvatura),enton- ces esta informaciónse usaría alternativamente para proporcionar lasdos condiciones necesarias. Los cincotiposanteriores de condicionesproporcionan un totalde 4n ecuacionesnecesarias para encontrarlos 4n coeficientes. Mientras que es posibledesarrollarinterpolacióncúbicasegmentariaconeste esque- ma, aquí se presentauna técnica diferente que requiere únicamente de la soluciónde n - 1 ecuaciones. Aunque laderivacióndeestemétodo (recuadro 11.3) es algo menos directo que el de interpolación cuadrática segmentaria, la ganancia en eficiencia bienvaleel esfuerzo. RECUADRO 11.3 Obtención de la interpolación cúbica segmentaria El primer pasoen la obtención(Chene y Kincaid, 1980) x - xi se basa en la observación de que debidoa que cada pare- ja de nodos está conectada por un polinomio cúbico, la segundaderivadadentro intervalo esuna línea [B11.3.1] recta. La ecuación (11.31)se puede derivar dos veces para verificar esta observación. Con base a lo anterior, las se- gundas derivadas se representan mediante los polinomios en donde f,” (x)es el valor de la segunda derivada en el de interpolación de primer ordendeLagrange[Ec. primer nodo x dentrodel i-ésimointervalo. Por lo tanto, x - xi-1 xi-1 - xi xi - xi-1 fl’(x) = f”(Xi-1)~ +f“(Xi)_ _ _ c (11.21)l: estaecuaciónesuna línea rectaqueconecta la segunda
  • 378. 380 METODOSNUMERICOSPARAINGENIEROS derivada en el primer nodo f”(xiPl)con la segunda deri- vada en el segundo nodo f”(x,). En seguida, la ecuación (B11.3.1)se integra dos ve- ces y se obtiene una expresión para ft(x).Sin embargo, esta expresión contendrá dos incógnitasconstantes de in- tegración. Estas constantes se evalúan invocando lascon- diciones de equiespaciamiento, f(x) debe ser igual f(x,-J en y f(x) debe ser igual a !(x,) en x,. Llevando a ca- bo estas evaluaciones,resulta la siguiente ecuacióncúbica: Ahora, esta expresión es mucho más complicadapara los polinomios de interpolación segmentariaen el i-ésimo in- tervalo, digamos, la ecuación (11.31).Sin embargo, nó- tese que esta contiene sólo dos “coeficientes” incógnitas, las segundas derivadas al principio y al final del intervalo, f’ ’h-1) y f’ ’(xi).Por lo tanto, si se determina propia- mente la segunda derivadaen cada nodo, la ecuación (B11.3.2)es un polinomio de tercer orden que se usa pa- rainterpolar dentro de un intervalo. Las segundas derivadas se evalúan usando la condi- ción de que lasprimerasderivadasen los nodos deben ser continuas: f I-1(Xi) = f I(Xi) [B11.3.3] La ecuación (B11.3.2)se deriva y se obtiene una expre- sión de la primera derivada. Si esto se hace para los inter- valos (¡ - l)-ésimos e ¡-ésimos y los dos resultados se igualan, de acuerdo a la ecuación (B11.3.3),resulta la si- guiente relación: (Xi - xi-1) f“(Xi-1) + 2(Xi+l - X,-d f ’ W + (Xi+l - Xi) f“(Xi+l) Si la ecuación (B11.3.4)se escribe para todos los nodos interiores, resultan n - 1 ecuaciones simultáneas con n + 1 segundas derivadas incógnitas.Sin embargo, yaque este es un polinomio interpolante “natural”,las segundas derivadas en los nodos finales son cero y el problema se reduce a n - 1 ecuaciones con n - 1 incógnitas. Ade- más, nótese que elsistema de ecuaciones será tridiago- nal. Por lo tanto, no sólo se tiene que reducir el número de ecuaciones sino que también se calculan de forma que sean muy fáciles de resolver (recuérdeseel recuadro 7.2). La derivación del recuadro 11.3genera las siguientes ecuaciones cú- bicasparacadaintervalo: [11.32]
  • 379. INTERPOLACldN 381 Esta ecuación contiene únicamente dos incógnitas, las segundas deriva- das al final de cada intervalo. Estas incógnitasse evalúan usandola ecua- ciónsiguiente: Si estaecuación se escribepara todos los nodos interiores, se generan n - 1 incógnitas. (Recuérdese que las segundasderivadasenlos nodos finales son cero). La aplicación de estas ecuaciones se ilustraenel ejem- plosiguiente: EJEMPLO 11.10 Interpolación cúbica segmentaria Enunciado del problema: ajústese un polinomio cúbico por segmentos a los datosusadosen los ejemplos 11.8 y 11.9 (Cuadro 11.1). Utilicense losresultadosparacalcularelvaloren x = 5. Solución: el primer paso es emplear la ecuación (11.33) para generarun conjunto de ecuaciones simultáneasque se usaránenladeterminación de las segundas derivadas en los nodos. Por ejemplo, en el primer nodo interior, se usan los siguientes datos: xo=3 f(xo) = 2.5 x1 = 4.5 f(xJ = 1 x2 = 7 f(~2)= 2.5 Estosvalores se sustituyenenla ecuación (11.33) y se obtiene (4.5 - 3)fff(3)+ 2(7 - 3)frr(4.5)+ (7 - 4.5)f”(7) (2.5 - 1) +7 - 4.54.5 - 3 - 6- (2.5 - 1) Debido a la condición natural de los polinomios,f ”(3) = O, y la ecuación se reduce a 8f”(4.5)+ 2.5ff’(7)= 9.6 De manerasimilar, la ecuación (11.33)se aplica a los segundospuntos interiorespara obtener
  • 380. 382 METODOS NUMÉRICOS PARAINGENIEROS I 3.5f"(4.5)+ 9f"(7) = -9.6 Estas dos ecuaciones se resuelven simultáneamente cómo f"(4.5) = 1.745 45 f " (7) = -1.74545 Estos valores se sustituyen en la ecuación (11.32),junto con los valo- res de las x y de las !(x), obteniendo: 1.745452.5 fib) = (x - 3 ) 3 + (4.5 - x) 6(4.5 - 3) 4.5 - 3 1.745 45 (4.5 - 3) + [4.5f 3 - 6 1(x - 3) O fI(x) = 0.193 9 3 9 ( ~- 3)3+ 1.666 667(4.5- X) + 0.230 3 0 3 ( ~- 3) Esta ecuación es el polinomio cúbico interpolante para el primer interva- lo. Se pueden llevar a cabo sustituciones similares y desarrollar las ecua- ciones para el segundo y tercer intervalo: fi(x) = 0.116 364(7 - x)3 - 0.116364(x - 4.5)3 - O. 327 273 (7 - X) + 1.727 2 7 3 ( ~- 4.5) Y f3(~)= - 0.145455(9 - + 1.831818(9 - X) + 0 . 2 5 ( ~- 7 ) Las tres ecuaciones se emplean para calcular los valores dentro de cada uno de los intervalos. Por ejemplo, el valor en x = 5, que cae dentro del segundo intervalo, se calcula cómo fZ(5) = 0.116364(7 - 5)3- 0.116364(5 - 4.5)3 - 0.327273(7 - 5) + 1.727273(5 - 4.5) = 1.125 5 Se calculan otros valores y los resultados obtenidos se muestran en la fi- gura 11.14~. Los resultados del ejemplo11.8al 11.10se resumen en la figura 11.14. Nótese cómo se obtienen mejoras progresivas conforme se pasade inter- polación lineal a cuadrática y a cúbica. También se ha sobrepuesto un
  • 381. lNTERPOLACl6N 383 polinomiodeinterpolacióncúbica enlafigura 1 1 . 1 4 ~ .Aunque la inter- polación cúbica consiste de una serie de curvas de tercer orden, el ajuste resultante difiere del que se obtiene usando polinomios de tercerorden. Esto se debe a que la interpolación natural requiere de segundas deriva- das en los nodos finales, mientras que el polinomio cúbico no tiene esta restricción. 11.4.4 Algoritmo para la interpolación cúbicasegmentaria El método para calcular los polinomioscúbicosde la interpolación seg- mentariavistaenlas secciones anterioresesidealpara su implementa- ción en microcomputadoras. Recuérdese que por algunas manipulaciones inteligentes, el método se reduce a resolver n - 1 ecuaciones simultá- neas. Un beneficioadicionalobtenido de la derivación es que, como lo especifica la ecuación (11.33), elsistema de ecuaciones es tridiagonal. Como se describe en el recuadro 7.2, se dispone de los algoritmos para resolvertalessistemasdeunamaneraextremadamente eficiente. Enla figura 11.16 se presenta el algoritmode interpolación cúbica segmentaria elcualincluyelos aspectos antes mencionados. FIGURA 1 1 . 1 6 Algoritmo de interpoiación cúbicasegmentaria. PROBLEMAS Cálculos a mano 11.1 Calcúlese el logaritmo de 4 en base 10 (log 4) usando interpolaciónlineal. a) Interpolarentre log 3 = 0.477 1213 y log 5 = 0.698 970 O. b) Interpolar entre log 3 y log 4.5 = 0.653 212 5. Para cada una de las interpolacionescalcúlese el error relativo porcentual basado en el error verdaderode log 4 = 0.602 060 O. 11.2 Ajústese un polinorniodeinterpolación de Newton de segundo ordenpara apro- ximar log 4 usando los datos del problema 1 1 . 1 , Calcúlese el error relativo por- centual.
  • 382. 384 METODOS NUMERICOSPARAINGENIEROS 11.3 Ajústese un polinomio de interpolación de Newton de tercer orden para calcular log 4 usando los datos del problema 11.1además del punto adicional, log 3.5 = 0.544 068 O. Calcúlese el error relativo porcentual. 11.4 Dados los datos x I O 0.5 1.0 1.5 2.0 2.5 f(x) I 1 2.119 2.910 3.945 5.720 8.695 a) Calcúlese f (1.6)usando polinomios de interpolación de Newton de orden 1 hasta el 3. Escójase la secuencia de puntos de las aproximaciones para lograr exactitud. b) Úsese la ecuación (11.18)para calcular el error en cada predicción. 11.5 Dados los datos x 1 1 2 3 5 6 f(x) I 4.75 4 5.25 19.75 36 Calcúlese f (3.5)usando polinomios de interpolación de Newton de orden1hasta el 4. Escójanse los puntos base para obtener una buena aproximación.¿Qué in- dican los resultados respectoal orden delpolinomio que seusa para generar los datos en la tabla? 11.6 Repítanse los problemas 11.1al 11.3 usando polinomios deLagrange. 11.7 Repítase el problema 11.40usando interpolación deLagrange. 11.8 Repítase el problema 11.5 usandopolinomios de Lagrane de orden 1hasta el 3 11.9 Desarróllese la interpolación cuadrática segmentaria para los datos del problema 11.5 y calcúlese f (3.5). 11.10 Desarróllese la interpolación cúbica segmentaria para los datos del problema 11.5 y cálculese f (3.5). Problemas relacionados con la computadora 11.11 Vuélvasea programar la figura 11.7 de tal manera que sea legible al usuario. Entre otras cosas: a) Insértese documentación a lo largo del programa para identificar lo que cada una de las secciones debe hacer. b) Etiquétense las entradas y las salidas. c) Inclúyase la ecuación (11.18)para calcular el error de cada ordendel polino- mio (excepto el último). 11.12 Pruébese el programa que el lector haya desarrollado en el problema 11.11du- plicando los cálculos del ejemplo 11.5. 11.13 úsese el programa desarrollado porel lector en el problema 11.11y resuélvanse los problemas 11.1al 11.3. 11.14 Úsese el programa desarrollado en el problema 11.11y resuélvanse los proble- mas 11.4y 11.5.En el problema 11.4,utilícense todos los datos par desarrollar
  • 383. INTERPOLAC16N 385 los polinomiosdelordenprimariohastael quinto. En ambos problemas, grafí- quese el error calculado contra el orden. 11.15 Repítanse los problemas 11.12 y 11.13, usando el paquete NUMERICOMP aso- ciado con este texto. 11.16 Úsese el paquete NUMERICOMP con los ejemplos 11.6 y 11.7 11.17 Desarróllese un programa legiblealusuarioparalainterpolación de Lagrange. Pruébese con el ejemplo 11.7. 11.18 Desarróllese un programa legiblealusuario para la interpolación cúbica segmen- taria basado enlafigura 11.16 y en la sección 11.4.4. Pruébese el progama con el ejemplo 11.10. 11-19 Úsese el programa desarrolladoenel problema 11.18 para ajustar polinomios cúbicos con los datos de los problemas 11.4 y 11.5. En ambos casos, calcular f (2.25).
  • 384. C A P í T U L O D O C E CASOS DE LAPARTE IV: AJUSTEDECURVAS El propósito de este capítulo es el de hacer uso de los métodos de ajuste de curvas en la solución de problemas de ingeniería. Aligual que enlos otros casos de estudio de los otros capítulos, el primer ejemplo se toma del área general de laingeniería económica y de administración. A este caso lo siguen las cuatro áreas principalesde la ingenieria: química, civil, eléctrica y mecánica. Enel caso 12.1se hace un análisis sobre los datos de venta de com- putadoras. El ejemplo ilustra dos puntos importantes relacionados con el ajuste de curvas: 1) los polinomios de interpolación están bien condicio- nados para el ajuste de datos imprecisos y 2) la extrapolaciónes un pro- cedimiento,poco confiable cuandola relación de causa-efectosubyacente a la tendencia se desconoce. El caso 12.2, tomado de laingeniería química, demuestra cómo se puede linealizarun modelo no lineal y ajustarse a datos que usan regre- siónlineal. El caso 12.3 usa un esquema similar pero empleatambién interpolación polinomial para determinar la relación esfuerzo-deformación enproblemasdeestructuraseningenieríacivil. El caso 12.4 ilustra cómo se usa un simplepolinomiodeinterpola- ción para aproximar una función más complicada en ingeniería eléctrica. Finalmente, el caso 12.5demuestracómo se usala regresión lineal múl- tipleenelanálisis experimentaldedatos en un problema de fluidos to- madodelaingeniería mecánica. CASO 12.1 MODELO DE INGENIERíA DEVENTA DEPRODUCTOS (INGENIERíA EN GENERAL) Antecedentes: los ingenieros encargados del diseñoy fabricación de pro- ductos talescomo automóviles, televisoresy computadoras pueden ver- se implicadosen otros aspectos de los negocios. Estasimplicaciones incluyenlas ventas, mercadeo y distribucióndelproducto.
  • 385. 388 METODOS NUMERICOS PARA INGENIEROS Supóngase que un ingenierotrabajaparalacompañía que fabrica las Computadoras de tipoMicro 1 (véase el caso 6.1).Las consideracio- nes sobre planificacióny localizaciónde recursos (caso9.1)requieren que este ingeniero sea capaz de predecirhastacuándopermaneceránenel mercado lascomputadorasde su compañía enfuncióndel tiempo. En este caso de estudio, se proporcionan datos que describen el número de computadorasde la compañía que se encuentran en el mercado en dife- rentestiemposhasta 60 días (Fig. 12.1). Al ingeniero se lepide que examine estos datos y, usando método de extrapolación, calcular cuán- tas computadorasse tendrán disponiblesa los 90 días. Los datosse mues- tranenelcuadro 12.1. FIGURA 12.1 Número de computadoras en el mercadocontra el tiempo. CUADRO 12.1 Número de computadorasen el mercado en función del tiempo Tiempo,computadoras días en el mercado Número de ~~ ~~ ~ O 50 O00 10 35 O00 20 31 O00 30 20O00 40 1 9 O00 50 1 2 O00 60 1 1 O00
  • 386. CASOS DE LA PARTE IV: NUSTE DE CURVAS 389 Este análisis de tendenciay extrapolación se resuelve usando polino- mios de interpolación del primero hastael sexto grado así como con poli- nomios de regresión del primero hasta el sexto grado. Las curvas resultantes se usan para predicciones en los días55,65 y 90 que ilustran el contraste entreinterpolación y extrapolación. Solución: analizando lafigura 12.1 se observa que los datos no son uni- formes. Aunque el número de computadoras decrezca con el tiempo, la tasa de decrecimiento varía de intervalo a intervalo comportiíndose alea- toriamente. Por lo tanto, aún antes de que empiece el análisis, se puede esperarque la extrapolacióndeestosdatostraerádificultades. Los resultados del cuadro 12.2 confirman esta conjetura. Nótese que hay una gran discrepancia entre las predicciones con cada uno de los mé- todos. Para cuantificar la discrepancia se calcula la media, ladesviación estándar y un coeficiente devariacióndelas predicciones.El coeficiente de variación, que es lamediadivididaporladesviaciónestándar (multi- plicada por el loo%, proporciona una medida relativa de la variabilidad de cada conjunto de predicciones [ € c .(IV.5)J. Nótese cómo el coeficien- CUADRO 12.2 Resultados del ajuste de varios polinomios de interpolacibny poli- nomios¿e minimos cuadrados alos datos del cuadro12.1. Se mues- tra una interpolacibn ent = 55 y una extraplacibn de t 65 y 90. Nbteseque, debido aque las ecuaciones notmales estbnmalcon- dicionadas, el polinomio con minimos cuadrados de sexto orden di- fiere del polinomio de interpolacibn mbspreciso(recuerdese la sección 10.2.1) INTERPOlACldNEXTRAPOlACldN ~~ t 55 t = 65 t 90 Polinomios de interpolación Primer orden 1 1 525 10 475 7 850 Segundo orden10788 12 688 43 230 Tercer orden10 047 16 391 161 750 Cuartoorden8961 992 578 750 Quinto orden7 300 38 942 1 854 500 Sexto orden4 660 67 975 5 458 100 Media 8 880 28 411 1 350 700 Desviaciónestándar2 542 21 951 2128 226 Coeficientedevariaci6n9% Polinomios con mínimos cuadrados Primer orden9 820 3 573 -1 2 045 Segundoorden 1 1 829 10 939 16 529 Tercer orden 12 040 8 872 Cuartoorden 1 1 10112 73383104 Quinto orden 1 1 768 9 366 -78 906 Sexto orden426171 266 5 768 460 Media 10 203 18 910 910 623 Desviaciónestándar2 834 24 233 2 228408 Coeficiente de variación 28%128%245% -3 046
  • 387. 390 MGTODOS NUMERICOS PARAINGENIEROS te de variación es el menor para el valor interpolado en el día 55. Tam- bién, nótese cómo la mayor discrepanciase daen el día 90, que representa la extrapolación más lejana. Además, los resultados de los polinomios de extrapolación disminu- yen a medida que crece el orden, hasta el punto en queel caso de sexto orden lleva a la ridícula predicción de que en el día 90 se tendrán dispo- nibles 5 458 100 computadoras. La razón de este resultado sin sentido se ilustra en la figura 12.2,que muestra el polinomio de sextogrado. Ya que la tendencia sugerida por los datos no es uniforme, los polinomios de grado superior oscilan para intersectar cada punto.Estas oscilaciones llevan a interpolaciones falsas y extrapolaciones del tipo manifestado en la figura 12.2. Ya que la regresión no se restringe para pasar por cada uno de los puntos, algunas veces resulta útil para remediar esta situación. La figura 12.3que muestra los resultados de la regresión cuadrática y cúbica su- giere que es real para regresión de nivel bajo. Dentro del rango de los datos (t = O hasta 60 días), los resultados de las dos regresiones llevan a resultados poco consistentes. Sin embargo, cuando se extrapolan más allá de este rango, la predicción diverge. En t = 90, la regresión de se-
  • 388. CASOS LAPARTE IV: AJUSTEDE CURVAS 391 FIGURA 12.3 Gráfica de las curvas de regresión de segundoy tercer orden usadas para interpolar y extrapolar los datos de venta de computadoras. gundo orden lleva al resultado absurdo de que el número de computa- dorasha crecido, mientrasque laversiónde tercerordenlleva a la proyección ridícula de que habráun número negativo de computadoras. La razón principal de que la interpolación y la regresión estén malcon- dicionadas para este ejemplo es que ni siquiera se basanen un modelo de larealidadfísica.En ambos casos, el comportamientodelaspredic- ciones es puramente un artificio del comportamientode los números. Por ejemplo, ni los modelos tomanen consideración que más allá det = 60. elnúmerodecomputadorasdebeestarentre O y 11 000. Por lo tanto, si se estuviera interesadoen una aproximación rdpida del número decom- putadoras enel mercado, en un tiempo futuro,un ajuste y una extrapo- lación“visula”arrojaríaresultadosmásrealistas.Esto se debe a que se está conciente de lasrestriccionesfísicasdelproblema y se puede, por lo tanto, incorporarestasrestriccionesen la solucióngráficasimple. En el caso de estudio 18.1, se usa una ecuación diferencial para desarrollar un modelo que tenga una base teórica y, por consiguiente,lleve a resul- tadosmássatisfactorios. Porelladopositivo se debe notar que este ejemplo ilustra cómo la regresión tiene alguna utilidad para la interpolación entre puntos un tan- to erróneos o inexactos. Sin embargo,la primera conclusión de este caso es que la extrapolación siempre se debe llevar a cabo con cuidadoy precaución. CASO 12.2 REGRESIóNLINEAL Y MODELOS DEMOGRÁFICOS (INGENIERíA QUíMICA) Antecedentes: los modelosdecrecimientopoblacionalsonimportantes en muchos campos de la ingeniería. La suposición de que la tasa de cre-
  • 389. 392 METODOSNUMERICOS PARA INGENIEROS cimientode la población (dp/dt)es proporcional a la población actual (p) enel tiempo (f) es de fundamental importancia en muchos de los mode- los, enforma de ecuación - = / qdP dt [12.11