Your SlideShare is downloading. ×
Gil control
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Gil control

1,499
views

Published on

ert

ert


0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,499
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
55
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. FUNDAMENTOS DE ´ CONTROL AUTOMATICODE SISTEMAS CONTINUOS Y MUESTREADOS Dr. Jorge Juan Gil Nobajas ´ Dr. Angel Rubio D´ ıaz-Cordov´s e San Sebasti´n, 15 de agosto de 2010 a
  • 2. Fundamentos de Control Autom´tico de Sistemas Continuos y Muestreados a ´ c 2009 Jorge Juan Gil Nobajas y Angel Rubio D´ ıaz-Cordov´s eISBN 978-84-613-4618-9Dep´sito Legal SS-1094-2009 oReservados todos los derechos.Queda prohibida la reproducci´n total o parcial sin autorizaci´n previa. o oImpreso en Espa˜a nImprime: Unicopia, C.B.Paseo Manuel Lardiz´bal, 13 a a u ˜20018 San Sebasti´n (Guip´zcoa) ESPANA 2
  • 3. ´Indice generalI Control de sistemas continuos 91. Introducci´n o 11 1.1. Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2. Tipos de sistemas de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122. La transformada de Laplace 15 2.1. Definici´n y propiedades . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . 15 2.2. Transformada de Laplace de funciones elementales . . . . . . . . . . . . . . . . . . . . . . 16 2.3. Transformada inversa de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.4. Resoluci´n de ecuaciones diferenciales . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . 18 2.5. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183. Representaci´n de los sistemas o 21 3.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.2. Funci´n de transferencia de un sistema . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . 22 3.3. Modelos de sistemas f´ ısicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.3.1. Sistemas mec´nicos . . . . . . . . . . . . . a . . . . . . . . . . . . . . . . . . . . . . . 23 3.3.2. Sistemas el´ctricos . . . . . . . . . . . . . e . . . . . . . . . . . . . . . . . . . . . . . 26 3.3.3. Sistemas electromec´nicos . . . . . . . . . a . . . . . . . . . . . . . . . . . . . . . . . 28 3.3.4. Sistemas hidr´ulicos . . . . . . . . . . . . a . . . . . . . . . . . . . . . . . . . . . . . 29 3.3.5. Sistemas t´rmicos . . . . . . . . . . . . . e . . . . . . . . . . . . . . . . . . . . . . . 30 3.4. Diagrama de bloques de un sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.4.1. Reglas para la simplificaci´n de diagramas o de bloques . . . . . . . . . . . . . . . . 31 3.4.2. Ejemplo de circuito con dos mallas . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.4.3. Ejemplo de motor de corriente continua . . . . . . . . . . . . . . . . . . . . . . . . 33 3.5. Sistema de realimentaci´n negativa no unitaria . o . . . . . . . . . . . . . . . . . . . . . . . 34 3.6. Sistema de realimentaci´n negativa unitaria . . . o . . . . . . . . . . . . . . . . . . . . . . . 36 3.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364. Respuesta temporal 39 4.1. Sistemas de primer orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.1.1. Respuesta ante entrada impulso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.1.2. Respuesta ante entrada escal´n . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . 40 4.1.3. Respuesta ante entrada sinusoidal . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.1.4. Ejemplos de sistemas de primer orden . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.2. Sistemas de segundo orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.2.1. Respuesta subamortiguada ante entrada escal´n . . . . . o . . . . . . . . . . . . . . 43 4.2.2. Respuesta sobreamortiguada ante entrada escal´n . . . . o . . . . . . . . . . . . . . 44 4.2.3. Respuesta cr´ıticamente amortiguada ante entrada escal´n o . . . . . . . . . . . . . . 45 4.2.4. Respuesta oscilatoria ante entrada escal´n . . . . . . . . . o . . . . . . . . . . . . . . 45 4.2.5. Respuesta ante entrada impulso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.3. Sistemas de orden superior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.4. Influencia de los ceros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.5. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3
  • 4. 5. Error en r´gimen permanente e 51 5.1. Definici´n de error en r´gimen permanente . . . . . . . o e . . . . . . . . . . . . . . . . . . . . 51 5.2. Error en sistemas con realimentaci´n negativa unitaria o . . . . . . . . . . . . . . . . . . . . 51 5.2.1. Error de posici´n . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . 52 5.2.2. Error de velocidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 5.2.3. Error de aceleraci´n . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . 52 5.2.4. Resumen de errores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 5.3. Magnitud y unidades del error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5.4. Error en sistemas con realimentaci´n no unitaria . . . o . . . . . . . . . . . . . . . . . . . . 54 5.5. Error en sistemas con varias entradas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 5.6. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 5.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 566. Estabilidad 61 6.1. Definici´n de estabilidad . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . 61 6.2. Criterio de Routh-Hurwitz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.2.1. Estabilidad de los sistemas de segundo orden . . . . . . . . . . . . . . . . . . . . . 62 6.2.2. Estabilidad de los sistemas de tercer orden . . . . . . . . . . . . . . . . . . . . . . 63 6.2.3. Ejemplo num´rico de sistema de cuarto orden e . . . . . . . . . . . . . . . . . . . . . 63 6.3. Casos especiales del criterio de Routh-Hurwitz . . . . . . . . . . . . . . . . . . . . . . . . 63 6.3.1. Se anula el primer coeficiente de una fila . . . . . . . . . . . . . . . . . . . . . . . . 64 6.3.2. Se anula toda una fila . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 6.4. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 6.5. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667. Lugar de las ra´ ıces 67 7.1. Introducci´n . . . . . . . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . 67 7.2. Generalidades del m´todo . . . . . . . . . . . . . . . e . . . . . . . . . . . . . . . . . . . . . 68 7.3. M´todo para dibujar el lugar de las ra´ e ıces . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 7.3.1. Polos y ceros en lazo abierto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 7.3.2. As´ ıntotas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 7.3.3. Puntos del eje real que pertenecen al lugar de las ıces ra´ . . . . . . . . . . . . . . . 69 7.3.4. Puntos de ruptura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 7.3.5. Puntos de corte con el eje imaginario . . . . . . . . . . . . . . . . . . . . . . . . . . 69 ´ 7.3.6. Angulos de salida y llegada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 7.4. C´lculo de la ganancia . . . . . . . . . . . . . . . . . a . . . . . . . . . . . . . . . . . . . . . 70 7.5. Ejemplos de lugares de las ra´ ıces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 7.5.1. Sistema de tercer orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 7.5.2. Sistema de segundo orden con un cero . . . . . . . . . . . . . . . . . . . . . . . . . 71 7.6. Estabilidad relativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 7.6.1. Margen de ganancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 7.6.2. Margen de fase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 7.7. Lugar de las ra´ıces en funci´n de otros par´metros . o a . . . . . . . . . . . . . . . . . . . . . 75 7.8. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 768. Respuesta en frecuencia 79 8.1. Respuesta a una entrada sinusoidal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 8.2. El diagrama de Bode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 8.3. Diagramas de Bode de sistemas elementales . . . . . . . . . . . . . . . . . . . . . . . . . . 80 8.3.1. Ganancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 8.3.2. Retraso en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 8.3.3. Integrador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 8.3.4. Derivador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 8.3.5. Polo simple estable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 8.3.6. Cero simple con parte real negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 8.3.7. Polos estables complejos conjugados . . . . . . . . . . . . . . . . . . . . . . . . . . 84 8.3.8. Ceros complejo conjugados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 8.3.9. Polo simple con parte real positiva . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 8.3.10. Cero simple con parte real positiva . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 4
  • 5. 8.4. Diagrama de Bode de cualquier funci´n de transferencia o . . . . . . . . . . . . . . . . . . . 87 8.5. Diagrama de Bode de un sistema en lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . 88 8.5.1. Ancho de banda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 8.5.2. Margen de fase y margen de ganancia . . . . . . . . . . . . . . . . . . . . . . . . . 89 8.6. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 899. Compensadores de adelanto y de retraso de fase 91 9.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 9.1.1. Especificaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 9.1.2. Tipos de compensaci´n . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . 91 9.1.3. M´todo de ajuste . . . . . . . . . . . . . . . e . . . . . . . . . . . . . . . . . . . . . . 92 9.2. Compensador de adelanto de fase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 9.2.1. Ajuste por el lugar de las ra´ıces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 9.2.2. Ajuste por el diagrama de Bode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 9.3. Compensador de retraso de fase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 9.3.1. Ajuste por el diagrama de Bode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 9.3.2. Ajuste por el lugar de las ra´ıces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 9.4. Compensador de adelanto-retraso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 9.5. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10610.Controladores PID 111 10.1. Expresi´n general . . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . 111 10.1.1. Forma est´ndar . . . . . . . . . . . . . . . a . . . . . . . . . . . . . . . . . . . . . . . 111 10.1.2. Forma paralela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 10.1.3. Forma serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 10.2. Sentido f´ısico de la actuaci´n de un PID . . . . . o . . . . . . . . . . . . . . . . . . . . . . . 112 10.2.1. Actuaci´n proporcional . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . 113 10.2.2. Actuaci´n proporcional-derivativa . . . . o . . . . . . . . . . . . . . . . . . . . . . . 113 10.2.3. Actuaci´n proporcional-integral . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . 114 10.3. Ajuste experimental de PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 10.3.1. Ajuste de Ziegler-Nichols . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 10.3.2. Otros ajustes experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 10.3.3. Ejemplo comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 10.4. Ajuste anal´ ıtico de PIDs por asignaci´n de polos o . . . . . . . . . . . . . . . . . . . . . . . 118 10.5. Control con dos grados libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 10.6. Modificaciones del PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 10.6.1. Supresi´n del efecto kick-off . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . 120 10.6.2. Set-point weighting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 10.6.3. Filtro de la derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 10.6.4. Prevenci´n del efecto windup integral . . o . . . . . . . . . . . . . . . . . . . . . . . 122 10.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12311.Control en espacio de estado 127 11.1. Introducci´n . . . . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . . 127 11.2. Tipos de variables de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 11.2.1. Variables de fase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 11.2.2. Variables can´nicas o normales . . . . . o . . . . . . . . . . . . . . . . . . . . . . . . 129 11.2.3. Variables f´ ısicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 11.3. Controlabilidad y observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 11.4. Realimentaci´n completa de estados . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . . 131 11.4.1. Asignaci´n de polos . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . . 132 11.4.2. M´todo de Ackermann . . . . . . . . . . e . . . . . . . . . . . . . . . . . . . . . . . . 132 11.4.3. Controlador optimo cuadr´tico . . . . . ´ a . . . . . . . . . . . . . . . . . . . . . . . . 132 11.5. Realimentaci´n parcial de estados . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . . 133 11.6. Observadores de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 11.7. Realimentaci´n completa de estados observados o . . . . . . . . . . . . . . . . . . . . . . . . 134 11.8. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 5
  • 6. II Control de sistemas muestreados 13712.Introducci´no 139 12.1. Ejemplo de implementaci´n anal´gica o o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 12.2. Ejemplo de implementaci´n digital . . o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 12.3. Concepto de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 12.4. Concepto de cuantizaci´n . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 12.5. Clasificaci´n de los sistemas . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14113.Tratamiento matem´tico de la se˜ al muestreada a n 143 13.1. Definici´n de muestreo peri´dico . . . . . . . . . . . o o . . . . . . . . . . . . . . . . . . . . . 143 13.1.1. Funci´n portadora . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . 143 13.1.2. Funci´n temporal muestreada . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . 145 13.2. Transformada de Fourier de la funci´n muestreada . o . . . . . . . . . . . . . . . . . . . . . 145 13.3. El problema del aliasing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 13.3.1. Teorema de Shannon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 13.3.2. Aliasing y reconstrucci´n de la se˜al original o n . . . . . . . . . . . . . . . . . . . . . 147 13.3.3. Aliasing y ruido en la medida de la se˜al . . n . . . . . . . . . . . . . . . . . . . . . 14814.El muestreo ideal 149 14.1. Definici´n de muestreo ideal . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . 149 14.1.1. Funci´n portadora . . . . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . 149 14.1.2. Funci´n temporal muestreada . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . 150 14.2. Transformada de Fourier de la funci´n muestreada . . . . o . . . . . . . . . . . . . . . . . . 150 14.3. Transformada de Laplace de la funci´n muestreada . . . . o . . . . . . . . . . . . . . . . . . 151 14.3.1. Forma cerrada y regi´n de convergencia . . . . . . o . . . . . . . . . . . . . . . . . . 151 14.3.2. Forma alternativa para la transformada de Laplace . . . . . . . . . . . . . . . . . . 152 14.3.3. Periodicidad de la transformada de Laplace . . . . . . . . . . . . . . . . . . . . . . 152 14.3.4. Franjas primaria y complementarias . . . . . . . . . . . . . . . . . . . . . . . . . . 15215.Reconstrucci´n de la funci´n continua original o o 153 15.1. Filtro ideal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 15.1.1. Caracter´ısticas del filtro ideal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 15.1.2. Imposibilidad f´ısica de construcci´n del filtro ideal . . o . . . . . . . . . . . . . . . . 153 15.1.3. Reconstrucci´n de la se˜ al con el filtro ideal . . . . . . o n . . . . . . . . . . . . . . . . 154 15.2. Retenedor de orden cero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 15.2.1. Caracter´ısticas del retenedor de orden cero . . . . . . . . . . . . . . . . . . . . . . 155 15.2.2. Expresi´n de Laplace del retenedor de orden cero . . . o . . . . . . . . . . . . . . . . 156 15.2.3. Respuesta en frecuencia del retenedor de orden cero . . . . . . . . . . . . . . . . . 156 15.3. Retenedor de primer orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 15.3.1. Caracter´ısticas del retenedor de primer orden . . . . . . . . . . . . . . . . . . . . . 157 15.3.2. Expresi´n de Laplace del retenedor de primer orden . o . . . . . . . . . . . . . . . . 158 15.3.3. Respuesta en frecuencia del retenedor de primer orden . . . . . . . . . . . . . . . . 158 15.4. Retenedor polinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 15.4.1. Caracter´ısticas del retenedor polinomial . . . . . . . . . . . . . . . . . . . . . . . . 159 15.4.2. Expresi´n de Laplace del retenedor polinomial . . . . o . . . . . . . . . . . . . . . . 15916.La transformada Zeta 161 16.1. C´lculo de la transformada Zeta . . . . . . . . . . . . . a . . . . . . . . . . . . . . . . . . . 161 16.2. Tabla de la transformada Zeta de funciones elementales . . . . . . . . . . . . . . . . . . . 162 16.3. Teoremas de la transformada Zeta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 16.4. C´lculo de la transformada inversa de Zeta . . . . . . . a . . . . . . . . . . . . . . . . . . . 162 16.4.1. M´todo directo o de la expansi´n de potencia . . e o . . . . . . . . . . . . . . . . . . . 163 16.4.2. M´todo de la expansi´n en fracciones . . . . . . e o . . . . . . . . . . . . . . . . . . . 164 16.5. Funci´n de transferencia Zeta . . . . . . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . 164 16.6. Ecuaciones en diferencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 6
  • 7. 17.Diagramas de bloques en Zeta 167 17.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 17.2. Bloques en cascada con muestreadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 17.2.1. Un unico bloque continuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ . . . 167 17.2.2. Bloques continuos con muestreador intermedio . . . . . . . . . . . . . . . . . . . . 168 17.2.3. Bloques continuos sin muestreador intermedio: el problema de la convoluci´n o . . . 169 17.2.4. Sistemas en lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 17.3. M´todo de simplificaci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e o . . . 171 17.4. Sistemas con bloques continuos y discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . 17218.Correspondencia entre el plano S y el plano Z 173 18.1. Franja primaria y c´ırculo unitario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 18.2. L´ ıneas de par´metros constantes . . . . . . . . . . a . . . . . . . . . . . . . . . . . . . . . . 174 18.3. Variaci´n de la posici´n de los polos y ceros con T o o . . . . . . . . . . . . . . . . . . . . . . 174 18.4. C´lculo del n´mero de muestras por ciclo . . . . . a u . . . . . . . . . . . . . . . . . . . . . . 17619.An´lisis de estabilidad a 179 19.1. Criterio general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 19.2. Criterio de Jury . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 19.3. Transformaci´n bilineal y criterio o de Routh-Hurwitz . . . . . . . . . . . . . . . . . . . . . 180 19.4. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18120.Respuesta transitoria y r´gimen e permanente 183 20.1. Respuesta transitoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 20.2. R´gimen permanente . . . . . . e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 20.3. Error en r´gimen permanente . e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 20.4. Tipo de sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18621.Lugar de las ra´ ıces 187 21.1. Definici´n . . . . . . . . . . o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 21.2. Punto de partida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 21.3. M´todo gr´fico . . . . . . . e a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 21.4. Dise˜ o de compensadores de n adelanto de fase . . . . . . . . . . . . . . . . . . . . . . . . . 190 21.5. Ejemplo de dise˜o . . . . . n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 21.6. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19422.M´todos de digitalizaci´n e o 197 22.1. Generalidades de los m´todos de digitalizaci´n . . . . . . . . e o . . . . . . . . . . . . . . . . 197 22.2. Integraci´n num´rica . . . . . . . . . . . . . . . . . . . . . . . o e . . . . . . . . . . . . . . . . 197 22.2.1. M´todo trapezoidal o de Tustin . . . . . . . . . . . . . e . . . . . . . . . . . . . . . . 198 22.2.2. M´todo de Euler impl´ e ıcito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 22.2.3. M´todo de Euler expl´ e ıcito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 22.2.4. Otros m´todos num´ricos de integraci´n . . . . . . . . e e o . . . . . . . . . . . . . . . . 200 22.2.5. Ejemplo de digitalizaci´n usando integraci´n num´rica o o e . . . . . . . . . . . . . . . . 200 22.3. Derivaci´n num´rica . . . . . . . . . . . . . . . . . . . . . . . o e . . . . . . . . . . . . . . . . 201 22.3.1. M´todo de backwards . . . . . . . . . . . . . . . . . . e . . . . . . . . . . . . . . . . 201 22.3.2. Otros m´todos de derivaci´n . . . . . . . . . . . . . . e o . . . . . . . . . . . . . . . . 202 22.3.3. Ejemplos de digitalizaci´n de PID . . . . . . . . . . . o . . . . . . . . . . . . . . . . 203 22.3.4. Ejemplos de digitalizaci´n de filtros . . . . . . . . . . o . . . . . . . . . . . . . . . . 203 22.4. M´todo de equiparaci´n de polos y ceros . . . . . . . . . . . . e o . . . . . . . . . . . . . . . . 204 22.4.1. Caso particular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 22.4.2. M´todo de equiparaci´n modificado . . . . . . . . . . e o . . . . . . . . . . . . . . . . 205 22.4.3. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 22.5. M´todo de la equivalencia del retenedor . . . . . . . . . . . . e . . . . . . . . . . . . . . . . 20623.Respuesta en frecuencia 207 23.1. Aproximaci´n de la respuesta en frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . . 207 o 23.2. Ejemplo num´rico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 e 23.3. Respuesta en frecuencia exacta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 7
  • 8. 24.Espacio de estado muestreado 211 24.1. Introducci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 o 24.2. Ejemplo de modelizaci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 o 24.3. Control mediante realimentaci´n completa de estados . . . . . . . . . . . . . . . . . . . . 212 oA. Ampliaci´n de espacio de estado o 215 A.1. Matriz de transici´n de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 o 8
  • 9. Parte IControl de sistemas continuos 9
  • 10. Cap´ ıtulo 1Introducci´n o La ingenier´ de control formula leyes matem´ticas para el gobierno de sistemas f´ ıa a ısicos conforme auna serie de requerimientos o especificaciones. La aplicaci´n de estas leyes convierte al sistema f´ o ısico en unsistema controlado que, o bien posee una din´mica mejorada, o bien se ha convertido en un automatismo, aes decir, un sistema que es capaz de “auto-conducirse” siguiendo una consigna de referencia. Esta disciplina es esencial para la automatizaci´n de procesos industriales y brinda los medios ade- ocuados para lograr el funcionamiento optimo de cualquier sistema din´mico. Resulta muy conveniente ´ aque los ingenieros posean un amplio conocimiento de esta materia. La Parte I del presente libro describe las herramientas cl´sicas para el control de sistemas continuos en ael tiempo, es decir, aquellos sistemas en los que se puede medir y actuar en todo instante. En electr´nica, oeste tipo de sistemas se llaman anal´gicos. La Parte II estudiar´ los discretos o digitales, utilizando o amuchas de las herramientas que se describieron en la primera parte.1.1. Definiciones En esta disciplina se emplea mucho la palabra sistema, que se puede definir como una combinaci´n de oelementos que act´ an conjuntamente y cumplen un determinado objetivo. A veces se usar´ la expresi´n u a osistema din´mico, es decir, que evoluciona a lo largo del tiempo. a Sistema es un t´rmino muy general, que puede aplicarse casi a cualquier realidad f´ e ısica. As´ un veh´ ı, ıculoimpulsado por un motor de combusti´n interna es un sistema. Pero tambi´n el conjunto de elementos o eque regulan la temperatura de un edificio es un sistema. El primer ejemplo (el veh´ ıculo) ser´ un sistema ıaque goza de una cierta unidad. En cambio el segundo ejemplo (el sistema de calefacci´n de un edificio) oes un sistema distribuido, es decir, sus elementos est´n repartidos en distintos lugares (los sensores de atemperatura, la caldera, los radiadores e incluso el volumen de aire que se pretende calentar forman partedel sistema). Por otro lado, todos y cada uno de los elementos que componen un sistema pueden ser considerados,en s´ mismos, como sistemas. El veh´ ı ıculo antes citado es un sistema de locomoci´n, pero el motor de ocombusti´n interna que lo impulsa puede ser considerado, en s´ mismo, como un sistema al margen del o ıveh´ ıculo. Para evitar equ´ıvocos, se reservar´ el t´rmino planta para el designar el sistema que se desea controlar. a eDesde el punto de vista del control autom´tico, es muy importante identificar la planta, es decir, el sistema af´ ısico que se pretende controlar. As´ y siguiendo con el ejemplo del veh´ ı, ıculo, es muy distinto pretendercontrolar la velocidad del veh´ ıculo para que sea 120 km/h constante (cualquiera que sea la pendiente de lacarretera), que controlar la temperatura interior del autom´vil para que sea 22◦ C constante (cualquiera oque sea la temperatura exterior). De alguna forma, previamente a abordar el problema de control, hayque formular matem´ticamente las ecuaciones diferenciales que describen la din´mica de la planta. El a aapartado 3.3 se dedica precisamente a la formulaci´n de ecuaciones diferenciales de algunos sistemas of´ ısicos elementales. El concepto de perturbaci´n est´ incluido tambi´n en los ejemplos de control apuntados anterior- o a emente. La pendiente de la carretera para el control de la velocidad y la temperatura exterior para elcontrol de la temperatura interior son perturbaciones de dichos sistemas, es decir, agentes f´ ısicos que elingeniero no puede controlar o modificar pero s´ influyen en la variable f´ ı ısica que se quiere gobernar. Lapropia planta podr´ contener elementos variables que modifiquen la respuesta del sistema. En este caso, ıaen lugar de perturbaciones se denominar´n incertidumbres. Por ejemplo, la masa del veh´ a ıculo dismi- 11
  • 11. nuye conforme se consume el combustible, influyendo en la velocidad del veh´ ıculo. Es una incertidumbrede la planta, no una perturbaci´n exterior. o Tambi´n se han mencionado en los ejemplos una referencia para el sistema controlado (los 120 km/h epara la velocidad o los 22◦ C para la temperatura). Evidentemente se trata de una se˜al o magnitud f´ n ısicaque se desea para el sistema controlado. Un sistema bien controlado seguir´ con fidelidad la consigna de ala referencia. Un sistema mal controlado no ser´ capaz de alcanzar la referencia o la seguir´ con un error a aconsiderable. El error que existe entre la referencia deseada y la respuesta real del sistema tambi´n es un elemento ede inter´s en los sistemas controlados. De hecho, el error puede ser objeto de especificaci´n. Por ejemplo, e oel ingeniero puede dar como satisfactorio un sistema controlado que sea capaz de alcanzar la referenciacon un error menor que un determinado umbral. El elemento central del sistema de control es lo que denomina controlador. A veces se le llamacompensador o regulador. Este elemento es el encargado de actuar en la planta en funci´n de la referencia oo del error, para conseguir que dicha planta se comporte de acuerdo con las especificaciones de dise˜o. nEn el ejemplo del climatizador del veh´ ıculo, en funci´n de la temperatura interior y la referencia deseada, oel controlador introducir´ aire fr´ o caliente en el habit´culo. En el ejemplo del control de la velocidad a ıo ade crucero, en funci´n de la velocidad actual del veh´ o ıculo y de la referencia deseada, el controladorinyectar´ en el carburador m´s o menos caudal de gasolina o incluso puede activar el sistema de frenado. a aHablando impropiamente, el controlador es el elemento “inteligente” del sistema. La existencia de esteelemento de gobierno es lo que hace que un sistema sea autom´tico y no manual. Cuando un controlador aconsigue su objetivo a pesar de las incertidumbres de la planta, se dice que el controlador es robusto.1.2. Tipos de sistemas de control Con los elementos enunciados en el apartado anterior, es posible dibujar —de forma cualitativa—c´mo funciona un sistema de control. De momento, los distintos elementos del sistema se representar´n o acon nubes o “cajas negras” y las se˜ ales con flechas. n Un sistema controlado en lazo abierto es aquel cuyo controlador act´a s´lo en funci´n de la referencia u o odeseada para la respuesta del sistema (Fig. 1.1). Este tipo de control se puede emplear si las perturbacionessobre el sistema son peque˜ as y se tiene un buen modelo de planta. Tambi´n se utiliza este tipo de control n esi la se˜ al de salida del sistema es imposible o muy dif´ de medir. n ıcil _‚„ Z„As{$Bt ? i‚P‚„‚t{$s V{ Zs{$Bt ? i‚R}Z‚R s ]Bt „BjsIB„ _jst s Figura 1.1: Sistema controlado en lazo abierto En los sistemas controlados en lazo cerrado la variable controlada se mide y se utiliza para modificarla actuaci´n sobre la planta. Evidentemente, para realizar esta medida se necesita un sensor. A priori, un osistema controlado en lazo cerrado es m´s complejo y caro que un sistema controlado en lazo abierto. La aforma m´s habitual de “cerrar el lazo” en los sistemas de control es calcular el error entre la referencia y ala respuesta actual del sistema. El controlador act´a entonces en funci´n del error (Fig. 1.2). El concepto u ode realimentaci´n (feedback ) es uno de los principios b´sicos del control autom´tico. o a a _‚„ Z„As{$Bt ? i‚P‚„‚t{$s e„„B„ V{ Zs{$Bt ? i‚R}Z‚R s ]Bt „BjsIB„ _jst s ± 7‚tRB„ Figura 1.2: Sistema controlado en lazo cerrado Al margen de la arquitectura que tenga la ley de control, el sistema de control en el que se hace especialhincapi´ a la capacidad del sistema de seguir los cambios de la referencia se le denomina servosistema. eEn cambio, el sistema de control en el que se hace especial hincapi´ a la capacidad del sistema de rechazar elas perturbaciones exteriores y mantener una referencia constante, o que cambia muy lentamente, se ledenomina regulador. 12
  • 12. Sin pretender realizar una clasificaci´n exhaustiva de los tipos de sistemas de control, merece la pena ose˜ alar algunos de ellos, y especificar cu´les se tratar´n en este libro. As´ por ejemplo, si se atiende a la n a a ıvariaci´n en el tiempo de la ley de control se puede distinguir entre: o - Control fijo o est´ndar: La ley de control no var´ en el tiempo. Es interesante la planta es fija. a ıa Como ya se ha apuntado en el apartado anterior, se llama control robusto a aquel que funciona correctamente ante errores en la modelizaci´n o incertidumbres de la planta. o - Control adaptable (gain scheduling): La ley de la planta cambia, y se puede decidir para cada ley un controlador distinto. Aqu´ se selecciona una ley de control como se ve en la Fig. 1.3. ı - Control adaptativo (adaptive control ): El controlador cambia gradualmente en funci´n de una o estimaci´n de la planta que se actualiza en todo momento. Este tipo de estrategia es adecuada para o aquellos sistemas en los que el modelo de la planta var´ mucho a lo largo del tiempo. ıa _‚„ Z„As{$Bt ? ]Bt „BjS1 ? V{ Zs{$Bt i‚R}Z‚R s _jst s i‚P‚„‚t{$s e„„B„ ]Bt „BjSd ± 7‚tRB„ Figura 1.3: Sistema de control adaptable Si se atiende al n´mero de entradas y de salidas que posee el sistema, se denominan sistemas SISO u(single input, single output) los que poseen una unica entrada y una salida, y sistemas MIMO (multiple ´input, multiple output) si poseen varias entradas y varias salidas. Si las ecuaciones en diferenciales que describen el sistema, tanto la planta como el controlador, sonlineales entonces todo el sistema de control se denomina lineal. En cambio, si falta la propiedad de lalinealidad en la planta o el controlador, todo el sistema ser´ no lineal. a Por otro lado, la divisi´n de este libro en dos grandes partes alude a otra posible clasificaci´n de los o osistemas de control: los sistemas continuos, en los que la ley de control posee informaci´n de la planta y oact´a en todo instante de tiempo. Y los sistemas muestreados o discretos en los que la ley de control urecibe informaci´n y act´a en determinados instantes que suele imponer un reloj. La Parte II del presente o umanual se dedica al estudio de este ultimo tipo de sistemas. ´ Finalmente, si el sistema est´ descrito por ecuaciones diferenciales ordinarias se llama sistema de apar´metros concentrados, pero si est´ descrito por medio de ecuaciones diferenciales en derivadas a aparciales se llama de par´metros distribuidos. Un ejemplo de este ultimo tipo de sistemas puede ser a ´el control de la transmisi´n de calor a trav´s de una superficie, o el control de la vibraci´n de un punto o e ode una membrana. 13
  • 13. 14
  • 14. Cap´ ıtulo 2La transformada de Laplace En el a˜o 1782 Pierre Simon Laplace estudi´ la transformaci´n integral que lleva su nombre. Sin n o oembargo, no es hasta el periodo de 1880-1887 cuando Oliver Heaviside la aplica para la resoluci´n de oecuaciones diferenciales. Dado que en ingenier´ de control se usa mucho esta herramienta matem´tica, ıa ael presente cap´ ıtulo resume sus principales propiedades.2.1. Definici´n y propiedades o Se define la transformada de Laplace F (s) de una determinada funci´n temporal f (t) como: o ∞ F (s) = L [f (t)] = f (t)e−ts dt (2.1) 0 Donde f (t) es una funci´n real de variable real, generalmente el tiempo, y su transformada de La- oplace F (s) es una funci´n compleja de variable compleja. Para que exista la transformada de Laplace es osuficiente que la integral exista para alg´n valor s complejo. Se reservar´n las letras min´sculas para las u a ufunciones temporales y las may´sculas para sus transformadas de Laplace. u L f (t) − F (s) → (2.2) La transformada de Laplace no existe para cualquier funci´n temporal f (t). Una condici´n suficiente o o—pero no necesaria— de existencia, es que f (t) sea seccionalmente continua en [0, T ], ∀T > 0, y que seade orden exponencial cuando t → ∞, es decir, que ∃ M, T > 0 y α ∈ R / |f (t)| < M eαt ∀t > T . Lasfunciones que cumplen esta condici´n suficiente se suelen decir que pertenecen al conjunto A, es decir, of (t) ∈ A. Como la integral (2.1) se extiende desde cero hasta infinito, dos funciones cualesquiera que difieranunicamente en valores de tiempo negativos, poseen la misma transformada de Laplace. Es decir, los´valores de f (t) para t negativos, no influyen en la transformada de Laplace. Para que la relaci´n entre ouna funci´n y su transformada de Laplace sea biun´ o ıvoca, a partir de ahora s´lo se considerar´n funciones o acausales, es decir, aquellas que son nulas para tiempos negativos, f (t) = 0 ∀t < 0, y toman valores finitosen tiempos positivos. Para funciones f (t) causales y continuas1 para t > 0, entonces la relaci´n entre f (t) oy F (s) es biun´ıvoca, es decir, que para toda f (t) existe una unica F (s) y viceversa. ´ La variable compleja s tiene en m´dulo unidades de rad/s. Pero si el n´mero complejo lo dividimos o uen parte real y parte imaginaria, se puede considerar que tiene unidades de rad/s sobre el eje imaginarioy de s−1 sobre el eje real. Se observa en la definici´n de la transformada de Laplace, o e−ts = e−t(a+bj) = e−ta |−tb (2.3)que el exponente del m´dulo del n´mero complejo es adimensional si consideramos que a, que es la parte o ureal de la variable compleja s, tiene unidades de s−1 . El argumento tendr´ unidades de radianes si b, que aes la parte imaginaria de la variable compleja s, tiene unidades de rad/s. En la Tabla 2.1 se resumen las principales propiedades de la transformada de Laplace. La propiedadde la linealidad existe si f (t) y g(t) poseen transformada de Laplace. La propiedad de la derivaci´n real o 1 Para Laplace no ser´ estrictamente necesario que fueran continuas, porque afirma que dos funciones que difieran en un ıanumero finito o infinito de puntos aislados deben considerarse iguales. 15
  • 15. se da si f (t) es continua en el intervalo (0, ∞), f (t) es de orden exponencial cuando t → ∞ y la f (t) esseccionalmente continua en [0, T ], ∀T > 0. El resto de propiedades se dan simplemente si f (t) ∈ A. Porlo general, estas condiciones rara vez se tienen en cuenta ya que las variables f´ ısicas que se manejan eningenier´ de control son casi siempre funciones causales. ıa Tabla 2.1: Propiedades de la transformada de Laplace Propiedad Expresi´n o Linealidad L [αf (t) + βg(t)] = αF (s) + βG(s) t Integraci´n real o L[ 0 f (τ ) dτ ] = F (s) s df (t) Derivaci´n real o L dt = sF (s) − f (0+ ) Valor final l´ f (t) = l´ sF (s) ım ım t→∞ s→0 Valor inicial l´ f (t) = l´ sF (s) ım ım t→0+ s→∞ Traslaci´n en el tiempo o L [f (t − a)] = e−as F (s) Traslaci´n en Laplace o L [e−as f (t)] = F (s + a) Convoluci´n o L [f (t) ⊗ g(t)] = F (s)G(s) Escalado en el tiempo L [f ( α )] = αF (αs) t Conviene se˜alar que la traslaci´n de una funci´n en el tiempo hace que aparezcan los valores nulos de n o ola funci´n causal en tiempos positivos (ver Fig. 2.1). Este hecho se suele olvidar y es fuente de importantes oerrores. Ww0D Ww0 u yD 0 y Figura 2.1: Funci´n trasladada en el tiempo o2.2. Transformada de Laplace de funciones elementales En este apartado se calculan las transformadas de Laplace de algunas funciones elementales. La funci´n oescal´n unidad u(t) se define como: o 1 para t ≥ 0 u(t) = (2.4) 0 para t < 0 Su transformada de Laplace se obtiene por definici´n: o ∞ ∞ e−ts 1 U (s) = L [u(t)] = e−ts dt = = (2.5) 0 −s 0 s Para el caso de la funci´n pulso de area unidad p(t), tambi´n por definici´n: o ´ e o 1 α para 0 ≤ t < α p(t) = (2.6) 0 resto α α 1 −ts 1 e−ts 1 − e−αs P (s) = L [p(t)] = e dt = = (2.7) 0 α α −s 0 αs La funci´n impulso unidad δ(t) se define como: o ∞ ∞ para t = 0 δ(t) = , siendo δ(t) dt = 1 (2.8) 0 resto −∞ 16
  • 16. En este caso, su transformada de Laplace se puede obtener como l´ ımite de la funci´n pulso de area o ´unidad, cuando el par´metro α tiende a cero, es decir, a 1 − e−αs Δ(s) = L [δ(t)] = l´ ım = 1, (2.9) α→0 αsdonde se ha empleado el teorema de l’Hˆpital para el c´lculo del l´ o a ımite. Otra forma de obtener este mismoresultado es considerar funci´n escal´n unidad se obtiene integrando la funci´n impulso unidad: o o o t 1 Δ(s) U (s) = L [u(t)] = =L δ(τ ) dτ = =⇒ Δ(s) = 1 (2.10) s 0 s En cualquier caso, la funci´n impulso unidad δ(t) es un poco especial, y el camino inverso al que se oha usado en la demostraci´n anterior no funciona: o du(t) 1 Δ(s) = L [δ(t)] = L = s − u(0+ ) = 1 − 1 = 0 ¡falso! (2.11) dt s Este hecho no puede sorprender ya que la funci´n impulso es la derivada de la funci´n escal´n en un o o osentido impropio. Por otro lado, no se cumplen las condiciones se˜aladas para poder aplicar la propiedad nde la derivaci´n real. o Tabla 2.2: Transformadas de las entradas habituales en los sistemas Funci´n o f (t) F (s) Impulso unidad δ(t) 1 1 Escal´n unidad o u(t) = 1, para t > 0 s 1 Rampa unidad r(t) = t, para t > 0 s2 Aceleraci´n unidad o a(t) = 1 t2 , para t > 0 2 1 s3 Se˜aladas estas advertencias matem´ticas, las funciones que m´s se emplean como entradas en los n a asistemas controlados son precisamente aquellas que se obtienen al ir integrando sucesivamente la funci´n oimpulso unidad, como se observa en la Tabla 2.2. En la Tabla 2.3 se muestran las transformadas de otrasfunciones, definidas para tiempos positivos. Tabla 2.3: Transformadas de Laplace de diversas funciones f (t) F (s) f (t) F (s) e−at 1 s+a tk−1 (k−1)! sk te−at 1 (s+a)2 e−at − e−bt b−a (s+a)(s+b) tk−1 e−at (k−1)! (s+a)k sin at a s2 +a2 1 − e−at a s(s+a) cos at s s2 +a2 1−e−at t− a a s2 (s+a) e−at sin bt b (s+a)2 +b2 a2 1 − (1 + at)e−at s(s+a)2 e−at cos bt s+a (s+a)2 +b22.3. Transformada inversa de Laplace El proceso matem´tico de pasar de la expresi´n matem´tica en el dominio de Laplace a la expresi´n a o a oen el dominio del tiempo se denomina transformada inversa de Laplace. Su expresi´n es: o c+jω 1 f (t) = L −1 [F (s)] = l´ ım F (s)ets ds , (2.12) ω→∞ 2πj c−jωdonde c es cualquier constante real mayor que la parte real de cualquier polo de F (s). 17
  • 17. Evaluar la integral (2.12) puede ser bastante complicado por lo que se suele calcular acudiendo a laTabla 2.3. Si en la tabla no se encuentra una determinada funci´n F (s), se recomienda descomponerla oen funciones simples en s, de las cuales s´ se conozcan sus transformadas inversas. Como las funciones de ıLaplace que se van a utilizar suelen ser fracciones de polinomios en s, el c´lculo de transformadas inversas ase reduce a dividir estas expresiones en fracciones simples. s2 + 2s + 3 F (s) = (2.13) (s + 1)3 Como ejemplo, se va a calcular la funci´n temporal de la funci´n de Laplace F (s) de la ecuaci´n o o o(2.13). Lo primero que se hace es dividir la unica fracci´n en tres simples: ´ o A B C A + B(s + 1) + C(s + 1)2 F (s) = + + = (2.14) (s + 1)3 (s + 1)2 s+1 (s + 1)3 Las constantes A, B y C se calculan igualando coeficientes de los polinomios del numerador. Tambi´n ees posible obtenerlos igualando los numeradores despu´s de dar un valor num´rico a la variable s. Los e evalores num´ricos m´s adecuados son las ra´ de distintos monomios. De esta forma es posible determinar e a ıcesm´s r´pidamente las constantes. Para el caso anterior los valores de A, B y C son respectivamente 2, 0 a ay 1. Entonces: 2 1 F (s) = 3 + (2.15) (s + 1) s+1 f (t) = t2 e−t + e−t = e−t (1 + t2 ), para t > 0 (2.16)2.4. Resoluci´n de ecuaciones diferenciales o En este apartado se utiliza la transformada de Laplace para resolver ecuaciones diferenciales lineales.Sea la siguiente ecuaci´n diferencial o df (t) d2 f (t) dr(t) a0 f (t) + a1 + a2 2 = b0 r(t) + b1 , (2.17) dt dt dtdonde las condiciones iniciales son: df (0+ ) f (0+ ) = c0 , = c1 , r(0+ ) = d0 (2.18) dt Se aplica la transformada de Laplace a los dos miembros de la ecuaci´n: o a0 F (s) + a1 [sF (s) − c0 ] + a2 s2 F (s) − c0 s − c1 = b0 R(s) + b1 [sR(s) − d0 ] (2.19) b0 + b 1 s a1 c0 + a2 c1 − b1 d0 + a2 c0 s F (s) = R(s) + (2.20) a0 + a1 s + a2 s2 a0 + a1 s + a2 s2 La ecuaci´n diferencial (2.17) se convierte en una ecuaci´n algebraica en el dominio de Laplace. De o oesta forma es muy sencillo obtener la soluci´n (2.20) a la ecuaci´n diferencial, tambi´n en el dominio de o o eLaplace. La soluci´n en el dominio del tiempo se puede obtener calculando la transformada inversa de oLaplace de F (s), conocida la funci´n r(t). o2.5. Ejercicios resueltos - Ejercicio 1: Obtener la funci´n x(t) que cumple la ecuaci´n diferencial con condiciones iniciales o o no nulas: d2 x(t) dx(t) x(0+ ) = a 2 +3 + 2x(t) = 0, dx(0+ ) (2.21) dt dt dt =b Aplicando la transformada de Laplace a la ecuaci´n diferencial, o s2 X(s) − sa − b + 3 [sX(s) − a] + 2X(s) = 0, (2.22) 18
  • 18. la soluci´n en el dominio de Laplace es: o sa + 3a + b X(s) = . (2.23) s2 + 3s + 2 La soluci´n en el dominio del tiempo es: o sa + 3a + b 2a + b a + b x(t) = L −1 = L −1 − (2.24) s2 + 3s + 2 s+1 s+2 x(t) = (2a + b)e−t − (a + b)e−2t , para t > 0 (2.25)- Ejercicio 2: Obtener la funci´n x(t) que cumple la ecuaci´n diferencial con condiciones iniciales o o nulas: d2 x(t) dx(t) +2 + 5x(t) = 3u(t) (2.26) dt2 dt Aplicando la transformada de Laplace a la ecuaci´n diferencial, o 3 s2 X(s) + 2sX(s) + 5X(s) = , (2.27) s la soluci´n en el dominio de Laplace es: o 3 X(s) = . (2.28) s(s2 + 2s + 5) La soluci´n en el dominio del tiempo es: o 3 A Bs + C x(t) = L −1 = L −1 + 2 (2.29) s(s2 + 2s + 5) s s + 2s + 5 3 1 3 s+1 1 2 x(t) = L −1 + L −1 + (2.30) 5 s 5 (s + 1)2 + 22 2 (s + 1)2 + 22 3 1 x(t) = 1 − e−t cos 2t − e−t sin 2t , para t > 0 (2.31) 5 2 19
  • 19. 20
  • 20. Cap´ ıtulo 3Representaci´n de los sistemas o Los sistemas de control se pueden representar gr´ficamente de diversas formas, por ejemplo, mediante adiagramas de flujo o diagramas de Bond-Graph. Sin embargo, en este libro s´lo se emplear´n los diagramas o ade bloques. Previamente, se definir´ el concepto de funci´n de transferencia y se aplicar´ a distintos tipos a o ade sistemas f´ ısicos.3.1. Generalidades En la Fig. 3.1 se muestra la forma gr´fica m´s elemental de representar un sistema. En dicha figura a aaparecen tres elementos: 1) la variable f´ ısica de la entrada, que se representa con una flecha apuntandoal sistema, 2) la variable f´ ısica de la salida, que es la flecha dirigida del sistema al exterior, y 3) el propiosistema, representado aqu´ como una nube o “caja negra” del que se desconoce a priori su funcionamiento ıinterno. et „sIs 7sj$Is 7$R ‚8s Figura 3.1: Diagrama de un sistema cualquiera Esta forma tan elemental de representar un sistema permite al ingeniero establecer una primeradescripci´n del mismo, sus posibles partes, as´ como las diferentes l´ o ı ıneas de causalidad que se dan.Por ejemplo, en la Fig. 3.2 se muestra esquem´ticamente el sistema “central hidroel´ctrica”, que tiene a ecomo entrada el caudal de agua y como salida la tensi´n el´ctrica. Este sistema se puede dividir en dos o esubsistemas: 1) la turbina que trasforma el caudal de agua entrante en una velocidad de giro en su eje,y 2) la dinamo o alternador que convierte el giro mec´nico en tensi´n el´ctrica. a o e ]sZIsj q‚tR$Bt ? ]‚t „sj ]sZIsj z‚jB{$IsI q‚tR$Bt ? qZ„A$ts *$ts8B Figura 3.2: Diagramas equivalentes de una central hidroel´ctrica e Evidentemente se podr´ haber dividido el sistema completo en muchas otras partes, conservando todas ıalas representaciones igual validez. Tambi´n se podr´ haber encontrado otras variables intermedias entre e ıanla entrada y la salida, que unieran los distintos subsistemas, y que har´an referencia a otras realidades ıf´ ısicas o incluso sin sentido f´ısico, pero coherentes desde el punto de vista matem´tico. a El ingeniero evitar´ por todos los medios cambiar el orden natural de la causalidad. En el ejemplo aanterior, no debe definir la tensi´n como entrada y el caudal de agua como salida. Y esto aunque se opueda encontrar la relaci´n matem´tica inversa que deduce la segunda variable a partir de la primera. o aPor otro lado, existen infinitas formas de representar gr´ficamente un sistema cualquiera. Sin embargo, ahay formas m´s adecuadas que otras (por ejemplo, porque muestren las variables f´ a ısicas m´s importantes aque intervienen en el sistema). Encontrar el esquema o modelo m´s adecuado para un sistema f´ a ısico es uno de los principales retosa los que se enfrenta el ingeniero, pero no es el cometido de esta asignatura. Adem´s, cada ejemplo a 21
  • 21. mec´nico, el´ctrico, hidr´ulico, t´rmico, etc. podr´ requerir mucho tiempo de an´lisis y simplificaci´n. a e a e ıa a oSin embargo, en el apartado 3.3 se estudian algunos sistemas f´ ısicos cuyas ecuaciones diferenciales sepueden obtener f´cilmente aplicando las leyes fundamentales de cada disciplina. a Lo habitual es que las leyes matem´ticas aparezcan directamente en el enunciado del ejercicio. En esta aasignatura se supondr´n correctas y se tomar´n como punto de partida para la resoluci´n del problema. a a oSin embargo, en el ejercicio de su profesi´n, el ingeniero no suele aceptar de forma acr´ o ıtica cualquier leymatem´tica que se le sugiera. Muchas veces deber´ obtenerlas a partir de ensayos o incluso deducirlas a ate´ricamente. o Uno de los principales inconvenientes de trabajar con las leyes matem´ticas que describen un sistema es aque ingeniero puede perder f´cilmente el sentido f´ a ısico de los problemas de control. Conviene aqu´ recordar ıque detr´s de una ley matem´tica se esconde un sistema f´ a a ısico real, del que se trabaja s´lo con un modelo. o3.2. Funci´n de transferencia de un sistema o En los esquemas propuestos en el apartado anterior el funcionamiento interno del sistema o subsistemasera desconocido. Una forma de ofrecer esa informaci´n es escribir la ecuaci´n diferencial que relaciona la o oentrada con la salida. Sin embargo, lo habitual es trabajar en el dominio de Laplace (Fig. 3.3) definiendola funci´n de transferencia del sistema. o „w0D w0D 7$R ‚8s 7$R ‚8s pwXD gwXD twXD Figura 3.3: Diagramas generales de un sistema La funci´n de transferencia, en general G(s), de un determinado proceso o sistema es la relaci´n en o oel dominio de Laplace entre la funci´n de salida c(t) y su correspondiente entrada r(t), con condiciones oiniciales nulas para ambas funciones. La funci´n de transferencia es un invariante del sistema, es decir, opara cualquier entrada que se introduzca en el sistema, la salida que se obtiene siempre est´ relacionada acon la entrada a trav´s de la funci´n de transferencia. e o L [c(t)] C(s) G(s) = = (3.1) L [r(t)] R(s) Como la funci´n de transferencia es un invariante del sistema, se puede obtener experimentalmente ointroduciendo una funci´n temporal conocida y midiendo la salida. Aplicando la transformada de Laplace oa las dos se˜ ales y calculando su cociente, se consigue la funci´n de transferencia. n o Si es posible introducir en el sistema una funci´n impulso en la entrada, δ(t), la funci´n de transferencia o oes directamente la transformada de Laplace de la funci´n temporal de salida del sistema. o L [c(t)] L [c(t)] G(s) = = = L [c(t)] (3.2) L [δ(t)] 1 Tambi´n es posible obtener de forma te´rica la funci´n de transferencia de un sistema, mediante las e o oecuaciones diferenciales de su modelo matem´tico. Por ejemplo, seg´ n la segunda ley de Newton, un a ucuerpo con masa m experimenta en el vac´ una aceleraci´n a(t) proporcional a la fuerza f (t) que se le ıo oaplique, de acuerdo con la ecuaci´n: o f (t) = ma(t) (3.3) La entrada o causa en el sistema es la fuerza, mientras que la salida o consecuencia es la aceleraci´n odel cuerpo. La funci´n de transferencia se puede obtener muy f´cilmente aplicando la transformada de o aLaplace a la ecuaci´n (3.3) suponiendo condiciones iniciales nulas: o L [f (t) = ma(t)] (3.4) L [f (t)] = mL [a(t)] (3.5) F (s) = mA(s) (3.6) A(s) 1 G(s) = = (3.7) F (s) m 22
  • 22. En este ejemplo, la funci´n de transferencia es una constante. Sin embargo, si el ingeniero quisiera oestudiar otros efectos de este sistema, como el desplazamiento del cuerpo, la ecuaci´n diferencial que odeber´ plantear es: ıa d2 x(t) f (t) = m (3.8) dt2 Y al aplicar la transformada de Laplace, suponiendo condiciones iniciales nulas, obtendr´a: ı d2 x(t) L f (t) = m (3.9) dt2 d2 x(t) L [f (t)] = mL (3.10) dt2 F (s) = ms2 X(s) (3.11) X(s) 1 G(s) = = (3.12) F (s) ms2 Ahora la funci´n de transferencia no es una constante, sino una funci´n de la variable de Laplace. Hay o oque remarcar que el mismo sistema f´ ısico puede tener distintas funciones de transferencia dependiendode las variables que se tomen como entradas y salidas. A partir de este momento, una expresi´n como H(s) puede corresponder tanto a la transformada de oLaplace de una funci´n temporal, H(s) = L [h(t)], como a la funci´n de transferencia de un sistema. o oNormalmente por el contexto es posible deducir a qu´ se refiere en cada caso. Conviene resaltar que: e - La funci´n de transferencia es una propiedad intr´nseca del sistema. Conocida la funci´n de trans- o ı o ferencia de un sistema, se puede conocer el comportamiento del mismo ante cualquier entrada. - La funci´n de transferencia responde a la ecuaci´n diferencial que gobierna un sistema pero no o o ofrece informaci´n acerca de su configuraci´n interna. Dos sistemas f´ o o ısicos diferentes pueden poseer id´nticas funciones de transferencia. e3.3. Modelos de sistemas f´ ısicos Ya se ha dicho que no es sencillo obtener un modelo matem´tico que caracterice de forma adecuada ael comportamiento de un sistema real. De hecho, ning´n modelo matem´tico puede abarcar toda la u arealidad de un sistema. Sin embargo, para que un modelo sea util no es necesario que sea excesivamente ´complicado. Basta con que represente los aspectos esenciales del mismo y que las predicciones sobre elcomportamiento del sistema, basadas en dicho modelo, sean lo suficientemente precisas. Los modelos de los sistemas suelen ser ecuaciones diferenciales. Normalmente se buscan ecuacionesdiferenciales lineales de coeficientes constantes. De hecho, cuando aparecen ecuaciones diferenciales nolineales, lo habitual es linealizarlas en un punto de operaci´n. En los siguientes apartados se estudian olos modelos m´s elementales de cuatro tipos de sistemas: mec´nicos, el´ctricos, hidr´ulicos y t´rmicos. a a e a eSe plantean las ecuaciones diferenciales elementales que gobiernan dichos sistemas y, teniendo en cuentacu´l es la entrada y cu´l es la salida, se hallar´n sus funciones de transferencia. a a a3.3.1. Sistemas mec´nicos a Los sistemas mec´nicos describen el movimiento en el espacio de cuerpos sometidos a fuerzas o pares. aAunque dichos cuerpos poseen dimensiones y propiedades f´ ısicas distribuidas en el espacio, la formam´s sencilla de analizarlos obtener un modelo de par´metros concentrados. Los elementos b´sicos para a a aconstruir un modelo con par´metros concentrados son la masa, el muelle y el amortiguador. a La ecuaci´n diferencial que rige el comportamiento de una masa es la segunda ley de Newton: o d2 x(t) f (t) = m (3.13) dt2 Donde f (t) es la suma de las fuerzas exteriores aplicadas a la masa y x(t) es su desplazamiento. Elpar´metro m es la masa y su unidad fundamental en el Sistema Internacional es el kilogramo, kg (siempre acon min´sculas). Si el cuerpo gira en lugar de desplazarse, la ecuaci´n que gobierna su movimiento es: u o d2 θ(t) τ (t) = J (3.14) dt2 23
  • 23. Donde τ (t) es la suma de los pares exteriores aplicados al sistema y θ(t) su giro. El par´metro constante aJ es la inercia del sistema y su unidad es el kg·m2 . La fuerza f (t) que restituye un amortiguador cuando se comprime es proporcional a la velocidad conque se aproximan sus extremos. La ecuaci´n diferencial que rige su comportamiento es: o dx(t) f (t) = c (3.15) dt El par´metro c es la constante del amortiguador o viscosidad, y su unidad es el Ns/m. Si una masa se adesplaza dentro de un medio viscoso (al aire, el agua, etc.), adem´s de su propia inercia debe vencer una afuerza viscosa proporcional a la velocidad con que se desplaza dicha masa. Este efecto se puede modelizarmatem´ticamente con un amortiguador cuyos extremos estuvieran anclados uno en el centro de gravedad ade la masa y otro en un punto exterior fijo del medio. Evidentemente, este efecto no aparece en el vac´ ıoo en el espacio exterior, fuera de la atm´sfera. o La fuerza f (t) que restituye un muelle o resorte cuando se comprime es proporcional a la distanciax(t) que se han acercado sus extremos desde su longitud natural. Es la llamada ley de Hooke (3.16),donde la constante k representa la rigidez del muelle y su unidad es el N/m. f (t) = kx(t) (3.16) Si un sistema posee varios elementos combinados hay que acudir a los conocimientos de Mec´nica apara obtener la ecuaci´n diferencial que gobierna el sistema. Por ejemplo, aislando las masas o los nodos, oy poniendo las fuerzas que act´an en ellos. Despu´s se aplica la segunda ley de Newton si son masas, o u esumatorio de fuerzas igual a cero si son nodos.Ejemplo mec´nico 1 a El sistema masa-muelle-amortiguador (Fig. 3.4) es un ejemplo t´ ıpico de sistema mec´nico. Se rige apor la ecuaci´n diferencial (3.17), donde la entrada es la fuerza f (t) y la salida el desplazamiento x(t). oAplicando la transformada de Laplace se puede obtener la funci´n de transferencia del sistema. o ? > W E  Figura 3.4: Sistema mec´nico masa-muelle-amortiguador a d2 x(t) dx(t) f (t) = m +c + kx(t) (3.17) dt2 dt F (s) = ms2 X(s) + csX(s) + kX(s) (3.18) X(s) 1 G(s) = = (3.19) F (s) ms2 + cs + k El diagrama de la Fig. 3.5 representa el sistema masa-muelle-amortiguador. Se puede comprobar c´moola funci´n de transferencia (3.19) posee las unidades de m/N, es decir, precisamente las que relacionan la osalida con la entrada. Asimismo, los sumandos del denominador son dimensionalmente coherentes. 7$R ‚8s B d … EX1 L X L > Figura 3.5: Diagrama del sistema masa-muelle-amortiguadorEjemplo mec´nico 2 a La entrada de un sistema mec´nico puede ser un desplazamiento en lugar de una fuerza, como ocurre aen el caso de la Fig. 3.6. El desplazamiento u(t) puede representar, por ejemplo, el desplazamiento de unv´stago neum´tico. a a 24
  • 24. ? `  > E Figura 3.6: Sistema mec´nico masa-muelle-amortiguador a La ecuaci´n diferencial que gobierna este nuevo sistema es: o d2 x(t) dx(t) ku(t) = m +c + kx(t) (3.20) dt2 dt Mientras que su funci´n de transferencia es: o X(s) k G(s) = = (3.21) U (s) ms2 + cs + kEjemplo mec´nico 3 a Tambi´n es posible que el sistema pueda modelizarse despreciando la masa de los elementos m´viles. e oEste es el caso del sistema de la Fig. 3.7, regido por la ecuaci´n diferencial (3.22). o ? > W  Figura 3.7: Sistema mec´nico muelle-amortiguador a dx(t) f (t) = c + kx(t) (3.22) dt X(s) 1 G(s) = = (3.23) F (s) cs + kEjemplo mec´nico 4 a En el sistema de la Fig. 3.8 ante una unica entrada u(t) existen dos variables temporales de salida, los ´desplazamientos de las masas x1 (t) y x2 (t). Este sistema puede servir para modelizar el comportamientodel sistema de amortiguaci´n de un veh´ o ıculo. La masa m2 representa la parte amortiguada del veh´ ıculo,mientras que m1 es el conjunto de la rueda y el eje. El desplazamiento de entrada u(t) es el perfil de lacarretera que act´a sobre la rueda a trav´s de la rigidez del neum´tico k1 . u e a E1 ?1  >1 Ed ?d >d ` Figura 3.8: Modelo de un sistema de amortiguaci´n o Para obtener las ecuaciones del sistema, habr´ que tener en cuenta las fuerzas debidas a la gravedad ıa(el peso). Sin embargo, es posible llegar m´s r´pido a la soluci´n definiendo la referencia de los despla- a a ozamientos x1 (t) y x2 (t) en el punto de equilibrio est´tico (no con la longitud natural de los resortes). a 25
  • 25. De esta forma, el conjunto se rige por el sistema de ecuaciones (3.24), donde —por simplicidad— no seespecifica la variable temporal de los desplazamientos. ⎫ d2 x1 dx1 dx2 ⎪ k1 (u − x1 ) = m1 2 + k2 (x1 − x2 ) + c − ⎪ dt dt dt ⎬ (3.24) dx1 dx2 d2 x2 ⎪ ⎪ k2 (x1 − x2 ) + c − = m2 2 ⎭ dt dt dt Si lo unico que interesa del sistema es el desplazamiento de la masa amortiguada, sin importar c´mo ´ ose mueva la rueda, habr´ eliminar del sistema de dos ecuaciones y dos inc´gnitas (3.24) la variable x1 (t). ıa oEl objetivo ser´ obtener una unica ecuaci´n que relacione la entrada u(t) con la variable x2 (t). Esto es ıa ´ odif´ de hacer con las ecuaciones diferenciales en el dominio temporal, pero muy sencillo gracias a la ıciltransformada de Laplace: k1 (U − X1 ) = m1 s2 X1 + k2 (X1 − X2 ) + cs(X1 − X2 ) (3.25) k2 (X1 − X2 ) + cs(X1 − X2 ) = m2 s2 X2 Queda un sistema de ecuaciones algebraico donde se puede eliminar la variable X1 . De esta forma lafunci´n de transferencia del sistema es: o X2 k1 (k2 + cs) = (3.26) U (m1 s2 + cs + k1 + k2 )(m2 s2 + cs + k2 ) − (k2 + cs)2 Evidentemente, tambi´n se podr´ haber tomado X1 como salida del sistema y eliminar variable X2 . e ıaEn este caso, la funci´n de transferencia que se obtendr´ es: o ıa X1 k1 (m2 s2 + cs + k2 ) = 2 + cs + k + k )(m s2 + cs + k ) − (k + cs)2 (3.27) U (m1 s 1 2 2 2 2 El sistema mec´nico completo, se podr´ representar gr´ficamente como un sistema con una entrada a ıa ay dos salidas como se muestra en la Fig. 3.9. Es interesante ver que, normalmente, las funciones detransferencia son fracciones de polinomios en s. k1 (m2 s2 + cs + k2 ) …dwXD (m1 s2 + cs + k1 + k2 )(m2 s2 + cs + k2 ) − (k2 + cs)2 JwXD k1 (k2 + cs) …1wXD (m1 s2 + cs + k1 + k2 )(m2 s2 + cs + k2 ) − (k2 + cs)2 Figura 3.9: Diagrama del sistema de amortiguaci´n o Las ra´ del denominador se llaman polos, y las ra´ del numerador se llaman ceros. Habitualmente ıces ıcesel n´mero de polos es mayor o igual que el n´mero de ceros. Y el orden del sistema lo determina el n´mero u u ude polos. En el ejemplo del sistema de amortiguaci´n, el sistema es de orden 4 (o de 4o orden). o Para un sistema f´ısico que posea una entrada y n salidas, se podr´n definir n funciones de transferencia. aY todas las funciones de transferencia tendr´n —por norma general— el mismo denominador. Por tanto, alos polos del sistema constituyen una caracteriza esencial e invariante del propio sistema. De hecho, elCap´ıtulo 4 analiza la respuesta temporal de los sistemas atendiendo a la posici´n y n´mero de los polos o udel sistema.3.3.2. Sistemas el´ctricos e Los sistemas el´ctricos, como los mec´nicos, tambi´n se suelen describir por medio de par´metros e a e aconcentrados donde los tres elementos fundamentales son las resistencias, los condensadores y las bobinas.La tensi´n que aparece sobre los extremos de una resistencia es proporcional a la intensidad de corriente oque circula a trav´s de ella. La constante proporcional se llama igualmente resistencia y su unidad en el eSistema Internacional es el ohmio, Ω. v(t) = Ri(t) (3.28) La tensi´n que aparece sobre los extremos de una bobina es proporcional a la derivada de la intensidad oque circula a trav´s de ella respecto del tiempo. La constante proporcional se llama inductancia y su eunidad es el henrio, H. di(t) v(t) = L (3.29) dt 26
  • 26. La tensi´n que aparece sobre los extremos de un condensador es proporcional a la integral de la ointensidad que circula a trav´s de ella a lo largo del tiempo. Desde otro punto de vista, tambi´n se puede e edecir que la intensidad que circula a trav´s de un condensador es proporcional a la variaci´n de la tensi´n e o oentre sus bornes. Esta ultima constante proporcional es la que se llama capacidad y su unidad es el ´faradio, F. dv(t) i(t) = C (3.30) dt En un circuito en el que existan resistencias, bobinas y condensadores, las ecuaciones diferenciales quelo gobiernan se obtienen aplicando las leyes de Kirchhoff en las mallas o en los nudos. A continuaci´n ose muestran algunos casos en los que se da una combinaci´n de estos tres elementos y sus respectivas oecuaciones diferenciales.Ejemplo el´ctrico 1 e En el sistema de la Fig. 3.10, la entrada en el circuito en la tensi´n vi (t) y la salida es la tensi´n vo (t) o osuponiendo que la corriente de salida es nula, o lo que es lo mismo, el circuito se conecta a un dispositivode alta impedancia de entrada. p U 87 8L 7 g Figura 3.10: Sistema el´ctrico resistencia-bobina-condensador e ⎫ di(t) 1 t ⎪ vi (t) = Ri(t) + L + i(τ ) dτ ⎪ ⎪ ⎬ dt C 0 (3.31) 1 t ⎪ ⎪ vo (t) = i(τ ) dτ ⎪ ⎭ C 0 En el sistema de ecuaciones diferenciales (3.31) interviene una variable intermedia: la intensidad i(t).Como ocurr´ anteriormente en los sistemas mec´nicos, en el dominio de Laplace se pueden eliminar ıa aaquellas variables que se consideren innecesarias, y obtener una unica expresi´n de la salida del sistema ´ oen funci´n de la entrada. As´ aplicando la transformada de Laplace al sistema de ecuaciones que gobierna o ı,el sistema, suponiendo condiciones iniciales nulas: ⎫ I(s) ⎪ Vi (s) = RI(s) + LsI(s) + ⎬ 1 sC Vo (s) = Vi (s) (3.32) I(s) ⎪ ⎭ 1 + RCs + LCs2 Vo (s) = sC Se ha conseguido expresar la tensi´n de salida del circuito en funci´n de la tensi´n de entrada, es o o odecir, la funci´n de transferencia, independientemente de la otra variable, que es la intensidad que circula opor la malla. En este caso particular, como la tensi´n de entrada y la tensi´n de salida tienen las mismas unidades, o ola funci´n de transferencia es adimensional y cada uno de los sumandos del denominador tambi´n lo o eser´: ohmio por faradio entre segundo es adimensional y henrio por faradio entre segundo al cuadrado es aadimensional. Comprobar las unidades puede ayudar a detectar errores en la resoluci´n de ejercicios. o Si la tensi´n de entrada en el sistema resistencia-bobina-condensador es un escal´n de valor 3 voltios, o oes posible encontrar el valor que alcanza la tensi´n en la capacidad cuando el tiempo tiende a infinito a otrav´s del teorema del valor final: e 1 3 l´ vo (t) = l´ sVo (s) = l´ s ım ım ım 2 s = 3 voltios (3.33) t→∞ s→0 s→0 1 + RCs + LCs Con este ejemplo, queda patente c´mo es posible conocer algunas caracter´ o ısticas de la respuestatemporal del sistema sin haber calculado la expresi´n general de la tensi´n vo (t) en funci´n del tiempo a o o otrav´s de la transformada inversa de Laplace. Con los teoremas del valor inicial y final es posible conocer eel valor en r´gimen permanente, el valor inicial de la funci´n y las sucesivas derivadas del la funci´n en e o oel origen. 27
  • 27. Ejemplo el´ctrico 2 e En el sistema de la Fig. 3.11 existen dos mallas, por tanto se obtienen dos variables intermedias entrelas tensiones de salida y de entrada: las intensidades i1 (t) e i2 (t). pd p1 87 8L 7d gd 7 g1 1 Figura 3.11: Sistema el´ctrico con dos mallas e t ⎫ 1 (i1 − i2 ) dτ ⎪ ⎪ vi = R1 i1 + ⎪ ⎪ C1 0 ⎪ ⎪ t t ⎪ ⎬ 1 1 (i1 − i2 ) dτ = R2 i2 + i2 dτ (3.34) C1 0 C2 ⎪ ⎪ 0 ⎪ ⎪ t ⎪ ⎪ v0 = 1 i2 dτ ⎪ ⎭ C2 0Ejemplo el´ctrico 3 e En el sistema de la Fig. 3.12 se muestra un ejemplo donde la entrada es una corriente en lugar deuna tensi´n. La entrada es la corriente i(t) de la fuente, la salida es la corriente i2 (t) en la resistencia de ocarga RL y existe una variable intermedia que es la corriente i1 (t) de la malla intermedia. 7 pd pU gd 7 g1 7 d 1 Figura 3.12: Sistema el´ctrico con fuente de corriente e ⎫ 1 t 1 t ⎪ (i − i1 ) dτ = R1 i1 + (i1 − i2 ) dτ ⎪ ⎪ ⎬ C1 0 C2 0 (3.35) 1 t ⎪ ⎪ (i1 − i2 ) dτ = RL i2 ⎪ ⎭ C2 03.3.3. Sistemas electromec´nicos a Los sistemas electromec´nicos o mecatr´nicos, combinan elementos mec´nicos y el´ctricos. Un ejemplo a o a ees el motor de corriente continua que hace girar un objeto con inercia y viscosidad, Fig. 3.13. La entradaes la tensi´n v(t) y la salida es el giro θ(t). o p U 8 + 7 Figura 3.13: Modelo de un motor de corriente continua arrastrando un objeto ⎫ di(t) v(t) = Ri(t) + L + e(t)⎪ ⎪ ⎪ dt ⎪ ⎪ ⎪ ⎪ dθ(t) ⎪ ⎬ e(t) = K dt (3.36) ⎪ ⎪ τ (t) = Ki(t) ⎪ ⎪ ⎪ ⎪ d2 θ(t) dθ(t) ⎪ ⎪ τ (t) = J +B ⎭ dt2 dt 28
  • 28. La primera ecuaci´n del sistema (3.36) responde a la unica malla del circuito. La tensi´n e(t) que o ´ oaparece en el motor es proporcional a la velocidad de giro del mismo. El par τ (t) que ejerce el motores proporcional a la intensidad que circula por ´l. Las constantes de velocidad y de par son la misma eK, donde es posible demostrar que tienen las mismas unidades. La ultima ecuaci´n del sistema es la del ´ omodelo mec´nico de inercia J y viscosidad B. a3.3.4. Sistemas hidr´ulicos a Los sistemas hidr´ulicos pueden incluir muy diferentes elementos (dep´sitos, v´lvulas, etc.). En este a o aapartado se muestra un ejemplo de ecuaci´n diferencial que gobierna la altura h de fluido contenido en oun dep´sito. o R7 _ RL L Figura 3.14: Dep´sito con conducto de desag¨e o u Las ecuaciones que se pueden plantar en el dep´sito de la Fig. 3.14 son la conservaci´n de la masa y o oel caudal de salida, ⎫ dh ⎬ qi − qo = A dt √ ⎭ (3.37) qo = Ao vo = Ao f 2gh = K hdonde qi y qo son los caudales de entrada y salida, mientras que A y Ao son las superficies de la secci´n odel dep´sito y del conducto de salida. Eliminando la variable del caudal de salida qo resulta: o dh √ A + K h = qi (3.38) dt Lo primero que conviene resaltar es que esta ecuaci´n diferencial no es lineal. En lugar de aparecer una ofunci´n temporal y sucesivas derivadas temporales, aparece la ra´ cuadrada de la funci´n. Un modo de o ız oestudiar este tipo de sistemas consiste en linealizar su ecuaci´n diferencial en alg´n punto de operaci´n. o u oLo m´s sencillo es estudiar este comportamiento en el punto de equilibrio del √ a sistema: para una altura Hde fluido existe un caudal de entrada Qi tal que el caudal de salida Qo = K H es igual al de entrada.El punto (Qi ,H) es el punto de equilibrio en el que se linealizar´ este sistema. a Se aplicar´ el desarrollo en serie de Taylor de primer orden a la funci´n, a o dh f (qi , h) = , (3.39) dtpor tanto, ∂f ∂f f (qi , h) ≈ f (Qi , H) + (qi − Qi ) + (h − H) (3.40) ∂qi (Qi ,H) ∂h (Qi ,H) dh 1 √ 1 K ≈ (Qi − K H) + (qi − Qi ) − √ (h − H) (3.41) dt A A 2A H dh 1 1 ≈ (qi − Qi ) − (h − H) (3.42) dt A τ Si se define el siguiente cambio de variables: h=h−H (3.43) q i = qi − Qila ecuaci´n diferencial lineal en torno al punto de equilibrio es: o dh 1 1 + h = qi (3.44) dt τ A 29
  • 29. Para hallar la funci´n de transferencia del sistema en torno al punto de equilibrio, habr´ que suponer o acondiciones iniciales nulas en las variables relativas: h(0+ ) = 0 y q i (0+ ) = 0, lo que equivale a decir quelas condiciones iniciales de las variables absolutas no son nulas: h(0+ ) = H y qi (0+ ) = Qi . Esta linealizaci´n se puede realizar en otros puntos distintos al de equilibrio. Para dep´sitos como el del o oejemplo, una formulaci´n aproximada bastante extendida es considerar el caudal de salida proporcional oa la altura del dep´sito, o h qo = , (3.45) Rdonde R equivale a una resistencia al flujo de salida de caudal por la boquilla. Esta aproximaci´n es unos´ ımil el´ctrico del flujo del fluido y conduce a ecuaciones diferenciales lineales. Por ejemplo, la conservaci´n e ode la masa en el dep´sito conduce a la ecuaci´n, o o h dh qi − =A , (3.46) R dtque es comparable al resultado que daba la linealizaci´n anterior, o dh 1 1 + h = qi , (3.47) dt AR Apero empleando esta vez la altura h y el caudal de entrada qi absolutos en lugar de sus diferenciasrespecto al punto de linealizaci´n. En definitiva, la suposici´n (3.45) equivale a linealizar el sistema en o otodas las alturas del dep´sito (no s´lo en un punto determinado). Siguiendo el s´ o o ımil el´ctrico, el caudal se ecomporta como la intensidad de corriente, la altura del dep´sito como el potencial y el ´rea de la secci´n o a odel dep´sito como una capacidad. Por esto ultimo, en algunos manuales al area A del dep´sito se le llama o ´ ´ ocapacitancia del tanque.3.3.5. Sistemas t´rmicos e Los sistemas t´rmicos describen el calentamiento de los objetos con el flujo de calor. Su descripci´n e omatem´tica es similar a los sistemas el´ctricos. En este caso la resistencia t´rmica R es la oposici´n al a e e oflujo de calor q(t) entre dos cuerpos que posean temperaturas distintas. En el Sistema Internacional, las ˙unidades de esta resistencia t´rmica es K/W. e T1 (t) − T2 (t) q(t) = ˙ (3.48) R La capacidad calor´ ıfica C se define como el calor almacenado o desprendido por un cuerpo cuandocambia de temperatura. Esta capacidad se suele dar en forma de calor espec´ ıfico, es decir, por unidad demasa. En el Sistema Internacional, las unidades del calor espec´ ıfico ce es J/kgK. dT (t) q(t) = C ˙ (3.49) dt dT (t) q(t) = mce ˙ (3.50) dt Con estas definiciones se puede modelizar el comportamiento t´rmico de muchos sistemas. Por ejemplo een la Fig. 3.15 se muestra una habitaci´n con un radiador que introduce un flujo de calor qr (t) en presencia o ˙de una ventana de resistencia t´rmica R por la que se pierde un flujo de calor de qs (t). La temperatura e ˙exterior Te (t), aunque se suele suponer constante, en realidad es tambi´n una variable temporal. e x7 RX x R„ Figura 3.15: Habitaci´n con un radiador y una ventana o Las ecuaciones del sistema son: ⎫ dTi (t) ⎪ qr (t) − qs (t) = mce ˙ ˙ ⎬ dt (3.51) Ti (t) − Te (t) ⎪ ⎭ qs (t) = ˙ R 30
  • 30. Eliminado la variable qs queda una ecuaci´n diferencial lineal de primer orden: ˙ o dTi (t) Ti (t) − Te (t) qr (t) = mce ˙ + (3.52) dt R Para obtener la funci´n de transferencia de un sistema t´rmico hay que tener especial precauci´n. El o e oconcepto de funci´n de transferencia requiere suponer condiciones iniciales nulas, cosa que s´lo ocurre o opor excepci´n en los sistemas t´rmicos. Es dif´ que la temperatura de la habitaci´n sea 0 K (−273◦ C) o e ıcil oen el momento de encender el radiador (origen de tiempos). Si en el origen de tiempos la habitaci´n ten´ o ıauna temperatura igual a Ti0 , la transformada de Laplace de la ecuaci´n diferencial del sistema es: o ˙ 1 1 Qr (s) = mce [sTi (s) − Ti0 ] + Ti (s) − Te (s) (3.53) R R La salida del sistema depende de dos entradas (por medio de funciones de transferencia) y las condi-ciones iniciales (a trav´s de un sumando que no es una funci´n de transferencia): e o R ˙ 1 mce RTi0 Ti (s) = Qr (s) + Te (s) + (3.54) mce Rs + 1 mce Rs + 1 mce Rs + 1 ˙ El flujo de calor que introduce el radiador Qr (s) es una entrada controlable del sistema. La temperaturaexterior Te (s) es un agente que influye en la salida pero no es controlable por el sistema de calefacci´n, opor tanto se trata de una perturbaci´n. Por otro lado, se puede apreciar que el sistema es de primer orden. oEste sistema t´rmico se puede definir por medio de funciones de transferencia si se emplean temperaturas erelativas respecto a la condici´n inicial de la temperatura interior: Ti (t) = Ti0 +T i (t) y Te (t) = Ti0 +T e (t). o3.4. Diagrama de bloques de un sistema Los diagramas de bloques aparecen cuando el sistema se divide en varios subsistemas. En este caso,en lugar de hallar de funci´n de transferencia del sistema completo se deben encontrar las funciones de otransferencia de cada uno de los subsistemas. En este diagrama, cada subsistema es un bloque del sistemacompleto. En las uniones entre bloques pueden aparecer puntos de bifurcaci´n y de suma (Fig. 3.16). Los opuntos de bifurcaci´n se emplean en las se˜ ales que atacan varias funciones de transferencia. Los puntos o nde suma se representan con c´ ırculos a los que llegan las se˜ales que se combinan para dar el resultado. nEn la l´ ınea de llegada al punto de suma se debe especificar el signo. Bd B B B1 [B[S)SBd B1 ± Bn B ± Bn Figura 3.16: Punto de bifurcaci´n (izquierda) y punto de suma (derecha) o El diagrama de bloques de un sistema se puede construir a partir de las ecuaciones diferenciales quelo gobiernan. Primero se toman las transformadas de Laplace de las ecuaciones, suponiendo condicionesiniciales nulas. Luego cada ecuaci´n en el dominio de Laplace se representa en forma de bloque. Finalmente ose unen los bloques para formar un unico diagrama. Este procedimiento se sigue en los ejemplos del ´siguiente apartado.3.4.1. Reglas para la simplificaci´n de diagramas de bloques o Simplificar un diagrama de bloques significa encontrar la funci´n de transferencia equivalente a todo oel diagrama. Esto se puede hacer anal´ ıticamente, planteando las ecuaciones del diagrama, o gr´ficamente, aaprendiendo unas las reglas de simplificaci´n de bloques. o t I ) tI Figura 3.17: Multiplicaci´n de bloques o En las Figuras 3.17-3.20 se muestran algunas las simplificaciones gr´ficas m´s utiles. La caracter´ a a ´ ısticafundamental es que el sistema simplificado es equivalente al anterior. 31
  • 31. t ) t I I Figura 3.18: Suma de bloques t ) t d t Figura 3.19: Translaci´n de un punto de bifurcaci´n o o ) ) ± ± ± Figura 3.20: Cambio de orden de los sumandos3.4.2. Ejemplo de circuito con dos mallas El sistema (3.55) contiene las ecuaciones diferenciales que gobiernan el circuito representado en laFig. 3.11, despu´s de aplicar la transformada de Laplace. El diagrama de la Fig. 3.21 corresponde a edichas ecuaciones, donde se ha se˜ alado con puntos el conjunto de bloques que corresponde a cada una nde ellas. ⎫ I1 − I2 ⎪ Vi = R1 I1 + ⎪ ⎪ sC1 ⎪ ⎪ ⎪ I1 − I2 I2 ⎬ = R2 I2 + (3.55) sC1 sC2 ⎪ ⎪ ⎪ ⎪ I2 ⎪ ⎪ Vo = ⎭ sC2 ~7 d {d pd ± d Xgd ± d {1 d ~L p1 + d Xg1 Xg1 Figura 3.21: Diagrama del circuito con dos mallas Usando mayor n´mero de variables intermedias, el sistema de ecuaciones aumentar´ en n´mero, pero u ıa uel diagrama de bloques puede resultar m´s sencillo de representar. En el ejemplo, si se incluye la tensi´n a oen un nudo intermedio v1 y la corriente ic diferencia de las corrientes en la mallas: ⎫ ⎫ vi − v1 = R1 i1 ⎪ ⎪ Vi − V1 = R1 I1 ⎪ ⎪ ⎪ ⎪ ⎪ t ⎪ ⎪ ⎪ ⎪ 1 ⎪ ⎪ ic dτ ⎪ Ic ⎪ ⎪ v1 = ⎪ V1 = ⎪ ⎪ C1 0 ⎪ ⎬ sC1 ⎪ ⎬ L v1 − vo = R2 i2 − V1 − Vo = R2 I2 → (3.56) ⎪ ⎪ ⎪ ⎪ 1 t ⎪ ⎪ I2 ⎪ ⎪ vo = i2 dτ ⎪ ⎪ ⎪ ⎪ Vo = ⎪ ⎪ ⎪ ⎪ C2 0 ⎪ sC2 ⎪ ⎪ ⎪ ⎪ ⎭ ic = i1 − i2 ⎭ Ic = I1 − I2 32
  • 32. El diagrama de bloques de la Fig. 3.22 a) corresponde al sistema de ecuaciones (3.56) y es equivalenteal diagrama anterior. Si se eliminan las variables intermedias de forma anal´tica en el sistema de ecua- ıciones, para expresar la tensi´n de salida en funci´n de la tensi´n de entrada, se obtiene la funci´n de o o o otransferencia equivalente del sistema. Con esta funci´n de transferencia se puede representar el sistema ocon un unico bloque, Fig. 3.22 b). La funci´n de transferencia equivalente del sistema tambi´n se puede ´ o eobtener simplificando de forma gr´fica cualquiera de los diagramas de bloques presentados previamente. a ± ~7 d {d { d ~d d {1 d ~L pd Xgd p1 Xg1 ± ± a) ~7 d ~L pdp1 gdg1 X1 + (pdgd + p1 g1 + pdg1 )X + d b) Figura 3.22: Diagramas equivalentes del circuito con dos mallas3.4.3. Ejemplo de motor de corriente continua El sistema (3.57) son las ecuaciones diferenciales que gobiernan un motor de corriente continua quearrastra una inercia (3.36) una vez aplicada la transformada de Laplace. ⎫ V = (R + Ls)I + E ⎪ ⎪ ⎬ E = KΩ (3.57) T = KI ⎪ ⎪ ⎭ T = (Js + B)Ω El diagrama de bloques que corresponde a estas ecuaciones y su simplificaci´n aparecen en la Fig. 3.23. o V 1 I T 1 Ω K R + Ls Js + B – E K a) V K Ω (R + Ls)(Js + B ) + K 2 b) Figura 3.23: Diagrama del motor de corriente continua Si se eliminan las variables intermedias del sistema de ecuaciones de Laplace se obtiene la funci´n de otransferencia equivalente. Aunque el sistema tiene forma de lazo cerrado con realimentaci´n no unitaria, ohay que hacer notar que no es propiamente un sistema controlado. La velocidad Ω est´ impuesta por la atensi´n V y la magnitud de la inercia J. En este ejemplo se observa c´mo la funci´n de transferencia o o oequivalente posee las unidades que relacionan la magnitud de salida con la de entrada. En el caso de que el giro de la inercia se vea frenado por un muelle torsor de rigidez Kt , las ecuacionesque hay que considerar son las siguientes: ⎫ di ⎪ v = Ri + L + e ⎪ ⎪ dt ⎪ ⎪ ⎫ ⎪ ⎪ V = (R + Ls)I + E ⎪ dθ ⎪ ⎬ ⎪ ⎬ e=K L E = KsΘ dt −→ (3.58) ⎪ ⎪ T = KI ⎪ ⎪ τ = Ki ⎪ ⎪ ⎭ ⎪ ⎪ T = (Js2 + Bs + Kt )Θ d2 θ dθ ⎪ ⎪ τ =J 2 +B + Kt θ ⎭ dt dt 33
  • 33. ~ d { x d  OX1 + 4X + 0 p + UX ± o X Figura 3.24: Diagrama del motor de corriente continua con muelle torsor Una posible representaci´n en diagrama de bloques se presenta en la Fig. 3.24, sin embargo no es una obuena elecci´n incluir bloques derivadores, es decir, aquellos cuya salida es proporcional a la derivada de ola entrada. Este tipo de bloques tienen el inconveniente de que amplifican enormemente el ruido de altafrecuencia que reciban en la entrada. Tambi´n se comportan mal a la hora de evaluar num´ricamente las e erespuestas temporales del sistema, por ejemplo utilizando Simulink R . Para evitar el bloque derivador, se propone como alternativa el diagrama de la Fig. 3.25 a). En amboscasos la funci´n de transferencia equivalente de todo el sistema es la misma, Fig. 3.25 b). o Kt – V 1 I T 1 Ω 1 Θ K R + Ls Js + B s – E K a) ~  (p + UX)(OX1 + 4X + 0 ) +  1 X b) Figura 3.25: Diagramas equivalentes del motor de corriente continua con muelle torsor3.5. Sistema de realimentaci´n negativa no unitaria o Los sistemas de realimentaci´n negativa son los m´s extendidos para el control de sistemas, por eso su o aestructura se estudia de forma pormenorizada. En la Fig. 3.26 se representa el caso m´s simple de sistema ade realimentaci´n negativa no unitaria. Hay que en cuenta que las funciones de transferencia G(s) y H(s) opueden ser el resultado del producto de varias funciones de transferencia. p o g t ± 4 I Figura 3.26: Sistema de realimentaci´n negativa no unitaria o En (3.59) se muestra soluci´n del sistema de ecuaciones de Laplace de la realimentaci´n negativa no o ounitaria, es decir, la salida en funci´n de la entrada. o ⎫ C = GE ⎬ G E =R−B C= R (3.59) ⎭ 1 + GH B = HC Habitualmente se emplea el convenio de usar la letra C(s) para nombrar a la transformada de Laplacede la funci´n de salida y R(s) para la entrada. A la se˜al E(s) se le llama error y a B(s) se˜ al de o n nrealimentaci´n. Las funciones de transferencia que intervienen en el sistema son: o - Funci´n de transferencia directa: es la que relaciona la se˜ al de error y la salida. o n C Gd = =G (3.60) E 34
  • 34. - Funci´n de transferencia en lazo abierto: es la que relaciona la se˜ al de error y la realimen- o n taci´n. Es el producto de todas las funciones de transferencia que se encuentran dentro del lazo de o control. B Gla = = GH (3.61) E - Funci´n de transferencia en lazo cerrado: es la que relaciona la se˜ al de entrada y la salida. Es o n igual a la funci´n de transferencia directa entre uno m´s la funci´n de transferencia en lazo abierto. o a o C G Gd Glc = = = (3.62) R 1 + GH 1 + Gla Con la funci´n de transferencia en lazo cerrado se puede representar el sistema de la Fig. 3.27 con un ounico bloque:´ p t g d + tI Figura 3.27: Sistema equivalente en lazo cerrado Para el dise˜o de controladores son especialmente importantes las expresiones de las funciones de ntransferencia en lazo abierto y cerrado. El sistema controlado responde a la funci´n de transferencia en olazo cerrado, sin embargo, muchas de las caracter´ ısticas del sistema controlado se deducen a partir de lafunci´n de transferencia en lazo abierto, como se ir´ mostrando en los sucesivos apartados y cap´ o a ıtulos. En la Fig. 3.28 se representa el caso de sistema realimentaci´n negativa no unitaria en presencia de operturbaciones. Para la se˜al de perturbaci´n se suele emplear la letra N y su signo puede ser positivo o n onegativo. ] p o J h g td t1 ± 4 I Figura 3.28: Sistema de realimentaci´n con perturbaciones o En (3.63) se muestra la soluci´n del nuevo sistema de ecuaciones de Laplace. En este caso es la salida oen funci´n de las dos entradas al sistema: la referencia R y la perturbaci´n N . o o ⎫ C = G2 P ⎪ ⎪ ⎪ P =U +N ⎪ ⎬ G 1 G2 G2 U = G1 E C= R+ N (3.63) ⎪ 1 + G1 G 2 H 1 + G1 G2 H E =R−B ⎪ ⎪ ⎪ ⎭ B = HC La soluci´n (3.63) se puede obtener por superposici´n, es decir, sumando las salidas que se producen o ocon entrada R y N nula m´s la salida con entrada N y R nula. La entrada propiamente dicha en el asistema es la se˜ al R y se llama referencia porque se desea que el sistema controlado la siga fielmente. nObservando la ecuaci´n (3.63), es posible deducir que el seguimiento se consigue de forma exacta, C = R, ocuando la funci´n de transferencia que multiplica a R se asemeja a la unidad, y la que multiplica a N se oasemeja a cero. Una forma de conseguir las dos cosas es hacer G1 todo lo grande que sea posible y H igual a la unidad.Por esta raz´n es habitual estudiar los sistemas de control de realimentaci´n negativa unitaria, donde o oel controlador se coloca inmediatamente despu´s del c´lculo del error, es decir, el controlador act´a en e a ufunci´n de la se˜al del error. A la actuaci´n del controlador se a˜aden las perturbaciones que puedan o n o nexistir sobre la planta. Los sistema servo busca sobre todo el seguimiento de la se˜ al, es decir, que la funci´n de transferencia n ode la R sea lo m´s parecida a la unidad, mientras que un sistema regulador busca sobre todo el rechazo aa las perturbaciones, es decir, anular la funci´n de transferencia que multiplica a la perturbaci´n. o o Tambi´n hay que notar que el denominador de las dos funciones de transferencia es id´ntico. Este e edenominador es una caracter´ ıstica esencial del sistema, como se ver´ en los siguientes cap´ a ıtulos. 35
  • 35. 3.6. Sistema de realimentaci´n negativa unitaria o En la Fig. 3.29 se representa el caso de sistema realimentaci´n negativa unitaria con perturbaciones. oQue la realimentaci´n sea unitaria implica que el sensor que mide la salida es ideal, es decir, no modifica en oabsoluto dicha se˜al. La funci´n de transferencia G1 incluye el controlador y la etapa final de amplificaci´n, n o omientras que G2 es la planta que se desea controlar. ] ]Bt „Bj _jst s p o J h g td t1 ± Figura 3.29: Sistema de realimentaci´n negativa unitaria o Hay que resalta que, en el caso de realimentaci´n negativa unitaria las funciones de transferencia odirecta y de lazo abierto coinciden y es el producto de G1 y G2 . Si no se especifica otra cosa, cuandose desee controlar un sistema, se entender´ que se le introduce en un lazo de control similar al de la aFig. 3.29. Las perturbaciones, tambi´n si no se especifica otra cosa, se supondr´n nulas. e a3.7. Ejercicios propuestos - Ejercicio 1: Sea un sistema mec´nico que compuesto de una muelle y un amortiguador en serie a (Fig. 3.30) cuya entrada es el desplazamiento u y cuya salida es el desplazamiento x. Hallar la ecuaci´n diferencial que gobierna el sistema, as´ como la soluci´n anal´ o ı o ıtica de la respuesta ante una entrada escal´n unidad. o ? `  > Figura 3.30: Sistema mec´nico muelle-amortiguador a La ecuaci´n diferencial del sistema es: o dx(t) ku(t) = kx(t) + c (3.64) dt La soluci´n general en el dominio de Laplace es: o k X(s) = U (s) (3.65) k + cs Con una entrada escal´n unidad: o k X(s) = (3.66) (k + cs)s Acudiendo a las tablas de la transformada de Laplace, la soluci´n en el dominio del tiempo es: o x(t) = 1 − e− c t , para t > 0 k (3.67) Y se puede demostrar que, tanto sustituyendo valores en la soluci´n temporal, como aplicando los o teoremas de valor inicial y final en la soluci´n del dominio de Laplace, se cumple que: o x(∞) = 1 (3.68) + dx(0 ) k = (3.69) dt c - Ejercicio 2: Un sistema mec´nico similar al anterior, pero en el que un muelle de rigidez k2 a est´ en serie con un conjunto paralelo muelle-amortiguador (Fig. 3.31). La entrada sigue siendo a 36
  • 36. ? ` >d >1  Figura 3.31: Sistema mec´nico muelle-muelle-amortiguador a el desplazamiento u y la salida el desplazamiento x. Hallar la ecuaci´n diferencial que gobierna el o sistema. Soluci´n: o du dx k1 u + c = (k1 + k2 )x + c (3.70) dt dt- Ejercicio 3: Un cuerpo de masa m unido a dos amortiguadores, uno de los cuales est´ amarrado a al suelo (ver Fig. 3.32). La entrada es el desplazamiento u en el extremo del amortiguador libre y la salida el desplazamiento x de la masa. Hallar la ecuaci´n diferencial que gobierna el sistema. o ? ` 1 d E Figura 3.32: Sistema mec´nico amortiguador-masa-amortiguador a Soluci´n: o du d2 x dx c1 = m 2 + (c1 + c2 ) (3.71) dt dt dt- Ejercicio 4: Dos cuerpos unidos entre s´ por un resorte (ver Fig. 3.33). Uno de ellos est´ amarrado ı a al suelo a trav´s de otro muelle y en el otro act´ a una fuerza f . La salida son los desplazamientos e u de los dos cuerpos. Hallar el sistema de ecuaciones diferenciales que gobierna el sistema. ?1 ?d >1 >d W E1 Ed Figura 3.33: Sistema mec´nico masa-muelle-masa-muelle a Soluci´n: o ⎫ d2 x1 ⎪ f = m1 + k1 (x1 − x2 ) ⎪ ⎬ dt2 (3.72) d2 x2 ⎪ k1 (x1 − x2 ) = m2 2 + k2 x2 ⎪ ⎭ dt- Ejercicio 5: Dos cuerpos unidos entre s´ por un resorte (ver Fig. 3.34). La entrada es la fuerza f ı que act´a sobre un cuerpo y la salida son los desplazamientos de los dos cuerpos. u ?1 ?d > W E1 Ed Figura 3.34: Sistema mec´nico masa-muelle-masa a 37
  • 37. Soluci´n: o ⎫ d2 x1 ⎪ f = m1 + k(x1 − x2 )⎪ ⎬ dt2 (3.73) d2 x2 ⎪ ⎪ k(x1 − x2 ) = m2 2 ⎭ dt- Ejercicio 6: Dos resistencias conectadas en serie a trav´s de una capacidad (ver Fig. 3.35). La e entrada es la tensi´n vi aplicada sobre una resistencia y poniendo a tierra la otra. La salida es la o tensi´n vo en un extremo de la capacidad. o pd 87 8L 7 g p1 Figura 3.35: Sistema el´ctrico resistencia-capacidad-resistencia e Soluci´n: o dvi dvo + vi = R 2 C R1 C + vo (3.74) dt dt- Ejercicio 7: Simplificar de forma gr´fica o anal´ a ıtica el siguiente diagrama de bloques: I1 ± p g td t1 tn ± Id t; Figura 3.36: Diagrama de bloques C(s) G1 G2 G3 +G4 +G2 G4 H1 +G2 G3 G4 H2 −G1 G2 G4 H1 Soluci´n: o R(s) = 1+G2 H1 +G2 G3 H2 −G1 G2 H1- Ejercicio 8: Simplificar el diagrama de bloques de la Fig. 3.37 y escribir la funci´n de transferencia o que relaciona la salida con la entrada de la forma m´s compacta posible. a x E p ± g td t1 tn ± ± Id ; I1 Figura 3.37: Diagrama de bloques C(s) G1 G3 (G2 +K5 K6 ) Soluci´n: o R(s) = 1+G3 (H1 −K6 )+G1 G3 (G2 +K5 K6 )(H2 +K4 ) 38
  • 38. Cap´ ıtulo 4Respuesta temporal Para analizar el comportamiento de un sistema se toma como punto de partida la representaci´n omatem´tica del mismo. Esta modelizaci´n, Fig. 4.1, es su funci´n de transferencia G(s). a o o p g t Figura 4.1: Respuesta del sistema ante una entrada El sistema puede ser excitado con distintas se˜ales de entrada r(t). Las m´s utilizadas son las funciones n aimpulso unidad, escal´n unidad, rampa unidad y sinusoidal de amplitud unidad, Fig. 4.2. La respuesta odel sistema ante las distintas entradas suele tener un r´gimen transitorio y otro permanente, aunque este eultimo puede no darse y depende de la estabilidad del sistema.´ „w0DS)S&w0D „w0DS)Sd „w0DS)S0 „w0DS)SR$tw0D d d d d 0 0 0 0 Figura 4.2: Tipos de entradas a los sistemas En este cap´ ıtulo se analizar´ la respuesta temporal de un sistema en funci´n de la entrada que se a oimponga y de las propias caracter´ ısticas de su funci´n de transferencia. o4.1. Sistemas de primer orden Por lo general, la funci´n de transferencia G(s) de un sistema es una expresi´n racional de polinomios o oen s. Las ra´ del denominador se llaman polos y las ra´ del numerador se llaman ceros. Un sistema ıces ıcesde primer orden se define como aquel que posee un unico polo. ´ twXD p  g d + xX Figura 4.3: Sistema de primer orden En la Fig. 4.3 se muestra la representaci´n general de un sistema de primer orden. A la constante K ose le llamar´ ganancia est´tica del sistema y a T constante de tiempo del sistema. a a4.1.1. Respuesta ante entrada impulso La salida temporal c(t) del sistema de primer orden ante una entrada impulso unidad es: K K c(0+ ) = K c(t) = L −1 [C(s)] = L −1 [G(s)R(s)] = L −1 = e− T =⇒ t T , (4.1) 1 + Ts T c(∞) = 0 39
  • 39. donde se han calculado los valores inicial y final de dicha salida. La pendiente inicial de la curva se puedecalcular a partir de la expresi´n general de la derivada: o dc(t) K K = − 2 e− T =⇒ c(0+ ) = − 2 t c(t) = ˙ ˙ (4.2) dt T T Estos resultados se pueden obtener a trav´s de las propiedades de las transformadas de Laplace, sin enecesidad de obtener la salida temporal del sistema: K K c(0+ ) = l´ + c(t) = l´ sC(s) = l´ s ım ım ım = (4.3) t→0 s→∞ 1 + Ts T s→∞ K c(∞) = l´ c(t) = l´ sC(s) = l´ s ım ım ım =0 (4.4) t→∞ s→0 s→0 1 + T s K K K c(0+ ) = l´ c(t) = l´ s[sC(s) − c(0+ )] = l´ s s ˙ ım ˙ ım ım − =− (4.5) t→0 + s→∞ s→∞ 1 + Ts T T2 En la Fig. 4.4 se muestra un ejemplo de respuesta ante entrada impulso. Aparece tambi´n la recta que ecomienza en K con pendiente − T 2 . Se observa que dicha recta pasa por cero para t = T . En el ejemplo, T KT = 0.33 s. 2 2 G(s) = s+3 1.5 c(t) 1 0.5 0 0 0.5 1 1.5 2 tiempo (s) Figura 4.4: Respuesta de un sistema de primer orden ante entrada impulso4.1.2. Respuesta ante entrada escal´n o La salida temporal del sistema de primer orden ante una entrada escal´n unidad es: o K c(0+ ) = 0 c(t) = L −1 [C(s)] = L −1 = K(1 − e− T ) =⇒ t , (4.6) s(1 + T s) c(∞) = Kdonde se han calculado los valores inicial y final de dicha salida. La pendiente inicial de la curva es: dc(t) K K = e− T =⇒ c(0+ ) = t c(t) = ˙ ˙ (4.7) dt T T Tambi´n es posible obtener estos resultados a partir de las propiedades de la transformada de Laplace. eEn la Fig. 4.5 se muestra la respuesta ante entrada escal´n unidad del mismo ejemplo que el apartado oanterior. Ahora el valor final es K, mientras que recta que sale del origen con pendiente K toma el valor TK para t = T . Estas l´ ıneas pueden usarse como referencias para dibujar la respuesta de un sistema amano alzada. Por tanto, el valor de la respuesta en r´gimen permanente coincide con la ganancia est´tica K. e aCuanto menor sea la constante de tiempo T m´s r´pidamente tiende la respuesta del sistema a su valor a aen r´gimen permanente. La constante de tiempo da una idea de la duraci´n del r´gimen transitorio del e o esistema. Aproximadamente la salida llega al 62 % del r´gimen permanente en el instante de tiempo igual ea la constante de tiempo del sistema: c(T ) ≈ 0.62K (4.8) 40
  • 40. 0.8 0.6 c(t) 0.4 0.2 2 G(s) = s+3 0 0 0.5 1 1.5 2 tiempo (s) Figura 4.5: Respuesta de un sistema de primer orden ante entrada escal´n o4.1.3. Respuesta ante entrada sinusoidal La salida temporal c(t) del sistema de primer orden ante una entrada sinusoidal de amplitud unidady frecuencia ω es: Kω c(t) = L −1 [C(s)] = L −1 (4.9) (1 + T s)(s2 + ω 2 ) KωT K2 e− T + t c(t) = 2 sin[(ωt) − arctan(ωT )] (4.10) 1 + (ωT ) 1 + (ωT )2 transitorio permanente Se observa que la salida c(t) posee dos sumandos: el primero es transitorio, desaparece pr´cticamente adespu´s de T segundos, y el segundo es una sinusoidal de frecuencia igual a la de la se˜al de entrada, e npero con una amplitud y un retraso que dependen tanto de la frecuencia ω de entrada como de lascaracter´ ısticas del sistema de primer orden. „w0D „w0D d d w0D w0D 0 0 Figura 4.6: Respuestas del sistema de primer orden ante entrada sinusoidal Si la frecuencia ω de la sinusoidal de entrada aumenta, la sinusoidal de salida poseer´ una amplitud acada vez menor y un retraso cada vez mayor (cualitativamente en la Fig. 4.6). En definitiva, un sistemade primer orden act´a en el dominio de las frecuencias como un filtro pasa-baja, es decir, aten´a las u ufrecuencias elevadas. Una forma de obtener la amplitud de la salida y su retraso en funci´n de la planta y la frecuencia ode entrada consiste en tomar la funci´n de transferencia de la planta y sustituir la variable s por jω. El oresultado es un n´mero complejo cuyo m´dulo es la amplitud de salida y cuya fase es el retraso de la u osalida respecto de la entrada. 2 K s=jω K |G(jω)| = 1+(ωT )2 K G(s) = − − G(jω) = −→ (4.11) 1 + Ts 1 + jωT ∠G(jω) = − arctan(ωT ) Esta propiedad no es exclusiva de los sistemas de primer orden. Se cumple siempre que la entrada essinusoidal, cualquiera que sea la expresi´n G(s) de la funci´n de transferencia de la planta. o o4.1.4. Ejemplos de sistemas de primer orden - Ejemplo 1: En la Fig. 4.7 se puede ver un ejemplo de un sistema f´ ısico de primer orden, y en la ecuaci´n (4.12) la funci´n de transferencia de dicho sistema. o o 41
  • 41. p 87 8L 7 g Figura 4.7: Sistema el´ctrico de primer orden e Vo 1 G(s) = = (4.12) Vi 1 + RCs - Ejemplo 2: En la Fig. 4.8 se puede ver un ejemplo de un sistema f´ ısico de primer orden, y en la ecuaci´n (4.13) la funci´n de transferencia de dicho sistema. o o ? `  > Figura 4.8: Sistema mec´nico de primer orden a X k G(s) = = (4.13) U k + cs4.2. Sistemas de segundo orden Un sistema de segundo orden es aquel que posee dos polos. Este tipo se sistemas se suele representarde la siguiente forma: twXD p  1z g X1L1 zXL 1 z Figura 4.9: Sistema de segundo orden La constante K es la ganancia est´tica del sistema, ζ es el amortiguamiento y ωn es la frecuencia anatural. Dependiendo del car´cter de los polos, el sistema de segundo orden puede ser: a - Sistema subamortiguado. El amortiguamiento posee un valor entre 0 y 1 y los polos del sistema de segundo orden son complejo-conjugados. Su posici´n aparece en la siguiente ecuaci´n: o o p1,2 = −ζωn ± ωn 1 − ζ 2 j = −σ ± ωd j (4.14) La constante σ es la atenuaci´n del sistema y ωd la frecuencia natural amortiguada. En la Fig. 4.10 o se define el ´ngulo φ que forman los polos complejo-conjugados en el plano complejo S con el origen. a - Sistema sobreamortiguado. El amortiguamiento es mayor que la unidad y los polos del sistema de segundo orden son reales localizados en: p1,2 = −ζωn ± ωn ζ2 − 1 (4.15) - Sistema cr´ ıticamente amortiguado. El amortiguamiento es igual a la unidad y los polos son reales e iguales: p1,2 = −ωn doble (4.16) 42
  • 42. C i Q * ± ±i Q Figura 4.10: Localizaci´n de los polos de un sistema de segundo orden subamortiguado o Cualquiera que sea el amortiguamiento del sistema, existen tres puntos clave de la respuesta temporalque siempre cumplen los sistemas de segundo orden ante una entrada escal´n unidad: o 2 Kωn c(0+ ) = l´ + c(t) = l´ sC(s) = l´ s ım ım ım =0 (4.17) t→0 s→∞ s→∞ (s2 2 + 2ζωn s + ωn )s 2 Kωn c(∞) = l´ c(t) = l´ sC(s) = l´ s 2 ım ım ım 2 =K (4.18) t→∞ s→0 s→0 (s + 2ζωn s + ωn )s 2 Kωn c(0+ ) = l´ + c(t) = l´ s[sC(s) − c(0+ )] = l´ s s 2 ˙ ım ˙ ım ım 2 −0 =0 (4.19) t→0 s→∞ s→∞ (s + 2ζωn s + ωn )s Es decir, la respuesta temporal de todos los sistemas de segundo orden comienzan en el origen conpendiente nula, y alcanzan en r´gimen permanente el valor de la ganancia est´tica K. e a - Sistema oscilatorio. El amortiguamiento es cero y los polos del sistema de segundo orden son complejo conjugados imaginarios puros localizados en: p1,2 = ±jωn (4.20) En este ultimo caso no existe ning´n valor de r´gimen permanente ante entrada escal´n unidad. ´ u e o4.2.1. Respuesta subamortiguada ante entrada escal´n o La respuesta de un sistema subamortiguado (ζ < 1) ante una entrada escal´n unidad es: o e−σt c(t) = K 1 − sin(ωd t + φ) (4.21) 1 − ζ2 En la Fig. 4.11 se muestra un ejemplo de respuesta temporal de un sistema subamortiguado. Se tratade una se˜al sinusoidal cuya amplitud se va atenuando seg´n un patr´n exponencial. n u o 1.6 4 1.4 G(s) = s2 +0 .75 s+4 1.2 1 c(t) 0.8 0.6 0.4 0.2 0 0 2 4 6 8 10 tiempo (s) Figura 4.11: Respuesta de un sistema de segundo orden subamortiguado ante entrada escal´n o Existen varios puntos clave en la respuesta temporal. El primero es el tiempo de levantamiento tr , yes el instante en el que la salida pasa por primera vez por el valor de su r´gimen permanente. e π−φ tr = (4.22) ωd 43
  • 43. El tiempo de tipo tp es el instante en el que la salida temporal alcanza su primer m´ximo. A la adiferencia entre el valor del m´ximo y el valor en r´gimen permanente, expresada en por unidad respecto a edel valor en r´gimen permanente, se le llama sobreimpulso m´ximo Mp . e a π tp = (4.23) ωd c(tp ) − c(∞) √−πζ −π Mp = = e 1−ζ2 = e tan φ (4.24) c(∞) El tiempo de establecimiento se define como el instante a partir del cual la respuesta temporal quedacircunscrita en una banda del 2 % o del 5 % en torno al valor en r´gimen permanente. ´ e 4 4 ts (2 %) ≈ = (4.25) ζωn σ 3 3 ts (5 %) ≈ = (4.26) ζωn σ En los sistemas de control no es deseable que exista una respuesta con mucho sobreimpulso ni muyoscilatoria. Se suele buscar que el sistema controlado posea un sobreimpulso entre el 0 % y el 20 % con elmenor tiempo de establecimiento posible.4.2.2. Respuesta sobreamortiguada ante entrada escal´n o La respuesta de un sistema sobreamortiguado (ζ > 1) ante una entrada escal´n unidad es: o ωn e−p1 t e−p2 t c(t) = K 1 + − (4.27) 2 ζ2 − 1 p1 p2donde p1 y p2 son las ra´ reales definidas en (4.15). En la Fig. 4.12 se muestra un ejemplo de respuesta ıcestemporal de un sistema sobreamortiguado. Los sistemas sobreamortiguados no poseen sobreimpulso. 1 0.8 0.6 c(t) 0.4 0.2 4 G(s) = s2 +5 s+4 0 0 1 2 3 4 5 tiempo (s) Figura 4.12: Respuesta de un sistema de segundo orden sobreamortiguado ante entrada escal´n o En este caso existen pocas referencias para dibujar a mano alzada la respuesta temporal. Una formaaproximada de representar la respuesta consiste en dividir la funci´n de transferencia en dos sistemas de oprimer orden, Fig. 4.13, y determinar cu´l de los dos es m´s lento, es decir, el que tiene la constante de a atiempo m´s grande. a t td t1 p €d €1 g p €d €1 g )  (X + €d )(X + €1 ) X + €d X + €1 Figura 4.13: Respuesta de un sistema de segundo orden sobreamortiguado La respuesta ante una entrada escal´n se asemejar´ a la respuesta del sistema de primer orden m´s o a alento a˜adiendo un peque˜o retraso, aproximadamente igual a la constante de tiempo del sistema de n nprimer orden m´s r´pido, y haciendo la pendiente de salida nula. En la Fig. 4.14 se compara la salida del a a 44
  • 44. 1 0.8 0.6 c(t) 0.4 4 0.2 G(s) = s2 +5 s+4 1 G 2 (s) = s+1 0 0 1 2 3 4 5 tiempo (s) Figura 4.14: Respuesta de un sistema de segundo orden sobreamortiguado ante entrada escal´n osistema sobreamortiguado de la anterior Fig. 4.12 con la del sistema de primer orden que impone el polom´s lento. a Una forma intuitiva de explicar este comportamiento consiste es imaginar en la Fig. 4.13 cu´l ser´ la a aentrada de la funci´n de transferencia G2 suponiendo que sea ´sta la que posee el polo m´s lento. Su o e aentrada ser´ una exponencial con una constante de tiempo peque˜a, es decir, aproximadamente un escal´n a n ounidad retrasado la constante de tiempo de G1 .4.2.3. Respuesta cr´ ıticamente amortiguada ante entrada escal´n o La respuesta de un sistema cr´ ıticamente amortiguado (ζ = 1) ante una entrada escal´n unidad es: o c(t) = K[1 + e−ωn t (1 + ωn t)] (4.28) En la Fig. 4.15 se muestra un ejemplo de respuesta temporal de un sistema cr´ ıticamente amortiguado.Este tipo de sistemas tampoco poseen sobreimpulso. 1 0.8 0.6 c(t) 0.4 0.2 25 G(s) = s2 +10 s+25 0 0 0.5 1 1.5 2 tiempo (s)Figura 4.15: Respuesta de un sistema de segundo orden cr´ ıticamente amortiguado con entrada escal´n o4.2.4. Respuesta oscilatoria ante entrada escal´n o La salida de un sistema oscilatorio es: c(t) = K[1 − cos(ωn t)] (4.29) En la Fig. 4.16 se muestra un ejemplo de respuesta temporal de un sistema oscilatorio. En este tipode sistemas el sobreimpulso es del 100 %.4.2.5. Respuesta ante entrada impulso La respuesta de un sistema ante una entrada impulso se puede obtener a partir de la respuesta anteuna entrada escal´n. En la Fig. 4.17 se observa c´mo la respuesta ante una entrada impulso se puede o oconseguir derivando directamente la respuesta del sistema con entrada escal´n unidad. o 45
  • 45. 2 1.5 c(t) 1 0.5 25 G(s) = s2 +25 0 0 1 2 3 4 5 tiempo (s) Figura 4.16: Respuesta de un sistema de segundo orden oscilatorio con entrada escal´n o g p (X) = d t d g p (X) = t X X Figura 4.17: Respuesta de un sistema ante entrada impulso Por tanto, basta con derivar las respuestas temporales de los apartados anteriores para obtener larespuesta del sistema ante entrada impulso. Como los sistemas de segundo orden, cualquiera que sea suamortiguamiento, comienzan y acaban con derivada nula, la respuesta ante entrada impulso comienza yacaba con valor nulo. 2 1 1.5 0.8 1 0.6 c(t) 0.5 0.4 0 0.2 −0.5 −1 0 0 2 4 6 8 10 0 2 4 6 tiempo (s) tiempo (s)Figura 4.18: Respuestas de sistemas de segundo orden ante entrada escal´n (l´ o ınea continua) y ante entradaimpulso (l´ ınea discontinua)4.3. Sistemas de orden superior El comportamiento de los sistemas de orden superior, es decir, de aquellos que poseen tres o m´s apolos, depende fundamentalmente del car´cter de los polos m´s lentos del sistema. Como se ha visto en a ael apartado anterior, el polo m´s lento es el que posee la constante de tiempo m´s grande, es decir, aquel a apolo se encuentran m´s cerca del origen en el plano complejo S. a twXD p € z1 g zXL zDwXL€D wX 1L1 1 Figura 4.19: Sistema de tercer orden Sea un sistema de tercer orden, Fig. 4.19, en el que existe un polo real y dos complejo-conjugados. Larespuesta temporal, depende de la posici´n relativa de los tres polos del sistema. La Fig. 4.20 muestra el o 46
  • 46. caso particular de que los polos complejo-conjugados sean los m´s lentos. La respuesta se asemeja a la del asistema de segundo orden subamortiguado, pero est´ un poco retrasada en el tiempo y tiene un menor asobreimpulso. Ese retraso en el tiempo es aproximadamente igual a la constante de tiempo del polo real. 1.2 C 1 0.8 −1 + 1.E i c(t) 0.6 0.4 − 10 .76 G(s) = s2 +4 s+10 .76 0.2 10 .76 7 G(s) = s2 +4 s+10 .76 s+7 −1 − 1.E i 0 0 0.5 1 1.5 2 2.5 3 tiempo (s) Figura 4.20: Respuesta temporal y posici´n de los polos de un sistema de tercer orden o Por tanto, la inclusi´n de polos adicionales a un determinado sistema no influye en la respuesta otemporal del mismo mientras los nuevos polos se encuentren suficientemente alejados del eje imaginariodel plano complejo S respecto a los que ya ten´ el sistema. Por norma general se puede admitir que los ıapolos que se encuentren m´s alejados que cinco veces la distancia de los polos m´s lentos al eje imaginario, a atienen una influencia en la respuesta temporal del sistema pr´cticamente despreciable. Por esta raz´n, a olos polos lentos se llaman tambi´n polos dominantes del sistema. e En la Fig. 4.21 se muestra un caso particular en el que el polo real es el m´s lento. La respuesta se aasemeja a la del sistema de primer orden, con un retraso adicional y pendiente inicial nula. 1 C 0.8 − + 1.E i 0.6 c(t) 0.4 −1 55 .76 2 0.2 G(s) = s2 +14 s+55 .76 s+2 2 G(s) = s+2 − − 1.E i 0 0 0.5 1 1.5 2 2.5 3 tiempo (s) Figura 4.21: Respuesta temporal y posici´n de los polos de un sistema de tercer orden o4.4. Influencia de los ceros Los ceros del sistema son las ra´ıces del numerador de la funci´n de transferencia. La presencia de oceros en la funci´n de transferencia, modifica la respuesta que se podr´ esperar del sistema atendiendo o ıaa la posici´n de los polos. Se va a mostrar la con el ejemplo de la Fig. 4.22. o La presencia de un cero real negativo hace el efecto contrario un polo, es decir, adelanta la respuestatemporal en lugar de retrasarla. Adem´s, modifica las condiciones iniciales de la respuesta temporal. Si ael sistema ten´ dos polos, la pendiente inicial del sistema pasa de ser nula a no nula. Si el sistema ten´ ıa ıatres polos, la derivada segunda en el instante inicial para se ser nula a no nula. Y as´ sucesivamente. ı En el caso concreto de sistema de segundo orden con cero, como es el caso de la Fig. 4.22, se puedecalcular la pendiente inicial de forma sencilla: 2 2 Kωn (s + z) Kωn c(0+ ) = l´ s[sC(s) − c(0+ )] = l´ s s ˙ ım ım −0 = (4.30) s→∞ s→∞ z(s2 + 2ζωn s + ωn )s 2 z 47
  • 47. 1.5 C z = 0.5 1 c(t) 1 0.5 2 −n −F −d 3 5 G(s) = s2 +4 s+3 3 s+z G(s) = s2 +4 s+3 z 0 0 0.5 1 1.5 2 2.5 3 tiempo (s) Figura 4.22: Influencia del cero en la respuesta temporal del sistema Por tanto, conforme el cero est´ m´s cerca del origen mayor es el valor de la pendiente inicial. a a Otro efecto muy interesante que se puede dar en un sistema es la cancelaci´n de un polo con un cero. oEsto ocurre en el ejemplo de la Fig. 4.22 cuando z toma el valor 1. En ese caso, el sistema disminuye suorden en una unidad y pasa de ser de orden dos a ser de orden uno. Se puede comprobar que la respuestatemporal en ese caso es efectivamente una exponencial con constante de tiempo igual a la que fija el poloque permanece en el sistema. En la pr´ctica, para cancelar un polo con un cero no es necesario que ambos se encuentren exactamente aen la misma posici´n. Basta con que est´n muy pr´ximos para que el efecto de uno se anule con el del o e ootro. 1 0.5 c(t) 0 3(1 −s) G(s) = s2 +4 s+3 −0.5 0 1 2 3 4 5 tiempo (s) Figura 4.23: Respuesta temporal de un sistema de fase no m´ ınima Los sistemas de fase no m´ınima son aquellos que poseen un cero real positivo. La respuesta temporalde este tipo de sistemas tiene la caracter´ ıstica de que comienza evolucionando en la direcci´n contraria oal valor en r´gimen permanente, Fig. 4.23. e4.5. Ejercicios propuestos - Ejercicio 1: Hallar la respuesta temporal del sistema de la Fig. 4.24 para una entrada escal´n o unidad para los valores de la ganancia K = 1, 2 y 5. p d g  X+d ± Figura 4.24: Sistema de control - Ejercicio 2: Dibujar la respuesta temporal del sistema de la Fig. 4.25 para una entrada escal´n o unidad y valores de K = 10, 50 y 100. Calcular el valor de K que consigue que el sistema sea cr´ ıticamente amortiguado. 48
  • 48. p d g  X(X + d() ± Figura 4.25: Sistema de control- Ejercicio 3: La respuesta temporal de un sistema cuya funci´n de transferencia se desconoce o presenta un sobreimpulso del 20 % a los 413 ms. En r´gimen estacionario se alcanza el valor exacto e de la se˜ al de referencia. Se pide deducir la funci´n de transferencia del sistema, la frecuencia de n o las oscilaciones, el tiempo de establecimiento del sistema y la posici´n de las ra´ o ıces en el plano S. Soluciones: G(s) = 73.1 s2 +7.8s+73.1 , ωd = 7.6 rad/s, ts = 1.026 s y p1,2 = −3.9 ± 7.6j (ζ = 0.456)- Ejercicio 4: Dibujar la respuesta temporal del sistema de la Fig. 4.26 para una entrada escal´n o unidad y K = 1. Calcular los valores de K que consiguen una respuesta temporal bien amortiguada. p d g  X +X 1 ± Figura 4.26: Sistema de control Soluci´n: Tomando 1 > ζ > 0.5, entonces 0.25 < K < 1 o- Ejercicio 5: Obtener el tiempo de crecimiento y el sobreimpulso del sistema de la Fig. 4.27. p (.;X + d g X(X + (.E) ± Figura 4.27: Sistema de control Soluci´n: tr = 2.42 s y Mp = 16.3 % o- Ejercicio 6: Dibujar, en una gr´fica, la respuesta al escal´n unidad de tres plantas cuyas funciones a o de transferencia son, respectivamente: 5 G1 (s) = (4.31) s2 + 2s + 5 20 G2 (s) = 2 (4.32) (s + 2s + 5)(s + 4) 20(s + 4) G3 (s) = 2 (4.33) 4s + 8s + 20- Ejercicio 7: La Fig. 4.28 muestra un p´ndulo invertido de 1 m de longitud cuya masa m de 1 kg se e puede considerar concentrada en un punto de su extremo, movi´ndose en un medio sin viscosidad. e E E/ + Figura 4.28: Sistema de un p´ndulo invertido e Su eje de giro est´ actuado por un motor de corriente continua con inductancia despreciable, cons- a tante de par 5 Nm/A y resistencia 1 Ω. Se pide representar el diagrama de bloques del sistema con entrada tensi´n V (s) y salida angulo de giro Θ(s). Determinar la funci´n de transferencia del o ´ o sistema. Para el sistema de realimentaci´n negativa unitaria con controlador proporcional obtener o la ganancia K del controlador que hace que el sistema est´ cr´ e ıticamente amortiguado. 49
  • 49. Soluci´n: oLas ecuaciones que gobiernan el sistema de la Fig. 4.28 son: ⎫ ⎫ v = Ri + e ⎪ ⎪ v = Ri + e ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎫ dθ ⎪ ⎪ dθ ⎪ ⎪ V = RI + E ⎪ e = Km ⎪ ⎬ e = Km ⎪ ⎬ ⎪ ⎬ dt sin θ≈θ dt L E = Km sΘ −−→ −− −→ (4.34) τ = Km i ⎪ ⎪ τ = Km i ⎪ ⎪ T = Km I ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ d2 θ ⎪ d2 θ ⎪ ⎪ ⎪ T + mglΘ = ml2 s2 Θ ⎪ ⎪ τ + mgl sin θ = ml2 2 ⎭ τ + mglθ = ml2 2 ⎭ dt dtSustituyendo los valores num´ricos de las constantes: e ⎫ V =I +E ⎪ ⎪ ⎬ Θ(s) 5 E = 5sΘ ⇒ = 2 (4.35) T = 5I ⎪ ⎪ V (s) s + 25s − 10 ⎭ T + 10Θ = s2 ΘEl sistema controlado por medio de un controlador proporcional es: Θ(s) 5K = 2 (4.36) Θr (s) s + 25s + 5K − 10Identificando coeficientes del denominador: 5K − 10 = ωn 2 ζ=1 ωn = 12.5 rad/s −→ − (4.37) 25 = 2ζωn K = 33.25 V/radEs interesante ver en este problema c´mo un sistema intr´ o ınsecamente inestable como es un p´ndulo einvertido puede hacerse estable al controlarlo. Por otro lado, el valor del angulo θ(t) en r´gimen ´ epermanente es mayor que cualquier ´ngulo de referencia θr que se introduzca. Esto es as´ porque la a ıdiferencia de posiciones —el error— genera el par motor que contrarresta el peso de la masa. 50
  • 50. Cap´ ıtulo 5Error en r´gimen permanente e Un aspecto importante a tener en cuenta es el comportamiento de un sistema ante diversas entradasen r´gimen permanente. En cualquier sistema f´ e ısico de control existe un error inherente, que es el erroren estado estacionario en respuesta a determinados tipos de entradas. Puede ocurrir que un sistemapresente o no error en r´gimen permanente ante diferentes entradas. El error en r´gimen permanente de e elos sistemas en lazo cerrado viene determinado por la funci´n de transferencia en lazo abierto, como se over´ a continuaci´n. a o5.1. Definici´n de error en r´gimen permanente o e Generalmente el error en r´gimen permanente s´lo se suele definir en los sistemas controlados donde la e oreferencia de entrada y la salida controlada son dimensionalmente coherentes, es decir, tienen las mismasunidades. As´ el error a lo largo del tiempo se define como la diferencia entre la entrada y la salida: ı, e(t) = r(t) − c(t) (5.1) As´ el error en r´gimen permanente ess (del ingl´s steady-state error ) se define como el l´ ı, e e ımite cuandoel tiempo tiene a infinito de la se˜al temporal del error: n ess = l´ e(t) = l´ [r(t) − c(t)] ım ım (5.2) t→∞ t→∞ Al error en r´gimen permanente se le suele llamar muchas veces simplemente error, y puede ser nulo, efinito o infinito. Evidentemente es un valor con dimensi´n, y sus unidades son las mismas que las de la oentrada y la salida. De cara al control de sistemas, en general, lo deseable es que el error tienda a cero (o a una cantidadinsignificante) lo m´s r´pidamente posible. As´ se garantiza que la salida controlada coincide con la a a ıreferencia. En este cap´ıtulo se deja de lado la rapidez con que se alcanza el r´gimen permanente y esimplemente se analiza el valor que alcanza el error.5.2. Error en sistemas con realimentaci´n negativa unitaria o La definici´n anterior del error se aplica frecuentemente a los sistemas de realimentaci´n negativa o ounitaria (Fig. 5.1). En este caso particular, la se˜al del error se puede identificar a la salida del comparador nde la referencia y la salida. p g t ± Figura 5.1: Sistema de control en lazo cerrado La funci´n de transferencia en lazo abierto del sistema, en este caso G(s), puede tener diversos polos oy ceros. En este cap´ ıtulo la constante K representa la ganancia est´tica de la funci´n de transferencia en a olazo abierto (5.3) y N es el n´ mero de polos de dicha funci´n de transferencia que se encuentran en el u oorigen del plano S. (1 + T1 s)...(1 + α1 s + β1 s2 ) G(s) = K N (5.3) s (1 + T2 s)...(1 + α2 s + β2 s2 ) 51
  • 51. El valor de N en la funci´n de transferencia en lazo abierto, determina el tipo del sistema. As´ si un o ı,sistema posee en lazo abierto dos polos en el origen (es decir, N = 2), entonces se dice que dicho sistemaes de tipo II. El tipo es una caracter´ ıstica que se puede decir de cualquier funci´n de transferencia, pero oes mejor referirla a todo el sistema controlado (a trav´s de su funci´n de transferencia en lazo abierto). e o El error en r´gimen permanente definido en el dominio temporal se pude pasar al dominio de Laplace eaplicando el teorema del valor final: ess = l´ [r(t) − c(t)] = l´ s[R(s) − C(s)] ım ım (5.4) t→∞ s→0 Para el caso del sistema de la Fig. 5.1, se puede desarrollar la expresi´n del error: o G(s) sR(s) ess = l´ s[R(s) − C(s)] = l´ s R(s) − ım ım R(s) = l´ ım (5.5) s→0 s→0 1 + G(s) s→0 1 + G(s) Por tanto, el valor del error depende de la forma de la entrada y del tipo del sistema. En los siguientesapartados se particulariza este resultado para distintas formas de entrada (escal´n, rampa, etc.). o5.2.1. Error de posici´n o El error de posici´n en estado estacionario es el que se produce en el sistema ante una entrada escal´n. o oPara el caso de escal´n unidad, su valor es: o 1 1 1 1 1+K tipo 0 ep = l´ ım = = = (5.6) s→0 1 + G(s) 1 + l´ s→0 G(s) ım 1 + Kp 0 ≥ tipo I La constante Kp se llama coeficiente de error de posici´n y su valor es igual a la ganancia est´tica de o ala funci´n de transferencia en lazo abierto del sistema o infinito, dependiendo del tipo del sistema, como ose puede deducir de la expresi´n (5.3). o5.2.2. Error de velocidad El error de velocidad en estado estacionario es el que se produce en el sistema ante una entrada rampa.Para el caso de rampa con pendiente unidad, su valor es: ⎧ 1 1 1 ⎨ ∞ tipo 0 1 ev = l´ ım = = = tipo I (5.7) s→0 s + sG(s) l´ s→0 sG(s) ım Kv ⎩ K 0 ≥ tipo II La constante Kv se llama coeficiente de error de velocidad. Su valor es igual a cero, o bien igual a laganancia est´tica de la funci´n de transferencia en lazo abierto del sistema, o bien infinito, dependiendo a odel tipo del sistema.5.2.3. Error de aceleraci´n o El error de aceleraci´n en estado estacionario es el que se produce en el sistema ante una entrada oparab´lica. Para el caso de par´bola unidad, su valor es: o a ⎧ 1 1 1 ⎨ ∞ ≤ tipo I 1 ea = l´ım 2 = = = tipo II (5.8) s→0 s + s2 G(s) l´ s→0 s2 G(s) ım Ka ⎩ K 0 ≥ tipo III La constante Ka se llama coeficiente de error de aceleraci´n. Su valor es igual a cero, o bien igual a la oganancia est´tica de la funci´n de transferencia en lazo abierto del sistema, o bien infinito, dependiendo a odel tipo del sistema.5.2.4. Resumen de errores La Tabla 5.1 resume los errores en estado estacionario en funci´n de la entrada y el tipo del sistema. oSe observa que se puede incrementar el tipo de sistema para mejorar el comportamiento de estado esta-cionario, sin embargo esto hace que sea m´s dif´ controlar el sistema y puede introducir inestabilidades. a ıcilHay que recordar que esta tabla de errores s´lo es aplicable a los sistemas de control con realimentaci´n o onegativa unitaria. 52
  • 52. Tabla 5.1: Errores en r´gimen permanente e 1 1 1 1 Entrada s s2 s3 s4 Tipo 0 1 1+Kp ∞ ∞ ∞ Tipo I 0 1 Kv ∞ ∞ Tipo II 0 0 1 Ka ∞5.3. Magnitud y unidades del error Por el convenio de signos de esta expresi´n, un error positivo significa que la salida no ha alcanzado ola referencia de entrada, mientras que un error negativo —que se puede dar— significa que la salida esmayor que la entrada. Como ya se ha dicho, el error tiene siempre las mismas unidades que la entraday la salida. Evidentemente, cuando el error es nulo o infinito, se obvian las unidades. Cuando el error esfinito puede ser mayor o menor en funci´n de la amplitud de la entrada al sistema. o „w0D „w0D € d € w0D w0D 0 0 Figura 5.2: Respuestas ante entradas escal´n o En la Fig. 5.2 se muestra c´mo, en el caso del error de posici´n, el error es directamente proporcional o oa la amplitud del escal´n de entrada. Para un escal´n de amplitud A, el error es A veces mayor que error o oante entrada escal´n unidad. Esto se puede demostrar con la expresi´n (5.9) que calcula el error ante un o oescal´n de amplitud A y compararlo con el que se calcul´ en (5.6). o o 1 A A A A ep = l´ s ım = l´ ım = = (5.9) s→0 1 + G(s) s s→0 1 + G(s) 1 + l´ s→0 G(s) ım 1 + Kp Una forma de expresar el error de posici´n para cualquier amplitud que posea el escal´n de entrada o oes darlo como un porcentaje respecto de la entrada (5.10). En el caso de que la salida sea mayor que lareferencia no se habla de “porcentajes negativos”, se debe dar el porcentaje siempre en positivo y, comomucho, especificar si es por encima o por debajo de la referencia. El error ante entrada escal´n unidad oser´ el valor del error en por unidad. ıa 100 ep = % (5.10) 1 + Kp Para el caso de entradas dependientes del tiempo, como rampas, par´bolas, etc., la forma de expresar ael valor del error para cualquier entrada es diferente. En la Fig. 5.3 se observa c´mo el valor del error otambi´n es proporcional a la pendiente de la entrada rampa. Sin embargo, existe algo invariante en ambos ecasos, a saber, el retraso en el tiempo entre las dos se˜ ales, et . n € „w0D 0 € „w0D d 0 w0D 0 w0D 0 Figura 5.3: Respuestas ante entradas rampa 53
  • 53. Por esta raz´n, se utiliza la medida del error en el tiempo, en segundos, para expresarlo de forma oindependiente a la pendiente de entrada. Como se puede deducir en la Fig. 5.3, la magnitud num´rica de elos errores et y ep coincide si la rampa de entrada tiene pendiente unidad. Por tanto, se puede emplearel valor num´rico del error en segundos como resultado del l´ e ımite de la ecuaci´n (5.7), aunque no se oconozcan las unidades de la entrada ni de la salida. Tambi´n por esta raz´n, es habitual dar el valor del e ocoeficiente de error de velocidad Kv con unidades de s−1 .5.4. Error en sistemas con realimentaci´n no unitaria o Cuando la realimentaci´n de un sistema de control en lazo cerrado no es unitaria, se plantea un oproblema en la definici´n del error que se dio en la ecuaci´n (5.2), porque la se˜al de referencia puede o o ntener unidades diferentes que la se˜al de salida. Como no se puede definir la diferencia entre la entrada ny la salida, se calcula el l´ ımite cuando el tiempo tiende a infinito de la se˜al e(t) de error del lazo: n ess = l´ e(t) = l´ [r(t) − b(t)] ım ım (5.11) t→∞ t→∞ sR(s) ess = l´ sE(s) = l´ s[R(s) − B(s)] = l´ ım ım ım (5.12) s→0 s→0 s→0 1 + G(s)H(s) De alg´n modo la variable de salida “verdadera” del sistema es B(s) y no C(s), pero el observador us´lo es capaz de ver C(s). Esta idea se ve reforzada por el hecho de que muchas veces el bloque H(s) ocorresponde exclusivamente a la funci´n de transferencia del sensor de la se˜al C(s), por lo que el sistema o ncontrolado es capaz de “observar” la se˜ al B(s) en lugar de C(s). n p o g t ± 4 I Figura 5.4: Sistema de control en lazo cerrado Se observa en la ecuaci´n (5.12), que el error en r´gimen permanente vuelve a depender del tipo de o ela funci´n de transferencia en lazo abierto, en este caso es el producto G(s)H(s). Por tanto, la Tabla 5.1 osigue sirviendo para el c´lculo de los errores, tomando el tipo de la funci´n de transferencia en lazo a oabierto y calculando los coeficientes de error tambi´n con la expresi´n de la funci´n de transferencia en e o olazo abierto. Este hecho corrobora la afirmaci´n que se apunt´ en la introducci´n del cap´ o o o ıtulo de que lamagnitud del error en r´gimen permanente de los sistemas de control en lazo cerrado viene determinada epor el tipo y la ganancia est´tica de la funci´n de transferencia en lazo abierto. a o5.5. Error en sistemas con varias entradas En un sistema controlado, las perturbaciones son entradas al mismo en puntos distintos al de lareferencia. Estas entradas afectan a la salida del sistema en r´gimen permanente, y por tanto, modifican ela magnitud del error. ] p o J h g td t1 ± Figura 5.5: Sistema de control en lazo cerrado con perturbaciones Si se desarrolla la expresi´n del error para el sistema de la Fig. 5.5, se obtiene: o G1 G2 G2 ess = l´ sE = l´ s(R − C) = l´ s R − ım ım ım R− N (5.13) s→0 s→0 s→0 1 + G1 G2 1 + G1 G2 La expresi´n (5.13) se puede dividir en dos partes, la primera es el error del sistema ante la entrada oreferencia con perturbaci´n nula y la segunda es el error del sistema ante la perturbaci´n con referencia o o 54
  • 54. nula. eR = l´ s→0 sE R = l´ s→0 s(R − C R ) ım ım ess = eR + eN ss (5.14) ss ss eN = l´ s→0 sE N = l´ s→0 s(0 − C N ) ss ım ım Para calcular la magnitud del error en r´gimen permanente del sistema ante la entrada referencia con eperturbaci´n nula, se puede emplear de nuevo la Tabla 5.1. Sin embargo, el error ante perturbaci´n con o oreferencia nula, siempre hay que calcularlo anal´ ıticamente. El error ante perturbaciones tambi´n se mide en las unidades de la variable de salida y, evidentemente, esu valor depender´ de la magnitud de la perturbaci´n. Si, por ejemplo, ante una perturbaci´n escal´n de a o o oamplitud 10 N se produce un error de −5 cm y se desea expresar este error en por unidad, se puede decirque es −0.5 cm por unidad de perturbaci´n, es decir, un valor de unidades de salida [cm] por unidad ode perturbaci´n [N]. Nunca hay que perder de vista que se est´n relacionando variables con unidades o adistintas y que la referencia es nula, es decir, nunca se trata de un porcentaje respecto la referencia.5.6. Ejercicios resueltos - Ejercicio 1: El sistema de la Fig. 5.6 representa una inercia sin viscosidad, es decir en el espacio exterior, a la que se impone un movimiento con velocidad constante. La ley de control consiste en una actuaci´n en par puramente proporcional al error de velocidades. o T Ωr 1 Ω K Js – Figura 5.6: Sistema de control en velocidad de una inercia sin viscosidad El sistema es de tipo I por lo que tendr´ error nulo ante entrada referencia escal´n, sin embargo, a o se pide calcular el error ante entradas escalones en la referencia y en la perturbaci´n, por lo que o habr´ que calcularlo anal´ a ıticamente: K 1 ess = l´ s(Ωr − Ω) = l´ s Ωr − ım ım Ωr − T (5.15) s→0 s→0 Js + K Js + K Sustituyendo las entradas por escalones de amplitudes ωr y τ : Js ωr 1 τ τ ess = l´ s ım − = − rad/s (5.16) s→0 Js + K s Js + K s K Como era de esperar por el tipo del sistema, ante la entrada referencia el error es nulo. Sin embargo, la perturbaci´n modifica ese error, haciendo que la velocidad de la inercia sea mayor —el error es o negativo— si se introduce un par extra positivo τ . - Ejercicio 2: Determinar cu´l debe ser el tipo del controlador Gc (s) para que el sistema de la a Fig. 5.7 posea error nulo ante entradas escal´n en referencia y perturbaci´n. El sistema pretende el o o control de la velocidad lineal de un veh´ ıculo. h ]Bt „Bj B B„ z‚Y?{ZjB ~„ d (.n ~ t X + d( (X + d)1 ± Figura 5.7: Sistema de control en velocidad de un veh´ ıculo La expresi´n del error ante entradas referencia y perturbaci´n: o o 0.3Gc Vr P ess = l´ s(Vr − V ) = l´ s Vr − ım ım − (5.17) s→0 s→0 (s + 10)(s + 1)2 + 0.3Gc (s + 10)(s + 1)2 + 0.3Gc 55
  • 55. Sustituyendo las entradas por escalones unidad: (s + 10)(s + 1)2 0.3(s + 10) 1 ess = l´ s ım − (5.18) s→0 (s + 10)(s + 1)2 + 0.3Gc (s + 10)(s + 1)2 + 0.3Gc s 10 3 ess = − (5.19) 10 + 0.3Gc (0) 10 + 0.3Gc (0) El error s´lo puede ser nulo si la funci´n de transferencia del controlador se hace infinito para s = 0, o o es decir, posee al menos un polo en el origen. Por tanto, el controlador debe ser de tipo I o superior: 10 3 ess = − =0 (5.20) 10 + 0.3∞ 10 + 0.3∞ Si se compara este resultado con el del ejercicio del apartado anterior, se observa c´mo la posici´n o o del bloque integrador dentro del lazo es crucial para conseguir que error sea nulo ante la entrada perturbaci´n o no. Si el integrador est´ antes de la perturbaci´n el error ante escalones perturbaci´n o a o o ser´ nulo; si el integrador est´ despu´s, en la planta a controlar, el error ser´ finito. a a e a - Ejercicio 3: Calcular la respuesta temporal ante una entrada escal´n unidad del sistema de la o Fig. 5.8. ¿Tiene sentido el valor el valor num´rico del error entre la entrada y la salida que ofrece e el l´ ımite en el dominio de Laplace? p d g X1 + Figura 5.8: Sistema oscilatorio La respuesta temporal es: 1 1 1 1 s 1 1 c(t) = L −1 [C(s)] = L −1 = L −1 − L −1 2 = − cos 3t (5.21) (s2 + 9)s 9 s 9 s +9 9 9 El error en r´gimen permanente del sistema es: e R s2 + 8 8 ess = l´ s(R − C) = l´ s R − ım ım 2+9 = l´ ım = ¡falso! (5.22) s→0 s→0 s s→0 s2 + 9 9 Aunque se llega a una soluci´n num´rica, el resultado es falso porque —aunque existe el l´ o e ımite en el dominio de Laplace— no existe el l´ımite en el dominio temporal. Por tanto no se puede hablar propiamente de error. En la Fig. 5.9 se puede observar c´mo en realidad se ha encontrado el valor o en torno al cual la respuesta temporal oscila continuamente. „w0D d M w0D 0 1$ n Figura 5.9: Sistema oscilatorio5.7. Ejercicios propuestos - Ejercicio 1: Sea el sistema de la Fig. 5.10, se pide: a) Calcular el valor de K para que el sobreimpulso sea del 5 %. ¿Cu´l es el error en r´gimen a e permanente para dicha K? b) Calcular el valor de K que consigue la mitad del error del apartado anterior. ¿Cu´l es el valor a del sobreimpulso para esa nueva K? 56
  • 56. p d g  (X + d)(X + 1) ± Figura 5.10: Sistema controlado de segundo orden Soluciones: a) K = 2.72 y ess = 42.33 % b) K = 7.44 y Mp = 17.26 %- Ejercicio 2: Se pretende que una peque˜a central hidroel´ctrica produzca una tensi´n de valor Vr n e o sea cual sea la carga que se le conecte P . Un modelo simplificado de dicho sistema aparece en la Fig. 5.11, donde lo unico que puede regular el ingeniero es la apertura de la v´lvula que gobierna ´ a el caudal de entrada en la turbina. Calcular el error en r´gimen permanente del sistema de ante e referencia nula y perturbaci´n escal´n de amplitud τ . Dar la soluci´n en voltios y en rad/s. o o o P Valvula ´ Turbina Generador Vr K 1 1 Ω 1 + 0.1s 1 + 0.2s Js – Tacometro ´ Kt Figura 5.11: Sistema de control de la velocidad de un turbo-generador Soluci´n: o τ ess = − V (5.23) K τ ess = − rad/s (5.24) KKt- Ejercicio 3: Para el sistema de la Fig. 5.12, se pide: a) Error con controlador constante de valor K, perturbaci´n nula y referencia escal´n unidad. o o b) Determinar el tipo del controlador Gc (s) para que el error sea nulo ante referencia rampa unidad y N nula. c) Determinar el tipo del controlador Gc (s) para que el error sea nulo ante referencia escal´n o unidad y perturbaci´n escal´n de amplitud p. o o ] p d g t X1 + X ± Figura 5.12: Sistema de control Soluciones: a) ess = 0 b) Gc (s) tipo I o superior. c) Gc (s) tipo I o superior.- Ejercicio 4: En modelo de la Fig. 5.13 representa un sistema de control con doble lazo, uno exterior de posici´n y otro interior de velocidad, muy usado para el control de m´quina-herramienta. Calcular o a el tipo del controlador Gc (s) para que el error sea nulo ante entradas escal´n. o Soluci´n: Gc (s) tipo I o superior. o 57
  • 57. ] „  d d t p OX + g X ± ± Figura 5.13: Sistema de control de doble lazo B„LF ± ~„ W d ~  -X ± Figura 5.14: Sistema de control de velocidad de un f´rmula 1 o- Ejercicio 5: El sistema de la figura representa la velocidad V que alcanza un f´rmula 1 de masa M o impulsado por una fuerza controlada para alcanzar una determinada velocidad de referencia Vref , en presencia de posibles perturbaciones de la fuerza de rozamiento Froz . a) Determinar el error del sistema ante una entrada Vref escal´n de 100 m/s. o b) Determinar el error del sistema ante una entrada Vref rampa de pendiente 9.8 m/s2 . Expresar el valor del error en forma de ev en m/s y en forma de Kv en s−1 . c) Determinar el error del sistema ante una entrada escal´n Vref de 60 m/s y una perturbaci´n o o fuerza de rozamiento Froz escal´n de valor 50 N. o d) Demostrar que si el rozamiento del sistema es viscoso, es decir, proporcional a la velocidad del tren, el sistema pasa a ser de tipo cero. Determinar en este caso, de nuevo, el error del sistema ante una entrada Vref escal´n de 100 m/s, llamando B a la nueva constante proporcional del o rozamiento viscoso. Soluciones: a) 0 b) ev = 9.8M K m/s, Kv = K M s−1 50 c) K m/s 100B d) B+K m/s- Ejercicio 6: El diagrama de bloques de un determinado sistema es: ] p d g d 1 X ± ± n ; Figura 5.15: Sistema de control a) Obtener la funci´n de transferencia que relaciona la salida C(s) con la referencia R(s). o b) Obtener la funci´n de transferencia que relaciona la salida C(s) con la perturbaci´n N (s). o o c) Calcular el error ante referencia escal´n unidad y perturbaci´n nula. ¿Se puede anular el error o o con las ganancias? d) Calcular el error ante perturbaci´n escal´n unidad y referencia nula. ¿Se puede anular el error o o con las ganancias? 58
  • 58. Soluciones: C(s) K1 K2 a) R(s) = s+(K3 +K4 )K2 C(s) 1 b) N (s) = s+(K3 +K4 )K2 K3 +K4 −K1 c) eR = ss K3 +K4 y se puede anular el error ante entrada referencia haciendo K1 = K3 + K4 −1 d) eN = ss (K3 +K4 )K2 y no se puede anular el error ante entrada perturbaci´n. o- Ejercicio 7: La inercia J del sistema de control de la Fig. 5.16 vale 25 kg·m2 . Las ganancias del sistema las puede ajustar el ingeniero. Se pide: a) Dar un valor para K3 de forma que el error del sistema sea de 1 cm para una entrada xref (t) = t, es decir, una rampa de pendiente 1 m/s. b) Con la ganancia del apartado anterior, dar un valor para el producto K1 K2 para que el sobreimpulso m´ximo sea del orden del 10 %. ¿Cu´l es el valor del tiempo de establecimiento a a del sistema? ± …„ W d d … d 1 OX X ± n Figura 5.16: Sistema de control de doble lazo Soluciones: a) K3 = 0.01 b) K1 K2 = 360000 y ts = 0.055 s- Ejercicio 8: Sea el sistema de la figura: h ± p d g  d X ± ± 1  Figura 5.17: Sistema de control a) Determinar la funci´n de transferencia que relaciona la salida con la entrada de referencia. o b) Calcular el valor del error cuando la entrada perturbaci´n es un escal´n unidad. o o c) Dibujar aproximadamente la respuesta temporal del sistema c(t), si K = K2 = 1, 1 < K1 < 10 y la entrada referencia es un escal´n unidad. Elegir K1 para que la respuesta temporal sea lo o m´s r´pida posible. a a- Ejercicio 9: El sistema de calefacci´n de una casa est´ regido por un conjunto de ecuaciones o a diferenciales que se explican a continuaci´n. Calor generado por los radiadores es: o qr (t) = K1 x(t − tr ), (5.25) donde x(t) es la posici´n de la v´lvula de paso de agua caliente y tr el retraso debido al transporte o a del agua. el calor perdido por las paredes es: qp (t) = K2 [Ti (t) − Te (t)], (5.26) 59
  • 59. donde Ti y Te son la temperatura interior y exterior respectivamente. La temperatura interior es: t Ti (t) = K3 [qr (τ ) − qp (τ )]dτ, (5.27) 0donde K3 es la constante que tiene en cuenta la masa del edificio y su calor espec´ ıfico. Y la ley decontrol del termostato es: x(t) = Kc [Tref (t) − Ti (t)], (5.28)donde Tref es la temperatura de referencia deseada y Kc es la ganancia del controlador del termos-tato. a) Dibujar el diagrama de bloques de esta planta considerando que la entrada es la temperatura de referencia y la salida es la temperatura interior. La temperatura se tratar´ dentro del diagrama a como si fuera una perturbaci´n. o b) Suponiendo que la constante del controlador Kc vale 5 que el resto de las constantes son la unidad, que el retraso de transporte es nulo, que la temperatura exterior es de 0◦ C, calcular la funci´n de transferencia que relaciona la temperatura deseada con la real. o c) Determinar el error en r´gimen permanente, es decir, la diferencia entre la temperatura deseada e y la real, en caso de que la primera sea de 20◦ C suponiendo las mismas condiciones que en el apartado anterior.Soluciones: 5 - La funci´n de transferencia en lazo cerrado es Glc (s) = o s+6 . - El error es 3.33◦ C. 60
  • 60. Cap´ ıtulo 6Estabilidad Para que un sistema de control sea util, lo primero que debe cumplir es que sea estable. Si el sistema ´es inestable no existe r´gimen permanente aunque num´ricamente se puedan encontrar los valores de e elos l´ ımites en el dominio de Laplace que se plantearon en el cap´ ıtulo anterior. Por tanto, asegurar laestabilidad del sistema debe ser un paso previo al c´lculo num´rico de los errores en r´gimen permanente, a e ey por este motivo en algunos libros de texto este cap´ ıtulo preceda al anterior.6.1. Definici´n de estabilidad o Existen varias definiciones para la estabilidad, que no tienen necesariamente por qu´ coincidir. As´ por e ıejemplo, se dice que un sistema es estable cuando: - La respuesta del sistema a un impulso tiende a cero cuando el tiempo tiende a infinito. - Ante una entrada acotada le corresponde una salida tambi´n acotada. e A la segunda situaci´n, se le conoce como estabilidad BIBO (de Bounded-Input Bounded-Output). Para osistemas continuos y lineales que se pueden definir por medio de funciones de transferencia racionalespropias, la estabilidad BIBO se cumple si y s´lo si todos los polos del sistema tienen parte real negativa. oEsto equivale a decir que todos los polos deben estar localizados en el semiplano izquierdo de S. No es de extra˜ ar que la estabilidad del sistema dependa de la posici´n de los polos del sistema, ya n oque se ha estudiado en cap´ ıtulos anteriores c´mo la localizaci´n de los polos de la funci´n de transferencia o o oresulta crucial en el r´gimen transitorio. Incluso es posible intuir el resultado anterior atendiendo a la etabla de transformadas de Laplace elementales. Los polos del sistema son las ra´ ıces de la ecuaci´n que resulta de igualar a cero el denominar de la ofunci´n de transferencia del sistema. Esa ecuaci´n se conoce con el nombre de ecuaci´n caracter´ o o o ıstica delsistema. Por tanto, las ra´ de la ecuaci´n caracter´ ıces o ıstica ofrecen informaci´n no s´lo del transitorio del o osistema, sino tambi´n de su estabilidad. e6.2. Criterio de Routh-Hurwitz Conocer las ra´ de la ecuaci´n caracter´ ıces o ıstica, para comprobar si las partes reales de todas ellas sonnegativas y asegurar as´ que el sistema es estable, es dif´ cuando el orden del sistema es superior a dos. ı ıcilEl problema se incrementa si adem´s, los coeficientes de la ecuaci´n no son valores num´ricos, sino que a o edependen de alg´n par´metro variable. u a El criterio de Routh-Hurwitz1 aplicado a la ecuaci´n caracter´ o ıstica de un sistema permite conocer sies estable o no, sin necesidad de calcular las ra´ıces de dicha ecuaci´n caracter´ o ıstica. Sea la funci´n de transferencia, o C(s) p(s) = , (6.1) R(s) an sn + an−1 sn−1 + ... + a1 s + a0 1 Edward John Routh (1831-1907) gan´ en 1877 el premio Adams por su m´todo de analizar la estabilidad de sistemas o edin´micos de cualquier orden, siguiendo estudios de James Clerk Maxwell. El matem´tico alem´n Adolf Hurwitz (1859-1919) a a apropuso su m´todo para asegurar la estabilidad de turbinas de vapor en 1895, siguiendo estudios de Aurel Boreslav Stodola. eEn 1911 se demostr´ que ambos criterios de estabilidad eran equivalentes. o 61
  • 61. su ecuaci´n caracter´ o ıstica posee n + 1 coeficientes ai reales: an sn + an−1 sn−1 + ... + a1 s + a0 = 0, (6.2) Primero se comprueba que todos los coeficientes ai sean positivos. Si hubiese alg´n coeficiente nulo o unegativo, el sistema no ser´ estable. Si se cumple la condici´n anterior, que se conoce como condici´n de ıa o oCardano-Vi`te, el sistema puede ser estable o no. Para comprobar si es estable, se disponen los coeficientes eai de forma que sigan el patr´n impuesto por la siguiente tabla: o sn an an−2 an−4 an−6 ... sn−1 an−1 an−3 an−5 an−7 ... sn−2 b1 b2 b3 ... (6.3) sn−3 c1 c2 ... ... ... ... s0 d Donde los coeficientes ai se distribuyen en las dos primeras columnas. Los coeficientes de las sucesi-vas filas se calculan empleando los coeficientes de las dos columnas inmediatamente superiores. As´ los ıcoeficientes bi se calculan como sigue: an−1 an−2 − an an−3 b1 = (6.4) an−1 an−1 an−4 − an an−5 b2 = (6.5) an−1 an−1 an−6 − an an−7 b3 = (6.6) an−1 An´logamente, los coeficientes ci se calculan: a b1 an−3 − an−1 b2 c1 = (6.7) b1 b1 an−5 − an−1 b3 c2 = (6.8) b1 A partir de un momento, los coeficientes de las filas valen sucesivamente cero. Estos ceros a veces sonnecesarios para calcular coeficientes posteriores. Se puede observar que el c´lculo de los coeficientes sigue aun patr´n que se puede memorizar. El denominador siempre es el primer coeficiente de la fila inmediata- omente superior. El numerador depende de los coeficientes de las dos filas inmediatamente superiores y esla diferencia de dos productos cuyos t´rminos poseen una posici´n cruzada. Para sucesivos coeficientes, e olos dos primeros t´rminos siempre se emplean en el producto cruzado, mientras que los otros dos van eavanzando. El proceso acaba cuando se calcula la fila de coeficientes en s0 , que s´lo posee un coeficiente no nulo, od en la expresi´n (6.3). El criterio afirma que el sistema es estable si y s´lo si todos los coeficientes de la o oprimera columna de Routh-Hurwitz son positivos. Es, por tanto, una condici´n necesaria y suficiente. La oprimera columna la forman los primeros coeficientes de todas las filas. Aunque el criterio s´lo se fije en los oprimeros coeficientes, las filas hay que completarlas enteras, porque todos los coeficientes son necesariospara calcular los inferiores. Cuando no se cumple el criterio de Routh-Hurwitz, es posible conocer el n´mero de polos del sistema uque est´n en el semiplano de parte real positiva. Existen tantos polos con parte real positiva como cambios ade signo aparecen a la largo de la primera columna de Routh-Hurwitz. Es importante recalcar que criterio de Routh-Hurwitz informa sobre la estabilidad absoluta, es decir,se limita a mostrar si el sistema es estable o no, sin indicar el grado de estabilidad o inestabilidad, lopr´ximo o lo alejado que se est´ de volverse inestable o estable. o a6.2.1. Estabilidad de los sistemas de segundo orden En el caso de sistemas de segundo orden, discernir la estabilidad del sistema es especialmente sencillo.Sea la ecuaci´n caracter´ o ıstica general de segundo orden: a2 s2 + a1 s + a0 = 0 (6.9) 62
  • 62. Si los tres coeficientes a1 , a2 y a3 son positivos no nulos, se cumple la condici´n de Cardano-Vi`te y o eel sistema puede ser estable. Se construye entonces la tabla de Routh-Hurwitz: s2 a2 a0 s1 a1 (6.10) s0 a0 En este caso concreto, los coeficientes de la primera columna coinciden exactamente con los coeficientesdel polinomio de la ecuaci´n caracter´ o ıstica. Por tanto, basta con observar si los tres coeficientes de laecuaci´n caracter´ o ıstica son positivos para que se cumpla tanto la condici´n de Cardano-Vi`te como el o ecriterio de Routh-Hurwitz y se pueda afirmar que el sistema es estable.6.2.2. Estabilidad de los sistemas de tercer orden En el caso de sistemas de tercer orden, tambi´n resulta relativamente sencillo predecir la estabilidad eo no del mismo. Sea la ecuaci´n caracter´ o ıstica general de tercer orden: a3 s3 + a2 s2 + a1 s + a0 = 0 (6.11) Si los coeficientes son positivos no nulos, el sistema puede ser estable. Se construye entonces la tablade Routh-Hurwitz: s3 a3 a1 s2 a2 a0 −a (6.12) s1 a2 a1a2 3 a0 s0 a0 Para que todos los coeficientes de la primera columna sean positivos, la unica condici´n que se debe ´ ocumplir es: a2 a1 > a3 a0 (6.13)6.2.3. Ejemplo num´rico de sistema de cuarto orden e El n´mero de condiciones que se deben cumplir para casos gen´ricos de sistemas de orden elevado u ees cada vez mayor. En este apartado se resuelve el caso concreto de un sistema de cuarto orden con lasiguiente ecuaci´n caracter´ o ıstica: s4 + 2s3 + 3s2 + 4s + 5 = 0 (6.14) Todos los coeficientes son positivos no nulos, por lo que se construye la tabla de Routh-Hurwitz: s4 1 3 5 s3 2 4 0 2·3−1·4 2·5−1·0 s2 2 =1 2 =5 (6.15) s1 1·4−2·5 1 = −6 0 −6·5−1·0 s0 −6 =5 Todos los coeficientes de la primera columna son positivos menos uno que es negativo, por tanto elsistema es inestable. Asimismo, existen dos cambios de signo en la columna, por tanto existen dos ra´ ıcescon parte real positiva. Las ra´ de la ecuaci´n caracter´ ıces o ıstica, es decir, los polos del sistema son: ⎧ ⎪ p1 = 0.29 + 1.41j ⎪ ⎨ p2 = 0.29 − 1.41j (6.16) ⎪ p3 = 1.29 + 0.86j ⎪ ⎩ p4 = 1.29 − 0.86j Efectivamente, como predice el criterio, existen dos polos de parte real positiva.6.3. Casos especiales del criterio de Routh-Hurwitz La confecci´n de la tabla de Routh-Hurwitz puede ser imposible en varios casos, por ejemplo cuando oalguno de los denominadores de los coeficientes se hace nulo. En los siguientes apartados se presenta elmodo de actuar para el caso de las dos situaciones especiales m´s frecuentes. a 63
  • 63. 6.3.1. Se anula el primer coeficiente de una fila Si existe un cero en la primera posici´n de una fila, todos los coeficientes de la fila inmediatamente oinferior se hacen infinitos. Para evitar esta situaci´n, se puede sustituir el coeficiente nulo por una cons- otante positiva muy pr´xima a cero. Esta constante se arrastra en el c´lculo de los siguientes coeficientes o ay permite estudiar el signo de todos ellos. Como ejemplo se puede observar qu´ ocurre cuando la ecuaci´n caracter´ e o ıstica es: s3 − 3s + 2 = (s − 1)2 (s + 2) = 0 (6.17) No cumple la condici´n de Cardano-Vi`te, por la que ya se puede afirmar que el sistema es inestable. o eSi se construye la tabla de Routh-Hurwitz: s3 1 −3 s2 2 (6.18) s1 −3 − 2 s0 2 Si toma un valor positivo muy peque˜o, el siguiente coeficiente de la columna es negativo muy ngrande, por lo que el sistema es inestable. Existen dos cambios de signo, de la segunda a la tercera fila yde la tercera a la cuarta, por tanto existen dos polos de parte real positiva. En efecto, s = 1 es un polodoble con parte real positiva, como ya se mostr´ en la definici´n de la ecuaci´n caracter´ o o o ıstica.6.3.2. Se anula toda una fila Cuando se anula toda una fila de la tabla de Routh-Hurwitz significa que existen ra´ces sim´tricas ı erespecto un eje y situadas encima del otro. Es decir, ser´n ra´ imaginarias puras conjugadas o reales de a ıcessigno contrario. Tambi´n pueden existir ra´ en el origen. Estas ra´ peculiares, se obtienen resolviendo e ıces ıcesla ecuaci´n que se construye con la fila superior a la nula, es decir, el ultimo rengl´n no nulo. o ´ o Como ejemplo, se puede observar c´mo se obtienen esas ra´ o ıces peculiares en la siguiente ecuaci´n ocaracter´ ıstica: s3 + 2s2 + s + 2 = 0 (6.19) Su tabla de Routh-Hurwitz es: s3 1 1 s2 2 2 (6.20) s1 0 s0 indeterminado Toda la fila en s1 es nula. Con los coeficientes de la fila inmediatamente superior no nula, la fila ens2 , se construye la ecuaci´n (6.21), llamada ecuaci´n auxiliar. o o 2s2 + 2 = 0 (6.21) Las ra´ıces de la ecuaci´n auxiliar, en este caso ±j, son tambi´n ra´ o e ıces de la ecuaci´n caracter´ o ıstica. Para poder seguir construyendo la tabla de Routh-Hurwitz, se realiza de la forma habitual una vezque se ha sustituido la fila de ceros por los coeficientes que resultan de derivar el polinomio de la ecuaci´noauxiliar respecto de s. Como ejemplo se puede observar qu´ ocurre cuando la ecuaci´n caracter´ e o ıstica es: s5 + 2s4 + 24s3 + 48s2 − 25s − 50 = 0 (6.22) Su tabla de Routh-Hurwitz es: s5 1 24 −25 s4 2 48 −50 s3 0 0 nueva s3 8 96 (6.23) s2 24 −50 s1 112.7 s0 −50 Donde la nueva fila en s3 se obtiene derivando respecto de s el polinomio de la ecuaci´n auxiliar: o d (2s4 + 48s2 − 50) = 8s3 + 96s (6.24) ds 64
  • 64. La anterior fila en s3 no se tiene en cuenta para la construcci´n de la tabla. En este caso, como era de oesperar, por Cardano-Vi`te, el sistema es inestable y, por tener un unico cambio de signo, le corresponde e ´una sola ra´ con parte real positiva. ız6.4. Ejercicios resueltos - Ejercicio 1: El criterio de Routh-Hurwitz permite estudiar la estabilidad de un sistema de control respecto uno o dos par´metros que puedan intervenir en el sistema. Esto permite establecer las a condiciones que deben cumplir dichos par´metros para que el sistema sea estable. En el sistema de a la Fig. 6.1, se desea determinar el rango de valores de K para que el sistema sea estable. p d g  X(X + d)(X + 1) ± Figura 6.1: Sistema de control La funci´n de transferencia del sistema es: o C(s) K K = = 3 (6.25) R(s) s(s + 1)(s + 2) + K s + 3s2 + 2s + K Su tabla de Routh-Hurwitz es: s3 1 2 s2 3 K 6−K (6.26) s1 3 s0 K Para que el sistema sea estable, K debe pertenecer al intervalo (0,6). - Ejercicio 2: Estudiar la estabilidad del sistema en funci´n del par´metro K si la ecuaci´n carac- o a o ter´ ıstica del mismo es: s5 + 15s4 + 85s3 + 225s2 + 274s + 120 + K = 0 (6.27) Su tabla de Routh-Hurwitz es: s5 1 85 274 s4 15 225 120 + K 3990−K s3 70 15 11760+K (6.28) s2 70 120 + K s1 a s0 120 + K K2 36288 − 387K 5 − 1050 a= 11760+K (6.29) 70 Establecer las condiciones para que todos los coeficientes de la primera columna de la tabla sean positivos es un razonamiento puramente algebraico. El primer coeficiente de la fila en s2 es positivo si se cumple que: K > −11760 (6.30) El primer coeficiente de la fila en s1 es positivo en los siguientes intervalos de K: K ∈ (−∞, −81736.16) ∪ (−11760, 466.16) (6.31) El primer coeficiente de la fila en s0 es positivo si se cumple que: K > −120 (6.32) Combinando las tres condiciones para que todos ellos a la vez sean positivos, se tiene que el sistema sea estable si K pertenece al intervalo: −120 < K < 466.16 (6.33) 65
  • 65. 6.5. Ejercicios propuestos - Ejercicio 1: Sea el sistema de la Fig. 6.2, de dos entradas y dos salidas: X a) Determinar la funci´n de transferencia o Xref con Fref = 0 X b) Determinar la funci´n de transferencia o Fref con Xref = 0 F c) Determinar la funci´n de transferencia o Fref con Xref = 0 F d) Determinar la funci´n de transferencia o Xref con Fref = 0 e) Identificar la ecuaci´n caracter´ o ıstica del sistema. f) ¿Qu´ condici´n se debe cumplir para que el sistema sea estable? e o ± …„ W d … d X(X + d) ± B„ W −1 B 1 X+1 ± Figura 6.2: Sistema de dos entradas y dos salidas Soluciones: X K1 (s+2)−2K2 a) Xref = s(s+1)(s+2)+K1 (s+2)−2K2 X −K2 (s+2) b) Fref = s(s+1)(s+2)+K1 (s+2)−2K2 F −2K2 c) Fref = s(s+1)(s+2)+K1 (s+2)−2K2 F −2s(s+1) d) Xref = s(s+1)(s+2)+K1 (s+2)−2K2 e) s(s + 1)(s + 2) + K1 (s + 2) − 2K2 = 0 f) K1 > K2 66
  • 66. Cap´ ıtulo 7Lugar de las ra´ ıces7.1. Introducci´n o En labores de dise˜o es interesante conocer c´mo var´ la ubicaci´n de los polos del sistema en funci´n n o ıa o ode un par´metro que el ingeniero pueda modificar a su arbitrio. Con esta informaci´n se puede saber a oqu´ especificaciones de r´gimen transitorio se pueden imponer en la respuesta del sistema. Habitualmente e eel par´metro de dise˜o es una ganancia proporcional dentro del lazo de control. El c´lculo de los polos a n aes sencillo con una funci´n de transferencia de segundo orden: o p d g  X(X + 1) ± Figura 7.1: Sistema controlado de segundo orden C(s) K = 2 (7.1) R(s) s + 2s + K Los polos del sistema son las ra´ ıces del denominador, es decir: √ p1,2 = −1 ± 1 − K (7.2) La Fig. 7.2 muestra el lugar que van ocupando estos polos, variando K entre cero e infinito. Elsistema es siempre estable para cualquier valor del par´metro K. Adem´s, su respuesta se puede imponer a asubamortiguada, con cualquier valor de amortiguamiento. C 1 ( Figura 7.2: Lugar de las ra´ del sistema de segundo orden ıces El estudio anal´ ıtico de sistemas de tercer orden o superior es m´s complicado. El m´todo del lugar de a elas ra´ ıces ideado en 1948 por el norteamericano Walter Richard Evans (1920-1999), permite obtener deforma gr´fica la localizaci´n de los polos del sistema sin tener que realizar su c´lculo num´rico. a o a e 67
  • 67. 7.2. Generalidades del m´todo e Se llama lugar de las ra´ de un sistema al lugar geom´trico de los puntos del plano S que satisfacen ıces esu ecuaci´n caracter´ o ıstica cuando se va modificando un determinado par´metro. Se trata por tanto de los apolos del sistema en funci´n de dicho par´metro. o a p g  t ± I Figura 7.3: Sistema de control en lazo cerrado Si el par´metro es una ganancia proporcional K dentro de un lazo de control, con realimentaci´n a onegativa no unitaria, Fig. 7.3, el lugar de las ra´ces es la ubicaci´n de los polos en lazo cerrado del ı osistema. La funci´n de transferencia en lazo cerrado de este sistema es: o C(s) KG(s) KGd (s) Glc = = = (7.3) R(s) 1 + KG(s)H(s) 1 + KGla (s) Los puntos q del lugar de las ra´ anulan el denominador de la funci´n de transferencia: ıces o 1 + KGla (q) = 0 (7.4) Dado que Gla (q) es un n´mero complejo, la ecuaci´n caracter´ u o ıstica (7.4) se puede descomponer en sum´dulo y argumento: o |KGla (q)| = 1 KGla (q) = −1 ⇒ (7.5) ∠Gla (q) = ±180◦ (2k + 1), con k ∈ N Se observa que la condici´n del argumento es independiente del par´metro K variable. Por tanto, o alos puntos q del plano complejo S que cumplen la condici´n del argumento son aquellos que pertenecen oal lugar de las ra´ ıces. En cambio, la condici´n del m´dulo sirve para calcular el valor del par´metro K o o anecesario para que un determinado punto q sea polo del sistema en lazo cerrado. Si se escribe la funci´n de transferencia en lazo abierto factorizada en sus n polos y m ceros, la ecuaci´n o ocaracter´ıstica del sistema es: Kla (q − z1 )(q − z2 )...(q − zm ) 1+K =0 (7.6) (q − p1 )(q − p2 )...(q − pn ) Las nuevas condiciones de m´dulo y argumento son: o ⎧ n ⎪ |KK | = j=1 |q − pj | ⎪ ⎪ ⎪ ⎨ la m i=1 |q − zi | m n (7.7) ⎪ ⎪ ⎪ ⎪ ∠(q − zi ) − ∠(q − pj ) = ±180◦ (2k + 1), con k ∈ N ⎩ i=1 j=1 Se hace notorio que para trazar el lugar de las ra´ de un sistema es necesario conocer la localizaci´n ıces ode los polos y los ceros de la funci´n de transferencia en lazo abierto. o7.3. M´todo para dibujar el lugar de las ra´ e ıces Para dibujar el lugar de las ra´ ıces no es necesario evaluar la condici´n del argumento en todos los opuntos del plano S. Se propone seguir los siguientes pasos:7.3.1. Polos y ceros en lazo abierto Se calculan los polos y los ceros de la funci´n de transferencia en lazo abierto y se sit´an en el plano o uS. El lugar de las ra´ es un conjunto de l´ ıces ıneas sim´tricas respecto al eje real que nacen en los polos en elazo abierto y acaban en los ceros en lazo abierto (si el n´ mero de polos y ceros coincide). u 68
  • 68. La caracter´ıstica de simetr´ se debe a que si un n´mero complejo es ra´ de la ecuaci´n caracter´ ıa u ız o ıstica,tambi´n lo es su conjugado. En cuando a los puntos de salida, son los polos del sistema cuando K = 0: e N (s) 1 + KGla (s) = 1 + K =0 (7.8) D(s) D(s) + KN (s) = 0 (7.9) D(s) = 0, si K = 0 (7.10) Se observa que los polos del sistema en lazo cerrado cuando K = 0 coinciden con los polos del sistemaen lazo abierto. Los puntos de llegada del lugar de las ra´ se obtienen cuando K = ∞ y coinciden con ıceslos ceros en lazo abierto: D(s) + N (s) = 0 (7.11) K N (s) = 0, si K = ∞ (7.12) Por tanto, si hay tantos polos como ceros, el lugar de las ra´ describe un conjunto de curvas cerradas, ıcesque parten de los polos y acaban en los ceros. Si no hay suficientes ceros, algunas ramas no describencurvas cerradas y van hacia el infinito.7.3.2. As´ ıntotas Si el n´mero de polos no coincide con el n´mero de ceros, aparecen en el lugar de las ra´ u u ıces tantasas´ ıntotas como diferencia entre polos y ceros. Es decir, el n´mero de as´ u ıntotas es n−m. Todas las as´ ıntotasse cortan en un unico punto del eje real, que se calcula de la forma: ´ n m j=1 pj − i=1 zi σa = (7.13) n−m Los ´ngulos que forman las as´ a ıntotas respecto al eje real son: 180◦ θa = (2k + 1), con k = 0, 1, ..., n − m − 1 (7.14) n−m7.3.3. Puntos del eje real que pertenecen al lugar de las ra´ ıces Los intervalos de la parte del eje real que pertenecen al lugar de las ra´ ıces, son aquellos que dejan asu derecha un n´mero impar de ceros y polos. Esto se puede justificar aplicando la condici´n angular. u o7.3.4. Puntos de ruptura En un punto del lugar de las ra´ se pueden juntar varios polos del sistema. Se juntan siguiendo una ıcesdirecci´n y se separan siguiendo otra diferente. Son los llamados puntos de ruptura y se buscan entre las ora´ ıces de la ecuaci´n: o dGla (s) =0 (7.15) ds S´lo las ra´ o ıces de la ecuaci´n (7.15) que pertenezcan al lugar de las ra´ o ıces son puntos de ruptura delmismo. Como lo habitual es que los puntos de ruptura aparezcan en el eje real, es suficiente comprobarsi las ra´ ıces se encuentran dentro de los tramos del eje real que pertenecen al lugar de las ra´ ıces.7.3.5. Puntos de corte con el eje imaginario Para encontrar los puntos del lugar de las ra´ıces que cortan el eje imaginario se emplea el criteriode Routh-Hurwitz. Primero se encuentra la ganancia cr´ ıtica del sistema, si existe. Posteriormente sesustituye este valor en la tabla del m´todo de Routh-Hurwitz. Se anular´ una de las filas de la tabla y, e acon la fila inmediatamente superior, se construye el polinomio auxiliar en s, cuyas ra´ıces son los puntosde corte con el eje imaginario. 69
  • 69. 7.3.6. ´ Angulos de salida y llegada Es interesante conocer el ´ngulo con que salen las ramas del lugar de las ra´ desde los polos en lazo a ıcesabierto y el ´ngulo con que llegan a los ceros. Para ello se aplica la condici´n del argumento en un punto a oq muy pr´ximo al polo o cero objeto de estudio. o m n zi q − pj q = ±180◦ (2k + 1), con k ∈ N (7.16) i=1 j=1 Esta condici´n se puede leer como: “la suma de los ´ngulos vistos desde los ceros menos la suma de o alos ´ngulos vistos desde los polos es igual a 180◦ o un angulo equivalente”. a ´7.4. C´lculo de la ganancia a Con los pasos del apartado anterior es posible dibujar f´cilmente el lugar de las ra´ del sistema. Con a ıcesdicha representaci´n se eligen los polos en lazo cerrado m´s adecuados para satisfacer una determinada o acondici´n de dise˜o. En este caso el requerimiento del dise˜o suele ser un determinado comportamiento o n ntransitorio de la salida controlada del sistema. La ganancia que hace que los polos del sistema sean lospuntos elegidos del lugar de las ra´ ıces, se calcula con la condici´n del m´dulo: o o n j=1 pj q KKla = m (7.17) i=1 zi q Esta condici´n se puede leer como: “la ganancia total del sistema en lazo abierto, la que introduce el ocontrolador proporcional y la propia del sistema, es igual al producto de las distancias desde los polos enlazo abierto hasta el polo objetivo dividido por el producto de las distancias desde los ceros”. En el casode que la funci´n de transferencia en lazo abierto no tenga ceros, la condici´n del m´dulo no se divide o o opor nada: n KKla = pj q (7.18) j=17.5. Ejemplos de lugares de las ra´ ıces En los siguientes apartados se muestran varios ejemplos de lugares de las ra´ ıces.7.5.1. Sistema de tercer orden Dado el sistema de la Fig. 7.4, dibujar su lugar de las ra´ y obtener el valor de la ganancia K para ıcesque la salida controlada posea un amortiguamiento de 0.5. p d g  X(X + d)(X + 1) ± Figura 7.4: Sistema controlado de tercer orden El tramo del eje real (−∞, −2] ∪ [−1, 0] pertenece al lugar de las ra´ ıces. Existen tres as´ ıntotas de´ngulos 60◦ , 180◦ y 300◦ . El punto de cruce de las as´a ıntotas se encuentra en: −1 − 2 = −1 σa = (7.19) 3 Los puntos de ruptura de buscan entre las ra´ de la ecuaci´n: ıces o r1 = 0.4226 3s2 + 6s + 2 = 0 → (7.20) r2 = −1.5774 El unico punto de ruptura es r1 porque r2 no pertenece al lugar de las ra´ ´ ıces. Para calcular los puntosde corte con el eje imaginario, se aplica el criterio de Routh-Hurwitz a la ecuaci´n caracter´ o ıstica: s3 1 2 s2 3 K 6−K (7.21) s1 3 s0 K 70
  • 70. En el rango 0 < K < 6 el sistema es estable. Para la ganancia cr´ ıtica de valor KCR = 6 se anula lafila en s1 y con la fila en s2 se construye la ecuaci´n (7.22), cuyas ra´ o ıces son los puntos de corte con eleje imaginario. √ 3s2 + 6 = 0 → s = ± 2j (7.22) Con esta informaci´n se puede dibujar el lugar de las ra´ o ıces, Fig. 7.5. C S)S( x 1i ±1 ±d ( ± ( ;1 1i Figura 7.5: Lugar de las ra´ del sistema de tercer orden ıces Para que la salida del sistema posea un amortiguamiento de 0.5 los polos deben formar un angulo de ´60◦ con el origen de coordenadas. El unico punto del lugar de las ra´ que cumple esta condici´n se ha ´ ıces orepresentado en la Fig. 7.5 con un tri´ngulo. Se aplica la condici´n del m´dulo en ese polo y resulta: a o o K = 0.68 · 0.87 · 1.75 = 1.03 (7.23) Como es una resoluci´n gr´fica, no es aconsejable dar el resultado con m´s de dos decimales. El polo o a aobjetivo se˜alado como un tri´ngulo no es el unico polo en lazo cerrado. Es un sistema de tercer orden, n a ´por lo que hay tres polos en lazo cerrado. Los tres polos se pueden calcular asignando un valor K = 1.03a la ganancia en la ecuaci´n caracter´ o ıstica del sistema: q1 = −2.3317 s3 + 3s2 + 2s + 1.03 = 0 → (7.24) q2,3 = −0.3341 ± 0.5745j El polo objetivo q2 forma 59.82◦ con el origen, es decir, posee un amortiguamiento casi exactamentede 0.5. Se comprueba que el m´todo gr´fico es lo suficientemente robusto como para ser v´lido a pesar e a ade la variabilidad que puede suponer la representaci´n gr´fica a mano alzada, o la medici´n aproximada o a ode las distancias. Tambi´n se observa que el polo objetivo complejo-conjugado es dominante frente al polo real dentro edel sistema es de tercer orden. Por tanto, se puede afirmar que la respuesta transitoria del sistema poseeel amortiguamiento deseado. Para asegurar que se cumplen las especificaciones transitorias deseadas,siempre es conveniente comprobar que los polos objetivos son los dominantes en el sistema controlado.7.5.2. Sistema de segundo orden con un cero Dado el sistema de la Fig. 7.6, dibujar su lugar de las ra´ ıces. Los polos en lazo abierto est´n en: a √ s2 + 2s + 3 = 0 → p1,2 = −1 ± 2j (7.25) 71
  • 71. p X+1 g  X1 + 1X + n ± Figura 7.6: Sistema controlado de segundo orden con cero Hay un cero en lazo abierto en −2. El tramo del eje real (−∞, −2] pertenece al lugar de las ra´ıces.Existe una unica as´ ´ ıntota que forma 180◦ con la horizontal. Los puntos de ruptura de buscan entre lasra´ ıces de la ecuaci´n: o r1 = −0.2679 s2 + 4s + 1 = 0 → (7.26) r2 = −3.7321 El unico punto de ruptura es −3.7321 porque el otro no pertenece al lugar de las ra´ ´ ıces. Para calcularlos puntos de corte con el eje imaginario, se observa la ecuaci´n caracter´ o ıstica del sistema: s2 + (2 + K)s + (3 + 2K) = 0 (7.27) El sistema es estable para cualquier valor de K, por lo que no existen cortes con el eje imaginario.Los puntos de salida de los polos imaginarios se calculan aplicando la condici´n del angulo: o ´ √ arctan 2 − φsalida − 90◦ = −180◦ (7.28) ◦ φsalida = 144.73 (7.29) El angulo de salida del polo conjugado ser´ −144.73◦ para que el lugar de las ra´ ´ a ıces sea sim´trico erespecto del eje real. Con estos datos, ya es posible dibujar el lugar de las ra´ del sistema, Fig. 7.7. ıces C d;; nž d 1i ±1 ± n n d 1i Figura 7.7: Lugar de las ra´ del sistema de segundo orden con un cero ıces El tramo que va desde los polos del sistema hasta el punto de ruptura es una circunferencia centradaen el cero. Esto s´lo ocurre en los sistemas segundo orden con un unico cero. Si se desea conocer alg´ n o ´ upunto del lugar de las ra´ ıces entre los polos de salida y el punto de ruptura, es posible hace un cambiode variable en s y encontrar los puntos de corte con los nuevos ejes imaginarios. Por ejemplo, con el cambio de variable s = s + 2, la ecuaci´n caracter´ ˆ o ıstica en la nueva variable s es: ˆ s2 + (K − 2)ˆ + 3 = 0 ˆ s (7.30) En los nuevos ejes es sistema es estable para valores de K mayores que 2. Para K = 2, los puntos decorte con los nuevos ejes son: √ s2 + 3 = 0 → s = ± 3j ˆ ˆ (7.31) En la Fig. 7.8 se muestran los nuevos ejes tras el cambio de variable y los puntos de corte del lugarde las ra´ ıces con dichos ejes. Se puede ver que el radio de la circunferencia mide 1.7321. 72
  • 72. Ö C C ni ni Figura 7.8: Lugar de las ra´ del sistema de segundo orden con un cero ıces Se pueden efectuar cuantos cambios de variable se desee para determinar la posici´n de otros polos en olazo cerrado. Si se buscan gr´ficamente los puntos del lugar de las ra´ que poseen un amortiguamiento a ıcesde 0.7, se˜ alados con tri´ngulos en la Fig. 7.9, la ganancia que hace que el sistema posea dichos polos en n alazo cerrado es K = 1.39. C S)S(  Figura 7.9: Lugar de las ra´ del sistema de segundo orden con un cero ıces 0.76 · 3.18 K= = 1.39 (7.32) 1.73 Sin embargo, a pesar de que los polos en lazo cerrado tienen ese amortiguamiento, la respuestatransitoria no es exactamente subamortiguada con esa caracter´ ıstica. La raz´n es que existe un cero en oel sistema tan cercano al eje imaginario como los dos polos. En la ecuaci´n (7.33) se muestra c´mo en un o o 73
  • 73. sistema de control con realimentaci´n negativa unitaria los polos en lazo cerrado var´ con la ganancia o ıanK mientras que los ceros en lazo cerrado no se modifican y coinciden con los ceros de la funci´n de otransferencia en lazo abierto. C(s) K N (s) D(s) KN (s) = N (s) = (7.33) R(s) 1 + K D(s) D(s) + KN (s) En el ejemplo de este apartado, con la ganancia K = 1.39 calculada, la funci´n de transferencia en olazo cerrado queda: C(s) 1.39(s + 2) = 2 (7.34) R(s) s + 2s + 3 + 1.39(s + 2) Los polos del sistema en lazo cerrado est´n en −1.6950 ± 1.7049j y el cero en −2. En la Fig. 7.10 ase compara la respuesta de este sistema ante una entrada escal´n unidad, con la un sistema de segundo oorden de amortiguamiento 0.5, sin cero e igual r´gimen permanente. La presencia del cero hace que la erespuesta del sistema sea m´s r´pida, con pendiente inicial no nula. El primer sobreimpulso se adelanta a ay es mayor al que impone un amortiguamiento de 0.5. 2 4 s2 +2 s+4 4(s+1) 1.5 s2 +2 s+4 c(t) 1 0.5 0 0 1 2 3 4 5 tiempo (s) Figura 7.10: Respuesta temporal del sistema controlado de segundo orden con cero y sin cero Con este ejemplo queda patente existen circunstancias en las que con una ley de control puramenteproporcional no es posible cumplir las especificaciones de r´gimen transitorio. Observando la respuesta etemporal del sistema, tambi´n es posible observar otra limitaci´n del controlador puramente proporcional, e oy es que no se tiene ning´n control sobre el error en r´gimen permanente del sistema. Cuando se emplea u ela condici´n del m´dulo para calcular la ganancia K, adem´s de situar los polos en lazo cerrado en una o o adeterminada posici´n para escoger un comportamiento transitorio, tambi´n se est´ fijando el error en o e ar´gimen permanente que va a tener el sistema. e7.6. Estabilidad relativa El criterio de Routh-Hurwitz informa sobre la estabilidad absoluta de un sistema, pero no dice nadasobre la estabilidad relativa del mismo, es decir, cu´nto de cerca o de lejos est´ de volverse inestable. Para a adar una medida de la estabilidad relativa de un sistema se definen los conceptos de margen de gananciay margen de fase.7.6.1. Margen de ganancia El margen de la ganancia es el factor proporcional que se debe introducir dentro del lazo de controlpara que el sistema se vuelva cr´ ıticamente estable. El margen de ganancia es, por tanto, el cociente de laganancia cr´ ıtica del sistema entre la ganancia actual de la funci´n de transferencia en lazo abierto. o En la Fig. 7.11 se muestra el lugar de las ra´ ıces de un sistema. Se ha impuesto un comportamientotransitorio con amortiguamiento 0.5 y la ganancia necesaria para ello es K = 1.03. El sistema se haceinestable para una ganancia cr´ ıtica KCR = 6. El margen de ganancia es MG = 5.82. Si el sistema fuera estable para cualquier valor de K, el margen de ganancia del sistema ser´ infinito. ıa 74
  • 74. C gp ) E ½ ¾ p ) x M1  ) d (n ¿ ±1 ±d ( Figura 7.11: Margen de ganancia de un sistema7.6.2. Margen de fase El margen de fase se define como el ´ngulo que se puede sustraer al sistema para dejarlo en el l´ a ımitede estabilidad, manteniendo constante la ganancia del mismo. En la Fig. 7.12 se se˜alan los puntos del nplano S en los que se obtiene una ganancia en lazo abierto de K = 2 aplicando la condici´n del m´dulo. o o C * dM(ž ½ )1 ¾ 0) Ex ;1ž * dd; xMž ¿ 1 ( Figura 7.12: Margen de fase de un sistema S´lo los dos puntos en los que se obtiene una fase de −180◦ aplicando la condici´n del angulo pertenecen o o ´al lugar de las ra´ ıces. La diferencia entre la fase de esos puntos y la fase de los puntos con la misma gananciaque est´n sobre el eje imaginario es el margen de fase del sistema. a Los retrasos en el dominio temporal producen precisamente una p´rdida de fase en el sistema que los epueden hacer inestables.7.7. Lugar de las ra´ ıces en funci´n de otros par´metros o a La t´cnica del lugar de las ra´ se puede emplear tambi´n si el par´metro variable no es una ganancia e ıces e aproporcional dentro del lazo de control. Para no contradecir el desarrollo te´rico empleado, es necesario oexpresar la ecuaci´n caracter´ o ıstica del sistema de la forma siguiente: 1 + αF (s) = 0 (7.35) 75
  • 75. Donde F (s) es una funci´n de transferencia cualquiera. Se dibuja el lugar de las ra´ces como si F (s) o ıfuera la funci´n de transferencia en lazo abierto del sistema. o Hay que se˜ alar que la funci´n de transferencia F (s) no responde la modelizaci´n matem´tica de n o o aning´n elemento f´ u ısico del sistema. Puede tener, por ejemplo, m´s ceros que polos, cosa que nunca ocurre acon funciones de transferencia de elementos f´ısicos.7.8. Ejercicios propuestos - Ejercicio 1: Dibujar el lugar de las ra´ de los sistemas cuyas funciones de transferencia en lazo ıces abierto son las siguientes: K(s + 5) G(s) = (7.36) s(s + 3)3 3Ks(s − 6) G(s) = (7.37) (s + 3)[(s + 4)2 + 1] K G(s) = (7.38) s(s + 3)[(s + 3)2 + 49] K(s2 + 4s + 5) G(s) = (7.39) s(s2 + 2s + 10) K(s − 1)2 G(s) = (7.40) (s + 2)(s + 3)[(s + 2)2 + 9] - Ejercicio 2: Sea el sistema de la figura: p 1X+1 g  X1 −1X ± Figura 7.13: Sistema de control Se pide determinar la ganancia K, por el m´todo del lugar de las ra´ e ıces, tal que los polos en lazo cerrado posean un amortiguamiento de 0.5. Soluci´n: K = 2 o - Ejercicio 3: Sea el sistema: p XL d( g XLM X(X + d) ± Figura 7.14: Sistema de control a) Dibujar el lugar de las ra´ del sistema, en funci´n del par´metro α. ıces o a b) Elegir de forma adecuada el par´metro α para el sistema. a c) ¿Qu´ polos y/o ceros influyen en la respuesta transitoria del sistema compensado con el par´me- e a tro elegido en el apartado anterior? - Ejercicio 4: Dibujar el lugar de las ra´ del sistema de la Fig. 7.15, en funci´n del par´metro K. ıces o a p X+d d( g X+ X(X + d) ± ±  Figura 7.15: Sistema de control 76
  • 76. - Ejercicio 5: Un sistema controlado posee el diagrama de bloques de la Fig. 7.16. El ingeniero puede elegir el factor constante K2 que multiplica a la referencia R antes de entrar en el lazo, y el coeficiente K1 del controlador. La salida del sistema se mide a trav´s de un sensor con funci´n de e o transferencia no unitaria. pstst{$s ]Bt „Bj _jst s p d d g 1 ((.xX + d)(X + d) X+1 ± 7‚tRB„ d (.((xX + d Figura 7.16: Sistema de control Se pide asignar unos valores adecuados para las constantes K1 y K2 de forma que el sistema posea error nulo ante entrada referencia escal´n de amplitud 50 unidades y los polos dominantes en lazo o cerrado posean aproximadamente un amortiguamiento de 0.7. ıces: −150.41, −2 y −1.33 Nota: Los puntos de ruptura se deben buscar entre las siguientes ra´ Soluci´n: K1 = 1.24 y K2 = 2.61 o- Ejercicio 6: Dibujar el lugar de las ra´ del siguiente sistema en lazo abierto: ıces 4(s + z) G(s) = (7.41) s(s + 1)(s + 3) Donde el par´metro z var´ desde cero hasta infinito. Se pide contestar razonadamente: a ıa a) ¿Se puede dejar el sistema con amortiguamiento 0.5? b) ¿Existe alg´n cero que afecte la respuesta temporal? En caso positivo, ¿se podr´ intentar u ıa anular su efecto? Nota: No hay puntos de ruptura. 4 Soluciones: Operando, la ecuaci´n caracter´ o ıstica del sistema es 1 + z s(s2 +4s+7) = 0. a) S´ se pueden dejar los polos complejo-conjugados del sistema en lazo cerrado con un angulo de ı ´ 60◦ con el origen. b) La respuesta temporal siempre est´ afectada por el cero en −z que se puede anular con el polo a real en lazo cerrado.- Ejercicio 7: La Fig. 7.17 muestra el diagrama de bloques de un extender, que es un mecanismo que sirve para amplificar la fuerza de un operador humano. B ± IwXD twXD 4wXD … gwXD  owXD pwXD ± U Figura 7.17: Extender Hallar la funci´n de transferencia general que relaciona la fuerza de entrada F y la posici´n de o o salida X. 77
  • 77. Si las funciones de transferencia que intervienen en la figura toman los siguientes valores: 1 1 H(s) = E(s) = B(s) = 1, G(s) = R(s) = , C(s) = (7.42) s(s − 1) s Entonces la funci´n de transferencia que relaciona la fuerza F y la posici´n X es: o o X(s) K(s − 1) + 1 = 2 (7.43) F (s) s + (2K − 1)s + 2(1 − K) a) Determinar el rango de ganancias K para los que dicha funci´n de transferencia es estable. o b) Dibujar el lugar de las ra´ de dicha funci´n de transferencia en funci´n de la ganancia K. ıces o o c) Elegir el valor de la ganancia K que deja los polos de la funci´n de transferencia con amor- o tiguamiento 1 y describir c´mo ser´ la respuesta temporal ante una entrada escal´n unidad. o a o Calcular el valor en r´gimen permanente, el valor y la pendiente de salida de la respuesta e temporal ante entrada escal´n unidad. o X(s) G+KBC Soluciones: F (s) = 1+E(R+KC)+H(G+KBC) a) Estable para 0.5 < K < 1 b) Dos polos en lazo abierto ficticio en 0.5 ± 1.32j y un cero en 1, un punto de ruptura en −0.41, cortes con el eje imaginario en el origen y ±j y ´ngulos de salida ±200.7◦ a c) K = 0.92- Ejercicio 8: La funci´n de transferencia de una planta es: o 1 G(s) = (7.44) (s + 1)(s + 2)(s + 5) a) Dibujar el lugar de las ra´ ıces. b) Elegir una ganancia de forma que el amortiguamiento de la planta sea de 0.5. c) Indicar la posici´n de todos los polos en lazo cerrado e indicar cu´les son los dominantes. o a d) Calcular el error en r´gimen permanente del sistema en lazo cerrado ante una entrada escal´n. e o e) Dibujar de forma aproximada la respuesta de la planta en lazo cerrado con la ganancia ante- riormente calculada. Indicar claramente c´mo afectan los polos adicionales con respecto a la o respuesta de la planta considerando s´lo los polos dominantes. o f) Se desea que el error ante una entrada escal´n sea nulo (conservando en lo posible el comporta- o miento anteriormente calculado). Para ello se sustituye la ganancia por un cierto controlador. Indicar qu´ controlador es el adecuado, cu´l es su ecuaci´n y calcular los valores de sus par´me- e a o a tros para esta planta particular. Nota: Para hacer algunos apartados no hace falta conocer los anteriores. 78
  • 78. Cap´ ıtulo 8Respuesta en frecuencia En este cap´ıtulo se estudia la respuesta del sistema ante una entrada sinusoidal. Esto permite hallarla funci´n de transferencia de un sistema con una planta compleja mediante un m´todo pr´ctico sencillo. o e a La representaci´n de la respuesta en frecuencia de un sistema sirve para dar una medida de su oestabilidad relativa, completando la informaci´n que puede dar el criterio de Routh-Hurwitz. o8.1. Respuesta a una entrada sinusoidal Sea G(s) la funci´n de transferencia de un sistema y R(s) una entrada sinusoidal. La salida del sistema oen el dominio temporal y r´gimen permanente es: e r(t) = sin(ωt) =⇒ c(t) = |G(jω)| sin[ωt + ∠G(jω)] (8.1) Por tanto el sistema amplifica o aten´ a en funci´n de la frecuencia de la se˜al de entrada. Lo mismo u o nocurre con el adelanto o retraso de la se˜al de salida respecto de la entrada. Existen varias formas de nrepresentar esos cambios en funci´n de la frecuencia, Fig. 8.1. En esta asignatura, sin embargo, s´lo se o oemplear´n los diagramas de Bode. a twi D y8>twi DH twi D twi D i‚>twi DH twi D sDSW${YBjR ADSWkJZ$R {DS BI‚ Figura 8.1: Representaciones gr´ficas de la respuesta en frecuencia a8.2. El diagrama de Bode El norteamericano Hendrik Wade Bode (1905-1982) us´ por primera vez en 1938 el diagrama que olleva su nombre para el estudio de estabilidad de sistemas en lazo cerrado. Durante la Segunda GuerraMundial contribuy´ al r´pido desarrollo de servomecanismos para dispositivos de control de disparo. Su o auso se extendi´ ampliamente en el estudio de los circuitos electr´nicos. o o Un diagrama de Bode consta de dos gr´ficas, una para la amplitud de salida y otra para el desfase de asalida. Se los denominar´ respectivamente diagrama de ganancias y diagrama de fases. Los dos diagramas arepresentan las frecuencias de forma logar´ ıtmica en el eje de abscisas empleando rad/s. El diagrama de ganancias representa en el eje de ordenadas la amplitud de la se˜al de salida trans- nformados a decibelios, ecuaci´n (8.2). El diagrama de fases representa en el eje de ordenadas el desfase ode la se˜ al de salida en grados. n 20 log |G(jω)| (8.2) En realidad, el uso de los decibelios como unidad de medida es una forma solapada de representar laamplitud de salida en escala logar´ ıtmica. Conviene resaltar que los logaritmos son siempre decimales, no 79
  • 79. neperianos. El factor 20 de la definici´n (8.2) se debe en parte al uso de la fracci´n del belio y en parte o oal empleo de la potencia de la se˜al —lo que hace que haya que elevar al cuadrado la amplitud dentro ndel logaritmo y salga fuera de ´l como un factor de dos—. e En el eje logar´ ıtmico de frecuencias se denomina d´cada a cualquier intervalo que va desde una edeterminada frecuencia hasta otra diez veces mayor. Se denomina octava a cualquier intervalo que vadesde una frecuencia hasta su doble. El nombre no tiene nada que ver con un hipot´tico factor de ocho, esino que proviene de las notas musicales. La escala musical tiene siete notas, al hacer sonar la octava notase obtiene la misma nota que la inicial con el doble de frecuencia. Tanto la d´cada como la octava son edistancias constantes en una escala logar´ıtmica.8.3. Diagramas de Bode de sistemas elementales Para poder dibujar el diagrama de Bode de una funci´n de transferencia cualquiera, es necesario oconocer la forma que adopta dicho diagrama es el caso de las funciones de transferencia m´s elementales. aLas funciones de transferencia m´s complicadas se obtendr´n como combinaci´n de las elementales. Las a a ofunciones de transferencia que se tomar´n como elementales son: una ganancia, un retraso en el tiempo, aun integrador, un derivador, un polo, un cero, un polo doble y un cero doble.8.3.1. Ganancia Una ganancia se limita a amplificar o a atenuar la entrada sin introducir retrasos o adelantos en lase˜ al de salida. Por tanto, es de esperar que el diagrama de Bode de una ganancia sea nulo en fases y no nnulo en amplitud. s=jω 20 log |G(jω)| = 20 log K G(s) = K − − G(jω) = K −→ (8.3) ∠G(jω) = 0◦ Como se observa el diagrama de Bode de la Fig. 8.2, es l´gico que una ganancia amplifique o aten´e o usiempre el mismo factor cualquiera que sea la frecuencia de la se˜ al de entrada, es decir, adopte una nforma constante con ω. 35.5 G(s) = 52 35 Ganancia (dB) 34.5 34 33.5 33 1 0.5 Fase ( ) ◦ 0 −0.5 −1 0 1 10 10 Frecuencia (rad/s) Figura 8.2: Diagrama de Bode de una ganancia Si K es menor que la unidad, la ganancia aten´a y se obtiene un nivel de decibelios negativo. Si K ues mayor que la unidad, la ganancia amplifica y se obtiene un nivel de decibelios positivo. Por tanto, enel tramo del diagrama de Bode que los decibelios sean positivos, quiere decir que la se˜al de entrada se namplifica, mientras que en los tramos de decibelios negativos, la se˜al de entrada se aten´a. n u8.3.2. Retraso en el tiempo Un retraso ni amplifica ni aten´a. La forma de la salida es exactamente igual a la de la entrada, uaunque la salida est´ retrasada T segundos respecto de la entrada. Dicho esto, es de esperar que sea nulo a 80
  • 80. el diagrama de ganancias y negativo el de fases. s=jω 20 log |G(jω)| = 0 dB G(s) = e−T s − − G(jω) = e−jωT −→ (8.4) ∠G(jω) = −ωT rad Para una frecuencia en rad/s igual a la inversa del tiempo T de retraso, el diagrama de fases toma unvalor de −1 rad. Una d´cada despu´s −10 rad. Dos d´cadas despu´s −100 rad. As´ sucesivamente. e e e e ı El diagrama de Bode, Fig. 8.3, muestra que la funci´n de transferencia genera desfases cada vez omayores con la frecuencia. El desfase es directamente proporcional a la frecuencia, por tanto, la gr´fica aes una l´ınea recta con la frecuencia en escala lineal y queda con forma exponencial con la frecuencia enescala logar´ıtmica. 1 G(s) = e−0 .3 s Ganancia (dB) 0.5 0 −0.5 −1 0 −45 Fase ( ) ◦ −90 −135 −180 0 1 10 10 Frecuencia (rad/s) Figura 8.3: Diagrama de Bode de un retraso La salida se adelanta respecto de la entrada, hecho poco probable en el mundo real, la funci´n de otransferencia ser´ una exponencial con exponente positivo. Su diagrama de Bode en fases tendr´ ´ngulos ıa ıa apositivos. Por este motivo, cuando en el diagrama de fases aparezcan angulos negativos se hablar´ de ´ aretrasos de fases y, al rev´s, con ´ngulos positivos se hablar´ de adelanto de fases. e a a8.3.3. Integrador Un integrador tiene por salida la integral de la funci´n de entrada. El diagrama de Bode de fases es oconstante en −90◦ . Esto es l´gico ya que la integral de un seno es un menos coseno, que est´ retrasado o a90◦ respecto el seno. 1 s=jω 1 1 20 log |G(jω)| = −20 log ω G(s) = − − G(jω) = −→ = ∠−90◦ (8.5) s jω ω ∠G(jω) = −90◦ El diagrama de Bode de ganancias es una recta con pendiente −20 dB/d´cada. La recta pasa por e0 dB en la frecuencia de 1 rad/s.8.3.4. Derivador Un derivador tiene por salida la derivada de la funci´n de entrada. El diagrama de Bode de fases es oconstante en 90◦ . Esto es l´gico ya que la derivada de un seno es un coseno, que est´ adelantado 90◦ o arespecto el seno. s=jω 20 log |G(jω)| = 20 log ω G(s) = s − − G(jω) = jω = ω∠90◦ −→ (8.6) ∠G(jω) = 90◦ El diagrama de Bode de ganancias es una recta con pendiente 20 dB/d´cada. Igual que los integradores, ela recta pasa por 0 dB en la frecuencia de 1 rad/s. 81
  • 81. 10 1 0 G(s) = s Ganancia (dB) −10 −20 −30 −40 −50 −88 Fase ( ) ◦ −89 −90 −91 0 1 2 10 10 10 Frecuencia (rad/s) Figura 8.4: Diagrama de Bode de un integrador 20 G(s) = s Ganancia (dB) 10 0 −10 −20 92 Fase ( ) ◦ 91 90 89 −1 0 1 10 10 10 Frecuencia (rad/s) Figura 8.5: Diagrama de Bode de un derivador8.3.5. Polo simple estable Se estudiar´ en este apartado un polo simple estable con ganancia est´tica igual a la unidad. Es un a asistema ideal de primer orden. 1 s=jω 1 G(s) = − − G(jω) = −→ (8.7) 1 + Ts 1 + jωT Las ganancias y fases de la ecuaci´n (8.7) se van a particularizar para distintos casos. En la ecua- oci´n (8.8) se observa c´mo la ganancia a bajas frecuencias es aproximadamente 0 dB. Para altas frecuencias o ola ganancia se parece a un integrador, una recta de pendiente −20 dB/d´cada, que pasa por 0 dB en la efrecuencia igual a la inversa de la constante de tiempo. ⎧ ⎨ ω → 0 =⇒ 0 dB √ 20 log |G(jω)| = −20 log 1 + (ωT )2 ω = T =⇒ −20 log 2 ≈ −3 dB 1 (8.8) ⎩ ω → ∞ =⇒ −20 log(ωT ) dB En la ecuaci´n (8.9) se observa c´mo la fase para bajas frecuencias es aproximadamente 0◦ y para o oaltas frecuencias −90◦ . El diagrama de Bode de la Fig. 8.6 corrobora el comportamiento en ganancias yen fases. ⎧ ⎨ ω → 0 =⇒ 0◦ ∠G(jω) = − arctan(ωT ) ω = T =⇒ −45◦ 1 (8.9) ⎩ ω → ∞ =⇒ −90◦ 82
  • 82. 10 0 .3 G(s) = s+0 .3 0 Ganancia (dB) −10 −20 −30 −40 0 Fase ( ) ◦ −30 −60 −90 −2 −1 0 1 10 10 10 10 Frecuencia (rad/s) Figura 8.6: Diagrama de Bode de un polo8.3.6. Cero simple con parte real negativa En este apartado se estudia el caso inverso del apartado anterior. s=jω G(s) = 1 + T s − − G(jω) = 1 + jωT −→ (8.10) La ganancia a bajas frecuencias tambi´n comienzan en 0 dB, ecuaci´n (8.11). En cambio, para altas e ofrecuencias la ganancia se comporta como un derivador; una recta de pendiente 20 dB/d´cada, que pasa epor 0 dB en la frecuencia igual a la inversa de la constante de tiempo. ⎧ ⎨ ω → 0 =⇒ 0 dB √ 20 log |G(jω)| = 20 log 1 + (ωT )2 ω = T =⇒ 20 log 2 ≈ 3 dB 1 (8.11) ⎩ ω → ∞ =⇒ 20 log(ωT ) dB En fases, ecuaci´n (8.12), para bajas frecuencias toma valores pr´ximos a 0◦ y para altas frecuencias o oaproximadamente 90◦ . ⎧ ⎨ ω → 0 =⇒ 0◦ ∠G(jω) = arctan(ωT ) ω = T =⇒ 45◦ 1 (8.12) ⎩ ω → ∞ =⇒ 90◦ El diagrama de Bode de la Fig. 8.7 muestra el comportamiento en ganancias y en fases. 40 G(s) = 1 + 5s 30 Ganancia (dB) 20 10 0 −10 90 Fase ( ) ◦ 45 0 −45 −2 −1 0 1 10 10 10 10 Frecuencia (rad/s) Figura 8.7: Diagrama de Bode de un cero 83
  • 83. 8.3.7. Polos estables complejos conjugados Es este apartado se analiza un sistema de segundo orden con polos complejo conjugados estables yganancia est´tica igual a la unidad. a 2 2 ωn s=jω ωn G(s) = − − G(jω) = 2 −→ (8.13) s2 + 2ζωn s + ωn 2 ωn − ω 2 + j2ζωωn En la ecuaci´n (8.14) se observa c´mo la ganancia para bajas frecuencias es aproximadamente 0 dB o oy para altas frecuencias es una recta de pendiente −40 dB/d´cada que pasa por 0 dB en la frecuencia eigual a la frecuencia natural. 2 ωn ω → 0 =⇒ 0 dB 20 log |G(jω)| = 20 log (8.14) 2 (ωn − ω 2 )2 + (2ζωωn )2 ω → ∞ =⇒ −40 log ωn dB ω En la ecuaci´n (8.15) se observa c´mo la fase para bajas frecuencias es aproximadamente 0◦ y para o oaltas frecuencias −180◦ . El diagrama de la Fig. 8.8 muestra el comportamiento en ganancias y en fases. ⎧ ω → 0 =⇒ 0◦ 2ζωωn ⎨ ∠G(jω) = − arctan 2 ω = ωn =⇒ −90◦ (8.15) ωn − ω 2 ⎩ ω → ∞ =⇒ −180◦ 20 0 Ganancia (dB) −20 −40 −60 9 −80 G(s) = s2 +2 s+9 −100 0 −45 Fase ( ) ◦ −90 −135 −180 −1 0 1 2 10 10 10 10 Frecuencia (rad/s) Figura 8.8: Diagrama de Bode de dos polos complejo conjugados En un rango de frecuencias pr´ximo a la frecuencia natural, el diagrama de Bode se comporta de oforma distinta en funci´n del amortiguamiento. En la Fig. 8.8 se observa c´mo aparece un m´ximo en o o ael diagrama de ganancias. Se va a emplear la expresi´n (8.14) para determinar la magnitud de dicho om´ximo y a qu´ frecuencia se produce. En concreto, se va a derivar la expresi´n del denominador para a e obuscar un m´ınimo —que ser´ un m´ximo de la ganancia—. a a d ω=0 [(ω 2 − ω 2 )2 + (2ζωωn )2 ] = −4ω[(1 − 2ζ 2 )ωn − ω 2 ] = 0 2 (8.16) dω n ω = ωr = ωn 1 − 2ζ 2 Si se estudiara el signo de la segunda derivada, se comprobar´ c´mo la primera soluci´n, para fre- ıa o ocuencia nula, se trata de un m´ximo del denominador y por tanto un m´ a ınimo del diagrama de Bode.La otra soluci´n ωr , llamada frecuencia de resonancia, es el m´ximo del diagrama de Bode que se hab´ o a ıaobservado. Si se sustituye el valor de la frecuencia de resonancia en la expresi´n de la ganancia (8.14), se oobtiene la magnitud del m´ximo, ecuaci´n (8.17), que se suele denominar pico de resonancia. a o 1 Mr = 20 log (8.17) 2ζ 1 − ζ2 El fen´meno de la resonancia no siempre existe. S´lo se da para un determinado rango de amortigua- o omientos. En concreto, aquellos amortiguamientos que hacen positivo el discriminante de la ra´ cuadrada ızde la expresi´n (8.16). o 1 ∃Mr ⇔ 0 ≤ ζ ≤ √ = 0.7071 (8.18) 2 84
  • 84. En la ecuaci´n (8.18) aparece el rango de amortiguamientos con pico de resonancia. Se trata siempre ode sistemas subamortiguados, aunque no todos los sistemas subamortiguados poseen pico de resonancia.En la Fig. 8.9 se muestra c´mo var´ el diagrama de Bode con el amortiguamiento. Cuanto menor es el o ıaamortiguamiento mayor es el pico de resonancia y m´s pr´ximo est´ a la frecuencia natural. Tambi´n a o a ecuanto menor es el amortiguamiento m´s brusco es el cambio de fases en torno a la frecuencia natural. a 50 Ganancia (dB) 0 1 G(s) = s2 +0 .2 s+1 (ζ = 0.1) −50 G(s) = 1 (ζ = 0.3) s2 +0 .6 s+1 1 G(s) = s2 +2 s+1 (ζ = 1) −100 0 −45 Fase ( ) ◦ −90 −135 −180 −2 −1 0 1 2 10 10 10 10 10 Frecuencia (rad/s) Figura 8.9: Diagrama de Bode de un sistema de segundo orden variando el amortiguamiento En el caso concreto de amortiguamiento igual a uno, es decir, cr´ ıticamente amortiguado y polo realdoble, el diagrama de ganancias pasa por −6 dB en la frecuencia natural.8.3.8. Ceros complejo conjugados En este apartado se estudia el caso inverso al del apartado anterior. s2 + 2ζωn s + ωn s=jω 2 ω 2 − ω 2 + j2ζωωn G(s) = 2 − − G(jω) = n −→ 2 (8.19) ωn ωn El desarrollo matem´tico es an´logo, por lo que no se va a repetir. En el caso de los ceros complejo a aconjugados tambi´n existe el fen´meno de la resonancia, s´lo que se manifiesta en forma de m´ e o o ınimo enlugar de un m´ximo en el diagrama de ganancias. a 100 s2 +2 s+9 80 G(s) = 9 Ganancia (dB) 60 40 20 0 −20 180 135 Fase ( ) ◦ 90 45 0 −1 0 1 2 10 10 10 10 Frecuencia (rad/s) Figura 8.10: Diagrama de Bode de dos ceros complejo conjugados 85
  • 85. 8.3.9. Polo simple con parte real positiva Un polo con parte real positiva constituye, en s´ mismo, un sistema inestable. Estrictamente hablando, ıun sistema inestable no tiene diagrama de Bode. Sin embargo, se puede considerar que forma parte deun sistema estable. Esta situaci´n se da, por ejemplo, cuando en lazo abierto la funci´n de transferencia o otiene un polo inestable, pero la funci´n de transferencia en lazo cerrado es estable. Es posible, en este ocaso, buscar la respuesta matem´tica y el diagrama de Bode que resultan de considerar las entradas y asalidas particulares de ese polo “inestable”. 1 s=jω 1 G(s) = − − G(jω) = −→ (8.20) 1 − Ts 1 − jωT ⎧ ⎨ ω → 0 =⇒ 0 dB √ 20 log |G(jω)| = −20 log 1 + (ωT )2 ω = T =⇒ −20 log 2 ≈ −3 dB 1 (8.21) ⎩ ω → ∞ =⇒ −20 log(ωT ) dB ⎧ ⎨ ω → 0 =⇒ 0◦ ∠G(jω) = arctan(ωT ) ω = T =⇒ 45◦ 1 (8.22) ⎩ ω → ∞ =⇒ 90◦ Su comportamiento en ganancias es igual que un polo con parte real negativa. Esto se debe a que elcambio de signo no afecto al m´dulo del n´mero complejo. Sin embargo, su comportamiento en fases es o uigual que un cero simple. 0 1 G(s) = 1 −0 .1 s Ganancia (dB) −10 −20 −30 −40 90 Fase ( ) ◦ 60 30 0 0 1 2 3 10 10 10 10 Frecuencia (rad/s) Figura 8.11: Diagrama de Bode de un polo con parte real positiva8.3.10. Cero simple con parte real positiva Un cero con parte real positiva puede darse en un sistema estable, pero su presencia ya se mostr´ c´mo o oconvert´ a una planta en un sistema de fase no m´ ıa ınima. s=jω G(s) = 1 − T s − − G(jω) = 1 − jωT −→ (8.23) ⎧ ⎨ ω → 0 =⇒ 0 dB √ 20 log |G(jω)| = 20 log 1 + (ωT )2 ω = T =⇒ 20 log 2 ≈ 3 dB 1 (8.24) ⎩ ω → ∞ =⇒ 20 log(ωT ) dB ⎧ ⎨ ω → 0 =⇒ 0◦ ∠G(jω) = − arctan(ωT ) ω = T =⇒ −45◦ 1 (8.25) ⎩ ω → ∞ =⇒ −90◦ Su comportamiento en ganancias es exactamente igual que un cero con parte real negativa, mientrasque su comportamiento en fases es igual que un polo simple. 86
  • 86. 40 G(s) = 1 − 10s Ganancia (dB) 30 20 10 0 360 Fase ( ) ◦ 330 300 270 −3 −2 −1 0 1 10 10 10 10 10 Frecuencia (rad/s) Figura 8.12: Diagrama de Bode de un cero con parte real positiva8.4. Diagrama de Bode de cualquier funci´n de transferencia o Para dibujar el diagrama de Bode de una funci´n de transferencia cualquiera, se suman las aportaciones ode cada una de las funciones elementales en las que se puede desglosar. Para el caso general de que lafunci´n de transferencia se pueda dividir en dos funciones de transferencia elementales: o s=jω G(s) = G1 (s)G2 (s) − − G(jω) = G1 (jω)G2 (jω) −→ (8.26) 20 log |G(jω)| = 20 log |G1 (jω)| + 20 log |G2 (jω)| G(jω) = G1 (jω)G2 (jω) (8.27) ∠G(jω) = ∠G2 (jω) + ∠G2 (jω) Cualquiera que sea n´mero de funciones elementales que compongan un sistema, basta con sumar upara cada frecuencia los diagramas de Bode de cada una ellas. A continuaci´n se muestra el ejemplo la ofunci´n de transferencia (8.28), que se ha dividido en cuatro funciones de transferencia elementales: una oganancia, un integrador, un cero y un polo. 25(s + 3) 1 s + 3 50 G(s) = = 1.5 (8.28) s(s + 50) s 3 s + 50 El diagrama de Bode de esta funci´n de transferencia se muestra en la Fig. 8.13. o 40 25( s+3) G(s) = s(s+50) Ganancia (dB) 20 0 −20 −40 0 Fase ( ) ◦ −30 −60 −90 −1 0 1 2 3 10 10 10 10 10 Frecuencia (rad/s) Figura 8.13: Diagrama de Bode de una funci´n de transferencia compuesta o 87
  • 87. 8.5. Diagrama de Bode de un sistema en lazo cerrado En los sistemas controlados es habitual introducir una planta dentro de un lazo de realimentaci´n onegativa. Para dibujar el diagrama de Bode de la funci´n de transferencia del sistema en lazo cerrado se opuede emplear el de la funci´n de transferencia en lazo abierto. o p g t ± Figura 8.14: Sistema de control en lazo cerrado Para el sistema de control en lazo cerrado de la Fig. 8.14 se desea dibujar el diagrama de Bode de lafunci´n de transferencia en lazo cerrado, ecuaci´n (8.29). o o G(s) Glc (s) = (8.29) 1 + G(s) Se supone conocido el diagrama de Bode de la funci´n de transferencia en lazo abierto, Fig. 8.15, y ose dibuja directamente el de la funci´n de transferencia en lazo cerrado. o 1(jB SStwi D (SI 1(jB SStqwi D (º tqwi D twi D Figura 8.15: Diagrama de Bode del sistema en lazo abierto y en lazo cerrado Para bajas frecuencias el sistema en lazo cerrado es la unidad, 0 dB y 0◦ , y a frecuencias elevadas esigual que el diagrama de Bode el lazo abierto. La frecuencia que marca la zona intermedia es la frecuenciade cruce de ganancias, es decir, la frecuencia que toma 0 dB el diagrama en lazo abierto. G(jω) |G(jω)| 1 =⇒ Glc (jω) ≈ 1 Glc (jω) = (8.30) 1 + G(jω) |G(jω)| 1 =⇒ Glc (jω) ≈ G(jω) En torno a la frecuencia de cruce de ganancias, el diagrama de Bode en lazo cerrado puede presentarun pico de resonancia o no, en funci´n de la fase que posea en dicha frecuencia el diagrama en lazo abierto. o8.5.1. Ancho de banda Es interesante apreciar c´mo es la respuesta en frecuencia de un sistema controlado, es decir, en lazo ocerrado. Sin importar la forma que posea la planta en lazo abierto, el sistema controlado en lazo cerrado escapaz de seguir fielmente a la entrada de referencia del sistema hasta un determinado valor de frecuencia.A partir de ese valor, que es pr´cticamente la frecuencia de cruce de ganancias del diagrama de Bode en alazo abierto, el sistema controlado empieza a atenuar y a retrasar la referencia: la salida del sistema noes capaz de seguir a la entrada. Este fen´meno es una explicaci´n intuitiva del concepto de ancho de banda de un sistema controlado. o oMatem´ticamente se define como el valor de la frecuencia en rad/s en el que la ganancia del diagrama ade Bode en lazo cerrado toma el valor de −3 dB. En la pr´ctica este valor exacto se puede aproximar al avalor de la frecuencia de cruce de fases del diagrama en lazo abierto. 88
  • 88. 8.5.2. Margen de fase y margen de ganancia En el cap´ıtulo anterior se definieron los m´rgenes de fase y ganancia y se relacionaron con la estabilidad arelativa del sistema. Es importante resaltar que los m´rgenes de fase y ganancia de un sistema controlado, ay por tanto en lazo cerrado, se miden sobre el diagrama de Bode de la funci´n de transferencia en lazo oabierto. 1(jB SStwi D / (SI p twi D 3 W −dM(º Figura 8.16: Margen de fase y de ganancia El margen de ganancia MG se mide en la frecuencia de cruce de fases del diagrama de Bode en lazoabierto. Es el valor en decibelios faltan al sistema para alcanzar los 0 dB. Si el diagrama est´ por encima ade 0 dB a esa frecuencia, se dice que el margen de ganancia es negativo. El margen de fase MF se mide en la frecuencia de cruce de ganancias fases del diagrama de Bodeen lazo abierto. Es el valor en grados que hay por encima de −180◦ hasta el diagrama de fases. Si eldiagrama de fases est´ por debajo de −180◦ a esa frecuencia, se dice que el margen de fase es negativo. a Un sistema en lazo cerrado es estable cuando sus m´rgenes de fase y ganancia son ambos positivos. a8.6. Ejercicios propuestos - Ejercicio 1: Dibujar el diagrama de Bode de las siguientes funciones de transferencia: (s + 3) G(s) = 10 (8.31) (s + 1)(s2 + 80s + 10000) 400 G(s) = (8.32) s(s2 + 80s + 40000) s−5 G(s) = 700 (8.33) (s + 1)(s + 100) e−0.3s G(s) = 10 (8.34) s+1 s−1 G(s) = 0.02 (8.35) s(s + 20)(s + 0.1) 89
  • 89. 90
  • 90. Cap´ ıtulo 9Compensadores de adelanto y deretraso de fase Controlar un sistema dado es establecer en su funcionamiento de acuerdo con unos requisitos o espe-cificaciones. En este cap´ıtulo se analizan los cambios que se pueden lograr en un dispositivo al a˜adir un nnuevo polo y un nuevo cero al sistema, que se introduce en un lazo de control. Estos nuevos elementos no tienen por qu´ ser de las mismas caracter´ e ısticas que la planta. Si laplanta es un sistema mec´nico, el controlador puede estar constituido por nuevos elementos mec´nicos a ao un dispositivo el´ctrico. La implementaci´n final del compensador no importa mientras su funci´n de e o otransferencia, la ecuaci´n diferencial que gobierna su comportamiento, sea la misma. o Se puede definir compensaci´n como la modificaci´n de la din´mica de un sistema para cumplir unas o o aespecificaciones determinadas.9.1. Generalidades El compensador objeto de estudio en este cap´ ıtulo act´ a sobre la planta en funci´n del error que u oexiste entre la salida del sistema y la referencia que se desea seguir, Fig. 9.1, y posee una funci´n de otransferencia con una ganancia, un polo y un cero. ]B8}‚tRsIB„ _jst s p g  X + y t X+K ± Figura 9.1: Sistema compensado Con estos presupuestos, se da por supuesto que el sistema se controla con un lazo de realimenta-ci´n negativa unitaria. Sin embargo, en ocasiones pueden dise˜arse compensadores que se coloquen en o notras posiciones del lazo de control, resultando una realimentaci´n negativa no unitaria. Este tipo de ocompensadores no se estudiar´n en la presente asignatura. a9.1.1. Especificaciones Las especificaciones exigibles a un sistema pueden ser de muy distinta ´ ındole. Habitualmente se cla-sifican como restricciones del sistema en el dominio temporal: - R´gimen transitorio: tiempo de establecimiento, tiempo de crecimiento, tiempo de pico, sobre- e impulso m´ximo, ancho de banda, etc. a - R´gimen permanente: error nulo o limitado ante un tipo determinado de entrada, rechazo a las e perturbaciones, etc.9.1.2. Tipos de compensaci´n o Es posible lograr que un sistema cumpla una serie de especificaciones con distintos compensadores.Una posible clasificaci´n para los tipos de compensador puede ser: o 91
  • 91. - Compensador de adelanto de fase. El cero produce un adelanto de fase a bajas frecuencias respecto el polo. El resultado final es que el compensador adelanta fase en un determinado rango de frecuencias. - Compensador de retraso de fase. En este caso el polo produce un retraso de fase a m´s bajas a frecuencias respecto el cero. El resultado final es que el compensador retrasa fase en un determinado rango de frecuencias. - Compensador de adelanto-retraso de fase: el compensador consiste el producto de las funciones de transferencia de un compensador de adelanto de fase y uno de retraso. El compensador de retraso se coloca a menores frecuencias que el de adelanto. VI‚jst B i‚ „sRB _jst s p g d X + y 1 X +  t X+K X+Q ± Figura 9.2: Sistema con compensador de adelanto-retraso9.1.3. M´todo de ajuste e El dise˜o o ajuste de los par´metros de un compensador se puede realizar de varias formas. Depen- n adiendo de las caracter´ ısticas de la planta la resoluci´n podr´ ser m´s sencilla con uno de los dos m´todos o a a em´s empleados en el control cl´sico: a a - Lugar de las ra´ ıces: En el plano S se a˜ ade el nuevo polo y cero del compensador. Se modifica n el lugar de las ra´ ıces del sistema de forma que los polos dominantes de la planta en lazo cerrado queden ubicados donde se desee. - Diagrama de Bode: Sobre el diagrama de Bode da la planta se a˜ade la contribuci´n del com- n o pensador. Teniendo como grados de libertad la ganancia junto con la posici´n del polo y el cero, o es posible modificar la respuesta en frecuencia del sistema en lazo abierto de forma que se consi- guen cumplir una amplia gama de especificaciones, tanto de r´gimen transitorio como de r´gimen e e permanente.9.2. Compensador de adelanto de fase Un compensador de adelanto de fase tiene la siguiente expresi´n: o 1 1 + Ts K s+ T s+a 0<α<1 D(s) = K = 1 = Kc s + b , con (9.1) 1 + αT s α s + αT a<b La primera expresi´n es m´s util cuando se trabaja en el diagrama de Bode, mientras que la segunda o a ´es preferible cuando se trabaja en el lugar de las ra´ ıces. En los siguientes apartados se explicar´n los procedimientos de ajuste de los tres par´metros del a acompensador. Para todos los m´todos se usar´ siempre el mismo ejemplo de la Fig. 9.3. e a ?  W E Figura 9.3: Sistema que se desea compensar Se trata de un sistema mec´nico en el que un actuador mueve una compuerta de masa m dentro de aun medio con viscosidad c. El actuador debe colocar la compuerta siguiendo la referencia de posici´n que ose le comande de tal forma que el tiempo de establecimiento sea menor o igual que 2 segundos y que elsobreimpulso m´ximo respecto la referencia sea del 20 % o menor. La masa de la compuerta es de 0.25 kg ay el coeficiente viscoso es 0.5 Ns/m. 92
  • 92. La funci´n de transferencia que relaciona la fuerza aplicada a la masa y su desplazamiento aparece en o(9.2), sustituyendo tambi´n los valores num´ricos. e e 1 4 G(s) = = (9.2) ms2 + cs s(s + 2)9.2.1. Ajuste por el lugar de las ra´ ıces La introducci´n de un polo y un cero en el sistema puede beneficiar al r´gimen transitorio, es decir, o epuede hace el sistema m´s r´pido si el nuevo cero est´ m´s cerca del origen que el nuevo polo. En ese a a a acaso, las ramas del lugar de las ra´ se alejan del eje imaginario del plano S. Por tanto, se puede elegir ıcesuna ganancia para el sistema que deje los polos dominantes del sistema con un tiempo de establecimientomenor. C C 7$R ‚8s {B8}‚tRsIB 7$R ‚8sSR$t 7$R ‚8sSR$t 7$R ‚8sS8sj {B8}‚tRsIB„ {B8}‚tRsIB„ {B8}‚tRsIB ±K ±y ±y ±K Figura 9.4: Efecto de la adici´n de un polo y un cero en el lugar de las ra´ o ıces Este efecto se muestra cualitativamente en la Fig. 9.4 y justifica la definici´n del compensador de oadelanto de fase de la ecuaci´n (9.1), donde se dec´ a < b. o ıa Evidentemente, la localizaci´n de polo y del cero del compensador depender´ de cu´nto se quiera o a aalejar las ramas del lugar de las ra´ del eje imaginario. Son las especificaciones que se deseen conseguir ıceslas que van a marcar la separaci´n relativa del nuevo polo y cero. Resulta casi inmediato, a partir de olos requerimientos de tiempo de establecimiento y sobreimpulso calcular los polos dominantes objeto deldise˜ o. n Mp ≤ 0.2 ⇒ ζ ≥ 0.45, se elige ζ = 0.5 (9.3) ts ≤ 2 segundos ⇒ ωn ≥ 4 rad/s, se elige ωn = 4 rad/s (9.4) p = −ζωn ± ωn 1 − ζ 2 j = −2 ± 3.46j (9.5) Con el valor de sobreimpulso se elige un valor para el amortiguamiento de los polos objetivo, ecua-ci´n (9.3), y con ´ste y el tiempo de establecimiento se calcula la frecuencia natural, ecuaci´n (9.4). o e oLa posici´n final de los polos objetivo, ecuaci´n (9.5), depende de las elecciones que haya realizado el o oingeniero. Es dif´ que dos ingenieros obtengan exactamente la misma soluci´n num´rica para un mismo ıcil o eproblema. Por tanto, las soluciones que se proponen en estos apuntes no son las unicas que se pueden dar ´correctamente para cada problema. Obtenida la localizaci´n de los polos objetivo, se aplica en ese punto la condici´n del angulo. Esto se o o ´realiza precisamente porque se quiere garantizar que esos puntos pertenecen al nuevo lugar de las ra´ ıcesdel sistema. Evidentemente, la condici´n del angulo se debe aplicar teniendo en cuenta el nuevo polo y o ´cero que introduce el compensador, cuya posici´n todav´ est´ por determinar, Fig. 9.5. o ıa a m n zi p − pj p = θz − θp − θ1 − θ2 = φc − θ1 − θ2 = −180◦ (9.6) i=1 j=1 En la ecuaci´n (9.6) los ´ngulos vistos desde los polos o ceros de la planta son conocidos. La unica o a ´inc´gnita es la diferencia de angulos del cero y polo del compensador. A esa diferencia se le llamar´ φc o ´ a 93
  • 93. C Q€ QF Q1 Qd € F 1 d K y ´ Figura 9.5: Angulos y distancias vistas al polo objetivoy es el ´ngulo con que el polo objetivo “ve” al polo y cero del compensador. Cualquier pareja polo-cero aque el polo objetivo vea con el mismo ´ngulo φc es una posible soluci´n al problema. a o φc = −180◦ + θ1 + θ2 = −180◦ + 120◦ + 90◦ = 30◦ (9.7) En el caso concreto del ejemplo φc vale 30◦ . Siempre que se trate de un compensador de adelanto defase este ´ngulo debe dar positivo, ya que el cero est´ m´s cercano al origen y ver´ al polo objetivo con a a a amayor ´ngulo que el polo del compensador. Cualquier pareja polo-cero que sea vista por el polo objetivo acon 30◦ es una hipot´tica soluci´n al problema, Fig. 9.6. e o C C C ejS ‚„{‚„S}BjB * ‚RSIB8$ts ‚ * * ±K ±y ±K ±y ±K ±y ejS ‚„{‚„S}BjB ejS ‚„{‚„S}BjB $tPjZk‚S}B{B ‚RS$t‚R sAj‚ Figura 9.6: Posiciones del par polo-cero del compensador con φc constante Sin embargo, la elecci´n de la posici´n del par polo-cero no es absolutamente arbitraria. Efectivamente o ose puede conseguir que el lugar de las ra´ ıces pase por el polo objetivo, pero puede ser que en la configu-raci´n final del sistema, el polo dominante sea otro. Esta posibilidad hay que evitarla. Si se busca que el or´gimen transitorio lo caracterice la posici´n de los polos objetivo, ´stos deben quedar como dominantes e o edel sistema. Incluso es posible colocar el par polo-cero en la zona del plano S de parte real positiva y cumplir eldeseo de que el polo objetivo pertenezca al lugar de las ra´ ıces, pero dejar el tercer polo del sistema deforma que lo hace inestable. En conclusi´n, la posici´n del polo y del cero del compensador es libre mientras el polo objetivo los o ovea con el ´ngulo φc adecuado y ´stos queden como dominantes del sistema. a e Dejando claro que el ingeniero puede elegir la posici´n del polo y del cero del compensador, cumpliendo olo que se ha enunciado en el p´rrafo anterior, en los siguientes apartados se explican algunos criterios que ase han propuesto para su colocaci´n. Dependiendo de la planta es posible que alguno de los criterios sea oinviable o no consiga que el polo objetivo quede dominante en el sistema compensado. Siempre habr´ que acomprobar este ultimo extremo, aunque sea de forma cualitativa. ´ En cuanto al c´lculo de la ganancia del compensador, se debe aplicar la condici´n del m´dulo en el a o opolo objetivo, Fig. 9.5, empleando l´gicamente la posici´n del polo y el cero del compensador que se haya o oelegido. n j=1 pj p d 1 d 2 dp Kc Kla = m = (9.8) i=1 zi p dz La unica inc´gnita de la ecuaci´n (9.8) es la ganancia Kc del compensador. En el ejemplo, la ganancia ´ o oKla de la planta en lazo abierto expresando los polos y ceros en monomios es 4, la distancia d1 es 4, la 94
  • 94. distancia d2 es 3.46 y las distancias dz y dp se miden en el lugar de las ra´ ıces y dependen de la posici´n oelegida para el polo y el cero del compensador.Criterio de la bisectriz La posici´n del polo y del cero del compensador se elige centr´ndolos sobre la bisectriz del arco que o aforma la recta que une el polo objetivo con el origen del plano S, y una recta horizontal que pasa por elpolo objetivo, Fig. 9.7. C * 1 * 1 x; 1 A$R‚{ „$9 Figura 9.7: Criterio de la bisectriz En el ejemplo propuesto, el polo del compensador queda aproximadamente en −5.4 y el cero en−2.9. Al aplicar la condici´n del m´dulo en el polo objetivo, la ganancia del compensador resulta ser o oaproximadamente 4.7, por tanto, el compensador tiene la siguiente expresi´n: o s + 2.9 D(s) = 4.7 (9.9) s + 5.4 Se puede observar en la Fig. 9.7 que en el caso del ejemplo, este criterio no hubiera sido recomendablesi el ´ngulo φc hubiera sido mayor que 60◦ . Si as´ fuera, el cero del compensador quedar´ entre los dos a ı ıapolos de la planta y el lugar de las ra´ tendr´ un tercer polo real en lazo cerrado m´s dominante que ıces ıa alos polos objetivo.Criterio de anular un polo dominante de la planta El cero del compensador se sit´a sobre un polo de la planta y el polo del compensador donde quede, umanteniendo el angulo φc . La unica limitaci´n de este m´todo, es que nunca se debe anular un polo de la ´ ´ o eplanta que est´ en s = 0, es decir, disminuir el tipo del sistema. El resultado es un sistema compensado econ igual n´mero de polos que sin compensar: no aparece ning´n polo nuevo. u u C * ; 1 Figura 9.8: Criterio de anular le segundo polo dominante de la planta En el ejemplo propuesto, el cero del compensador queda en −2 y el cero en −4. Al aplicar la condici´n odel m´dulo en el polo objetivo, la ganancia del compensador resulta ser 4, por tanto, el compensador otiene la siguiente expresi´n: o s+2 D(s) = 4 (9.10) s+4 La limitaci´n de uso de este criterio depender´ evidentemente de la posici´n del segundo polo do- o a ominante de la planta en lazo abierto. En el caso del ejemplo, este criterio no se puede emplear para un´ngulo φc mayor que 90◦ .a 95
  • 95. Criterio del cero bajo el polo objetivo El cero del compensador se sit´a justo debajo del polo objetivo y el polo donde quede, manteniendo uel ´ngulo φc . En este ejemplo, el resultado es el mismo que en el apartado anterior, porque ha coincidido aque el segundo polo dominante de la planta en lazo abierto queda debajo del polo objetivo. Sin embargo,lo habitual es que den resultados distintos. Este m´todo se puede emplear s´lo en el caso de que queden a la derecha del cero del compensador al e omenos dos polos de la planta en lazo abierto. Se puede observar en la Fig. 9.7 que el ejemplo se encuentraen el caso l´ ımite de uso, ya que si el segundo polo de la planta hubiese estado m´s a la izquierda, el tercer apolo en lazo cerrado del sistema quedar´ m´s dominante que los polos objetivo. ıa a Si se cumple lo dicho en el p´rrafo anterior, para cualquier planta que se desee compensar, este criterio ase puede emplear siempre que el ´ngulo φc sea igual o menor que 90◦ . aCriterio de un compensador proporcional-derivativo El polo del compensador se sit´a en el −∞ del plano S y el cero del compensador donde quede, umanteniendo el angulo φc . El compensador, por tanto, est´ compuesto por un unico cero y ning´n polo, ´ a ´ uFig. 9.9. u’ C * uM Figura 9.9: Criterio de un compensador proporcional-derivativo El angulo φc coincide exactamente con el ´ngulo del que ve el cero al polo objetivo. En el ejemplo ´ apropuesto, el cero del compensador queda en −8 y la ganancia resulta ser 0.5, por tanto, el compensadortiene la siguiente expresi´n: o D(s) = 0.5(s + 8) (9.11) Este criterio, como la anulaci´n de un polo de la planta en lazo abierto, no a˜ade ning´n polo nuevo en o n uel sistema en lazo cerrado. El nombre de compensador proporcional-derivativo es coherente si se calculaen el dominio del tiempo cu´l es la actuaci´n sobre la planta u(t) en funci´n del error e(t), ecuaci´n (9.12), a o o odonde se observa que hay una componente proporcional al error y otra proporcional a la derivada delerror. L −1 de(t) U (s) = Kc (s + a)E(s) = Kc sE(s) + aKc E(s) − − u(t) = Kc −→ + aKc e(t) (9.12) dt Un inconveniente de los compensadores PD es que amplifican el ruido de alta frecuencia, Fig. 9.10.Por este motivo, en la pr´ctica se desaconseja elegir este tipo de compensadores a no ser que se pida de aforma expl´ ıcita. 1(jB S ;wi D ;wi D Figura 9.10: Diagrama de Bode de un compensador proporcional-derivativo 96
  • 96. Comparaci´n de la respuesta temporal de los distintos criterios o Resulta interesante comparar la respuesta temporal que consiguen los distintos criterios que se hanenunciado. En la Fig. 9.11 se nuestra la respuesta ante una entrada escal´n unidad del sistema en lazo ocerrado con los distintos compensadores que se han ido calculando. Evidentemente, todos los compensadores consiguen cumplir las especificaciones de partida: tiempode establecimiento menor que 2 segundos y sobreimpulso del orden del 20 %. El compensador PD esf´cilmente reconocible en la Fig. 9.11 porque la pendiente inicial no es nula. El compensador del criterio ade la bisectriz es un poco m´s r´pido que el que anula el polo de la planta porque tiene la influencia del a acero del compensador —tambi´n por eso tiene un poco m´s de sobreimpulso—. e a 1.5 1 c(t) 0.5 D(s) = 4.7 s+2 .9 s+5 .4 D(s) = 4 s+2 s+4 D(s) = 0.5(s + 8) 0 0 0.5 1 1.5 2 2.5 3 tiempo (s) Figura 9.11: Respuesta temporal del sistema compensado ante una entrada escal´n unidad o Antes de continuar con el dise˜o de compensadores de adelanto de fase por m´todos frecuencias, n econviene se˜ alar que el m´todo del lugar de las ra´ n e ıces que se ha descrito no permite el cumplimiento deespecificaciones de error en r´gimen permanente. Los par´metros Kc , a y b del compensador se emplean e apara localizar los polos del sistema en lazo cerrado. Por tanto s´lo puede lograr especificaciones de r´gimen o etransitorio. Ha quedado patente en el ejemplo que se ha empleado que existe m´s de un compensador v´lido para a aunas especificaciones dadas. Sin embargo, a la hora de resolver un problema hay que decir expl´ ıcitamentequ´ elecciones se est´n tomando en cada momento de forma justificada. e a Se puede dise˜ar el compensador sin llegar a dibujar exactamente el lugar de las ra´ n ıces del sistema,compensado o no, porque todas las operaciones se hacen con la posici´n de los polos y ceros de la planta y ocompensador en lazo abierto. El unico punto que se conoce de forma exacta del lugar de las ra´ puede ´ ıcesser el polo objetivo. Sin embargo, es muy conveniente al menos imaginar c´mo va a quedar el lugar de olas ra´ ıces del sistema compensado, de forma cualitativa. Siempre que se pretendan mejorar el r´gimen transitorio, en el sentido de hacer el sistema m´s r´pido e a ade lo que de suyo es, el ´ngulo φc va a dar positivo. Si da un angulo peque˜o, por ejemplo menos de 10◦ , a ´ nsignifica que el lugar de las ra´ del sistema sin compensador pasa bastante cerca de los polos objetivo. ıcesEn este caso, es suficiente con dise˜ ar un compensador puramente proporcional que deje los polo en lazo ncerrado lo m´s cerca posible de los polos objetivo. a Si φc da un angulo muy grande, por ejemplo mayor que 70◦ , significa que el polo objetivo queda ´muy lejos del lugar de las ra´ ıces del sistema sin compensador. Quiz´ se pueden modificar las elecciones arealizadas para el c´lculo de los polos objetivo para que de un angulo algo menor. Si no es as´ no es a ´ ı,recomendable elegir el compensador de adelanto de fase para cumplir las especificaciones exigidas. Habr´ ıaque ir a otro tipo de controlador o afirmar que no se pueden cumplir dichas especificaciones.9.2.2. Ajuste por el diagrama de Bode El dise˜o de un compensador de adelanto de fase con el diagrama de Bode es muy sencillo si se conoce nbien la forma que posee el compensador en dicho diagrama, Fig. 9.12. Como ya se ha indicado, cuandose trabaje con el diagrama de Bode se emplear´ la expresi´n del compensador (9.1) con constantes de a otiempo. Las ganancias comienzan y acaban con pendiente nula. Siempre el aporte de ganancia a altas fre-cuencias es mayor que a bajas frecuencias. Sin embargo, dependiendo de K y α ese aporte puede serfinalmente positivo, negativo o nulo para alguna de esas frecuencias. 97
  • 97. 1(jB S ;wi D 1(jB  ± 1(jB ± d(jB 1(jB  ;wi D *8s- (º d d d xx x Figura 9.12: Diagrama de Bode de un compensador de adelanto de fase El compensador no aporta fase para bajas y elevadas frecuencias. Sin embargo, entre el cero y el polo,aporta siempre fase positiva. Por tanto, a˜adir´ fase a la planta en ese rango de frecuencias. El angulo n a ´φm´x de adelanto m´ximo, depende de lo separados que est´n el cero y el polo del compensador. Depende a a apor tanto exclusivamente del par´metro α seg´ n la expresi´n: a u o 1−α sin φm´x = a (9.13) 1+α Evidentemente, como m´ximo el valor del adelanto m´ximo ser´ de 90◦ en el caso de que est´n muy a a a ealejados el cero y el polo del compensador. La frecuencia ωm´x a la que se da el adelanto m´ximo es la a amedia geom´trica de la posici´n del cero y el polo. En la Fig. 9.12 tambi´n se aparece el valor del aumento e o ede ganancias que se produce en la frecuencia de adelanto de fases m´ximo. aTraducci´n de las especificaciones al dominio de la frecuencia o Una vez que se conoce la forma del compensador de adelanto de fase, hay que saber cu´les van a ser alos objetivos del dise˜o en el dominio de la frecuencia. Para el caso del lugar es directa la traducci´n de n osobreimpulso m´ximo de la salida en amortiguamiento de los polos dominantes en lazo cerrado, el tiempo ade establecimiento en atenuaci´n de dichos polos, etc. La traducci´n que se recomienda en el dominio de o ola frecuencia es la siguiente: - El margen de fase del sistema en lazo abierto en grados es aproximadamente igual a 100 veces el amortiguamiento de los polos dominantes en lazo cerrado. MF ≈ 100ζ (9.14) - La frecuencia de cruce de ganancias del sistema en lazo abierto es aproximadamente igual a la frecuencia natural de los polos dominantes en lazo cerrado. - La frecuencia de cruce de ganancias del sistema en lazo abierto es aproximadamente igual al ancho de banda del sistema. Tambi´n se puede trasladar f´cilmente al dominio de la frecuencia una especificaci´n de r´gimen e a o e permanente. El error en r´gimen permanente es igual a la inversa de los coeficientes de error. Por e tanto, si se observa la definici´n del coeficiente de error de un sistema de tipo 0 compensado: o 1 + Ts Kp = l´ K ım G(s) = KG(0) (9.15) s→0 1 + αT s Es decir, el coeficiente de error del sistema compensado es K veces mayor que el del sistema sin compensador. El coeficiente de error del sistema sin compensador, G(0), puede verse en el diagrama de Bode directamente como la magnitud de las ganancias a bajas frecuencias. Por tanto: - Para reducir el error en r´gimen permanente de un sistema compensado en lazo cerrado, se debe e aumentar la magnitud de las ganancias a bajas frecuencias del sistema en lazo abierto. Como el efecto de la ganancia K del compensador es elevar todo el diagrama de ganancias la magnitud de K en decibelios. Se puede aprovechar ese aumento para disminuir el error en r´gimen e permanente. 98
  • 98. En el diagrama de Bode se puede tambi´n deducir si el error en r´gimen permanente ser´ nulo o e e a no en funci´n del tipo del sistema. Si el diagrama de ganancias comienza horizontal para bajas o frecuencias, el sistema es de tipo 0. Si a bajas frecuencias comienza con −20 dB por d´cada, el e sistema es de tipo I y tendr´ error nulo ante entrada escal´n. Si comienza con −40 dB por d´cada, a o e el sistema es de tipo II y tendr´ error nulo ante entrada escal´n y rampa. Y as´ sucesivamente. a o ıEjemplo de dise˜ o n Se va a dise˜ar un compensador de adelanto de fase para el mismo ejemplo que se utiliz´ en el m´todo n o edel lugar de las ra´ ıces. Lo primero que se hace es traducir las especificaciones al dominio de la frecuencia: Mp ≤ 0.2 ⇒ ζ ≥ 0.45, se elige ζ = 0.5 ⇒ MF ≈ 50◦ (9.16) ts ≤ 2 segundos ⇒ ωn ≥ 4 rad/s, se elige ωn = 4 rad/s ⇒ ωcg ≈ 4 rad/s (9.17) A continuaci´n se representa el diagrama de Bode de la planta sin el compensador: o 50 4 G(s) = s(s+2) Ganancia (dB) 0 −50 −100 −90 Fase ( ) ◦ −120 −150 MF −180 −1 0 1 2 10 10 10 10 Frecuencia (rad/s) Figura 9.13: Diagrama de Bode de la planta en lazo abierto sin compensador Se observa que actualmente el MF es aproximadamente 52◦ y la frecuencia de cruce de gananciases de 1.6 rad/s. Por tanto, el sistema sin compensador en lazo cerrado aproximadamente cumple laespecificaci´n de amortiguamiento, y por tanto de sobreimpulso m´ximo, pero no cumple la de tiempo o ade establecimiento. Se podr´ introducir un compensador proporcional para aumentar la frecuencia de cruce de ganancias ıay cumplir la especificaci´n de tiempo de establecimiento, pero el margen de fase disminuir´ el amor- o ıa,tiguamiento tambi´n disminuir´ y el sobreimpulso aumentar´ Para cumplir las dos especificaciones a e ıa ıa.la vez no queda m´s remedio que emplear un compensador de adelanto de fase que haga las dos cosas: aaumentar la frecuencia de cruce de ganancias y conservar el margen de fase. Lo m´s dif´ del dise˜o es decidir cu´l de los par´metros se ajusta primero. Con las especificaciones a ıcil n a adel ejemplo, el dato clave es que al sistema compensado se le va a obligar a que tenga su frecuencia decruce de ganancias en 4 rad/s. A esa frecuencia el diagrama de Bode de la planta s´lo tiene 28◦ . Se puede ointroducir el compensador cuyo adelanto m´ximo sea de 24◦ y se d´ en 4 rad/s. a e 1−α sin 24◦ = ⇒ α = 0.4217 (9.18) 1+α 1 √ = 4 rad/s ⇒ T = 0.385 s (9.19) T α De esa forma, si la frecuencia de cruce de ganancias es realmente 4 rad/s, se conseguir´ un margen ade fase de 52◦ , porque se ha dise˜ado un compensador que a˜ade justo la fase necesaria para cumplirlo. n nLa ganancia del compensador sube o baja el diagrama de ganancias y se elegir´ la que sea necesaria apara conseguir 0 dB en 4 rad/s. La ganancia necesaria no se mide directamente del diagrama de Bode deganancias de la planta, porque el compensador de adelanto modifica tanto las fases como las ganancias.En concreto, en la frecuencia de adelanto m´ximo, 4 rad/s, introduce una subida de ganancias de: a −10 log α = 3.75 dB (9.20) 99
  • 99. Por tanto, si la planta necesitaba en 4 rad/s una subida de 12 dB y el compensador de adelanto yaha introducido una subida de 3.75 dB, la ganancia s´lo debe a˜ adir 8.25 dB. Es decir: o n 20 log K = 8.25 dB ⇒ K = 2.58 (9.21) Con todo lo dicho ya est´n fijados los tres par´metros del compensador, que tiene la forma: a a 1 + 0.385s s + 2.59 D(s) = 2.58 = 6.11 (9.22) 1 + 0.162s s + 6.16 Se observa que es similar, pero no exactamente igual, a los que se dise˜aron en el lugar de las ra´ n ıces.Ejemplo de dise˜ o con especificaci´n de error n o Se supone que las especificaciones de la planta del ejemplo del apartado anterior son obtener un MFde 50◦ y un coeficiente de error de velocidad de 20 s−1 . La forma de dise˜ar el compensador de adelanto nde fase es completamente distinta. Primero se utiliza la ganancia K del compensador para lograr laespecificaci´n de error en r´gimen permanente: o e 1 + Ts 4 Kv = l´ sK ım = 2K = 10 ⇒ K = 10 (9.23) s→0 1 + αT s s(s + 2) Se decide empezar por la ganancia K porque es el unico elemento del compensador que interviene en ´la mejora del error, pero adem´s porque modifica el MF de la planta. En la Fig. 9.14 se muestra c´mo a oal introducir la ganancia de 10, el margen de fase del sistema disminuye de 52◦ hasta 18◦ . El cero y elpolo del compensador colocados en torno a la nueva frecuencia de cruce de ganancias, aproximadamente6 rad/s, conseguir´n aumentar el margen de fase hasta los 50◦ deseados. a 50 Ganancia (dB) 0 4 −50 G(s) = s(s+2) 40 KG(s) = s(s+2) −100 −90 Fase ( ) ◦ −120 −150 MF MF’ −180 −1 0 1 2 10 10 10 10 Frecuencia (rad/s) Figura 9.14: Diagrama de Bode de la planta en lazo abierto sin compensador y con ganancia El adelanto de fases m´ximo del compensador debe ser unos 32◦ si se quieren conseguir 50◦ de MF. Sin aembargo, el compensador tambi´n introduce una peque˜a subida de ganancias, por lo que la frecuencia e nde cruce de ganancias definitiva se va a desplazar un poco a la derecha. Por ese motivo, en lugar dedise˜ar un compensador que adelante exactamente lo necesario para dar el MF de la especificaci´n se n osuelen sumar entre 5◦ y 12◦ de m´s. El margen se va a medir al final en un punto a una frecuencia un apoco m´s elevada que donde est´ MF’. Se elige por tanto, dise˜ar un controlador cuyo adelanto m´ximo a a n asea un poco m´s de 32◦ , por ejemplo 38◦ . a 1−α sin 38◦ = ⇒ α = 0.24 (9.24) 1+α Hecha esta elecci´n, ya se puede saber cu´nto va a subir en dB el diagrama de Bode para la frecuencia o ade adelanto m´ximo: a −10 log α = 6.2 dB (9.25) Por tanto, se elige para la frecuencia de adelanto m´ximo el punto del diagrama de Bode con ganancia aque tenga −6.2 dB, para que al a˜adir el polo y el cero el adelanto m´ximo se d´ en la frecuencia de n a e 100
  • 100. cruce de ganancias definitiva. En la Fig. 9.14 se pueden medir aproximadamente −6.2 dB en la plantacon ganancia en la frecuencia de 9 rad/s. Por tanto: 1 √ = 9 rad/s ⇒ T = 0.227 s (9.26) T α Con esto ya est´n definidos los tres par´metros del compensador de adelanto de fase que queda as´ a a ı: 1 + 0.227s s + 4.4 D(s) = 10 = 41.66 (9.27) 1 + 0.0544s s + 18.36 50 Ganancia (dB) 0 −50 G(s) −100 KG(s) D(s)G(s) −150 −90 −120 Fase ( ) ◦ −150 MF’’ −180 −1 0 1 2 3 10 10 10 10 10 Frecuencia (rad/s) Figura 9.15: Diagrama de Bode de la planta en lazo abierto sin y con compensador Como las especificaciones en este apartado son distintas que en el apartado anterior, la expresi´n del ocompensador es bastante diferente. En la Fig. 9.15 se muestra el diagrama de Bode del sistema en lazoabierto, el producto D(s)G(s), y se observa c´mo efectivamente al final se consigue un margen de fase oaproximadamente de 50◦ . Como recomendaci´n final para el dise˜o, no es conveniente implementar un compensador de ade- o nlanto de fase que en frecuencias posea un adelanto de fase m´ximo φm´x superior a 60◦ . En el caso de a aque sea necesario a˜ adir tanta fase se pueden encontrar soluciones m´s satisfactorias, por ejemplo con n acompensadores de adelanto-retraso.9.3. Compensador de retraso de fase Un compensador de retraso de fase tiene la siguiente forma: 1 1 + Ts K s+ T s+a β>1 D(s) = K = 1 = Kc s + b , con (9.28) 1 + βT s β s + βT a>b La primera expresi´n es m´s util cuando se trabaja en el diagrama de Bode, mientras que la ultima o a ´ ´es preferible cuando se trabaja en el lugar de las ra´ ıces.9.3.1. Ajuste por el diagrama de Bode Para el dise˜o de un compensador de retraso de fase con el diagrama de Bode se debe estudiar en nprimer lugar qu´ forma adopta dicho compensador en el diagrama, Fig. 9.16. e Las ganancias comienzan y acaban con pendiente nula. Siempre el aporte de ganancia a altas frecuen-cias es menor que a bajas frecuencias. Dependiendo de K y β ese aporte puede ser finalmente positivo,negativo o nulo para alguna de esas frecuencias. Aunque en los compensadores de retraso tiene menosinter´s, la fase de retraso m´ximo es: e a 1−β sin φm´ = ın (9.29) 1+β El angulo φm´ depende exclusivamente de β y como mucho puede ser de −90◦ cuando el polo y el ´ ıncero est´n muy separados. a 101
  • 101. 1(jB S ;wi D 1(jB  ± d(jB # ± 1(jB # 1(jB  # d d d ;wi D x# x # x (º *8$t Figura 9.16: Diagrama de Bode de un compensador de retraso de faseCompensador de retraso que mejora el error Un compensador de retraso de fase puede utilizarse para disminuir el error en r´gimen permanente esin empeorar el r´gimen transitorio del sistema. Haciendo K igual a β, ecuaci´n (9.30), la ganancia y fase e odel compensador valen ambos 0 para altas frecuencias y por tanto no se modifica el diagrama de Bodede la planta, Fig. 9.17. Sin embargo, a bajas frecuencias se produce un aumento de ganancia, por lo queaumenta el coeficiente de error del sistema y por tanto disminuye el error del mismo. 1 1 + Ts s+ T s+a β>1 D(s) = β = 1 = s + b , con (9.30) 1 + βT s s + βT a>b 1(jB S ;wi D 1(jB # (SI d d d ;wi D x# x # x (º *8$t Figura 9.17: Diagrama de Bode de un compensador de retraso de fase que disminuye el error Si se emplea el compensador de retraso de fase exclusivamente para disminuir el error en r´gimen etransitorio, lo unico que hay que hacer es: calcular β con la expresi´n (9.31) del coeficiente de error, ´ oigualar la ganancia K a β para que el compensador no modifique el Bode a altas frecuencias y elegir Tde tal forma que el cero del compensador quede entre una d´cada y una octava antes de la frecuencia de ecruce de ganancias del sistema. Esto ultimo se hace para asegurar precisamente que el compensador no ´modifica el Bode en la frecuencia que rige el r´gimen transitorio. e 1 + Ts Kp = l´ β ım G(s) = βG(0) (9.31) s→0 1 + βT sCompensador de retraso que anula el error o compensador proporcional-integral Se trata de la misma idea que en el apartado anterior, pero en lugar de disminuir el error del sistema,se anula. Para ello se incrementa el tipo del sistema en una unidad, haciendo que el polo del compensadorse sit´ e en 0 rad/s en el diagrama de Bode, o lo que es lo mismo, en el origen del plano S. u 1 1 + Ts s+ T s+a D(s) = = = (9.32) Ts s s Este tipo de compensador se llama proporcional-integral porque en el dominio del tiempo la actuaci´noen la planta es la suma de una parte proporcional al error y otra proporcional a la integral del error. t s+a E(s) L −1 U (s) = E(s) = E(s) + a − − u(t) = e(t) + a −→ e(τ )dτ (9.33) s s 0 102
  • 102. 1(jB S ;wi D (SI d ;wi D x (º −;xº − (º Figura 9.18: Diagrama de Bode de un compensador de retraso de fase proporcional-integral El m´todo de dise˜ o es todav´ m´s sencillo que el caso anterior porque s´lo haya que elegir la e n ıa a oconstante de tiempo T del cero del compensador de forma que ´ste quede entre una d´cada y una octava e eantes de la frecuencia de cruce de ganancias de la planta cuyo transitorio no se quiere modificar.Compensador de retraso que mejora el error y el transitorio Los compensadores de retraso que se han explicado en los apartados anteriores pueden incluir unamejora en las especificaciones de r´gimen transitorio. Lo que hay que hacer es a˜adir una ganancia K e nque modifique el Bode de la planta antes de incorporar los compensadores de retraso de los apartadosanteriores. Con la ganancia K se puede modificar la frecuencia de cruce de ganancias para conseguir unade estas dos cosas: un ancho de banda determinado —que es lo mismo que un tiempo de estableci-miento determinado— o un margen de fase determinado —que es lo mismo que un amortiguamientodeterminado—. Pero con una ganancia no es posible conseguir las dos cosas a la vez. Si, como se acaba de decir, se pueden cumplir una especificaci´n de error y una especificaci´n de o otransitorio, entonces el ejemplo usado para el apartado de compensador de adelanto de fase se puedesolucionar tanto con un compensador de adelanto de fase como con uno de retraso. Se va resolver aqu´ ese mismo ejemplo con un compensador de retraso de fase. Las especificaciones ıeran obtener un margen de fase de 50◦ y un coeficiente de error de velocidad de 20 s−1 . El diagrama deBode de la planta daba un margen de fase de 52◦ , por lo que se puede introducir una ganancia muy pocomenor que la unidad para conseguir exactamente 50◦ de margen de fase. La diferencia en este caso es tanpeque˜a, que se ha optado por no introducir ninguna ganancia K, Fig. 9.19. n 50 4 G(s) = s(s+2) Ganancia (dB) 0 −50 −100 −90 Fase ( ) ◦ −120 −150 MF −180 −1 0 1 2 10 10 10 10 Frecuencia (rad/s) Figura 9.19: Diagrama de Bode de la planta en lazo abierto sin compensador El compensador de retraso de fase que mejora s´lo el error debe cumplir: o 1 + Ts 4 Kv = l´ sβ ım = 2β = 10 ⇒ β = 10 (9.34) s→0 1 + βT s s(s + 2) 103
  • 103. En cuanto a la posici´n del cero de cero del compensador, se propuso que estuviera entre una d´cada o ey una octava antes que la frecuencia de cruce de ganancias. En la ecuaci´n (9.35) se ha elegido colocar el ocero una d´cada antes. e 1 1.6 = rad/s ⇒ T = 6.25 s (9.35) T 10 100 Ganancia (dB) 50 0 −50 G(s) D(s)G(s) −100 −90 −120 Fase ( ) ◦ −150 MF −180 −3 −2 −1 0 1 2 10 10 10 10 10 10 Frecuencia (rad/s) Figura 9.20: Diagrama de Bode de la planta con compensador de retraso de fase En la Fig. 9.20 se muestra el diagrama de Bode del sistema en lazo abierto compensado. La expresi´n ofinal del compensador de retraso de fase que cumple las especificaciones dadas es: 1 + 6.25s s + 0.16 D(s) = 10 = (9.36) 1 + 62.5s s + 0.016 En la Fig. 9.21 se compara el sistema compensado de las dos maneras, con el compensador de retrasode fase y con el compensador de adelanto de fase. Como era de esperar, el sistema compensado con elde adelanto es m´s r´pido porque su frecuencia de cruce de ganancias es mucho mayor. Sin embargo, a acomo el margen de fase es aproximadamente igual en los dos casos, el amortiguamiento —y por tanto elsobreimpulso m´ximo— son similares. a 1.5 1 c(t) 0.5 s+0 .16 D(s) = s+0 .016 D(s) = 4.7 s+2 .9 s+5 .4 0 0 1 2 3 4 5 tiempo (s) Figura 9.21: Respuesta temporal del sistema con compensador de retraso y de adelanto9.3.2. Ajuste por el lugar de las ra´ ıces En el lugar de las ra´ ıces se dise˜ an s´lo compensadores de retraso de fase que mejoren el error en n or´gimen permanente pero no modifiquen el r´gimen transitorio del sistema. Por tanto, la expresi´n del e e o 104
  • 104. compensador siempre tendr´ K igual a β, es decir, en monomios ser´ un polo y un cero sin ganancia a aaparente como ya se demostr´ en la ecuaci´n (9.30). o o s+a D(s) = , con a > b (9.37) s+b La unica forma de que un nuevo polo y cero en el lugar de las ra´ no modifiquen la localizaci´n de ´ ıces olos polos objetivo que caracterizan el r´gimen transitorio y, a la vez, puedan mejorar sustancialmente el er´gimen permanente del sistema, es que ambos est´n muy cerca del origen. e e Un polo y un cero exactamente en un mismo lugar se anulan, pero si est´n muy cerca el uno del aotro, a y b muy cercanos, su influencia es casi despreciable. Cualquier punto del plano S suficientementealejado de ellos los ver´ con el mismo ´ngulo y distancia, por lo que no cambiar´ el lugar de las ra´ a a a ıces,es decir, el hecho de que pase o no por ese punto. Si ese polo y cero muy pr´ximos entre s´ est´n adem´s muy lejos del origen del plano S, tampoco o ı, a apueden modificar la expresi´n del error en r´gimen permanente, porque el cociente a ser´ muy pr´ximo o e b a oa la unidad. s+a a Kp = l´ ım G(s) = G(0) (9.38) s→0 s + b b Sin embargo, su el polo y el cero est´n muy pr´ximos entre s´ y a la vez est´n muy cerca del origen, a o ı, aes posible mejorar cuanto se desee el error en r´gimen permanente sin modificar el lugar de las ra´ del e ıcessistema y, por tanto, conservando los mismo polos objetivo que sin ellos. Precisamente porque se quieremejorar el error en r´gimen permanente se debe escoger a > b. e C 7$R ‚8sSR$t 7$R ‚8sS{Bt {B8}‚tRsIB„ {B8}‚tRsIB„ y K Figura 9.22: Lugar de las ra´ al introducir un compensador de retraso ıces Como se observa en el ejemplo de sistema de segundo orden de la Fig. 9.22, aparece un tercer polo enlazo cerrado debido a la introducci´n del compensador, pero apenas influir´ en la respuesta transitoria del o asistema porque est´ muy cercano el cero del compensador y sus actuaciones se cancelan pr´cticamente. a a Para dise˜ar el compensador con el lugar de las ra´ n ıces, lo unico que hay que hacer es conocer cu´l debe ´ aser la separaci´n relativa entre el polo y el cero del compensador para que con la ecuaci´n (9.38) —u otra o oequivalente dependiendo del tipo de error— se cumpla la especificaci´n deseada, y posteriormente colocar oel cero del compensador, que es el m´s cercano al polo objetivo, entre tres y diez veces m´s cercano al a aorigen. Si el compensador suficientemente alejado del polo objetivo, ´ste ultimo variar´ su posici´n muy e ´ a opoco, por lo que no se recomienda introducir ninguna ganancia extra que modifique de nuevo su posici´n, oaunque algunos autores incluyen este ultimo paso. ´9.4. Compensador de adelanto-retraso Un compensador de adelanto-retraso es el producto de uno de adelanto y uno de retraso: 1 + Ts 1 + T s 0<α<1 D(s) = K , con (9.39) 1 + αT s 1 + βT s β>1 Los compensadores de adelanto-retraso son muy utiles, por ejemplo, cuando se deben cumplir tres ´especificaciones en un sistema. Hasta ahora en los ejemplos que se han resuelto s´lo exist´ dos espe- o ıancificaciones, sin embargo, puede darse el caso que se pidan dos especificaciones de r´gimen transitorio y e 105
  • 105. otra de error que hagan necesario contar con m´s grados de libertad que los que ofrecen por separado los acompensadores de adelanto de fase y los de retraso. En este caso, lo que se recomienda es dise˜ ar primera la parte de adelanto del compensador que haga ncumplir las dos especificaciones de r´gimen transitorio y despu´s la parte de retraso que no modifique e elas altas frecuencias y mejore el error en r´gimen permanente. Aqu´ se recomienda situar el cero del e ıcompensador de retraso una d´cada antes de frecuencia de cruce ganancias que resulte despu´s de ajustar e eel compensador de adelanto. Tambi´n es posible que un sistema con s´lo dos especificaciones lleve al ingeniero a elegir un com- e opensador de adelanto-retraso. Por ejemplo, cuando resulte que un compensador de adelanto de fase debetener un adelanto de fase m´ximo φm´x mayor que los 60◦ recomendados o incluso mayor que su l´ a a ımitesuperior de 90◦ . 1(jB S ;wi D ;wi D (º Figura 9.23: Diagrama de Bode de un compensador de adelanto-retraso En cualquiera de los dos casos mencionados, el compensador de retraso se coloca a bajas frecuencias yel de adelanto a m´s elevadas frecuencias, Fig. 9.23. Nunca se dise˜ an compensadores de adelanto-retraso a nen los que esta situaci´n est´ invertida. o e9.5. Ejercicios propuestos - Ejercicio 1: Dise˜ ar un compensador que, en lazo cerrado, consiga un coeficiente Kv de 5 s−1 para n la siguiente planta: 1 G(s) = (9.40) s(s + 1)(s + 2) - Ejercicio 2: Dise˜ ar un compensador que, en lazo cerrado, consiga un coeficiente Kv mayor o igual n que 100 s−1 y un margen de fase mayor o igual que 30◦ para la siguiente planta: 4 G(s) = (9.41) s(1 + 0.1s)(1 + 0.2s) - Ejercicio 3: Dise˜ ar un compensador que, en lazo cerrado, consiga un amortiguamiento de 0.5, n una frecuencia natural de 5 rad/s y coeficiente Kv de 80 s−1 para la siguiente planta: 4 G(s) = (9.42) s(s + 0.5) - Ejercicio 4: Un PLL (Phase Locked Loop) es un circuito electr´nico utilizado para sincronizar o la frecuencia y la fase de los relojes de dos sistemas que desean intercambiar informaci´n. Es o necesario utilizarlo en sistemas digitales que env´ la onda modulada. Su utilizaci´n, por tanto, ıen o es ampl´ısima: tel´fonos m´viles, acceso en banda ancha, etc. T´cnicamente el sistema no es lineal, e o e pero bajo determinadas hip´tesis se puede considerar que es un sistema lineal como el que muestra o el diagrama de bloques: - En primer lugar se estima la diferencia entre el angulo de la referencia. ´ - En el c´lculo de esa diferencia se introduce t´rminos de altas frecuencias que se filtran con un a e filtro pasa-baja. - La salida del filtro pasa-baja es la entrada del controlador que se pide dise˜ar. n 106
  • 106. - La salida de este controlador, es la entrada de un oscilador controlado por voltaje (VCO), es decir, un oscilador que genera una se˜al de frecuencia proporcional al voltaje que se aplica n sobre ´l. Aqu´ se ha supuesto una ganancia unidad. e ı - El ´ngulo de la sinusoide es directamente la integral de la frecuencia. a Se pide dise˜ar un compensador que cumpla las siguientes propiedades: n - Error nulo ante una entrada rampa (esto es equivalente a, por ejemplo, sincronizar los relojes de un tel´fono m´vil en un coche y la estaci´n base). e o o - Sobreimpulso menor del 10 %. - Ancho de banda de unos 20 rad/s. (Nota: los valores habituales son entre 50 y 100 Hz, pero se ha puesto ´ste para facilitar los c´lculos). e a 3$j „B ]Bt „Bj z]! „ W (( ~ d t d X1 + ;1X + (( X ± Nota: Aunque el diagrama de Bode que se da puede ser util, no es estrictamente necesario para la ´ resoluci´n de este ejercicio. o o 1+0.107s Soluci´n: Gc (s) = 10.3 1+0.0233s 1+1.07s 1.07s- Ejercicio 5: Se quiere controlar de forma r´pida y precisa la posici´n de un robot que dispone a o de un controlador para la velocidad angular independiente en cada una de las articulaciones. El siguiente diagrama de bloques muestra un modelo estimado de una articulaci´n con su control de o velocidad: „ W −(.(dX 1M(X + ) (X + d;)1 Se requiere dise˜ar un controlador de posici´n adecuado para dicha articulaci´n en los siguientes n o o casos: - Controlador proporcional. - Compensador de adelanto de fase. Por consideraciones de dise˜o, el m´ximo avance de fase del n a compensador es de 45◦ . Nota: Se recomienda dibujar primero el diagrama de bloques del sistema con el controlador de posici´n, teniendo en cuenta que la entrada es la referencia de posici´n deseada y la salida es la o o posici´n θ de la articulaci´n del robot (no su velocidad ω). o o Soluciones: - Gc (s) = 10 1+0.069s s+5.88 - Gc (s) = 20.6 1+0.0117s = 121 s+85.25- Ejercicio 6: Ajustar, por el m´todo del lugar de las ra´ e ıces el√compensador de la Fig. 9.24, de tal forma que los polos en lazo cerrado queden situados en −2 ± 2j. ]Bt „BjsIB„ _jst s p d g  (X + y) X1 + 1X + 1 ± Figura 9.24: Sistema de control Soluci´n: a = 2 y K = 2 o 107
  • 107. - Ejercicio 7: Una m´quina de control num´rico (Fig. 9.25) debe seguir una posici´n de referencia a e o con un error inferior a 2 mm. La velocidad m´xima de referencia de posici´n es de 1 m/s (Fig. 9.26). a o Los par´metros de la m´quina son: M = 1 kg y C = 6 Ns/m. Determinar un compensador de retraso a a de fase adecuado para el sistema. El sistema debe tener un comportamiento transitorio razonable. Nota 1: La referencia de posici´n se puede tomar como una rampa. o Nota 2: Por seguridad, la ganancia del controlador a bajas frecuencias debe ser finita, es decir, no puede tener un polo en el origen. …„ W d … t -X1 + gX ± Figura 9.25: M´quina de control num´rico a e ?„ Ww0D 1S88 ?w0D 0 Figura 9.26: Se˜ales de referencia y salida n Soluci´n: o s+1 Gc (s) = 18 s+0.006 usando el lugar de las ra´ ıces. s+1 Gc (s) = 23.71 s+0.0079 usando el diagrama de Bode.- Ejercicio 8: Sea el sistema de la Fig. 9.27, dise˜ ar un controlador de forma que el coeficiente de n error ante entrada rampa sea de 28 s−1 y el margen de fase sea al menos de 45◦ . …„ W d( … t X(X + d) ± Figura 9.27: Sistema de control Soluci´n: Se pueden cumplir especificaciones con un compensador de retraso, sin embargo, lo mejor o es dise˜ ar un compensador de adelanto: n 1 + 0.268s Gc (s) = 2.8 (9.43) 1 + 0.0582s- Ejercicio 9: Sea el sistema de la Fig. 9.28, calcular un compensador de adelanto de fase que consiga que el sistema posea un sobreimpulso menor del 10 % y un error en r´gimen permanente menor del e 5 %. ¿Cu´l es el ancho de banda del sistema compensado? a ]Bt „Bj _jst s p d g twXD (X + d)(X + d() ± Figura 9.28: Sistema de control 1+0.119s Soluci´n: G(s) = 200 1+0.0583s , con 12 rad/s de ancho de banda aproximadamente. o- Ejercicio 10: Se desea dise˜ ar un compensador de adelanto de fase que controle la posici´n de un n o sat´lite en el espacio. El diagrama de bloques del sistema se muestra en la Fig. 9.29. Se requiere un e tiempo de establecimiento menor que 2 segundos con un amortiguamiento adecuado. a) Dise˜ ar el compensador por el m´todo del lugar de las ra´ n e ıces. 108
  • 108. ]Bt „Bj V{ ZsIB„ 7s ? ‚ ‚j$ p d g twXD d OX1 ± 7‚tRB„ 1 Figura 9.29: Sistema de control b) Dise˜ar el compensador por el m´todo de la respuesta en frecuencia. n e Recomendaciones: 1. Expresar la ganancia del compensador en funci´n de las constantes J, K1 y K2 del sistema. o 2. La frecuencia de cruce de ganancias es aproximadamente igual a la frecuencia natural de los polos dominantes del sistema. Soluciones: Si se elige ζ = 0.45, 34J s+2 a) G(s) = K1 K2 s+7.5 48.22J s+1.82 b) G(s) = K1 K2 s+10.79- Ejercicio 11: Dise˜ ar un compensador de retraso de fase que deje el sistema con un error del 4 % n y un margen de fase de 45◦ , donde la planta es: 1 G(s) = (9.44) (s + 3)2 1+s Soluci´n: Gc (s) = 216.5 1+1.93s o- Ejercicio 12: Sea la siguiente planta en lazo abierto: e−0.2s G(s) = K (9.45) s a) Determinar la ganancia K que deja al sistema con margen de fase de 60◦ . b) Determinar la ganancia cr´ ıtica del sistema. c) Dibujar en unos ejes de coordenadas los valores que va tomando el margen de fase en funci´n o de la ganancia K, si dicha ganancia var´ entre 1 y la ganancia cr´ ıa ıtica. Explicar el resultado. Soluciones: a) K = 2.61 b) KCR = 7.74 c) El margen de fase frente a la ganancia K, sale una l´ ınea recta decreciente. Esto es l´gico porque o pasar la ganancia de dB a K es pasar a escala logar´ ıtmica y el margen de fase tambi´n cae de e forma logar´ıtmica por el retraso.- Ejercicio 13: Dise˜ ar un compensador de adelanto de fase tal que el error sea de 5 mm ante entrada n rampa de pendiente unidad y el margen de fase sea de 45◦ , donde la planta (que tiene unidades en el SI) es: 2500 G(s) = (9.46) s(s + 25) Soluciones: K = 2, ωcg = 70 rad/s, φm = 33◦ , α = 0.29 y T = 0.02 s.- Ejercicio 14: Se desea tener el m´ ınimo error, asegurando un comportamiento transitorio razonable, en la siguiente planta: e−0.5s G(s) = (9.47) s+5 a) Con un controlador puramente proporcional, ¿qu´ magnitud de error puede dejar en el sistema? e 109
  • 109. b) ¿Y con un compensador de adelanto de fase? ¿Puede mejorar el error manteniendo el compor- tamiento transitorio?- Ejercicio 15: Sea el sistema de la Fig. 9.30: a) Elegir una constante K adecuada para el sistema y determinar el valor del margen de fase y ancho de banda del sistema compensado. b) ¿Cu´nto vale el error ante una entrada rampa r(t) = t? a c) Dibujar aproximadamente la respuesta temporal del sistema c(t) ante una entrada escal´n y o una entrada rampa. ]Bt „BjsIB„ _jst s p d g  (X + 1) X1 (X + d1) ± Figura 9.30: Sistema de control 110
  • 110. Cap´ ıtulo 10Controladores PID Actualmente los dispositivos de control son de uso com´n en las empresas. Las t´cnicas de fabricaci´n u e oen serie han hecho que no se implementen compensadores para una funci´n particular, sino dispositivos ogen´ricos que sean capaces de ajustarse para una labor espec´ e ıfica, seg´ n las caracter´ u ısticas del sistema. El controlador proporcional-integral-derivativo, o controlador PID, es un dispositivo de control gen´ri- eco donde el dise˜ ador s´lo tiene que dar valores adecuados, seg´n lo requiera la situaci´n, a los distintos n o u opar´metros que contiene. Por tanto, se elude la necesidad de fabricar el compensador que se desea imple- amentar.10.1. Expresi´n general o Como su propio nombre indica, un controlador PID es un caso particular de compensador de adelanto-retraso en el que el compensador de adelanto es proporcional-derivativo y el compensador de retraso esproporcional-integral. Del producto de ambos compensadores, se obtiene un controlador con dos ceros—que en general pueden ser reales o no—, un polo en el origen y una ganancia. ]Bt „Bj _jst s p o J g h{; t ± Figura 10.1: Sistema controlado con PID s+b s2 + αs + β GPID (s) = GPD (s)GPI (s) = K1 (s + a)K2 =K (10.1) s s Un controlador PID, por tanto, tiene tres par´metros que se pueden elegir: la posici´n de los dos ceros a oy el valor de la ganancia.10.1.1. Forma est´ndar a Una expresi´n equivalente a la ecuaci´n (10.1) es la que se presenta en (10.2), tambi´n llamada forma o o eest´ndar del controlador PID. a 1 U (s) = Kp 1 + + sTd E(s) (10.2) Ti s En (10.3) se observa la actuaci´n temporal del controlador en la planta, que tiene tres sumandos: uno oproporcional al error, otro proporcional a la integral del error y otro proporcional a la derivada del error. t 1 de(t) u(t) = Kp e(t) + e(τ )dτ + Td (10.3) Ti 0 dt A la constante Kp se le llama ganancia proporcional y posee las unidades que relacionan la actuaci´n ocon el error, Ti es la constante de tiempo integral y tiene unidades de segundos, y Td la constante detiempo derivativa y tambi´n tiene unidades de segundos. e 111
  • 111. 10.1.2. Forma paralela La actuaci´n del controlador se puede separar en forma de tres sumandos diferentes. Cada uno de oellos acapara respectivamente la actuaci´n proporcional, integral y derivativa: o KI U (s) = KP + + sKD E(s) (10.4) s Las constantes KP , KI y KD se obtienen f´cilmente conocidos los par´metros est´ndar Kp , Ti y Td . a a aEsta forma de expresar el controlador PID se conoce como paralela porque se puede representar comoaparece en la Fig. 10.2. X; p o J g h t ± { X Figura 10.2: Sistema de control con PID en forma paralela10.1.3. Forma serie En el caso de que los dos ceros del controlador sean reales, se puede encontrar la forma serie o cl´sica adel PID. La actuaci´n del controlador PID serie se expresa como: o 1 U (s) = Kp 1 + (1 + sTd )E(s) (10.5) Ti s Los nuevos par´metros serie Kp , Ti y Td se pueden obtener tambi´n a partir de los par´metros a e aest´ndar. La condici´n que deben cumplir los par´metros est´ndar para que los dos ceros del controlador a o a asean reales es que el tiempo de integraci´n sea mayor que cuatro veces el tiempo de derivaci´n: Ti > 4Td . o oEntonces, el controlador serie PID se puede representar en serie como aparece en la Fig. 10.3. d XxQ′d′ sT x7′ X p o J g ′ € t ± Figura 10.3: Sistema de control con PID en forma serie La forma serie se llama tambi´n cl´sica porque los primeros actuadores PID neum´ticos que se lograron e a aimplementar, siempre resultaban tener ceros reales. Es bueno conocer las tres formas de expresar los PID,porque el ingeniero puede manejar controladores comerciales que permitan introducir las constantes dealguna de estas tres maneras. En este cap´ ıtulo, a partir de este momento, siempre se emplear´n los apar´metros de la forma est´ndar, que son los que tienen sentido f´ a a ısico m´s evidente. a10.2. Sentido f´ ısico de la actuaci´n de un PID o Es posible ajustar los par´metros de un controlador PID sin un conocimiento preciso del tipo de aactuaci´n que realiza cada una de las partes del mismo. Sin embargo, resulta muy conveniente para opoder predecir c´mo afecta al sistema la modificaci´n de cada uno de ellos. o o 112
  • 112. 10.2.1. Actuaci´n proporcional o Si el tiempo de integraci´n se hace infinito y el de derivaci´n nulo, el controlador PID se transforma o oen una ley de control puramente proporcional al error entre la referencia y la salida. u(t) = Kp e(t) (10.6) ? ?„  E Figura 10.4: Actuaci´n proporcional o Un s´ımil mec´nico de esta actuaci´n, Fig. 10.4, es la que har´ un muelle de rigidez K = Kp que uniera a o ıala referencia con una masa que se deseara mover hasta dicha referencia. Se puede hacer m´s r´pido el a asistema aumentando la rigidez del muelle, es decir, aumentando la ganancia proporcional del controlador.Como contrapartida, tambi´n es previsible que el sistema se oscile m´s en torno a la referencia. e a10.2.2. Actuaci´n proporcional-derivativa o Una forma de evitar las fuertes oscilaciones que se pueden producir en torno a la referencia es a˜adir na la actuaci´n proporcional otra actuaci´n proporcional a la derivada del error. Esto es lo mismo que o odotar al sistema una cierta capacidad de “anticipaci´n” porque la inclusi´n del t´rmino derivativo es o o eequivalente a actuar proporcionalmente al error que existir´ dentro de Td segundos. a de(t) u(t) = Kp e(t) + Td ≈ Kp e(t + Td ) (10.7) dt Esta antelaci´n es beneficiosa porque el sistema es capaz de “frenar” antes de llegar a la referencia. oEn la Fig. 10.5 se muestra c´mo en el instante t1 el error todav´ es positivo, por lo que el control o ıaproporcional seguir´ actuando en la planta para acercar la masa a la referencia, aunque sea una fuerza apeque˜a. Pero un usuario previsor, deducir´ que con la elevada velocidad que lleva la masa en breves n ıainstantes se rebasar´ la posici´n de referencia por lo que en ese instante introducir´ una fuerza contraria a o ıao “de frenado”. Es decir, actuar en t1 con la fuerza que se estima para t2 . ?w0D ?„w0D xQ 0 0 d 01 Figura 10.5: Actuaci´n proporcional-derivativa o Un s´ ımil mec´nico para la actuaci´n proporcional-derivativa es la de imaginar que la posici´n del a o omasa y la referencia se encuentran unidas por un muelle y un amortiguador en paralelo. La rigidez delmuelle sigue siendo igual a la ganancia proporcional, mientras que el coeficiente de amortiguamiento esel producto de la ganancia por la constante de tiempo de derivaci´n. o de(t) de(t) u(t) = Kp e(t) + Td = Kp e(t) + Td Kp = Ke(t) + Bv(t) (10.8) dt dt Con esta comparaci´n se muestra de forma m´s evidente c´mo la actuaci´n derivativa puede frenar el o a o osistema haci´ndolo menos oscilatorio, m´s amortiguado. Adem´s, tambi´n se observa c´mo al aumentar e a a e oel valor de Td se incrementa el “amortiguamiento” del sistema. 113
  • 113. ? ?„  E 4 Figura 10.6: Actuaci´n proporcional-derivativa o Con estas consideraciones, es posible aventurar unos valores adecuados para el tiempo Td de la partederivativa. No parece razonable asignar a Td un valor muy elevado, en concreto superior al periodo deoscilaci´n que posee el sistema sin acci´n derivativa. Parece l´gico pensar que la estimaci´n del error en o o o oTd segundos s´lo es buena mientras Td se encuentre entre cero y, como mucho, un cuarto del periodo de ooscilaci´n del sistema. o10.2.3. Actuaci´n proporcional-integral o Una caracter´ıstica com´ n de la actuaci´n proporcional y la proporcional-derivativa es que se hace cero u ocuando el error desaparece. Sin embargo, en algunos casos puede ser necesario que esto no sea as´ En la ı.Fig. 10.7 se muestra el mismo ejemplo de los apartados anteriores con la masa movi´ndose verticalmente. e ?„  ? E Figura 10.7: Sistema con error no nulo ante actuaci´n proporcional o Si la actuaci´n es puramente proporcional, la masa en r´gimen permanente no alcanzar´ la referencia o e ıasino que se colocar´ en el lugar donde la acci´n del muelle contrarreste la fuerza del peso. a o mg Kp ess = mg → ess = (10.9) Kp Si se desea que no exista error en r´gimen permanente a la acci´n proporcional hay que a˜adir una e o nactuaci´n extra u0 , (10.10). En los primeros sistemas controlados, la actuaci´n u0 se a˜ ad´ de forma o o n ıamanual, incrementando esa especie de offset hasta que desaparec´ el error. ıa u(t) = Kp e(t) + u0 (10.10) En el caso del sistema de la Fig. 10.7, es evidente que, consiguiendo error nulo, el controlador debeintroducir una fuerza u(t) = u0 = mg. La soluci´n automatizada m´s adecuada a este problema es ir o aaumentando el valor de u0 de forma proporcional a la integral del error. La funci´n integral del error oaumenta paulatinamente mientras exista error no nulo hasta alcanzar, con error nulo, un valor finito. t Kp u(t) = Kp e(t) + e(τ )dτ (10.11) Ti 0 La constante de tiempo de integraci´n Ti da una idea del tiempo que se tarda en anular el error de oforma autom´tica. Esto se puede mostrar, de forma aproximada, calculando el valor de u0 si el error en ar´gimen permanente permanece constante: e t t Kp Kp Kp u0 = e(τ )dτ = ess dτ = ess t (10.12) Ti 0 Ti 0 Ti Sustituyendo en la ecuaci´n (10.12) el valor del error que se obtuvo en (10.9), resulta que cuando el otiempo es igual a la constante de tiempo integral, t = Ti , el valor de u0 alcanza el valor deseado mg. Kp Kp mg t u0 = ess t = t = mg (10.13) Ti Ti Kp Ti 114
  • 114. Por tanto, la constante de tiempo Ti da una idea del momento en que se anula el error en r´gimen epermanente. Si se elige una Ti muy elevada, el sistema tarda mucho en alcanzar la referencia, Fig. 10.8. ?„w0D ?w0D 0 x7 Figura 10.8: Actuaci´n proporcional-integral con Ti muy grande o La interpretaci´n f´ o ısica que se acaba de dar a la actuaci´n integral concuerda con el hecho de que ocuando Ti se hace infinito entonces el sistema no tiene actuaci´n integral. Un valor adecuado para Ti opuede ser el periodo de oscilaci´n del sistema, o un tiempo algo menor. o La actuaci´n integral puede darse tambi´n en sistemas que, de suyo, carezcan de error en r´gimen o e epermanente ante un determinado tipo de entrada. Lo que consigue entonces la parte integral es elevar eltipo del sistema en una unidad y anular el error ante entradas m´s severas. a10.3. Ajuste experimental de PID Las ideas enunciadas en el apartado anterior ayudan a conocer c´mo cambia la respuesta del sistema omodificando alguno de los par´metros del controlador, pero resultan insuficientes para poder asignar de aforma adecuada sus valores num´ricos. e Para asignar valores a los par´metros del controlador sin conocer la funci´n de transferencia de la a oplanta que se desea controlar, se han propuesto una serie de tablas que utilizan varios par´metros que se aobtienen de forma experimental sobre la planta.10.3.1. Ajuste de Ziegler-Nichols El m´todo m´s utilizado es el que propusieron en 1942 John G. Ziegler y Nataniel B. Nichols [1] para el e acontrol de servomecanismos hidr´ulicos en bater´ antia´reas empleadas en la Segunda Guerra Mundial. a ıas eEl ajuste de Ziegler-Nichols propone unos par´metros para el PID de forma que el sistema controlado aposea un buen rechazo a las perturbaciones que se puedan introducir en el sistema. Esto quiere decir que elseguimiento que hace el sistema a la referencia puede ser poco amortiguado, con demasiado sobreimpulso.Pero esto se considera intrascendente comparado con la especificaci´n mencionada. o Tabla 10.1: Ajuste de Ziegler-Nichols Tipo Kp Ti Td Kp Ti Td P 1 a ∞ 0 0.5KCR ∞ 0 0.9 TCR PI a 3L 0 0.45KCR 1.2 0 1.2 TCR TCR PID a 2L 0.5L 0.6KCR 2 8 En muchos procesos industriales un buen rechazo a las perturbaciones es mucho m´s interesante que aun buen seguimiento a la referencia. Por ejemplo, en una planta de elaboraci´n de objetos pl´sticos, o aes muy importante que la temperatura del fluido permanezca constante en la referencia a pesar de lasperturbaciones que suponen la entrada y la salida de material. El proceso inicial de calentamiento, or´gimen transitorio, no es muy importante de cara a la producci´n. Puede ser m´s o menos largo, con e o amayor o menor sobreimpulso, pero lo importante es que una vez que se llega a la temperatura de r´gimen epermanente, las perturbaciones no hagan variar la temperatura dentro de un rango permisible. En concreto, la especificaci´n que se pretende con Ziegler-Nichols es obtener una relaci´n de ca´ de o o ıdasobreimpulsos de un cuarto, es decir, que ante la entrada de una perturbaci´n los sucesivos rebases en otorno a la referencia sean sucesivamente cada uno cuatro veces inferior al anterior. 115
  • 115. Los valores para los par´metros del PID se obtienen con la Tabla 10.1. Existen dos formas de ajuste: auno emplea los par´metros a y L de la respuesta de la planta ante una entrada escal´n unidad y otro que a oemplea los par´metros de ganancia cr´ a ıtica KCR y periodo de oscilaci´n cr´ o ıtico TCR de la planta. En la Fig. 10.9 se muestra c´mo se obtienen los par´metros a y L de la respuesta de la planta ante una o aentrada escal´n unidad. El valor de la salida en r´gimen permanente K se relaciona por trigonometr´ o e ıacon el tiempo muerto L y la constante de tiempo T , seg´ n la ecuaci´n (10.14). u o `w0D d w0D  U 0 y x Figura 10.9: Respuesta de la planta a un escal´n unidad o KL a= (10.14) T La funci´n de transferencia de la planta no se conoce, pero una aproximaci´n de la misma puede ser o o(10.15), es decir, un sistema de primer orden con constante de tiempo T , un tiempo muerto L y unaganancia est´tica K. a Ke−Ls G(s) = (10.15) 1 + Ts Los par´metros de ganancia cr´ a ıtica KCR y periodo de oscilaci´n cr´ o ıtico TCR de la planta se puedenobtener experimentalmente de varias formas. Una posibilidad es introducir la planta en un sistema decontrol proporcional y aumentar la ganancia hasta volver la salida del sistema oscilatoria ante una estradaescal´n, es decir, en el l´ o ımite de estabilidad. La ganancia que deja el sistema en el l´ımite de estabilidades la ganancia cr´ ıtica KCR , mientras que el periodo de oscilaci´n que se observe en la salida del sistema o ıtico TCR .es el cr´ p g  t ± Figura 10.10: C´lculo de la ganancia cr´ a ıtica „w0D w0D xgp 0 Figura 10.11: Medida del periodo de oscilaci´n cr´ o ıtico Si se conoce la funci´n de transferencia de la planta, es posible obtener la ganancia cr´ o ıtica del sistemaanal´ıticamente por medio del criterio de Routh-Hurwith. El periodo de oscilaci´n cr´ o ıtico se puede obtenersustituyendo K por la KCR , a trav´s de los polos en lazo cerrado del sistema de la Fig. 10.10, que se esit´an sobre el eje imaginario del plano S, ecuaci´n (10.16). u o 2π pCR = ± j (10.16) TCR 116
  • 116. El ajuste de Ziegler-Nichols cumple una peculiaridad, y es que el tiempo de integraci´n siempre es ocuatro veces mayor que el tiempo de derivaci´n. Esta elecci´n es razonable, como se vio en el sentido f´ o o ısicode cada uno de las partes del PID. Matem´ticamente, se puede demostrar que, en este caso concreto, los ados ceros del PID son reales y doble (10.17). 2 K p Td 1 U (s) = s+ E(s) (10.17) s 2Td10.3.2. Otros ajustes experimentales Varios autores han propuesto tablas de ajuste para los par´metros del PID. A continuaci´n se pre- a osentan las que propusieron Chien-Hrones-Rewick. Estos autores ofrecen los par´metros que consiguen asobreimpulsos del 20 % o del 0 %, tanto ante entradas referencia, como ante entrada perturbaci´n. o Tabla 10.2: Ajuste de Chien-Hrones-Rewick para entrada perturbaci´n N o Mp = 0 % Mp = 20 % Tipo Kp Ti Td Kp Ti Td P 0.3 a ∞ 0 0.7 a ∞ 0 0.6 0.7 PI a 4L 0 a 2.3L 0 0.95 1.2 PID a 2.4L 0.42L a 2L 0.42L Tabla 10.3: Ajuste de Chien-Hrones-Rewick para entrada referencia R Mp = 0 % Mp = 20 % Tipo Kp Ti Td Kp Ti Td P 0.3 a ∞ 0 0.7 a ∞ 0 0.35 0.6 PI a 1.2T 0 a T 0 0.6 0.95 PID a T 0.5L a 1.4T 0.47L Tabla 10.4: Ajuste de Cohen-Coon Tipo Kp Ti Td P 1 a (1 + L 3T ) ∞ 0 1 9 L 30T +3L PI a ( 10 + 12T ) 9T +20L L 0 1 4 L 32T +6L 4T PID a(3 + 4T ) 13T +8L L 11T +2L L Hay que destacar que, los par´metros Chien-Hrones-Rewick no mantienen la relaci´n cuatro a uno a oentre los tiempos de integraci´n y derivaci´n que ten´ los de Ziegler-Nichols. Tambi´n se puede observar o o ıan ec´mo los par´metros Chien-Hrones-Rewick de la Tabla 10.2 se asemejan a los de Ziegler-Nichols si aumenta o ael sobreimpulso permitido. El ajuste de Cohen-Coon, Tabla 10.4, es otra propuesta para conseguir unbuen seguimiento ante la entrada referencia.10.3.3. Ejemplo comparativo En este apartado se calculan los par´metros del PID para el sistema de la Fig. 10.12, por los m´todos a ede Ziegler-Nichols y de Chien-Hrones-Rewick para referencia y 20 % de sobreimpulso. La respuesta de la planta a una entra escal´n unidad se observa en la Fig. 10.13, donde se puede medir oun tiempo muerto L de 0.7826 segundos y un coeficiente a de 0.2092. Con L y a, acudiendo a la Tabla 10.1 los par´metros del PID por Ziegler-Nichols son 5.7361 para la aKp , 1.5652 segundos para la Ti y 0.3913 segundos para la Td . Si se acude a la Tabla 10.3, los valores porChien-Hrones-Rewick son 4.5411 para la Kp , 5.1738 segundos para la Ti y 0.3678 segundos para la Td . En 117
  • 117. ] ]Bt „Bj _jst s p d g h{; (X + d)n ± Figura 10.12: Sistema controlado por un PID 1 0.8 0.6 c(t) 0.4 0.2 0 0 5 10 15 tiempo (s) Figura 10.13: Respuesta temporal ante entrada escal´n unidad ola Fig. 10.14 se comparan las respuestas del sistema con los dos PID ante una entrada referencia escal´n ounidad en el instante inicial y una estrada perturbaci´n, tambi´n escal´n unidad, a los 20 segundos. o e o 2 Ziegler-Nichols Chien-Hrones-Rewick 20% ante referencia 1.5 c(t) 1 0.5 0 0 5 10 15 20 25 30 35 40 tiempo (s) Figura 10.14: Respuesta temporal del sistema Como era de esperar, lo par´metros de Ziegler-Nichols propician un rechazo a las perturbaciones amejor que los de Chien-Hrones-Rewick, pero ante la entrada referencia el sobreimpulso es muy elevado,en esta caso casi del 70 %. Tambi´n se observa c´mo los par´metros de Chien-Hrones-Rewick consiguen e o ael sobreimpulso aproximadamente de 20 % para los que est´n dise˜ados. a n10.4. Ajuste anal´ ıtico de PIDs por asignaci´n de polos o Existen muchas formas de ajustar los controladores PID. En este apartado s´lo se mencionar´ un o am´todo anal´ e ıtico de ajuste que persigue colocar los polos del sistema en lazo cerrado en aquellas posicionesque garantizan un comportamiento adecuado en r´gimen transitorio. e El m´todo se va a explicar con el ejemplo de la Fig. 10.15, en el que se desea ajustar un controlador ePI para un sistema de primer orden. La funci´n de transferencia en lazo cerrado es: o C(s) KKp (1 + Ti s) = (10.18) R(s) T Ti s2 + Ti (1 + KKp )s + KKp Por tanto, queda un sistema de segundo orden con un cero. La localizaci´n de los polos en lazo cerrado o 118
  • 118. se pueden colocar anal´ ıticamente donde se desee. Basta resolver los valores de Kp y Ti que satisfacen: T Ti s2 + Ti (1 + KKp )s + KKp = α(s2 + 2ζωn s + ωn ) 2 (10.19) La posici´n del cero viene dada con la asignaci´n de polos, pero es posible eliminar su efecto con un o oprefiltro de la referencia. El dise˜o de prefiltros no se explica en estos apuntes. n _y _jst s p  g  € (d + d ) x7 X d + xX ± Figura 10.15: Control PI sobre una planta de primer orden10.5. Control con dos grados libertad Anteriormente se ha mostrado c´mo el ingeniero a la hora de ajustar el PID debe elegir qu´ tipo o ede especificaci´n desea obtener: si un buen comportamiento ante cambios en la referencia o un buen ocomportamiento ante presencia de perturbaciones. Sin embargo, es posible encontrar arquitecturas decontrol que permitan satisfacer especificaciones diferentes ante distintas entradas. Se llamar´ control con ados grados libertad aquella estrategia de control que permite ajustar a la vez especificaciones ante loscambios de referencia y la presencia de perturbaciones. Las arquitecturas de control con dos grados de libertad se podr´ estudiar en un cap´ ıan ıtulo distintoque el de los controladores PID. Sin embargo, los controladores PID m´s avanzados se entender´n mejor a auna vez que se han explicado los fundamentos del control con dos grados de libertad. ] p g td t1 t ± Figura 10.16: Arquitectura de control con dos grados de libertad Como ejemplo de control con dos grados de libertad, se propone el diagrama de bloques de la Fig. 10.16.Antes de escribir las funciones de transferencia que relacionan la salida C(s) con la referencia R(s) o laperturbaci´n N (s), es razonable imaginar que la funci´n de transferencia del controlador externo al lazo o oGc1 (s) s´ va a influir en el “camino” que va de R(s) a C(s), pero no en el que va de N (s) a C(s). ı Gc1 (s)Gc2 (s)G(s) Gc2 (s)G(s) C(s) = R(s) + N (s) (10.20) 1 + Gc2 (s)G(s) 1 + Gc2 (s)G(s) Por tanto, el ingeniero puede dise˜ar a voluntad la funci´n de transferencia del controlador interno al n olazo Gc2 (s) para fijar un comportamiento adecuado ante la entrada perturbaci´n. A continuaci´n puede o odeterminar la funci´n de transferencia del controlador exterior al lazo Gc1 (s) para definir el comporta- omiento —en general distinto— del sistema ante cambio de referencia. De ah´ que Gc1 (s) y Gc2 (s) son los ıdos grados de libertad de la arquitectura de control de la Fig. 10.16. A la funci´n de transferencia Gc1 (s) ode esta estrategia se le suele llamar filtro de la referencia. Es interesante notar que las arquitecturas de control con dos grados de libertad poseen funciones detransferencia con id´ntico denominador y, por tanto, la estabilidad es una caracter´ e ıstica com´ n de toda ula estrategia. ] p g td t ± t1 Figura 10.17: Variante de la estrategia con filtro de referencia 119
  • 119. Una posible variante de arquitectura de control con dos grados de libertad es la que se presenta en laFig. 10.17. En este caso, el controlador interno al lazo se sit´a en la realimentaci´n. La salida del sistema u oes: Gc1 (s)G(s) G(s) C(s) = R(s) + N (s) (10.21) 1 + Gc2 (s)G(s) 1 + Gc2 (s)G(s) En las siguientes variantes es posible identificar en el diagrama de bloques la se˜al del error E(s), ncosa que no se pod´ hacer en las anteriores arquitecturas. En la estrategia de la Fig. 10.18 el filtro de la ıareferencia se sustituye por un lazo de prealimentaci´n. o td ] p o g t1 t ± Figura 10.18: Estrategia con lazo de prealimentaci´n o En la estrategia de la Fig. 10.19 existen en cambio dos caminos de realimentaci´n. Se deja como oejercicio la obtenci´n de los grados de libertad de esta arquitectura. o ] p o g td t ± ± t1 Figura 10.19: Estrategia con dos caminos de realimentaci´n o10.6. Modificaciones del PID La expresi´n est´ndar del PID se suele modificar para obtener mejores prestaciones. En los siguientes o aapartados se explican algunas de las mejoras m´s habituales. a10.6.1. Supresi´n del efecto kick-off o El efecto kick-off se produce en todos los sistemas controlados en los que act´ a de forma proporcional ua la derivada del error y la referencia es una entrada escal´n. En el momento del cambio finito de la oreferencia la derivada del error se hace infinita, por lo que la actuaci´n tambi´n se hace muy grande — o ete´ricamente infinita— provocando la saturaci´n de los actuadores. Esta actuaci´n puede resultar nociva o o opara la planta. Una forma de solucionar este problema es hacer que la parte derivativa del PID no act´e sobre la use˜ al del error E(s), sino exclusivamente sobre la se˜ al de salida C(s) del sistema. Es f´cil demostrar que n n aesta estrategia no altera el comportamiento del sistema controlado ante entrada escal´n y s´lo suprime o olos impulsos infinitos que introduce la derivaci´n del salto finito. Estos impulsos infinitos producir´ una o ıanespecia de golpes bruscos en el sistema: es el efecto kick-off que evita esta estrategia. p o g  € (d + d ) t x7 X ± ±  € xQ X Figura 10.20: Controlador PI-D En la Fig. 10.20 se muestra la estrategia descrita. Es evidente que se trata de una arquitectura decontrol con dos grados de libertad. Algunos autores llaman a esta arquitectura controlador PI-D. 120
  • 120. En aplicaciones en las que interesa saturar el dispositivo con rapidez, se conserva la derivada de lareferencia, e incluso se multiplica con un factor c, de la forma: 1 U (s) = Kp E(s) + E(s) + Td s[cR(s) − C(s)] . (10.22) Ti s Si ingeniero posee control sobre el par´metro c, se asignar un valor finito o incluso superior a la unidad apara conseguir el efecto kick-off o hacer c = 0 para cancelarlo y obtener un controlador PI-D. Muchosfabricantes de controladores PID no dejan posibilidad de elecci´n y hacen c = 0 por hardware. o10.6.2. Set-point weighting Otro modo muy habitual de mejorar el controlador PID es introducir un factor b a la referencia de laparte proporcional: 1 U (s) = Kp bR(s) − C(s) + E(s) + Td sE(s) . (10.23) Ti s Para controladores P con mucho error en r´gimen permanente es habitual elegir valores de b mayores eque la unidad, porque consiguen disminuir el error. En caso de controladores PI es habitual elegir valoresentre 0 y 1, con lo que se consigue disminuir el primer sobreimpulso de la salida ante cambios bruscos dela referencia. En cualquier caso, el valor m´s habitual es b = 1. a 2 Ziegler-Nichols Ziegler-Nichols con b = 0.4 1.5 c(t) 1 0.5 0 0 5 10 15 20 25 30 35 40 tiempo (s) Figura 10.21: Respuesta temporal del sistema En la Fig. 10.21 se observa c´mo haciendo b = 0.4 en el sistema ejemplo de la Fig. 10.12, se ha reducido ola magnitud del primer sobreimpulso hasta dejarlo del orden del 20 %. De esta forma se consigue mejorarel comportamiento de los par´metros de Ziegler-Nichols ante la entrada referencia, conservando intacto ael buen rechazo de las perturbaciones. p g  € (K + d + xQ X) t x7X ±  € (d + d + xQ X) x7 X Figura 10.22: Controlador PID modificado con par´metros b y c a El PID modificado puede incluir los par´metros b y c a la vez. En la Fig. 10.22 se representa el adiagrama de bloques de dicho PID modificado y se comprueba c´mo esta ley de control tambi´n esconde o euna arquitectura con dos grados de libertad. El caso particular de PID con coeficientes c = 0 y b = 0 sele conoce como controlador I-PD y se muestra en la Fig. 10.23.10.6.3. Filtro de la derivada Las se˜ ales que pasan por el controlador suelen ir cargadas de ruido. Como la parte derivativa amplifica nsin ning´n tipo de limitaci´n el ruido de alta frecuencia, es habitual introducir un filtro de primer orden u o 121
  • 121. p o € g t x7 X ± ± € (d + xQ X) Figura 10.23: Controlador I-PDen la parte derivativa, de tal forma que posea ganancia finita para altas frecuencias. Esto se consiguea˜adiendo un polo —es un filtro pasa-baja— a la parte derivativa: n 1 Td s U (s) = Kp bR(s) − C(s) + E(s) + [cR(s) − C(s)] (10.24) Ti s 1 + Td s N El nuevo polo cuya constante de tiempo igual al tiempo derivativo dividido por N . Normalmente elvalor de N est´ comprendido entre 2 y 20, siendo valores t´ a ıpicos 8 y 10. Como se puede deducir de laexpresi´n (10.24), cuanto mayor es N menor es el efecto el filtro. o10.6.4. Prevenci´n del efecto windup integral o La operaci´n integral de un PID convencional tambi´n puede ocasionar problemas en los sistemas de o econtrol. Para hacerse una idea cualitativa de qu´ tipo de problemas pueden ocurrir, en la Fig. 10.24 se emuestra el comportamiento t´ ıpico de un sistema con windup integral. w0D „w0D 0 0d 01 0n Figura 10.24: Efecto windup integral En este ejemplo cualitativo existe un intervalo de tiempo, desde t = 0 hasta t = t1 , en el que elcontrolador est´ calculando fuerzas pero el actuador del sistema est´ apagado y por esa raz´n no se a a oha movido de su posici´n inicial. Este fen´meno puede darse muy f´cilmente si el sistema cuenta, por o o aejemplo, con una seta de emergencia, porque es lo ultimo que normalmente se suele accionar. ´ Como consecuencia de este hecho —o simplemente porque la referencia est´ muy alejada de la posici´n e oinicial del sistema— el actuador alcanza el punto de saturaci´n. Aunque pod´ haber ocurrido incluso o ıaantes que t = t1 , sup´ngase que la saturaci´n se alcanza en el instante t = t2 . A partir de t2 , a pesar de o oque el controlador demande una actuaci´n mayor —la parte integral proporcional al area rayada sigue o ´aumentando— el actuador introduce a la planta una actuaci´n constante, la m´xima que puede dar. o aPor esa raz´n, el crecimiento de la salida pocos instantes de t = t2 se asemeja a una recta de pendiente oconstante. Cuando la salida c(t) del sistema sobrepasa la referencia r(t), no se detiene en su crecimiento, porque—aunque la parte proporcional del PID comienza a actuar en contra de dicho movimiento— la parteintegral es muy elevada y no se anular´ y cambiar´ de direcci´n hasta mucho despu´s, en torno a t = t3 a a o edonde las areas rayadas son parecidas. ´ Comienza entonces el efecto m´s t´ a ıpico de windup integral: una serie de oscilaciones poco amortiguadasen torno a la referencia, con formas muy triangulares hasta que —al cabo del tiempo— desaparezca lasaturaci´n de los actuadores. o El efecto windup integral es especialmente peligroso en aquellos sistemas con espacio de trabajolimitado. Es muy t´ ıpico en aplicaciones de rob´tica que se imponga al robot una posici´n de referencia o o 122
  • 122. muy alejada a la posici´n inicial del robot, pero cerca del extremo de recorrido del robot. Si el ingeniero no ose percata de la existencia de este fen´meno, el robot sobrepasar´ la referencia sin disminuir su velocidad o ay llegar´ a los topes del mecanismo provocando eventualmente su rotura. a Existen varias maneras de prevenir el efecto windup integral. Si el PID est´ implementado en c´digo, a ono mediante un circuito anal´gico, es posible realizar una integraci´n condicionada, es decir, s´lo se o o ointegra mientras no se alcance la saturaci´n. Tambi´n es relativamente f´cil asegurar por software que o e ano se exigen cambios de referencia demasiado bruscos, que son los que provocan f´cilmente la saturaci´n a ode los actuadores. As´ por ejemplo, se puede reemplazar las referencias escal´n grandes por rampas ı ocuya pendiente no sobrepase la velocidad m´xima que puede alcanzar el sistema (como se muestra en la aFig. 10.25). „w0D „w0D 0 0 Figura 10.25: Cambio de referencia escal´n y cambio de referencia con velocidad limitada o Existen otras formas de evitar el efecto windup integral usando el tracking de la se˜al de actuaci´n n osaturada. Como son estrategias no lineales no se estudiar´n en esta asignatura. a10.7. Ejercicios propuestos - Ejercicio 1: Dados los siguientes sistemas controlados: ] p d g d 1 X+d ± Figura 10.26: Sistema 1 ] p d g _y X+d ± Figura 10.27: Sistema 2 a) Determinar los valores de K1 y K2 para que el Sistema 1 tenga error nulo en r´gimen perma- e nente y una constante de tiempo de 0.1 segundos b) Determinar las constantes del PI, en el Sistema 2, para que la respuesta sea la misma que en el apartado anterior. La ecuaci´n de este controlador es: o 1 U (s) = Kp 1 + E(s) (10.25) Ti s Nota: Se recomienda cancelar el polo de la planta con el cero del PI, y ajustar la ganancia del sistema resultante. c) Al cabo de 10 segundos hay una perturbaci´n de tipo escal´n de amplitud 3. Determinar el o o error en r´gimen permanente para cada sistema. e Soluciones: 10 a) K2 = 9 y K1 = 9 123
  • 123. b) Ti = 1 y Kp = 10 c) Error de − 10 en el Sistema 1 y nulo en el Sistema 2. 3- Ejercicio 2: Sea el sistema de la figura: ]Bt „BjsIB„ _jst s p (X + E)(X + 1)  g X X1 − d ± Figura 10.28: Sistema de control a) Determinar la relaci´n que deben cumplir K y m, positivos, para que el sistema sea estable. o b) Elegir el valor de m que deja el sistema en lazo cerrado de segundo orden para cualquier K y a continuaci´n elegir el valor de K en la planta para obtener un comportamiento transitorio o adecuado en el sistema compensado, por el m´todo del lugar de las ra´ e ıces. Calcular los puntos de ruptura y cortes con el eje imaginario. c) Calcular el error en r´gimen permanente del sistema compensado del apartado b) para una e entrada rampa de pendiente unidad. Dibujar cualitativamente a mano alzada la entrada y la salida en el mismo eje de tiempos. d) Con el valor de m elegido en el apartado b) el bloque del controlador de la figura representa un PID, ¿cu´les son los valores est´ndar Kp , Ti y Td de dicho PID? a a Soluciones: 2m+1 a) K > m+2 b) m = 1 para anular un polo de la planta y K = 5 para dejar los dos polos en lazo cerrado sobre el unico cero, puntos de ruptura en −4.449 y 0.449, puntos de corte con en eje imaginario en ´ 1.414j y −1.414j para K = 1 c) ess = −0.1 para K = 5 d) Kp = 3, Ti = 1.5 segundos y Td = 0.33 segundos para m = 1.- Ejercicio 3: Dise˜ ar un controlador PI para el siguiente sistema indicando la funci´n de transfe- n o rencia del controlador. _y _jst s p −X g twXD X+d ± Figura 10.29: Sistema de control a) Usando el primer m´todo de Ziegler-Nichols. e b) Usando el segundo m´todo de Ziegler-Nichols. e- Ejercicio 4: El desplazamiento de una herramienta se controla mediante dos lazos de retroalimen- taci´n, uno de velocidad y otro de posici´n. La masa m vale 50 kg y el amortiguamiento b es de o o 10 Ns/m. B„LF _ _y _jst s …„ W ~„ W ~ … d 1 (d + d ) d d xX EX + K X ± ± Figura 10.30: Herramienta con doble lazo de control 1. Determinar el valor de T para que el cero del controlador PI anule al polo de la herramienta. 124
  • 124. 2. Usando el valor de T del apartado anterior determinar: a) La inecuaci´n que deben cumplir el resto de los par´metros del sistema para que el error o a de posici´n ante una entrada rampa de 10 cm/s sea menor que 1 mm. o b) La inecuaci´n que deben cumplir el resto de los par´metros del sistema para que el ancho o a de banda del lazo de control de velocidad sea mayor que 2 rad/s. c) La inecuaci´n que deben cumplir el resto de los par´metros del sistema para que el tiempo o a de establecimiento del control en posici´n sea menor que 2 d´cimas de segundo. o e d ) La inecuaci´n que deben cumplir el resto de los par´metros del sistema para que el amor- o a tiguamiento del sistema de control en posici´n sea menor que 1 y mayor que 0.5. o 3. El PI del lazo de control en velocidad, ¿anula el error ante entrada escal´n en la fuerza de o rozamiento de cualquier magnitud?- Ejercicio 5: Dibujar el diagrama de bloques correspondiente al siguiente controlador PID: t 1 dy(t) u(t) = Kp byref (t) − y(t) + [yref (τ ) − y(τ )]dτ − Td (10.26) Ti 0 dt 125
  • 125. 126
  • 126. Cap´ ıtulo 11Control en espacio de estado11.1. Introducci´n o El comportamiento de un sistema lineal de orden n se puede definir por medio de n ecuacionesdiferenciales de primer orden. Una forma matricial de expresar esas ecuaciones diferenciales es el llamadomodelo en espacio de estado, sistema (11.1), donde adem´s de las entradas u(t) y las salidas y(t) aparecen aun conjunto de variables x(t) que se denominan estados del sistema. x(t) = Ax(t) + Bu(t) ˙ ecuaci´n de estado o (11.1) y(t) = Cx(t) + Du(t) ecuaci´n de salida o Los sistemas lineales de coeficientes constantes poseen matrices A, B, C y D con elementos constantes.Habitualmente la matriz D es nula. En adelante se estudiar´n exclusivamente los sistemas single input asingle output, cuyas ecuaciones en espacio de estado son: x(t) = Ax(t) + bu(t) ˙ (11.2) y(t) = cT x(t) Por ejemplo, para un sistema de tercer orden las ecuaciones de estado y de salida son: ⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎡ ⎤ x1 (t) ˙ a11 a12 a13 x1 (t) b1 ⎣x2 (t)⎦ = ⎣a21 a22 a23 ⎦ ⎣x2 (t)⎦ + ⎣b2 ⎦ u(t) ˙ (11.3) x3 (t) ˙ a31 a32 a33 x3 (t) b3 ⎡ ⎤ x1 (t) y(t) = c1 c2 c3 ⎣x2 (t)⎦ (11.4) x3 (t) ` - d - r A X {x V Figura 11.1: Modelo en espacio de estado de un sistema El modelo en espacio de estado es muy util para obtener la respuesta temporal de un sistema de forma ´num´rica iterativa. La Fig. 11.1 muestra el diagrama de bloques del modelo. El unico inconveniente es e ´que no deja patente el orden de las multiplicaciones matriciales. Es posible trasladar la ecuaci´n (11.2) al dominio de Laplace, o sx(s) = Ax(s) + bu(s) (11.5) y(s) = cT x(s)y encontrar la expresi´n de la funci´n de transferencia del sistema: o o y(s) = cT (sI − A)−1 b (11.6) u(s) 127
  • 127. El paso de espacio de estado a funci´n de transferencia no siempre es posible. En cambio, el paso de ofunci´n de transferencia a espacio de estado siempre es posible y, adem´s, de infinitas maneras distintas. o a Con la misma limitaci´n que la enunciada para la funci´n de transferencia, se puede definir la ecuaci´n o o ocaracter´ ıstica como q(s) = det(sI − A) = 0, (11.7)donde se observa que la posici´n de los polos del sistema depende exclusivamente de la matriz del sistema oA.11.2. Tipos de variables de estado Un mismo sistema se puede modelizar de infinitas maneras en espacio de estado. El n´mero n de uestados puede variar para un mismo sistema dependiendo del modelo, pero conviene elegir el m´ ınimon´mero posible para que no existan estados redundantes. En sistemas lineales de coeficientes constantes, uel n´mero m´ u ınimo de estados coincide con el orden del sistema.11.2.1. Variables de fase Cuando los estados de un sistema lo forman una variable temporal y sus sucesivas derivadas, se diceque el sistema posee variables de fase. Las variables de fase de un sistema de tercer orden son: ⎡ ⎤ ⎡ ⎤ x1 (t) x1 (t) x(t) = ⎣x2 (t)⎦ = ⎣x1 (t)⎦ ˙ (11.8) x3 (t) x1 (t) ¨ Consid´rese un sistema de tercer orden con m´s polos que ceros1 : e a y(s) K(β2 s2 + β1 s + β0 ) = 3 (11.9) u(s) s + α2 s2 + α1 s + α0 Definiendo una variable intermedia x1 , la funci´n de transferencia se puede dividir la en dos partes: o y(s) x1 (s) K = (β2 s2 + β1 s + β0 ) 3 2+α s+α (11.10) x1 (s) u(s) s + α2 s 1 0 Con la primera parte, que recoge los ceros de la funci´n de transferencia, se puede deducir la ecuaci´n o ode salida: y(s) = β2 s2 + β1 s + β0 (11.11) x1 (s) y(s) = β2 s2 x1 (s) + β1 sx1 (s) + β0 x1 (s) (11.12) y(s) = β2 x3 (s) + β1 x2 (s) + β0 x1 (s) (11.13) Con la segunda parte, en la que aparecen s´lo los polos, se puede deducir una de las ecuaciones de oestado: x1 (s) K = 3 (11.14) u(s) s + α2 s2 + α1 s + α0 s3 x1 (s) + α2 s2 x1 (s) + α1 sx1 (s) + α0 x1 (s) = Ku(s) (11.15) sx3 (s) + α2 x3 (s) + α1 x2 (s) + α0 x1 (s) = Ku(s) (11.16) sx3 (s) = −α2 x3 (s) − α1 x2 (s) − α0 x1 (s) + Ku(s) (11.17) El modelo completo en espacio de estado usando variables de fase es: ⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎡ ⎤ x1 (t) ˙ 0 1 0 x1 (t) 0 ⎣x2 (t)⎦ = ⎣ 0 ˙ 0 1 ⎦ ⎣x2 (t)⎦ + ⎣ 0 ⎦ u(t) (11.18) x3 (t) ˙ −α0 −α1 −α2 x3 (t) K ⎡ ⎤ x1 (t) y(t) = β0 β1 β2 ⎣x2 (t)⎦ (11.19) x3 (t) 1 Todos los procesos f´ ısicos cumplen esta propiedad. En caso contrario, la matriz D de la ecuaci´n (11.1) no ser´ nula. Las o ıafunciones de transferencia que cumplen esta propiedad se llaman funciones estrictamente propias. Si tienen igual n´ mero ude polos que de ceros, entonces se les conoce simplemente como funciones propias. 128
  • 128. La ganancia K se puede trasladar a la ecuaci´n de salida sin que el m´todo pierda generalidad. La o eFig. 11.2 muestra el diagrama de bloques del sistema usando variables de fase. r #1 #d #( ` d ?n d ?1 d ?d  X X X ± 1 d ( Figura 11.2: Modelo en espacio de estado usando variables de fase Otra forma de usar las mismas variables de fase es: ⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎡ ⎤ x1 (t) ˙ −α2 1 0 x1 (t) Kβ2 ⎣x2 (t)⎦ = ⎣−α1 0 1⎦ ⎣x2 (t)⎦ + ⎣Kβ1 ⎦ u(t) ˙ (11.20) x3 (t) ˙ −α0 0 0 x3 (t) Kβ0 ⎡ ⎤ x1 (t) y(t) = 1 0 0 ⎣x2 (t)⎦ (11.21) x3 (t)11.2.2. Variables can´nicas o normales o Las variables can´nicas son adecuadas cuando la funci´n de transferencia del sistema se puede des- o ocomponer en fracciones simples. Por ejemplo, la funci´n de transferencia de un sistema de tercer orden ocon polos reales distintos es: y(s) d1 d2 d3 = + + (11.22) u(s) s + λ1 s + λ2 s + λ3 La ecuaci´n de salida se obtiene definiendo las variables can´nicas zi : o o u(s) u(s) u(s) y(s) = d1 + d2 + d3 (11.23) s + λ1 s + λ2 s + λ3 y(s) = d1 z1 (s) + d2 z2 (s) + d3 z3 (s) (11.24) Las ecuaciones de estado se obtienen de la propia definici´n de cada una de las variables can´nicas: o o u(s) zi (s) = (11.25) s + λi szi (s) = −λi zi (s) + u(s) (11.26) Por tanto, las ecuaciones de estado usando variables can´nicas queda: o ⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎡ ⎤ z1 (t) ˙ −λ1 0 0 z1 (t) 1 ⎣z2 (t)⎦ = ⎣ 0 ˙ −λ2 0 ⎦ ⎣z2 (t)⎦ + ⎣1⎦ u(t) (11.27) z3 (t) ˙ 0 0 −λ3 z3 (t) 1 ⎡ ⎤ z1 (t) y(t) = d1 d2 d3 ⎣z2 (t)⎦ (11.28) z3 (t) La Fig. 11.3 muestra un modelo de sistema usando variables can´nicas. Todos los estados est´n o adesacoplados. Este modo de representaci´n se asemeja a la t´cnica de programaci´n en paralelo para la o e osimulaci´n de funciones de transferencia. o La matriz A del sistema es diagonal y sus elementos −λi son los polos del sistema, como queda patenteobservando la ecuaci´n caracter´ o ıstica: n q(s) = det(sI − A) = (s + λi ) = 0, (11.29) i=1 129
  • 129. d Fd X Qd ± d ` d F1 r X Q1 ± 1 d Fn X Qn ± n Figura 11.3: Modelo en espacio de estado usando variables can´nicas o11.2.3. Variables f´ ısicas Es posible usar variables f´ ısicas del sistema en el modelo de espacio de estado. As´ por ejemplo, las ıecuaciones diferenciales que gobiernan un motor de corriente continua son: ⎧ ⎪ v(t) = Ri(t) + Li (t) + e(t) ⎪ ⎨ e(t) = Kθ (t) (11.30) ⎪ τ (t) = Ki(t) ⎪ ⎩ τ (t) = Jθ (t) + Bθ (t) En este ejemplo se sigue la notaci´n de Lagrange en lugar de la de Newton, es decir se ponen primas oen lugar de puntos para se˜alar las derivadas, para usar sin confusi´n la variable i(t). n o Tomando como variables de estado el ´ngulo θ(t) del motor, la velocidad de giro θ (t) y la intensidad ai(t), se puede construir el siguiente modelo: ⎡ ⎤ ⎡ ⎤⎡⎤ ⎡ ⎤ θ (t) 0 1 0 θ(t) 0 ⎣θ (t)⎦ = ⎣0 −BJ K ⎦⎣ J θ (t)⎦ + ⎣ 0 ⎦ v(t) (11.31) 1 i (t) 0 −KL −R i(t) L ⎡ L ⎤ θ(t) θ(t) = 1 0 0 ⎣θ (t)⎦ (11.32) i(t) La principal ventaja de usar variables f´ ısicas es que existen m´s probabilidades de poder medir los aestados del sistema por medio de sensores. A veces las variables f´ ısicas coinciden con las variables de fase o las can´nicas. Por ejemplo, un sistema omec´nico compuesto por una masa y un amortiguador se rige por la ecuaci´n diferencial: a o f (t) = m¨(t) + bx(t) x ˙ (11.33) Tomando como estados las variables f´ ısicas de posici´n x y velocidad x, se puede obtener como modelo o ˙f´ ısico del sistema en espacio de estado: x(t) ˙ 0 1 x(t) 0 = + 1 f (t) (11.34) x(t) ¨ 0 −mb x(t) ˙ m x(t) x(t) = 1 0 (11.35) x(t) ˙ Como la velocidad es la derivada de la posici´n, se puede obtener el mismo resultado considerando la orepresentaci´n con variables de fase. Tambi´n es posible comprobar que: o e s −1 sI − A = b (11.36) 0 s+ m 1 m x(s) 0 1 = cT (sI − A)−1 b = 1 0 s ms2 +bs m 1 = (11.37) f (s) 0 ms+b m ms2+ bs 130
  • 130. 11.3. Controlabilidad y observabilidad Para dise˜ar controladores en espacio de estado, primero hay que averiguar si el sistema es observable ny controlable. Se dice que un sistema es controlable si existe una entrada u capaz de variar el estado inicialx0 a cualquier otro estado deseado xt en un tiempo finito. Matem´ticamente, un sistema es controlable asi su matriz de controlabilidad Pc no es singular. La matriz de controlabilidad se define como Pc = b Ab A2 b ... An−1 b , (11.38)y el sistema es controlable si y s´lo si el det(Pc ) = 0. o Un sistema controlable es siempre estabilizable. Por otro lado, se dice que un sistema es observablesi cualquier estado x0 puede ser determinado mediante la salida del sistema y durante un tiempo finito.Matem´ticamente, un sistema es observable si su matriz de observabilidad Po no es singular. La matriz ade observabilidad se define como ⎡ ⎤ cT ⎢ cT A ⎥ ⎢ ⎥ Po = ⎢ cT A 2 ⎥ , ⎢ ⎥ (11.39) ⎣ ... ⎦ cT An−1y el sistema es observable si y s´lo si el det(Po ) = 0. Se puede demostrar que el paso de espacio de estado oa funci´n de transferencia s´lo es posible si el sistema es controlable y observable. o o El sistema con masa y amortiguador, que apareci´ anteriormente como ejemplo, es controlable y oobservable. Sus matrices de controlabilidad y observabilidad son: 1 0 0 1 0 m b= y Ab = = (11.40) 1 m 0 −mb 1 m − m2b 1 0 m Pc = (11.41) 1 m − m2b 0 1 cT = 1 0 y cT A = 1 0 = 0 1 (11.42) 0 −mb 1 0 Po = (11.43) 0 1 El sistema es controlable porque el det(Pc ) = − m2 = 0; y es observable porque el det(Po ) = 1 = 0. 111.4. Realimentaci´n completa de estados o Cuando son medibles todos los estados de un sistema, Fig. 11.4, se puede definir una realimentaci´n okT = [k1 k2 ... kn ] que asigna una ganancia a cada estado. El objetivo de obtener un comportamientoespec´ ıfico entre la referencia r y la salida y. Las ecuaciones del sistema controlado quedan de forma: x(t) = (A − bkT )x(t) + kr br(t) ˙ (11.44) y(t) = cT x(t) „ ` - d - r >„ A X {x ± V ,x Figura 11.4: Realimentaci´n completa de estados o La nueva ecuaci´n caracter´ o ıstica del sistema es qd (s) = det(sI − A + bkT ) = 0, (11.45)donde la posici´n de los polos del sistema controlado depende de la nueva matriz del sistema A − bkT . oLa ganancia kr no modifica la posici´n de los polos, y por tanto tampoco el r´gimen transitorio, pero s´ el o e ır´gimen permanente. Para poder colocar todos los polos del sistema controlado en posiciones arbitrarias, ela condici´n necesaria y suficiente que el sistema sea controlable. o 131
  • 131. 11.4.1. Asignaci´n de polos o El ajuste de las ganancias de realimentaci´n de estados se puede hacer de distintos modos. En este oapartado se realiza una asignaci´n de polos en lazo cerrado de acuerdo con unas especificaciones de dise˜o. o n Si en el ejemplo de la masa y amortiguador se desea una comportamiento cr´ ıticamente amortiguado yfrecuencia natural ωn rad/s, los dos polos del sistema compensado deben ser reales en s = −ωn . Usandovariables de fase, una matriz que cumplir´ este requerimiento es ıa 0 1 A − bkT = . (11.46) −ωn2 −2ωn Por tanto: 0 1 0 0 1 b − 1 k1 k2 = (11.47) 0 −m m −ωn2 −2ωn 0 1 0 1 = (11.48) − k1 m − b+k2 m −ωn2 −2ωn Las ganancias del vector de realimentaci´n kT deben tomar los valores k1 = mωn y k2 = 2mωn − b. o 2Este m´todo se podr´ hacer de forma sistem´tica en el caso de que b = [0 0 ... 1]T y conociendo los e ıa acoeficientes de la ecuaci´n caracter´ o ıstica del sistema sin compensar: q(s) = sn + an−1 sn−1 + an−2 sn−2 + ... + a2 s2 + a1 s + a0 = 0, (11.49)y los de la ecuaci´n caracter´ o ıstica del sistema compensado: qd (s) = sn + bn−1 sn−1 + bn−2 sn−2 + ... + b2 s2 + b1 s + b0 = 0. (11.50) En ese caso, el vector de realimentaci´n es: o kT = k1 k2 ... kn = b0 − a0 b1 − a1 ... bn−1 − an−1 (11.51)11.4.2. M´todo de Ackermann e Otro m´todo de asignaci´n de polos es usar la f´rmula de Ackermann [2]: e o o kT = k1 k2 ... kn = 0 0 ... 1 Pc −1 qd (A), (11.52)donde Pc es la matriz de controlabilidad y qd (A) = An + bn−1 An−1 + bn−2 An−2 + ... + b2 A2 + b1 A + b0 I. (11.53)11.4.3. Controlador optimo cuadr´tico ´ a Aunque las especificaciones de dise˜ o suelen referirse habitualmente en esta asignatura a determinados nreg´ımenes transitorios, y por tanto a localizaci´n de polos en lazo cerrado, a veces el objetivo del contro- olador es obtener una respuesta estable que minimice una funci´n de coste con m´ ltiples interpretaciones o uf´ ısicas (consumo de combustible, potencia de entrada, etc.). Para sistemas MIMO, la funci´n de coste se osuele expresar como: ∞ J= (xT Qx + uT Ru)dt (11.54) 0 En los sistemas SISO que nos ocupan en este manual, la funci´n de coste se reduce: o ∞ J= (xT Qx + ru2 )dt (11.55) 0 Como par´metro, la funci´n de coste consta de dos elementos: el primer sumando penaliza las desvia- a ociones de los estados con respecto a ciertos niveles que se consideren deseables, mientras que el segundosumando penaliza la energ´ de la se˜al de control. Evidentemente, dependiendo de los valores num´ricos ıa n ede Q y r, tendr´ m´s peso uno u otro sumando. a a El vector de realimentaci´n completa de estados kT que minimiza la funci´n de coste se conoce como o ocontrolador optimo del sistema o regulador lineal cuadr´tico (LQR). Su expresi´n es: ´ a o kT = r−1 bT P, (11.56)donde P es una matriz sim´trica real que proviene de resolver la ecuaci´n matricial de Riccati: e o AT P + PA − Pbr−1 bT P + Q = 0. (11.57) 132
  • 132. 11.5. Realimentaci´n parcial de estados o En muchas ocasiones no es posible medir todos los estados de un sistema. En lugar de los n estadosx, s´lo son accesibles m medidas z (con m < n), que ser´n combinaci´n lineal de los estados, o a o z = Ex, (11.58)donde la matriz E no es cuadrada, sino de orden m × n. „ ` - d - r >„ A X {x ± V 9 Px e d E z Figura 11.5: Realimentaci´n parcial de estados o La ley de control mediante realimentaci´n parcial de estados tiene la forma que se muestra en la oFig. 11.5. Ahora, el vector de realimentaci´n f T s´lo posee m ganancias: f1 , f2 , ..., fm . Por tanto, no o oes posible situar todos los polos del sistema controlado en posiciones arbitrarias y hay que buscar unasoluci´n de compromiso. La nueva ecuaci´n caracter´ o o ıstica del sistema es: qd (s) = det(sI − A + bf T E) = 0. (11.59)11.6. Observadores de estado La limitaci´n que posee la realimentaci´n parcial de estados, llev´ al desarrollo de herramientas o o omatem´ticas que estimaran de forma precisa todos los estados del sistema de cara a su posterior empleo aen una realimentaci´n completa de estados observados. Aunque estos observadores de estado pueden odesearse en s´ mismos para la monitorizaci´n del sistema. ı o En este apartado se describe el observador de estados que conoce la entrada u y la salida y del sistema.Dicho observador intenta anular el error que existe entre la salida real y la estimada mediante un lazo derealimentaci´n, Fig. 11.6. El sistema de ecuaciones que gobierna el observador es: o ˆ ˆx ˆ ˙ x = Aˆ + bu + l(y − y ) ˆ (11.60) y = cT x ˆ ˆ ` - d - r A X {x V j ± ˆ - ˆ - ˆ r ˆ A d {x X ˆ - ˆ V !AR‚„%sIB„ Figura 11.6: Observador de estados El lazo de realimentaci´n posee un vector l de ganancias proporcionales. Se define la variaci´n del o oerror de la estimaci´n como: o ˙ ˙ ˆ ˙ ˆ ˆx e = x − x = (b − b)u + Ax − Aˆ − l(y − y ) ˆ (11.61) ˆ ˆx T e = (b − b)u + Ax − Aˆ − lc (x − x) ˙ ˆ (11.62) 133
  • 133. ˆ ˆ Suponiendo A ≈ A y b ≈ b: e ≈ (A − lcT )(x − x) ˙ ˆ (11.63) T e ≈ (A − lc )e ˙ (11.64) El error tiende a cero si los valores propios de la matriz A − lcT tienen parte real negativa. Y dichoerror tender´ a cero de forma m´s o menos r´pida de acuerdo con la posici´n de los polos de la siguiente a a a oecuaci´n caracter´ o ıstica: qe (s) = det(sI − A + lcT ) = 0. (11.65) Ackermann propuso otra f´rmula para asignar los polos del observador: o T T l = l1 l2 ... ln = qe (A)Po −1 0 0 ... 1 , (11.66) Otros autores han propuesto diferentes formas de encontrar los valores para el vector l. Kalman [3][4] propone su valor optimo teniendo en cuenta la varianza del ruido en la medida de la actuaci´n u y la ´ osalida y. ˆ ˆx ˆ ˙ x = Aˆ + b(u + w) + l(y + v − y )ˆ (11.67) y = cT x ˆ ˆ La se˜ al w es el ruido que se solapa a la actuaci´n y v es el ruido que se solapa a la salida. Se supone n oque ambos ruidos est´n desacoplados y siguen distribuciones normales de media cero. El filtro Kalman ase usa a veces para estimar la derivada de la salida sin introducir una diferenciaci´n. o11.7. Realimentaci´n completa de estados observados o Los observadores se pueden usar para cerrar el lazo de control usando todos los estados aunques´lo se pueda medir la entrada u la salida y. La Fig. 11.7 muestra la estrategia de control. Dise˜ ando o nadecuadamente el observador, con las reglas que se han propuesto en el apartado anterior, se asegura queel controlador act´a pr´cticamente sobre los estados del sistema. u a Se puede aplicar el principio de superposici´n: dise˜ar el observador como si no existiera el controlador o ny el controlador como si actuara directamente sobre la planta. S´lo hay que tener cuidado de colocar los opolos del observador m´s r´pidos que los de la planta; por ejemplo 10 veces m´s r´pidos. a a a a „ ` - d - r >„ A X {x ± V j ± ˆ - ˆ - ˆ r ˆ A d {x X ˆ V !AR‚„%sIB„ ,x ]Bt „BjsIB„ Figura 11.7: Control mediante realimentaci´n completa de estados o Evidentemente, el comportamiento del sistema ser´ mejor si el controlador act´a directamente sobre a ulos estados del sistema, porque se pueden medir, que si act´ a sobre las estimaciones que calcula el uobservador.11.8. Ejercicios propuestos - Ejercicio 1: Un determinado sistema se comporta de acuerdo con la siguiente ecuaci´n diferencial: o y (t) − 0.03y(t) = 0.9u(t) ¨ (11.68) Donde la se˜al u(t) es la entrada y la se˜al y(t) es la salida del sistema. Se pide: n n 134
  • 134. a) Determinar el modelo en espacio de estado del sistema —matrices A, b y c— usando variables de fase. b) Calcular la matriz de controlabilidad Pc del sistema. ¿Es el sistema controlable? c) Calcular la matriz de observabilidad Po del sistema. ¿Es el sistema observable? d) Determinar —si es posible— la funci´n de transferencia del sistema. ¿Es estable el sistema? o e) Determinar el vector de ganancias k —utilizando la f´rmula de Ackermann— que se debe usar o en la realimentaci´n de estados, para que los polos del sistema controlado sean las ra´ de la o ıces ecuaci´n: o qd (s) = s2 + 6s + 18 (11.69)- Ejercicio 2: Un determinado sistema se comporta de acuerdo con la siguiente ecuaci´n diferencial: o x(t) + x(t) + y(t) = u(t) ˙ (11.70) y(t) + 2y(t) = 0 ˙ Donde los estados del sistema son y(t) y x(t), la se˜al u(t) es la entrada y la se˜al y(t) es la salida n n del sistema. Se pide: a) Determinar el modelo en espacio de estado del sistema, es decir, las matrices A, b y c. b) Calcular la matriz de controlabilidad Pc del sistema. ¿Es el sistema controlable? c) Calcular la matriz de observabilidad Po del sistema. ¿Es el sistema observable? d) Determinar —si es posible— la funci´n de transferencia del sistema. ¿Es estable el sistema? o e) Determinar el vector de ganancias k —utilizando la f´rmula de Ackermann— que se debe usar o en la realimentaci´n de estados, para que los polos del sistema controlado sean las ra´ de la o ıces ecuaci´n: o qd (s) = s2 + 6s + 18 (11.71)- Ejercicio 3: El movimiento de un sistema viene definido por la siguiente funci´n de transferencia: o 2 G(s) = (11.72) s(s + 1) Se pide: a) Escribir el modelo en espacio de estado, usando variables de fase. b) Dise˜ar un controlador por la f´rmula de Ackermann de tal forma que los polos del sistema n o controlado est´n en −2 ± 2j. e- Ejercicio 4: El comportamiento de un sistema viene definido por la siguiente funci´n de transfe- o rencia: 2 G(s) = (11.73) (s + 1)(s + 2) Se pide: a) Escribir el modelo en espacio de estado, usando variables can´nicas. o b) Dise˜ar un controlador de realimentaci´n completa de estados usando la f´rmula de Ackermann n o o de forma que los polos del sistema controlado est´n en −3 ± 3j. e 135
  • 135. 136
  • 136. Parte IIControl de sistemas muestreados 137
  • 137. Cap´ ıtulo 12Introducci´n o En la Parte I de estos apuntes se han descrito las herramientas cl´sicas de control para sistemas acontinuos en el tiempo. Todas ellas se pueden aplicar directamente, por ejemplo, en el dise˜o de circuitos nanal´gicos que gobiernan cualquier tipo de sistema f´ o ısico. Sin embargo, la aparici´n de los microprocesa- odores supuso una aut´ntica revoluci´n en el mundo de la ingenier´ de control. Con su uso, el ingeniero e o ıaes capaz de ajustar o cambiar la ley de control de mucha mucho m´s r´pida. Adem´s, la potencia c´lculo a a a ade estos dispositivos ha permitido desarrollar nuevas estrategias de control. La unica dificultad que plantea el uso de microprocesadores es que es necesario trasladar todos los ´conceptos cl´sicos de control a un nuevo escenario en el que las se˜ ales no son conocidas en todo instante a nde tiempo. A este tipo de sistemas se les llamar´ sistemas de tiempo discreto. a El presente libro de texto describe las herramientas b´sicas para el control de sistemas discretos en el atiempo. Se introducir´ el concepto de muestreo y la herramienta matem´tica que se usar´ para manejar a a alas se˜ ales muestreadas es la transformada Z. n12.1. Ejemplo de implementaci´n anal´gica o o Sea el sistema de control de la Fig. 12.1, en el que el controlador es un compensador de adelanto-retraso de fase. Si las se˜ ales de error y actuaci´n son se˜ales el´ctricas, el ingeniero puede implementar n o n ef´ ısicamente el circuito de la Fig. 12.2 para introducir su ley de control. Para ajustar los par´metros del acontrolador a los deseados, debe sintonizar se forma adecuada los potenci´metros del circuito. o ]Bt „Bj _jst s p o J g t t ± Figura 12.1: Sistema de control g1 gd p1 o p; pd J pn Figura 12.2: Circuito anal´gico para un compensador de adelanto o Los potenci´metros del circuito permiten al ingeniero modificar, dentro de unos l´ o ımites, la ley delcompensador. Sin embargo, si el ingeniero desea probar otro tipo de compensador, tendr´ que soldar un anuevo circuito. Esta forma de dise˜ar controladores anal´gicos no es muy r´pida y suele ser bastante n o atediosa. 139
  • 138. 12.2. Ejemplo de implementaci´n digital o En la Fig. 12.3 se muestra la alternativa digital para el mismo problema. El controlador se sustituyeen este caso por un microprocesador que es capaz de adquirir la magnitud del error por los puertos deentrada (generalmente son convertidores A/D, pero tambi´n pueden ser contadores de pulsos, de encoder, eetc.) y puede comandar la actuaci´n en la planta a trav´s de los puertos de salida (convertidores D/A). o e o J h Figura 12.3: Microprocesador que controla el sistema La operaci´n del microprocesador est´ gobernada por un reloj interno (aunque algunos microproce- o asadores lo tienen externo), que marca los instantes en los que se ejecutan las sentencias del programa quepuede introducir el ingeniero (de nuevo este programa puede estar almacenado en una memoria internao externa). El reloj es quien se˜ala tambi´n con qu´ frecuencia se produce la lectura de los convertidores n e eA/D y el comando de las salidas D/A. Si el ingeniero tiene implementado un determinado programa de control y desea cambiar el algoritmo,s´lo debe modificar unas l´ o ıneas de c´digo y volverlo a compilar. No es necesario que cambie el hardware oni las conexiones. Esto hace que, a la hora del dise˜o, el control digital sea mucho m´s vers´til que el n a aanal´gico. o El ejemplo sirve tambi´n para plantearse la siguiente pregunta: ¿qu´ datos puede usar el ingeniero e een su programa para calcular la salida o actuaci´n del controlador? Evidentemente en cada instante que omarque el reloj puede usar la lectura actual de la entrada. Tambi´n puede disponer de las entradas y las esalidas en instantes anteriores, si ha tenido el cuidado de almacenarlas en variables. Nunca podr´ usar avalores futuros de esas se˜ales. Y como la memoria del dispositivo es finita, tampoco podr´ disponer de n ainfinitos valores de entrada y salida anteriores en el tiempo. Tendr´ que decidir si guarda dos, tres, diez, avalores pasados... pero no puede disponer de un “hist´rico infinito”. Por tanto, el valor de la salida (es odecir, la actuaci´n del controlador) en cada instante ser´ una combinaci´n de un n´mero finito de valores, o a o uque corresponder´n a entradas actuales o anteriores en el tiempo, y salidas anteriores en el tiempo. a ¿Es posible con esa informaci´n controlar el sistema de la misma manera que se hac´ con el circuito o ıaanterior? Y en el caso de que sea posible, ¿cu´l es la combinaci´n matem´tica de todos esos valores para se a o acontrole de forma equivalente el sistema? Evidentemente la respuesta a la primera pregunta depender´ deala frecuencia del reloj que gobierna el controlador. No se puede esperar que un microprocesador sea capazde controlar el movimiento de un cabezal del disco duro, si el reloj del mismo ordena la ejecuci´n del oprograma cada minuto. Pero para controlar la temperatura del interior de un edificio s´ puede ser suficiente ıcon esa frecuencia... Se ve c´mo la frecuencia de ejecuci´n del programa de control es una decisi´n clave o o odel ingeniero. En esta asignatura se dar´n las herramientas necesarias para controlar los sistemas de estas acaracter´ ısticas.12.3. Concepto de muestreo Una se˜ al continua en el tiempo se encuentra muestreada por un observador exterior cuando ´ste n econoce s´lo informaci´n de dicha se˜al en determinados momentos de tiempo. En la Fig. 12.4 a) se o o nrepresenta una se˜al continua, mientras que en Fig. 12.4 b) se ha representado esa misma se˜al muestreada n na intervalos. Las se˜ ales pueden ser muestreadas de muy diversas maneras. Lo m´s habitual ser´ que el observador n a aexterior posea informaci´n puntual de la se˜al continua a intervalos regulares de tiempo. A la duraci´n o n ode esos intervalos se le llama periodo de muestreo y se designar´ con la variable Ts o simplemente T . Para ala frecuencia de muestreo se usar´ fs (en Hz) o bien ωs (en rad/s). a El periodo de muestreo va a ser crucial en esta asignatura. El comportamiento de los sistemas cambiacon dicho periodo de muestreo. De hecho, un mismo sistema puede ser estable o no, dependiendo dequ´ periodo de muestreo se haya elegido. e 140
  • 139. Ww0D W ~w0D ( 0 0 sD AD Figura 12.4: Funci´n continua (a) y muestreada (b) o12.4. Concepto de cuantizaci´n o Los sistemas de medici´n que llevan incorporados los microprocesadores (convertidores A/D, con- otadores de pulsos, etc.) conllevan intr´ınsecamente la cuantizaci´n de la se˜al. Es decir, no se pueden o nconocer infinitos decimales de la se˜ al f´ n ısica que se pretende medir. En alg´n momento se debe truncar ula magnitud medida. El momento en que se produce el truncamiento determina la resoluci´n del sistema osensor. Por ejemplo, si se desea medir el voltaje de una se˜ al el´ctrica con un convertidor de 14 bits, la n eresoluci´n que se obtiene cuando el fondo de escala es de −10 a +10 V, es 1.22 mV. Cambios en la otensi´n por debajo de este umbral no ser´n detectables por el sistema. Consecuencia de la cuantizaci´n o a oes que la se˜ al medida ya no es continua en el tiempo. Es continua a intervalos y “escalonada”. n Ww0D WRw0D ( ( 0 0 sD AD Figura 12.5: Funci´n continua (a) y cuantizada (b) o Aunque el fen´meno de la cuantizaci´n puede ser cr´ o o ıtico en determinadas circunstancias, lo habituales que se pueda despreciar. Es decir, si el controlador dise˜ado es robusto y consigue que el sistema siga nla referencia a pesar la existencia del ruido o las perturbaciones, mantendr´ esa caracter´ a ıstica a pesar dela existencia de la cuantizaci´n. De hecho, en muchos manuales, la cuantizaci´n se estudia como un ruido o oaleatorio que se suma a la se˜ al original. n12.5. Clasificaci´n de los sistemas o Una vez introducidos los conceptos de muestreo y cuantizaci´n, es posible clasificar los sistemas en: o - Sistemas continuos. Son aquellos en los que s´lo intervienen se˜ales continuas en el tiempo. o n - Sistemas muestreados o discretos en el tiempo. Son aquellos en los que existe al menos un proceso de muestreo en alguna de las se˜ ales que intervienen en el mismo. n 141
  • 140. - Sistemas cuantizados. Son aquellos en los que existe al menos un proceso de cuantizaci´n de o alguna de las se˜ales que intervienen en el mismo. n - Sistemas digitales. Son aquellos en los que existe a la vez al menos un proceso de muestreo y cuantizaci´n de alguna de las se˜ales que intervienen en el mismo. o n Evidentemente, un sistema se puede dividir en partes que posean distintas caracter´ ısticas. As´ en un ı,sistema muestreado se puede definir un subsistema que sea estrictamente continuo. Y lo mismo puededecirse de los sistemas digitales y cuantizados. Hay que advertir que los adjetivos “muestreado”, “discreto” y “digital” se suelen usar como sin´nimos. oEsto se debe al hecho antes citado de que el fen´meno de la cuantizaci´n se pueda despreciar en la mayor´ o o ıade los casos. 142
  • 141. Cap´ ıtulo 13Tratamiento matem´tico de la se˜al a nmuestreada En este cap´ ıtulo se presenta el tratamiento matem´tico que se dar´ a la se˜ al muestreada en el a a ndominio temporal y, mucho m´s importante, cu´l es su transformada de Fourier. Todo lo que se diga de a ala transformada de Fourier se podr´ trasladar m´s adelante a la transformada de Laplace. a a13.1. Definici´n de muestreo peri´dico o o Sea f (t) una funci´n continua en el tiempo. De dicha funci´n, Fig. 13.1 a), un observador s´lo conoce o o osu evoluci´n en peque˜os intervalos de duraci´n a cada cierto tiempo T , con a < T , como se muestra en o n ola Fig. 13.1 b). Ww0D W ~w0D y ( 0 x 0 sD AD Figura 13.1: Funci´n continua (a) y muestreada (b) o13.1.1. Funci´n portadora o El resultado final se puede considerar como resultado de multiplicar la funci´n original f (t) por otra ofunci´n p(t) que se define como se muestra en la Fig. 13.2. As´ pues, desde un punto de vista matem´tico el o ı amuestreo de una funci´n consiste simplemente en un producto de funciones. A semejanza de un modulador, of (t) ser´ la se˜ al moduladora y p(t) la se˜ al portadora. ıa n n Dado que p(t) es una funci´n peri´dica se puede definir de dos maneras. En la primera (13.1) se dan o olos valores de la funci´n dentro de su periodo, mientras que la segunda (13.2) es su desarrollo en serie de oFourier. 1 si 0 ≤ t < a p(t) = (13.1) 0 si a ≤ t < T ∞ p(t) = cn ejnωs t (13.2) n=−∞ 143
  • 142. €w0D y d 0 ( x Figura 13.2: Funci´n peri´dica que produce el muestreo o o Es posible calcular el valor de los coeficientes de Fourier para la funci´n p(t) elegida: o 1 T 1 a 1 1 − e−jnωs a cn = p(t)e−jnωs t dt = e−jnωs t dt = [e−jnωs t ]a = 0 (13.3) T 0 T 0 jnωs T jnωs T Para ver qu´ valores van tomando los distintos coeficientes en funci´n de n, es interesante modificar e oconvenientemente la expresi´n (13.3). Operando con n´meros complejos, se sabe que: o u 2j sin α = ejα (1 − e−2jα ) (13.4) Por tanto se puede afirmar que: 2j sin nωs a nωs a nωs a 1 − e−jnωs a = 2 nωs a = 2je−j 2 sin (13.5) ej 2 2 Y la expresi´n de los coeficientes de Fourier queda as´ o ı: 1 nωs a nωs a a sin nωs a −j nωs a cn = 2je−j 2 sin = 2 e 2 (13.6) jnωs T 2 T nωs a 2 A la funci´n seno de un angulo dividido por el mismo angulo se le llama funci´n sinus cardinalis o ´ ´ o(abreviado “sinc”) o funci´n de interpolaci´n: o o sin α = sinc α (13.7) α La representaci´n de dicha funci´n, dependiendo de la variable, es: o o 1 0.8 0.6 0.4 sinc α 0.2 0 −0.2 −0.4 −10 π −8 π −6 π −4 π 0−2π 2π 4π 6π 8π 10π α Figura 13.3: Funci´n sinus cardinalis o En definitiva, los coeficientes de Fourier de la funci´n p(t) son n´meros complejos cuyo m´dulo y o u oargumento se pueden obtener f´cilmente de la expresi´n (13.6). Usando otra notaci´n habitual para los a o on´meros complejos, ecuaci´n (13.8), se advierte que el argumento da saltos finitos de 180◦ cada vez que u ola funci´n sinus cardinalis cambia de signo. o a nωs a nωs a cn = e−j 2 sinc (13.8) T 2 En la Fig. 13.4 se se˜alan con c´ n ırculos los valores de m´dulo y argumento que van tomando de los ocoeficientes cn de Fourier. 144
  • 143. a |c0 | T a T| sinc ωa | |c−1 | |c1 | 2 0.8a T |cn | 0.6a T 0.4a T |c−2 | |c2 | 0.2a T 0 − 6π − 4a π − 2π −ωs 0 ωs 2π a 4π a 6π a a a π rad c−2 − ωa sinc ωa 2 2 π cn 2 rad c−1 c0 0 c1− π rad 2 c2−π rad − 6π a − 4a π − 2π a 0 2π a 4π a 6π a α Figura 13.4: M´dulo y argumento de los coeficientes de Fourier cn de la funci´n portadora o o13.1.2. Funci´n temporal muestreada o Mediante la funci´n peri´dica p(t) definida en el apartado anterior, se puede dar una expresi´n ma- o o otem´tica para la funci´n temporal muestreada: a o ∞ ∞ f ∗ (t) = f (t)p(t) = f (t) cn ejnωs t = cn f (t)ejnωs t (13.9) n=−∞ n=−∞ Siempre se usar´ el s´ a ımbolo asterisco para denotar la funci´n resultante despu´s del muestreo. La o eexpresi´n (13.9) ser´ de mucha utilidad para calcular en el siguiente apartado su transformada de Fourier. o a13.2. Transformada de Fourier de la funci´n muestreada o Por definici´n, la transformada de Fourier de una funci´n es: o o ∞ F (ω) = F [f (t)] = f (t)e−jωt dt (13.10) −∞ Es una funci´n compleja de variable real que ofrece informaci´n del contenido en frecuencia de la o ofunci´n original f (t). Si la variable t tiene unidades de segundos, la variable ω tiene unidades de rad/s. oLas dos variables reales, t y ω, se extienden desde −∞ a ∞. La propiedad de traslaci´n de la transformada de Fourier dice que: o F f (t)ejω1 t = F (ω − ω1 ) (13.11) Por tanto, la transformada de Fourier de la funci´n muestreada es: o ∞ ∞ F ∗ (ω) = F [f ∗ (t)] = F cn f (t)ejnωs t = cn F (ω − nωs ) (13.12) n=−∞ n=−∞ Es decir, la transformada de Fourier de una funci´n muestreada es igual a una suma con infinitos osumandos, y cada sumando es una copia de la transformada de Fourier de la funci´n original trasladada oen frecuencia (un m´ltiplo de la frecuencia de muestreo) y ponderada por el coeficiente cn . u 145
  • 144. Es interesante hacer notar que este resultado es independiente del tipo o la forma de muestreo que sehaya llevado a cabo. En otras palabras, la forma de la funci´n portadora p(t) s´lo influye en los coeficientes o ocomplejos cn .13.3. El problema del aliasing13.3.1. Teorema de Shannon El fen´meno del aliasing es uno de los conceptos m´s importantes de la asignatura. Una forma o ade entender qu´ es el aliasing consiste en intentar dibujar la transformada de Fourier de una funci´n e omuestreada, cuya expresi´n se ha obtenido en el apartado anterior. o Para mayor simplicidad, se intentar´ dibujar s´lo el m´dulo de la transformada de Fourier (recu´rdese a o o eque es un n´mero complejo) y adem´s se supondr´ que la funci´n original f (t) tiene ancho de banda limi- u a a otado, es decir, su transformada de Fourier tomar´ valores nulos a partir de una determinada frecuencia m aque se˜ ala el m´ximo contenido en frecuencia de la se˜al f (t). En la Fig. 13.5 se muestra cualitativamente n a nc´mo podr´ representarse el m´dulo de la transformada de Fourier de la se˜al, aunque podr´ adoptar o ıa o n ıacualquier otra forma mientras sea nula fuera del intervalo −ωm < ω < ωm . /B w D/ u E E Figura 13.5: Transformada de Fourier de una funci´n con ancho de banda limitado o v /B w D/ x /udB w u XD/ /dB w L XD/ /u1B w u 1 XD/ /dBw L 1 XD/ u1 X u X u E E X 1 X Figura 13.6: Transformada de Fourier de la funci´n muestreada o En la Fig. 13.6 se muestra la forma que adopta la suma de la ecuaci´n (13.12) que origina la trans- oformada de Fourier de la funci´n muestreada. Cada sumando es una r´plica escalada de la se˜ al original o e ntrasladada en frecuencia. La condici´n para que no se produzca solapamiento entre los sumandos es: o ωs > 2ωm (13.13) Y esta condici´n es independiente de valores tomen los coeficientes cn , por tanto es tambi´n indepen- o ediente del tipo de muestreo que se haya efectuado. Esta condici´n general es el teorema de Shannon del omuestreo (1948). Cuando no se cumple el teorema de Shannon, existe solapamiento en los sumandos yaparece el fen´meno del aliasing. En la Fig. 13.7 se muestra la forma de la transformada de Fourier de la ose˜ al muestreada cuando existe aliasing. n /B ~w D/ u1 X u X u E E X 1 X Figura 13.7: Transformada de Fourier de la funci´n muestreada con aliasing o 146
  • 145. 13.3.2. Aliasing y reconstrucci´n de la se˜ al original o n Comparando la Fig. 13.6 con la Fig. 13.7 es posible observar la ventaja que supone para el ingenieroque no exista aliasing. Cuando no hay aliasing el ingeniero podr´ se capaz de obtener la se˜ al original ıa nno muestreada a partir de la muestreada. Bastar´ que fuera capar de aislar el sumando no trasladado en ıafrecuencia entre −ωN y ωN con un filtro pasa-baja y deshacer el escalado del coeficiente c0 . As´ hallar´ ı ıala transformada de Fourier de la se˜al continua en el tiempo y podr´ encontrar su expresi´n exacta en n ıa oel dominio del tiempo. En cambio, si existe aliasing, no es posible obtener la transformada de Fourier de la se˜al original. El nsolapamiento de los sumandos, hace imposible este paso. Ahora se puede entender mejor porqu´ en el apartado anterior se hizo el an´lisis para el caso de que e ala funci´n continua tuviera ancho de banda limitado. Si el contenido en frecuencia de la se˜al continua o nno est´ limitado, siempre existir´ aliasing por muy r´pido que se realice el muestreo. En otras palabras, a a ahabr´ informaci´n de alta frecuencia de la se˜al original que se perder´ y no ser´ posible reconstruir a o n a adicha se˜ al a partir de la funci´n muestreada. En cambio, si el ancho de banda es limitado, es posible n omuestrear r´pidamente la se˜ al sin perder informaci´n. a n o Ww0D W ~w0D ux nx ;x 0 x 1x xx Figura 13.8: Se˜al continua y muestreada que no cumple el teorema de Shannon n En la Fig. 13.8 se muestra un ejemplo de muestreo de una se˜al a una frecuencia inferior al umbral nque marca el teorema de Shannon. Con s´lo la informaci´n de la se˜al muestreada, Fig. 13.9, no es posible o o nllegar a la se˜ al original. n W ~w0D ux nx ;x 0 x 1x xx Figura 13.9: Se˜al muestreada n En m´s, la se˜ al sinusoidal que se podr´ sugerir para como la original podr´ ser err´nea, como la a n ıa ıa oque se presenta en la Fig. 13.10. Por tanto, muestrear por debajo del umbral que marca el teorema de Shannon, no s´lo implica que ose pierda informaci´n del contenido en alta frecuencia; tambi´n implica que las se˜ales de alta frecuencia o e npueden ser observadas con una frecuencia inferior a la que realmente tienen. En eso consiste en la pr´ctica ael solapamiento de los sumandos en frecuencia. Por ultimo cabr´ preguntarse si tiene sentido suponer que las se˜ales continuas que se van a estudiar ´ ıa ntienen ancho de banda limitado o no. Para conocerlo y asegurar que no se va a producir aliasing, habr´ ıaque calcular la transformada de Fourier de la se˜al, o una herramienta an´loga como es el espectro n a 147
  • 146. W ~w0D Wdw0D ux nx ;x 0 x 1x xx Figura 13.10: Se˜al muestreada y continua que no corresponde a la original nde frecuencia. En sistemas mec´nicos es muy corriente suponer que su respuesta en posici´n ante una a oentrada fuerza tiene esta caracter´ ıstica. En cualquier caso, llega un momento en que la respuesta de altafrecuencia posee una amplitud tan peque˜a que est´ por debajo de la resoluci´n del sensor de medida y, n a opor lo menos a partir de ese momento su respuesta se puede suponer nula.13.3.3. Aliasing y ruido en la medida de la se˜al n Un problema a la hora de tratar las se˜ales muestreadas es el ruido que se puede introducir en la nlectura del sensor de medida. Ese ruido se puede malinterpretar como presente en la funci´n continua ooriginal y podr´ ser causante de aliasing si se intenta llevar a cabo una reconstrucci´n de la misma. ıa o /B w D/ R‚tsj K „Z$IB u E E Figura 13.11: Se˜al de ancho de banda limitado y ruido de alta frecuencia n En la Fig. 13.11 se muestra la transformada de Fourier de una se˜al continua con ancho de banda nlimitado y ruido de alta frecuencia. En la Fig. 13.12 se muestra el aliasing que se puede producir debidoal ruido. /B ~w D/ u1 X u X u E E X 1 X Figura 13.12: Aliasing producido por el ruido Por este motivo, muchos sensores llevan incorporado un filtro de ruido que se suele denominar comofiltro anti-aliasing. Y, si no los lleva, el ingeniero debe filtrar convenientemente la se˜al medida para nprevenir este problema. 148
  • 147. Cap´ ıtulo 14El muestreo ideal En este cap´ ıtulo se introduce el concepto de muestreo ideal. Aunque muchas de las conclusiones quese obtuvieron en el cap´ıtulo anterior son independientes del tipo de muestreo que se aplique, la realidades que los convertidores A/D no graban la se˜ al original en un intervalo de tiempo a, sino que conocen nun valor puntual de la funci´n. Por tanto, habr´ que definir una nueva funci´n portadora que tome s´lo o a o ovalores puntuales de la funci´n continua. o14.1. Definici´n de muestreo ideal o14.1.1. Funci´n portadora o El muestreo ideal se consigue cuando se multiplica la funci´n continua f (t) con la funci´n portadora o op(t) que se define como: T ∞ si t = 0 2 p(t) = con p(t)dt = 1 (14.1) 0 si 0 < t < T −T 2 ∞ p(t) = δ(t + nT ) (14.2) n=−∞ €w0D x d 0 ( Figura 14.1: Funci´n portadora para el muestreo ideal o Como se observa en la Fig. 14.1, la funci´n portadora es una secuencia o tren de impulsos unidad que ose extiende a lo largo del tiempo, desde −∞ hasta ∞, separados cada T segundos. Como la nueva funci´n oportadora p(t) sigue siendo peri´dica, es posible expresarla tambi´n mediante una serie de Fourier con o ecoeficientes: T 1 2 1 cn = p(t)e−jnωs t dt = (14.3) T −T 2 T Se obtiene que todos los coeficientes son iguales y reales. Por tanto: ∞ ∞ 1 p(t) = cn e−jnωs t = e−jnωs t (14.4) n=−∞ T n=−∞ Las expresiones (14.2) y (14.4) son completamente equivalentes y se usar´ una u otra indistintamente adependiendo de cu´l ofrezca mayores ventajas. a 149
  • 148. 14.1.2. Funci´n temporal muestreada o Con las dos expresiones equivalentes de la funci´n peri´dica p(t) definida en el apartado anterior, se o opueden hallar otras dos para la funci´n temporal de muestreada: o ∞ ∞ f ∗ (t) = f (t)p(t) = f (t) δ(t + nT ) = f (nT )δ(t + nT ) (14.5) n=−∞ n=−∞ ∞ ∞ 1 1 f ∗ (t) = f (t)p(t) = f (t) e−jnωs t = f (t)e−jnωs t (14.6) T n=−∞ T n=−∞ Tambi´n estas expresiones son equivalentes, aunque queda m´s patente en la ecuaci´n (14.5) que en e a ola funci´n muestreada s´lo se conocen los valores de la funci´n original en cada periodo de muestreo. La o o ofunci´n muestreada es una sucesi´n de impulsos, que se extienden en el tiempo desde −∞ hasta ∞, y el o oarea encerrada por cada uno de ellos es igual al valor de la funci´n original en ese instante.´ o W ~w0D 0 Figura 14.2: Funci´n muestreada de forma ideal o14.2. Transformada de Fourier de la funci´n muestreada o Para calcular la transformada de Fourier de la funci´n muestreada a partir de la ecuaci´n (14.5), hay o oque recordar previamente que la transformada de Fourier del impulso unidad en el origen de tiempos, esla unidad: F [δ(t)] = 1 (14.7) La propiedad de traslaci´n en el tiempo de la transformada de Fourier dice que: o F [f (t + t1 )] = e−jωt1 F [f (t)] (14.8) Conociendo estas propiedades, es posible calcular la transformada de Fourier de la funci´n muestreada, oque se denotar´ como F ∗ (ω) = F [f ∗ (t)], de la siguiente forma: a ∞ ∞ ∞ F ∗ (ω) = F f (nT )δ(t + nT ) = f (nT )F [δ(t + nT )] = f (nT )e−jωnT (14.9) n=−∞ n=−∞ n=−∞ Tambi´n se puede obtener una transformada de Fourier completamente equivalente a partir de la eecuaci´n (13.12) de forma m´s inmediata: o a ∞ ∞ 1 F ∗ (ω) = cn F (ω − nωs ) = F (ω − nωs ) (14.10) n=−∞ T n=−∞ De nuevo las expresiones (14.9) y (14.10) son completamente equivalentes. Es interesante hacer notarque en el caso del muestreo ideal todos los “alias” son exactamente iguales a la transformada de Fourieroriginal, s´lo que se encuentran multiplicados por una misma constante, Fig. 14.3. Tambi´n en el caso de o emuestreo ideal se debe cumplir el teorema de Shannon para que se pueda reconstruir la se˜al original a npartir de la muestreada. A partir de ahora, mientras no se especifique la contrario, se entender´ siempre que se hable de amuestreo que se trata del muestreo ideal. 150
  • 149. d d d d d v /B w u 1 XD/ x v /B w u x XD/ v /B w D/ x v /B w L x XD/ v /B w L 1 XD/ x u1 X u X u E E X 1 X Figura 14.3: Transformada de Fourier de la se˜al muestreada n14.3. Transformada de Laplace de la funci´n muestreada o Con la transformada de Fourier se pudo relacionar el m´ximo contenido en frecuencia de una se˜al con a nel periodo de muestreo adecuado para dicha se˜al, de cara a su posterior reconstrucci´n, por medio del n oteorema de Shannon. Sin embargo, la herramienta matem´tica que m´s se emplea en esta asignatura es a ala transformada de Laplace. En este apartado se estudia si es posible obtener la transformada de Laplacede una se˜al muestreada. n Aplicando la definici´n y propiedades de la transformada de Laplace que se contienen en el Cap´ o ıtulo 2a una funci´n muestreada: o ∞ ∞ ∞ F ∗ (s) = L f (nT )δ(t + nT ) = f (nT )L [δ(t + nT )] = f (nT )e−snT (14.11) n=−∞ n=−∞ n=0 Se obtiene un sumatorio donde no aparecen valores de n negativos. La raz´n es que los impulsos oque se encuentran en la zona de “tiempos negativos” tienen transformada de Laplace nula. Es f´cil arecordar la expresi´n (14.11) ya que cada valor muestreado de la funci´n temporal va multiplicado por o ouna exponencial que define precisamente el momento en que ha sido muestreado, o mejor a´n, el retraso ude tiempo que se debe esperar hasta que se d´ dicho valor en la funci´n. e o14.3.1. Forma cerrada y regi´n de convergencia o En el siguiente ejemplo, se muestra la transformada de Laplace de un escal´n unidad muestreado, oFig. 14.4: ∞ U ∗ (s) = L [u∗ (t)] = e−snT = 1 + e−sT + e−s2T + e−s3T + ... (14.12) n=0 ` ~w0D d 0 ( x 1x nx ;x xx Figura 14.4: Escal´n unidad muestreado o Resulta una suma de infinitos t´rminos, bastante m´s dif´ de manejar que su equivalente para la e a ıcilfunci´n no muestreada. Sin embargo, si se cumplen ciertas condiciones es posible encontrar una forma om´s compacta para la expresi´n de la transformada de Laplace de la funci´n muestreada. En concreto, a o oen el ejemplo anterior: 1 U ∗ (s) = 1 + e−sT + e−s2T + e−s3T + ... = si |e−sT | < 1 (14.13) 1 − e−sT El sumatorio de esta serie geom´trica converge si la raz´n de dicha serie es menor que la unidad. La e ocondici´n de convergencia de la forma cerrada es llamada habitualmente con la abreviatura ROC (del oingl´s region of convergence) y en algunos casos puede llegar a tener importancia. Sin embargo, en esta easignatura las regiones de convergencia no suelen tener especial inter´s. e 151
  • 150. 14.3.2. Forma alternativa para la transformada de Laplace Se puede dar una expresi´n equivalente de la transformada de Laplace usando de la funci´n muestreada o ocomo serie de Fourier: ∞ ∞ 1 1 F ∗ (s) = L [f ∗ (t)] = F f (t)ejnωs t = F (s − jnωs ) (14.14) T n=−∞ T n=−∞ Esta expresi´n es equivalente a la ecuaci´n (14.11). Hay que advertir que ahora el sumatorio se extiende o odesde −∞ hasta ∞. Aqu´ no ocurre que se puedan despreciar los sumandos para valores de n negativos, ıdebido a que esta suma se extiende en el dominio de Laplace. Esto suele generar no pocas confusiones,por lo que se recomienda un estudio riguroso de las dos formas de la transformada de Laplace.14.3.3. Periodicidad de la transformada de Laplace Una propiedad muy importante de la transformada de Laplace de la funci´n muestreada es que es ouna funci´n compleja y peri´dica con periodo jωs . Como por lo general los alumnos est´n acostumbrados o o aa funciones peri´dicas reales con periodos reales, se va a mostrar a continuaci´n porqu´ la transformada o o ede Laplace es una funci´n compleja peri´dica y que su periodo es el n´mero complejo imaginario puro o o uque se ha citado anteriormente: f (t) es peri´dica de periodo T si f (t + mT ) = f (t) ∀m o F ∗ (s) es peri´dica de periodo jωs si F ∗ (s + mjωs ) = F ∗ (s) ∀m o ∞ ∞ F ∗ (s + mjωs ) = f (nT )e−(s+mjωs )nT = f (nT )e−snT e−jmn2π = F ∗ (s) (14.15) n=0 n=0 −jmn2π El t´rmino exponencial e e es un “giro” m´ltiplo entero de 2π rad del n´mero complejo previo, u upor lo que no lo modifica. Hay que advertir que la funci´n muestreada es peri´dica en el dominio de o oLaplace, es decir, su transformada de Laplace. Evidentemente la propia funci´n muestreada no es peri´dica o oen el dominio temporal.14.3.4. Franjas primaria y complementarias Una consecuencia muy importante de la propiedad de periodicidad de la transformada de Laplace esque se pueden definir dentro del plano complejo S en el que est´ definida la variable de Laplace una serie ade franjas o bandas como las que se muestran en la Fig. 14.5. C _Zt BR n ]i ‚JZ$%sj‚t ‚R 3„st`sS{B8}j‚8‚t s„$s ]i 3„st`sS}„$8s„$s u ]i 3„st`sS{B8}j‚8‚t s„$s un ]i Figura 14.5: Franjas primaria y secundarias Todo lo que ocurra en la franja primaria se repite en las franjas complementarias de forma peri´dica. oComo se ver´ m´s adelante, en los sistemas muestreados si s1 es un polo del sistema, los infinitos valores a as1 + jmωs que se pueden definir con m cualquier valor entero, tambi´n ser´n polos del sistema. e a 152
  • 151. Cap´ ıtulo 15Reconstrucci´n de la funci´n o ocontinua original Al hablar del fen´meno del aliasing ya se mencion´ que a partir de una se˜al muestreada se podr´ o o n ıaintentar reconstruir la funci´n continua original utilizando un filtro. En este cap´tulo se explica c´mo se o ı opuede hacer esto de forma exacta y qu´ otros filtros —menos exactos— se usan realmente en los sistemas emuestreados. A los filtros que reconstruyen funciones temporales a partir de los valores muestreados seles suele llamar tambi´n retenedores (en ingl´s holders). e e15.1. Filtro ideal15.1.1. Caracter´ ısticas del filtro ideal Suponiendo que se cumple el teorema de Shannon, el espectro de la se˜al original se repite en el ndominio de la frecuencia sin solape ninguno. Por tanto, lo que se necesita es un filtro con la siguienteforma: I7w D x u ] ] Figura 15.1: Filtro ideal T si |ω| < ωs 2 Hi (ω) = (15.1) 0 si |ω| ≥ ωs 2 A la mitad de la frecuencia de muestreo se le conoce como frecuencia de Nyquist: π ωs ωN = = . (15.2) T 2 Si se hubiera empleado una escala logar´ ıtmica en la Fig. 15.1 tanto en ganancias como en frecuencias,como es habitual en los diagramas de Bode, quedar´ patente que el filtro ideal posee una pendiente de ıa−∞ dB/d´cada a partir de la frecuencia de Nyquist. Este hecho previene ya al ingeniero de que no es eposible llevar a la pr´ctica un filtro de tales caracter´ a ısticas.15.1.2. Imposibilidad f´ ısica de construcci´n del filtro ideal o En este apartado se demuestra lo que de alguna manera ya se ha anticipado en el apartado anterior,es decir, por qu´ es imposible implementar f´ e ısicamente un filtro ideal. 153
  • 152. 3$j „BS $I‚sj w D Vw D I7w D Figura 15.2: Respuesta en frecuencia del filtro ideal a un impulso Como lo que se conoce es la forma del filtro ideal en el dominio de la frecuencia, o de Fourier, habr´ que acalcular la transformada inversa de Fourier de la salida del filtro. La transformada inversa de Fourier sedefine como: ∞ F −1 1 F (ω) − − f (t) = −→ F (ω)ejωt dω (15.3) 2π −∞ Como la transformada de Fourier del impulso unidad es la propia unidad, F [δ(t)] = Δ(ω) = 1, latransformada de Fourier da la salida coincidir´ con la expresi´n del filtro ideal: a o Y (ω) = Hi (ω)Δ(ω) = Hi (ω) (15.4) Por tanto: ωN 1 ωN jωt T ejωt 2(ejωN t − e−jωN t ) sin ωn t y(t) = Te dω = = = = sinc ωn t (15.5) 2π −ωN 2π jt −ωN jωN t ωn t La respuesta del filtro ideal ante un impulso es una funci´n sinus cardinalis de frecuencia igual a ola frecuencia de Nyquist (Fig. 15.3). Sin embargo, ¿c´mo es posible que el filtro responda en tiempos onegativos, es decir, antes de que se produzca la entrada? Esto viola el principio de causalidad. No sepuede observar un efecto antes de que act´e la causa. As´ pues, aunque matem´ticamente sea posible dar u ı ala definici´n del filtro ideal, f´ o ısicamente no se puede implementar. &w0D rw0D d d 0 0 ( ( Figura 15.3: Respuesta temporal del filtro ideal a un impulso15.1.3. Reconstrucci´n de la se˜ al con el filtro ideal o n Otra forma de demostrar que el filtro ideal es irrealizable consiste en observar directamente qu´ ex- epresi´n temporal continua resulta al introducir en dicho filtro una funci´n muestreada: o o 3$j „BS $I‚sj B ~w D Bw D I7w D Figura 15.4: Respuesta del filtro ideal a una funci´n muestreada o Por definici´n la respuesta debe ser la funci´n continua f (t) original, pero se pretende ver c´mo el o o ofiltro ideal consigue reconstruirla en el dominio del tiempo. La operaci´n producto en el dominio de la ofrecuencia se puede convertir en el dominio temporal como la operaci´n convoluci´n: o o F (ω) = Hi (ω)F ∗ (ω) (15.6) f (t) = hi (t) ⊗ f ∗ (t) (15.7) Para calcular la funci´n temporal hi (t) se debe hacer la siguiente transformada inversa de Fourier: o ∞ ωN 1 1 hi (t) = Hi (ω)ejωt dω = T ejωt dω = sinc ωn t (15.8) 2π −∞ 2π −ωN 154
  • 153. Resulta ser la misma expresi´n que la anterior ecuaci´n (15.5). Es por eso que la funci´n temporal o o oasociada a una funci´n de transferencia se le suele llamar “funci´n respuesta impulso unidad” o expresiones o oequivalentes. Volviendo al c´lculo de la funci´n temporal original, se puede demostrar que la convoluci´n a o ode la funci´n muestreada con la funci´n sinus cardinalis es: o o ∞ f (t) = f (nT ) sinc(ωn t + nT ) (15.9) n=−∞ Es decir, que para poder calcular el valor de la funci´n f (t) en un instante cualquiera es necesario oconocer todos los valores muestreados de dicha funci´n. Por tanto, no es posible generar on-line dicha ofunci´n porque no se conocen los valores muestreados futuros (suponiendo que se sea posible memorizar olos infinitos valores pasados). En la f´rmula (15.9) se puede ver por qu´ se llama tambi´n a la funci´n sinus cardinalis “funci´n de o e e o ointerpolaci´n”. Es decir, en el intervalo de tiempo comprendido entre dos instantes de muestreo, se utiliza oesta funci´n para interpolar. Pero se ve tambi´n que no es exactamente una interpolaci´n, ya que es un o e oprocedimiento que no s´lo afecta al periodo de tiempo comprendido entre dos muestreos. Las funciones ode interpolaci´n afectan a todos los instantes de tiempo. o15.2. Retenedor de orden cero15.2.1. Caracter´ ısticas del retenedor de orden cero En lugar del filtro ideal, lo que se utiliza en la pr´ctica es alg´ n tipo de retenedor de los que se ver´n a u aa continuaci´n. Los retenedores m´s extendidos act´ an a intervalos de forma similar a c´mo aproxima o a u ouna funci´n la suma en serie de Taylor. o W{w0D W(w0D Ww0D 0 zx Figura 15.5: Aproximaciones de Taylor en torno a un instante de muestreo En la Fig. 15.5 se ve c´mo se aproximar´ por Taylor la funci´n f (t) en los puntos pr´ximos a un o ıa o oinstante cualquiera de muestreo, t = nT . En dicha gr´fica, f0 (t) ser´ la aproximaci´n de orden cero y a ıa ofI (t) la aproximaci´n de primer orden. Formulando esta idea en una ecuaci´n: o o df (t) d2 f (t) f (t) ≈ f (nt) + (t − nT ) + (t − nT )2 + ... (15.10) dt t=nT dt2 t=nT El retenedor de orden cero (en ingl´s zero-order holder ) es el “constructor” de la funci´n original que e ousa s´lo el t´rmino de orden cero de la serie de Taylor, es decir, un valor constante, entre un periodo de o emuestreo y el siguiente: ⎧ ⎪ 0 ⎪ si t < 0 ⎪ ⎪ f (0) ⎪ ⎪ si 0 ≤ t < T ⎨ f (T ) si T ≤ t < 2T f0 (t) = (15.11) ⎪ f (2T ) si 2T ≤ t < 3T ⎪ ⎪ ⎪ ... ⎪ ⎪ ⎩ f (nT ) si nT ≤ t < nT + T La reconstrucci´n que hace el retenedor de orden cero es una funci´n no continua, o continua a tramos, o ocon saltos finitos cada periodo de muestreo (Fig. 15.6). 155
  • 154. Ww0D W(w0D 0 Figura 15.6: Reconstrucci´n de la funci´n original con el retenedor de orden cero o o15.2.2. Expresi´n de Laplace del retenedor de orden cero o Para encontrar una expresi´n en el dominio de Laplace del retenedor de orden cero, se acude al con- ocepto de respuesta al impulso unidad al que se hizo menci´n tras la ecuaci´n (15.8). Con las caracter´ o o ısticasque han descrito en el apartado anterior, la respuesta del retenedor de orden cero a un impulso unidaden el origen de tiempos deber´ ser la que se muestra en la Fig. 15.7. ıa &w0D rw0D d d 0 0 ( ( x Figura 15.7: Respuesta del retenedor de orden cero a un impulso unidad Matem´ticamente, en el dominio temporal y pasando al dominio de Laplace, se puede escribir: a y(t) = u(t) − u(t − T ) (15.12) 1 1 Y (s) = − e−sT (15.13) s s Dado que la transformada de Laplace de la entrada es la unidad, se puede concluir que la expresi´n oen Laplace del retenedor de orden cero es: Y (s) 1 − e−sT H0 (s) = ZOH(s) = = (15.14) Δ(s) s Hay que destacar que la respuesta del retenedor de orden cero no viola el principio de causalidad, yaque el efecto (la salida) es posterior a la causa (la entrada).15.2.3. Respuesta en frecuencia del retenedor de orden cero En cuanto a la respuesta en frecuencia, se puede calcular la transformada de Fourier del retenedor deorden cero sustituyendo la variable s de Laplace por jω. 1 − e−jωT ωT = (...) = T e−j 2 sinc ωT H0 (ω) = ZOH(ω) = (15.15) jω 2 Con la expresi´n (15.15) se puede representar f´cilmente la respuesta en frecuencia, separando el o am´dulo del argumento. En la Fig. 15.8 la respuesta en frecuencia en escala lineal. o Como se podr´ haber deducido observando la Fig. 15.6 el retenedor de orden cero introduce cierto ıaretraso en la se˜ al reconstruida. Tambi´n se observa en la Fig. 15.8 que el retenedor de orden cero posee, n epara frecuencias inferiores a la de muestreo la misma ca´ lineal en fases que un retraso puro de valor ıdamitad que el periodo de muestreo. ZOH(s) ≈ T e− 2 s T (15.16) Por tanto, la expresi´n (15.16) es una buena aproximaci´n del retenedor de orden cero para frecuencias o oinferiores a la de Nyquist. Esta aproximaci´n se suele usar para analizar en el dominio continuo aquellos osistemas discretos cuya din´mica sea mucho menor que la frecuencia de muestreo. a 156
  • 155. d 1x /I7 w D/ x ( Mx ( En x ( Ex /.5I w D/ ( ;x ( 1d1 x ( 1x ( d1 x ( ( (x X X dx X 1 X 1x X n X nx X ; X 3„‚{Z‚t{$sS Sw„sIRD (S„sI I7 w D ±$ „sI 1 .5I w D ±$ „sI ± n$ „sI 1 ( (x X X dx X 1 X 1x X n X nx X ; X 3„‚{Z‚t{$sS Sw„sIRD Figura 15.8: Respuesta en frecuencia del retenedor de orden cero15.3. Retenedor de primer orden15.3.1. Caracter´ ısticas del retenedor de primer orden El retenedor de primer orden es el “constructor” de la funci´n original que entre dos instantes de omuestreo usando una serie de Taylor de primer orden: df (t) fI (t) = f (nt) + (t − nT ) para nT ≤ t < nT + T (15.17) dt t=nT La mayor dificultad de este retenedor es c´mo estima la derivada de la funci´n original a partir de o olos valores muestreados de la funci´n original. Aunque se puede hacer de distintas maneras, la mejor oaproximaci´n de la derivada es calcular la diferencia de la funci´n entre el muestreo actual y el anterior, o odividido por el periodo de muestreo. f (nt) − f (nt − T ) fI (t) = f (nt) + (t − nT ) para nT ≤ t < nT + T (15.18) T Con esto se consigue, por ejemplo, la reconstrucci´n que se muestra en la Fig. 15.9. Como se puede oobservar, este modo de reconstrucci´n es peor que el que se consigue con el retenedor de orden cero. oEsto se debe a que la aproximaci´n de la derivada es buena para el intervalo de muestreo precedente, oo —como mucho— para el valor de muestreo actual, pero no resulta muy buena para el periodo demuestreo siguiente. Por otro lado, la reconstrucci´n que hace el retenedor de primer orden tambi´n o epresenta discontinuidades cada muestreo. 157
  • 156. Wyw0D Ww0D 0 Figura 15.9: Reconstrucci´n de la funci´n original con el retenedor de primer orden o o15.3.2. Expresi´n de Laplace del retenedor de primer orden o La respuesta del retenedor de primer orden a un impulso unidad en el origen de tiempos es: ⎧ ⎪ 0 ⎪ si t<0 ⎨ 1+ Tt si 0≤t<T fI (t) = (15.19) ⎪ 1− T ⎪ t si T ≤ t < 2T ⎩ 0 si t ≥ 2T rw0D &w0D d d 0 1x 0 ( ( x Figura 15.10: Respuesta del retenedor de primer orden a un impulso unidad Empleando las funciones escal´n unidad u(t) y rampa de pendiente unidad r(t) (funciones que son omulas para “tiempos negativos”) se puede escribir como: r(t) r(t − T ) r(t − 2T ) y(t) = u(t) + − 2u(t − T ) − 2 + u(t − T ) + (15.20) T T T Y su transformada de Laplace es: 1 1 2 2 −sT 1 1 −2sT Y (s) = + 2 − e−sT − 2 e + e−2sT + e (15.21) s Ts s Ts s T s2 Por tanto, la funci´n de transferencia del retenedor de primer orden es: o 2 Y (s) 1 − e−sT 1 + Ts 1 + Ts HI (s) = F OH(s) = = = ZOH 2 (s) (15.22) Δ(s) s T T15.3.3. Respuesta en frecuencia del retenedor de primer orden En cuanto a la respuesta en frecuencia, en la Fig. 15.11 se comparan los m´dulos de la respuesta en ofrecuencia de los tres retenedores vistos hasta el momento. El retenedor de orden uno no es claramente superior al retenedor de orden cero. Es peor pasa-baja,introduce mayor retraso a alta frecuencia y es mucho m´s dif´ de implementar que el de orden cero. a ıcilPor estos motivos, el que m´s se usa es el retenedor de orden cero. a 158
  • 157. d Ex d ;x /B5Iw D/ d 1x /I7 w D/ x ( Mx ( Ex /.5I w D/ ( ;x ( 1x ( ( (x X X dx X 1 X 1x X n X nx X ; X 3„‚{Z‚t{$sS Sw„sIRD Figura 15.11: M´dulo de la respuesta en frecuencia del retenedor de primer orden o (S„sI I7 w D .5I w D ±$ „sI B5I w D ±1$ „sI ±n$ „sI ( (x X X dx X 1 X 3„‚{Z‚t{$sS Sw„sIRD Figura 15.12: Argumento de la respuesta en frecuencia del retenedor de primer orden15.4. Retenedor polinomial15.4.1. Caracter´ ısticas del retenedor polinomial El retenedor polinomial es un retenedor de primer orden retrasado un periodo de muestreo, con loque se consigue una reconstruir una funci´n continua (aunque con puntos angulosos) que tiene la forma odel polinomio que une los valores muestreados de la funci´n. Pero como en el instante actual no se puede oconocer el valor inmediatamente posterior, es por eso que s´lo se puede conseguir retrasando la respuesta oun periodo de muestreo (Fig. 15.13).15.4.2. Expresi´n de Laplace del retenedor polinomial o La respuesta del retenedor polinomial a un impulso unidad se muestra en la Fig. 15.14. 159
  • 158. Ww0D W_w0D 0 Figura 15.13: Reconstrucci´n de la funci´n original con el retenedor polinomial o o &w0D rw0D d d 0 0 ( ( x 1x Figura 15.14: Respuesta del retenedor polinomial a un impulso unidad Matem´ticamente: a r(t) r(t − T ) r(t − 2T ) y(t) = −2 + (15.23) T T T Y su transformada de Laplace es: 1 2 −sT 1 −2sT Y (s) = 2 − 2 e + e (15.24) Ts Ts T s2 Por tanto, la funci´n de transferencia del retenedor polinomial es: o 2 Y (s) 1 1 − e−sT 1 HP (s) = = = ZOH 2 (s) (15.25) Δ(s) T s T Con este retenedor se consigue un mejor filtro pasa-baja que con el retenedor de orden cero (el doblemejor), pero tambi´n un mayor retraso (el doble de retraso). Otro inconveniente del retenedor polinomial ees que, si se vuelve a muestrear el resultado de la reconstrucci´n, no se obtiene la misma se˜al muestreada o nde la que se ha partido, cosa que s´ ocurr´ con los retenedores anteriores. ı ıa En general, en cada ejercicio se tendr´ que especificar qu´ retenedor se est´ empleando. Si no se dice ıa e anada se supondr´ que se usa el retenedor de orden cero, porque es la respuesta que ofrecen normalmente alos convertidores digital-anal´gicos. o Tambi´n hay que advertir que los retenedores que se han explicado en este cap´ e ıtulo s´lo tienen sentido ocon el muestreo ideal (con impulsos unidad). No se pueden mezclar estos retenedores con otras formas demuestreo. 160
  • 159. Cap´ ıtulo 16La transformada Zeta La transformada Z es la parte esencial de la teor´ de control discreto. Algunos manuales de control ıadiscreto comienzan precisamente con la definici´n de esta transformada. Sin embargo, se ha considerado omuy conveniente esperar hasta este momento para definirla, porque s´lo si se ha entendido el sentido de los odesarrollos matem´ticos anteriores se puede alcanzar una idea acertada de por qu´ se usa la transformada a eZ en esta asignatura.16.1. C´lculo de la transformada Zeta a La transformada Z de una funci´n temporal es igual a la transformada de Laplace de esa funci´n o omuestreada idealmente, pero con un ultimo cambio de variable. Este cambio de variable permitir´ pre- ´ acisamente obtener transformadas Z en forma de fracciones de polinomios en la variable compleja, comoocurr´ en el caso de las transformadas de Laplace. ıa Z f (t) − F (z) → (16.1) La funci´n f (t) es una funci´n real de variable t real, y F (z) es una funci´n compleja de variable z o o ocompleja. La notaci´n que se suele emplear es F (z) = Z[f (t)] y el modo de obtener esta funci´n F (z) o ocompleja es: L z=eT s f (t) − − − − − f ∗ (t) − F ∗ (s) − − → F (z) muestreo ideal − − − −→ → −− (16.2) Por tanto, dado que la transformada de Laplace de una funci´n muestreada es o ∞ F ∗ (s) = f (nT )e−snT , (16.3) n=0haciendo el siguiente cambio de variable compleja: z = eT s , (16.4)se obtiene: ∞ F (z) = f (nT )z −n . (16.5) n=0 Por las caracter´ ıvoca entre f ∗ (t) y F (z). ısticas de la transformada de Laplace, existe una relaci´n biun´ oPero no as´ entre f (t) y F (z), puesto que ya se sabe que dos funciones temporales podr´ tener la misma ı ıanfunci´n muestreada. o La expresi´n (16.5) es la forma m´s habitual de definir la transformada Z de cualquier funci´n f (t). o a oSabiendo que la variable z representa una traslaci´n en el tiempo, como se aprecia en su definici´n (16.4), o ose puede emplear la misma regla nemot´cnica que se mencion´ para la transformada de Laplace: cada e ovalor muestreado de la funci´n est´ multiplicado por la variable z elevada al exponente que dice en o aqu´ periodo de muestreo respecto del origen de tiempos se da dicho valor. e Evidentemente, se puede definir el cambio de variable de z a s como: 1 s= ln z (16.6) T 161
  • 160. 16.2. Tabla de la transformada Zeta de funciones elementales La transformada Z se puede calcular siguiendo al proceso descrito en el apartado anterior. Por ejemplo,para el caso del escal´n unidad f (t) = u(t), se hab´ encontrado la siguiente forma cerrada: o ıa 1 U ∗ (s) = si |e−sT | < 1 (16.7) 1 − e−sT Sustituyendo z = eT s , la transformada Z del escal´n unidad ser´ entonces: o ıa 1 z U (z) = = si |z −1 | < 1 (16.8) 1 − z −1 z−1 Se observa que el ingeniero puede elegir usar fracciones de polinomios en z con exponentes negativoso positivos. Tabla 16.1: Transformadas Zeta de diversas funciones f (t) F (s) F (z) δ(t) 1 1 1 z u(t) s z−1 1 Tz t s2 (z−1)2 t2 1 T 2 z(z+1) 2 s3 2(z−1)3 e−at 1 s+a z z−e−aT T ze−aT te−at 1 (s+a)2 (z−e−aT )2 a z sin aT sin at s2 +a2 z 2 −2z cos aT +1 s z(z−cos aT ) cos at s2 +a2 z 2 −2z cos aT +1 (e−aT −e−bT )z e−at − e−bt b−a (s+a)(s+b) (z−e−aT )(z−e−bT ) z(1−e−aT ) 1 − e−at a s(s+a) (z−1)(z−e−aT ) 1−e−at z[(aT −1+e−aT )z+(1−e−aT −aT e−aT )] t− a a s2 (s+a) a(z−1)2 (z−e−aT ) ze−aT sin bT e−at sin bt b (s+a)2 +b2 z 2 −2ze−aT cos bT +e−2aT z 2 −ze−aT cos bT e−at cos bt s+a (s+a)2 +b2 z 2 −2ze−aT cos bT +e−2aT a2 aT ze−aT 1 − (1 + at)e−at s(s+a)2 z z−1 − z z−e−aT − (z−e−aT )2 La Tabla 16.1 es un resumen de las transformadas Z de funciones habituales, donde se supone quelas funciones temporales f (t) son nulas para “tiempos negativos”. Las regiones de convergencia de lastransformadas Z no se muestran por mayor simplicidad. Las expresiones de las transformadas Z seasemejan a las transformadas de Laplace, en el sentido que son fracciones de polinomios en la variablecompleja cuyas ra´ ıces son los polos y los ceros de tales expresiones.16.3. Teoremas de la transformada Zeta Si F (z) es la transformada Z de f (t) y G(z) la correspondiente a g(t), donde f (t) y g(t) son funcionescausales, se pueden demostrar los teoremas que se muestran en la Tabla 16.2.16.4. C´lculo de la transformada inversa de Zeta a Lo primero que hay que hacer notar es que, dado un periodo de muestreo, la transformada inversa deZ no es unica. Es decir, dada una expresi´n F (z) existen infinitas funciones continuas causales f (t) que ´ oposeen esa transformada Z. Todas las funciones continuas que posean valores id´nticos en los instantes ede muestreo tendr´n, evidentemente, la misma transformada Z. a 162
  • 161. Tabla 16.2: Propiedades de la transformada Zeta Propiedad Expresi´n o Linealidad Z[αf (t) + βg(t)] = αF (z) + βG(z) Valor final l´ f (nT ) = l´ (1 − z −1 )F (z) si el sistema es estable ım ım n→∞ z→1 Valor inicial f (0) = l´ F (z) si existe el l´ ım ımite z→∞ Retraso en el tiempo Z[f (t − nT )] = z −n F (z) f (kT )z −k ] n−1 Adelanto en el tiempo Z[f (t + nT )] = z n [F (z) − k=0 ∞ Convoluci´n o F (z)G(z) = Z[f (nT ) ⊗ g(nT )] = Z [ k=0 f (kT )g(nT − kT )] En la Fig. 16.1 se muestran dos funciones continuas que poseen igual transformada Z porque su funci´n omuestreada es id´ntica. Por tanto, a la hora de calcular la transformada inversa de Z, s´lo podr´n dar de e o aforma exacta los valores temporales de la funci´n continua en todos los instantes de muestreo. En forma omatem´tica, se podr´n dar los valores de f (nT ), no la entera expresi´n de f (t). a a o /w0D Ww0D 0 zx zx L x zx L 1x Figura 16.1: Funciones con igual transformada Z16.4.1. M´todo directo o de la expansi´n de potencia e o La forma directa de obtener los valores de f (nT ) consiste simplemente en escribir la funci´n F (z) ocomo fracci´n de polinomios en z con exponentes negativos y efectuar la divisi´n de los polinomios. El o oresultado de la divisi´n es directamente la expresi´n de la transformada Z de la forma: o o ∞ F (z) = f (nT )z −n . (16.9) n=0 Con esta expresi´n se pueden identificar directamente los valores de la expresi´n temporal en los o oinstantes de muestreo. En el siguiente ejemplo, se aplica el m´todo descrito: e 10z + 5 F (z) = (16.10) (z − 1)(z − 0.2) En primer lugar se reescribe la transformada Z como: 10z −1 + 5z −2 F (z) = , (16.11) 1 − 1.2z −1 + 0.2z −2y se efect´ a la divisi´n: u o 10z −1 +5z −2 1 − 1.2z −1 + 0.2z −2 −10z −1 +12z −2 −2z −3 10z −1 + 17z −2 + 18.4z −3 + ... 0 +17z −2 −2z −3 (16.12) −17z −2 +20.4z −3 −3.4z −4 0 +18.4z −3 −3.4z −4 ... ... 163
  • 162. Por tanto, los valores de la funci´n temporal en los instantes de muestreo son: o f (0) = 0 f (T ) = 10 f (2T ) = 17 (16.13) f (3T ) = 18.4 f (4T ) = ... Con estos valores es posible ir representando a mano alzada la funci´n temporal. o16.4.2. M´todo de la expansi´n en fracciones e o Este m´todo trata de dividir la funci´n F (z) en una combinaci´n de fracciones elementales de las que e o ose conozca su funci´n temporal correspondiente, es decir, que se puedan encontrar en la Tabla 16.1. Si se opuede, es preferible buscar las fracciones simples de F (z) dividido por z, porque suele ser m´s sencillo. aPor ejemplo, aunque la funci´n: o (1 − e−aT )z F (z) = , (16.14) (z − 1)(z − e−aT )ya posea una soluci´n directamente en la Tabla 16.1, se va a calcular con otras expresiones m´s elemen- o atales. En primer lugar se divide en fracciones simple de la forma: F (z) 1 − e−aT 1 1 = −aT ) = + , (16.15) z (z − 1)(z − e z − 1 z − e−aTy por tanto: z z F (z) = + . (16.16) z − 1 z − e−aT Se puede concluir que: f (nT ) = 1 − e−anT , (16.17)donde se ha escrito nT en lugar de la variable temporal t porque, como ya se ha dicho, cuando se calculala transformada inversa de Z s´lo se pueden dar con certeza los valores de la funci´n en los instantes de o omuestreo. Con esta formula se podr´ ir calculando los sucesivos valores que toma la funci´n, de forma ıan oan´loga a como se escribieron en (16.13) y representar a mano alzada la forma de la funci´n temporal. a o Recordar que cuando en la funci´n Z aparecen t´rminos (z − a)n , hay que obtener tantas fracciones o ecomo indica la potencia, con denominadores: (z − a), (z − a)2 , ..., (z − a)n .16.5. Funci´n de transferencia Zeta o En el dominio continuo se defin´ funciones de transferencia como una expresi´n matem´tica funci´n ıa o a ode la variable s que era precisamente la relaci´n de las transformadas de Laplace de la se˜al de salida y o nla de entrada, en un determinado sistema, con condiciones iniciales nulas. 7$R ‚8s pwFD gwFD twFD Figura 16.2: Funcion de transferencia Z Tambi´n es posible definir una expresi´n matem´tica en z que sea la relaci´n de las transformadas e o a oZ de la salida respecto de la entrada, asumiendo condiciones iniciales nulas. Como habitualmente lastransformadas Z de las se˜ ales temporales son fracciones de polinomios en z, las funciones de transferencia nZ tambi´n ser´n fracciones de polinomios en z. Las ra´ del polinomio numerador ser´n los ceros de la e a ıces afunci´n de transferencia Z y las ra´ o ıces del polinomio denominador ser´n los polos. a C(z) a0 + a1 z + a2 z 2 + a3 z 3 + ... G(z) = = (16.18) R(z) b0 + b1 z + b2 z 2 + b3 z 3 + ... Igual que ocurr´ en el dominio continuo de Laplace, las funciones de transferencia Z de sistemas ıaf´ ısicos suelen poseer m´s polos que ceros, o como mucho, igual n´mero de ceros que de polos. a u 164
  • 163. 16.6. Ecuaciones en diferencias Saber escribir la ecuaci´n en diferencias equivalente a una funci´n Z es una de las herramientas m´s o o ainteresantes de la asignatura, de cara a poder implementar los controladores digitales en lenguajes deprogramaci´n como C o Matlab R . El objetivo es traducir la funci´n de transferencia Z que relaciona la o osalida con la entrada en operaciones elementales. Primero se mostrar´ un ejemplo. El punto de partida