Your SlideShare is downloading. ×
Modelagem e Compensação da Dinâmica de Robôs Móveis e sua aplicação em Controle de Formação
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Modelagem e Compensação da Dinâmica de Robôs Móveis e sua aplicação em Controle de Formação

4,124
views

Published on

Uma proposta de modelagem da dinâmica de robôs móveis tipo uniciclo é aqui apresentada e utilizada no projeto de controladores para os referidos robôs, inclusive num contexto de controle de formação. …

Uma proposta de modelagem da dinâmica de robôs móveis tipo uniciclo é aqui apresentada e utilizada no projeto de controladores para os referidos robôs, inclusive num contexto de controle de formação. A dinâmica dos robôs móveis é modelada através de uma nova abordagem, baseada em um modelo dinâmico que aceita sinais de velocidades linear e angular como entradas. O novo modelo dinâmico apresentado tem suas propriedades estudadas e posteriormente utilizadas no desenvolvimento de controladores adaptativos, para compensar
os efeitos da dinâmica de robôs móveis quando realizam tarefas de seguimento de
trajetória, posicionamento e controle de formação. A teoria de Lyapunov é utilizada para analisar a estabilidade do equilíbrio para cada caso, também sendo realizada análise de robustez à variação de parâmetros e à presença de distúrbios não modelados. A influência da compensação da dinâmica é estudada, e sua importância evidenciada através do cálculo de um índice de desempenho obtido em simulações e experimentos. Três estratégias de controle de formação com compensação dinâmica são apresentadas, sendo uma de controle
descentralizado tipo líder-seguidor e duas de controle centralizado tipo estruturas virtuais. Uma das estratégias de controle centralizado é aqui proposta, sendo apresentado o desenvolvimento do Esquema de Controle Multicamadas. Tal esquema permite que cada parte do problema de controle de formação seja resolvido por um módulo independente,
aumentando sua flexibilidade. É proposto um controlador de formação que posiciona os robôs numa formação que pode ser fixa ou variável, tanto em posição como em forma, sendo possível enfatizar a importância do controle de posicionamento ou de forma da formação. A influência da compensação dinâmica neste controle de formação é analisada e ilustrada através de resultados de simulação e também de experimentos.

Published in: Technology

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
4,124
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
28
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Felipe Nascimento MartinsModelagem e Compensa¸ao da Dinˆmica c˜ a de Robˆs M´veis e sua Aplica¸ao em o o c˜ Controle de Forma¸˜o ca Tese apresentada ao Programa de P´s-Gradua¸˜o em o ca Engenharia El´trica do Centro Tecnol´gico da Uni- e o versidade Federal do Esp´ ırito Santo, como requisito parcial para obten¸˜o do Grau de Doutor em Enge- ca nharia El´trica - Automa¸˜o. e ca Orientador: Prof. Dr. M´rio Sarcinelli Filho. a Coorientadores: Prof. Dr. Teodiano Freire Bastos Filho e Prof. Dr. Ricardo Carelli. Vit´ria, ES o 2009
  • 2. A Cynthia.Aos meus pais, irm˜os e toda minha fam´ a ılia.
  • 3. Agradecimentos “I do not overrate my importance! I dare say I am the most humble droid I know.” (C-3PO, em Star Wars: The New Rebellion) Tantas pessoas colaboraram, de diversas maneiras, com a realiza¸˜o deste trabalho, caque acho muito dif´ escrever um texto de agradecimentos que seja justo. Por isso, ıcilantes de tudo, quero agradecer a todos que, de alguma forma, prestaram sua contribui¸˜o ca(t´cnica, financeira, espiritual, etc.) para que este trabalho fosse realizado e conclu´ e ıdo.Menciono, a seguir, algumas delas. Meus sinceros agradecimentos... A Cynthia, por todo seu apoio, carinho, companhia, compreens˜o e amor. Sem ela, atudo seria muito mais dif´ ıcil. Aos meus pais, Ronaldo e Ana, que sempre trabalharammuito para que meus irm˜os e eu tiv´ssemos o melhor poss´ a e ıvel, sempre nos incentivandocom muita aten¸˜o e carinho. Aos meus irm˜os Paulo e Julia, `s minhas av´s Helenita ca a a oe Yvonne, aos meus sogros Jos´ Augusto e Li´te, e ` toda minha fam´ pelo incentivo, e e a ıliaapoio, carinho, suporte e compreens˜o durante os momentos de falta. a Aos professores M´rio Sarcinelli Filho (My Professor ), Teodiano Freire Bastos Filho e aRicardo Carelli, por sua orienta¸˜o dedicada e valiosa, pela aten¸˜o, pelos conhecimentos ca cacompartilhados, pelas revis˜es detalhadas de todos os artigos e desta tese, e por confiarem oque eu poderia realizar este trabalho enquanto seguia como professor. Jamais me esque- ıssemos como Serguei Bubka1 ,cerei dos conselhos de My Professor para que sempre evolu´sempre mostrando progresso, pouco a pouco. E dos excelentes passeios tur´ ısticos por SanJuan guiados pelo professor Carelli, que nos recebeu t˜o bem no Instituto de Autom´tica a a(INAUT) e nos fez sentir em casa, na Argentina! Agradecimentos especiais a My Profes-sor e a Carelli pela ajuda no contato com o Instituto de Investigaciones Arqueol´gicas y oMuseo “Prof. Mariano Gambier”, da UNSJ, e ` Dra. Catalina Teresa Michieli, diretora ade tal museu, que recebeu a Cynthia e possibilitou que ela me acompanhasse durante a 1 Serguei Nazarovich Bubka, ucraniano nascido em Voroshilovgrad em 4 de dezembro de 1963, ´ um eex-campe˜o ol´ a ´ ımpico e multirrecordista mundial do salto com vara. E considerado por muitos o maiorsaltador com vara de todos os tempos. Quebrou o recorde mundial de salto com vara 34 vezes entre 1984e 1995 (na maioria das vezes, o pr´prio recorde). At´ o presente det´m o recorde de 6,15 m (Biography o e eBase, Acesso em: 18/nov/2008).
  • 4. primeira viagem a San Juan em 2006. Tal fato resultou numa mudan¸a importante em csua vida profissional. Aos amigos, colegas e companheiros de viagem Alexandre Santos Brand˜o (Tim´tiu), a oWanderley Cardoso Celeste (Wander), Rafael Leal Silva (Preto) e Vinicius Thiago LeccoRampinelli (Vicˆncio), pela amizade, pelo companheirismo, pelos momentos de divers˜o e a(nos asados, tomando um bom vinho ou um caf´, esquiando, assistindo a Heroes ou a The eBig Bang Theory), e pelos muitos momentos de trabalho em equipe que compartilhamosno Lai (Laborat´rio de Automa¸˜o Inteligente) e em nossa Sorprendente y Querida San o caJuan. Obrigado, tamb´m, pela gentileza em aceitar dividir o quarto com a Cynthia. eEspero que possamos trabalhar e tomar muitos outros vinhos e caf´s juntos. Vou me elembrar sempre com muita alegria da companhia de vocˆs, principalmente porque eu fui eo campe˜o no jogo de boliche. a A Raquel Frizera Vassallo, Eliete Maria de Oliveira Caldeira, Christiano Couto Gava,Fl´vio Garcia Pereira, Lorena Sophia Campos de Oliveira, Alexandre Konzen (In Me- amoriam), Roger Alex de Castro Freitas, Andr´ Ferreira, Daniel Cruz Cavalieri, Sandra eMara Torres M¨ller, Bruno Pandolfi, Lester e todos os colegas do Lai, pela ajuda na uprograma¸˜o, manuten¸˜o e “cirurgia”de upgrade do Pioneer, pela motiva¸˜o, e pela ca ca cacompanhia para bate-papo durante os caf´s. A Fernando Auat Chee´ Flavio Robertti, e ın,Lorgio Teodovich, Franco Penizzotto, Jos´ Luis Torres, Juli´n Nantes, Andr´s Rosales, e a eMarcos Toibero, Adriana Amicarelli, Natalia L´pez, Fernando di Sciascio, Vicente Mut, oHumberto Secchi, Emanuel Slawi˜ski, Flavio Capraro, Santiago Tosetti, Jorge Sarapura, nArmando Assandri, Antonio Cunsulo, Rogelio Fullana, Marcelo Martin, Pedro Campillo,Juan Enrique Guell e todos os colegas e professores do INAUT, por nos receberem deforma t˜o cordial em San Juan e no instituto, e por sempre estarem dispostos a auxiliar aem todo o necess´rio, inclusive em atividades n˜o acadˆmicas. Agradecimentos especiais a a ea Celso de la Cruz Casa˜o pelas pacientes explica¸˜es e ajuda na realiza¸˜o de experi- n co camentos, e ao Dr. Carlitos Soria, respons´vel pelo laborat´rio de rob´tica do INAUT, pelo a o oaux´ na programa¸ao e solu¸˜o dos problemas dos robˆs, e pela companhia nos fins de ılio c˜ ca osemana de realiza¸˜o de experimentos no instituto (alguns de muito calor e vento Zonda). ca Aos professores membros da banca de avalia¸˜o Jussara Farias Fardin, Paulo Faria caSantos Amaral, Vladimir Dynnikov e Pablo Javier Alsina, pelas observa¸˜es, cr´ co ıticas evaliosas sugest˜es no sentido de melhorar o conte´do e o texto desta tese. A todos os o uprofessores do PPGEE/UFES pelos ensinamentos e por toda a aten¸˜o, incentivo e ajuda casempre oferecidos.
  • 5. ` A Coordena¸˜o de Aperfei¸oamento de Pessoal de N´ Superior (CAPES) e ` Se- ca c ıvel acretar´a de Pol´ticas Universitarias (SPU), Argentina, pelo financiamento do programa ı ıde coopera¸˜o entre o Programa de P´s-Gradua¸˜o em Engenharia El´trica (PPGEE) da ca o ca eUFES e o Instituto de Autom´tica da UNSJ. Tal programa me permitiu viajar por trˆs a evezes para realiza¸˜o de est´gios no INAUT, o que ajudou sobremaneira no desenvolvi- ca a `mento deste trabalho. A Funda¸˜o de Apoio ` Ciˆncia e Tecnologia do Esp´ ca a e ırito Santo(FAPES) pelo financiamento do projeto que permitiu a compra de mais um robˆ Pioneer opara o PPGEE. ` A UCL - Faculdade do Centro Leste - que, atrav´s dos diretores de sua mantenedora e ˆCarlos Alberto Souza de Oliveira, Maria Angela Loyola de Oliveira, Maur´ Del Caro ıcioe Sandro Madureira Lobato, e de seu Programa de Incentivo ` Capacita¸˜o de Professo- a cares, me ofereceu apoio financeiro e redu¸˜o de carga hor´ria. Sem tal apoio seria muito ca acomplicado realizar o doutorado e as viagens ` Argentina. Agrade¸o a todos os colegas a cda UCL, v´rios dos quais assumiram atividades extras e parte de minhas fun¸˜es, espe- a cocialmente aos professores Frans´rgio Leite da Cunha, Bruno Venturini Loureiro e Rafael eLeal Silva. Agradecimento especial ao professor Klinger Marcos Barbosa Alves, diretoracadˆmico da UCL, pelo incentivo e total apoio desde o surgimento da oportunidade de erealiza¸˜o do doutorado. ca Por fim, quero comentar que a fic¸˜o-cient´ ca ıfica teve grande influˆncia em meu inte- eresse pela tecnologia e me fez desejar ir um pouco mais al´m. Por isso, agrade¸o tamb´m e c ea todos os autores e, principalmente, a Isaac Asimov, que fomentou meu interesse pelosrobˆs e incentivou-me a querer estud´-los, entendˆ-los, program´-los e constru´ o a e a ı-los. Acre-dito que o mundo seria um lugar melhor se toda crian¸a aprendesse desde cedo, como os crobˆs, a obedecer `s suas Trˆs Leis: o a e1. Um robˆ n˜o pode prejudicar um ser humano ou, por omiss˜o, permitir que o ser o a ahumano sofra dano.2. Um robˆ tem de obedecer `s ordens recebidas dos seres humanos, a menos que contra- o adigam a Primeira Lei.3. Um robˆ tem de proteger sua pr´pria existˆncia, desde que essa prote¸˜o n˜o entre em o o e ca aconflito com a Primeira ou a Segunda Leis. Muito obrigado! Felipe Nascimento Martins.
  • 6. “Eu sou mais r´pido que vocˆ. Sou mais forte que vocˆ. a e eE, com certeza, vou durar muito mais que vocˆ. eVocˆ pode pensar que eu sou o futuro, mas est´ errado. e aVocˆ ´ o futuro! eeSe eu pudesse desejar alguma coisa, desejaria ser humano.Pra saber o que significa ter sentimentos,ter esperan¸as, ter ang´stias, d´vidas... amar. c u uEu posso alcan¸ar a imortalidade, basta n˜o me desgastar. c aVocˆ tamb´m pode alcan¸ar a imortalidade. e e cBasta fazer apenas uma coisa not´vel.” a Andr´ide da propaganda de Johnnie Walker, 2006. o
  • 7. ResumoUma proposta de modelagem da dinˆmica de robˆs m´veis tipo uniciclo ´ aqui apresentada a o o ee utilizada no projeto de controladores para os referidos robˆs, inclusive num contexto de ocontrole de forma¸˜o. A dinˆmica dos robˆs m´veis ´ modelada atrav´s de uma nova abor- ca a o o e edagem, baseada em um modelo dinˆmico que aceita sinais de velocidades linear e angular acomo entradas. O novo modelo dinˆmico apresentado tem suas propriedades estudadas ae posteriormente utilizadas no desenvolvimento de controladores adaptativos, para com-pensar os efeitos da dinˆmica de robˆs m´veis quando realizam tarefas de seguimento de a o otrajet´ria, posicionamento e controle de forma¸˜o. A teoria de Lyapunov ´ utilizada para o ca eanalisar a estabilidade do equil´ ıbrio para cada caso, tamb´m sendo realizada an´lise de e arobustez ` varia¸˜o de parˆmetros e ` presen¸a de dist´rbios n˜o modelados. A influˆncia a ca a a c u a eda compensa¸˜o da dinˆmica ´ estudada, e sua importˆncia evidenciada atrav´s do c´lculo ca a e a e ade um ´ ındice de desempenho obtido em simula¸˜es e experimentos. Trˆs estrat´gias de co e econtrole de forma¸˜o com compensa¸˜o dinˆmica s˜o apresentadas, sendo uma de controle ca ca a adescentralizado tipo l´ ıder-seguidor e duas de controle centralizado tipo estruturas virtu-ais. Uma das estrat´gias de controle centralizado ´ aqui proposta, sendo apresentado o e edesenvolvimento do Esquema de Controle Multicamadas. Tal esquema permite que cadaparte do problema de controle de forma¸˜o seja resolvido por um m´dulo independente, ca o ´aumentando sua flexibilidade. E proposto um controlador de forma¸˜o que posiciona os carobˆs numa forma¸˜o que pode ser fixa ou vari´vel, tanto em posi¸˜o como em forma, o ca a casendo poss´ ıvel enfatizar a importˆncia do controle de posicionamento ou de forma da aforma¸˜o. A influˆncia da compensa¸˜o dinˆmica neste controle de forma¸˜o ´ analisada ca e ca a ca ee ilustrada atrav´s de resultados de simula¸˜o e tamb´m de experimentos. e ca e
  • 8. AbstractA new dynamic modeling approach for unicycle-like mobile robots is proposed, which isapplied in the design of controllers for this type of robot. The dynamic model thus gene-rated accepts linear and angular velocities as inputs, which is usual in commercial robots.Some of its properties are studied and proved, and are then used in the design of adaptivecontrollers that compensate for the robot dynamics while tracking a desired trajectory,following a leader or being part of a group in formation control problems. The Lyapunovtheory is used on the stability analysis of the equilibrium in every case. A robustnessanalysis considering possible parameter variation and non-modeled disturbance is alsoperformed. The influence of the dynamic compensation is studied, and its importance isillustrated by a performance index measured for both simulation and experimentation.Three formation control strategies with dynamic compensation are presented: one is adecentralized leader-follower control, and the other two are centralized virtual structurecontrol. A Multi-Layer Scheme for formation control is here presented using one of thecentralized formation control strategies. Such scheme is flexible in the sense that eachpart of the formation control problem is solved by an independent module. The proposedformation controller is capable of making the robots achieve a fixed desired formation,and to follow a desired formation having time-varying position and shape. The influenceof the dynamic compensation on this formation control scheme is analyzed and illustratedthrough both simulation and experimental results.
  • 9. ResumenUna propuesta de modelado de la din´mica de robots m´viles tipo uniciclo es presentada a oy utilizada en el dise˜o de controladores para dichos robots, incluso en el contexto de ncontrol de formaci´n. La din´mica de los robots m´viles es modelada de una nueva ma- o a onera, basada en un modelo din´mico que acepta se˜ales de velocidades lineal y angular a ncomo entradas. El nuevo modelo din´mico presentado tiene sus propiedades estudiadas y aposteriormente utilizadas en el desarrollo de controladores adaptables, para compensar losefectos de la din´mica de robots m´viles cuando realizan tareas de seguimiento de trayec- a otoria, posicionamiento y control de formaci´n. La teor´ de Lyapunov es utilizada para o ıaanalizar la estabilidad del equilibrio en cada caso, y un an´lisis de robustez muestra que la aestabilidad es garantizada tambi´n cuando hay variaci´n de par´metros y perturbaciones e o ano modeladas. La influencia de la compensaci´n din´mica es estudiada, y su importancia o aevidenciada a trav´s del c´lculo de un ´ e a ındice de desempe˜o obtenido en simulaciones y nexperimentos. Tres estrategias de control de formaci´n con compensaci´n din´mica son o o apresentadas. Una de ellas es de control descentralizado tipo l´ ıder-seguidor y las otras dosson de control centralizado tipo estructuras virtuales. Una de las estrategias de controlcentralizado es aqu´ propuesta. Tambi´n es presentado el desarrollo del Esquema de Con- ı etrol Multi-Capas, que permite que cada parte del problema de control de formaci´n sea osolucionado por un m´dulo independiente, lo que aumenta su flexibilidad. Se propone oun controlador de formaci´n que posiciona los robots en una formaci´n fija o variable, en o oposici´n o en forma. Dicho controlador permite enfatizar la importancia del control del oposicionamiento o de la forma de la estructura virtual. La influencia de la compensaci´n odin´mica en dicho sistema es analizada e ilustrada por resultados de simulaci´n y tambi´n a o ede experimentos.
  • 10. Lista de Figuras1 (a) Robˆ manipulador industrial ABB (ABB V¨ster˚ Sweden, Acesso em: o a as 2/jan/2009); (b) Robˆ m´vel a rodas dotado de um robˆ manipulador a o o o bordo (KATZ et al., 2006). . . . . . . . . . . . . . . . . . . . . . . . . . . 292 Robˆ Ambiental H´ o ıbrido desenvolvido pela Petrobras (STEIN et al., 2007). 303 Postura de um robˆ uniciclo cujo ponto de interesse est´ (a) no ponto o a central do eixo que une as rodas de tra¸˜o; e (b) a uma distˆncia a desse ca a eixo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314 Modelo do Robˆ Uniciclo. . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 o5 Robˆs cujos parˆmetros foram identificados: (a) Robˆs Pioneer 2-DX com o a o computador (esquerda) e 3-DX (direita); (b) Cadeira de rodas rob´tica. . . 48 o6 Controlador cinem´tico: trajet´ria circular. (a) Parte da trajet´ria percor- a o o rida pelo robˆ; (b) Erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a identificados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597 Controlador cinem´tico: trajet´ria circular. (a) Velocidades linear e angu- a o lar enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante a o simula¸˜o com parˆmetros identificados. . . . . . . . . . . . . . . . . . . . 60 ca a8 Controlador cinem´tico: trajet´ria em forma de oito. (a) Parte da tra- a o jet´ria percorrida pelo robˆ; (b) erro de distˆncia durante a simula¸˜o com o o a ca parˆmetros identificados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 a9 Controlador cinem´tico: trajet´ria em forma de oito. (a) Velocidades linear a o e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade e o durante a simula¸˜o com parˆmetros identificados. . . . . . . . . . . . . . . 61 ca a10 Controlador cinem´tico: trajet´ria circular. (a) Parte da trajet´ria percor- a o o rida pelo robˆ; (b) erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a alterados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6211 Controlador cinem´tico: trajet´ria circular. (a) Velocidades linear e angu- a o lar enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante a o simula¸˜o com parˆmetros alterados. . . . . . . . . . . . . . . . . . . . . . 62 ca a
  • 11. 12 Controlador cinem´tico: trajet´ria em forma de oito. (a) Parte da tra- a o jet´ria percorrida pelo robˆ; (b) erro de distˆncia durante a simula¸˜o com o o a ca parˆmetros alterados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 a13 Controlador cinem´tico: trajet´ria em forma de oito. (a) Velocidades li- a o near e angular enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade o durante a simula¸˜o com parˆmetros alterados. . . . . . . . . . . . . . . . 64 ca a14 Controlador cinem´tico: trajet´ria em forma de oito. (a) Parte da tra- a o jet´ria percorrida pelo robˆ; (b) erro de distˆncia durante a simula¸˜o com o o a ca parˆmetros alterados e ganhos maiores. . . . . . . . . . . . . . . . . . . . . 64 a15 Diagrama geral do sistema de controle proposto. . . . . . . . . . . . . . . . 6616 Diagrama geral do sistema de controle proposto considerando adapta¸˜o ca de parˆmetros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 a17 Primeiro controlador dinˆmico: trajet´ria circular. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) Erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a alterados e sem adapta¸˜o. . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 ca18 Primeiro controlador dinˆmico: trajet´ria circular. (a) Velocidades linear e a o angular enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante o a simula¸˜o com parˆmetros alterados e sem adapta¸˜o. . . . . . . . . . . . 76 ca a ca19 Primeiro controlador dinˆmico: trajet´ria circular. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) Erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a alterados e com adapta¸˜o ativada. . . . . . . . . . . . . . . . . . . . . . . 76 ca20 Primeiro controlador dinˆmico: trajet´ria circular. (a) Velocidades linear e a o angular enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante o a simula¸˜o com parˆmetros alterados e com adapta¸˜o ativada. . . . . . . 77 ca a ca21 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a ca trajet´ria circular - primeiro controlador dinˆmico. . . . . . . . . . . . . . 78 o a22 Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o de o o ca parˆmetros; (b) erro de distˆncia durante a simula¸˜o com parˆmetros exatos. 79 a a ca a23 Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Velocida- a o des linear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de e o velocidade durante a simula¸˜o com parˆmetros exatos. . . . . . . . . . . . 79 ca a
  • 12. 24 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a ca trajet´ria em forma de oito com parˆmetros exatos - primeiro controlador o a dinˆmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 a25 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de longa dura¸˜o ca a ca ca para trajet´ria em forma de oito com parˆmetros exatos - primeiro contro- o a lador dinˆmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 a26 Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Parte a o da trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o o o ca de parˆmetros; (b) erro de distˆncia durante a simula¸˜o com parˆmetros a a ca a alterados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8227 Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Velocida- a o des linear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de e o velocidade durante a simula¸˜o com parˆmetros alterados. . . . . . . . . . 82 ca a28 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a ca trajet´ria em forma de oito com parˆmetros alterados - primeiro controla- o a dor dinˆmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 a29 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de longa dura¸˜o ca a ca ca para trajet´ria em forma de oito com parˆmetros alterados - primeiro con- o a trolador dinˆmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 a30 Segundo controlador dinˆmico: trajet´ria circular. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) Erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a alterados e sem adapta¸˜o de parˆmetros. . . . . . . . . . . . . . . . . . . 92 ca a31 Segundo controlador dinˆmico: trajet´ria circular. (a) Velocidades linear e a o angular enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante o a simula¸˜o com parˆmetros alterados e sem adapta¸˜o de parˆmetros. . . 93 ca a ca a32 Segundo controlador dinˆmico: trajet´ria circular. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) Erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a alterados e com adapta¸˜o de parˆmetros. . . . . . . . . . . . . . . . . . . 95 ca a33 Segundo controlador dinˆmico: trajet´ria circular. (a) Velocidades linear e a o angular enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante o a simula¸˜o com parˆmetros alterados e com adapta¸˜o de parˆmetros. . . 95 ca a ca a
  • 13. 34 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a ca trajet´ria circular - segundo controlador dinˆmico. . . . . . . . . . . . . . . 96 o a35 Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o de o o ca parˆmetros; (b) erro de distˆncia durante a simula¸˜o com parˆmetros exatos. 97 a a ca a36 Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Velocida- a o des linear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de e o velocidade durante a simula¸˜o com parˆmetros exatos. . . . . . . . . . . . 97 ca a37 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a ca trajet´ria em forma de oito com parˆmetros exatos - segundo controlador o a dinˆmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 a38 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de longa dura¸˜o ca a ca ca para trajet´ria em forma de oito com parˆmetros exatos - segundo contro- o a lador dinˆmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 a39 Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Parte a o da trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o o o ca de parˆmetros; (b) erro de distˆncia durante a simula¸˜o com parˆmetros a a ca a alterados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9940 Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Velocida- a o des linear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de e o velocidade durante a simula¸˜o com parˆmetros alterados. . . . . . . . . . 100 ca a41 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a ca trajet´ria em forma de oito com parˆmetros alterados - segundo controlador o a dinˆmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 a42 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de longa dura¸˜o ca a ca ca para trajet´ria em forma de oito com parˆmetros alterados - segundo con- o a trolador dinˆmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 a43 Robˆ Pioneer 3-DX com sensor de varredura laser e sistema de vis˜o om- o a nidirecional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10244 Controlador cinem´tico: trajet´ria em forma de oito. (a) Parte da tra- a o jet´ria percorrida pelo robˆ; (b) erro de distˆncia durante experimento o o a sem carga. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
  • 14. 45 Controlador cinem´tico: trajet´ria em forma de oito. (a) Velocidades linear a o e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade e o durante experimento sem carga. . . . . . . . . . . . . . . . . . . . . . . . . 10446 Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o de o o ca parˆmetros; (b) erro de distˆncia durante o experimento sem carga. . . . . 105 a a47 Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Velocida- a o des linear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de e o velocidade durante experimento sem carga. . . . . . . . . . . . . . . . . . . 10648 Evolu¸˜o dos parˆmetros estimados durante experimento de seguimento da ca a trajet´ria em forma de oito sem carga - primeiro controlador dinˆmico. . . 106 o a49 Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o de o o ca parˆmetros; (b) erro de distˆncia durante experimento com carga. . . . . . 107 a a50 Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Velocida- a o des linear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de e o velocidade durante experimento com carga. . . . . . . . . . . . . . . . . . . 10851 Evolu¸˜o dos parˆmetros estimados durante experimento de seguimento da ca a trajet´ria em forma de oito com carga - primeiro controlador dinˆmico. . . 108 o a52 Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ; (b) erro de distˆncia durante experimento o o a com parˆmetros identificados. . . . . . . . . . . . . . . . . . . . . . . . . . 109 a53 Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Velocida- a o des linear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de e o velocidade durante experimento com parˆmetros identificados. . . . . . . . 110 a54 Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ; (b) erro de distˆncia durante experimento o o a com parˆmetros incorretos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 a55 Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Velocida- a o des linear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de e o velocidade durante experimento com parˆmetros incorretos. . . . . . . . . . 111 a
  • 15. 56 Evolu¸˜o dos parˆmetros estimados durante experimento de seguimento da ca a trajet´ria em forma de oito com parˆmetros iniciais incorretos - segundo o a controlador dinˆmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 a57 Erro de distˆncia durante simula¸˜o com varia¸˜o em degrau dos parˆmetros a ca ca a dinˆmicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 a58 Erros de velocidade durante simula¸˜o com varia¸˜o em degrau dos parˆmetros. ca ca a (a) Durante todo o per´ ıodo de simula¸˜o; (b) Detalhe do intervalo em que ca a varia¸˜o de parˆmetros ocorre. . . . . . . . . . . . . . . . . . . . . . . . . 118 ca a59 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o com varia¸˜o em ca a ca ca degrau dos parˆmetros dinˆmicos. . . . . . . . . . . . . . . . . . . . . . . . 118 a a60 Erro de distˆncia durante simula¸˜o com varia¸˜o senoidal dos parˆmetros a ca ca a dinˆmicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 a61 Erros de velocidade durante simula¸˜o com varia¸˜o senoidal dos parˆmetros. ca ca a (a) Durante todo o per´ ıodo de simula¸˜o; (b) Detalhe do intervalo em que ca a varia¸˜o de parˆmetros ´ iniciada. . . . . . . . . . . . . . . . . . . . . . . 119 ca a e62 Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de longa dura¸˜o ca a ca ca com varia¸˜o senoidal dos parˆmetros dinˆmicos. . . . . . . . . . . . . . . 120 ca a a63 IAE para simula¸˜es de 250s para os casos (a-d ) (ver texto). . . . . . . . . 121 co64 IAE para experimentos de 75s para os casos (a) e (c) (ver texto). . . . . . 12265 Vari´veis de forma¸˜o e controle. . . . . . . . . . . . . . . . . . . . . . . . 135 a ca66 Medidas do sensor de varredura laser utilizado no robˆ seguidor. . . . . . . 136 o67 (a) Representa¸˜o dos robˆs l´ ca o ıder (com o semicilindro no topo) e seguidor num ambiente de simula¸˜o. (b) Vari´veis de forma¸˜o e medidas do sensor ca a ca ˜ laser. Fonte: (BRANDAO, 2008). . . . . . . . . . . . . . . . . . . . . . . 13768 Perfil das medidas do sensor laser no ambiente e a diferen¸a entre medidas c ˜ de distˆncia consecutivas. Fonte: (BRANDAO, 2008). . . . . . . . . . . . . 138 a69 Estrutura de controle de forma¸˜o l´ ca ıder-seguidor com compensa¸˜o da ca dinˆmica (robˆ seguidor). . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 a o70 Caminho percorrido pelos robˆs l´ o ıder e seguidor. . . . . . . . . . . . . . . . 14071 Evolu¸˜o das vari´veis de forma¸˜o sem compensa¸˜o da dinˆmica. . . . . 141 ca a ca ca a
  • 16. 72 Forma¸˜o l´ ca ıder-seguidor - com compensa¸˜o da dinˆmica e adapta¸˜o de ca a ca parˆmetros. (a) Vari´veis de forma¸˜o; (b) Parˆmetros estimados do robˆ a a ca a o seguidor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14173 Robˆs m´veis utilizados nos experimentos de controle de forma¸˜o l´ o o ca ıder- ˜ seguidor. Fonte: (BRANDAO, 2008). . . . . . . . . . . . . . . . . . . . . . 14274 Experimento de controle de forma¸˜o l´ ca ıder-seguidor: caminho percorrido pelo robˆ seguidor e mapa do ambiente obtido atrav´s das medi¸˜es do o e co sensor de varredura laser. . . . . . . . . . . . . . . . . . . . . . . . . . . . 14475 Experimento de controle de forma¸˜o l´ ca ıder-seguidor: evolu¸˜o das vari´veis ca a de forma¸˜o sem compensa¸˜o da dinˆmica. . . . . . . . . . . . . . . . . . 144 ca ca a76 Experimento de controle de forma¸˜o l´ ca ıder-seguidor com compensa¸˜o da ca dinˆmica e adapta¸˜o de parˆmetros: (a) Vari´veis de forma¸˜o; (b) Parˆmetros a ca a a ca a estimados do robˆ seguidor. . . . . . . . . . . . . . . . . . . . . . . . . . . 145 o77 Duas formas de se definir as vari´veis de forma¸˜o (De La CRUZ, 2006). . 146 a ca78 Defini¸˜o das vari´veis de forma¸˜o (De La CRUZ, 2006). . . . . . . . . . . 150 ca a ca79 Arquiteturas de controle centralizado de forma¸˜o: (a) compensa¸˜o da ca ca dinˆmica dos robˆs realizada pelo agente de controle centralizado; e (b) a o compensa¸˜o da dinˆmica realizada por cada robˆ membro da forma¸˜o. . 152 ca a o ca80 Controle centralizado de forma¸˜o: (a) trajet´ria percorrida pelos robˆs; e ca o o (b) evolu¸˜o dos erros de forma¸˜o durante a primeira simula¸˜o. . . . . . 153 ca ca ca81 Controle centralizado de forma¸˜o: evolu¸˜o dos parˆmetros dinˆmicos dos ca ca a a robˆs (a) 1 e (b) 2 durante a primeira simula¸˜o. . . . . . . . . . . . . . . 154 o ca82 Controle centralizado de forma¸˜o: (a) trajet´ria percorrida pelos robˆs; e ca o o (b) evolu¸˜o dos erros de forma¸˜o durante a segunda simula¸˜o. . . . . . . 155 ca ca ca83 Controle centralizado de forma¸˜o: evolu¸˜o dos parˆmetros dinˆmicos dos ca ca a a robˆs (a) 1 e (b) 2 durante a segunda simula¸˜o. . . . . . . . . . . . . . . . 155 o ca84 Arquitetura do Esquema Multicamadas proposto. . . . . . . . . . . . . . . 15785 Vari´veis de forma¸˜o. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 a ca86 Resultados de Simula¸˜o. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 ca
  • 17. 87 Esquema Multicamadas - trajet´rias percorridas durante experimento sem o carga, sem compensa¸˜o da dinˆmica: (a) forma¸˜o desejada fixa, e (b) ca a ca forma¸˜o desejada variando. . . . . . . . . . . . . . . . . . . . . . . . . . . 168 ca88 Esquema Multicamadas - erros de forma¸˜o durante experimento sem carga, ca sem compensa¸˜o da dinˆmica. . . . . . . . . . . . . . . . . . . . . . . . . 169 ca a89 Esquema Multicamadas - a¸˜es de controle enviadas aos robˆs durante co o experimento sem carga, sem compensa¸˜o da dinˆmica. . . . . . . . . . . . 169 ca a90 Esquema Multicamadas - trajet´rias percorridas durante experimento sem o carga, com compensa¸˜o adaptativa da dinˆmica: (a) forma¸˜o desejada ca a ca fixa, e (b) forma¸˜o desejada variando. . . . . . . . . . . . . . . . . . . . . 170 ca91 Esquema Multicamadas - erros de forma¸˜o durante experimento sem carga, ca com compensa¸˜o adaptativa da dinˆmica. . . . . . . . . . . . . . . . . . . 171 ca a92 Esquema Multicamadas - a¸˜es de controle enviadas aos robˆs durante co o experimento sem carga, com compensa¸˜o da dinˆmica. . . . . . . . . . . . 171 ca a93 Esquema Multicamadas - evolu¸˜o dos parˆmetros dinˆmicos estimados ca a a durante experimento sem carga, com compensa¸˜o adaptativa da dinˆmica. ca a (a) Robˆ 1, (b) Robˆ 2, e (c) Robˆ 3. . . . . . . . . . . . . . . . . . . . . . 173 o o o94 Esquema Multicamadas - trajet´rias percorridas durante experimento com o carga, sem compensa¸˜o da dinˆmica: (a) forma¸˜o desejada fixa, e (b) ca a ca forma¸˜o desejada variando. . . . . . . . . . . . . . . . . . . . . . . . . . . 174 ca95 Esquema Multicamadas - erros de forma¸˜o durante experimento com carga, ca sem compensa¸˜o da dinˆmica. . . . . . . . . . . . . . . . . . . . . . . . . 174 ca a96 Esquema Multicamadas - a¸˜es de controle enviadas aos robˆs durante co o experimento com carga, sem compensa¸˜o da dinˆmica. . . . . . . . . . . . 175 ca a97 Esquema Multicamadas - trajet´rias percorridas durante experimento com o carga, com compensa¸˜o adaptativa da dinˆmica: (a) forma¸˜o desejada ca a ca fixa, e (b) forma¸˜o desejada variando. . . . . . . . . . . . . . . . . . . . . 175 ca98 Esquema Multicamadas - erros de forma¸˜o durante experimento com carga, ca com compensa¸˜o adaptativa da dinˆmica. . . . . . . . . . . . . . . . . . . 176 ca a99 Esquema Multicamadas - a¸˜es de controle enviadas aos robˆs durante co o experimento com carga, com compensa¸˜o da dinˆmica. . . . . . . . . . . . 176 ca a
  • 18. 100 Esquema Multicamadas - evolu¸˜o dos parˆmetros dinˆmicos estimados ca a a durante experimento com carga, com compensa¸˜o adaptativa da dinˆmica. ca a (a) Robˆ 1, (b) Robˆ 2, e (c) Robˆ 3. . . . . . . . . . . . . . . . . . . . . . 177 o o o101 Simula¸˜o do controle de quatro robˆs com escalonamento proposto. As ca o figuras apresentam o deslocamento dos robˆs e a forma¸˜o desejada fixa o ca em trˆs momentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 e
  • 19. Lista de Tabelas1 IAE para simula¸˜es do controle descentralizado tipo l´ co ıder-seguidor . . . . 1412 IAE para experimentos do controle descentralizado tipo l´ ıder-seguidor . . . 1443 IAE para simula¸˜es do controle centralizado tipo estruturas virtuais . . . 166 co4 IAE para experimentos do controle centralizado tipo estruturas virtuais . . 178
  • 20. Sum´rio a1 Introdu¸˜o ca 27 1.1 Defini¸˜o do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 ca 1.2 Contribui¸˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 co 1.3 Estrutura da Tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 Modelo Dinˆmico do Robˆ M´vel a o o 37 2.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 ca 2.2 Modelo do Robˆ Uniciclo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 o 2.3 Proposta de Representa¸˜o do Modelo Dinˆmico . . . . . . . . . . . . . . . 41 ca a 2.4 Propriedades do Modelo Dinˆmico Proposto . . . . . . . . . . . . . . . . . 44 a 2.5 Identifica¸˜o dos Parˆmetros Dinˆmicos ca a a . . . . . . . . . . . . . . . . . . . 46 2.6 Independˆncia Linear dos Parˆmetros . . . . . . . . . . . . . . . . . . . . . 51 e a 2.7 Considera¸˜es Finais do Cap´ co ıtulo . . . . . . . . . . . . . . . . . . . . . . . 523 Compensa¸˜o Adaptativa da Dinˆmica ca a 53 3.1 Introdu¸˜o e Trabalhos Relacionados . . . . . . . . . . . . . . . . . . . . . 53 ca 3.2 Controlador Cinem´tico de Seguimento de Trajet´ria . . . . . . . . . . . . 56 a o 3.3 Controladores Dinˆmicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 a 3.3.1 Primeiro Controlador Dinˆmico . . . . . . . . . . . . . . . . . . . . 65 a 3.3.1.1 Adapta¸˜o de Parˆmetros . . . . . . . . . . . . . . . . . . 68 ca a 3.3.1.2 Resultados de Simula¸˜o . . . . . . . . . . . . . . . . . . . 74 ca 3.3.2 Segundo Controlador Dinˆmico . . . . . . . . . . . . . . . . . . . . 84 a 3.3.2.1 Adapta¸˜o de Parˆmetros . . . . . . . . . . . . . . . . . . 87 ca a 3.3.2.2 Resultados de Simula¸˜o . . . . . . . . . . . . . . . . . . . 91 ca 3.4 Resultados Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
  • 21. 3.4.1 Controlador Cinem´tico . . . . . . . . . . . . . . . . . . . . . . . . 103 a 3.4.2 Primeiro Controlador Dinˆmico . . . . . . . . . . . . . . . . . . . . 104 a 3.4.3 Segundo Controlador Dinˆmico . . . . . . . . . . . . . . . . . . . . 109 a 3.5 Considera¸˜es sobre a Robustez . . . . . . . . . . . . . . . . . . . . . . . . 112 co 3.6 Compara¸˜o de Desempenho . . . . . . . . . . . . . . . . . . . . . . . . . . 119 ca 3.7 Considera¸˜es Finais do Cap´ co ıtulo . . . . . . . . . . . . . . . . . . . . . . . 1224 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca a 125 4.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 ca 4.2 Trabalhos Relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 4.3 Controle Descentralizado de uma Forma¸˜o L´ ca ıder-Seguidor . . . . . . . . . 133 4.3.1 Estrat´gia de Controle . . . . . . . . . . . . . . . . . . . . . . . . . 133 e 4.3.2 Compensa¸˜o da Dinˆmica do Robˆ Seguidor . . . . . . . . . . . . 138 ca a o 4.3.3 Resultados de Simula¸˜o . . . . . . . . . . . . . . . . . . . . . . . . 139 ca 4.3.4 Resultados Experimentais . . . . . . . . . . . . . . . . . . . . . . . 142 4.4 Primeiro Esquema de Controle Centralizado de Forma¸˜o . . . . . . . . . . 145 ca 4.4.1 Modelo Cinem´tico de um Sistema Multirrobˆs . . . . . . . . . . . 146 a o 4.4.2 Transforma¸ao de coordenadas . . . . . . . . . . . . . . . . . . . . . 147 c˜ 4.4.3 Lei de Controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 4.4.4 Compensa¸˜o da Dinˆmica dos Robˆs da Forma¸˜o . . . . . . . . . 151 ca a o ca 4.4.5 Resultados de Simula¸˜o . . . . . . . . . . . . . . . . . . . . . . . . 153 ca 4.5 Segundo Esquema de Controle Centralizado de Forma¸˜o . . . . . . . . . . 156 ca 4.5.1 Esquema Multicamadas . . . . . . . . . . . . . . . . . . . . . . . . 156 4.5.2 Cinem´tica Direta e Inversa de Forma¸˜o . . . . . . . . . . . . . . . 159 a ca 4.5.3 Lei de Controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 4.5.4 Compensa¸˜o da Dinˆmica dos Robˆs da Forma¸˜o . . . . . . . . . 162 ca a o ca 4.5.5 Resultados de Simula¸˜o . . . . . . . . . . . . . . . . . . . . . . . . 163 ca
  • 22. 4.5.6 Resultados Experimentais . . . . . . . . . . . . . . . . . . . . . . . 166 4.5.7 Sobre o Escalonamento da Forma¸˜o . . . . . . . . . . . . . . . . . 178 ca 4.6 Considera¸˜es Finais do Cap´ co ıtulo . . . . . . . . . . . . . . . . . . . . . . . 1815 Conclus˜es o 183Referˆncias e 187
  • 23. 27 1Introdu¸ao c˜ “I am C-3PO, Human-Cyborg relations. And this is my counterpart, R2-D2.” (C-3PO, em Star Wars Episode IV: A New Hope) Robˆs s˜o dispositivos capazes de realizar as mais diversas atividades com algum grau o ade autonomia. Atualmente, existem robˆs realizando tarefas em ind´strias, em residˆncias o u ee at´ no espa¸o (BEKEY; YUH, 2008), muitos deles substituindo o trabalho humano e cem atividades perigosas, como explora¸˜o espacial ou submarina, repara¸˜o de sat´lites, ca ca edesarmamento de dispositivos explosivos, trabalho em ambientes radioativos, entre outros(SPONG; HUTCHINSON; VIDYASAGAR, 2006). Robˆs tamb´m s˜o utilizados para o e arealiza¸˜o de tarefas repetitivas e que exigem grande precis˜o, de realiza¸˜o muito dif´ ca a ca ıcilou imposs´ por seres humanos. ıvel Uma defini¸˜o oficial para o termo robˆ ´ dada pelo Robot Institute of America (RIA) ca oe(SPONG; HUTCHINSON; VIDYASAGAR, 2006): “Um robˆ ´ um manipulador repro- oegram´vel, multifuncional, projetado para movimentar material, ferramentas ou disposi- ativos especializados atrav´s de movimentos program´veis variados para desenvolver uma e avariedade de tarefas”. O elemento chave da defini¸˜o anterior ´ a reprograma¸˜o, que ca e cad´ ao robˆ sua caracter´ a o ıstica de adaptabilidade. Tal defini¸˜o ´ aplicada a robˆs mani- ca e opuladores, que possuem estrutura mecˆnica formada por uma s´rie de hastes conectadas a epor meio de juntas. A realiza¸˜o de uma tarefa requer a movimenta¸˜o de suas juntas, ca capara que sua extremidade se movimente ao longo de uma trajet´ria definida, de modo oque sua ferramenta possa alcan¸ar os pontos necess´rios, com a orienta¸˜o desejada, para c a carealiza¸˜o da tarefa especificada. Usualmente os robˆs manipuladores executam tarefas ca ode movimenta¸˜o de objetos na ind´stria de manufatura, pintura e soldagem na ind´stria ca u uautomobil´ ıstica, entre outras (BEKEY; YUH, 2008). Atualmente, o mercado de robˆs oindustriais est´ estimado em cerca de US$4 bilh˜es, com uma taxa anual de crescimento a o
  • 24. 28 1 Introdu¸˜o caem torno de 4% (BEKEY; YUH, 2008). Um exemplo de robˆ manipulador ´ mostrado o ena Figura 1(a). Uma classe de robˆs que tem aumentado de importˆncia, devido ao n´mero de o a uaplica¸˜es, ´ a de robˆs de servi¸os. Essa classe inclui robˆs que realizam servi¸os de co e o c o cutilidade aos seres humanos ou equipamentos, excluindo-se opera¸˜es de manufatura. coNela est˜o os robˆs que auxiliam em tarefas como busca e resgate, assistˆncia dom´stica a o e e(como aspiradores de p´ e cortadores de grama), entretenimento (futebol de robˆs, robˆs o o oque se comportam como animais de estima¸˜o) e assistˆncia a pessoas com deficiˆncia ca e e(como cadeiras de rodas rob´ticas e dispositivos de aux´ ao caminhar) (ROMANO, o ılio2002). Levando-se em considera¸˜o aplica¸˜es profissionais e dom´sticas, robˆs de servi¸o ca co e o cj´ formam um mercado de mais de US$3,5 bilh˜es (BEKEY; YUH, 2008). A importˆncia a o ado mercado de robˆs de servi¸os ´ evidenciada quando se verifica que existem cerca de 5,5 o c emilh˜es de unidades desse tipo de robˆ em funcionamento no mundo, enquanto a quanti- o odade de robˆs industriais ´ de cerca de 1 milh˜o (NOGUEIRA, Acesso em: 28/fev/2009). o e a Muitos robˆs de servi¸o s˜o robˆs m´veis. Um robˆ m´vel pode se deslocar no solo o c a o o o o(atrav´s de rodas, esteiras, patas, etc.), no ar (como um helic´ptero, avi˜o ou bal˜o), na e o a a´gua (como um navio ou submarino) ou no espa¸o, e ´ definido como um ve´a c e ıculo capazde movimenta¸˜o autˆnoma, equipado com atuadores controlados por um computador ca oembarcado (CANUDAS de WIT; SICILIANO; BASTIN, 1997). Um robˆ m´vel pode ter o oa bordo um robˆ manipulador, como ´ o caso do robˆ m´vel a rodas desenvolvido na o e o oUniversidade de Massachusetts Amherst, ilustrado na Figura 1(b). Um exemplo de robˆ de servi¸o ´ o Robˆ Ambiental H´ o c e o ıbrido, mostrado na Figura 2,que foi desenvolvido pelo CENPES/Petrobras. Tal robˆ dever´ operar ao longo de linhas o ade g´s natural ao longo do Rio Solim˜es, na regi˜o Amazˆnica, com objetivo de auxiliar a o a ona coleta de amostras e dados sobre o ecossistema, de forma a minimizar a necessidadede envio de pessoas a regi˜es em que existe constante presen¸a de animais selvagens e o cinsetos transmissores de doen¸as perigosas, al´m de permitir acesso a lugares inacess´ c e ıveisao homem. O robˆ ´ capaz de se locomover na ´gua e na terra, possui um manipulador a oe abordo, para coleta de amostras, e permite o embarque de diversos equipamentos e sensores.O sistema de navega¸˜o proposto utiliza fus˜o de dados obtidos atrav´s de um receptor ca a eGPS e de sensores inerciais (STEIN et al., 2007).
  • 25. 1.1 Defini¸˜o do Problema ca 29 (a) (b) Figura 1: (a) Robˆ manipulador industrial ABB (ABB V¨ster˚ Sweden, Acesso em: o a as 2/jan/2009); (b) Robˆ m´vel a rodas dotado de um robˆ manipulador a bordo (KATZ o o o et al., 2006).1.1 Defini¸˜o do Problema ca O problema que esta tese pretende resolver trata de robˆs m´veis a rodas. Dentre o oas distintas estruturas de robˆs m´veis, a de tipo uniciclo ´ frequentemente1 utilizada o o eem v´rias tarefas, devido ` sua boa mobilidade e configura¸˜o simples. Como exemplo, a a caesta estrutura tem sido utilizada em aplicac˜es de vigilˆncia (PATEL; SANYAL; SOBH, o a2006), limpeza de pisos (PRASSLER et al., 2000), manuten¸˜o e constru¸˜o de autopistas ca ca(FENG; VELINSKY, 1997), cadeiras de rodas rob´ticas (RAO et al., 2002; FERREIRA oet al., 2007; FERREIRA, 2008), navega¸˜o em planta¸˜es (vinhedos e outras frutas) ca co ˜para diagn´stico das plantas (PENIZZOTTO; PATINO; CARELLI, 2008) e transporte ode cargas em ambientes industriais (STOUTEN; GRAAF, 2004). Um robˆ uniciclo possui duas rodas de tra¸˜o independentes, fixas e dispostas sobre o ca 1 O texto desta tese foi escrito segundo as normas do Acordo Ortogr´fico da L´ a ıngua Portuguesa,assinado em Lisboa, em 16 de dezembro de 1990, por Portugal, Brasil, Angola, S˜o Tom´ e Pr´ a e ıncipe,Cabo Verde, Guin´-Bissau, Mo¸ambique e, posteriormente, por Timor Leste. No Brasil, o acordo foi e caprovado pelo Decreto Legislativo 54, de 18 de abril de 1995, e suas normas passaram a vigorar em01/01/2009 (TUFANO, 2008).
  • 26. 30 1 Introdu¸˜o ca Figura 2: Robˆ Ambiental H´ o ıbrido desenvolvido pela Petrobras (STEIN et al., 2007).um mesmo eixo. Tamb´m disp˜e de uma roda independente, que gira livremente e serve e opara equilibrar e estrutura. Assumindo que sua estrutura ´ r´ e ıgida e que suas rodas n˜o ase deformam e n˜o deslizam, a postura de um robˆ uniciclo ´ dada por (CANUDAS de a o eWIT; SICILIANO; BASTIN, 1997) x = u cos ψ; ˙ y = u sin ψ; ˙ ˙ ψ = ω,onde x e y representam a posi¸˜o do ponto de interesse h (nesse caso, localizado no ponto cacentral do eixo virtual que une as rodas de tra¸˜o), ψ representa a orienta¸˜o do robˆ (ou ca ca oseja, a dire¸˜o de u em rela¸˜o ao eixo X), e u e ω s˜o suas velocidades linear e angular, ca ca arespectivamente. A Figura 3(a) ilustra a postura do robˆ uniciclo para este caso. Tal orobˆ ´ uma plataforma n˜o-holonˆmica, pois a quantidade de graus de liberdade ´ menor oe a o edo que o n´mero de coordenadas generalizadas e a velocidade linear do ponto de interesse uao longo do eixo que une as rodas de tra¸˜o ´ nula. ca e Para o caso em que o ponto de interesse h ´ definido a uma distˆncia a do eixo que e aune as rodas de tra¸˜o, tem-se o modelo cinem´tico n˜o-holonˆmico de acessibilidade me- ca a a olhorada, ilustrado na Figura 3(b). Nesse caso, a postura do robˆ ´ definida por (ZHANG oe
  • 27. 1.1 Defini¸˜o do Problema ca 31 (a) (b)Figura 3: Postura de um robˆ uniciclo cujo ponto de interesse est´ (a) no ponto central o a do eixo que une as rodas de tra¸˜o; e (b) a uma distˆncia a desse eixo. ca aet al., 1998) x = u cos ψ − aω sin ψ; ˙ y = u sin ψ + aω cos ψ; ˙ ˙ ψ = ω. No modelo n˜o-holonˆmico de acessibilidade melhorada, o ponto de interesse h possui a omenos restri¸˜es de movimento no plano, tendo maior alcance. Em qualquer dos casos, a copostura do robˆ, dada pelo vetor [x, y, ψ]T , pode assumir qualquer valor, n˜o havendo o arestri¸˜es para o posicionamento do ponto h no plano. Neste trabalho ser´ adotado o co amodelo n˜o-holonˆmico de acessibilidade melhorada, ilustrado na Figura 3(b). a o A teoria de controle n˜o-linear tem sido aplicada no estudo do robˆ m´vel unici- a o oclo h´ anos (KANAYAMA et al., 1990; CANUDAS de WIT C.; SORDALEN, 1992). aV´rios estudos tˆm tratado do projeto de controladores de seguimento de trajet´ria, e a e odo problema de gera¸˜o de trajet´rias para estes robˆs (FRAGA; SOUSA; PEREIRA, ca o o2003). Alguns controladores foram projetados com base em seu modelo cinem´tico, como aaqueles apresentados em (CARELLI; SECCHI; MUT, 1999) e (WU et al., 1999). Noentanto, para execu¸ao de tarefas que requerem deslocamento em altas velocidades ou c˜transporte de cargas, ´ fundamental considerar a dinˆmica dos ve´ e a ıculos. Por isso, algunsestudos apresentam o projeto de controladores que compensam a dinˆmica dos robˆs. a oPor exemplo, Fierro e Lewis (1995) apresentaram uma lei de controle para robˆs m´veis o on˜o-holonˆmicos que leva em considera¸˜o a dinˆmica do ve´ a o ca a ıculo, e gera sinais de torquecomo comandos para o robˆ m´vel controlado. Em (KIM; SHIN; LEE, 2000) foi proposto o oum controlador adaptativo para robˆs m´veis, dividido em duas partes: a primeira ´ ba- o o e
  • 28. 32 1 Introdu¸˜o caseada na cinem´tica do ve´ a ıculo, e gera sinais de referˆncia para a segunda, que compensa esua dinˆmica e gera sinais de torque para comandar o robˆ. J´ em (DAS; KAR, 2006) a o afoi proposto um controlador adaptativo em que a incerteza do sistema era estimada porum sistema baseado em l´gica fuzzy. O modelo dinˆmico usado em tal trabalho inclui a o adinˆmica dos atuadores, e os sinais de controle gerados s˜o tens˜es para os motores do a a orobˆ. o A maior parte dos controladores que realizam a compensa¸˜o da dinˆmica de robˆs ca a om´veis presentes na literatura geram sinais de torque, como nos trabalhos mencionados oanteriormente. No entanto, robˆs m´veis comerciais usualmente recebem sinais de velo- o ocidade como comandos, n˜o torques, como ´ o caso dos robˆs Pioneer da empresa Mobile a e oRobots (Mobile Robots, Acesso em: 30/jun/2008), e dos robˆs Khepera da K-Team Cor- oporation (K-Team Corporation, Acesso em: 3/jan/2009). Por isso, um dos problemasque esta tese aborda ´ o desenvolvimento de controladores que realizem a compensa¸˜o e cada dinˆmica de robˆs m´veis, de forma adaptativa, gerando velocidades como sinais de a o ocomando para os robˆs. o Por outro lado, algumas tarefas s˜o de dif´ execu¸˜o por apenas um robˆ, ou s˜o a ıcil ca o aexecutadas de maneira mais eficiente por um grupo de robˆs trabalhando de forma co- oordenada. A utiliza¸˜o de diversos robˆs mais simples pode levar ` execu¸˜o de tarefas ca o a cade forma mais barata, tolerante a falhas e flex´ ıvel, quando comparada ao uso de umunico robˆ de maior capacidade (CAO; FUKUNAGA; KAHNG, 1997). Alguns exemplos´ ode tais tarefas s˜o busca e resgate de pessoas, vigilˆncia de uma grande ´rea ou busca a a ae seguimento de um per´ ımetro (FEDDEMA; LEWIS; SCHOENWALD, 2002; CLARK;FIERRO, 2005). O posicionamento de sensores e atuadores tamb´m pode ser realizado ede forma coordenada por um grupo de robˆs, de forma que medi¸˜es de grandezas pos- o cosam ser efetuadas em grandes ´reas de maneira eficiente (BICCHI et al., 2008). Outros aexemplos de tarefas que podem ser executadas de forma mais eficiente por um grupo derobˆs s˜o deslocamento ou transporte de cargas, mapeamento de grandes ´reas, busca o a ae desarmamento de minas terrestres, explora¸˜o espacial e algumas tarefas de entreteni- camento, como futebol de robˆs (STILWELL; BISHOP, 2000; AIRES; ALSINA; MEDEI- oROS, 2001; FEDDEMA; LEWIS; SCHOENWALD, 2002; LAWTON; BEARD; YOUNG,2003; BRAGANCA, 2004; SISTO; GU, 2006; WANG; WU; XU, 2006; LIANG; LEE, ¸2006; De La CRUZ; CARELLI, 2006). Fierro e Das (2002) argumentam que incertezas na dinˆmica do ve´ a ıculo causam de-grada¸˜o no sistema em malha fechada, provocando erros durante o seguimento de uma catrajet´ria, por exemplo. Mencionam, inclusive, que o erro que ´ tolerado para um unico o e ´
  • 29. 1.2 Contribui¸˜es co 33ve´ ıculo considerado individualmente pode n˜o ser aceit´vel quando os robˆs necessitam a a onavegar mantendo uma forma¸˜o. Por exemplo, numa tarefa em que v´rios robˆs devem ca a osustentar uma mesma carga e translad´-la, a manuten¸˜o da estrutura de forma¸˜o ´ de a ca ca eextrema importˆncia para que o deslocamento da carga ao longo da trajet´ria desejada a oseja realizado com sucesso. Nesse contexto, outro problema abordado por esta tese ´ o controle coordenado de um egrupo de robˆs m´veis tipo uniciclo, de maneira que eles alcancem e se mantenham numa o oforma¸˜o desejada, compensando sua pr´pria dinˆmica de forma adaptativa. O grupo de ca o arobˆs deve percorrer uma trajet´ria definida por um agente de controle de mais alto n´ o o ıvel,ou executar a tarefa de seguimento de l´ ıder. O estado da arte em rela¸˜o aos temas tratados nesta tese ´ discutido com mais ca edetalhes nos cap´ ıtulos seguintes, cada um dos quais trata de um aspecto importante doproblema abordado ao longo do trabalho.1.2 Contribui¸˜es co No intuito de se resolver os problemas definidos na se¸˜o 1.1, diversos trabalhos foram carealizados, e resultaram nas contribui¸˜es mencionadas a seguir. co A primeira contribui¸˜o est´ relacionada ` representa¸˜o do modelo dinˆmico de um ca a a ca arobˆ m´vel tipo uniciclo. O modelo dinˆmico apresentado por De La CRUZ (2006), que o o arecebe sinais de velocidade linear e angular como entradas, foi reescrito, e suas propri-edades foram estudadas. A proposta da´ resultante ´ que a representa¸˜o do modelo ı e cadinˆmico do robˆ m´vel seja feita de maneira similar ` representa¸˜o da dinˆmica dos a o o a ca arobˆs manipuladores. A equa¸˜o resultante teve algumas propriedades estudadas e pro- o cavadas e estas podem ser utilizadas no projeto e an´lise de estabilidade de sistemas de acontrole desenvolvidos com base no modelo proposto. Outras contribui¸˜es est˜o relacionadas ao desenvolvimento de controladores para co arobˆs m´veis. Foram desenvolvidos controladores dinˆmicos adaptativos para seguimento o o ade trajet´ria, sendo um deles baseado no modelo proposto por De La CRUZ (2006) e ooutro baseado no modelo proposto nesta tese. Foi mostrado que ambos possuem resulta-dos similares, o que valida o modelo aqui proposto. O comportamento dos controladorespropostos foi estudado atrav´s de simula¸˜es e experimentos realizados em robˆs comerci- e co oais, cujos resultados mostram que os controladores propostos s˜o capazes de fazer o robˆ a oseguir uma trajet´ria determinada, enquanto realizam a compensa¸˜o adaptativa de sua o ca
  • 30. 34 1 Introdu¸˜o cadinˆmica. Al´m disso, a estabilidade dos sistemas resultantes foi estudada com base na a eteoria de Lyapunov2 , e provou-se que os erros de controle tendem a zero ou a uma regi˜o alimitada em torno da origem. A robustez do sistema tamb´m foi estudada, e mostrou- ese que este ´ capaz de tolerar dist´rbios limitados e varia¸˜es limitadas nos parˆmetros e u co adinˆmicos dos robˆs, mantendo limitados os erros de controle. a o Foi mostrado, atrav´s de simula¸˜es e experimentos, que os controladores adaptativos e copropostos podem ser aplicados a sistemas multirrobˆs, tanto em conex˜o com um sistema o ade controle centralizado como em conex˜o com um sistema de controle descentralizado, apara realizar a compensa¸˜o da dinˆmica dos ve´ ca a ıculos membros do grupo. Foi apresentadoo Esquema de Controle Multicamadas, que permite que cada parte do problema de con-trole de forma¸˜o seja resolvido por um m´dulo independente, aumentando a flexibilidade ca odo sistema como um todo. Tamb´m foi proposto um controlador que posiciona os robˆs e onuma forma¸˜o que pode ser fixa ou vari´vel, tanto em posi¸˜o como em forma, sendo ca a caposs´ enfatizar a importˆncia do controle de posicionamento ou de forma da forma¸˜o. ıvel a caA influˆncia da compensa¸˜o dinˆmica neste controle de forma¸˜o foi analisada e ilustrada e ca a caatrav´s de resultados de simula¸˜o e experimentais. e ca Artigos sobre partes do trabalho desenvolvido nesta tese foram apresentados e publi-cados em congressos nacionais e internacionais (MARTINS et al., 2007a, 2007b, 2007c, ˜2008, 2008a, 2008b, 2008c, 2008d, 2008e, 2009; BRANDAO et al., 2009a; RAMPINELLIet al., 2009b). Alguns artigos foram enviados para poss´ apresenta¸˜o em congressos e ıvel caestavam sob avalia¸˜o no momento do fechamento da vers˜o final desta tese (BRANDAO ca a ˜et al., 2009b; MARTINS et al., 2009; RAMPINELLI et al., 2009a). Parte deste trabalhotamb´m resultou em publica¸˜o em revista internacional (MARTINS et al., 2008). e ca1.3 Estrutura da Tese Esta tese est´ estruturada como segue: o primeiro cap´ a ıtulo traz uma introdu¸˜o ao catema pesquisado, citando as contribui¸˜es alcan¸adas. Tamb´m s˜o mencionados alguns co c e atrabalhos relacionados aos temas principais. O Cap´ ıtulo 2, por sua vez, aborda o modelo dinˆmico do robˆ uniciclo e apresenta a o 2 Aleksandr Mikhailovitch Lyapunov (6/06/1857 - 03/11/1918), matem´tico russo nascido em Yaros- alavl, foi aluno de Tchebyshev na Universidade de S˜o Petersburgo e deixou uma cole¸˜o de estudos a cade grande importˆncia sobre equil´ a ıbrio de l´ ıquidos rotativos, probabilidade e estabilidade de sistemasdinˆmicos. Desenvolveu seu pr´prio conceito de estabilidade, que ´ adotado at´ o presente em diver- a o e esos trabalhos na ´rea de controle autom´tico. (University of St Andrews, School of Mathematics and a aStatistics, Acesso em: 18/nov/2008).
  • 31. 1.3 Estrutura da Tese 35uma proposta para sua representa¸˜o matem´tica. S˜o apresentadas e provadas algumas ca a apropriedades do modelo proposto, que podem ser uteis no projeto de controladores e na ´an´lise de estabilidade dos sistemas projetados com base em tal modelo. a J´ no Cap´ a ıtulo 3 s˜o apresentados um controlador cinem´tico e dois controladores a adinˆmicos adaptativos, sendo um deles baseado no modelo proposto no Cap´ a ıtulo 2. Algu-mas das propriedades do modelo proposto s˜o utilizadas no projeto do segundo controlador adinˆmico. S˜o realizadas an´lises de estabilidade dos sistemas em malha fechada, consi- a a aderando a utiliza¸˜o de cada controlador proposto. A robustez do sistema em rela¸˜o a ca cadist´rbios e varia¸˜o de parˆmetros dinˆmicos tamb´m ´ avaliada. Tamb´m s˜o apresen- u ca a a e e e atados resultados de simula¸˜o e resultados experimentais que ilustram o funcionamento cado sistema em cada caso. O Cap´ ıtulo 4 trata dos sistemas multirrobˆs, enfatizando o controle de forma¸˜o o cacom compensa¸˜o da dinˆmica. Os controladores dinˆmicos adaptativos desenvolvidos ca a ano Cap´ ıtulo 3 s˜o utilizados para compensa¸˜o da dinˆmica dos robˆs da forma¸˜o, e tal a ca a o casitua¸˜o ´ ilustrada em trˆs cen´rios: um de controle descentralizado tipo l´ ca e e a ıder-seguidor,e dois de controle centralizado tipo estruturas virtuais. Uma das estrat´gias de controle ecentralizado ´ aqui proposta, sendo apresentados o desenvolvimento do Esquema de Con- etrole Multi-Camadas, que permite que cada parte do problema de controle de forma¸˜o ca o ´seja resolvido por um m´dulo independente. E proposto um controlador de forma¸˜o que caposiciona os robˆs numa forma¸˜o que pode ser fixa ou vari´vel, tanto em posi¸˜o como o ca a caem forma, sendo poss´ enfatizar a importˆncia do controle de posicionamento ou de ıvel aforma. A influˆncia da compensa¸˜o dinˆmica neste controle de forma¸˜o ´ analisada e e ca a ca eilustrada atrav´s de resultados de simula¸˜o e de experimentos. e ca O estado da arte relacionado com cada um dos temas abordados nos Cap´ ıtulos 3 e 4´ discutido no cap´e ıtulo correspondente. Finalmente, o Cap´ ıtulo 5 apresenta as conclus˜es e considera¸˜es finais. o co
  • 32. 36 1 Introdu¸˜o ca
  • 33. 37 2Modelo Dinˆmico do Robˆ M´vel a o o “I am an obsolete design.” (Exterminador T800 comparando-se ao T-X, em Terminator 3: Rise of the Machines)2.1 Introdu¸˜o ca A equa¸˜o cl´ssica para representa¸˜o da dinˆmica de robˆs m´veis pode ser obtida ca a ca a o oa partir da formula¸˜o Lagrangeana, que resulta na representa¸˜o do modelo dinˆmico ca ca acomo (FUKAO; NAKAGAWA; ADACHI, 2000) M(q)¨ + Vm (q, q)q + Fm (q) + Gm (q) + τd = B(q)τ − AT (q)λ, q ˙ ˙ ˙ (2.1)onde q = [q1 q2 ... qn ]T ´ o vetor das coordenadas generalizadas do sistema com n egraus de liberdade, M(q) ∈ Rn×n ´ a matriz de in´rcia, Vm (q, q) ∈ Rn×n ´ a matriz de e e ˙ e c ıfugas e de Coriolis, Fm (q) ∈ Rn×1 ´ o vetor que representa o atrito viscoso,for¸as centr´ ˙ eGm (q) ∈ Rn×1 ´ o vetor de torques gravitacionais, τd ∈ Rn×1 ´ o vetor que representa as e eperturba¸˜es, τ ∈ Rr×1 ´ o vetor de torques de entrada, sendo r o n´mero de entradas, co e uB(q) ∈ Rn×r ´ a matriz de transforma¸˜o destas entradas, λ ∈ Rm×1 ´ o vetor que e ca erepresenta as for¸as de restri¸˜o e A(q) ∈ Rm×n ´ a matriz associada `s restri¸˜es. Duas c ca e a codas propriedades conhecidas deste modelo s˜o (FUKAO; NAKAGAWA; ADACHI, 2000; aDAS; KAR, 2006): 1. A matriz de in´rcia M(q) ´ sim´trica e definida positiva, ou seja M(q) = M(q)T > e e e 0; 2. A matriz (M − 2Vm ) ´ antissim´trica. ˙ e e
  • 34. 38 2 Modelo Dinˆmico do Robˆ M´vel a o o Tais propriedades s˜o comumente utilizadas no desenvolvimento e an´lise de esta- a abilidade de controladores para robˆs m´veis, como apresentado em (FIERRO; LEWIS, o o1995, 1997; FUKAO; NAKAGAWA; ADACHI, 2000; KIM; SHIN; LEE, 2000; DAS; KAR,2006). O presente cap´ ıtulo apresenta uma nova maneira de modelar a dinˆmica de robˆs a om´veis tipo uniciclo. O novo modelo resulta de uma modifica¸˜o feita no modelo desen- o cavolvido por De La CRUZ (2006) e apresentado tamb´m em (De La CRUZ; CARELLI, e2006), cujos sinais de entrada s˜o as referˆncias de velocidades linear e angular do robˆ, e a e on˜o torques, como no modelo cl´ssico apresentado anteriormente. Diversas propriedades a ado modelo proposto s˜o estudadas e discutidas, e algumas delas s˜o usadas no projeto de a acontroladores que compensam os efeitos da dinˆmica (mostrados no pr´ximo cap´ a o ıtulo). Para tratar desses t´picos, o presente cap´ o ıtulo est´ assim organizado: na Se¸˜o 2.2 a ca´ apresentado o modelo dinˆmico do robˆ uniciclo desenvolvido em (De La CRUZ; CA-e a oRELLI, 2006), e a nova proposta de representa¸˜o do modelo ´ mostrada na Se¸˜o 2.3. ca e caEm seguida, na Se¸˜o 2.4, propriedades importantes do modelo s˜o apresentadas e discu- ca atidas, como sua caracter´ ıstica de passividade e a antissimetria de uma de suas matrizes.As Se¸˜es 2.5 e 2.6 tratam da identifica¸˜o dos parˆmetros dinˆmicos do modelo e de co ca a asua caracter´ ıstica de independˆncia linear, respectivamente. Considera¸˜es finais sobre o e comodelo proposto s˜o abordadas na Se¸˜o 2.7. a ca2.2 Modelo do Robˆ Uniciclo o A Figura 4 mostra a representa¸˜o do robˆ m´vel tipo uniciclo, seus parˆmetros e ca o o avari´veis de interesse. Na figura, u e ω s˜o, respectivamente, as velocidades linear e a aangular desenvolvidas pelo robˆ, G ´ seu centro de massa, C ´ a posi¸˜o de sua roda o e e cacastor, E ´ a posi¸˜o de uma ferramenta a bordo do robˆ (que aqui n˜o ´ considerada), e ca o a eh ´ o ponto de interesse (de coordenadas x e y no plano XY), ψ ´ a orienta¸˜o do robˆ, e e ca oe a ´ a distˆncia entre o ponto de interesse e o ponto central do eixo virtual que conecta e aas rodas de tra¸˜o (ponto B ). ca Os modelos dinˆmicos desenvolvidos por De La CRUZ (2006) foram baseados no amodelo proposto por Zhang et al. (1998), que apresentam como sinais de entrada os valoresde torque a serem aplicados `s rodas esquerda e direita. No entanto, robˆs comerciais a ogeralmente aceitam comandos de velocidades linear e angular, e n˜o de torque para seus amotores. Neste contexto, em (De La CRUZ, 2006) foram propostos dois modelos para
  • 35. 2.2 Modelo do Robˆ Uniciclo o 39 u C E h G e c b a B y d x Figura 4: Modelo do Robˆ Uniciclo. orobˆs m´veis tipo uniciclo que levam em conta sua cinem´tica e sua dinˆmica. Num o o a adeles os sinais de entrada s˜o as tens˜es aplicadas aos motores das rodas esquerda e a odireita (considerando um robˆ com tra¸˜o diferencial), e no outro s˜o as referˆncias de o ca a evelocidade linear e angular do robˆ. o O modelo completo cujos sinais de entrada s˜o as tens˜es nos motores pode ser escrito a ocomo (De La CRUZ, 2006)         x ˙ u cos ψ − aω sin ψ 0 0 δx        [ ] δ   y   u sin ψ + aω cos ψ   0  y  ˙    0    ˙     +0  νu   ψ  =  ω   0  +  0 , (2.2)    θ0    u   3 r2 ω 2 − 2 θ4 u   2r 0   θ0 0  νω δ   ˙   θ1 0 θ10   1   u θ 0 θ 0 ω˙ −2 θ3 r2 uω − θ4 d2 ω 0 0 0 2rd θ0 δω 2 2 2onde δ = [δx δy 0 δu δω ]T ´ o vetor de incertezas associado ao robˆ m´vel, em e o oque δx e δy s˜o fun¸oes das velocidades de deslizamento e da orienta¸˜o do robˆ, δu e a c˜ ca oδω s˜o fun¸˜es de parˆmetros f´ a co a ısicos como massa, in´rcia, diˆmetros das rodas e pneus, e aparˆmetros dos motores e servos, for¸as nas rodas, entre outros, a c νl + νr νr − νl νu = e νω = , 2 2sendo νl e νr os valores das tens˜es aplicadas aos motores das rodas esquerda e direita, orespectivamente. Os parˆmetros do modelo s˜o dados por a a 0 Ra θ1 = (mr2 + 2Ie ), ka
  • 36. 40 2 Modelo Dinˆmico do Robˆ M´vel a o o 0 Ra ( 2 ( )) θ2 = Ie d + 2r2 Iz + mb2 , ka 0 Ra θ3 = mb, ka ( ) 0 Ra ka kb θ4 = + Be , ka Raonde Ra ´ a resistˆncia el´trica dos motores, kb ´ sua constante eletromotriz, ka ´ sua e e e e econstante de torque, Be ´ o coeficiente de atrito, m ´ a massa do robˆ, Iz ´ seu momento e e o ede in´rcia no ponto G, Ie ´ o momento de in´rcia de cada grupo rotor-redu¸˜o-roda, r ´ e e e ca eo raio de suas rodas e b e d s˜o as distˆncias mostradas na Figura 4. a a A equa¸˜o anterior ´ util nos casos em que se pode controlar diretamente as tens˜es ca e´ oaplicadas em cada motor do robˆ. No entanto, robˆs comerciais geralmente possuem o ocontroladores internos que recebem referˆncias de velocidades para cada motor, e n˜o e apermitem que suas tens˜es sejam controladas diretamente. Neste contexto, em (De La oCRUZ, 2006) foi considerado que os controladores internos s˜o do tipo PD (Proporcional- aDerivativo), com ganhos proporcionais kP T > 0 e kP R > 0, e derivativos kDT ≥ 0 ekDR ≥ 0. Vale ressaltar que o tipo de controlador PD considerado ´ aquele em que eapenas o sinal medido ´ derivado (WADE, 2004; ROMAGNOLI; PALAZOGLU, 2006). eAssim, obteve-se a rela¸˜o ca [ ] [ ] νu kP T (uref − u) − kDT u ˙ = , νω kP R (ωref − ω) − kDR ω ˙onde 1 1 u= [r(ωr + ωl )] , ω= [r(ωr − ωl )] , 2 dsendo ωl e ωr as velocidades angulares das rodas esquerda e direita, respectivamente. Apartir dessas equa¸˜es, o modelo foi reescrito como (De La CRUZ; CARELLI, 2006) co         x ˙ u cos ψ − aω sin ψ 0 0 δx          y  u sin ψ + aω cos ψ   0 0[ ]  δy   ˙     u    ˙     ref   ψ  = ω +0 0 +  0 , (2.3)       ωref   u  ω − θ4 u   θ11 θ3 2 0 δ   ˙  θ1 θ1     u ω ˙ − θ2 uω − θ2 ω θ5 θ6 0 1 θ2 δωonde uref e ωref s˜o os sinais de referˆncia de velocidades linear e angular, respectivamente, a eθ = [θ1 θ2 θ3 θ4 θ5 θ6 ]T ´ o vetor de parˆmetros (identificados) do modelo e δ = e a[δx δy 0 δu δω ]T ´ o vetor de incertezas associado ao modelo do robˆ m´vel. Como e o o
  • 37. 2.3 Proposta de Representa¸˜o do Modelo Dinˆmico ca a 41no modelo anteriormente apresentado, δx e δy s˜o fun¸˜es das velocidades de deslizamento a coe da orienta¸˜o do robˆ, enquanto δu e δω s˜o fun¸˜es de parˆmetros f´ ca o a co a ısicos. Os parˆmetros inclu´ a ıdos no vetor θ s˜o fun¸˜es de alguns parˆmetros f´ a co a ısicos do robˆ. oAs equa¸˜es que descrevem os parˆmetros do modelo s˜o co a a [ ] Ra ( 2 ) 1 θ1 = mr + 2Ie + 2rkDT , ka (2rkP T ) [ ] Ra ( 2 2 ( 2 )) 1 θ2 = Ie d + 2r Iz + mb + 2rdkDR , ka (2rdkP R ) Ra mbr θ3 = , ka 2kP T ( ) Ra k a k b 1 θ4 = + Be + 1, ka Ra rkP T Ra mbr θ5 = , e ka dkP R ( ) Ra k a k b d θ6 = + Be + 1. ka Ra 2rkP R Deve ser observado que θi > 0, i = 1, 2, 4, 6. Os parˆmetros θ3 e θ5 , por outro alado, podem ser negativos e ser˜o nulos se, e somente se, o centro de massa G estiver aexatamente sobre o ponto central do eixo virtual que une as rodas de tra¸˜o (ponto B ), cai.e. b = 0. Neste trabalho considera-se que b = 0, de maneira que θ3 e θ5 s˜o distintos de azero. Nota 2.1 . O modelo cujas entradas s˜o velocidades linear e angular inclui a dinˆmica a ados atuadores e dos servos, o que n˜o ocorre no modelo cujas entradas s˜o torques. a a2.3 Proposta de Representa¸˜o do Modelo Dinˆmico ca a O modelo do robˆ tipo uniciclo apresentado em (2.3) pode ser dividido em uma parte ocinem´tica e uma parte dinˆmica, como mostrado a seguir. O modelo cinem´tico do robˆ a a a o´ representado pore       x ˙ cos ψ −a sin ψ [ ] δx     u    y  =  sin ψ a cos ψ  + δy  , (2.4)  ˙     ω ψ˙ 0 1 0
  • 38. 42 2 Modelo Dinˆmico do Robˆ M´vel a o oe seu modelo dinˆmico ´ dado por a e [ ]   [ ][ ] [ ] u ˙ θ3 2 θ1 ω − θ4 θ1 u 1 0 uref δu = + θ1 1 + . (2.5) ω ˙ − θ5 uω − θ6 ω 0 θ2 ωref δω θ2 θ2 Os termos foram reagrupados com o objetivo de se determinar e estudar algumaspropriedades do modelo que podem ser uteis no desenvolvimento de controladores. Assim, ´(2.5) foi reescrita como [ ][ ] [ ][ ] [ ][ ] [ ][ ] −θ1 0 δu θ1 0 u ˙ θ4 −θ3 ω u 1 0 uref + + = , (2.6) 0 −θ2 δω 0 θ2 ω ˙ θ5 ω θ6 ω 0 1 ωrefou, em uma forma compacta, como ∆ + H v + c(v)v = vr , ˙ (2.7)onde vr = [uref ωref ]T ´ o vetor de referˆncias de velocidades, v = [u ω]T ´ o vetor que e e econt´m as velocidades reais do robˆ, e as matrizes H , c(v) e o vetor ∆ s˜o dados por e o a [ ] [ ] [ ][ ] θ1 0 θ4 −θ3 ω −θ1 0 δu H = , c(v) = e ∆= . 0 θ2 θ5 ω θ6 0 −θ2 δωA matriz c(v) pode ser dividida em duas matrizes distintas, ou seja, c(v) = C (v) + F ,onde [ ] [ ] 0 −θ3 ω θ4 0 C (v) = e F = , θ5 ω 0 0 θ6de forma que a equa¸˜o (2.6) pode ser escrita como ca [ ][ ] [ ][ ] [ ][ ] [ ][ ] [ ] θ1 0 δu θ1 0 u ˙ 0 −θ3 ω u θ4 0 u uref + + + = . (2.8) 0 θ2 δω 0 θ2 ω ˙ θ5 ω 0 ω 0 θ6 ω ωref Da´ em uma forma compacta o modelo dinˆmico pode ser representado por ı, a ∆ + H v + C (v)v + F v = vr . ˙ (2.9) ´ E importante salientar que, embora seu significado f´ ısico seja diferente, a representa¸˜o cada dinˆmica do robˆ m´vel dada por (2.9) possui uma estrutura matem´tica similar ao a o o aformato da equa¸˜o que descreve a dinˆmica de robˆs manipuladores (2.1). Isto ´, ambas ca a o es˜o formadas por uma soma de termos que incluem um vetor de dist´rbios, o produto a u
  • 39. 2.3 Proposta de Representa¸˜o do Modelo Dinˆmico ca a 43entre uma matriz de parˆmetros do modelo e um vetor de acelera¸˜o e o produto entre a cauma matriz de parˆmetros do modelo e um vetor de velocidade. As diferen¸as entre ambas a cas equa¸˜es s˜o que (2.9) n˜o possui termo gravitacional Gm (q), n˜o possui restri¸˜es co a a a coA(q) = 0, tem matriz de transforma¸˜o B(q) igual ` matriz identidade e, principalmente, ca aapresenta entradas de velocidade, n˜o de torque. Por isso, os produtos das matrizes H apor v, C (v) por v, e F por v resultam em velocidades, e n˜o em torques, como ocorre ˙ aem (2.1). Al´m disso, os parˆmetros θ n˜o s˜o todos adimensionais, sendo suas unidades e a a adadas por θ1 [s], θ2 [s], θ3 [sm/rad2 ], θ4 [1], θ5 [s/m] e θ6 [1]. Para estudar as propriedades de (2.9), a equa¸˜o foi reescrita com a adi¸˜o e subtra¸˜o ca ca cade um termo de valor Iθ3 u, de forma que seu resultado n˜o fosse alterado, obtendo-se a [ ][ ] [ ][ ] [ ][ ] [ ] θ1 0 u ˙ 0 −θ3 ω u θ4 0 u uref ∆+ + + = , (2.10) 0 θ2 ω ˙ θ5 ω 0 ω 0 θ6 + (Iθ3 − Iθ3 )u ω ωrefou, rearranjando os termos, [ ][ ] [ ][ ] [ ][ ] [ ] θ1 0 u ˙ 0 −θ3 ω Iu θ4 0 u uref ∆+ + + = , (2.11) 0 θ2 ω ˙ θ3 ω 0 ω 0 θ6 + (θ5 − Iθ3 )u ω ωrefonde I = 1 rad2 /m2 ´ uma constante de valor unit´rio necess´ria para compatibilizar as e a aunidades. Definindo-se as matrizes C(v) e F (v) como [ ] [ ] 0 −θ3 ω θ4 0 C(v) = e F (v) = , θ3 ω 0 0 θ6 + (θ5 − Iθ3 )uo modelo dinˆmico pode ser escrito, em forma compacta, como a ∆ + H v + C(v)v + F (v)v = vr , ˙ (2.12)onde v = [Iu ω]T ´ o vetor de velocidades modificadas. Ou seja, e [ ][ ] I 0 u v = . 0 1 ω Os termos de tal vetor s˜o numericamente iguais aos termos do vetor de velocidades av, apenas suas dimens˜es s˜o distintas. Reescrevendo alguns parˆmetros de H e F (v), o a a
  • 40. 44 2 Modelo Dinˆmico do Robˆ M´vel a o os˜o definidas as matrizes a [ ] [ ] θ1 /I 0 θ4 /I 0 H= e F(v ) = , 0 θ2 0 θ6 + (θ5 /I − θ3 )Iue o modelo dinˆmico pode ser reprsentado por a ∆ + Hv + C(v )v + F(v )v = vr . ˙ (2.13) Deve-se notar que C(v) = C(v ), H v = Hv e F (v)v = F(v )v . Portanto, as di- ˙ ˙mens˜es do vetor resultante vr n˜o s˜o alteradas. o a a Nota 2.2 . J´ que a representa¸˜o da dinˆmica do robˆ m´vel dada por (2.9) possui a ca a o oestrutura matem´tica similar `quela da equa¸˜o (2.1) que descreve a dinˆmica de robˆs a a ca a omanipuladores, t´cnicas de projeto de controladores aplicadas a manipuladores, como as epropostas por Craig e por Slotine e Li (MARTINS, 2001), podem ser adaptadas paraprojeto de controladores para robˆs m´veis cujas sa´ o o ıdas sejam sinais de velocidade.2.4 Propriedades do Modelo Dinˆmico Proposto a Uma caracter´ ıstica importante do modelo apresentado ´ que suas entradas s˜o velo- e acidades linear e angular, n˜o torque e for¸a, como ´ comum nos modelos presentes na a c eliteratura. Desta maneira, o modelo proposto incorpora a dinˆmica dos atuadores e de aseus servos. De fato, robˆs comerciais geralmente aceitam comandos de velocidades linear oe angular, como ´ o caso dos robˆs da linha Pioneer, da empresa Mobile Robots, e dos e orobˆs Khepera, da K-Team Corporation. Portanto, o modelo proposto, representado pela oequa¸˜o (2.13), ´ util para ser utilizado em conjunto com estes robˆs, al´m de outros. ca e ´ o eTal modelo possui algumas propriedades importantes que podem ajudar no projeto decontroladores que consideram a dinˆmica do robˆ. Estas propriedades s˜o: a o a 1. As matrizes H e H s˜o sim´tricas e definidas positivas, ou seja H = HT > 0 e a e H = H T > 0; 2. As inversas de H e H existem e tamb´m s˜o definidas positivas, ou seja ∃ H−1 > 0 e a e ∃ H −1 > 0; 3. A matriz F ´ sim´trica e definida positiva, ou seja F = FT > 0, se e e θ6 > −(θ5 /I − θ3 )Iu;
  • 41. 2.4 Propriedades do Modelo Dinˆmico Proposto a 45 4. As matrizes H e H s˜o constantes quando n˜o existe varia¸˜o nos parˆmetros a a ca a dinˆmicos; a 5. A matriz C(v ) ´ antissim´trica; e e 6. A matriz F(v ) pode ser considerada constante se θ6 |(θ5 /I − θ3 )Iu| e n˜o existe a varia¸˜o nos parˆmetros dinˆmicos; ca a a 7. O mapeamento vr → v ´ estritamente passivo de sa´ se θ6 > −(θ5 /I − θ3 )Iu e e ıda ∆ = 0. As propriedades 1 a 3 podem ser provadas observando-se que H, H e F s˜o diagonais, ae que seus termos s˜o todos positivos. A propriedade 4 ´ verdadeira sob a hip´tese de a e oque n˜o existe mudan¸a nos valores dos parˆmetros, isto ´, a estrutura do robˆ, sua a c a e o e a ´massa, seu momento de in´rcia, etc. n˜o se alteram. E importante mencionar que H n˜o adepende da posi¸˜o do robˆ, desde que este se desloque num plano horizontal, j´ que o ca o adeslocamento em um plano inclinado provocaria altera¸˜o em sua energia potencial. A cavalidade da propriedade 5 ´ evidente, j´ que os termos da diagonal principal de C(v ) s˜o e a anulos e os outros s˜o iguais em m´dulo, com sinais opostos. Tamb´m ´ poss´ observar a o e e ıvelque (H − 2C) ´ antissim´trica, j´ que a matriz H ´ constante e, portanto, H = 0. ˙ e e a e ˙ A validade da propriedade 6 depende do cumprimento da condi¸˜o θ6 ca |(θ5 /I −θ3 )Iu|. Tal condi¸˜o foi verificada experimentalmente para quatro robˆs tipo uniciclo, ca oap´s identifica¸˜o de seus parˆmetros, resultando que, de fato, θ6 o ca a |(θ5 /I − θ3 )Iu| eθ6 > −(θ5 /I − θ3 )Iu. O procedimento de identifica¸˜o de parˆmetros ´ explicado na se¸˜o ca a e caseguinte. Propriedades de passividade de um sistema podem ser utilizadas no projeto de con-troladores est´veis para tal sistema (KHALIL, 2002). A propriedade de passividade do amodelo proposto ´ apresentada pelo seguinte teorema. eTeorema 1. Considerando-se ∆ = 0 e θ6 > −(θ5 /I −θ3 )Iu, e assumindo-se que vr ∈ L2ee v ∈ L2e , o mapeamento vr → v do modelo dinˆmico Hv + C(v )v + F(v )v = vr ´ a ˙ eestritamente passivo de sa´da. ıProva. De acordo com (SCHAFT, 1999), um operador P : L2e → L2e ´ estritamente epassivo de sa´ se, e somente se, existem constantes δ ∈ R e β ∈ R tais que ıda < P x, x > ≥ β + δ P x 2 2,T ∀x ∈ L2e ,
  • 42. 46 2 Modelo Dinˆmico do Robˆ M´vel a o oonde < ., . > representa o produto interno. Para mostrar que o mapeamento vr → v ´ estritamente passivo de sa´ considera-se e ıda, ca ˙a fun¸˜o definida positiva V = 1 v T Hv e sua primeira derivada temporal V = v T Hv , ˙ 2onde aplicou-se a propriedade 4 do modelo. Usando (2.13) e levando-se em conta as ˙propriedades 3 e 5, V pode ser escrita como V = v T (vr − Cv − Fv ) = v T vr − v T Fv . ˙ (2.14) Integrando-se (2.14) resulta a equa¸˜o ca ∫ T ∫ T ∫ T ˙ V dt = v vr dt − T v T Fv dt, 0 0 0que pode ser escrita como ∫ T ∫ T V (T ) − V (0) = v vr dt − T v T Fv dt. (2.15) 0 0 Desprezando-se o termo positivo V(T), tem-se a desigualdade ∫ T ∫ T −V (0) ≤ v vr dt − inf(λmin (F)) T v 2 dt, 0 0ou ∫ T 2 v T vr dt ≥ −V (0) + inf(λmin (F)) v 2,T . 0 Assumindo-se que vr ∈ L2e e v ∈ L2e , a equa¸˜o anterior pode ser escrita como ca 2 < v , vr > ≥ −V (0) + inf(λmin (F)) v 2,T , (2.16)onde inf(λmin (.)) representa o ´ ınfimo do menor autovalor de uma matriz. J´ que θ6 > a−(θ5 /I − θ3 )Iu, tem-se que F > 0. Portanto, baseando-se em (2.16), pode-se concluir queo mapeamento vr → v ´ estritamente passivo de sa´ e ıda.2.5 Identifica¸˜o dos Parˆmetros Dinˆmicos ca a a Seja um sistema representado por Y = Wθ, (2.17)
  • 43. 2.5 Identifica¸˜o dos Parˆmetros Dinˆmicos ca a a 47onde θ ´ o vetor de parˆmetros e Y ´ a sa´ do sistema. A estimativa de m´ e a e ıda ınimosquadrados para θ ´ dada por e ( )−1 T ˆ θ = WT W W Y, ˆsendo θ o vetor com os valores estimados de θ (PHILLIPS; NAGLE, 1995). Para estesistema, a matriz W ´ chamada de matriz de regress˜o e a equa¸˜o (2.17) ´ chamada de e a ca emodelo de regress˜o do sistema. a Desprezando-se as incertezas e rearranjando (2.6), o modelo dinˆmico do robˆ m´vel a o opode ser representado por [ ] [ ] uref u 0 −ω 2 u 0 0 [ ˙ ]T = θ1 θ2 θ3 θ4 θ5 θ6 , (2.18) ωref 0 ω ˙ 0 0 uω ωonde pode-se considerar [ ] [ ] uref u 0 −ω 2 u 0 0 ˙ [ ]T Y= , W= , θ = θ1 θ2 θ3 θ4 θ5 θ6 . ωref 0 ω ˙ 0 0 uω ω Com o objetivo de se obter uma estimativa para os valores de θ, cada robˆ foi excitado ocom sinais de referˆncia de velocidade enquanto seus valores de velocidade e acelera¸˜o e caeram medidos. Os sinais de excita¸˜o consistiam numa soma de seis sinais senoidais com caamplitudes distintas. Todos os dados foram armazenados e o modelo de regress˜o foi amontado de forma que o vetor Y e a matriz W tivessem todos os valores obtidos em cadaper´ ıodo de amostragem. Posteriormente, o valor de θ para cada robˆ foi calculado pelo om´todo de m´ e ınimos quadrados. Esta estrat´gia ´ descrita com mais detalhes em (De La e eCRUZ, 2006). Alguns robˆs tiveram seus parˆmetros dinˆmicos identificados pelo m´todo descrito. o a a eTrˆs desses robˆs s˜o da empresa Mobile Robots, sendo dois Pioneer 2-DX (um deles e o apossui computador de bordo e o outro n˜o o possui) e um Pioneer 3-DX que possui acomputador de bordo e sensor de varredura laser. O quarto robˆ cujos parˆmetros foram o aidentificados ´ uma cadeira de rodas rob´tica (FERREIRA et al., 2007; FERREIRA, e o2008). Tais robˆs possuem diferentes massas e caracter´ o ısticas dinˆmicas. Por exemplo, aos robˆs da linha Pioneer possuem dimens˜es de (44 × 38)cm e altura de 22cm at´ sua o o ebase superior. Suas rodas de tra¸˜o possuem um diˆmetro de 16, 5cm, e a massa de cada ca arobˆ ´ de 9kg quando descarregado (Mobile Robots, Acesso em: 30/jun/2008). O sensor oede varredura laser montado na parte dianteira superior do Pioneer 3-DX possui massa
  • 44. 48 2 Modelo Dinˆmico do Robˆ M´vel a o o (a) (b) Figura 5: Robˆs cujos parˆmetros foram identificados: (a) Robˆs Pioneer 2-DX com o a o computador (esquerda) e 3-DX (direita); (b) Cadeira de rodas rob´tica. ode aproximadamente 50% da massa do pr´prio robˆ. Ou seja, tal sensor provoca uma o omudan¸a importante em sua dinˆmica. Por outro lado, a cadeira de rodas rob´tica possui c a ocerca de 70kg de massa, incluindo os equipamentos de controle que foram adicionados aomodelo original. Suas dimens˜es s˜o de (64 × 78)cm, com altura de 98cm, e suas rodas de o atra¸˜o possuem 49, 5cm de diˆmetro. A Figura 5(a) mostra os robˆs Pioneer 2-DX com ca a ocomputador de bordo (` esquerda) e Pioneer 3-DX (` direita), cujos parˆmetros dinˆmicos a a a aforam identificados. A cadeira de rodas rob´tica ´ ilustrada na Figura 5(b). o e A seguir s˜o mostrados os valores dos parˆmetros identificados por De La CRUZ a a(2006) para os trˆs robˆs Pioneer mencionados. Os parˆmetros identificados para o robˆ e o a oPioneer 2-DX que n˜o possui computador de bordo s˜o a a θ1 = 0, 3037 s, θ2 = 0, 2768 s, θ3 = −0, 000402 sm/rad2 , θ4 = 0, 9835, θ5 = 0, 00382 s/m, θ6 = 1, 0725,
  • 45. 2.5 Identifica¸˜o dos Parˆmetros Dinˆmicos ca a a 49enquanto que para o robˆ Pioneer 2-DX com computador de bordo eles s˜o o a θ1 = 0, 19920 s, θ2 = 0, 13736 s, θ3 = 0, 001954 sm/rad2 , θ4 = 0, 99070, θ5 = 0, 01554 s/m, θ6 = 0, 98660,e, finalmente, para o robˆ Pioneer 3-DX eles s˜o o a θ1 = 0, 2604 s, θ2 = 0, 2509 s, θ3 = −0, 000499 sm/rad2 , θ4 = 0, 9965, θ5 = 0, 00263 s/m, θ6 = 1, 0768. O procedimento de identifica¸˜o de parˆmetros do robˆ Pioneer 3-DX foi repetido ca a ocom a remo¸˜o do sensor de varredura laser, o que representa uma redu¸˜o significativa ca caem sua massa. Para este caso, os valores obtidos foram θ1 = 0, 5338 s, θ2 = 0, 2168 s, θ3 = −0, 0134 sm/rad2 , θ4 = 0, 9560, θ5 = −0, 0843 s/m, θ6 = 1, 0590. Pode-se notar que, para todos os casos, as condi¸˜es θ6 > −(θ5 /I − θ3 )Iu e θ6 co|(θ5 /I − θ3 )Iu| s˜o verdadeiras para os trˆs robˆs Pioneer considerados desde que o valor a e ode velocidade linear u seja suficientemente pequeno. Como a velocidade linear nos robˆs oPioneer ´ de, no m´ximo, 1, 2m/s (Mobile Robots, Acesso em: 30/jun/2008), eles sempre e atrabalhar˜o numa faixa de velocidade que mant´m v´lidas as condi¸˜es anteriores. a e a co A cadeira de rodas rob´tica foi projetada para operar transportando uma pessoa, o
  • 46. 50 2 Modelo Dinˆmico do Robˆ M´vel a o ocuja massa pode ser de at´ 130kg. Por isso, a identifica¸˜o de seus parˆmetros dinˆmicos e ca a afoi realizada considerando diversas situa¸˜es de carga, sendo que o resultado de duas codelas ´ relatado a seguir. Uma pessoa de 55kg e outra de 125kg auxiliaram na realiza¸˜o e cada identifica¸˜o de parˆmetros da cadeira de rodas. Os parˆmetros identificados para a ca a acadeira de rodas rob´tica enquanto transportava uma pessoa de 55kg de massa s˜o o a θ1 = 0, 3759 s, θ2 = 0, 0188 s, θ3 = 0, 0128 sm/rad2 , θ4 = 1, 0027, θ5 = −0, 0015 s/m, θ6 = 0, 9808,enquanto os parˆmetros para o caso do transporte de uma pessoa de 125kg s˜o a a θ1 = 0, 4263 s, θ2 = 0, 0289 s, θ3 = 0, 0058 sm/rad2 , θ4 = 0, 9883, θ5 = 0, 0134 s/m, θ6 = 0, 9931. Pode-se notar que, para todos os casos, as condi¸˜es θ6 > −(θ5 /I − θ3 )Iu e θ6 co|(θ5 /I − θ3 )Iu| s˜o verdadeiras para a cadeira de rodas rob´tica desde que o valor de a ovelocidade linear u seja suficientemente pequeno. Como a velocidade linear de tal cadeira ´ ede, no m´ximo, 2m/s, tais condi¸˜es s˜o sempre verificadas. Portanto, o modelo dinˆmico a co a ados robˆs mencionados anteriormente pode ser representado por (2.13), considerando otodas as propriedades apresentadas anteriormente. ´ E importante que se mencione que, em todos os casos experimentados, a identifica¸˜o cados parˆmetros dinˆmicos da cadeira de rodas rob´tica resultou em valores tais que a a a ocondi¸˜o θ6 > −(θ5 /I − θ3 )Iu ´ cumprida, validando a propriedade 3. No entanto, em ca ealgumas situa¸˜es em que a carga estava deslocada, e quando se considera que a cadeira code rodas se desloca ` sua m´xima velocidade linear u, observou-se que o valor de θ6 a aficou apenas entre trˆs e cinco vezes superior a |(θ5 /I − θ3 )Iu|, fato que prejudica o ecumprimento da condi¸˜o de θ6 ca |(θ5 /I − θ3 )Iu|. Portanto, em alguns casos n˜o ´ uma a e
  • 47. 2.6 Independˆncia Linear dos Parˆmetros e a 51boa aproxima¸˜o considerar a matriz F(v ) constante. ca Nota 2.3 . O procedimento de identifica¸˜o dos parˆmetros resulta em valores aqui ca achamados de parˆmetros identificados. Tais valores representam os parˆmetros reais ou a averdadeiros, cujos valores dependem das caracter´ ısticas f´ ısicas do robˆ. No Cap´ o ıtulo 3s˜o apresentados controladores adaptativos que modificam os valores dos parˆmetros uti- a alizados em suas equa¸˜es. Nesse caso, o conjunto de valores passa a ser chamado de coparˆmetros estimados. a Nota 2.4 . O modelo e os parˆmetros identificados foram validados atrav´s de si- a emula¸˜es e experimentos em que ambos receberam os mesmos sinais de comando vr = co[uref ωref ]T . As velocidades linear u e angular ω resultantes do experimento com o robˆ oe da simula¸˜o com o modelo correspondente foram muito similares, o que confirma que cao modelo e os parˆmetros identificados representam o robˆ real. Mais detalhes sobre o a oprocedimento de valida¸˜o do modelo s˜o apresentados em (De La CRUZ, 2006). ca a2.6 Independˆncia Linear dos Parˆmetros e a ´ E importante que se verifique se os parˆmetros θ1 a θ6 do modelo (2.18) s˜o linearmente a aindependentes. Se h´ parˆmetros linearmente dependentes, o modelo pode ser simplificado a ade maneira a ser escrito com um n´mero menor de parˆmetros. u a Para verificar a independˆncia linear dos parˆmetros, primeiro analisou-se as equa¸˜es e a coque os definem analiticamente. Tais equa¸˜es, apresentadas na se¸˜o 2.2, mostram clara- co camente que θ1 e θ2 s˜o independentes entre si e dos demais. No entanto, as equa¸˜es que a codefinem os demais parˆmetros θ dependem de algumas vari´veis f´ a a ısicas que est˜o presentes aem mais de uma delas, o que faz com que a independˆncia linear entre tais parˆmetros e an˜o seja evidente. Por isso, os valores dos seis parˆmetros θ foram calculados utilizando o a asoftware MATLAB com base nas equa¸˜es que os definem analiticamente. Os valores das covari´veis f´ a ısicas (Ra , Ie , Be , m, r, etc.) foram gerados aleatoriamente, e os valores de θ1..6foram calculados, obtendo-se, assim, parˆmetros tamb´m aleat´rios. Este procedimento a e ofoi repetido um n´mero K de vezes, e montou-se uma matriz com os resultados, da forma u   θ (1) θ2 (1) θ3 (1) θ4 (1) θ5 (1) θ6 (1)  1   θ (2) θ (2) θ (2) θ (2) θ (2) θ (2)   1 2 3 4 5 6     θ1 (3) θ2 (3) θ3 (3) θ4 (3) θ5 (3) θ6 (3)  .    . . . . . .   . . . . . .   . . . . . .  θ1 (K) θ2 (K) θ3 (K) θ4 (K) θ5 (K) θ6 (K)
  • 48. 52 2 Modelo Dinˆmico do Robˆ M´vel a o o Tal matriz possui 6 colunas e K linhas, onde K ´ o n´mero de amostras aleat´rias e u oobtidas. Seu posto ´ igual a 6, o que indica que ela possui 6 colunas independentes, ou eseja, indica que todos os parˆmetros s˜o linearmente independentes. Tal procedimento a afoi repetido diversas vezes para K = 1000 e K = 5000, resultando sempre em valor 6 parao posto. Na tentativa de evitar a indica¸˜o de uma falsa independˆncia entre os parˆmetros, ca e acada coluna da matriz foi normalizada, dividindo todos os seus valores pelo valor m´ximo ada coluna. Ent˜o, antes de se calcular o posto da matriz, todos os seus valores foram atruncados de forma que tivessem um n´mero fixo de casas decimais. Para truncamento ucom 4, 3 e 2 casas decimais, o posto da matriz resultou igual a 6 em todos os casostestados, indicando que os parˆmetros continuavam linearmente independentes. a Em seguida foi realizada an´lise dos valores obtidos experimentalmente durante os aprocedimentos de identifica¸˜o realizado nos robˆs. Em todos os conjuntos de dados ca o ( T )obtidos, a matriz W W ´ invers´ e ıvel, o que tamb´m indica independˆncia linear entre e eos parˆmetros. a Portanto, concluiu-se que todos os parˆmetros inclu´ a ıdos no vetor θ s˜o linearmente aindependentes, o que significa que (2.18) representa o modelo dinˆmico do robˆ uniciclo a ocom o n´mero m´ u ınimo de parˆmetros. a2.7 Considera¸˜es Finais do Cap´ co ıtulo Neste cap´ ıtulo, o modelo completo para representa¸˜o de robˆs m´veis proposto em ca o o(De La CRUZ; CARELLI, 2006) foi apresentado, e uma nova abordagem para repre-senta¸˜o de sua parte dinˆmica foi proposta. Uma vantagem de tal modelo ´ o fato deste ca a eaceitar sinais de velocidade linear e angular como referˆncia, o que ´ usual em robˆs e e om´veis comerciais, mas n˜o na literatura. Al´m disso, inclui a dinˆmica dos atuadores e o a e aservos do robˆ. Propriedades importantes da representa¸˜o proposta, uteis no projeto de o ca ´controladores e na an´lise de estabilidade do sistema em malha fechada, foram listadas ae provadas. Os parˆmetros dinˆmicos de quatro robˆs m´veis distintos foram identifica- a a o odos, e seus valores foram apresentados, ilustrando que as propriedades apresentadas s˜o av´lidas para robˆs com caracter´ a o ısticas bastante distintas. O pr´ximo cap´ o ıtulo mostra odesenvolvimento de controladores baseados no modelo proposto, em que se faz uso de al-gumas das propriedades listadas. Resultados de simula¸˜o e experimentais apresentados caem tal cap´ ıtulo mostram que o modelo proposto ´ efetivamente v´lido. e a
  • 49. 53 3Compensa¸˜o Adaptativa da caDinˆmica a “You must be aware I am programmed to evolve. To better myself.” (Lieutenant Commander Data, em Star Trek: First Contact)3.1 Introdu¸˜o e Trabalhos Relacionados ca Grande parte dos controladores presentes na literatura para o controle n˜o-linear de arobˆs m´veis e AGVs considera apenas seu modelo cinem´tico, como ´ o caso dos traba- o o a elhos apresentados em (KANAYAMA et al., 1990; CANUDAS de WIT C.; SORDALEN,1992; CARELLI; SECCHI; MUT, 1999; WU et al., 1999; FREIRE; CARELLI, 2003; ¨FERREIRA, 2004; KUHNE; JR; LAGES, 2005; GAVA, 2007; TEODOVICH; CARELLI,2008; PENIZZOTTO; PATINO; CARELLI, 2008; GARC´ AGAMENNONI; FIGUE- ˜ IA;ROA, 2008). No entanto, para execu¸˜o de tarefas que exigem movimentos em altas cavelocidades ou transporte de cargas, a considera¸˜o do modelo dinˆmico dos robˆs se ca a otorna essencial (FIERRO; LEWIS, 1997; FIERRO; DAS, 2002). Assim, alguns trabalhos dispon´ ıveis na literatura j´ apresentam controladores que acompensam a dinˆmica dos robˆs. Como exemplo, Fierro e Lewis (1995) propuseram uma a olei de controle para robˆs m´veis n˜o-holonˆmicos que leva em conta a dinˆmica modelada o o a o ado robˆ. Os sinais de comando gerados pelo controlador apresentado s˜o torques que, em o ageral, precisam ser convertidos para sinais de referˆncia de velocidade para serem aplicados ea robˆs comerciais. Al´m disso, somente resultados de simula¸˜o foram apresentados. Os o e camesmos autores propuseram um controlador robusto adaptativo baseado em redes neuraispara lidar com dist´rbios e dinˆmica n˜o modelada (FIERRO; LEWIS, 1997). Por´m, u a a e
  • 50. 54 3 Compensa¸˜o Adaptativa da Dinˆmica ca auma vez mais, resultados experimentais n˜o foram apresentados. a Outros exemplos de controladores que levam em conta a dinˆmica dos robˆs m´veis a o oe geram sinais de torque como comandos foram apresentados em (DONG; HUO, 1999;FUKAO; NAKAGAWA; ADACHI, 2000; LIU et al., 2004; DONG; GUO, 2005), mas ape-nas resultados de simula¸˜o foram mostrados. Em (CORRADINI; ORLANDO, 2002) s˜o ca aapresentados resultados experimentais, mas os sinais gerados pelo controlador propostoainda s˜o torques. a Alguns trabalhos propuseram controladores que levam em conta a dinˆmica do robˆ a oe geram sinais de comando que n˜o s˜o torques. Por exemplo, em (DAS; KAR, 2006) ´ a a eproposto um controlador adaptativo baseado em l´gica fuzzy, em que as incertezas s˜o es- o atimadas e os parˆmetros do controlador s˜o ajustados durante sua execu¸˜o. Nesse traba- a a calho, o modelo dinˆmico do sistema inclui a dinˆmica dos atuadores, e os comandos gerados a apelo controlador s˜o tens˜es para alimenta¸˜o dos motores. J´ em (ANTONINI; IPPO- a o ca aLITI; LONGHI, 2006) foi proposto um controlador chaveado, com aprendizado on-line earquitetura hier´rquica, que usa metodologias baseadas em redes neurais para compensar aos efeitos de fenˆmenos n˜o-modelados. Redes neurais s˜o utilizadas para identifica¸˜o e o a a cacontrole, e os sinais de comando gerados s˜o velocidades lineares e angulares de referˆncia a epara o robˆ. No entanto, a implementa¸˜o em tempo-real da solu¸˜o proposta requer uma o ca caarquitetura computacional de alto desempenho, baseada em um sistema multiprocessado. Por outro lado, em (De La CRUZ, 2006; De La CRUZ; CARELLI, 2006) foi propostoum modelo dinˆmico que aceita sinais de referˆncia de velocidades linear e angular como a eentradas (mostrado no Cap´ ıtulo 2), e apresentado o projeto de um controlador dinˆmico apara seguimento de trajet´ria baseado em tal modelo. Uma grande vantagem do contro- olador ali apresentado ´ a gera¸˜o de sinais de velocidade linear e angular como comandos, e caj´ que robˆs comerciais usualmente possuem controladores internos e aceitam sinais de a oreferˆncia de velocidade, e n˜o de torque ou tens˜o para seus motores. Al´m disso, o e a a ec´lculo dos sinais de comando pode ser realizado on-line por computadores de bordo co- amumente presentes em robˆs m´veis comerciais. No entanto, se os parˆmetros do robˆ o o a on˜o forem corretamente identificados, ou forem alterados entre uma tarefa e outra (por aexemplo, no caso de transporte de cargas), o desempenho do controlador proposto podeser severamente afetado. Para reduzir a degrada¸˜o de desempenho em aplica¸˜es em que os parˆmetros dinˆmicos ca co a ado robˆ podem variar, a adapta¸˜o de parˆmetros on-line se torna bastante importante. o ca aNeste cap´ ıtulo s˜o apresentados os projetos de dois controladores cujo objetivo ´ realizar a e
  • 51. 3.1 Introdu¸˜o e Trabalhos Relacionados ca 55a compensa¸˜o da dinˆmica dos robˆs m´veis de forma adaptativa. O primeiro ´ baseado ca a o o eno modelo apresentado em (De La CRUZ; CARELLI, 2006), e ´ aqui denominado pri- emeiro controlador dinˆmico. O outro ´ baseado no novo modelo proposto no Cap´ a e ıtulo 2e denominado segundo controlador dinˆmico. a Rossomando et al. (2007) propuseram uma modifica¸˜o na estrutura do primeiro cacontrolador dinˆmico, que foi inicialmente apresentado em (MARTINS et al., 2007c), aresultando numa arquitetura em que uma rede neural opera em paralelo com o contro-lador dinˆmico. Os controladores cinem´tico e de compensa¸˜o dinˆmica ali utilizados a a ca as˜o praticamente idˆnticos `queles aqui propostos, com a diferen¸a que o controlador a e a cdinˆmico n˜o ´ adaptativo. O algoritmo de aprendizado permite que a rede neural realize a a ea compensa¸˜o de dinˆmicas n˜o-modeladas de forma adaptativa, reduzindo o erro de ca a aseguimento de trajet´ria. Resultados experimentais apresentados em (ROSSOMANDO oet al., 2007) mostram que o sistema possui desempenho similar `quele obtido usando o aprimeiro controlador dinˆmico aqui proposto. Embora tenha a vantagem de poder com- apensar dinˆmicas n˜o modeladas, o aprendizado da rede neural pode, em alguns casos, a alevar muito mais tempo que a adapta¸˜o de parˆmetros realizada pelo primeiro contro- ca alador dinˆmico. Al´m disso, a implementa¸˜o do sistema ´ mais complexa, e seu custo a e ca ecomputacional ´ maior pois, al´m do controlador n˜o-linear de compensa¸˜o da dinˆmica, e e a ca adevem ser implementados a rede neural e seu algoritmo de aprendizagem. ´ Em (JORDAN et al., 2008) os autores apresentam a compara¸˜o entre dois tipos de cacontroladores adaptativos que realizam a compensa¸˜o da dinˆmica de robˆs m´veis tipo ca a o ouniciclo. Ambos s˜o projetados com base no modelo dinˆmico proposto em (De La CRUZ; a aCARELLI, 2006). Um dos controladores ´ n˜o-linear, projetado para levar os erros de e aseguimento de posi¸˜o e velocidade a zero atrav´s da minimiza¸˜o de uma fun¸˜o custo. O ca e ca caoutro controlador ´ baseado em aproxima¸˜es alg´bricas e interpola¸˜o de ordem vari´vel. e co e ca aOs autores realizaram compara¸˜o de desempenho entre os controladores com base em casimula¸˜es de seguimento de uma trajet´ria senoidal a velocidades classificadas como co omoderada e alta, considerando o modelo dinˆmico do robˆ Pioneer 3-DX. Em todos os a ocasos simulados o controlador n˜o-linear apresentou melhor desempenho que o controlador abaseado em interpola¸˜o. Para velocidades moderadas a diferen¸a ´ pequena, mas ela ca c efica bastante evidente para velocidades mais elevadas. Al´m disso, os sinais de controle etamb´m s˜o mais suaves com o controlador n˜o-linear. Os autores comentam que nenhum e a ados dois controladores requer conhecimento pr´vio dos valores dos parˆmetros dinˆmicos e a ado robˆ, embora o controlador adaptativo requeira maior informa¸˜o estrutural para seu o caprojeto. Esta ´ a principal justificativa dos autores para explicar o melhor desempenho e
  • 52. 56 3 Compensa¸˜o Adaptativa da Dinˆmica ca aapresentado pelo controlador n˜o-linear. a Este cap´ ıtulo apresenta os projetos dos chamados primeiro e segundo controladoresdinˆmicos, al´m da an´lise de estabilidade dos sistemas em malha fechada, para cada caso, a e acom base na Teoria de Lyapunov. Os controladores s˜o projetados com base no modelo adinˆmico do robˆ, que incorpora toda a informa¸˜o estrutural dispon´ sobre o sistema. a o ca ıvelA importˆncia da compensa¸˜o adaptativa da dinˆmica ´ ilustrada atrav´s da compara¸˜o a ca a e e cade desempenho entre os sistemas com e sem sua realiza¸˜o. Considera¸˜es quanto ` ca co arobustez em rela¸˜o a dist´rbios e varia¸˜o de parˆmetros tamb´m s˜o apresentadas. ca u ca a e aResultados de simula¸˜es demonstram a validade e o funcionamento dos controladores copropostos, enquanto resultados experimentais ilustram o desempenho de tais controladoresquando aplicados a um robˆ m´vel comercial. o o3.2 Controlador Cinem´tico de Seguimento de Tra- a jet´ria o Esta se¸˜o apresenta o projeto de um controlador de seguimento de trajet´ria para ca orobˆs m´veis tipo uniciclo, e a an´lise de estabilidade do sistema em malha fechada o o aresultante. O controlador ´ baseado no modelo cinem´tico do robˆ, dado por (2.4). Tal e a omodelo foi apresentado no Cap´ ıtulo 2, e ´ aqui reproduzido por conveniˆncia: e e       x ˙ cos ψ −a sin ψ [ ] δx     u    y  =  sin ψ a cos ψ  +  δy  . (3.1)  ˙     ω ψ˙ 0 1 0 Desprezando-se as incertezas δx e δy e considerando-se as coordenadas do ponto deinteresse h = [x y]T , a equa¸˜o cinem´tica pode ser escrita como ca a [ ] [ ][ ] [ ] ˙ x ˙ cos ψ −a sin ψ u u h= = =A , (3.2) y ˙ sin ψ a cos ψ ω ωonde [ ] cos ψ −a sin ψ A= , (3.3) sin ψ a cos ψe sua inversa ´ dada por e [ ] cos ψ sin ψ A−1 = . − a sin ψ 1 1 a cos ψ
  • 53. 3.2 Controlador Cinem´tico de Seguimento de Trajet´ria a o 57 Logo, a cinem´tica inversa ´ dada por a e [ ] [ ][ ] u cos ψ sin ψ x ˙ = , (3.4) ω − a sin ψ 1 1 a cos ψ y ˙e a lei de controle proposta ´ e      kx uc cos ψ sin ψ xd + lx tanh( lx x) ˙ ˜   ref  =  , (3.5) ky c ωref − a sinψ a cos ψ 1 1 yd + ly tanh( ly y ) ˙ ˜onde a > 0, vd = [uc ref ωref ]T ´ a sa´ do controlador cinem´tico, x = xd −x e y = yd −y c e ıda a ˜ ˜s˜o os erros de posi¸˜o nos eixos X e Y, respectivamente, kx > 0 e ky > 0 s˜o os ganhos a ca ado controlador, lx ∈ R, e ly ∈ R s˜o constantes de satura¸˜o, e (x, y) e (xd , yd ) s˜o as a ca acoordenadas atual e desejada do ponto de interesse, respectivamente. Para a an´lise de estabilidade se sup˜e conhecimento do valor exato da distˆncia a a o ae seguimento perfeito de velocidade, ou seja, se considera que u ≡ uc e ω ≡ ωref , o ref cque significa que os efeitos da dinˆmica do robˆ s˜o ignorados. A equa¸˜o do sistema em a o a camalha fechada ´ e [ ] [ ][ ] [ ] ˙ x ˜ lx 0 tanh( kx x) x ˜ 0 l + ky = . (3.6) ˙ y ˜ 0 ly tanh( ly y ) ˜ 0 ıda ˜ Definindo o vetor de erro de sa´ como h = [˜ y ]T , a equa¸˜o (3.6) pode ser escrita x ˜ cacomo [ ( ) ( )]T ˙ h = − lx tanh kx x ly tanh ky y ˜ l x ˜ l y ˜ , (3.7)que possui um unico ponto de equil´ ´ ıbrio na origem. Para a an´lise de estabilidade deste aequil´ ca ˜ ˜ ıbrio, considera-se a fun¸˜o candidata de Lyapunov V = 1 hT h > 0, que ´ definida e 2positiva. Sua primeira derivada temporal ´ e ( ) ( ) ˙ kx ky V = h h = −˜lx tanh ˙ ˜ T˜ x x − y ly tanh ˜ ˜ y , ˜ lx lyque ´ definida negativa. Portanto, pode-se concluir que o equil´ e ıbrio (na origem) ´ as- esintoticamente est´vel, o que significa que x → 0 e y → 0 quando t → ∞ (KHALIL, a ˜ ˜2002). Nota 3.1 . Na Se¸˜o 3.3, a hip´tese de seguimento perfeito de velocidade ser´ re- ca o alaxada, e a estabilidade do equil´ ıbrio ser´ analisada para o sistema completo, depois da aadi¸˜o de um controlador dinˆmico. ca a
  • 54. 58 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Nota 3.2 . Considerando que a referˆncia ´ um ponto fixo, tem-se xd = 0 e yd = 0. e e ˙ ˙Nesse caso, o robˆ tende a atingir o ponto de referˆncia (xd , yd ), pois foi provado que x → 0 o e ˜e y → 0. Como a lei de controle proposta garante que ωref → 0, supondo seguimento ˜ cperfeito de velocidade, conclui-se que ω → 0. Nota 3.3 . A conclus˜o anterior mostra que o controlador cinem´tico projetado a apode ser utilizado em um problema de posicionamento, al´m de seguimento de trajet´ria, e ocomo foi mostrado em (MARTINS et al., 2007c). No entanto, o posicionamento realizadosomente com a utiliza¸˜o deste controlador n˜o leva em conta a orienta¸˜o final do robˆ. ca a ca oCaso seja desej´vel control´-la, pode-se realizar o chaveamento entre controladores de a aforma que, ap´s atingir o ponto final, o controlador de seguimento seja desativado e um ocontrolador de orienta¸˜o final seja habilitado. Exemplos desse tipo de utiliza¸˜o podem ca ca ˜ser encontrados em (TOIBERO et al., 2006; BRANDAO et al., 2007a). Nota 3.4 . Supondo que a trajet´ria desejada seja suave e limitando-se os valores de oxd e yd , pode-se obter constantes lx e ly tais que os termos lx tanh( kx x) e ly tanh( ky y ),˙ ˙ l x ˜ l y ˜presentes na lei de controle, limitem os sinais de controle a valores aceit´veis para o arobˆ. Assim, mesmo na presen¸a de erros muito grandes, o controlador proposto n˜o vai o c aprovocar satura¸˜o dos atuadores do robˆ. ca o Para ilustrar o funcionamento do controlador cinem´tico representado pela equa¸˜o a ca(3.5), foram realizadas simula¸˜es considerando o modelo completo do robˆ representado co opela equa¸˜o (2.13) com os parˆmetros identificados do robˆ Pioneer 3-DX, apresentados ca a ona Se¸˜o 2.4. O modelo completo do sistema foi constru´ e simulado utilizando a ca ıdoplataforma MATLAB/Simulink. Foi inserido ru´ branco nos sinais de posi¸˜o e de ıdo cavelocidade, de forma a simular o ru´ existente na leitura dos sinais disponibilizados pelo ıdorobˆ. A potˆncia do ru´ inserido foi definida experimentalmente de forma que os sinais o e ıdosimulados possu´ ıssem aspecto semelhante ao daqueles obtidos atrav´s da odometria dos erobˆs Pioneer. O mesmo tipo de ru´ o ıdo, com a mesma potˆncia, est´ presente em todas e aas simula¸˜es apresentadas neste cap´ co ıtulo. Na primeira simula¸˜o, o controlador foi utilizado para fazer o robˆ seguir uma tra- ca ojet´ria circular cujo raio varia bruscamente entre 0, 8 m e 0, 7 m, a cada 60 s, a partir ode t = 50 s. Seus ganhos foram ajustados experimentalmente de forma que o robˆ apre- osentasse desempenho satisfat´rio para a tarefa em quest˜o. Dessa forma, considerou-se o akx = 0, 2 e ky = 0, 2. A Figura 6(a) mostra parte da trajet´ria percorrida pelo robˆ, enquanto a Figura 6(b) o o
  • 55. 3.2 Controlador Cinem´tico de Seguimento de Trajet´ria a o 59 Erro de distância 1.4 1 1.2 0.5 1 0.8 Real erro [m] y [m] 0 0.6 0.4 −0.5 Ref. 0.2 −1 −1 −0.5 0 0.5 1 0 0 50 100 150 200 250 x [m] tempo [s] (a) (b)Figura 6: Controlador cinem´tico: trajet´ria circular. (a) Parte da trajet´ria percorrida a o o pelo robˆ; (b) Erro de distˆncia durante a simula¸˜o com parˆmetros identificados. o a ca ailustra a evolu¸˜o do erro de distˆncia durante a simula¸˜o considerada. O erro de ca a cadistˆncia ´ definido como a distˆncia instantˆnea entre as posi¸˜es atual e desejada. O a e a a cogrande valor inicial do erro se deve ao fato de que a posi¸˜o inicial do robˆ ´ (0, 2; −0, 8) m, ca oeenquanto a trajet´ria de referˆncia se inicia em (0, 8; 0, 0) m. Nota-se que a cada 60 s h´ o e aum acr´scimo instantˆneo no valor do erro, que ocorre devido ` s´bita mudan¸a no raio e a a u cda trajet´ria de referˆncia. Em todos os casos, o controlador projetado ´ capaz de fazer o e eo robˆ seguir a trajet´ria circular, sempre levando o erro para um valor pr´ximo a zero. o o o A Figura 7(a) apresenta os valores de velocidade linear e angular enviados pelo con-trolador cinem´tico e desenvolvidas pelo robˆ durante o seguimento da trajet´ria circular a o oem quest˜o, enquanto a Figura 7(b) mostra a diferen¸a entre esses valores, definido como a cerro de velocidade. Pode-se notar que o erro de seguimento de velocidade ´ muito pr´ximo e ode zero para o caso simulado, o que faz com que as linhas que indicam as velocidades reaise de referˆncia estejam praticamente sobrepostas na Figura 7(a). e O resultado da simula¸˜o anteriormente descrita mostra que o controlador cinem´tico ca arepresentado pela equa¸˜o (3.5) ´ capaz de fazer o robˆ seguir uma trajet´ria de referˆncia ca e o o ecom pequeno erro, considerando que seus ganhos sejam corretamente ajustados. No en-tanto, se a trajet´ria ´ modificada e os ganhos do controlador s˜o mantidos, o desempenho o e ado controlador pode ser prejudicado. Para ilustrar esse fato, foi realizada outra simula¸˜o cacom os mesmos parˆmetros do robˆ e do controlador, mas com uma trajet´ria em forma a o ode oito, com a finalidade de excitar ainda mais a dinˆmica do robˆ. As figuras 8(a) e a o
  • 56. 60 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 0.6 Real 0.4 Ref. 0.4 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 2 2 Real 1.5 Ref. 1 1 0 0.5 0 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b) Figura 7: Controlador cinem´tico: trajet´ria circular. (a) Velocidades linear e angular a o enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante a simula¸˜o com o ca parˆmetros identificados. a 0.5 Ref. 0 Real Erro de distância −0.5 0.4 y [m] −1 0.3 erro [m] −1.5 0.2 −2 0.1 −2.5 0 −2 0 2 0 50 100 150 200 250 x [m] tempo [s] (a) (b)Figura 8: Controlador cinem´tico: trajet´ria em forma de oito. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a identificados.8(b) ilustram, respectivamente, a trajet´ria percorrida pelo robˆ e a evolu¸˜o do erro de o o cadistˆncia durante a execu¸˜o da tarefa. O controlador ´ capaz de fazer o robˆ seguir a a ca e otrajet´ria em forma de oito, mas pode-se perceber que o valor m´dio do erro de distˆncia o e a´ maior se comparado com o resultado obtido na simula¸˜o anterior.e ca As velocidades linear e angular desenvolvidas pelo robˆ durante o seguimento da o
  • 57. 3.2 Controlador Cinem´tico de Seguimento de Trajet´ria a o 61 Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 Real 0.6 Ref. 0.4 0.4 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Real Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] Ref. 1 2 0.5 1 0 0 −0.5 −1 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b)Figura 9: Controlador cinem´tico: trajet´ria em forma de oito. (a) Velocidades linear e a o angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade durante a e o simula¸˜o com parˆmetros identificados. ca atrajet´ria em forma de oito s˜o apresentadas na Figura 9(a), assim como seus sinais de o areferˆncia enviados pelo controlador cinem´tico. Os erros de velocidade s˜o apresentados e a ana Figura 9(b). Nota-se que os valores de erro de seguimento de velocidade s˜o maiores anesse caso, o que indica a necessidade de algum tipo de ajuste nos ganhos do controlador. As simula¸˜es para seguimento das trajet´rias circular e em forma de oito foram repe- co otidas considerando que o robˆ teve sua dinˆmica alterada, representada por um aumento o ade 25% nos valores de seus parˆmetros dinˆmicos θ. As demais condi¸˜es, como os ganhos a a codo controlador e velocidades de referˆncia da trajet´ria, foram mantidas, e as simula¸˜es e o coanteriormente descritas foram repetidas. A Figura 10(a) mostra parte da trajet´ria circular percorrida pelo robˆ na simula¸˜o o o caem que os parˆmetros dinˆmicos foram alterados, enquanto a Figura 10(b) ilustra a a aevolu¸˜o do erro de distˆncia nesse caso. Pode-se notar que houve grande degrada¸˜o no ca a cadesempenho do controlador cinem´tico, com aumento significativo do erro de distˆncia, a aquando comparado com a situa¸˜o anterior, para a qual os ganhos do controlador ci- canem´tico foram inicialmente ajustados. a A Figura 11(a) mostra os valores das velocidades linear e angular desenvolvidas pelorobˆ, assim como seus valores de referˆncia enviados pelo controlador cinem´tico. Pode- o e ase notar que a modifica¸˜o na dinˆmica do robˆ provocou aumento na diferen¸a entre os ca a o cvalores desejados e reais de velocidade, fato ilustrado pela figura 11(b), que apresenta os
  • 58. 62 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Erro de distância 1.4 1 Ref. 1.2 0.5 1 Real 0.8 erro [m] y [m] 0 0.6 0.4 −0.5 0.2 −1 −1 −0.5 0 0.5 1 0 0 50 100 150 200 250 x [m] tempo [s] (a) (b)Figura 10: Controlador cinem´tico: trajet´ria circular. (a) Parte da trajet´ria percorrida a o o pelo robˆ; (b) erro de distˆncia durante a simula¸˜o com parˆmetros alterados. o a ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 0.6 Real 0.4 Ref. 0.4 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 2 2 Real 1.5 Ref. 1 1 0 0.5 0 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b)Figura 11: Controlador cinem´tico: trajet´ria circular. (a) Velocidades linear e angular a o enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante a simula¸˜o com o ca parˆmetros alterados. avalores dos erros de seguimento de velocidade para esta simula¸˜o. ca Para o caso do seguimento da trajet´ria em forma de oito, a Figura 12(a) mostra oparte da trajet´ria percorrida pelo robˆ, enquanto a Figura 12(b) ilustra a evolu¸˜o do o o caerro de distˆncia durante a simula¸˜o em que o robˆ teve seus parˆmetros dinˆmicos a ca o a aalterados. Tamb´m nesta simula¸˜o, os valores dos ganhos do controlador cinem´tico s˜o e ca a aos mesmos daqueles usados na primeira simula¸˜o, situa¸˜o para a qual foram ajustados. ca ca
  • 59. 3.2 Controlador Cinem´tico de Seguimento de Trajet´ria a o 63 0.5 Ref. 0 Real Erro de distância −0.5 0.4 y [m] −1 0.3 erro [m] −1.5 0.2 −2 0.1 −2.5 0 −2 −1 0 1 2 0 50 100 150 200 250 x [m] tempo [s] (a) (b)Figura 12: Controlador cinem´tico: trajet´ria em forma de oito. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a alterados.Pode-se notar que a degrada¸˜o no desempenho do controlador neste caso foi ainda maior, cacom grande aumento no valor m´dio do erro de distˆncia durante todo o seguimento da e atrajet´ria. o A Figura 13(a) mostra os valores das velocidades linear e angular desenvolvidas pelorobˆ, assim como seus valores de referˆncia enviados pelo controlador cinem´tico. Pode- o e ase notar que a modifica¸˜o na dinˆmica do robˆ provocou aumento na diferen¸a entre os ca a o cvalores desejados e reais de velocidade, quando comparado com o resultado obtido paraa simula¸˜o anterior. A Figura 13(b) apresenta os valores dos erros de seguimento de cavelocidade para esta simula¸˜o, que ilustram o fato rec´m mencionado. ca e ´ E importante mencionar que ´ poss´ se obter melhora no desempenho do controlador e ıvelcinem´tico atrav´s do ajuste de seus ganhos. Por exemplo, um aumento nos valores de a ekx e ky provoca redu¸˜o nos valores de erro apresentados na Figura 12(b). A melhora cano desempenho ´ ilustrada pelas Figuras 14(a) e 14(b) que mostram, respectivamente, ea trajet´ria percorrida pelo robˆ e seu erro de seguimento para as mesmas condi¸˜es de o o cosimula¸˜o, apenas com aumento nos valores dos ganhos kx e ky . Nesse caso, os valores cados ganhos foram aumentados em cinco vezes. Na Se¸˜o 3.6 s˜o apresentados outros ca aresultados que ilustram a redu¸˜o no erro de distˆncia com o aumento dos ganhos do ca acontrolador cinem´tico. Deve-se notar, no entanto, que o erro de velocidade continua a aexistir, pois seu valor n˜o depende dos valores de kx e ky . a
  • 60. 64 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 Real 0.6 Ref. 0.4 0.4 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 2 Real 2 Ref. 1 1 0 0 −1 −2 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b)Figura 13: Controlador cinem´tico: trajet´ria em forma de oito. (a) Velocidades linear e a oangular enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante a simula¸˜o o ca com parˆmetros alterados. a 0.5 Ref. 0 Real Erro de distância −0.5 0.4 y [m] −1 0.3 erro [m] −1.5 0.2 −2 0.1 −2.5 0 −2 −1 0 1 2 0 50 100 150 200 250 x [m] tempo [s] (a) (b)Figura 14: Controlador cinem´tico: trajet´ria em forma de oito. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a alterados e ganhos maiores. Os resultados apresentados ilustram que, uma vez ajustados seus ganhos, o controla-dor cinem´tico pode ter seu desempenho severamente afetado por varia¸˜es na trajet´ria a co oe nos parˆmetros dinˆmicos do robˆ. Tal fato motiva o projeto de controladores que con- a a osideram o modelo dinˆmico completo do robˆ, que s˜o apresentados na pr´xima se¸˜o. a o a o ca
  • 61. 3.3 Controladores Dinˆmicos a 653.3 Controladores Dinˆmicos a Esta se¸˜o apresenta o projeto e an´lise de estabilidade de controladores cujo objetivo ca a´ compensar a dinˆmica dos robˆs m´veis. O sistema de controle proposto consiste nae a o oinser¸˜o de um controlador para compensar os efeitos da dinˆmica do robˆ, denominado de ca a ocontrolador dinˆmico. Este recebe do controlador cinem´tico as referˆncias de velocidades a a elinear e angular, e envia ao robˆ sinais de comando compensados, de forma que o robˆ o oexecute as velocidades de referˆncia geradas pelo controlador cinem´tico com o menor e aerro poss´ ıvel. Em rela¸˜o ao controlador dinˆmico proposto em (De La CRUZ; CARELLI, 2006), ca aa abordagem aqui proposta apresenta como vantagem o fato de que, uma vez projetadopara um dado robˆ, o mesmo controlador dinˆmico pode ser utilizado em conjunto com o aoutros controladores cinem´ticos com fun¸˜es diferentes, como seguimento de caminhos a co(CELESTE et al., 2008), posicionamento num dado ponto (MARTINS et al., 2007c), ou ˜controle de forma¸˜o (MARTINS et al., 2008; BRANDAO et al., 2009a), por exemplo. caTal fato ´ ilustrado no Cap´ e ıtulo 4, que apresenta a utiliza¸˜o dos controladores dinˆmicos ca aaqui propostos em conjunto com controladores cinem´ticos, cujos objetivos s˜o manter a a aforma¸˜o numa estrutura l´ ca ıder-seguidor e manter e seguir uma forma¸˜o numa estrutura cavirtual. Nas subse¸˜es seguintes ser˜o apresentados dois controladores dinˆmicos adaptativos, co a asendo um projetado com base no modelo representado por (2.3), denominado primeirocontrolador dinˆmico, e o outro projetado com base no modelo representado por (2.13), adenominado segundo controlador dinˆmico. a3.3.1 Primeiro Controlador Dinˆmico a O primeiro controlador dinˆmico proposto foi projetado com base no modelo dinˆmico a arepresentado por (2.3). Em (De La CRUZ, 2006) j´ havia sido proposto um controlador adinˆmico com base neste modelo. Por´m, o controlador l´ apresentado foi projetado com a e abase em lineariza¸˜o do modelo completo por realimenta¸˜o de entrada-sa´ e a equa¸˜o ca ca ıda, cade controle resultante depende das caracter´ ısticas cinem´ticas e dinˆmicas do robˆ. Aqui, a a oo controlador completo tamb´m depende das caracter´ e ısticas cinem´ticas e dinˆmicas do a arobˆ, mas seu projeto ´ divido em duas partes (cinem´tica e dinˆmica), sendo a parte o e a acinem´tica aquela apresentada na Se¸˜o 3.2. a ca O sistema completo ´ ilustrado no diagrama da Figura 15. A figura mostra que o e
  • 62. 66 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Figura 15: Diagrama geral do sistema de controle proposto.controlador cinem´tico recebe os valores desejados de posi¸˜o (xd , yd ) e velocidade (xd , yd ) a ca ˙ ˙no referencial cartesiano, e gera os valores desejados de velocidade linear uc e angular ref cωref com base nas informa¸˜es de posi¸˜o (x, y) e orienta¸˜o ψ fornecidas pelo robˆ. Ao co ca ca oinv´s de serem diretamente enviados ao robˆ (como foi feito nas simula¸˜es realizadas na e o coSe¸˜o 3.2), os sinais uc e ωref s˜o enviados ao controlador dinˆmico, que gera outro par ca ref c a ade sinais de referˆncia de velocidade uref e ωref para serem enviados ao robˆ, compensando e oa dinˆmica do ve´ a ıculo. O projeto do primeiro controlador dinˆmico ´ baseado no modelo dinˆmico parame- a e atrizado do robˆ m´vel. Desprezando os termos δu e δω , que representam dist´rbios, a o o uparte que representa a dinˆmica do modelo dado por (2.3) pode ser escrita como a [ ]   [ ][ ] u ˙ θ3 2 θ1 ω − θ4 θ1 u 1 0 uref = + θ1 1 , ω ˙ − θ5 uω − θ6 ω 0 θ2 ωref θ2 θ2 Rearranjando os termos, a parametriza¸˜o linear da equa¸˜o dinˆmica resulta em ca ca a [ ] [ ] uref u 0 −ω 2 u 0 0 [ ˙ ]T = θ1 θ2 θ3 θ4 θ5 θ6 , (3.8) ωref 0 ω˙ 0 0 uω ωque tamb´m pode ser escrita como e [ ] [ ][ ] [ ] uref θ1 0 u˙ 0 0 −ω 2 u 0 0 [ ]T = + θ1 θ2 θ3 θ4 θ5 θ6 , ωref 0 θ2 ω ˙ 0 0 0 0 uω ω
  • 63. 3.3 Controladores Dinˆmicos a 67ou, numa forma compacta, vr = H v + η, ˙ (3.9)onde vr = [uref ωref ]T , v = [u ω]T , H = diag(θ1 , θ2 ) e [ ] 0 0 −ω 2 u 0 [ 0 ]T η= θ1 θ2 θ3 θ4 θ5 θ6 . 0 0 0 0 uω ω Baseado na dinˆmica inversa, a lei de controle proposta ´ a e [ ] [ ][ ] [ ] uref θ1 0 σ1 0 0 −ω 2 u 0 0 [ ]T = + θ1 θ2 θ3 θ4 θ5 θ6 , ωref 0 θ2 σ2 0 0 0 0 uω ωque pode ser escrita como vr = H σ + η, (3.10)onde σ = [σ1 σ2 ]T = vd + K˜, onde K = diag(ku , kω ) > 0 ´ uma matriz de ganhos diag- ˙ v enonal e definida positiva, v = vd − v ´ o vetor de erro de velocidade e vd = [uc ˜ e ref ωref ]T . cOu seja, σ1 = uc + ku u, ˙ ref ˜ ku > 0, ˙c σ2 = ωref + kω ω , ˜ kω > 0. Os erros de velocidade s˜o definidos como u = uc − u e ω = ωref − ω. A equa¸˜o a ˜ ref ˜ c ca(3.10) tamb´m pode ser escrita como e vr = G(σ1 , σ2 , u, ω)θ, (3.11)onde θ = [θ1 θ2 θ3 θ4 θ5 θ6 ]T e [ ] σ1 0 −ω 2 u 0 0 G= . 0 σ2 0 0 uω ω O desenvolvimento anterior considera que os parˆmetros dinˆmicos do robˆ s˜o conhe- a a o acidos de forma exata, ou seja, que o vetor θ cont´m os valores verdadeiros dos parˆmetros. e aNo entanto, caso haja incerteza nos valores dos parˆmetros, a lei de controle a ˆ ˜ ˜ vr = Gθ = Gθ + Gθ = H σ + η + Gθ (3.12) e ˆ adeve ser considerada, ao inv´s de (3.11), onde θ e θ s˜o os vetores de parˆmetros reais a
  • 64. 68 3 Compensa¸˜o Adaptativa da Dinˆmica ca a(verdadeiros) e estimados do robˆ, respectivamente, sendo θ = θ − θ o vetor de erro o ˜ ˆparam´trico. e Para an´lise de estabilidade do sistema em malha fechada, iguala-se as equa¸˜es do a comodelo (3.9) e do controlador (3.12), que resulta em ˜ H v + η = H σ + η + Gθ, ˙que ´ equivalente a e H (σ − v) = −Gθ. ˙ ˜ (3.13) Pode-se concluir que σ − v = v + K˜, e a equa¸˜o (3.13) pode ser escrita como ˙ ˜ ˙ v ca H (v + K˜) = −Gθ ˙ ˜ v ˜ou v = −H −1 Gθ − K˜, ˙ ˜ ˜ v (3.14)que representa a equa¸˜o do erro do sistema. Agora, ´ considerada a fun¸˜o candidata de ca e caLyapunov 1 1 ˜T ˜ V = vT H v + θ γ θ > 0, ˜ ˜ (3.15) 2 2sendo γ ∈ R6×6 uma matriz diagonal definida positiva e H > 0, como pode ser visto naSe¸˜o 2.2. Considerando que os parˆmetros do robˆ n˜o se alteram durante a execu¸˜o ca a o a cade uma tarefa, o vetor de parˆmetros θ ´ constante. Assim, j´ que θ = θ − θ, conclui-se a e a ˜ ˆ ˙ ˙que ˜ = ˆ e a primeira derivada temporal da fun¸˜o candidata de Lyapunov (3.15) ´ θ θ, ca e ˜ ˜T θ.˙ V = −˜T H K˜ − vT Gθ + θ γˆ ˙ v v ˜ (3.16)3.3.1.1 Adapta¸˜o de Parˆmetros ca a Com a inclus˜o da lei de adapta¸˜o de parˆmetros, o diagrama geral do sistema de a ca acontrole proposto tem o aspecto ilustrado na Figura 16. A figura mostra que o sistematem o mesmo aspecto daquele apresentado pela Figura 15, com a inclus˜o de um bloco que a ˆexecuta o ajuste dos valores dos parˆmetros estimados θ. Esse bloco recebe os valores de avelocidades de referˆncia enviados pelo controlador cinem´tico e os valores das velocidades e areais do robˆ, e calcula a varia¸˜o que cada parˆmetro deve ter em fun¸˜o do erro de o ca a cavelocidade, como detalhado a seguir. Ser˜o consideradas duas leis de adapta¸˜o de parˆmetros para o controlador proposto. a ca a
  • 65. 3.3 Controladores Dinˆmicos a 69Figura 16: Diagrama geral do sistema de controle proposto considerando adapta¸˜o de ca parˆmetros. aA primeira delas ´ dada por e ˙ ˆ = γ −1 GT v. θ ˜ (3.17)Substituindo (3.17) em (3.16) tem-se que V = −˜T H K˜, ˙ v v (3.18) e ˆ aque ´ semidefinida negativa, pois o sinal de erro θ n˜o est´ presente. Isso permite verificar aa estabilidade do equil´ ıbrio (mas n˜o estabilidade assint´tica) para o sistema descrito por a o(3.14) com a utiliza¸˜o da lei de adapta¸˜o de parˆmetros (3.17). Ou seja, pode-se afirmar ca ca aque v e θ s˜o sinais limitados, i.e., v ∈ L∞ e θ ∈ L∞ . ˜ ˜ a ˜ ˜ Integrando a equa¸˜o (3.18), tem-se que ca ∫ T V (T ) − V (0) = − vT H K˜dt, ˜ v 0e desprezando-se o termo positivo V (T ), tem-se a desigualdade ∫ T ∫ T −V (0) − ˜T v H K˜dt ou V (0) v vT H K˜dt. ˜ v (3.19) 0 0 Como H K ´ uma matriz sim´trica e definida positiva, a desigualdade e e 2 λmin (H K) v ˜ vT H K˜ ˜ v λmax (H K) v ˜ 2 (3.20)
  • 66. 70 3 Compensa¸˜o Adaptativa da Dinˆmica ca a´ verificada, onde λmin (·) e λmax (·) representam os autovalores m´e ınimo e m´ximo da amatriz, respectivamente. Assim, usando a condi¸˜o (3.20) na equa¸˜o (3.19) verifica-se ca caque ∫ T V (0) v 2 dt ˜ . (3.21) 0 λmin (H K) V (0) Al´m disso, como o termo e λmin (H K) n˜o depende do tempo, a condi¸˜o expressa por a ca(3.21) ´ v´lida para todo T , ou seja, pode-se concluir que v ´ um sinal quadrado integr´vel, e a ˜e ai.e., v ∈ L2 . ˜ Considerando-se o caso em que os sinais de referˆncia de acelera¸˜o vr = [uc e ca ˙ ˙ ref ωref ]T ˙cgerados pelo controlador cinem´tico s˜o limitados (seguimento de uma trajet´ria suave, a a opor exemplo), tem-se que G ∈ L∞ . Observando-se que v ∈ L∞ e θ ∈ L∞ , da equa¸˜o ˜ ˜ ca(3.14) pode-se verificar que v ∈ L∞ . Portanto, de acordo com o Lema de Barbalat ˙ ˜(ASTROM; WITTENMARK, 1994) pode-se concluir que v → 0 quando t → ∞, o que ˜garante a convergˆncia assint´tica dos erros de controle para zero. e o A lei de adapta¸˜o de parˆmetros representada por (3.17) funciona como um integra- ca ador e, portanto, pode provocar problemas de robustez na presen¸a de ru´ c ıdos, dist´rbios uou erros na medi¸˜o dos sinais. Uma poss´ maneira de se evitar a deriva param´trica ´ ca ıvel e eatrav´s do desligamento da adapta¸˜o de parˆmetros quando o valor de erro atinge deter- e ca aminado limite m´ ınimo, como ilustrado em (MARTINS et al., 2007c). Outra forma conhe-cida de se evitar a deriva param´trica ´ a modifica¸˜o da lei de adapta¸˜o de parˆmetros e e ca ca aatrav´s da introdu¸˜o de um termo de modifica¸˜o-σ, tamb´m conhecido como “Termo de e ca ca eFuga”, ou “Leakage Term” (KAUFMAN; SOBEL, 1998; BOYD; SASTRY, 1989). Coma introdu¸˜o desse termo, ao inv´s de (3.17), a lei de adapta¸˜o de parˆmetros ca e ca a ˙ ˆ = γ −1 GT v − γ −1 Γθ ˆ θ ˜ (3.22)deve ser considerada, onde Γ ∈ R6×6 ´ uma matriz de ganhos diagonal definida positiva. eA equa¸˜o (3.22) pode ser reescrita como ca ˙ ˆ = γ −1 GT v − γ −1 Γθ − γ −1 Γθ. θ ˜ ˜ (3.23)Substituindo (3.23) em (3.16), a primeira derivada temporal da fun¸˜o candidata de caLyapunov (3.15) resulta em T T V = −˜T H K˜ − θ Γθ − θ Γθ. ˙ v v ˜ ˜ ˜ (3.24)
  • 67. 3.3 Controladores Dinˆmicos a 71 Em (NASISI; CARELLI, 2003) os autores analisam a estabilidade do equil´ ıbrio de umsistema de controle servo-visual para robˆs manipuladores. A an´lise realizada a seguir ´ o a ebaseada nas ideias ali apresentadas. Definindo as constantes µΓ = χ(Γ), µHK = χ(H K) √e ϑΓ = κmax (Γ), onde χ(Z) = λmin (ZT Z) ´ o valor singular m´ e ınimo de Z, κmax (Z) =√ λmax (ZT Z) denota o valor singular m´ximo de Z e λmin (·) e λmax (·) s˜o fun¸˜es para a a co ˙obten¸˜o do menor e do maior autovalor de uma matriz, respectivamente, V pode ser careescrita como ˙ V −µHK v ˜ 2 − µΓ θ ˜ 2 ˜ + ϑΓ θ θ . (3.25) Considerando ξ ∈ R+ e a diferen¸a quadrada c ( )2 1 ˜ 1 ˜ θ −ξ θ = 2 θ 2−2 θ ˜ θ + ξ2 θ 2, ξ ξque pode ser escrita como ( )2 1 ˜ ξ2 1 1 ˜ ˜ θ θ = 2 θ 2 + θ 2 − θ −ξ θ , 2ξ 2 2 ξe desprezando o termo negativo, a inequa¸˜o ca ˜ 1 ˜ 2 ξ2 2 θ θ θ + θ (3.26) 2ξ 2 2´ obtida. Substituindo (3.26) em (3.25), resultae ( ) 1 ˜ ξ2 ˙ V −µHK v ˜ 2 − µΓ θ ˜ 2 + ϑΓ θ 2 + θ 2 , 2ξ 2 2ou, de forma equivalente, ( ) ϑΓ 1 ξ2 ˙ V −µHK v ˜ 2 − µΓ 1− ˜ θ 2 + ϑΓ θ 2. (3.27) µΓ 2ξ 2 2 ( ) Em seguida, os parˆmetros α1 = µHK > 0 e α2 = µΓ 1 − a ϑΓ 1 µΓ 2ξ 2 > 0 s˜o definidos, acom ξ selecionado de maneira conveniente. Logo, (3.27) pode ser reescrita como ˙ V −α1 v ˜ 2 − α2 θ ˜ 2 + ρ, (3.28) 2 Tonde ρ = ϑΓ ξ2 θ 2 . Agora, a fun¸˜o candidata de Lyapunov V = 1 vT H v + 1 θ γ −1 θ ca 2 ˜ ˜ 2˜ ˜
  • 68. 72 3 Compensa¸˜o Adaptativa da Dinˆmica ca apode ser escrita como V β1 v ˜ 2 ˜ + β2 θ 2 , (3.29) √onde β1 = 1 ϑH , β2 = 1 ϑγ , ϑH = κmax (H ), ϑγ = κmax (γ), com κmax (Z) = 2 2 λmax (ZT Z)denotando o m´ximo valor singular de Z. Ent˜o, a a ˙ V −ΛV + ρ, (3.30) { }com Λ = min α1 α2 , β1 β2 ˜ ˜ a . J´ que ρ ´ limitado, (3.30) implica que v e θ s˜o finalmente a elimitados. Portanto, a modifica¸˜o-σ torna a lei de adapta¸˜o mais robusta, mas aumenta ca cao limite de erro. Como ρ ´ fun¸˜o do valor singular m´ e ca ınimo da matriz de ganho Γ, e seusvalores s˜o arbitr´rios, a fronteira limite do erro pode ser feita pequena. No limite, se a aΓ = 0, ent˜o v → 0 quando t → ∞, como foi mostrado anteriormente. a ˜ ˜e Agora, o comportamento do erro de seguimento h ´ analisado novamente, relaxando-se a condi¸˜o de seguimento perfeito de velocidade assumida na se¸˜o 3.2. Quando n˜o ca ca aexiste seguimento perfeito de velocidade, a equa¸˜o (3.6) deve ser escrita como ca [ ] [ ][ ] [ ] ˙ x ˜ lx 0 tanh( kx x) x ˜ ε1 l + ky = , (3.31) ˙ y ˜ 0 ly tanh( ly y ) ˜ ε2onde o vetor de erro [ε1 ε2 ]T pode tamb´m ser escrito como A˜, sendo e v [ ] cos ψ −a sin ψ A= , sin ψ a cos ψ ˙ ˜ ˜como definida na se¸˜o 3.2. Pode-se escrever a equa¸˜o (3.31) como h + L(h) = A˜, onde ca ca v [ ][ ] lx 0 tanh( kx x) x ˜ ˜ L(h) = l . 0 ly tanh( ky y ) l y ˜ Considera-se a mesma fun¸˜o candidata de Lyapunov utilizada na an´lise feita na ca a 1 ˜T ˜se¸˜o 3.2, ou seja, V = 2 h h > 0. Sua primeira derivada temporal ´ agora escrita como ca e ˙ V = hT h = hT (A˜ − L(h)), ˙ ˜ ˜ ˜ v ˜e uma condi¸˜o suficiente para V < 0 ´ hT L(h) >|hT A˜|. Para valores pequenos do erro ca ˙ e˜ ˜ ˜ v
  • 69. 3.3 Controladores Dinˆmicos a 73de controle h, pode-se escrever L(h) ≈ Kxy h, onde ˜ ˜ ˜ [ ] kx 0 Kxy = . 0 ky Portanto, uma condi¸˜o suficiente para estabilidade assint´tica ´ ca o e hT Kxy h > |hT A˜|, ˜ ˜ ˜ v ˜ min(kx , ky ) h 2 ˜ > h A˜ , vou ˜ A˜v h > . (3.32) min(kx , ky ) ˜ a ˜ Por outro lado, se os valores do erro de controle h s˜o muito grandes, o termo L(h) ˜ esatura. Seu valor de satura¸˜o LSAT (h) ´ dado por ca [ ] lx sign(tanh( kx x)) x ˜ ˜ LSAT (h) = l , ly sign(tanh( ky y )) l y ˜onde sign(.) representa o sinal do argumento. Nesse caso, uma condi¸˜o suficiente para caestabilidade assint´tica ´ o e |hT LSAT (h)| > |hT A˜|, ˜ ˜ ˜ v |min(lx , ly )| h > h A˜ , ˜ ˜ vou |min(lx , ly )| > A˜ . v (3.33) Para o caso em que se utiliza a lei de adapta¸˜o de parˆmetros dada por (3.17), foi ca aprovado que v → 0, o que implica que as condi¸˜es (3.32) e (3.33) s˜o assintoticamente ˜ co a ˜ ˜verificadas para qualquer valor de h. Consequentemente, o erro de controle h(t)→ 0, oque est´ de acordo com o objetivo de controle. a Por outro lado, considerando a lei de adapta¸˜o mais robusta, que inclui o termo de camodifica¸˜o-σ, representada pela equa¸˜o (3.22), foi provado que v ´ finalmente limitado, ca ca ˜eo que significa que existe um limite R numa norma do sinal. Logo, para valores pequenos ˜ ˜do erro de controle h, a partir de (3.32) conclui-se que o erro de seguimento h tamb´m eser´ finalmente limitado por R A /min(kx , ky ) numa norma do erro de controle. J´ para a a ˜valores grandes do erro de controle h, a estabilidade est´ garantida com erros de controle afinalmente limitados se for cumprida a condi¸˜o dada por (3.33). Assim, as constantes lx e ca
  • 70. 74 3 Compensa¸˜o Adaptativa da Dinˆmica ca aly podem ser escolhidas de maneira que |min(lx , ly )| > R A , o que garante a estabilidadedo equil´ ıbrio com erros finalmente limitados para qualquer valor de h. ˜ Nota 3.5 . Deve-se notar que o controlador proposto n˜o garante que θ → 0 quando a ˜t → ∞. Em outras palavras, os parˆmetros estimados podem convergir para valores adiferentes dos verdadeiros. Isso n˜o significa um problema, j´ que θ → 0 n˜o ´ um a a ˜ a erequisito para que v → 0, ou para que v seja finalmente limitado. ˜ ˜ ´ Nota 3.6 . E importante salientar que uma plataforma n˜o-holonˆmica restringe a a odire¸˜o de velocidade linear que pode ser desenvolvida pelo robˆ. Um robˆ m´vel n˜o- ca o o o aholonˆmico deve estar orientado tangente ao caminho da trajet´ria, para segui-la com o oerro pequeno. Se esse n˜o for o caso, os erros de distˆncia ir˜o crescer. O fato de que os a a aerros de controle convergem para valores limitados mostra que a orienta¸˜o do robˆ n˜o ca o aprecisa ser controlada de forma expl´ ıcita. Nota 3.7 . As leis de adapta¸˜o de parˆmetros (3.17) e (3.22) realizam ajuste nos ca avalores dos parˆmetros estimados sempre que o erro de velocidade ´ diferente de zero. Isso a esignifica que, neste sistema, considera-se que todo o erro de seguimento de velocidade ´ ecausado por erro nos valores estimados dos parˆmetros dinˆmicos. Tais leis, portanto, n˜o a a arealizam a identifica¸˜o dos parˆmetros, mas uma adapta¸˜o em seus valores estimados ca a cade modo a reduzir o erro de seguimento de velocidade v. ˜3.3.1.2 Resultados de Simula¸˜o ca Para ilustrar o funcionamento do primeiro controlador dinˆmico proposto, represen- atado pela equa¸˜o (3.10), foram realizadas simula¸˜es nos mesmos moldes daquelas apre- ca cosentadas na se¸˜o 3.2, ou seja, foi considerado o modelo completo do robˆ, representado ca opela equa¸˜o (2.13), com os parˆmetros identificados do robˆ Pioneer 3-DX apresentados ca a ona Se¸˜o 2.4. No controlador cinem´tico foram mantidos os mesmos ganhos utilizados ca anas simula¸˜es anteriores, quais sejam kx = 0, 2 e ky = 0, 2. Os ganhos do controlador codinˆmico foram ajustados empiricamente, resultando em ku = 4 e kω = 4. a Na primeira simula¸˜o, o controlador foi utilizado para fazer o robˆ seguir uma tra- ca ojet´ria circular cujo raio varia bruscamente entre 0, 8 m e 0, 7 m a cada 60 s, a partir ode t = 50 s. Os parˆmetros θ utilizados no controlador dinˆmico possuem valores 25% a amaiores em rela¸˜o aos parˆmetros utilizados no modelo do robˆ. Neste primeiro caso, a ca a oadapta¸˜o de parˆmetros foi mantida desativada. ca a A Figura 17(a) mostra parte da trajet´ria percorrida pelo robˆ, enquanto a Fi- o o
  • 71. 3.3 Controladores Dinˆmicos a 75 Erro de distância 1.4 1 Ref. 1.2 0.5 1 Real 0.8 erro [m] y [m] 0 0.6 0.4 −0.5 0.2 −1 −1 −0.5 0 0.5 1 0 0 50 100 150 200 250 x [m] tempo [s] (a) (b) Figura 17: Primeiro controlador dinˆmico: trajet´ria circular. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) Erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a alterados e sem adapta¸˜o. cagura 17(b) ilustra a evolu¸˜o do erro de distˆncia durante a simula¸˜o considerada. O ca a cagrande valor inicial do erro se deve ao fato de que a posi¸˜o inicial do robˆ ´ (0, 2; −0, 8) m, ca oeenquanto a trajet´ria de referˆncia se inicia em (0, 8; 0, 0) m. Nota-se que a cada 60 s h´ o e aum acr´scimo instantˆneo no valor do erro, que ocorre devido ` s´bita mudan¸a no raio e a a u cda trajet´ria de referˆncia. A figura 17(b) tamb´m mostra que o erro n˜o tende a zero em o e e aregime permanente, o que ocorre devido ao erro param´trico existente, mas permanece elimitado. A Figura 18(a) apresenta os valores de velocidade linear e angular enviadas pelo con-trolador cinem´tico e desenvolvidas pelo robˆ durante o seguimento da trajet´ria circular a o oem quest˜o, enquanto a Figura 18(b) mostra a diferen¸a entre esses valores. Pode-se no- a ctar que o erro de velocidade apresenta um valor significativo em regime, o que ´ causado epela diferen¸a entre os parˆmetros dinˆmicos do modelo do robˆ e aqueles considerados c a a ono controlador. Com essa diferen¸a, a compensa¸˜o da dinˆmica do robˆ n˜o ´ feita c ca a o a ecorretamente pelo controlador dinˆmico. a A mesma simula¸˜o foi repetida, mas com a adapta¸˜o de parˆmetros ativada. Considerou- ca ca ase a lei de adapta¸˜o de parˆmetros dada por (3.22), que inclui a modifica¸˜o-σ. ca a ca A Figura 19(a) mostra parte da trajet´ria percorrida pelo robˆ, enquanto a Fi- o ogura 19(b) ilustra a evolu¸˜o do erro de distˆncia durante a simula¸˜o considerada. O ca a cagrande valor inicial do erro se deve ao fato de que a posi¸˜o inicial do robˆ ´ (0, 2; −0, 8) m, ca oe
  • 72. 76 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 0.6 Real 0.4 Ref. 0.4 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 2 2 Real 1.5 Ref. 1 1 0 0.5 0 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b) Figura 18: Primeiro controlador dinˆmico: trajet´ria circular. (a) Velocidades linear e a oangular enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante a simula¸˜o o ca com parˆmetros alterados e sem adapta¸˜o. a ca Erro de distância 1.4 1 1.2 0.5 1 Real 0.8 erro [m] y [m] 0 0.6 0.4 −0.5 Ref. 0.2 −1 −1 −0.5 0 0.5 1 0 0 50 100 150 200 250 x [m] tempo [s] (a) (b) Figura 19: Primeiro controlador dinˆmico: trajet´ria circular. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) Erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a alterados e com adapta¸˜o ativada. caenquanto a trajet´ria de referˆncia se inicia em (0, 8; 0, 0) m. Nota-se que o erro de o edistˆncia diminui ao longo do tempo, na medida em que a adapta¸˜o de parˆmetros ´ a ca a erealizada. A cada 60 s h´ um acr´scimo instantˆneo no valor do erro, que ocorre devido a e a` s´bita mudan¸a no raio da trajet´ria de referˆncia.a u c o e A Figura 20(a) apresenta os valores de velocidade linear e angular enviadas pelo con-
  • 73. 3.3 Controladores Dinˆmicos a 77 Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 0.6 Real 0.4 Ref. 0.4 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 2 2 Real 1.5 Ref. 1 1 0 0.5 0 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b) Figura 20: Primeiro controlador dinˆmico: trajet´ria circular. (a) Velocidades linear e a oangular enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante a simula¸˜o o ca com parˆmetros alterados e com adapta¸˜o ativada. a catrolador cinem´tico e desenvolvidas pelo robˆ durante o seguimento da trajet´ria circular a o oem quest˜o, enquanto a Figura 20(b) mostra a diferen¸a entre esses valores. Pode-se a cperceber que o erro de velocidade apresenta um valor diferente de zero no in´ da si- ıciomula¸˜o, o que ´ causado pela diferen¸a entre os parˆmetros dinˆmicos do modelo do robˆ ca e c a a oe aqueles considerados no controlador, mas esta diferen¸a diminui ao longo do tempo. Ou cseja, na medida em que os parˆmetros θ do controlador s˜o ajustados com base na lei de a aadapta¸˜o, o erro de compensa¸˜o dinˆmica diminui, o que provoca redu¸˜o no erro de ca ca a cavelocidade e a consequente redu¸˜o no erro de seguimento. ca A evolu¸˜o dos parˆmetros estimados durante esta simula¸˜o ´ mostrada na Figura 21. ca a ca eConforme mencionado na Nota 3.5, a convergˆncia para os valores verdadeiros n˜o ´ e a egarantida pela lei de adapta¸˜o utilizada. ca Foi realizada uma terceira simula¸˜o para ilustrar o desempenho do controlador no cacaso em que os parˆmetros usados no controlador s˜o os parˆmetros reais (verdadeiros) a a ado robˆ, ou seja, considerando o caso ideal para a compensa¸˜o dinˆmica. Simulou-se o o ca acaso em que o robˆ deve seguir a trajet´ria em forma de oito anteriormente apresentada, o omantendo inalteradas as caracter´ ısticas como a trajet´ria de referˆncia, sua velocidade, os o eparˆmetros do robˆ, etc. Na presente simula¸˜o, a adapta¸˜o de parˆmetros do controla- a o ca ca ador dinˆmico ´ feita com base na lei de ajuste (3.22), que possui o termo de modifica¸˜o-σ. a e caNo in´ da simula¸˜o a adapta¸˜o est´ desativada, assim permanecendo at´ t = 50s. ıcio ca ca a eA partir desse instante, a adapta¸˜o de parˆmetros ´ ativada, e assim permanece at´ o ca a e e
  • 74. 78 3 Compensa¸˜o Adaptativa da Dinˆmica ca a θ1 θ2 1 0.4 0.5 0.3 0 0.2 0 100 200 300 0 100 200 300 θ3 θ4 0.2 1.5 0 1 −0.2 0.5 0 100 200 300 0 100 200 300 −3 θ5 θ6 x 10 5 1.4 4.5 1.2 4 1 0 100 200 300 0 100 200 300 tempo [s] tempo [s] Figura 21: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a ca trajet´ria circular - primeiro controlador dinˆmico. o at´rmino da simula¸˜o. e ca As Figuras 22(a), 22(b) ilustram, respectivamente, a trajet´ria percorrida pelo robˆ o oantes e depois da adapta¸˜o de parˆmetros, e a evolu¸˜o do erro de distˆncia durante a ca a ca aexecu¸˜o da tarefa. Pode-se notar que, ap´s atingir a trajet´ria, o controlador ´ capaz ca o o ede fazer o robˆ segu´ com erro muito pr´ximo a zero, mesmo antes de a adapta¸˜o o ı-la o cade parˆmetros ser ativada. Ap´s a adapta¸˜o de parˆmetros (em t = 50s) o erro se a o ca amant´m praticamente no mesmo valor e a trajet´ria percorrida pelo robˆ tamb´m n˜o ´ e o o e a evisivelmente alterada. As velocidades linear e angular desenvolvidas pelo robˆ durante o seguimento da otrajet´ria em forma de oito s˜o apresentadas na Figura 23(a), assim como seus sinais de o areferˆncia enviados pelo controlador cinem´tico. Os erros de velocidade s˜o apresentados e a ana Figura 23(b). Nota-se que os valores de erro de velocidade s˜o muito pr´ximos a zero a oj´ que, nesse caso, considerou-se que a dinˆmica do robˆ ´ exatamente compensada. a a oe A evolu¸˜o dos parˆmetros estimados durante esta simula¸˜o ´ mostrada na Figura 24. ca a ca eNota-se que os valores dos parˆmetros apresentam varia¸˜o muito pequena, o que era a caesperado, j´ que os parˆmetros estimados iniciam com os valores iguais aos do modelo. a a ca ca θ˙E importante ressaltar que, de acordo com a equa¸˜o de adapta¸˜o ˆ = γ −1 GT v, os´ ˜parˆmetros somente devem ter seus valores alterados se o erro de velocidade v ´ diferente a ˜ede zero. No presente caso, como foi inserido ru´ nos sinais de medi¸˜o de posi¸˜o ıdo ca ca
  • 75. 3.3 Controladores Dinˆmicos a 79 Antes da Adaptação Depois da Adaptação 0.5 0.5 Referência Referência Real Real 0 0 Erro de distância −0.5 −0.5 0.4 0.35y [m] y [m] −1 −1 0.3 0.25 erro [m] −1.5 −1.5 0.2 0.15 −2 −2 0.1 0.05 −2.5 −2.5 0 −2 −1 0 1 2 −2 −1 0 1 2 0 50 100 150 200 250 x [m] x [m] tempo [s] (a) (b) Figura 22: Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o de parˆmetros; o o ca a (b) erro de distˆncia durante a simula¸˜o com parˆmetros exatos. a ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 Real 0.6 Ref. 0.4 0.4 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Real Erro de Velocidade Angular [rad/s] 1 Ref. 2 0.5 1 0 0 −0.5 −1 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b)Figura 23: Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Velocidades a olinear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade durante e o a simula¸˜o com parˆmetros exatos. ca ae de velocidade, existe um pequeno erro entre a velocidade desenvolvida pelo robˆ e o ovalor recebido pelo controlador, ainda que a velocidade real do robˆ seja exatamente oigual ` velocidade de referˆncia gerada pelo controlador cinem´tico. Isso faz com que o a e aerro de velocidade seja distinto de zero, provocando pequenas varia¸˜es nos valores dos coparˆmetros. Al´m disso, a lei de adapta¸˜o utilizada inclui a modifica¸˜o-σ, ou seja, a e ca ca
  • 76. 80 3 Compensa¸˜o Adaptativa da Dinˆmica ca a θ θ2 1 0.25 0.28 0.24 0.27 0.23 0.26 0 100 200 300 0 100 200 300 −3 θ3 θ4 x 10 5 1.01 0 1 −5 0.99 0 100 200 300 0 100 200 300 −3 θ5 θ6 x 10 5 1.07 4 1.06 3 1.05 0 100 200 300 0 100 200 300 tempo [s] tempo [s] Figura 24: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a ca trajet´ria em forma de oito com parˆmetros exatos - primeiro controlador dinˆmico. o a a θ1 θ 2 0.3 0.28 0.25 0.27 0.2 0.26 0 0.5 1 1.5 2 0 0.5 1 1.5 2 4 4 x 10 x 10 θ θ 3 4 0.01 1.01 0 1 −0.01 0.99 0 0.5 1 1.5 2 0 0.5 1 1.5 2 4 4 x 10 x 10 −3 θ5 θ6 x 10 5 1.07 0 1.06 −5 1.05 0 0.5 1 1.5 2 0 0.5 1 1.5 2 tempo [s] x 10 4 tempo [s] x 10 4Figura 25: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de longa dura¸˜o para ca a ca ca trajet´ria em forma de oito com parˆmetros exatos - primeiro controlador dinˆmico. o a a˙ˆ = γ −1 GT v − γ −1 Γθ. Nesse caso, ainda que o erro de velocidade v seja nulo, haver´ ˆθ ˜ ˜ apequena modifica¸˜o no valor dos parˆmetros, como ilustra a Figura 24. ca a A mesma simula¸˜o foi repetida por um per´ ca ıodo muito mais longo, de 20.000s. NaFigura 25, que ilustra a evolu¸˜o dos parˆmetros estimados nesse caso, pode-se notar que ca an˜o ocorre divergˆncia em seus valores. a e
  • 77. 3.3 Controladores Dinˆmicos a 81 Ao se comparar os resultados mostrados pelas figuras 22(b) e 23(b), em que o con-trolador dinˆmico est´ presente, com aqueles das figuras 8(b) e 9(b), em que apenas o a acontrolador cinem´tico estava presente, percebe-se que a inser¸˜o do controlador dinˆmico a ca aproduz uma melhora substancial no desempenho do sistema. Ou seja, a inser¸˜o do con- catrolador dinˆmico produziu redu¸˜o no valor do erro de velocidade e, por conseguinte, a cadiminui¸˜o no valor do erro de seguimento. ca Para ilustrar a utilidade da adapta¸˜o de parˆmetros quando o robˆ tem sua dinˆmica ca a o aalterada, repetiu-se a simula¸˜o de seguimento da trajet´ria em forma de oito para o caso ca oem que os parˆmetros do robˆ foram alterados para valores 25% maiores do que os valores a ocarregados no controlador dinˆmico. A adapta¸˜o de parˆmetros do controlador dinˆmico a ca a atamb´m ´ feita com base na lei de ajuste (3.22), que possui o termo de modifica¸˜o-σ. e e caNo in´ da simula¸˜o a adapta¸˜o est´ desativada, assim permanecendo at´ t = 50s. A ıcio ca ca a epartir desse instante, a adapta¸˜o de parˆmetros ´ ativada, assim permanecendo at´ o ca a e et´rmino da simula¸˜o. e ca As figuras 26(a) e 26(b) ilustram, respectivamente, a trajet´ria percorrida pelo robˆ o oantes e depois da adapta¸˜o de parˆmetros, e a evolu¸˜o do erro de distˆncia durante ca a ca aa execu¸˜o da tarefa. Pode-se notar que o controlador ´ capaz de fazer o robˆ seguir ca e oa trajet´ria de referˆncia, por´m com erro grande, antes da adapta¸˜o de parˆmetros o e e ca aser ativada. Ap´s sua ativa¸˜o, em t = 50s, o erro come¸a a ser reduzido e se mant´m o ca c epr´ximo a zero ap´s t = 200s. o o As velocidades linear e angular desenvolvidas pelo robˆ durante o seguimento da otrajet´ria em forma de oito s˜o apresentadas na Figura 27(a), assim como seus sinais de o areferˆncia enviados pelo controlador cinem´tico. Os erros de velocidade s˜o apresentados e a ana Figura 27(b). Nota-se que os valores de erro de velocidade s˜o grandes antes de t = 50s, aj´ que a dinˆmica do robˆ n˜o est´ sendo compensada corretamente. Ap´s o in´ da a a o a a o ıcioadapta¸˜o de parˆmetros, o erro de velocidade ´ reduzido gradualmente, apresentando ca a etendˆncia a se manter pr´ximo a zero. e o A evolu¸˜o dos parˆmetros estimados durante esta simula¸˜o ´ mostrada na Figura 28. ca a ca eNota-se que os valores dos parˆmetros apresentam varia¸˜o ap´s a ativa¸˜o da adapta¸˜o, a ca o ca caem t = 50s. A convergˆncia dos parˆmetros ´ ilustrada na Figura 29, obtida com a e a erepeti¸˜o da simula¸˜o anterior, mantendo-se as mesmas condi¸˜es, mas por um per´ ca ca co ıodomuito mais longo. Pode-se notar que n˜o h´ divergcia em nenhum de seus valores. a a Ao se comparar os resultados mostrados pelas figuras 26(b) e 27(b), tendo o controla-dor dinˆmico presente e adapta¸˜o de parˆmetros ativa, com aqueles das figuras 12(b) e a ca a
  • 78. 82 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Antes da Adaptação Depois da Adaptação 0.5 0.5 0 0 Erro de distância −0.5 −0.5 0.4 Início da Adaptação y [m] −1 Real y [m] −1 Real 0.3 erro [m] −1.5 −1.5 0.2 −2 −2 0.1 Ref. Ref. −2.5 −2.5 0 −2 −1 0 1 2 −2 −1 0 1 2 0 50 100 150 200 250 x [m] x [m] tempo [s] (a) (b) Figura 26: Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o de parˆmetros; o o ca a (b) erro de distˆncia durante a simula¸˜o com parˆmetros alterados. a ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 Real 0.6 Ref. 0.4 0.4 Início da Adaptação 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Real Erro de Velocidade Angular [rad/s] 1 Ref. 2 0.5 Início da Adaptação 1 0 0 −0.5 −1 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b)Figura 27: Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Velocidades a olinear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade durante e o a simula¸˜o com parˆmetros alterados. ca a13(b), em que apenas o controlador cinem´tico estava presente, percebe-se que a inser¸˜o a cado controlador dinˆmico produz uma melhora expressiva no desempenho do sistema ap´s a oo in´ da adapta¸˜o de parˆmetros. Ap´s t = 50s, quando a adapta¸˜o ´ iniciada, o ıcio ca a o ca evalor do erro de velocidade ´ reduzido e, consequentemente, ocorre importante diminui¸˜o e cano valor do erro de seguimento.
  • 79. 3.3 Controladores Dinˆmicos a 83 θ1 θ2 1 1 0.5 0.5 0 0 0 100 200 300 0 100 200 300 θ3 θ4 0.05 1.5 0 1 −0.05 0.5 0 100 200 300 0 100 200 300 −3 θ5 θ6 x 10 5 1.4 4.5 1.2 4 1 0 100 200 300 0 100 200 300 tempo [s] tempo [s] Figura 28: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a catrajet´ria em forma de oito com parˆmetros alterados - primeiro controlador dinˆmico. o a a θ θ 1 2 1 1 0.5 0.5 0 0 0 0.5 1 1.5 2 0 0.5 1 1.5 2 4 4 x 10 x 10 θ θ 3 4 0.05 1.5 0 1 −0.05 0.5 0 0.5 1 1.5 2 0 0.5 1 1.5 2 4 4 x 10 x 10 −3 θ5 θ6 x 10 5 1.4 0 1.2 −5 1 0 0.5 1 1.5 2 0 0.5 1 1.5 2 tempo [s] x 10 4 tempo [s] x 10 4Figura 29: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de longa dura¸˜o para ca a ca catrajet´ria em forma de oito com parˆmetros alterados - primeiro controlador dinˆmico. o a a Nota 3.8 . Considerando a adapta¸˜o dos parˆmetros estimados, seu tempo de con- ca avergˆncia pode ser reduzido com o aumento dos valores da matriz de ganhos de adapta¸˜o e caγ −1 , o que tamb´m provocaria redu¸˜o mais r´pida nos erros de controle. No entanto, e ca aobservou-se em simula¸˜es e experimentos que na presen¸a de dist´rbios ou ru´ co c u ıdos namedi¸˜o, ganhos de adapta¸˜o elevados podem causar oscila¸˜o no sistema, prejudicando ca ca caseu desempenho.
  • 80. 84 3 Compensa¸˜o Adaptativa da Dinˆmica ca a3.3.2 Segundo Controlador Dinˆmico a O projeto do segundo controlador dinˆmico foi realizado com base na equa¸˜o (2.13), a caproposta para representar o modelo dinˆmico do robˆ m´vel uniciclo. Tal equa¸˜o ´ aqui a o o ca ereproduzida por conveniˆncia: e ∆ + Hv + C(v )v + F(v )v = vr . ˙ (3.34) Assim como o primeiro controlador dinˆmico, este tamb´m recebe as referˆncias de a e evelocidade linear uc e angular ωref geradas pelo controlador cinem´tico, realiza a com- ref c apensa¸˜o da dinˆmica do ve´ ca a ıculo, e gera comandos de velocidades linear uref e angularωref que s˜o enviados ao robˆ. A estrutura do controlador ´ aquela representada pela a o eFigura 15, que ilustra que v = [u ω]T , vd = [uc ref ωref ]T e vr = [uref c ωref ]T . Parafacilitar a leitura, os componentes do vetor vd ser˜o, a partir de agora, chamados de ud e aωd , ou seja, vd = [ud ωd ]T = [uc ref ωref ]T . c O vetor de velocidades desejadas modificadas vd ´ definido como e [ ][ ] I 0 ud vd = . 0 1 ωd Assim, o vetor de erro de velocidade ´ dado por v = vd − v . e ˜ Foi proposta a lei de controle vr = H(vd + T(˜ )) + Cvd + Fvd , ˙ v (3.35) O vetor T(˜ ) ´ dado por v e [ ][ ] lu 0 tanh( ku I u) l u ˜ T(˜ ) = v , 0 lω tanh( kω ω ) l ω ˜onde ku > 0 e kω > 0 s˜o ganhos constantes e lu ∈ R e lω ∈ R s˜o constantes de satura¸˜o. a a caO termo T(˜ ) provoca satura¸˜o para garantir que os sinais de comando enviados ao robˆ v ca oestejam dentro dos limites aceitos pelo ve´ ıculo, o que evita a satura¸˜o de seus atuadores cadesde que vd e vd sejam limitados a valores apropriados. ˙ Considerando a lei de controle (3.35), a equa¸˜o de malha fechada ´ ca e Hv = −HT(˜ ) − C˜ − F˜ + ∆. ˙ ˜ v v v (3.36)
  • 81. 3.3 Controladores Dinˆmicos a 85 Para a an´lise de estabilidade, considera-se a fun¸˜o candidata de Lyapunov definida a ca 1 T ˜2 v e ˙ ˜ ˙positiva V = v H˜ . Sua primeira derivada temporal ´ V = v T Hv , onde considerou-se ˜que os parˆmetros dinˆmicos do robˆ s˜o constantes e, portanto, H ´ constante. Usando a a o a ea equa¸˜o (3.36) e considerando nulo o vetor de dist´rbios ∆, a primeira derivada pode ca user escrita como V = −˜ T HT(˜ ) − v T C˜ − v T F˜ . ˙ v v ˜ v ˜ v Considerando a propriedade 5 do modelo, de antissimetria da matriz C, pode-seescrever que V = −˜ T HT(˜ ) − v T F˜ . ˙ v v ˜ v A propriedade 1 afirma que H ´ uma matriz sim´trica e definida positiva. Os termos e edo vetor T(˜ ) possuem o mesmo sinal dos termos de v . A propriedade 3 afirma que a v ˜matriz F ´ sim´trica e definida positiva se θ6 > −(θ5 /I − θ3 )Iu. Portanto, considerando e eque θ6 > −(θ5 /I − θ3 )Iu, pode-se concluir que V < 0, ou seja, v ∈ L∞ e v → 0 com ˙ ˜ ˜t → ∞ e, portanto, v ∈ L∞ e v → 0 com t → ∞, o que mostra que o objetivo de controle ˜ ˜´ cumprido. Como foi discutido na se¸˜o 2.4, os robˆs que tiveram seus parˆmetrose ca o aidentificados (Pioneer 2 e Pioneer 3-DX, da empresa Mobile Robots, e a cadeira de rodasrob´tica) cumprem a condi¸˜o anterior. o ca Na se¸˜o 3.5 a an´lise de estabilidade deste controlador ´ retomada considerando-se ca a eque o vetor de dist´rbios ´ n˜o nulo, ou seja, ∆ = 0. u e a Uma propriedade adicional do sinal de erro v ´ o fato de ser quadrado integr´vel, ˜ e a ˙como se mostra a seguir. Integrando V , resulta em ∫ T ∫ T V (T ) − V (0) = − v HT(˜ )dt − ˜T v v T F˜ dt. ˜ v 0 0 Desprezando o termo positivo V (T ), ∫ T ∫ T −V (0) ≤ − v HT(˜ )dt − ˜ T v v T F˜ dt. ˜ v 0 0 Considerando que θ6 > −(θ5 /I − θ3 )Iu e aplicando a propriedade 3, pode-se escreverque ∫ ∫ T T V (0) ≥ ˜T v HT(˜ )dt + inf(λmin (F)) v v ˜ 2 dt, 0 0onde inf(λmin (F)) representa o ´ ınfimo do menor autovalor de F. A desigualdade anterior
  • 82. 86 3 Compensa¸˜o Adaptativa da Dinˆmica ca amostra que os termos est˜o todos limitados e, portanto, pode ser escrita como a ∫ T V (0) ≥ inf(λmin (F)) v 2 dt + α, ˜ 0 ∫∞onde α = 0 v T HT(˜ )dt. Logo, ˜ v ∫ ∫ ∞ T 2 V (0) − α 2 V (0) − α v ˜ dt ≤ ⇒ v ˜ dt ≤ , (3.37) 0 inf(λmin (F)) 0 inf(λmin (F))o que permite concluir que v ´ quadrado integr´vel, i.e., v ∈ L2 . ˜ e a ˜ Agora ´ realizada uma an´lise equivalente ` que foi feita na se¸˜o 3.3.1, considerando- e a a case que n˜o h´ seguimento perfeito de velocidade. Ou seja, considera-se que v = 0 e, a a ˜portanto, v = 0. Como foi visto, pode-se escrever a equa¸˜o de erro (3.6) como ˜ ca ˙ ˜ ˜ h + L(h) = A˜, v (3.38)onde [ ][ ] lx 0 tanh( kx x) x ˜ ˜ L(h) = l , 0 ly tanh( ky y ) l y ˜e o vetor A˜ representa o erro de seguimento de velocidade [ε1 v ε2 ]T , sendo [ ] cos ψ −a sin ψ A= . sin ψ a cos ψ 1 ˜T ˜ Considerando-se a fun¸˜o candidata de Lyapunov V = ca 2 h h > 0, cuja primeiraderivada temporal ´ e ˙ V = hT h = hT (A˜ − L(h)), ˙ ˜ ˜ ˜ v ˜verifica-se que uma condi¸˜o suficiente para V < 0 ´ hT L(h) >|hT A˜|. Para valores ca ˙ e ˜ ˜ ˜ vpequenos do erro de controle h, pode-se escrever que L(h) ≈ Kxy h, onde ˜ ˜ ˜ [ ] kx 0 Kxy = . 0 ky Portanto, uma condi¸˜o suficiente para estabilidade assint´tica ´ que ca o e hT Kxy h > |hT A˜|, ˜ ˜ ˜ v ˜ min(kx , ky ) h 2 ˜ > h A˜ , v
  • 83. 3.3 Controladores Dinˆmicos a 87ou ˜ A˜v h > . (3.39) min(kx , ky ) ˜ a ˜ Por outro lado, se os valores do erro de controle h s˜o muito grandes, o termo L(h)satura. Nesse caso, como j´ mostrado na subse¸˜o 3.3.1.1, uma condi¸˜o suficiente para a ca caestabilidade assint´tica ´ o e |min(lx , ly )| > A˜ . v (3.40) Foi provado que v → 0. Logo, as condi¸˜es (3.39) e (3.40) s˜o assintoticamente veri- ˜ co a ˜ ˜ficadas para qualquer valor de h. Consequentemente, o erro de controle h(t)→ 0, o queest´ de acordo com o objetivo de controle. a3.3.2.1 Adapta¸˜o de Parˆmetros ca a Na se¸˜o 3.3.2 considerou-se que a dinˆmica do robˆ ´ exatamente conhecida. Aqui, a ca a oeadapta¸˜o dos parˆmetros usados no controlador ´ considerada, levando-se em conta que ca a eos parˆmetros dinˆmicos podem n˜o ser corretamente identificados, ou podem variar de a a auma tarefa a outra. A equa¸˜o (3.34) pode ser escrita, em seu formato de parametriza¸˜o ca calinear, como [ ] u 0 −ω 2 u ˙ 0 0 vr = G θ = θ. (3.41) 0 ω ˙ 0 0 uω ω Considerando a incerteza param´trica, a lei de controle (3.35) deve ser escrita como e ˆ ˙ ˆ ˆ vr = H(vd + T(˜ )) + Cvd + Fvd , v (3.42) ˆ ˆ ˆ aonde H, C, e F s˜o estimativas de H, C, e F, respectivamente. Para projetar a lei deadapta¸˜o, a equa¸˜o da lei de controle (3.42) ´ reescrita em seu formato de parame- ca ca etriza¸˜o linear, ou seja ca [ ] ˆ σ1 0 −ωd ω ud 0 0 ˆ vr = Gθ = θ, (3.43) 0 σ2 (Iud ω − Iuωd ) 0 uωd ωdonde σ1 = ud + lu tanh( ku u) e σ2 = ωd + lω tanh( kω ω ). O vetor de erro param´trico ´ ˙ l u ˜ ˙ l ω ˜ e edefinido como θ = θ − θ, onde θ ´ o vetor de estimativa de parˆmetros. Assim, (3.43) ˜ ˆ ˆ e a ˜pode ser escrita como vr = Gθ + Gθ, ou ˜ vr = Hσ + Cvd + Fvd + Gθ, (3.44)
  • 84. 88 3 Compensa¸˜o Adaptativa da Dinˆmica ca aonde σ = vd + T(˜ ). Recordando que v = vd − v , pode-se concluir que vd = v + v . ˙ v ˜ ˙ ˙ ˜ ˙ ˙Portanto, σ = v + T(˜ ) + v . Substituindo este termo na equa¸˜o (3.44), a equa¸˜o do ˜ v ˙ ca casistema em malha fechada torna-se −Gθ = H(v + T(˜ )) + C˜ + F˜ . ˜ ˙ ˜ v v v (3.45) Seja 1 1 ˜T V = v T H˜ + θ γ −1 θ > 0 ˜ v ˜ 2 2a fun¸˜o candidata de Lyapunov. Sua primeira derivada temporal, considerando que os caparˆmetros θi s˜o constantes, ´ a a e ˜ ˜ ˜ ˙ T ˙ V = v T Hv + θ γ −1˜ ˙ θ. Usando (3.45), resulta que ˜T ˙ V = −˜ T (Gθ + C˜ + F˜ ) − v T HT(˜ ) + θ γ −1˜ ˙ v ˜ v v ˜ v θ. (3.46) Considerando que os valores dos parˆmetros n˜o se alteram durante a execu¸˜o de uma a a ca ˙ ˜ ˙tarefa, i.e., θ = 0, pode-se escrever que ˆ = θ. Escolhendo a lei de ajuste de parˆmetros ˙ θ acomo ˙ ˆ = γGT v , θ ˜ (3.47)e usando a propriedade 5 do modelo, de antissimetria de C, a equa¸˜o (3.46) resulta em ca V = −˜ T F˜ − v T HT(˜ ), ˙ v v ˜ vque ´ semidefinida negativa. Assim, pode-se concluir que θ ∈ L∞ , v ∈ L∞ e, portanto, e ˜ ˜v ∈ L∞ .˜ ˙ Integrando V , tem-se que ∫ T ∫ T V (T ) − V (0) = − v HT(˜ )dt − ˜T v v T F˜ dt. ˜ v 0 0 Desprezando-se o termo positivo V (T ), e usando o mesmo racioc´ ınio adotado nasubse¸˜o 3.3.1.2, pode-se concluir que ca ∫ T ∫ ∞ 2 V (0) − α 2 V (0) − α v dt ≤ ˜ ⇒ v ˜ dt ≤ , (3.48) 0 λmin (F) 0 λmin (F)
  • 85. 3.3 Controladores Dinˆmicos a 89onde ∫ ∞ α= v T HT(˜ )dt. ˜ v 0 Ou seja, v ´ um sinal quadrado integr´vel, i.e., v ∈ L2 e, portanto, v ∈ L2 . ˜ e a ˜ ˜ J´ que v e vd s˜o limitados, como v = vd − v , pode-se notar que v tamb´m ´ a ˜ a ˜ e elimitado. Logo, como C e F s˜o limitadas, e considerando-se que vd tamb´m ´ limitado, a ˙ e epode-se afirmar que G ´ limitada. A propriedade 4 do modelo garante que H ´ constante, e e ˜ ˜e sabe-se que θ, v e T(˜ ) s˜o limitados. Ent˜o, da equa¸˜o (3.45) pode-se verificar que v a a cav ´ limitado, i.e., v ∈ L∞ . Como v ∈ L∞ e v ∈ L2 , o Lema de Barbalat garante que˙˜ e ˙ ˜ ˙ ˜ ˜v (t) → 0 com t → ∞. Logo, v(t) → 0 com t → ∞, o que prova que o objetivo de˜ ˜controle ´ cumprido. e A lei de adapta¸˜o (3.47) funciona como um integrador e, por isso, pode provocar pro- cablemas de robustez em caso de erros nas medi¸˜es, ru´ ou perturba¸˜es. Como j´ men- co ıdo co acionado na se¸˜o 3.3.1.1, uma poss´ maneira de se evitar a deriva param´trica ´ atrav´s ca ıvel e e edo desligamento da adapta¸˜o de parˆmetros quando o valor de erro atinge determinado ca alimite m´ ınimo, como ilustrado em (MARTINS et al., 2007c). Outra forma conhecida dese evitar a deriva param´trica ´ a modifica¸˜o da lei de adapta¸˜o de parˆmetros atrav´s e e ca ca a eda introdu¸˜o de um termo de modifica¸˜o-σ (ou Leakage Term) (KAUFMAN; SOBEL, ca ca1998; BOYD; SASTRY, 1989). Com a introdu¸˜o desse termo, ao inv´s de (3.47), a lei ca ede adapta¸˜o de parˆmetros ca a ˙ ˆ = γGT v − γΓθ ˆ θ ˜ (3.49)´ utilizada, onde Γ ∈ R6×6 ´ uma matriz diagonal de ganhos positivos. Para analisar ae eestabilidade do equil´ ıbrio do sistema em malha fechada considerando a lei de ajuste (3.49),ser´ adotado o mesmo racioc´ a ınio apresentado na se¸˜o 3.3.1.1. Inicialmente, (3.49) ser´ ca areescrita como ˙ ˆ = γGT v − γΓθ − γΓθ. θ ˜ ˜ Substituindo a equa¸˜o anterior em (3.46), resulta que ca v v ˜ v ˜T ˜ ˜T V = −˜ T F˜ − v T HT(˜ ) − θ Γθ − θ Γθ. ˙ Considerando valores pequenos de v , tem-se que T(˜ ) ≈ Kv v . S˜o definidas as se- ˜ v ˜ aguintes constantes: ϑΓ = κmax (Γ), µF = χ(F), µΓ = χ(Γ), µHK = χ(HKv ), µF HK = µF + √ √µHK , onde χ(Z) = λmin (ZT Z) ´ o valor singular m´ e ınimo de Z, κmax (Z) = λmax (ZT Z)denota o valor singular m´ximo de Z, e λmin (·) e λmax (·) s˜o fun¸˜es para obten¸˜o do a a co ca
  • 86. 90 3 Compensa¸˜o Adaptativa da Dinˆmica ca amenor e do maior autovalor de uma matriz, respectivamente. ˙ Assim, V pode ser escrita como V ≤ −µF HK v ˙ ˜ 2 − µΓ θ ˜ 2 ˜ + ϑΓ θ θ , (3.50) Considerando a diferen¸a quadrada c ( )2 1 ˜ 1 ˜ θ −ξ θ = 2 θ 2 −2 θ ˜ θ + ξ2 θ 2, ξ ξe rearranjando seus termos, tem-se que ( )2 1 ˜ ξ2 1 1 ˜ ˜ θ θ = 2 θ 2 + θ 2 − θ −ξ θ , 2ξ 2 2 ξsendo ξ ∈ R+ . Desprezando-se o termo negativo, a desigualdade 1 ˜ ξ2 ˜ θ θ ≤ θ 2 + θ 2 (3.51) 2ξ 2 2´ obtida. Substituindo (3.51) em (3.50), resulta eme ( ) 1 ˜ ξ2 V ≤ −µF HK v − µΓ θ + ϑΓ ˙ ˜ 2 ˜ 2 θ 2 + θ 2 , 2ξ 2 2ou, de forma equivalente, ( ) ϑΓ 1 ξ2 V ≤ −µF HK v ˙ ˜ 2 − µΓ 1− ˜ θ 2 + ϑΓ θ 2. (3.52) µΓ 2ξ 2 2 ( ) Em seguida, os parˆmetros α1 = µF HK > 0 e α2 = µΓ 1 − a ϑΓ 1 µΓ 2ξ 2 > 0 s˜o adefinidos, com ξ convenientemente selecionado. Logo, (3.52) pode ser reescrita como V ≤ −α1 v ˙ ˜ 2 − α2 θ ˜ 2 + ρ, (3.53)onde ξ2 ρ = ϑΓ θ 2. 2 ca ˜ v ˜T Agora, a fun¸˜o candidata de Lyapunov V = 1 v T H˜ + 1 θ γ −1 θ pode ser escrita ˜ 2 2como V ≤ β1 v ˜ 2 ˜ + β2 θ 2 , (3.54)
  • 87. 3.3 Controladores Dinˆmicos a 91 √onde β1 = 1 ϑH , β2 = 1 ϑγ , ϑH = κmax (H), ϑγ = κmax (γ), com κmax (Z) = 2 2 λmax (ZT Z)denotando o maior valor singular de Z. Ent˜o, a V ≤ −ΛV + ρ, ˙ (3.55) { }com Λ = min α1 α2 , ˜ a . J´ que ρ ´ limitado, (3.55) implica que v e θ s˜o finalmente a e ˜ β1 β2limitados. Logo, v tamb´m ´ finalmente limitado. Portanto, considerando-se valores ˜ e e ˜pequenos do erro de controle h e uma cota R em uma norma do sinal v, recordando ˜ ˜(3.39) pode-se concluir que o erro de seguimento h tamb´m ser´ finalmente limitado por e a R Amin(kx ,ky ) numa norma do erro de controle. ˜ a ˜ Por outro lado, se os valores do erro de controle h s˜o muito grandes, o termo L(h)satura. Nesse caso, como j´ mostrado na subse¸˜o 3.3.1.1, uma condi¸˜o suficiente para a ca caestabilidade assint´tica ´ o e |min(lx , ly )| > A˜ . v (3.56) Para o caso em que se utiliza a lei de adapta¸˜o de parˆmetros dada por (3.47), foi ca aprovado que v → 0, o que implica que as condi¸˜es (3.39) e (3.56) s˜o assintoticamente ˜ co a ˜ ˜verificadas para qualquer valor de h. Consequentemente, o erro de controle h(t)→ 0, oque est´ de acordo com o objetivo de controle. a Por outro lado, considerando a lei de adapta¸˜o mais robusta, que inclui o termo de camodifica¸˜o-σ, representada pela equa¸˜o (3.49), foi provado que v ´ finalmente limitado, ca ca ˜eo que significa que existe um limite R numa norma do sinal. Logo, para valores pequenos ˜ ˜do erro de controle h, a partir de (3.39) conclui-se que o erro de seguimento h tamb´m eser´ finalmente limitado por R A /min(kx , ky ) numa norma do erro de controle. J´ para a a ˜valores grandes do erro de controle h, a estabilidade est´ garantida com erros de controle afinalmente limitados se for cumprida a condi¸˜o dada por (3.56). Assim, as constantes lx e caly podem ser escolhidas de maneira que |min(lx , ly )| > R A , o que garante a estabilidadedo equil´ ıbrio com erros finalmente limitados para qualquer valor de h. ˜3.3.2.2 Resultados de Simula¸˜o ca Para ilustrar o funcionamento do segundo controlador dinˆmico proposto, represen- atado pela equa¸˜o (3.42), foram realizadas simula¸˜es equivalentes `quelas apresentadas ca co ana se¸˜o 3.3.1.2, ou seja, foi considerado o modelo completo do robˆ representado pela ca oequa¸˜o (2.13) com os parˆmetros identificados do robˆ Pioneer 3-DX apresentados na ca a oSe¸˜o 2.4. Para que pudesse ser feita uma compara¸˜o entre resultados, foram usados ca ca
  • 88. 92 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Erro de distância 1.4 1 1.2 0.5 1 Real 0.8 erro [m] y [m] 0 0.6 0.4 −0.5 0.2 Ref. −1 −1 −0.5 0 0.5 1 0 0 50 100 150 200 250 x [m] tempo [s] (a) (b) Figura 30: Segundo controlador dinˆmico: trajet´ria circular. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) Erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a alterados e sem adapta¸˜o de parˆmetros. ca aos mesmos valores de ganhos utilizados nas simula¸˜es da se¸˜o 3.3.1.2, quais sejam, co cakx = 0, 2, ky = 0, 2, ku = 4 e kω = 4. Na primeira simula¸˜o, o controlador foi utilizado para fazer o robˆ seguir uma tra- ca ojet´ria circular cujo raio varia bruscamente entre 0, 8 m e 0, 7 m a cada 60 s, a partir ode t = 50 s. Os parˆmetros θ utilizados no controlador dinˆmico possuem valores 25% a amaiores em rela¸˜o aos parˆmetros utilizados no modelo do robˆ. Neste primeiro caso, a ca a oadapta¸˜o de parˆmetros foi mantida desativada. ca a A Figura 30(a) mostra parte da trajet´ria percorrida pelo robˆ, enquanto a Fi- o ogura 30(b) ilustra a evolu¸˜o do erro de distˆncia durante a simula¸˜o considerada. O ca a cagrande valor inicial do erro se deve ao fato de que a posi¸˜o inicial do robˆ ´ (0, 2; −0, 8) m, ca oeenquanto a trajet´ria de referˆncia se inicia em (0, 8; 0, 0) m. Nota-se que a cada 60 s o eh´ um acr´scimo instantˆneo no valor do erro, que ocorre devido ` mudan¸a no raio da a e a a ctrajet´ria de referˆncia. A figura 30(b) tamb´m mostra que o erro n˜o tende a zero em o e e aregime permanente, o que ocorre devido ao erro param´trico existente, mas permanece elimitado. A Figura 31(a) apresenta os valores de velocidade linear e angular enviadas pelo con-trolador cinem´tico e desenvolvidas pelo robˆ durante o seguimento da trajet´ria circular a o oem quest˜o, enquanto a Figura 31(b) mostra a diferen¸a entre esses valores. Pode-se notar a cque o erro de velocidade apresenta um valor de regime diferente de zero, o que ´ causado e
  • 89. 3.3 Controladores Dinˆmicos a 93 Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 0.6 Real 0.4 Ref. 0.4 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 2 2 Real 1.5 Ref. 1 1 0 0.5 0 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b) Figura 31: Segundo controlador dinˆmico: trajet´ria circular. (a) Velocidades linear e a oangular enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante a simula¸˜o o ca com parˆmetros alterados e sem adapta¸˜o de parˆmetros. a ca apela diferen¸a entre os parˆmetros dinˆmicos do modelo do robˆ e aqueles considerados c a a ono controlador. Com essa diferen¸a, a compensa¸˜o da dinˆmica do robˆ n˜o ´ feita corre- c ca a o a etamente pelo controlador dinˆmico. No entanto, quando se faz uma compara¸˜o entre as a cafiguras 18(b) e 31(b), nota-se que o erro de velocidade obtido na simula¸˜o em que se usou cao segundo controlador dinˆmico ´ menor do que aquele obtido quando se usou o primeiro a econtrolador dinˆmico. Essa diferen¸a pode ser entendida pela an´lise das equa¸˜es dos a c a cocontroladores, que s˜o repetidas aqui por conveniˆnica. O primeiro controlador dinˆmico a e a´ representado pela equa¸˜oe ca [ ] u d + ku u ˙ ˜ 0 −ω 2 u 0 0 ˆ vr = θ, 0 ωd + kω ω ˙ ˜ 0 0 uω ωe o segundo controlador dinˆmico ´ dado por a e [ ] ud + lu tanh( ku u) ˙ l u ˜ 0 −ωd ω ud 0 0 ˆ vr = θ. 0 ωd + lω tanh( kω ω ) (Iud ω − Iuωd ) 0 uωd ωd ˙ l ω ˜ Nota-se que o segundo controlador apresenta termos de satura¸˜o do sinal de erro caque n˜o existem no primeiro controlador. Al´m disso, o segundo controlador utiliza sinais a ede velocidade e acelera¸˜o desejados (gerados pelo controlador cinem´tico) e velocidades ca areais no c´lculo de vr , enquanto o primeiro controlador utiliza apenas os valores desejados ade acelera¸˜o e de velocidades reais desenvolvidas pelo robˆ. De acordo com as figuras ca o
  • 90. 94 3 Compensa¸˜o Adaptativa da Dinˆmica ca a31(a) e 18(a), durante o seguimento da trajet´ria circular, as velocidades linear e angular odesenvolvidas pelo robˆ s˜o um pouco menores do que os valores de referˆncia gerados o a epelo controlador cinem´tico. Como o segundo controlador usa os valores desejados de ve- alocidade (fornecidos pelo controlador cinem´tico e, neste caso, maiores em m´dulo do que a oos valores reais) na gera¸˜o dos sinais de controle, estes apresentam valores mais elevados, cao que proporciona menor erro de velocidade para este caso espec´ ıfico. A diferen¸a entre cos controladores dinˆmicos se reflete no erro de seguimento de trajet´ria. Comparando-se a oas figuras 17(b) e 30(b), referentes ` simula¸˜o da trajet´ria circular quando o robˆ est´ a ca o o acarregado e n˜o h´ adapta¸˜o de parˆmetros, percebe-se que, em regime permanente, o a a ca aerro de seguimento foi cerca de 0, 125m quando se usou o primeiro controlador dinˆmico, ae de 0, 08m quando se usou o segundo controlador. Ou seja, a diferen¸a entre os valores cde erro de regime ficou em torno de 60%. Como ser´ visto a seguir, o erro de seguimento aapresentado por ambos os controladores ´ equivalente quando a adapta¸˜o de parˆmetros e ca aest´ ativada. a A mesma simula¸˜o foi repetida, mas com a adapta¸˜o de parˆmetros ativada. Foi ca ca aconsiderada a lei de adapta¸˜o de parˆmetros dada por (3.49), que inclui a modifica¸˜o-σ. ca a caA Figura 32(a) mostra parte da trajet´ria percorrida pelo robˆ, enquanto a Figura 32(b) o oilustra a evolu¸˜o do erro de distˆncia durante a simula¸˜o considerada. Nota-se que o erro ca a cade distˆncia diminui ao longo do tempo, na medida em que a adapta¸˜o de parˆmetros ´ a ca a erealizada. A cada 60 s h´ um acr´scimo instantˆneo no valor do erro, que ocorre devido a e a` mudan¸a no raio da trajet´ria de referˆncia.a c o e A Figura 33(a) apresenta os valores de velocidade linear e angular enviadas pelo con-trolador cinem´tico e desenvolvidas pelo robˆ durante o seguimento da trajet´ria circular a o oem quest˜o, enquanto a Figura 33(b) mostra a diferen¸a entre esses valores. Pode-se per- a cceber que o erro de velocidade apresenta um valor diferente de zero no in´ da simula¸˜o, ıcio cao que ´ causado pela diferen¸a de 25% entre os parˆmetros dinˆmicos do modelo do robˆ e c a a oe aqueles considerados no controlador, mas esta diferen¸a diminui ao longo do tempo. Ou cseja, na medida em que os parˆmetros θ do controlador s˜o ajustados com base na lei de a aadapta¸˜o, o erro de compensa¸˜o dinˆmica diminui, o que provoca redu¸˜o no erro de ca ca a cavelocidade e, consequentemente, redu¸˜o no erro de seguimento. ca Ao se comparar as figuras 19(b) e 20(b) com as figuras 32(b) e 33(b), nota-se que osvalores de erro de seguimento e de velocidade em regime permanente s˜o muito similares aquando a adapta¸˜o de parˆmetros est´ ativada, considerando ambos os controladores ca a apropostos. A evolu¸˜o dos parˆmetros estimados durante esta simula¸˜o ´ mostrada na ca a ca eFigura 34.
  • 91. 3.3 Controladores Dinˆmicos a 95 Erro de distância 1.4 1 1.2 0.5 1 Real 0.8 erro [m] y [m] 0 0.6 0.4 −0.5 Ref. 0.2 −1 −1 −0.5 0 0.5 1 0 0 50 100 150 200 250 x [m] tempo [s] (a) (b) Figura 32: Segundo controlador dinˆmico: trajet´ria circular. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) Erro de distˆncia durante a simula¸˜o com parˆmetros o a ca a alterados e com adapta¸˜o de parˆmetros. ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 0.6 Real 0.4 Ref. 0.4 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 2 2 Real 1.5 Ref. 1 1 0 0.5 0 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b) Figura 33: Segundo controlador dinˆmico: trajet´ria circular. (a) Velocidades linear e a oangular enviadas e desenvolvidas pelo robˆ; (b) erros de velocidade durante a simula¸˜o o ca com parˆmetros alterados e com adapta¸˜o de parˆmetros. a ca a Uma terceira simula¸˜o ilustra o desempenho do controlador no caso em que os caparˆmetros usados no controlador s˜o os parˆmetros reais do robˆ, ou seja, conside- a a a orando o caso ideal para a compensa¸˜o dinˆmica. Simulou-se o caso em que o robˆ deve ca a oseguir a trajet´ria em forma de oito anteriormente apresentada, mantendo inalteradas as ocaracter´ ısticas como a trajet´ria de referˆncia, sua velocidade, os parˆmetros do robˆ, etc. o e a o
  • 92. 96 3 Compensa¸˜o Adaptativa da Dinˆmica ca a θ1 θ2 1 0.4 0.5 0.3 0 0.2 0 100 200 300 0 100 200 300 θ3 θ4 0.2 1.5 0 1 −0.2 0.5 0 100 200 300 0 100 200 300 −3 θ5 θ6 x 10 6 1.4 5 1.2 4 1 0 100 200 300 0 100 200 300 tempo [s] tempo [s] Figura 34: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a ca trajet´ria circular - segundo controlador dinˆmico. o aNa presente simula¸˜o, a adapta¸˜o de parˆmetros do controlador dinˆmico ´ feita com ca ca a a ebase na lei de ajuste (3.49), que inclui o termo de modifica¸˜o-σ. No in´ da simula¸˜o ca ıcio caa adapta¸˜o est´ desativada, assim permanecendo at´ t = 50s. A partir desse instante, a ca a eadapta¸˜o de parˆmetros ´ ativada, assim permanecendo at´ o t´rmino da simula¸˜o. ca a e e e ca As Figuras 35(a) e 35(b) ilustram, respectivamente, a trajet´ria percorrida pelo robˆ o oantes e depois da adapta¸˜o de parˆmetros, e a evolu¸˜o do erro de distˆncia durante a ca a ca aexecu¸˜o da tarefa. Pode-se notar que, ap´s atingir a trajet´ria, o controlador ´ capaz ca o o ede fazer o robˆ segui-la com erro muito pr´ximo a zero, mesmo antes de a adapta¸˜o de o o caparˆmetros ser ativada. Ap´s a adapta¸˜o de parˆmetros (em t = 50s) o erro se mant´m a o ca a epraticamente no mesmo valor e a trajet´ria percorrida pelo robˆ tamb´m n˜o ´ visivel- o o e a emente alterada. Comparando-se estes resultados com aqueles apresentados pelas figuras22(a) e 22(b), nota-se que o desempenho de ambos os controladores dinˆmicos propostos a´ equivalente para este caso, em que se considera os valores exatos dos parˆmetros θ nase aequa¸˜es dos controladores. co As velocidades linear e angular desenvolvidas pelo robˆ durante o seguimento da otrajet´ria em forma de oito s˜o apresentadas na Figura 36(a), assim como seus sinais de o areferˆncia enviados pelo controlador cinem´tico. Os erros de velocidade s˜o apresentados e a ana Figura 36(b). Nota-se que os valores de erro de velocidade s˜o muito pr´ximos de zero a oj´ que, nesse caso, considerou-se que a dinˆmica do robˆ ´ exatamente compensada. Este a a oeresultado tamb´m ´ equivalente `quele ilustrado pelas figuras 23(a) e 23(b), obtido com e e a
  • 93. 3.3 Controladores Dinˆmicos a 97 Antes da Adaptação Depois da Adaptação 0.5 0.5 0 0 Erro de distância −0.5 −0.5 0.4y [m] y [m] −1 −1 0.3 erro [m] −1.5 −1.5 0.2 Real Real −2 −2 0.1 Ref. Ref. −2.5 −2.5 0 −2 −1 0 1 2 −2 −1 0 1 2 0 50 100 150 200 250 x [m] x [m] tempo [s] (a) (b) Figura 35: Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o de parˆmetros; o o ca a (b) erro de distˆncia durante a simula¸˜o com parˆmetros exatos. a ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 Real 0.6 Ref. 0.4 0.4 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Real Erro de Velocidade Angular [rad/s] 1 Ref. 2 0.5 1 0 0 −0.5 −1 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b) Figura 36: Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Velocidades a olinear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade durante e o a simula¸˜o com parˆmetros exatos. ca ao uso do primeiro controlador dinˆmico. a A evolu¸˜o dos parˆmetros estimados durante esta simula¸˜o ´ mostrada na Figura 37. ca a ca eNota-se que os valores dos parˆmetros apresentam varia¸˜o muito pequena, o que era a caesperado, j´ que os parˆmetros estimados iniciam com os valores iguais aos do modelo. A a aconvergˆncia dos parˆmetros ´ ilustrada na Figura 38, obtida com a repeti¸˜o da simula¸˜o e a e ca ca
  • 94. 98 3 Compensa¸˜o Adaptativa da Dinˆmica ca a θ θ2 1 0.3 0.28 0.25 0.26 0.2 0.24 0 100 200 300 0 100 200 300 −3 θ3 θ4 x 10 5 1.01 0 1 −5 0.99 0 100 200 300 0 100 200 300 −3 θ5 θ6 x 10 4.2 1.07 4 1.06 3.8 1.05 0 100 200 300 0 100 200 300 tempo [s] tempo [s] Figura 37: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a ca trajet´ria em forma de oito com parˆmetros exatos - segundo controlador dinˆmico. o a a θ1 θ2 0.25 0.28 0.26 0.2 0.24 0 0.5 1 1.5 2 0 0.5 1 1.5 2 4 4 x 10 x 10 θ θ 3 4 0.02 1.02 0 1 −0.02 0.98 0 0.5 1 1.5 2 0 0.5 1 1.5 2 4 4 x 10 x 10 −3 θ5 θ6 x 10 5 1.06 0 1.055 −5 1.05 0 0.5 1 1.5 2 0 0.5 1 1.5 2 tempo [s] x 10 4 tempo [s] x 10 4Figura 38: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de longa dura¸˜o para ca a ca ca trajet´ria em forma de oito com parˆmetros exatos - segundo controlador dinˆmico. o a aanterior, mantendo-se as mesmas condi¸˜es, por um per´ co ıodo muito mais longo. Pode-senotar que n˜o h´ divergˆncia param´trica. a a e e Ao se comparar os resultados mostrados pelas Figuras 35(b) e 36(b), em que o segundocontrolador dinˆmico est´ presente, com aqueles das Figuras 8(b) e 9(b), em que apenas o a acontrolador cinem´tico estava presente, percebe-se que a inser¸˜o do controlador dinˆmico a ca a
  • 95. 3.3 Controladores Dinˆmicos a 99 Antes da Adaptação Depois da Adaptação 0.5 0.5 0 0 Erro de distância −0.5 −0.5 0.4 y [m] y [m] −1 −1 0.3 Início da Adaptação erro [m] −1.5 −1.5 0.2 Real Real −2 −2 0.1 Ref. Ref. −2.5 −2.5 0 −2 −1 0 1 2 −2 −1 0 1 2 0 50 100 150 200 250 x [m] x [m] tempo [s] (a) (b) Figura 39: Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o de parˆmetros; o o ca a (b) erro de distˆncia durante a simula¸˜o com parˆmetros alterados. a ca aproduz uma melhora no desempenho do sistema. Ou seja, a inser¸˜o do controlador cadinˆmico produziu redu¸˜o no valor do erro de velocidade e, por conseguinte, diminui¸˜o a ca cano valor do erro de seguimento. Este resultado ´ equivalente ao que foi obtido com o uso edo primeiro controlador dinˆmico. a Para ilustrar a utilidade da adapta¸˜o de parˆmetros quando o robˆ tem sua dinˆmica ca a o aalterada, repetiu-se a simula¸˜o de seguimento da trajet´ria em forma de oito para o caso ca oem que os parˆmetros do robˆ s˜o 25% maiores que os valores carregados no controlador a o adinˆmico. A adapta¸˜o de parˆmetros do controlador dinˆmico tamb´m ´ feita com base a ca a a e ena lei de ajuste (3.49), que inclui o termo de modifica¸˜o-σ. No in´ da simula¸˜o a ca ıcio caadapta¸˜o est´ desativada, assim permanecendo at´ t = 50s. A partir desse instante, a ca a eadapta¸˜o de parˆmetros ´ ativada, e assim permanece at´ o t´rmino da simula¸˜o. ca a e e e ca As Figuras 39(a) e 39(b) ilustram, respectivamente, a trajet´ria percorrida pelo robˆ o oantes e depois da adapta¸˜o de parˆmetros, e a evolu¸˜o do erro de distˆncia durante ca a ca aa execu¸˜o da tarefa. Pode-se notar que o controlador ´ capaz de fazer o robˆ seguir a ca e otrajet´ria de referˆncia com erro grande antes da adapta¸˜o de parˆmetros ser ativada. o e ca aAp´s sua ativa¸˜o, em t = 50s, o erro come¸a a ser reduzido, e se mant´m pr´ximo a zero o ca c e oap´s t = 200s. o As velocidades linear e angular desenvolvidas pelo robˆ durante o seguimento da otrajet´ria em forma de oito s˜o apresentadas na Figura 40(a), assim como seus sinais de o a
  • 96. 100 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 Real 0.6 Ref. 0.4 0.4 Início da Adaptação 0.2 0.2 0 0 −0.2 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Real Erro de Velocidade Angular [rad/s] 1 Ref. 2 0.5 1 Início da Adaptação 0 0 −0.5 −1 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b) Figura 40: Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Velocidades a olinear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade durante e o a simula¸˜o com parˆmetros alterados. ca a θ θ 1 2 1 0.4 0.5 0.3 0 0.2 0 100 200 300 0 100 200 300 θ θ 3 4 0.05 1.5 0 1 −0.05 0.5 0 100 200 300 0 100 200 300 −3 θ5 θ6 x 10 5 1.4 4.5 1.2 4 1 0 100 200 300 0 100 200 300 tempo [s] tempo [s] Figura 41: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de seguimento da ca a catrajet´ria em forma de oito com parˆmetros alterados - segundo controlador dinˆmico. o a areferˆncia enviados pelo controlador cinem´tico. Os erros de velocidade s˜o apresentados e a ana Figura 40(b). Nota-se que os valores de erro de velocidade s˜o grandes antes de t = 50s, aj´ que a dinˆmica do robˆ n˜o est´ sendo compensada corretamente. Ap´s o in´ da a a o a a o ıcioadapta¸˜o de parˆmetros, o erro de velocidade ´ reduzido gradualmente, apresentando ca a etendˆncia a se manter pr´ximo a zero. e o
  • 97. 3.3 Controladores Dinˆmicos a 101 θ1 θ2 1 0.4 0.5 0.3 0 0.2 0 0.5 1 1.5 2 0 0.5 1 1.5 2 4 4 x 10 x 10 θ3 θ4 0.05 1.5 0 1 −0.05 0.5 0 0.5 1 1.5 2 0 0.5 1 1.5 2 4 4 x 10 x 10 −3 θ5 θ6 x 10 5 1.4 0 1.2 −5 1 0 0.5 1 1.5 2 0 0.5 1 1.5 2 tempo [s] x 10 4 tempo [s] x 10 4Figura 42: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de longa dura¸˜o para ca a ca ca trajet´ria em forma de oito com parˆmetros alterados - segundo controlador dinˆmico. o a a A evolu¸˜o dos parˆmetros estimados durante esta simula¸˜o ´ mostrada na Figura 41. ca a ca eNota-se que os valores dos parˆmetros apresentam varia¸˜o ap´s a ativa¸˜o da adapta¸˜o, a ca o ca caem t = 50s. A Figura 42, obtida com a repeti¸˜o da simula¸˜o anterior por um per´ ca ca ıodomuito mais longo, sem altera¸˜o de nenhuma outra condi¸˜o, ilustra que n˜o h´ di- ca ca a avergˆncia nos valores dos parˆmetros estimados. e a Ao se comparar os resultados das simula¸˜es mostrados pelas Figuras 39(b) e 40(b), cotendo o segundo controlador dinˆmico presente e adapta¸˜o de parˆmetros ativada, com a ca aaqueles das Figuras 12(b) e 13(b), em que apenas o controlador cinem´tico estava presente, apercebe-se que a inser¸˜o do controlador dinˆmico produz uma melhora muito significa- ca ativa no desempenho do sistema ap´s o in´ da adapta¸˜o de parˆmetros. Ap´s t = 50s, o ıcio ca a oquando a adapta¸˜o ´ iniciada, o valor do erro de velocidade ´ reduzido e, consequen- ca e etemente, ocorre diminui¸˜o no valor do erro de seguimento. Embora os valores iniciais cade erro de seguimento e de velocidade tenham sido menores com o uso do segundo con-trolador dinˆmico, ap´s a adapta¸˜o de parˆmetros estes s˜o equivalentes aos que foram a o ca a aobtidos quando se utilizou o primeiro controlador dinˆmico proposto, cujos resultados s˜o a aapresentados nas figuras 26(b) e 27(b).
  • 98. 102 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Figura 43: Robˆ Pioneer 3-DX com sensor de varredura laser e sistema de vis˜o o a omnidirecional.3.4 Resultados Experimentais Para comprovar o funcionamento dos controladores projetados, foram realizados ex-perimentos com um robˆ Pioneer 3-DX, que ´ um robˆ m´vel uniciclo fabricado pela o e o oempresa Mobile Robots, o qual ´ mostrado na Figura 43. Tal robˆ possui um sensor de e ovarredura laser e um sistema de vis˜o omnidirecional montados em sua base superior. aA identifica¸˜o dos parˆmetros dinˆmicos de tal robˆ gerou os valores dos parˆmetros ca a a o aapresentados na se¸˜o 2.4. ca Foram realizados experimentos usando os controladores cinem´tico e dinˆmicos apre- a asentados nas se¸oes anteriores, sempre aplicados ao mesmo robˆ, de forma que este seguisse c˜ oa mesma trajet´ria em forma de oito que foi simulada nas se¸˜es anteriores. O desem- o copenho do sistema foi calculado com base no ´ ındice IAE (Integral do valor Absoluto doErro), sendo ∫ T2 √ IAE = |E(t)|dt, E(t) = x2 + y 2 , ˜ ˜ T1onde E(t) denota o valor instantˆneo do erro de seguimento e T1 e T2 representam os alimites do intervalo de tempo considerado para c´lculo do ´ a ındice. A equa¸˜o anterior camostra que o ´ ındice IAE representa o ac´mulo do valor absoluto do erro durante o per´ u ıodoconsiderado, crescendo de forma proporcional ao aumento do erro. Ou seja, quanto maiorfor o ´ ındice IAE, maior ´ o valor m´dio do erro no intervalo em quest˜o. e e a
  • 99. 3.4 Resultados Experimentais 103 0.5 Ref. Real 0 Erro de distância 0.4 −0.5 y [m] 0.3 −1 erro [m] 0.2 −1.5 0.1 −2 0 −2 −1 0 1 2 0 10 20 30 40 50 x [m] tempo [s] (a) (b)Figura 44: Controlador cinem´tico: trajet´ria em forma de oito. (a) Parte da trajet´ria a o o percorrida pelo robˆ; (b) erro de distˆncia durante experimento sem carga. o a3.4.1 Controlador Cinem´tico a Neste experimento, o controlador cinem´tico representado pela equa¸˜o (3.5) foi pro- a cagramado no robˆ Pioneer 3-DX. As Figuras 44(a) e 44(b) ilustram, respectivamente, a otrajet´ria percorrida pelo robˆ e a evolu¸˜o do erro de distˆncia durante a execu¸˜o da o o ca a catarefa. Como se pode verificar, o controlador ´ capaz de fazer o robˆ seguir a trajet´ria e o oem forma de oito, com erro diferente de zero. O ´ ındice IAE foi calculado considerandoum intervalo de 15 segundos da parte final do experimento (entre 35s e 50s), de forma aenfatizar o erro m´dio em regime permanente. Seu valor foi de 9,06. e As velocidades linear e angular desenvolvidas pelo robˆ durante o seguimento da otrajet´ria em forma de oito s˜o apresentadas na Figura 45(a), assim como seus sinais de o areferˆncia enviados pelo controlador cinem´tico. Os erros de velocidade s˜o apresentados e a ana Figura 45(b). O de erro de velocidade apresentado faz com que o robˆ n˜o consiga o aseguir exatamente a trajet´ria de referˆncia. o e O experimento realizado mostra que o controlador cinem´tico projetado tem um com- aportamento real muito similar `quele previsto nas simula¸˜es apresentadas na se¸˜o 3.2. a co caDeve-se notar que o desempenho do sistema pode ser melhorado com aumento dos ganhosdo controlador. No entanto, um aumento grande pode fazer com que o sistema fique os-cilat´rio e apresente problemas de estabilidade. Por isso, a utiliza¸˜o de um controlador o caque realize a compensa¸˜o da dinˆmica do robˆ m´vel ´ interessante. ca a o o e
  • 100. 104 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.8 0.6 Real 0.6 Ref. 0.4 vel 0.4 0.2 0.2 0 0 −0.2 0 10 20 30 40 50 0 10 20 30 40 50 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 2 Real 2 Ref. 1 1 vel 0 0 −1 −2 −1 0 10 20 30 40 50 0 10 20 30 40 50 tempo [s] tempo [s] (a) (b)Figura 45: Controlador cinem´tico: trajet´ria em forma de oito. (a) Velocidades linear e a o angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade durante e o experimento sem carga.3.4.2 Primeiro Controlador Dinˆmico a O mesmo robˆ foi programado com o primeiro controlador dinˆmico, representado o apela equa¸˜o (3.10), adicionado ao controlador cinem´tico experimentado na se¸˜o 3.4.1. ca a caOs valores de ganhos usados no controlador cinem´tico no experimento anterior foram amantidos. Foi utilizada a adapta¸˜o dos parˆmetros que inclui o termo de modifica¸˜o-σ, ca a cadada por (3.22), que ´ ativada a partir de t = 50s. e Para ilustrar o funcionamento do controlador numa aplica¸˜o de transporte de cargas, catipicamente realizada por robˆs m´veis na ind´stria, foram realizados dois experimentos. o o uEm ambos o robˆ deve seguir a mesma trajet´ria em forma de oito, mas em um deles o o orobˆ est´ descarregado e, no outro, carrega uma carga de cerca de 23kg. Esta equivale a o apouco mais de 100% da massa total do robˆ quando descarregado. o As Figuras 46(a) e 46(b) ilustram, respectivamente, a trajet´ria percorrida pelo robˆ o oantes e depois da adapta¸˜o de parˆmetros, e a evolu¸˜o do erro de distˆncia durante ca a ca ao seguimento da trajet´ria quando o robˆ estava descarregado. Neste experimento os o ovalores dos parˆmetros θ usados no controlador dinˆmico s˜o aqueles identificados para a a ao caso do robˆ descarregado, apresentados na Se¸˜o 2.4. Pode-se notar que, mesmo com o cao robˆ descarregado, existe erro de seguimento antes da adapta¸˜o de parˆmetros ser o ca aacionada. Ap´s a adapta¸˜o de parˆmetros (em t = 50s) o erro decresce e a trajet´ria o ca a oseguida se aproxima mais da trajet´ria de referˆncia. o e
  • 101. 3.4 Resultados Experimentais 105 Antes da Adaptação Depois da Adaptação 0.5 0.5 Ref. Ref. Real Real 0 0 Erro de distância −0.5 −0.5 0.4y [m] y [m] −1 −1 0.3 erro [m] −1.5 −1.5 0.2 Início da Adaptação −2 −2 0.1 −2.5 −2.5 0 −2 −1 0 1 2 −2 −1 0 1 2 0 50 100 150 200 250 x [m] x [m] tempo [s] (a) (b) Figura 46: Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o de parˆmetros; o o ca a (b) erro de distˆncia durante o experimento sem carga. a O´ ındice IAE para este caso foi calculado considerando dois intervalos de 15 segundos,sendo um antes da adapta¸˜o de parˆmetros ser acionada (entre 35s e 50s), e outro ap´s o ca a oseu acionamento (entre 185s e 200s). Antes da adapta¸˜o de parˆmetros o valor obtido foi ca aIAE = 10, 67; depois da adapta¸˜o de parˆmetros ter sido iniciada obteve-se IAE = 6, 06, ca ao que mostra que a adapta¸˜o de parˆmetros promoveu redu¸˜o no valor m´dio do erro ca a ca ede seguimento. As velocidades linear e angular desenvolvidas pelo robˆ durante o seguimento da otrajet´ria em forma de oito s˜o apresentadas na Figura 47(a), assim como seus sinais de o areferˆncia enviados pelo controlador cinem´tico. Os erros de velocidade s˜o apresentados e a ana Figura 47(b). Nota-se que os valores de erro de velocidade diminuem bastante ap´s o oin´ da adapta¸˜o de parˆmetros. ıcio ca a A evolu¸˜o dos parˆmetros estimados durante este experimento ´ mostrada na Fi- ca a egura 48. Nota-se que existe certa varia¸˜o no valor dos parˆmetros, e que esta ´ res- ca a epons´vel pela melhora na compensa¸˜o da dinˆmica do robˆ. Ou seja, a inser¸˜o do a ca a o cacontrolador dinˆmico produziu redu¸˜o no valor do erro de velocidade e, por conseguinte, a cadiminui¸˜o no valor do erro de seguimento, mesmo no caso do robˆ n˜o estar carregado. ca o a Apesar de serem usados os parˆmetros identificados do robˆ, estes podem n˜o cor- a o aresponder exatamente aos valores verdadeiros. Por isso, mesmo quando se utiliza nocontrolador os valores identificados dos parˆmetros, pode existir erro na compensa¸˜o a ca
  • 102. 106 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.8 0.6 Real 0.6 Ref. 0.4 Início da Adaptação vel 0.4 0.2 0.2 0 0 −0.2 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 2 Real 2 Ref. Início da Adaptação 1 1 vel 0 0 −1 −2 −1 0 50 100 150 200 250 0 50 100 150 200 250 tempo [s] tempo [s] (a) (b)Figura 47: Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Velocidades a olinear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade durante e o experimento sem carga. θ1 θ2 1 1 0.5 0.5 0 0 0 100 200 300 0 100 200 300 −4 θ3 θ4 x 10 8 1.05 6 1 4 0.95 0 100 200 300 0 100 200 300 θ5 θ6 0.01 1.1 0 1.05 −0.01 1 0 100 200 300 0 100 200 300 tempo [s] tempo [s] Figura 48: Evolu¸˜o dos parˆmetros estimados durante experimento de seguimento da ca a trajet´ria em forma de oito sem carga - primeiro controlador dinˆmico. o adinˆmica, conforme pode-se notar nos resultados apresentados. a Para ilustrar a utilidade da adapta¸˜o de parˆmetros quando o robˆ tem sua dinˆmica ca a o aalterada, repetiu-se o experimento para o caso em que o robˆ est´ carregando uma massa o ade 23kg. A adapta¸˜o de parˆmetros do controlador dinˆmico ´ feita com base na lei de ca a a eajuste (3.22), que possui o termo de modifica¸˜o-σ. No in´ do experimento a adapta¸˜o ca ıcio ca
  • 103. 3.4 Resultados Experimentais 107 Antes da Adaptação Depois da Adaptação 0.5 0.5 Ref. Ref. Real Real 0 0 Erro de distância 0.4 −0.5 −0.5 y [m] y [m] 0.3 −1 −1 erro [m] −1.5 −1.5 0.2 Início da Adaptação −2 −2 0.1 −2.5 −2.5 0 −2 −1 0 1 2 −2 −1 0 1 2 0 20 40 60 80 100 120 140 x [m] x [m] tempo [s] (a) (b) Figura 49: Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ antes e depois de iniciada a adapta¸˜o de parˆmetros; o o ca a (b) erro de distˆncia durante experimento com carga. aest´ desativada, assim permanecendo at´ t = 50s, quando ´ ativada. a e e As Figuras 49(a) e 49(b) ilustram, respectivamente, a trajet´ria percorrida pelo robˆ o oantes e depois da adapta¸˜o de parˆmetros, e a evolu¸˜o do erro de distˆncia durante ca a ca aa execu¸˜o da tarefa. Pode-se notar que o erro de seguimento, nesse caso, ´ maior que ca eaquele obtido no experimento em que o robˆ estava descarregado. As figuras mostram, oainda, que o controlador ´ capaz de fazer o robˆ seguir a trajet´ria de referˆncia com erro e o o egrande antes da adapta¸˜o de parˆmetros ser ativada mas, ap´s sua ativa¸˜o, o erro ´ ca a o ca ereduzido e o desempenho do sistema melhora de forma bastante significativa. As velocidades linear e angular desenvolvidas pelo robˆ durante o seguimento da otrajet´ria em forma de oito s˜o apresentadas na Figura 50(a), assim como seus sinais de o areferˆncia enviados pelo controlador cinem´tico. Os erros de velocidade s˜o apresentados e a ana Figura 50(b). Nota-se que os valores de erro de velocidade s˜o grandes antes de t = 50s, aj´ que a dinˆmica do robˆ n˜o est´ sendo compensada corretamente. Ap´s o in´ da a a o a a o ıcioadapta¸˜o de parˆmetros, o erro de velocidade ´ reduzido gradualmente, melhorando a ca a ecompensa¸˜o da dinˆmica e provocando redu¸˜o no erro de seguimento. ca a ca A evolu¸˜o dos parˆmetros estimados durante o experimento descrito ´ mostrada na ca a eFigura 51. Nota-se que os valores dos parˆmetros apresentam varia¸˜o ap´s a ativa¸˜o da a ca o caadapta¸˜o, em t = 50s, enquanto o erro ´ reduzido. Neste experimento o ´ ca e ındice IAE foicalculado considerando dois intervalos de 15 segundos, sendo um antes da adapta¸˜o de ca
  • 104. 108 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.8 0.6 Real 0.6 Ref. 0.4 Início da Adaptação vel 0.4 0.2 0.2 0 0 −0.2 0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 2 Real 2 Ref. Início da Adaptação 1 1 vel 0 0 −1 −2 −1 0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140 tempo [s] tempo [s] (a) (b)Figura 50: Primeiro controlador dinˆmico: trajet´ria em forma de oito. (a) Velocidades a olinear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade durante e o experimento com carga. θ1 θ2 1 1 0.5 0.5 0 0 0 50 100 150 0 50 100 150 −4 θ3 θ4 x 10 −5 1.05 −6 1 −7 0.95 0 50 100 150 0 50 100 150 θ5 θ6 0 1.2 −0.005 1.1 −0.01 1 0 50 100 150 0 50 100 150 tempo [s] tempo [s] Figura 51: Evolu¸˜o dos parˆmetros estimados durante experimento de seguimento da ca a trajet´ria em forma de oito com carga - primeiro controlador dinˆmico. o aparˆmetros ser acionada (entre 45s e 60s), resultando em IAE = 12, 28, e outro ap´s o a oseu acionamento (entre 105s e 120s), resultando em IAE = 5, 39. Tais valores evidenciamque a adapta¸˜o de parˆmetros promoveu redu¸˜o bastante significativa no valor m´dio ca a ca edo erro de seguimento.
  • 105. 3.4 Resultados Experimentais 109 0.5 Ref. Real 0 Erro de distância y [m] −0.5 0.4 −1 0.3 erro [m] −1.5 0.2 −2 0.1 −2.5 0 −2 −1 0 1 2 0 10 20 30 40 50 x [m] tempo [s] (a) (b) Figura 52: Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ; (b) erro de distˆncia durante experimento com o o a parˆmetros identificados. a3.4.3 Segundo Controlador Dinˆmico a Foram realizados dois experimentos usando o segundo controlador dinˆmico proposto, arepresentado pela equa¸˜o (3.42). Em ambos o robˆ estava descarregado. ca o No primeiro experimento considerou-se o caso em que os parˆmetros dinˆmicos do a arobˆ foram identificados com pequeno erro e foram utilizados no controlador dinˆmico. o aA adapta¸˜o de parˆmetros foi mantida desativada. O robˆ deveria seguir a trajet´ria ca a o oem forma de oito que foi utilizada nos experimentos anteriores. As Figuras 52(a) e 52(b)ilustram, respectivamente, a trajet´ria percorrida e a evolu¸˜o do erro de distˆncia durante o ca aa execu¸˜o da tarefa. Pode-se notar que o controlador ´ capaz de fazer o robˆ seguir a ca e otrajet´ria com erro pr´ximo a zero, j´ que os parˆmetros identificados s˜o usados no o o a a acontrolador. As velocidades linear e angular desenvolvidas pelo robˆ durante o seguimento da otrajet´ria em forma de oito s˜o apresentadas na Figura 53(a), assim como seus sinais de o areferˆncia enviados pelo controlador cinem´tico. Os erros de velocidade s˜o apresentados e a ana Figura 53(b). Nota-se que os valores de erro de velocidade s˜o pr´ximos a zero, j´ que, a o anesse caso, os parˆmetros identificados do robˆ foram usados no controlador. a o O´ ındice IAE obtido para o intervalo de 15 segundos entre 35s e 50s foi de 8, 93. Para ilustrar a utilidade da adapta¸˜o de parˆmetros quando os parˆmetros usados ca a a
  • 106. 110 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.8 0.6 Real 0.6 Ref. 0.4 vel 0.4 0.2 0.2 0 0 −0.2 0 10 20 30 40 50 0 10 20 30 40 50 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 1 2 Real 0.5 Ref. 1 vel 0 0 −0.5 −1 −1 0 10 20 30 40 50 0 10 20 30 40 50 tempo [s] tempo [s] (a) (b) Figura 53: Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Velocidades a olinear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade durante e o experimento com parˆmetros identificados. an˜o s˜o aqueles identificados, ou quando os parˆmetros sofrem altera¸˜o, por exemplo a a a canuma tarefa de transporte de carga, foi realizado outro experimento de seguimento datrajet´ria em forma de oito. Nesse caso, foram carregados parˆmetros incorretos no o acontrolador dinˆmico (25% de erro em rela¸˜o aos valores obtidos no procedimento de a caidentifica¸˜o) e a adapta¸˜o de parˆmetros foi ativada a partir de t = 30s. A adapta¸˜o ca ca a cade parˆmetros do controlador dinˆmico ´ feita com base na lei de ajuste (3.49), que possui a a eo termo de modifica¸˜o-σ. ca As Figuras 54(a) e 54(b) ilustram, respectivamente, a trajet´ria percorrida pelo robˆ o oantes e depois da adapta¸˜o de parˆmetros, e a evolu¸˜o do erro de distˆncia durante ca a ca aa execu¸˜o da tarefa. Pode-se notar que o controlador ´ capaz de fazer o robˆ seguir a ca e otrajet´ria de referˆncia com erro grande antes da adapta¸˜o de parˆmetros ser ativada. o e ca aAp´s sua ativa¸˜o, em t = 30s, o erro ´ reduzido. Tal fato ´ evidenciado pela redu¸˜o no o ca e e cavalor do ´ ındice IAE obtido antes e depois da ativa¸˜o da adapta¸˜o de parˆmetros. Para ca ca ao intervalo entre 15s e 30s o valor obtido de IAE foi de 14, 38. J´ para o intervalo entre a45s e 60s o valor desse ´ ındice foi de 6, 55. As velocidades linear e angular desenvolvidas pelo robˆ durante o seguimento da otrajet´ria em forma de oito s˜o apresentadas na Figura 55(a), assim como seus sinais de o areferˆncia enviados pelo controlador cinem´tico. Os erros de velocidade s˜o apresentados e a ana Figura 55(b). Nota-se que os valores de erro de velocidade diminuem ap´s o in´ da o ıcioadapta¸˜o de parˆmetros. No entanto, o desempenho do controlador foi prejudicado pelo ca a
  • 107. 3.4 Resultados Experimentais 111 Antes da Adaptação Depois da Adaptação 0.5 0.5 Ref. Ref. Real Real 0 0 Erro de distancia (filtrado) 0.4 −0.5 −0.5 0.35 0.3 y [m] y [m] −1 −1 0.25 erro [m] 0.2 Início da Adaptação −1.5 −1.5 0.15 −2 −2 0.1 0.05 −2.5 −2.5 0 −2 −1 0 1 2 −2 −1 0 1 2 0 10 20 30 40 50 60 70 x [m] x [m] tempo [s] (a) (b) Figura 54: Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Parte da a o trajet´ria percorrida pelo robˆ; (b) erro de distˆncia durante experimento com o o a parˆmetros incorretos. a Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.8 0.6 Real 0.6 Ref. 0.4 Início da Adaptação vel 0.4 0.2 0.2 0 0 −0.2 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70 tempo [s] tempo [s] Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 1 2 Real 0.5 Ref. 1 Início da Adaptação vel 0 0 −0.5 −1 −1 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70 tempo [s] tempo [s] (a) (b) Figura 55: Segundo controlador dinˆmico: trajet´ria em forma de oito. (a) Velocidades a olinear e angular de referˆncia e desenvolvidas pelo robˆ; (b) Erros de velocidade durante e o experimento com parˆmetros incorretos. an´ de ru´ observado nos sinais de medi¸˜o de posi¸˜o e velocidade. ıvel ıdo ca ca A evolu¸˜o dos parˆmetros estimados durante o experimento descrito ´ mostrada na ca a eFigura 56. Nota-se que os valores dos parˆmetros apresentam varia¸˜o ap´s a ativa¸˜o a ca o cada adapta¸˜o, em t = 30s, o que provoca gradual diminui¸˜o no erro de seguimento de ca cavelocidade.
  • 108. 112 3 Compensa¸˜o Adaptativa da Dinˆmica ca a θ θ 1 2 0.18 0.4 0.17 0.2 0.16 0 0 20 40 60 80 0 20 40 60 80 θ3 θ4 0.2 0.9 0 0.85 −0.2 0.8 0 20 40 60 80 0 20 40 60 80 θ5 θ6 2 0.9 0 0.8 0.7 −2 0 20 40 60 80 0 20 40 60 80 tempo [s] tempo [s] Figura 56: Evolu¸˜o dos parˆmetros estimados durante experimento de seguimento da ca a trajet´ria em forma de oito com parˆmetros iniciais incorretos - segundo controlador o a dinˆmico. a3.5 Considera¸˜es sobre a Robustez co No projeto do segundo controlador dinˆmico realizado com base na equa¸˜o (2.13), a cadesprezou-se o vetor de incertezas e perturba¸˜es durante a an´lise de estabilidade do co asistema resultante. A partir de agora, considerar-se-´ a existˆncia de perturba¸˜es ∆ no a e comodelo dado por (2.13), reproduzido aqui por conveniˆncia: e ∆ + Hv + C(v )v + F(v )v = vr . ˙ (3.57) Considerando-se a lei de controle vr = H(vd + T(˜ )) + Cvd + Fvd , ˙ v (3.58)a equa¸˜o de malha fechada do sistema ´ ca e Hv = −HT(˜ ) − C˜ − F˜ + ∆. ˙ ˜ v v v (3.59) Para a an´lise de estabilidade, considera-se a fun¸˜o candidata de Lyapunov definida a ca 2 v e ˙ ˜ ˙positiva V = 1 v T H˜ . Sua primeira derivada temporal ´ V = v T Hv , onde se levou em ˜ ˜conta que os parˆmetros dinˆmicos do robˆ n˜o se alteram. Usando a equa¸˜o (3.59), a a a o a ca
  • 109. 3.5 Considera¸˜es sobre a Robustez co 113primeira derivada pode ser escrita como V = −˜ T HT(˜ ) − v T C˜ − v T F˜ + v T ∆. ˙ v v ˜ v ˜ v ˜ Considerando a propriedade 5 do modelo, de antissimetria da matriz C, pode-seescrever que V = −˜ T HT(˜ ) − v T F˜ + v T ∆. ˙ v v ˜ v ˜ Sabendo que H ´ uma matriz sim´trica e definida positiva (propriedade 1) e con- e esiderando que a matriz F ´ sim´trica e definida positiva (ou seja, assumindo θ6 > e e−(θ5 /I − θ3 )Iu, o que valida a propriedade 3), pode-se concluir que V < 0 sempre que ˙v T HT(˜ ) + v T F˜ > v T ∆.˜ v ˜ v ˜ Considerando valores grandes de v o termo T(˜ ) satura e a condi¸˜o anterior ´ ˜ v ca e 2assegurada se v min(θ1 lu , θ2 lω ) + v ˜ ˜ λmin (F) > v ˜ ∆ . Ou seja, para este caso oerro de velocidade converge, em um tempo finito, a uma regi˜o limitada de tamanho a ∆ − min(θ1 lu , θ2 lω ) v < ˜ . (3.60) λmin (F) J´ para pequenos valores de v , a condi¸˜o v T HT(˜ ) + v T F˜ > v T ∆ ´ satisfeita a ˜ ca ˜ v ˜ v ˜ e 2 2se v ˜ λmin (HKv ) + v ˜ λmin (F) > v ˜ ∆ , onde Kv = diag(ku , kω ). Ou seja,considerando as perturba¸˜es ∆ o erro de velocidade converge, em um tempo finito, a couma regi˜o limitada de tamanho a ∆ v ˜ < . (3.61) λmin (HKv ) + λmin (F) Em outras palavras, conclui-se que v (t) decresce (e, portanto, v(t) tamb´m decresce) ˜ ˜ eenquanto sua norma for maior que um determinado valor que depende da amplitudedas perturba¸˜es, o que leva os erros de controle a uma regi˜o limitada Rv . Se n˜o h´ co a a aperturba¸˜es, ∆ = 0 e v (t)→ 0 com t → ∞ (logo v(t)→ 0 com t → ∞), que ´ a mesma co ˜ ˜ econclus˜o obtida anteriormente. a Foi provado que v ´ finalmente limitado a uma regi˜o Rv considerando-se perturba¸˜es ˜e a co ˜∆ limitadas. Dessa forma, o erro de seguimento h(t), ser´ finalmente limitado por a A Rv . min(kx , ky ) Quando se considera, tamb´m, as incertezas param´tricas, a equa¸˜o de malha fechada e e ca
  • 110. 114 3 Compensa¸˜o Adaptativa da Dinˆmica ca ado sistema deve ser escrita como ∆ − Gθ = H(v + T(˜ )) + C˜ + F˜ . ˜ ˙ ˜ v v v (3.62) Considerando-se 1 1 ˜T V = v T H˜ + θ γ −1 θ > 0 ˜ v ˜ 2 2como fun¸˜o candidata de Lyapunov, e assumindo-se que n˜o h´ varia¸˜o nos parˆmetros ca a a ca adinˆmicos do robˆ, sua primeira derivada temporal ´ a o e ˜T ˙ V = −˜ T (Gθ + C˜ + F˜ ) − v T HT(˜ ) + θ γ −1˜ + v T ∆. ˙ v ˜ v v ˜ v θ ˜ (3.63) Ser´ considerada a lei de adapta¸˜o robusta a ca ˙ ˆ = γGT v − γΓθ ˆ θ ˜ (3.64)onde Γ ∈ R6×6 ´ uma matriz de ganhos diagonal definida positiva. Reescrevendo (3.64), e ˙tem-se ˆ = γGT v − γΓθ − γΓθ. A partir de agora, considerar-se-´ que os parˆmetros θ ˜ ˜ a a ˙ ˙dinˆmicos do sistema podem variar, ou seja, θ = θ(t) e ˜ = ˆ − θ. Para este caso, (3.63) a θ θ ˙deve ser reescrita como ˙ v v v ˜T ˜ ˜T ˜T ˙ 1˜ ˙ v ˜ V = −˜ T (F˜ + HT(˜ )) − θ Γθ − θ Γθ − θ γ −1 θ + v T H˜ + v T ∆, (3.65) 2onde aplicou-se a propriedade de antissimetria da matriz C(v). Em (NASISI; CARELLI, 2003) os autores analisam a estabilidade de um sistema decontrole servo-visual adaptativo para robˆs manipuladores. A an´lise realizada a seguir o autiliza t´cnica similar ` aplicada no trabalho mencionado, mas aqui considera-se o caso e amais geral em que os parˆmetros dinˆmicos θ podem variar durante a execu¸˜o de uma a a catarefa. Inicialmente considera-se que ∆ = 0. Considerando valores pequenos de v , tem-se que T(˜ ) ≈ Kv v . S˜o definidas as ˜ v ˜ aseguintes constantes: ϑΓ = κmax (Γ), ϑγ = κmax (γ −1 ), ϑH = κmax (H), µF = χ(F), ˙ ˙ √µΓ = χ(Γ), µHK = χ(HKv ), µF HK = µF + µHK − ϑH , onde χ(Z) = λmin (ZT Z) ´ o ˙ e √ ınimo de Z, κmax (Z) = λmax (ZT Z) denota o valor singular m´ximo devalor singular m´ aZ, e λmin (·) e λmax (·) s˜o fun¸˜es para obten¸˜o do menor e do maior autovalor de uma a co camatriz, respectivamente. Considera-se que a varia¸˜o dos parˆmetros dinˆmicos ´ limitada, de tal forma que ca a a eµF + µHK > ϑH , i.e., µF HK > 0. Deve-se notar que quanto maiores s˜o os valores dos ˙ a
  • 111. 3.5 Considera¸˜es sobre a Robustez co 115 e o ˙ganhos ku e kω , mais forte ´ a hip´tese anterior. Logo, V pode ser escrita como V ≤ −µF HK v ˙ ˜ 2 − µΓ θ ˜ 2 ˜ + ϑΓ θ ˜ θ + ϑγ θ ˙ θ , (3.66) Considerando-se a diferen¸a quadrada c ( )2 1 ˜ 1 ˜ θ −ξ θ = 2 θ 2 −2 θ ˜ θ + ξ2 θ 2, ξ ξpode-se concluir que 1 ˜ ξ2 ˜ θ θ ≤ θ 2 + θ 2, (3.67) 2ξ 2 2sendo ξ ∈ R+ . Aplicando um racioc´ ınio equivalente ´ poss´ mostrar que e ıvel 1 ˜ η2 ˙ 2 ˜ θ θ ≤ 2 θ ˙ 2 + θ , (3.68) 2η 2onde η ∈ R+ . Substituindo (3.67) e (3.68) em (3.66), resulta em ( ) 1 ˜ 2 ξ2 V ≤ −µF HK v − µΓ θ + ϑΓ ˙ ˜ 2 ˜ 2 θ + θ 2 + 2ξ 2 2 ( ) 1 ˜ 2 η2 ˙ 2 ϑγ θ + θ , 2η 2 2ou, rearranjando os termos, V ≤ −α1 v ˙ ˜ 2 − α2 θ ˜ 2 + ρ, (3.69) ( ) 2 2 ϑγonde α1 = µF HK > 0, α2 = µΓ − ϑΓ 2ξ 2 − 2η 2 > 0, e ρ = ϑΓ ξ2 θ 2 ˙ + ϑγ η2 θ 2 ,com ξ e η convenientemente selecionados. Agora, a partir da candidata de Lyapunov ˜ v ˜TV = 1 v T H˜ + 1 θ γ −1 θ pode-se esrever ˜ 2 2 V ≤ β1 v ˜ 2 ˜ + β2 θ 2 , (3.70) 1 1onde β1 = 2 ϑH , β2 = 2 ϑγ , ϑH = κmax (H), ϑγ = κmax (γ). Logo, V ≤ −ΛV + ρ, ˙ (3.71) { } α1 α2com Λ = min , β1 β2 . Se n˜o existe varia¸˜o de parˆmetros reais, ou quando a varia¸˜o a ca a ca ˙ ˜ ˜cessa, θ = 0 e ρ ´ limitado. Portanto, (3.71) implica que θ, v (e, logo, v) s˜o finalmente e ˜ alimitados. Por outro lado, se h´ varia¸˜o nos valores dos parˆmetros dinˆmicos do robˆ, a ca a a o ˙ ˙θ = 0 e ρ ser´ limitado se θ for limitado. Nesse caso, a fronteira que limita os erros a
  • 112. 116 3 Compensa¸˜o Adaptativa da Dinˆmica ca ade controle cresce, mas estes continuam limitados. Em qualquer dos casos, um limiteconservador para v ´ tal que v ˜ e ˜ 2 ≤ ρ α1 . Agora, considerando que ∆ = 0, a equa¸˜o (3.69) deve ser reescrita como ca V ≤ −α1 v ˙ ˜ 2 − α2 θ ˜ 2 +ρ+ v ˜ ∆ . (3.72) ˙ Uma condi¸˜o suficiente para que V < 0 ´ α1 v ca e ˜ 2 ˜ + α2 θ 2 > ρ+ v ˜ ∆ . Uma 2condi¸˜o ainda mais restritiva ´ α1 v ca e ˜ > ρ+ v ˜ ∆ . Considerando que v ˜ = 0, talcondi¸˜o pode ser expressada como ca ρ ∆ < α1 v − ˜ . v ˜ A condi¸˜o anterior mostra que a estabilidade do equil´ ca ıbrio est´ garantida se os adist´rbios est˜o limitados, e que a intensidade m´xima dos dist´rbios que mant´m a u a a u egarantia de estabilidade depende do valor do erro de velocidade. Ou seja, a robustez aosdist´rbios ´ reduzida na medida em que o erro de velocidade diminui. Isso significa que u equando o erro de velocidade ´ muito pequeno, um dist´rbio de pequena intensidade faz e ucom que a condi¸˜o n˜o seja cumprida, elevando o valor do erro. Tal fato leva ` conclus˜o ca a a ade que, na pr´tica, v n˜o ser´ nulo e, portanto, sempre existir´ algum valor de erro de a ˜ a a avelocidade v n˜o nulo, ainda que sua amplitude seja pequena. Vale ressaltar que um ˜ aaumento nos ganhos ku e kω provoca aumento no valor da constante α1 , aumentando arobustez a dist´rbios. u Recordando (3.32), e considerando um limite R numa norma do sinal v, pode-se ˜ ˜concluir que o erro de seguimento h ser´ finalmente limitado por a R A numa norma min(kx ,ky )do erro de controle. Nota 3.9 . Atrav´s de an´lise muito similar ` apresentada nesta se¸˜o, pode-se chegar e a a ca` mesma conclus˜o quando se considera o uso do primeiro controlador dinˆmico, ou seja,a a aa estabilidade continua garantida sob varia¸˜o limitada de parˆmetros, com crescimento ca ado limite de convergˆncia dos erros de controle. e Duas simula¸˜es foram realizadas para ilustrar que a estabilidade do equil´ co ıbrio ´ man- etida sob varia¸˜o nos parˆmetros dinˆmicos. As simula¸˜es descritas a seguir foram reali- ca a a cozadas com as mesmas condi¸˜es daquelas descritas anteriormente, ou seja, foi considerado coo modelo completo do robˆ representado pela equa¸˜o (2.13) com os parˆmetros identifi- o ca acados do robˆ Pioneer 3-DX apresentados na Se¸˜o 2.4. Foram usados os mesmos valores o cade ganhos utilizados nas simula¸˜es anteriores, utilizando o segundo controlador dinˆmico co a
  • 113. 3.5 Considera¸˜es sobre a Robustez co 117 Erro de distância 0.4 0.3 erro [m] 0.2 0.1 0 0 100 200 300 400 500 600 700 800 tempo [s]Figura 57: Erro de distˆncia durante simula¸˜o com varia¸˜o em degrau dos parˆmetros a ca ca a dinˆmicos. acom adapta¸˜o de parˆmetros ativada, para que o robˆ seguisse uma trajet´ria em forma ca a o ode oito. Primeiro, simulou-se uma varia¸˜o em degrau nos valores reais de todos os parˆmetros ca adinˆmicos. Ou seja, simulou-se uma varia¸˜o s´bita nos parˆmetros dinˆmicos do robˆ a ca u a a om´vel. O per´ o ıodo total de simula¸˜o foi de 800s, e em t = 400s todos os parˆmetros ca aθi , i = 1, 2, ..., 6, subitamente dobram de valor. A Figura 57 mostra o erro de distˆncia adurante esta simula¸ao. Pode-se notar que existe um aumento do erro em t = 400s, c˜quando ocorre o degrau de varia¸˜o dos parˆmetros, mas seu valor volta a decrescer e ca aatinge o patamar estabelecido antes da ocorrˆncia da varia¸˜o, conforme esperado. e ca A Figura 58(a) ilustra os erros de velocidade para a simula¸˜o em quest˜o. Nota-se ca aque h´ um aumento em tais valores quando ocorre a varia¸˜o dos parˆmetros, fato que ´ a ca a eevidenciado na Figura 58(b), mas os erros retornam ao patamar anterior na medida emque os parˆmetros estimados s˜o ajustados. A evolu¸˜o dos parˆmetros estimados durante a a ca aesta simula¸˜o ´ apresentada na Figura 59. Pode-se notar que os valores estimados se ca emodificam a partir de t = 400s, mas n˜o necessariamente v˜o aos valores verdadeiros, a aconforme discutido anteriormente. A segunda simula¸˜o considera uma varia¸˜o senoidal em todos os parˆmetros, com ca ca auma amplitude de 25% e per´ ıodo de 180s. A simula¸˜o ´ realizada por um per´ ca e ıodo maislongo, de 8.000s, sendo que a varia¸˜o nos valores dos parˆmetros ´ iniciada na metade ca a edesse tempo. A Figura 60 ilustra a evolu¸˜o do erro de distˆncia, e as Figuras 61(a) e ca a61(b) apresentam os erros de velocidade para este caso. Pode-se notar que a partir doin´ da varia¸˜o dos parˆmetros a faixa de varia¸˜o dos erros cresce um pouco, como ıcio ca a caprevisto na an´lise apresentada anteriormente. Como a varia¸˜o dos parˆmetros n˜o cessa a ca a aat´ o final da simula¸˜o, o intervalo de permanˆncia dos valores de erro n˜o mais diminui. e ca e a
  • 114. 118 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Erro de Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 0.4 0.01 0.2 0 0 −0.01 −0.2 350 400 450 0 100 200 300 400 500 600 700 800 tempo [s] tempo [s] Erro de Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 0.2 0.02 0.1 0 0 −0.1 −0.02 −0.2 350 400 450 0 100 200 300 400 500 600 700 800 tempo [s] tempo [s] (a) (b) Figura 58: Erros de velocidade durante simula¸˜o com varia¸˜o em degrau dos ca caparˆmetros. (a) Durante todo o per´ a ıodo de simula¸˜o; (b) Detalhe do intervalo em que a ca varia¸˜o de parˆmetros ocorre. ca a θ1 θ2 0.4 0.4 0.2 0.2 0 0 0 200 400 600 800 0 200 400 600 800 θ3 θ4 0.05 1.5 0 1 −0.05 0.5 0 200 400 600 800 0 200 400 600 800 θ5 θ6 0.05 1.4 1.2 0 1 0 200 400 600 800 0 200 400 600 800 tempo [s] tempo [s] Figura 59: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o com varia¸˜o em ca a ca ca degrau dos parˆmetros dinˆmicos. a a A evolu¸˜o dos parˆmetros estimados durante a segunda simula¸˜o ´ apresentada na ca a ca eFigura 62. Pode-se notar que os valores estimados se modificam a partir de t = 4.000s, ese mantˆm variando at´ o final da simula¸˜o. Isso ocorre porque os valores dos parˆmetros e e ca adinˆmicos do robˆ tamb´m n˜o param de variar. a o e a As simula¸˜es apresentadas ilustram claramente que o equil´ co ıbrio do sistema conti-
  • 115. 3.6 Compara¸˜o de Desempenho ca 119 Erro de distância 0.4 0.3 erro [m] 0.2 0.1 0 0 1000 2000 3000 4000 5000 6000 7000 8000 tempo [s] Figura 60: Erro de distˆncia durante simula¸˜o com varia¸˜o senoidal dos parˆmetros a ca ca a dinˆmicos. a Erro de Velocidade Linear [m/s] Erro de Velocidade Linear [m/s] 0.6 0.4 0.01 0.2 0 0 −0.01 −0.2 3900 3950 4000 4050 4100 0 1000 2000 3000 4000 5000 6000 7000 8000 tempo [s] tempo [s] Erro de Velocidade Angular [rad/s] Erro de Velocidade Angular [rad/s] 0.2 0.02 0.1 0 0 −0.1 −0.02 −0.2 3900 3950 4000 4050 4100 0 1000 2000 3000 4000 5000 6000 7000 8000 tempo [s] tempo [s] (a) (b)Figura 61: Erros de velocidade durante simula¸˜o com varia¸˜o senoidal dos parˆmetros. ca ca a(a) Durante todo o per´ıodo de simula¸˜o; (b) Detalhe do intervalo em que a varia¸˜o de ca ca parˆmetros ´ iniciada. a e a ca e ´ anua est´vel sob varia¸˜o param´trica limitada em degrau e senoidal. E v´lido comentarque tamb´m foram realizadas algumas simula¸˜es com varia¸˜es de maior amplitude nos e co coparˆmetros, que resultaram em perda da condi¸˜o de estabilidade. a ca3.6 Compara¸˜o de Desempenho ca Para avaliar a importˆncia da compensa¸˜o dinˆmica, foram realizadas simula¸˜es a ca a copara comparar o desempenho do sistema com e sem a compensa¸˜o dinˆmica. O desem- ca apenho do sistema foi calculado com base no ´ ındice IAE, como explicado na Se¸˜o 3.4. ca Nas simula¸˜es foi considerado o modelo completo do robˆ m´vel Pioneer-3DX, in- co o o
  • 116. 120 3 Compensa¸˜o Adaptativa da Dinˆmica ca a θ θ 1 2 0.4 0.4 0.3 0.3 0.2 0.2 0 2000 4000 6000 8000 0 2000 4000 6000 8000 θ3 θ4 0.05 1.5 0 1 −0.05 0.5 0 2000 4000 6000 8000 0 2000 4000 6000 8000 θ5 θ6 0.05 1.4 0 1.2 −0.05 1 0 2000 4000 6000 8000 0 2000 4000 6000 8000 tempo [s] tempo [s]Figura 62: Evolu¸˜o dos parˆmetros estimados durante simula¸˜o de longa dura¸˜o com ca a ca ca varia¸˜o senoidal dos parˆmetros dinˆmicos. ca a acluindo limites m´ximos de velocidade e acelera¸˜o, com adi¸˜o de ru´ branco aos sinais a ca ca ıdode posi¸˜o e velocidade enviados aos controladores. ca O´ ındice IAE foi calculado para cada simula¸˜o de T = 250s em que o robˆ deveria ca oseguir uma trajet´ria de referˆncia em forma de 8. Em cada uma das simula¸˜es, os ganhos o e codo controlador cinem´tico (kx = ky ) foram fixados em um valor distinto variando entre a0,5 e 35,0 enquanto todos os ganhos do controlador dinˆmico foram mantidos inalterados. aO objetivo era verificar o valor do ´ ındice IAE antes e depois da ativa¸˜o da compensa¸˜o ca cadinˆmica para cada conjunto de valores de ganhos do controlador cinem´tico. Para isso, a aforam simuladas quatro situa¸˜es, quais sejam: co • (a) Somente o controlador cinem´tico habilitado, isto ´, o robˆ recebe como co- a e o mandos os sinais de velocidade desejada vd diretamente do controlador cinem´tico. a Equivale ao esquema cl´ssico em que o controlador n˜o considera a dinˆmica do a a a ve´ ıculo; • (b) Com compensa¸˜o dinˆmica ativada considerando parˆmetros estimados com ca a a um erro de 10%, sem adapta¸˜o de parˆmetros; ca a • (c) Com compensa¸˜o dinˆmica ativada considerando parˆmetros estimados iniciais ca a a com um erro de 10%, com adapta¸˜o de parˆmetros ativada a partir de t = 0s; e ca a • (d ) Com compensa¸˜o dinˆmica ativada considerando parˆmetros estimados exatos ca a a
  • 117. 3.6 Compara¸˜o de Desempenho ca 121 IAE 10 (a) 8 (b) 6 (c) 4 2 0 0 10 20 30 40 (d) kx, ky Figura 63: IAE para simula¸˜es de 250s para os casos (a-d ) (ver texto). co (caso ideal), sem adapta¸˜o de parˆmetros. ca a A Figura 63 mostra os valores do ´ ındice IAE obtidos para diversas simula¸˜es dos cocasos mencionados anteriormente. Pode-se observar que quando a compensa¸˜o dinˆmica ca aest´ ativada (casos b-d ), os valores dos ´ a ındices IAE obtidos s˜o menores, o que indica me- alhor desempenho. Como esperado, os menores erros foram obtidos durante as simula¸˜es codo caso ideal (d ). ´ a E v´lido ressaltar que os valores resultantes do ´ ındice IAE para os casos (b) e (c) s˜o amenores do que aqueles obtidos para o caso (a), ainda que as condi¸˜es de compensa¸˜o co cadinˆmica n˜o sejam favor´veis devido ao erro nos valores dos parˆmetros estimados. Outra a a a aobserva¸˜o importante ´ que a compensa¸˜o dinˆmica permitiu a obten¸˜o de desempenho ca e ca a camelhor do que o melhor desempenho obtido com uso apenas do controlador cinem´tico, aconsiderando a faixa de varia¸˜o de ganhos adotada nas simula¸˜es. O menor valor de ca coIAE obtido com o controlador cinem´tico foi 1,2 para kx = ky = 17. Ganhos maiores aprovocaram pequeno aumento do ´ ındice devido ao aumento da oscila¸˜o do robˆ. Con- ca osiderando os mesmos valores de kx = ky , a ativa¸˜o da compensa¸˜o dinˆmica provocou ca ca aredu¸˜o do valor de IAE para cerca de 1,0, o que repesenta uma melhora de aproxima- cadamente 20%. Para valores menores de ganhos do controlador cinem´tico a melhora no adesempenho com a compensa¸˜o dinˆmica ´ muito mais expressiva. Por exemplo, pode-se ca a eobservar na Figura 63 que para kx = ky = 3, o ´ ındice IAE obtido para o caso da com-pensa¸˜o dinˆmica ativada com adapta¸˜o de parˆmetros (caso c) tem aproximadamente ca a ca ao mesmo valor do menor ´ ındice obtido com apenas o controlador cinem´tico, ou seja, aIAE = 1,2. Sem a compensa¸˜o dinˆmica, o ´ ca a ındice nesse caso seria maior que 2,0. Tal
  • 118. 122 3 Compensa¸˜o Adaptativa da Dinˆmica ca a Figura 64: IAE para experimentos de 75s para os casos (a) e (c) (ver texto).fato ilustra que a ativa¸˜o da compensa¸˜o dinˆmica permitiu obten¸˜o de desempenho ca ca a caequivalente ao do controlador cinem´tico, mas com ganhos menores. a A Figura 64 mostra os valores do ´ ındice IAE obtidos para alguns experimentos doscasos (a) e (c) mencionados anteriormente. Pode-se observar que para o caso em quekx = ky = 2, 0, o ´ ındice IAE sofre uma redu¸˜o de cerca de 30% ap´s a ativa¸˜o da ca o cacompensa¸˜o dinˆmica. Assim como mostraram os resultados de simula¸˜o, durante os ca a caexperimentos a compensa¸˜o da dinˆmica tamb´m provocou melhora no desempenho do ca a esistema.3.7 Considera¸˜es Finais do Cap´ co ıtulo Este cap´ ıtulo apresentou o desenvolvimento de um controlador cinem´tico de segui- amento de trajet´rias e de dois controladores dinˆmicos adaptativos. Estes tˆm a fun¸˜o o a e cade compensar os efeitos da dinˆmica do robˆ, fazendo com que o ve´ a o ıculo desenvolva asvelocidades de referˆncia geradas pelo controlador cinem´tico com o menor erro poss´ e a ıvel.Os controladores dinˆmicos foram desenvolvidos com base nos modelos dinˆmicos apre- a asentados no cap´ ıtulo 2, e geram sinais de velocidade linear e angular como comandos parao robˆ. o Foi apresentada an´lise de estabilidade do sistema considerando a utiliza¸˜o de cada a cacontrolador, e foi demonstrado que todos fazem com que o equil´ ıbrio do sistema em malhafechada seja est´vel, de modo que os sinais de erro sejam limitados ou tendam a zero. A aan´lise de robustez a dist´rbios e ` varia¸˜o limitada de parˆmetros dinˆmicos durante a u a ca a aa execu¸˜o de uma tarefa demonstrou que a estabilidade do equil´ ca ıbrio ´ garantida se os edist´rbios e a varia¸˜o dos parˆmetros s˜o limitados. u ca a a
  • 119. 3.7 Considera¸˜es Finais do Cap´ co ıtulo 123 Diversas simula¸˜es foram realizadas e seus resultados ilustram o bom desempenho dos cocontroladores propostos para os casos de seguimento de trajet´rias. Nas simula¸˜es foram o coconsiderados casos com diferentes valores de parˆmetros no modelo dinˆmico do robˆ, e a a oos resultados foram comparados e comentados. Os resultados de simula¸˜o atestam o fun- cacionamento dos controladores e mostram que a adapta¸˜o de parˆmetros pode promover ca amelhoria significativa no desempenho do sistema, principalmente quando os parˆmetros adinˆmicos n˜o foram corretamente identificados ou podem sofrer altera¸˜o, por exemplo, a a cadevido ao transporte de cargas. O c´lculo de um ´ a ındice de desempenho atrav´s de si- emula¸˜es e experimentos mostrou que a compensa¸˜o adaptativa da dinˆmica ´ capaz de co ca a emelhorar o desempenho do sistema quando comparado ao desempenho obtido apenas como controlador cinem´tico de ganhos vari´veis. a a Alguns resultados experimentais tamb´m foram apresentados, e mostram que os con- etroladores propostos funcionam de maneira adequada. No entanto, cabe observar queos resultados n˜o foram t˜o bons quanto previsto em simula¸˜o. Pode-se citar trˆs fa- a a ca etores que contribuem para a diferen¸a entre os resultados obtidos em simula¸˜o e em c caexperimentos: 1. Os sinais de medi¸˜o de posi¸˜o e velocidade do robˆ m´vel Pioneer usado nos ca ca o o experimentos apresentam ru´ ıdo, o que pode provocar degrada¸˜o no desempenho ca dos controladores, j´ que todos utilizam essas informa¸˜es no c´lculo das a¸˜es de a co a co controle. Tal fato tamb´m foi reportado em (GAVA et al., 2007). A an´lise de ro- e a bustez mostrou que um aumento na amplitude das perturba¸˜es provoca aumento co da regi˜o de convergˆncia dos erros de controle. De fato, durante a realiza¸˜o das si- a e ca mula¸˜es comprovou-se que um aumento na amplitude do ru´ provoca degrada¸˜o co ıdo ca no desempenho do sistema; 2. Pequenas ondula¸˜es no piso e deslizamento das rodas podem provocar dist´rbios co u que n˜o foram considerados durante as simula¸˜es, j´ que quando o vetor δ de a co a incertezas param´tricas, que modela efeitos como o deslizamento das rodas e for¸as e c e torques exercidos na roda independente, n˜o ´ nulo, o limite de erro aumenta. a e De fato, o piso do laborat´rio onde os experimentos descritos neste cap´ o ıtulo foram realizados ´ formado por blocos de cerˆmica lisa. Observou-se que, em alguns casos, e a h´ deslizamento das rodas do robˆ, por vezes bastante significativo. Al´m disso, a o e quando a roda independente passa na jun¸˜o entre os blocos de cerˆmica, nota-se ca a uma varia¸˜o em sua dire¸˜o. Tais fatos n˜o foram levados em conta nas simula¸˜es ca ca a co realizadas.
  • 120. 124 3 Compensa¸˜o Adaptativa da Dinˆmica ca a 3. Devido aos sinais de medi¸˜o ruidosos e aos demais dist´rbios presentes durante ca u os experimentos, os valores dos ganhos de adapta¸˜o de parˆmetros foram alterados ca a em rela¸˜o `queles utilizados durante as simula¸˜es. ca a co ´ a E v´lido ressaltar que, em rela¸˜o ao controlador dinˆmico apresentado por De La ca aCRUZ (2006), os controladores aqui propostos apresentam duas vantagens principais:adapta¸˜o de parˆmetros e possibilidade de conex˜o com outros controladores cinem´ticos. ca a a aIsso torna o sistema mais flex´ ıvel, pois permite a troca de controladores cinem´ticos apara execu¸˜o de tarefas distintas, como seguimento de caminhos, posicionamento ou ca ca ˜controle de forma¸˜o (MARTINS et al., 2008; BRANDAO et al., 2009a). Tamb´m torna eo sistema mais robusto, j´ que a adapta¸˜o de parˆmetros, realizada on-line, permite que a ca ao sistema se adapte a varia¸˜es param´tricas que podem ocorrer de tarefa a tarefa, como co eem transporte de cargas, por exemplo (MARTINS et al., 2008). Finalmente, em sistemas pr´ticos o desempenho global pode ser melhorado durante a aexecu¸˜o de uma tarefa se for poss´ a aplica¸˜o da seguinte estrat´gia: estando o robˆ ca ıvel ca e onas condi¸˜es em que deve realizar a tarefa, e antes de sua execu¸˜o, fazˆ-lo percorrer co ca euma trajet´ria que garanta a completa excita¸˜o de sua dinˆmica, enquanto os valores o ca ados parˆmetros estimados s˜o adaptados com ganhos baixos. Ap´s a convergˆncia dos a a o eparˆmetros, ou de determinado tempo, desativa-se a adapta¸˜o de parˆmetros e envia-se a ca ao robˆ para execu¸˜o da tarefa. Dessa forma, durante a realiza¸˜o da tarefa, a com- o ca capensa¸˜o da dinˆmica ´ realizada com valores fixos de parˆmetros, previamente adapta- ca a e a ´dos. Uma estrat´gia muito similar foi proposta em (JORDAN; BUSTAMANTE, 2008) epara ajuste autom´tico de ganhos de um controlador adaptativo aplicado a robˆs subma- a orinos. Vale ressaltar que tal estrat´gia n˜o ´ conveniente para aplica¸˜o em casos em que e a e caos parˆmetros dinˆmicos do robˆ podem variar diversas vezes de tarefa a tarefa, como em a a ocasos de transporte de v´rias cargas. a
  • 121. 125 4Controle de Sistemas Multirrobˆs ocom Compensa¸˜o da Dinˆmica ca a “They all look like me. But none of them are me.” (Sonny, sobre os outros robˆs NS-5, em I Robot) o4.1 Introdu¸˜o ca Sistemas multirrobˆs permitem que algumas tarefas, como busca e resgate, transporte oou deslocamento de cargas e mapeamento de grandes ´reas, sejam realizadas de forma amais barata, tolerante a falhas e flex´ do que com a utiliza¸˜o de um unico robˆ de maior ıvel ca ´ ocapacidade. De acordo com Cao, Fukunaga e Kahng (1997), um sistema multirrobˆs ´ o econsiderado cooperativo quando apresenta, devido a um mecanismo de interliga¸˜o, um cacomportamento tal que sua utilidade aumenta para dada tarefa. Portanto, comporta-mento cooperativo implica em ganho de desempenho do sistema em termos da tarefa quedeve ser cumprida. Do ponto de vista de controle, a arquitetura do sistema multirrobˆs pode ser cen- otralizada ou descentralizada. Ainda de acordo com Cao, Fukunaga e Kahng (1997), aarquitetura centralizada ´ caracterizada pela existˆncia de um unico agente de controle, e e ´enquanto a arquitetura descentralizada n˜o possui tal agente. Um exemplo t´ a ıpico de con-trole centralizado de robˆs m´veis ´ abordado em (AIRES; ALSINA; MEDEIROS, 2001), o o eque apresenta um sistema de vis˜o global para realiza¸˜o de controle centralizado de um a catime de futebol de robˆs. Na aplica¸˜o abordada, o controle centralizado ´ apropriado, o ca epois pode ser feito num computador externo de grande capacidade de processamento,enquanto os robˆs podem ter eletrˆnica mais simples, com pouca capacidade de proces- o o
  • 122. 126 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca asamento a bordo. Al´m disso, a informa¸˜o de posi¸˜o e orienta¸˜o de todos os robˆs ´ e ca ca ca o eobtida com a utiliza¸˜o de um s´ sensor, o que ´ poss´ pois a ´rea de atua¸˜o de todos ca o e ıvel a caos robˆs ´ limitada. Isso permite que todo o grupo atue como um unico agente, e que o e ´algoritmos complexos possam ser executados para seu controle. Na arquitetura de controle descentralizada, cada robˆ possui seu pr´prio sistema o ode controle e o m´ ınimo de sensores necess´rios para obter as informa¸˜es que necessita a codo ambiente e dos demais robˆs do grupo. Cada agente ´ capaz de determinar seus o epr´prios sinais de controle para que a tarefa desejada seja executada, como manter uma o ´forma¸˜o, por exemplo (De La CRUZ; CARELLI, 2006). E importante ressaltar que o cacontrole descentralizado n˜o implica em falta de comunica¸˜o entre os robˆs membros do a ca ogrupo (WANG; TAN; GOLDSMITH, 2005; DONG; GUO; FARRELL, 2006). Pode havertroca de informa¸˜es entre os robˆs sem que algum deles tenha que, necessariamente, co ocentralizar todas elas. Por´m, cada robˆ deve ter a capacidade de gerar suas pr´prias e o oa¸˜es de controle, com base na tarefa que deve ser realizada. A arquitetura descentralizada copode, ainda, ser caracterizada como distribu´ em que todos os agentes s˜o equivalentes ıda, ado ponto de vista de controle, ou hier´rquicas, que s˜o localmente centralizadas (CAO; a aFUKUNAGA; KAHNG, 1997). Uma importante diferen¸a entre os paradigmas de controle centralizado e descentra- clizado diz respeito ` robustez do sistema: no controle centralizado, a ocorrˆncia de uma a efalha no agente centralizador provoca uma falha em todo o sistema. Sistemas descen-tralizados tendem a ser mais robustos, exatamente por n˜o dependerem de um unico a ´agente. Por outro lado, num sistema centralizado o agente centralizador do controle (e dainforma¸˜o) pode ser capaz de verificar se uma dada solu¸˜o ´ ´tima, enquanto num sis- ca ca e otema descentralizado encontrar a solu¸˜o ´tima global pode n˜o ser trivial (ANDERSON; ca o aBARTHOLDI-III, 2000). Tanto a arquitetura centralizada como a descentralizada podem ser aplicadas na rea-liza¸˜o de controle de forma¸˜o, que consiste no problema de se controlar a posi¸˜o relativa ca ca cae a orienta¸˜o dos robˆs em um grupo que se movimenta como um todo. Em geral, o ca ocontrole de forma¸˜o de robˆs pode ser classificado em uma das trˆs categorias: controle ca o ebaseado em comportamentos, m´todo de estruturas virtuais ou m´todo de seguimento de e el´ ıderes (CONSOLINI et al., 2007), explicados a seguir. No controle baseado em comportamentos, v´rios comportamentos desejados s˜o pro- a agramados nos robˆs (como evitar colis˜es, manter forma¸˜o, seguir at´ um alvo, etc.). A o o ca ea¸˜o de controle final ´ obtida a partir de uma m´dia ponderada da a¸˜o definida por cada ca e e ca
  • 123. 4.1 Introdu¸˜o ca 127comportamento, com pesos determinados por sua importˆncia num dado instante. A for- amaliza¸˜o te´rica e an´lise matem´tica desta abordagem ´ dif´ e, portanto, n˜o ´ trivial ca o a a e ıcil a ede se garantir que a forma¸˜o ir´ convergir para uma configura¸˜o desejada (CONSOLINI ca a caet al., 2007). O m´todo de estruturas virtuais consiste em considerar todo o grupo de robˆs como e ouma unica estrutura. A trajet´ria planejada ´ transmitida ` forma¸˜o como um todo, ´ o e a cae n˜o a cada um dos robˆs individualmente. Nesse caso, ´ poss´ prever o comporta- a o e ıvelmento de cada robˆ e do grupo, e ´ necess´rio que exista comunica¸˜o entre os robˆs o e a ca o(CONSOLINI et al., 2007). No m´todo de seguimento de l´ e ıder, um dos robˆs ´ designado como tal e percorre o ea trajet´ria desejada, enquanto os demais robˆs (seguidores) devem se manter a uma o odeterminada distˆncia e ˆngulo desse. As principais cr´ a a ıticas a este tipo de abordagem s˜o ao fato de que uma falha no robˆ l´ o ıder prejudica todo o sistema, e que o conjunto possuibaixa tolerˆncia a dist´rbios (CONSOLINI et al., 2007). No entanto, esta abordagem ´ a u ede mais f´cil implementa¸˜o que a de estruturas virtuais, e permite escalonamento direto, a ca ˜como mostrado em (BRANDAO, 2008). Este cap´ ıtulo aborda as arquiteturas de controle de forma¸˜o centralizado e descen- catralizado para sistemas multirrobˆs. O sistema de controle descentralizado aqui abordado o´ do tipo l´e ıder-seguidores, distribu´ ıdo, em que o robˆ l´ o ıder executa a tarefa que lhe ´ de- esignada, enquanto o(s) seguidor(es) deve(m) atuar de maneira a manter(em) a forma¸˜o cadesejada. O robˆ aqui designado como l´ o ıder n˜o envia sinais de comando a nenhum aoutro membro do grupo. Cada agente membro do grupo ´ respons´vel por processar a e ainforma¸˜o sensorial pr´pria (ou compartilhada) e executar o algoritmo de controle que ca ogera seus pr´prios sinais de referˆncia. Dessa forma, o l´ o e ıder n˜o precisa conhecer o modelo ados demais membros da forma¸˜o, e a compensa¸˜o da dinˆmica, quando existir, deve ser ca ca afeita pelos controladores presentes em cada um dos robˆs. o No controle centralizado abordado, o agente centralizador recebe toda a informa¸˜o casensorial e executa o algoritmo de controle de forma¸˜o. Ent˜o, envia a todos os robˆs ca a osinais de referˆncia de velocidade linear e angular para que a forma¸˜o desejada seja atin- e cagida e mantida. Tal sistema ´ classificado como controle baseado em estruturas virtuais. eO agente centralizador (que pode ser um dos robˆs) precisa ter informa¸˜o de posi¸˜o e o ca cavelocidade de cada robˆ membro da forma¸˜o, al´m de conhecer o modelo cinem´tico de o ca e acada um deles, para ser capaz de gerar os sinais de referˆncia correspondentes. Apesar ede cada robˆ possuir controladores internos que garantem o seguimento da velocidade de o
  • 124. 128 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca areferˆncia recebida, este sistema ´ caracterizado como controle centralizado pois o controle e e a ca e ´das vari´veis de forma¸˜o ´ feito de forma centralizada. E importante que se note quea compensa¸˜o da dinˆmica de cada robˆ, quando realizada, pode ser feita pelo pr´prio ca a o orobˆ, ou pelo agente centralizador do controle que, nesse caso, deve conhecer o modelo e oos parˆmetros dinˆmicos de cada agente membro do grupo. a a4.2 Trabalhos Relacionados Diversos trabalhos tratam de controle de sistemas multirrobˆs. H´ trabalhos que con- o asideram a coopera¸˜o entre robˆs m´veis subaqu´ticos (SARIEL; BALCH; ERDOGAN, ca o o a2008), entre robˆs a´reos (BETHKE; VALENTI; HOW, 2008), e at´ entre robˆs a´reos o e e o ee terrestres (MICHAEL; FINK; KUMAR, 2007). No entanto, nesta se¸˜o s˜o discutidos ca abrevemente apenas alguns estudos que tratam de coopera¸˜o entre ve´ ca ıculos terrestres. O trabalho relatado em (FEDDEMA; LEWIS; SCHOENWALD, 2002) aborda o con-trole de m´ltiplos ve´ u ıculos usando t´cnicas de controle descentralizado, analisando em que esitua¸˜es um grande grupo de robˆs ´ control´vel e observ´vel. Segundo os autores, a co o e a amaioria dos trabalhos que tratam de controle de m´ltiplos ve´ u ıculos n˜o inclui o desen- avolvimento formal do sistema de controle, do ponto de vista de estabilidade. A t´cnica eali proposta permite garantir a estabilidade do sistema mesmo sob perturba¸˜es estru- coturais, como falhas de comunica¸˜o e varia¸˜o de parˆmetros. Os autores mostram que ca ca ao grau de intera¸˜o entre os robˆs, dado pela influˆncia da posi¸˜o dos robˆs vizinhos ca o e ca ona gera¸˜o dos sinais de controle de um dado robˆ, influencia na estabilidade do sistema ca ocomo um todo. Concluem que o n´mero de ve´ u ıculos tamb´m influencia na estabilidade, j´ e aque imp˜e restri¸˜es na faixa do ganho de intera¸˜o. Observam, ainda, que um overshoot o co cano sinal de controle de um dos ve´ıculos pode levar todo o sistema ` instabilidade, ainda a ´que este seja est´vel individualmente. E mostrado um experimento que ilustra o controle ade forma¸˜o para deslocamento de um grupo de oito robˆs, cada um dotado de sensores ca oindividuais (como GPS diferencial) e comunica¸˜o por r´dio. ca a Um sistema para controle cooperativo de um grupo de robˆs que usam como sensor oapenas uma cˆmera omnidirecional (uma para cada robˆ) ´ apresentado em (DAS et al., a o e2002). Tal sistema permite que o controle seja feito de modo centralizado ou descentra-lizado, baseado em trˆs m´todos de navega¸˜o: (1) um robˆ do grupo pode seguir um e e ca ol´ ıder a uma distˆncia e ˆngulo determinados; (2) um robˆ do grupo pode seguir dois ou- a a otros a uma distˆncia determinada de cada um; ou (3) cada robˆ pode navegar de forma a oautˆnoma. O modo de seguimento permite varia¸˜o da forma¸˜o (de triˆngulo para linha, o ca ca a
  • 125. 4.2 Trabalhos Relacionados 129por exemplo), atrav´s do chaveamento de controladores, para uma situa¸˜o de desvio de e caobst´culos. O sistema com chaveamento de controladores ´ provado ser est´vel com uso a e ade uma fun¸˜o de Lyapunov comum a todos os controladores. A determina¸˜o das veloci- ca cadades dos robˆs da forma¸˜o ´ feita por observadores de estado. S˜o mostrados resultados o ca e ade simula¸˜o com at´ seis robˆs, e experimentos com trˆs, todos sendo controlados por ca e o eum computador remoto (controle centralizado). Em (MONTEIRO; VAZ; BICHO, 2004) ´ apresentada uma estrat´gia de controle de e eforma¸˜o que gera comportamentos baseados em uma s´rie temporal de estados assinto- ca eticamente est´veis. A geometria da forma¸˜o ´ determinada atrav´s de uma matriz cujos a ca e eparˆmetros indicam qual ´ o robˆ l´ a e o ıder de cada membro da forma¸˜o, e a que distˆncia ca ae ˆngulo os robˆs seguidores devem se posicionar em rela¸˜o a ele. O controle ´ feito a o ca ede forma centralizada, e pode ocorrer relaxamento da geometria da forma¸˜o no caso de cadesvio de obst´culos. Tal fato ´ ilustrado por resultados experimentais apresentados com a eum grupo de trˆs robˆs. e o Pereira, Campos e Kumar (2004) abordam a tarefa de deslocamento de cargas porrobˆs m´veis que a empurram e a guiam at´ o alvo. A estrat´gia de coopera¸˜o adotada ´ o o e e ca ede controle descentralizado de forma¸˜o, por´m os autores n˜o consideraram a dinˆmica ca e a ados robˆs. S˜o apresentados resultados experimentais usando a plataforma descrita em o a(MICHAEL; FINK; KUMAR, 2008). Um sistema de controle descentralizado baseado em comportamentos inspirados bio-logicamente ´ apresentado em (CLARK; FIERRO, 2005). Cada controlador ´ composto e epor m´quinas de estado, assumindo que os robˆs possuem seus pr´prios sensores e podem a o ocomunicar-se entre si. O objetivo do sistema ´ localizar e seguir um per´ e ımetro. Quandoqualquer membro do grupo localiza o per´ ımetro, envia informa¸˜o aos demais. Os com- caportamentos s˜o baseados em trˆs controladores: (1) cobertura aleat´ria, que faz com que a e oos robˆs realizem movimenta¸˜o aleat´ria numa ´rea buscando o per´ o ca o a ımetro e evitando co-lis˜es; (2) movimenta¸˜o r´pida at´ o per´ o ca a e ımetro, assim que o mesmo ´ localizado; e (3) eseguimento do per´ ımetro, evitando colis˜es. o Uma estrat´gia de controle descentralizado de forma¸˜o tipo l´ e ca ıder-seguidores em que a a co o e ˜n˜o h´ troca de informa¸˜es entre os robˆs ´ apresentada em (BRANDAO et al., 2007b).Em tal trabalho ´ estudado o uso de um sensor de varredura laser para determina¸˜o da e caposi¸˜o e orienta¸˜o do robˆ l´ ca ca o ıder da forma¸˜o. Os robˆs seguidores determinam a posi¸˜o ca o cae orienta¸˜o e estimam a velocidade do robˆ l´ ca o ıder, posicionando-se em rela¸˜o a este, de caacordo com a distˆncia e ˆngulo de forma¸˜o desejados. S˜o apresentados resultados a a ca a
  • 126. 130 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca aexperimentais usando dois robˆs e simula¸˜es para casos de forma¸˜es mais complexas. o co co Outra estrat´gia de controle de forma¸˜o tipo l´ e ca ıder-seguidores ´ apresentada em e(CONSOLINI et al., 2007). Ali, a posi¸˜o do seguidor pode variar dentro de certos calimites (um cone) em rela¸˜o ao l´ ca ıder, sendo o ˆngulo entre o l´ a ıder e o seguidor medidono referencial deste, e n˜o daquele. Um resultado interessante apresentado pelos autores a´ que a geometria da forma¸˜o imp˜e um limite m´ximo ` curvatura da trajet´ria a sere ca o a a opercorrida pelo l´ ıder e ` velocidade dos seguidores. Somente resultados de simula¸˜o s˜o a ca aapresentados. Em (KRESS-GAZIT et al., 2008), os autores apresentam uma t´cnica de controle edescentralizado baseada em pol´ ıticas locais de controle (equivalentes a comportamentos)para ser aplicada em ve´ ıculos autˆnomos. Tais pol´ o ıticas locais garantem a execu¸˜o da catarefa num dado entorno, garantindo que o estado do ve´ ıculo, ao final da execu¸˜o de uma cadelas, estar´ dentro da ´rea de abrangˆncia da pol´ a a e ıtica que ser´ executada em seguida. aCada pol´ ıtica de controle obedece a especifica¸˜es de alto n´ co ıvel, como “dirigir at´ encontrar euma vaga e, ent˜o, estacionar”, ou “deixar o quarteir˜o obedecendo as leis de trˆnsito”. a a aA execu¸˜o da tarefa por parte de cada ve´ ca ıculo depende do estado dos ve´ ıculos ao seuredor, percebido por seus sensores. S˜o apresentados resultados de simula¸˜o envolvendo a caas tarefas de estacionamento e movimenta¸˜o obedecendo as leis de trˆnsito. ca a Uma t´cnica de controle centralizado de forma¸˜o baseado em estruturas virtuais, e cachamada de Cluster Space Control, foi apresentada por Mas, Petrovic e Kitts (2008). Osautores prop˜em uma estrutura de controle para um grupo de trˆs robˆs uniciclo, em que o e oo controle para seu deslocamento ´ feito com base em seu centr´ide. Mencionam que os e ocontroladores adotados s˜o do tipo PID, mas n˜o explicam como foram projetados e n˜o a a aapresentam an´lise de estabilidade do sistema. S˜o apresentados resultados experimen- a atais com robˆs AmigoBot (da empresa Mobile Robots), mas os erros s˜o muito grandes, o aoscilando a picos de mais de um metro de distˆncia. a Em (ANTONELLI; ARRICHIELLO; CHIAVERINI, 2008) ´ proposto um sistema emultirrobˆs que tem o prop´sito de posicionar os ve´ o o ıculos em forma¸˜o em torno de caum alvo (cujo movimento ´ inicialmente desconhecido) e escolt´-lo ou acompanh´-lo, e a amantendo a forma¸˜o. A ideia ´ que os robˆs se mantenham em torno do alvo para evitar ca e osua fuga ou para protegˆ-lo de outros agentes externos. Cada um dos n robˆs se posiciona e onum dos v´rtices de um pol´ e ıgono de ordem n em torno do alvo, de forma a minimizaras janelas de poss´ ıvel fuga ou penetra¸˜o na regi˜o interna. Os autores usam uma lei ca ade controle centralizado que leva em conta a ordem de prioridade das subtarefas a serem
  • 127. 4.2 Trabalhos Relacionados 131executadas: (1) o centr´ide da forma¸˜o deve coincidir com a posi¸˜o do alvo; (2) os o ca carobˆs devem se mover seguindo uma circunferˆncia em torno do alvo; (3) os robˆs devem o e ose distribuir adequadamente ao longo da circunferˆncia; e (4) os robˆs devem evitar colis˜o e o acom obst´culos e entre si. Cada subtarefa ´ tratada como um comportamento, e gera um a ecomando de velocidade para cada robˆ. Os comandos de velocidade s˜o, ent˜o, fusionados o a ade forma que os sinais de comando enviados a cada robˆ sejam uma combina¸˜o de cada o cacomportamento, de acordo com sua prioridade e ativa¸˜o. S˜o apresentadas simula¸˜es ca a coque evidenciam diferentes resultados para diferentes ordens de prioridade de cada tarefa,e diferentes ganhos de cada controlador. Tamb´m s˜o mostrados experimentos com seis e arobˆs de tipo uniciclo Khepera II (da empresa K-Team), em que a informa¸˜o de posi¸˜o o ca cado alvo e dos demais robˆs ´ obtida a partir de duas cˆmeras posicionadas no teto. Os o e aresultados mostram que o sistema ´ capaz de se posicionar em torno de uma bola de tˆnis e ee segu´ ı-la. Nos trabalhos mencionados anteriormente a dinˆmica dos ve´ a ıculos n˜o ´ considerada a ena gera¸˜o dos sinais de controle. Por outro lado, existem alguns trabalhos que tratam cado controle de sistemas multirrobˆs considerando seus modelos dinˆmicos. Por exemplo, o aem sistemas em que se deseja executar deslocamento de cargas ou controle de forma¸˜o, caa compensa¸˜o da dinˆmica de cada robˆ do grupo pode levar a uma melhora de desem- ca a openho, j´ que cada robˆ pode seguir seus sinais de comando com menor erro. a o Neste contexto, Fierro e Das (2002) apresentam uma arquitetura dividida em quatrocamadas para coordenar um time de robˆs m´veis para que estes atinjam uma posi¸˜o o o cadesejada com uma forma¸˜o determinada. Sensores permitem que os robˆs se organizem ca onuma rede e definam seus l´ ıderes e seus vizinhos. A camada 4 (superior) ´ respons´vel e apor planejar a trajet´ria a ser seguida pelo robˆ l´ o o ıder e, portanto, pelo grupo de robˆs. oA camada 3 possui um algoritmo para realizar o controle de forma¸˜o, cuja forma ´ ca edeterminada pelas medidas de distˆncia de um a dois outros robˆs, ou pela distˆncia e a o aˆngulo entre dois robˆs. Tal estrat´gia ´ classificada como l´a o e e ıder-seguidores pois cada robˆ odeve seguir outro (ou dois outros), e ´ muito similar `quela apresentada em (FIERRO et e aal., 2001). A camada 2 realiza o controle cinem´tico de cada robˆ, enquanto a camada a o1 ´ respons´vel pelo controle adaptativo de torque, que leva em considera¸˜o a dinˆmica e a ca ade cada ve´ ıculo. Os autores tamb´m mostram que o sistema em malha fechada ´ est´vel e e acom base na teoria de Lyapunov. S˜o apresentados apenas resultados de simula¸˜o para a caum grupo de dois robˆs. o Uma abordagem de controle descentralizado de forma¸˜o que considera os modelos cadinˆmicos dos robˆs do grupo ´ apresentada em (LAWTON; BEARD; YOUNG, 2003). a o e
  • 128. 132 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca aTal trabalho apresenta uma abordagem baseada em comportamentos para controlar ma-nobras de grupos de robˆs entre padr˜es de forma¸˜o. Os autores desenvolvem uma o o caestrat´gia baseada em dois objetivos que competem entre si: (1) movimentar os robˆs at´ e o eo ponto de destino e (2) manter a forma¸˜o durante o movimento. Para lidar com esses caobjetivos, foi proposta uma fun¸˜o de erro que leva em conta o erro de posi¸˜o de cada ca carobˆ e o erro de forma¸˜o do grupo, com pesos que podem ser ajustados. A estrat´gia de o ca econtrole proposta, chamada de dinˆmica acoplada, prevˆ que cada robˆ saiba as posi¸˜es a e o corelativas e desejadas de pelo menos dois outros robˆs integrantes da forma¸˜o, al´m de o ca econhecer ou estimar suas velocidades. A convergˆncia dos erros de controle a valores elimitados ´ provada com base na teoria de Lyapunov. e Estrat´gias para deslocamento de cargas atrav´s da coopera¸˜o entre dois robˆs m´veis e e ca o ode tipo uniciclo s˜o propostas e estudadas em (BRAGANCA, 2004). Para projeto do a ¸controlador, cujas sa´ ıdas s˜o tens˜es para os motores, ´ utilizado um modelo dinˆmico a o e asimplificado dos robˆs m´veis, que considera que o ponto de interesse e o centro de massa o odo robˆ coincidem com o ponto central do eixo virtual que une as rodas de tra¸˜o, e que o can˜o h´ varia¸˜o na dinˆmica do robˆ. A efic´cia do sistema de controle e das estrat´gias a a ca a o a epropostas para deslocamento das cargas ´ ilustrada por resultados de experimentos, mas eum estudo formal de estabilidade do sistema n˜o ´ apresentado. a e Em (De La CRUZ, 2006; De La CRUZ; CARELLI, 2006) foi proposta uma arquite-tura de controle centralizado de forma¸˜o de robˆs m´veis que leva em conta os modelos ca o odinˆmicos dos ve´ a ıculos da forma¸˜o. Foram desenvolvidos dois modelos cinem´ticos do ca asistema multirrobˆs, denominados de modelo cinem´tico de primeira ordem e modelo ci- o anem´tico de segunda ordem. O primeiro leva em conta apenas os modelos cinem´ticos a ados robˆs da forma¸˜o, enquanto o segundo leva em considera¸˜o seus modelos dinˆmicos, o ca ca acompensando os efeitos da dinˆmica de cada robˆ para gera¸˜o dos sinais de controle. a o caNeste sistema, o controlador de forma¸˜o deve conhecer o modelo dinˆmico de cada robˆ ca a odo grupo, cujos parˆmetros s˜o supostos constantes. Resultados experimentais s˜o apre- a a asentados usando um grupo de trˆs robˆs Pioneer. e o Neste contexto, este cap´ ıtulo aborda as arquiteturas de controle descentralizado ecentralizado de forma¸˜o, sempre com realiza¸˜o da compensa¸˜o da dinˆmica de um ou ca ca ca amais robˆs membros do grupo. Primeiro, na se¸˜o 4.3, ´ apresentado o caso do controle o ca e ca e ˜descentralizado de forma¸˜o, em que foi utilizada a estrat´gia proposta em (BRANDAO,2008), que trata do controle de uma estrutura l´ ıder-seguidor. O sistema original consideraapenas os modelos cinem´ticos dos robˆs. Ent˜o, o segundo controlador dinˆmico, pro- a o a aposto na subse¸˜o 3.3.2, ´ aqui agregado para realizar a compensa¸˜o da dinˆmica do robˆ ca e ca a o
  • 129. 4.3 Controle Descentralizado de uma Forma¸˜o L´ ca ıder-Seguidor 133seguidor. Resultados de simula¸˜o e de experimentos s˜o apresentados para ilustrarem a ca ainfluˆncia da compensa¸˜o da dinˆmica na redu¸˜o dos erros de forma¸˜o, considerando e ca a ca cao esquema de controle de forma¸˜o descentralizado tipo l´ ca ıder-seguidor. Em seguida, duas arquiteturas s˜o apresentadas para ilustrar o controle centralizado ade forma¸˜o. A primeira, apresentada na se¸˜o 4.4, ´ baseada no modelo cinem´tico de ca ca e aprimeira ordem proposto em (De La CRUZ; CARELLI, 2006) que, originalmente, n˜o aleva em conta os modelos dinˆmicos dos robˆs membros da forma¸˜o. A tal sistema a o cafoi agregado o primeiro controlador dinˆmico, apresentado na subse¸˜o 3.3.1, de forma a a carealizar a compensa¸˜o da dinˆmica dos robˆs sem que fosse necess´rio alterar a estrutura ca a o ade controle de forma¸˜o. Resultados de simula¸˜o s˜o mostrados. A segunda arquitetura, ca ca aapresentada na se¸˜o 4.5, ´ baseada no controle do centr´ide de uma estrutura virtual, ca e ocomo proposto em (MAS; PETROVIC; KITTS, 2008). A estrat´gia de controle proposta enaquele trabalho ´ baseada em controladores PID e n˜o leva em conta a dinˆmica dos robˆs e a a oda forma¸˜o. Aqui, prop˜e-se um controlador n˜o-linear de forma¸˜o compat´ com tal ca o a ca ıvelestrat´gia, e apresenta-se a an´lise de sua estabilidade. O segundo controlador dinˆmico, e a aapresentado na subse¸˜o 3.3.2, ´ utilizado para realizar a compensa¸˜o da dinˆmica de ca e ca atodos os robˆs, e sua influˆncia na redu¸˜o dos erros de controle de forma¸˜o ´ ilustrada. o e ca ca eResultados de simula¸˜o e de experimentos s˜o apresentados para este caso, e ilustram a ca ainfluˆncia da compensa¸˜o da dinˆmica considerando o esquema de controle centralizado e ca ade forma¸˜o tipo estruturas virtuais. ca4.3 Controle Descentralizado de uma Forma¸˜o L´ ca ıder- Seguidor Esta se¸˜o aborda a estrat´gia de controle descentralizado de forma¸˜o tipo l´ ca e ca ıder- ˜ ˜seguidor desenvolvida em (BRANDAO et al., 2007b; BRANDAO, 2008), em que n˜o ah´ troca de informa¸˜o entre os robˆs, e mostra um exemplo de utiliza¸˜o do segundo a ca o cacontrolador dinˆmico aqui proposto para compensar a dinˆmica do ve´ a a ıculo seguidor.4.3.1 Estrat´gia de Controle e Nesta estrat´gia, o robˆ l´ e o ıder segue uma trajet´ria pr´-definida, enquanto o robˆ o e oseguidor deve se manter em uma posi¸˜o fixa em rela¸˜o ao primeiro. A identifica¸˜o da ca ca caposi¸˜o e da orienta¸˜o do robˆ l´ ´ feita atrav´s da utiliza¸˜o de um sensor de varredura ca ca o ıder e e calaser (montado no seguidor) e de um padr˜o a ser identificado (montado no l´ a ıder). As
  • 130. 134 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca amedidas de distˆncia obtidas pelo robˆ seguidor s˜o suficientes para determina¸˜o das a o a ca a ca ˜vari´veis de forma¸˜o, conforme enunciado em (BRANDAO, 2008). No mesmo trabalhofoi proposta para o robˆ seguidor uma lei de controle de forma¸˜o baseada na cinem´tica o ca ainversa do sistema. A este sistema foi agregada a compensa¸˜o da dinˆmica do robˆ, ca a oatrav´s da utiliza¸˜o do segundo controlador dinˆmico aqui proposto, apresentado na e ca asubse¸˜o 3.3.2 (MARTINS et al., 2008). ca O desenvolvimento do controlador de forma¸˜o em quest˜o foi apresentado inicial- ca a ˜mente em (BRANDAO et al., 2007b), e ser´ reproduzido de forma resumida a seguir. a As vari´veis de forma¸˜o [ρLF βLF θLF ]T , que constituem o controle descentralizado a cade forma¸˜o, s˜o apresentadas na Figura 65. Tais vari´veis representam a distˆncia entre ca a a a o a o ıder em rela¸˜o ao seguidor (βLF ∈ (0◦ , 180◦ )), eos robˆs (ρLF ∈ R+ ), o ˆngulo do robˆ l´ cao erro de orienta¸˜o entre os robˆs (θLF ∈ [−90◦ , 90◦ ]). ca o ˜ Conforme desenvolvido em (BRANDAO, 2008), as equa¸˜es de estado do robˆ segui- co odor, baseadas nas vari´veis de forma¸˜o, s˜o dadas por a ca a   ρLF = uL sen (βLF − θLF ) − uF sen βLF  ˙   ˙ uL cos(βLF − θLF ) − uF cos βLF βLF = − ωF (4.1)   ρLF   ˙ θLF = ωL − ωF ,onde uL e uF s˜o as velocidades lineares e ωL e ωF s˜o as velocidades angulares do robˆ a a ol´ ıder (L) e do seguidor (F). Assim como em (CONSOLINI et al., 2007), o sistema decoordenadas do robˆ seguidor ´ adotado como referˆncia para o controle da estrutura o e el´ ıder-seguidor. Para o projeto do controlador cinem´tico de forma¸˜o foi considerada a cinem´tica a ca ainversa do sistema. Assim, tem-se que        ρLF ˙ − sen βLF 0 uL sen (βLF − θLF )  =   uF     cos βLF  +  u cos(β − θ ) , L LF LF (4.2) ˙ βLF − −1 ωF ρLF ρLF ˙ x vd g(x) q(x)onde x = [ρLF βLF ]T representa as vari´veis de forma¸˜o control´veis e vd representa os a ca asinais de controle. Com o objetivo de estabelecer uma lei de controle que fa¸a x → xd cpara t → ∞, e supondo que g(x) seja uma matriz invers´ ıvel, foi proposto que vd = g −1 (x)(η − q(x)), para η = x˙d + Kf (˜ ), x (4.3)
  • 131. 4.3 Controle Descentralizado de uma Forma¸˜o L´ ca ıder-Seguidor 135 Figura 65: Vari´veis de forma¸˜o e controle. a caonde K ´ uma matriz de ganhos definida positiva e f (˜ ) ´ uma fun¸˜o de satura¸˜o. e x e ca caPor fim, em malha fechada se obt´m que x + Kf (˜ ) = 0, onde x = xd − x ´ o vetor e ˙ ˜ x ˜ ede erro de forma¸˜o. Vale salientar que g(x) ´ invers´ se ρLF > 0 e βLF ∈ (0, 180◦ ). ca e ıvelComo ρLF ´ a distˆncia entre os robˆs, a condi¸˜o de singularidade nunca ocorrer´ para e a o ca aρLF = 0. No entanto, se o ˆngulo βLF de forma¸˜o entre os robˆs for igual a zero ou a a ca o180◦ , outra condi¸˜o de singularidade ocorre. Isso significa que o controlador proposto can˜o permite que os robˆs naveguem lado-a-lado. Tal fato n˜o chega a ser um fator de a o alimita¸˜o adicional, j´ que a detec¸˜o do robˆ l´ ca a ca o ıder ´ feita pelo sensor de varredura laser, eque est´ a bordo do robˆ seguidor e ´ capaz de medir distˆncias a objetos localizados a o e aapenas ` frente do robˆ, com um ˆngulo de abertura de 180◦ . Isso significa que o padr˜o a o a aa ser detectado e, portanto, o robˆ l´ o ıder, n˜o podem estar exatamente ao lado nem atr´s a ado robˆ seguidor. o A an´lise da estabilidade foi feita com uso da fun¸˜o candidata de Lyapunov V (˜ ) = a ca x1 T x x > 0, cuja derivada temporal ´ dada por V (˜ ) = −˜ T Kf (˜ ). ˜ ˜ e ˙ x x x2 [ ] [ ] tanh ρLF ˜ k1 0 Assumindo f (˜ ) = x eK= , sendo k1 > 0 e k2 > 0, ´ poss´ e ıvel ˜ tanh βLF 0 k2afirmar que V (˜ ) = −˜ T Kf (˜ ) < 0, ˙ x x x (4.4)isto ´, V ´ definida negativa. Logo, x→ 0 para t → ∞, ou, ainda, x → xd com t → ∞. e ˙ e ˜ Para a estrat´gia de controle de forma¸˜o abordada, xd = [ρLF d βLF d ]T ´ uma matriz e ca e
  • 132. 136 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca a Obstáculo Último Valor Primeiro Valor ° ° (90 ) (−90 ) Figura 66: Medidas do sensor de varredura laser utilizado no robˆ seguidor. oconstante, o que implica em xd = [0 0]T . Logo, os sinais de controle de (4.3) tornam-se ˙     uL sen (βLF − θLF ) − k1 tanh ρLF ˜ uF  sen βLF   = , (4.5) u sen θLF + k1 tanh ρLF cos βLF ˜  ωF L ˜ − k2 tanh βLF ρLF sen βLF ˜onde ρLF = ρLF d − ρLF e βLF = βLF d − βLF s˜o os erros das vari´veis de forma¸˜o. ˜ a a caAssume-se que βLF ∈ (0◦ , 180◦ ) e, portanto, pode-se verificar que vd ∈ L∞ . Tamb´m se eassume que vd ∈ L∞ , j´ que as acelera¸˜es do robˆ l´ ˙ a co o ıder s˜o limitadas. a Os valores das vari´veis de forma¸˜o [ρLF a ca βLF θLF ]T s˜o estimados a partir das amedidas da varredura do sensor laser instalado a bordo do robˆ seguidor, sendo a velo- o ıder estimada atrav´s de um Filtro de Kalman1 . Tal sensor informa ao robˆcidade do l´ e o181 medidas de distˆncia a obst´culos localizados adiante do robˆ, obtidas a cada grau, a a oconforme ilustra a Figura 66. Sobre o robˆ l´ o ıder da forma¸˜o foi montado um semicilindro de diˆmetro igual a ca a200mm para sua identifica¸˜o no ambiente, como ilustra a Figura 67(a). A Figura 67(b) cailustra as vari´veis de forma¸ao ρLF e βLF , cujos valores devem ser estimados a partir das a c˜medidas das distˆncias ρ1 e ρ2 , as quais s˜o tomadas, respectivamente, nos ˆngulos β1 e a a a ˜β2 da varredura laser. Em (BRANDAO, 2008) foi proposto um modelo simplificado paradeterminar os valores de βLF e θLF , dado por β1 + β2 βLF ≈ , (4.6) 2 θLF ≈ γ2 , (4.7) 1 Rudolf Emil Kalman nasceu em Budapeste, Hungria, em 19 de maio de 1930. Graduou-se em Enge-nharia El´trica pelo MIT, onde tamb´m obteve o t´ e e ´ ıtulo de Mestre. E doutor pela Columbia University,atuou como engenheiro da IBM e hoje ´ professor em´rito do Instituto Federal Su´co de Tecnologia. e e ı¸Alcan¸ou fama por sua coinven¸˜o de uma t´cnica matem´tica intensamente utilizada no campo da c ca e aEngenharia de Controle, conhecida como Filtro de Kalman (IEEE, Acesso em: 30/dez/2008).
  • 133. 4.3 Controle Descentralizado de uma Forma¸˜o L´ ca ıder-Seguidor 137 pr Líder (Leader) <L> ρLF ρ2 ρ1 β2 βLF β1 <F > Seguidor (Follower) (a) (b) Figura 67: (a) Representa¸˜o dos robˆs l´ ca o ıder (com o semicilindro no topo) e seguidor num ambiente de simula¸˜o. (b) Vari´veis de forma¸˜o e medidas do sensor laser. ca a ca ˜ Fonte: (BRANDAO, 2008).onde γ2 ´ o ˆngulo de rota¸˜o aparente do padr˜o, conforme este ´ “visto”pelo sensor e a ca a elaser. O valor de γ2 pode ser obtido a partir de ρ1 sen β1 − ρ2 sen β2 tan γ2 = . (4.8) ρ1 cos β1 − ρ2 cos β2 Com base nos valores aproximados de θLF e βLF , o valor de ρLF pode ser aproximadopor ρLF ≈ M∠βLF , (4.9)onde M ´ o vetor de medidas de distˆncia fornecidas pelo sensor laser. Ou seja, ρLF ´ e a eaproximadamente a medida de distˆncia obtida na posi¸˜o angular βLF do vetor M. a ca A Figura 68 ilustra as medidas do vetor M em fun¸˜o do ˆngulo de resolu¸˜o do ca a casensor durante a navega¸˜o de uma forma¸˜o linear com ρLF = 1m e βLF = 90◦ . Na ca caparte inferior da Figura 68 ´ apresentada a diferen¸a entre medidas angulares sucessivas e cdo perfil, destacando suas descontinuidades. A detec¸˜o do padr˜o se d´ atrav´s da ca a a eidentifica¸˜o de um pico negativo seguido de outro positivo (dentro de limiares assumidos), calevando-se em considera¸˜o a dimens˜o real do padr˜o, que ´ conhecida. Uma explica¸˜o ca a a e ca ˜mais detalhada pode ser encontrada em (BRANDAO, 2008). Nota 4.1 . A conclus˜o da an´lise de estabilidade apresentada para o controlador a ade forma¸˜o mostra que a lei de controle dada por (4.3) ´ capaz de fazer com que o robˆ ca e o
  • 134. 138 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca a Figura 68: Perfil das medidas do sensor laser no ambiente e a diferen¸a entre medidas c de distˆncia consecutivas. Fonte: (BRANDAO, a ˜ 2008). o ıder a a ´seguidor siga o robˆ l´ a uma distˆncia e ˆngulo desejados. E importante que se note quetal conclus˜o ´ v´lida para xd constante ou variante no tempo, ou seja, xd = xd (t). Isso a e asignifica que, se as equa¸˜es que geram os sinais de controle forem definidas considerando coxd = xd (t), a distˆncia e ˆngulo desejados de forma¸˜o podem variar durante a realiza¸˜o a a ca cada opera¸˜o de seguimento. ca ˜ Nota 4.2 . Foi observado em (BRANDAO, 2008) que ru´ ıdos nas medidas da varre-dura laser podem introduzir erros no c´lculo da dimens˜o do padr˜o. Tamb´m foi notado a a a eque, como o sensor de varredura laser faz medidas de distˆncia a intervalos discretos (a acada 1◦ ), nos casos em que a distˆncia entre os robˆs ´ muito maior que a dimens˜o do a o e apadr˜o, o erro no valor estimado pelo seguidor para a dimens˜o do padr˜o ´ grande, o a a a eque provoca degrada¸˜o no desempenho do sistema de controle de forma¸˜o. ca ca4.3.2 Compensa¸˜o da Dinˆmica do Robˆ Seguidor ca a o ˜ O controlador proposto em (BRANDAO, 2008) para uma forma¸˜o l´ ca ıder-seguidor,e apresentado de maneira suscinta na subse¸˜o 4.3.1, aborda somente o comportamento cacinem´tico dos robˆs que constituem a forma¸˜o. No caso da forma¸˜o l´ a o ca ca ıder-seguidor tra-tada, o controlador do robˆ seguidor gera comandos de forma a mantˆ-lo em forma¸˜o com o e cao l´ ıder, enquanto este executa um deslocamento desconhecido a priori. Conforme discu-tido e ilustrado no cap´ ıtulo 3, uma varia¸˜o nos valores dos parˆmetros dinˆmicos do robˆ ca a a opode provocar degrada¸˜o em seu desempenho. Neste contexto, foi adicionado ao robˆ ca oseguidor um controlador para compensar os efeitos de poss´ varia¸˜o em sua dinˆmica. ıvel ca a
  • 135. 4.3 Controle Descentralizado de uma Forma¸˜o L´ ca ıder-Seguidor 139 Robˆ o ρ LF d c νref νref ν ˙ x x Controlador Controlador y Dinâmica ˙ y 1 βLF d Descentralizado c ωref Dinâmico ωref ω Cinemática de Formação ˆ [θ] [θ] ψ˙ s ψ ρ LF βLF Sensoriamento Externo θLF (LASER) Figura 69: Estrutura de controle de forma¸˜o l´ ca ıder-seguidor com compensa¸˜o da ca dinˆmica (robˆ seguidor). a oA Figura 69 apresenta a estrutura de controle de forma¸˜o descentralizado implementada cano robˆ seguidor. Ao sistema apresentado na subse¸˜o anterior foi acrescentado um con- o catrolador para realizar a compensa¸˜o da dinˆmica do ve´ ca a ıculo. Foi utilizado o segundocontrolador dinˆmico, apresentado na subse¸˜o 3.3.2, que recebe os sinais de velocidades a cadesejadas gerados pelo controlador cinem´tico de forma¸˜o, realiza a compensa¸˜o da a ca cadinˆmica, e envia os sinais de comando para o robˆ seguidor. a o4.3.3 Resultados de Simula¸˜o ca Foram realizadas simula¸˜es para verificar o desempenho do sistema de controle des- cocentralizado de forma¸˜o l´ ca ıder-seguidor com compensa¸˜o da dinˆmica do robˆ segui- ca a odor. O sistema foi simulado com uso da plataforma de simula¸˜o MRSiM, descrita em ca ˜(BRANDAO et al., 2008). Al´m de simular os modelos dos robˆs e seu comportamento, e otal plataforma permite a simula¸˜o do ambiente (inclusive com obst´culos) e da intera¸˜o ca a caentre os robˆs. o Nas simula¸˜es realizadas foram utilizados dois robˆs, sendo um l´ co o ıder e um seguidor.Na base superior do robˆ l´ o ıder foi colocada uma estrutura semicil´ ındrica de dimens˜es oconhecidas, como mostrado na Figura 67(a). O robˆ seguidor deve identificar a posi¸˜o e o caorienta¸ao do robˆ l´ c˜ o ıder atrav´s das medidas realizadas por seu sensor de varredura laser, ecomo explicado na subse¸˜o 4.3.1, e estimar sua velocidade. Com base nesses dados, caexecuta o controle de forma¸˜o, de forma a obter ρLF d = 1m e βLF d = 90◦ . O robˆ ca ol´ ıder, por sua vez, se movimenta comandado por um controlador de posicionamento semorienta¸ao final. Devido a caracter´ c˜ ısticas do controlador adotado, sua velocidade variaconforme se desloca, diminuindo ao se aproximar do ponto de destino. Quando alcan¸a o cponto de destino, outro ponto ´ automaticamente designado, de forma que o robˆ l´ e o ıder se
  • 136. 140 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca a Figura 70: Caminho percorrido pelos robˆs l´ o ıder e seguidor.mant´m em marcha constantemente. Nas simula¸˜es executadas, o robˆ l´ e co o ıder partiu doponto (0, 0)m e foram definidos como destinos, nesta ordem, os pontos (5; 0)m, (10; 3)m,(15; 3)m, (15; 0)m, (10; 0)m, (5; 3)m, (0; 3)m e (0; 0)m. O caminho percorrido pelosrobˆs l´ o ıder e seguidor ´ ilustrado na Figura 70. e Para verificar o desempenho do sistema, os valores dos parˆmetros θ utilizados no acontrolador dinˆmico eram diferentes daqueles utilizados no modelo do robˆ, que corres- a oponderam aos parˆmetros do robˆ Pioneer 3-DX listados na se¸˜o 2.4. Os valores de a o caθ1 , θ2 , θ3 e θ5 utilizados no controlador correspondiam a um quinto daqueles usados nomodelo, enquanto θ4 e θ6 tinham os mesmos valores no controlador e no modelo do robˆ. oDuas simula¸˜es foram realizadas mantendo-se as mesmas condi¸˜es, inclusive os ganhos co codo controlador cinem´tico de forma¸˜o, apenas alterando o comportamento do controla- a cador dinˆmico utilizado. Em ambas, a sequˆncia de pontos de referˆncia enviada ao robˆ a e e ol´ ıder foi repetida trˆs vezes. e Na primeira simula¸˜o, o controlador dinˆmico estava desativado, n˜o sendo feita ca a acompensa¸˜o da dinˆmica do robˆ seguidor. A evolu¸˜o das vari´veis de forma¸˜o, para ca a o ca a caeste caso, ´ apresentada na Figura 71. Na segunda, o controlador dinˆmico estava ativado, e acom adapta¸˜o dos parˆmetros atrav´s da lei de adapta¸˜o com modifica¸˜o-σ, dada por ca a e ca ca(3.49). Nas Figuras 72(a) e 72(b) s˜o apresentadas as vari´veis de forma¸˜o e a evolu¸˜o a a ca cados parˆmetros estimados do robˆ seguidor para este caso. a o Os resultados apresentados nas figuras 71 e 72(a) s˜o similares, j´ que as vari´veis a a ade forma¸˜o permanecem variando durante todo o percurso simulado. Para efetuar a cacompara¸˜o entre os dois casos, foram calculados os ´ ca ındices de desempenho IAE - Integraldo valor Absoluto do Erro, para os erros de forma¸˜o entre os robˆs l´ ca o ıder e seguidor: IAEρ a ˜ a ca ˜para o erro de distˆncia ρLF , e IAEβ para o erro de ˆngulo de forma¸˜o βLF . Ambasas simula¸˜es tiveram a mesma dura¸˜o de, aproximadamente, 750s. Os valores de IAE co ca
  • 137. 4.3 Controle Descentralizado de uma Forma¸˜o L´ ca ıder-Seguidor 141 1.5 ρLF [m] 1 0.5 0 100 200 300 400 500 600 700 800 100 βLF [graus] 80 60 0 100 200 300 400 500 600 700 800 50 θLF [graus] 0 −50 0 100 200 300 400 500 600 700 800 tempo [s] Figura 71: Evolu¸˜o das vari´veis de forma¸˜o sem compensa¸˜o da dinˆmica. ca a ca ca a θ1 θ2 0.2 0.06 1.5 0.1 0.05 ρLF [m] 1 0 0.04 0 200 400 600 800 0 200 400 600 800 −3 θ3 θ4 0.5 x 10 0 100 200 300 400 500 600 700 800 1 1.05 100βLF [graus] 0 1 80 −1 0.95 0 200 400 600 800 0 200 400 600 800 60 0 100 200 300 400 500 600 700 800 −3 θ5 θ6 x 10 50 1 1.08θLF [graus] 0 0.5 1.078 −50 0 1.076 0 100 200 300 400 500 600 700 800 0 200 400 600 800 0 200 400 600 800 tempo [s] tempo [s] tempo [s] (a) (b) Figura 72: Forma¸˜o l´ ca ıder-seguidor - com compensa¸˜o da dinˆmica e adapta¸˜o de ca a ca parˆmetros. (a) Vari´veis de forma¸˜o; (b) Parˆmetros estimados do robˆ seguidor. a a ca a oobtidos em ambas simula¸˜es s˜o mostrados na tabela 1. co a Tabela 1: IAE para simula¸˜es do controle descentralizado tipo l´ co ıder-seguidor IAEρ IAEβ Sem compensa¸˜o da dinˆmica ca a 49,0 62,2 Com compensa¸˜o adaptativa da dinˆmica 47,2 ca a 59,6 Pode-se notar que a ativa¸˜o do controlador dinˆmico com adapta¸˜o de parˆmetros ca a ca aprovocou uma diminui¸˜o nos ´ ca ındices IAEρ e IAEβ , o que indica melhor desempenho.Em outras palavras, a compensa¸˜o da dinˆmica do robˆ seguidor com adapta¸˜o dos ca a o caparˆmetros estimados levou a menores erros de distˆncia e de ˆngulo de forma¸˜o, em a a a cam´dia. e
  • 138. 142 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca a Figura 73: Robˆs m´veis utilizados nos experimentos de controle de forma¸˜o o o ca l´ ˜ 2008). ıder-seguidor. Fonte: (BRANDAO, A redu¸˜o nos valores de IAE para o caso considerado foi de cerca de 4%. Esta can˜o ´ uma melhora t˜o expressiva quanto se poderia esperar, tendo em vista a redu¸˜o a e a cade 20 a 30% nos valores do ´ ındice IAE relatada na se¸˜o 3.6. Por isso, ´ importante ca eressaltar que os erros considerados naquela e nesta se¸˜es s˜o diferentes. O esquema de co acontrole de forma¸˜o l´ ca ıder-seguidor aqui apresentado possui outras fontes de erro que n˜o aestavam presentes na an´lise apresentada na se¸˜o 3.6, como erros de medi¸˜o de posi¸˜o a ca ca cae orienta¸˜o do l´ ca ıder, erros de estima¸˜o de sua velocidade e atraso provocado pelo filtro cade Kalman, por exemplo. Como mencionado na Nota 4.2, quando a distˆncia entre os arobˆs ´ muito maior que as dimens˜es do padr˜o (200mm), o erro de medi¸˜o pode ser o e o a cabastante grande. Tais fontes de erro fizeram com que a compensa¸˜o da dinˆmica, neste ca acaso, tivesse um impacto pequeno na redu¸˜o do valor do erro de forma¸˜o. ca ca4.3.4 Resultados Experimentais O desempenho do sistema de controle descentralizado de forma¸˜o l´ ca ıder-seguidor, come sem compensa¸˜o da dinˆmica, tamb´m foi comparado atrav´s de experimentos. Foram ca a e eutilizados dois robˆs, sendo um robˆ Pioneer 2-DX, como l´ o o ıder, e um Pioneer 3-DX comsensor de varredura laser, como seguidor. Na base superior do robˆ l´ o ıder foi colocada umaestrutura semicil´ ındrica de dimens˜es conhecidas. Os robˆs utilizados nos experimentos o os˜o mostrados na Figura 73. a
  • 139. 4.3 Controle Descentralizado de uma Forma¸˜o L´ ca ıder-Seguidor 143 Nos experimentos, o robˆ seguidor deve identificar a posi¸˜o e a orienta¸˜o do robˆ o ca ca ol´ ıder atrav´s das medidas realizadas por seu sensor de varredura laser, como explicado na esubse¸˜o 4.3.1, e estimar sua velocidade. Com base nesses dados, deve executar o controle cade forma¸˜o para obter ρLF d = 0, 7m e βLF d = 60◦ . O robˆ l´ ca o ıder, por sua vez, se movi-menta comandado por um controlador de posicionamento sem orienta¸˜o final, que realiza ca a e e ˜desvio de obst´culos atrav´s da t´cnica de desvio tangencial modificado (BRANDAO etal., 2007a). Devido `s caracter´ a ısticas do controlador utilizado, sua velocidade varia con-forme se desloca, diminuindo ao se aproximar de um obst´culo e do ponto de destino. aVale ressaltar que o algoritmo de desvio de obst´culos ´ executado somente pelo robˆ a e ol´ ıder, que ´ capaz de detect´-los atrav´s de seus sensores ultrassˆnicos. e a e o Foram realizados dois experimentos no mesmo ambiente, com a presen¸a de obst´culos. c aEm ambos os experimentos, a posi¸˜o inicial do robˆ l´ ´ (0, 0; −0, 7)m, e a do seguidor ca o ıder e´ (−0, 7; −0, 375)m. O robˆ l´e o ıder deve chegar ` posi¸˜o (6, 5; −4, 0)m. A diferen¸a entre a ca cos dois experimentos ´ que, no primeiro, foi utilizado apenas o controlador cinem´tico e ade forma¸˜o, sendo que a compensa¸˜o adaptativa da dinˆmica foi ativada somente no ca ca asegundo. A Figura 74 mostra o caminho percorrido pelo robˆ seguidor e o mapa do ambiente oobtido atrav´s das medi¸˜es do sensor de varredura laser. Os c´ e co ırculos azuis indicama posi¸˜o instantˆnea do robˆ seguidor a cada 5 segundos de experimento, enquanto os ca a oc´ ırculos negros indicam a posi¸˜o do l´ ca ıder (detectada pelo seguidor) nos mesmos instantes.Para deslocar-se da posi¸˜o inicial ` posi¸˜o final, o robˆ seguidor realiza desvio dos ca a ca oobst´culos existentes entre elas, como pode ser visto na figura. a No primeiro experimento, o controlador dinˆmico estava desativado, n˜o sendo feita a acompensa¸˜o da dinˆmica do robˆ seguidor. A evolu¸˜o das vari´veis de forma¸˜o, para ca a o ca a caeste caso, ´ apresentada na Figura 75. No segundo, o controlador dinˆmico estava ativado, e acom adapta¸˜o dos parˆmetros atrav´s da lei de adapta¸˜o com modifica¸˜o-σ, dada por ca a e ca ca(3.49). Nas Figuras 76(a) e 76(b) s˜o apresentadas as vari´veis de forma¸˜o e a evolu¸˜o a a ca ca a o ´ ados parˆmetros estimados do robˆ seguidor para este caso. E v´lido ressaltar que osparˆmetros utilizados no controlador dinˆmico iniciam com os valores identificados para a ao robˆ Pioneer 3DX. o Como ocorreu nas simula¸˜es, os resultados apresentados nas figuras 75 e 76(a) s˜o co asimilares, j´ que as vari´veis de forma¸˜o permanecem variando durante todo o percurso. a a caPara efetuar a compara¸˜o entre os dois casos, foram calculados os ´ ca ındices de desempenho a ˜ a ca ˜IAEρ para o erro de distˆncia ρLF , e IAEβ para o erro de ˆngulo de forma¸˜o βLF . Os
  • 140. 144 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca a 4000 3000 2000 1000 0 y [mm] −1000 −2000 −3000 −4000 −5000 −6000 −2000 0 2000 4000 6000 8000 10000 x [mm]Figura 74: Experimento de controle de forma¸˜o l´ ca ıder-seguidor: caminho percorrido pelo robˆ seguidor e mapa do ambiente obtido atrav´s das medi¸˜es do sensor de varredura o e co laser. 1.5 ρLF [m] 1 0.5 0 0 10 20 30 40 50 60 100 βLF [graus] 50 0 0 10 20 30 40 50 60 50 θLF [graus] 0 −50 0 10 20 30 40 50 60 Tempo [s]Figura 75: Experimento de controle de forma¸˜o l´ ca ıder-seguidor: evolu¸˜o das vari´veis ca a de forma¸˜o sem compensa¸˜o da dinˆmica. ca ca avalores de IAE obtidos em ambos os experimentos s˜o mostrados na tabela 2. a Tabela 2: IAE para experimentos do controle descentralizado tipo l´ ıder-seguidor IAEρ IAEβ Sem compensa¸˜o da dinˆmica ca a 3,98 12,71 Com compensa¸˜o adaptativa da dinˆmica 4,39 ca a 8,85 Pode-se notar que, nos experimentos realizados, a ativa¸˜o do controlador dinˆmico ca a
  • 141. 4.4 Primeiro Esquema de Controle Centralizado de Forma¸ao c˜ 145 θ1 θ2 1 0.268 1.5 0.5 0.268 ρLF [m] 1 0 0.268 0.5 0 20 40 60 0 20 40 60 −3 θ3 θ4 0 x 10 0 10 20 30 40 50 60 5 1 100βLF [graus] 0.5 50 0 0 0 20 40 60 0 20 40 60 0 0 10 20 30 40 50 60 −3 θ5 θ6 x 10 50 6 1.0565θLF [graus] 0 4 1.0565 −50 2 1.0565 0 10 20 30 40 50 60 0 20 40 60 0 20 40 60 Tempo [s] tempo [s] tempo [s] (a) (b) Figura 76: Experimento de controle de forma¸˜o l´ ca ıder-seguidor com compensa¸˜o da ca dinˆmica e adapta¸˜o de parˆmetros: (a) Vari´veis de forma¸˜o; (b) Parˆmetros a ca a a ca a estimados do robˆ seguidor. ocom adapta¸˜o de parˆmetros provocou diminui¸˜o de cerca de 30% no ´ ca a ca ındice IAEβ , mashouve um aumento de 10% no ´ ındice IAEρ . Ou seja, considerando-se os erros de forma¸˜o cacomo um todo, j´ que a redu¸˜o no erro de orienta¸˜o foi maior do que o aumento do a ca caerro de distˆncia, pode-se concluir que a compensa¸˜o da dinˆmica do robˆ seguidor levou a ca a oa menores erros de forma¸˜o, em m´dia. Como comentado na subse¸˜o 4.3.3, o erro de ca e caforma¸˜o do esquema l´ ca ıder-seguidor aqui apresentado ´ influenciado por v´rias fontes de e aerro. Por isso, a compensa¸˜o da dinˆmica, neste caso, teve um impacto pequeno na ca aredu¸˜o do erro de forma¸˜o. ca ca4.4 Primeiro Esquema de Controle Centralizado de Forma¸˜o ca Os controladores centralizados de forma¸˜o propostos por De La CRUZ (2006) foram cadesenvolvidos com base nos modelos cinem´ticos de primeira ordem e de segunda ordem ado sistema multirrobˆs, apresentados no mesmo trabalho. Tais modelos s˜o explicados o anas se¸˜es seguintes. co
  • 142. 146 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca a (a) (b) Figura 77: Duas formas de se definir as vari´veis de forma¸˜o (De La CRUZ, 2006). a ca4.4.1 Modelo Cinem´tico de um Sistema Multirrobˆs a o Os modelos cinem´ticos de primeira e de segunda ordens propostos em (De La CRUZ, a2006) descrevem a varia¸˜o da forma¸˜o dos robˆs no tempo. Foram definidos os vetores ca ca oz1 , que cont´m um conjunto de vari´veis que descrevem o aspecto, a posi¸˜o e a orienta¸˜o e a ca cada forma¸˜o, e z2 = z1 . Essas vari´veis que definem a forma¸˜o e suas derivadas s˜o ca ˙ a ca adenominadas de vari´veis de forma¸˜o. a ca O vetor z1 pode ser definido de v´rias formas. Dois exemplos de defini¸˜o para tal a cavetor s˜o z1 = [x1 , y 1 , l2 , α2 , l3 , α3 , l4 , α4 ]T , que representa a forma¸˜o apresentada a cana Figura 77(a), e z1 = [x1 , y 1 , l12 , α12 , l23 , α23 , l34 , α34 ]T , que representa a forma¸˜o caapresentada na Figura 77(b). Outras defini¸˜es, que levam em conta a posi¸˜o do centr´ide co ca oda forma¸˜o, s˜o apresentadas em (De La CRUZ, 2006). Como pode ser visto nas figuras, ca ax1 e y 1 definem a posi¸˜o do robˆ 1 no plano cartesiano, em ambos os casos. Na forma¸˜o ca o camostrada na Figura 77(a), as posi¸˜es dos demais robˆs s˜o dadas pelas vari´veis li e αi , co o a aque definem a posi¸˜o do i-´simo robˆ em rela¸˜o ao robˆ 1. Na forma¸˜o mostrada na ca e o ca o caFigura 77(b), a posi¸˜o de cada robˆ na forma¸˜o ´ definida em rela¸˜o ` posi¸˜o do robˆ ca o ca e ca a ca oanterior, como ilustrado. Logo, para ambos os casos pode-se considerar que a posi¸˜o da caforma¸˜o ´ dada por x1 e y 1 , enquanto as demais vari´veis definem seu aspecto. ca e a No modelo de primeira ordem do sistema multirrobˆs, o vetor de estados de forma¸˜o o caz pode ser dado por z = z1 . Definiu-se um vetor ξ de estados de forma¸˜o trivial como casendo um vetor que cont´m a posi¸˜o de cada robˆ da forma¸˜o no plano cartesiano, e ca o caou seja, ξ = [x1 , y 1 , x2 , y 2 , ... xn , y n ]T . Seja hi = [xi , y i ]T o vetor que determina a
  • 143. 4.4 Primeiro Esquema de Controle Centralizado de Forma¸ao c˜ 147posi¸˜o do i-´simo robˆ da forma¸˜o. Portanto, o modelo cinem´tico de primeira ordem ca e o ca ado sistema multirrobˆs ´ dado por (De La CRUZ, 2006) o e ˙ ξ = µ + Π, (4.10) ˙r ˙ronde ξ = [(h1 )T ... (hn )T ]T ´ o vetor de estados de forma¸˜o trivial, µ = [(h1 )T ... (hn )T ]T e ca´ a entrada do sistema, dada pelas velocidades de referˆncia de cada robˆ, e Π ´ um vetore e o ede perturba¸˜o que cont´m as diferen¸as entre as velocidades real e de referˆncia de cada ca e c erobˆ. o No modelo de segunda ordem, o vetor de estados de forma¸˜o z pode ser dado por caz = [z1 z2 ]T . Nesse caso, o modelo ´ expresso em termos dos modelos dinˆmicos lineari- e azados por realimenta¸˜o entrada-sa´ de cada robˆ, sendo o do i-´simo robˆ dado por ca ıda o e o¨hi = υ i + η i , onde υ i ´ a entrada de seu modelo linearizado (fun¸˜o da acelera¸˜o dese- e ca cajada e dos erros de posi¸˜o e de velocidade) e η i ´ um vetor de perturba¸˜o. Logo, este ca e camodelo tem impl´ ıcitas as caracter´ ısticas dinˆmicas de cada robˆ membro da forma¸˜o. O a o camodelo cinem´tico de segunda ordem do sistema multirrobˆs ´ a o e ¨ ξ = µ 2 + Π2 , (4.11)onde µ2 = [(υ 1 )T ... (υ n )T ]T ´ a entrada do sistema, Π2 = [(η 1 )T ... (η n )T ]T ´ o vetor e ede perturba¸˜o e ξ = [(h1 )T ... (hn )T ]T . O vetor de estados de forma¸˜o trivial para este ca ca ˙modelo ´ dado por [(ξ)T (ξ)T ]T . e Mais informa¸˜es sobre o modelo cinem´tico de segunda ordem s˜o apresentadas em co a a(De La CRUZ, 2006). O desenvolvimento apresentado a seguir faz uso do modelo ci-nem´tico de primeira ordem, j´ que a compensa¸˜o da dinˆmica de cada robˆ ser´ reali- a a ca a o azada localmente, e n˜o pelo controlador centralizado. a4.4.2 Transforma¸˜o de coordenadas ca Para expressar o modelo do sistema multirrobˆs em termos do vetor de estados de oforma¸˜o z, ´ realizada uma transforma¸˜o de coordenadas atrav´s de um mapeamento ca e ca esuave φ1 de ξ a z1 , tal que a inversa φ−1 exista e seja suave. Ou seja, 1 z = φ1 (ξ) = φ(ξ), (4.12)onde z = z1 . O mapeamento φ define um difeomorfismo, j´ que φ−1 existe e ´ suave. a 1 e
  • 144. 148 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca aPortanto, ξ = φ−1 (z1 ) = φ−1 (z), 1 (4.13) Derivando-se a equa¸˜o (4.13), tem-se que ca ˙ ∂φ−1 (z1 ) 1 1 ξ = J(z1 )˙ 1 = z z , ˙ (4.14) ∂z1onde J(z1 ) ´ a matriz Jacobiana2 . e Substituindo a equa¸˜o (4.10), do modelo cinem´tico de primeira ordem, na equa¸˜o ca a ca(4.14), e supondo que J(z)−1 existe, obt´m-se o modelo cinem´tico de primeira ordem em e afun¸˜o das novas coordenadas, ou seja, ca z = J(z)−1 µ + J(z)−1 Π, ˙ (4.15)onde z ´ o vetor de estados da forma¸˜o. e ca A transforma¸˜o de coordenadas para o modelo cinem´tico de segunda ordem ´ apre- ca a esentada em (De La CRUZ, 2006), que tamb´m mostra um exemplo de aplica¸˜o. e ca4.4.3 Lei de Controle A lei de controle de forma¸˜o ca µ = J(z) (K(˜) + zd ) z ˙ (4.16)foi proposta por De La CRUZ (2006), baseada no modelo cinem´tico de primeira ordem ado sistema multirrobˆs. Nela, z = z1 ´ o vetor de estados de forma¸˜o, zd = z1 ´ o vetor o e ca d ede estados que caracteriza a forma¸˜o desejada, ˜ = zd − z ´ o vetor de erro de forma¸˜o, ca z e ca ˙r ˙rµ = [(h1 )T ... (hn )T ]T ´ a entrada do sistema multirrobˆs, dada por velocidades de e oreferˆncia, e K(·) ´ uma fun¸˜o de satura¸˜o projetada de maneira que xT K(x) seja e e ca cadefinida positiva globalmente, com x ∈ R2n . Substituindo a lei de controle (4.16) na equa¸˜o do modelo (4.15) obt´m-se a equa¸˜o ca e cado sistema em malha fechada, dada por −J(z)−1 Π = K(˜) + ˜. z ˙ z (4.17) 2 A matriz formada pelas derivadas parciais de primeira ordem de uma fun¸˜o vetorial ´ denominada ca ede Matriz Jacobiana em homenagem ao matem´tico alem˜o Karl Gustav Jacob Jacobi (10/12/1804 - a a18/02/1851), em reconhecimento ao seu trabalho em prol do desenvolvimento da matem´tica anal´ a ıtica(Biography Base, Acesso em: 16/jan/2009).
  • 145. 4.4 Primeiro Esquema de Controle Centralizado de Forma¸ao c˜ 149 Considerou-se K(˜) = Kc˜, sendo z z   kG1 aG +|ez1 | 0 ... 0    0 kG2 ... 0   aG +|ez2 |  Kc =  . . .. . , (4.18)  . . . . . . .    kG(2n) 0 0 ... aG +|ez(2n) |onde ezi ´ o i-´simo elemento do vetor ˜, aG > 0 e kGi > 0 para i = 1, 2, . . . , 2n. e e z 1Considerando-se a fun¸˜o candidata de Lyapunov V = 2 ˜T ˜, sua derivada temporal ´ ca z z edada por V = −˜T Kc˜ − ˜T J(z)−1 Π. ˙ z z z (4.19) Uma condi¸˜o suficiente para que (4.19) seja definida negativa ´ que ca e minj (kGj ) ˜ z 2 > ˜ z − J(z)−1 Π , aG + ˜ zou aG − J(z)−1 Π ˜ > z . (4.20) minj (kGj ) − − J(z)−1 Π A equa¸˜o (4.20) ´ v´lida se minj (kGj ) > −J(z)−1 Π , ou se tal condi¸˜o ´ verificada ca e a ca enum tempo finito (De La CRUZ, 2006). Considerando-se o vetor de perturba¸˜o Π calimitado, verifica-se que existe um entorno da origem, limitado, dentro do qual se manter´ ao vetor de erros de forma¸˜o ˜. Se o vetor de perturba¸˜o ´ considerado nulo, ent˜o ca z ca e averifica-se que z → zd com t → ∞. ´ a E v´lido enfatizar que o controlador dado pela equa¸˜o (4.16) ´ capaz de seguir uma ca eforma¸˜o desejada continuamente variante no tempo. ca Para realizar o controlador de forma¸˜o foi utilizado o mapeamento φ1 escalon´vel ca aproposto em (De La CRUZ, 2006), apresentado a seguir. O vetor de estados de forma¸˜o catrivial ξ ´ dado por e [( ) ( ) ]T [ ]T 1 T 2 T n T ξ= h h . . . (h ) = x1 y 1 x2 y 2 . . . x n y n . (4.21) Define-se as vari´veis de forma¸˜o da maneira ilustrada na Figura 78, obtendo-se o a camapeamento dado por z1 = φ1 (ξ) = [x1 y 1 l2 α2 . . . ln αn ]T , (4.22)
  • 146. 150 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca a Figura 78: Defini¸˜o das vari´veis de forma¸˜o (De La CRUZ, 2006). ca a caonde √ li = (xi − x1 )2 + (y i − y 1 )2 αi = fζi (xi − x1 , y i − y 1 ),sendo fζi (x, y) uma fun¸˜o para calcular o ˆngulo do vetor (x, y), e i = 2, 3, . . . , n. ca a O mapeamento inverso ξ = φ−1 (z1 ) ´ dado por 1 e x 1 = x1 y1 = y1 xi = x1 + li cos (αi ), i = 2, 3, . . . , n y i = y 1 + li sin (αi ), i = 2, 3, . . . , n. De acordo com a equa¸˜o (4.14), a matriz J(z1 ) resulta ca em   I 0 0 0 ... 0 0  2×2  I 0   2×2 J S2 0 0 . . . 0    J(z ) = I2×2 0 J S3 0 . . . 0 1  0 ,  (4.23)  . . . . .. . .   . . . . . . .   . . . . . .  I2×2 0 0 0 . . . 0 J Sn
  • 147. 4.4 Primeiro Esquema de Controle Centralizado de Forma¸ao c˜ 151onde I2×2 ´ a matriz identidade 2 × 2 e e [ ] cos αi −li sin αi J Si = , i = 2, 3, . . . , n. (4.24) sin αi li cos αi As vari´veis de forma¸˜o atuais z1 e desejadas z1 para o i-´simo robˆ s˜o definidas a ca i id e o acomo [ ] [ ] x1 x1 d z1 = 1 , z1 = 1d , (4.25) 1 1 y yd [ ] [ ] li lid z1 = i , z1 = id , i = 2, 3, . . . , n, (4.26) αi αid ˜1 = z1 − z1 , zi id i i = 1, 2, . . . , n, (4.27)onde ˜1 representa o erro de forma¸˜o para o i-´simo robˆ. Considerando-se a fun¸˜o de zi ca e o casatura¸˜o (4.18), a lei de controle de forma¸˜o baseada no modelo cinem´tico de primeira ca ca aordem (4.16) pode ser expressa como   S1 , i = 1 ˙r hi = (4.28)  S1 + J Si Si , i = 2, 3, . . . , n,sendo Si = Kci˜1 + z1 , zi ˙ id i = 1, 2, . . . , n, (4.29)onde Kci ´ uma submatriz da matriz Kc , definida como e   kG(2i−1) 0 Kci =  G z(2i−1) . a +|e | kG(2i) (4.30) 0 aG +|ez(2i) | Vale mencionar que o mapeamento φ1 selecionado resulta em express˜es da matriz oJacobiana que permitem que a lei de controle seja facilmente modificada caso o n´mero ude robˆs da forma¸˜o varie (De La CRUZ, 2006). o ca4.4.4 Compensa¸˜o da Dinˆmica dos Robˆs da Forma¸˜o ca a o ca No sistema proposto em (De La CRUZ, 2006), e apresentado de forma resumida nestase¸˜o, ´ necess´rio usar o controlador baseado no modelo cinem´tico de segunda ordem ca e a ado sistema multirrobˆs, que tem impl´ o ıcita a dinˆmica de cada robˆ, para se efetuar a a ocompensa¸˜o da dinˆmica dos robˆs membros da forma¸˜o. No entanto, a aplica¸˜o ca a o ca ca
  • 148. 152 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca a (a) (b) Figura 79: Arquiteturas de controle centralizado de forma¸˜o: (a) compensa¸˜o da ca cadinˆmica dos robˆs realizada pelo agente de controle centralizado; e (b) compensa¸˜o da a o ca dinˆmica realizada por cada robˆ membro da forma¸˜o. a o cados controladores dinˆmicos desenvolvidos no Cap´ a ıtulo 3 permite que a compensa¸˜o da cadinˆmica dos robˆs seja realizada por cada robˆ, e que seja aplicado o controlador de a o oforma¸˜o baseado no modelo cinem´tico de primeira ordem, que ´ mais simples. Isso ca a esignifica que o controlador de forma¸˜o, neste caso, n˜o precisa ter conhecimento do ca amodelo dinˆmico de cada robˆ, como ´ o caso do controlador proposto em (De La CRUZ, a o e2006). De fato, a aplica¸˜o dos controladores dinˆmicos apresentados no Cap´ ca a ıtulo 3permite que a compensa¸˜o da dinˆmica de cada robˆ seja realizada pelo mesmo agente ca a oque realiza o controle da forma¸˜o, como ilustrado na Figura 79(a), ou por cada robˆ de ca oforma independente, como mostra a Figura 79(b), o que deixa o sistema mais flex´ ıvel. Vale ressaltar que a aplica¸˜o dos controladores dinˆmicos apresentados na se¸˜o ca a ca3.3 permite que os parˆmetros identificados tenham seus valores ajustados com base em auma das leis de adapta¸˜o propostas nas subse¸˜es 3.3.1.1 e 3.3.2.1. Esta caracter´ ca co ısticagarante adapta¸˜o a modifica¸˜es na dinˆmica dos robˆs membros da forma¸˜o, causadas, ca co a o capor exemplo, por execu¸˜o de uma tarefa de transporte de carga de forma compartilhada, caem que ocorre varia¸˜o de massa de cada robˆ quando ele est´ carregado ou descarregado. ca o a
  • 149. 4.4 Primeiro Esquema de Controle Centralizado de Forma¸ao c˜ 153 Erros de formação 0.8 0.6 x1−x1 [m] d 1 1 0.4 yd−y [m] 0.2 Trajetória percorrida 0.8 0 Robô 1 0.6 Robô 2 −0.2 0 2 4 6 8 10 12 14 16 18 Tempo [s] 0.4 0.5y [m] 0.2 0 0 l2d−l2 [m] −0.5 α2d−α2 −0.2 −1 −0.4 −1.5 −0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 0 2 4 6 8 10 12 14 16 18 x [m] Tempo [s] (a) (b) Figura 80: Controle centralizado de forma¸˜o: (a) trajet´ria percorrida pelos robˆs; e ca o o (b) evolu¸˜o dos erros de forma¸˜o durante a primeira simula¸˜o. ca ca ca4.4.5 Resultados de Simula¸˜o ca Foram realizadas duas simula¸˜es do sistema utilizando o controlador centralizado de coforma¸˜o baseado no modelo cinem´tico de primeira ordem do sistema multirrobˆs, dado ca a opela equa¸˜o (4.28), incluindo a compensa¸˜o da dinˆmica dos robˆs. Nestas simula¸˜es ca ca a o coa compensa¸˜o da dinˆmica foi realizada com uso do primeiro controlador dinˆmico, ca a aproposto na subse¸˜o 3.3.1. ca Duas simula¸˜es foram executadas, sempre com dois robˆs. Na primeira delas, um dos co orobˆs (denominado de robˆ 1) parte da posi¸˜o (0, 0; 0, 0)m, enquanto o outro (robˆ 2) o o ca oparte do ponto (0, 0; 0, 6)m. Ambos devem se deslocar em linha reta, paralela ao eixo X,sendo a forma¸˜o desejada caracterizada por l2d = 1m e α2d = 23◦ . A Figura 80(a) ilustra caa trajet´ria percorrida por ambos os robˆs. Nesta figura, o caminho percorrido pelo robˆ o o o1 ´ representado por uma linha cont´ e ınua, enquanto o caminho percorrido pelo robˆ 2 ´ o erepresentado por uma linha tracejada. A cada dois segundos as posi¸˜es instantˆneas dos co arobˆs s˜o marcadas por um c´ o a ırculo. Pode-se notar que o robˆ 2 ´, inicialmente, acelerado o ede forma que a forma¸˜o desejada seja atingida. Em seguida, ambos os robˆs passam a ca ose deslocar com a mesma velocidade, mantendo a forma¸˜o. ca Na Figura 80(b) s˜o apresentados os valores de erro de forma¸˜o dos robˆs 1 (figura a ca osuperior) e 2 (figura inferior) durante a primeira simula¸˜o. A figura mostra que os erros cadecrescem e permanecem pr´ximos a zero durante o deslocamento dos robˆs. A evolu¸˜o o o cano tempo dos valores estimados dos parˆmetros dinˆmicos dos robˆs 1 e 2 ´ mostrada nas a a o e
  • 150. 154 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca a θ1 θ2 θ1 θ2 0.232 0.8 0.45 0.144 0.4 0.23 0.6 0.142 0.35 0.228 0.4 0.14 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 θ3 θ4 θ3 θ4 0.02 1.05 0.02 1.05 0 1 0 1−0.02 0.95 −0.02 0.95 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 θ5 θ6 θ5 θ6 2 1.08 0.0156 0.988 0 0.0155 0.987 −2 1.0799 0.0155 0.986 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 tempo [s] tempo [s] tempo [s] tempo [s] (a) (b) Figura 81: Controle centralizado de forma¸˜o: evolu¸˜o dos parˆmetros dinˆmicos dos ca ca a a robˆs (a) 1 e (b) 2 durante a primeira simula¸˜o. o cafiguras 81(a) e 81(b). Na segunda simula¸˜o, os robˆs partem das mesmas posi¸˜es iniciais anteriores, ou ca o coseja, (0, 0; 0, 0)m para o robˆ 1 e (0, 0; 0, 6)m para o robˆ 2. Ambos devem seguir o ouma trajet´ria que descreve, inicialmente, um arco no sentido anti-hor´rio e, em seguida, o auma linha reta paralela ao eixo Y. A forma¸˜o desejada ´ caracterizada por l2d = 1m ca ee α2d = 23◦ + ψ1 , onde ψ1 representa a orienta¸˜o do robˆ 1 em rela¸˜o ao sistema ca o cafixo de coordenadas. A Figura 82(a) ilustra a trajet´ria percorrida por ambos os robˆs. o oO caminho percorrido pelo robˆ 1 ´ representado por uma linha cont´ o e ınua, enquanto ocaminho percorido pelo robˆ 2 ´ representado por uma linha tracejada. A cada dois o esegundos as posi¸˜es instantˆneas dos robˆs s˜o marcadas por um c´ co a o a ırculo. Pode-se notarque o robˆ 2 ´, inicialmente, acelerado de forma que a forma¸˜o desejada seja atingida. o e caEm seguida, ambos os robˆs passam a descrever o arco, sendo que a forma¸˜o desejada o ca´ mantida pelo controlador centralizado, fazendo com que ambos os robˆs se desloqueme ocom a mesma velocidade. Na Figura 82(b) s˜o apresentados os valores de erro de forma¸˜o dos robˆs 1 (figura a ca osuperior) e 2 (figura inferior) durante a segunda simula¸˜o. A figura mostra que os erros cadecrescem e permanecem pr´ximos a zero durante o deslocamento dos robˆs, mesmo o odurante a descri¸˜o do arco. A evolu¸˜o no tempo dos valores estimados dos parˆmetros ca ca adinˆmicos dos robˆs 1 e 2 s˜o mostrados nas figuras 83(a) e 83(b). a o a Os resultados de ambas as simula¸˜es ilustram que o primeiro controlador dinˆmico, co a
  • 151. 4.4 Primeiro Esquema de Controle Centralizado de Forma¸ao c˜ 155 Trajetória percorrida 5 4.5 Robô 1 Erros de formação 4 Robô 2 0.8 0.6 x1−x1 [m] d 3.5 0.4 1 1 yd−y [m] 3 0.2 2.5 0y [m] −0.2 2 0 5 10 15 20 25 30 35 40 Tempo [s] 1.5 0.5 1 0 0.5 −0.5 l −l [m] 2d 2 α −α −1 2d 2 0 −1.5 −0.5 0 0.5 1 1.5 2 2.5 3 3.5 0 5 10 15 20 25 30 35 40 x [m] Tempo [s] (a) (b) Figura 82: Controle centralizado de forma¸˜o: (a) trajet´ria percorrida pelos robˆs; e ca o o (b) evolu¸˜o dos erros de forma¸˜o durante a segunda simula¸˜o. ca ca ca θ1 θ2 θ1 θ2 0.4 0.4 0.8 0.16 0.35 0.3 0.6 0.15 0.2 0.4 0 10 20 30 40 0 10 20 30 40 0 10 20 30 40 0 10 20 30 40 θ3 θ4 θ3 θ4 0.02 1.05 0.02 1.05 0 1 0 1−0.02 0.95 −0.02 0.95 0 5 10 15 20 0 10 20 30 40 0 5 10 15 20 0 10 20 30 40 −3 θ θ θ θ6 x 10 5 6 5 0 1.2 0.018 1.05 −2 1.1 0.016 1 −4 1 0.014 0.95 0 10 20 30 40 0 10 20 30 40 0 10 20 30 40 0 10 20 30 40 tempo [s] tempo [s] tempo [s] tempo [s] (a) (b) Figura 83: Controle centralizado de forma¸˜o: evolu¸˜o dos parˆmetros dinˆmicos dos ca ca a a robˆs (a) 1 e (b) 2 durante a segunda simula¸˜o. o cadesenvolvido na subse¸˜o 3.3.1, pode ser utilizado para compensar a dinˆmica de robˆs ca a omembros de um grupo sob controle centralizado de forma¸˜o baseado no modelo ci- canem´tico de primeira ordem. Por serem adaptativos, os controladores dinˆmicos pro- a amovem, ainda, ajuste nos valores dos parˆmetros estimados de forma a compensarem aposs´ ıveis mudan¸as na dinˆmica dos robˆs, o que n˜o ´ realizado pelo controlador de c a o a e
  • 152. 156 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca aforma¸˜o baseado no modelo cinem´tico de segunda ordem proposto em (De La CRUZ; ca aCARELLI, 2006).4.5 Segundo Esquema de Controle Centralizado de Forma¸˜o ca A abordagem proposta por De La CRUZ (2006) para realiza¸˜o de controle de forma¸˜o ca cacom compensa¸ao da dinˆmica envolve o modelo cinem´tico de segunda ordem do sis- c˜ a atema multirrobˆs. Na se¸˜o 4.4 foi mostrado que ´ poss´ realizar a compensa¸˜o da o ca e ıvel cadinˆmica dos robˆs da forma¸˜o utilizando um dos controladores dinˆmicos apresenta- a o ca ados no Cap´ ıtulo 3 em conjunto com o modelo cinem´tico de primeira ordem do sistema amultirrobˆs, que ´ mais simples. Esta se¸˜o apresenta outro esquema de controle cen- o e catralizado de forma¸˜o baseado em estruturas virtuais, que tamb´m permite o uso de um ca edos controladores dinˆmicos apresentados no Cap´ a ıtulo 3. Tal esquema ´ similar ao que efoi proposto em (FIERRO; DAS, 2002), em que cada camada funciona como um m´dulo oindependente que lida com uma parte espec´ ıfica do problema de controle de forma¸˜o de carobˆs. A se¸˜o tamb´m mostra o projeto e an´lise de estabilidade de um controlador de o ca e aforma¸˜o, al´m de resultados de simula¸˜o e de experimentos. ca e ca4.5.1 Esquema Multicamadas Com o intuito de modularizar o sistema e aumentar sua flexibilidade, nesta se¸˜o ´ ca e ˜introduzido o Esquema Multicamadas, proposto em (BRANDAO et al., 2009a) e ilustradona Figura 84. Suas principais caracter´ ısticas s˜o: a • Camadas de Planejamento Off-line e Planejamento On-line: a primeira ´ res- e pons´vel pelas condi¸˜es iniciais, gera¸˜o da trajet´ria a ser seguida e defini¸˜o a co ca o ca da forma desejada para a estrutura virtual (forma¸˜o dos robˆs). A segunda tem ca o como objetivo alterar os sinais de referˆncia gerados pela primeira, realizando um e ajuste momentˆneo de maneira que o robˆ, ou a forma¸˜o, reajam de acordo com a o ca a informa¸˜o obtida por seus sensores sobre o ambiente, por exemplo realizando ca desvio de obst´culos. a • Camada de Controle: respons´vel pela gera¸˜o dos sinais de controle a serem envi- a ca ados ao robˆ ou aos robˆs da forma¸˜o, de modo que sejam atingidas as referˆncias o o ca e enviadas pelas Camadas de Planejamento.
  • 153. 4.5 Segundo Esquema de Controle Centralizado de Forma¸ao c˜ 157 Figura 84: Arquitetura do Esquema Multicamadas proposto. • Camada de Compensa¸˜o Dinˆmica: realiza a compensa¸˜o adaptativa da dinˆmica ca a ca a de cada robˆ de forma que estes sejam capazes de seguir as velocidades de referˆncia o e enviadas pela Camada de Controle com o menor erro poss´ ıvel. • Camada do Robˆ: representa o robˆ ou os robˆs da forma¸˜o a ser controlada. o o o ca • Ambiente: representa o meio que cerca o robˆ ou a forma¸˜o, incluindo a intera¸˜o o ca ca com os demais robˆs, obst´culos, etc. o a Uma importante caracter´ ısica do esquema de controle proposto ´ a independˆncia de e ecada camada, o que significa que modifica¸˜es em uma camada espec´ co ıfica n˜o provocam amudan¸as estruturais nas demais camadas. Como exemplo, diferentes controladores de cforma¸˜o ou de compensa¸˜o dinˆmica podem ser testados sem que as demais camadas ca ca asejam modificadas. Al´m disso, a estrutura b´sica do esquema proposto pode ser alterada, e apor exemplo, atrav´s da retirada de camadas que n˜o sejam necess´rias a determinada e a aaplica¸˜o. Por exemplo, a Camada de Planejamento On-line pode ser descartada caso n˜o ca aexistam obst´culos no ambiente em que os robˆs ir˜o navegar, caso em que a referˆncia a o a egerada pela Camada de Planejamento Off-line deve ser enviada diretamente ` Camada a
  • 154. 158 4 Controle de Sistemas Multirrobˆs com Compensa¸˜o da Dinˆmica o ca ade Controle. Considerando o controle de forma¸˜o, alguns blocos foram adicionados aos j´ explica-