Your SlideShare is downloading. ×
Aprendizaje  resumen jc cabrera temas 1-9
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Aprendizaje resumen jc cabrera temas 1-9

5,823

Published on

0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
5,823
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
159
Comments
0
Likes
4
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. PSICOLOGIA PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Juan Carlos Cabrera Valderrama Cádiz 2009-2010Descargado del campus, http://campus.felizmente.info
  • 2. Descargado del campus, http://campus.felizmente.info
  • 3. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos Cabrera - 2009/2010Antecedentes históricos- Desarrollo histórico del estudio de la mente.- Desarrollo histórico del estudio de los reflejos.El amanecer de la nueva era- La cognición comparada y la evolución de la inteligencia.- Neurología funcional.- Modelos animales de la conducta humana.- Modelos animales y robótica.Definición de aprendizaje:- La distinción entre aprendizaje y ejecución.- El aprendizaje y otras fuentes de cambion conductual.- Diferentes tipos de mecanismos causales.Aspectos metodológicos del estudio del aprendizaje- El aprendizaje como ciencia experimental.- La perspectiva de proceso general en el estudio del aprendizaje.Uso de animales no humanos en la investigación sobre aprendizaje- Razones del uso de animales no humanos en la investigación sobre aprendizaje.- Los animales de laboratorio y la conducta normal.- El debate público sobre la investigación con animales no humanos. 1 Descargado del campus, http://campus.felizmente.info
  • 4. Descargado del campus, http://campus.felizmente.info
  • 5. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos CabreraAntecedentes HistóricosLas aproximaciones teóricas al estudio del aprendizaje tienensus raíces en la filosofía de René Descartes. Antes deDescartes, se pensaba que el comportamiento humano estabaenteramente determinado por la intención consciente y por ellibre albedrío. Descartes reconoció que muchas cosas quehacen las personas son respuestas automáticas a estímulosexternos, aunque no abandonó por completo la idea del librealbedrío y del control consciente. Por tanto, formuló la visióndualista del comportamiento humano conocida como dualismo René Descartes (1596-1650)cartesiano: conducta voluntaria controlada por la mente yconducta involuntaria controlada por mecanismos reflejos. Mundo físico (causa Órganos de la acción sensoriales involuntaria) Glándula Cerebro pineal Mente (causa de la Acción acción voluntaria Músculos voluntaria) o involuntaria Diagrama de dualismo cartesiano. Los órganos sensoriales detectan los eventos del mundo físico. Desde aquí la información se trasmite al cerebro. El cerebro está conectado a la mente por medio de la Glándula pineal. La acción involuntaria se realiza por un arco reflejo que envía mensajes en primer lugar a los órganos sensoriales al cerebro y después del cerebro a los músculos. La acción voluntaria se inicia en la mente, que envía mensajes al cerebro y después a los músculos.Descartes asume que los estímulos del ambiente externo son la causa de toda conductainvoluntaria. Estos estimulos producen respuestas involuntarias por medio de un circuitoneuronal que incluye al cerebro. Sin embargo, creía que los mismos nervios transmitían lainformación de los órganos de los sentidos al cerebro y del cerebro a los músculos. Estecircuito permitía reacciones rápidas a estímulos exteros ( ejemplo: retirar rápidamente undedo del fogón caliente).Descartes creía que los animales carecían del libre albedrío y eran incapaces de accionesvoluntarias y conscientes, frente a los seres humanos que se les atribuía una mente o alma.La mente como una entidad inmaterial, se conectaba al cuerpo a traves de la glándula pineal,cerca del cerebro, por lo que podía tener conciencia de la conducta involuntaria e iniciar las 3 Descargado del campus, http://campus.felizmente.info
  • 6. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos Cabreraacciones voluntarias. Dado que la conducta voluntaria se iniciaba en la mente, ésta podíatener lugar independientemente de la estimulación externa.El dualismo mente-cuerpo introducido por Descartes dio lugar a dos tradicionesintelectuales, base del estudio del aprendizaje moderno: 1.- El mentalismo, se ocupaba de los contenidos y funcionamiento de la mente. 2.- La reflexología, del mecanismo de la conducta involuntaria.Desarrollo histórico del estudio de la mente.Los filósofos preocupados por la mente estaban interesados en descubrir qué era la mentey cómo funcionaba. Preguntas similares se plantean los psicólogos cognitivos actuales.En cuanto al contenido de la mente.Descartes creía que la mente contenía ideas innatas independientemente de la experienciapersonal. La aproximación filosófica según la cual nacemos con ideas innatas acerca deciertas cosas se denomina innatismo.Otros filósofos posteriores a Descartes se enfrentaron a la postura nativista, como JohnLocke(1632-1704) creía que las ideas de las personas eran aprendidas directa oindirectamente a través de experiencias posteriores al nacimiento, recibiendo esta elnombre de empirismo.En cuanto a cómo funciona.Descartes creia en una mente impredecible y desordenada sin ninguna regla estricta o leyesque pudieran identificar. Mientras que el filósofo Thomas Hobbes ( 1588-1679) fue pioneroen proponer que al igual que los reflejos, la mente operaba de forma predecible y conformea leyes. En concreto propuso la conducta voluntaria estaba gobernada por el principio delhedonismo (las personas tratan de lograr el placer y de evitar el dolor).Los empiristas británicos propusieron que las sensaciones simples se combinan hasta formarideas complejas por medio de asociaciones. Al oir la palabra coche cuando hemos visto uncoche, se establece asociación con estos atributos de los coches, de manera que estapalabra volverá a activar los recuerdos de los aspectos del coche que hemos experimentadocuando vuelva a oirla. Los empiristas británicos consideraban que tales asociacionesconstituían los ladrillos de la actividad mental y dedicaran un considerable esfuerzo endetallar las Leyes de asociación. 4 Descargado del campus, http://campus.felizmente.info
  • 7. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos CabreraLeyes de asociación. Los empiristas británicos aceptaron dos conjuntos de leyes para elestablecimiento de asociaciones: • Primarias: formuladas por Aristoteles que propuso tres principios, Contigüidad: si dos eventos ocurren juntos en el espacio o en el tiempo de forma repetida quedarán asociados. Por ejemplo, si nos encontramos con el olor de la salsa de tomate y de los espaguetis con la suficiente frecuencia, nuestro recuerdo de los espaguetis se activará con el mero olor de la salsa de tomate. Similitud y contraste: dos ideas se asocian si son similares en algún aspecto (por ejemplo, si las dos son rojas) o si tienen alguna característica contraria (por ejemplo, si una es muy alta y otra muy baja). • Secundarias: varios filósofos formularon leyes de asociación secundarias, entre ellos Tomas Brown(1778-1820) propuso que la formación de asociaciones entre dos sensaciones estaba influida por un número de factores, incluyendo la intensidad de las sensaciones y la frecuencia y recencia con que las dos ocurrian conjuntamente. Además, se consideraba que la formación de una asociación entre dos eventos dependía del número de asociaciones anteriores en las que cada uno de dichos eventos estaba involucrado, y la similitud entre estas asociaciones pasadas y la que se forma en el presente.La investigación empírica de los mecanismos de asociación no comenzaría hasta el siglo XIX,con el trabajo pionero del psicólogo alemán Hermann Ebbinghaus (1850-1909) inventor delas sílabas sin sentido, combinaciones de tres letras sin ningún significado, estudió listasde estas y midió su capacidad de recordarlas bajo diversas condiciones experimentales,permitió comprobar que :- la fuerza de las asociaciones mejoraba con el entrenamiento.- Las sílabas sin sentido que aparecían juntas en una lista quedaban asociadas con mayor fuerza que las sílabas que estaban más distantes,- Una sílaba se asocia con mayor fuerza a la siguiente de la lista que a la anterior. 5 Descargado del campus, http://campus.felizmente.info
  • 8. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos CabreraDesarrollo histórico del estudio de los reflejos.Al formular el concepto de reflejo, Descartes hizo una gran contribución a la compresión dela conducta, aunque estaba eqivocado en sus ideas acerca del acto reflejo cuando creia quelos mensajes sensoriales iban de los órganos de los sentidos al cerebro y los mensajesmotores iban del cerebro a los músculos, viajando por los mismo nervios; y cuando pensabaque los nervios eran tubos huecos y su transmisión neuronal involucraba gases a los quedenominó espíritus animales. Suponía que estos espíritus animales, liberados por la glándulapineal, se desplazaban por los tubos neurales y entraban en los musculos hinchandolos yprovocando el movimiento. Por último, Descartes consideraba el movimiento reflejo era decarácter innato y que estaban fijados por la anatomía del sistema nervioso.Charles Bell (1774-1842) y François Magaendie (1783-1855) mostraron que eran fibrasnerviosas distintas las encargadas de transmitir la información sensorial desde los organossensoriales a SNC (sistema nervioso central) y la información motora, del SNC a losmúsculos.John Swanmmerdan (1637-1680) en 1669 mostró que el influjo de espiritus animales desdela glándula pineal resultaba innecesario y Francis Glisson (1597-1677) demostró que lascontracciones musculares no se debían a que los músculos se hincharan por un gas.Descartes y la mayor parte de los filósofos posteriores asumieron que los reflejos eranresponsables únicamente de reacciones sencillas a estímulos externos. Se suponía que unestimulo mayor corresponde a una respuesta más vigorosa. Por ejemplo, si tocamos unfogón, cuanto mayor sea el calor más rápido se retira la mano.Hasta el s.XIX I.M. Sechenov (1829-1905) propuso quelos estímulos no siempre elicitan respuestas reflejas deforma directa. En algunos casos pueden liberar respuestaque estaba inhibida, cuya fuerza no dependerá de laintensidad del estimulo. Por ejemplo, pequeñas particulasde polvo pueden producir potentes estornudos. Sugirióque formas complejas de comportamiento (acciones opensamientos) que ocurrian en ausencia de estímuloelicitador manifiesto eran de hecho respuestas reflejas.Así, la conducta voluntaria y los pensamientos están enrealidad elicitados por estímulos débiles y apenasvisibles.Sechenov no tomó en consideración que la conducta de I.M. Sechenov ( 1829-1905)los organismos no permanecía fija e invariable a lo largo 6 Descargado del campus, http://campus.felizmente.info
  • 9. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos Cabrerade su vida, sino que se veia alterada por la experiencia. Desde tiempos de Descartes seconsideró las respuestas reflejas como innatas y fijadas de antemano por las conexiones delsistema nervioso y por tanto un estímulo dado elicitaría la misma respuesta a lo largo detoda la vida del individuo. Pavlov demostró experimentalmente que no todos los reflejos son innatos. Mediante mecanismos asociativos se pueden establecer nuevos reflejos para los estímulos. Trabajó desde la tradición fisiológica de la reflexología tratanto de determinar las leyes de la asociación mediante la investigación experimental . El análisis de tipo asociativo continua jugando un importante papel en investigaciones tanto fisiológicas como conductuales, aunque algunos han complementado los mecanismos asociativos Ivan Pavlov (1849-1936) con otro tipo de procesos.El Amanecer De Una Nueva EraLos estudios experimentales sobre los principios básicos de aprendizaje se realizanfrecuentemente con animales no humanos y dentro de la tadición reflexológica.La cognición comparada y la evolución de la inteligencia.Surge como consecuencia de los escritos de Charles Darwinque atacaba los privilegios que Descartes daba a los humanoscuando asumia que sólo estos poseían mente. En su segundaobra más importante, El origen del hombre, Darwin, argumentóque "el hombre desciende de algún ser más primitivo, a pesarde que por el momento se desconozcan los eslabonesintermedios". Al reclamar la continuiad entre los demásanimales y los humanos, Darwin trató de caracterizar, no sólola evolución de los rasgos físicos, sino tambien la evolución delas capacidades psicológicas o mentales. En su opinión, la mentehumana es producto de la evolución. Sugería que los animalestambién poseen capacidades similares a las humanas incluso Charles Darwin (1809-1882)capaces de creer en entidades espitiruales. 7 Descargado del campus, http://campus.felizmente.info
  • 10. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos CabreraDarwin recopiló evidencias anecdóticas de formas de comportamiento inteligente enanimales, que hoy no satisface los estandares científicos pero que el tema de investigaciónsiguen siendo de máxima actualidad por la posibilidad de seguir la huella de la evolución de lainteligencia por medio de destudios delas capacidades de las diversas especies animales.George Romanes en su libro inteligencia animal de 1882, sugirió que la inteligencia podríaidentificarse determinando si un animal aprende "a hacer nuevos ajustes, o a modificar losantiguos, de acuerdo con los resultados de su propia experiencia individual". La definió comola capacidad de aprender.Neurología Funcional.De acuerdo con el principio del nervismo, las principales funciones fisiológicas estángobernadas por el sistema nervioso (SN). Ivan Pavlov dedicó su vida a investigarlo y granparte a la identificación de los mecanismos neurales de la digestión. El descubrimiento porparte de los britanicos Bayliss y Starling evidenciando el control parcial del páncreas porfactores hormonal y no por factores neurales, hizo que abandonara el estudio de lafisiología del sistema digestivo para investigar los reflejos condicionados. La afirmación dePavlov según la cual los estudios de aprendizaje revelan cómo opera el sistema nervioso esampliamente aceptada por los neurocientíficos contemporaneos. Kandel, por ejemplo, hacomentado que "el principio central de las modernas neurociencias es que todocomportamiento es un reflejo del funcionamiento del cerebro".El psicólogo del comportamiento es como un conductor que trata de descubrir elfuncionamiento de un vehículo experimental probandolo, en lugar de estudiando el motor.Los estudios conducturales del aprendizaje pueden proporcionar pistas sobre la maquinariadel sistema nervioso. Tales estudios nos informan de la plasticidad potencial del sistemanervioso, de las condiciones en las cuales el aprendizaje puede tener lugar, del mecanismopor el cual persisten las respuestas aprendidas y de las circunstancias en las cuales lainformación aprendida es o no accesible. Al detallar las funciones del sistema nervioso, losestudios conductuales del aprendizaje definen los rasgos u operaciones que deben serexplicados por investigaciones de tipo neurofisiológico. 8 Descargado del campus, http://campus.felizmente.info
  • 11. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos CabreraModelos animales de la conducta humana.La realización de inferencias sobre el comportamiento humano partiendo de investigacionescon otras especies animales puede ser arriesgada, si se realiza de forma injustificada; ycontrovertida si las razones para la utilización del modelo no se entiende apropiadamente.Los modelos bases suelen ser animales de otras especies como palomas, ratones y ratones,primates.La utilización de animales como modelo es una herramienta cientifica básica y potente.Permite el estudio de aspectos de la realidad que representan en condiciones sencillas,controladas y económicas. Lo importante del modelo animal es que la caracteristica aestudiar sea similar a las conductas humanas. Por ejemplo, las similitudes entre las ratas ylos humanos en la forma de evitar comidas peligrosas hace que la rata sea un modelo válidopara investigar el aprendizaje de aversión a la comida en humanos.Dollard y Miller fueron partidarios de una integración en la que los estudios de laboratoriorealizados con animales no humanos se usaran para aislar e identificar los fenómenos quepodrían posteriormente ser estudiados con éxito en personas. La investigación con animalespermite también aumentar nuestra confianza en los datos obtenidos con humanos mediantemétodos de investigación menos rigurosos.Modelos animales y robótica.Los modelos animales de aprendizaje y conducta también revisten cierta importancia enrelación a la robótica y a los sistemas de inteligencia artificial. Los robots son máquinascapaces de realizar funciones o tareas específicas. La meta de la robótica es hacermáquinas tan "inteligentes" como sea posible. Al igual que Romanes definió el término"inteligencia" a partir de la capacidad de aprender, los ingenieros actuales contemplan lacapacidad de recordad y aprender a partir de la experiencia como un rasgo importante delos sitemas artificiales "inteligentes". La información sobre las características ymecanismos de tal aprendizaje puede obtenerse a partir de estudios de aprendizajerealizados por animales no humanos. Por ejemplo, en inteligencia artificial se utilizanfrecuentemente mecanismos asociativos para permitir que las respuestas de estos sistemassean modificables por la experiencia. 9 Descargado del campus, http://campus.felizmente.info
  • 12. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos CabreraDefinición De Aprendizaje.No hay una definición de aprendizaje universalmente aceptada. Sien embargo, muchosaspectos quedan recogidos en las siguiente afirmación: El aprendizaje es un cambio duradero en los mecanismos de conducta que implicaestímulos y/o respuestas específicas y que es resultado de la experiencia previa conesos estímulos y respuestas o con otros similares.La distinción entre aprendizaje y ejecución.Siempre que contemplamos evidencia de aprendizaje, observamos la aparición de un cambioen el comportamiento. Es la única forma de saber si el aprendizaje a tenido lugar. Elcomportamiento está determinado por muchos otros factores distintos del aprendizaje.La ejecución se refiere a las acciones de un organismo en un momento concreto. Laejecución esta determinada por la oportunidad, la motivación y las capacidades sensoriales ymotoras, además del aprendizaje. Por lo que, un cambio de actuación no puede serautomáticamente considerada como una manifestación de aprendizaje.El aprendizaje y otras fuentes de cambio conductual.La fatiga o cansancio , entre otros, es un mecanismo que da lugar a cambios de conductaque es excesivamene breve para ser considerados como aprendizaje. Se produce por elesfuerzo físico y provoca una disminución gradual en la fuerza de una respuesta. Este tipode cambio está producido por la experiencia, pero no se considera ejemplo de aprendizajedebido a que la debilitación de la respuesta desaparece si se permite al individuo descansarun rato.Un cambio en las condiciones estimulares también puede alterar la conducta temporalmente(La luz del cine se enciende de repente, el espectador cambia su comportamiento, y cuandose apaga se vuelve a concentrar en la pelicula). Como tampoco puede considerarseaprendizaje los que implican alteración en el estado fisiológico o motivacional del organismo( el hambre, la sed, cambios en niveles hormonas sexuales, drogas psicoactivas, etc.provocan cambios conductuales transitorios).En algunos casos, pueden aparecer cambios persistentes en la conducta sin necesidad de laexperiencia con eventos del entorno que requiere la definición de aprendizaje. Destacabelde este tipo es la maduración. Un niño no alcanza un objeto que está en una estantería altahasta que crezca lo suficiente. 10 Descargado del campus, http://campus.felizmente.info
  • 13. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos CabreraDiferentes tipos de mecanismos causales.Las causas pueden ser conceptualizadas de diversas formas o a diferentes niveles deexplicación. Cuatro tipos de causas descritos por Aristóteles. Primero , causa eficiente, hace referencia a las condiciones necesarias y suficientes para producir un resultado en la conducta. Segundo, causas materiales, cambios en los mecanismos sinápticos; cambios neurales. Tercera, causas formales son las teorías o modelos de aprendizaje. Cuarta, causas finales son las explicaciones del aprendizaje que pone énfasis en su función o utilidad.Los cientificos de orientación biológica a menudo establecen una distinción entre las causaspróximas o inmediatas del comportamiento y sus causas últimas. Las causas próximas secorresponden con las causas eficientes y materiales de Aristóteles. Las causas últimas secorresponden con las causas finales.Aspectos Metodológicos Del Estudio del Aprendizaje.La investigación sobre los procesos de aprendizaje se caracteriza por dos rasgosmetodológicos principales. Uno es consecuencia directa de la definición de aprendizaje yrequiere el uso de métodos de investigación experimentales, en lugar de métodosobservacionales. Los fenómenos del aprendizaje no pueden investigarse sin una metodologíaexperimental. El segundo rasgo metodológico es más una cuestión de preferencia que denecesidad.El aprendizaje como ciencia experimental.De los cuatro tipos de causas, los investigadores del aprendizaje han centrado su atenciónen las causas eficiente, materiales y formales. Independientemente del tipo de causa, esteénfasis prescribe que las investigaciones de aprendizaje utilicen una metodologíaexperimental. Las causas no pueden observarse directamente. Tan sólo pueden ser inferidasa partir de los resultados de las manipulaciones experimentales.En el estudio del aprendizaje, lo que nos interesa es la conducta de organismos vivos, enpresencia y en ausencia de la presunta causa. Hay que comparar las acciones de losindividuos que previamente han sido expuestos al procedimiento en cuestión con las accionesde los individuos que no han sido expuestos a dicho procedimiento. La única forma dedemostrar que la exposición a ese entrenamiento es la causa del cambio conductual 11 Descargado del campus, http://campus.felizmente.info
  • 14. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos Cabreraestudiado es manipular experimentalmente la presencia y la ausencia de dicha exposición.Por esta razón, el aprendizaje sólo puede estudiarse mediante técnicas experimentales ytiene lugar básicamente en el laboratorio.La perspectiva de proceso general en el estudio del aprendizaje.El segundo rasgo metodológico de los estudios de aprendizaje es una perspectiva basada enprocesos generales. Ésta es más una cuestión de preferencia que de necesidad. Sinembargo, al adoptar una perspectiva de proceso general, los investigadores del aprendizajeanimal siguen una antigua tradición científica.Elementos de la perspectiva de proceso general. La característica más obvia de lanaturaleza es su diversidad. Los cientificos han elegido fijarse en los aspectos comunespara buscar la uniformidad y formular leyes generales con las que organizar y explicar ladiversidad de los eventos del universo. Los investigadores del aprendizaje animal hanseguido esta misma tradición.Un presupuesto fundamental de la perspectiva de proceso general es que los fenómenosestudiados son el resultado de procesos más elementales. Además, se asume que esosprocesos elementales operan de forma similar independientemente de dónde se encuentren.Por tanto, se asume que la generalidad emerge a nivel de los procesos básicos o elementales.Los investigadores del condicionamiento y el aprendizaje se han adherido a la perspectivade proceso general desde los comienzos de esta área de estudio en psicología. Se hancentrado en los aspectos comunes de los diversos tipos de aprendizaje y han asumido quelos fenómenos de aprendizaje son producto de procesos elementales que operan de formasimilar en diversas situaciones de aprendizaje.El presupuesto según el cual las leyes "universales" de la asociación son las responsables delos fenómenos de aprendizaje no excluye que los animales puedan aprender sobre multitudde estímulos, respuestas o que cada especie tenga un ritmo de aprendizaje diferente. Seasume que la generalidad se sitúa en los principios o procesos de aprendizaje; no en elcontenido o en la velociad del mismo. El trabajo del psicólogo del aprendizaje es descubriresas leyes universales.Implicaciones metodológicas de la perspectiva de proceso general. Si asumimos queexisten principios universales de aprendizaje, entonces deberíamos ser capaces dedescubrir esos principios en cualquier situación en la que el aprendizaje tenga lugar. Portanto, una importante implicación metodológica de la perspectiva de proceso general es quese pueden descubrir los principios del aprendizaje estudiando cualquier especie o sistemade respueta que muestre aprendizaje. Los investigadores han confluido hacia unos 12 Descargado del campus, http://campus.felizmente.info
  • 15. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos Cabreraparadigmas experimentales estandarizados o convencionales. La mayor parte de los estudiosde aprendizaje se realizan en estos paradigmas. A lo largo de los años se han idoperfeccionando estos paradigmas experimentales convencionales, para ajustarse a laspredisposiciones conductuales de los animales de investigación. Debido a estas mejoras,estas preparaciones experimentales permiten realizar estudios de laboratorio conrespuestas bastante naturales.Demostración de la generalidad de los fenómenos de aprendizaje. Asumir que existenprocesos elementales de aprendizaje comunes no es lo mismo que demostrar empíricamenteestas similitudes.La verificación empírica de la existencia de tales mecanismos comunes en diversassituaciones sigue siendo necesaria para construir una explicación verdaderamente generaldel aprendizaje. Una teoría general del aprendizaje no puede verificarse empíricamenteutilizando sólo unos pocos paradigmas experimentales estandarizados. La generalidad delaprendizaje debe probarse realizando estudios de distintas especies y situaciones.Uso de Animales No Humanos En La Investigación Sobre Aprendizaje.Gran parte de los experimentos se han realizado con animales no humanos por razonestanto teóricas como metodológicas.Razones del uso de animales no humanos en la investigación sobre aprendizaje.Para investigar los fenómenos de aprendizaje se requiere el uso de métodos experimentalesque puedan atribuir la adquisición de una nueva conducta a una experiencia previa enparticular. Este control experimental de la experiencia previa no puede alcanzarse con elmismo grado de precisión cuando se utilizan sujetos humanos que cuando se utilizananimales de labotatorio. Con los animales de laboratorio, los cientificos pueden estudiarcómo se aprende las reacciones emocionale intensas y cómo el aprendizaje interviene a lahora de buscar comida, evitar el dolor o el estrés, o encontrar posible pareja sexual. Con laspersonas, se ven limitados a tratar de modificar las respuestas emocionales inadaptadas unavez que éstas ya han sido aprendidas. Incluso para procedimientos terapéuticos eficaces enel tratamiento de la conducta inadaptada requiere conocer primero los mecanismos por loscuales se aprenden dichas respuestas emocionales, conocimiento que requiere estudios conanimales de laboratorio. 13 Descargado del campus, http://campus.felizmente.info
  • 16. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos CabreraObtener información sobre las bases evolutivas y biológicas del aprendizaje, o cómoevoluciona la cognición y la inteligencia requieren el apoyo o la utilización de animales deinvestigación.Igualmente el conocimiento de las bases biológicas del aprendizaje necesitan el apoyo de losanimales de laboratorio para desenmarañar cómo aprende y recuerda el sistema nervioso.Los estudios conductuales de aprendizaje realizados con animales son un requisito necesariopara cualquier intento de investigar las bases biológicas del aprendizaje con animales. Laneurociencia tiene que fundamentarse en la ciencia del comportamiento.Estudiar los procesos de aprendizaje en animales criados en condiciones de control delaboratorio es más simples que hacerlo en personas cuyos ambientes son mucho másvariados y difíciles de describir. El comportamiento de los animales no se ve complicado porlos procesos lingüísticos que juegan un papel tan importante en determinados tipos deconducta humana. Otra ventaja importante es que en la investigación con animales no esnecesario hacer peticiones explícitas a los sujetos. En la investigación con humanos se debeasegurar que los participantes no están influenciados por el deseo de complacer alinvestigador.Los animales de laboratorio y la conducta normal.Parece errónea la idea de alguno cuando sugieren que la endogamia y los largos periodos decautiverio de los animales domesticados de laboratorio pueden influir en la conducta normalde estos. De hecho, los animales de laboratorio (ratas) pueden ser preferibles con fines deinvestigación a sus equivalentes salvajes ya que viven en un medio tan "artificial" como el delhumano.El debate público sobre la investigación con animales no humanos.Ha habido un gran debate acerca de las ventajas y los inconvenientes de realizarinvestigaciones con animales. Parte del debate se ha centrado en la necesidad de dar untrato humano a los animales. Otros aspectos del debate han centrado los requisitos éticos yque debe cumplir el trato de los animales, en el derecho de los seres humanos abeneficiarse a expensas de los animales y en posibles alternativas a la investigación conanimales.La ética de la investigación con animales de laboratorio. La preocupación por el bienestarde los animales de laboratorio han dado lugar a la adopción de reglas estrictas para elalojamiento de los animales y para la supervisión de la investigación con animales. En el casode la ciencia que estudia la conducta, siempre se preocupan de ese bienestar ya que no se 14 Descargado del campus, http://campus.felizmente.info
  • 17. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos Cabrerapuede obtener información sobre el aprendizaje y la conducta normales utilizando animalesenfermos o maltratados.Algunos experimentos conllevan alguna incomodidad, sin embargo, se realizan todos losesfuerzos necesarios para minimizarlos.¿Qué es un trato "humano" a los animales? Asumiendo que una especie merece el tratoque establezcan las normas oficiales. A menudo se describe como "trato humano" altratamiento que se considera apropiado para los animales de laboratorio.¿Deben los seres humanos beneficiarse del uso de otros animales? La relación essimbiótica más que unilateral y de explotación. Además, el uso de animales de laboratorio enla investigación representa tan sólo una pequeña parte del uso que otros humanos hacen delos animales domésticos, incluyendo su uso como fuente de alimentación. Estimaciones del número de animales empleados en avicultura y ganadería Pollos 7.764.200.000 Gallinas ponedoras 303.604.000 Pavos 301.251.000 Ganado vacuno 59.801.000 Cerdos 104.301.000 Ovejas y corderos 6.691.000 TOTAL AVICULTURA Y GANADERÍA 8.539.848.000 Estimaciones del número de animales empleados en Investigación Perros 75.429 Gatos 26.091 Primates 56.381 Caballos 217.079 Conejos 309.322 Animales de granja 159.742 Ratas y ratones 7.452.186 Otros 150.987 TOTAL INVESTIGACIÓN 8.452.186 *Datos de 1997 de EEUU. Porcentaje del total empleado en investigación = 0.099%Alternativa a la investigación con animales. La creciente preocupación por aspectos éticosde la investigación con animales ha llevado a la búsqueda de técnicas alternativas. Russell yBurch (1959) formularon las "tres R": reemplazamiento de animales por otras técnicas deestudio, reducción del número de animales empeados por técnicas estadísticas yrefinamiento de los procedimientos experimentales para causar menos sufrimiento. Pero enla investigación sobre aprendizaje no es posible la experimentación sin organismos vivos. 15 Descargado del campus, http://campus.felizmente.info
  • 18. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 1: Introducción Juan Carlos CabreraAlgunas de las técnicas propuestas:1. Técnica observacionales. Al necesitar los estudios de aprendizaje manipulacciones experimentales de la experiencia pasada, las observaciones realizadas sin intervenir sobre los animales no pueden proporcionar información sobre los mecanismos de aprendizaje.2. Uso de plantas. El aprendizaje no puede estudiarse en plantas, ya que carecen de sistema nervioso, imprescindible para el aprendizaje.3. Cultivo de tejidos. Aunque los cultivos de tejidos pueden revelar las operaciones de procesos celulares, el funcionamiento del estos procesos celulares dentro del organismo intacto sólo puede estudiarse en el organismo intacto. Además, la búsqueda de los mecanismos celulares del aprendizaje requiere una caracterización previa del aprendizaje a nivel conductual.4. Simulaciones informáticas. Sin los conocimientos precisos sobre la naturaleza de los fenómenos de aprendizaje y de los mecanismos y factores que determinan el aprendizaje, los programadores no pueden realizar una simulación informática. Por tanto, la investigación con organismos vivos es un requisito para la simulación informática efectiva.TERMINOS CLAVEAprendizaje Cambio duradero en los mecanismos de Hedonismo Postura filosófica propuesta por Hobbes conducta que implica estímulos y/o respuestas según la cual las acciones de un organismo están específicos y que es resultado de la experiencia enteramente determinadas por la persecución del previa con esos estímulos y respuestas o con otros placer y la evitación del dolor. similares. Maduración Cambio en la conducta causado por elAsociación Conexión entre la representación mental desarrollo físico o fisiológico del organismo en de dos eventos (dos estímulos o un estímulo y una ausencia de experiencia con eventos particulares respuesta) de forma que la ocurrencia de uno de del ambiente. los eventos activa la representación del otro. Innatismo Postura filosófica según la cual los seresDualismo Visión de la conducta según la cual las humanos nacen con ideas innatas. acciones pueden dividirse en dos categorías: conducta voluntaria controlada por la mente y Nervismo Postura filosófica adoptada por Pavlov conducta involuntaria controlada por mecanismos según la cual todos los procesos conductuales y reflejos. fisiológicos están regulados por el sistema nervioso.Ejecución Actividades de un organismo en un momento particular. Reflejo Mecanismo que permite que un evento específico del ambiente elicite una respuestaEmpirismo Corriente filosófica según la cual todas las específica. ideas de la mente tienen su origen en la experiencia. Sílaba sin sentido Combinación de tres letras (dos consonantes y una vocal) sin significado. 16 Descargado del campus, http://campus.felizmente.info
  • 19. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010La naturaleza de la conducta elicitada.- El concepto de reflejo.- Pautas de acción modal.- Estímulos elicitantes de las pautas de acción modal.- La organización secuencial de la conducta.Efectos de la estimulación repetida.- Atención visual en los bebés humanos.- Salivación y evaluación del sabor en humanos.- Respuesta de sobresalto en ratas.Los conceptos de hatituación y sensibilización.- Adaptabilidad y generalidad de la habituación y la sensibilización.- Diferencias entre habituación y adaptación sensorial y fatiga.- Teoría de proceso dual de la habituación y la sensibilidad.Características de la habituación y la sensibilización.- Curso temporal.- Especificidad del estímulo.- Efecto de un estímulo externo intenso.Aplicación a las emociones y la conducta motivada.- Reacciones emocionales y sus efectos posteriores.- La teoría del proceso oponente.- Variaciones en la conducta dirigida a metas. 17 Descargado del campus, http://campus.felizmente.info
  • 20. Descargado del campus, http://campus.felizmente.info
  • 21. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010La Naturaleza de la Conducta Elicitada (pág. 29)Todos los animales reaccionan a los eventos que tienen lugar en su entorno. Gran parte de laconducta tiene lugar como respuesta a los estímulos; es decir, ocurre de forma elicitada.El concepto de reflejo.Un reflejo conlleva dos elementos íntimamente relacionados, un estímulo elicitante y sucorrespondiente respuesta. La respuesta rara vez tiene lugar en ausencia del estímulo.Estímulo y respuesta es una consecuencia de la organización del sistema nervioso. Losreflejos simples suelen estar mediados por tres neuronas:- Neurona sentorial o neurona aferente, es activada por un estímulo ambiental y transmite el mensaje sensorial a la médula espinal.- Neurona motora o neurona eferente, trasmite el impulso desde la médula espinal que activa el musculo involuntario en la repuesta refleja.- Interneural el impulso que comunica las dos neuronas anteriores. Organización neuronal de los reflejos simples. Los estímulos del entorno activan una neurona sensorial, que trasmite el mensaje sensorial a la médula espinal. En este lugar, el impulso neuronal pasa a una interneurona, que a su vez dirige el impulso hacia una neurona motora. La neurona motora activa al musculo involucrado en el movimiento.Los circuitos neuronales están dispuestos de tal modo que determinadas neuronassensoriales se conectan al conjunto correspondiente de neurnas motoras, por lo que una 19 Descargado del campus, http://campus.felizmente.info
  • 22. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010determinada respuesta refleja está elicitada únicamente por un conjunto limitado deestímulos. El conjunto formado por neurona aferente, la interneuraona y la neuronaeferente constituyen el arco reflejo.El arco reflejo representa el número Arco reflejomínimo de conexiones neuronales El estímulo provoca una reacción automática. Componentes: Neurona sensorial, interneural, neurona motora.necesarias para que tenga lugar el actoreflejo, pero pueden verse involucradas esctructuras neuronales adicionales. Por ejemplo, lainformación sensorial puede transmitirse al cerebro, que a su vez puede modificar lareacción refleja de diversas formas.La mayor parte de los reflejos contribuyen al bienestar delorganismo, constituyen una parte importante del repertorioconductual de los niños recien nacidos y en ocasiones esencial para lasupervivencia, como el reflejo de oclusión respiratoria.Pautas de acción modal.Hay respuetas simples comunes en muchas especies, por el contrario, existen otrasespecificas de la propia especie. Por ejemplo, la respuesta de succión provocada por objetossituados cerca de la boca es un rasgo característico de los mamíferos.A las secuencias de respuestas típicas de especies particulares, tales como las que aparecenen la alimentación de crías, se las denomina pautas de acción modal o PAMs.Estímulos elicitantes de las pautas de acción modal.Los rasgos especificos que se requieren para elicitar la conducta reciben colectivamente elnombre de estímulo señal o estímulo desencadenante. Un estímulo señal o desencadenante es Son secuencias de conducta específicas de algunas especies suficiente para elicitar una pauta de que se desencadenan ante un estímulo determinado (estímulo señal o estímulo desencadenante). acción modal. Sin embargo, una Ej: "Bailes de cortejo". determinada pauta de acción puedeestar controlada por varios rasgos del estímulo de forma aditiva. Además, el estímulo queelicita con mayor efectividad la pauta de acción no tiene por qué ser el que ocurra conmayor probabilidad en condiciones naturales.De hecho experimentos realizados con la gaviota arenquera, demostraron que el color, latextura y el tamaño parecían controlar la conducta de recuperación del huevo de formaaditiva. El atractivo del huevo podía resaltarse haciéndolo más verde, más moteado o más 20 Descargado del campus, http://campus.felizmente.info
  • 23. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010grande. Al optimizar cada una de estas Imaginemos que el parámetro más importante es el color azul.dimensiones se obtenía un objeto que Así puede suceder que el huevo artificial más efectivo paraera más efectivo que el natural como iniciar la Pauta de acción modal (PAM) resulta ser muy diferente del huevo real. Un huevo muy azul que no existe en laelicitador de la pauta de acción. Estos naturaleza, pero que elicita la PAM con más fuerza que los deestímulos inusualmente efectivos verdad, lo llamamos estímulo supranormal.reciben el nombre de estímulossupranormales.La organización secuencial de la conducta.Las conductas nunca aparecen aisladas sino que forman secuencias. Distinguimos dos tipos: 1.- Conducta apetitiva a los primeros componentes de la secuencia de comportamiento. Sirve para poner al animal en contacto con el estímulo. Por ejemplo, olfatear la comida antes de comerla. 2.- Conductas consumatoria a los últimos componentes de la secuencia de comportamiento. Por ejemplo, tragar la comida. Son normalmente más estereotipadas (menos variables) que las conductas apetitivas.En secuencias de busqueda de comida: 1.- Modo de búsqueda general. Son conductas apetitivas. El sujeto no sabe dónde buscar comida. Por ejemplo, la ardilla busca un nogal. 2.- Modo de búsqueda focalizada. Tambien conductas apetitiva. El sujeto ya ha localizado espacialmente la fuente de comida, la búsqueda es ahora más restringida. Por ejemplo, la ardillaha encontrado el nogal y comienza a buscar nueces. 3.- Modo de manipulación del alimento. Es la conducta consumatoria. Por ejemplo, la ardilla ha obtenido la nuez.Efectos De La Estimulación Repetida. (pág. 35 del libro)Descartes pensaba que una respuesta simple elicitada ocurre automáticamente de la mismaforma que se presenta el estímulo elicitada. Cada aparición del estímulo elicitante producirála misma acción refleja. Esto no es así, dado que a menudo aparecen alteraciones en lanaturaleza de la conducta elicitada simplemente como resultado de la presentación repetidadel estímulo elicitante. 21 Descargado del campus, http://campus.felizmente.info
  • 24. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010Atención visual en los bebés humanos.Los bebés humanos tienen que aprender muchas cosas sobre el mundo, y una forma esobservar el entorno. Las claves visuales elicitan una respuesta de observación, que puedemedirse por el tiempo que los bebés mantienen sus ojos en un objeto antes de mirar a otraparte.En un estudio sobre atención visual se tomaron dos grupos de bebés de cuatro meses y seles presentaron diferentes estímulos visuales. Los dos patrones similares a tableros deajedrez; uno de 4x4 y el otro de 12x12. Se presentaron durante 10s., ocho veces enintervalos de 10s. Patrón de tablero 4 x 4 Patrón de tablero 12 x 12Los resultados muestran que la atención visual provocada por un estímulo novedoso cambia amedida que el bebé se familiariza con el estímulo. Con el patron 4x4 relativamente sencillo,la atención visual se reduce progresivamente. Con el patrón 12x12 más complejo, la atenciónse incrementó en el segundo ensayo, pero después se redujo también.Salivación y evaluación del sabor en humanos.El sabor de la comida elicita la salivación como respuesta refleja. Esto puede observarsetan claramene en las personas como en los perros de Pavlov. Las personas encuentran el sabor de una comida específica menos placentera cuanto máscomen. Sin embargo, el sabor de una comida distinta es suficiente para restablecer lavaloración hedónica de una comida familiar. Estos hallazgos , del experimento realizado porEpstein, Rodefer, Wisniewski y Caggiula, 1992, suguieren que sobrealimentación puedereducirse no variando la alimentación disponible para su consumo. 22 Descargado del campus, http://campus.felizmente.info
  • 25. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010Respuesta de sobresalto en ratas.La respuesta de sobresalto es una respuesta defensiva que aparece en muchas especies.Consiste en un salto repentino y una contracción de los músculos de la parte superior delcuerpo, con frecuencia acompañado de una elevación de los hombros.Davis (1974) estudió la respuesta de sobresalto en dos grupos de ratas. A cada grupo, en unambiente con un sonido suave de 60dB y al otro, algo más fuerte, con 80dB. Ambos gruposrecibieron 100 presentaciones de un tono de 4000 cps en intervalos de 30 segundos. Losresultados fueron una reacción de sobresalto cada vez más débil para el grupo expuesto aambiente 60dB y reacciones de sobresalto cada vez más vigorosas para el grupo expuesto aambiente 80dB.Los Conceptos De Habituación y Sensibilización. (pág. 39 del libro)Los estudios descritos anteriormente Habituación: La respuesta desciende debido a la estimulaciónmuestran que la presentación repetida de repetida. Ej: Acostumbrarse a vivir cerca de un aeropuerto,un estímulo elicitante puede provocar cuando los primeros días es una tortura, por el ruido.tanto disminuciones como incrementos en Sensibilización: La respuesta aumenta debido a la estimulación repetida. Ej: La primera vez que escuché unala respuesta. Las disminuciones de la ópera no había distinguido el sonido de los clarinetes, ahoratendencia a responder producidas por la que ya la he oído muchas veces puedo diferenciar ese sonido claramente.estimulación repetida recibe el nombretécnico de efecto de habituación. Losincrementos de la tendencia a responder se llaman efecto de sensibilización.Adaptabilidad y generalidad de la habituación y la sensibilización. Estamos continuamente bombardeados Habituación y sensibilización son útiles y necesarias porque ayudan a hacer caso a ciertos estímulos relevantes y a ignorar por estimulos. Si tuviesemos que los estímulos irrelevantes. De lo contrario, nos moveríamos en un maremágnum estimular poco informativo. responder a todos nuestra conducta sería desorganizada y caótica. Los fenómenosde habituación y sensibilización son el producto final de procesos que ayudan a organizar yfocalizar la conducta en el caótico mundo de estímulos en el que los organismos viven. 23 Descargado del campus, http://campus.felizmente.info
  • 26. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010Diferencias entre habituación y adaptación sensorial y fatiga.La habituación no es el único efectoque da lugar a una disminución en larespuesta. La adaptación sensorialocurre en los órganos sensoriales (unacegera temporal al pasar de laoscuridad a una luz) y la fatiga de larespuesta tiene lugar en los músculosefectores. Por el contrario, lahabituación y la sensibilizaciónocurren en el sistema nervioso.En la habituación, el órganismo deja de responder a un estímulo aunque mantiene lacapacidad de percibirlo y de realizar los movimientos musculares requeridos por larespuesta. La respuesta no tiene lugar debido a los cambios en el sistema nervioso bloqueanla transmisión del impulso nervioso de la neuronas motoras.En los estudios sobre habituación, la adaptación sensorial puede descartarse ya que existeevidencia de que la habituación es específica de la respuesta.La fatiga también puede descartarse como causa de la habituación por medio de evidenciasque muestra que la habituación es específica del estímulo. Adaptación sensorial: pérdida de sensibilidad de ls Fatiga: Reducción de la respuesta producida por el organos sensoriales ( ej: deslumbrarse por una luz muy cansancio de los músculos involucrados en ella. fuerte). ¿En qué se parece y en qué se distingue de la ¿Cómo distinguirla de la Habituación? Habituación? La adaptación sensorial... 1. La fatiga sí puede ser consecuencia de una estimulación 1. No se debe a una estimulación repetida, como la repetida, como la Habituación. Ejecutar una misma Habituación, sino a una estimulación demasiado potente. respuesta continuamente produce fatiga. 2. No sucede en el sistema nervioso central, como la 2. Sin embargo, la fatiga no sucede en el sistema nervioso, habituación, sino en los órganos sensoriales. No es por no es aprendizaje, sino en los músculos que ejecutarían tanto una forma de aprendizaje. la respuesta. Un brazo cansado no puede ejecutar la respuesta. 3. No es específica de la respuesta. Si los órganos sensoriales están afectados, todas las respuestas 3. La fatiga no es específica del estimulo, como sí lo es disminuirán porque los estímulos no son bien captados por la Habituación. En el caso de la Habituación, un cambio en los sentidos. Por el contrario, en la habituación, sólo el estímulo devuelve la respuesta normal. Sin embargo, un desciende una respuesta, otras respuestas diferentes músculo fatigado no puede volver a ejecutar la respuesta pueden ser ejecutadas con normalidad. por haber cambiado el estímulo presentado. 4. Es un tipo de efecto muy transitorio. 4. Igualmente es un cambio muy transitorio: sólo hace falta descansar un rato. 24 Descargado del campus, http://campus.felizmente.info
  • 27. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010Teoría de proceso dual de la habituación y la sensibilidad.La teoría del proceso dual presupone que los incrementos y disminuciones en la tendencia aresponder a un estímulo son producto de procesos neuronales diferentes: Proceso dehabituación, rovoca una disminución de la tendencia a responder y proceso desensibilización, produce un incremento en la tendencia a responder. Estos procesos no sonexlcuyentes y ambos pueden estar activos al mismo tiempo. El resultado conductual dependede qué proceso sea más fuerte.En base investigaciones neuropsicológica, losprocesos de habituación y sensibilizacióntienen lugar en diferentes partes de sistemanervioso. La habituación tiene lugar en elsistema E-R, que consiste en el caminoneural más corto que conecta los órganossensoriales activos por el estímulo elicitantey los músculos involucrados en la producción La teoría del proceso dual integra los dos procesos dede la respuesta elicitada ( como el arco habituación y sensibilización.reflejo). Cada presentación de un estímulo Los dos procesos suceden al mismo tiempo: la conductaelicitante activa el sistema E-R y causa un observada es el resultado neto de los dos. ¿Quién es másincremento en la habituación. fuerte?Los procesos de sensibilización tienen lugar en el sistema de estado. Este determina latendencia general de un organismo a responder, mientras el sistema E-R permite al animaldar la respuesta específica al estímulo relevante. Los cambios de conducta que tienen lugarpor la repetición de un estímulo refleja la acción combinada de los sistemas E-R y deestado. Los dos procesos (habituación y sensibilización) tienen lugar en distintas partes del SN. El proceso de habituación tiene lugar en el sistema E-R (similar al arco reflejo). Cada presentación de un estímulo activa el sistema E-R aumentando la habituación. El proceso de sensibilización tiene lugar en el sistema de estado (determina la tendencia a responder). Sólo se activa ante la presentación repetida de estímulos excitadores (por tanto, no está activo todo el tiempo). Se puede modificar esa tendencia mediante drogas o estados emocionales ( ej: el miedo). La conducta observada será el resultado de la combinación de los dos procesos, por lo tanto depende de cuál de los dos sea más fuerte en un momento dado.Aplicaciones de la teoría del proceso dual. En los ejemplos de habituación ysensibilización, la exposición repentida al patrón ajedrez 4x4 produjo una disminución derespuesta visual de los bebés, posiblemente no provocó mucha activación del sistema E-R,proceso de habituación. El patrón ajedréz 12x12, más complejo, produjo mayor activación y 25 Descargado del campus, http://campus.felizmente.info
  • 28. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010activó, no sólo el sistema E-R, sino también el sistema estado. Produjo un incremento en laatención visual después del primera presentación. Sin embargo, el proceso de sensibilizaciónno fue lo suficientemente fuerte para contrarestar completamente los efectos de lahabituación. Como resultado, despues de varios ensayos, la atención visual tambien declinoen respuesta al estimulo 12x12.La respuesta de sobresalto de las ratas anteriormente comentadas requieren una aplicacióndiferente de la teoría del proceso dual. Cuando se sometió a prueba con ruido ambientalrelativamente suave (60 dB), no había nada que las activara. Por tanto, podemos asumir quelos procedimientos experimentales no produjeron cambios en el sistema estado. Lapresentación repetida de tono elicitador activaba tan sólo el sistema E-R, lo que dio lugar ala habituación de la respuesta de sobresalto.El resultado contrario tubo lugar cuando fueron puestos en presencia de los 80 dB.Sucesivas presentaciones del tono aparecieron reacciones de sobresalto más enérgicas.Dado que en ambos grupos se utilizó el mismo tono, la diferencia en los resultados no puedeser atribuida al mismo. Debemos asumir que en el segundo grupo, el ruido ambiente intensoincrementó el nivel de activación o la tendencia a respuesta. Esta sensibilización del sistemade estado fue la causa del incremento en la reacción de sobresalto al tono en el segundogrupo.Implicaciones de la teoría del proceso dual. El sistema E-R se activa siempre que unestímulo elicita una respuesta, mientras que el sistema de estado sólo interviene encircunstancias especiales.Características de la habituación y la sensibilización. (pág. 45 del libro)Curso temporal.Por lo general duran poco tiempo, lo suficiente para ser considerarlos formas deaprendizaje.Curso temporal de la sensibilización por lo general tienen efectos temporales y suduración depende de la intensidad de los estímulos. Los estímulos más intensos producenmayores incrementos en la tendencia a responder y una sensibilización más persistentes.Curso temporal de la habituación. La persistencia es variable. En la habituación sedistingue entre habituación a corto plazo (se disipa en segundos o minutos) y habituación a 26 Descargado del campus, http://campus.felizmente.info
  • 29. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010largo plazo (persiste durante muchos días). La recuperación espontánea es la principalcaracterística del efecto de habituación a corto plazo.Especificidad del estímulo.Especificidad del estímulo en la habituación. La habituación es específica del estímulo queha sido presentado repetidamente. Una respuesta a un estímulo previamente habituadapuede manifestarse plenamente alterando alguna característica importante del estímulo.Ejemplo, después de habituarse al sabor del limón, la presentación de la lima recupera larespuesta totalmente.Aunque la habituación es específica de un estímulo, puede darse cierta generalización. Sinos hemos habituado a un determinado sonido del reloj, es posible que tampocorespondamos al sonido de otro reloj que es similar al original. Este fenómeno recibe elnombre de generalización del estímulo de la habituación. A medida que los estímulos sehacen progresivamente diferente, el organismo mostrará una menor habituación o supresiónde la respuesta ante dicho estímulo.Especificidad del estímulo en la sensibilización.La sensibilización no es específica del estímulo.Si una animal se sensibiliza por alguna razón,su reactividad se incrementá para toda una variedad de estímulos. Especialidad del estímulo: - Habituación: Muy específica del estímulo (cambiamos el estímulo y la respuesta). - Sensibilización: No específica del estímulo. Cuando el animal se sensibiliza (por estados de alerta, miedo, ingestión de drogas), está hipersensible para casi cualquier estímulo que vaya a presentarse.Efecto de un estímulo externo intenso.La respuesta habituada también puederestablecerse sensibilizando al organismo con Un estímulo intenso puede producir en el animal un estado de sensibilización que recupera la respuesta anteriormentela exposición de un estímulo externo. Este habituadas: Deshabituación.fenómeno recibe el nombre dedeshabituación. 27 Descargado del campus, http://campus.felizmente.info
  • 30. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010Aplicación a las emociones y la conducta motivada. (pág. 49 del libro)La exposición de los cambios producidos por la repetición de un estímulo se ha limitadohasta ahora a respuestas relativamente sencillas. Los estímulos también pueden provocaremociones complejas, tales como amor, miedo, euforia, terror o satisfacción.Reacciones emocionales y sus efectos posteriores.Solomon y Corbit (1.074) destacaron dos rasgos llamativos.• Las reacciones emocionales intensas a menudo constas de dos fase: - Primero, tiene lugar durante la presentación del estímulo elicitante, y - Segundo, la opuesta se observa cuando el estímulo desaparece. R.L. SolomonPor ejemplo, el efecto psicoactivo del alcohol. Una persona sevuelve alegre y relajada, y experiementa sensaciones de cáracter generalmente agradablecuando toma una un vaso de vino. Estas reacciones reflejan el efecto sedante inicial delalcohol. Por el contrario, tras tomar varias bebidas ocurre algo bastante distino. Una vezque el efecto sedante del alcohol se ha disipado, es probable que la persona se vuelvairritable y que experimente dolor de cabeza y náuseas. El efecto sedante y placentero delalcohol da paso a la sensaciones molestas de la resaca.Cuanto más bebemos másalegres o sedados quedamos ymás intensa es la resaca Reacción emocional Reacción emocionalposteriormente. "positiva": Euforia y "negativa": Irritabilidad, agresividad. relajación.• Las reacciones emocionales cambian con la experiencia. La reacción primaria se hace más débil y su postefecto se hace más fuerte. La habituación de la Tolerancia a las drogas: primera reacción a la droga se llama tolerancia a la droga, lo que habituación a la emoción primaria que producen. hace referencia a la disminución en la efectividad a una droga con las exposiciones repetidas.Solomon y Corbit (1974) destacaron que se producen patrones de reacción emocionalsimilares con otros estímulos emocionales. El amor y el apego, por ejemplo, la habituaciónprimaria va acompañada de un fortalecimiento del postefecto afectivo. 28 Descargado del campus, http://campus.felizmente.info
  • 31. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010La teoría del proceso oponente.La teoría del proceso oponente de la motivación se diseño para explicar estos tres rasgoscaracterísticos de las reacciones emocionales: 1. Las reacciones emocinales son bifásicas; a una reacción primaria sigue un postefecto opuesto. 2. La reacción primaria se debilita con la estimulación repetida. 3. El debilitamiento de la reaccion primaria va acompañado por un fortalecimiento del postefecto. Esta teoría asume que hay que mantener el equilibro (homeostasis) emocional. Toda emoción primaria, activa un proceso oponente de signo contrario para compensarla. El porceso oponente empieza siendo más débil que el proceso primario (ejemplo, felicidad) pero también aumenta de fuerza más rápido que el proceso primario. Por lo tanto, con la estimulación repetida, el proceso oponente se va haciendo más fuerte que el proceso primario ( la tristeza gana a la felicidad). Esto sería Habituación..Mecanismos oponentes durante la exposición inicial al estímulo. La figura 2.16 muestra cómo los procesos primario y oponente determinan la respuesta iniciales de un organismo ante un estímulo emocional activador. Cuando el estímulo se presenta por primera vez (panel inferior) el proceso a tiene lugar sin la oposición del proceso b. Esto permite que la reacción emocional primaria alcance su nivel más alto. Después se activa el proceso b y comienza a oponerse al proceso a. Sin embargo, en la primera presentación del estímulo el proceso b no es lo suficientemente fuerte para compensar por completo la respuesta emocional primaria, que persiste mientras está presente el estímulo elicitante. Cuando el estímulo se retira, el proceso a se detiene rápidamente, pero el proceso b Figura 2.16 permanece por algún tiempo. En ese momento, nohay nada que se oponga al proceso b, y la respuesta emocional característica del procesooponente se hace evidente por primera vez. Estas emociones son por lo general opuestas alas que se observan durante la presentación del estímulo. 29 Descargado del campus, http://campus.felizmente.info
  • 32. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010Mecanismos oponentes tras la exposición prolongada al estímulo. La figura 2.17 muestra cómo funcionan los procesos primarios y oponentes tras la exposición prolongada al estímulo. Un estímulo familiar no elicita reacciones emocionales fuertes, pero el postefecto afectivo tiende a ser más fuerte cuendo termina un estímulo familiar. La teoría del proceso oponente explica este resultado asumiendo que el proceso b fortalece con la exposición prolongada al estímulo. El fortalecimiento del proceso b se refleja en varias de sus características: se activa antes tras la aprición del estímulo, su intensidad máxima se hace mayor y tarda más tiempo en decaer tras la desaparición del estímulo. Por el contrario, se Figura 2.17 asume que el proceso a pertenece inalterado. Por tanto, tras la presentación repetida de unestímulo, la respuesta emocional primaria queda compensada de forma más efectiva por elproceso oponente. Este fortalecimiento del proceso oponente reduce la intensidad de lasrespuestas emocionales primarias observadas durante la presentación del estímuloemocional activador. También da lugar a un postefecto emocional intenso cuando el estímulose retira.Motivación y postefecto oponente. Si los efectos placenteros iniciales de una drogapsicoactiva desaparecen en los consumidores habituales ¿por qué continúan tomando ladroga? ¿Por qué se hacen adictos?. La teoría del proceso oponente suguiere que la adiccióna las drogas es principalmente un intento de reducir la aversión producida por el postefectoafectivo de las drogas. Hay dos formas de reducir los postefectos oponetes aversivos.Esperar a que se disipen ( "pasar el mono" , puede tardad mucho tiempo y puede ser muyduro) o tomando de nuevo la droga para reducir más rápidamente los postefectosoponentes. Quedan atrapados, no por el placer directo que obtienen de la droga, sino de lanecesidad de reducir los efectos de la retirada.Valoración general de la teoría del proceso oponente. La teoría del proceso oponenteresultó muy atractiva cuando se presentó, ya que abarca un amplio rango de situaciones yproporciona una interesante explicación de la tolerancia a las drogas, así como ladependencia y la adicción. Aún está pendiente de probar de forma empírica muchas de suspredicciones en varias situaciones. 30 Descargado del campus, http://campus.felizmente.info
  • 33. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010 Adicción a las drogas y proceso oponente Las drogas ( en general, toda sustancia psicoactiva) activan un proceso primario positivo (euforía, "colocón") y también un proceso oponente negativo ("bajón", resaca, "mono") que le sigue después. 1 . Nada más tomar la droga, el proceso primario gana ("colocón"). 2. Al retirar la droga, el proceso oponente permanece un tiempo ("bajón"). Con la estimulación repetida, se va haciendo más fuerte el proceso oponente (habituación=tolerancia a la droga). El usuario de la droga que ha desarrollado tolerancia siente los efectos positivos cada vez menos, y los efectos negativos cada vez más. A veces, el bajon (proceso oponente) puede durar mucho tiempo y ser inaguantable (eso es "pasar el mono"). Una manera de reducir su duración es volver a tomar la droga para reiniciar el proceso primario. Así se explica la adicción. El adicto no acude a la droga por sus efectos positivos, sino para detener los efectos negativos... por un tiempo.Variaciones en la conducta dirigida a metas.Responder para escapar de la molestia producida por la retirada de un estímulo es sólo unode los tipos de conducta motivada a dirigir a metas. Un objeto meta gratificante recibe elnombre técnico de reforzador. Las situaciones en la que los organismos respondenrepetidamente para obtener un reforzador muestran muchas de las propiedades comunesde la habituación y la sensibilización.Ejemplo: El acto de encender un lector de disco ppara escuchar una canción particular. Esmenos problable que encedndamos el lectos si el resultado es siempre la misma canción(habituación), pero esta pérdida de interés es especifica de esa canción repetida(especificidad del estímulo). Además, recuperaremos nuestro interes en la canción origianlsi no la escuchamos durante unos días ( recuperación espontánea). Nuestro interés por lacanción conocida tambien puede establecerse por la exposición a estímulos novedosos, talescomo la excitación de encontrarnos con un amigo (sensibilización)La habituación y la sensibilización son frecuentes con reforzadores sensoriales comopueden ser las piezas musicales. También tienen lugar fenómenos similares a la habituacióny la sensibilización con objetos meta consumibles, como la comida y el agua. La exposiciónrepetida a la comida, por ejemplo, provocará un descenso de la conducta dirigida a laalimentación. La disminución de la conducta dirigida a alimentos normalmente puedeatribuirse a la reducción del hambre o saciedad, pero también pueden estar involucrados losmecanismos generales de la habituación. 31 Descargado del campus, http://campus.felizmente.info
  • 34. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010TERMINOS CLAVEAdaptación sensorial Reducción temporal en la Estímulo supranormal Estímulo señal artificial-mente sensibilidad de los órganos sensoriales provocada agrandado o exagerado que elicita una respuesta por la estimulación repetida o excesiva. inusualmente vigorosa.Arco reflejo Estructura neural que consiste en una neurona aferente (sensorial), una interneurona y Fatiga Disminución temporal de la conducta causada una neurona eferente (motora) y que permite que por el uso repetido o excesivo de los músculos un estímulo pueda elicitar una respuesta refleja. involucrados en la conducta.Conducta apetitiva Conducta que tiene lugar al Interneural Neurona de la médula espinal situada principio de una secuencia natual de conducta y entre la neurona aferente (sensorial) y la que sirve para poner al organismo en contacto neurona eferente (motora) en el arco reflejo. con un estímulo desencadenante. (Véase también modo de búsqueda general y modo de búsqueda Modo de búsqueda focalizada Segundo componente focalizada.) de la secuencia de conducta de alimentación, tras la búsqueda general, en el que el organismo poneConcucta consumatoria Conducta que lleva a en marcha una conducta centada en la consumar o completar una secuencia natural de localización de un estímulo particular que indica conducta. La respusta consumatorias son, por lo la presencia de alimento. La búsqueda focalizada general, patrones de acción modal específicos de es una forma de conducta apetitiva más la especie. (Véase también modo de manipulación directamente relacionada con el alimento que la del alimento.) busqueda general.Deshabituación Recuperación de una respuesta Modo de búsqueda general Primer compnente de la habituada como resultado de la presentación de secuencia de conducta de alimentación, en la que un estímulo externo e intenso. el organismo pone en marcaha una conducta motora sin dirección fija. La búsqueda general esEfecto de habituación Disminución progresiva en el una forma de conducta apetitiva. vigor de la conducta elicitada que puede tener lugar con la presentación repetida del estímulo Modo de manipulación del alimento Último elicitante. componente de la secuencia de conducta de alimentación en el que el organismo manipula yEfecto de sensibilización Incremento en el vigor de consume el alimento. Es similar a lo que los la conducta elicitada que puede resultar de la etólogos llaman conducta consumatoria. presentación repetida del estímulo elicitante o de la exposición a un estímulo externo intenso. Neurona aferente Neurona que transmite mensajes de los órganos de los sentidos al sistema nerviosoEstímulo desencadenante Lo mismo que estímulo central. También recibe el nombre de neurona señal. sensorial.Estímulo señal Rasgo específico de un objeto o Neurona eferente Neurona que transmite los animal que elicita una pauta de acción modal en impulsos a los músculos. También llamada otros organismos. También llamado estímulo neurona motora. desencadenante. Neurona motora Lo mismo que neurona eferente. Neurona sensorial Lo mismo que neurona aferente. 32 Descargado del campus, http://campus.felizmente.info
  • 35. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capitulo 2: Conducta elicitada, habituación y sensibilización Juan Carlos Cabrera – 2009/2010 Recuperación espontánea Recuperación de unaPAM Abreviatura de pauta de acción modal. respuesta habituada o de una respuesta exinguida tras un período de descanso.Pauta de acción modal Patrón de respuesta exhibido de forma similar por la mayoría de los miembros Reforzador Estímulo cuya administración de una misma especie. Las pautas de acción modal inmediatamente posterior a una respuesa se utilizan como unidades básicas de conducta en incrementa la probabilidad futura de dicha las investigaciones etológicas de respuesta. comportamiento. Abreviatura PAM. Sistema de estado Estructuras neurales queProceso a Lo mismo que proceso primario en la teoría determinan el nivel general de responsividad o de proceso oponente de la motivación. tendencia a responder del organismo.Proceso b Lo mismo que proceso oponente en la teoría de proceso oponente de la motivación. Sistema E-R Ruta neural más corta que conecta los órganos sensoriales estimulados por un estímuloProceso de habituación Mecanismo neural activado elicitante con los músculos involucrados en la por la repetición de un estímulo que reduce la producción de respuesta elicitada. magnitud de las respuestas elicitadas por ese estímulo. Tolerancia a las drogas Reducción en la efectividad de una droga como resultado del uso repetido deProceso de sensibilización Mecanismo neural que la droga. incrementa la magnitud de las respuestas elicitadas por un estímulo.Proceso oponente Mecanismo compensatorio que tiene lugar en respuesta al proceso primario elicitado por eventos biológicamente significativos. El proceso oponente provoca cambios fisiológicos y conductuales opuestos a los que provova el proceso primario. También llamado proceso b.Proceso primario Primer proceso elicitado por un evento biológicamente significativo. También llamado proceso a. 33 Descargado del campus, http://campus.felizmente.info
  • 36. Descargado del campus, http://campus.felizmente.info
  • 37. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos Cabrera - 2009/2010Los primeros años del acondicionamiento clásico- Los descubrimientos de Vulfson y Snarskii- El paradigma de condicionamiento clásicoSituaciones experimentales- Condicionamiento del miedo.- Condicionamiento del parpadeo.- Seguimiento del signo.- Aprendizaje de aversión al sabor.Procedimientos de condicionamiento pavloviano excitatorio- Procedimientos típicos de condicionamiento pavloviano.- Medida de las respuestas condicionadas.- Procedimientos de control en el condicionamiento clásico.- Eficacia de los procedimientos típicos de condicionamiento.Condicionamiento pavloviano inhibitorio- Procedimientos de condicionamiento inhibitorio.- Mediación de la inhibición condicionada.Predominio del condicionamiento clásico 35 Descargado del campus, http://campus.felizmente.info
  • 38. Descargado del campus, http://campus.felizmente.info
  • 39. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraEl condicionamiento clásico es el mecanismo más simple por el cual los organismos puedenaprender acerca de las relaciones entre estímulos y cambiar su conducta en conformidadcon la misma. Permite a los seres humanos y a los demás animales aprovecharse de lasecuencia ordenada de eventos de su ambiente y aprender qué estímulos tienden a ir conqué evento.Los Primeros años del condicionamiento clásico (página 60 del libro)Comenzaron con el trabajo del fisiólogo ruso Ivan P. Pavlov. Los descubrimientos de EdwinB. Twitmyer sobre el condicionamiento clásico, que realizó en su tesis doctoral, en el que noinvestigó sistemáticamente las implicaciones y sus hallazgos no despertaron gran atención.Como una estensión más de los estudios que Pavlov realizó sobre la digestión, su equipoténico descubrió que los perro secretaban jugos gástricos en respuesta de la mera visión dela comida o la persona que normalmente se las suministraba. Sus técnicos del laboratorio lollamaban "secreciones psíqicas" .Los descubrimientos de Vulfson y SnarskiiLos primeros estudios sistemáticos sobre el condicionamiento clásico fueron realizados porS. G. Vulfson y A. T. Snarskii en el laboratorio de Pavlov.Vulfson estudió la respuesta salival de los perros con productos naturales. Después de quelos perros hubieran experimentado la sensación provocada por estas sustancias en susbocas, la mera visión de la misma era suficiente para provocar salivación.Snarskii extendió estas observaciones a sustancias artificiales.El aprendizaje de objeto, requiere asociar diferentes características de un mismo objeto.El paradigma de condicionamiento clásicoEl procedimiento básico de Pavlov para el estudio de la salivación condicionada conlleva dosestímulos: un tono o luz que no provoca salivación al principio y un alimento o solución ácidasituada en la boca que provoca una fuerta salivación.EC o Estímulo condicionado sería la luz.EI o Estímulo incondicionado sería el alimento.RC o Respuesta condicionada sería la respuesta provocada por la Luz.RI o Respuesta incondicionada sería la salivación provocada por el alimento. 37 Descargado del campus, http://campus.felizmente.info
  • 40. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos Cabrera 38Descargado del campus, http://campus.felizmente.info
  • 41. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraSituaciones experimentales (página 63 del libro)Condicionamiento del miedo.Watson y Rayner (1920) condicionaron la respuesta de miedo en unniño de 9 meses, Albert, a la presentación inofensiva de una ratablanca de laboratorio. Albert se alarmaba cuando se hacía sonar unfuerte sonido, así que cada vez que le presentaba la rata segolpeaba una barra de acero. Después de cinco ensayos, Albertmostró una reacción de miedo intenso ante la rata. Este miedo segeneralizó rápidamente a otros objetos peludos.Desde el estudio de Albert, los experimentos se realizan sobretodo con ratas de laboratorio. El EI aversivo (odioso o John Broadus Watson (1878-1958)desagradable) utilizado en estos estudios es una breve descargaeléctrica administrada directamente en las patas del animal mediante un rejilla metálica,con una intensidad y duración que no provoque daño tisular (de los tejidos u organos). El ECpuede ser un tono o una luz.La respuesta de miedo de las ratas es quedarse quietas, así se utiliza una técnica popular demedida indirecta del miedo condicionado como es el procedimiento de respuesta emocionalcondicionada o supresión condicionada (REC) diseñada por Estes y Skinner (1941). Consisteen primero enseñar al sujeto (rata) a presionar una barra varias veces para obteneralimento como recompensa de forma regular. Después comienza la segunda fase queconsiste en presentar un EC (un tono) durante 1 o 2 minutos e inmediatamente aplicarle unabreve exposición a la descarga. Espaciando los ensayos entre 15 o 20 minutos.La supresión condicionada puede ser completa, de modo que las ratas no presionen enabsoluto la barra, en 3 o 5 ensayo de condicionamiento. Sin embargo, la supresión esespecífica de del EC y cuando desaparece, los animales vuelven rápidamente a su conductapara obtener comida.Para medir cuantitativamente la supreción condicionada se calcula una razón de supresión. Respuesta durante EC Razón de supresión = Respuesta durante el EC + Respuesta durante el pre − EC La razón de supresión adopta un valor 0 si la rata deja de presionar la palanca completamente durante el EC, ya que el numerador de la fórmula es 0. En el otro extremo, si la rata no altera su ritmo de presiones en absoluto cuando se presenta el EC, la razón tiene un valor de 0,5. 39 Descargado del campus, http://campus.felizmente.info
  • 42. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraAlgunos investigadores prefieren el procedimiento de supresión condicionada del lameteoporque requiere menos entrenamiento para hacer que las ratas beban del tubo que para quepresionen una palanca y obtener comida. En el procedimiento de supresión del lameteo, seregistra el tiempo que el animal tarda en completar un total de 5 segundos de lameteo comomedida de la supresión de la respuesta.Condicionamiento del parpadeo.El reflejo palpebal es un reflejo discreto ( moderado, sin exceso, que no destaca ). Unsoplo suave en un ojo hace que se parpadee. Si el aire está precedido de un tono breve, esproblable que la persona aprenda a parpadear cuando aparece el tono, anticipando el soplode aire.En un experimento se tomó dos grupos de niños de 5 meses de edad y se realizadon dosensayos . A uno de estos grupos se emparejó un tono (EC) que terminaba con un ligero soplode aire en el ojo. Al otro el tono y el soplo nunca ocurrian juntos. En el primer ensayo la tasade parpadeo no influyo en ninguno de los grupos, sin embargo, en el segundo ensayo, en elprimer grupo la tasa fue significativamente superior al segundo grupo, debido en parte a laasociación EC-EI que comenzaron a aprender en la primera sesión.Este experimento demostro varios aspectos importantes del aprendizaje: Primero, elcondicionamiento clásico requiere del emparejamiento del EC y el EI. Segundo, elaprendizaje inicial puede no ser directamente observable.El interes por el condicionamiento palpebral en humanos se debe al hecho de que se hanrealizado los progresos sutanciales en la compresión de los sustratos neurobiológicos deeste tipo de aprendizaje. Las investigaciones neurobiológicas sobre el condicionamientopalpebral se ha llevado a cabo principalmente con conejos dómesticos y fue desarrollado porGormezano. 40 Descargado del campus, http://campus.felizmente.info
  • 43. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraEl condicionamiento palpebral y la búsquea del engrama.Cuando un organismo aprende algo, el resultado de esteaprendizaje debe almacenarse en el cerebro. De algún modo, lared de neuronas que constituyen el sistema nervioso central (SNC)es capaz de codificar la relación entre evento biológicamentesignificativos y de utilizar esta información para dirigir la conductaen curso. Esta memoria biológica se denomina engrama. Según elpunto de vista tradicional, el engrama de una respuestacondicionada concreta se almacena en regiones localizadas delcerebro.Richard Thompson y sus colegas, después de casi cuatro décadasbuscando el engrama, reconoció que requeriría un sistemaconductual claramente definido en el que estuvieran precisamenteespecificados tanto las condiciones para el aprendizaje como elresultado motor. Estas consideraciones le llevaron a estudiar losmecanismos que subyacen al condicionamiento palpebral.La búsqueda del engrama comenzó por el hipocampo. Personascon daños en esta región revelaron perdida de habilidad enrecordar conscientemente un evento reciente. Colocando unaserie de electrodos a animales en el hipocampo revelaron que lascélulas reflejaban el aprendizaje por una asociación EC-EI. La ablación del hipocampo, incluso la eliminación de todas lasestructuras cerebrales por encima del cerebro medio, no eliminaba la capacidad del animal para adquirir y retener una respuestacondicionada de parpadeo. Esto sugirie que el circuito esencial para el condicionamiento palpebral se sitúa en las estructurasinferiores del tronco del encéfalo y el cerebelo. Los experimentos posteriores mostraron claramente que la adquisción de una respuesta condicionada del parpadeo bien ajustada depende de un circuito neuronal situado en el cerebelo. La respuesta incondicionada elicitada por un soplo de aire en el ojo está mediada por neuronas que se proyectan sobre una región del tronco del encéfalo conocida como núcleo trigeminal. Desde allí, las neuronas siguen dos rutas, una directa y otra a través de la formación reticular, hasta llegar al núcleo craneal motor, donde se organiza la salida conductual. Para definir este recorrido, se utilizan tres técnicas básicas. La primera consistía en tomar registros electrofisiológicos para verificar que las neuronas de ese circuito intervienen el la resusta EI. La segunda técnica consistía en desactivar el circuito neuronal, ya fuera permanentemente (eliminando las células) o temporalmente (por medio de drogas o frio), para mostrar que el circuito tiene un papel esencial en la respuesta incondincionada. Si el circuito es necesario, la alteración de sus funciones debería eliminar la salida conductual. Finalmente, se estimuló el circuito de forma artificial para mostrar que la actividad de dicho circuito era suficiente par producir la salida conductual. Las mismas técnicas (registro eléctrico, desactivación y estimulación) se utilizaron para definir el reorrido neuronal que media en la adquisición y ejecución de la respuesta condicionada.La entrada EC se trasmite hasta una región del tronco del encéfalo conocida como núcleo pontino. Desde allí, al cerebelo por medio de fibras musgosas. La señal del EI llega al cerebelo a través de fibras trepadoras. Estas dos señales se encuentran en el córtex 41 Descargado del campus, http://campus.felizmente.info
  • 44. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos Cabrera cerebeloso donde la convergencia de actividades produce una modificación sináptica que altera la salida neuronal del cerebelo. Básicamente, las fibras ascendentes actuan como “maestras”, seleccionando un subconjunto de conexiones para su modificación. Este cambio definelas propiedades del estímulo (las características del EC) que serán responsables de una salida motora concreta. Esta salida está mediada por neuronas que se proyectan desde el núcleo interpositus al núcleo rojo, y finalmente, al núcleo craneal motor. A medida que se va adquiriendo la respuesta condicionada, la actividad condicionada se desarrolla en el núcleo interpositus. Las neuronas de dicho núcleo se proyectan hacia atrás hasta el circuito del EI e inhiben la señal del mismo en la oliva inferior. Esto proporciona una retroalimentación negativa que reduce la efectividad del EI. Muchos investigadores creen que fenómeno como el bloqueo o el ensombrecimiento tienen lugar porque un EI previsto es menos eficaz. En el paradigma del condicionamiento palpebral esto podría suceder debido a que la entrada del EI está inhibida en la oliva inferior. Esta idea se ve apoyada por un experimento de Kim y colaboradores (1998), que mostró que la eliminación de esta fuente de inhibición eliminaba el efecto de bloqueo. Previamente hemos dicho que el hipocampo no es ncesario para el condicionamiento de demora simple. Sin embargo, sí interviene en formas más complejas de aprendizaje. Un ejemplo lo proporciona el condicionamiento de huella, en el que se inserta una demora temporal entre el final del EC y el principio de EI. Un animal normal puede adquirir fácilmente un parpadeo condicionado a un EC que termina 0,5 segundos antes del comienzo del EI. Sin embargo, no puede alvar este espacio si se retira el hipocampo. Se observa un patrón de resultados similar en los pacientes amnésicos que han sufrido daño en el hipocampo. Estos pacientes no pueden recordar concientemente la relación EC-EI. En ausncia de esta memoria esplícita, son incapaces de aprender con un procedimiento de huella. El aprendizaje con un procedimento de demora no se ve alterado, incluso si los pacientes no pueden recordar conscientemente la relación EC-EI de una sesión a la siguiente. Curiosamente, la alteración de conciencia en un individuo normal debilita la apreciación de la relación EC-EI con un procedimiento de huella. De nuevo, los sujetos que no pueden dar información explícita sobre la relación, son incapaces de aprender. -J.W.GrauSeguimiento del signo.Uno de los paradigmas experimentales que ha contribuido significativamente a la concepciónactual del condicionamiento pavloviano es el paradigma de seguimiento del signo oautomoldeamiento que consiste en el movimiento hacia un estímulo que señala ladisponibilidad de un reforzador, como comida, y posible contacto con el mismo.Experimentos con palomas en un laboratorio mediante la presentación de un estimulo visualdiscreto y bien localizado (una tecla luminosa) justo antes de cada administraciónautomática de alimentos, las palomas en vez de utilizar el estímulo visual para predecircuando dirigirse al comedero, picoteaban la tecla aunque no era necesario para tener accesoa la comida. Demostrando que el seguimiento del signo es una herramienta útil para elestudio del aprendizaje asociativo.El aprendizaje tiene lugar de forma rápida cuando EC se presenta justo antes del EI. Laspalomas no se aproximan a EC si el EC y el EI se presentan de forma aleatoria uno del otro.El segimiento del signo sólo es posible en situaciones en las que el EC tiene una localizaciónprecisa y puede ser "seguido". Cuando el EC es un sonido no provoca la aproximación a lafuente y sí el acercamiento al comedero. El EC tiene que ser de una modalidad yconfiguración apropiada. 42 Descargado del campus, http://campus.felizmente.info
  • 45. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraOtro factor importante es la relación entre la cantidad de tiempo que el sujeto pasa en elcontexto experimental y la duración de cada presentación del EC. Se obtienen mayoresniveles de seguimiento del signo con mayores exposiciones al contexto experimental enrelación a la duración EC.Aprendizaje de aversión al sabor.El simple acto de comer proporciona numerosas oportunidades de aprendizaje de laasociación. La experiencia de aprendizaje de aversión típica consiste en ingerir una comidacon un sabor muy distinto y posteriormente enfermar. Este emparejamiento, sabor-enfermedad, puede dar lugar a una aversión condicionada al alimento en un único ensayo, y elaprendizaje puede tener lugar incluso si la enfermedad se manifiesta con varias horas deretraso con respecto a la ingestión de la comida. Otro hallazgo interesante es que el 20%de las personas que enfermaron estaban seguras de que no lo provocó la comida. Lo queindica que el aprendizaje de aversión al sabor puede ser independiente de los procesos depensamiento racional y que puede ser contrario a las conclusiones de una persona sobre lacausa de su enfermedad.Personas con malestar gástrico producidos por tratamientos médicos, como enquimioterapia del cáncer que suele producir náuseas, pueden adquieren aversiones a losalimentos ingeridos justo antes de las sesiones, contribuyendo a la falta de apetito, a lasupresión de la ingesta de alimento o anorexia.El desarrollo de tumores, depresiones severas y la anorexia nerviosa, entre otras, puedencontribuir a incrementar la probabilidad de aprender aversión al sabor. La aversión al sabor es el resultado del emparejamiento de un EC (un sabor) con un EI (malestar: una droga o exposición a radiación) similar a otros ejemplos de condicionamiento clásico, y sigue las mismas leyes de aprendizaje en muchos aspectos. También tiene caracteristicas especiales: • Primero, puede aprenderse con un solo ensayo aversión al sabor por el emparejamiento del sabor y la enfermedad. • Segundo, puede darse después de varias horas de la exposición al nuevo sabor. Probablemente sea un aprendizaje demorado de la aversión al sabor que ha evolucionado para permitir a os animales evitar alimentos venenosos con efecto retardado. 43 Descargado del campus, http://campus.felizmente.info
  • 46. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraProcedimientos de Condicionamiento Pavloviano Excitatorio(página 74 del libro)Procedimientos típicos de condicionamiento pavloviano.Uno de los factores críticos que determinan el curso del condicionamiento clásico es laordenación temporal del EC y el EI. Pequeñas variaciones en la forma de emparejarlospueden tener importantes efectos en la intensidad de la RC.A continuación se muestran cinco procedimientos comunes de condicionamiento clásico. La distancia horizontal representa el paso del tiempo; el desplazamiento vertical el momento en ue cada estímulo aparece ydesaparece. Cada configuración EC y EI representa un único ensayo de condicionamiento. Tiempo Inicio Final Procedimiento de condicionamiento clásico en el que el estímulo EC condicionado aparece poco antes del estímulo incondicionado enCondicionamiento cada ensayo de condicionamiento.de demora corta EI Procedimiento de condicionamiento clásico en el que el estímulo EC incondicionado se presenta poco después de que haya terminado elCondicionamiento estímulo condicionado.de huella EI Similar al procedimiento de condicionamiento de demora corta, EC en que el EC comienza antes que el EI, sin embargo, EI se demora másCondicionamiento tiempo (5-10 minutos).de demora larga EI Procedimiento de condicionamiento clásico en el que el estímulo EC condicionado y el incondicionado se presenta simultáneamente enCondicionamiento cada ensayo condicionado.simultaneo EI Procedimiento de condicionamiento clásico en el que el estímulo EC condicionado se presenta en todos los ensayos después del estímuloCondicionamiento incondicionado.hacia atrás EI 44 Descargado del campus, http://campus.felizmente.info
  • 47. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraUn experimento típico de condicionamiento clásico, los episodios EC-EI se repiten variasveces a lo largo de la sesión de entrenamiento. El tiempo entre el final de un ensayo y elcomienzo del siguiente se llama intervalo entre ensayos. El tiempo entre el comienzo del ECy el comienzo del EI en un mismo ensayo se llama intervalo entre estímulos o intervaloEC-EI.Medida de las respuestas condicionadas.Para poder medir el condicionamiento, en cualquiera de los procedimientos anteriores, hayque realizar un ensayo de prueba, consistente en la presentación del EC aislado (sin el EI) yobservar la respuesta del EC sin la contaminación procedente de la respuesta provocada porel EI. Estos ensayos pueden introducirse periodicamente a lo largo del curso delentrenamiento para hacer un seguimiento del proceso de aprendizaje.La conducta EC puede cuantificarse:• Por la magnitud de la respuesta condicionada (Pavlov midió en número de gotas de saliva elicitada por un EC).• Por la probabilidad de la respuesta (en estudios de condicionamiento palpebral, el porcentaje de ensayos en los que el EC provoca una respuesta condicionada).• Por latencia de la respuesta (es la cantidad de tiempo que pasa entre el principio del EC y la aparición de la respuesta condicionada).En procedimientos de demora y huella, el EC aparece de forma aislada al principio de cadaensayo, por lo que puede utilizarse como medida del aprendizaje al no estar contaminadapor el EI. Por el contrario, ensayos de condicionamiento simultáneo y hacia atrás larespuesta durante el EC puede reflejar presencia del EI o su presentación reciente. Portanto, los ensayos de prueba resultan cruciales para evaluar el aprendizaje en estas dos.Procedimientos de control en el condicionamiento clásico.Un ensayo de prueba válido no es suficiente para tener evidencias concluyentes decondicionamiento clásico. En los estudios de habituación y sensibilización tan sólo eran deinterés los efectos de exposición previa al un estímulo. El procedimiento de comparación ocontrol consistía en la ausencia de exposición al estímulo. Cuando el estudio es la forma enla que se asocian los EC y EI, los procedimientos de control son más complicados.Una asociación EC-EI implica que dos eventos se han conectado de alguna forma. DespuésEC adquiere la capacidad de activar procesos relacionados con el EI. Requiere algo más queuna familiaridad. Para concluir que se ha establecido asociación, debemos asegurarnos de 45 Descargado del campus, http://campus.felizmente.info
  • 48. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos Cabreraque el cambio conductual observado no podría haberse producido por la mera presentaciónde EC o del EI por separado.El incremento en la respuesta podría resultar de la sensibilización y no por un procesoasociativo. La presentación de un estímulo activador, como la comida a un animalhambriento, puede incrementar la conducta provocada por un estímulo menos efectivo, talcomo un tono, sin que se haya establecido ninguna asociación entre los dos estímulos. Portanto, el incremento de la respueta que se observa con el emparejamiento repetido del EC yel EI podría ser, en realidad, el resultado de una mera exposición al EI. Los casos en los quela mera exposición al EI da lugar a respuestas similares a la respuesta condicionada recibenel nombre de pseudocondicionamiento. Para determinar si la respuesta que se dan ante elEC representa una asociación entre EC-EI, en lugar de sensibilización debido a la exposicióna los EC y EI, se requieren procedimientos de control.Uno de los procedimientos discutidos por los investigadores es el de control aleatorio, en elque los estímulos condicionado e incondicionado se pesentan en momentos aleatorios unorespecto al otro. Desafortunadamente hay evidencias de que puede dar lugar a aprendizajeasociado.Un procedimiento más útil es el denominado control desemparejado explícito, que consisteen la presentación de los estímulos condicionados e incondicionado en diferentes ensayos,pero con el suficiente espacio temporal para evitar que se asocien.Eficacia de los procedimientos típicos de condicionamiento.En general, se ha observado poco condicionamiento en los procedimientos decondicionamiento simultáneo, en los que el intervalo EC-EI es cero. Una ligera demora de lapresentación EI tras el EC a menudo facilitaba la Respuesta Condicionada. Sin embargo, siel intervalo se incrementaba más, la RC disminuía. Incluso en el procedimiento de aversión alsabor, donde el aprendizaje es posible con intervalos de 1 ó 2 horas, la RC disminuye amedida que se aumente el intervalo.Se consolida la idea de que el condicionamiento es más efectivo cuando el EC es una buenaseñal de que EI aparecerá pronto. El valor de la señal es mejor en el procedimiento dedemora corta, en el que el EI tiene lugar poco después de la aparición del EC. El valor de laseñal EC disminuye a medida que se incrementa el intervalo EC-EI. También el EC es malpredictor del EI en los procedimientos simultáneo y de huella. El procedimiento simultáneose presenta el EC junto con EI y por tanto EC no señala la parición del EI. En el intervalo dehuella el EC va seguido por el intervalo de huella en lugar del EI. 46 Descargado del campus, http://campus.felizmente.info
  • 49. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraEl condicionamiento hacia atrás produce resultadoa ambiguos. Algunos han observadocondicionamientos excitatorio y otros de tipo inhibitorio, mientras que otros encontraronexcitatorios e inhibitorio.Nuevas tendencias emergentes sobre los procedimientos de demora, simultáneo, de huella yhacia atrás, conceptualizan que todos ellos producen un aprendizaje sólido y una respuestacondicionada vigorosa, pero lo que los sujetos aprenden es direrente en cada caso. En vezde aprender una mera asociación EC-EI, se asume que también se aprende cuándo apareceel EI en relación al EC, denominadose tal fenómeno hipótesis de la codificación temporal.La idea es que puede obtenerse diferentes tipos de RC dependiendo de la informacióntemporal acerca del EI que proporciona el EC.Condicionamiento Pavloviano Inhibitorio (página 79 del libro)La exposición a estímulos aversivos impredecibles es muy perturbador y produce úlceras deestómago y otros sintomas fisiológicos del estrés.Otra fuente de estrés es el ataque depánico (sensación repentina de miedo oincomodidad, acompañada de síntomasfísicos -por ejemplo, taquicardia- y unasensación de desastre inminente).Cuando son frecuentes se dice que elindividuo sufre de un trastorno depánico y a veces estas personas puedenpredecirlos. En un estudio con estosindividuos se midieron la ansiedadgeneral de los sujetos antes y despuésde cada tipo de ataque (predecibles eimpredecibles). Antes de los ataques los Niveles de ansiedad general de individuos con trastorno de pániconiveles de ansiedad eran similares, antes y después de ataques de pánico previstos e imprevistos.después del ataque de pánico la ansiedadse incrementaba si este era imprevisto y disminuía tras un ataque previsto. Demostrandoque son preferibles los ataque cuando son predecibles. Las señales que predicen la ausencia de un estímulo aversivo son estímulos condicionadosinhibitorios. 47 Descargado del campus, http://campus.felizmente.info
  • 50. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraProcedimientos de condicionamiento inhibitorioLa inhibición condicionada tiene un requisito importante, y es que, para que la ausencia deEI sea significativa, este debe ocurrir periódicamente en la situación. Procedimiento estandar de inhibición condicionada. Se requiere dos estimulos condicionados y dos tipos de ensayo de condicionamiento, uno Procedimiento estándar de inhibición condicionada. En algunos ensayos (Tipo A) para el condicionamiento el EC+ se empareja con el EI. En otros ensayos (tipo B) el EC+ se presenta excitatorio y otro para el junto con el EC- y se omite el EI. El procedimiento resulta efectivo para condicionar propiedades inhibitorias al EC-. condicionamiento inhibitorio.Ensayo Tipo A (condicionamiento exitatorio): Siempre que aparece el EI va anunciado por elestimulo condicionado EC+, conviertiendose así por asociación en una señal del EI y sirvepara proporcionar el contexto excitatorio necesario para el desarrollo de la inhibicióncondicionada.Ensayo B (condicionamiento inhibitorio): El EC- se presenta en el contexto excitatorioproporcionado por el EC+, pero no se empareja con el EI. Esto convierte al EC- en uninhibidor condicionado.A lo largo del tratamiento, los ensayos se alternan de forma aleatoria. A medida que elanimal recibe ensayos repetidos del EC+ seguido del EI y ensayos del EC+ y el EC- seguidosde la ausencia de EI, el EC- adquiere gradualmente propiedades inhibitorais.Ejemplo: Un semáforo rojo en un cruce transitado es una señal (EC+) de un peligro potencial(EI). Sin embargo, si un agente de policía indica con su silbato (EC-) que debemos cruzar, apesar de la luz roja, es poco probable que tengamos un accidente y el peligro señalado por elsemáforo queda bloqueado o inhibido por silbato.Contingencia o correlaciónnegativa entre el EC y el EI.Otro procedimiento paraproducir inhibición condicio-nada que no requiere un estímulo excitatorio EC+ explícito; en lugar de eso, se utiliza unúnico EC- que está negativamente correlacionado con el EI. Una correlación o contingencianegativa indica que el EI es menos probable tras el EC que en otro momento. 48 Descargado del campus, http://campus.felizmente.info
  • 51. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraEl EC señala una reducción en la probabilidad de que aparezca el EI. Como por ejemplo, Losniños que se meten con un compañero en clase y dejan de hacerlo en presencia del profesor.El profesor funciona como EC- que señala un período libre de acoso, o ausencia EI.En el procedimiento de contigencia negativa EC-EI, el EI aversivo puede aparecer de vez encuando tras el EC, pero con una probabilidad pequeña. Es mucho más probable que el EIaversivo aparezca en ausencia del EC, dando lugar a una contingencia negativa entre el EC yel EI. Sin embargo, incluso en ausencia del EC, el momento exacto de presentación del EI nopuede predecirse. El EI tiene lugar de forma probabilística, a diferencia del procedimientoestándar, en el que el EI siempre aparece al final del EC+ y no aparece cuando se presentael EC- junto con el EC+. Así podemos predecir el momento preciso de la aparición del EI, ytambién permite predecir cuándo no va a aparecer, posibilitando la codificación temporal dela ausencia del EI.Medición de la inhibición.Los estímulos inhibitorios elicitan reacciones opuestas a los estímulos condicionadosexcitatorios. Si los estímulos condicionados excitatorios provocan salivación, los estímulosinhibitorios provocan la supresión de la salivación.Sistema de respuesta bidireccionales. La identificación de tendencias de respuestaopuesta es sencilla en aquellos sistemas de respuesta que pueden variar en direccionesopuestas con respecto a una línea base de ejecución normal. Por ejemplo, una paloma puedeacercarse a una tecla luminosa asociada con la presentación subsiguiente de comida ocuando se utiliza un procedimiento inhibitorio, alejarse de la luz.Una limitación es que este método funciona sólo con respuestas que pueden ir endirecciones opuestas. Otra es que esta técnica puede mostrar sólo el efecto neto de laexcitación y la inhibición. El sujeto se aproxima a EC si excitación es mayor a la inhibicióny se aleja en caso contrario. La paloma no puede acercarse y alejarse al mismo tiempo. Estoinvalida el procedimiento para los casos en que EC adquiere ambas propiedades (exitatoriase inhibitorias)La prueba del estímulo compuesto o sumación. Cuando la conducta no es bidireccional elprocedimiento más aceptado por los investigadores para la medición de la inhibicióncondicionada es la prueba de sumación o del estímulo compuesto. La prueba requiereobservar los efectos de un EC inhibitorio en compuesto con un EC+ exitatorio. 49 Descargado del campus, http://campus.felizmente.info
  • 52. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraExperimento de lameteo con ratas de laboratorio: Prueba del estímulo compuesto de la inhibición en un experimento de supresión del lameteo. Los estímulos A y B se condicionaron como estímulos excitatorios mediante la presentación de cada uno de ellos por separado junto con la descarga (A+ y B+). El estímulo X se condicionó como inhibidor presentándolo junto con el estímulo A sin la descarga (AX-). El estímulo Y era un estímulo de control que no había intervenido en ningún condicionamiento excitatorio o inhibitorio. A era una luz brillante. B, X e Y eran claves auditivas ( un clic, un ruido blanco y un zumbador, contrabalanceados). A y AX se pusieron a prueba con el contexto original de condicionamiento. B, BX y BY se pusieron a prueba en un contexto diferente. (Para detalles adicionales, vease Cole, Barnet y Miller, 1997, Experimento 1.El procedimiento de prueba del estímulo compuesto para la inhibición condicionada sugiereque la presentación de un inhibidor condicionado o de una señal de seguridad puede reducirlos efectos estresantes de una experiencia aversiva.La prueba de retraso en la adquisición. Si un estímulo inhibe de forma activa unarespuesta particular, entonces debería ser especialmente difícil de condicionar eseestímulo para que provoque la conducta. 50 Descargado del campus, http://campus.felizmente.info
  • 53. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraRetomando el experimento anterior, en una cámara experimental diferente a las utilizadasanteriormente para realizar el entrenamiento inhibitorio, Cole y sus colegas tomaron elestímulo X (que había sido condicionado como inhibidor) y el estímulo Y ( que no habíautilizado con anterioridad en el procedimiento de condicionamiento ) y realizadon unaprueba de retraso en la adquisición emparejando tres veces cada uno de estos estímulos conuna descarga. Tras los tres ensayos sometierón a prueba para ver cuál provocaba una mayorsupresión de la conducta de beber. El tiempo empleado en completar un total de 5 segundosde ingestión de agua fue mayor en presencia del estímulo de control Y que en presencia delestímulo X. El entrenamiento inhibitorio inicial de X retrasó la adquisición de propiedadesexcitatorias de miedo condicionado.La inhibición condicionada puede ser difícil de distinguir de otros procesos conductuales. Lamejor estrategia es utilizar más de una prueba y asegurarse de que las diferentes pruebasseñalan la misma conclusión. La estrategia dual ( utilización tanto la prueba de estímulocompuesto como de la del retraso en la adquisición) ha gozado de popularidad desde que lopropuso Rescorla (1969).PREDOMINIO DEL CONDICIONAMIENTO CLÁSICO (página 86 del libro)El condicionamiento clásico se estudia normalmente en situaciones de laboratorio, aunquetambién ocurre en una gran variedad de situaciones fuera de este. Aparece con mayorprobabiliad cuando un evento predice a otro regularmente y con una demora corta entre elEC y el EI.Un área de investigación particularmente interesante es cómo las personas llegan aconsiderar que un evento es la causa de otro, denominado juicios de causalidad humanos. Losestudios sobre causalidad se parecen a los estudios sobre condicionamiento pavloviano enque ambos conllevan experiencias repetidas con dos eventos y respuestas basadas en elgrado en que esos dos eventos están relacionados. Los mecanismos asociativos pavlovianosno se limitan a los perros de Pavlov, sino que pueden tener un importante papel en los juiciosde causalidad informales que realizamos en el curso de nuestra vida cotidiana.El condicionamiento pavloviano puede dar lugar al condicionamiento de preferencias yaversiones alimenticias, adquisición de miedo (ansiedad, fobias y trastornos del pánico),tolerancia y adición a las drogas ...El condicionamiento pavloviano también interviene en las respuestas de los niños y de lasmadres durante la lactancia. Para que el amamantamiento sea satisfactorio, la madre debemantener al bebé en una postura determinada, que proporcione estímulos táctiles especialestanto para la madre como para el niño. Los estímulos táctiles que percibe el niño puedencondicionarse y elicitar respuestas de orientación y succión. Los estímulos táctiles 51 Descargado del campus, http://campus.felizmente.info
  • 54. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos Cabreraexperimentados por la madre que amamanta a sus hijos suelen experimentar el reflejo desecreción de lecha cuando el niño llora o cuando llega lahora habitual de amamantamiento.Todos estos estímulos preceden de forma regular a la succión del bebé y por tanto puedencondicionarse a la estimulación propia de la succión y adquirir la capacidad de provocar lasecreción de lecha como respuesta condicionada. Las respuestas anticipatorias deorientación y succión y la respuesta anticipatoriade secreción de leche hace que la lactanciasea más satisfactoria tanto para la madre como para el niño.El condicionamiento pavloviano también es importante en el aprendizaje acerca desituaciones sexuales. Estudios realizados con animales machos y como estímulo condicionadola visión de una hembra sexualmente receptiva o el acceso a una hembra, los sujetos acabanaproximandose a los estímulos que señalan la disponibilidad de un compañero sexual. Laexposición a un EC sexual realizan la respuesta copulatoria más rápidamente, compitenmejor con otros machos por el acceso a una hembra, muestran más conducta de cortejo,liberan una mayor cantidad de esperma y muestran un incremento en los niveles detestosterona y hormona luteinizante. Incluso incrementan el número de crías en algunasespecies de peces y codornices estudiadas.COMENTARIOS FINALESEn este Capítulo se ha continuado el estudio sobre la conducta elicitada desplazando laatención de la habituación y la sensibilización al condicionamiento clásico, más complejo, yaque está mediada por mecanismos asociativos. El condicionamiento clásico es una de lasprincipales técnicas para investigar cómo se aprenden las asociaciones y pueden interveniren muchos aspectos importantes de la conducta. Dependiendo del procedimiento empleado,el aprendizaje puede tener lugar de manera rápida o lenta. Con algunos procedimientos, seaprenden tendencias de respuesta excitatorias y con otros, el organismo aprende a inhibiruna respuesta particular en presencia del estímulo condicionado. El condicionamientoexitatorio e inhibitorio tiene lugar en muchos aspectos de la experiencia cotidiana y sirvepara mejorar la efectifidad con la que nos enfrentamos a eventos biológicamentesignificativos. 52 Descargado del campus, http://campus.felizmente.info
  • 55. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos Cabrera Ensayo de condicionamiento Episodio de entre-TÉRMINOS CLAVE namiento compuesto por la presentación de un estímulo condicionado con ( o sin) un estímuloAprendizaje de objeto Aprendizaje de asocia- incondicionado. ciones entre diferente elementos de un objeto. Ensayo de prueba Ensayo en el que se presenta elAutomoldeamiento Lo mismo que seguimiento del estímulo condicionado sin el estímulo incondicio- signo. nado. Esto permite medir la respuesta condiciona- da en ausencia de la respuesta incondicionada.Condicionamiento de demora corta Procedimiento de condicionamiento clásico en el que el estímulo Estímulo condicional o condicionado Estímulo que condicionado aparece poco antes del estímulo inicialmente no provoca una respuesta particular, incondicionado en cada ensayo de condiciona- pero que adquiere la capacidad de hacerlo como miento. resultado del desarrollo de una asociación con un estímulo incondicionado. Abreviatura EC.Condicionamiento de huella Procedimiento de condicionamiento clásico en el que el estímulo Estimulo incondicional o incondicionado Estímulo incondicionado se presenta poco después de que que elicita una respuesta particular sin necesidad haya terminado el estímulo condicionado. de entrenamiento. Abreviatura EI.Condicionamiento hacia atrás Procedimiento de Hipótesis de la codificación temporal Idea según condicionamiento clásico en el que el estímulo la cual el condicionamiento pavloviano lleva, no condicionado se presente en todos los ensayos sólo al aprendizaje de que el EI ocurre, sino después del estímulo incondicionado. también de cuándo ocurre en relación al EC. El EC representa ( o codifica) la disposición temporalCondicionamiento simultáneo Procedimiento de del EI. condicionamiento clásico en elque el estímulo condicionado y el incondicionado se presentan Intervalo de huella Intervalo entre el final del simultáneamente en cada ensayo de condiciona- estímulo condicionado y el principio del estímulo miento. incondicionado en los ensayos de condiciona- miento de huella.Control aleatorio Procedimiento en el que los estímulos condicionado e incondicionado se Intervalo EC-EI Lo mismo que intervalo entre rpresentan en momentos aleatorios uno con res- estímulos. pecto a otro. Intervalo entre ensayos Cantidad de tiempo queControl desemparejado explícito Procedimiento en pasa entre dos ensayos consecutivos. el que se presentan tanto el estímulo condicionado como el incondicionado, pero con el Intervalo entre estímulos Cantidad de tiempo que suficiente tiempo entre ellos como para que no se pasa entre el comienzo del estímulo condicionado asocien el uno del otro. (EC) y el comienzo del estímulo incondicionado (EI) durante un ensayo de condicionamientoEC Abreviatura de estímulo condicionado. clásico. También llamado intervalo EC-EI.EI Abreviatura de estímulo incondicionado. Latencia Tiempo transcurrido entreel comienzo de un estímulo (o el comienzo de un ensayo) y la respuesta que se da a ese etímulo. 53 Descargado del campus, http://campus.felizmente.info
  • 56. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 3: Condicionamiento clásico: fundamentos Juan Carlos CabreraMagnitud de la respuesta Medida del tamaño, Respuesta emocional condicionada Supresión devigor o extensión de una respuesta. una conducta instrumental positivamente reforzada (por ejemplo, presión de una palanca para obtenerProbabiliad de una respuesta Probabilidad de que alimento) provacada por la presentación de unse realice una respuesta, normalmente represen- estímulo que se ha asociado con un estímulotada en términos de porcentaje de ensayos en los aversivo. Abreviatura REC. También llamadaque tiene lugar la respuesta. supresión condicionada.Prueba de retraso en la adquisición Procedimien- Respuesta incondicional o incondicionada Res-to de prueba que identifica un inhibidor condicio- puesta que provoca un estímulo sin necesidad denado si ese estímulo tarda más tiempo en adquirir entrenamiento previo.propiedades exitatorias que un estímulo de compa-ración. RI Abreviatura de respuesta incondicionada.Prueba de sumación Lo mismo que prueba del estí- Seguimiento del signo Movimiento hacia unmulo compuesto. estímulo que señala la disponibilidad de un reforza- dor positivo, como comida, y posible contacto con elPrueba del estímulo compuesto Procedimoento de mismo. Tambien llamada automoldeamiento.prueba que sirve para identiricar un inhibidorcondiconado si dicho estímulo reduce a respuesta Supresión condicionada del lameteo Similar a laelicitada por un estímulo condicionado excitatorio. respuesta emocional condicionada (REC) oTambién llamado prueba de sumación. procedimiento de supresión condicionada. Sin embargo, en lugar de utilizar la presión de laPseudocondicionamiento Incremento en la respues- palanca para obtener la comida como conducta ata que puede provocar un estímulo cuyas suprimir por el miedo condicionado, la línea de basepresentaciones están entremezcladas con las es el lameteo de un tubo con agua por parte depresentaciones del estímulo condicionado (EC) sin ratas sedientas. La presentación de un ECque se establezca una asociación entre el estímulo y condicionado al miedo ralentiza la tasa de lameteo.el EI. Supresión condicionada Lo mismo que respuestaRC Abreviatura de respuesta condicionada. emocional condicionada.REC Abreviatura de respuesta emocional condicio-nada.Respuesta condicional o condicionada Respuestaque se realiza ante el estímulo condicionado comoresultado del condicionamiento clásico. AbreviaturaRC. 54 Descargado del campus, http://campus.felizmente.info
  • 57. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos Cabrera – 2009/2010¿A qué deben su eficacia los estímulos condicionados e incondicionados?- Respuestas iniciales a los estímulos.- La novedad de los estímulos condicionados e incondicionados.- Intensidad y saliencia del EC y del EI.- Relevancia o pertinencia EC-EI.- El conceto de fuerza biológica.¿Qué determina la naturaleza de la respuesta condicionada?- El modelo de sustitución del estímulo.- Aprendizaje y homeostasis: Un caso especial de sustitución del estímulo.- El EC como determinante de la forma de la RC.- Conducta condicionada y sistemas de conducta.- Aprendizaje E-R frente a aprendizaje E-E.¿Cómo se asocian los estímulos condicionado e incondicionado?- El efecto de bloqueo.- El modelo de Rescola y Wagner.- Otros modelos de condicionamiento clásicos.Comentarios finales 55 Descargado del campus, http://campus.felizmente.info
  • 58. Descargado del campus, http://campus.felizmente.info
  • 59. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos Cabrera¿A qué deben su eficiacia los estímulos condicionados eincondicionados? (página 91 del libro)Esta es quizá la pregunta más importante en relación al condicionamiento clásico. Planteadaoriginalmente por Pavlov y también en la actualidad está recabando cada vez más la atenciónde los investigadores.Respuestas iniciales a los estímulos.Según definió Pavlov los términos condicionado e incondicionado: un estímulo condicionado(EC) inicialmente no provoca la respuesta condicionada, pero adquiere la capacidad dehacerlo como resultado del desarrollo de una asociación con el estímulo incondicionado (EI).Por el contrario, el EI elicita eficazmente la respuesta en custión desde el principio, sinningún entrenamiento previo.La comparación de los ECs y de los EIs son relativas, pues en un evento particular puedeservir de EC respecto a un estímulo y de EI respecto a otro. Una exposición salina en unexperimento de aversión al sabor actua como EC y la droga que produce el malestar comoEI; mientras que en un experimento de seguimiento del signo la exposición salina se podríaconsiderar como EI y la luz el EC. Por tanto, el que la sacarina se considere un EC o un EIdepende de su relación con otros estímulos de la situación.La novedad de los estímulos condicionados e incondicionados.Tanto si el estímulo condicionado como el incondicionado es familiar, el aprendizaje sedesarrolla con mayor lentitud que si el EC y el EI son novedosos.Los estudios sobre el papel de la novedad de los estímulos en el condicionamiento clásicosuelen realizarse en dos fases. Primero se expone repetidamente y de forma aislada alsujeto al estímulo que posteriormente va a utilizarse como EC y después se empareja con unEI según el condicionamiento clásico. La familiarización que se produce por la exposiciónincial retrasa el condicionamiento posterior de dicho estímulo. Este fenómeno se denominaefecto de preexposición al EC o efecto de inhibición latente.La habituación y efecto de preexposición al EC sirven para limitar la cantidad deprocesamiento y atención a los estímulos que se sabe carecen de consecuencias.El mismo proceso realizado con EI han dado similares resultados. Los sujetos familiarizadoscon un EI antes de su emparejamiento con EC desarrollan la respuesta condicionada al EC 57 Descargado del campus, http://campus.felizmente.info
  • 60. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos Cabreramás lentamente que los participantes para los cuales el EI es novedoso. Este resultado sedenomina efecto de preexposicion al EI.Dos son las explicaciones por parte de los investigadores de los efectos de preexposicioónal EC y al EI. La interferencia asociativa como mecanismo que disminuye la capacidad de losestímulos para participar en nuevas asociaciones; y otra, la interferencia de memoria en laque los participantes recuerdan lo sucedido en fase de experimento alterando la respuestacondicionada. Los mecanismos que reduzcan el recuerdo de preexposición en el momento dela prueba fortalecen la respuesta condicionada.Intensidad y saliencia del EC y del EI.Otra variable importante para elcondicionamiento clásico es la intensidad delos estímulos condicionados e incondicionados.La respuesta es más fuerte cuanto másintenso sean estos. Objeto utilizados como EC en los estudios sobreUn estímulo puede adquirir saliencia o condicionamiento sexual con codornices macho parasignificación aumentando su intensidad, lo que señalar la oportunidad de copula. El objeto de la izda. es "arbitrario" está hecho de un material lanudo. El objetohace que despierte mayor atención. Por de la derecha inlcuye una cabeza y algunas plumas del cuello de un ejemplar de hembra disecado, de modo queejemplo, una rata presta más atención a la sal contenga alguna de las claves que proporciona la hembra.si sufre un deficit nutricional de sal.Estudios sobre condicionamiento sexual de la codorniz macho doméstica, muestran que seobserva una respuesta sexual condicionada más intensa utilizando un EC que incluya algunasde las características estimulares de la hembra de codoniz.Relevancia o pertinencia EC-EI.El aprendizaje depende de la relevancia o adecuación del EC con respecto al EI que seadministra. El sabor se asocia fácilmente al malestar y las claves audiovisuales se asocian aldolor periférico. condicionamientoGustativo + audiovisual DescargaGustativo + audiovisual MalestarEl experimento se emparejaron un estimulo audiovisual y un estímulo gustativo, presentados simultaneamente, con una descarga o con una sensación de malestar, dependiendo del grupo. Después los sujetos se pusieron a prueba con los estímulos gustativos y audiovisuales por separado.Las ratas condicionadas con una sensación de malestar adquirieron una mayor aversión a las claves gustativas que las audiovisuales. Por el contrario, las ratas condicionadas con una descarga adquirieron una mayor aversión a las claves audiovisuales que a las gustativas. 58 Descargado del campus, http://campus.felizmente.info
  • 61. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos CabreraSe demostró con ratas recien nacidas que la experiencia con sabores o con la enfermedad(o con las claves audiovisuales y el daño periférico) no es necesaria para que se dé el efectode relevancia del estímulo. Más bien, el fenómeno parece reflejar una predisposicióngenética para la asociación selectiva de ciertas combinaciones de estímulos condicionados eincondicionados.Se ha documentado otras situaciones del efecto de relevancia del estímulo de aversión alsabor en palomas que asocian la comida mejor con claves visuales que con auditivas y unadescarga más efectivas con las auditivas. En cuanto a efectos de relevancia del estímulo enla adquisición del miedo en monos, estos parecen que tienen una predisposición paraaprender a temer a las serpientes de juguete que si lo hacen a flores de plástico. Estaselectividad de estímulos en el aprendizaje de miedos también se muestran en las personas,cuando participantes en estudios, han asociado fotografías de serpientes y arañas con unadescarga con mayor facilidad que fotografías de flores y casas. Los procedimiento de condicionamiento aversivo resultan más efectivos a la hora de eliminar el tabaquismo si se combinan Aproximaciones conductuales al control del con otras técnicas de modificación conductual. La inhalación tabaquismo rápida, por ejemplo, puede combinarse con un entrenamiento en autoobservación o autoadministración. Se han desarrollado diversos procedimientos de Primero se pide al sujeto que mantenga un egistro preciso del condiciona-miento aversivo para que las personas dejen número de cigarrillos que fuma, así como del momento, lugar de fumar (Hall, Hall y Ginsberg, 1990). Los primeros y circunstancia en las que lo hace. Una vez conocidas la intentos consistieron en una terapia aversiva en la que el frecuencia y las circunstancias en las que fuma, se proponen acto de fumar se emparejaba con el dolor producido por dos objetivos con los que se pretende reducir gradualmente el una descarga eléctrica. Técnicas más recientes se basan consumo de tabaco: reducir el número total de cigarrillos en los hallazgos que indican que el condicionamiento de la fumados al día y reducir el número de situaciones en las que aversión es más efectivo si el estímulo aversivo es se permite fumar. Esta combinación de objetivos permita “relevante” en relación a la situación. En estos restringir la conducta de fumar. El cumplimiento puede procedimientos, suele utilizarse el propio acto de fumar alentarse utilizando un sistema de contratos. Por ejemplo, la como fuente de la estimulación aversiva. Un procedimiento persona puede depositar una cantidad de dinero al comienzo utilizado frecuentemente es el de inhalación rápida del tratamiento y recuperar posiciones de este depósito cada (USDHHS, 1996), en el ue se pide al sujeto que inhale vez que logre un objetivo. tabaco cada 6 segundos durante un periodo de tiempo hasta que surja náuseas o mareos. Esta forma de fumar es aversiva y permite condicionar una aversión al tabaco.El concepto de fuerza biológicaPavlov sugirió que para que un estímulo se condicionara debía tener una fuerza biológicamenor que la del estímulo incondicionado con el que se emparejaba. El concepto de "menorfuerza biológica" se refería a que inicialmente el EC debía elicitar menos respuestas y másdébiles que el EI. 59 Descargado del campus, http://campus.felizmente.info
  • 62. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos CabreraCondicionamiento de orden superior. Un estímulo puede hacer de EI tras haber sidofuertemente condicionado. Un tono emparejado repetidamente con la comida, elicitará lasalivación, así como seguimiento del signo. El concepto de fuerza biológica dice que estetono debería ser efectivo para condicionar una luz. El término orden superior, puede considerarse el condicionamiento como si operase en diferentes niveles. El emparejamiento del tono con la comida se considera condicionamiento de primer orden; El emparejamiento de la luz con el tono previamente condicionado sería el condicionamiento de segundo orden; y si la luz se usara para condicionar otro estímulo, por ejemplo, un olor, se trataría de condicionamiento de tercer orden.El condicionamiento de segundo orden es similar al procedimiento estandar para la inhibicióncondicionada, sin embargo, parece ser el número de ensayos no EI es el factor crítico. Conpocos ensayos no reforzados tiene lugar condicionamiento excitatorio de segundo orden.Con un entrenamiento más extenso, se desarrolla inhibición condicionada.Con el condicionamiento de orden superior, el condicionamiento clásico puede acontecer sinun EI primario. El único requisito es que estén disponibles estímulos previamentecondicionados.El condicionamiento de segundo orden también resulta interesante como técnica paraconfirmar la aparición de condicionamiento de primer orden, que a veces no provocadirectamente una respuesta condicionada, pero que el EC de primer orden puede elicitar larespuesta condicionada si es sometido a un condicionamiento de segundo orden. Condicionamiento de orden superior del miedo del condicionamiento de orden superior, un estímulo condicionado al miedo (las multitudes) había condicionado Los miedos irracionales se desarrollan muchas veces por elmiedo a otros estímulos (cines) que previamente medio del condicionamiento de oren superior. Por ejemplo, resultaban inocuos. El aspecto destacable de esta Woldpe (1990) describe el caso de una mujer que experiencia es que se adquirió aversión a los estímulos del inicialmente tenía miedo a las multitudes. Aunque se cine sin que estas claves se hubieran emparejado desconoce cómo se condicionó este miedo, las multitudes directamente con un estímulo incondicionado aversivo. habían adquirido la capacidad de elicitar miedo. Para evitar Después de esta terrible experiencia con el cine, la mujer el surgimiento del miedo, la mujer iba al cine sólo en el evitaba ir al cine incluso cuando era poco probable que se momento del día en el que había poca gente. En una de encontrara con mucha gente. Además, el miedo a los cines tales visitas, el cine se llenó repentinamente de estudiantes. recién adquirido se generalizó a otros lugares públicos, tales La mujer quedó muy afectada por esta experiencia y asoció como restaurantes, iglesias y edificios públicos, que también los cines con las multitudes. Así pues, como consecuencia evitaba incluso si estaban vacíos. 60 Descargado del campus, http://campus.felizmente.info
  • 63. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos CabreraContracondicionamiento. Dos estímulos pueden quedar asociados aunque ambos eliciteninicialmente respuesta intensas. La respuesta que un animal da a un EC se invierte ocontrarresta emparejando ese estímulo con un EI que provoca una reacción opuesta. Porejemplo, un animal puede condicionarse para aproximarse a un estímulo que anteriormenteevitaba.Precondicionamiento sensorial. También pueden aprenderse asociaciones entre dosestímulos que tan sólo elicitan una débil respuesta de orientación antes decondicionamiento. Por ejemplo, el emparejamiento del sabor de vainilla y canela quedanasociados el uno del otro en los pasteles. Una aversión a la canela por medio deenvenenamiento, nos llevará a rechazar también pasteles con sabor a vainilla.¿Qué determina la naturaleza de la respuesta condicionada? (pág. 100 del libro)El modelo de sustitución del estímuloSegún el modelo de sustitución del estímulo de Pavlov, el EC adquiere la capacidad defuncionar de forma similar a como el EI lo hacía previamente, asumiendo, que el EC activalos circuitos neuronales que previamente activaba sólo el EI y elicita respuetas similares aEI.Pavlov sugirió que el condicionamiento da lugar al establecimiento de nuevos enlacesneuronales durante los emparejamientos reptidos de EC y EI, desarrollando una nuevaconexión entre los circuitos que previamente activaba el EC y los que previamente activabael EI. Establecida la conexión EC se convierte en un sustituto del EIEl EI como factor determinante de la RC. EC diferentes elicitan respuetan condicionadasdiferentes. La comida elicita salivación y aproximación; las descargas elicitan aversión yalejamiento. Si el condicionamiento convierte al EC en un sustituto del EI, entonces los Ecscondicionados con diferentes EIs deberían provocar diferentes tipos de RC.El experimento con palomas de Jenkins y Moore (1973) compararon el condicionamientopavloviano utilizando como EI comida y agua . Para comer las palomas picotean rápido ybruco hacia el grano y abren el pico justo antes de tomar contacto con él. Para el beberintroducen el pico casi cerrado en el agua y bajo ella abren periodicamente para succionar.Las respuestas incondicionadas de comer y beber son diferentes. 61 Descargado del campus, http://campus.felizmente.info
  • 64. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos CabreraEl EC fue la iluminación de una tecla durante 8 segundos y se emparejó tanto para lapresentación del grano de cereal como con la disposibilidad de agua. La forma de RC separecía a la forma de la respuesta incondicionada: El EC condicionado con la comidaprovocaba el picoteo relacionado con la comida y el EC condicionado con agua provocaba lospicoteos relacionados con la bebida.Aprendizaje y homeostasis: Un caso especial de sustitución del estímulo.Walter Cannon introdujo el concepto homeostasis para referirse a los mecanismosfisiológicos que mantienen los aspectos críticos del cuerpo dentro de los límites aceptables,Estos mecanismo funcionaban por procesos de retroalimentación negativa que servían paracontrarestar las alteraciones una vez que estas ya habían provocado una desviación de losniveles optimos. Esto puede resultar ineficiente, especialmente si el proceso decompensación o corrección tarda en activarse. Dworking (1993) señalo que las alteracionesen la homeosteasis pueden compensarse más activamente si pueden anticiparse. Elcondicionamiento pavloviano proporciona los medio necesarios para tal anticipación.Las respuetas homeostáticas condicionadas se han examinado más extensamente enrelación a la forma en que los organismos respondem a la administración de drogaspsicoactivas. Suelen provocar alteraciones fisiológicas que afectan a la homeostasis queactivan reacciones compensatorias condicionadas. Las claves que se asocian con la alteraciónfisiológica inducida por la droga pueden llegar a elicitar estas reacciones compensatoriascomo respuestas condicionadas anticipatorias.El modelo de condicionamiento de tolerancia a las drogas: Se considera que se hadesarrollado tolerancia a las drogas cuando las administraciones repetidas de las mismastiene un efecto cada vez menor. Tradicionalmente se ha considerado esta tolerancia comodebida a procesos farmacológicos. Shepard Siegel, en contraste ha propuesto un modelobasado en el condicionamiento clásico, utilizando el concepto de homeostasis aprendida.El modelo de condicionamiento de la tolerancia a las drogas atribuye la tolerancia a lasrespuestas compensatorias condicionadas a los estímulos del entorno que se emparejan conla administración de la droga. Una importante predicción del modelo es que la tolerancia a ladroga se verá atenuada si los sujetos reciben la droga en condiciones novedosas o enausencia de las claves que normalmente predicen su consumo. También predice que variosfactores que atenúan el desarrollo de las respuestas condicionadas (como la preexposiciónal EC) también deberían atenuar el desarrollo de la tolerancia a la droga 62 Descargado del campus, http://campus.felizmente.info
  • 65. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos CabreraEl EC como determinante de la forma de la RC La forma de la RC también esta influenciada por la naturaleza del EC. Timberlake y Grant(1975) utilizaron comida como EI, el EC fue la presentación de otra rata justo antes de laadministración de comida, el EC no porvoco conductas de roer y morder, elicito respuestasde orientación, aproximación y olfateo, asi como contactos de tipo social.Conducta condicionada y sistemas de conductaLos diversos sistemas de conductas han evolucionado para permitir al animal llevar a cabotareas criticas, tales como obtener y comer el alimento, defender su territorio, evitar a losdepredadores, reproducirse y cuidad sus crías. Cada sistema consiste en una serie de modosde respuesta, cada uno de ellos con sus propios estimulos y respuestas relevantes,dispuestos con determinado orden espacial y secuencial.La teoría de los sistemas de conducta asume que la presentación del EI en un porcedimientode condicionamiento pavloviano activa el sistema de conducta relevante para ese EI. Losestímulos condicionados con comida elictan componentes del sistema de alimentación y losestímulos condicionados sexuales elicitan componentes del sistema de conducta sexual.Una predicción de la teoría de los sitemas de conducta es que la forma de la RC dependerádel intervalo EC-EI que se utilice. Este intervalo determina el lugar en que se incorporara elEC dentro de la secuencia de respuestas del sistema de conducta.La teoría es claramente compatible con el hecho de que la forma de la RC está determinadapor: La naturaleza del (EI) estímulo incondicionado y la naturaleza del (EC) estímulocondicionado.Aprendizaje E-R frente a aprendizaje E-EHistoricamente la conducta condicionada se veía como una conducta elicitada directamentepor el EC. De acuerdo con la teoría del aprendizaje E-R, establece una nueva conexiónestímulo-respueta entre el EC y la RC. La teoría del aprendizaje E-E los sujetos aprendenuna asociación estimulo-estimulo entre el EC y el EI. Los sujetos responden al EC, no porqueeste elicite directamente una RC, sino porque el EC activa una representación del EI. Lapresentación del EC hace que el sujeto piense en el EI y esta es la causa de la conductacondicionada.Un método de investigación importante para decidir entre aprendizaje E-R y E-E es la de ladevaluación del EI. 63 Descargado del campus, http://campus.felizmente.info
  • 66. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos Cabrera¿ Cómo se asocian los estímulos condicionados e incondicionados ? (pág. 109 del libro)El efecto de bloqueoConlleva una secuencia de suscesossimilar. Primero se asocia EC (estímuloA) y el EI. Una vez que el ECA esta biencondicionado, se añade el segundoestímulo (estímulo B) al estímulo A y sepresentan los dos juntos en los ensayos Figura 4.13. Esquema del procedimiento de bloqueo.de condicionamiento. El hallazgo básico En la fase 1, el estímulo A se condiciona con el EI para el grupoes que el condicionamiento previo de A, experimental, mientras que el grupo de control recibebloquea el desarrollo de la RC al presentaciones desemparejadas de A y el EI.estímulo B. En la fase 2, ambos grupos reciben ensayos de condicionamiento en los que el estímulo A se presenta a la vez que el estímulo B y se empareja con el EI.Este efecto se ha convertido en un Una prueba posterior con el estímulo B aislado muestra que elfenómeno clave del condicionamiento grupo experimental produce una respuesta condicionada menorclásico porque puso en duda el ante el estímulo B que el grupo de control.presupuesto de que la contigüidadtemporal fuese suficiente para el aprendizaje.Kamin, su descubridor, explico el efecto proponiendo que para que se produzca aprendizajede forma efectiva el EI debía ser inesperado o sorprendente.El modelo de Rescorla y WagnerRescola Wagner asumieron que la sorpresividad, y por tanto le efectividad, de un EIdepende de lo diferente que el EI sea en comparación con lo que el sujeto espera. Asumenque la expectativa del EI está relacionada con las propiedades condicionadas o asociativasdel estímulo que precede al EI. Una RC intensa indica una fuerta expectativa de que el EIaprecerá (condicionamiento excitatorio o incremento de la fuerza asociativa); una RC débilindica una baja expectativa del EI (condicionamiento inhibitorio o disminución de la fuerzaasociativa). Ecuación básica : ΔV = k ( λ − V ) λ : asítona de aprendizaje V : valor asociativo de los estímulos k : constante relacionada con la saliencia del EC y del EI. 64 Descargado del campus, http://campus.felizmente.info
  • 67. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos CabreraAplicación del efecto de bloqueo. El modelo de Rescorla y Wagner predicen claramente elefecto bloqueo. Como se muestra en la Figura 4.13, el grupo experimental de diseño debloqueo recibe primero un condicionamiento extenso del estímulo A, de forma que adquiereuna expectativa de que el EI ocurrirá siempre que se presente el estímulo A. Cuandofinaliza la fase 1, VA es igual a la asíntota de aprendizaje o λ (V A = λ ) . En la fase 2, elestímulo B se presenta junto con el estímulo A, y ambos van seguido del EI. De acuerdo conel modelo Rescorla-Wagner, no habrá condicinamiento del estímulo B en la Fase 2, ya que elEI es perfectamente predecible por la presencia del estímulo A: (λ − V A+B ) = 0El grupo de control recibe un tratamiento idéntico en la Fase 2, pero para ellos la presenciadel estímulo A no lleva a unaexpectativa del EI y por tanto es sorprendente para el grupode control y produce nuevo aprendizaje.Perdida de valor asociativo a pesar de los emparejamientos con el EI. Gran parte de laimportancia del modelo se debe a sus inusuales predicciones. Una de tales predicciones esque, en ciertas circunstancias, las propiedades condicionadas de los estimulos se reducirana pesar de que siga habiendo emparejamientos con el EI. Fase 1 Fase 2 A → EI [A + B] → EI el EI1 B → EI Pérdida de valor asociativo a pesar de las presentación continuada del EI. Los estímulos A y B se condicionan separadamente hasta llegar a la asíntota en la Fase 1, de modo que cada EC sea capaz de predecir el EI perfectamente. En la Fase 2, los estímulos A y B se presentan simultáneamente y se emparejan con el mismo EI utilizando en la Fase 1. Esto produce una expectativa excesiva del EI. Dado que el EI es sorprendentemente pequeño al principio de la Fase 2, las propiedades condicinadas de los estímulos A y B se reducen hasta que la presentación simultánea de los dos ECs deja de producir un exceso de expectativas.Inhibición condicionada. La aplicación del modelo de Rescorla y Wagner a esteprocedimiento requiere que se consideren separadamente los ensayos reforzados y los noreforzados. Para poder anticipar el EI en los ensayos reforzados, el EC+ debe adquirirpropiedades excitatorias. El condicionamiento excitatorio conlleva la adquisición de unavalor asociado positivo, y cesa una vez que el organismo predice el EI perfectamente encada ensayo.En cada ensayo aparecen tanto el EC+ como el EC-. Una vez que el EC+ ha adquirido ciertogrado de excitación condicionada (debido a su presentación en los ensayos reforzados), elorganismo esperará que se presente el EI siempre que aparezca el EC+, incluyendo losensayos no reforzados. Sin embargo, el EI no ocurre en los ensayos no reforzados, por loque se trata de un caso de expectativa excesiva. Para predecir con exactitud la ausencia delEI en los ensayos reforzados, los valores asociativos del EC+ y del EC- tienen que sumar 65 Descargado del campus, http://campus.felizmente.info
  • 68. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos Cabreracero (valor que representa la ausencia de EI). Para lograrlo, como el EC+ tiene un valorasociativo positivo, la única forma es hacer que el valor asociativo del EC- sea negativo. Elmodelo Rescola-Wagner explica la inhibición condicionada asumiento que el EC- adquiere unvalor asociativo negativo.Extinción de la excitación y de la inhibición. En un procedimiento de extinción, elestímulo condicionado se presenta repetidamente sin el EI. Si un EC ha adquiridopropiedades excitatorias (EC+) habrá un exceso de expectativa del EI la primera vez que elEC se presente sin el EI en la fase de extinción. Al continuar con los ensayos del EC solo, laexpectativa elicitada por el EC se va acercando a la línea que representa la ausencia del EIpor medio de una reducción gradual del valor asociativo del EC+ hasta llegar a cero.El modelo de Rescola y Wagner prdice un situación similar para la extinción de la inhibicióncondicionada. Al principio de la extinción, el EC- tiene valor asociativo negativo, esto puedeconsiderarse una predicción excesivamente baja del EI; el organismo predice un EI con unvalor menor del valor cero con el que de hecho aparece le EI. Para ajustar las expectativasa la ausencia del EI, el valor asociativo negativo del Ec- se va perdiendo gradualmente y elEC- termina con una fuerza asociativa igual a cero.Problemas del modelo Rescorla Wagner. 1º- Su análisis de la extinción de la inhibición es incorrecto. Algunos investigadoreshan encontrado que no reforzar un EC- de forma repetida puede potenciar sus propiedadesinhibitorias. 2º- El modelo considera la extinción como lo opuesto a la excitación, o a la vuelta a unvalor asociativo cero, pero la extinción no debería verse como una mera inversión de laadquisición. La extinción parece involucrar el aprendizaje de una nueva relación entre el ECy el EI. 3º- En ciertas condiciones el mismo EC puede tener tanto propiedades excitatoriascomo inhibitorias, en el modelo no pueden ser ambos. 4º- El modelo tiene dificultades para explicar hallazgos recientes obtenidos en losparadigmas de avesion al sabor y olor. En experimentos similares al de efecto de bloqueo,cabria esperar que la presencia del EC previamente condicionado interfiriera en elcondicionamiento del EC añadido en la fase 2. Se encontró el resultado opuesto: un efectode aumento o de contrabloqueo. 66 Descargado del campus, http://campus.felizmente.info
  • 69. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos CabreraOtro modelos de condicionamiento clásicoModelos atencionales de condicionamiento. Las teorías atencionales difieren en sussupuestos sobre que es lo que determina la saliencia del EC en un ensayo. Pearce y Hall(1980) asumen que el grado de atención que un animal presta al EC en un ensayodeterminado depende del grado en el que el EI haya sido sorprendente en el ensayoanterior, y por tanto aún tiene mucho que aprender y prestarán más atención al EC en elsiguiente ensayo. Por el contario, si un EC iba seguido de un EI esperado en el ensayoanterior, el sujeto prestará menos atención a ese EC en el siguiente ensayo, asumiendo queun EI esperado reduce la saliencia o la atención dedicada al EC.Una caracteristica importante de la teorías atencionales es que asumen que la sorpresividaddel EI en un ensao determinado altera el grado de atención dedicado al EC en los ensayossiguientes. Esta es una diferencia importante con Rescorla Wagner que asumen que lasorpresividad del EI en un ensayo determina lo que se aprende en ese ensayo.El supuesto de que el EI presentado en un ensayo sólo afecta a lo que se aprende en elsiguiente ensayo ha permitido explicar ciertos hallazgos, pero también tienen dificultadescon otros, como los del experimento de bloqueo en el primer ensayo de la Fase 2 delexperimento de bloqueo.Factores temporales y respuesta condicionada. Ni el modelo de Rescola y Wagner ni losmodelos modificación del EC fueron diseñados para explicar los efectos del tiempo sobre elcondicionamiento, pese a que el tiempo es un factor crítico. Una variable temporalimportante es el intervalo EC-EI. La respuesta condicionada es inversamente proporcional alintervalo EC-EI o duración del EC. Por encima de un punto óptimo los procedimientos conintervalos EC-EI más largos producen menos respuestas.Otra variable temporal importante es el intervalo entre ensayos. En general en ensayos másseparados entre si, mayor respuesta condicionada. Mas interesante resulta que el intervaloentre ensayos y la duración del EC interactuan a la hora de determinar la respuesta.Numerosos ensayos han mostrado que el factor crítico es la duración relativa de estas dosvariables temporales, más que el valor absoluto de las mismas.Se han ofrecido varias interpretaciones sobre por qué la respuesta condicionada esta tanfuertemente determinada por la razón IEE/DE (intervalo entre ensayos/duración delensayo). Una de las primeras explicaciones fue la hipótesis de espera relativo, que suponeque un EC proporciona información acerca de la aparición del EI sólo si el sujeto tiene quepasar menos tiempo esperando al EI que cuando esta simplemente expuesto al contextoexperimental. 67 Descargado del campus, http://campus.felizmente.info
  • 70. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos CabreraCuando la Razón IEE/ED es baja, el tiempo de espera ante el EC es similar al tiempo deespera en el contexto. En este caso, el EC proporciona poca información adicional sobre elmomento de aparición del EI y no se desarrollara mucha respuesta condicionada. Por elcontrario, cuando la razón IEE/ED es alta, el tiempo de espera ante el EC es mucho menorque el tiempo de espera en el contexto. Esto hace que el EC aporte información sobre elmomento que aparece el EI, y la respuesta condicionada será mas fuerte.La hipótesis del comparador. R.Miller. Se parece a la hipótesis del tiempo de esperarelativo, en que asume que la respuestas condicionadas depende no sólo de la asociaciónentre el EC y EI, sino también de todas las posibles asociaciones que puedan establecerseen claves contextuales y el EI. La fuerza asociativa de otras claves presentes durante elentrenamiento con el EC crítico es especialmente importante. Otra restricción del modelodel comparador es que sólo permite asociaciones excitatorias con el EI. El modelo asumeque el que la RC refleje excitación o inhibición está determinado por la fuerza relativa de laexcitación condicionada al EC en comparación con la excitación condicionada a las clavescontextuales presentes durante el entrenamiento del EC. La hipótesis hace más hincapié en las asociaciones que en el tiempo. Asume que los sujetosaprenden tres asociaciones en el curso del condicionamiento: 1º Une el EC crítico con el EI. 2º Une el EC crítico con las claves contextuales de comparación . 3º Une los estímulos de comparación y el EI.Cuando se presenta el EC este activa la representación del EI tanto directamente (asoc 1)como indirectamente (asoc 2 y3). La comparación de las activaciones directa y indirecta delEI determina el grado de respuesta excitatoria o inhibitoria que tendrá lugar.Esta hipótesis no indica cómo se establecen las asociaciones, es una teoría de la ejecución.Un importante corolario es que la comparación entre asociaciones EC-EI y el contexto-EI serealiza en el momento de la prueba. Predice que la extinción de la asociación contexto EIdespués del entrenamiento del EC potenciara la respuesta al EC crítico.Principal contribución ha sido su énfasis en que las diferencias en la respuesta condicionadapueden reflejar diferencias en la ejecución más que en el aprendizaje, considera el efectobloqueo como un fallo en la ejecución, Predice que la extinción del estimulo bloqueadorelevara la RC al EC bloqueadoTambién se ha puesto a prueba en estudios sobre inhibición condicionada. El modelo leatribuye la inhibición condicionada a situaciones en las que se asocia el EC crítico con el EIes más débil que la asociación de las claves contextuales con el EI. En este caso, las claves 68 Descargado del campus, http://campus.felizmente.info
  • 71. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos Cabreracontextuales son estímulos que proporcionan el contexto excitatorio necesario para elcondicionamiento inhibitorio. Curiosamente predice que la extinción de estos estímuloscondicionados excitatorios tras el condicionamiento inhibitorio reduciría la respuestainhibitoria. Por tanto, la hipotesis del comparador es la única que predice que la extinción dela inhibición condicionada se logra de forma óptima, no presentando el EC- aislado, sinoextinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para elcondicionamiento inhibitorio del EC-.El modelo predice también que incrementar el valor excitatorio de las claves contextualestras el tratamiento (Asoc. 3) reducirá la respuesta condicionada del EC crítico. No se haconseguido confirmar esta predicción.Una de sus principales contribuciones ha sido su énfasis en que la diferencias en larespuesta condicionada puede reflejar diferencias en la ejecución más que en elaprendizaje. El bloqueo lo considera como un mero fallo en la ejecución más que en elaprendizaje. Predice que la extinción del estímulo bloqueador tras el entrenamiento elevarála respuesta condicionada al EC bloqueado.Visión general de las alternativas teóricas. Cada uno de los modelos que se han descritohace hincapié en un aspecto diferente del condicionamiento clásico. La hipótesis del tiempode espera relativo se centre en un pequeño conjunto de fenómenos relacionados con ladistribución temporal de los estímulos condicionados e incondicionados, a pesar de que suantecesora (la teoría de la expectativa escalar) tiene un alcance mucho mayor.La hipótesis del comparador también es ambiciosa, pero es una teoría de la ejecución másque del aprendizaje y, por toanto, no explica como se adquieren las asociaciones.Los modelos atencionaes hacen referencia al mismo tipo de fenómeno que el modeloRescorla-Wagner, pero comparten algunas de sus limitaciones.Todos estos modelos han sido importantes en tanto que han dirigido nuestra atención aaspectos previamente ignorados del condicionamiento clásico. Ninguno de ellos ha llegado adominar el estudio del condicionamiento clásico e la misma forma que el modelo Rescorla-Wagner lo hizo en los setenta. 69 Descargado del campus, http://campus.felizmente.info
  • 72. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos CabreraComentarios finales (pág. 122 del libro)Inicialmente, algunos psicólogos consideraron el condicionamiento clásico como un tipo deaprendizaje relativamente simple y primitivo que intervenía sólo en la regulación derespustas glandulares y vecerales como la salivación. Se asumía que el establecimiento delas asociaciones EC-EI tenía lugar automáticamente con los emparejamientos del EC y el EI.Debido a la naturaleza simple y automática del condicionamiento y a que se creía que estabalimitado a las respustas glandulares y vicerales, no se consideraba que fuera importante a lahora de explicar la complejidad y riqueza de la experiencia humana. Claramente, esta visióndel condicionamiento clásico resulta insotenible en la actualidad.La investigación revisada de los Capítulos 3 y 4 muestra que el condicionamiento clásicoinvolucra numerosos procesos complejos y está implicado en el control de una gran variedadde respuestas, desde la conducta emocional hasta las respuestas de aproximación yevitación. Además, el aprendizaje no ocurre de forma automática por el meroemparejamiento de un EC con un EI. Depende de la experiencia previa del organismo concada uno de estos estímulos, de la presencia de otros estímuos durante los ensayos decondicionamiento y del grado con que el EC y el EI sean mutuamente relevantes. Además, losprocesos de condicionamiento clásico no se limitan a emparejamientos EC-EI. Tambiénpueden desarrollarse asociaciones entre dos eventos sin significación biológica(precondicionamiento ensorial), en ausencia de un estímulo incondicionado (condicionamientode orden superior) o en ausencia de un estímulo condicionado convencional(contracondiconamiento).Debido a estas y otras complejidades de los procesos de condicionamiento clásico, es unerror ignorar el condiconamiento clásico al tratar de explicar formas complejas decomportamiento. La riqueza de los mecanismos del condicionamiento clásico los convierte enrelevantes en relaicón a la riqueza y complejidad de la experiencia humana. 70 Descargado del campus, http://campus.felizmente.info
  • 73. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos CabreraTérminos claveAprendizaje E-E Aprendizaje de una asociación Efecto de inhibición latente Lo mismo que efecto entre dos estímulos, con el resultado de que la de preexposicioón al EC. exposición a uno de los estímulos adquiere la Efecto de preexposición al EC Interferencia con capacidad de activar una representación o el proceso de condicionamiento producida por la “imagen mental” del otro estímulo. También exposición repetida al estímulo condicionado llamado aprendizaje estímulo-estímulo. antes de los ensayos de condicionamiento. También llamado efecto de inhibición latente.Aprendizaje E-R Aprendizaje de una asociación entre un estímulo y una respuesta, con el Efecto de preexposición al EI Interferencia con resultado de que el estímulo adquiere la el proceso de condicionamiento producida por la capacidad de provocar la respuesta. Lo mismo exposición repetida al estímulo incondicionado que aprendizaje estímulo-respuesta. antes de los ensayos de condicionamiento.Aprendizaje estímulo-estímulo Lo mismo que Hipótesis del comparador Idea según la cual la aprendizaje E-E. respuesta condicionada depende de una comparación entre la fuerza asociativa delAprendizaje estímulo-respuesta Lo mismo que estímulo condicionado crítico (EC) y la fuerza aprendizaje E-R. asociativa de otras claves presentes durante el condicionamiento del EC crítico.Condicionamiento de orden superior Procedimien- to en el que se utiliza un estímulo previamente Hipotesis del tiempo de espera relativo Idea condicionado (EC1) para condicionar un nuevo según la cual la respuesta condicionada depende estímulo (EC2) de cuánto tiempo tenga que esperar el organismo para el estímulo incondicionado (EI)Contracondicionamiento Procedimiento de condi- en presencia del estímulo condicionado (EC), en cionamiento que invierte la respuesta comparación con el tiempo que tenga que condicionada con anterioridad a un estímulo. Por esperar para el EI en la situación experimental ejemplo, un animal puede condicionarse para independientemente del EC. aproximarse aun estímulo que anteriormente evitaba. Homeostasis Concepto introducido por Walter Cannon para referirse a los mecanismosDevaluación del EI Reducción el atractivo de un fisiológicos que permiten mantener los aspectos es-tímulo incondicionado, normalmente obtenida corporales críticos (tales como los niveles e mediante la aversión o la saciedad. azúcar en sangre o la temperatura) dentro de ciertos límites. El nivel homeostático sueleEfecto de aumento Facilitación en el condiciona- lograrse mediante la acción de mecanismos de miento el un estímulo novedoso debido a su retroalimentación negativa que permiten condicionamiento junto a un estímulo previa- contrarrestar el efecto de los cambios en el mente condicionado. También llamado efecto de nivel homeostático. contrabloqueo. Precondicionamiento sensorial Procedimiento en elEfecto bloqueo Interferencia en el que un estímulo biológicamente débil (EC2) se condicionamien-to de un nuevo estímulo debida a empareja repetidamente con un estímulo la presencia de un estímulo previamente biológicamente débil (EC1). Después, el EC1 se condicionado. condiciona con un estímulo incondicionado. En un ensayo de prueba posterior, el EC2 tambiénEfecto de contrabloqueo Lo mismo que nunca se había emparejado directamente con el aumentación. estímulo incondicionado. 71 Descargado del campus, http://campus.felizmente.info
  • 74. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 4: Condicionamiento clásico: mecanismos Juan Carlos CabreraRespuesta homeostática condicionada Respuesta condicionada que se parece a las reacciones homeostáticas incondicionadas que elicita un estímulo incondicionado.Saliencia del estímulo Significación o percep- tibilidad de un estímulo para el organismo. En general, el aprendizaje avanza más rápido con estímulos condicionados e incondicionados más salientes.Sustitución del estímulo Idea teórica según la cual el resultado del condicionamiento clásico es que el organismo responde al estímulo condicionado de la misma manera que respondía previamente al estímulo incondicionado.Tolerancia a las drogas Reducción en la efectividad de una droga como resultado del consumo repetido de la misma. 72 Descargado del campus, http://campus.felizmente.info
  • 75. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos Cabrera – 2009/2010Primeras investigaciones sobre el condicionamiento instrumentalAproximaciones modernas al estudio del condicionamiento instrumental- Procedimientos de ensayo discreto- Procedimientos de operante libreProcediminetos de condicionamiento instrumentalElementos fundamentales del condicionamiento instrumental- La respuesta instrumental- El reforzador instrumental- La relación respuesta-reforzadorContigüidad y contingencia: Comentarios finales 73 Descargado del campus, http://campus.felizmente.info
  • 76. Descargado del campus, http://campus.felizmente.info
  • 77. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos CabreraEn este capítulo se vuelve la vista al análisis de las situaciones de aprendizaje en las cualeslos estímulos a los que un organismo se enfrenta son el resultado directo de su conducta,descrita como “dirigida a una meta”.La conducta que sucede debido a que ha servido previamente como instrumento paraproducir ciertas consecuencias se denomina conducta instrumental.Primeras investigaciones sobre el condicionamiento instrumental. (página 125 del libro)Los análisis teóricos y de laboratorio del condicionamiento instrumental comenzaronformalmentecon el trabajo de thorndike. Su intención original era estudiar la inteligenciaanimal. Estudio la cuestión planteada por Darwin sobre que capacidades intelectualeshumanas estaban presentes en los animales mediante investigación empírica, para elloinvento una serie de cajas problema donde introducía un gato hambriento con algo decomida fuera de la vista del animal. Su tarea era aprender a salir de la caja y obtener lacomida.La cuidadosa aproximación empirica de Thorndike fue un avance significativo en el estudiode la “inteligencia animal”. Otra contribución importante fue la estricta evitación deinterpretaciones antropomórficas de la conducta observada. En lugar de ello, interpreto losresultados de sus estudios como el reflejo del aprendizaje de una asociación E-R. A medidaque la asociación o conexión entre las claves de la caja y la respuesta con éxito se hacia masfuerte, el gato llegaba a realizar esta de forma más rápida. La consecuencia de la respuestaexitosa fortalecía la asociación entre los estimulos de la caja y esa respuesta.Sobre la base de eta investigación, Thorndike formulo la ley del efecto: si una respuestaen presencia de un estimulo es seguida por un suceso satisfactorio, la asociación E-R sefortalece, si es seguida por un suceso molesto, se debilita. Esta ley implica un aprendizajeE-R. 75 Descargado del campus, http://campus.felizmente.info
  • 78. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos CabreraAproximaciones modernas al estudio (página 125 del libro)del condicionamiento instrumental.Thorndike utilizó 15 cajas problemas diferentes en sus investigaciones que requeríandiferentes manipulaciones para que el gato saliese. Algunas llegaron a ser “estándar”.Procedimientos de ensayo discretoEl método es similar al de Thorndike, en el que cada ensayo de entrenamiento acaba con laretirada del animal del aparato, y la respuesta instrumental se realiza sólo una vez durantecada ensayo.Similares al método de Thorndike, W.S.Small (1899,1900), introdujo el laberinto en lasinvestigaciones sobre aprendizaje inspirado en las madrigueras bajo tierra.Un laberinto muy utilizado es el de forma de T, diseñado para estudiar la conducta deelección. La conducta en el laberinto puede cuantificarse midiendo la velocidad decarrera, que normalmente aumenta con ensayos de entrenamiento repetidos. Otra medidacomún es la latencia, tiempo que tarda el animal en abandonar la caja salida y empezar adesplazarse por el pasadizo, las latencias se hacen mas cortas a medida que progresa elentrenamiento.Procedimientos de operante libreIdeado por B.F. Skinner, los procedimientos de operante libre permiten al animal que repitala respuesta instrumental una y otra vez sin restricciones.Skiner estaba interesado en analizar en el laboratorio una forma de conducta que fueserepresentativa de toda la actividad en curso que ocurria de forma natural. La conducta nose divide como si fueran moléculas, por eso propuso el concepto de operante como la formade dividir la conducta en unidades medibles con significado.La típica caja básica de Skinner que utilizada para estudiar la conducta opeante libre,consistia en una pequeña cámara que contiene una palanca y un mecanismo que proporcionaun reforzador.Una respuesta operante, como presionar una palanca, se defina a partir del efecto queproduce en el ambiente. Las actividades que provocan el mismo efecto ambiental seconsideran ejemplos de la misma operante. 76 Descargado del campus, http://campus.felizmente.info
  • 79. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos CabreraEntrenamiento y moldeamiento al comedero. Hay algunos pasos preliminares paraestablecer la conducta de presión de la palanca. En primer lugar, los animales tienen queaprender cuándo esta disponible la comida en el comedero. Esto comprende uncondicionamiento clásico. Tras suficientes emparejamientos del sonido del dispensador conla entrega de comida, el sonido llega a elicitar una respuesta de seguimiento del signo: elanimal se dirige al comedero y recoge la bolita de comida. Esta fase preliminar se llamaentrenamiento al comedero.Después, el organismo esta preparado para aprender la respuesta instrumental requerida.Si la respuesta no es algo que el animal ya realiza, nunca sucederá por si mima, para facilitarla adquisición de una nueva respueta operante, al principio, la comida se entrega si el animalhace cualquier cosa remotamente relacionada con la respuesta deseada. Una vez que larespuesta de alzamiento ha sido establecida la comida solo entrega si la rata realiza larespuesta de alzamiento sobre la palanca de respuesta. Una vez que el alzamiento sobre lapalanca ha sido establecido, la bolita de comida puede entregarse solo si realmente la ratapresiona la palanca. Esta secuencia de pasos se denomina moldeamiento. Este incluye dostácticas complementarias: reforzamiento de aproximaciones sucesivas a la respuestarequerida y no reforzamiento de las formas de respuesta más tempranas.Moldeamiento y nueva conducta: El condicionamiento instrumental incluye a menudo laconstrucción o síntesis de una nueva unidad conductual a partir de componentes derespuesta preexistentes que ya se encuentran en el repertorio del sujeto. Elcondicionamiento instrumental puede también utilizarse para producir respuestas que no separecen en nada a lo que el individuo es probable que haga sin entrenamiento. Elmoldeamiento aprovecha la variabilidad inherente de la conducta. Sin esta variabilidad, losprocedimientos de moldeamiento no tendrían éxito. El moldeamiento puede producir nuevasformas de respuesta nunca antes realizadas por el organismo.La tasa de respuesta como medida de la conducta operante. Los métodos de operantelibre permiten una observación continua durante largos periodos, proporcionan una ocasiónespecial para obsevar cambios en la probabilidad de la conducta a lo largo del tiempo.Las medidas de la latencia de la respuesta y de la velocidad que se emplea normalmente enprocedimientos de ensayo discreto no permiten que se repita la respuesta. Skinner propusoque la tasa de ocurrencia de una conducta operante (frecuencia por minuto, por ej.) seutilizase como medida de la probabilidad de respuesta. 77 Descargado del campus, http://campus.felizmente.info
  • 80. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos CabreraProcedimientos de condicionamiento instrumental (página 133 del libro)Una consecuencia placentera se denomina técnicamente estimulo apetitivo. Unaconsecuencia molesta estimulo aversivo. La respuesta instrumental puede proporcionar elestimulo, en este caso se dice que surte efecto una contingencia positiva entre la respuestay su estimulo consecuente. De forma alternativa, la respuesta instrumental puede retirar oeliminar un estimulo, en este caso se dice que existe un efecto de contingencia negativoentre la respuesta y su consecuencia: Que el resultado de un procedimiento decondicionamiento sea un aumento o una disminución de la tasa de respuesta depende tantode la contingencia respuesta-consecuencia como de la naturaleza de la consecuencia.Reforzamiento positivo: es un procedimiento en el que la respuesta instrumental produce unestimulo apetitivo. Si se da la respuesta el estimulo apetitivo se presenta, si no se da larespuesta el estimulo apetitivo no se presenta: existe una contingencia positiva entre laespuesta instrumental y el estimulo positivo. El reforzamiento positivo produce incrementoen la tasa de respuesta.Castigo: En un procedimiento de castigo, la respuesta instrumental produce o aproxima unestimulo molesto o aversivo. Produce disminución en la respuesta instrumental.Reforzamiento negativo: En una contingencia negativa, la respuesta retira o previene lapresentacion de un suceso ambiental. Un procedimiento en el que la respuesta instrumentalfinaliza o previene la entrega de un estimulo aversivo se denomina reforzamiento negativo.Hay dos tipos, escape y evitación.: En el escape, el estimulo aversivo se presenta pero puede ser eliminado por larespuesta instrumental.La presencia de un estimulo aversivo establece la ocasión para laocurrencia de la respuesta instrumental, entonces es reforzada por la terminación delestimulo aversivo. La evitación implica la programación de un estimulo aversivo para ser presentado enalgún momento del futuro. En este caso la respuesta instrumental previene la entrega delestimulo aversivo.Entrenamiento de omisión: Incluye una contingencia negativa entre la respuestainstrumental y un suceso ambiental. En este caso la respuesta instrumental previene lapresentación de un estimulo apetitivo o placentero. A menudo es el preferido para disuadirla conducta humana (niño a su habitación). 78 Descargado del campus, http://campus.felizmente.info
  • 81. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos CabreraLos procedimientos de entrenamiento de omisión se denominan en ocasiones reforzamientodiferencial de otras conductas o RDO. Este termino refleja el hecho de que el individuorecibe un estímulo apetitivo periódicamente a condición de que se dedique a realizar otraconducta diferente de la respuesta especificada por el procedimiento. Implica elreforzamiento de “otras” conductas.La respuesta instrumental disminuye por el castigo y aumenta por el reforzamiento negativoElementos fundamentales del condicionamiento instrumental (página 137 del libro)La esencia de la condcuta instrumental es que esta controlada por sus consecuencias. Elcondicionamiento instrumental consta de tres elementos claves; una respuesta, unaconsecuencia (el reforzador) y una relación o contingencia, entre la respuesta y laconsecuencia.La respuesta instrumentalEl resultado de los procedimientos del condicionamiento instrumental depende en parte dela naturaleza de la respuesta que se este condicionando.Algunas respuestas son masfácilmente condicionables que otras.Variabilidad conductual versus estereotipia. Thorndike y Skinner enfatizaron que elreforzamiento incrementa la probabilidad de que la respuesta se repita en el futuro. Esteénfasis alentó la creencia de que los procedimientos de condicionamiento instrumentalproducían repeticiones de la misma respuesta - que producían uniformidad o estereotipia enla conducta - . Sin embargo, esto no significa que el condicionamiento instrumental no puedaverse también involucrado en la producción de respuestas creativas o variables. Losorganismos pueden aprender a obtener refuerzo en situaciones donde se requiera haceralgo nuevo. La variabiliad de la respuesta puede ser la base para el reforzamientoinstrumental. (ver ejemplo. Pag 137).Relevancia o pertinencia en el condicionamiento instrumental: Thorndike propuso eltermino de pertinencia para explicar los fallos en el entrenamiento del rascado y delbostezo, ciertas respuestas se corresponden de forma natural con el reforzador debido a lahistoria evolutiva del animal. Los Breland denominaron deriva instintiva al desarrollo derespuestas como la de hozar en los cerdos y frotar monedas en los mapaches. Estasrespuestas naturales relacionadas con la comida eran aparentemente muy fuertes ycompetían con las respuestas que requería el investigador. 79 Descargado del campus, http://campus.felizmente.info
  • 82. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos CabreraSistemas de conducta y limitaciones en el condicionamiento instrumental. De acuerdocon la teroría de los sistemas de conducta, cuando un animal está privado de comida y seencuentra en una situación donde podría encontrarla, su sistema de alimentación se activa, yse dedica al forrajeo y otras actividades relacionadas con la comida. Sobre este sistema deconducta se superpone un procedimiento de condicionamiento instrumental. La efectividaddel procedimiento para el incremento de una respuesta instrumental dependerá de lacompatibilidad de esa respuesta con la organización preexistente del sistema dealimentación.Podemos predecir qué respuestas se incrementarán con un reforzamiento de comidamediante el estudio de lo que los animales hacen cuando su sistema de alimentación estáactivado en ausencia de condicionamiento instrumental.Otra forma de diagnosticar si una respuesta es parte de un sistema de conducta es realizarun experimento de condicionamiento clásico. Un EC llega a elicitar componentes del sistemade conducta activado por el EI. Si la deriva instintiva refleja las respuestas del sistema deconducta, las respuestas análogas a la deriva instintiva deberías ser evidentes en unexperimento de condicionamiento clásico. Timberlake y colaboradores comprobaron estapredicción en ratas utilizando una modificación de los estudios de manipulacion de monedasllevados a cabo por los Brelands.El reforzador instrumentalCantidad y naturaleza del reforzador: En un estudio sistemático, Hutt(1954) intentoaislar los efectos de la cantidad y naturaleza del reforzador alimenticio líquido mediante lavariación sistematica de ambos rasgos. Los incrementos en el calidad y cantidad produjeronmayor tasa de respuesta.Cambios en la naturaleza y la cantidad de reforzador: Se plantea la posibilidad de que laefectividad de un reforzador dependa no sólo de sus propiedades sino también de cómo esereforzador se compara con otros que el individuo haya experimentado. La efectividad de unEI en el condicionamiento clásica depende de cómo se compare el EI con las expectativasdel individuo basándose en la experiencia previa. Esta es la idea fundamental del modeloRescorla-Wagner, si el EI es mayor de lo esperado, producirá condicionamiento excitatorio,si el EI es menor producirá condicionamiento inhibitorio. Los efectos de una cantidad o tipode reforzador dependen de la cantidad y la naturaleza de los reforzadores que el individuoha experimentado previamente. Mellgren (1972) Los resultados que obtuvo ilustran el fenómeno de contraste positivo: serefiere a una elevada respuesta por una recompensa favorable, resultado de unaexperiencia anterior con una consecuencia menos atractiva y contraste negativo: se refiere 80 Descargado del campus, http://campus.felizmente.info
  • 83. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos Cabreraa una respuesta disminuida por una recompensa desfavorable debido a una experienciaanterior con una consecuencia mejor. Los efectos de contraste también se dan si lascondiciones de recompensa se modifican una y otra vez con una clave diferente sañalandocada condición de recompensa, estos efectos son ejemplo de contraste conductualsimultaneo.Todos los efectos de contraste ilustran que la efectividad de un reforzador en unasituación esta determinada en parte por las experiencias del organismo con reforzadores enotras situaciones. Por razones que no están totalmente claras, el contraste negativo se haobtenido de forma más clara que el contraste positivo.La relación respuesta-reforzadorUnas veces existe una fuerte relación entre la conducta y sus consecuencias (introducir unamoneda en una maquina y obtener un refresco), en otras no (llevar una camiseta roja alexamen y sacar buena nota) y también puede ser probabilistica (hacer llamadas de telefonoy encontrar a alguien que te ayude).Existen dos tipos de relaciones entre una respuesta y un reforzador: 1.- La relación temporal , que se refiere al tiempo que transcurre entre la respuestay el reforzador. Un tipo especial es la contigüidad temporal, la cual se refiere a la entregadel reforzador inmediatamente después de la respuesta. 2.- La relación causal o contingencia respuesta-reforzador, se refiere al hecho deque la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador.Los factores temporales y causales son independientes unos de otros.Ambas son independientes unos de otros . Hay una relación causal fuerte entre presentar una solicitud de admisión y ser aceptado, pues si no lo solicitas es seguro que no será aceptado; sin embargo, la relación temporal entre solicitar y ser admitido es débil porque puede pasar semanas o meses sin conocer la respuesta a la solicitud despues de haberla presentado.Efectos de contigüidad temporal. El reforzamiento inmediato es preferible alreforzamiento demorado. Los psicólogos del aprendizaje han resaltado que elcondicionamiento instrumental requiere porporcionar el reforzador inmediatamentedespués de la ocurrencia de la respuesta instrumental. Grice informo que el aprendizajeinstrumental puede deteriorarse con demoras tan cortas como 0.5 seg.Hay varios factores que pueden contribuir a este deterioro. Cuando el reforzamiento esdemorado tras la realización de una respuesta, R1, el organismo no deja de hacer cosas, R2R3 R4 etc. Si el reforzador se establece en R1 pero no se entrega hasta algún tiempo 81 Descargado del campus, http://campus.felizmente.info
  • 84. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos Cabreradespués, el reforzador puede ocurrir después de alguna otra respuesta por ej. R5. Paraasociar R1 con el reforzador, el organiso tiene que poder distinguir R1 de otras respuestasque realiza durante el intervalo de demora.Hay dos formas de resolver este problema. La primera técnica, es proporcionar un reforzador secundario o condicionadoinmediatamente después de la respuesta instrumental. Un reforzador condicionado osecundario es un estímulo condicionado que previamente ha sido asociado con el reforzador. Otra técnica es marcar la respuesta instrumental criterio de alguna manera parahacerla distinguible de otras actividades del organismo.La efectividad del procedimiento demarcado se demostró por primera vez por Lieberman, Mcintosh y Thomas (1979)La contingencia respuesta-reforzador. Los estudios de demora del reforzamientomuestran que no es suficiente una relación causal perfecta entre la respuesta y elreforzador para producir una respuesta instrumental vigorosa. Incluso con una relacióncausal perfecta, el condicionamiento no ocurre si el reforzamiento es demorado durantedemasiado tiempo. Se concluyó que la contigüidad respuesta-reforzador más que lacontingencia era el factor critico que producía el aprendizaje instrumental. No obstante,esta visión ha resultado injustificada por la investigación posterior. La contingenciarespuesta-reforzador es también importante.El experimento de superstición Skinner. Fue un hito en el debate acerca del papel de lacontigüidad frente a la contingencia en el aprendizaje instrumental. Skinner situó palomasen cámaras experimentales independientes y montó el equipo para entregar una cantidad dede comida cada 15 segundos independientemente de lo que las palomas estuvieran haciendo.Las palomas parecían estar respondiendo como si la conducta controlara la entrega delreforzador. Skinner denominó a esto conducta supersticiosa.La conducta supersticiosa descansa en la idea de reforzamiento accidental o adventicio.Se refiere al emparejamiento accidental de una respuesta con la entrega de un reforzador,un segundo emparejamiento accidental aumenta aún más la probabilidad de la respuesta, deesta forma cada emparejamientno ayuda a estampar una respuesta particular.1º- Reinterpretación del experimento de superstición: la afirmacion de Skinner ha sidopuesta en duda por la evidencia empirica posterior. Stadon y Simmelhag (1971) realizaronobservaciones más extensas, definieron y midieron la ocurrencia de muchas respuestas,algunas respuesta ocurrían de modo predominante hacia el final del intervalo entrereforzadores, las llamaron respuestas terminales. Otras aumentaron tras la entrega delreforzador y disminuían a medida que se acercaba el tiempo de la siguiente comida;respuestas de interin. 82 Descargado del campus, http://campus.felizmente.info
  • 85. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos CabreraLas acciones que eran respuestas terminales y las que eran respuestas de interin novariaban mucho de una paloma a otra. No encontraron evidencia de reforzamientoaccidental. La investigacion posterior ha proporcionado mucha evidencia adicional de que laspresentaciones periodicas de un reforzador producen regularidades en la conducta.2º-Explicación de la periodicidad de las respuestas de interin y terminales. Staddon ySimmelhag sugirieron que las respuestas terminales son respuestas típicas de la especie quereflejan la anticipación de la comida a medida que el tiempo se encuentra más cerca de lapróxima presentación de comida. En contraste, entendieron las respuestas de interin comouna manifestación de otras fuentes de motivación que eran mas importantes al comienzo delintervalo entre comidas, cuando la presentación de comida era improbable. Losinvestigadores posteriores, sin embargo han favorecido aproximaciones en las cuales lasrespuestas terminales y de interin se consideran diferentes manifestaciones del mismosistema motivacional.La teoría de sistema de conducta, el sistema de alimentación está activado en animalesprivados de comida a los que se les proporciona periódicamente pequeñas cantidades decomida. Justo después de la entrega de comida se asume que el organismo realiza respuetasde búsqueda focalizada poscomida, que involucra actividades cercana a la comida. En mediodel intervalo entre entregas ocurren respuestas de búsqueda general, que aleja al suejto dela comida. En el momento de la próxima entrega de comida ocurre la respuesta de búsquedafocalizada.Congruente con la teoría de los sistemas de conducta, la distribución de las actividades sedesarrollan con la entrega periodica de un reforzador depende de la naturaleza de esereforzador. Por ejemplo, se desarrollan diferentes patrones de conductas conpresentaciones de comida o agua, debido a que activan diferentes patrones de forrajeo.Efectos de la controlabilidad de los reforzadores. Una contingencia fuerte entre unarespuesta instrumental y un reforzador esencialmente significa que la respuesta controla elreforzador, esto es, que el reforzador suceda depende de si ha ocurrido la respuestainstrumental. Los estudio acerca de los efectos de control sobre reforzadores hanproporcionado la evidencia mas amplia de la sensibilidad de la conducta a las contingenciasrespuesta-reforzador. La mayoría de la investigación se ha centrado en los efectos decontrol sobre la estimulación aversiva, esa se origino con los estudios pioneros de Seligman,Overmier y Maier, quienes investigaron los efectos de la exposición a una descargaincontrolable en el aprendizaje posterior de escape-evitación en perros. El hallazgo másimportante fue que la exposición a una descarga incontrolable dificultaba el aprendizajeposterior: Efecto de indefensión aprendida. 83 Descargado del campus, http://campus.felizmente.info
  • 86. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos Cabrera1º - Diseño tríadico: los experimentos sobre indefensión aprendida se realizan normalmenteutilizando este diseño, incluye dos fases: exposición, un grupo de ratas (E escape) esexpuesto a descargas periodicas que puede fianlizar mediante la realización de un respuestade escape. Cada sujeto del segundo grupo (A, acoplado) es acoplado a un animal del grupo Ey recibe las mismas descargas, pero el grupo A no puede hacer nada por evitarlas. El tercergrupo (C confinado), no recibe descargas durante la fase de exposición pero esta confinadoen el aparato tanto tiempo como los otros grupos. Durante la fase de condicionamiento, lostres grupos reciben entrenamiento escape-evitacion. El hallazgo destacable es que losefectos de la estimulación aversiva durante la fase de exposición dependen de si ladescarga es o no es escapable. La exposición a una descarga incontrolable (grupo A) produceuna severa interrupción del aprendizaje posterior de escape-evitacion, esto indica que losanimales son sensibles a las diferencias procedimentales entre la descarga escapable y ladescarga inescapable. La principal diferencia procedimental entre los grupos E y A es lapresencia de una contingencia respuesta-reforzador para el grupo E pero no para el grupoA. EL DISEÑO TRIÁDICO UTILIZADO EN LOS ESTUDIOS DEL EFECTO DE INDEFENSIÓN APRENDIDA FASE DE GRUPO FASE DE EXPOSICIÓN CONDICIONAMIENTO PRUEBA . Grupo E Descarga escapable Escape-evitación Aprendizaje rápido de evitación Grupo A Descarga acoplada inescapable Escape-evitación Aprendizaje lento de evitación Grupo C Confinado al aparato Escape-evitación Aprendizaje rápido de evitación2º- La hipótesis de la indefensión aprendida: la primera explicación importante estababasada en la conclusión de que los animales pueden percibir la contingencia entre suconducta y la entrega de un reforzador. La hipótesis de la indefensión aprendida asumeque durante la exposición a descargas incontrolables, los animales aprenden que lasdescargas son independientes de su conducta. Es más, llegan a esperar que los reforzadorescontinuaran siendo independientes de su conducta . Esta expectativa de ausencia decontrol debilita su habilidad para aprender una nueva respuesta instrumental. Esto ocurrepor dos razones , primero, la expectativa de falta de control reduce la motivación de lossujetos para realizar una respuesta instrumental; segundo, incluso si realizan la respuesta yson reforzados en la fase de condicionamiento, la expectativa previamente aprendida defalta de control hace mas difícil para los sujetos aprender que su conducta es ahoraefectiva para producir reforzamiento.Es importante distinguir la hipótesis de indefensión aprendida del efecto de indefensiónaprendida . El efecto de indefensión aprendida es el patrón de resultados obtenido con eldiseño tríadico, este ha sido reproducido en numerosos estudios y es un hallazgo bien 84 Descargado del campus, http://campus.felizmente.info
  • 87. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos Cabreraestablecido. En contraste, desde que se propuso, la hipótesis de indefensión aprendida hasido una explicación sugestiva y controvertida del efecto de indefensión aprendida.3º- Déficit de actividad: El déficit de aprendizaje observado en el grupo A era resultado deque aprendían a ser inactivos durante la fase de exposición. Congruente con esta hipótesis,en algunas situaciones la descarga inescapable produce una disminución en el movimientomotor, y a esto se deberían los posteriores déficits de actuación. Hay también situacionesen las cuales los efectos del aprendizaje probablemente no son debidos a la supresión delmovimiento causada por la descarga inescapable. Por tanto, la hipótesis de la inactividadaprendida no puede explicar todos los ejemplos de efectos de indefensión aprendida.4º- Déficit atencional: Que la descarga provoque que los animales presten menos atención asus acciones. Si un animal no presta atención a su conducta, tendrá dificultad para asociarsus acciones con los reforzadores en el escape.-evitacion o en otras formas decondicionamiento instrumental.Maier, Jackson y Tomie (1987) probaron esta hipótesis de déficit atencional con ratas,razonaron que la atencion reducida a la conducta instrumental también podía ser aliviadamediante la introducción de una clave externa de retroalimentación de la respuesta oestímulo de marcado.5º- Relaciones estimulares en el condicionamiento de escape: Resulta evidente que elcondicionamiento de escape resulta mas complejo de lo que se pensaba anteriormente. Elrasgo definitorio de la conducta de escape es que la respuesta instrumental tiene comoconsecuencia la terminación de un estimulo aversivo. Realizar la respuesta de escape tienecomo resultado claves internas de retroalimentación de la respuesta. Algunos de estosestimulos producidos por la respuesta son experimentados al comienzo de la respuesta deescape, justo antes de que la descarga se retire, y se denominan claves de retroalimen-tacion de la terminación de la descarga. Otros estimulos producidos por la respuesta sonexperimentados cuando el animal completa la respuesta, justo después de que la descargase haya retirado al comienzo del intervalo entre ensayos, estos se denominan claves deretroalimentación de la señal de seguridad. Estas son seguidas de forma fiable por elintervalo entre ensayos, y por tanto por la ausencia de descarga. En consecuencia, estasclaves contextuales pueden llegar a convertirse en inhibidores condicionados del miedo ylimitan o inhiben el miedo elicitado por las claves contextuales de la cámara experimental.Estas señales de seguridad no existen para los animales que están acoplados a la descargainescapable porque, para ellos, los periodos de descarga no descarga no son predecibles.Centrarse en los factores estimulares del condicionamiento de escape en lugar de lascontingencias respuesta-reforzador no ha permitido todavía el desarrollo de una explicacióncomprensiva de todos los resultados con el diseño tríadico. 85 Descargado del campus, http://campus.felizmente.info
  • 88. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos CabreraContiguidad y contingencia: comentarios finales (pagina 156 del libro)Como se ha descrito, los organismos son sensibles a la contigüidad tanto como a lacontingencia entre una respuesta instrumental y un reforzador. Normalmente, estos dosaspectos de la relación entre la respuesta y el reforzador actúan en conjunto para producirel aprendizaje. Ambos factores sirven para entender los efectos del reforzamiento en larespuesta instrumental. La relación causal, o contingencia, asegura que el reforzador esentregado sólo tras la ocurrencia de la respuesta instrumental especificada. La relación decongigüidad asegura que otras actividades no se interpongan entre la respuestaespecificada y el reforzador para interferir en el condicionamiento de la respuesta crítica.Términos clave (pagina 160 del libro)Castigo Procedimiento de condicionamiento Contraste conductual simultáneo Efectos de instrumental en el cual hay una contingencia contraste conductual (contraste positivo y positiva entre la respuesta instrumental y un negativo) que están producidos por frecuentes estímulo aversivo. Si el sujeto realiza la respues- cambios entre una condición de recompensa ta instrumental, recibe el estímulo aversivo; si el favorable y una desfavorable, con cada condición sujeto no realiza la respuesta instrumental, no de recompensa asociada a su propio estímulo recibe el estímulo aversivo. distintivo.Conducta instrumental Actividad que ocurre debido Contraste negativo Respuesta menor a un a su efectividad para producir una consecuencia reforzador desfavorable tras una experiencia particular o reforzador. previa con un reforzador más deseado que en ausencia de esa experiencia previa.Conducta supersticiosa Conducta que se incrementa en frecuencia debido a emparejamientos acciden- Contraste negativo Respuesta mayor a un estímulo tales de la entrega de un reforzador con ocurre- favorable tras una experiencia previa con un ncia de la conducta. reforzador menos deseado que en ausencia de esa experiencia previa.Contigüidad Ocurrencia simultánea ( o casi simultá- nea) de dos eventos, como una respuesta y un Deriva instintiva Deriva gradual de la conducta reforzador. También denominada contigüidad instrumental que se aleja de las respuestas temporal. requeridas para el reforzamiento hacia respuestas típicas de la especie o “instintivas”Contigüidad temporal Lo mismo que contigüidad. relacionadas con el reforzador y con otros estímulos de la situación experimental.Contingencia respuesta-reforzador Relación causal entre una respuesta y un reforzador, medida en Efecto de indefensión aprendida Interferencia en términos de la probabilidad de ser reforzado por el aprendizaje de nuevas respuestas instrumen- realizar la respuesta en comparación con la tales como resultado de la exposición a estimula- probabilidad de ser reforzado en ausencia de la ción aversiva inescapable e inevitable. respuesta. 86 Descargado del campus, http://campus.felizmente.info
  • 89. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos CabreraEntrenamiento al comedero Estadio preliminar del condicionamiento instrumental en el cual un Método de ensayo discreto Método de estímulo es repetidamente emparejado con el condicionamiento instrumental en el cual el sujeto reforzador a fin de capacitar al sujeto para puede realizar la respuesta instrumental sólo aprender a ir a recoger el reforzador cuando se durante períodos específicos normalmente presenta. El sonido del mecanismo de la entrega determinados bien por el emplazamiento del de comida, por ejemplo, puede ser repetidamente sujeto en una cámara experimental o por emparejado con la comida, por lo que el animal lapresentación de un estímulo. aprenderá a ir al cuenco de comida cuando ésta se entregue. Método de operante libre Método de condicionamiento instrumental que permite laEntrenamiento de omisión Procedimiento de ejecución repetida de la respuesta instrumental conicionamiento instrumental en el cual la sin que el sujeto sea retirado de la cámara respuesta instrumental previene la presentación experimental. (Compárese con el método de de un estímulo refonzante. ( Véase también ensayo discreto). reforzamiento diferencial de otras conductas) Moldeamiento Reforzamiento de aproximacionesEscape Procedimiento de condicionamiento instru- sucesivas a la respuesta instrumental deseada. mental en el cual la respuesta intrumental finaliza un estímulo aversivo ( Véase tambien reforza- Pertinencia La idea teórica, originalmente propuesta miento negativo.) por Thorndike, de que la historia evolutiva de un organismo hace que ciertas respuestas encajen oEstímulo apetitivo Estímulo placentero o se correspondan con ciertos reforzadores. La satisfactorio que puede utilizarse para reforzar pertinencia facilita el aprendizaje. positivamente una respuesta instrumental. Procedimiento de marcado Procedimiento en el cualEstímulo aversivo Estímulo displacentero o molesto la respuesta instrumental es inmediatamente que puede ser utilizado para castigar una seguida por un evento distintivo (el sujeto es respuesta instrumental. recogido, o se presenta un destello de una luz) que hace que la respuesta instrumental sea másEvitación Procedimiento de condicionamiento instru- fácil de memorizar y ayuda a superar los efectos mental en el cual la respuesta instrumental pre- perjudiciales del reforzamiento demorado. viene la administración de un estímulo aversivo. Reforzador condicionado Estímulo que se convierteHipótesis de la indefensión aprendida Idea teórica en un reforzador efectivo debido a su asociación que asume que durante la exposición a con un reforzador primario o incondicionado. estimulación aversiva inescapable e inevitable, los También denominado reforzador secundario. sujetos aprenden que su conducta no controla los eventos ambientales. Reforzador secundario Lo mismo que reforzador condicionado.Latencia Tiempo entre el inicio de un ensayo (o el inicio de un estímulo) y la respuesta instrumental. Reforzamiento accidental Caso en cual la entrega de un reforzador coincide con una respuestaLey del efecto Regla de la conducta instrumental, particular incluso si esta respuesta no es propueta por Thorndike, que establece que si una responsable de la presentación del reforzador. respuesta en presencia de un estímulo es seguida También denominado reforzamiento adventicio. por un evento satisfactorio, la asociación entre el estímulo y la respuesta se fortalecerá; si la Reforzamiento adventicio Lo mismo que respuesta es seguida por un evento molesto, la reforzamiento accidental. asociación se debilitará. 87 Descargado del campus, http://campus.felizmente.info
  • 90. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 5: Condicionamiento instrumental: Fundamentos Juan Carlos CabreraReforzamiento diferencial de otras conductas Respuesta de ínterin Respuesta que aumenta en Procedimiento de condicionamiento instrumental frecuencia después de la entrega de un en el cual un reforzador positivo es reforzador periódico y que disminuye a medida periódicamente entregado sólo si el sujeto no que se aproxima el siguiente reforzador. realiza una respuesta particular. Abreviado RDO. Respuesta operante Respuesta que se define por elRDO Abreviación de reforzamiento diferencial de efecto que produce en el ambiente. Los ejemplos otras conductas. incluyen presionar una palanca y abrir una puerta. Cualquier secuencia de movimientos que emuje laReforzamiento negativo Procedimiento de palanca hasta abajo o abra la puerta constituye un condicionamiento instrumental en el cual hay una ejemplo de esa operante particular. contingencia negativa entre la respuesta instrumental y un estímulo aversivo. Si la Respuesta terminal Respuesta que es más probable respuesta intrumental es realizada, el estímulo al final del intervalo entre sucesivos aversivo finaliza o se previene; si la respuesta reforzadores que están presentes a intervalos instrumental no se realiza, se presenta el fijos. estímulo aversivo. Velocidad de la carrera Rapidez (en metros porReforzamiento positivo Procedimiento de segundo, por ejemplo) con que se mueve un animal condicionamiento instrumental en el cual hay una por un corredor. contingencia positiva entre la respuesta intrumental y un estímulo reforzante. Si el sujeto realiza la respuesta, recibe el estímulo reforzante; si el sujeto no realiza la respuesta, no recibe elestímulo reforzante. 88 Descargado del campus, http://campus.felizmente.info
  • 91. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos Cabrera – 2009/2010Programas simples de reforzamiento intermitente- Programa de razón- Programas de intervalo- Comparación de los programas de razón y de intervalo- Programas de reforzamiento de tasas de respuestaConducta de elección: programas concurrentes- Medidas de la conducta de elección- La ley de la igualación- Mecanismos de la ley de la igualaciónElección con compromiso- Programas concurrentes encadenados- Estudios de "autocontrol"Comentarios finales 89 Descargado del campus, http://campus.felizmente.info
  • 92. Descargado del campus, http://campus.felizmente.info
  • 93. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraUn programa de reforzamiento es un programa, o regla, que En la vida real, no siempre quedetermina cómo y cuándo la ocurrencia de una respuesta ira damos una respuesta, aparecerá un reforzador.seguida de un reforzador. Este puede establecerse de El programa de reforzamientoinfinidad de formas. Los programas de reforzamiento que determina cuándo la ocurrenciaincluyen relaciones similares entre los estímulos, las de la respuesta va a ir seguida de un reforzadorrespuestas y los reforzadores, normalmente producenpatrones de conducta similares. Los programas de reforzamiento influyen tanto en laforma de aprender una respuesta instrumental como en la forma en que se mantiene elreforzamiento.Zeiler (1984) denominó a los programas de reforzamiento el gigante durmiente del análisisde la conducta.PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE (página 154 del libro)Los programas que organizan y dirigen la ejecución instrumental se activan de diferentesformas por los distintos programas de reforzamiento. En los programas "simples", un sólofactor determina qué ocurrencia de la respuesta instrumental se refuerza.Programas de razónLa característica definitoria de un programa de razón es que el reforzamiento dependesólo del número de respuestas que el organismo realiza. Un programa de razón sólo requierecontar el número de respuestas que ha ocurrido y entregar el reforzador cad vez que sealcance el número requerido. Si este número es uno, cada ocurrencia e la respuestainstrumental provacará la entrega de reforzador. Este tipo de programa se denominatécnicamente reforzamiento continuo (abreviado RFC).Las situaciones en las que la respuesta se refuerza sólo alguna vez, reforzamiento parcial ointermitente.Razón fija. Por ejemplo, la entrega de un reforzador después de cada décima respuesta depresión de palanca en un estudio con ratas de laboratorio. En un programa como éste, hayuna razón fija entre el número de respuestas que la rata realiza y el número dereforzadores que consigue. Esto convierte al procedimiento en un programa de razón fija.El procedimiento podría denominarse programa de reforzamiento de razón fija (RF 10). 91 Descargado del campus, http://campus.felizmente.info
  • 94. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraUn programa de reforzamiento continuoconstituye también un programa de razón fija. Es Programa de reforzamiento continuo: Cada respuesta correcta es reforzada.una razón fija de una respuesta por reforzador, Programa de reforzamento parcial o intermitente:en la que los organismos suelen responder con una No todas las respuestas correctas son reforzadas ytasa de respuesta constante pero moderada. pueden ser de varios tipos.Se da un patrón de respuesta diferente cuando se trata de un programa de razónintermitente de razón fija.El patrón típico de los programas de razón fija es que se da una tasa constante y alta unavez que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar elnúmero requerido de respuestas. Estas se muestran con claridad en un registro acumulativode la conducta.Un registro acumulativo es una forma especial de representar la forma de repetirse unarespuesta a lo largo del tiempo. Muestra el número total (o acumulativo ) de respuestas quehan ocurrido hasta un momento determinado en el tiempo.El registro acumulativo propor-ciona una representación visualcompleta de cuando y con quefrecuencia responde el sujetodurante la sesión. La tasa cero de respuesta quese observa justo después delreforzamiento se llama pausaposreforzamiento. La tasa altay estable que completa cadarequerimiento de la razón sellama carrera de la razón.Si el requerimiento de la razón se incrementa un poco ( de una RF 120 a un RF 150), la tasade respuesta puede permanecer igual durante la carrera de razón. Con mayoresrequerimientos de tasa, tienden a ocurrir pausas posreforzamiento más largas. Si elrequerimiento de la razón sufre un aumento súbito y significativo (de RF 120 a RF 500) esprobable que el animal realice una pausa periodica cada vez que complete la razón requerida,este efecto se llama tensión de la razón. En casos exremos, la tensión de la razón puedeser tan grande que el animal deje de responder. La longitud de la pausa posreforzamientoesta controlada por el requerimiento de la razón subsiguiente, por tanto podría recibir elnombre de pausa pre-razón. 92 Descargado del campus, http://campus.felizmente.info
  • 95. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraRazón variable. Es un procedimiento en el que se necesita un número de respuestas distintopara la entrega de cada recompensa. El valor numérico del programa de razón variable (RV)indica el número medio de respuestas requerido para conseguir el reforzador. Debido a que el número de respuestas necesario para conseguir el reforzamiento no espredecible, las pausas predecibles en la tasa de respuesta son menos probables con estosprogramas RV que con los programas de RF. Los organismos suelen responder con una tasaclaramente estable en los programa RV.Aunque pueden darse pausas posreforzamiento en los programas de razón variable, estasson mas largas y prominentes en los programas de razón fija. La tasa global de respuesta enlos programas de RF y RV es similar siempre y cuando, como promedio, se requieran númerossimilares de respuestas. Sin embargo, la tasa global de respuesta tiende a distribuirse enun patrón de pausa-carrera con los programa de RF, mientras que se observa un patrón másestable con los de RV. Programa de RAZÓN: El reforzador se otorga en función del número de respuestas. • Razón Fija (RF): El número de respuestas necesarias para obtener un reforzador es siempre el mismo. Ejemplo: RF5 = Cada 5 respuestas, me dan un premio. El programa de RF1 es un programa de reforzamiento continuo. Produce pausas post-reforzamiento. • Razón variable (RV): El número de respuestas necesarias para obtener un reforzador va variando. Ejemplo: RV5 = Cada 5 respuestas de media, me dan un premio.Programas de intervaloLas respuestas son reforzadas sólo si ocurren cuando ha transcurrido una cierta cantidadde tiempo.Intervalo fijo: el tiempo no varia de una ocasión a la siguiente. Se dan en situaciones dondese requiere una cantidad fija de tiempo para dispensar el reforzador. A medida que eltiempo para la disponibilidad del próximo reforzador se acerca, la tasa de respuestaaumenta, este aumento de la tasa de respuesta se manifiesta como una aceleración delregistro acumulativo al final del IF, este se denomina por consenso festón de intervalofijo. La pusa posreforzamiento y el aceleron posterior hacia el final del intervalo reflejanuna habilidad rudimentaria para contar el tiempo, En un estudio se uso como reloj un puntode luz que crecia a medida que el tiempo pasaba. L introducción de este estimulo relojincremento la pausa posreforzamiento y provoco que la respuesta se desplazase mas cercadel final del ciclo IF. 93 Descargado del campus, http://campus.felizmente.info
  • 96. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraUn programa IF no garantiza que el reforzador se proporcionara en algún momento a lolargo del intervalo, el intervalo sólo determina cuándo el reforzador esta disponible, nocuando se entrega.Intervalo variable: (IV), las respuestas se refuerzan si se dan tras haber transcurrido unintervalo variable desde la administración del reforzador previo. Se hallan en situacionesdonde se requiere una cantidad de tiempo impredecible para preparar o dispensar elreforzador.El sujeto en los programas IV tiene que realizar la respuesta instrumental para obtener elreforzador., no se dan gratis, se dan solo si el organismo responde tras un intervalovariable. Los programa IV mantienen tasa de respuesta constantes y estables sin pausasregulares. Programas de intervalo y espera limitada: Con los programas fuera de laboratorio, es mas común que los reforzadores estén disponibles durante tiempo limitado. Este tipo de restricción en cuanto al tiempo que permanece el reforzador disponible se llama espera limitada. Las restricciones de la espera limitada pueden añadirse tanto a los programas de intervalo fijo como a los de intervalo variable Programa de INTERVALO: El reforzador se otorga en función del tiempo que ha transcurrido desde el último reforzador (Pero todavía hay que responder al menos 1 vez para obtener el reforzador • Intervalo Fijo (IF): El tiempo que pasa entre dos reforzamientos es siempre el mismo. Ejemplo: IF5 = Cada 5 segundos, el reforzador está disponible (cada cinco segundos, si respondo me dan un premio. Produce pausas post-reforzamiento y aceleración pre-reforzamiento (Patrón “festoneado”) • Intervalo variable (IV): El tiempo que pasa entre dos reforzadores va variando. Ejemplo: IV5 = Cada 5 respuestas de media, el reforzador está disponible. 94 Descargado del campus, http://campus.felizmente.info
  • 97. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraComparacion de los programas de razón e intervaloHay similitudes entre los patrones de respuesta, tanto los programas RF como los IFproducen una pausa posreforzamiento después de la administración del reforzador.Producen altas tasas de respuestajusto antes de la administración delsiguiente reforzador. Por elcontrario, los programas de RV y deIV mantienen tasas estables derespuesta, sin pausas predecibles.Los programas de intervalo y derazón activan diferentes cambiosneuroquímicos en el cerebro.La conducta mantenida porprogramas de intervalo estamediada por el sentido temporal delorganismo, en los programas de razón no.La primera evidencia sobre las diferencias entre programas de intervalo y de razón fueproporcionada por un importante experimento de Reynolds (1975), ver pag 169-170 libro. ¿Cuál produce más respuesta? Reforzamiento diferencial del tiempo interres- puesta. ¿Por qué los programas de razón son Los programas que más respuestas producen son los de RAZÓN, porque en los de intervalo el capaces de producir tasas más altas de respuesta reforzador se obtiene por esperar al momento idóneo, no por dar un número determinado de que los programas de intervalo? El factor critico es respuestas. el espaciamiento entre respuestas que se da justo ¿Cuál produce más respuestas? antes del reforzamiento. El intervalo entre una respuesta y la siguiente se denomina tiempo Los programas fijos producen menos respuestas que los variables porque son más interrespuesta o TIR. Si se refuerzan TIRs cortos, predecibles. Además son más faciles de extinguir (tema 9). será mas probable que el sujeto realice TIRs cortos, si se refuerzan TIRs largos será mas De modo que el programa más efectivo para crear respuestas es el de razón probable que el sujeto realice TIRs largos. En un variable ( Ejemplo: máquina tragaperras, por eso programa de razón , no hay restricciones acerca de son tan “adictivas” y peligrosas) cuando cuentan las respuestas para conseguir el reforzador, esto es no se espera mucho entre lasrespuestas. Los programas de intervalo favorecen TIRs largos. 95 Descargado del campus, http://campus.felizmente.info
  • 98. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraProgramas de reforzamiento de tasas de respuesta.Requieren específicamente que el organismoresponda a una tasa particular de respuesta. El Además de las respuestas independientes, también podemos reforzar la tasa de respuesta (lareforzamiento de una respuesta particular depende velocidad a la que se dan las respuestas).de cuan pronto ocurra tras la respuesta Ejemplo: quiero que un animal dé cómo mínimoprecedente. Reforzamiento diferencial de tasa 12 respuestas por minuto. Entonces le doy el reforzador sólo si produce una respuesta en los 5altas (RDA): una respuesta se refuerza sólo si segundos siguientes a la anterior respuesta. Siocurren antes de que haya transcurrido cierta responde cada 5 segundos o menos, tiene una tasa de 12 respuestas por minuto, lo que yocantidad de tiempo tras la respuesta precedente. quería. Si tarda más de 5 segundos en responder,Reforzamiento diferencial de tasas bajas (RDB): no es reforzado aunque responda. Eso hará que se vuelva más rápido en el futuro.una respuesta se refuerza sólo si ocurre despuésde que haya transcurrido cierta cantidad de tiempodesde la respuesta previa.CONDUCTA DE ELECCIÓN: PROGRAMAS RECURRENTES (página 154 del libro)Históricamente se estudio con laberintos enforma de T. Las aproximaciones recientes al Si te dejan elegir, ¿qué prefieres hacer?estudio de la conducta de elección utilizan En los programas concurrentes se deja elegir al animalcajas de Skinner equipadas con dos entre dos programas de reforzamientomanipulandos (dos botones). En elexperimento típico, responder en cada teclaes reforzado según algún programa dereforzamiento. Los dos programas funcionanal mismo tiempo (o concurrentemente) y elsujeto es libre de cambiar de una tecla a otra, este tipo de procedimiento se llamaprograma concurrente, permite una medicion continua de la elección porque el organismo eslibre para cambiar de una tecla a otra en cualquier momento. 96 Descargado del campus, http://campus.felizmente.info
  • 99. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraMedidas de la conducta de elección La conducta de elección de un organismo en un programa concurrente se refleja en la distribución de su conducta entre dos respuestas alternativas. Una técnica común de medición es calcular la tasa relativa de Para saber qué programa prefiere seguir la paloma, respuestas de cada alternativa. recurriremos a la tasa relativa de respuestas. RA RA / (RA+RB) Tasa relativa de respuestas de tecla A = R A + RB Si la paloma no tiene ninguna preferencia en especial, la La forma en que un individuo distribuye su tasa relativa se queda en 0,5. conducta entre dos alternativas esta muy influida por el programa de reforzamiento que Para saber que programa administra más reforzadores a la paloma, recurriremos a la tasa relativa de reforzamiento. funciona para cada respuesta. La tasa relativa rA de reforzamiento para cada alternativa de Tasa relativa de reforzamiento de tecla A = rA + rB respuesta puede calcularse de una manera Si la paloma recibe reforzadores con la misma frecuncia en semejante a la tasa relativa de respuesta. cada lado, la tasa relativa se queda en 0,5. rA/(rA+rB)La ley de la igualaciónHerrnstein (1961) estudio la distribución delas respuestas en varios programas Ley de la igualación (Herrnstein)concurrentes IV-IV en los cuales la tasa total La tasa de respuesta = tasa de reforzamientomáxima de reforzamiento que las palomaspodían obtener estaba fijada en 40 por hora. RA rA =Dependiendo del valor exacto de cada R A + R B r A + rBprograma de IV, se podían obtener diferentes O sea, que la paloma responde más en el programaproporciones de los 40 reforzadores y no que más reforzadores le proporciona.había restricciones acerca de cual tecla Si te dejan escoger entre pasar una tarde en el cine opodían picotear. Los sujetos distribuyeron sus paseando con un amigo, escogerás probablemente la actividad más reforzante.respuestas de una manera altamentepredecible, la tasa relativa de respuesta enuna alternativa dada, estaba siempre muy cercana a igualar la tasa relativa dereforzamiento en esa alternativa, por tanto la tasa de respuesta en una alternativa seiguala con la tasa relativa de reforzamiento en esa alternativa: ley de la igualación.RA/(RA+RB)=rA/(rA+rB) o RA/RB=rA/rB; las tasas relativas de respuesta se igualan con lastasas relativas de reforzamiento. RA/RB= rA/rB 97 Descargado del campus, http://campus.felizmente.info
  • 100. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraInfraigualacion, supraigualacion y sesgo de respuesta.La tasa relativas de respuesta Infraigualación, supraigualación y sesgo de respuestano siempre se igualan con las A veces la ley de igualación no se cumple, y en esos casos se cumple estatasas relativas de reforza- norma:miento. Para acomodarlo añadie- s EL parámetro s es la sensibilidad de laron dos parametros, b y s a la RA ⎛ rA ⎞ conducta de eleción a las tasas de = b⎜ ⎟ ⎜r ⎟ reforzamiento (“Cuáto me afecta la tasaecuación: RA/RB=b(rA/rB)S , RB ⎝ B⎠ de reforzamiento de este programa”).donde s representa la sensibili- Una buena comida es reforzante, pero si no me gusta el pescado a lo mejor nodad de la conducta de elección a eligiría ese menú (sensibilidad).las tasas relativas de reforza-miento para las alternativas de El parámetro b es el sesgo (bias) de respuesta. Es una preferenciarespuesta. Cuando ocurre una por uno de los dos programas en particular, incluso aunque proporcione la misma tasa de reforzamiento que el otro (por ejemplo,igualacion perfecta s=1.0. la respuesta en sí puede ser más cómoda). Ir al ginmasio podría ser más reforzante que ver la televisión, porqueUn tipo de desviación de la produce un bneficio a largo plazo, pero como la respuesta es costosa, puede que prefiramos quedarnos en casa (sesgo de respuesta)iguala-ción perfecta incluye unasensi-bilidad reducida de laconducta de elección a las tasas relativas de reforzamiento: infraigualación y puedenacomodarse mediante la ecuación de arriba dotando al exponente s de un valor menor que1.0, indicando la sensibilidad reducida a la tasa relativa de reforzamiento.En otros ejemplos, la tasa relativa de respuesta es mas sensible a la tasa relativa dereforzamiento de lo que se predice para una igualación perfecta: supraigualación, dotandoal exponente s un valor mayor que uno, indicando el aumento de la sensibilidad de estefactor.Es más probable que las elecciones muestren sensibilidad reducida a las tasas relativas dereforzamiento que sensibilidad reducida a las mismas. El parámetro de sensibilidad puedeestar influido por númerosas variables, le especie, esfuerzo dificultad, etc.El parámetro b de la ecuación representa el sesgo de respuesta, estos influyen en laelección cuando las alternativas de respuesta son diferentes, también es importante cuandoel reforzador proporcionado para las dos respuestas es diferente. En ausencia de sesgosb=1.0. Infraigualación: El animal tiene una tasa de respuesta menor que la tasa de reforzamiento (recibe muchos reforzadores, pero no responde mucho), es como si los reforzadores obtenidos no produjeran mucha efecto en su elección. El parámetro sensibilidad (s) es <1. Supraigualación: El animal responde más de lo que le correspondería en función de su tasa de reforzamiento. El parámetro sensibilidad (s) es >1. En realizad, en estas relaciones influyen tanto la cantidad como la calidad del reforzador: si es un reforzador valioso, unos poquitos bastaran para que el animal prefiera ese programa a otro. 98 Descargado del campus, http://campus.felizmente.info
  • 101. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraLa ley de la igualación y el valor del reforzador: Se ha encontrado que la tasa relativa derespuesta es una función de la cantidad relativa de reforzador, asi como de la demorarelativa del reforzamiento. También están determinadas por la palatabilidad de losreforzadores.La ley de la igualación y los programas simples de reforzamiento La ley de la igualación también puede aplicarse a Herrnstein (1970) apuntó que incluso las programas sencillos de reforzamiento (no a la elección situaciones de respuesta única pueden en programas concurrentes) involucrar elección, entre realizar la respuesta Realizar cualquier conducta supone una elección especificada (presión de palanca) y ocuparse en (elegimos realizar esa conducta en vez de hacer cualquier otra cosa). Si una conducta no me “refuerza” otras posibles actividades (acicalarse). En un más que cualquier otra alternativa, si no es atractiva, es poco probable que la realice. programa simple, el sujeto recibe no sólo reforzamiento explícito por realizar unarespuesta operante específica, sino también recompenss intrínsecas de las otrasactividades que puede realizar. Por tanto, el reforzamiento total incluye las recompensasextrínsecas programadas tanto como las fuentes del reforzamiento no programadas. Estetipo de análisis permite la aplicacion de la ley de la igualación.Si sustituimos los valores de la ecuación de la ley de igualación, podemos adaptarla assituaciones de respuesta única: • RA representa la tasa de respuesta operante especificada por el programa. • RO representa la tasa de otras actividades del animal. • rA es la tasa de reforzamiento explicito programado. • rO es la tasa de reforzamiento intrínseco por las otras actividades. • k es una constante que el investigador utiliza cuando presupone que (RA+RO) es una constante que no guarda relación con el reforzador utilizado. krA RA = rA + rOEsta ecuación predice que la tasa de respuesta (RA) estará directamente relacionada con latasas de reforzamiento para esa respuesta de una forma negativamente acelerada. Otraimplicación, de particular interés clínico, es que la tasa de respuesta disminuirá a medidaque aumente la tasa de las otras fuentes de reforzamiento (rO). Por tanto, esta ecuaciónproporcionara dos maneras de modificar la tasa de una respuesta, mediante el cambio de sutasa de reforzamiento o mediante el cambio en la tasa de las otras fuentes dereforzamiento.La presuposición de que (RA+RO) es constante para unas situación instrumental esta puestoen cuestión con estudios recientes que varian el reforzador pero no la respuestainstrumental. 99 Descargado del campus, http://campus.felizmente.info
  • 102. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraMecanismos de la ley de la igualaciónLa ley de la igualación describe como los organismos distribuyen sus respuestas en unasituacion de elección pero no explica que mecanismos son responsables de esta distribuciónde respuestas. Está establecida en funcion de las tasas de respuestas y de reforzamientopromediada sobre la duración total de las sesiones experimentales. Ignora cuando serealizan las respuestas individuales. Igualmente las teorías molares de la igualación ignoranque podría ocurrir al nivel de las respuestas individuales. Las terorías molares explicanagregados de respuestas y se relacionan con la distribución total de respuestas yreforzadores en las situaciones de elección. Las teorías moleculares se centran en lo queocurre al nivel de las respuestas individuales y consideran la relación de igualación como elresultado neto de estas elecciones individuales. Otras teorías proporcionan.caracterizaciones de la conducta que no son ni molares ni moleculares, sino algo intermedioentre ellas ; el mejoramiento.Igualación y maximización de las tasas de reforzamiento: las explicaciones másinvestigadas de la conducta de eleccion están basadas en la idea de que los organismosdistribuyen sus acciones entre las alternativas de respuesta para recibir la mayor cantidadposible de reforzamiento.1º Maximizacion molecular: los organismos siempre eligen cualquier alternativa de respuestacon mejores probabilidades de que sea reforzada en ese momento. Shimp (1966.1969)propuso una primera versión de la ley de igualación molecular. Cuando dos programas A y B,funcionando simultáneamente, el sujeto cambia del programa A al B a medida que laprobabilidad de reforzamiento aumenta para el programa B. Supuso que la relación deigualación es un subproducto de una alternancia prudente cuando la probabilidad dereforzamiento en la tecla de respuesta alternativa es mayor que la probabilidad dereforzamiento en la tecla de respuesta actual.Estudios detallados de las pautas de alternancia entre respuestas no siempre apoyaron lateoría de maximización molecular propuesta por Shimp. Algunos estudios han mostrado quela igualación es posible en ausencia de una maximización momentánea. Sin embargo,aproximaciones más recientes a los análisis moleculares de la conducta de elección hantenido mas éxito.2º maximización molar: presuponen que el organismo distribuye sus respuestas entre lasvarias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen a lalarga. Se centran en agregados de conducta sobre algún período más que en las respuestasde elección individual. 100 Descargado del campus, http://campus.felizmente.info
  • 103. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraFue originalmente formulada para explicar la eleccion en programas concurrentesconstruidos con programas de razón, en estos programas, los animales raramente cambiande una alternativa a otra, en su lugar, responden exclusivamente en el componente de razónque requiere el menor número de respuestas, de esta forma maximiza su tasa dereforzamiento con el mínimo esfuerzo.La maximización molar predice de forma precisa los resultados de los procedimientos deelección, pero ciertos hallazgos presentan dificultades; como en los resultados de losprogramas concurrentes de reforzamiento IV-IV, en los cuales los organismos puedenconseguir casi todas las recompensas disponibles en ambos programas, siempre y cuadnoprueben de forma ocasional cada alternativa. La teoría no puede explicar por qué laconducta de elección se distribuye de forma tan cercana a la relación de igualación.Otro desafio son los programas de IV-RV, dadas las diferencias entre estos dos programas,para el máximo beneficio en un programa concurrente RV-IV, los sujetos deberíanconcentrara sus respuestas en la alternativa de razón variable y responder soloocasionalmente en el componente de intervalo variable, esto no sucede, los animalesfavorecen el componente RV pero no de forma tan fuerte como predice la teoría3ª Mejoramiento: Los mecanismos de mejoramiento operan en una escala temporal que estaentre la escala temporal de las teorías molar y molecular.El termino mejoramiento se refiere a hacer algo mejor. No se refiere a elegir la mejoralternativa en ese momento (maximización molecular), o hacer que a largo plazo algo sea tanbueno como pueda (maximización molar), sino a hacer que la situacion sea mejor a cómo esasituación ha sido en el pasado reciente. Los beneficios están circunscritos a una situaciónlimitada - no en su totalidad o a largo plazo.La teoría asume que los organismos cambian de una alternativa a otra para mejorar la tasalocal de reforzamiento. Puede demostrarse matemáticamente que cuando los sujetosdistribuyen sus respuestas para obtener la misma tasa local de reforzamiento en cadaalternativa, se están comportando de acuerdo con la ley de igualación. Por tanto, elmecanismo de mejoramiento da como resultado la igualación. De acuerdo con esta teoría, lapaloma cambiara su preferencia a favor de la alternativa de respuesta que arroje la tasalocal más alta. Estos cambios de un lado a otro continuaran hasta que sea igual la tasa localde reforzamiento conseguida en las dos alternativas. ¿Qué determina los cambios de un programa a otro? • Teorías de la maximización molecular: El animal hace un cambio de programa para obtener un reforzador determinado. • Teoría de la maximización molar: El animal hace los cambios precisos para obtener el máximo de reforzadores a la larga. • Teoría del mejoramiento: El animal cambia para obtener una tasa local de reforzamiento mejor que la actual. La tasa local de reforzamiento en el programa A: Número de reforzadores obtenidos durante el tiempo que se ha dedicado al programa A. La alternancia de programas continúa hasta que las tasas locales se igualan. 101 Descargado del campus, http://campus.felizmente.info
  • 104. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraELECCION CON COMPROMISO (página 182 del libro)Una vez que se tome una decisión, no se puede cambiar.Programas concurrentes encadenadosLa técnica básica en este area deinvestigación es el programa concurrenteencadenado de reforzamiento, este constade dos fases; eslabón de elección; sepermite al participante elegir entre dosprogramas alternativos de respuesta. Laoportunidad para el reforzamiento sucedesólo después de que la elección inicial hayasido realizada y la paloma se encuentra enel eslabón terminal; otra característicaimportante de este programa es que unavez que el participante ha realizado laelección, esta comprometido con esta hasta el final del programa. Por tanto los programasconcurrentes encadenados implican elección con compromiso.Los estudios de este tipo han demostrado que los sujetos prefieren la alternativa de RV,esta está guiada por el hecho de que ocasionalmente un programa de RV proporcionareforzamiento por un número relativamente pequeño de respuestas.La consecuencia de responder duranteel eslabon inicial de un programaconcurrente no es el reforzadorprimario (comido), es pasar a uno de loseslabones terminales, la consecuenciainmediata de una respuesta en uneslabon inicial es un estímulo que estaasociado con el eslabón terminalelegido. Como este estimulo estapresente cuando se proporciona elreforzador primario, el estimulo deleslabón terminal se convierte enreforzador condicionado . Por tanto, se puede caracterizar un programa concurrente comoaquel en que las respuestas al eslabón inicial se refuerzan por la presentación de unreforzador condicionado. Las diferencias en el valor de reforzador condicionadodeterminaran entonces la tasa relativa de cada respuesta de elección en el eslabon inicial. 102 Descargado del campus, http://campus.felizmente.info
  • 105. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraEstudios de “autocontrol” El autocontrol es a menudo cuestión de elegir una recompensa grande demorada sobre una recompensa pequeña inmediata.Explicaciones del autocontrol: El valor de un reforzador se reduce en función de cuantotiempo se tiene que esperar para obtenerlo, funcion descontadora de valor. El consensoactual es que el valor (V) de un reforzador esta directamente relacionado con la magnitudde la recompensa (M) e inversamente relacionado con la demora de la recompensa (D), deacuerdo con la formula: V=M/(1+KD) donde K es el parámetro de la tasa descontadora, estaecuación se llama función del decaimiento hiperbólico, de acuerdo con esta ecuación, si elreforzadro es entregado sin demora (D=0), el valor del reforzador está directamenterelacionado con su magnitud. Cuanto más se demora el reforzador, menor es su valor.Las funciones descontadoras y los problemas de autocontrol en la adicción a lasdrogas. Madden, Petry, Badger y bickel (1997) advirtieron que el abuso de sustanciasfrecuentemente revela una serie de elecciones impulsivas. Los adictos elegirán larecompensa relativamente pequeña y rápida de la intoxicación de la droga a riesgo deconsecuencias negativas más demoradas de problemas interpersonales. Este tipo deelecciones sugieren que se descuenta el valor (o amenaza) de las consecuencias a largoplazo. Si esto es cierto, entonces los adictos deberían mostrar funciones de descuento dela recompensa mas acusadas que otros individuos. Madden y colaboradores (1997)comprobaron esta predicción con un grupo de pacientes dependientes de la heroínaapuntados aun programa de desintoxicacion y otro grupo de no dependientes igualados enedad, genero, educación y CI. Ver ej libro pag 187. Un hallazgo significativo fue que lafunciones descontadoras de la recompensa eran mucho más acusadas para los adictos a laheroína. Esto indica una falta de control. 103 Descargado del campus, http://campus.felizmente.info
  • 106. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos Cabrera¿Puede entrenarse el autocontrol? Una persona que no puede tolerar esperar el tiemponecesario para obtener recompensas grandes tiene que olvidarse de obtener esosreforzadores. El autocontrol, o la preferencia pr una recompensa grande demorada frente auna recompensa pequeña inmediata, es a menudo una estrategia sensible. De hecho, algunoshan sugerido que el autocontrol es un componente crítico de la socialización y del ajusteemocional.Entrenar a las personas con recompensas demoradas parace tener efectos generalizados enincrementar su tolerancia a la recompensa demorada. En un estudio de elección, realizadoscon niños de una escuela elemental, a los que se les preguntó si querían conseguir 2 céntimosinmediatamente o 3 al final del día, se les realizadon tres sesiones de entrenamiento conuna recompensa imediata o demorada.Durante cada sesión de entrenamiento, se presentaron varios roblemas: uno incluía contarobjetos en una carta, otro era una rarea pictórica, y el tercero era una tarea deemparejamiento de formas. Para la mitad de los estudiantes, la respuesta correcta erareforzada inmediatamente con 2 centimos. Para el resto, las respuestas correctas teniancomo resultado 3 céntimos que se situaban en un cuanco y serían entregados al final de día.Se midió la preferencia por la recompensa pequeña inmediata frente a la más grandedemorada. Siempre y cuando las tareas de entrenamiento implicasen bajo esfuerzo, elentrenamiento con la recompensa demorada incrementó la preferencia por la recompensamás grande demorada durante el postest. Por tanto, el entrenamiento con reforzamientodemorado producía autocontrol generalizado.Comentarios finales (página 189 del libro)El principio básico del condicionamiento instrumental es muy simplie: el reforzamientoaumenta (y el castigo disminuye) la probabilidad futura de una respuesta instrumental. Sinembargo, como se ha descrito, el análisis experimental de la conducta instrumental puedeser bastante intrincado. Muchos aspectos importantes de la conducta instrumental estádeterminados por el programa de reforzamiento. Hay numerosos programas por los cualeslas respuestas pueden ser reforzadas. El reforzamiento puede depender de cuántasrespuestas han ocurrido, el paso del tiempo, o la tasa de respuesta. Es más, puede estardisponible más de un programa de reforzamiento al mismo tiempo. El patrón de conductainstrumental, así como las elecciones entre varias alternativas de respuestas, estánfuertemente determinados por el programa de reforzamiento en curso. Estos hallazgos hanpermitido conocer bastante sobre cómo el reforzamiento controla la conducta en diversascircunstancias y han alentado muchas aplicaciones importantes de los principios delreforzamiento a la conducta humana. 104 Descargado del campus, http://campus.felizmente.info
  • 107. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraTÉRMINOS CLAVECarrera de razón Tasa de respuesta alta y estable Programa concurrente Procedimiento de que se observa tras la pausa posreforzamiento en reforzamiento complejo en el cual el participante los programas de reforzamiento de razón fija. La puede elegir cualquiera de dos o más programas de carrera de la razón finaliza cuando se ha llevado a reforzamiento simples que están disponibles cabo el número necesario de respuestas y el sujeto simultáneamente. Los programas concurrentes es reforzado. permiten la medida de la elección entre alternativas de programas simples.Espera limitada Restricción en cuánto tiempo permanece disponible el reforzamiento. Para que Programa concurrente encadenado Procedimiento una respuesta sea reforzada, debe ocurrir durante de reforzamiento complejo en el que se permite al el periodo de espera limitada. participante elegir cuál de varios programas simples de reforzamiento funcionará. Una vezFestón del intervalo fijo Incremento gradual de la realizada la elección, las alternativas rechazadas tasa de respuesta que ocurre entre no están disponibles durante algún tiempo. reforzamientos sucesivos en un programa de intervalo fijo. Programa de intervalo Programa de reforzamiento por el que una respuesta es reforzada sólo siFunción descontadora del valor Función matemática ocurre después de una cantidad de tiempo que describe cómo disminuye el valor del establecida desde el último reforzamiento. reforzador en función del tiempo que el sujeto tiene que esperar para la administración del Programa de intervalo fijo Programa de reforzador. reforzamiento en el cual el reforzador se entrega por la primera respuesta que ocurre después deInfraigualación Sensibilidad menor de la predicha una cantidad fija de tiempo desde el último por una igualación perfecta a la tasa relativa de reforzador. Abreviado IF. reforzamiento. Programa de intervalo variable Programa deLey de la igualación Regla de la conducta reforzamiento en el que el reforzamiento se instrumental, propuesta por R.J.Herrnstein, que proporciona por la primera respuesta que ocurre establece que la tasa relativa de respuesta en una tras una cantidad de tiempo variable desde el alternativa de respuesta particular es igual a la último reforzador. Abreviado IV. tasa relativa de reforzamiento para esa alternativa de respuesta. Programa de razón Programa de reforzamiento en el que el reforzamiento depende sólo del númeroMejoramiento Mecanismo para alcanzar la de respuestas que realiza el sujeto, igualación respondiendo para mejorar las tasas independientemente de cuándo sucedan. locales de reforzamiento en las alternativas de respuesta. Programa de razón fija Programa de reforzamiento en el cual debe ocurrir un número fijo dePausa posreforzamiento Pausa en el responder que respuestas para que la próxima respuesta sea sucede normalmente tras la administración del reforzada. Abreviado RF. reforzador en los programas de reforzamiento de razón fija e intervalo fijo. 105 Descargado del campus, http://campus.felizmente.info
  • 108. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 6: Programas de Reforzamiento y Conducta de Elección Juan Carlos CabreraPrograma de razón variable Programa de Reforzamiento intermitente Programa de reforzamiento en el que el número de respuestas reforzamiento por el que sólo algunas de las necesarias para producir reforzamiento varía de ocurrencias de la respuesta instrumental son ensayo a ensayo. El valor del programa se refiere al reforzadas. La respuesta instrumental es reforzada número medio de respuestas necesarias para el ocasionalmente, o de forma intermitente. También reforzamiento. Abreviado RV. denominado reforzamiento parcial.Programa de reforzamiento Programa, o regla, que Reforzamiento parcial Lo mismo que reforzamientodetermina cómo y cuándo la ocurrencia de una intermitente.respuesta irá seguida por la adaministración de unreforzador. Registro acumulativo Una representación gráfica de cómo se repite una respuesta a lo largo del tiempo,Programa de tasa de respuesta Programa de con el paso del tiempo representado por la distanciareforzamiento en el que la respuesta se refuerz horizontal (o eje x) y el total o número acumulativodependiendo de lo pronto que ésta se realiza tras la de respuestas que ha ocurrido hasta un momentoocurrencia previa de la conducta. determinado representado por la distancia vertical (oReforzamiento continuo Programa de reforzamiento eje y).en el cual cada ocurrencia de la respuestainstrumental produce el reforzador. Abreviado RFC. Supraigualación Sensibilidad mayor de la predicha por una igualación perfecta a la tasa relativa deReforzamiento diferencial de tasas altas Programa reforzamiento.de reforzamiento en el cual una respuesta esreforzada sólo si ocurre antes de que haya Tensión de la razón Deterioro en la respuesta quetranscurrido una cantidad especifica de tiempo sucede cuando el requerimiento de respuesta de unadespués de la respuesta precedente. Abreviado RDA. razón fija se incrementa demasiado rápido.Reforzamiento diferencial de tasas bajas Tiempo interrespuesta o TIR Intervalo entre unaPrograma de reforzamiento en el cual una respuesta respuesta y la siguiente. Los TIRs pueden seres reforzada sólo si ocurre despues de que haya diferencialmente reforzados de la misma manera quetranscurrido una cantidad especificada de tiempo otros aspectos de la conducta, como la fuerza deladespues de la respuesta precedente. Abreviado RDB. respuesta o la variabilidad. 106 Descargado del campus, http://campus.felizmente.info
  • 109. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos Cabrera – 2009/2010La estructura asociativa del condicionamiento instrumental- La asociación E-R y la ley del efecto.- Expectativa de recompensa y la asociación E-C- Relaciones R-C y E(R-C) en el condicionamiento instrumentalRegulación conductual- Antecedentes de la regulación conductual- Regulación conductual y el punto de deleite conductual- Conceptos económicos y distribución de respuesta- Problemas con las aproximaciones de regulación conductual- Contribuciones de la regulación conductualComentarios finalesDescargado del campus, http://campus.felizmente.info 107
  • 110. Descargado del campus, http://campus.felizmente.info
  • 111. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos CabreraSe han propuesto dos aproximaciones muy diferentes a intentar explicar por que ocurre larespuesta instrumental. Una de estas se inicio con el trabajo de Pavlov y se centra enexplicar la estructura asociativa del condicionamiento instrumental. La otra se origino conel trabajo de Skinner y se centra en como la conducta esta regulada en vista de laslimitaciones o restricciones creadas por los procedimientos de condicionamientoinstrumental. Las teorías de la regulación conductual describen los efectos delreforzamiento dentro del amplio contexto del repertorio conductual de un organismoutilizando conceptos de varias áreas de investigación, incluyendo la economía conductual yla ecología conductual. La aproximación asociacionista se centra en los mecanismosmoleculares y no se preocupa de la meta a largo plazo o la función de la conductainstrumental. Por el contrario, la aproximación de la regulación conductual se centra n losaspectos molares de la conducta y considera los efectos del condicionamiento instrumentalcomo manifestaciones de procesos de maximización u optimización.La motivación de la respuesta instrumental ha sido considerada desde dos perspectivasradicalmente distintas. La primera se origino con Thorndike e incluye el análisis de laestructura asociativa del condicionamiento instrumental , radica en el concepto deasociaciones y es compatible con la tradición teórica del condicionamiento pavloviano. Tomauna perspectiva molecular: se centra en las respuestas individuales y sus antecedentesestimulares y consecuencia especificas. Para alcanzar este nivel de detalles, laaproximación asociativa examina el aprendizaje instrumental en preparaciones conductualesaisladas. Debido a que las asociaciones pueden encontrar sustento en el sistema nerviosos,la aproximación asociativa proporciona un marco conveniente para estudiar los mecanismosneurales del condicionamiento instrumental.La aproximación alternativa a los procesos motivacionales en el aprendizaje instrumental esla regulación conductual. Se desarrolla dentro de la tradición skinneriana e incluye laconsideración del condicionamiento instrumental en el contexto más amplio de las múltiplescosas que el organismo esta haciendo. Esta interesada en como un procedimiento decondicionamiento instrumental establece los limites al flujo de actividades de un organismoy las consecuencias conductuales de estas restricciones: considera la motivación de laconducta instrumental desde un punto de vista más molar, las metas y como los organismossacan provecho de la complejidad de su ambiente y de sus múltiples opciones conductualespara alcanzar sus metas. Dos perspectivas de motivación de la respuesta instrumental: • Estructura asociativa del condicionamiento instrumental Concepto de asociación pavloviano → (perspectiva molecular→respuestas especificas) • Regulación conductual: influencia Skinneriana. Contexto más amplio que la conducta aislada. Se centra en cómo un procedimiento instrumental establece límites a las actividades naturales de un organismo y las consecuencias de dichas restricciones (perspectiva molar)Descargado del campus, http://campus.felizmente.info 109
  • 112. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos CabreraLa estructura asociativa del condicionamiento instrumental (página 192 del libro)Eduard Thorndike fue el primer en reconocer que el condicionamiento instrumental incluyealgo más que una respuesta y un reforzador. La respuesta instrumental ocurre en presenciade estímulos particulares. Deben considerarse tres sucesos en el análisis delcondicionamiento instrumental: el contexto estimular (E), la respuesta instrumental (R) y laconsecuencia de la respuesta instrumental o reforzador (C). Skinner también suscribió lanoción de tres sucesos y describió el condicionamiento instrumental en términos de unacontingencia de tres términos que incluía E R y C .La asociación E-R ya la Ley del efecto Thorndike → La respuesta ocurre en presencia de ciertos estímulos particulares.La asociación E-R fue postulada por Thorndike Recordemos la ley del efecto: La presencia de señales ocomo la clave del aprendizaje instrumental en estímulos que señalan acontecimientos significativos (por ejemplo, la disponibilidad de recompensa sisu ley del efecto; el papel del reforzador o de llevamos a cabo una respuesta determinada) controla nuestra expectativa de recompensa.la consecuencia de la respuesta es establecer o"estampar" una asociación entre las claves contextuales E y la respuesta instrumental.Pensó que una vez establecida esta asociación E-R sería, de forma única, responsable de laocurrencia de la respuesta instrumental. Por tanto, el ímpetu básico o motivación para larespuesta instrumental era la activación de la asociación E-R mediante la exposición delsujeto a los estímulos en presencia de los cuales la respuesta instrumental fue previamentereforzada.La ley del efecto asume que el único papel del reforzador es crear una asociación E-R, queel reforzador en si mismo no es una parte o no participa en esta asociación. Esta presunciónes bastante contraintuitiva.Expectativa de recompensa y la asociación E-C Clark HullCualesquiera que sean los estímulos, el reforzamiento de larespuesta instrumental produciría inevitablemente unemparejamiento entre E y el reforzador o consecuencia de larespuesta (C). Estos emparejamientos proporcionan el Dos tipos distintos de aprendizaje:potencial para el condicionamiento clásico y el 1. Aprendizaje pavloviano E-C (expectativa de recompensa)establecimiento de una asociación entre E y C. Activa un estado emocional 2. Aprendizaje instrumental E-R.Una de las explicaciones más tempranas e influyentes del papel del condicionamiento clásicoen la conducta instrumental fue propuesta por Clark Hull (1930,1931) y más tardeelaborada por Kenneth Spence (1956) , durante el curso del condicionamiento instrumental.La respuesta instrumental llega a ser instigada o motivada por dos factores. En primerlugar, la presencia de E llega a evoca la respuesta instrumental directamente por asociacióncon E-R. En segundo lugar, la actividad instrumental también llega a realizarse en respuestaDescargado del campus, http://campus.felizmente.info 110
  • 113. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos Cabreraa la expectativa de recompensa debido al establecimiento de una asociación R-C: la formaconcreta en que la asociación R-C llega a motivar la conducta instrumental ha sido tema deconsiderable debate e investigación experimental. Una formulación especialmenteinfluyente fue la teoría moderna de los dos procesos /Rescorla y Salomon,1967)La teoría moderna de los dos procesos. Asume que hay dos tipos distintos deaprendizaje, el condicionamiento pavloviano y el instrumental, además, estos dos procesosestán relacionados de una forma especial. Durante el curso de un condicionamientoinstrumental, los estímulos (E) -en presencia de los cuales de refuerza la respuestainstrumental- se presume que llegan a asociarse con la consecuencia de la respuesta (C) através de condicionamiento pavloviano para establecer una asociación E-C. A través de laasociación E-C, el estímulo E llega a motivar la conducta instrumental mediante laactivación de un estado emocional central. La naturaleza de ese estado emocional omotivación dependerá de la naturaleza del reforzador. Por ejemplo, en un procedimiento decondicionamiento instrumental en el que la respuesta sea reforzada por la presentación decomida ( u otro reforzadores apetitivos), la asociación E-C activa la expectativa de comida(Mowrer la llamo "esperanza").Recorla y Salomon (1967) apuntaron que si la expectativa pavloviana motiva la conductainstrumental, entonces la presentación de un estímulo condicionado pavloviano deberíaalterar el curso de la respuesta instrumentalmente reforzada. La implicación básica de lateoría moderna de los dos procesos es que la tasa de una respuesta instrumental serámodificada por la presentación de un estímulo clásicamente condicionado. la presentaciónde un EC+ clásicamente condicionado con comida durante la ejecución de una respuestareforzada con comida debería aumentar la esperanza que fue creada por la contingenciainstrumental e incrementar la respuesta.Resultados consecuentes con la teoría moderna de los dos procesos. Utilizanormalmente un diseño experimental llamado experimento de transferencia de control,consta de tres fases: Fase 1: Condicionamiento instrumental de una respuesta operante utilizando algún programa de reforzamiento positivo o negativo. Fase 2: Condicionamiento clásico, en el cual se asocia un EC explícito con la presencia o ausencia de un EI. Es necesario durante esta fase no esté presente el condicionamiento instrumental. Fase 3: Fase de transferencia crítica. Los participantes pueden realizar la respuesta instrumental y se presenta periodicamente el EC de la fase 2 para observar su efecto en la tasa de conducta instrumental.Descargado del campus, http://campus.felizmente.info 111
  • 114. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos CabreraInteracciones de respuesta en los experimentos de transferencia de control. Losestímulos condicionados clásicamente elicitan no sólo estados emocionales, sino tambiénrespuestas concretas que puede influir sobre la conducta que habíamos condicionado. Porejemplo, si el estímulo condicionado provoca una conducta de quedarse quieto y la conductainstrumental que se ha aprendido y reforzado es dar saltos, la presencia del EC disminuirá,interferirá. Esto hace ver que no es sólo el estado emocional lo que influye en la conductareforzada.¿Estados emocionales centrales condicionados o expectativas especificas derecompensa? La teoría moderna de los dos procesos asume que el condicionamiento clásicomedia la conducta instrumental a través del condicionamiento de estados emocionalescentrales como la esperanza (en el caso de reforzamiento positivo) o el miedo (en el casodel reforzamiento negativo). En ciertas circunstancias los animales adquieren expectativasespecificas del reforzador en lugar de un estado emocional más general de esperanzadurante el condicionamiento instrumental y clásico. El aprendizaje de expectativaespecifica de recompensa es una alternativa importante a la teoría de los dos procesospara explicar ciertos tipos de resultados. Esta basada en la asunción de que elcondicionamiento instrumental incluye aprendizaje de una asociación E-C.Las asociaciones E-C parecen ser fundamentales para la motivación de la conductainstrumental, Berridge (2001) apunto que la asociación E-C, E llega a ser un estímulo deincentivo; E en si mismo llega a ser atractivo. Esta motivación adquirida de incentivocontribuye significativamente a la motivación de la respuesta instrumental. Como resumen: la teoría de los dos procesos asume que el condicionamiento clásico media de conducta instrumental a través del condicionamiento de estados emocionales centrales como la esperanza o el miedo.Relaciones R-C y E(R-C) en el condicionamiento instrumentalLa intuición sugiere que la conducta instrumental involucra asociaciones R-C, estas noexisten en el modelo de los dos procesos.Otra peculiaridad de la estructura asociativa del condicionamiento instrumental asumidapor las teorías de los dos procesos es que E supone que llega a estar asociado directamentecon C en la idea de que el emparejamiento de E con C es suficiente para la ocurrencia decondicionamiento clásico. Los emparejamientos EC-EI no son suficientes para el desarrollode asociaciones pavlovianas. El EC debe también proporcionar información acerca del EI, oestar de alguna manera relacionado con el EI. Esta condicionalidad en la relación de E con Ces desestimada en la teoría de los dos procesos. Parece difícil creer que toda la motivación depende de las asociaciones E-C y E-R teniendo en cuenta que ninguna de ellas establece una relación directa entre la respuesta y el reforzador. En la vida diaria hacemos las cosas porque conllevan una consecuencia determinada, cosa que no refleja la teoría de los dos procesos.Descargado del campus, http://campus.felizmente.info 112
  • 115. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos CabreraEvidencia de asociaciones R-C; Algunas investigaciones han sugerido que elcondicionamiento instrumental lleva el aprendizaje de asociaciones respuesta-consecuencia. La devaluación del reforzador La importancia de la asociación R-C se ve con la devaluación del reforzador. ha sido utilizada para DEVALUACIÓN DEL REFORZADOR • Fase 1: Entrenamiento de dos conductas con IV1 con reforzadores distintos. determinar si la repuesta • Fase 2: Devaluación del reforzador: Reforzador + LiC1 (condicionamiento de instrumental esta mediada aversión) • Fase 3: Posibilidad de realizar las dos conductas aprendidas → La conducta por una asociación entre la cuyo reforzador ha sido condicionado aversivamente disminuye. respuesta y la consecuencia reforzante. La supresiónselectiva de respuesta que se obtuvo es difícil de explicar a partir de las asociaciones E-Co E-R que se supone que son aprendidas de acuerdo con la teoría de los dos procesos, ladevaluación de un reforzador debilita selectivamente la respuesta particular que ha sidoentrenada con ese reforzador. Este hallazgo indica que cada respuesta estaba asociadaseparadamente con su propio reforzador.Evidencia del aprendizaje de una relación jerárquica E-(R-C); los organismos aprendena asociar la respuesta instrumental con su consecuencia. Sin embargo, las asociaciones R-Cno pueden actuar aisladamente para producir la repuesta instrumental. E no activa Rdirectamente , sino que activa la asociación R-C. El sujeto llega a pensar en la asociación R-C cuando se encuentra con E, y eso motiva que realice la respuesta instrumental.Skinner (1938) sugirió que E, R y C en el condicionamiento instrumental están conectados através de una relación condicional E-(R-C).Regulación Conductual (página 199 del libro)La regulación conductual se centran en cómo las contingencias instrumentales ponenlimitaciones a las actividades de un organismo.Antecedentes de la regulación conductualLos teóricos están de acuerdo en que los reforzadores son un tipo especial de estímulos. Las respuestas consumatorias típicas de laLa teoría de la respuesta consumatoria especia (comer, beber...) son en sí mismas el rasgo crítico de los reforzadores.El primer reto a esta idea vino de Fred Sheffieldque formularon la teoría de respuesta Esta teoría considera que las respuestas reforzadoras son especiales porque involucran laconsumatoria, esta atribuye el reforzamiento a consumación o el completamiento de unaestas conductas típicas de la especie. Se establece secuencia instintiva de conducta. La teoría asume que las respuestas consumatoriasque las respuestas consumatorias típicas de la (masticar y tragar, por ejemplo) son fundamentalmente diferentes de variasespecie son en si mismas el rasgo critico de los respuestas instrumentales potenciales (correr,reforzadores. Fue una innovación radical debido a saltar...)que traslado la investigación de los reforzadoresdesde tipos especiales de estímulos a tipos especiales de respuestas. Se considero que lasrespuestas reforzadoras eran especiales porque involucraban la consumación o elDescargado del campus, http://campus.felizmente.info 113
  • 116. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos Cabreracompletamiento de una secuencia instintiva de conducta. David Premack retomo el tema consu teoría y sugirió que las respuestas reforzadoras son especiales sólo debido a que es másprobable que ocurran que las respuestas instrumentales a las que siguen.El principio de Premack: Apuntó que Principio de Premacklas respuestas incluidas en los Las respuestas incluidas en los reforzadores comúnmentereforzadores comúnmente utilizados utilizados son actividades que es altamente probable queeran actividades que es altamente realicen los animales.probable que realicen los animales. Las Principio de Premack o "Principio de la probabilidad diferencial"respuestas instrumentales son activi- "Dadas dos respuestas de diferente probabilidad, A y B, ladades que normalmente ocurren a una oportunidad para realizar la respuesta de alta probabilidad Abaja probabilidad. Propuso que esta después de la respuesta de baja probabilidad B tendrá como resultado el reforzamiento de la respuesta B. (B→A refuerza B). Ladiferencia en las probabilidades de oportunidad para realizar la respuesta B de baja probabilidad después de la respuesta A de alta probabilidad no dará comorespuesta es critica para el reforza- resultado el reforzamiento de la respuesta (A→ no refuerza A)"miento.Se centra en la diferencia de la probabilidad de las respuestas instrumental y reforzadora.En consecuencia también es denominado el principio de la probabilidad diferencial.El principio de Premack significó un avance importante en el pensamiento científico sobre elreforzamiento. Estimuló la consideración de los reforzadores como respuestas más quecomo estímulos, y amplió mucho el rango de cosas que los investigadores empezaron autilizar como reforzadores. Cualquier actividad podía servir como reforzador siempre ycuando fuera más probable que la respuesta instrumental. Principio de Premack Principio de Premack También sirve para el castigo... Una conducta muy probable es una conducta muy preferida. Las conductas probables (preferidas) sirven para reforzar las Las conductas poco probables (no preferidas) menos probables y hacer que se repitan más en el futuro. sirven para castigar la más probables y hacer que Respuesta reforzadora: La que se usa para reforzar otra. no se repitan tanto en el futuro. Respuesta instrumental: La que es reforzada con otra. La conducta instrumental es la castigada.Descargado del campus, http://campus.felizmente.info 114
  • 117. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos CabreraLa hipótesis de la privación de respuesta: En la mayoría de los procedimientos decondicionamiento instrumental, la probabilidad momentanea de una respuesta reforzada semantiene a un nivel alto mediante la restricción al acceso a la respuesta reforzante.Premack (1965) reconoció la importancia de restringir el acceso a respuesta reforzadorapara el condicionamiento instrumental. Caracterizo la privación de respuesta no sólo comouna condición necesaria para el reforzamiento sino como algo adjunto al principio deprobabilidad diferencial. La respuesta reforzadora todavía tiene que ser una conducta másprobable que la respuesta instrumental. Por el contrario, Timberlake y Allison (1974)abandonaron totalmente el principio de probabilidad diferencial y argumentaron que larestricción de la respuesta reforzadora era el factor critico para el reforzamientoinstrumental, esta propuesta es denominada Hipótesis de privación de respuesta, haceexplícita la idea radicalmente diferente de que un reforzador es producido por lacontingencia instrumental en si misma. Posteriores desarrollos de las teorías de regulaciónconductual han establecido como las contingencias instrumentales crean los reforzadores ylos efectos del reforzamiento. Hipótesis de la privación de la respuesta: Lo importante no es la probabilidad diferencial de las conductas (cuáles se repitan más y cuáles menos), sino el estado de privación de una determinada conducta. Puede que en el estado natural correr sea una conducta de baja probabilidad, pero si yo privo el acceso a esta conducta, entonces la puedo usar como respuesta reforzadora.Regulación conductual y el punto de deleite conductualLas teorías de la regulación conductual asumen que existen mecanismos homeostáticosanálogos respecto a la conducta. Se propone que los organismos tienen una distribución deactividades preferida u optima que luchan por mantener frente a los cambios ointerrupciones. Se centran en el grado en que la contingencia instrumental respuesta-reforzador rompe la estabilidad conductual y empuja al individuo fuera de su distribuciónde actividades preferida u optima.El punto de deleite conductual. La teoríade la regulación conductual asume que si losorganismos son libres para distribuir susrespuestas entre las alternativasdisponibles, lo harán de la forma en quesea más cómodo o en algún sentido optimopara ellos. Esta distribución de respuestasdefine el punto de deleite conductual.El punto de deleite conductual puedeidentificarse mediante la frecuenciarelativa de ocurrencia de todas lasrespuestas de un organismo en una situación sin restricciones.Descargado del campus, http://campus.felizmente.info 115
  • 118. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos CabreraImposición de una contingencia instrumental. La teoría de regulación conductual estableceque los organismos defenderán el punto de deleite conductual contra los cambios. Lointeresante es que la línea de base libre del Imposición de una contingencia instrumental:punto de deleite conductual no siempre puede Si dejamos al sujeto a su aire, se quedará en elser restablecida después de que se haya punto de deleite. Eso puede ser malo ( ejemplo: estudiar poco, fumar mucho...)introducido una contingencia instrumental. Este El terapeuta quiere modificar esa distribución de conductas haciendo que se apartasen del punto dees a menudo el dilema que impone una deleite. ¿Cómo? Mediante reforzamientos y castigos.contingencia instrumental. No permite volver alpunto de deleite. El punto de deleite proporciona la motivación para la conducta instrumental. La teoría de regulación conductual asume que para volver al punto conductual establecido continua siendo una meta en la distribución de respuestas. Cuando este meta no puede alcanzarse, la redistribución de las respuestas entre las conductas instrumental y contingente llega a ser una cuestión de ajuste. La tasa de una respuesta se mantiene lo mas cerca posibledel nivel preferido sin cambiar la otra respuesta demasiado de su nivel preferido.Staddon propuso un modelo de desviación mínima de regulación conductual para resolverel dilema de las restricciones del programa, la introducción de una contingencia respuesta-reforzador provoca que los organismos redistribuyan sus conductas entre las respuestasinstrumentales y contingentes de manera que se minimice la desviación total de las dosrespuestas con respecto al punto optimo o de deleite.Explicación los efectos de reforzamiento. La regulación conductual incluye la defensa deun punto de deleite conductual frente a restricciones de respuesta impuestas por unacontingencia respuesta-reforzador. Esta defensa puede requerir establecerse en algúnpunto cercano peno no exactamente en el punto de deleite de la línea base. El aumento en larespuesta instrumental (un efecto de reforzamiento ) es el resultado de mecanismosreguladores de la conducta que funcionan para minimizar las desviaciones del punto dedeleite conductual.Una visión sobre las contingencias de reforzamiento en un contexto conductual masamplio: Las contingencias instrumentales no suceden en un vacío conductual ocurren en elcontexto de una variedad de respuestas y reforzadores que puede obtener el sujeto.Descargado del campus, http://campus.felizmente.info 116
  • 119. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos CabreraCentrarse solo en la respuesta instrumental y sus estímulos antecedentes y consecuentes(esto es, la estructura asociativa de la conducta instrumental) desatiende el contextoconductual mas amplio ya que puede influir de forma significativa en el resultado de losprocedimientos particulares de condicionamiento instrumental.Conceptos económicos y distribución de respuestaEn las situaciones de condicionamiento instrumental, las restricciones están proporcionadaspor el número de respuestas que un organismo es capaz de realizar y el número derespuestas requerido para obtener cada reforzador.Demanda del consumidor. La relación entre el precio de una comodidad y cuanto se obtienese denomina curva de la demanda.El grado en el cual el precio influye en elconsumo se denomina elasticidad de lademanda.El concepto de demanda del consumidorpuede utilizarse para analizar el refor-zamiento instrumental considerando elnumero de respuestas realizadas comoanálogo al dinero. EL precio de unreforzador es el tiempo o numero derespuestas requeridas para obtener unreforzador. Por tanto, el precio delreforzador esta determinado por elprograma de reforzamiento.Determinantes en la elasticidad de la demanda.Los conceptos económicos han ayudado a identificar tres factores principales que influyenen como las restricciones de un programa moldean la redistribución de la conducta.1º Disponibilidad de sustitutos: Es el factor que mas influye en la elasticidad de lademanda. La disponibilidad de sustitutosaumenta la sensibilidad del articulo a los preciosaltos.Una fuente de reforzadores sustituible es la disponibilidad de un reforzador fuera de lasesión experimental. La parte de comida que no comen durante la sesión experimental seles da luego en la jaula hogar, esta situación se denomina una economía abierta, Esto secontrapone con una economía cerrada, en la cual los sujetos no reciben alimentaciónDescargado del campus, http://campus.felizmente.info 117
  • 120. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos Cabrerasuplementaria. En general la elasticidad de la demanda es mayor en situaciones de economíaabierta que en economías cerradas.2º Rango de precios: Un aumento en elprecio tiene menos efecto en preciosbajos que en precios altos.3º Nivel de ingresos: En estudios decondicionamiento instrumental, elnúmero de respuestas o la cantidad detiempo disponible para respondercorresponde a los ingresos. Cuantas másrespuestas o tiempo tengan disponibleslos animales, menos estará su conductainfluida por los aumentos en el coste delreforzador.Problemas con las aproximaciones de regulación conductualEl punto de deleite es una característicamolar de la conducta. Se basa en una medida 1. El punto de deleite se formula desde un punto de vista molar (como un conjunto, y a lo largo de un periodode cada respuesta acumulada a lo largo del amplio). Sin embargo, está demostrado que es importante cómo se alcanza ese punto de deleitebloque temporal amplio. Un punto de deleite (pausas de elección en los cambios de conducta amolar dado puede alcanzarse de varias otra) desde un punto de vista más molecular.formas, de acuerdo con esta aproximación , 2. El "valor reforzante· de una conducta puede cambiarlas diferencias en las pautas de respuesta no según si es obligada o no. Por ejemplo, al principio una conducta A puede ser agradable, pero cuando ladeberían tener importancia. Pero la evidencia utilizo para reforzar otra conducta B, estoy imponiendo la conducta A. ¿Cómo sé si sigue siendoexperimental indica que es importante como tan agradable como al principio?se alcanza el punto de deleite molar. Enconsecuencia una adecuada caracterización del deleite conductual requiere informaciónsobre las pautas de elección moleculares.Otra dificultad, tal vez más seria es que las respuestas durante un periodo de línea baselibre no siempre tiene el mismo valor como respuestas que ocurren como parte de unacontingencia instrumental impuesta, Hacer algo cuando no hay requerimientos impuestosexternamente (correr por placer ) parece ser diferente a hacer lo mismo cuando serequiere por una contingencia instrumental impuesta.Finalmente, debido a que las aproximaciones no comprenden procesos conductualesmoleculares, no dicen nada de cómo los organismos defienden una combinación favorita debienes o actividades.Descargado del campus, http://campus.felizmente.info 118
  • 121. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos CabreraContribuciones de la regulación conductual1º Nos alejó de la consideración de los 1. Antes se pensaba en los reforzadores como tiposreforzadores como tipos especiales de especiales de estímulos. Desde la aproximación de larespuestas. Los efectos del reforzamiento se regulación conductual, la causa del reforzamiento está en la forma en que el flujo libre, natural, de la conductaven como producidos por las restricciones del se ve alterado por las contingencias instrumentales. Una conducta puede ser reforzante.programa en el devenir de las actividades deun organismo. 2. Ahora, el entrenamiento instrumental ya no sirve sólo para "fijar" o "eliminar" una conducta, sino que crea una2º Los procedimientos de condicionamiento nueva distribución de conductas en general.instrumental ya no se considera que estampano fortalecen la conducta instrumental: en sulugar el condicionamiento instrumental esvisto como la creación de una nueva 3. Una respuesta reforzadora no tiene nada inherentedistribución o asignación de respuestas, la distinto de una respuesta instrumental: no proporciona ningún beneficio especial, por ejemplo fisiológico (hacerreasignación de la conducta incluye un ejercicio vs. Comer caramelos). Simplemente, el que unaaumento en la respuesta instrumental y una conducta sea reforzadora o instrumental va a depender de los papeles que les asigne el terapeuta odisminución de la respuesta reforzadora. experimentador.3º No existe una distinción fundamental entre 4. Ha contribuido a ver el condicionamiento instrumental como un sistema, en vez de cómo elementos aislados.las respuestas instrumentales y las Al cambiar un solo elemento, el sistema entero se vereforzadoras, se distinguen solo por los afectado.papeles asignados a ellas mediante unprocedimiento de condicionamiento instrumental.4º Aceptan la idea de que los organismos responden para maximizar sus beneficios.5º Han proporcionado caminos nuevos y precisos para describir las restricciones queimponen varios procedimientos de condicionamiento instrumental en el repertorio deconducta de un organismo. Mas importante, han enfatizado que la conducta instrumental nopuede ser estudiada en un vacío o en un tubo de ensayo conductual. Todas las opciones derespuesta del organismo que se dan en un momento dado deben ser consideradas como unsistema.Comentarios finalesLos procesos motivacionales en la conducta instrumental se ha enfocado desde dosperspectivas radicalmente diferentes y dos tradicionales intelectuales: la perspectivaasociacionista tiene sus raices en la ley del efecto de Thorndike y el condicionamientopavloviano, y la perspectiva de la regulación conductual tiene su origen en el análisisconductual skinneriano. Estas dos aproximaciones difieren más que se asemejan, haciendodifícil imaginar cómo podrían integrarse. Por ejemplo, el concepto fundamental en laDescargado del campus, http://campus.felizmente.info 119
  • 122. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos Cabreraaproximación asociacionista (el concepto de una asociación) es enteramente soslayado porla regulación conductual. Igualmente, los conceptos críticos de la regulaciónconductual(puntos de deleite y restricciones del programa) no tienen correspondencia en laaproximación asociacionista. La aproximación asociacionista por sí misma lleva un inmediatoa la exploración de los circuitos neurales de condicionamiento instrumental. Por otra parte,es difícil ver cómo la aproximación de la regulación conductual podría utilizarse para guiarla investigación neurofisiológica.Las dos aproximaciones parecen centrarse en asuntos completamente distintos, pero ambashan contribuido de forma significativa a la compresión de la motivación de la conductainstrumental. Es evidente que una aproximación no puede ignorarse a favor de la otra, pero¿cómo contribuye cada una a la compresión completa de la motivación instrumental?.Una forma de pensar sobre las dos aproximaciones es que incluyen diferentes niveles deanálisis. La asociacionista involucra un nivel molecular donde el objetivo son los estímulosespecíficos, las respuestas, y sus conexiones. En contraste, como se ha descrito, laregulación conductual opera a un nivel molar de agregados de conducta y de contextosconductuales más amplio en el que operan las contingencias instrumentales. Por tanto, laaproximación de la regulación conductual contacta mejor con las complejidades de laecología de un organismo.Otra forma de pensar en la relación entre las dos aproximaciones es que una se relacionacon procesos y la otra está más relacionada con funciones o metas a largo plazo. Laaproximación asociacionista describe procesos específicos [asociaciones E-R, E-C, R-C y E-(R-C)] que sirven para generar y dirigir la conducta instrumental, pero no tienen en cuentael “propósito” o función a largo plazo del aprendizaje instrumental. Éste es el punto de vistade la regulación conductual y la economía conductual, que asumen que los organismostrabajan para defender una distribución óptima de actividades. La defensa del punto dedeleite conductual se alcanza mediante los procesos moleculares de las asociaciones.Los desarrollos conceptuales en el estudio de la motivación de la conducta instrumentalproporcionan un ejemplo representativo del curso de la investigación científica. Ésta se hadesarrollado desde formulaciones simples estímulo-respuesta hasta consideraciones máscomprensivas de la forma en que el repertorio del organismo se restringe mediante lascontingencias instrumentales y cómo los organismos resuelven problemas ecológicoscomplejos. En ese aspecto del estudio del condicionamiento y el aprendizaje, tal vez másque en ningún otro, los investigadores se han movido con atrevimiento para explorar nuevasconcepciones cuando las viejas ideas no afrontaban con éxito los desafíos propuestos porlos hallazgos empíricos.Descargado del campus, http://campus.felizmente.info 120
  • 123. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales Juan Carlos CabreraTERMINOS CLAVE (página 216 del libro)Curva de la demanda Relación entre la cantidad Punto de deleite conductual Distribución preferida que se obtiene de una comodidad y su precio. de las actividades de un organismo antes de que se introduzca un procedimiento deElasticidad de la demanda Grado en el que el precio condicionamiento instrumental que disponga influye sobre el consumo u obtención de una limitaciones en la distribución de respuesta. comodidad. Si el precio tiene un efecto importante en el consumo, la elasticidad de la Principio de Premack Lo mismo que principio de demanda es alta. Si el precio tiene poco efecto probabilidad diferencial. sobre el consumo, la elasticidad de la demanda es baja. Principio de probabilidad diferencial Principio que asume que el reforzamiento depende laExperimento de transferencia de control probabilidad relativa del organismo de ejecutar la Experimento que evalúa los efectos de un respuesta reforzadora frente a la respuesta estímulo condicionado clásicamente (EC) en la instrumental antes de que se introduzca el ejecución de la conducta instrumental. El EC y la procedimiento de condicionamiento instrumental. respuesta instrumental se condicionan en primer Cuanta más diferencia exista entre la lugar en fases independientes del experimento. probabilidad de la respuesta reforzadora y la Los efectos del EC sobre la respuesta instrumental durante las condiciones de línea de instrumental se determinan entonces en la fase base, mayor será el efecto reforzante de de transferencia. proporcionar la oportunidad de ejecutar la respuesta reforzadora tras realizar laHipótesis de la privación de respuesta Explicación instrumental. También conocido como principio de del reforzamiento que defiende que la restricción Premack. el acceso a una respuesta por debajo de su tasa de línea base de ocurrencia (privación de Teoría de la respuesta consumatoria Teoría que respuesta) es suficiente para hacer que la asume que las respuestas consumatorias típicas oportunidad de ejecutar esa respuesta actúe de la especia (comer, beber y cosas así) son las como un reforzador positivo efectivo. características fundamentales de los reforzadores.Modelo de desviación mínima Modelo de conducta instrumental, según el cual los participantes responden a la contingencia respuesta- reforzador de manera que los acerque lo máximo posible a su punto de deleite conductual.Descargado del campus, http://campus.felizmente.info 121
  • 124. Descargado del campus, http://campus.felizmente.info
  • 125. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos Cabrera – 2009/2010Identificación y medida del control por el estímulo- Respuesta diferencial y discriminación de estímulos- Generalización de estímulos- Los gradientes de generalización del estímulo como medida de control por el estímulo.Factores del estímulo y la respuesta en el control por el estímulo- Capacidad sensorial y orientación.- Facilidad relativa del condicionamiento de varios estímulos.- Tipo de reforzamiento.- Tipo de respuesta instrumental.- Elementos del estímulo frente a claves configuracionales en los estímulos compuestos.Factores de aprendizaje en el control por el estímulo- Entrenamiento en discriminación de estímulos.- Efectos del entrenamiento en discriminación sobre el control por el estímulo.- Rango de posibles estímulos discriminativos.- ¿Qué se aprende en el entrenamiento de discriminación?- Interacciones entre el E+ y el E-: desplazamiento del máximo- Entrenamiento de equivalencia de estímulosClaves contextuales y relaciones condicionales- Control por claves contextuales.- Control por las relaciones condicionales.Comentarios finalesDescargado del campus, http://campus.felizmente.info 123
  • 126. Es tan importante la adecuación de una respuesta instrumental al contexto estimular en elque se realiza, que la falta de un apropiado control por el estímulo se considera a menudoanormal, desvestirse en privado es aceptable en publico motivo de arresto.El control de la conducta por el estímulo es un aspecto importante de la forma en que losorganismos se adaptan al ambiente. Para acomodarse de forma efectiva y evitar el peligrolos animales tienen que comportarse de forma congruente con las circunstanciascambiantes.Identificación y medida del control por el estímulo (página 218 del libro)¿Cómo se puede afirmar que una respuesta instrumental esta bajo el control de ciertosestímulos?.Respuesta diferencial y discriminación de estímulosEl control por el estímulo de la conducta Reynolds (1961)instrumental se demuestra mediante variaciones Entrenamiento:en la respuesta (respuesta diferencial) rela-cionadas con las variaciones en los estímulos. Siun organismo responde de una manera enpresencia de un estímulo, y de forma diferenteen presencia de otro, se puede decir que su Prueba:conducta esta bajo el control de esos estímulos.Estas respuestas diferenciales resultan eviden- Resultados: una paloma picoteaba más el circulo rojo y para la otra fue el triángulo blanco.tes en el comportamiento de las dos palomas delexperimento de Reynolds. Conclusiones: Si un cambio en el estímulo conlleva un cambio en la conducta, es que ese estímulo controlaLa respuesta diferencial a dos estímulos también en cierta medida esa conducta.indica que las palomas estaban tratando cada Para que un estímulo controle una conducta, elestímulo de forma diferente. Esto se denomina organismo tiene que poder distinguir ese estí-discriminación de estímulos. Se dice que un mulo de otros (diferenciar al estímulo com- puesto del círculo por un lado y del triánguloorganismo muestra discriminación de estímulos si por el otro).responde de forma diferente a dos o más En esta situación es difícil predecir qué compo-estímulos. La discriminación de estímulos y el nente del estímulo original va a tener el con- trol. Unas palomas responden más al círculo,control por el estímulo constituyen dos maneras otras al triángulo.de considerar el mismo fenómeno: una no existesin la otra. Si un organismo no discrimina entre dos estímulos, su conducta no esta bajo elcontrol de esas claves.Descargado del campus, http://campus.felizmente.info
  • 127. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos CabreraOtro aspecto interesante del experimento de Reynolds es que la conducta de cada pájaroestaba controlada por un estímulo diferente. En ausencia de procedimientos especiales, losinvestigadores no siempre pueden predecir cual de varios estímulos de aquellos que unorganismo experimenta adquirirá control sobre su conducta instrumentalGeneralización de estímulosIdentificar y diferenciar varios estímulos no es algo tan simple. Los estímulos puedendefinirse de formas muy diversas. En ocasiones, objetos o eventos muy diferentes seconsideran ejemplos del mismo estímulo debido a que comparten la misma función. En otroscasos, los estímulos se identifican y distinguen partiendo de rasgos físicos precisos, comola longitud de onda.Los análisis experimentales del problema han dependido en su mayoría del fenómeno de lageneralización de estímulos, que es lo opuesto a la respuesta diferencial, o discriminaciónde estímulos. Se dice que un organismo muestra generalización de estímulos si respondemanera similar a dos o mas estímulos. Este fenómeno fue observado en primer lugar porPavlov.En un experimento clásico Guttman y Kalish palomas programa IV picotear con luzamarillenta con longitud de onda 580 anómetros, después se observa que palomas tambiénresponde a 570 y590. Estos resultados mostraron un gradiente de respuesta en función dela semejanza entre cada estímulo de prueba y el estímulo original de entrenamiento. Esteresultado es un ejemplo de lo que se denomina gradiente de generalización de estímulo.Los gradientes de generalización del estímulo como medidas del control por elestímuloSe utilizan a menudo para medir el control por el estímulo porque facilitan informaciónacerca del grado de sensibilidad de la conducta de un organismo ante la variación de unaspecto particular del ambiente.Guttman y Kalish (1956) y el experimento hipotético con las palomas ciegas a los coloresindica que lo acusado del gradiente de generalización de un estímulo proporciona unamedida precisa del grado de control del estímulo. Se obtiene un gradiente degeneralización plano si el organismo responde de forma similar a todos los estímulos de laprueba. Esta falta de respuesta diferencial demuestra que el rasgo del estímulo que sevaria en la prueba de generalización no controla la conducta instrumental. Por el contrario,se obtiene un gradiente de generalización acusado si el organismo responde en mayormedida a algunos de los estímulos de prueba que a otros. Esta respuesta diferencialDescargado del campus, http://campus.felizmente.info 125
  • 128. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos Cabreraevidencia el hecho de que la conducta instrumental esta bajo el control del rasgo delestímulo que varia entre los estímulos de prueba.Si se da una gran cantidad de generalización, se dará poca respuesta diferencial. Si larespuesta es altamente diferencial ante los estímulos, se obtendrá una mínimageneralización.Factores del estímulo y la respuesta en el control por el estímulo. (página 222 del libro)La cuestión principal es la siguiente ¿Qué es lo que determina que una de las muchascaracterísticas de una situación estimular adquiera control sobre la conductainstrumental?.Capacidad sensorial y orientaciónEl factor que determina de forma mas evidente si una característica particular delestímulo llega a controlar la respuesta es la capacidad sensorial y de orientación delindividuo. La presentación de estímulos con ciertas características de interés para unorganismo no garantiza que otro organismo responderá a las mismas características.Los sucesos fuera del rango de lo que un organismo puede detectar con sus órganossensoriales simplemente no existen para ese organismo a menos que se amplifiquen o seantraducidos a algo que el organismo pueda detectar. Las limitaciones en los estímulos quepueden llegar a controlar la conducta dependen también de si el individuo llega a tomarcontacto con el estímulo.Descargado del campus, http://campus.felizmente.info 126
  • 129. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos CabreraFacilidad relativa del condicionamiento de varios estímulos La intensidad con que los organismos aprenden Factores del estímulo y la respuesta.sobre un estímulo depende de la facilidad relativade condicionamiento de otras claves presentes en la 1. Capacidad sensorial del individuo.situación. Este fenómeno se llamaensombrecimiento. Pavlov fue el primero enobservar que si dos estímulos se presentan al mismotiempo, la presencia del estímulo que se puedeentrenar mas fácilmente puede ocultar el 2. Facilidad de condicionamiento del estimulo.aprendizaje del otro. En general cuanto más intensosea el estímulo , más rápido se condicionara y Unos estímulos se condicionan mejor queensombrecerá el aprendizaje del estímulo mas otros, por sudébil. Pavlov encontró que el estímulo débil podía intensidad, naturaleza...llegar a condicionarse (algo más lentamente ) si sepresentaba solo.Tipo de reforzamientoEs más probable que ciertos tipos deestímulos adquieran control sobre laconducta instrumental con reforzamientopositivo que con reforzamiento negativo.Ciertos hallazgos indican que el control porel estímulo de la conducta instrumentalesta determinado en parte por el tipo dereforzamiento utilizado. Es más probableque los estímulos visuales adquieran controlsobre la conducta en situaciones apetitivas Efectos del tipo de reforzamiento en el control por el estímulo. Seque las claves auditivas, mientras que es reforzó una respuesta de presión de un pedal en palomas en presencia de un estímulo compuesto consistente en un tono ymas probable que estas adquieran control una luz. Con un reforzamiento con comida, la luz obtuvo muchoen situaciones aversivas. más control sobre la conducta que el tono. Con un reforzamiento de evitación de una descarga, el tono adquirió mucho más control sobre la conducta que la luz (Adaptado deEsto está probablemente relacionado con Foree y Lolordo, 1973.)los sistemas de conducta que se activan enlos dos casos, la activación del sistema de alimentación puede involucrar una sensibilidadincrementada a los estímulos visuales. En contraste los procedimientos de evitación de ladescarga activan el sistema de conducta defensiva. Responder a claves auditivas puede serparticularmente adaptativo para evitar el peligro.Descargado del campus, http://campus.felizmente.info 127
  • 130. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos CabreraTipo de respuesta instrumentalOtro factor que puede determinar que rasgos de un estímulo compuesto obtendrán controlsobre la conducta es la naturaleza de la respuesta requerida por el reforzamiento.Las respuestas que se diferencian por la localización es mas probable que lleguen a estarbajo el control de la característica espacial de las claves auditivas. Por el contrario lasrespuestas que se diferencian por la naturaleza (hacer/no hacer) es mas probable quelleguen a estar bajo el control de la naturaleza de las claves auditivas. Este fenómeno sedenomina efecto de la naturaleza-localizacion. Este efecto es una forma de asociaciónselectiva.El efecto de naturaleza-localización no significa que los sujetos no puedan nunca aprendersobre la naturaleza de los sonidos cuando están involucradas respuestas que se diferenciasespacialmente o que nunca puedan aprender acerca de la localización de los sonidos en unatarea de hacer/no hacer. Con un emplazamiento oportuno de las fuentes de sonido (unomucho más cerca de la respuesta que el otro), los sujetos pueden llegar a responder a lascaracterísticas de localización de sonidos en una tarea de hacer/no hacer.Elementos del estímulo frente a claves configuracionales en los estímuloscompuestos.En el análisis anterior sobre el control de la conducta por varios elementos del estímulo, seasumió que los organismos tratan a estos elementos del estímulo como rasgos distintivos yseparados del ambiente. Esto se denomina aproximación elemental del estímulo. Por tanto,en el efecto de naturaleza-localización, la naturaleza y la localización de un estímuloauditivo se consideran características separables de las claves auditivas. Se suponía queuna característica particular del estímulo (la naturaleza del sonido) se percibía de la mismamanera independientemente del estatus de la otra característica (la localización delsonido). Una alternativa teórica importante presuma que los organismos tratan losestímulos complejos como un todo integral que no se divide en partes o elementos. Esto sedenomina aproximación de la clave configuracional.De acuerdo con la aproximación de la clave configuracional, los individuos responden a unestímulo compuesto en función de la configuración única de sus elementos. Se asume que loselementos no se tratan como entidades separadas. Pueden incluso no ser identificablescuando se presenta el estímulo compuesto, los elementos del estímulo son importantes noen cuanto a su individualidad sino en función de cómo contribuyen a la configuración totalde la estimulación proporcionada por el compuesto.El ensombrecimiento , según esta teoría, refleja diferentes grados de decremento de lageneralización desde la fase de entrenamiento a la de prueba para los grupos deensombrecimiento y de control, (John Pearce, 1987): No hay decremento de lageneralización para el grupo de control cuando se prueba el estímulo débil a porque es elmismo estímulo que recibió durante el condicionamiento. Por el contrario, se da unDescargado del campus, http://campus.felizmente.info 128
  • 131. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos Cabreraconsiderable decremento de la generalización cuando se prueba el estímulo a en el grupo deensombrecimiento tras el condicionamiento con el compuesto aB. Para el grupo deensombrecimiento, la respuesta se condiciona al compuesto aB, que es muy diferente depresentar sólo a durante la generalización, este mayor decremento de la generalización esla causa del efecto de ensombrecimiento.En ciertas condiciones, los organismos claramente responden a los estímulos compuestosprincipalmente en términos de la configuración de los elementos que forman el compuesto.Esta teoría es incompatible con varios ejemplos de asociaciones selectivas que se handescrito con anterioridad, no explica por que el control por el, estímulo esta en función deltipo de reforzamiento utilizado o del tipo de respuesta requerida. La conclusión masprudente es que los organismos responden a los compuestos estimulares tanto a partir delos elementos del estímulo que forman el compuesto como en función de configuracionesestimulares únicas creadas por los elementos del estímulo. En ciertas circunstanciaspredomina el control elemental, mientras que en otras condiciones predomina el control delas características configuracionales de los compuestos estimulares.La estructura de una teoría unificada de este tipo ha sido descrita recientemente porWagner y Brandon (2001), estímulos como el sonido de un tono contienen rasgos distintivos(tono, intensidad, localización ). Cuando un estímulo se combina con otro se crean nuevoselementos estimulares configuracionales que son únicos para este nueva combinaciónestimular. Además, algunos de los rasgos individuales de los estímulos originales se pierdenen la combinación. Esto sesga el control por el estímulo a favor de los elementosconfiguracionales y produce resultados congruentes con la aproximación de la claveconfiguracional.FACTORES DE APRENDIZAJE EN EL CONTROL POR ELESTÍMULO (página 230 del libro)Los factores del estímulo y la respuesta son los puntos de arranque del control por elestímulo. El que ciertos estímulos lleguen a controlar la conducta a menudo depende de loque el organismo ha aprendido acerca de esos estímulos.La sugerencia de que la experiencia con los estímulos puede determinar hasta que puntoestos llegan a controlar la conducta tuvo su origen en los esfuerzos por explicar elfenómeno de la generalización de estímulos. Pavlov sugirió que la generalización del estímulose da porque el aprendizaje sobre el EC llega a transferirse a otros estímulos en función dela semejanza física de esos estímulos de prueba con el EC original.Lashley y Wade (1946) adoptaron una postura contraria a la de Pavlov. Rechazaron la ideade que la generalización del estímulo reflejase la transferencia del aprendizaje yargumentaron que reflejaba la ausencia de aprendizaje. En particular propusieron que lageneralización del estímulo ocurre si los organismos no han aprendido a distinguir lasdiferencias entre los estímulos. Defendían que los animales tenían que aprender a tratarlos estímulos como diferentes uno de otro. Consideraban la forma del gradiente deDescargado del campus, http://campus.felizmente.info 129
  • 132. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos Cabrerageneralización del estímulo como determinada principalmente por las experiencias previasde aprendizaje del organismo mas que por las propiedades físicas de los estímulos.Entrenamiento en discriminación de estímulos.Numerosos estudios han demostrado que el control por el estímulo puede alterarse deforma notable por las experiencias de aprendizaje. El procedimiento más poderoso parasituar la conducta bajo el control de un estímulo es el entrenamiento en discriminación deestímulos. En un procedimiento de discriminación de estímulos los participantes seexponen al menos a dos estímulos diferentes, pero el reforzamiento por realizar larespuesta instrumental esta disponible solo en presencia de uno de los colores. El estímuloque señala la disponibilidad de reforzamiento se denomina E+ o ED (pronunciado “e de”). Encontraste, el estímulo que señala la falta de reforzamiento se denomina E- o EΔ(pronunciado “e delta”). Losprocedimientos de discriminación deestímulos establecen un control porlos estímulos que señalan cuandoesta o no disponible elreforzamiento. Cuando E+ y E- hanadquirido control sobre la conductadel organismo, se denominanestímulos discriminativos . El E+ esun estímulo discriminativo para larealización de la respuestainstrumental, y el E- es un estímulodiscriminativo para la supresión dela respuesta.Los procedimientos instrumentales de discriminación de estímulos se diferencian de losprocedimientos de condicionamiento clásico sólo en que el reforzador se presenta de formacontingente a la respuesta durante el E+. No es necesario responder para que se den losemparejamientos del EC+ con el EI en el condicionamiento clásico. A diferencia de un EC+,un E+ no señala de que el reforzador ocurrirá inevitablemente. Más bien, el E+ indica que larespuesta instrumental será reforzada.En un programa múltiple de reforzamiento funcionan diferentes programas dereforzamiento en presencia de diferentes estímulo.Efectos del entrenamiento en discriminación sobre el control por el estímuloEl entrenamiento en discriminación sitúa la conducta instrumental bajo el control del E+ yel E-. Los investigadores deben también determinar lo acusado del gradiente degeneralización cuando los participantes responden en presencia de estímulos que varíansistemáticamente a partir del E+: Es mas debe determinarse que aspecto del procedimientoDescargado del campus, http://campus.felizmente.info 130
  • 133. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos Cabreradel entrenamiento en discriminación es responsable del tipo de gradiente de generalizacióndel estímulo que se obtiene.Jenkins y Harrison (1960,1962) examinaron como los estímulos auditivos que diferían en eltono llegaban a controlar la conducta de picoteo de las palomas reforzada con comida. Ungrupo de pájaros fue reforzado por picotear en presencia de un tono de 1000 hertzios y norecibía reforzamiento cuando el tono no se presentaba. El tono de 1000 hz servía como E+y la ausencia de tono como E-.Para el segundo grupo, el tono de 1000 hz sirvió de nuevo como E+ , pero el E- fue un tonode 950 hz. El tercer grupo de palomas sirvió como grupo de control y no recibióentrenamiento, el tono de 1000 hz sonaba constantemente y siempre podían recibirreforzamiento por picotear cuando estaban en la cámara experimental.Después de acabar el entrenamiento, en cada grupo se puso a prueba la conducta de picoteoen presencia de tonos de varia frecuencias para ver con que precisión controlaba el tonodicha conducta. El grupo control respondió de forma casi idéntica en presencia de todos losestímulos de prueba; el tono de los sonidos no controlaba su conducta: Cada uno de losotros procedimientos de entrenamiento produjo un mayor nivel de control estimular por eltono. El gradiente de generalización mas acusado y por tanto el control por el estímulo masfuerte se observo en los pájaros que habían sido entrenados con el tono de 1000 hz comoE+ y el tono de 950 como E-. Las otras (1000 hz y ausencia de tono ) mostraron un gradointermedio de control.Este experimento aporto dos conclusiones importantes (1) el entrenamiento endiscriminación aumenta el control por el estímulo de la conducta instrumental, y (2) unadimensión particular del estímulo (como la frecuencia tonal ) es mas probable que adquieracontrol sobre la respuesta si el E+ y el E- difieren a lo largo de la dimensión del estímulo.Rango de posibles estímulos discriminativosLos procedimientos de entrenamiento en discriminación se emplean a menudo para evaluarla capacidad sensorial de los animales. Schsterman y colaboradores lo han utilizado paradeterminar los umbrales visuales y auditivos .Los investigadores también se han interesadopor el estudio de si los animales son capaces de detectar las sensaciones internas creadaspor una droga. Esta investigación ha mostrado que los mecanismos de control por elestímulo con drogas son asombrosamente parecidos a los mecanismos identificados porJenkins y Harrison para el control del picoteo de una tecla por claves visuales en laspalomas. El gradiente de generalización fue mucho mas acusado, lo que indica un control porlas drogas mucho mas fuerte.Descargado del campus, http://campus.felizmente.info 131
  • 134. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos Cabrera¿Qué se aprende en el entrenamiento de discriminación?Se aprende a responder al E+ como a suprimir la respuesta ante el E-.Teoría de Spence del aprendizaje de discriminación: Esta basada en la idea de que lo quese aprende tanto el significado del E+ como del E-, o sea aprender tanto a responder al E+como a suprimir la respuesta ante el E-. El reforzamiento de una respuesta en presencia delE+ condiciona tendencias excitatorias de respuesta al E+. Por el contrario, el noreforzamiento de la respuesta durante el E- condiciona propiedades inhibitorias al E-, loque sirve para suprimir la conducta instrumental. Se asume que la respuesta diferencial alE+ y al E- refleja tanto la excitación por responder ante el E+ como la inhibición porresponder ante el E-.Comprobar esto requiere pruebas sofisticadas. Una posibilidad es utilizar los gradientes degeneralización del estímulo.Si se ha condicionado una tendencia exitatoria al E+, entonces los estímulos que difieran deforma progresiva del E+ deberían ser cada vez menos efectivos en evocar la respuestainstrumental. En otras palabras, debe observarse un gradiente de generalización acusado,con la mayor cantidad de respuesta ante el E+. Un resultado como este se llama gradientede generalización del estímulo excitatorio. Por el contrario, si se ha condicionado unatendencia inhibitoria al E-, entonces los estímulos que difieran progresivamente del E-deberían ser cada vez menos efectivos en inhibir la respuesta instrumental, este resultadose llama gradiente de generalización del estímulo inhibitorio.Las pruebas conductuales llevadas acabo décadas después omprobaronque las ideas de Spence eransustancialmente correctas. En unexperimento clásico Honig, Boneau,Burstein y Pennypacker, 1963. Ungrupo de palomas es reforzadocuando la tecla estaba iluminada conluz blanca y una línea vertical negra(E+) sin la línea vertical no refuerzo(E-). 2º Grupo el E+ y E-intercambiados, después de que losdos grupos aprenden a responder alE+, se llevaron a cabo las pruebas degeneralización del estímulo para Gradientes de generalización del estímulo para estímulosaveriguar el grado de control de la consistentes en la inclinación de una línea en dos grupos de palomasbarra vertical negra sobre la tras un entrenamiento en discriminación. Para el Grupo 1, sirvió como E+ una barra vertical negra sobre un fondo blanco, y la luz blanca sinconducta; en el grupo 1, mayor tasa barra sirvió como E-. Para el Grupo 2, las funciones de los estímulosde respuesta ante la raya vertical y se invirtieron.progresivamente descendiendo, estoDescargado del campus, http://campus.felizmente.info 132
  • 135. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos Cabrerailustra un gradiente de generalización del estímulo excitatorio. En el grupo 2los estímulosque eran cada vez mas diferentes del original E- producían progesivamente menos inhibiciónen la conducta, ilustrando un gradiente de generalización del estímulo inhibitorio.Este experimento muestra que el entrenamiento en discriminación puede producir tantocondicionamiento excitatorio al E+ como condicionamiento inhibitorio al E-. El hecho de quelos gradientes de excitación e inhibición puedan ocurrir alrededor del E+ y del E-proporcionan un fuerte apoyo a la teoría de Spence del aprendizaje de discriminación.Se obtienen diferentes resultados si los estímulos E+ y E- difieren cuantitativamente enuna caraterística en lugar de cualitativamente ( incluyendo muchas características.)Interacciones entre el E+ y el E-: desplazamiento del máximoLo que los sujetos aprenden sobre el E+ es independiente de lo que aprenden sobre el E-.Esta suposición es demasiado simplista. Lo que se aprende sobre el E+ puede influir en larespuesta al E- y viceversa. Estas interacciones son particularmente probables si el E+ y elE- se relacionan de alguna manera.Una de las maneras en que el E+ y el E- puede estar relacionados es siendo semejantesexcepto por un rasgo o atributo. Un procedimiento de entrenamiento en que sólo difierenpor el valor de una característica del estímulo se llama discriminación intradimensional.Las discriminaciones intradimensionales son de particular interés debido a que estánrelacionadas con el problema de la ejecución experta, esta implica normalmente realizardistinciones sutiles. Distinguir los estímulos que difieren en un única característica es masdifícil que distinguir entre estímulos que difieren en muchos aspectos. La discriminaciónintradimensional requiere la detección de un único rasgo diferenciador entre el E+ y el E-y, en consecuencia, es una forma de ejecución experta.Una característica importante de la discriminación intradimensional es que a veces dancomo resultado una interesante interacción entre las respuestas al E+ y al E-, en unexperimento clásico Hanson (1959) examinaba el grado en que varios colores controlaban laconducta de picoteo en paloma. Todos los sujetos fueron reforzados con un luz de 550nn, elE+ era el mismo para todos los grupos, diferían en lo similar que era el E- al E+. un gruporecibió un E- de 590nn , para otro grupo el E- era de 555nm, y u n grupo de control que norecibió entrenamiento en discriminación pero que también fue reforzado por picotear enpresencia del estímulo de 550 nm. El grupo de control mostró un gradiente degeneralización del estímulo excitatorio normal centrado alrededor del E+, el grupo en que elE- fue de 590nm mostró un desplazamiento del máximo del gradiente de generalizacióndesde el E+ llamativo porque la respuesta nunca se reforzó en 540 o 530 donde seobtuvieron las tasas mas altas de respuesta, estos estímulos nunca habían sido presentadosdurante el entrenamiento original.El desplazamiento del máximo del gradiente de generalización alejado del E+ original seDescargado del campus, http://campus.felizmente.info 133
  • 136. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos Cabreradenomina efecto del desplazamiento del máximo, este puede ocurrir en cualquierdiscriminación intradimensional.Explicación de Spence del desplazamiento del máximo. El efecto de desplazamiento demáximo es importante porque muestra que el único estímulo en cuya presencia se refuerzala respuesta (E+) no es necesariamente es estímulo que evoca la tasa de respuesta más alta.Spence sugirió que los gradientesexcitatorio e inhibitorio pueden producir elfenómeno de desplazamiento del máximo,asumió que el entrenamiento endiscriminación intradimensional producegradientes de generalización excitatorios einhibitorios centrados en el E+ y el E-, sinembargo, debido a que el E+ y el E- sonsemejantes en las tareas de discriminaciónintradimensional, los gradientes de generalización de la inhibición y excitación sesuperpondrán. Es mas, el grado de superposición dependerá del grado de semejanza entreel E+ y el E-. La inhibición generalizada del E- suprimirá la respuesta al E+, dando comoresultado un efecto de desplazamiento del máximo.Explicaciones alternativas del desplazamiento del máximo: Una cuestión importante es sivemos los estímulos en función de sus propiedades individuales y absolutas, o en función desu relación con otros estímulos que experimentamos, existe evidencia consistente con cadauna de estas aproximaciones, que sugiere que ambos tipos de mecanismos están implicadosen la forma de responder de los organismos.El modelo de Spence es un modelo de aprendizaje absoluto del estímulo. Predice laconducta basada en las propiedades excitatorias netas de los estímulos individuales. Unaaproximación alternativa asume que los organismos aprenden a responder a un estímulobasándose en la relación de ese estímulo con otras claves de la situación. Una prediccióninteresante de esta aproximación es que la forma de un gradientes de generalizacióncambiara en función del rango de los estímulos de prueba que se presenten durante lasesión de generalización. Estas y oras predicciones de la teoría relacional han sidoconfirmadas.Entrenamiento de equivalencia de estímulosDe la misma forma que el entrenamiento en discriminación potencia la respuestadiferencial, el entrenamiento en equivalencia potencia la respuesta generalizada oequivalencia de estímulos.Se dispone de varias aproximaciones para promover la generalización en lugar de ladiscriminación, 1º (Herrnstein, Loveland y Cable 1976, la estrategia básica deentrenamiento es reforzar la misma respuesta en presencia de varias imágenes queDescargado del campus, http://campus.felizmente.info 134
  • 137. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos Cabreracontiene agua, una vez que aprenden la discriminación agua/no agua, su conducta segeneralizo a nuevas fotografía.Los investigadores también han explorado la posibilidad de que la equivalencia funcionalentre dos estímulos diferentes podría establecerse enlazando cada una de las distintasclaves con un tercer estímulo común Ej. Honey y Hall (1989) un grupo ruido y click concomida, grupo control ruido y click, solo el click con comida después ambos recibe ruido condescarga-miedo al ruido. Los investigadores estaban interesados en saber si este miedocondicionado se generalizaría al clik, se dio significativamente mas generalización en losanimales entrenados en equivalencia que en el grupo de control.El emparejamiento de estímulos diferentes con la misma consecuencia crea equivalenciafuncional entre esos estímulos, con la consecuencia de que una respuesta condicionada a unode ellos se generalizara a los oros. Una definición mas formal de clase de equivalencia hasido propuesta por Siedman y colaboradores. Se dice que existe una clase equivalencia sisus miembros poseen propiedades matemáticas 1 reflexividad o igualdad, 2 simetría y 3transitividad. La reflexividad o igualdad se refiere a la relación A=A: la simetría existe siuna relación es bidireccional, la transitividad se refiere a la integración de dos relacionesen una tercera.CLAVES CONTEXTUALES Y RELACIONES CONDICIONALES (página 242 del libro)Un estímulo se dice que es discreto si se presenta durante un breve periodo y tiene uncomienzo y un final claros. Las claves contextuales pueden ser visuales, auditivas o clavesolfatoria de la habitación o lugar donde se presentan los estímulos discriminativosdiscretos. La investigación reciente indica que las claves contextuales pueden proporcionaruna importante fuente adicional de control de la conducta aprendida.Control por claves contextualesLas claves contextuales pueden llegar a controlar la conducta instrumental. Es más fácilconcentrarse en una biblioteca del colegio que en casa durante las vacaciones, debido alcontrol contextual de la conducta de estudio por los estímulos experimentados en labiblioteca. Charlar en un partido de fútbol, pero no durante misa es otro ejemplo del poderde las claves contextuales.El control contextual por el estímulo puede ocurrir sin que un contexto esté másfuertemente asociado con el reforzamiento que otro. Dado que un contexto no es mejorseñal par el reforzamiento que otro, las asociaciones involucran un tipo diferente demecanismos. Una posibilidad es que cada contexto activa una memoria diferente. Que leContexto 1 active la memoria de reforzamiento con 90º y la de ausencia de reforzamientocon 0º. Por el contrario, el Contexto 2 active la memoria de reforzamiento con 0º y la deausencia de reforzamiento con 90º. En lugar de estar asociado con un estímulo particular,cada contexto podría estar asociado con una contingencia diferente E+/E-. Estasasociaciones se denominan relaciones condicionales.Descargado del campus, http://campus.felizmente.info 135
  • 138. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos CabreraControl por las relaciones condicionalesEn capítulos anteriores se han destacado las relaciones que involucran sólo dos eventos, unEC y un EI, o una respuesta y un reforzador. Las relaciones entre dos eventos se llamanrelaciones binarias. En ciertas circunstancias, la naturaleza de un relación binaria estadeterminada por un tercer suceso, llamado modulador. La relación de un modulador con larelación binaria que señala se denomina una relación condicional.Numerosos experimentos hanindicado que los animales puedenaprender a utilizar moduladores paradecir cuando esta en funcionamientouna relación binaria particular.Un procedimiento en el que unorganismo es reforzado porresponder en presencia del E+ perono es reforzado en presencia del E-,los estímulos discriminativos E+ y E-son moduladores que señalan la relación entre la respuesta y el reforzador. Existe unarelación respuesta-reforzador durante el E+ y una relación diferente durante el E-, portanto los procedimientos de discriminación instrumental incluyen el control condicional dela relación entre la respuesta y el reforzador.Control condicional en el condicionamiento pavloviano. El concepto fundamental delcontrol condicional es que un evento señala la relación entre otros dos eventos.Un modulador es un tercer elemento que indica cuándo la presentación del EC o elreforzador aparecerá.En los procedimientos de discriminación instrumental, los moduladores (E+ y E-) sedenominan "estímulos discriminativos". En el condicionamiento pavloviano han denominado alcontrol condicional de la respuesta facilitación debido a que el modulador facilita larespuesta del EC. Mas común, el control condicional en el condicionamiento clásico se llamaestablecimiento de la ocasión porque el modulador establece la ocasión para losemparejamientos del EC con el EI. En esta terminología, el modulador se llama establecedorde la ocasión.Distinción entre la excitación y la modulación. El establecimiento de la ocasión es unaspecto importante del condicionamiento clásico porque parece involucrar mecanismos deaprendizaje diferentes . Los emparejamientos de un EC con un EI dan como resultado unaasociación entre los dos sucesos tal que la presentación del EC llega a activar unarepresentación del EI. Este tipo de aprendizaje se ha considerado que refleja elcondicionamiento de la excitación al EC. Las propiedades modulatorias de los estímulos sondiferentes de la excitación condicionada.Descargado del campus, http://campus.felizmente.info 136
  • 139. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos CabreraEn varios estudios, los intentos de obtener evidencia de las propiedades excitatoriascondicionadas de los moduladores han fracasado, estos experimentos indican que unestímulo puede establecer la ocasión para la respuesta condicionada elicitada por otra clavesin elicitar por si mismo una respuesta condicionada visible. Otros estudios han mostradoque condicionar las propiedades excitatorias simples a un estímulo no hace que estefuncione como un modulador.La evidencia adicional para mantener la distinción entre modulación y excitacióncondicionada se basa en los efectos de los procedimientos de extinción. La extinción es unprocedimiento en el cual un estímulo previamente condicionado se presenta repetidamentepero se omite el EI.Un estímulo condicionado excitatorio señala la próxima presentación del EI. La ausenciadel EI después de la presentación del EC durante la extinción es una violación de esaexpectativa. Por tanto, el valor como señal del EC tiene que reajustarse en la extinción paraestar en consonancia con la nueva realidad. Un reajuste como este no se requiere en unprocedimiento de extinción de un establecedor de la ocasiónUn establecedor de la ocasión señala una relación entre un EC y un EI. La ausencia del EIcuando se presenta el establecedor de la ocasión por si solo durante la extinción nosignifica que la relación entre el EC y el EI haya cambiado. La información señalada por unestablecedor de la ocasión no se prueba que sea incorrecta mediante la presentación delmodulador por si mismo durante la extinción. En consecuencia, la habilidad del moduladorpara promover la respuesta elicitada se reduce si se altera la relación EC-EI señalada porel modulador.Otra evidencia que apoya la conclusión de que el establecedor de la ocasión es distinto de laexcitación convencional se ha obtenido en las pruebas de transferencia, estas fueronllevadas a cabo para determinar si un estímulo que había sido condicionado para establecerla ocasión de responder a un EC critico particular también incrementaría la respuesta aorto EC. Se ha obtenido evidencia de transferencia positiva de los efectos de unmodulador a un nuevo EC critico, los efectos de transferencia son mas probables si losnuevos estímulos críticos han servido previamente como estímulos críticos de otrosestímulos moduladores. Las limitaciones en la transferencia proporcionan evidenciaadicional de que los moduladores tienen sus efectos mediante algún mecanismo distinto dela excitación convencional.Modulación frente a condicionamiento configuracional: Los efectos modulatoriosrequieren la respuesta al compuesto estimular como constituido por elementosindependientes estimulares, Los investigadores han presentado los elementos uno tras otromas que simultáneamente, en lo que se llama compuesto serial. En los ensayos reforzados,el establecedor de la ocasión es presentado normalmente primero, seguido por el EC críticoy el reforzamiento. Holland y colaboradores han encontrado que los organismos respondena las discriminaciones condicionales que incluyen compuestos seriales en términos deDescargado del campus, http://campus.felizmente.info 137
  • 140. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos Cabrerarelaciones condicionales. En contraste, la utilización de compuestos simultáneos en ladiscriminación condicional a menudo no produce efectos modulatorios.COMENTARIOS FINALES (página 249 del libro)El control por el estímulo se refiere al grado de precisión del ajuste de la conducta de unorganismo a las características específicas del ambiente. Por tanto, los temas relacionadoscon el control de la conducta por el estímulo son importantes para entender cómo unorganismo interactúan con su ambiente. El control por el estímulo se mide en términos deapuntamiento de los gradientes de generalización. Un gradiente de generalización acusadoindica que pequeñas variaciones en un estímulo producen grandes diferencias en larespuesta. Un control por el estímulo más débil se manifiesta en gradientes degeneralización más planos.El grado de control por el estímulo está determinado por numerosos factores, incluyendo lacapacidad y orientación sensorial del organismo, la prominencia relativa de otras claves enlas situaciones, el tipo de reforzamiento utilizado, y el tipo de respuesta requerida para elreforzamiento. El control por el estímulo está también en función del aprendizaje. Elentrenamiento en discriminación aumenta el control de la conducta por el estímulo tanto siincluye estímulos que difieren en varios aspectos como en uno solo. El entrenamiento endiscriminación con estímulos que difieren sólo en una dimensión produce un control por elestímulo más preciso y puede llevar al resultado contraintuitivo de que el nivel máximo derespuesta se desplace del estímulo reforzado. Lo opuesto del entrenamiento endiscriminación es el entrenamiento en equivalencia, el cual aumenta la generalización de laconducta.No sólo los estímulos discretos sino también las claves contextuales de fondo pueden llegara controlar la conducta. El control del estímulo por claves contextuales puedendesarrollarse aun cuando no se requiera atención a las claves contextuales para optimizarel reforzamiento. Las claves contextuales pueden llegar a asociarse directamente con el EIo servir para modular la relación entre un EC discreto y un EI.Descargado del campus, http://campus.felizmente.info 138
  • 141. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos CabreraTÉRMINOS CLAVE Facilitación Procedimiento en el que una claveAproximación de la clave configuracional Aproxi- designa cuándo otra clave será reforzada. mación al análisis del control por estímulos También llamado establecimiento de la ocasión. compuestos que asume que los organismos responden a un estímulo compuesto como un todo Generalización del estímulo Ocurrencia de una integral más que a una colección de elementos conducta aprendida a través de habituación o estimulares separados e independiente. (Compa- condicionamiento en presencia de estímulos que rése con la aproximación elemental del estímulo) son diferentes de los estímulos utilizados durante el entrenamiento.Aproximación elemental del estímulo Aproximación al análisis del control por los estímulos Gradiente de generalización del estímulo compuestos que asume que los participantes Gradiente de respuesta que se observa si los responden a un estímulo compuesto en términos participantes se prueban con estímulos que de los elementos del estímulo que forman el difieren cada vez más del estímulo que estaba compuesto. (Compárese con aproximación de la presente durante el entrenamiento. (Véase clave configuracional.) también gradiente de generalización del estímulo excitatorio y gradiente de generalización delDesplazamiento del máximo Desplazamiento de la estímulo inhibitorio.) tasa más alta de respuesta en un gradiente de generalización del estímulo desde el E+ en Gradiente de generalización del estímulo dirección opuesta al E- después del entrenamien- excitatorio Gradiente de respuesta que se to en discriminación intradimensional. observa cuando se prueba a los organismos con el E+ de un procedimiento de discriminación y conDiscriminación del estímulo Respuesta diferencial estímulos que difieren cada vez más del E+. El en presencia de dos o más estímulos. nivel más alto de respuesta sucede con los estímulos similares al E+; se da progresivamenteDiscriminación intradimensional Discriminación menos respuestas a los estímulos que difieren entre estímulos que difieren sólo en cuanto al cada vez más del E+. Por tanto, el gradiente tiene valor de una característica del estímulo, como el forma de U invertida. color, el brillo o el tono. Gradiente de generalización del estímuloEquivalencia de estímulos Responder a estímulos inhibitorio Gradiente de respuesta que se físicamente distintos como si fuesen iguales observa cuando se prueba a loa organismos con el debido a experiencias comunes previas con los E- de un procedimiento de discriminación y con estímulos. estímulos que difieren cada vez más del E-. El nivel más bajo de respuesta sucede con losEnsombrecimiento Interferencia en el estímulos similares al E-; se da progresivamente condicionamiento de un estímulo debido a la más respuestas a los estímulos que difieren cada presencia simultánea de otro estímulo que es más vez más del E-. Por tanto, el gradiente tiene fácil de condicionar. forma de U.Establecimiento de la ocasión Lo mismo que Modulador Estimulo que señala la relación entre facilitación. otros dos sucesos. La naturaleza de una relación binaria está determinada por el modulador.Estímulo discriminativo Estímulo que controla la ejecución de la conducta instrumental porque señala la disponibilidad (o no disponibilidad) de reforzamiento.Descargado del campus, http://campus.felizmente.info 139
  • 142. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 8:El control de la conducta por el estímulo Juan Carlos CabreraProcedimiento de discriminación del estímulo (en condicionamiento clásico) Procedimiento de condicionamiento clásico en el cual un estímulo (el EC+) es emparejado con el estímulo incondi- cionado en algunos ensayos y otros estímulos (el EC-) se presenta sin el estímulo incondicionado en otros ensayos. Como resultado de este procedi- miento, el EC+ llega a elicitar una respuesta condicionada, y el EC- llega a inhibir esta res- puestas. (También denominado inhibición diferen- cial.)Procedimiento de discriminación del estímulo (en condicionamiento instrumental) Procedimiento en el cual el reforzamiento por responder está disponible siempre y cuando se presente un estímulo (el E+, o ED) y no está disponible siempre y cuando se presente otro estímulo (el E- o E∆).Programa múltiple de reforzamiento Procedimiento en el cual funcionan diferentes programas de reforzamiento en presencia de diferentes estímulos presentados en sucesión. General- mente, cada estímulo llega a evocar un patrón de respuesta que se corresponde con el programa de reforzamiento.Relación condicional Relación en la que la significación de un estímulo o suceso depende del estatus del otro estímulo.Descargado del campus, http://campus.felizmente.info 140
  • 143. Descargado del campus, http://campus.felizmente.info
  • 144. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 9: Extinción de la conducta condicionada Juan Carlos Cabrera 2009-2010Efectos de los procedimientos de extinciónExtinción y aprendizaje originales- Recuperación espontánea- Renovación del condicionaiento excitatorio original- Restauración de la ejecución de la extinción.- Restablecimiento de la excitación condicionada.- Sensibilidad a a devaluación del reforzador.¿Qué se pretende en la extinción?- Asociación E-R inhibitorias- Efectos “paradójicos”- Mecanismos del reforzamiento parcial de la extinciónResistencia a la extinción y momento conductualComentarios finales 143 Descargado del campus, http://campus.felizmente.info
  • 145. Descargado del campus, http://campus.felizmente.info
  • 146. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 9: Extinción de la conducta condicionada Juan Carlos Cabrera 2009-2010 La extinción puede llevarse a cabo sólo después de que haya sido establecida unarespuesta o una asociación utilizando condicionamiento pavloviano o instrumental. Elobjetivo es revertir los efectos de la adquisición, pero raramente se alcanza y en la mayoríaresultan imposible. Fenómenos como la recuperación espontánea, la renovación y elrestablecimiento muestran que la extinción no elimina lo que se aprendió de forma original. Los estudios sobre devaluación del reforzador sugieren que la extinción no tienevirtualmente ningún impacto sobre las asociaciones E-C o R-C. Parece implicar el nuevoaprendizaje de una asociación E-R inhibitoria que se superpone a lo que se aprendió conanterioridad. La inhibición surge de los efectos de la frustación y esta falta inesperada derecompensa es responsable de una serie de efectos “paradójicos” de la recompensa,incluyendo el efecto del reforzamiento parcial en la extinción. El reforzamiento parcial o intermitente permite a los organismos aprender sobre lafalta de recompensa de manera que les sirva para inmunizarse frente a los efectos de laextinción, como demuestra los estudios acerca del momento conductual. La extinción implica la omisión del EI o reforzador. Por tanto, la extinción en elcondicionamiento clásico incluye presentaciones repetidas del estimulo condicionado por sísolo; la extinción en el condicionamiento instrumental implica no volver a presentar elreforzador como una consecuencia de la respuesta instrumental. El resultado es que larespuesta condicionada disminuye. La extinción no es lo contrario de la adquisición. La extinción se produce por la omisión del EI que sigue a las presentaciones del EC ola omisión del reforzador que sigue a la respuesta instrumental. El olvido, por el contrario,es una disminución de la respuesta condicionada que se da por la ausencia prolongada deexperiencia con el estimulo condicionado o con la respuesta instrumental. La extinción no siempre funciona en la terapia de conducta, los avances sugieren quelos fallos en la extinción reflejan las limitaciones normales de la misma. La extinción norevierte los efectos de la adquisición, en lugar de ello, implica el aprendizaje de algo nuevoque se superpone sobre lo que se aprendió antes (sin la perdida de lo que se aprendióanteriormente). 145 Descargado del campus, http://campus.felizmente.info
  • 147. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 9: Extinción de la conducta condicionada Juan Carlos Cabrera 2009-2010EFECTOS DE LOS PROCEDIMIENTOS DE EXTINCION.(página 253 del libro)La extinción disminuye la tasa de respuesta e incrementa la variabilidad de respuesta, perono altera de otro modo la estructura de la conducta.Si un organismo está acostumbrado a recibir reforzamiento por una respuesta particular,puede trastornarse cuando no vuelve a entregar los reforzadores. Las reacción emocionalinducida por la falta de un reforzador esperado se denomina frustación. La ausenciafrustrante de recompensa proporciona energía a la conducta que en ocasiones puede ser losuficietemente severa como para implicar reacciones agresivas.EXTINCION Y APRENDIZAJE ORIGINAL (página 255 del libro)Aunque la extinción produce importantes efectos conductuales y emocionales, no reviertelos efectos de la adquisición. La evidencia de que la extinción no elimina lo que se aprendióoriginalmente se ha obtenido a través de estudios sobre la renovación espontanea, larenovación, el restablecimiento y los efectos de la devaluación del reforzador.Recuperación espontaneaLa recuperación espontanea tras el condicionamiento pavloviano: La extinción se disipacon el tiempo, y como consecuencia, la respuesta condicionada original vuelve a presentarsesi el sujeto se pone a prueba tras una demora que siga al procedimiento de extinción.Recuperación espontanea tras el condicionamiento instrumental: La recuperaciónespontánea es un fenómeno notable en la extinción tras el condicionamiento instrumental. Laintroducción de un periodo de descanso tras la extinción produce una recuperaciónsustancial en la respuesta.Renovación del condicionamiento excitatorio originalLa renovación se refiere a la recuperación de la ejecución propia de la adquisición que se dacuando se cambian las claves contextuales que estaban presentes durante la extinción. Elcambio puede consistir en una vuelta al contexto de la adquisición original o a un cambio a uncontexto “neutral”.El efecto de la renovación no sólo se ha observaldo en el condicionamiento pavloviano delmiedo, sino también en el condicionamiento apetitivo del miedo, la inhibición condicionada y 146 Descargado del campus, http://campus.felizmente.info
  • 148. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 9: Extinción de la conducta condicionada Juan Carlos Cabrera 2009-2010en varias situaciones de condicionamiento instrumental. El fenómeno se evidencia no sólocon claves externas contextuales sino con claves contextuales creadas por estadosprovocados por drogas. También puede darse si el sujeto se retira del contexto deadquisición a uno alternativo que no es el de la adquisición original. Este tipo de renovaciónno es tan sólido como cuando se reinstaura en el contexto original de adquisición.La mayor parte de la evidencia indica que el efecto de renovación se produce porque lamemoria de la extinción es específica de las claves que estaban presentes durante la fasede extinción. En consecuencia, un cambio en el contexto de la extinción dificulta larecuperación de la memoria de extinción, con el resultado de que se pierde la ejecuciónpropia de la extinción.Bouton (1993,1994) ha sugerido que las claves contextuales sirven para eliminar laambigüedad del significado de un estimulo condicionado. Un EC que adquierecondicionamiento excitatorio y luego se extingue también tiene un significado ambiguo, en elsentido de que podría indicar la cercanía del EI (adquisición) o su ausencia (extinción). Estaambigüedad permite al EC ponerse bajo el control contextual de manera más fácil. Tras elentrenamiento de adquisición por sí solo, el EC no es ambiguo porque solo significa una cosa(la proximidad de la entrega del EI). En consecuencia, este EC no es susceptible de controlcontextual.Los investigadores han explorado la forma de reducir el efecto de renovación. Unprocedimiento que se muestra prometedor es llevar a cabo la extinción en distintoscontextos. Otras técnicas para reducir el efecto de renovación implican entrenamiento eninhibición condicionada, condicionamiento diferencial, y la presentación del ECexplícitamente emparejado con el EI.Restauración de la ejecución propia de la extinciónEl efecto de renovación representa reactivar una conducta aprendida previamente medianteel cambio del contexto a condiciones más aproximadas a las presentes cuando la conductase adquirió con anterioridad. Esta estrategia puede aplicarse a la extinción, es decir, laejecución propia de la extinción puede restaurarse introduciendo claves contextuales quereactiven la memoria de extinción.La recuperación espontanea implica la recuperación de la conducta condicionadaoriginalmente que sigue a la extinción si transcurre un periodo suficiente de tiempo tras lafase de extinción. La conducta propia de la extinción puede restaurarse (contrarrestando larecuperación espontaneas) presentando las claves que estaban presentes durante la fase de 147 Descargado del campus, http://campus.felizmente.info
  • 149. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 9: Extinción de la conducta condicionada Juan Carlos Cabrera 2009-2010extinción. La recuperación expontánea se debe a un eterioro de las claves contextuales dela extinción que se da con el paso del tiempo.Restablecimiento de la excitación condicionadaEl restablecimiento se refiere a la recuperación de la respuesta excitatoria a un estimuloextinguido, producida por exposiciones al estimulo incondicionado. Las respuestas que seextinguen con éxito, pueden recuperarse si el individuo se enfrenta de nuevo con el estímuloincondicionado.Investigaciones durante los últimos 20 años sobre el efecto del restablecimiento, hanindicado que el condicionamiento contextual es importante, pero no porque permita la sumade la extinción sino por suprimir la ambigüedad del significado de un estimulo que tiene unahistoria mezclada de condicionamiento y extinción. El contexto tiene poco efecto en losestímuos con una historia sólo de condicionamiento.Bouton considera el restablecimiento como una forma de renovación. Las clavescontextuales condicionadas proporcionan algunas de las claves contextuales para larespuesta excitatoria en circunstancias normales. Estas se extinguen cuando se presenta elEC por si solo durante la extinción.Sensibilidad a la devaluación del reforzadorLa persistencia del aprendizaje original a pesar de la extinción puede también investigarseanalizando los efectos de la devaluación del reforzador. Rescorla ha utilizado la técnica dedevaluación del EI para determinar si la asociación EC-EI establecida a través decondicionamiento pavloviano persiste a lo largo de la extinción.Los hallazgos han fortalecido la conclusión de que la extinción no elimina las asociaciones -R-C y E-C que se aprende durante el condicionamiento instrumental. 148 Descargado del campus, http://campus.felizmente.info
  • 150. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 9: Extinción de la conducta condicionada Juan Carlos Cabrera 2009-2010¿QUE SE APRENDE EN LA EXTINCIÓN? (página 266 del libro)Si como hemos visto la extinción no implica “desaprendizaje” y deja intacta las asociacionesR-C y E-C, ¿por qué disminuye las respuestas en los procedimientos de extinción?Asociaciones ER inhibitoriasLos investigadores han vuelto a considerar la relevancia de las asociaciones E-R. En lugar decentrarse en las asociaciones excitatorias E-R, como hizo originalmente Thorndike, hanllegado a la conclusión de que la falta de reforzamiento produce una asociación E-Rinhibitoria: La falta de reforzamiento de una respuesta en presencia de un estímuloespecífico, produce una asociación E-R inhibitoria que sirve para suprimir esa respuestasiempre y cuando el E esté presente. Esta hipótesis, predice que los efectos de la extinciónserán altamente específicos del contexto en el que la respuesta fue extinguida.La omisión de una recompensa esperada genera desilusión o frustración. Estos efectosemocionales se presume que desempeñan un papel crítico en la disminución conductual que seda en la extinción. La ausencia de recompensa esperada desencadena una reacción frustanteaversiva incondicionada que sirve para que se deje de responder durante el curso de laextinción mediante el establecimiento de una asociación inhibitoria.La afirmación de que la extinción implica el aprendizaje de una asociación inhibitoria resultacontrovertida frente a las teorías convencionales que consideraban la inhibicióncondicionada y la extinción como fenómenos diferentes.Efectos paradójicos de la recompensaEfecto de sobreentrenamiento en la extinción. Cuanto más entrenamiento conreforzamiento se proporciona más fuerte es la expectativa de recompensa, y más fuerte lafrustración cuando se introduce la extinción. La disminución en la respuesta se debe a losefectos frustrantes de la ausencia de recompensa, el entrenamiento de reforzamiento másextenso produce una extinción más rápida. Especialmente evidente cuando el entrenamientoincluye reforzamiento continuo.Ejemplo: Podriamos pensar que un entrenamiento más extenso crearía una respuesta “más fuerte”,que sería más resistente a la extinción, pero sucede lo contrario. 149 Descargado del campus, http://campus.felizmente.info
  • 151. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 9: Extinción de la conducta condicionada Juan Carlos Cabrera 2009-2010Efecto de magnitud del reforzamiento en la extinción: se refiere al hecho de que larespuesta disminuye más rápido durante la extinción que sigue a un reforzamiento con unreforzador mayor. Es más evidente cuando el entrenamiento incluye reforzamientocontinuo.Ejemplo: Si consideramos dos posibiliades: en una, que se recibe 100€ al mes; en la otra, 20€ al mes.Si se deja de percibir la cantidad, es más aversiva si nos hemos acostumbramos a 100 que a 20.Efecto del reforzamiento parcial en la extinción: Es el efecto paradójico más estudiado.Un factor crítico que determina la magnitud de los efectos tanto conductuales comoemocionales de un procedimiento de extinción es el programa de reforzamiento que operaantes de que se introduzca el procedimiento de extinción. Pero la característica dominantedel programa que determina los efectos de la extinción es si la respuesta instrumental sereforzó cada vez que ocurría (reforzamiento continuo) o sólo algunas veces (reforzamientointermitente o parcial). La extinción es mucho más lenta y produce menos reacciones defrustración si estaba en activo un programa de reforzamiento parcial antes de laintroducción del procedimiento de extinción. Este fenómeno se denomina el efecto dereforzamiento parcial en la extinción o ERPE,Mecanismos del efecto del reforzamiento parcial en la extinciónLa explicación más evidente del ERPE es que la introducción de la extinción es más fácil dedetectar tras el reforzamiento continuo que tras el reforzamiento parcial. La ausencia dereforzamiento es presumiblemente mucho más fácil de detectar tras el reforzamientocontinuo. Esta explicación del efecto del reforzamiento parcial en la extinción se llamahipótesis de la discriminación.El reforzamiento parcial parece enseñar a los sujetos a no rendirse ante la ausencia dereforzador. El reforzamiento parcial favorece la persistencia de dos formas diferentes.Una explicación seria la teoría de la frustración, basada en que los sujetos aprenden sobrelos efectos emocionales de la ausencia de recompensa durante el entrenamiento enreforzamiento parcial. La otra explicación, la teoría secuencial, está basada en lo que lossujetos aprenden sobre la memoria de la ausencia de recompensa.Teoría de la frustración: Desarrollada por Abram Amsel, la persistencia en la extinción esresultado del aprendizaje de algo paradójico, es decir, continuar respondiendo cuando seespera no ser reforzado o ser frustrado. Asume que el reforzamiento intermitente da comoresultado aprender a responder a pesar de esperar la ausencia de reforzamiento. Sinembargo, este aprendizaje requiere considerable experiencia con reforzamientointermitente. 150 Descargado del campus, http://campus.felizmente.info
  • 152. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 9: Extinción de la conducta condicionada Juan Carlos Cabrera 2009-2010El reforzamiento intermitente incluye ensayos reforzados y no reforzados. Lorecompensados animan a los sujetos a esperar reforzamiento y los no recompensados lesllevan a espera la ausencia de recompensa. Por tanto el reforzamiento intermitente produceel aprendizaje de expectativas tanto de recompensa como de no recompensa. Laexpectativa de recompensa alienta a los sujetos a responder, y la anticipación de la ausenciade reforzamiento desalienta la respuesta, al principio del entrenamiento los sujetos entranen conflicto con lo que se ha de hacer. Sus expectativas motivan tendencias de respuestaopuestas. Sin embargo a medida que el entrenamiento continua, el conflicto se resuelva afavor de responder.La resolución del conflicto ocurre debido a que el reforzamiento no es predecible en eltípico programa de reforzamiento parcial. Debido a estas experiencias, la respuestainstrumental se condiciona a la expectativa de la ausencia de recompensa. De acuerdo con lateoría de la frustración, esta es la clave de la persistencia en responder durante laextinción. Con suficiente entrenamiento, el reforzamiento intermitente da como resultadoel aprendizaje de realizar la respuesta instrumental como reacción a la expectativa deausencia de recompensa. Por el contrario no existe nada en la experiencia del reforzamientocontinuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. Elreforzamiento continuo no produce persistencia en la extinción.Teoría secuencial; Capaldi, está formulada en términos de memoria. Asume que los sujetospueden recordar si fueron reforzados por realizar la respuesta instrumental en el pasadoreciente. Recuerdan los ensayos recientes tanto recompensados como no recompensados.Se asume además que durante el entrenamiento en reforzamiento intermitente, la memoriade la ausencia de recompensa llega a ser una clave para la realización de la respuestainstrumental, esto produce persistencia en le extinción.Considerese un ensayo: RNNRRNR. El sujeto es recompensado en el primer ensayo, norecompensado en los dos siguientes, recompensado dos veces, luego no reforzado yfinalmente recompensado de nuevo. Con suficientes experiencias de este tipo, el sujetoaprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayoprecedentes. Este aprendizaje provoca la persistencia de la respuesta instrumental en laextinción.Desde que la dos teorías fueron propuestas se ha obtenido gran evidencia en apoyo de cadateoría. Ambas representan dos formas diferentes en las que el reforzamiento parcial puedeinfluir sobre la respuesta durante la extinción. Los mecanismos de memoria puedencontribuir en mayor medida cuando los ensayos de entrenamiento no estén separados porlargos intervalos entre ensayos. El aprendizaje emocional descrito por la teoría de lafrustración es menos sensible a los intervalos entre ensayos y, por tanto, proporciona unamejor explicación del ERPE cuando se utilizan ensayos ampliamente espaciados. 151 Descargado del campus, http://campus.felizmente.info
  • 153. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 9: Extinción de la conducta condicionada Juan Carlos Cabrera 2009-2010RESISTENCIA AL CAMBIO Y MOMENTO CONDUCTUAL(página 273 del libro)Otra forma de considerar la persistencia de la respuesta en la extinción es que representala resistencia al cambio en las contingencias de reforzamiento que sucede cuando seintroduce la extinción. Nevin y colaboradores han estudiado la resistencia al cambio deforma más general y han propuesto el concepto de momentos conductual para caracterizarla susceptibilidad de la conducta a las interrupciones. Está basada en el concepto demomento de la física newtoniana. Predice que la conducta que posee un momento elevadotambién será difícil de “parar” o interrumpir por las manipulaciones. Ver ej. Pag 274 libro.Un experimento en el que participó HCB, una chica de 17 años y una edad mental de 3. Losresultados obtenidos con HCB ilustran dos conclusiones normales de los estudios demomento conductual. La primera es que el momento conductual está directamenterelacionado con la tasa de reforzamiento. Una tasa más alta de reforzamiento produce unaconducta que tiene un mayor momento y que es menos susceptible a la interrupción; otrohallazgo es que el momento conductual no está relacionado con la tasa de respuesta. Dosconductas que se dan a tasas semejantes no es preciso que tengan grados similares demomento conductual. Nevin ha destacado la tasa de reforzamiento en lugar de la tasa derespuesta como el determinante fundamental del momento conductual. Esta conclusión estáconfirmada por otros estudios que demuestran que los programas que proporcionan tasassimilares de reforzamiento pero tasa diferentes de respuesta tienen similares momentos oresistencias al cambio.La primacía de la tasa de reforzamiento sobre la tasa de respuesta como determinante delmomento conductual ha llevado a Nevin y Grace (2000) a atribuir el momento conductualprincipalmente al condicionamiento pavloviano o de asociaciones E-C, aunque la forma exactaen que estas asociaciones promueven el momento conductual no se han averiguado todavía.El reto principal a la proposición básica de que el momento conductual está directamenterelacionado con la tasa de reforzamiento es el efecto ERPE, este es un caso en que laresistencia a la extinción es mayor después de una baja tasa o probabilidad dereforzamiento. Nevin y Grace han sugerido que el ERPE puede explicarse asumiendo que laextinción es menos discriminable tras el reforzamiento intermitente que tras el continuo 152 Descargado del campus, http://campus.felizmente.info
  • 154. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 9: Extinción de la conducta condicionada Juan Carlos Cabrera 2009-2010Comentarios finales (página 276 del libro)Los estudios sobre extinción ilustran la naturaleza duradera de ciertos temas en la teoríade la conducta. Los primeros estudios sobre la extinción se centraron en los efectos delreforzamiento parcial enla extinción y otros efectos “paradójicos” de la recompensa, y sellevaron a cabo dentro de la tradición hulliana que daba preeminencia al aprendizaje E-R.Los mecanismos E-R cayeron en desuso con la creciente evidencia de que elcondicionamiento pavloviano y el intrumental involucraban asociaciones E-C y R-C, queestaban controladas o moduladas por claves contextuales. Estas evidencias fueron parte dela “revolución cognitiva” que se introdujo en la psicología en el último cuarto de siglo XX.Ésta proporcionó una mejor compresión de la recuperación espontánea y llevó aldescubrimiento de nuevos fenómenos como la renovación y el restablecimiento. Sinembargo, estos fenómenos representas los fallos de la extinción más que la exticnión en símisma. Como se ha descrito, la compresión de la extinción en sí misma ha requerido lavuelta a los conceptos E-R, esta vez en forma de asociaciones E-R inhibitorias. Losinvestigadores sigun interesados en qué es lo que hace que conducta sea resistente alcambio. Esta resistencia o momento conductual plantea especiales desafíos para la terapiade conducta. 153 Descargado del campus, http://campus.felizmente.info
  • 155. PRINCIPIOS DE APRENDIZAJE Y CONDUCTA Capítulo 9: Extinción de la conducta condicionada Juan Carlos Cabrera 2009-2010Terminos Clave (página 277 del libro)Efecto de la magnitud del reforzamiento en la Momento conductual Susceptibilidad de la respues- extinción Persistencia menor de la conducta ta a la interrupción mediante manipulaciones como instrumental en la extinción que sigue al la alimentación presión, la disponibilidad libre de entrenamiento con un reforzador de gran comida, o el cambio en el programa de magnitud que en la que sigue al entrenamiento con reforzamiento. un reforzador pequeño o moderado. Olvido Reducción de la respuesta aprendida queEfecto de reforzamiento parcial en la extinción ocurre por el paso del tiempo, no debido a Término utilizado para describir una persistencia experiencias particulares. mayor de la respuesta instrumental en la extinción posterior a un entrenamiento de Reforzamiento continuo Programa de reforzamiento reforzamiento parcial (intermitente) que en la en el que cada ocurrencia de la respuesta intru- extinción posterior a un entrenamiento de mental produce el reforzador. Abreviado RFC. reforzamiento continuo. Abreviado ERPE. Reforzamiento intermitenta Un programa deEfecto de sobreentrenamieno en la extición reforzamiento en el que sólo algunas de las Persistencia menor de la conducta instrumental ocurrencias de la respuesta instrumental se en la que la extinción que sigue a un refuerzan. La respuesta intrumental se refuerza entrenamiento extenso con reforzamiento ocasionalmente, o intermitentemente. También (sobrentrenamiento) que en la que sigue a un denominado reforzamiento parcial. entrenamiento con niveles de reforzamiento moderados. Restablecimiento Recuperación de la respuesta excitatoria a un estímulo extinguido producidaExtinción (en el condicionamiento clásico) Reducción por la exposiciones al estímulo incondicionado. de la respuesta aprendida que ocurre debido a que el estímulo condicionado no se vulve a Renovación Recuperación de la respuesta emparejar con el estímulo condicionado. También, excitatoria a un estímulo extinguido producida el procedimiento de presentar repetidamente un por la retirada de las claves contextuales que estímulo condicionado sin el estímulo incondi- estaban presentes durante la extinción. cionado. Teoría de la frustración Teoría del efecto delExtinción (en el condicionamiento intrumental) reforzamiento parcial en la extinción, de acuerdo Reducción de la respuesta instrumental que con la cual la extinción se retarda tras le ocurre porque la respuesta no vuelve a ir seguida reforzamiento parcial porque la resuesta instru- de un reforzador. También, el procedimiento de mental se condiciona a la anticipación de la ausen- no volver a reforzar la respuesta instrumental. cia frustante de recompensa.Frustración Respuesta emocional aversiva que es Teoría secuencial Teoría del efecto de reforza- resultado de la ausencia inesperada de reforza- miento parcial en la extinción, de acuerdo con la miento. que la extinción se retarda tras el reforzamiento parcial porque la respuesta intrumental se condi-Hipótesis de la discriminación Explicación del ciona a la memoria de ausencia de rescompensa. efecto de reforzamiento parcial en la extinción, de acuerdo con la que la extinción es más lenta tras el reforzamiento parcial que tras el reforza- miento continuo, porque el principio de la extin- ción es más difícil de detectar cuando sigue el reforzamiento parcial. 154 Descargado del campus, http://campus.felizmente.info

×