Resumen aprendizaje temas 1 9

8,989 views

Published on

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
8,989
On SlideShare
0
From Embeds
0
Number of Embeds
5
Actions
Shares
0
Downloads
138
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Resumen aprendizaje temas 1 9

  1. 1. AprendizajeTema 1 : Introducción 1 Introducción y antecedentes históricosEn el aprendizaje se da mayor importancia al aprendizaje procedimental de carácterautomático, que no requiere conciencia, que al aprendizaje de tipo declarativo, másaccesible a la conciencia. Wegner y Wheatley concluyeron que el verdaderomecanismo causal que subyace al comportamiento nunca se presenta a la conciencia.Bargh y Chartrand concluyeron que la mayor parte de la vida cotidiana de una personaesta determinada no por sus intenciones conscientes y decisiones deliberadas, sinopor procesos mentales que se ponen en marcha ante rasgos del ambiente y que operafuera de la supervisión de la conciencia.Antes de Descartes se pensaba que el comportamiento humano estaba enteramentedeterminado por la intención consciente y el libre albedrío, sin intervenir estímulosexternos. Descartes propuso una visión dualista del comportamiento denominadadualismo cartesiano donde existen dos formas de conducta; voluntaria e involuntaria.La involuntaria consiste en respuesta automáticas a los estímulos externos, mediadapor un mecanismo denominado reflejo. Por el contrario la conducta voluntaria norequiere de estímulos externos (es independiente) y se debe únicamente a la voluntadconsciente de actuar de una determinada forma.Según Descartes los nervios que transmiten la información de los sentidos al cerebro ydel cerebro a los músculos son los mismos. Por otro lado consideraba que losanimales no tenían libre albedrío (mente) ni conducta voluntaria. De este dualismomente-cuerpo surgen dos tradiciones intelectuales; el mentalismo, interesada por elcontenido y funcionamiento de la mente, y la reflexología, interesada por la conductainvoluntaria. Ambas constituyen la base del estudio del aprendizaje moderno. Desarrollo histórico del estudio de la menteDescartes pensaba que la mente y el cerebro estaban conectados por la glándulapineal, y por lo tanto algunos contenidos de esta provenían de experiencia sensoriales.También creía que la mente contenía ideas innatas al nacer (concepto de Dios,concepto de si mismo, etc..). Esta aproximación filosófica se denomina innatismo.John Locke (posterior a Descartes) creía que todas las ideas de las personas eranaprendidas directa o indirectamente a través de experiencias posteriores al nacimiento(la mente es una pizarra en blanco). Esta corriente filosófica se denomina empirismo(siglos XVII y XIX).Descartes creía que la mente no funciona de forma predecible, mientras que ThomasHobbes creía que al igual que los reflejos la mente funcionaba de forma predecible. Deesta manera propuso que la conducta voluntaria estaba gobernada por el principio delhedonismo (búsqueda del placer y evitación del dolor).El funcionamiento de la mente para los empiristas (obtención de información porexperiencias sensoriales) está basado en la asociación. Esta se basa en laasociación de sensaciones simples para formar ideas complejas. Las tres leyesprimarias de la asociación son: contigüidad (dos eventos que ocurren juntos quedan
  2. 2. asociados), similitud (dos ideas similares se asocian) y contraste (dos estímulos muydiferentes se asocian, sin evidencias). Las leyes de asociación secundarias dependende la intensidad, frecuencia y recencia con que las sensaciones ocurríanconjuntamente.Los empiristas no realizaron experimentos para validar sus leyes. Fue HermannEbbinghaus (siglo XIX) quien comenzó la investigación empírica mediante el uso desilabas sin sentido (tres letras sin significado). Comprobó que la fuerza de laasociación mejora con el entrenamiento. Desarrollo histórico del estudio de los reflejosDescartes consideraba que los nervios son tubos huecos con gases denominadosespíritus animales. Todo esto fue refutado posteriormente.Descartes y posteriores filósofos consideraban que los reflejos eran responsablesúnicamente de reacciones sencillas a estímulos externos.Sechenov propuso que los estímulos no siempre elicitan (provocan) respuestasreflejas de forma directa (puede liberar respuestas inhibidas). En este caso la fuerzade la respuesta no depende de la intensidad del estimulo (ej. conducta voluntaria ypensamientos asociados con estímulos débiles).Pavlov demostró experimentalmente que no todos los reflejos son innatos.La teoría moderna de conducta se basa en el concepto de estimulo-respuesta (E-R) yel concepto de la asociación. 2 El amanecer de una nueva eraLa investigación del aprendizaje esta basada en tres fuentes; la cognicióncomparada y la evolución de la mente, neurología funcional (funcionamiento delsistema nervioso) y el desarrollo de modelos animales de la conducta humana.- Cognición comparada y evolución de la inteligenciaSegún Darwin la mente humana es producto de la evolución, en oposición a lo quepensaba Descartes (sólo los humanos tienen mente). Según George Romanes lainteligencia podría identificarse determinando si un animal aprende a hacer nuevosajustes, o a modificar los antiguos, de acuerdos con los resultados de su propiaexperiencia individual (definición de inteligencia en función de la capacidad deaprendizaje).- Neurología funcionalDe acuerdo con el nervismo, las principales funcionas fisiológicas están gobernadaspor el sistema nervioso. Pavlov considero el condicionamiento como medio de obtenerinformación del sistema nervioso.- Modelos animales de la conducta humanaLos modelos se utilizan para analizar aspectos de la realidad bajo condicionessencillas, controladas y económicas. Para que un modelo se valido debe ser
  3. 3. comparable con el objeto real en relación a los rasgos o función sometidos a estudio. 3 Definición de aprendizajeEl aprendizaje es un cambio duradero en los mecanismos de la conducta que implicaestímulos y/o respuestas específicas y que es resultados de la experiencia previa conesos estímulos y respuestas o con otros similares.La ejecución se refiere a las acciones de un organismo en un momento concreto. Uncambio en la actuación no puede ser automáticamente considerado una manifestaciónde aprendizaje.La fatiga puede producir una disminución gradual en la fuerza de una respuesta (estetipo de cambio es debido a la experiencia). Esto no se considera aprendizaje.La conducta también puede verse alterada por cambios en la condiciones estimulareso cambios en el estado fisiológico o motivacional.En la maduración aparecen cambios persistentes en la conducta sin necesidad de laexperiencia con eventos del entorno tal y como requiere el aprendizaje.Cuatro son los mecanismos causales descritos por Aristóteles.Causa eficiente: condiciones necesarias y suficientes para producir un resultado en laconducta (experiencia anterior con estimulo y/o respuestas).Causa material: cambios físicos en el sistema nervioso que median en el aprendizaje(mecanismos sinápticos).Causas formales: son las teorías y modelos de aprendizaje (constructor teóricos,matemáticos, etc..).Causa final: relacionado con la función o utilidad. En biología la causa final es comoafecta este proceso al éxito reproductivo del organismo. 4 Aspectos metodológicos del estudio del aprendizajeLa investigación del aprendizaje se caracteriza por dos rasgos metodológicos; elmétodo experimental (en contraste con los métodos de observación), y la confianzaen una perspectiva de proceso general.Los estudios de aprendizaje hacen hincapié en identificar los factores causalesresponsables de los cambios persistentes en la conducta que resultan de laexperiencia previa, centrándose en las causas eficientes, materiales y formales. Elaprendizaje solo puede estudiarse mediante técnicas experimentales (básicamente enlaboratorio). El aprendizaje no puede observarse de la misma manera que elacicalamiento, la agresión etc.. ya que es necesario estar seguros que los cambios enla conducta no se deben a cambios hormonales, motivacionales, etc..Un presupuesto fundamental de la perspectiva de proceso general es que losfenómenos estudiados son el resultado de procesos más elementales que operan deforma similar independientemente de donde se encuentren (se asume que la
  4. 4. generalidad emerge a nivel de los procesos básicos).Si asumimos que existen principios universales de aprendizaje, estos principiospueden ser descubiertos en cualquier situación donde el aprendizaje tenga lugar. Estopermite que el aprendizaje pueda ser estudiado en un número reducido de situacionesexperimentales (paradigmas). Una teoría general del aprendizaje no puede verificarseempíricamente utilizando solo unos pocos paradigmas experimentales estandarizados,es necesario realizar estudios en distintas especies y situaciones. 5 Uso de animales no humanos en la investigación sobre aprendizajeEn la investigación se usan animales no humanos por razones tanto teóricas comometodológicas. Con los animales de laboratorio se puede estudiar como el aprendizajeinterviene a la hora de buscar comida, evitar el dolor o el estrés o encontrar una parejasexual. La búsqueda de las bases biológicas del aprendizaje requiere documentarantes la naturaleza de los procesos de aprendizaje a nivel conductual. Los estudiosconductuales de aprendizaje realizados con animales son un requisito necesario parainvestigar las bases biológicas del aprendizaje. La neurociencia tiene quefundamentarse en la ciencia del comportamiento.El comportamiento de los animales no se ve complicado por los procesos lingüísticosni por las solicitudes explicitas a lo sujetos así como deseos de complacer o contrariaral investigador..Los animales de laboratorio no son menos representativos que sus congéneressalvajes. Los animales deben ser tratados con respeto y cuidado para que losresultados sean fiables.Las alternativas a la investigación con animales son; técnicas observacionales (noproporcionan información), plantas (no tienen sistema nervioso), cultivo de tejidos (esnecesario la caracterización previa a nivel conductual) y simulaciones informáticas (esnecesario conocer las reglas del aprendizaje para poder ser programas).
  5. 5. Tema 2 : Conducta elicitada, habituación y sensibilización1. La naturaleza de la conducta elicitadaEn los vertebrados los reflejos simples suelen estar mediados por tres neuronas. Elestimulo ambiental de un reflejo activa una neurona sensorial (neurona aferente) quetransmite el mensaje sensorial a la medula espinal. Allí el impulso sensorial setransmite a la neurona motora (neurona eferente) que activa el músculo involucradoen la respuesta en la respuesta refleja. Raramente ambas neuronas se comunicandirectamente y estas se suelen comunicar a través de una interneurona. Esto dalugar a que determinadas respuestas reflejas están elicitadas sólo por un conjuntolimitado de estímulos. El conjunto de tres neuronas se denomina arco reflejo. Sinembargo la información sensorial puede transmitirse al cerebro y alterar la reacciónrefleja.En los niños este fenómeno se da con el reflejo de oclusión respiratoria. Si el beberecibe menos oxigeno tenderá a inclinar la cabeza para atrás, si no surge efectomoverá las manos y llorará para expulsar cualquier obstrucción Pautas de acción modalA las secuencias de respuestas típicas de especies particulares (alimentación de avespor estimulación del pico de la madre por parte de los polluelos) se las denominapautas de acción modal (PAM). Los rasgos específicos que se requieren para elicitarla pauta de acción modal reciben el nombre de estímulo señal o estímulodesencadenante (ej. las características del pico del ave que trae la comida para queel polluelo lo reconozca).Los rasgos del estimulo se pueden identificar para fabricar un estimulo más efectivoque el natural como elicitador de la pauta de acción. Estos estímulos inusualmenteefectivos se denominan estímulos supranormales.Los patrones de acción modal tienen lugar de forma parecida entre miembros de unamisma especie dando lugar a actividades “instintivas”. Se considera que la conductainstintiva refleja la historia genética de un individuo, pero también el aprendizaje puedeestar involucrado en este tipo de conductas.Las respuestas no tienen lugar aisladas unas de otras, organizándose en secuenciasde comportamiento funcionalmente efectivas. Los etólogos denominan conductaapetitiva a los primeros componentes de la secuencia de comportamiento (búsquedade comida) y conducta consumatoria a los últimos (romper la cáscara, extraer elcontenido, masticarlo y tragarlo). Las conductas consumatorias son altamenteestereotipadas (masticación y deglución), siendo las conductas apetitivas menosestereotipadas (diferentes formas de obtener comida). Las conductas consumatoriastienden a ser pautas de acción modal específicas de la especie.Al estudiar animales es normal considerar que la secuencia de respuestas debúsqueda de comida comienza por un modo de búsqueda general (el sujeto no sabedonde encontrar comida) seguido de un modo de búsqueda focalizada (identificadouna fuente de comida, se busca en ella la comida, ej. un árbol y sus frutos) y terminapor un modo de manipulación del alimento. En la teoría moderna del aprendizaje la
  6. 6. categoría de respuesta apetitiva se ha subdividido en las categorías de búsquedageneral y focalizada.2. Conceptos de habituación y sensibilizaciónUno de los rasgos más característicos de la conducta elicitada es su plasticidad (lasrespuestas elicitadas simples no ocurren de la misma manera en todas las ocasiones).A medida que se presenta el estimulo de forma repetida la respuesta elicitada se vahaciendo más débil (efecto de habituación) o más intensa (efectos desensibilización). Como ejemplo el caso de los bebes ante estímulos visuales, dondeal aumentar la frecuencia de aparición de un objeto reducen su interés por el.Teniendo en cuenta los tres componentes del reflejo (neurona sensorial, motora einterneurona), existan varias razones por las cuales una respuesta elicitada puede noocurrir. Una disminución de la sensibilidad recibe el nombre de adaptación sensorial(ej. quedar cegado por una luz brillante). Si los músculos involucrados quedanincapacitados por la fatiga tampoco aparecerá la respuesta. En ambos fenómenos nointerviene el sistema nervioso, por lo que puede distinguirse de la habituación. Seasume que la habituación y la sensibilización conllevan cambios neurofisiológicos quedificultan o facilitan la transmisión de impulsos entre neuronas sensoriales y motoras(pero sigue percibiendo el estimulo y tiene capacidad de hacer movimientos).La adaptación sensorial puede detectarse teniendo en cuenta que la habituación esespecifica de la respuesta (deja de responder de una forma pero responde de otra). Lafatiga puede detectarse teniendo en cuenta la habituación al estimulo (una respuestahabituada se recupera rápidamente cuando se introduce un estimulo novedoso). Teoría del proceso dual de la habituación y sensibilizaciónLa teoría del proceso dual presupone que los incrementos y disminuciones en latendencia a responder a un estimulo son producto de procesos neuronales diferentes.El proceso de habituación provoca una disminución en la tendencia a responder,mientras que el proceso de sensibilización provoca un incremento en la tendencia aresponder, pudiendo estar ambos activos al mismo tiempo. El resultado conductual(efecto de habituación o sensibilización) depende de que proceso sea más fuerte. Losefectos hacen referencia a la conducta observable y los procesos a los mecanismossubyacentes.Según estudios, los procesos de habituación y sensibilización tienen lugar endiferentes partes del sistema nervioso. Los procesos de habituación tienen lugar en elsistema E-R (conducto neuronal más corto que conecta los órganos sensoriales conlos motores). El sistema E-R actúa como un arco reflejo. Se asume que los procesosde sensibilización tienen lugar en el sistema de estado (abarca otras partes delorganismo). El sistema de estado determina la tendencia general de un organismo aresponder, mientras que el sistema E-R permite al animal dar la respuesta específicaal estimulo relevante.El sistema E-R se activa siempre que un estimulo elicita una respuesta, sin embargo,el sistema de estado sólo interviene en circunstancias especiales. El sistema deestado puede sensibilizarse por la presentación repetida del propio estimulo critico sies lo suficientemente intenso o estimulante.
  7. 7. 3. Características de la habituación y sensibilizaciónLa mayor parte de los cambios conductuales se mantienen durante periodos largos(semanas o meses), una característica definitoria de los fenómenos de aprendizaje.Sin embargo, no todos los casos de habituación y sensibilización puedenconsiderarse en rigor muestras de aprendizaje duradero.En todos los sistemas de respuesta la duración de los efectos de sensibilización estádeterminada por la intensidad del estimulo. Los estímulos mas intensos producenmayores incrementos en la tendencia a responder y una sensibilización máspersistente.En el caso de la habituación hay dos tipos de efectos, habituación a corto plazo(segundos o minutos de duración), y habituación a largo plazo (persistente muchodías). Tras un periodo de habituación a corto plazo la respuesta decrece, pero si sepermite un periodo de descanso lo suficientemente largo, la recuperaciónespontánea restaura completamente la reacción del animal. La recuperaciónespontánea es la principal característica del efecto de habituación a corto plazo. Sinembargo con habituación a largo plazo, la recuperación espontánea nunca escompleta.La habituación a corto plazo se da cuando el estímulo elicitante se presentafrecuentemente, mientras que la habituación a largo plazo es más probable cuando laspresentaciones del estimulo están más separadas.La habituación es específica del estímulo que ha sido presentado repetidamente.Una respuesta a un estimulo previamente habituada puede manifestarse plenamentealterando alguna característica importante del estimulo. Sin embargo cuando losestímulos son similares se puede dar la generalización del estimulo a la habituación.La sensibilización no es muy especifica del estimulo (la sensibilización a las descargaseléctricas incrementa la reactividad a claves visuales y auditivas).Un cambio en la naturaleza del estimulo elicitante puede dar lugar a la recuperación deuna respuesta habituada. La respuesta habituada también puede restablecersesensibilizando al organismo con la exposición a un estímulo externo, este fenómeno sedenomina deshabituación.4. Aplicación a las emociones y la conducta motivadaLas reacciones emocionales intensas a menudo constan de dos fases. Una emocióntiene lugar durante la presentación del estimulo elicitante, y la opuesta se observacuando el estimulo desaparece (ej. el alcohol produce sedación y posteriormentecuando se pasan los efectos irritabilidad). Con la experiencia la reacción primaria sehace más débil y su postefecto se hace más fuerte. La habituación a la reacción de ladroga se denomina tolerancia a la droga. Solomon y Corbit destacaron que seproducen patrones de reacción emocional similares con otros estímulos emocionales(ej. el amor y el apego cuando pasan los años es menor, sin embargo el sufrimiento dela muerte es mayor debido al postefecto afectivo, aun habiendo dejado de mostrarafecto).Tres características comunes de las reacciones emocionales: son bifásica (reacción
  8. 8. primaria y postefecto), la reacción primaria se debilita con la estimulación repetida, y eldebilitamiento de la reacción primaria va acompañado por un fortalecimiento delpostefecto. Estos tres rasgos se explican mediante la teoría del proceso oponentede la motivación.La teoría del proceso oponente asume que los mecanismos neurofisiológicosinvolucrados en la conducta emocional tratan de mantener la estabilidad emocional(teoría homeostática). La teoría asume que un estimulo emocional activador desvía dela neutralidad el estado emocional de una persona. Se asume que estedesplazamiento con respecto a la neutralidad emocional pone en marcha un procesooponente que compensa el cambio. La teoría del proceso oponente asume que lapresentación de un estimulo emocional activador elicita un proceso primario oproceso a que es el responsable de la naturaleza del estado emocional (ej. felicidad)en presencia del estimulo. El proceso primario elicita a su vez un proceso oponente oproceso b que genera la reacción emocional opuesta (ej. tristeza). La fuerza delproceso oponente se resta de la fuerza del proceso primario para dar lugar a lasemociones que realmente ocurren. El proceso oponente es ligeramente ineficiente. Alprincipio es muy débil para compensar la emoción primaria, pero posteriormente sehace más rápido y potente con la experiencia del estimulo que activa la emoción (sesensibiliza). Con el tiempo el proceso oponente se va haciendo más fuerteproduciendo un postefecto muy fuerte al terminar el estimulo emocional activador.Un estimulo familiar (debido a una exposición prolongada) no elicita reaccionesemocionales fuertes, pero el postefecto afectivo tiende a ser más fuerte cuando seretira un estimulo familiar. La teoría del proceso oponente asume que el proceso b sefortalece con la exposición prologada al estimulo, dando lugar a que el proceso b seactive antes tras la aparición del estimulo, su intensidad máxima sea mayor y tardemás tiempo en decaer tras la desaparición del estimulo. Sin embargo el proceso apermanece inalterado. Este fortalecimiento del proceso oponente reduce la intensidadde las respuesta emocionales primarias observadas durante la presentación delestimulo emocional activador.Hay dos formas de reducir los postefectos oponentes aversivos de las drogas, una esesperar el tiempo necesario hasta que se disipen (“pasar el mono“). La otra es reducirmás rápidamente el postefecto oponente tomando de nuevo la droga, reactivando denuevo el proceso primario acabando con la agonía de la abstinencia. De acuerdo conla teoría los adictos quedan atrapados, no por el placer de la droga, sino por lanecesidad de tomar la droga para reducir los efectos de la retirada.Responder para escapar de la molestia producida por la retirada de un estimulo essólo uno de los tipos de conducta motivada o dirigida a metas. Un objeto metagratificante recibe el nombre técnico de reforzador. El reforzador es un estimulo cuyaadministración inmediatamente posterior a una respuesta incrementa la probabilidadfutura de dicha respuesta.
  9. 9. Tema 3: Condicionamiento clásico: fundamentosLa habituación y la sensibilización permiten cambios en las respuestas que yapertenecen al repertorio de respuestas del organismo. No permiten el aprendizaje denuevas respuestas o de respuestas a nuevos estímulos. El condicionamiento clásicoes el mecanismo más simple por el cual los organismos pueden aprender acerca de larelación entre estímulos y cambiar su conducta.1. Los primeros años del condicionamiento clásicoLos estudios sistemáticos del condicionamiento clásico comenzaron con los trabajosdel fisiólogo Ivan P. Pavlov. Pero también fue descubierto independientemente porEdwin B. Twitmyer al condicionar el reflejo patelar (patada debido al golpeo de larotula) haciendo sonar una campana 0.5 segundos antes de golpear el tendónrotuliano.Los técnicos del laboratorio de Pavlov descubrieron que los perros secretaban jugosgástricos en respuesta a la mera visión de la comida o de la persona que losalimentaba.Los primero estudios sistemáticos sobre el condicionamiento clásico fueron realizadospor S. G. Vul’fson y A. T. Snarskii en el laboratorio de Pavlov. Ambos estudiaron larespuesta salival a varias sustancias situadas en la boca. Después de que los perroshubieran experimentado la sensación provocada por estas sustancias en la boca, lamera visión de las mismas era suficiente para provocar la salivación. Las sustanciasprovocaban en la boca sensaciones de textura y sabor características. Estassensaciones se denominan estímulos orofaríngeos. Al poner arena en la boca de unperro, este salivaba. Tras poner arena varias veces en la boca, la visión de la eran (ysus características visuales) también provocaban salivación. Este tipo de aprendizajese denomina aprendizaje de objeto, ya que requiere asociar diferentes característicasde un mismo objeto.Para estudiar los mecanismos del aprendizaje asociativo los estímulos se debenmanejar de forma independiente, estos es difícil cuando los dos estímulos sonpropiedades del mismo objeto. Pavlov utilizo procedimientos en los que los estímulos aasociar provenían de distintas fuentes. El paradigma del condicionamiento clásicoEl procedimiento de Pavlov conlleva dos estímulos; (1) un tono o luz que no provocasalivación al principio del experimento y (2) un alimento o solución acida situada en laboca que produce una fuerte salivación la primera vez que se presenta. El tono o luzse considera el estimulo condicional (EC) ya que la efectividad de este estimulo paraprovocar salivación dependía del emparejamiento repetido con la presencia de lacomida. Al alimento se denominó estimulo incondicional (EI) ya que su efectividadde provocar salivación era independiente del entrenamiento anterior. La salivaciónprovocada por el tono o luz se denomina respuesta condicional (RC), y la salivaciónprovocada por la comida o sabor acido se denomina respuesta incondicional (RI).En resumen, los estímulos y respuestas cuyas propiedades no dependen delentrenamiento proveo se denomina “incondicional”, y los estímulos y respuestas cuyaspropiedades aparecían sólo tras el entrenamiento se denominan “condicionales”.
  10. 10. 2. Situaciones experimentales Condicionamiento del miedoWatson y Rayner (1920) creían que al principio los niños estaban limitados en sureactividad emocional, asumiendo que “debe haber algún procedimiento sencillo(condicionamiento pavloviano) por medio del cual el rango de estímulos que puedendespertar las emociones y sus compuestos se amplia”. Para demostrarlocondicionaron la respuesta de miedo de un niño (Albert) de 9 meses a la presentaciónde una inofensiva rata blanca de laboratorio. Tras cinco ensayos de condicionamiento(con un sonido fuerte a la vez que la presencia de la rata) Albert mostró una reacciónde miedo intenso a la rata que antes no tenía.Debido a cuestiones éticas, actualmente los estudios de miedo se realizan con ratasde laboratorio. El estimulo incondicionado aversivo utilizado es una breve descargaeléctrica en las patas. El estimulo condicionado suele ser un tono o luz. Las ratasmuestran miedo quedándose quietas, pero esta respuesta no suele ser medidadirectamente, sino indirectamente registrando como el estimulo condicionado altera laactividad del animal. Una técnica popular de la medida indirecta del miedocondicionado es el procedimiento de respuesta emocional condicionada osupresión condicionada (REC), diseñada por Estes y Skineer (1941). Esteprocedimiento consiste en enseñar a la rata a presionar una palanca para obtenercomida. Después comienza la fase de condicionamiento del miedo, donde en cadaensayo se presenta el EC durante 1 o 2 minutos y posteriormente la descarga,habiendo una separación entre ensayos de 15 a 30 minutos. Las ratas no puedenpresionar la palanca cuando están paralizadas por el miedo. La supresión esespecífica del EC, ya que si este desaparece las ratas vuelve a su conducta paraobtener comida.Para medir cuantitativamente la supresión condicionada se usa la razón desupresión= Respuestas durante el EC/(Respuestas durante el EC+Respuestasdurante el pre-EC). El rango de esta formula va desde 0 (supresión total durante elEC) a 0.5, donde la rata no suprime en absoluto su conducta (la escala es inversa).Otro procedimiento similar al de pulsar una palanca para obtener comida es el de laconducta de lameteo de un tubo de agua. La presentación del EC que provoca miedoda lugar a la supresión de conducta de lameteo, denominada supresióncondicionada de lameteo. En este procedimiento se registra el tiempo que tarda elanimal en completar un total de 5 seg. de lameteo como medida de supresión de larespuesta. Condicionamiento del parpadeoEl reflejo palpebral (parpadear) es un reflejo discreto, similar al patelar. Este reflejo sepuede condicionar a un tono soplando al ojo a la ves que suena el tono. Steinmets(1999) destaca que el condicionamiento palpebral es un medio excelente para laobservación de una conducta simple en humanos y puede ser usado para analizar elaprendizaje, la atención, la activación, etc….Los estudios con niños pequeños muestran que el reflejo palpebral puede sercondicionado a un tono si el EC (tono) y el EI (soplo de aire) son contiguos. Sinembargo si el EC y EI están separados entre 4 y 8 segundos no se produce elcondicionamiento.Gormezano (1996) estudio el reflejo palpebral en conejos, ya que raramenteparpadean en ausencia de aire. Sin embargo el condicionamiento palpebral en conejoses lento y se requieren cientos de ensayos para obtener un nivel significativo decondicionamiento.
  11. 11. El engrama es la memoria biológica que permite asociar dos estímulos y que de algúnmodo queda almacenado en el cerebro. En humanos se ha demostrado que parapoder recordar algo de forma consciente el hipocampo debe estar intacto. Sinembargo en conejos se ha comprobado que la eliminación de las estructuralescerebrales hasta el cerebro medio tiene un escaso efecto en el condicionamientopalpebral. Esto sugiere que el circuito esencial para el condicionamiento palpebral sesitúa en las estructuras inferiores del tronco del encéfalo y el cerebelo. Losexperimentos demostraron claramente que la adquisición de una respuestacondicionada depende de un circuito neuronal situado en el cerebelo. Los pacientesamnésicos que han sufrido daños en el hipocampo son incapaces de aprender por unprocedimiento de huella (el EI comienza 0.5 seg. después de acabar el EC), sinembargo si pueden aprender con un procedimiento de demora corta (el EI comienzaantes de acabar el EC). Los individuos que no pueden dar información explicita de larelación EC-EI son incapaces de aprender.Seguimiento del signoUno de los paradigmas experimentales que ha contribuido significativamente a laconcepción actual del condicionamiento pavloviano es el seguimiento del signo oautomoldeamiento. Los animales tienden a aproximarse y a tomar contacto con losestímulos que señalan la disponibilidad de alimento. El seguimiento del signo seestudia en el laboratorio mediante la presentación de un estímulo visual discreto y bienlocalizado justo antes de la administración de alimento. En estudios con palomas(Hearst y Jenkins 1974) donde una luz (EC) se activa antes de la administración de lacomida (EI), sin necesidad de intervención del animal, se ha comprobado que laspalomas tienden a picotear la luz en lugar de usarla como medio de predicción de lacomida. Esta atracción por el seguimiento del signo es tan fuerte que picotean la luzincluso cuando no es necesario (por ejemplo con el pasillo muy largo y el comedero enel centro, estando la paloma en el centro, van y vuelven).Experimentos adicionales con ratas mostraron que usando una luz y un tono, el ECauditivo provocaba una aproximación al comedero en lugar de a la fuente de sonido,cosa que ocurre con la luz. Esto demuestra que para que tenga lugar el seguimientodel signo el estimulo tiene que ser uno determinado. Se obtienen mayores niveles deseguimiento del signo con mayores exposiciones al contexto experimental en relacióna la duración del EC. Aprendizaje de aversión al saborEl simple acto de comer proporciona numerosas oportunidades para el aprendizaje deasociaciones. La aversión al sabor puede aprenderse si la ingestión de un sabor nuevova seguida de enfermedad o de otras consecuencias aversivas. Por el contrario, lapreferencia por un sabor puede aprenderse si se empareja con la sensación desaciedad. El condicionamiento de aversión sabor puede darse incluso si las molestiassurgen horas después de ingerir el alimento y en un único ensayo (y es independientede los procesos de pensamiento racionales).La anorexia que acompaña al crecimiento de algunos tumores puede ser el resultadode un aprendizaje de aversión al sabor. Algunas evidencias sugieren que las personasaquejadas de anorexia nerviosa sufren trastornos digestivos que pueden incrementarla probabilidad de aprender aversiones al sabor (similar a lo que ocurre con laspersonas que sufren depresiones severas).La aversión al sabor es el resultado del emparejamiento de un EC (sabor) con un EI(droga o radiación).Tiene dos características; puede aprenderse con un único ensayo,algo muy raro con el condicionamiento palpebral, salival o seguimiento del signo. Laotra característica única es que tiene lugar incluso si los animales enferman horasdespués de haber ingerido el alimento (García 1966). El aprendizaje demorado a la
  12. 12. aversión al sabor probablemente ha evolucionado para permitir a los animales(humanos como no humanos) evitar alimentos venenosos con efectos retardados.Experimentos con ratas irradiadas mostraron aversión al sabor hasta 24 horasdespués (menor aversión cuanto más tiempo pasa), a partir de 24h prácticamentedesaparece la aversión al sabor.3. Procedimientos de condicionamiento pavloviano excitatorio Procedimientos típicos de condicionamiento pavlovianoUno de los factores críticos que terminan el curso del condicionamiento clásico es laordenación temporal del estímulo condicionado e incondicionado.El tiempo entre un ensayo de condicionamiento y el siguiente se denomina intervaloentre ensayos. El tiempo entre el comienzo del EC y el comienzo del EI dentro de unmismo ensayo se llama intervalo entre estímulos o intervalo EC-EI. Paradesarrollar la respuesta condicionada el intervalo EC-EI debe ser mucho mas cortoque el intervalo entre ensayos. Típicamente intervalo entre estímulos=1minuto eintervalo entre ensayos=5min. Existen cinco procedimientos de condicionamientoclásico: • Condicionamiento de demora corta: Se demora el comienzo del EI ligeramente tras el comienzo del EC. El EC puede continuar durante el EI o terminar cuando empieza el EI. • Condicionamiento de huella: Es similar al condicionamiento de demora corta, pero en este caso el EI no se presenta hasta que ha transcurrido cierto tiempo desde la terminación del EC. El espacio de tiempo entre el EC y el EI se denomina intervalo de huella. • Condicionamiento de demora larga: Similar al condicionamiento de demora corta, sin embargo el EI se demora durante más tiempo (5-10 minutos) que en el procedimiento de demora corta. El EC lógicamente es más largo. El procedimiento de demora larga no incluye intervalo de huella y el EC dura hasta que el EI empieza. • Condicionamiento simultaneo: el EC y el EI comienzan al mismo tiempo. • Condicionamiento hacia atrás: el EI ocurre un poco antes que el EC (en orden contrario que los casos anteriores). Medida de las respuestas condicionadasPara medir el condicionamiento se realiza un ensayo de prueba que consiste en lapresentación del estimulo condicionado aislado (sin el EI). La magnitud de la respuestacondicionada mide la conducta durante el EC. Ejemplos son el número de gotas desaliva, la supresión de la conducta (procedimiento REC) o el grado de reducción de lapreferencia del sabor. La probabilidad de la respuesta hace referencia al porcentajede ensayos que el EC provoca una respuesta condicionada. La latencia es la cantidadde tiempo que pasa entre el principio del EC y la aparición de la respuestacondicionada. En los procedimientos de demora y huella el EC aparece de formaaislada y cualquier conducta condicionada no esta contaminada por el EI y puede serutilizada como medida del aprendizaje (cosa que no puede hacerse con elprocedimiento simultaneo y hacia atrás). Procedimientos de control en el condicionamiento clásicoEl aprendizaje es una inferencia sobre las causas de la conducta basada en unacomparación entre al menos dos condiciones. Una asociación entre un EC y un EI
  13. 13. implica que los dos eventos han quedado conectados de alguna forma. Un incrementoen la respuesta podría resultar de la sensibilización, que no es un proceso asociativo.Así por ejemplo la presencia de la comida puede incrementar la conducta provocadapor un tono sin que se haya establecido ninguna asociación entre los dos estímulos.Por tanto el incremento en la respuesta que se observa con el emparejamientorepetido de EC y EI puede ser en realidad el resultado de la mera exposición al EI. Enestos casos la respuesta condicionada recibe el nombre depseudocondicionamiento. Para determinar si existe una asociación se requierenprocedimientos de control. Uno de ellos es la presentación aleatoria del EC y el EI,denominado control aleatorio. Sin embargo el procedimiento de control aleatoriopuede dar lugar a aprendizaje asociativo. Un procedimiento más útil es el controldesemparejado explicito donde el EC y el EI aparecen lo suficientemente separadospara evitar que se asocien. La cantidad de tiempo depende del sistema de respuesta(el sabor requiere más tiempo). Eficacia de los procedimientos típicos de condicionamientoSe han realizado muchos estudios para determinar que procedimiento decondicionamiento es más efectivo. Se observo poco condicionamiento cuando EC y EIse presentan simultáneamente. Si se demora el EI tras el EC incrementa elcondicionamiento, pero si se demora demasiado se reduce (similar a la aversión alsabor). Tradicionalmente se ha considerado que el condicionamiento de huella esmenos efectivo que el de demora debido al intervalo de huella. En general seconsidera el condicionamiento más efectivo cuando el EC es una buena señal de queel EI aparecerá pronto. El condicionamiento hacia atrás da resultados ambiguos.El simple presupuesto de que el valor de señal EC determina si un procedimientoproducirá condicionamiento es claramente incapaz de explicar la complejidad de loshallazgos que se han obtenido en el condicionamiento hacia atrás. El reto es formularnuevas ideas teóricas para explicar la diversidad de resultados.Una conceptualización completamente nueva de la efectividad relativa de diferentesprocedimientos de condicionamiento pavloviano está empezando a emerger. Lahipótesis de la codificación temporal asume que el sujeto también aprende cuandoaparece el EI en relación al EC. La idea es que pueden obtenerse diferentes tipos derespuesta condicionada dependiendo de la información temporal del EI queproporciona el EC.4. Condicionamiento pavloviano inhibitorioExiste otro tipo de condicionamiento donde el individuo aprende a predecir la ausenciadel estímulo incondicionado. La investigación con animales de laboratorio muestra quela exposición a estímulos aversivos impredecibles es muy perturbadora y produceúlceras de estomago y otros síntomas fisiológicos de estrés. Estudios con pacientescon problemas de ataques de pánico demostraron que la ansiedad generada por laexperiencia de pánico tiene lugar principalmente a causa de la imprevisibilidad de losataques (cuando se pueden predecir la ansiedad es menor posteriormente que cuandoson imprevisibles). Esto demuestra que en los experimentos es preferible estímulosaversivos predecibles. El hecho de que sea preferible la predicción de estímulosaversivos puede ser debida a que permite predecir la ausencia de estimulaciónaversiva. La introducción de pequeños periodos de seguridad predecible puede reducirel estrés sustancialmente. Las señales que predicen la ausencia de un estímuloaversivo son estímulos condicionados inhibitorios. Aunque se puede aprender apredecir la ausencia de un estimulo EI positivo, gran parte de la investigación serealiza con estímulos aversivos.
  14. 14. Procedimientos de condicionamiento inhibitorioA diferencia del condicionamiento excitatorio que puede ocurrir si condiciones previas,para que la ausencia de un EI se significativa, el EI debe ocurrir periódicamente en lasituación. Esto hace que el condicionamiento inhibitorio dependa del contexto. Procedimiento estándar de inhibición condicionadaEl procedimiento que uso Pavlov requiere dos estímulos condicionados (EC+ y EC-) ydos tipos de ensayo de condicionamiento. El EI se presenta en el primer tipo deensayo y siempre va precedido por un EC+ (un tono por ejemplo), de esta forma elEC+ se convierte en una señal del EI. En el segundo tipo de ensayo el EC+ seempareja con el EC- y no se presenta el EI. Esto convierte el EC- en un inhibidorcondicionado. A lo largo del tratamiento los ensayos de los dos tipos se alternan deforma aleatoria. A medida que esto ocurre el EC- adquiere gradualmente propiedadesinhibitorias. Contingencia o correlación negativa entre el EC y el EIEste procedimiento para producir inhibición condicionada no requiere un EC+ explicito,en lugar de eso usa un EC- que está correlacionado negativamente con el EI (el EI esmenor probable que se produzca junto con el EC-).Lo que proporciona el contextoexcitatorio es el entorno de la cámara experimental, ya que es en este entorno dondese repite el EI. En este procedimiento el EI aversivo puede aparecer de vez en cuandotras el EC, pero con una probabilidad pequeña. Es mucho más probable que el EIaparezca en ausencia del EC, dando lugar a una contingencia negativa entre EC y EI.Dado que el procedimiento estándar permite predecir la aparición del EI, tambiénpermite predecir cuando no va a aparecer. Esto permite la codificación temporal de laausencia del EI. Medición de la inhibición condicionada Sistemas de respuesta bidireccionalesCiertas respuestas conductuales son bidireccionales (ritmo cardiaco, respiración ytemperatura corporal pueden aumentar o disminuir). En estos casos la excitacióncondicionada da lugar a un cambio conductual en una dirección y la inhibicióncondicionada da lugar a un cambio en la dirección opuesta (ej. la frecuencia a la quese presiona una palanca puede aumentar o disminuir). Este método no es valido si elEC adquiere tanto propiedades excitatorias como inhibitorias y sólo muestra el efectoneto de la excitación y la inhibición. Prueba del estímulo compuesto o sumaciónEste método permite medir la inhibición cuando la conducta no es bidireccional. Lainhibición condicionada se mide a partir de la reducción o inhibición de esta respuestacondicionada. La prueba requiere observar los efectos de un EC inhibitorio encompuesto con un EC+ excitatorio. El procedimiento también puede verse como lasumación de los efectos de un EC+ y un EC-. Ejemplo, se somete a las ratas a un
  15. 15. estimulo (luz) que terminaba con una descarga A+, y un inhibidor X (tono) queeliminaba la descarga AX-. (procedimiento estándar de inhibición condicionada). Se lassometió también a otro estimulo auditivo B que terminaba en descarga B+. El resultadofue que X podía inhibir A+, como había sido condicionado, pero también B+. Se probocon otro estímulo auditivo Y pero este al no ser condicionada no surtió efecto. Elresultado fue que X fue capaz de inhibir el miedo condicionado ante A, pero tambiénante B que no había sido presentado junto con X.El procedimiento de prueba del estimulo compuesto para la inhibición condicionadasugiere que la presentación de un inhibidor condicionado o de una señal de seguridadpuede reducir los efectos estresantes de una experiencia aversiva. Prueba del retraso en la adquisiciónSi un estimulo inhibe una respuesta particular, entonces debería ser especialmentedifícil de condicionar ese estímulo para que provoque la conducta. En otras palabras,la velocidad de adquisición de una respuesta excitatoria debería disminuir si el EC esun inhibidor condicionado. En el ejemplo anterior, el entrenamiento inhibitorio inicial deX retrasará la adquisición de propiedades excitatorias de miedo condicionado.Rescorla (1969) propone usar el retraso en la adquisición y la prueba de estimulocompuesto para medir la conducta de inhibición condicionada.
  16. 16. Tema 4: Condicionamiento clásico: mecanismos1. ¿A que deben su eficacia los estímulos condicionados e incondicionados?Esta es quizá la pregunta más importante en relación al condicionamiento clásico.Actualmente está recabando cada vez más la atención de los investigadores. Respuestas iniciales a los estímulosPavlov hizo hincapié en los criterios de eficacia de los estímulos. El estímulocondicionado (EC) inicialmente no provoca la respuesta condicionada, pero adquierela capacidad de hacerlo como resultado del desarrollo de una asociación con elestimulo incondicionado (EI). El EI elicita eficazmente la respuesta en cuestión desdeel principio. La comparación del EC y el EI previa al condicionamiento siempre esrelativa. Un evento particular puede servir de EC respecto a un estímulo y de EIrespecto a otro. La novedad de los estímulos condicionados e incondicionadosEl efecto conductual de un estímulo depende de su novedad. Los estímulos familiaresno suscitan reacciones tan intensas como los estímulos novedosos (los estímulosfamiliares producen un aprendizaje más lento). El efecto de preexposición al EC oefecto de inhibición latente es debido a la exposición, previa al condicionamiento,del EC de forma repetida sin el EI. Esto da lugar a un retraso en el condicionamientoposterior. Este efecto es similar a la habituación. La habituación sirve para sesgar laconducta elicitada a favor de los estímulos novedosos, la inhibición latente sirve parasesgar el aprendizaje a favor de los estímulos novedosos. Según Lubow (1995) lainhibición latente promueve la selección de estímulos necesaria para un aprendizajerápido. Algo similar ocurre con el EI, dando lugar al efecto de preexposición al EI,que retrasa el condicionamiento.Según la explicación basada en la interferencia asociativa, las preexposiciones al ECo al EI disminuyen la capacidad de esos estímulos para participar en nuevasasociaciones. Según la explicación basada en la interferencia de memoria, larespuesta condicionada resulta alterada debido a que los participantes recuerdan losucedido en ambas fases del experimento (haber sido expuesto al EC o EI de formaaislada, y posteriormente al EC y al EI emparejados). En concordancia con estemecanismo, los procedimientos que reducen el recuerdo de la preexposición en elmomento de la prueba fortalecen la respuesta condicionada. Intensidad y saliencia del EC y del EILa mayor parte de los efectos biológicos y fisiológicos de la estimulación se relacionancon la intensidad del estímulo. La respuesta condicionada es más fuerte cuando seutilizan estímulos condicionados e incondicionados más intensos. La saliencia delestímulo se corresponde con la significación o la perceptibilidad del estímulo. Siaumenta la saliencia aumentará la velocidad de aprendizaje, según las teorías delaprendizaje. El aumento de la saliencia se puede lograr aumentando la intensidad delestímulo (despertando mayor atención), o haciéndolo más relevante en relación a lasnecesidades biológicas del organismo (mayor atención a la sal si se sufre déficit denutricional de sal).
  17. 17. Relevancia o pertinencia EC-EIOtra variable que afecta al ritmo de desarrollo del condicionamiento clásico es el gradoen que el EC es relevante o pertinente con respecto al EI. García y Koelling (1966)demostraron la importancia de la relevancia del estímulo con el siguiente experimento: Condicionamiento Prueba Gustativo + Gustativo Descarga Audiovisual Audiovisual Gustativo + Gustativo Malestar audiovisual Audiovisual (radiación)En el experimento se condicionaban dos EC a un EI diferente (descarga o malestar),posteriormente se midió la respuesta (supresión del lameteo) de cada EC de formaindividual, dando como resultado una mayor supresión del estímulo audiovisual para elcondicionamiento mediante descarga (asemeja el ataque de un depredador), y mayorsupresión del estímulo gustativo para el condicionamiento mediante malestar (asemejala aversión al sabor). El sabor se asoció fácilmente al malestar y las clavesaudiovisuales se asociaron al dolor periférico (combinación de EC y EI apropiados).El fenómeno de relevancia EC-EI parece reflejar una predisposición genética para laasociación selectiva de ciertas combinaciones de estímulos condicionados eincondicionados (no se requiere experiencia previa).En las palomas las claves visuales son relevantes para la conducta de alimentación(comida) y las claves auditivas son relevantes para la conducta defensiva (descarga),LoLordo 1982.La relevancia del estímulo también es importante en la adquisición del miedo. Losmonos Rheus adquieren el miedo por observación de sus congéneres ante serpientes(es menos probable la adquisición del miedo si en lugar de serpientes se presentanflores artificiales). Si el paradigma de aprendizaje implica comida, las flores y laserpiente son igual de efectivas. Como conclusión, parece que los monos tienen unapredisposición para aprender a temer a las serpientes. El concepto de fuerza biológicaPavlov sugirió que para que un estímulo se condicionara, debía tener una fuerzabiológica menor que la del estímulo incondicionado con el que se emparejaba. Fuerzabiológica se refiere a que el EC debía elicitar menos respuestas y más débiles que elEI. Condicionamiento de orden superiorEl criterio de fuerza biológica implica que un estímulo puede hacer de EI tras habersido fuertemente condicionado. El hecho de condicionar una respuesta con unestímulo (EC) usando otro estímulo (EI) que ha sido previamente condicionado, recibeel nombre de condicionamiento de orden superior. La siguiente figura resume elproceso.
  18. 18. EC1 EI EC2 EC1 RC RCEL primer emparejamiento se denomina condicionamiento de primer orden,mientras que el segundo es condicionamiento de segundo orden.Este procedimiento es similar a la inhibición condicionada (tema 2). ¿Por qué esteprocedimiento puede provocar inhibición condicionada en algunos casos, ycondicionamiento excitatorio de segundo orden en otros casos? El número de ensayosno EI es el factor crítico. Con pocos ensayos no reforzados tiene lugar elcondicionamiento excitatorio de segundo orden. Con un entrenamiento más extensose desarrolla inhibición condicionada.Un ejemplo de condicionamiento de orden superior en la experiencia humana estárelacionado con el dinero debido a la asociación con caramelos, juguetes, etc..El condicionamiento de segundo orden también resulta interesante como técnica paraconfirmar la aparición de condicionamiento de primer orden. ContracondicionamientoMuchos ejemplos de aprendizaje asociativo satisface el criterio de fuerza biológicadiferencial. Pero no todas las situaciones que permiten aprendizaje de asociacionesentre estímulos satisfacen este criterio. En el contracondicionamiento dos estímulospueden quedar asociados el uno con el otro aunque ambos eliciten respuestasintensas. La respuesta que un animal da a un EC se invierte o contrarrestaemparejando ese estímulo con un EI que provoca una reacción opuesta.En un estudio de condicionamiento (Pearce y Dickinson, 1975) se redujeron laspropiedades aversivas de una descarga emparejándola con comida. Como resultadolos animales mostraban menos supresión condicionada que los grupos de control(reducción de las propiedades aversivas de la descarga debido alcontracondicionamiento). Precondicionamiento sensorialCuando dos estímulos quedan asociados (por ejemplo dos sabores), si posteriormenteadquirimos aversión a uno de ellos es posible que adquiramos también aversión haciael otro sabor asociado al primero. Esto se denomina precondicionamiento sensorial.En el siguiente cuadro se resume: EC2 EC1 EC1 EI EC2 RC RCEste experimento se suele realizar con estímulos biológicamente débiles, que tan sóloelicitan una débil respuesta de orientación antes del condicionamiento.
  19. 19. 2. ¿Qué determina la naturaleza de la respuesta condicionada? El modelo del estímuloLa primera y más duradera explicación acerca de la naturaleza de la respuestacondicionada (RC) es el modelo de sustitución del estímulo. En este modelo seasume que el EC activa los circuitos neuronales que previamente activaba sólo el EI yelicita respuestas similares a las del EI. Pavlov sugirió que el condicionamiento dalugar al establecimiento de nuevos enlaces neuronales, y por tanto el EC se concierteen un sustituto del EI.Estímulos incondicionados diferentes elicitan respuestas condicionales diferentes(comida->salivación, descargas->aversión y alejamiento). La salivación no secondiciona con los experimentos de condicionamiento palpebral y las respuestas deparpadeo no se condicionan en los experimentos de condicionamiento salival. Elestimulo incondicionado es una factor determinante de la respuesta condicionada. Elfamoso experimento de Jenkins y Moore (1973) demuestra este fenómeno conpalomas. Las palomas tienen respuestas incondicionadas diferentes para beber quepara comer (difieren tanto en la velocidad del pico como en la forma de abrirlo).Cuando se las condicionó con comida o bebida mediante la iluminación de una tecla,la respuesta condicionada hacia la tecla fue la misma que la RI hacia el EI (cambiabala velocidad y la forma de actuar hacia la tecla según se las condicionara con bebida ocomida). Aprendizaje y homeostasis: Un caso especial de sustitución del estímuloWalter Cannon introdujo el concepto de homeostasis para referirse a los mecanismosfisiológicos que mantienen los aspectos críticos del cuerpo dentro de los límitesaceptables. Para lograr la homeostasis se requiere que cualquier amenaza al nivelhomeostático ponga en marcha una reacción compensatoria que neutralice laalteración (bucle de realimentación negativa).Este proceso puede resultar ineficiente siel proceso de corrección tarda en activarse. Dworkin (1993) señalo que lasalteraciones en la homeostasis pueden compensarse más efectivamente si puedenanticiparse, y el condicionamiento Pavloviano proporciona los medios necesarios paratal anticipación. De acuerdo con esta perspectiva, la respuesta condicionada a unaalteración fisiológica es igual que la respuesta compensatoria a dicha alteración. Portanto la respuesta condicionada es la misma que la respuesta incondicionada, sólo queesta vez la respuesta incondicionada es una reacción compensatoria a una alteraciónfisiológica.Las drogas suelen provocar alteraciones fisiológicas de la homeostasis que activanreacciones compensatorias condicionadas (respuestas homeostáticascondicionadas). Las claves que se asocian con la alteración fisiológica inducida por ladroga pueden llegar a elicitar estas reacciones compensatorias como respuestascondicionadas anticipatorias (la ansiedad por consumir droga es una manifestación deestas respuestas anticipatorias).Se considera que la administración de una droga constituye un ensayo decondicionamiento en el que las claves relacionadas con la administración de la drogase emparejan con los efectos farmacológicos de la misma (ej: el olor y sabor del cafépueden funcionar como estímulos condicionados que predicen los efectos fisiológicosde la cafeína). Estudios llevados a cabo con cocainómanos muestran que presentanmayor ansiedad y sensación de abstinencia con los estímulos relacionados con lacocaína, y poca ansiedad con los estímulos de la heroína (sin ser consumidores). Portanto, los resultados sugieren que los consumidores de cocaína adquieren respuestasemocionales y fisiológicas condicionadas a los estímulos relacionados con la cocaínaen el curso del consumo de cocaína.
  20. 20. El condicionamiento Pavloviano se ha estudiado extensamente en lo referente aldesarrollo de la tolerancia a las drogas. Se ha desarrollado tolerancia a la drogacuando las administraciones repetidas tienen un efecto cada vez menor, requiriéndosedosis mayores. En el modelo de condicionamiento de tolerancia a las drogas loscambios fisiológicos (debidos a las droga) constituyen el estimulo incondicionado (EI),que a su vez pone en marcha ajustes compensatorios incondicionados (RI) paracontrarrestar la alteración. Mediante el condicionamiento Pavloviano los estímulos queacompañan la administración de la droga (hora del día, preparación de la jeringuilla,lugar donde se prepara la droga) se asocian al EI. Las claves que acompañan laadministración de la droga elicitan respuestas compensatorias que previamente seactivaban como respuestas incondicionadas a las alteraciones homeostáticas, y portanto atenúan los efectos de la droga, dando lugar a la tolerancia a la droga.El modelo de condicionamiento de la tolerancia a las drogas atribuye la tolerancia a lasrespuestas compensatorias condicionadas a los estímulos del entorno (EC) que seemparejan con la administración de la droga. El modelo predice que la tolerancia a ladroga se verá atenuada si los sujetos reciben la droga en condiciones novedosas o enausencia de las claves que normalmente predicen su consumo, así como lapreexposición al EC (claves del contexto) también debería reducir el efecto de ladroga. Este modelo ha sido validado por muchos estudios de laboratorio.En este modelo el EC adquiere la capacidad de elicitar respuestas compensatorias.Las respuestas compensatorias condicionadas se desarrollaran sólo para aquellossistemas fisiológicos que están controlados de forma homeostática. El EC como determinante de la forma de la RCEl EI no es el único factor importante para determinar la forma de la respuestacondicionada, ya que esta también está influida por la naturaleza del EC. Timberlake yGrant (1995) sustituyeron al típico estímulo de luz o tono (EC), por el uso de una rataviva como EC, junto con un EI de tipo comida. Según el modelo de sustitución delestímulo, el EC (rata viva) producirá las mismas respuestas que el EI (comer y roer)debido a los emparejamientos EC-EI. Contrariamente el EC no produjo conductas deroer y morder, y elicitaba respuestas de aproximación, olfateo y conductas sociales.Estas respuestas no se desarrollaban si la rata EC no se emparejaba con comida o sepresentaba sin guardar relación alguna con la comida.El resultado de este no apoya ningún modelo que explique la forma de la respuestacondicionada en términos del estímulo incondicionado utilizado. La conducta de larata está condicionada por la naturaleza del EC. Conducta condicionada y sistemas de conductaHolland (1984) ha comentado que la comprensión de la conducta condicionadarequerirá un mayor conocimiento “de las funciones normales de los sistemas deconducta activados por diferentes EC, de la organización natural de dichos sistemasindependientes del aprendizaje y de su desarrollo ontogénico”. Los sistemas deconducta han evolucionado para permitir a los animales llevar a cabo tareas críticas,tales como obtener y comer alimentos, defender su territorio, evitar a losdepredadores, reproducir y cuidar de sus crías.La teoría de los sistemas de conducta asume que la presentación del EI en unprocedimiento de condicionamiento pavloviano activa el sistema de conducta relevantepara ese EI. Los estímulos incondicionados relacionados con la comida activan lossistemas de búsqueda de comida. Cuando un estímulo condicionado se asocia con elEI, se integra en su sistema conductual y adquiere la capacidad de elicitar respuestasque forman parte de dicho sistema.Una predicción provocadora de la teoría de sistemas de conducta es que la forma dela RC dependerá del intervalo EC-EI que se utilice. La razón es que el intervalo EC-EI
  21. 21. determina el lugar en el que se incorporará el EC dentro de la secuencia derespuestas del sistema de conducta. El EC no sustituye ni compensa al EI, en lugar deeso sustituye a un estímulo en un punto del sistema de conducta determinado por elintervalo EC-EI. Todo esto fue estudiado por Akins (2000) con codornices y su sistemade búsqueda focalizada y general.La teoría es claramente compatible con el hecho de que la forma de la respuestacondicionada está determinada por (1) la naturaleza del EI, ya que diferentesestímulos incondicionados activan diferentes sistemas de conducta, y (2) la naturalezadel estímulo condicionado. La naturaleza del EC determina como se incorpora el ECal sistema de conducta (hay estímulos más efectivos que otros para elicitarcomponentes del sistema de conducta). Aprendizaje E-R frente a aprendizaje E-EHistóricamente la conducta condicionada se veía como una respuesta elicitadadirectamente por el EC (aprendizaje E-R). Una visión más moderna considera que lossujetos aprenden una asociación estímulo-estímulo (aprendizaje E-E). Según estemodelo, lo sujetos responden al EC, no porque eliciten directamente la RC, sinoporque el EC activa una representación del EI. De esta forma, la conductacondicionada refleja el estado de la representación del EI activada por el EC.El método para decidir entre aprendizaje E-R y E-E es la técnica de la devaluacióndel EI. La siguiente figura muestra el proceso: Fase 1 Fase 2 Prueba EC EI EI EI EC EIGrupo DevaluaciónExperimental RC del EI RC EC EI EI sigue EC EI siendo EIGrupo deControl RC RCEn este experimento el EI se devalúa dándole un menor valor, como por ejemplo,considerando el EI la comida y dando un acceso menos restringido a la comida. Lasaciedad del alimento reduce el valor de la comida, y por tanto devalúa larepresentación del EI.En este experimento, en el grupo que se ha devaluado el EI (comida) da lugar amenos respuestas condicionadas que en el grupo de control.No todos los casos de condicionamiento clásico conllevan aprendizaje E-E. Estudiossobre condicionamiento de segundo orden proporcionan evidencia de aprendizaje E-R,pero algunos casos también conllevan aprendizaje E-E.
  22. 22. 3. ¿Cómo se asocian los estímulos condicionado e incondicionado? El efecto bloqueoEn el efecto bloqueo, un estimulo (A) previamente condicionado, es presentado juntocon un nuevo estímulo (B) y emparejado con el EI. En una prueba posterior con elestímulo B aislado, el grupo experimental produce una respuesta condicionada menorque el grupo de control (sin emparejamiento A y EI). EL hallazgo básico es que elcondicionamiento previo de A interfiere, o bloquea, el desarrollo de la respuestacondicionada al estímulo añadido B. Fase 1 Fase 2 Prueba Grupo exp. A EI [A+B] EI B Grupo control A/EI [A+B] EI BEl efecto de bloqueo muestra claramente que no es suficiente emparejar un EC y un EIpara que se desarrolle la respuesta condicionada. Kamin (descubridor del efecto debloqueo) explicó el fenómeno proponiendo que para que se produjera aprendizaje deforma efectiva, el EI debería ser sorprendente. Si el EI no es sorprendente, no alerta alanimal y no estimula el trabajo mental necesario para formar la asociación. Loseventos inesperados activan procesos que llevan a un nuevo aprendizaje. El modelo de Rescorla y WagnerLa idea de que la efectividad de un estímulo incondicionada está determinada por elgrado en que resulta sorprendente es la base de un modelo matemático formal delcondicionamiento clásico (modelo de Rescorla y Wagner). Por definición un eventoes sorprendente si es diferente de lo que se espera. Un EI puede ser inesperadamentegrande, o inesperadamente pequeño. Según el modelo, un EI inesperadamentegrande es la base del condicionamiento excitatorio (incremento de la fuerzaasociativa), y un EI inesperadamente pequeño es la base del condicionamientoinhibitorio (disminución de la fuerza asociativa). Una respuesta condicionada intensaindica una fuerte expectativa de que el EI aparecerá, mientras que si es débil indicauna baja expectativa del EI.En el modelo, el parámetro λ representa la asíntota de aprendizaje que permite el EIutilizado, y V representa el valor asociativo de los estímulos que preceden al EI. Lasorpresividad del EI será (λ-V), y la cantidad de aprendizaje en un ensayo esproporcional a (λ-V). La sorpresividad será alta al principio, dando lugar al aprendizajey a la fuerza asociativa, y posteriormente la sorpresividad será menor disminuyendo elaprendizaje adicional.El aprendizaje que se produce en un determinado ensayo de condicionamiento es elcambio (∆V) en el valor asociativo de un estímulo. El modelo finalmente es: ∆V=k (λ-V) k= saliencia del EC λ=asíntota de aprendizaje que permite el EI utilizado V=valor asociativo de los estímulos que preceden al EI (λ-V)= sorpresividad del EI (proporcional al aprendizaje)
  23. 23. Aplicación al efecto de bloqueoEl modelo de Rescorla y Wagner predicen el efecto de bloqueo. En la primera fase delexperimento de bloqueo, VA es igual a la asíntota de aprendizaje o λ (VA= λ). Deacuerdo con el modelo de Rescorla –Wagner no habrá condicionamiento con elestímulo B en la fase 2 ya que el IE es perfectamente predecible por la presencia delestímulo A: (λ- VA+B)=0.En el grupo de control la presentación del estimulo A no lleva una expectativa del EI.Por tanto, en la fase 2 el EI es sorprendente para el grupo de control y produce nuevoaprendizaje. Pérdida de valor asociativo a pesar de los emparejamientos con el EIUna predicción del modelo Rescorla-Wagner es que los estímulos perderán valorasociativo si se presentan juntos en un ensayo de condicionamiento después de habersido entrenados por separado. El experimento para confirma esto es el siguiente: A EI [A+B] EI B EIPosteriormente a la fase 1, VA = VB = λ. En la fase 2 A y B se presentansimultáneamente por vez primera y este estímulo compuesto va seguido por el mismoEI (una bolita de comida). El modelo de Rescorla-Wagner predice que las propiedadescondicionadas de cada uno de los estímulos individuales. A y B, deberían reducirsedurante la fase 2.Durante la fase inicial VA+B = VA +VB = 2λ, esto es una expectativa excesiva ya que elel EI sigue siendo una bolita de comida (discrepancia entre lo que se espera, dosbolita, y lo que se obtiene, una bolita). Los participantes encuentran que el EI essorprendentemente pequeño. Para reducir la expectativa del EI a lo que ocurre en lafase 2, los participantes deben reducir la expectativa del EI basada en los estímulos Ay B. La pérdida de valor asociativo continuará hasta que la suma de expectativasbasadas en A y B sea igual a una bolita de comida. Inhibición condicionadaLa aplicación del modelo de Rescorla-Wagner a este procedimiento requiere que seconsideren separadamente los ensayos reforzados ([EC+] > EI) y los no reforzados([EC+ y EC- ] > no EI]). El condicionamiento excitatorio conlleva la adquisición de unvalor asociativo positivo, y cesa una vez que el organismo predice el EI perfectamenteen cada ensayo reforzado. Como el EI no ocurre en los ensayos no reforzados,supone una expectativa excesiva. Para predecir con exactitud la ausencia del EI en losensayos no reforzados, los valores asociativos del EC+ y EC- tienen que sumar cero(haciendo que el valor asociativo del EC- sea negativo).El modelo de Rescorla-Wagner explica la inhibición condicionada asumiendo que elEC- adquiere un valor asociativo negativo. Extinción de la excitación y de la inhibiciónEn el procedimiento de extinción, el EC se presenta repetidamente sin el EI. Si un Echa adquirido propiedades excitatorias, habrá un exceso de expectativa del EI la
  24. 24. primera vez que se presente el EC sin el EI en la fase de extinción. Al continuar losensayos la expectativa elicitada por el EC se va acercando a la línea que representa laausencia del EI por medio de una reducción gradual del valor asociativo del EC+ hastallegar a cero.De forma similar ocurre con el EC-, que finalmente reduce su valor asociativo negativopara terminar con una fuerza asociativa negativa. Problemas del modelo de Rescorla y WagnerUno de los primeros problemas del modelo es que su análisis de la extinción de lainhibición condicionada es erróneo. El modelo predice que la presentación repetida deun inhibidor condicionado EC- sin el EI debería dar lugar a una pérdida de la inhibicióncondicionada, pero esto no sucede. Algunos investigadores han encontrado que noreforzar un EC- de forma repetida puede potenciar sus propiedades inhibitorias (nopresentando el EC-). Un procedimiento de extinción consiste en extinguir laspropiedades excitatorias del EC+ junto con el que se presentaba el EC- durante elentrenamiento inhibitorio.Otro problema es considerar la extinción como lo opuesto a la excitación, o la vuelta aun valor asociativo cero. Sin embargo esto no debería verse así, sino como una nuevarelación entre el EC y el EI.El hecho de que un EC pueda tener tanto propiedades excitatorias como inhibitoriashace difícil incorporarlo al modelo de Rescorla-Wagner (un único valor).El modelo también tiene dificultades para explicar el efecto de aumento ocontrabloqueo que se produce en los paradigmas de aversión al sabor y al olor. Enestos casos un experimento similar al diseño de bloqueo da lugar a un incremento delcondicionamiento del EC añadido. Otros modelos de condicionamiento clásicoNinguna de las teorías actuales ha logrado explicar todos los fenómenos delaprendizaje de forma satisfactoria. A continuación se presentan algunas de las teoríasque complementan el modelo de Rescorla-Wagner, otras son incompatibles ydesplazan el debate teórico en otras direcciones. Modelos atencionales del condicionamientoEl supuesto general es que para que el condicionamiento tenga lugar los sujetosdeben prestar atención al EC. Se espera que los procedimientos que afectan a latención al EC afecten también al aprendizaje.Las teorías atencionales difieren en sus supuestos sobre que es lo que determina lasaliencia o perceptibilidad del EC en un ensayo. Pearce y Hall (1980) asumen que elgrado de atención que un animal presta a un EC en un ensayo determinado dependedel grado en el que el EI haya sido sorprendente en el ensayo anterior. Este modeloasume que un EI esperado reduce la saliencia o la atención dedicada al EC. Estosmodelos asumen que la sorpresividad del EI tiene sólo un efecto prospectivo oproactivo sobre la atención y el condicionamiento. La principal diferencia con el modelode Rescorla-Wagner es que en este la sorpresividad del EI en un ensayo en concretodetermina lo que se aprende en ese mismo ensayo.Según los modelos atencionales, el bloqueo tiene lugar porque la falta desorpresividad del EI en el primer ensayo de la fase 2 reduce la atención prestada enlos siguientes ensayos al EC añadido. Sin embargo este modelo no puede explicar elbloqueo que tiene lugar en el primer ensayo de la fase 2 del experimento de bloqueo.
  25. 25. Factores temporales y respuesta condicionadaNi el modelo de Rescorla-Wagner ni los modelos de modificación del EC fuerondiseñados para explicar los efectos del tiempo sobre el condicionamiento (ejemplo,intervalo EC-EI). La respuesta condicionada es inversamente proporcional al intervaloEC-EI. Sin embargo esto depende de las respuestas ligadas al EI. En el caso debúsqueda general, el nivel de respuesta es mayor con procedimientos que conllevanintervalos EC-EI mayores.En general se observa una mayor respuesta condicionada cuando se utilizanprocedimientos en los que los ensayos están más separados entre si. Pero también elintervalo entre ensayos y la duración del EC interactúan a la hora de determinar larespuesta, siendo el factor crítico la duración relativa de estas dos variablestemporales, más que su valor absoluto. Los experimentos demuestran que larespuesta condicionada es directamente proporcional al intervalo entre ensayos (IEE)dividido entre la duración de los ensayos (DE). Una posible explicación es la hipótesisdel tiempo de espera relativo o teoría de la expectativa escalar. Esta hipótesis sebasa en que el EC proporciona información acerca de la aparición del EI sólo si elsujeto tiene que pasar menos tiempo esperando al EI tras la presentación al EC quecuando está simplemente expuesto al contexto experimental. Cuando la razón IEE/DEes baja, el tiempo de espera ante el EC es similar al tiempo de espera en el contexto(el EC proporciona poca información de la aparición del EI-> poca respuestacondicionada). Si el razón IEE/DE es alta, el tiempo de espera ante el EC es muchomenor que el tiempo de espera en el contexto (EC aporta información de la aparicióndel EI-> fuerte respuesta condicionada).Estas ideas se han desarrollado más extensamente en la teoría de la expectativa detasa. En la actualidad se acepta ampliamente que los organismo perciben y recuerdanlos aspectos temporales de un procedimiento de condicionamiento (tales como IEE yDE) y que la respuesta condicionada depende de los procesos de decisión en lo quese comparan estas variables temporales. La hipótesis del comparadorUna importante contribución de las teorías del tiempo de espera relativo es quedestacan que la respuesta condicionada depende no sólo de lo que sucede durante elEC, sino también de lo que sucede en la situación experimental en general. Lahipótesis del comparador tiene en cuenta estos dos factores.La hipótesis del comparador se parece a la hipótesis del tiempo de espera relativo enque asume que la respuesta condicionada depende no sólo de la asociación EC y elEI, sino también de todas las posibles asociaciones que puedan establecerse entre lasclaves contextuales y el EI. Una restricción de esta hipótesis es que sólo permite laformación de asociaciones excitatorias con el EI. Una respuesta condicionada querefleje excitación o inhibición dependerá de la fuerza relativa de la excitacióncondicionada al EC en comparación con la excitación condicionada de las clavescontextuales presentes durante el entrenamiento del EC.A diferencia de la hipótesis del tiempo de espera relativo, la hipótesis del comparadorhace más hincapié en las asociaciones que en el tiempo. Los organismos aprenderántres asociaciones en el curso del condicionamiento:  1) EC crítico con EI  2) EC crítico con las claves contextuales de comparación => representación del estímulo comparador  3) Estímulos de comparación y EI
  26. 26. Asociación crítica EC-EI Presentación Representación del EC directa del EI crítico 1 Asociación entre el EC Comparación Respuesta al crítico y el estimulo 2 EC comparador 3 Representación del Representación estímulo indirecta del EI comparador Asociación estímulo comparador--EILa comparación de las actividades directa e indirecta del EI determina el grado de larespuesta excitatoria o inhibitoria que tendrá lugar.Este modelo no indica como se establecen las asociaciones, sino como lasasociaciones EC-EI y contexto-EI determinan la respuesta al EC crítico (teoría deejecución, no teoría de aprendizaje).La hipótesis del comparado predice (está confirmado) que la extinción de la asociacióncontexto-EI después del entrenamiento del EC potenciará la respuesta al EC crítico.Sin embargo esto no puede ser explicado por las teorías de modificación del EI y lasteorías atencionales.El modelo atribuye la inhibición condicionada a situaciones en las que la asociación delEC crítico con el EI es más débil que la asociación de las claves contextuales con el EI(las claves contextuales son estímulos que proporcionan el contexto excitatorionecesario para el condicionamiento inhibitorio). Esta hipótesis es la única que prediceque la extinción de estos estímulos condicionados excitatorios tras el condicionamientoinhibitorio reduciría la respuesta inhibitoria. Es decir, la extinción de la inhibicióncondicionada se logra de forma óptima, no presentando el EC- aislado, sinoextinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatoriopara el condicionamiento inhibitorio del EC-.Al incrementar el valor excitatorio de las claves contextuales se puede debilitar laasociación entre el estímulo crítico y el comparador. Este modelo también predice quela extinción del estímulo bloqueador tras el entrenamiento elevará la respuestacondicionada al EC bloqueado.Esta hipótesis considera el bloqueo como un fallo en la ejecución en lugar de un falloen el aprendizaje.
  27. 27. Tema 5: Condicionamiento instrumental: fundamentosEn este capítulo se presenta el análisis del condicionamiento instrumental y laconducta dirigida a una meta. En este tipo de condicionamiento, las presentaciones delos estímulos dependen de la ocurrencia previa de respuestas específicas. Laconducta que sucede debido a que ha servido previamente como instrumento paraproducir ciertas consecuencias se denomina conducta instrumental.1. Primeras investigaciones sobre el condicionamiento instrumentalLos análisis teóricos y de laboratorio del condicionamiento instrumental comenzaronformalmente con Thorndike. Para ello uso las “cajas problema” en las cuales un gatotenía que salir para conseguir la comida. Thorndike interpreto los resultados de susestudios como el reflejo del aprendizaje de una asociación E-R. Cuando un gato sesituaba inicialmente en una caja, desplegaba una variedad de respuestas típicas deuna animal confinado. Algunas respuestas daban como resultado la apertura de la cajay Thorndike creía que estos escapes con éxito conducían al aprendizaje de unaasociación entre los estímulos del interior de la caja problema y la respuesta deescape. La consecuencia de la respuesta exitosa -escapar de la caja- fortalecía laasociación entre los estímulos de la caja y la respuesta.En base a esto, Thorndike formuló la ley del efecto. Esta ley establece que si unarespuesta en presencia de un estímulo es seguida por un suceso satisfactorio, laasociación entre el estímulo (E) y la respuesta (R) se fortalece. Si la respuesta esseguida por un suceso molesto, la asociación E-R se debilita. La consecuencia de larespuesta no es un elemento que forme parte de la asociación, sólo sirve parafortalecer o debilitar la asociación.La ley del efecto de Thorndike implica un aprendizaje E-R.2. Aproximaciones modernas al estudio del condicionamiento instrumental Procedimientos de ensayo discretoLos procedimientos de ensayo discreto son similares al método de Thorndike, en elque cada ensayo del entrenamiento acaba con la retirada del animal del aparato, y alrespuesta instrumental se realiza sólo una vez durante cada ensayo. Este tipo deensayos son realizados principalmente con laberintos para ratas, existiendo dos tipos;el corredor (pasadizo recto), y el laberinto en T (una T que implica una decisión decamino a tomar). Se coloca a la rata en la caja de salida al comienzo y se permite a larata caminar a lo largo del corredor hasta alcanzar la caja meta que contiene unreforzador (comida o agua). La conducta en el laberinto puede cuantificarse midiendola velocidad de la carrera (normalmente aumenta con ensayos de entrenamientorepetidos). Otra medida común es la latencia, el tiempo que tarda el animal enabandonar la caja de salida y empezar a desplazarse por el pasadizo. Las latencias sehacen más cortas según progresa el entrenamiento. Procedimientos de operante libreEn el caso anterior el animal tiene limitadas oportunidades de responder, y estánprogramadas por el experimentador. En los procedimientos de operante libre sepermite al animal que repita la respuesta instrumental una y otra vez sin restricciones.
  28. 28. Skinner propuso el concepto de operante como la forma de dividir la conducta enunidades medibles con significado. Una respuesta operante, como presionar unapalanca, se define a partir del efecto que produce en el ambiente. Las actividades queprovocan el mismo efecto ambiental se consideran ejemplos de la misma respuestaoperante. El elemento fundamental no son los músculos involucrados en la conducta,sino la forma en la que la conducta “opera” en el ambiente. Se asume que las diversasformas de presionar la palanca son funcionalmente equivalentes porque todas tienenel mismo efecto en el medio. Entrenamiento y moldeamiento al comederoLa mayoría de las ratas situadas en una caja de Skinner no presionan la palanca confrecuencia (se necesitan unos pasos preliminares). Primero tienen que aprendercuando está disponible la comida en el comedero mediante condicionamiento clásico(sonido dispensador-bolita de comida). El sonido elicita una respuesta seguimiento delsigno (aproximación al comedero). Esta fase se denomina entrenamiento alcomedero.Posteriormente el animal está preparado para aprender la respuesta instrumental.Para facilitar la adquisición de una nueva respuesta operante, los experimentadoresinicialmente entregan comida si el animal hace algo remotamente relacionada con larespuesta deseada. Posteriormente se restringe el rango de respuesta asociadas conbolita de comida, hasta finalmente conseguir la respuesta deseada (ej. inicialmente seda comida si la rata se pone sobre dos patas, posteriormente se da comida sólo si lohace sobre la palanca, y finalmente sólo si presiona la palanca). Esta secuencia depasos se denomina moldeamiento. El moldeamiento incluye dos tácticascomplementarias: reforzamiento de aproximaciones sucesivas a la respuestarequerida, y no reforzamiento de las formas de respuesta más tempranas.La forma en que el organismo cumple la operación requerida en el ambiente noimporta. Sin embargo, los pasos utilizados en el moldeamiento de la conducta afectana la forma de realizar la respuesta, Moldeamiento y nueva conductaLos procedimiento de moldeamiento sin utilizados a menudo para generar una nuevaconducta; pero ¿hasta que punto son nuevas esas respuestas? Al enseñar a la rata apresionar la barra, el investigador no le está enseñando nuevos componentes derespuestas; le está inculcando como combinar respuesta familiares en una nuevaactividad. El condicionamiento instrumental incluye a menudo la construcción de unanueva unidad conductual a partir de componentes de respuesta preexistentes que yase encuentran en el repertorio del sujeto. El condicionamiento instrumental puedetambién utilizarse para producir respuestas que no se parecen en nada a lo que elindividuo es probable que haga sin entrenamiento.En experimentos con palomas que picoteaban una tecla (con una apertura de picodiferente según el ensayo), se comprobó que se podía enseñar a las palomas apicotear la tecla con aperturas cada vez mayores premiándolas según se ibaincrementando la apertura. Esta variabilidad de las respuestas ayuda a asegurar queal menos algunas de las respuestas que suceden lo hagan en la dirección en la que sequiere moldear la conducta. Por tanto, el moldeamiento aprovecha la variabilidadinherente de la conducta. Sin esta variabilidad, los procedimientos de moldeamientono tendrían éxito.El moldeamiento puede producir nuevas formas de respuesta, nunca antes realizadaspor el organismo.
  29. 29. La tasa de respuesta como medida de la conducta operanteLos métodos de operante libre permiten al organismo determinar la frecuencia de surespuesta instrumental. Las técnicas de operante libre proporcionan una ocasiónespecial para observar los cambios en la probabilidad de la conducta a lo largo deltiempo. Skinner propuso que la tasa de ocurrencia de una conducta operante(frecuencia de la respuesta por minuto) se utilizase como una medida de laprobabilidad de la respuesta. (las medidas de latencia y velocidad en los ensayosdiscretos no permiten que se repita la respuesta).3. Procedimientos de condicionamiento instrumentalEn todas las situaciones de condicionamiento instrumental, el sujeto realiza unarespuesta y por tanto produce una consecuencia. Una consecuencia placentera sedenomina estímulo apetitivo, y una consecuencia molesta se denomina estímuloaversivo. La respuesta instrumental puede proporcionar un estímulo dando lugar auna contingencia positiva entre la respuesta y su estímulo consecuente. Larespuesta instrumental puede retirar o eliminar un estímulo dando lugar a unacontingencia negativa. Que el resultado de un procedimiento de condicionamientosea un aumento o una disminución en la tasa de respuesta depende tanto de lacontingencia respuesta-consecuencia como de la naturaleza de la consecuencia. Contingencia Procedimiento Resultado respuesta-consecuencia Positivo Reforzamiento Reforzamiento positivo (estímulo apetitivo) (incremento de respuesta) Negativo Reforzamiento Reforzamiento negativo (estímulo aversivo) (incremento de respuesta) Positivo Supresión Castigo (positivo) (estímulo aversivo) (disminución de respuesta)Entrenamiento de omisión Negativo Supresión (RDO) (estímulo apetitivo) (disminución de respuesta) Reforzamiento positivoEl reforzamiento positivo es un procedimiento en que la respuesta instrumentalaproxima o produce un estímulo apetitivo. Si se da la respuesta, el estímulo apetitivose presenta, si no se da la respuesta, el estímulo apetitivo no se presenta(contingencia positiva). El reforzamiento positivo produce un incremento en la tasa derespuesta. CastigoEn un procedimiento de castigo, la respuesta instrumental produce o aproxima unestímulo molesto o aversivo (contingencia positiva). Los procedimientos de castigoproducen una disminución en la respuesta instrumental. Reforzamiento negativoUn procedimiento en el que la respuesta instrumental finaliza o previene la entrega deun estímulo aversivo se denomina reforzamiento negativo.Hay dos tipos de procedimientos de reforzamiento negativo; escape y evitación. En el
  30. 30. escape, el estímulo aversivo se presenta pero puede ser eliminado por la respuestainstrumental (ej. apagar una radio que un hace ruido molesto, presionar una barra paraapagar un ruido). La respuesta instrumental entonces es reforzada por la terminacióndel estímulo aversivo.La evitación implica la programación de un estímulo aversivo para ser presentado enalgún momento futuro. En este caso la respuesta instrumental previene la entrega delestímulo aversivo.(ej. programar que una rata reciba una descarga al finalizar unestímulo de aviso, si la rata realiza la respuesta instrumental durante el estímulo deaviso, no se dispensará la descarga).Es importante diferenciar el castigo del reforzamiento negativo. La respuestainstrumental disminuye por el castigo y aumenta por el reforzamiento negativo. Sepuede ver el reforzamiento negativo como una tortura. Entrenamiento de omisiónEn el entrenamiento de omisión la respuesta instrumental previene la presentación deun estímulo apetitivo o placentero (contingencia negativa). Se está utilizandoentrenamiento de omisión cuando se le dice a un niño que se vaya a su habitacióndespués de haber hecho algo malo (se le suprime los juguetes o la tele-> contingencianegativa). Es preferido al castigo ya que no implica el uso de un estímulo aversivo.Los procedimientos de entrenamiento de omisión se denominan en ocasionesreforzamiento diferencial de otras conductas o RDO. El individuo recibe unestímulo apetitivo periódicamente a condición de que se dedique a realiza otraconducta diferente de la respuesta especificada por el procedimiento. Por tanto, elreforzamiento de omisión implica el reforzamiento de “otras” conductas.4. Elementos fundamentales del condicionamiento instrumentalEl condicionamiento instrumental consta de tres elementos claves: una respuesta, unaconsecuencia (el reforzador) y una relación, o contingencia, entre la respuesta y laconsecuencia. La respuesta instrumentalEl resultado de los procedimientos de condicionamiento instrumental depende en partede la naturaleza de la respuesta que se esté condicionando. Algunas respuestas sonmás fácilmente modificables que otras. En esta sección se analizan los resultados delos procedimientos de reforzamiento positivo. Variabilidad conductual versus estereotipiaTanto Thorndike como Skinner enfatizaron que el reforzamiento incrementa laprobabilidad de que la respuesta instrumental se repita en el futuro, dando lugar a lacreencia de que los procedimientos de condicionamiento instrumental producíanrepeticiones de la misma respuesta (uniformidad o estereotipia en la conducta). Sinembargo el condicionamiento instrumental puede también verse involucrado en laproducción de respuestas creativas o variables.Los organismos pueden aprender a obtener reforzamiento en una situación donde serequiere hacer algo nuevo, algo distinto de lo que hicieron en los cuatro o cincoensayos precedentes. La variabilidad de la respuesta puede ser la base para elreforzamiento instrumental.
  31. 31. Estudios con palomas donde la respuesta es la secuencia de picoteo de dos teclas(izquierda y derecha) muestran que la variabilidad de la respuesta puede mantenersee incrementarse por reforzamiento. La variabilidad de la respuesta puede establecersecomo una operante. Los resultados también muestran que en ausencia dereforzamiento explicito de la variabilidad, la respuesta llega a ser más estereotipadacon un condicionamiento instrumental continuado. Por tanto, el resultado típico delreforzamiento instrumental es una disminución en la variabilidad de la respuesta.Los procedimientos de reforzamiento se han convertido en comunes en los contextoseducativos como forma de animar a los estudiantes a leer y realizar sus tareas. Unmetaanálisis de 100 estudios indicó que hay poca evidencia para apoyar el argumentode que el reforzamiento elimina la motivación intrínseca o la ejecución. La únicacircunstancia en la que el reforzamiento socavaba consistentemente la ejecución erasu la recompensa se entregaba independientemente de la conducta. El reforzamientopuede incrementar o disminuir la originalidad dependiendo del criterio de reforzamiento(si se refuerza la originalidad, la originalidad aumenta). Relevancia o pertinencia en el condicionamiento instrumentalEl condicionamiento instrumental puede actuar sobre componentes manifiestos de larespuesta o sobre dimensiones abstractas de la conducta (como la variabilidad). ¿Haylímites en los tipos de nuevas unidades conductuales o dimensiones de la respuestaque pueden ser modificados por condicionamiento instrumental? Las evidenciasdemuestran que hay importantes limitaciones.Thorndike fue el primero en observar diferencias en la facilidad de condicionamientode varias respuestas. Thorndike intento condicionar el rascado y el bostezo, sinembargo la forma de las respuestas cambio a medida que el condicionamientoprogresaba. Al principio el gato se rascaba vigorosamente para salir de la caja, pero enensayos posteriores simplemente ponía la pata en su cuerpo, pero no realizaba unaverdadera respuesta de rascado. Algo similar ocurrió con el bostezo, el gato sólo abríala boca, pero no bostezaba para salir de la caja. Thorndike propuso el concepto depertenencia para explicar los fallos en el entrenamiento del rascado y bostezo. Lasrespuestas manipulatorias están relacionadas de forma natural con escapar delconfinamiento, sin embargo bostezas y rascar no ayudan normalmente a los animalesa escapar del confinamiento por lo que no se corresponde con escapar de una cajaproblema. Algo similar se ha observado en peces donde existe una relación depertenencia entre morder y la presentación consecuente de otro macho, pero no tienerelación con la presentación de una hembra, lo que típicamente elicita cortejo en lugarde agresión.Otros experimentos similares muestran que los animales en lugar de realizar larespuesta deseada, realizan otras que se encuentran en su repertorio de respuestasnaturales (en lugar de meter una moneda en una hucha, se dedican a frotarla). Esto seconoce como deriva instintiva. Sistemas de conducta y limitaciones en el condicionamiento instrumentalLas limitaciones de respuesta en el condicionamiento instrumental que se han descritoson consecuentes con la teoría de los sistemas de conducta en relación con lanaturaleza de la respuesta condicionada. De acuerdo a esta teoría cuando un animalestá privado de comida y se encuentra en una situación donde podría encontrarla, susistema de alimentación se activa y se dedica a actividades relacionadas con lacomida. La efectividad del procedimiento para el incremento de una respuestainstrumental dependerá de la compatibilidad de esa respuesta con la organizaciónpreexistente del sistema de alimentación.

×