Conducta Instrumental: Definición y Esencia
Comportamiento que se produce por haber sido previamente instrumental en la generación de ciertas consecuencias. Su esencia radica en que es controlada por sus consecuencias.
Manipulación Experimental
Método de investigación utilizado en el estudio del condicionamiento instrumental.
Pioneros del Condicionamiento Instrumental: Edward Thorndike
Los estudios de laboratorio y teóricos sobre el condicionamiento instrumental fueron iniciados por Edward Thorndike. Él estudió la inteligencia animal, por ejemplo, colocando a un gato hambriento en una caja problema con comida afuera. La tarea del animal era aprender a salir de la caja para obtener el alimento. Este proceso implicaba el aprendizaje de una asociación entre los estímulos presentes en la caja problema y la respuesta de escape.
Contribuciones de Thorndike: La Ley del Efecto
Thorndike también investigó la conducta instrumental en pollos y aplicó los principios de aprendizaje por ensayo y error, descubiertos en animales, a niños. Además, mostró interés en la evaluación psicológica. Su contribución más destacada es la Ley del Efecto:
- Si una respuesta en presencia de un estímulo es seguida por un acontecimiento satisfactorio, la asociación entre el estímulo (E) y la respuesta (R) se fortalece.
- Si a la respuesta le sigue un acontecimiento molesto, la asociación E-R se debilita.
Esta ley implica un aprendizaje de tipo Estímulo-Respuesta (E-R).
Procedimientos de Investigación en Condicionamiento Instrumental
Procedimiento de Ensayo Directo
En este procedimiento, cada ensayo de entrenamiento finaliza con el retiro del animal del aparato, y la respuesta instrumental se ejecuta solo una vez en cada intento.
Uso de Laberintos
Los laberintos fueron introducidos por W.S. Small. El Laberinto en T, por ejemplo, consiste en una caja de inicio y corredores dispuestos en forma de T, con una caja meta localizada a cada lado de los brazos de la T. Este diseño se utiliza para el estudio de la conducta de elección y para medir preferencias.
Medidas de Respuesta en Laberintos
- Velocidad de Carrera: Mide la rapidez con la que el animal se desplaza desde la caja de inicio hasta la meta. Esta velocidad aumenta con ensayos de entrenamiento repetidos.
- Latencia de Respuesta: Mide el tiempo que tarda el animal en abandonar la caja de inicio y comenzar a desplazarse por el corredor. La latencia se vuelve más corta a medida que progresa el entrenamiento.
Procedimiento de Operante Libre
Este procedimiento permite que el animal repita la respuesta instrumental libremente, una y otra vez. El organismo, y no el experimentador, es quien determina la frecuencia de su respuesta instrumental. Esto posibilita una observación continua del comportamiento durante largos períodos. B.F. Skinner fue pionero en el estudio de la conducta de forma más continua, observando cómo una actividad lleva a la otra.
Skinner creó el Registrador Acumulativo, un dispositivo que proporciona un registro de datos continuo de la conducta, indicando cuándo y con qué frecuencia responde el animal durante una sesión.
La Respuesta Operante se define por el efecto que produce en el entorno, no por los músculos asociados a la conducta, sino por la manera en que esta opera en el medio.
Técnicas Fundamentales en Condicionamiento Instrumental
Entrenamiento de Comedero
Esta es una etapa preliminar del condicionamiento instrumental en la que se asocia de manera repetida un estímulo con el reforzador. Su objetivo es que el participante aprenda a ir y obtener el reforzador cuando este se presenta. Por ejemplo, el sonido del mecanismo de entrega de alimento puede asociarse repetidamente con el alimento, de modo que el animal aprenda a dirigirse al plato de alimento cuando se produce dicho sonido.
Moldeamiento (Shaping)
El moldeamiento es una secuencia de pasos de entrenamiento que implica reforzar aproximaciones sucesivas a la respuesta requerida, dejando de reforzar las formas anteriores de respuesta. Esta técnica también se utiliza para entrenar nuevas características, como mejorar la velocidad al nadar en el deporte. Aprovecha la variabilidad inherente de la conducta y puede generar nuevas formas de respuesta.
Un ejemplo clásico es el trabajo de Deich, Allan y Zeigler, quienes moldearon la respuesta de abrir el pico en palomas que picoteaban para obtener reforzamiento alimentario.
Tipos de Condicionamiento Instrumental
En el condicionamiento instrumental, una respuesta se relaciona con un suceso ambiental, el cual puede ser agradable (estímulo apetitivo) o desagradable (estímulo aversivo).
1. Reforzamiento Positivo
La respuesta instrumental activa produce un estímulo apetitivo. Si la respuesta ocurre, se presenta dicho estímulo; si no ocurre, no se presenta. Por ejemplo: Un padre da un dulce a su hijo cuando guarda sus juguetes. Este procedimiento implica una contingencia positiva entre la conducta y el reforzador.
Definición de Reforzamiento: Fortalecimiento o incremento en la tasa de respuesta.
2. Castigo
La respuesta instrumental produce o activa un estímulo desagradable o aversivo. Si el individuo ejecuta la respuesta instrumental, recibe el estímulo aversivo; si no lo hace, no se presenta el estímulo. Por ejemplo: Un padre puede reprender a su hijo por jugar en la calle. El castigo disminuye la probabilidad futura de la respuesta instrumental (procedimientos punitivos). Cuando existe una contingencia positiva (relación entre respuesta instrumental y estímulo aversivo), se denomina castigo positivo.
3. Reforzamiento Negativo
Este es un procedimiento de condicionamiento instrumental en el que existe una contingencia negativa entre la respuesta instrumental y un estímulo aversivo. Si se ejecuta la respuesta instrumental, se termina o se evita la ocurrencia del estímulo aversivo; si no se ejecuta, se presenta dicho estímulo. Existen dos clases principales:
- Escape: El estímulo aversivo se presenta, pero la respuesta instrumental puede terminarlo.
- Evitación: La respuesta operante previene la entrega de un estímulo aversivo.
4. Entrenamiento por Omisión
Procedimiento de condicionamiento instrumental en el que la respuesta instrumental impide la entrega de un estímulo reforzador (agradable o apetitivo). Por lo tanto, el estímulo apetitivo solo se entrega si el individuo no emite la respuesta instrumental. Ejemplos: A un niño se le envía a su habitación cuando se porta mal, retirando así fuentes de reforzamiento positivo como jugar con amigos. Otro ejemplo es la suspensión de la licencia de conducir por manejar en estado de ebriedad. También se le conoce como Reforzamiento Diferencial de Otras Conductas (RDO).
Elementos Fundamentales del Condicionamiento Instrumental
1. La Respuesta Instrumental
El resultado de los procedimientos del condicionamiento instrumental depende de la naturaleza de la respuesta que se condiciona. Esto puede implicar el reforzamiento de una respuesta ya existente o la creación de nuevas unidades de respuesta. Por ejemplo, la presión de una palanca por parte de una rata puede realizarse de diversas formas; las ratas no son inexpertas en los movimientos básicos. Lo que la rata aprende es a reunir diversos componentes de la conducta de presión de palanca en una respuesta coordinada y efectiva, lo que constituye la creación de una nueva unidad de respuesta formada por componentes de respuesta familiares.
Mientras Thorndike consideraba la conducta instrumental como la impresión de una asociación E-R, Skinner la veía como una conducta que se refuerza o fortalece. Ambos autores coinciden en que el reforzamiento aumenta la probabilidad de que la respuesta se repita en el futuro. La variabilidad de la respuesta puede ser la base del reforzamiento instrumental; esta variabilidad puede mantenerse y aumentarse mediante el reforzamiento, estableciéndose así como una operante. En ausencia de variabilidad, las respuestas tienden a volverse estereotipadas.
Pertenencia (Thorndike)
Según Thorndike, la historia evolutiva de un organismo hace que ciertas respuestas sean más adecuadas o «pertenezcan» a ciertos reforzadores. Estas respuestas, de forma natural, «pertenecen al» reforzador, lo que facilita el aprendizaje.
Limitaciones: Arrastre Instintivo (Breland y Breland)
Breland y Breland identificaron limitaciones en el condicionamiento instrumental, destacando el concepto de Arrastre Instintivo: una desviación gradual de la conducta instrumental que se aleja de las respuestas requeridas para obtener reforzamiento, en favor de respuestas características de la especie o instintivas relacionadas con el reforzador y otros estímulos en la situación experimental. Estos fenómenos deben considerarse en el análisis del comportamiento.
Shettleworth observó que la privación de alimento disminuye la probabilidad de respuestas de autocuidado (como lavarse la cara o rascarse), pero aumenta la de actividades dirigidas al medio (como excavar, arañar una pared, escarbar o pararse en las patas traseras).
2. El Resultado (El Reforzador Instrumental)
Una modificación en la cantidad del reforzador puede hacerlo cualitativamente distinto. Los aumentos en la calidad y cantidad del reforzador producen tasas más elevadas de respuestas. Por ejemplo, las ratas corren más rápido por reforzadores más grandes y agradables al paladar. La respuesta a una recompensa está influenciada por experiencias previas contrastantes. Crespi fue el primero en describir los efectos de las modificaciones en la cantidad de recompensa.
Efectos de Contraste Conductual
- Contraste Conductual Positivo: Aumento en las respuestas ante un reforzador favorable después de una experiencia previa con un reforzador menos deseado, en comparación con la ausencia de tal experiencia anterior.
- Contraste Conductual Negativo: Menor cantidad de respuestas ante un reforzador desfavorable que sigue a una experiencia previa con un reforzador más deseado, en comparación con la ausencia de tal experiencia previa.
- Contraste Conductual Simultáneo: Efectos de contraste conductual (positivo y negativo) que se producen por las modificaciones frecuentes entre una condición de recompensa favorable y desfavorable, con cada condición de recompensa asociada con su propio estímulo distintivo.
3. Relación (Contingencia) entre la Respuesta y el Resultado
Esta relación se analiza en dos aspectos clave:
- Medición del Tiempo entre la respuesta y el reforzador: La Contigüidad o Contigüidad Temporal se refiere a la ocurrencia simultánea (o casi simultánea) de dos sucesos, como una respuesta y un reforzador.
- Causalidad: Mide en qué medida la respuesta instrumental es necesaria y suficiente para la presentación del reforzador. La Contingencia entre Respuesta y Reforzador se define en términos de la probabilidad de ser reforzado por dar la respuesta en comparación con la probabilidad de serlo en ausencia de la respuesta. Es importante destacar que los reforzadores temporales y causales son independientes entre sí.
Efecto de la Demora en el Reforzamiento
Grice sugirió que el aprendizaje instrumental puede verse afectado negativamente por demoras breves, incluso de 0.5 segundos. Sin embargo, investigaciones más recientes indican que el aprendizaje es posible con demoras de hasta 30 segundos.
El condicionamiento instrumental es susceptible al condicionamiento demorado porque la conducta consiste en un torrente continuo de actividades.
Estrategias para el Aprendizaje con Reforzamiento Demorado
Para facilitar el aprendizaje con reforzamiento demorado, se utilizan dos estrategias principales:
- Reforzador Condicionado (o Secundario): Un estímulo que se convierte en un reforzador efectivo por su asociación con un reforzador primario o incondicionado. Por ejemplo, en el entrenamiento de un perro, frases como «muy bien» o «así se hace» sirven para tender un puente de demora entre la respuesta instrumental y el suministro del reforzador primario.
- Procedimiento de Marcaje: Un procedimiento en el que la respuesta instrumental es seguida de inmediato por un suceso característico (como que el participante se levante o que se presente un destello luminoso). Esto hace que la respuesta instrumental sea más memorable y ayuda a reducir los efectos perjudiciales del reforzamiento demorado (Lieberman, McIntosh y Thomas).
Conducta Supersticiosa y Reforzamiento Accidental (Skinner)
Skinner describió la Conducta Supersticiosa como un comportamiento que aumenta en frecuencia debido a emparejamientos accidentales entre la entrega de un reforzador y la ocurrencia de la conducta. Esto se debe al Reforzamiento Accidental o Adventicio, un caso en el que la entrega de un reforzador coincide por casualidad con una respuesta particular, incluso cuando esta no es responsable de la presentación del reforzador.
Respuestas Terminales e Interinas (Staddon y Simmelhag)
Staddon y Simmelhag identificaron dos tipos de respuestas en el condicionamiento con intervalos fijos:
- Respuestas Terminales: Respuestas que son más probables al final del intervalo entre presentaciones sucesivas de un reforzador a intervalos fijos.
- Respuestas Interinas: Respuestas que aumentan en frecuencia después de la entrega de un reforzador periódico y que luego disminuyen a medida que se acerca el momento del siguiente reforzamiento.
Efecto del Desamparo Aprendido
El Efecto del Desamparo Aprendido se refiere a la interferencia con el aprendizaje de nuevas respuestas instrumentales como resultado de la exposición a estimulación aversiva que no puede evitarse ni de la que es posible escapar. Para estudiar este fenómeno, se utiliza el Diseño Triádico, compuesto por dos fases: una de exposición y otra de condicionamiento. La Hipótesis del Desamparo Aprendido postula que, durante la exposición a estimulación aversiva inescapable e inevitable, los participantes aprenden que su conducta no controla los sucesos ambientales.