Condicionamiento instrumental
De Wikipedia, la enciclopedia libre
En psicología, el condicionamiento instrumental es una forma de aprendizaje en la que la consecuencia (el estímulo reforzador) es contingente a la respuesta que previamente ha emitido el sujeto. Se le llamó en principio "operante" porque el organismo opera sobre el medio para recibir una consecuencia.
El nombre que B.F. Skinner dio a este tipo de aprendizaje fue condicionamiento operante, aunque hoy se prefiere el de condicionamiento instrumental, por ser más descriptivo, aunque hay quien ve algún matiz distintivo desde posiciones puramente conductistas. Fue él precisamente el primero en distinguir entre este tipo de condicionamiento y el condicionamiento clásico.
Tabla de contenidos |
[editar] Distinción entre condicionamiento clásico y operante
- En el condicionamiento clásico la asociación es entre un estímulo condicionado y uno incondicionado. En el condicionamiento intrumental la asociación es entre las respuestas y las consecuencias de refuerzo.
- En es condicionamiento clásico, el estímulo incondicionado no depende de la respuesta del sujeto, mientras que, en el operante, las consecuencias dependen de la respuesta del sujeto.
- En el clásico la respuesta del sujeto es involuntaria mientras que en el instrumental es generalmente voluntaria.
La distinción entre ambos condiconamientos para los conductistas más radicales es tanto operativa como de procesos:
- Operativa, ya que el reforzador depende de la respuesta, de la conducta, por tanto.
- Procesual, estando implicado en un caso el sistema nervioso autónomo y en el otro el sistema nervioso central. Esta diferencia no ha sido demostrada experimentalmente.
[editar] Estímulos
Lo verdaderamente importante en este tipo de condicionamiento es la respuesta generada ante el estímulo. Cualquier proceso de condicionamiento instrumental admite el uso de estímulos que en condicionamiento pavloviano podrían clasificarse como condicionados, incondicionados o neutros, ya que el análisis no se concentra en ellos sino en las consecuencias de las respuestas, que son las que determinan la probabilidad de que la conducta se repita o no.
En el condicionamiento instrumental los estímulos incondicionados se usan igual que en el pavloviano. El estímulo incondicionado (EI) es el resultado que sigue a la respuesta (por ejemplo comida, descargas eléctricas...)
También se usan estímulos condicionados (EC), estímulos relativamente inocuos sin significado o poder específico, al menos al comienzo del entrenamiento.
El estímulo discriminativo es un estímulo neutro que indica cuándo la respuesta puede conducir o no a la consecuencia deseada. Es decir, el estímulo discriminativo indica si el reforzador está disponible. Por oposición, el estímulo delta es el estímulo que no estuvo presente cuando la respuesta fue reforzada, y por lo tanto no da información sobre la disponibilidad del reforzador.
[editar] Respuestas
La respuesta incondicionada (RI) es la provocada por el EI de forma refleja y que viene determinada por él.
La respuesta condicionada (también llamada respuesta instrumental) suele ser distinta a la RI, siendo bastante arbitraria.
[editar] Fases
Las fases de un experimento de condicionamiento instrumental son esencialmente las mismas que en el caso del condicionamiento clásico:
- Adquisición
- Extinción
[editar] Programas de refuerzo
Un programa de refuerzo es una regla sobre la administración del refuerzo. Existen programas de refuerzo de dos tipos: de razón (en función de la respuesta) y de intervalo (en función del tiempo), y cada uno admite una variación fija o variable.
- En un programa de razón fija se da un reforzador cada cierto número de respuestas. Un programa RF1, por ejemplo, da reforzador cada respuesta. El RF2 da reforzador cada dos respuestas.
- El programa de razón variable da reforzadores cada cierto número de respuestas, número que no es fijo sino que varía alrededor de un promedio. RV3 da una respuesta cada 2, 3 o 4 respuestas, aproximadamente (y aleatoriamente).
- Un programa de intervalo fijo implica un período siempre igual durante el cual no hay disponibilidad del reforzador, período que inicia justo después de la presentación de la respuesta criterio (es decir, aquella de interés).
- El programa de intervalo variable hace que el período durante el cual no está disponible el reforzador cambie alrededor de un promedio. El ejemplo claro es una máquina tragamonedas, que dispensa reforzadores cada cierto tiempo que no es predecible por parte de la persona que la opera.
Por lo general, los programas de tasa (razón) producen adquisición más rápida, y los de intervalo producen adquisición más estable y resistente a la extinción.
[editar] Tipos
Existen cuatro procedimientos o tipos de condicionamiento instrumental:
- Condicionamiento de recompensa
- Entrenamiento de omisión
- Castigo
- Escape y evitación (Aunque distintos, ambos se consideran dentro del mismo procedimiento, ya que ambos implican la no ocurrencia del estímulo incondicionado aversivo.)