sábado, 31 de octubre de 2015

CONDICIONAMIENTO OPERANTE DE SKINNER

Condicionamiento Operante

No todas nuestras conductas se basan en respuestas reflejas como es el caso del condicionamiento clásico, de hecho, la mayor parte de nuestras conductas parecen ser producto de nuestra voluntad (Ej. levantarnos para ir al trabajo, tomar o no un taxi que nos lleve, copiar o no lo que se dice en clase,…).

El condicionamiento instrumental se refiere al comportamiento voluntario. Una conducta instrumental es aquella que nos sirve para lograr determinadas consecuencias.

El condicionamiento operante o instrumental es el aprendizaje en el que una respuesta voluntaria se refuerza o debilita según sus consecuencias sean positivas o negativas.

A diferencia del condicionamiento clásico, donde los comportamientos son las respuestas biológicas naturales a la presencia de estímulos como el alimento, el agua, el dolor, etc., en el condicionamiento operante, un organismo opera en su ambiente y efectúa respuestas voluntarias para producir un resultado deseable: los organismos tienden a repetir las respuestas que se acompañen de consecuencias favorables.

Este condicionamiento fue descubierto por el norteamericano E. L. Thorndike, más o menos en la misma época en que Pavlov hacía sus experimentos con perros.



Thorndike encerraba gatos o ratas en jaulas dotadas de un mecanismo sencillo para abrirlas desde adentro. El animal intentaba salir (sobre todo si estaba hambriento y fuera veía comida) y comenzaba a agitarse en el interior de la jaula. En uno de los movimientos daba casualmente al mecanismo y conseguía salir (recibiendo así la recompensa, que es posterior a su acción). Si se repetía la misma situación, se observaba que el animal terminaba por aprender el mecanismo de salida: el número de "ensayos y errores" se iba reduciendo hasta que el aprendizaje se perfeccionaba.

Los estudios más famosos sobre el condicionamiento operante se deben al también norteamericano B. F. Skinner que utiliza igualmente animales, ratas y palomas, sobre todo. Skinner ideó un mecanismo: "la caja de Skinner" dispuesto de tal manera que cada vez que se presiona cierta tecla se tiene acceso a la trampilla donde se encuentra la comida, que en este caso es el refuerzo que consigue la consolidación de una conducta en el animal.



Este aprendizaje se denomina "operante" porque el sujeto aprende a realizar ciertos comportamientos. Para ello son fundamentales los refuerzos y castigos: un premio o refuerzo es cualquier estímulo que aumenta la probabilidad de que cierta conducta sea repetida por el sujeto; un castigo es cualquier estímulo que disminuye la probabilidad de que cierta conducta sea repetida.

El condicionamiento operante de la conducta de los animales permite al hombre utilizar sus habilidades: así, se utiliza el olfato de los perros para combatir el contrabando de ciertas mercancías, en tareas de salvamento, etc.

El propio Skinner consiguió notables éxitos en adiestramiento de animales; sin embargo, su principal aportación se encuentra en el terreno de la educación (donde es muy importante la motivación y del refuerzo de la conducta) y del comportamiento social (técnicas de la modificación de la conducta).


Elementos del Condicionamiento Operante

Reforzador: cualquier acto o estímulo que sigue a una conducta y que aumenta la probabilidad de que sea repetida en el futuro.
Refuerzo positivo: es un objeto, evento o conducta que incrementa la frecuencia de la respuesta. El reforzamiento positivo ocurre cuando una respuesta se fortalece porque se acompaña de un estímulo reforzante. Es el más efectivo.
Su efectividad depende de:
·         A mayor cantidad de recompensa mayor esfuerzo realizado
·         Entre el refuerzo y la conducta reforzada debe haber una proximidad temporal
·         El nivel de motivación es fundamental en el aprendizaje
Ejemplo: los animales aprenden a presionar palancas para obtener comida.

Refuerzo negativo: Se produce cuando una respuesta se fortalece porque se acompaña de la eliminación de un estímulo aversivo (desagradable).
Ejemplo: los animales aprenden a presionar palancas para evitar descargas eléctricas.

Castigo: En términos generales podemos decir que el castigo reviste dos cualidades principales (que a su vez lo diferencian del refuerzo positivo y del negativo).
  • El castigo es en sí un evento que resulta desagradable (doloroso, lastimoso) a quien lo recibe.
  • El propósito fundamental del castigo es evitar que una conducta se repita.
Nótese entonces que el castigo se diferencia del refuerzo positivo y del negativo en que:
El evento no es agradable al organismo.
No incentiva conductas sino que quiere reprimirlas.


Ejemplo: Recibir una multa por exceso de velocidad.

TIPOS DE CONDICIONAMIENTO OPERANTE

1. Reforzamiento. Cualquier adición (para aumentar la frecuencia del comportamiento) o retiro (para aumentar también la frecuencia del comportamiento) de algún estimulo o artefacto como consecuencia de cualquier conducta.
Por ejemplo, tu perro se sienta y le das comida cuando lo hace. Tu perro se sienta cada vez con más frecuencia porque la comida ha funcionado como reforzador. Esto se conoce como reforzamiento positivo porque la adición de una consecuencia positiva (comida) aumenta la frecuencia de la conducta (sentarse).
Ahora imagina que tu perro tiene miedo de la gente. Una persona se le acerca y él ladra agresivamente. La persona se aleja y tu perro deja de sentir miedo. Entonces, aprende que ladrando agresivamente puede hacer que la gente que teme se aleje. Esto se conoce como reforzamiento negativo porque el retiro de un estímulo aversivo (la gente) aumenta la frecuencia de la conducta (ladrar agresivamente).
2. Castigo. comportamiento usado para extinguir o anular algún comportamiento de algún organismo.
Imagina que tu perro se acerca a un extraño al que no le gustan los perros, y esta persona le da una patada. Entonces, tu perro aprende a evitar a las personas. Esto se conoce como castigo positivo porque la adición de algo (la patada) disminuye la frecuencia de la conducta (acercarse a las personas). Este tipo de castigo no es recomendable en el adiestramiento porque tiene consecuencias adversas que implican daño físico y/o emocional del organismo.
Un caso diferente ocurre si tu perro está jugando contigo al tira y afloja. Tú tiras del extremo de un trapo, mientras tu perro tira del otro extremo. En su entusiasmo por morder el trapo, tu perro te muerde la mano por lo que terminas el juego y te vas. Entonces tu perro aprende a no morderte cuando juegan. Esto se conoce como castigo negativo, porque el retiro de algo (el juego) disminuye la frecuencia de la conducta (morder tu mano).
3. Extinción. Es la disminución de la frecuencia de una conducta aprendida, que ocurre cuando dicha conducta no tiene consecuencias. Es decir que dejan de existir las consecuencias que antes reforzaban la conducta.
Imagina que cuando tu perro era un cachorro saludaba a las personas saltando sobre ellas, porque lo acariciaban y jugaban con él. Entonces aprendió que esta es la manera correcta de saludar a la gente. Un buen día, la gente deja de acariciarlo y jugar con él cuando salta. En cambio, le dan la espalda y lo ignoran. Con el tiempo tu perro deja de saltar para saludar a las personas. Esto ocurre porque la conducta aprendida (saltar sobre las personas) deja de tener consecuencias reforzantes y, entonces, se produce la extinción de la conducta.

4. Discriminación y control por el estímulo. Es el aumento de la frecuencia de una conducta en presencia de un estímulo, pero no en presencia de otros.