Artículos, Condicionamiento instrumental y Clicker, Destacado, Todos

Glosario de términos técnincos de adiestramiento

25 Octubre 2007 Sin Comentarios

Titulo Original: Glossary of Clicker Training Terms
Original en : http://www.clickersolutions.com/ Autor: Melissa Alexander

ABE- Primer emprendimiento comercial que aplicó los principios del Condicionamiento Instrumental al entrenamiento animal. Fundado por Keller y Marian Breland, en aproximadamente 45 años de existencia, el personal de ABE entrenó 15.000 animales de 140 especies diferentes.

Aversivo- Algo por el cual el animal estará deseoso de trabajar para evitar.

Bailey, Bob (Robert E.)- químico y zoólogo pionero en los métodos del Condicionamiento Instrumental aplicado al entrenamiento de animales, tanto en el ambiente libre como en el laboratorio. Bob y su esposa, Marian Breland Bailey, enseñaron los principios del Condicionamiento Instrumental a entrenadores de perros en sus campamentos de “entrenadores de pollos”.

Bailey, Marian Breland- segunda estudiante graduado con B.F Skinner. Marian y su primer marido, Keller Breland, trabajaron con Skinner en el proyecto “pigeon bombing” (”paloma bombardera”*) en la Segunda Guerra Mundial, por entonces dejó sus estudios de graduación para fundar ABE. Marian consiguió sus Ph.D en 1978 y fue profesora de la universidad durante veinte años. Aunque ella se retiró en 1998, Marian y su segundo marido, Bob Bailey, continuó enseñando los principios del OC (siglas en inglés del Condicionamiento Operativo o Instrumental) en sus campamentos.

Bingo o Jakpot- El gran premio, un mega-premio dado después de un esfuerzo particularmente excepcional.

Breland, Keller- el primer estudiante graduado con B.F. Skinner, trabajó con Skinner en el proyecto “pigeon bombing” en la Segunda Guerra Mundial. Fundó ABE, junto a su esposa. Keller fue el primero en usar un marcador de evento al que llamó “estímulo puente” (del inglés bridging stimulus), debido a que se tendía un puente entre la contestación deseada y la entrega del refuerzo primario.

Castigo- En el condicionamiento instrumental; consecuencia de una conducta en que algo se agrega o se aleja de los efectos deseados de un comportamiento y que probablemente hará que se modifique en el futuro.

Castigo negativo (P -)- Hace que el animal trabaje para suprimir (disminuya la frecuencia de) un comportamiento. Por ejemplo, el perro salta para conseguir atención. Dándose vuelta o alejándose de él le quita la atención que él desea.

Clicker- Juguete que hace ruido (clásica “ranita” de las fiestas de cumpleaños*). Los entrenadores de animales hacen uso del clicker como un marcador de evento para marcar un comportamiento deseado. El clicker es un marcador excelente porque es único, rápido, y consistente.

Collar de cabeza o ronzal- Similar al cabestro de un caballo, da el mando de la cabeza del perro a su entrenador, haciéndole más fácil conducirlo que con la traílla. Habitualmente se utiliza hasta que el perro haya aprendido a caminar al lado del entrenador. (En otros casos se lo utiliza para enseñar todo tipo de comportamientos*)

Condicionando clásico- El proceso de asociar un estímulo neutro con una respuesta involuntaria hasta que el estímulo incite la respuesta.

Condicionamiento controlado o contracondicionamiento- Técnica por la cual se aparean estímulos que evocan una respuesta determinada con una contestación opuesta, para que el estímulo evoque la nueva respuesta. Por ejemplo, un perro tiene miedo a los hombres con sombrero de determinado tipo. Cuando un hombre que lleva un sombrero se acerca, se alimenta al perro con su comida favorita repetidamente. La meta es reemplazar el miedo con el placer proporcionado por la comida. Debe hacerse gradualmente, pues si el proceso fuera precipitado, la comida favorita podría asumir la asociación de miedo.

Condicionamiento Instrumental-(O.C en inglés*)- El proceso de cambiar la conducta de un animal con cierto estímulo manipulando las consecuencias del comportamiento. Los cinco principios de O.C fueron desarrollados por B.F. Skinner. El entrenamiento del Clicker es un subconjunto de O.C, que sólo usa refuerzo positivo, la extinción, y en menor grado, el castigo negativo.

Consecuencia- El resultado de una acción. Las consecuencias frecuentemente -pero no siempre- afectan la conducta futura, haciendo más o menos probable que la conducta pueda ocurrir. Los cinco principios de OC describen los resultados potenciales.

Criterio- Respuesta específica, definida por el entrenador en una sesión de entrenamiento. El adiestrador hace clic al momento que el animal logra el criterio específico. El criterio no sólo puede incluir la conducta física sino también elementos como la latencia, duración y distancia.

Criterio temporal- Se establece para enseñar comportamientos más complejos al final del entrenamiento. Es de carácter provisorio. No debe abusarse de él pues el animal puede ser renuente a cambiar su conducta si se lo ha reforzado demasiado.

Crossover-dog- Perro que ha estado previamente entrenado por un método tradicional que luego se adiestra con el método del clicker.

Crossover-trainer- Entrenador que previamente usó los métodos tradicionales para entrenar animales y que ahora entrena con el clicker.

Cuatro cuadrantes de O.C- Referencia incorrecta al plan de entrenamiento habitual que ilustra los conceptos de refuerzo y castigo. Esta descripción está errada de dos maneras. Obvia mencionar la extinción, e implica que los otros principios del O.C son de igual valor en un programa de entrenamiento.

El blanco- Algo que se enseña a tocar al animal con alguna parte de su cuerpo. Un blanco es generalmente estacionario; aunque también existen blanco móviles (target stick) que se utilizan para enseñarles a seguirlos en movimiento.

Encadenando hacia atrás - En una sesión de entrenamiento se relaciona el próximo comportamiento al último obtenido y así sucesivamente. Encadenando hacia atrás es una técnica útil para el Principio de Premack.

Entrenamiento balanceado- Tipo de entrenamiento que utiliza los cinco principios del OC y un marcador de evento (el clicker) para modificar la conducta. Esta metodología también es conocida como “entrenamiento combinado” . El entrenamiento equilibrado implica cantidades iguales de refuerzo y castigo. Sin embargo, el apresuramiento asociado con el castigo lleva a una opción de entrenamiento pobre pues se pierde el equilibrio.

Entrenamiento de Compulsión o entrenamiento tradicional- El entrenamiento tradicional se caracteriza por moldear o provocar la conducta con el uso del refuerzo negativo y, el castigo positivo para “corregirla”.

Encadenando- El proceso de combinar las conductas múltiples en una conducta continua con una sola señal.

Entrenamiento con clicker- Término acuñado por Karen Pryor y definido por ella como un subconjunto de OC que usa refuerzo positivo, extinción, castigo negativo, y un marcador de evento para modificar la conducta.

Entrenamiento combinado- Utiliza los cinco principios de OC y una señal como marcador (el clicker) para modificar la conducta.

Entrenamiento compulsivo- El estilo tradicional de entrenar perros donde se compele al animal para realizar la conducta y físicamente se corrige el incumplimiento de esta.

Estímulo puente- Marcador de evento que identifica al comportamiento deseado y el lapso que transcurre entre la contestación y la entrega del refuerzo primario. El clicker es un estímulo puente.

Estímulo- Cambio en el ambiente. Si el estímulo no tiene ningún efecto en el animal, es un estímulo neutro. Un estímulo que destaca en el ambiente -otros animales o estímulos medioambientales- es un estímulo positivo. Un estímulo que causa un cambio en el estado del animal -por ejemplo, lo causa para realizar una conducta específica- es un estímul
o negativo

Extinción- Debilitar una conducta a través del no-refuerzo. “Ignorando” la conducta. En la extinción, nada se agrega o quita del ambiente. Si una conducta previamente reforzada no se refuerza, el animal aumentará la intensidad o frecuencia de la conducta en el intento por ganar el refuerzo de nuevo. Después de estos estallidos, la presentación de la conducta disminuirá.

Insensibilización- El proceso de aumentar la tolerancia a un estímulo particular aumentando la presencia del estímulo gradualmente.

Intervalo fijo- Horario de refuerzo en que el entrenador alienta la primera repuesta correcta después de un período específico de tiempo por ejemplo, después de un minuto.

Intervalo variable- Horario de refuerzo en que el entrenador refuerza la primera contestación correcta después de períodos disímiles de tiempo dentro de un cierto contexto o logro. Cronometrar es una habilidad mecánica y requiere práctica. El entrenador debe poder reconocer las conductas que preceden a la conducta designada para hacer clic en el mismo momento que la elegida ocurre.

La conducta- Algo que un animal hace.

La señal- Estímulo que obtiene una conducta. Las señales pueden ser verbales, físicas (es decir, un signo de la mano), o medioambiental (es decir, una restricción puede volverse una señal para sentarse si el perro siempre es enseñado a asumir esa posición antes de cruzar un camino).

Latencia- Tiempo entre la señal y la respuesta. Con un buen entrenamiento, ese tiempo es cero.

Marcador de evento- Signo que marca la conducta deseada al momento que ocurre. El clicker es un marcador de evento.

Medios positivos de refuerzo (R+)- Harán que el animal trabaje para consolidar (aumente la frecuencia de) un comportamiento. Por ejemplo, dar al perro un premio para “el sentado” aumentará la probabilidad de que el perro se sentará otra vez.

Medios positivos de castigo (P+)- Harán que el animal trabaje para evitar (disminuya la frecuencia de) un comportamiento. Sacar de un tirón a un perro que salta para saludar a la gente es un ejemplo de P+ , usado para suprimir el comportamiento de saltar. Otros ejemplos comunes de P+ incluyen el grito, golpecitos en la nariz, el azote, la descarga eléctrica, y las “trampas explosivas camufladas” .

Medios negativos de refuerzo (R -)- Harán que el animal trabaje para evitar fijar (aumente la frecuencia de) un comportamiento. Un sujetador de orejas, usado tradicionalmente para entrenar “el sostener”, es un ejemplo clásico de R -. los sujetadores de orejas sirven para hacer que el perro abra su boca, con lo cual el entrenador inserta el rodillo , entonces para reforzar “el sostener” el rodillo , se quita el sujetador de orejas. Se requiere que un primer estímulo aversivo esté aplicado mediante una orden para luego ser quitada.

Ningún Marcador de Premio (NRM)- Creado para ser una señal para decir “No, eso no es lo que yo quiero–intenta de nuevo.” Se piensa que agrega una señal verbal a la extinción de la perspectiva de OC. Sin embargo, una vez que algo se ha agregado a la situación, es imposible saber si un cambio ocurrió a través de extinción o castigo.

Principio de Premack- Teoría que declara que una respuesta más fuerte reforzará una respuesta más débil.

Pryor, Karen- Biólogo, autora y entrenadora de delfines reconocida por acuñar el término de “entrenamiento del clicker” y popularizar el método con entrenadores de perros.

Período de entrenamiento- Lapso de tiempo destinado al momento de las sesiones de adiestramiento. Un período de entrenamiento puede componerse de sesiones de entrenamiento múltiples.

Proporción del Refuerzo- El número de refuerzos medido en un período específico de tiempo. Una proporción alta de refuerzos es crítica para entrenar exitosamente.

Proporción variable- Horario de refuerzo en el que se refuerza el primer comportamiento correcto después de números inconstantes de contestaciones correctas.

Proporción fija- Tiempo de refuerzo en que el entrenador premia el primer comportamiento correcto después de un número específico de contestaciones.

Recuperación espontánea- Característica de la extinción en que una conducta que se pensaba que estaba extinta inexplicablemente reaparece. Si dicha conducta no se refuerza, desaparecerá rápidamente.

Reforzamiento- Algo por el cual el animal trabajará para obtener.

Reforzamiento continuo- El horario más simple de refuerzo. Cada respuesta deseada se refuerza.

Reforzamiento secundario- Refuerzo condicionado. A éste, el animal no lo necesita pero pueden ser iguales o aún más poderosos que un reforzamiento primario.

Refuerzo condicionado- Estímulo neutro apareado con un reforzamiento primario hasta que el estímulo neutro asuma las propiedades del primero. El sonido del clicker, después de ser repetidamente asociado con un premio de comida u otro refuerzo, se vuelve un refuerzo condicionado.

Refuerzo diferencial- Algunas respuestas correctas se premian y otras no . Todos los tipos de refuerzo excepto el refuerzo continuo son una clase de refuerzo del diferencial.

Refuerzo primario- Refuerzo que el animal necesita para desarrollarse normalmente. Comida, agua y sexo son reforzadores primarios.

Reforzamiento negativo (R-)- Son estímulos aversivos que pueden bloquearse o evitarse modificando la conducta. Tan pronto como se realiza el nuevo comportamiento, el estímulo aversivo cesa, y de este modo el nuevo comportamiento se refuerza. El perro recibe una corrección cuando camina en otra posición distinta de la de junto a su amo; por lo tanto, caminar junto a su guía es el único lugar seguro. El que evita la corrección. R - es un aversivo que debe aplicarse primero o debe amenazarse para ser luego quitado.

Refuerzo variable- Se refuerza al animal según un lapso de tiempo. En un intervalo fijo, el entrenador refuerza el primer comportamiento correcto después de un período específico de tiempo. Por ejemplo, cada minuto. En un intervalo inconstante, el entrenador refuerza la primera respuesta correcta después de períodos variables dentro de un cierto horario. Con esta técnica se logra instalar la conducta deseada * .

Señal de avance-( KGS)- Señal, verbal o de otra naturaleza, dada en el medio de una conducta para decirle al animal que está realizando correctamente el ejercicio y debe seguir con el resto de la rutina. La señal de avance se emplea frecuentemente en entrenamiento de Agility y otros deportes de obediencia *.

Señales de calma- Signos del cuerpo, sutiles, usados por los perros para indicar tensión, evitar la confrontación y disuadir la agresión.

Sesión de entrenamiento- Período real de adiestramiento. Su criterio debe permanecer constante durante una sola sesión. Al final de una sesión de entrenamiento, usted evalúa el progreso del animal y decide si hacer la próxima sesión más compleja o quedarse al mismo nivel.

Skinner, BF- Científico que definió los principios del Condicionamiento instrumental.

Tiempo variable de refuerzo- (VSR) Técnicamente, un intervalo inconstante o proporción inconstante. Sin embargo, la mayoría de los entrenadores usan VSR para significar una proporción inconstante.

Three-fer- (se mantiene el vocablo en inglés pues es de común utilización*) El animal tiene que realizar tres conductas correctas para ganar un clic y un premio.

Timing- (idem anterior) La elección del momento adecuado para hacer sonar el clicker. Con suerte, el clic debe ocurrir exactamente en el mismo momento que el criterio designado.

Two-fer- El animal tiene que realizar dos conductas correctas para ganar un clic y un obsequio.

Melissa Alexander
mcalex@clickersolutions.com

* Notas de traducción.
>

AUTOR

Melissa Alexander
E-Mail: mcalex@clickersolutions.com
Web: Clicker Solutions

Deja un comentario!

Deja tu comentario o trackback de tu propio sitio Web.

Puedes usar algunas etiquetas HTML:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Este blog permite avatares de gravatar. Si deseas tener un avatar reconocido a nivel global, crea tu cuenta de forma gratuita en Gravatar.