Conditionnement opérant ou instrumental Apprendre à agir en fonction des conséquences
Définitions L’apprentissage instrumental L’apprentissage instrumental est une modification de la probabilité de réapparition d’une réponse, modification entraînée par l’apparition ou le retrait d’un évènement particulier, le renforçateur, de façon contingente à la réponse. Ex: Skinner: rats – labyrinthe – Skinner-box
Définitions L’apprentissage instrumental Le sujet apprend une relation entre le comportement et un changement dans l’environnement. SdRS Stimulus discriminatif Réponse ou opérant Conséquence qui a un effet sur la réponse
Définitions Exemples SdRS Conflit Je m’exprime Il crie, il s’énerve Demande d’aide J’accepte Elle se montre soulagée Soirée entre amis Je bois de l’alcool Je me sens plus à l’aise
Principes et concepts Le renforçateur modifier la hausse ou à la baisse Évènement consécutif à une action et qui a pour effet de modifier, à la hausse ou à la baisse, la probabilité de réapparition de cette action. jouet donné en récompense à l’enfant qui a obtenu de bonnes notes Renforçateur de nature appétitive Une contravention est donnée au conducteur qui a roulé trop vite Renforçateur de nature aversive
Principes et concepts jouet donné en récompense à l’enfant qui a obtenu de bonnes notes La relation de nécessité La conséquence n’est présente que si le comportement cible a été accompli contingence Cette relation de nécessité est une contingence
Principes et concepts les dimensions de l’analyse de l’apprentissage instrumental nature appétitive ou aversive de la conséquence la présence, la non-apparition,l’absence de la conséquence Tous les cas d’apprentissage peuvent être catégorisés selon ces dimensions.
Les phénomènes instrumentaux jouet donné en récompense à l’enfant qui a obtenu de bonnes notes Type particulier de contingence: RENFORCEMENT POSITIF Stimuli appétitif Effets comportementaux: Le renforcement vise à augmenter la probabilité d’apparition d’un comportement ou son intensité. Type particulier d’entraînement: RECOMPENSE
L’enfant qui a obtenu de bonnes notes ne doit plus suivre de cours supplémentaires Type particulier de contingence: RENFORCEMENT NEGATIF Stimuli aversif Effets comportementaux: Le renforcement vise à augmenter la probabilité d’apparition d’un comportement ou son intensité. Type particulier d’entraînement: ECHAPPEMENT-EVITEMENT Les phénomènes instrumentaux
réprimande adressée à l’enfant qui joue au ballon sur la route Type particulier de contingence: PUNITION POSITIVE Stimuli aversif Effets comportementaux: La punition vise à diminuer la probabilité d’apparition d’un comportement ou son intensité /ne pas faire apparaître Type particulier d’entraînement: PUNITION Les phénomènes instrumentaux
L’enfant qui a mal travaillé à l’école n’a plus le droit de regarder la télévision Type particulier de contingence: PUNITION NEGATIVE Stimuli appétitif La punition vise à diminuer la probabilité d’apparition d’un comportement ou son intensité /ne pas faire apparaître Type particulier d’entraînement: OMISSION Les phénomènes instrumentaux
Quatre types de contingence Renforcement Renforcement positif Renforcement négatif Punition Punition positive Punition négative Apparition du stimuli Disparition du stimuli Apparition du stimuli Disparition du stimuli
Notation Les conséquences qui affectent nos comportements sont considérées comme des « stimuli » au sens large = variables qui induisent des réactions. S Précédé et suivi d’un signe « - » ou « + » Précédé d’un signe « ° »
opération SdRC stimuli appétitif apparition Dans le coursJe parleOn m’écoute + S + Soir, livingEnfant range15’ plus de TV + S + CaféJeu de hasardJe gagne + S + ConflitJe me coupeIls s’occupent de moi + S + InquietJe l’interrogeIl me rassure + S + Renforcement positif récompense
opération SdRC stimuli aversif apparition DemandeCrise de colèreEnfant est mis dans le coin + S - ConflitJe m’exprimeIl crie + S - CaféJeu de hasardJe perds + S - TéléphoneJe m’énerveElle raccroche + S - ConflitJe boisReproches + S - Punition positive punition
opération SdRC stimuli appétitif élimination refusCrise de colèreMaman quitte la chambre - S + ConversationAborder un sujet difficile Il ne parle plus - S + DemandeRefus de débarrasser la table Maman éteint la TV - S + ExamenÉtude non-stopPas de sorties avec les copains - S + Envie de fumerQuitte la pièce où se trouvent ses amis Est écarté de la conversation qui l’intéresse - S + Punition négative Omission
opération SdRC stimuli aversif élimination Soir dans le livingJe rangeMaman s’arrête de gronder - S - SoirJe bois un verreLa tension diminue - S - ExamenJe travailleAnxiété et culpabilité diminuent - S - InquiétudeJe le rassureIl cesse de s’inquiéter - S - ConflitJe me taisIl cesse de crier - S - Renforcement négatif échappement La réponse élimine ou termine l’évènement aversif
opération SdRC stimuli appétitif Non apparition FêteRepas, cadeauIl ne le remarque pas ° S + CuisineJe l’aide à préparer le repas Pas de réaction ° S + RestaurantJe ne fume pas après le repas Pas de plaisir lié à la cigarette ° S + Résultats scolairesJ’ai fait des progrèsPas de remarque ° S + Je suis maladeJe prends mes médicaments Pas d ’amélioration de ma santé ° S + Punition négative omission
opération SdRC stimuli aversif Non apparition SoirJe range(sinon) maman ramasse + poubelle ° S - Soirée entre amisJe vais fumer dehorsPas de remarques désagréables de mes amis ° S - Peur d’une réunion de travail Je dis que je suis malade et reste à la maison Pas de peur ° S - InvitationJ’y réponds positivement alors que je n’en ai pas envie Pas de reproches ° S - Il est de mauvaise humeur Je ne lui adresse pas la parole Pas de conflit ° S - Renforcement négatif évitement La réponse postpose ou prévient le contact avec le stimulus aversif
Exercice: trouver les types de contingence Un enfant est félicité pour avoir ramassé ses jouets Un enfant ne reçoit plus d’ attention des adultes lorsqu’il utilise un langage grossier Un enfant reçoit des remontrances pour avoir fouillé dans les médicaments de la pharmacie Un conducteur ralentit pour éviter une contravention
Les comportements opérants: R Comportements volontaires ayant une incidence sur l’environnement du sujet Actions produites par le sujet dans un contexte donné Conséquences « ouverts » ou « couverts » Comportements observables ou pas (« évitements ») Conséquences du comportement intentionnelles ou non
Principes et concepts comportements « réflexes » Ex:les pleurs d’un nouveau-né qui a faim comportements « opérants » Ex: les pleurs d’un enfant qui veut des friandises
Principes et concepts La plupart de nos comportements sont « contrôlés » par une pluralité de conséquences. Ex: cas de l’étudiant d’université qui assiste au cours Généralement nous ne sommes pas conscients de la complexité des coûts et des bénéfices qui nous motivent ou pourraient nous motiver à accomplir un comportement. Les anticipations de conséquences de nos comportements « opérants » résultent de nos expériences passées (histoire de l’individu et de ses apprentissages).
Principes et concepts Les conséquences de nos comportements Une conséquence extrinsèque Une conséquence intrinsèque Une conséquence autoproduite
Principes et concepts Extinction: un S ne suit plus une R. Procédure qui consiste à cesser de renforcer une réponse. Il faut donc qu’une contingence de renforcement ait existé auparavant.
Principes et concepts Discrimination: quand la relation R – S dépend d’un stimulus antérieur, celui-ci est le stimulus discriminatoire (Sd) les situations dans lesquelles la R n’est pas suivie par S sont nommées Sdelta Généralisation: l’organisme émet la réponse renforcée aussi dans des situations qui ressemblent au Sd original
Exercices d’analyse Entraînement à l’analyse fonctionnelle: Établir les stimuli antécédents (sd) et conséquences qui contrôlent un comportement-problème.
L’intervention 1. L’installation de nouveaux comportements A. Le shaping (façonnage) Le comportement cible est atteint en renforçant de petites étapes successives, ou approximations. La probabilité de réponses similaires à la réponse finale est augmentée, tandis que les réponses s’écartant du comportement cible sont placées sous extinction. Ex: lorsque les jeunes enfants apprennent à manger.
L’intervention 1. L’installation de nouveaux comportements B. La procédure en chaîne De nombreux comportements sont constitués par une chaîne de plusieurs réponses. Ex: quitter le domicile pour se rendre au travail, s’habiller, préparer le repas Seule la dernière réponse est suivi de l’octroi du renforcement Un évènement qui précède immédiatement un renforcement est un signal pour ce renforcement.
L’intervention 1. L’installation de nouveaux comportements B. La procédure en chaîne Dans l’installation d’une chaîne, l’émission de la dernière réponse signale que le renforçateur va suivre. Ce dernier comportement joue donc un rôle de stimulus discriminatif pour le renforcement et devient une réponse conditionnée Ce comportement sert de renforçateur pour l’étape qui la précède immédiatement dans la chaîne Les autres comportements acquièrent également cette double fonction et permettent ainsi l’installation de la séquence Ex: faire du sport – sentiment de bien-être
L’intervention 1. L’installation de nouveaux comportements B. La procédure en chaîne Les chaînes de comportements s’installent en commençant par la réponse qui précède immédiatement le renforcement Apprentissage: Installer la dernière réponse de la séquence + renforcement Stabilisation de cette liaison La réponse qui précède est apprise à son tour, et ainsi de suite Méthode régressive
L’intervention 1. L’installation de nouveaux comportements B. La procédure en chaîne Bensberg et al (1965). Chez des enfants arriérés mentaux. Apprendre aux enfants à s’habiller seuls
L’intervention 1. L’installation de nouveaux comportements C. L’incitation L’incitation peut revêtir diverses formes: verbale, gestuelle ou visuelle L’incitation précède la réponse; lorsque celle-ci est émise elle est renforcée L’incitation joue donc un rôle de stimulus discriminatif
L’intervention 1. L’installation de nouveaux comportements C. L’incitation Incitation verbale: ex: demander à un sujet de faire quelque chose ex: lever un bras Incitation visuelle: ex: restreindre ou supprimer le choix entre des objets de manière à ce que le sujet montre l’objet demandé Incitation gestuelle: ex: guider la main du sujet vers un verre Aide au shaping
L’intervention 1. L’installation de nouveaux comportements C. L’incitation Le sujet devra apprendre à agir sans incitation Les incitations ne doivent être éliminées que progressivement au cours de l’apprentissage Procédure dite d’estompage Obtenir l’émission du comportement sous le contrôle des contingences habituelles du milieu
L’intervention 2. Accroître la probabilité d’émission d’une réponse A. Le renforcement positif Les renforçateurs primaires: stimuli ayant une capacité à renforcer un ou des comportements indépendamment de tout apprentissage antérieur (Malcuit et al., 1995). Cette propriété serait le fruit d’un héritage génétique. Les renforçateurs primaires sont: la nourriture, l’eau, le sommeil, la chaleur, l’air, la température de la peau, certaines saveurs, les stimulations tactiles et visuelles, etc.. Les comportements qui les produisent sont renforcés. Les renforçateurs
L’intervention 2. Accroître la probabilité d’émission d’une réponse A. Le renforcement positif Les renforçateurs secondaires ( renforçateurs conditionnels). Les propriétés des renforçateurs secondaires sont acquises parce que ces stimuli sont associés avec des renforçateurs primaires ou avec d’autres renforçateurs secondaires. Les renforçateurs
L’intervention 2. Accroître la probabilité d’émission d’une réponse A. Le renforcement positif Les renforçateurs secondaires peuvent être catégorisés selon leur forme 1. Les renforçateurs tangibles sont des objets qui peuvent être manipulés, regardés, sentis, portés, de bien différentes manières; ex: bouquet de fleurs, tableau, vêtement, etc. 2. Les renforçateurs comestibles, s’ils sont souvent des renforçateurs primaires peuvent acquérir leur fonction de renforçateur au cours de l’histoire interactionnelle. Ex: la moutarde est un renforçateur pour peu d’enfants alors qu’elle l’est pour beaucoup d’adulte.
L’intervention 2. Accroître la probabilité d’émission d’une réponse A. Le renforcement positif Les renforçateurs secondaires peuvent être catégorisés selon leur forme l’attention 3. Les renforçateurs sociaux sont de très puissants agents renforçateurs. Le sourire est un agent renforçateur ayant acquis cette fonction parce qu’il est présent sur le visage de la mère quand elle nourrit son enfant. Généralement, l’attention est un renforçateur puissant impliqué dans de nombreux comportements de notre espèce. 4. Les activités peuvent être des renforçateurs. Ex: vélo, sport, console de jeu, TV etc.. Attention aux différences individuelles.
L’intervention Le principe de Premack ( Premack, 1965) Selon ce principe, une réponse à forte probabilité naturelle d’apparition (niveau opérant élevé) peut renforcer une autre réponse dont la probabilité naturelle d’apparition est plus faible. Ce principe fait partie de notre quotidien. Exemple: L’enfant qui doit terminer ses devoirs avant de pouvoir aller jouer dehors avec ses amis est soumis à une contingence de renforcement positif où la réponse cible « faire ses devoirs » a une faible probabilité d’apparition naturelle. Le renforçateur « jouer avec ses amis » est par contre un comportement dont la probabilité naturelle est très élevée. En rendant ce second comportement contingent au premier, la mère ou le père de l’enfant vise à augmenter la probabilité de la première réponse.
L’intervention 2. Accroître la probabilité d’émission d’une réponse A. Le renforcement positif Son efficacité dépend de trois facteurs le délai dans l’octroi du renforcement la quantité le programme en vigueur Les principes du renforcement positif
L’intervention A. Le renforcement positif L’installation: renforcement délivré immédiatement après la réponse. Si un délai s’installe, d’autres réponses peuvent apparaître, sans aucune relation avec le comportement que l’on souhaite renforcer. Le maintien: peut se réaliser malgré l’introduction d’un délai entre son émission et le renforcement final, par l’intermédiaire de renforcements intermittents. Loi discutable chez l’homme: les capacités de représentation peuvent avoir une valeur de renforcement. Le sportif peut s’entraîner en s ’imaginant qu’il reçoit le trophée… L’anticipation du résultat joue le rôle de renforcement. le délai dans l’octroi du renforcement Les principes du renforcement positif
L’intervention A. Le renforcement positif La quantité de renforcement En général, la probabilité d’émission d’une réponse est directement liée à la quantité de renforcement octroyée. Effet de satiété: un renforcement octroyé en quantités trop importantes peut ne plus avoir aucun effet sur le comportement. L’effet du renforcement dépend de l’état de privation dans lequel se trouve le sujet Éviter la satiété créer un état de privation problème éthique Les principes du renforcement positif
L’intervention A. Le renforcement positif Les programmes de renforcement Spécification des modalités de la relation entre la réponse et le renforcement. Les programmes à proportions de réponses basés sur le nombre de réponses requises pour l’octroi d’un renforcement Les programmes à composante temporelle basés sur la durée s’écoulant entre l’émission des réponses et le renforcement Les principes du renforcement positif
L’intervention Les programmes à composante temporelle Le programme à intervalle fixe (programme FI ou Fixed Interval) Requiert qu’un intervalle de temps constant s’écoule avant l’octroi d’un renforcement. La première réponse émise après la fin de l’intervalle est renforcée. Un programme FI 1 minute indique que la première réponse émise après une minute sera renforcée. Les réponses émises durant l’intervalle n’ont aucun effet sur l’obtention du renforcement (dépenses d’énergie non fonctionnelle). Ex de Kazdin (1975): la distribution du courrier. Pour de nombreux individus, l’arrivée du courrier à une période déterminée entraîne l’émission d’une réponse: regarder dans la boîte aux lettres, dès l’obtention du renforcement la réponse n’est plus émise jusqu’à la fin de l’intervalle: la distribution du lendemain
L’intervention Les programmes à composante temporelle Le programme à intervalle variable (programme VI ou Variable Interval) Spécifie que le renforcement est délivré après une durée variable. Un programme VI 2 minutes indique qu’une réponse sera renforcée en moyen toutes les 2 minutes, la durée pouvant s’échelonner entre 90 et 150 secondes. Exemple: l’enseignant qui effectue des contrôles de la matière sous la forme d’interrogations écrites, sans prévenir les élèves, place en fait le comportement d’étude des élèves sur un programme à intervalle variable.
L’intervention Les programmes à proportions de réponses Le programme à proportion constante (programme FR ou Fixed Ratio) Le programme à proportion variable (programme VR ou Variable Ratio) Requiert l’émission d’un nombre constant de réponses avant l’octroi d’un renforcement. Ex: un programme FR 10 spécifie que la 10 ième réponse émise sera suivi d’un renforcement. Le renforcement est octroyé après un nombre variable de réponses. Pour le sujet renforcé, ce nombre varie de manière non prédictible d’une occasion à l’autre. Un programme VR 10 : renforcement en moyenne toutes les 10 réponses.
L’intervention A. Le renforcement négatif 2. Accroître la probabilité d’émission d’une réponse La probabilité d’apparition d’un comportement est accrue lorsque ce comportement a eu pour résultat d’échapper ou d’éviter une stimulation aversive. La plupart des réponses d’évitement sont acquises sans contact direct avec la situation aversive. Anticipations - Règles verbales transmises par la société. Connaissance des sanctions prévues par le code pénale.
L’intervention A. Le renforcement négatif 2. Accroître la probabilité d’émission d’une réponse Procédure pas utilisée en psychothérapie: Requiert la présentation de stimulation aversive (problème éthique) Le résultat de la procédure de renforcement négatif est identique à celui de la procédure de renforcement positif = augmentation de la probabilité du comportement.
L’intervention 3. Réduire la probabilité d’émission d’un comportement Quatre procédures sont utilisées pour réduire ou supprimer l’émission d’un comportement: A.la punition B.L’extinction C.Le retrait momentané à l’accès au renforcement positif ou time-out du renforcement positif D.Sanction de la réponse
L’intervention 3. Réduire la probabilité d’émission d’un comportement A. La punition Les types de stimuli aversifs Les stimuli aversifs primaires ont des propriétés aversives innées: choc électrique d’une certaine intensité, une lumière aveuglante, un bruit assourdissant ou une blessure corporelle. Les stimuli aversifs secondaires acquièrent leurs propriétés aversives par association avec un stimuli aversif primaire (conditionnement pavlovien).
L’intervention 3. Réduire la probabilité d’émission d’un comportement A. La punition Les principes de la punition Quelques lois générales: La rapidité d’élimination d’une réponse est directement liée à l’intensité du stimuli aversif; la punition est plus efficace lorsque les conséquences aversives sont introduites à leur intensité maximale. La punition doit être délivrée immédiatement après le comportement à éliminer
L’intervention 3. Réduire la probabilité d’émission d’un comportement A. La punition Les principes de la punition Quelques lois générales: l’élimination d’une chaîne comportementale est plus rapide lorsque les contingences aversives sont appliquées à la première réponse formant la séquence.
L’intervention 3. Réduire la probabilité d’émission d’un comportement A. La punition Les principes de la punition Procédure pas utilisée en psychothérapie: 1.Le comportement risque de refaire son apparition lorsque les contingences punitives auront été supprimées (les conduites de récidives en sont des exemples frappants). 2.L’évitement de la punition peut se faire par différents moyens « inadaptés » (attaque de l’agent « punitif ») 3.L’utilisation de contingences aversives n’élargit pas le répertoire comportemental de l’individu
L’intervention 3. Réduire la probabilité d’émission d’un comportement B. L’extinction Le stimuli ne suit plus la réponse En TCC: l’utilisation la plus fréquente de la procédure d’extinction consiste en la suppression des conséquences positives qui suivent l’émission de réponses inappropriées. Ex: les crises de colère de l’enfant – l’extinction consiste à ignorer les crises: les conséquences positives rattachées à l’attention sont ainsi retirées et les conduites inadaptées sont placées sous extinction.
L’intervention 3. Réduire la probabilité d’émission d’un comportement B. L’extinction Attention! La suppression non programmée des contingences positives après l’acquisition d’une réponse. Situation fréquente dans de nombreux cas d’apprentissage. Ex: l’élève qui apprend à manipuler les opérations arithmétiques peut être renforcé au départ pour chaque réponse correcte qu’il émet. Pour diverses raisons, manque d’attention de l’enseignant, difficultés dans la maîtrise de la tâche, les renforcements peuvent être ensuite supprimés.
L’intervention 3. Réduire la probabilité d’émission d’un comportement C. Time-out du renforcement positif Éloignement de l’individu (le plus souvent pendant une période de temps relativement courte) d’une situation dans laquelle le renforcement sont disponibles. En TCC: le thérapeute suspend momentanément l’accès aux renforçateurs le sujet est placé dans un environnement restreint supposé moins renforçant. Ex: enfant isolé dès qu’il présente des crises de colère. L’efficacité du time-out n’est pas très claire. Le sujet placé en isolement peut-être renforcé positivement.
L’intervention 3. Réduire la probabilité d’émission d’un comportement C. La sanction de la réponse Sous classe de la punition. Rarement employée en TCC. Cette technique implique la perte de renforcements positifs octroyés précédemment ou une pénalité consistant en l’exécution d’une tâche. Ex: les contraventions routières, les taxes sur le courrier mal affranchi et les travaux pénitentiaires sont des exemples de cette procédure.