Apprentissage associatif Conditionnement classique et conditionnement opérant
Est-ce qu’un rat peut apprendre ? Est-ce qu’un rat peut apprendre ? Oui. De quelle façon ? Par association.
Conditionnement classique Ivan Pavlov : fondateur Ivan Pavlov est le fondateur de la théorie du conditionnement classique. Il est né en 1849 en Russie et est mort en 1936. Il a remporté le prix Nobel de physiologie ou médecine en 1904 grâce à ses travaux sur le conditionnement.
Définitions Stimulus inconditionnel (SI) : stimulus provoquant une réaction par réflexe. Réponse inconditionnelle (RI) : réponse déclenchée par réflexe, sans qu’aucun apprentissage ne soit nécessaire. Exemple de stimuli inconditionnels et de réponses inconditionnelles : Lorsque quelqu’un nous souffle dans l’œil (SI), on le ferme automatiquement (RI). Lorsqu’on entend un bruit très fort près de nous (SI), la réaction de sursaut est instantanée (RI).
Définitions (suite) Stimulus neutre (SN) : stimulus qui ne déclenche, de prime abord, aucun réflexe ni aucune réponse. Stimulus conditionnel (SC) : pendant le conditionnement, le stimulus neutre change de statut et devient un stimulus conditionnel puisqu’il provoque maintenant une réponse, appelée réponse conditionnelle (RC). Réponse conditionnelle (RC) : réponse similaire, ou même identique à la réponse du stimulus inconditionnel.
Schéma Illustration : expérience de Pavlov Avant conditionnement Stimulus inconditionnel (SI) Réponse inconditionnelle (RI) Stimulus neutre (SN) Aucune réponse Pavlov a longuement travaillé sur le conditionnement de la salivation des chiens. Ce schéma est tiré des résultats de son expérience.
Schéma (suite) Pendant le conditionnement Stimulus neutre (SN) Stimulus inconditionnel (SI) Réponse inconditionnelle (RI) Après le conditionnement Stimulus conditionnel (SC) Réponse conditionnelle (RC) Stimulus inconditionnel (SI) Il suffit de présenter au chien la sonnette juste avant de lui donner la nourriture. Au bout d'un certain temps, après un nombre suffisant de présentation sonnette-nourriture, on va constater que le chien salive dès la présentation du premier stimulus. Une association est créée entre ces deux stimuli. Le stimulus neutre devient alors un stimulus conditionnel et provoque une réponse conditionnelle de salivation sans que la présentation du stimulus inconditionnel ne soit nécessaire.
Exemples chez les êtres humains L’expérience du petit Albert (Watson) Les phobies et les autres réactions de peur Les aversions gustatives La salivation en lisant un menu de restaurant
Phénomène lié : la généralisation Survient lorsqu’un stimulus semblable à un stimulus conditionnel provoque une réponse semblable à la réponse conditionnelle. Exemple : après le conditionnement, le petit Albert n’avait pas seulement peur des souris blanches, mais de plusieurs autres petits animaux blancs et même d’un manteau de fourrure blanche.
Phénomène lié : la discrimination La réponse conditionnelle est obtenue face à certains stimuli bien spécifiques, mais ne se manifeste pas face à des stimuli semblables. Exemple : une personne peut développer une phobie des gros chiens, sans toutefois avoir peur des petits chiens.
Phénomène lié : l’extinction La réponse conditionnelle peut diminuer et disparaître lorsque le stimulus conditionnel est présenté trop souvent sans le stimulus inconditionnel. Exemple : dans l’expérience de Pavlov, lorsque le son de la cloche n’est plus suivi de l’apparition de nourriture, la réponse de salivation diminue, puis disparaît.
Phénomènes liés : récupération spontanée Réapparition de la réponse conditionnelle après une période d’extinction. Exemple : une personne qui avait autrefois une phobie des seringues peut soudainement avoir de nouveau une réaction de peur lors d’une prise de sang chez le médecin.
Pause
Conditionnement opérant Fondateur : Burrhus Frédéric Skinner Association entre notre comportement et l’effet favorable ou défavorable produit sur l’environnement. La fréquence du comportement est ensuite modifiée en fonction des conséquences engendrées. Skinner est un psychologue américain. Il est le fondateur du béhaviorisme radical. Il a été fortement influencé par les travaux de Pavlov et de Watson. Il a été élu par ses pairs comme l'un des psychologues les plus importants du 20e siècle. Influence sur la fréquence d’un comportement. Par exemple, lorsque je suis très jeune, si mes parents me punissent lorsque je crie après ma sœur, je vais avoir tendance à répéter moins souvent ce comportement pour éviter d’être puni. Si je viens d’avoir un chien et que j’essaie de lui apprendre à venir lorsque je dis son nom, je vais le récompenser par un biscuit lorsqu’il répond à mon appel pour favoriser la répétition de ce comportement.
Expérience de Skinner Un rat est placé dans une cage (« Boîte de Skinner »). Le but est d’apprendre au rat à peser sur le levier pour qu’il puisse s’alimenter par lui-même. La boîte de Skinner comprend un levier et un plat vide pouvant recevoir de la nourriture lorsqu’on appui sur le levier.
Expérience de Skinner (suite) Pour cela, on utilise la technique du façonnement, c’est-à-dire qu’on récompense les comportements se rapprochant du comportement cible. Continu Intermittent Le rat apprend ainsi en fonction des conséquences de son comportement. Façonnement : on récompense les comportements se rapprochant du comportement cible. Par exemple : se tenir devant le levier, lui toucher, puis finalement l’abaisser. Continu : on récompense toujours le comportement cible. Intermittent : on récompense le comportement cible de façon irrégulière.
Définitions : renforcement Augmente la fréquence d’un comportement. Renforcement positif (R+) : survient quand on présente un stimulus qui fait augmenter les probabilités de répétition d’un comportement. Exemple : gagner au casino.
Définitions (suite) Renforcement négatif (R-) : survient quand on supprime un stimulus désagréable afin d’augmenter les probabilités de répétition de la réponse initiale. Exemple : être exempté de faire la vaisselle.
Définitions : punition Diminue la fréquence d’un comportement. Punition positive (P+) : survient lorsque l’ajout d’un stimulus désagréable diminue la probabilité de répétition d’un comportement. Exemple : recevoir une contravention. Exemples : Punition + : si un jeune enfant essaie de grimper sur un meuble et tombe par terre, il se fera peut-être un peu mal, ce qui diminuera la probabilité qu’il essaie de nouveau. Si je roule trop vite sur l’autoroute et que je me fais arrêter, j’aurai une contravention à payer. Punition - : si un enfant se comporte mal durant le souper, alors ses parents peuvent le priver de dessert. Si vous n’avez pas étudié durant la semaine précédant un examen, vous allez devoir étudier toute la fin de semaine et vous serez peut-être obligé d’annuler une soirée avec vos amis.
Définitions (suite) Punition négative (P-) : survient lorsque le retrait d’un stimulus agréable diminue la probabilité de répétition d’un comportement. Exemple : être privé de dessert.
Tableau résumé Positif/ Positive Négatif/Négative Renforcement Ajout d’un stimulus agréable Retrait d’un stimulus désagréable Punition Ajout d’un stimulus désagréable Retrait d’un stimulus agréable Mettre l’accent sur le fait que le renforcement sert à augmenter la probabilité d’un comportement et que la punition sert à diminuer cette probabilité alors que les termes + et – signifient qu’il y a ajout ou retrait d’un élément. Le terme positif ne signifie pas quelque chose d’agréable et le terme négatif ne signifie pas quelque chose de désagréable.
Synthèse Conditionnement classique : Stimulus inconditionnel amène une réponse inconditionnelle. Stimulus neutre + stimulus inconditionnel (association) provoque la réponse inconditionnelle. Stimulus neutre devient un stimulus conditionnel et provoque la réponse conditionnelle. Conditionnement opérant : Renforcement : augmente la fréquence d’un comportement (R+, R-). Punition : diminue la fréquence d’un comportement (P+, P-).