vendredi 14 février 2014

Le renforcement négatif et les phases

Les méthodes de type Parelli/La Cense sont souvent montrées comme étant l'archétype du renforcement négatif. Cependant ces méthodes n'ont pas été développées par des scientifiques, et elles ne constituent donc pas un programme d'application pur et simple du renforcement négatif. En particulier, elles proposent une méthodologie de l'apprentissage basée sur le concept de phases ; or il peut y avoir apprentissage en R- sans phases.
1. Les phases dans la méthode la Cense


Expliquons la méthode sur un exemple : l'enseignement du reculer à distance. Dans la méthode La Cense/Parelli on propose les phases suivantes :
  • phase 1 = un doigt qui fait non
  • phase 2 = longe qui oscille doucement
  • phase 3 = longe qui oscille plus fort
  • phase 4 = longe qui oscille suffisamment fort pour que le mousqueton tape l'auge du cheval
La méthode consiste à commencer en phase 1, si le cheval ne produit pas le comportement attendu (au départ, juste un report de poids vers l'arrière) attendre 3 secondes puis passer en phase 2, puis attendre 3 secondes et passer en phase 3, puis attendre 3 secondes et passer en phase 4, et enfin faire ce qu'il faut pour que le cheval esquisse la bonne réponse.

2. Les phases et les différentes méthodes d'apprentissage

  • La phase 1, c'est en fait le code auquel on veut ensuite que le cheval réponde. Certains entraineurs (JB, HR) préconisent de ne mettre le code qu'une fois que le cheval a compris le comportement. Ici, le code est mis avant, ça évite de se poser la question de la mise sous code du comportement, je n'ai pas vraiment d'avis sur la question et ça ne me dérange pas vraiment. Au début c'est illusoire d'espérer que le cheval réponde à la phase 1 puisqu'il n'a aucune idée de ce que ça veut dire.
  • La phase 2 est en fait la première phase inconfortable pour le cheval. À ce stade, on voit qu'elle n'est pas douloureuse, il ne s'agit pas de faire mal, mais de mettre dans l'inconfort. Je ne suis pas sure par contre de connaître la limite entre inconfort et douleur, de savoir si c'est qualitatif ou quantitatif...? Cette phase est présente dans tous les apprentissages en R-. 
    • Dans un conditionnement opérant en R- classique, cette phase se poursuit jusqu'à ce que le cheval produise une réponse qui va dans le sens du comportement attendu. 
    • Dans la méthode la Cense ou Parelli, le dresseur attend 3 secondes et passe à une phase plus inconfortable si pas de réponse.
3. Critique des phases de la Cense/Parelli
  •  Statut de l'erreur
  • Dans cette méthode, je trouve que l'on fait passer l'idée que le cheval qui ne fait pas le bon comportement se trompe, fait mal, et que cela justifie d'augmenter l'inconfort et excuse la violence dans certaines phases 4.
  •  Laisser au cheval le temps et la possibilité de répondre
  • Comme l'explique Ben Hart, les chevaux, surtout si ils sont timides et qu'ils ont souvent été punis de ne pas produire le "bon" comportement qu'ils ne connaissaient pas, sont lents avant de proposer un comportement. Ils paraissent bloqués alors qu'en fait ils réfléchissent et hésitent. Augmenter le stress en augmentant l'inconfort, c'est leur donner encore moins de chance de réfléchir et de produire autre chose qu'une réponse de fuite. Il est connu que lorsque l'on est trop stressé, on répond toujours moins bien aux questions, on est "moins intelligent".
  •  La loi de l'action et la réaction
  • Les phases de la Cense sont en général soit des phases exploitant le réflexe de fuite, soit des phases exploitant une pression physique. Dans ce cas, dans ces méthodes, on cherche à apprendre au cheval à céder à la pression. Dans ce cas, lorsqu'on exerce une force sur le cheval, celui-ci exerce sur nous la même force. Par exemple si je tire un licol vers le bas pour faire baisser la tête à un cheval, la loi physique de l'action et de la réaction indique que le cheval est lui en train d'exercer une force vers le haut. Si je lâche le licol, sa tête va monter. Plus je tire fort vers le bas, plus lui aussi tire fort vers le haut. Et donc plus je tire, moins il est probable qu'il propose spontanément le bon comportement : baisser la tête.

4. Conclusion

Si je ne suis pas contre le travail en renforcement négatif que je continue à pratiquer, je suis désormais contre une utilisation systématique de phases dans l'apprentissage d'un comportement. Est ce que je ne vais jamais plus utiliser de phases? Je ne pense pas. En fait je pense qu'il ne faut jamais dire jamais. Il y a au moins une situation dans laquelle je continue à utiliser une sorte de phase : quand je suis dans une phase d'éducation en R- (travail d'un cheval dont le proprio ne veut pas utiliser de friandises, travail monté en classique, ... ) et que le cheval a compris quel comportement je veux, mais ne le produit pas avec assez d'intensité. Prenons l'exemple de la leçon de jambes : je sers un tout petit peu mes jambes, puis je relâche : j'ai appliqué le code qui veut dire : "plus vite". Si le cheval ne réagit pas, c'est qu'il ne connait pas le code. Si il accélère mollement, il connait le code. Dans ce cas, je vais faire
1) j'applique le code
2) je compte jusqu'à 2, si à 2 il n'y a pas l'intensité que je veux dans le comportement, je vais faire un renforcement négatif assez fort, mais très court et sans émotion: cravache derrière la jambe.
3) dès que le cheval part, je relâche tout et félicite de la voix.
Je ne dis pas que c'est une bonne méthode, mais c'est une méthode de R- que j'utilise.

UPDATE : il s'agit d'un ancien article relu et updaté 

5 commentaires:

elodie a dit…

Un constat que j'ai un peu fait comme ça aussi... J'ai l'impression que les chevaux qui ont appris qu'il pouvait proposer, R+ ou R- peut importe, cherche très rapidement une réponse au premier stimuli très bas...

Les chevaux travaillés avec monté en phase, sont vraiment plus long quand on repasse à attendre en phase 1/2 une réponse à proposer quelque chose... (dans un premier temps) Peur de l'erreur?! Ou simplement pas l'habitude de proposer.

Et que du coup un cheval qui propose, ça n'est pas forcément un cheval travaille exclusivement en R+... C'est peut être plus un cheval qui a le droit de proposer, l'on considère qu'il ne commet pas d'erreur...

Et je pense que la motivation (certainement aussi le relationnel) est renforcé aussi par ce point là : avoir le droit de proposer, être actif dans l'apprentissage.

Anonyme a dit…

Je mettrai quand même un point d'honneur à différencier le concept de la Cense à celui de Parelli. Même si le premier est issu du second, ce dernier ne cesse d'évoluer et présente aujourd'hui de nombreuses différence avec l'approche de la Cense, qui reste essentiellement axée sur le principe de confort/inconfort et de la monté en phase très scolaire ;).

zaude a dit…

Je suppose que tu es parelliste, tu défends ton clocher, c'est normal ^^

Pour moi ça reste blanc bonnet et bonnet blanc... Mais je t'accorde que à la marge il y a des différences, mais pour moi la philosophie de l'apprentissage derrière est la même.

Unknown a dit…

Super intéressant comme réflexion, effectivement, ça encourage le cheval à trouver des solutions. De toute manière avec mon poney, plus je monte en phase, plus il résiste fort et ensuite difficile de l'avoir connecté... Par contre, effectivement, c'est valable pour la phase d'apprentissage, mais pas une fois que l'exercice est acquis !

Unknown a dit…

Tes réflexions sont très pertinentes et avec la pratique, la recherche de finesse mais surtout de justesse avec le cheval j'en suis arrivé aux mêmes conclusions que toi.

Je laisse plus de temps de réflexion aux chevaux timides, il est inutile d'obtenir un quelque chose en force et dans le stress pour ensuite tenter d'apaiser un cheval qui a pris le pli de stresser dans cet exercice alors que l'on peut le lui apprendre directement dans le calme en étant un peu plus patient. Il est important de savoir lire dans le cheval s'il a compris ou non, s'il réfléchit, s'il est stressé, s'il hésite ou s'il a peur de mal faire et reste alors immobile.
Toutes les variantes existent et savoir les différencier est un réel plus pour un bon apprentissage.

L'utilisation des phases sur un cheval qui connaît déjà le code est top aussi. En même temps tu utilise l'effet de surprise pour inciter le cheval à être plus à ton écoute, plus concentré sur toi et en obtenant ce que tu souhaitais au départ sans lourdeur. Tout bénef quoi !