Comment le cheval apprend
par
Andrew McLEAN
1ère partie: Instinct, mémoire et renforcements
 
 
 
  Les cavaliers talentueux savent éduquer correctement les chevaux; ils savent quand et comment utiliser les aides, et leurs résultats en sont la preuve. Ils acquièrent ce savoir-faire soit par expérimentation (Par tâtonnements), grâce à leur sensibilité, soit en ayant reçu eux-mêmes un très bon enseignement. Il est fort possible que bon nombre d'entre eux ne connaissent pas les mécanismes réels de l'apprentissage chez le cheval, mais en aient à la place une approche intuitive.

La connaissance théorique de ces mécanismes permet de définir un système d'apprentissage pouvant s'appliquer dans toutes les situations, et offre à ceux qui ne savent pas intuitivement comment éduquer les chevaux la possibilité d'obtenir de meilleurs résultats. Elle permet également de mieux comprendre comment on peut modifier le comportement du cheval pour en éliminer les mauvaises habitudes. Les principes de l'apprentissage sont applicables à toutes les situations, que le cheval soit sous la selle, tenu en main, attelé, ou à l'état sauvage, là où ces stratégies d'apprentissage se sont formées et ont évolué.

Dans cette série d'articles, je vais décrire la manière dont les chevaux apprennent et n'apprennent pas, et comment l'apprentissage peut être accéléré ou entravé. En psychologie comportementale, l'apprentissage est défini comme une modification plus ou moins définitive du comportement faisant suite à un renforcement. Par renforcement, j'entends un concept apparenté au duo récompense-punition qui oriente l'apprentissage dans une direction particulière.

 
  Fruit de l'évolution, le cerveau du cheval est merveilleusement doué pour apprendre différentes sortes d'informations, de manières diverses. Le cheval a une excellente mémoire visuelle du monde physique et des comportements qu'il a à adopter en réponse à ce qui s'y déroule; ces comportements, que l'on nomme habitudes, se manifestent de manière extrèmement rapide, telles des réponses automatiques. Cette mémoire, d'accès très rapide, est maintenue à long terme. N'étant pas masquée par des processus mentaux plus complexes comme le raisonnement et l'imagination, elle permet des réactions précises et instantanées.

L'expression de ces réactions est influée par les comportements instinctifs tels que la réponse de fuite (Peur), le besoin de rapports sociaux (Le désir du cheval d'avoir de la compagnie.), l'établissement d'une hiérarchie sociale, les pulsions sexuelles, la faim, la soif et de nombreux autres facteurs internes tels que la santé, la vigueur, les hormones...

Lorsque les cavaliers veulent apprendre au cheval les mouvements sous la selle, ils rencontrent une pierre d'achoppement qu'ils sont souvent enclins à ignorer: leur propre équilibre. Seule une pratique suffisante dans une position correcte pourra vous apprendre les aspects les plus subtils de l'équilibre juste. Il est fort peu recommandé d'apprendre l'équilibre sur un jeune cheval, car cela entraînera inévitablement chez lui le développement de mauvaises habitudes: un placé incorrect, dû aux déplacements involontaires de votre équilibre et de votre centre de gravité; des problèmes d'impulsion et d'engagement, ainsi qu'une bouche dure, causés par le fait de vous accrocher sur les rênes pour tenter de conserver votre équilibre. L'équilibre précis, que ce soit en position assise ou en suspension, doit être constamment surveillé par une personne compétente, et seul un enseignant efficace pourra vous faire progresser rapidement. C'est seulement quand le cavalier aura acquis un équilibre précis qu'il pourra ressentir si le cheval est lui-même en équilibre; il pourra alors utiliser les renforcements appropriés pour guider le cheval dans la recherche de son équilibre.

L'aboutissement de l'apprentissage est l'établissement d'habitudes, de réponses automatiques. Ces habitudes existent dans le cerveau sous la forme de circuits neuronaux et de sustances chimiques spécifiques. Dans les premiers stades de la formation de ces habitudes, ces structures sont fragiles; elles deviennent plus solides et permanentes au fur et à mesure des répétitions et avec le temps. En règle générale, il semble qu'il faille environ 3 à 7 répétitions consécutives pour déclencher leur formation, et plus pour les voir commencer à devenir plus solides, ceci à condition bien sûr que le cheval ait à chaque fois reçu immédiatement et de manière appropriée un renforcement. Celui-ci peut se présenter sous la forme d'une suppression de toute pression (Céder dans ses mains et dans ses jambes.), de nourriture ou de tout autre renforcement primaire comme par exemple gratter la base de la crinère.

Plus le renforcement sera fort, plus l'habitude se formera rapidement. Il est important d'éviter en permanence la réponse de peur; en effet, la peur est un renforcement très fort et les habitudes qui s'y associent se forment très rapidement. Durant l'apprentissage, la formation des habitudes peut être accélérée par l'adoption de programmes d'entraînement de 3 à 7 répétitions d'une même tâche, entrecoupés de quelques minutes au pas rênes longues. Ce cycle devra être répété jusqu'à ce que vous ayez effectué 3 ensembles de 3 à 7 répétitions pour chaque tâche.

Par exemple, dans le cas d'un cheval refusant de partir au galop sur le bon pied (Un problème courant chez les anciens chevaux de course.), une méthode pour lui apprendre à prendre le galop correctement peut être de le lui demander à partir de l'épaule en dedans, ou en le menant à la longe, ou encore de le faire galoper sur un cercle sur lequel on aura préalablement installé une barre au sol (En maintenant l'encolure droite et en utilisant les aides extérieures.); quelque soit l'exercice choisi, il devra, pour être pleinement efficace, être répété de la manière décrite ci-dessus.

Un tel problème devrait idéalement être résolu avec l'aide d'un professionnel qualifié, car il est généralement exacerbé par un mauvais placer et un manque d'équilibre. En règle générale, plus le cheval a un tempérament calme et peu réactif, plus le nombre de répétitions nécessaires pour parvenir au même résultat a tendance à augmenter. J'ai constaté, dans le cas spécifique de la modification comportementale, que l'apprentissage est accéléré significativement par l'utilisation de cette stratégie.

Un autre aspect important dans l'utilisation des répétitions est que celles-ci doivent s'enchaîner le plus rapidement possible. Le départ au galop, par exemple, aura bien plus de chances d'être effectué correctement si le cheval a encore à l'esprit la séquence des évènements de la répétition précédente. Plus le délai sera long, moins il y aura de chances d'obtenir à nouveau la nouvelle réponse souhaitée.

Pour prendre un autre exemple, le cheval ayant fait un refus à l'obstacle (A supposer qu'il n'ait pas été gêné par une faute du cavalier.) doit être reconduit à sauter cet obstacle le plus rapidement possible, et ce saut doit être répété au moins 3 autres fois. Chaque répétition doit être suivie d'une récompense immédiate, afin d'accélérer l'apprentissage et d'étouffer la tendance au refus. Plus le délai entre les répétitions s'allonge, moins le cheval peut apprendre de la correction, et plus il a de chances de découvrir que le refus peut être une alternative envisageable. Je pense qu'apprendre de cette manière au cheval à être de bonne volonté constitue un atout important, notamment en compétition.

L'approche correcte pour erradiquer les habitudes indésirables est d'empêcher leur expression. Par exemple, si le cheval a tendance à s'effondrer sur son épaule intérieure en un point précis du manège, le cavalier doit empêcher ceci de se produire les fois suivantes en applicant plus fortement les aides s'y opposant juste avant d'arriver à cet endroit, puis céder et récompenser le cheval immédiatement. Ces mesures doivent être maintenues au moins pour les 3 fois suivantes, juste pour être sûr que la tendance a été éliminée et qu'une habitude ne commence pas à se former. Il ne sert à rien d'essayer de s'attaquer au problème après que l'habitude ait été exprimée.

Dans tous les cas, quand il y a nécessité de corriger une habitude indésirable chez le cheval, il faut prendre soin de rechercher et d'éliminer les causes premières de cette habitude; ainsi, une fois erradiquée, elle aura beaucoup moins de chances de réapparaître.

Se cabrer est une habitude rencontrée chez les chevaux n'étant pas dans le mouvement en avant, ou de manière plus fréquente étant empêchés de se porter en avant par des mains sévères. Une fois apprise, cette habitude offre au cheval un moyen d'évasion efficace qu'il utilise activement pour se dérober à son travail. Cette habitude dangereuse se rencontre aussi chez les chevaux n'ayant pas appris durant leur débourrage à se porter activement en avant, et en premier lieu à marcher au pas avec de bonnes enjambées; cette lacune pourra être la source de problèmes futurs lorsque le cheval aura à subir plus de pression pour se porter en avant de la part de son cavalier.

 
  Le mot renforcement est abondamment utilisé en théorie de l'apprentissage; comme je l'ai expliqué plus haut, il désigne à la base un stimulus faisant croître ou décroître la probabilité d'un comportement lui étant associé de se produire de nouveau.

Comme l'écrit si justement Tom Roberts :
"Si le cheval tire d'un comportement un profit quelquonque, que ce soit en recevant de la nourriture ou en ayant un rapport social, par la cessation du travail ou la suppression de toute forme de pression, par le gain de liberté s'il parvient à s'échapper, ou même simplement par le fait de différer le travail, alors ce comportement est renforcé et la probabilité de le voir se reproduire augmente."
Par exemple, donner de la nourriture au cheval après qu'il soit venu à vous accroît la probabilité qu'il vienne de nouveau les fois suivantes et se laisse attraper facilement. On distingue les renforcements selon leurs caractères primaire ou secondaire, et positif ou négatif.

Un renforcement primaire agit en relation directe avec les instincts naturels du cheval: la nourriture, le sens du toucher, la douleur en sont de bons exemples. Un renforcement secondaire, lui, agit en étant associé à un renforcement primaire par apprentissage: flatter l'encolure du cheval, le féliciter ou le gronder vocalement ("C'est bien.", "Non !"...). Les renforcements secondaires n'ont aucun effet en eux-mêmes si l'on n'a pas appris au cheval à les associer à un renforcement primaire. C'est pourquoi flatter ou donner de grandes tapes sur l'encolure est une manière humaine et inappropriée de récompenser le cheval pour son comportement; il vaut bien mieux gratter la base de la crinière, surtout qu'une étude récente a montré que c'est à cet endroit là que le fait de gratter le cheval induit en lui le plus de relaxation. En selle, récompenser par de la nourriture n'est pas toujours pratique; de plus, cela peut ammener le cheval espérant recevoir une récompense à quémander, entraînant ainsi la perte de la concentration et du placer, et conduire à l'incorporation dans le répertoire des comportements appris d'habitudes indésirables. En conséquence, gratter la région du cheval en avant de la selle est la récompense la plus simple et la plus efficace que vous ayez à votre disposition.

Donner au cheval quelque chose qu'il aime pendant ou juste après un comportement désiré constitue un renforcement positif. Celui-ci se distingue de la récompense par sa synchronisation précise avec le comportement à mettre en valeur. Le terme récompense a un sens vague, il n'implique en effet aucune nécessité de synchronisation: on peut en effet récompenser un cheval quelques millisecondes ou de nombreuses minutes après le comportement approuvé.

La récompense différée est inefficace par rapport au renforcement positif, car du fait de l'intervalle de temps, le cheval ne peut tout simplement pas établir de rapport entre le comportement récompensé et la récompense. Le seul résultat utile de cette récompense différée est qu'elle contribue à renforcer les liens entre vous et votre cheval, ce qui, en soi, est hautement désirable. Mais ne tombez pas dans le piège consistant à penser que le cheval pourra apprendre quoi que ce soit d'une récompense différée; quelques friandises après une bonne séance de travail consolident les liens qui vous unissent à lui, mais ne servent pas à récompenser son bon travail.

La meilleure manière de récompenser un bon travail est de le faire pendant ce travail, immédiatement après avoir obtenu une réponse désirée. Mettre le cheval rênes longues et lui gratter le garrot pas plus tard qu'une ou deux secondes après une réponse correcte sont les plus puissants moyens de récompenser à la disposition du cavalier, étant donné que celui-ci ne peut pas mettre pied-à-terre dans ce laps de temps; en effet, descendre du dos du cheval constitue aussi pour lui une récompense.

La majeure partie de l'éducation du cheval est accomplie en utilisant le renforcement négatif, qu'il ne faut pas confondre avec la punition. Il n'a rien à voir avec elle, et encore moins avec la violence. Le renforcement négatif se définit par le fait de supprimer un stimulus que le cheval n'aime pas (Comme par exemple la pression de votre jambe.), utilisé pour produire la réponse désirée (Par exemple céder à cette jambe en déplaçant ses hanches.), au moment même où le cheval se soumet.

Le renforcement négatif doit se produire pendant le comportement non désiré, et non pas après lui. Cela peut être par exemple le tapotement régulier du stick de dressage, maintenu tant qu'une réponse incorrecte est obtenue, et cessant instantanément lorsque la réponse correcte commence.

Par opposition, la punition est le fait d'infliger un stimulus douleureux après un acte. L'utilisation de la punition différée dans le cadre de l'entraînement des chevaux est en partie le reflet de la mentalité vengeresse de notre culture traditionnelle, et est basée sur le préjugé injuste et faux que le cheval peut associer les relations de cause à effet d'évènements séparés par le temps. Autrement dit, quand vous faites souffrir votre cheval pour punir ses fautes, la connection sera faite seulement avec le comportement ayant directement précédé la correction. En fait, la punition ne peut être efficace que si elle advient immédiatement après la réponse incorrecte, à condition qu'elle soit utilisée judicieusement et seulement une fois. Elle devrait de toutes façons n'être utilisée que dans le cas de résistances dangereuses.

Le résultat de la punition différée est que la réponse correcte ne pourra pas être incorporée dans la mémoire du cheval, et que sa réponse de peur sera sollicitée en proportion du degré de douleur infligé. Cette dernière aura alors toutes les chances d'être exprimée par une tentative de fuite. Pour parler clairement, disons que la punition sert largement à faire se sentir mieux celui qui l'inflige, et que des études ont montré que chez certains humains la violence peut être un renforcement.

Pour bien réaliser la différence entre renforcement négatif et punition, prenons l'exemple d'un cheval craintif qui a l'habitude de donner un coup de pied défensif à chaque fois que vous touchez son arrière-main. Le punir après son coup de pied ne pourra que le rendre encore plus craintif et plus nerveux, et il y a de bonnes chances pour qu'il essaie de taper encore plus fort. Cela peut durer longtemps...

Considérez maintenant une approche par le renforcement négatif: prenez un long stick de dressage, et tapotez régulièrement avec, d'abord le long du flanc du cheval, puis en descendant le long de sa jambe alors qu'il tente de taper; n'arrêtez et n'éloignez le stick que lorsqu'il cesse de lui-même de vouloir taper. Vous devriez ainsi pouvoir faire progressivement disparaître ce dangereux comportement.

 
  En modification comportementale, les comportements tendent le plus souvent à se réduire en intensité plutôt qu'à diparaître immédiatement. Ruades et cabrés se réduisent progressivement à des gestes symboliques, avant de finir par disparaître complètement. Ceci est dû au fait que le comportement est généré par des habitudes associées à des circuits neuronaux, et que ceux-ci ne peuvent pas simplement disparaître; ils doivent être modifiés progressivement, et cela prend du temps, comme lorsque l'on essaie de modifier le cours d'une rivière.

Lors de la correction de problèmes chez le cheval, cela permet à l'entraîneur professionnel d'avoir devant lui quelques délais pour apprendre au cavalier d'une part à maintenir et encourager le nouveau comportement, et d'autre part à identifier les vestiges de l'ancien vice afin d'écraser dans l'œuf toute tentative de réapparition. Chaque comportement, qu'il soit bon ou mauvais, est généré par la présence dans le cerveau d'un ensemble de connections neuronales; ces structures, qui font partie de l'acquis, ont été créées par l'action du monde physique sur le cheval, et sont donc en fait en grande partie dues au cavalier.

Vous devez toujours veiller à récompenser toute tentative du cheval allant vers un comportement désirable, grâce au pouvoir du toucher couplé à la parole. En dépit de sa remarquable mémoire, ses capacités d'association restent limitées, ce qui veut dire que vous ne devez pas lui en vouloir pour son comportement. Les décisions d'agir d'une certaine façon ne sont pas chez le cheval le produit d'une approche réfléchie, comme c'est le cas chez l'être humain; elles sont plutôt une représentation directe des circuits neuronaux les plus renforcés dans son cerveau et de ses pulsions et instincts naturels, comme la peur, la dominance, la curiosité...

Etre conscient de ceci devrait améliorer considérablement la compréhension des moyens à utiliser pour établir les bonnes habitudes et anéantir les mauvaises. En effet, vu sous cet angle, le cheval n'est pas responsable de son comportement car il n'a pas de réel libre-arbitre. Il apparaît beaucoup plus comme étant la victime des réponses qui lui ont été apprises.