Reflexions, le site de vulgarisation de l'Université de Liège


Le profane, juge éclairé de la justesse vocale

03/12/2015

Qu’est-ce qui fait que l’on perçoit la justesse d’un chanteur ou d’une chanteuse ? Difficile de le définir objectivement. C’est pourtant ce à quoi parvient Pauline Larrouy-Maestri, chercheuse à l’institut Max Planck et collaboratrice scientifique du département de psychologie de l’Université de Liège. En quantifiant des critères objectifs de justesse à l’aide de programmes informatiques, et en comparant les jugements subjectifs de professionnels de la musique et de profanes, elle a pu évaluer la perception de la justesse chez les deux groupes de juges. Ces recherches nuancent grandement l’idée communément admise selon laquelle les professionnels de la musique auraient de meilleures capacités à déterminer la justesse de la voix.

singing voiceQue ce soit en écoutant la radio, en regardant l’une des nombreuses émissions de télé réalité cherchant à débusquer la prochaine célébrité de l’été, ou même en entendant un proche s’époumoner sous la douche, nous sommes quotidiennement amenés à juger l’habileté de nos semblables à chanter juste. Que ce soit consciemment ou non, de manière objective ou non, appuyés de connaissances approfondies ou non, nous avons tous nos critères et nos armes pour graduer des échelles de jugement allant du statut de casserole à celui de chanteur professionel. Distinguer grossièrement les deux extrêmes semble être une tâche enfantine pour le commun des mortels. La question devient plus épineuse quand elle est réquisitionnée pour des recherches d’ordre scientifique. Parce que, dans le fond, que signifie « chanter juste » ? Et que signifie « percevoir la justesse d’un chant » ? La réponse peut être plurielle. Des phénomènes différents s’entrecroisent. Il y a des questions d’ordre physique, d’ordre acoustique, des questions liées à nos héritages culturels, des critères très objectifs et d’autres liés à des appréciations individuelles, etc. Difficile, donc, de savoir à quoi renvoie le jugement de la justesse du chant.

C’est à ces questions complexes que s’intéresse Pauline Larrouy-Maestri, chercheuse au département des neurosciences du Max Planck Institute en Allemagne, et au département de psychologie de l’Université de Liège. Elle a publié dans PLOS ONE un article (1) consacré à la comparaison des jugements de profanes et de professionnels de la musique. Une étude sur base de critères quantitatifs rigoureux, dont les conclusions en étonnent plus d’un. Car à bien des égards, les personnes « non musiciennes » n’ont pas à rougir de leurs facultés à discerner le faux du juste. Une étude surprenante, qui s’inscrit à la suite de plusieurs années de recherches.

Une identification de critères objectifs

Entre des études de musique au conservatoire royal de Mons et un master en logopédie obtenu à l’ULB, la voie était presque tracée pour Pauline Larrouy-Maestri. Attirée par la recherche scientifique, elle rencontre Dominique Morsomme, chef de service à l’unité de logopédie de la voix à l’ULg, et amorce une thèse de doctorat sur la perception de la justesse. « Je me demandais ce qui faisait que nous estimions d’un chant qu’il était faux ou juste. Il y a un tas d’émissions de télévision qui nous exposent à ce type d’évaluation mais personne ne sait réellement identifier les phénomènes qui rendent un chant juste ou faux. »

Pour la jeune chercheuse, il fallait donc dans un premier temps se concentrer sur une mesure objective et quantifiée de la justesse. Elle s’est pour cela penchée sur des programmes informatiques consacrés à l’acoustique et à la musique, optimisés pour satisfaire ses propres recherches. La voix, comme tous les sons, est un signal acoustique mesurable. Dans le cas de voix non entraînées, il s’agit essentiellement d’extraire la fréquence fondamentale de chaque note chantée et de mesurer la relation entre ces différentes fréquences pour vérifier si un chant était juste ou faux. « Ces outils m’ont permis de quantifier trois critères musicaux : les erreurs de contour mélodique, donc quand la fréquence de la note varie dans une direction inattendue, les erreurs d’intervalles, d’écarts trop grands ou trop petits entre deux notes, et enfin les changements de tonalité au cours du morceau. Ces changements arrivent quand une erreur d’intervalle n’a pas été compensée par la suite. Le chanteur ne l’a pas corrigée et poursuit donc dans une autre tonalité. »  

L’ordinateur contre les experts

Une fois le programme informatique développé, il fallait, pour l’alimenter, créer une base de données. La logopède, aidée d’étudiants, s’est rendue dans la rue, et a enregistré 166 volontaires, qui acceptaient de chanter « Joyeux anniversaire ». Un morceau facile et connu de tous. Dans cet échantillon se trouvaient des hommes, des femmes, des jeunes, des personnes âgés, des gens timides, d’autres qui aiment chanter… « La seule condition, souligne la chercheuse, était qu’ils n’aient pas une voix entraînée. Je voulais que l’échantillon soit exclusivement composé de gens qui n’ont pas formellement appris à chanter. »

Ces séquences ont ensuite été quantifiée selon les trois critères développés. Pour chacune des 166 performances, Pauline Larrouy-Maestri disposait ainsi d’une analyse objective de trois types d’erreurs possibles, et donc de trois valeurs. Dans la foulée, la chercheuse a sélectionné 18 experts ayant suivi plusieurs années d’études de musique classique ou ayant une expertise vocale. Ils ont évalué les 166 chants selon une échelle de 1 à 9 allant de « pas juste du tout » à « très juste ». « Nous disposions donc d’une part de trois critères de justesse objectifs, et d’autre part, de 18 évaluations subjectives de juges experts. Nous pouvions comparer ces données entre elles, appliquer des analyses statistique pour observer la relation entre les avis des différents juges et la valeur des trois critères mesurés. » Il en résultait une forte corrélation entre le critère objectif et le jugement des différents experts. Par exemple, si l’ordinateur identifiait pour une performance de nombreuses erreurs d’intervalle ou de tonalité, les juges cotaient cette même performance d’une mauvaise note (voir pour plus de détails « Les profanes se joignent à l’étude », ci-dessous). Une première étape dont les résultats, publiés en 2013 dans le Journal of Voice, ont été reconvoqués pour la présente étude. Car si la chercheuse venait de trouver un modèle capable de quantifier et d’expliquer la perception de la justesse par l’oreille humaine, ses expériences, qui ne touchaient alors que des experts, ne faisaient que commencer.

Bon nombre d’études montrent les bienfaits de l’apprentissage de la musique. Les musiciens ont de meilleures performances d’attention, de concentration, dans la perception des sons, dans l’apprentissage d’autres langues, et développent des facultés qu’ils parviennent à transférer pour d’autres activités. « Je ne dis pas que ces études ne sont pas fondées, nuance la logopède. Mais de leur point de vue, elles dressent le portrait du musicien comme une personne aux facultés cognitives particulières. Et pourtant, j’ai des amis non musiciens qui chantent mieux que moi, ou qui ont une acuité auditive sensible, et qui peuvent repérer et reproduire des sons, ou retrouver un thème sur un piano sans ne jamais avoir appris à jouer de cet instrument. A force d’entendre des systèmes musicaux qu’on ne connaît pas, on finit par les intégrer. Et toute notre vie, nous chantons ou nous écoutons de la musique. A l’école, on en crée ensemble, on s’amuse à écrire des chansons… Donc, quelque part, nous sommes tous musiciens. Et de la même manière, nous sommes tous amenés à évaluer, à juger les performances des autres. »

Les profanes se joignent à l’étude

« Nous sommes tous musiciens ». C’est donc cette intuition que la logopède a suivie pour vérifier scientifiquement que les non musiciens avaient une formation musicale implicite. Pour mener à bien son expérience, elle a réitéré l’évaluation des 166 versions de « Joyeux anniversaire » auprès de 18 juges, profanes, cette fois-ci. Les juges devaient ne pas avoir eu de formation musicale, mais devaient toutefois entendre correctement (audiométrie normale et pas de score déficitaire à la batterie de Montréal d’évaluation de l’amusie). Ils ont aussi été choisis de manière à pouvoir proposer des profils similaires à ceux des experts. Même proportion d’hommes et de femmes, de jeunes et de personnes âgées, mêmes milieux socioculturels… La seule différence majeure était l’absence de formation musicale. Contrairement aux experts, les non experts ont dû passer le test deux fois, à quinze jours d’intervalle. La manœuvre devait permettre de vérifier qu’ils ne changeaient pas leurs critères de jugement d’une fois à l’autre, ce qui aurait signifié que l’expérience était en elle-même un processus d’apprentissage trop influent.

Experts non expertsLes grandes lignes de la recherche se lisent dans la figure ci-dessus, qui recense les relations entre les avis des différents juges et les résultats des trois critères objectifs. La première colonne représente les données du groupe d’experts (remontant à l’article de 2013), la deuxième et la troisième colonne les données des deux récoltes des non experts. Sur l’axe des ordonnées, la gradation allant de 0 à 1 représente le coefficient de corrélation entre les résultats objectifs et les avis des juges. Plus le coefficient est proche de 1, plus les critères objectifs analysés par l’expérimentateur sont corrélés au jugement des juges. Par exemple, le premier cube en haut à gauche représente les avis des experts et le critère « déviation des intervalles ». Avant d’avoir été soumis au jury, les 166 versions de « Joyeux anniversaire » ont été analysées objectivement selon ce critère. En d’autres mots, les approximations autour des intervalles entre deux notes ont été quantifiées. Le coefficient de corrélation pour cette case se situe aux alentours de 0.8. « Un tel résultat signifie que les deux opérations sont liées, explique la chercheuse. Plus l’ordinateur enregistre une grande précision dans les intervalles, plus les juges, de leur côté, donnent une bonne note, ce qui est plutôt attendu et rassurant. »

La ligne rouge, présente sur chacune des cases, correspond au taux de significativité des résultats. Tout ce qui se trouve en dessous de cette ligne est considéré comme statistiquement significatif. « La relation entre le jugement et les critères objectifs ne tient pas du hasard. Si on reproduisait la même expérience, on aurait plus de 95% de chances d’obtenir les mêmes résultats ou, autrement dit, que le résultat observé a moins de 5% de chances d’être obtenu par hasard» Un autre point général à comprendre sur cette figure est la gradation des abscisses, allant de 1 à 18. « La boîte noire au-dessus du nombre 18 représente la moyenne de l’ensemble des avis des 18 juges. A sa gauche, elle représente la moyenne de 17 des 18 juges, pris au hasard, etc. Tout à gauche, il s’agit de l’avis d’un seul juge, toujours pris au hasard. Dans chacun des cas, on a observé la relation, la corrélation entre ces groupes de juges allant de 1 à 18 et les analyses objectives réalisées avec nos programmes informatiques. On remarque par exemple que dans la première case, il nous suffit d’avoir 3 juges pour avoir une très forte corrélation entre la mesure objective et l’évaluation. »

Un dernier petit détail doit encore être relevé avant de comprendre ce que révèle cette figure, il s’agit des « moustaches », plus ou moins grandes, qui s’élèvent de part et d’autre de chacune des petites boîtes noires. Si ces moustaches sont petites, la variabilité entre les avis des juges est faible. Si elles sont grandes, les juges n’ont pas répondu de la même manière entre eux. Une donnée importante. Car plus les juges sont d’accords entre eux, plus cela signifie que leur avis est consistant, lié à des critères d’évaluation clairs, objectifs, ou en tout cas conditionnés par des mêmes formes d’apprentissages. Les boîtes représentant des moyennes, il est logique qu’il n’y ait pas de moustaches pour le groupe de 18 juges, vu qu’il n’y a dès lors qu’une seule réponse. A l’inverse, ces moustaches sont plus grandes quand elles regroupent les avis séparés des 18 juges, tout à gauche de l’axe des abscisses.

Des non experts bien compétents

Plusieurs informations peuvent être dégagées de cette figure. Les coefficients de corrélation des experts et des non experts sont globalement semblables. Ce qui signifie que les non experts sont également « objectifs » lorsqu’ils jugent de la justesse d’un chant. Les résultats se trouvent également bien en dessous de la ligne rouge, ce qui les rend significatifs. « Toutefois, relativise la chercheuse, les moustaches des non experts sont plus grandes que les moustaches des experts. Cela signifie que les experts fournissent tout de même des réponses plus conditionnées que les non experts, qui sont plus variables dans leurs évaluations. Nous voyons qu’une sensibilité commune se dessine. En effet, si les non experts n’étaient absolument pas d’accords entre eux, les moustaches couvriraient toute la boîte. A partir d’un certain nombre de juges, les non experts ont des performances quasiment égales à celle des experts. »

Une deuxième observation concerne les deux tests proposés aux non experts. La figure montre qu’ils réagissent d’une manière similaire les deux fois. « Ce qui est encourageant. Quand on fait passer une même expérience deux fois dans un intervalle de temps assez court, on cherche à voir s’il y a un changement de stratégie ou un apprentissage. Ici, ce n’est pas le cas. » Ce résultat témoigne que le jugement des non experts est stable d’une fois à l’autre et qu’ils ont des connaissances suffisamment ancrées en eux pour qu’il n’y ait pas d’effet d’apprentissage significatif lors de l’expérience. La figure témoigne tout au plus de moustaches un peu moins larges dans la troisième colonne, donc d’une moins grande variabilité entre les évaluations des différents juges.

Cette figure illustre parfaitement la forte relation entre les critères de justesse mesurés et l’évaluation par des groupes d’experts mais elle ne permet pas de dire ce qui explique ou peut prédire les évaluations des juges. En d’autres mots, à quels critères objectifs de justesse nos oreilles sont-elles réellement sensibles ? « A l’aide de statistiques, on remarque que tant les experts que les non experts n’attachent pas beaucoup d’importance au respect du contour des mélodies pour juger du niveau de justesse d’un chant. » A l’inverse, les erreurs liées aux intervalles ont été prises en compte par les deux jurys. Par contre, seuls les experts semblent avoir pris en compte les changements de tonalité au cours d’un même morceau. « Ce qui peut sembler étonnant. D’un autre côté, c’est la notion qui apparaît le plus tard dans le développement, tant en perception qu’en production musicale. Cela ne signifie pas pour autant que les non experts n’entendent pas ce type d’erreur. Cela signifie en tout cas que ce n’est pas un critère suffisamment important pour eux et n’apparaît pas comme une variable  prédictive d’après notre modèle statistique. »

Les statistiques pour objectiver le subjectif

L’étude montre que la faculté à discerner le juste du faux résulte en partie d’un apprentissage musical implicite, d’un acquis qui concerne une majorité de la population. Le nombre d’années de pratique de la musique apporte bien évidemment des compétences, mais ne forme pas spécifiquement de meilleurs juges. Plus globalement, ce qui intéresse Pauline Larrouy-Maestri, c’est de rendre justice aux profanes et d’aller au delà des idées reçues pour bien comprendre d’où viennent d’éventuelles différences, « Dans beaucoup d’études, les différences entre deux groupes sont surestimées, simplement parce que l’un des deux groupes ne comprend pas ce qu’on attend de lui. Dans le cas présent, je pose une question toute simple. Tel chant est-il juste ou faux ? Si j’avais demandé de repérer les imprécisions liées aux intervalles ou de juger si le morceau était chanté dans la bonne tonalité, j’aurais eu de bien meilleurs résultats chez les experts que chez les non experts. Ces résultats auraient probablement été liés au fait que les non experts n’auraient pas compris la question. Ils n’auraient rien montré sur leurs facultés auditives réelles. SingersLa méthode développée ici permet de poser une simple question, accessible à tous, et ensuite, à l’aide de programmes informatiques et d’outils statistiques, d’examiner les raisons objectives qui peuvent influencer leur réponse. On dresse alors la relation entre des critères clairs qu’on a épinglés et l’évaluation des juges. On cherche donc par nous-mêmes à comprendre les motifs de leurs jugements. Ce type de méthode me paraît particulièrement intéressant et prometteur pour l’étude de sensibilités ou de jugements qui semblent initialement très subjectifs, que ce soit dans le domaine de la musique ou dans d’autres champs de recherche. »


© Universit� de Li�ge - https://www.reflexions.uliege.be/cms/c_404627/fr/le-profane-juge-eclaire-de-la-justesse-vocale?printView=true - 19 avril 2024