Après la lecture du livre de Pierre Legendre, Le Tour du monde des concepts, nous nous sommes interrogés sur ce qui pouvait être perçu différemment selon les pays et les cultures. Nous avions également envie de traiter un sujet relatif au Covid, car, d’une part, nous nous sentions très concernés par le sujet, et, d’autre part, parce qu’avec la gigantesque quantité d’articles sortant tous les jours sur le Web, nous avions à disposition une base de données très riche.
Et cela nous a fait réfléchir sur le rôle des médias dans la pandémie, cette dernière ayant mis en lumière la question de la surinformation, mais aussi (et surtout) de la mésinformation…
Le sujet s’amène finalement assez logiquement si l’on se pose la question ainsi : quel sujet a été évoqué en masse par les médias, sous différents angles, et qui a fait l’objet d’informations parfois contradictoires ? Les masques !
En effet, après une courte discussion, nous nous sommes rendus compte que les masques étaient considérés comme normaux en Chine, alors qu’ils venaient de faire leur apparition dans le paysage français et américain. Et si aujourd’hui, le masque est obligatoire dans les transports et certains lieux publics, il a fait l’objet de controverses en France. En mars 2020, la porte-parole du gouvernement avait déclaré que les masques « n’étaient pas nécessaires pour tout le monde ». Aux Etats-Unis, le Président avait affirmé en mai 2020 qu’il n’allait probablement pas porter de masque et avait dissuadé ses alliés Républicains de ne pas en porter car cela «enverrait un mauvais signal » au public.
Il semble donc que dans les médias de ces deux pays, le mot « masque » aurait une vie mouvementée. En est-il de même pour la Chine ?
Puisque nous supposons que l’usage du mot par les médias a évolué dans le temps, nous avons constitué un corpus chronologique. Cela a posé plusieurs questions méthodologiques : quelles sont les limites temporelles ? Comment représenter les dates dans le corpus ? Quelles mesures doit-on faire et à quelle fréquence ? Tout un ensemble de difficultés que nous avons surmonté tant bien que mal , tout en ayant conscience que nos solutions étaient loin d’être les meilleures. Le but du projet n’est donc pas de créer une analyse diachronique extrêmement complète, mais plutôt de repérer quelques variations quand cela est possible - to catch a glimpse .
Nous avons décidé d'étudier l'évolution de l'emploi du mot depuis le début de la pandémie (janvier 2020) jusqu'à la fin de l'été 2020, car c'est à cette dernière période que les masques sont devenus obligatoires un peu partout dans le monde.
La conclusion se trouve à la fin de la rubrique Nuages de mots. Nous espérons que votre visite sur ce site vous sera agréable, et que nous pourrons , à l’issue de ce travail, dire « bas les masques » à ce mystère linguistique !
Kengrong FANG et Menel MAHAMDI
Nous avons décidé de créer deux scripts différents. Au fur et à mesure que le projet avançait, Kengrong a dû rajouter des éléments spécifiques au traitement du chinois. Par exemple, il a eu besoin d'un sous-programme de segmentation pour créer les bigrammes.
Ce script fonctionne de la manière suivante:
->Il vérifie si le code http est bon. Si oui, il vérifie si la page aspirée est compressée ou non. Si oui, il la décompresse.
->Si le code http est bon, il vérifie l'encodage. Si l'encodage est bon, il lance les traitements.
->Si le code http n'est pas bon, il teste l'option --location de curl. Si le problème est réglé, il passe à l'encodage et aux traitements.
->Si l'option --location n'a pas marché, l'url n'est pas traitée.
->Pour ce qui est de l'encodage, c'est toujours la même chose : si l'encodage est bon, on traite, sinon, on essaye de le repérer avec curl. Si cela ne marche pas, on lance la méthode detect url. Si cela ne marche pas, on ne traite pas le fichier.
->Le programme créée aussi un fichier concaténé , composé des dumps séparés par des balises.
Ici le script est plus complexe. Il remplit les mêmes tâches que le corpus précédent (sauf la décompression). Mais il y a plusieurs autres programmes qui ont été appelés dans le script.
Observations :
- On remarque des similitudes entre les bigrammes français et anglais: vers la fin de la liste des urls, on retrouve "mask mandate", "mask policy", "masque obligatoire", ce qui montre que les médias mettent l'accent sur le caractère réglementaire du masque.
- On ne remarque pas de croissances linéaires des occurences à travers le temps.
- Les contextes nous montrent qu'au début, aux Etats-Unis, les masques sont décrits comme une pratique asiatique.En France comme aux USA, on évoque la pénurie, puis l'efficacité discutable des masques. Plus on avance dans le temps, et plus les médias encouragent les lecteurs à en porter, en évoquant les masques en tissu. Enfin on observe vers la fin du corpus l'émergence des questions sociales liées au masque. En France, on parle du niqab, tandis qu'aux USA, on parle du droit constitutionnel de refuser à porter un masque.
- Dans le corpus français, le mot "masque" gagne progressivement des places dans l'index hiérarchique. Dans le corpus américain, l'index de "mask" est assez haut la plupart du temps mais fluctue plus.
Observations :
- D'abord pour le corpus en chinois, on a collecté des données dans quatre régions : la Chine continentale, Taïwan, Hong Kong et Macao.
- Dans le corpus, on a constaté une similarité dans ces régions : le port du masque est devenu une nouvelle norme sociale. En plus, sauf Taïwan, toutes les régions ont souffert d'une pénurie de masques.
- Les contextes nous montrent aussi que la Chine continentale a commencé à exporter des masques après la reconstruction du système médical.
- Cependant, on ne remarque pas de croissances linéaires des occurences à travers le temps.
>>> Cliquer sur les images pour les agrandir
• Dictionnaire :
On peut constater que le mot “mask” apparaît sous des formes variées , telles que “masks”, “facemasks”, “MASKS" etc...On prendra en compte le pluriel "masks" et le mot "facemasks" dans les autres analyses , car ils sont plus fréquents.On constate que la forme au pluriel est plus utilisée que celle au singulier.
• Schémas de coocurrence :
À part “mask”, on a également décidé de chercher “masks” et “facemasks”. Pour “mask” et “masks”, on a des similitudes :ces mots sont souvent accompagnés par des mots comme “porter”, “médical”, “chirurgical”, “N95” et “pénurie”. Mais il y a aussi des différences : le singulier est utilisé en compagnie de mots qui évoquent l'obligation et les troubles sociaux : "should", "mandates", "public", "attacked", "violation". La forme au pluriel en revanche est utilisée avec des mots plus médicaux ("respirators", "medical") et une dimension pratique ("fitting","cloth","DIY", "produce", "types"...).On voit que les mots employés ont moins de force déontique ("recommends" au lieu de "mandates").
Quand il s’agit de “facemasks”, on a un résultat encore plus orienté vers l'obligation, avec des mots tels que “governement”, "necessary", et “officials”. Il semble ici que “facemasks” est une forme plus soutenue du mot "mask". Donc les médias semblent préférer utiliser cette forme quand ils parlent des décisions gouvernementales. Comme cette forme est moins fréquente, on peut en déduire que “mask”, plus simple et plus court, est devenu la forme utilisée dans le registre courant.
• Réseaux de coocurrences :
Les réseaux de coocurrences nous montrent un phénomène intéressant. On remarque une division de la distribution des coocurrents en fonction des groupes de personnes.Les adjectifs "masked" et "unmasked" sont associés à différents groupes. Ainsi, les manifestants (“protestors”), sont sans masques(“unmasked”). D’un autre côté, les députés (“Representatives”), ont des masques ("masked").
Ce qui est encore plus intéressant, c’est que la conjonction "mais" (“but”) fait le lien entre l’état de porter un masque (“masked”) et l'objet lui-même (“masks”). Cela montre qu'il y a des problèmes de plusieurs natures liés au masque. Ces problèmes nous sont donnés dans le réseau de l'objet : la pénurie ("shortage"), la manière de le porter ("adjusts"), les conflits ("attacked")...
On voit également que ne pas porter de masque ("maskless") a été mal perçu par la société ("backlash").
• Dictionnaire :
On voit une similarité dans les formes utilisées du mot, avec une forme au singulier et une au pluriel. On analysera donc les deux.Pourtant, ici, c'est la forme au singulier qui est la plus fréquemment utilisée. D'ailleurs, dans le schéma de ventilation, la courbe monte progressivement, contrairement au pluriel, dont la courbe augmente entre fébrier et mars 2020, puis redescend.
• Schémas de coocurrence :
Selon les schémas, on voit que l'utilisation en France est similaire de celle aux Etat-Unis.On retrouve des coocurrents anglais et français identiques, comme "porter", "femme", "millions", "chirurgicaux"... Le langage de la presse en Occident est finalement assez uniforme. Ici encore, la forme au singulier attire des mots évoquant l'autorité comme “obligatoire” et “obligation”, ainsi que les questions plus politiques avec "niqab". Le côté pragmatique (production, vente, types) est employé avec la forme au pluriel.La pénurie a également touché la France, et on sent encore un impact fort avec "explosent".
• Réseaux de coocurrence :
Les réseaux de coocurrence dénotent le même phénomène que les schémas de coocurrence. On voit qu'en France, il a eu moins de débats clivants concernant le masque : on n'a pas le coocurrent "sans" équivalent à "maskless", par exemple. Mais plutôt, on voit un consensus, et moins d'animosité envers cet objet, comparé aux Etats-Unis.Finalement, le seul enjeu politique saillaint tourne autour de la laïcité.
Pour le corpus en chinois, on va l’étudier de manière différente. On va utiliser iTrameur pour une analyse générale. Ensuite, on va utiliser les nuages de mots pour analyser la progression du mot “MASQUE” dans le temps. Cette deuxième partie d’analyse sera dans la rubrique “Nuages de mots”.
• Coocurrence :
Pour commencer, on va regarder les coocurrences de mot “MASQUE”. Cette table montre les mots qui apparaissent le plus avec notre mot cible. On peut constater que quand les gens parlent du masque, ils utilisent souvent les mots accompagnés comme “chirurgical” (93 fois), “porter” (76 fois), “chirurgical” (22 fois, le mot “外科”et le mot “医用”ont le même sens dans ce contexte), “jetable” (25 fois), N95 (36 fois), “protéger” ( 52 fois), “sortir” ( 9 fois), “acheter” ( 22 fois).
• Schéma de coocurrence :
Dans le graphe fabriqué par iTrameur, il est évident qu’il existe une pénurie de masques en Chine, surtout de masques pour enfants. À part les masques, les gens veulent aussi du gel hydroalcoolique. Par ailleurs, il semble qu’ils comparent des masques jetables et des masques réutilisables, et il y a des contrefaçons de masques dans le marché.
Pour avoir le coeur net, on va regarder l’utilisation du mot “MASQUE” en contexte :
Après avoir analysé le contexte, les combinaisons les plus fréquentes sont “masque chirurgical jetable”, “porter un masque” et “la pénurie de masques”. Quand on voit “porter un masque”, le contexte nous montre que c’est souvent dans les situations de voyage. Pour le terme “la pénurie de masques”, on voit que des nouvelles usines ont été fondées pour fabriquer plus de masques.
Nous avons voulu savoir s'il y avait une "évolution" des nuages. Nous avons séparé le corpus concaténé par saisons plutôt que par vague du virus, car les vagues sont différentes entre les trois territoires.
Cliquer sur l'image pour zoomer
Observations:
- Le mot "France" est très présent dans le corpus, quel que soit le moment de l'année.
- En hiver, on remarque les mots "protection", "santé", et "Chine". Ce dernier mot indique encore que le regard des médias est tourné vers ce pays à ce moment de la pandémie.
- Au printemps, les mots "changer et "tissu" apparaissent. C'est le moment où les questions du masque fait-maison et des normes de port du masque émergent dans le débat public.
- En été, le mot "obligatoire" est très présent. Cela correspond à la période des premières lois concernant le port du masque.
Cliquer sur l'image pour zoomer
Observations:
- Les mots "New" et "Face" sont toujours très présents dans le corpus.
- En hiver, on retrouve les mots "Chine" ("China") et santé ("health") et l'idée de protection ("protect").Le mot "medics" (professionnels de santé) est mis en avant, contrairement à la France.Cela correspond au moment où les masques étaient livrés en priorité aux médecins hospitaliers.
- Au printemps, les mots "people","public" et "person" augmentent en fréquence : le masque est entré dans la société, et on ne parle plus de Chine, mais de monde ("world").
- En été, on aperçoit les mots "policy", "county","nation", "state" et "social" : clairement, le ton a changé, et le masque est devenu objet de législation, voir de discours politique.
Cliquer sur l'image pour zoomer
Observations:
- On va regarder la progression de ce mot selon les saisons. Pour chaque saison, on a fait un nuage de mots, et on va comparer les différences entre ces quatre images.
- Le premier nuage de mots est la situation en hiver 2020:
- Apparemment, il existe déjà des cas confirmés en Chine. Il y a des mots tels que “masque”, “chirurgical”, “pénurie”, “gouvernement”, “cas confirmé”, “patient”, “épidémie”, etc.
- Conclusion : En hiver, les gens ont déjà commencé à utiliser des masques, et la pénurie a apparu.
- Le deuxième nuage de mots est la situation au printemps 2020 :
- Il y a toujours des mots comme “masque”, “chirurgical”, et “gouvernement”. Mais on a aussi trouvé des nouveaux mots comme “école”, “lunettes”, ”vêtement de protection”, “stockage” et “coronavirus”.
- Cela signifie qu'au printemps, les gens ont pris la connaissance que le masque ne suffit pas pour se protéger, et la pandémie a déjà influencé l’éducation aux écoles.
- Le troisième nuage de mots montre la situation en été 2020 :
- Ici, on trouve des nouvelles combinaisons pour le mot “masque”. Par exemple, “masque contre la pandémie”, “porter un masque”, “commander des masques” et “exporter des masques”.
- Donc, on peut dire que la Chine a exporté des masques à l’étranger. Pendant cette période, quand les Chinois parlent du masque, il s’agit souvent du commerce international. En plus, vu que le mot “pénurie” n’existe plus, il est possible que la Chine a déjà augmenté la productivité des masques.
- Le dernier nuage de mots désigne la situation en automne 2020 :
- À part le mot “masque”, les mots comme “enfants”, “écoles”, “retours aux écoles”, “normalisation”, “législation” et “prix bas” sont aussi affichés.
- Donc, la pandémie est devenue moins grave en Chine, et le prix des masques a diminué. Le port du masque est devenu une nouvelle norme sociale, et on se concentre plus sur comment s'y adapter que sur sa légitimité ou sur son impact sur les relations sociales (contrairement à la France et aux USA).
En conclusion,on peut affirmer qu'en Chine, le masque est un outil essentiel de lutte contre le virus, et la société s'adapte à son utilisation. En France et aux Etats-Unis, au fil des mois, la perception du masque a évolué. D'abord optionnel, puis objet de protection, il est finalement devenu objet politique.
Etudier la vie d'un mot permet de mieux comprendre la vie d'une société. Ainsi, le mot “masque” révèle :
- l’évolution de la pandémie dans une région du monde.
- l’évolution de la perception d'un objet dans une société et des problématiques qui en découlent.
- les différences d'usage entre singulier et pluriel, qui ont ici des justifications pragmatiques et sociolinguistiques(et non purement morphologiques).
Étudiante en Master de Traitement Automatique des Langues à l’Université Paris Nanterre
Mail : mmahamdi@live.fr
Étudiant en Master de Traitement Automatique des Langues à l’Université Sorbonne Nouvelle
Mail : kengrongfang@gmail.com