Transidentité - analyse

Coréen


Pré-traitements

Avant de commencer l'analyse du texte coréen, il faut savoir que la langue coréenne est une langue qui fonctionne avec des particules en postposition. Nous avons donc énormément de formes du même lexème:

Même lexèmes pour le coréen

Vous pouvez voir ici que notre motif "트랜스젠더" est suffixé de nombreux et divers particules.

Après avoir essayé d'effectuer une analyse sur cette version du corpus, nous avons remarqué que les résultats n'étaient pas du tout représentatifs du corpus car, le pôle source n'utilisant pas les expressions régulières pour réaliser ses calculs, iTrameur ne prenait pas en compte toutes ces formes suffixées.

Par conséquent, nous avons donc décidé de passer par une étape de séparation en morphèmes en utilisant un analyseur morpho-syntaxique nommé mecab. La ressource de mecab que nous avons décidé d'utiliser est la librairie Python, que nous avons utilisée dans un petit programme nous permettant de segmenter le corpus en morphèmes, tout en gardant les retours à la ligne pour éviter que tout soit regroupé sur une seule ligne et pour ainsi nous assurer une certaine lisibilité.

Script mecab
#!/usr/bin/env python3 # -*- coding : utf-8 -*- import mecab if __name__ == "__main__": mecab = mecab.MeCab() path = '/media/sf_Dossiers_Ubuntu/projet_ELODIE_LEA/' corpus_morpheme = open(path + 'CORPUS_KR_segmentation_morphemes.txt', 'w') with open(path + 'CORPUS_KR_corrige.txt', 'r') as text : for line in text : liste_morphemes = mecab.morphs(line) for morph in liste_morphemes : corpus_morpheme.write(f'{morph} ') corpus_morpheme.write('\n') corpus_morpheme.close()

Pour plus d’informations, un article sur notre blog est consacré à cette phase de segmentation.

Le fichier engendré par ce programme est donc notre corpus coréen dont les tokens sont maintenant les morphèmes.

Pour certains motifs qui nous intéressent dans nos requêtes, nous allons considérer ces tokens comme une seule unité en les liant d'un blanc souligné. Bien sûr, il ne faudra pas oublier de retirer cette ponctuation de la liste des délimiteurs.

Nous avons donc effectué un pré-traitement supplémentaire en regroupant les mots suivants en une seule unité.

Exemple de regroupement de lexèmes pour le coréen Exemple de regroupement de lexèmes pour le coréen

D’un point de vue personnel, nous trouvons que nous perdons quand même une certaine quantité d’informations du corpus en passant par cette segmentation. Mais, dans l’ensemble, le ratio des informations manquées reste moindre face à la quantité d’avantages que nous apporte cette méthode.

Notre corpus est maintenant prêt à être analysé.

Analyse

Nous précisons que nous avons pris comme liste de délimiteurs la liste suivante :

,;’'~|&#@=`-.?!%*$()[]{}:+«»§\/‘“”ʼ·…〈《◇■▲◆→

ATTENTION à ne pas oublier l’espace en début de liste

Nous rappelons que les pages numéro 11, 27 et 32 n'ont pas pu être aspirées. Par conséquent, les parties associées dans le corpus balisé sont vides.

Analyse du terme "transgenre"

Travaillons dans un premier temps sur le terme "transgenre".

En coréen, "transgenre" se dit de plusieurs manières. Nous avons, d'une part, "트랜스" (teuraenseu) ou bien "트랜스젠더" (teuraenseujendeo), qui résultent d'un emprunt à la langue anglaise. Et d'autre part, le terme sino-coréen "성전환자" (性轉換者 seongjeonhwanja) peut également être utilisé pour désigner les personnes transgenres.

Fréquence absolue 트랜스/트랜스젠더/성전환자

Parmi les termes désignant les personnes transgenres, "성전환자" est celui qui est le moins utilisé dans tout notre corpus. Et cela est notable. La ligne jaune est collée à 0 presque tout le long du graphique de fréquence absolue. Le terme "트랜스" n'est également pas beaucoup employé comparé à "트랜스젠더".

"트랜스젠더" est utilisé 940 fois tandis que "트랜스" et "성전환자" ne sont employés que 62 fois et 8 fois dans le corpus.

Néanmoins, avec le dictionnaire proposé par iTrameur et le nuage de mots, nous remarquons que "성전환" (signifiant "changement de sexe") est un terme relativement utilisé : 199 occurrences.

Dictionnaire transgenre 1
Dictionnaire transgenre 2

En ce qui concerne la spécificité de ces termes, "성전환자" n'est spécifique que pour le 6e texte du corpus.

Par ailleurs, nous pouvons voir dans le graphique que, même si le mot "트랜스" n’est pas énormément employé dans le corpus, il est tout de même particulièrement spécifique dans le 10e texte. "트랜스" est donc très sur-représenté dans ce texte comparé aux autres textes du corpus.

Pour le premier texte du corpus coréen, le mot "트랜스젠더" est très largement sous-représenté.

Indice de spécificité transgenre

Dans les segments répétés avec "트랜스", les collocations ne prenant pas en compte les particules du coréen sont :

segments répétés avec 트랜스

Nous avons des remarques concernant quelques segments :

  • “jour de commémoration des transgenres” fait peut-être référence au Transgender Day Of Remembrance
  • le “A” dans “transgenre A” est utilisé pour garder l'anonymat d’une personne (équivalent de “Monsieur/Madame X” dans la langue française)
  • Les segments les plus intéressants sont ceux qui concernent les droits de l'Homme et l'armée.

    Nous l'avons vu dans le nuage de mots : certains événements liés aux causes transgenres ont marqué la Corée. Mais un autre événement a également ébranlé la Corée: Un soldat de l'armée coréenne a fait son coming out transgenre et les institutions militaires n'ont pas très bien reçu cette nouvelle. Suite à cela, ce soldat s'est retrouvée au centre des médias et souhaitant réintégrer l'armée en tant que femme trans, elle a utilisé cette attention médiatique pour se battre pour ses droits et pour les droits des personnes transgenres.

    Par conséquent, en plus des thématiques se dégagent du nuage de mots, les discriminations que subissent les personnes transgenres sont également du domaine militaire.

    Vu le peu de fois que "성전환자" est employé dans le corpus, il n'y pas de segments répétés incluant ce terme.

    Mais pour le terme "changement de sexe" (성전환), les segments répétés affichent évidemment les noms "수술" (susul opération chirurgicale) et "여성” (yeoseong sexe/genre féminin) et “남성" (namseong sexe/genre masculin).

    segments répétés avec 성전환

    A travers ces segments répétés, nous pouvons voir que la lutte contre les discriminations des personnes transgenres semble être prise très au sérieux.

    Lorsque l'on regarde les cooccurrents des termes "transgenre", nous obtenons ceci.

    Cooccurrents de transgenre

    Parmi les cooccurrents ayant des indices de spécialité les plus importants, nous retrouvons certaines unités vues précédemment dans les segments répétés :

  • 해방전선 : front de libération
  • 여성 : sexe/genre féminin
  • 인권 : droit de l'Homme
  • 추모 : commémoration
  • Et dans les contextes, nous pouvons voir que ces termes sont en effet associés ensemble dans la plupart des cas.

    Contextes de transgenre 1
    Contextes de transgenre 2
    Contextes de transgenre 3

    Analyse du terme "discrimination"

    Nous avons également analysé le terme "discrimination" (차별 chabyeol), qui était un des points importants de notre problématique.

    Apparaissant 333 fois, il fait partie d'une des unités les plus employées dans le corpus.

    Dictionnaire pour 차별

    Néanmoins, il est assez mal réparti : beaucoup plus fréquent dans la deuxième partie du corpus. Son indice de spécificité y est aussi plus élevé, comparé au reste du corpus.

    Fréquence absolue discrimination
    Fréquence relative discrimination
    Indice de spécialité discrimination

    Un pic est particulièrement notable pour le 38e texte du corpus. Il est présent dans les graphiques de fréquence (relative et absolue) mais également dans le graphique des spécialités, où l'indice de spécificité est particulièrement élevé et donc sur-représenté dans ce texte.

    Sur le même schéma que les fréquences, le terme "차별" (chabyeol) signifiant "discrimination" est plus spécifique dans les textes de la seconde partie du corpus. Ce terme n'est sur-représenté que sur cette moitié du corpus. Dans la première partie du corpus, "차별" est davantage en sous-représentation.

    Du point de vue des cooccurrences de "차별", un terme se démarque particulièrement des autres.

    Le terme “금지법” (loi prohibitive) est celui qui a une co-fréquence et un indice de spécificité le plus élevé parmi les cooccurrents du terme discrimination.

    Cooccurrences discrimination 1 Cooccurrences discrimination 2

    Dans les cooccurrents de "차별", on retrouve souvent le trigramme "차별 금지법 제정" (institution d'une loi contre la discrimination).

    Contextes discrimination 1

    Dans les différentes formes de discriminations auxquelles les transgenres font face, le terme "transphobie" est revenu dans les sujets.

    Concernant le terme "transphobie"

    Nous avons considéré les termes transphobie ("트랜스 포비아", "트랜스젠더 혐오" et "트랜스 혐오") et transphobe ("트랜스젠더 혐오자"). Ils sont composés d'un mot se référant aux transgenres et d'un autre qui désigne la haine ("포비아" phobie, "혐오" haine/dégoût). Par ailleurs, "트랜스 포비아" (teuraenseu pobia) est un emprunt à l'anglais "transphobia". Nous rappelons que vous avons rassemblé ces mots en une seule unité grâce à l'ajout d'un blanc souligné.

    Malgré la notion très présente de haine envers les transgenres au sein du corpus, les mentions à la transphobie sont très faibles (17 occurrences au total) et assez disparates.

    Dictionnaire transphobie Ventilation formes de transphobie

    Vu le peu d'occurrences de ces unités textuelles dans le corpus, les traitements de cooccurrence ne donnent pas de résultats très concluants.

    Cooccurrents de transphobie

    Que peut-on donc tirer de toute cette analyse?

    D'après le dictionnaire de iTrameur, les mots pleins les plus fréquents se réfèrent aux personnes transgenres, à l'identité de genre et aux discriminations. Dans notre corpus, la mention des personnes transgenres est plutôt associée à des sujets où ils/elles sont placé.e.s en position de victimes. Les différentes formes d’inégalités semblent bien ressortir dans les médias coréens.

    Le nuage de mots et l'analyse sur l'iTrameur nous confirment que les transgenres en Corée subissent des discriminations sur le plan :

  • législatif, avec les lois anti-discriminations et la défense des droits des personnes transgenres,
  • médical, avec les opérations chirurgicales,
  • civil, avec les difficultés rencontrées lors du changement de sexe qui entrainent d'autres problèmes, notamment dans le domaine militaire,
  • scolaire et social, avec la haine à laquelle ils/elles font face.
  • Cependant, on souligne une vision assez progressiste et une réelle volonté de dénoncer les discriminations et de faire en sorte que les transgenres soient plus acceptés dans la société coréenne.