LA VIE MULTILINGUE DES MOTS SUR LE WEB
L'intelligence Artificielle et la Robotique




Trameur Anglais


"Artificial Intelligence(AI)"




Pour analyser le corpus multilingue que nous avons constitué en anglais et en français, nous avons utilisé le logiciel Trameur, spécialisé pour l’analyse textométrique. Lorsque nous regardons tout d’abord l’anglais, nous pouvons constater que le fichier est bien encodé en UTF-8. Le vocabulaire utilisé est très mobilisé, puisque le nombre d’occurrences de formes est cinq fois plus grand que le nombre de formes.



Lors de la visualisation du corpus, nous voyons que le travail est bien balisé puisque les différentes parties du corpus s’affichent sur le Trameur.



Après annotations et affichage du Treetager du fichier, nous constatons qu les mots qui sont affiliés aux mots cibles “artificial intelligence” contiennent “robotics”, “Robotics” tel que nous l’avions imaginé au départ. Nous retrouvons également des termes tels que “digital” ou “Lab” (pour “laboratory”).



Pour le corpus français, nous voyons tout d’abord que l’encodage est comme celui de l’anglais, en UTF-8. Le nombre d’occurrences de formes est sept fois plus grand que le nombre de forms, induisant donc que le vocabulaire est ici aussi relativement homogène et bien mobilisé.



Trameur Francais


"Intelligence Artificielle(IA)"

Lorsque nous visualisons le corpus, nous constatons ici encore que les balises permettent l’affichage et la visualisation de chaque partie du corpus.



Après affichage du Treetager pour le français, nous constatons qu’il y a beaucoup plus de formes différentes affiliées aux mots “intellogence artificielle” qu’en anglais. Par exemple : “Applis”, “Transports”, “communication”, “logiciels”, “automatisation”, “progresser”, “experts”.



Contrairement à ce que nous avions pensé, les résultats sont différents dans les deux langues. Si l’anglais, comme nous l’avions imaginé, a tendance à mettre plutôt en relation l’IA avec la thématique de la robotique, le français, quant à lui, va être plus varié : nous retrouverons une plus grande gamme de variété de lexèmes différents. Le mot “robotique” n’apparaît d’ailleurs nulle part dans le Treetager français.



Notre hypothèse de départ postulait que l’utilisation de la combinaison “intelligence artificielle” (= “artificial intelligence”) serait en lien avec celle du mot “robotique”. Or, les résultats que nous avons pu faire ressortir avec l’anglais et le français nuancent cette idée. En effet, même si l’anglais est effectivement dans l’utilisation de ces mots ensemble, l’analyse du français a montré que dans celle-ci, la combinaison “intelligence artificielle” était plus variée et hétérogène.



Ainsi, notre postulat de départ est recevable pour l’anglais mais pas pour le français. Que faut-il donc en conclure ? Que la vie des mots sur le web, et donc leur vie réelle, est beaucoup moins prévisible que ce que nous pouvons avoir comme idées reçues.





Trameur Mandarin(Taïwan, Caractères traditionnels)


"人工智慧"







A Taïwan, pour parler de l'intelligence artificielle, les Taïwanais utilisent le mot "人工智慧" qu'ils écrivent avec les caractères traditionnels du Mandarin. Ce terme est différent des autres pays sinophones qui utilisent d'autres termes comme par exemple "人工智能" mais aussi en les écrivant avec des caractères simplifiés. Cela est déjà intéressant car l'on se rend compte que l'usage des mots peut véritablement être influencé par la culture, par l'histoire ou encore la politique du pays dont il est question. Ici, même si tous les locuteurs appartiennent à des pays dont la langue de l'État est le Mandarin, les évolutions du langage sont différentes.



Nous allons donc regarder les résultats des cooccurrences dans le Trameur.



Le premier terme le plus fréquent , "計算機科學", peut se traduire par "computer science" ou "informatique" (en tant que science), en français. La catégorie d'application de ce mot concerne les domaines "scientifique", "mathématiques", et aussi "informatique". On peut voir que l'intelligence artificielle est en fait fortement liée à l'"informatique" dans la plupart des occurrences relevées ici.



Le deuxième terme est 機器人, Ce terme veut dire la "robotique" en français soit la science qui regroupe les études techniques de conception et de mise en oeuvre des robots. Ainsi, la robotique est également très fortement corrélée à l'intelligence artificielle. Dans ce domaine, on retrouve notamment : le robot, la robotique, le chatbot, la machine, la technologie, etc. Les gens aujourd'hui croient et savent que ce sujet est l'un des plus populaires et ayant encore toute un champ de possibilité de croître encore dans le futur. Ainsi, l'intelligence artificielle, à travers la robotique, touche tous les niveaux : de la mécanique à l'industrie et l'économie, en passant par la recherche scientifique et l'opinion publique.



Ce sont les seules tendances fortes en Mandarin que l'on peut relever dans ce corpus. En fait, il n'y a pas beaucoup de mots intéressants en Mandarin qui sont sortis sur le Trameur. Nous avons eu l'impression (et étions presque certaines) que c'était parce que les écrits taïwanais sur l'intelligence artificielle reprenaient particulièrement les termes originaux et notamment le principal : "AI" de l'anglais "Artificial Intelligence" (lui-même également utilisé).

Ce phénomène d'anglicisation est très commun à Taïwan. Nous pouvons noter les enjeux économiques liés à ce phénomène qui est plutôt vendeur, mais également l'arrière-plan historique : Taïwan a de nombreuses fois été colonisées par les occidentaux et les asiatiques. Il en résulte la conservation de son environnement multi-ethniques et multi-culturel.