Studio Java

Pourquoi ce mot ?

Présentation multilingue...

FRONTIÈRE est un mot qui dans les langues que nous avons choisies possède toujours au moins deux sens distincts. Un que l'on pourrait qualifier d'abstrait, l'autre de concret.

Ce mot est très présent sur le web dans ses deux sens, mais selon la langue son environnement textuel peut varier. Ce projet nous permet de constater les différences sémantique mais aussi d'usage qui se rattache au mot d'une langue à l'autre.

Mais on verra également qu'au delà un variation d'usage, de graphie et quelque fois d'emploi, la FRONTIÈRE entre les langue est parfois bien ténue...


Voici les équivalences pour lesquelle nous avons opté :

Français : frontière
Anglais : border
Allemand : Grenze
Espagnol : frontera
Italien : frontiera
Portugais : fronteira
Finnois : raja
Russe : граница


Pour réaliser ce travail nous avons travaillé sur un environnement unix, soit sur le shell pour ceux utilisant Linux (ou MAC) ou sur Cygwin pour les autres.
Nous avons codé en BASH un script qui nous permet de récupérer à partir d'un fichier d'urls, le contenu de ces urls, des les réencoder en utf-8 si besoin et d'extraire le contexte textuel de nos mots cibles.


ICI le script BASH (!)


Vous trouverez sur ce script après l'avoir téléchargé, chaque ligne commentée et expliquée pour une meilleure compréhension de notre travail, nous avons eu quelques problèmes techniques par rapport à ce qui était demandé et si la solution qui est parfois adoptée n'est pas la meilleure c'est parceque souvent c'est la seule qui fonctionnait.



copyleft