Barrage par AB & CJ

Exploration interréseaunale du mot barrage

Bienvenue sur la page de la mission d'exploration interréseaunale du mot barrage.

Objectif de la mission d'exploration

La mission d'exploration se décompose en deux sous-missions : la première, la mission d'exploration sémantique consistera à identifier les différents sens du mot barrage à l'aide d'un dictionnaire notamment le Trésor de la Langue Française Informatisé, la seconde, la mission d'exploration internétique dont le succès dépend du bon déroulement de la première, consistera, à l'aide de différents moteurs de recherche, à constituer une liste d'URLs qui sera triée selon les différents sens du mot barrage. Le but de la mission d'exploration est donc la création de fichiers contenant chacun une liste d'URLs identifiant des pages ayant la même utilisation sémantique du mot barrage. Cette recherche et ce classement seront effectués manuellement bien qu'une semi-automatisation en soit possible.

Objectif de la mission d'exploration en image

Un briefing d'une mission d'exploration sans carte, serait indigne, alors voici une simulation de la mission d'exploration en image.

Schéma de la mission
d'exploration

Commentaire sur cette image

 Le schéma se lit de haut en bas en suivant le sens des flèches. Ce schéma fait apparaître quatre symboles distincts.

On voit clairement que l'utilisateur est l'initiateur de la phase 1 et que dans le cas d'un traitement non automatisé, il est aussi le finaliseur de la phase 1, c'est à dire que c'est lui qui effectue le processus manuel. On constatera que la formalisation et l'analyse de ce que le projet doit faire, éclaire sur la manière dont on doit le réaliser.

Au coeur de la mission d'exploration

Exploration du réseau sémantique : les sens du mot barrage

Le dictionnaire utilisé pour l'identification des sens est le Trésor de la Langue Française Informatisé.La consultation de ce dictionnaire pour le mot barrage revèle, à l'exception des sens : "film Barrage" "barrage de guitare" "faire barrage", plusieurs sens qui pourraient se résumer par l'extrait suivant :

« Après le match de barrage perdu par son équipe sportive favorite, un supporteur déçu, fonce sur un barrage de police près du barrage hydraulique, précisement celui où le film Barrage fût en partie tourné. Un tir de barrage ne sera pas nécessaire pour l'arrêter, le supporteur ayant stoppé sa course avant que le drame n'ait lieu, privant ainsi le ministre de l'Intérieur d'une nouvelle allocution : « Par tous les moyens je ferai barrage à la violence dans les stades, les stades doivent rester un lieu de convivialité.» Néanmoins cet individu sera expertisé psychologiquement par un test de barrage. Lors de son arrestation il confia que si le barrage de sa guitare n'avait pas été endommagé, il aurait joué de celle-ci pour se détendre et ne serait pas, à l'heure actuelle, si mal barré. »

Pour plus de détails concernant les différents sens du mot barrage on pourra se reporter aux carnets de routes de l'exploratrice suivante :

Après avoir dégagé les différents sens du mot barrage, une réflexion s'impose afin de formuler des requêtes pertinentes destinées aux différents moteurs de recherches. Une requête pertinente est une requête dont la page de résultats révèlera un emploi commun du mot barrage. Dans le cadre d'une sélection manuelle, la formulation de requêtes pertinentes n'est pas vraiment indispensable car en parcourant des dizaines de pages de résultats on pourra sélectionner les URLs intéressantes. Toutefois si on veut automatiser la collecte et le classement des URLs, la formulation de requêtes pertinentes devient nécessaire. De plus elle accélère aussi la sélection manuelle en faisant en sorte qu'il n'y ait pas trop de pages à parcourir avant d'obtenir des pages représentatives des différents sens.

Exploration du réseau internétique : moteurs de recherche et requêtes

La création de ces requêtes n'est pas aisée. Prenons l'exemple de barrage au sens de barrage pour instrument de musique. Si on essaye une requête de type barrage+instrument avec google, on voit que le résultat n’est pas uniforme. En effet, un instrument peut être économique, construire un barrage est un enjeu économique. Mais la requête barrage+instrument+musique semble renvoyer une page uniforme, on peut donc sauvegarder cette page de résultat sous le nom barrage_instrument_musique.html.

Voici quelques sens retenus ainsi que les requêtes correspondantes :

Pour formuler ces requêtes, il a d'abord fallu rechercher à l'aide des moteurs de recherche des pages avec une requête contenant seulement le mot barrage. C'est en observant certaines pages sélectionnées au hasard que la formulation de la requête a pu être précisée.

On peut à partir de ces pages résultats, appliquer une procédure manuelle qui consiste à sélectionner les URLs et les copier en les groupants dans plusieurs fichiers respectifs.

Pour une sélection et un classement d'URL on pourra se reporter aux carnets de routes des explorateurs suivants :

Cependant on peut aussi automatiser cette opération de la manière suivante :

Critique de la mission d'exploration

Cette sélection des URLs à des limites et il faut bien savoir lesquelles pour pouvoir préciser ce que vont représenter les pages choisies à travers ces URLs. En effet nous ne sélectionnons qu'un sous-ensemble des pages du web où apparait le mot barrage.

Discrimination des résultats par les moteurs de recherche

Sélectionner tel ou tel moteur de recherche sélectionne déjà un sous-ensemble des pages du web. En effet aucun moteur de recherche ne peut les indexer toutes. On peut classer les différents outils de recherche selon les catégories suivantes :

On peut dire que ces deux types d'outils de recherche ne représente que la partie du web visible et indexable, le web invisible, celui des profondeurs pourra être accessible avec d'autres types de moteur de recherche tels les portails sectoriels et spécialisés, certains sont payants, d'autes gratuits :

Pour approfondir ses connaissances en matière de recherche sur internet on pourra se reporter à l'article en ligne de Amaury Mestre de Laroque dont cette partie n'est qu'un résumé partiel.

Discrimination des résultats par les requêtes

Une fois le ou les moteurs sélectionnés, la requête est un facteur discriminant. Certaines peuvent éliminer des usages du mot barrage. Par exemple "Barrage le film", et "barrage de guitare" furent trouvés par hasard sur une recherche générique avec uniquement le mot barrage. C'est à dire que si on créé des requêtes basées uniquement sur le sens du mot barrage que l'on connaît déjà, on se prive des pages utilisant des sens du mot que l'on ne connait pas encore, ce qui est dommageable. D'où l'importance de formuler des requêtes dont le résultat est le plus large possible puis de les affiner au fur et à mesure pour obtenir des résultats homogènes.

On concluera cette exploration en insistant sur le fait qu'il faut être conscient ou du moins avoir une idée de ce que l'on cherche afin de pouvoir qualifier ce qui est trouvé, de le sélectionner ou de le rejeter, c'est à dire pouvoir comparer ce que l'on a obtenu à ce que l'on attendait.

Menu