Secteur TAL Informatique

ILPGA Université Paris 3

Cours Modules L7T04/L8T07 : Notation du mini-projet BARRAGE PluriTAL 05-06

Etat courant des notes
idURLNomsnoteJMDnoteSFnoteBHremarquesJMDremarquesSFremarquesBH
1Voir la pageAleksandra Ristic (Inalco/Traductique) et Yannick LAM KIM (Inalco/Ingénierie Multilingue)141415ok, unitex en prime, bonnes connaissances du shell (find -exec)
j'aime pas que les url extérieures s'ouvrent dans la même fenêtre
la forme n'a rien d'extraordinaire
j'aime pas cette énorme page

Présentation : très synthétique (trop parfois), dommage aussi je crois de ne pas avoir tenté de présenter les choses de manière plus ergonomique, même si je n'aime pas trop les FRAMES, leur utilisation ici aurait été judicieuse pour offrir au lecteur une navigation simplifiée (en particulier pour donner à voir les résultats). Une autre solution consistait à utiliser une navigation via un menu (cf travail de Faïna et Sébastien)
Contenu : maîtrise des outils OK. L'ensemble du travail réalisé est globalement bien décrit.

Forme
Attention aux "ils" dont on ne sait pas à quoi ils renvoient.
C'est bien d'avoir un sommaire navigable tout au départ.
Fond
Pourquoi Le Monde serait-il le plus pertinent ?
Bonne utilisation des sources consultées.Bonne organisation des données et de leur exploitation (les copies d'écran sont utiles). Donnez des noms plus explicites à vos scripts.
Les comparaisons des scores selon les sources est instructive (y compris dans les scories : hydrolique). On voit le nombre de pages indexées respectivement par Google et par Yahoo.
2Voir la pageNévéna Pantikina (Inalco/Traductique) et Virginie Picard (Paris 3/pluriTAL)141614bonne idée de comparer mozbot/google, mais pas de raisons données aux différences
linguistiquement, peut-on aussi clairement affecter un sens à chaque occurrence de "barrage" ? du coup on risque de se retrouver avec des catégories inombrables (cf "barrage" d'un point de vue social, il n'y a qu'une URL)
le fichier fourni en argument de wget doit se terminer par .txt, disent-elles, car avec .doc, ça marche pas, mais c'est à cause du formatage interne du fichier que ça marche pas, pas à cause de l'extension ?
j'aime bien la page d'accueil, courte, mais ensuite les pages liées sont longues

Présentation : travail dont la présentation a visiblement été soignée (et "réfléchie") en essayant d'organiser au mieux les données montrées. Dommage que la circulation entre les pages ne soit pas plus ergonomique, l'utilisation de FRAME ou de MENU "pilotant" la navigation aurait été un plus : la page d'accueil avec des liens vers les autres pages est une amorce vers cela...
Contenu : le journal ressemble vraiment à ce qui était demandé et son contenu est largement détaillé, explicité et commenté...

Forme
Evitez les soulignés en dehors des liens.
Dans du code, les commentaires sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs). Par ailleurs, vos commentaires sont précis et utiles.
Fond
Introduction très claire.
Méthode d'échantillonnage de bon aloi.Bonnes indications sur le poids des sens.
Bonne présentation des modules utilisés.
Vous êtes claires sur ce qui n'a pas été réalisé.
3Voir la pageAurélia Trinquier (Paris 3/pluriTAL) et Claire Bonasso (Inalco/Traductique)121313c'est mal écrit, tout vous tombe dessus comme si on répondait à des questions autonomes, c'est pas une bonne idée de donner le même nom de pointeur vers les fichiers html et les fichiers texte

Présentation : j'aime bien la mise en avant des scripts, moins l'allure des tableaux (il manque les titres des colonnes d'ailleurs).
Contenu : maîtrise des outils OK. La partie "introductive" aurait méritée un peu plus de développement : le mot traité, la problématique linguistique, les moteurs utilisés et les pbs liés au tout est peu explicitée. Rien n'est dit ou montré sur l'organisation mise en place pour organiser les données. Je ne suis pas sûr que les raisons données pour expliquer certains pbs soient les bonnes... (si on passe sur un autre ordi, ça marche)

La conclusion aurait pu être directement sur la page d'accueil.
Attention aux couleurs dures (titre du journal).
Dans du code, les commentaires longs sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs).
Vos encadrés de code gagneraient à être plus larges (pour ne pas couper inutilement les lignes).
Fond
Bonne utilisation des requêtes négatives.
La présentation de lynx est restrictive.
Les images sont-elles vraiment inutiles pour une analyse linguistique ?
4Voir la pageWu Li-Chi (Paris 3/pluriTAL) et Chachaty Edmond (Paris 3/pluriTAL)111111tache1.txt ne peut servir à faire 2 choses différentes, on ne comprend pas pourquoi les usages divers de "barrage" n'ont pas été illustrés (c'était ce qui était demandé)
le tableau final aurait dû être créé automatiquement (avec moins de colonnes)
il n'y a pas de journal relatant les difficultés

Présentation : présentation très synthétique et "à plat", navigation verticale pas toujours pratique..., difficile de repérer l'organisation des choses et surtout de différencier les différents types d'information (en particulier dans les liens dont le libellé est souvent le même...)
Contenu : le contexte du projet et celui de sa prise en main ne sont pas montrés ce qui rend la lecture de l'ensemble un peu "rude", peu de commentaires sur le travail fait (les scripts écrits, l'organisation des données...), les distinctions de sens ne sont pas exploitées...

Forme
Evitez les soulignés en dehors des liens.
Fond
Noms des scripts non transparents.
L'objectif de chaque module devrait être explicité.
Vous avez fait les choses, mais vous n'expliquez pas beaucoup comment ni les conclusions que vous en tirez.

5Voir la pageOlga Semenova (Inalco/Traductique) et Ninon Payen (Inalco/Traductique)121313seul le journal est dans un style non-télégraphique, la page principale est trop succinte
on pourrait penser qu'il y a un tas d'étapes qui auraient pu être regroupés, vu le nombre de scripts donnés à la fin de journal, mais je ne veux pas me pencher sur chacun d'entre eux, au moins elles ont appris à écrire du code

Présentation : présentation (sans menu et donc peu ergonomique) mais l'idée, mise en oeuvre par d'autres aussi, de créer une page d'accueil synthétisant le travail va dans le bon sens. J'aime assez la tentative de mettre en avant typographiquement certaines zones textuelles...
Contenu : le journal retrace assez bien l'ensemble de vos activités, il est parfois un peu trop "au ras des choses", il y manque d'un peu de recul (pas simple de fait à présenter), la partie linguistique est très peu développée, idem sur la partie "organisation des données traitées".

Forme
Evitez les soulignés en dehors des liens.
Dans du code, les commentaires longs sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs).
Vous auriez pu faire des renvois aux tableaux plutôt que de les insérer (ce qui rend la page Journal trop longue). Idem pour les scripts.
Fond
La page d'introduction devrait donner une idée plus distanciée de ce qui a été fait.
Journal : vous ne motivez pas vos choix (pourquoi tel moteur ?).
Utilisation de filtres positifs plus fins : bonne approche.
Vous présentez de manière synthétique les commandes.
Bonne utilisation des ressources extérieures (mais si vouscitez Detagger, mettez une URL).
Vous ne motivez pas le fait de garder l'emploi en musique, pourtant rare.
6Voir la pageThomas Ragot (Paris 3/pluriTAL), Yann Hiard (Paris 3/pluriTAL) et Samia Achouri (Paris 3/pluriTAL)141415le cas de noms de fichiers identiques : sous linux, numérotation automatique des fichiers du même nom

la page de garde, avec les liens, semble montrer une structuration non-linéaire, mais on se retrouve en fait à descendre dans la mêmem page

quelques commandes shell non proposées en cours sont mises en eouvre (sed)

Présentation : très sobre mais efficace
Contenu : maîtrise des outils OK, belle présentation des scripts, dommage que la partie linguistique soit peu documentée, le lien vers le TLF n'est plus valide (cf la solution consiste à utiliser l'URL suivante : http://atilf.atilf.fr/scripts/fast.exe?mot=barrage

Forme
C'est bien d'avoir un sommaire navigable tout au départ.
Mettre en italiques les mots cités.
Bon découpage en niveaux avec liens. Les scripts auraient pu être dans des pages de niveau inférieur.
Bon jeu sur les couleurs dans le code.
Dans du code, les commentaires longs sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs).
Fond
Bonne utilisation des ressources extérieures.
Bonne motivation des sources employées.
Cygwin ne se limite pas à une émulation du shell bash.
Bonne analyse de détail des contraintes des modules utilisées, y compris en fonction des données qui leur sont soumises.
Recul sur les outils utilisés.
7Voir la pageAlexey FEDOROV (Inalco/Ingénierie Multilingue), Natalia KOZHINA (Inalco/Traductique) et Evguénia KROUGOVAïA (Inalco/Traductique)131312leur travail n'a pas de valeur linguistique, disent-ils à la premièer page : c'est inquiétant

les pages mettent un temps infini à s'ouvrir, ça m'énerve

ils n'ont pas utilisé egrep -A -B, du coup le contexte est misérable

utilisation de commandes non vues (basename, sed...)

les programmes sont soignés, mais le reste est superficiel


Présentation : je me cite... "présentation (sans menu et donc peu ergonomique) mais l'idée, mise en oeuvre par d'autres aussi, de créer une page d'accueil synthétisant le travail va dans le bon sens...". Dommage que la compréhension du découpage sémantique de la page d'accueil ne soit compréhensible qu'après avoir lu le journal. Je ne suis pas sûr que le rapport "couleur de police / image de fond" soit toujours efficace, notamment pour la lecture
Contenu : le journal retrace de manière trop synthétique : la partie linguistique est très peu développée, idem sur la partie "organisation des données traitées"...

Forme
Belle mise en page (attention cependant à la cohérence et à ne pas en faire trop. La qualité typographique rime généralement avec simplicité).
Evitez les soulignés en dehors des liens.
Donner un nom au lien vers les fichiers HTML.
Mettre une conclusion sur la page d'accueil.
Fond
"Nous tenons à préciser que les résultats de notre travail ne portent pas de valeur significative du point de vue linguistique, le but principal étant de mettre en place une méthodologie de recherche et d'extraction d'information" : juste.
Il faut commenter davantage vos choix, vos résultats, les étapes.

8Voir la pageHAMRI Nacer (Paris 3/pluriTAL), RATSIMBA Hoby (...) et GAGOUM Parfaite (...)111112bonne idée de suivre le mot "barrage" au cours du temps, mais orthographe franchement fantaisiste

organisation de certaines pages également fantaisiste

ces histoires de classement des sens de barrage pourraient être fondées sur des chiffres, ça ferait plus sérieux

j'aime bien cette idée que barrage_hydraulique se subdivise lui-même en barrage_voûte et autres

on est un peu enfermé dans chaque page, avec nécessité de revenir à l'accueil

beaucoup de liens sont morts

egrep n'est pas utilisé avec -A et -B


Présentation : Un apprentissage de HTML serait bénéfique, le rendu actuel est peu satisfaisant : rapport couleur fond/police, l'alignement de texte via des blancs n'est pas satisfaisant... de plus certains liens ne fonctionnent pas (c'est d'autant plus embêtant que ces liens pointent vers les scripts-résultats)
Contenu : le début de la présentation (introduction, aperçu historique, répartition sémantique) constitue la partie "dense" du travail, la partie "traitement avec les outils" est plus modeste voire "pauvre" (cf liens "défectueux vers les résultats)

Forme
Attention aux couleurs dures.
Vous devriez ne pas limiter la page d'accueil à un sommaire.
Evitez les soulignés en dehors des liens.
Attention à l'orthographe.
Fond
Bonne analyse de la difficulté du problème. Bon ancrage lexicologique et lien avec les données.Bon questionnement sur la répartition des sens.
Le commentaire des commandes devrait être plus précis (et il faudrait définir le rôle de chacune d'elles).
Des liens sans cible.
9Voir la pageFaïna Ramdani (Inalco/Traductique) et Sébastien Delahaye (Inalco/Ingénierie Multilingue)161813ergonomie excellente

beaucoup de connaissances shell mises en oeuvre

je trouve l'informatique très professionnelle

Présentation : la solution retenue pour présenter le travail est effectivement une des (meilleures) solutions la plus efficace : un sommaire générique permettant à tout moment de naviguer dans les différentes pages. De plus le rendu visuel est tout à fait efficace (choix de police, couleur...)
Contenu : très bonne maîtrise des outils (ceux prévus par le projet et d'autres d'ailleurs). Le contenu propre du rapport final couvre globalement bien les choses mais parfois un peu rapidement : le contexte linguistique est survolé, dommage aussi que les scripts utilisés ne soient pas "commentés" ni même visibles au sein des pages (cf d'autres travaux l'ont fait de manière élégante et précise).

Forme
Bonne circulation dans le site.
C'est bien de trépider, mais restez plutôt dans le genre "rapport de projet".
Noms de scripts clairs.
Fond
Essai de tenir compte des sens rares.
Les indications sur les commandes pourraient être plus proches d'une page de manuel pour faciliter leur réutilisation.
C'est bien d'être allé au delà de ce qui était demandé, mais le commentaire de ce qui a été réalisé en souffre un peu.
10Voir la pageEgle RAMDANI (Paris 3/pluriTAL) et Svetlana TSARKOVA (Inalco/Traductique)141315toujours cette longue page

elles se sont posées des questions sur le traitement de la langue et tout le monde ne l'a pas fait


Présentation : très synthétique (trop parfois), dommage de ne pas avoir tenté de présenter les choses de manière plus ergonomique... la présentation commentée du script est une bonne idée. Attention le lien vers le TLF utilise un lien "temporaire", la solution était d'utiliser l'URL suivante : http://atilf.atilf.fr/scripts/fast.exe?mot=barrage"

Contenu : tout y est mais la présentation ne rend pas trop compte de l'évolution du travail (comment on passe du script initial non présenté au script final). La maîtrise des outils semble acquise.

Forme
C'est bien d'avoir un sommaire navigable tout au départ.
Evitez les soulignés en dehors des liens.
Bonne utilisation des couleurs dans le code commenté.
Dans du code, les commentaires longs sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs).
Fond
Grande finesse dans l'analyse des sources. Filtres précis (y compris négatifs).
Analyse précise des difficultés rencontrées.

11Voir la pageVioleta Ordonez (Paris 3/pluriTAL) et Claire Guiraud (Inalco/Ingénierie Multilingue)121516elles réfèrent à des dossiers (documentation et corpus) en fait inaccessibles

c'est un peu désordonné, elles parlent des arborescences utilisées, on s'attend à les trouver, mais rien, elles parlent subitement de pb technique

trame générales peu claire

Présentation :je me cite de nouveau... "présentation (sans menu et donc peu ergonomique) mais l'idée, mise en oeuvre par d'autres aussi, de créer une page d'accueil synthétisant le travail va dans le bon sens..." avec ici un effort supplémentaire pour ordonnancer la structure des informations données à voir. J'aime pas trop le "rose" mais bon... Par contre, la coloration "distinctive" pour certaines zones de texte (remarque, question/problème technique est bien vue
Contenu : globalement satisfaisant, des survols ou des impasses (contexte linguistique...), par contre et c'est un exception dans l'ensemble des travaux, un effort a été fait pour donner à voir la structure de l'arborescence construite pour mener à bien le projet (les 2 images sont biens), dommage par contre que les scripts utilisés ne soient pas "commentés" ni même visibles au sein des pages. Pourquoi, la partie documention annoncée dans votre structur n'est-elle pas accessible en particulier au moment où les outils associés sont sollicités ?

Forme
Evitez les soulignés en dehors des liens.
Attention aux couleurs dures.
Vos liens doivent dire qu'ils sont des liens sans qu'il faille "tirer la manche du lecteur" (Cliquez ici pour...)
Fond
Bonne structuration du travail et du rendu (y compris avec l'arbre dessiné).
Bonne utilisation de filtres (y compris négatifs).
Compréhension fine (jeux de caractères par exemple) des commandes et adjonction de commandes complémentaires.
Problèmes de liens relatifs : bizarre !
12Voir la pageBruno Raffard (Paris 3/pluriTAL) et Zahir Maafa (Inalco/Ingénierie Multilingue)121315confusion aval/amont ?

détails inutiles (sur cygwin), assez verbeux parfois tout en contenant pas mal de fautes d'orthographe

dans le tableau général, beaucoup de liens morts

encore une très longue page, malgré un souci louable d'organiser chaque étape

Présentation : Un apprentissage de HTML serait bénéfique, le rendu actuel est pensé je crois comme s'il s'agissait d'un "objet texte traditionnel" (type document word avec table des matières) alors que la publication web nécessite souvent des méthodes de publication différente. (Remarques ponctuelles : le choix de police en taille réduite est-il lié à la taille longue du document ? l'alignement de texte via des blancs n'est pas satisfaisant...). Cette présentation à plat est d'autant moins efficace ici que a priori un réel effort de structuration des informations (dense) a été fait (via une structuration classique en parties ordonnées). A noter malheureusement que certains liens ne fonctionnent pas (celui de la synthèse dans la partie B en particulier). La page "synthèse" aurait mérité une présentation moins éclatée et plus précise.
Contenu : particularité de ce travail : volonté manifeste d'articuler au maximum l'ensemble des différents types d'information présent dans la mise en oeuvre du projet (en particulier articulation usage des outils et documentation associée), le contexte linguistique un peu moins fouillé cependant. Cependant, l'ensemble manque parfois de précisions. Il reste aussi quelques coquilles...

Forme
Evitez les soulignés en dehors des liens.
Dans du code, les commentaires longs sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs).
Fond
La page d'accueil pourrait être plus fournie.
Présentation précise et claire des outils utilisés ainsi que des sources. Bon recours à des sources extérieures.
Vous auriez pu hiérarchiser davantage votre rapport (pour l'essentiel, une "lourde" page).
Bonne manière de dégager la structure des scripts.
13Voir la pageJean-Louis COSTE (Paris 3/pluriTAL), Nicolas VONGNOUKOUN (Inalco/Traductique) et Raphaël SCHAEFFER (Inalco/Ingénierie Multilingue)151517on ne navigue pas à l'intérieur d'une longue page, tant mieux

souci de gloser le dictionnaire et les textes trouvées avant de se lancer dans l'aspect informatique

donne des pistes pour améliorer le projet (co-occurrences)

souci pédagogique d'expliquer les programmes informatiques (diagramme)

connaissances en linguistique sous-jacentes (Jakobson, mais faute d'orthographe)

Présentation : présentation qui a le mérite d'essayer d'organiser les choses, il aurait été bien de garder le "menu" de la page d'accueil visible en permanence (via un FRAME ou un menu générique sur toutes les pages)..., la configuration du serveur fait que la visibilité des dossiers contenant les fichiers de travail (dossier d'urls par ex.) n'est pas disponible, une copie d'écran aurait fait l'affaire...Le PDF est très bien !
Contenu : maîtrise des outils OK, le travail est globalement bien documenté et explicité.

Forme
Belle présentation avec le souci de renvoyer aux ressources pertinentes.
Fond
Bonne séparation des versants linguistique et informatique du travail.
Bonne structuration du rapport.
Utilisation des ressources en ligne guidée par un travail lexicologique précis.Avec le risque de s'en tenir à ce qui est déjà lexicographié.
Volonté de répartition uniforme des emplois.
Les synapses, n'est-ce pas Benveniste plutôt que Jackobson.
L'algorithme en flux est beaucoup plus compréhensible.
Vous avez le souci de permettre à quelqu'un de reprendre ce que vous avez fait.
Le journal est, à juste titre, réduit à sa plus simple expression au profit d'une réanalyse motivée de la démarche.