Secteur TAL Informatique
ILPGA Université Paris 3
Cours Modules L7T04/L8T07 : Notation du mini-projet BARRAGE PluriTAL 05-06
Etat courant des notes | ||||||||
id | URL | Noms | noteJMD | noteSF | noteBH | remarquesJMD | remarquesSF | remarquesBH |
1 | Voir la page | Aleksandra Ristic (Inalco/Traductique) et Yannick LAM KIM (Inalco/Ingénierie Multilingue) | 14 | 14 | 15 | ok, unitex en prime, bonnes connaissances du shell (find -exec)
j'aime pas que les url extérieures s'ouvrent dans la même fenêtre la forme n'a rien d'extraordinaire j'aime pas cette énorme page | Présentation : très synthétique (trop parfois), dommage aussi je crois de ne pas avoir tenté de présenter les choses de manière plus ergonomique, même si je n'aime pas trop les FRAMES, leur utilisation ici aurait été judicieuse pour offrir au lecteur une navigation simplifiée (en particulier pour donner à voir les résultats). Une autre solution consistait à utiliser une navigation via un menu (cf travail de Faïna et Sébastien) | Forme
Attention aux "ils" dont on ne sait pas à quoi ils renvoient. C'est bien d'avoir un sommaire navigable tout au départ. Fond Pourquoi Le Monde serait-il le plus pertinent ? Bonne utilisation des sources consultées.Bonne organisation des données et de leur exploitation (les copies d'écran sont utiles). Donnez des noms plus explicites à vos scripts. Les comparaisons des scores selon les sources est instructive (y compris dans les scories : hydrolique). On voit le nombre de pages indexées respectivement par Google et par Yahoo. |
2 | Voir la page | Névéna Pantikina (Inalco/Traductique) et Virginie Picard (Paris 3/pluriTAL) | 14 | 16 | 14 | bonne idée de comparer mozbot/google, mais pas de raisons données aux différences
linguistiquement, peut-on aussi clairement affecter un sens à chaque occurrence de "barrage" ? du coup on risque de se retrouver avec des catégories inombrables (cf "barrage" d'un point de vue social, il n'y a qu'une URL) le fichier fourni en argument de wget doit se terminer par .txt, disent-elles, car avec .doc, ça marche pas, mais c'est à cause du formatage interne du fichier que ça marche pas, pas à cause de l'extension ? j'aime bien la page d'accueil, courte, mais ensuite les pages liées sont longues | Présentation : travail dont la présentation a visiblement été soignée (et "réfléchie") en essayant d'organiser au mieux les données montrées. Dommage que la circulation entre les pages ne soit pas plus ergonomique, l'utilisation de FRAME ou de MENU "pilotant" la navigation aurait été un plus : la page d'accueil avec des liens vers les autres pages est une amorce vers cela... | Forme
Evitez les soulignés en dehors des liens. Dans du code, les commentaires sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs). Par ailleurs, vos commentaires sont précis et utiles. Fond Introduction très claire. Méthode d'échantillonnage de bon aloi.Bonnes indications sur le poids des sens. Bonne présentation des modules utilisés. Vous êtes claires sur ce qui n'a pas été réalisé. |
3 | Voir la page | Aurélia Trinquier (Paris 3/pluriTAL) et Claire Bonasso (Inalco/Traductique) | 12 | 13 | 13 | c'est mal écrit, tout vous tombe dessus comme si on répondait à des questions autonomes, c'est pas une bonne idée de donner le même nom de pointeur vers les fichiers html et les fichiers texte | Présentation : j'aime bien la mise en avant des scripts, moins l'allure des tableaux (il manque les titres des colonnes d'ailleurs). | La conclusion aurait pu être directement sur la page d'accueil.
Attention aux couleurs dures (titre du journal). Dans du code, les commentaires longs sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs). Vos encadrés de code gagneraient à être plus larges (pour ne pas couper inutilement les lignes). Fond Bonne utilisation des requêtes négatives. La présentation de lynx est restrictive. Les images sont-elles vraiment inutiles pour une analyse linguistique ? |
4 | Voir la page | Wu Li-Chi (Paris 3/pluriTAL) et Chachaty Edmond (Paris 3/pluriTAL) | 11 | 11 | 11 | tache1.txt ne peut servir à faire 2 choses différentes, on ne comprend pas pourquoi les usages divers de "barrage" n'ont pas été illustrés (c'était ce qui était demandé)
le tableau final aurait dû être créé automatiquement (avec moins de colonnes) il n'y a pas de journal relatant les difficultés | Présentation : présentation très synthétique et "à plat", navigation verticale pas toujours pratique..., difficile de repérer l'organisation des choses et surtout de différencier les différents types d'information (en particulier dans les liens dont le libellé est souvent le même...) | Forme
Evitez les soulignés en dehors des liens. Fond Noms des scripts non transparents. L'objectif de chaque module devrait être explicité. Vous avez fait les choses, mais vous n'expliquez pas beaucoup comment ni les conclusions que vous en tirez. |
5 | Voir la page | Olga Semenova (Inalco/Traductique) et Ninon Payen (Inalco/Traductique) | 12 | 13 | 13 | seul le journal est dans un style non-télégraphique, la page principale est trop succinte
on pourrait penser qu'il y a un tas d'étapes qui auraient pu être regroupés, vu le nombre de scripts donnés à la fin de journal, mais je ne veux pas me pencher sur chacun d'entre eux, au moins elles ont appris à écrire du code | Présentation : présentation (sans menu et donc peu ergonomique) mais l'idée, mise en oeuvre par d'autres aussi, de créer une page d'accueil synthétisant le travail va dans le bon sens. J'aime assez la tentative de mettre en avant typographiquement certaines zones textuelles... | Forme
Evitez les soulignés en dehors des liens. Dans du code, les commentaires longs sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs). Vous auriez pu faire des renvois aux tableaux plutôt que de les insérer (ce qui rend la page Journal trop longue). Idem pour les scripts. Fond La page d'introduction devrait donner une idée plus distanciée de ce qui a été fait. Journal : vous ne motivez pas vos choix (pourquoi tel moteur ?). Utilisation de filtres positifs plus fins : bonne approche. Vous présentez de manière synthétique les commandes. Bonne utilisation des ressources extérieures (mais si vouscitez Detagger, mettez une URL). Vous ne motivez pas le fait de garder l'emploi en musique, pourtant rare. |
6 | Voir la page | Thomas Ragot (Paris 3/pluriTAL), Yann Hiard (Paris 3/pluriTAL) et Samia Achouri (Paris 3/pluriTAL) | 14 | 14 | 15 | le cas de noms de fichiers identiques : sous linux, numérotation automatique des fichiers du même nom la page de garde, avec les liens, semble montrer une structuration non-linéaire, mais on se retrouve en fait à descendre dans la mêmem page quelques commandes shell non proposées en cours sont mises en eouvre (sed) | Présentation : très sobre mais efficace | Forme
C'est bien d'avoir un sommaire navigable tout au départ. Mettre en italiques les mots cités. Bon découpage en niveaux avec liens. Les scripts auraient pu être dans des pages de niveau inférieur. Bon jeu sur les couleurs dans le code. Dans du code, les commentaires longs sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs). Fond Bonne utilisation des ressources extérieures. Bonne motivation des sources employées. Cygwin ne se limite pas à une émulation du shell bash. Bonne analyse de détail des contraintes des modules utilisées, y compris en fonction des données qui leur sont soumises. Recul sur les outils utilisés. |
7 | Voir la page | Alexey FEDOROV (Inalco/Ingénierie Multilingue), Natalia KOZHINA (Inalco/Traductique) et Evguénia KROUGOVAïA (Inalco/Traductique) | 13 | 13 | 12 | leur travail n'a pas de valeur linguistique, disent-ils à la premièer page : c'est inquiétant les pages mettent un temps infini à s'ouvrir, ça m'énerve ils n'ont pas utilisé egrep -A -B, du coup le contexte est misérable utilisation de commandes non vues (basename, sed...) les programmes sont soignés, mais le reste est superficiel | Présentation : je me cite... "présentation (sans menu et donc peu ergonomique) mais l'idée, mise en oeuvre par d'autres aussi, de créer une page d'accueil synthétisant le travail va dans le bon sens...". Dommage que la compréhension du découpage sémantique de la page d'accueil ne soit compréhensible qu'après avoir lu le journal. Je ne suis pas sûr que le rapport "couleur de police / image de fond" soit toujours efficace, notamment pour la lecture | Forme
Belle mise en page (attention cependant à la cohérence et à ne pas en faire trop. La qualité typographique rime généralement avec simplicité). Evitez les soulignés en dehors des liens. Donner un nom au lien vers les fichiers HTML. Mettre une conclusion sur la page d'accueil. Fond "Nous tenons à préciser que les résultats de notre travail ne portent pas de valeur significative du point de vue linguistique, le but principal étant de mettre en place une méthodologie de recherche et d'extraction d'information" : juste. Il faut commenter davantage vos choix, vos résultats, les étapes. |
8 | Voir la page | HAMRI Nacer (Paris 3/pluriTAL), RATSIMBA Hoby (...) et GAGOUM Parfaite (...) | 11 | 11 | 12 | bonne idée de suivre le mot "barrage" au cours du temps, mais orthographe franchement fantaisiste organisation de certaines pages également fantaisiste ces histoires de classement des sens de barrage pourraient être fondées sur des chiffres, ça ferait plus sérieux j'aime bien cette idée que barrage_hydraulique se subdivise lui-même en barrage_voûte et autres on est un peu enfermé dans chaque page, avec nécessité de revenir à l'accueil beaucoup de liens sont morts egrep n'est pas utilisé avec -A et -B | Présentation : Un apprentissage de HTML serait bénéfique, le rendu actuel est peu satisfaisant : rapport couleur fond/police, l'alignement de texte via des blancs n'est pas satisfaisant... de plus certains liens ne fonctionnent pas (c'est d'autant plus embêtant que ces liens pointent vers les scripts-résultats) | Forme
Attention aux couleurs dures. Vous devriez ne pas limiter la page d'accueil à un sommaire. Evitez les soulignés en dehors des liens. Attention à l'orthographe. Fond Bonne analyse de la difficulté du problème. Bon ancrage lexicologique et lien avec les données.Bon questionnement sur la répartition des sens. Le commentaire des commandes devrait être plus précis (et il faudrait définir le rôle de chacune d'elles). Des liens sans cible. |
9 | Voir la page | Faïna Ramdani (Inalco/Traductique) et Sébastien Delahaye (Inalco/Ingénierie Multilingue) | 16 | 18 | 13 | ergonomie excellente beaucoup de connaissances shell mises en oeuvre je trouve l'informatique très professionnelle | Présentation : la solution retenue pour présenter le travail est effectivement une des (meilleures) solutions la plus efficace : un sommaire générique permettant à tout moment de naviguer dans les différentes pages. De plus le rendu visuel est tout à fait efficace (choix de police, couleur...) | Forme
Bonne circulation dans le site. C'est bien de trépider, mais restez plutôt dans le genre "rapport de projet". Noms de scripts clairs. Fond Essai de tenir compte des sens rares. Les indications sur les commandes pourraient être plus proches d'une page de manuel pour faciliter leur réutilisation. C'est bien d'être allé au delà de ce qui était demandé, mais le commentaire de ce qui a été réalisé en souffre un peu. |
10 | Voir la page | Egle RAMDANI (Paris 3/pluriTAL) et Svetlana TSARKOVA (Inalco/Traductique) | 14 | 13 | 15 | toujours cette longue page elles se sont posées des questions sur le traitement de la langue et tout le monde ne l'a pas fait | Présentation : très synthétique (trop parfois), dommage de ne pas avoir tenté de présenter les choses de manière plus ergonomique... la présentation commentée du script est une bonne idée. Attention le lien vers le TLF utilise un lien "temporaire", la solution était d'utiliser l'URL suivante : http://atilf.atilf.fr/scripts/fast.exe?mot=barrage"
| Forme
C'est bien d'avoir un sommaire navigable tout au départ. Evitez les soulignés en dehors des liens. Bonne utilisation des couleurs dans le code commenté. Dans du code, les commentaires longs sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs). Fond Grande finesse dans l'analyse des sources. Filtres précis (y compris négatifs). Analyse précise des difficultés rencontrées. |
11 | Voir la page | Violeta Ordonez (Paris 3/pluriTAL) et Claire Guiraud (Inalco/Ingénierie Multilingue) | 12 | 15 | 16 | elles réfèrent à des dossiers (documentation et corpus) en fait inaccessibles c'est un peu désordonné, elles parlent des arborescences utilisées, on s'attend à les trouver, mais rien, elles parlent subitement de pb technique trame générales peu claire | Présentation :je me cite de nouveau... "présentation (sans menu et donc peu ergonomique) mais l'idée, mise en oeuvre par d'autres aussi, de créer une page d'accueil synthétisant le travail va dans le bon sens..." avec ici un effort supplémentaire pour ordonnancer la structure des informations données à voir. J'aime pas trop le "rose" mais bon... Par contre, la coloration "distinctive" pour certaines zones de texte (remarque, question/problème technique est bien vue | Forme
Evitez les soulignés en dehors des liens. Attention aux couleurs dures. Vos liens doivent dire qu'ils sont des liens sans qu'il faille "tirer la manche du lecteur" (Cliquez ici pour...) Fond Bonne structuration du travail et du rendu (y compris avec l'arbre dessiné). Bonne utilisation de filtres (y compris négatifs). Compréhension fine (jeux de caractères par exemple) des commandes et adjonction de commandes complémentaires. Problèmes de liens relatifs : bizarre ! |
12 | Voir la page | Bruno Raffard (Paris 3/pluriTAL) et Zahir Maafa (Inalco/Ingénierie Multilingue) | 12 | 13 | 15 | confusion aval/amont ? détails inutiles (sur cygwin), assez verbeux parfois tout en contenant pas mal de fautes d'orthographe dans le tableau général, beaucoup de liens morts encore une très longue page, malgré un souci louable d'organiser chaque étape | Présentation : Un apprentissage de HTML serait bénéfique, le rendu actuel est pensé je crois comme s'il s'agissait d'un "objet texte traditionnel" (type document word avec table des matières) alors que la publication web nécessite souvent des méthodes de publication différente. (Remarques ponctuelles : le choix de police en taille réduite est-il lié à la taille longue du document ? l'alignement de texte via des blancs n'est pas satisfaisant...). Cette présentation à plat est d'autant moins efficace ici que a priori un réel effort de structuration des informations (dense) a été fait (via une structuration classique en parties ordonnées). A noter malheureusement que certains liens ne fonctionnent pas (celui de la synthèse dans la partie B en particulier). La page "synthèse" aurait mérité une présentation moins éclatée et plus précise. | Forme
Evitez les soulignés en dehors des liens. Dans du code, les commentaires longs sont avant ce sur quoi ils portent (ils préparent la lecture, ce sont des éclaireurs). Fond La page d'accueil pourrait être plus fournie. Présentation précise et claire des outils utilisés ainsi que des sources. Bon recours à des sources extérieures. Vous auriez pu hiérarchiser davantage votre rapport (pour l'essentiel, une "lourde" page). Bonne manière de dégager la structure des scripts. |
13 | Voir la page | Jean-Louis COSTE (Paris 3/pluriTAL), Nicolas VONGNOUKOUN (Inalco/Traductique) et Raphaël SCHAEFFER (Inalco/Ingénierie Multilingue) | 15 | 15 | 17 | on ne navigue pas à l'intérieur d'une longue page, tant mieux souci de gloser le dictionnaire et les textes trouvées avant de se lancer dans l'aspect informatique donne des pistes pour améliorer le projet (co-occurrences) souci pédagogique d'expliquer les programmes informatiques (diagramme) connaissances en linguistique sous-jacentes (Jakobson, mais faute d'orthographe) | Présentation : présentation qui a le mérite d'essayer d'organiser les choses, il aurait été bien de garder le "menu" de la page d'accueil visible en permanence (via un FRAME ou un menu générique sur toutes les pages)..., la configuration du serveur fait que la visibilité des dossiers contenant les fichiers de travail (dossier d'urls par ex.) n'est pas disponible, une copie d'écran aurait fait l'affaire...Le PDF est très bien ! | Forme
Belle présentation avec le souci de renvoyer aux ressources pertinentes. Fond Bonne séparation des versants linguistique et informatique du travail. Bonne structuration du rapport. Utilisation des ressources en ligne guidée par un travail lexicologique précis.Avec le risque de s'en tenir à ce qui est déjà lexicographié. Volonté de répartition uniforme des emplois. Les synapses, n'est-ce pas Benveniste plutôt que Jackobson. L'algorithme en flux est beaucoup plus compréhensible. Vous avez le souci de permettre à quelqu'un de reprendre ce que vous avez fait. Le journal est, à juste titre, réduit à sa plus simple expression au profit d'une réanalyse motivée de la démarche. |