#MODE D'EMPLOI : perl bao3-extract-patron.pl fichier-ud.xml nom_relation > nom_fichier_sortie.txt #!/usr/bin/perl use strict; use utf8; binmode STDOUT, ':utf8'; # L'encodage pour la sortie my $file="$ARGV[0]"; # Assignement des ARVG Pour les fichiers my $relation="$ARGV[1]"; my %dicoRelation=(); # Dictionnaire pour GOUV et DEP $/="
"; # Desactiver la saut a la ligne open my $input ,"<:encoding(utf8)",$file; # Ouverture et lire le corpus etiqueté while (my $phrase=<$input>) { # Pour toutes les phrases d'input my @LIGNES=split(/\n/,$phrase); # Séparer les phrases par saut lignes # Initialisation d'indice i qui va incrémenter à chaque tour de boucle for (my $i=0;$i<=$#LIGNES;$i++) { if ($LIGNES[$i]=~/