#! /usr/bin/perl

#####################################################################
# Auteur: Zahir MAAFA
# Date: 22 mai 2006
# Description: prend en entrée un fichier  etiqueté et le nom du fichier de sortie.  
#Le fichier de sortie est composé de fenêtres et contient sur chaque ligne:
#
# lemme_categorie 
#################################################################

my $ligne;
@ARGV == 2 or die "usage: prog <infile> <outfile> ";
$infile = $ARGV[0];
$outfile = $ARGV[1];

# changer catégories
my %tag =(
                'NOM','N',  # les noms simples
                'PUN','Y',
                'DET','D',
                'ADJ','A',
                'SEN','Y',
                'ABR','N',
                'VER','V',
                'NAM','N',
                'PRP','S',
                'ADV','R',
                'KON','C',
                'NUM','M'
                        );
open(INFILE,"<$infile");
open(OUTFILE,">$outfile");
while (<INFILE>){
        
        
        split /\t/;
         if (m/[" '<>]/) { next;}
         my $i=0;
        chop($_[2]);
        $_[2]=~s/[\r\n]//;
        
         $_[1]=substr($_[1],0,3);
        $_[1]=~s/\s//g;
         
        if (exists($tag{$_[1]}))
         {
           
         print OUTFILE   "$_[2]_$tag{$_[1]}\n";
         }
        else
         {
          print OUTFILE   "$_[2]_$_[1]\n";
          }
        

}
print OUTFILE   "<FinFenetre/>";

close(INFILE);
close(OUTFILE);
