#--------------------------------------------------------
# le patron cherché ici est du type NOM PREP NOM";
#--------------------------------------------------------
use utf8;
binmode(STDIN, ':encoding(utf8)');
binmode(STDOUT, ':encoding(utf8)');
binmode(STDERR, ':encoding(utf8)');

my $rubrique = "$ARGV[0]";
open(FILE,"<:encoding(utf8)","$rubrique.xml") or die "NE PEUT PAS OUVIRE LE FICHIER !";
open(OUTPUT,">>:encoding(utf8)","N_PRP_N_$rubrique.txt") or die "NE PEUT PAS OUVIRE LE FICHIER !";

my @lignes=<FILE>;
close(FILE);
while (my $ligne=shift(@lignes))
{
  chomp $ligne;
  my $sequence = "";
  my $longueur = 0;
  if ($ligne =~ /<element><data type=\"type\">NOM<\/data><data type=\"lemma\">[^<]+<\/data><data type=\"string\">([^<]+)<\/data><\/element>/) 
  {
    my $forme = $1;
    $sequence.=$forme;
    $longueur = 1;
    my $nextligne = $lignes[0];
    if ($nextligne =~ /<element><data type=\"type\">PRP<\/data><data type=\"lemma\">[^<]+<\/data><data type=\"string\">([^<]+)<\/data><\/element>/) 
    {
      my $forme = $1;
      $sequence.=" ".$forme;
      $longueur = 2;
      my $nextligne = $lignes[1];
      if($nextligne =~ /<element><data type=\"type\">NOM<\/data><data type=\"lemma\">[^<]+<\/data><data type=\"string\">([^<]+)<\/data><\/element>/)
      {
        my $forme=$1;
        $sequence.=" ".$forme;
        $longueur = 3;
      }   
    }
  }
  
  if ($longueur == 3) 
  {
    print "$sequence\n";
    print OUTPUT "$sequence\n";
  }
}
close OUTPUT;
