#ce fichier en tête peut evider Wide character
use utf8;
binmode(STDIN, ':encoding(utf8)');
binmode(STDOUT, ':encoding(utf8)');
binmode(STDERR, ':encoding(utf8)');
#--------------------------------------------
# le patron cherché ici est du type NOM ADJ";
#--------------------------------------------
my $rubrique = "$ARGV[0]";
open(FILE,"<:encoding(utf8)","$rubrique.xml") or die "NE PEUT PAS OUVIRE LE FICHIER !";
open(OUTPUT,">>:encoding(utf8)","N_ADJ_$rubrique.txt") or die "NE PEUT PAS OUVIRE LE FICHIER !";

my @lignes=<FILE>;
close(FILE);
while (my $ligne=shift(@lignes))
{
  chomp $ligne;
  my $sequence = "";
  my $longueur = 0;
  if ( $ligne =~ /<element><data type=\"type\">NOM<\/data><data type=\"lemma\">[^<]+<\/data><data type=\"string\">([^<]+)<\/data><\/element>/) 
  {
	  my $forme = $1;
	  $sequence.=$forme;
	  $longueur = 1;
	  my $nextligne = $lignes[0];
	  if ( $nextligne =~ /<element><data type=\"type\">ADJ<\/data><data type=\"lemma\">[^<]+<\/data><data type=\"string\">([^<]+)<\/data><\/element>/) 
    {
	    my $forme = $1;
	    $sequence.=" ".$forme;
	    $longueur = 2;
	  }
  }
  
  if ($longueur == 2) 
  {
	  print "$sequence\n";
    print OUTPUT "$sequence\n";
  }
}
close OUTPUT;

