use locale;
use strict;
use LWP::Simple;


# Indication des fichiers d'input et d'output :
open (IN, "<", "./PROGRAMMES/input.txt") or die "Impossible d'ouvrir le fichier d'input.\n\n";
open (OUT, ">", "./TABLEAUX/tableau1perl.html") or die "impossible de créer le fichier d'output.\n\n";


# Déclaration des variables :
my $nom_de_fichier;
my $url;
my $num_url;
my $num_sous_corpus;
my $page_asp;



# Mise en place de l'en-tête de  la page html :

print OUT "<html>\n\n<head>\n<meta http-equiv=\"Content-Type\" content=\"texte/html;charset=ISO-8859-1\"></head><body><center>";

while ($nom_de_fichier=<IN>){
chomp $nom_de_fichier;
open (INBIS, "<", "./URLS-POUR-PERL/$nom_de_fichier") or die "Impossible d'ouvrir le fichier d'input bis.\n\n";



# Création de l'en-tête du tableau. 

print OUT "<table border=\"2\">\n<th bgcolor=\"grey\" colspan=\"4\">Liste URL $nom_de_fichier </th>";



# Début de la boucle 1, traitement du contenu du fichier ligne par ligne :

$num_url = 1;

while ($url = <INBIS>){
	chomp $url;


	# Distinction entre les urls et les balises de sous-corpus :

	if ($url=~/<([^>]+)>/){
		print OUT "<tr><td bgcolor=\"#A9A9A9\" colspan=\"4\"><center>",$1,"</center></td></tr>";
		print OUT "<tr><td bgcolor=\"#A9A9A9\">n&ordm URL</td><td bgcolor=\"#A9A9A9\">n&ordm URL dans le sous-corpus</td><td bgcolor=\"#A9A9A9\">URL</td> <td bgcolor=\"#A9A9A9\">Pages aspir&eacute;es</td> </tr>";
		$num_sous_corpus = 1;
	}
	
	
	else {
		print OUT "<tr><td><font color=\"red\"> <center> ", $num_url, " </center> </font></td> <td> <font color=\"red\"> <center> ", $num_sous_corpus , " </center> </font></td><td><a href=\"", $url , "\" target=\"_blank\">URL n&ordm", $num_url , "</a></td>";
		$num_url = $num_url + 1;
		$num_sous_corpus = $num_sous_corpus+1;
	
	
		# Aspiration des pages :
	
		$page_asp = get("$url");
		open (FICHIER, ">", "PAGES-ASPIREES/$nom_de_fichier$num_url.html") or die "impossible d'ouvrir FICHIER";
		print FICHIER "$page_asp";

		if ( not defined( $page_asp ) ){
  			print OUT "<td bgcolor=\"red\"> erreur lors de l'aspiration </td>";
   
		}
		else {
			print OUT "<td><center> <a href=\"../PAGES-ASPIREES/", $nom_de_fichier,$num_url, ".html\" target=\"blank\"> page aspir&eacute;e</center> </td> </tr>";
		}
	}
}
# Fermeture du tableau : 

print OUT "</table><br><br>";
}

# Fin de la page html :

print OUT "</center></body></html>";

close (IN);
close (INBIS);
close (OUT);