Python   

      Voici un exemple de script de type "Python" grace auquel on aura récuperé le code source d'une page web et que
       l'on aura "nettoyé" de tout contenu non linguistique sur lequel on aura effectué quelques opérations telles que:
       le comptage du nombre de mots, ou encore l'organisation sous forme de liste ...

         lien vers le script commenté de Python:       script.html  

         lien vers la page web recupérée avec python:      lien    
           
         lien vers la page "nettoyée"           lien

         lien vers le  fichier contenant les résultats des comptes :    lien
  
       
         Commandes Unix 
       

       Afin de travailler sur les expressions régulières, nous allons employer certaines commandes, la première permet
      d'extraire les lignes contenant des mots qui commencent par "citoy":
         
                                 reponse1.html    


        On note que "egrep" correspond à la fonction permettant de chercher les expressions régulières, "\b" cible les 
        débuts de mots, "citoy" correspond à l'occurence ciblée, et "Duchn-utf8.txt" correspond au texte dans lequel
        on souhaite que Python lance sa recherche.
        


         Nous utiliserons les commandes suivantes pour extraire les lignes qui contiennent des mots commencant par :
       -"aristo"
       -"bougre"
       
                          
       
       
             
                    reponse2.html                                                                                   reponse3.html  

       
         Pour lancer une recherche ciblant les mots contenant le terme "sans-culottes" on utilisera la commande suivante:

                                    reponse4.html 

        Pour les mots contenant une majuscule on utiilisera la commande:

                                             reponse5.html

        Pour les mots qui se terminent par "-er" :
         
                reponse6.html 

        Pour les mots qui parlent de "danger" :

                reponse7.html 

        Pour les mots qui parlent de "patrie" :

           reponse8.html  

        Pour les mots qui parlent de "liberté" :

            reponse9.html 

        On remarque que les mots qui réferent au "temps" , on remarque qu'ils prennent 4 sens différents:

       Sens 1 : durée dans laquelle se succède les événements, les jour et les nuits. Exemple : "est pris depuis longtemps".

       Sens 2: durée mesurable. Exemple :"quatre ans,et pendant ce temps".

       Sens 3: état de l'atmosphère. Exemple : "à faire la pluie et le beau temps".

       Sens 4 : moment propice. Exemple "il est temps que nos maux finissent".

       Voici la commande pour l'extraire :

         reponse10.html 


       Voici la commande pour extraire des mots qui parlent de "république" :
         
            reponse11.html  
 
       Voici la commande pour extraire les mots qui parlent de "trahison" :

           reponse12.html 

       Voici la commande pour extraire des séquences de mots contenant de la négation :

         


           Etude morphologique
       

         Voici la commande pour connaitre le nombre de mots dans le fichier "dico.txt" :

               

                                    

         Voici la commande permettant d'extraire les mots se terminant par "-able" :

       

                                     lien pour voir les mots extraits:    lien

        On remarque que les mots finissant par "-able" sont employés comme adjectifs. Ex "vulnérable"
       
        Voici la commande pour connaitre le nombre de mots se terminant par "-able":
   
       

                                 

        On remarque que les mots finissant par "-eux" sont employés comme:
        -adjectifs ex :"vigoureux"
        -adjectifs numéraux ex: "deux"
        -noms communs ex : "yeux"
        -pronoms démonstratifs ex: "ceux"
        -pronom personnels : "eux"

        Voici la commande pour extraire les mots qui terminent par "-eux" :

         

                     lien pour voir les mots extraits :         lien           

        Voici la commande pour extraire les mots qui terminent par "-able" et par "ible" :