Étape 2

Choix de cinq adjectifs

Chaque classe étudiée est représentée par un adjectif.

  1. tonique
    • qualificatif relationnel
  2. calme
    • qualificatif propremment dit
  3. verbal
    • verbal
  4. quatre
    • déterminatif numéral
  5. autre
    • déterminatif indéfini

Extraction de zones textuelles et le numéro d'infirmière associée

#       répéter pour chaque élément dans la liste
#       d'adjectifs choisis
for adj in tonique calme présent quatre autre;
do
        #       
        cat "corpus/p96.bal" |
        #       substitution de "newline" par un espace
        tr "\n" " " |
        #       enlever les balises <SCORE>*
        sed -e "s/<SCORE>[0-9]*/\n\n\n/g" |
        #       subs. "<" par "newline"
        sed -e "s/</\n</g" |
        #       ne choisir que les balises <TXT> ou <INFIRMIERE>
        egrep -e "<TXT>|<INFIRMIERE>" |
        #       enlever les balises
        sed -e "s/<[^<]*>//g" |
        #       subs. "newline" par un espace
        tr "\n" " " |
        #       subs. "tab" par un espace
        tr "\t" " " |
        #       newline après des chiffres
        sed -e "s/[0-9] /&\n/g" |
        #       subs. "tab"s par un espace
        sed -e "s/[ \t]+/ /g" |
        #       n'afficher que l'adjectif courant
        egrep -e "$adj" >
        #       enregistrer sur le fichier "etape_2-1-<nom_de_l'adjectif>"
        etape_2-1-$adj;
done

Extraire le premier mot des zones textuelles, les classer par infirmière, les trier, les compter

barre="===================================";
liste="tonique calme présent quatre autre"
for adjectif in $liste;
do  
        echo $barre;
        echo "Adjectif : " $adjectif;
        echo $barre;
        echo;

        infirmieres=`cat etape_2-1-$adjectif | awk '{print $NF}' | sed -e "s/[.,_]//g" | sort -u`
        for infirmiere in $infirmieres;
        do
                echo "Infirmière : " $infirmiere;
                nb_premiers_mots=`cat etape_2-1-$adjectif | awk '{print $NF " " $1}' | sed -e "s/[.,_]//g" | egrep -e "$infirmiere " | wc -l`
                echo "Premiers mots : " $nb_premiers_mots;
                liste_unique=`cat etape_2-1-$adjectif | awk '{print $NF " " $1}' | sed -e "s/[.,_]//g" | egrep -e "$infirmiere " | awk '{print $2}' | sort -u`

                style_liste=" => "
                echo "Liste (tri unique) :";
                for element in $liste_unique;
                do
                        echo $style_liste $element
                done;
                echo;
        done;
done