Savoir Faire
Tout pour partir bien équipé...
Dans cette partie du site vous trouverez toutes les informations nécessaires pour utiliser nos outils et pouvoir refaire notre expérience. Nous vous présentons les fils RSS, le langage de programmation perl, les expressions régulières, Cordial et Tree-tagger.
Tree-tagger
Tree-tagger est un logiciel d'annotation syntaxique et de lemmatisation.
Il a été créé par le chercheur Helmut Schmid dans les années 90 au sein de l'université de Stuttgart.
Il permet d'annoter du texte en POS (Part Of Speech) dans différentes langues parmis lesquelles le français, l'anglais, l'allemand, l'espagnol, l'italien , le néerlandais et bien d'autres.
Installer tree-tagger
Pour installer tree-tagger il faut se rendre sur le site de tree-tagger et télécharger les trois fichiers du tagger package, le tagging script et install-tagger.sh ainsi que le fichier paramètre pour le français french-par-linux_3.2-utf8.bin.gz ou pour la langue du texte à annoter dans le même fichier. Ensuite il faut se positionner dans le fichier et lancer cette commande dans le terminal :cd ~/treetagger bash install-tagger.sh
étiquette | signification | étiquette | signification |
ABR | abreviation | ADJ | adjectif |
ADV | adverbe | PRO | pronom |
DET:POS | déterminants possessifs | PRP / PRP:Det | préposition |
VER | verbe | KON | conjonction |
NOM | nom communs | NAM | noms propres |
NUM | numéral | DET:ART | articles |
SENT | point | SYM | symbole |
INT | interjection | PUN | ponctuation |
