Lingunix

Les outils unix appliqués à la recherche linguistique et psycholinguistique

  • Augmenter la taille
  • Taille par défaut
  • Diminuer la taille

Générer un dictionnaire comprenant tous les adjectifs de la langue française avec AWK

Imprimer PDF

Commande :

awk -F"\t" '{print $1,$4}' Lexique3.txt | grep ADJ$ > dictionnaire_adjectifs_fr.txt

Résultat:

abattus ADJ
abbatial ADJ
abbatiale ADJ
abbatiales ADJ
abdominal ADJ
abdominale ADJ
...

Explication :

Dans ce script nous avons fait appel à la base de donnée Lexique3.txt. Nous avons à l'aide de la commande AWK extrait les colonnes 1 et 2 de la base Lexique3.txt correspondant respectivement au mot (colonne 1) et à sa nature (colonne 2).

Nous avons ensuite redirigé le flux de données à l'aide du pipe (le bâtonnet vertical) dans le filtre grep ne laissant passer ici uniquement les lignes se terminant par ADJ (pour adjectif).

Pour finir nous redirigeons le résultat de notre commande dans le fichier dictionnaire_adjectifs_fr.txt à l'aide du caractère "greater than".

Voir le dictionnaire des adjectifs de la langue française trié par ordre de fréquence (décroissant).

Mise à jour le Jeudi, 31 Mars 2011 10:06  

Ajouter un Commentaire


Code de sécurité
Rafraîchir