Lingunix

Les outils unix appliqués à la recherche linguistique et psycholinguistique

  • Augmenter la taille
  • Taille par défaut
  • Diminuer la taille

AWK : Calculer la moyenne du nombre de lettres dans les mots en Français

Imprimer PDF

Commande :

awk -F"\t" '{sum +=$15} END {print sum/NR}' Lexique3.txt | less

Résultat :

8.86738

Ce chiffre est le nombre moyen de lettres dans chaque mot du dictionnaire Lexique3.txt (lexique.org).

Explication :

Ici on utilise la base de donnée Lexique.txt. La quizième colonne donne le nombre de lettres pour chaque mot, nous les additionnons toutes (sum +=$15) puis nous divisons le résultat par le nombre total de lignes de la base Lexique.txt (print sum/NR).

Mise à jour le Vendredi, 07 Janvier 2011 13:34  

Ajouter un Commentaire


Code de sécurité
Rafraîchir