Warning: fsockopen() [function.fsockopen]: unable to connect to 193.0.6.135:43 (Connection timed out) in /home/viviensc/lingunix/components/com_joomlastats/count.classes.php on line 1078
 

Lingunix

Les outils unix appliqués à la recherche linguistique et psycholinguistique

  • Augmenter la taille
  • Taille par défaut
  • Diminuer la taille

Utiliser LEXIQUE, AWK et SORT pour obtenir une liste des mots les plus fréquents

Imprimer PDF

Commande :

cat Lexique3.txt | awk -F"\t" '{print $1,$10}' | sort -t\  -k2nr > mots_freq_decroissant_Lexique3.txt

Explication :

La commande "cat Lexique3.txt" permet de lire toutes les colonnes du fichier Lexique3.txt. Nous redirigeons le flux de la commande précédente à l'aide du pipe "|" dans l'éditeur AWK avec lequel nous ne conserverons uniquement la colonne 1 (les mots) et la colonne 2 (les frequences). Nous redirigeons ce flux dans le filtre sort avec lequel nous ordonnons par ordre décroissant la deuxième colonne du tableau correspondant aux fréquences. Pour finir, nous redirigeons le résultat dans le fichier mots_freq_decroissant_Lexique3.txt à l'aide du caractère de redirection greater than ">".

Résultat :

la 23633.92
et 20879.73
à 19209.05
le 18310.95
il 15832.09
les 14662.3
un 13550.68
l' 12746.76
d' 11876.35
...

Télécharger le résultat complet de ce sript : Liste des mots les plus fréquents avec LEXIQUE

Mise à jour le Dimanche, 17 Avril 2011 11:39  

Ajouter un Commentaire


Code de sécurité
Rafraîchir