Outils d’analyse des concepts, des mots, des textes …

Analyser l’apparition et l’usage d’un mot dans les livres

Google Books Ngram Viewer permet d’interroger les ouvrages numérisés par le moteur de recherche (15 millions de livres) ; l’application propose des représentations graphiques sur la fréquence de l’utilisation d’un mot (ou d’une suite de deux à cinq mots). Cela peut vous permettre de dater l’apparition d’un mot, de vérifier la popularité d’un personnage, de suivre l’évolution du vocabulaire…

Analyse d’un corpus documentaire

  • Comment traiter des données en grand nombre? Avec Cortext, lorsque vous aurez téléchargé un ensemble de données, vous pourrez faire des analyses statistiques des textes. Voir le tutoriel en ligne.

Analyse du discours

  • Tropes, logiciel d’analyse sémantique, en libre accès pour la version d’essai. Marche bien pour les langues formelles (droit, technique…), moins pour le texte libre.
  • Pour nettoyer les données textuelles imparfaites, voir les anomalies des données, corriger les termes inexacts, homogénéiser le vocabulaire, Google Refine. Claires explications ici. Ou encore DataWrangler de l’Université de Stanford.