Exemple des congrès ISL (International Slope Stability)

 

Ces congrès se déroulent tous les quatre ans et réunissent jusqu'à 1000 chercheurs. Les deux derniers congrès sont analysés ici.

Analyse des congrès de Xi’an (2008) et de Banff en 2012 par MKD. 


Rappel des étapes

Mise en base

CongrèsEartFichiers initiaux txt : Nombre de lignes
S1S2S3Nb articlesNb ref luesNb ref nouvellesNb auteurs lusNb auteurs nouveauxNb syntagmes lus
Xian 2008mkd_xian3106165331087102702980277172924859106709
Banff 2012 banff34431788212491227110454128112966465123096
Totaux


Construction du lexique

CongrèsNb syntagmes lusNb de syntagmes retenusNb syntagmes sommésNb syntagmes nouveaux
Xian 20081067097831
7831
7831
Banff 20121230968287
13032
5203
Total

Les 13032 syntagmes sont ordonnés suivant le tf-idf et par seuillage des syntagmes les plus pertinents un lexique est construit avec 2055 syntagmes. (voir ce lexique  )
Pour chaque syntagme on a calculé son tf-idf, sorte de probabilité tenant compte du nombre d'occurences du syntagme et du nombre de textes (fichiers) dans lequel il apparait. Le seuillage est fait en fonction de la taille désirée du lexique.

Le lexique choisi, le calcul des signatures est fait.
La base peut être interrogée. (voir les résultats)