Les ordinateurs ont atteint une puissance suffisante pour
traiter des masses de données de plus en plus grandes. L’intelligence, comment
la mettre en évidence, de la machine ne
correspond qu’a un traitement massif de données. Pour lui donner un semblant
d’intelligence afin qu’elle aide l’utilisateur à répondre à une question
précise, un prétraitement des données semble être une approche efficace.
Comment, pour une situation donnée, peut-on connaître causes
et conséquences de cette situation ? C’est-à-dire avoir un diagnostic
et/ou des propositions d’actions. Ce qui revient à présenter à
l’ingénieur-utilisateur les bonnes pages d’une encyclopédie virtuelle, des
normes et des recommandations du domaine défini par la question posée.
Le projet MKD aborde cette problématique en traitant un domaine dont l’étendue, qui peut être élargie à la demande, est limitée par le recueil d’écrits contenant le savoir du domaine. A des fins pratiques les premières expériences utilisent les documents fondamentaux d’un domaine comme les manuels, les cours magistraux, les recommandations, les normes et les congrès.
Le domaine choisi pour cette expérience est celui de la
géotechnique, cette branche du génie civil qui se préoccupe de l’interaction
des ouvrages et du sol afin de construire les infrastructures de demain.
Le domaine est donc défini par un corpus de texte, ce qui
permettra à d’autres utilisateurs d’aborder tout domaine.
Domaine de la géotechnique.
La littérature est abondante car l’évolution technologique
(matériaux et matériels) et scientifique (techniques de reconnaissance et
modélisation) est en constante progression et mondialement soutenue. Les
nombreux congrès apparaissent alors comme une source incontournable
d’informations possédant des marqueurs temporels permettant aussi de mettre en
évidence l’évolution des techniques. Des cours, des recommandations et des
normes seront ajoutés au corpus.
Traitement du corpus.
Le congrès au sens large est l’unité de
traitement ; c’est un ensemble d’articles (de 100 à plus de 500)
rassemblés dans un répertoire sous la
forme de fichiers .pdf. Les congrès sont nommés et rattachés à l’organisation qui les
a réalisés.
Pseudo-congrès.
Chaque chercheur ou unité de recherche possède un ensemble
de documents .pdf provenant de sources variées (collègues, conférences,
etc…)
et aimerait les intégrer à la base MKD et les rendre accessibles à sa
communauté. Pour cela il suffit de regrouper tous ces documents dans un
répertoire qui sera traité comme celui d'un congrès. Une
vérification sera faite pour éliminer d'éventuels doublons.
Pour chaque réponse un lien permet à l'utilisateur d'accéder au document.
D’autres questions pourront être ajoutées à la demande.