Problématique

Les ordinateurs ont atteint une puissance suffisante pour traiter des masses de données de plus en plus grandes. L’intelligence, comment la mettre en évidence,  de la machine ne correspond qu’a un traitement massif de données. Pour lui donner un semblant d’intelligence afin qu’elle aide l’utilisateur à répondre à une question précise, un prétraitement des données semble être une approche efficace.

Comment, pour une situation donnée, peut-on connaître causes et conséquences de cette situation ? C’est-à-dire avoir un diagnostic et/ou des propositions d’actions. Ce qui revient à présenter à l’ingénieur-utilisateur les bonnes pages d’une encyclopédie virtuelle, des normes et des recommandations du domaine défini par la question posée.

Le projet  MKD aborde cette problématique en traitant un domaine dont l’étendue, qui peut être élargie à la demande, est limitée par le recueil d’écrits contenant le savoir du domaine. A des fins pratiques les premières expériences utilisent les documents fondamentaux d’un domaine comme les manuels, les cours magistraux, les recommandations, les normes et les congrès.

Le domaine choisi pour cette expérience est celui de la géotechnique, cette branche du génie civil qui se préoccupe de l’interaction des ouvrages et du sol afin de construire les infrastructures de demain.
Le domaine est donc défini par un corpus de texte, ce qui permettra à d’autres utilisateurs d’aborder tout domaine.

Domaine de la géotechnique.
La littérature est abondante car l’évolution technologique (matériaux et matériels) et scientifique (techniques de reconnaissance et modélisation) est en constante progression et mondialement soutenue. Les nombreux congrès apparaissent alors comme une source incontournable d’informations possédant des marqueurs temporels permettant aussi de mettre en évidence l’évolution des techniques. Des cours, des recommandations et des normes seront ajoutés au corpus.

Traitement du corpus.
Le congrès  au sens large est l’unité de traitement ; c’est un ensemble d’articles (de 100 à plus de 500) rassemblés  dans un répertoire sous la forme de fichiers .pdf. Les congrès sont nommés et rattachés à l’organisation qui les a réalisés.

Pseudo-congrès.
Chaque chercheur ou unité de recherche possède un ensemble de documents .pdf provenant de sources variées (collègues, conférences, etc…) et aimerait les intégrer à la base MKD et les rendre accessibles à sa communauté. Pour cela il suffit de regrouper tous ces documents dans un répertoire qui sera traité comme celui d'un congrès.  Une vérification sera faite pour éliminer d'éventuels doublons.

Les questions suivantes permettent de trouver l'information qui aidera l'utilisateur à résoudre son problème.

Pour chaque réponse un lien permet à l'utilisateur d'accéder au document.

D’autres questions pourront être ajoutées à la demande.