Les minerais de fer et de manganèse se retrouvent dans des contextes géologiques très variés qui ont été largement exploités aux périodes historiques et préhistoriques, même pour les plus petits d’entre eux. Afin de comprendre le rôle de ces matériaux dans les activités techniques, il est nécessaire d’en déterminer la nature et d’identifier leur origine géologique. Pour cela, leur nature pétrographique et leur composition minéralogique et élémentaire sont analysées puis comparées à des sources géologiques collectées à des échelles régionales voire nationales. Devant la complexité et l’hétérogénéité de ces données, il est nécessaire de recourir à des analyses statistiques multivariées permettant de discriminer de manière robuste les sources géologiques de natures différentes et d’établir les correspondances entre sources géologiques et matériel archéologique. Les objectifs de ce stage sont d’évaluer la pertinence et la robustesse des différents protocoles de pré-traitement des données élémentaires, combinés à différentes méthodes d’analyses multivariées et d’apprentissage automatique afin de déterminer les plus performantes. Plusieurs jeux de données géochimiques seront utilisés pour appliquer différentes méthodes de transformation des données (transformation additive, transformation centrée, transformation isométrique) en pré-traitement propres aux données de composition. Puis différentes analyses multivariées exploratoires (analyse en composantes principales (ACP)) ou encore des méthodes d’apprentissage automatique supervisées (analyses discriminantes linéaires (LDA), PLS-DA (Partial Least-Squares Discriminant Analysis), Support Vector Machine (SVM), Random Forest (RF)…) seront appliquées à chacune de ces transformations. Chacun des modèles sera évalué par l’utilisation de différentes mesures de performance. Afin de limiter les biais, le risque de sur-ajustement sera évalué par les techniques de validation croisée.
Plus d’informations :
[Télécharger l'annonce - PDF 60 Ko]