RNTI

MODULAD
Algorithme semi-interactif pour la s�lection de dimensions
In EGC 2006, vol. RNTI-E-6, pp.323-334
Résumé
Nous pr�sentons un algorithme g�n�tique semi-interactif de s�lection de dimensions dans les grands ensembles de donn�es pour la d�tection d'individus atypiques (outliers). Les ensembles de donn�es poss�dant un nombre �lev� de dimensions posent de nombreux probl�mes aux algorithmes de fouille de donn�es, une solution est d'effectuer un pr�-traitement afin de ne retenir que les dimensions "int�ressantes". Nous utilisons un algorithme g�n�tique pour le choix du sous-ensemble de dimensions � retenir. Par ailleurs nous souhaitons donner un r�le plus important � l'utilisateur dans le processus de fouille, nous avons donc d�velopp� un algorithme g�n�tique semi-interactif o� l'�valuation des solutions n'�limine pas compl�tement la fonction d'�valuation mais la couple avec une �valuation de l'utilisateur. Enfin, l'importante r�duction du nombre de dimensions nous permet de visualiser les r�sultats de l'algorithme de d�tection d'outlier. Cette visualisation permet � l'expert des donn�es d'�tiqueter les �l�ments atypiques (erreurs ou simplement des individus diff�rents de la masse).