Algorithme semi-interactif pour la s�lection de dimensions
Résumé
Nous pr�sentons un algorithme g�n�tique semi-interactif de s�lection
de dimensions dans les grands ensembles de donn�es pour la d�tection
d'individus atypiques (outliers). Les ensembles de donn�es poss�dant un
nombre �lev� de dimensions posent de nombreux probl�mes aux algorithmes
de fouille de donn�es, une solution est d'effectuer un pr�-traitement afin de ne
retenir que les dimensions "int�ressantes". Nous utilisons un algorithme
g�n�tique pour le choix du sous-ensemble de dimensions � retenir. Par ailleurs
nous souhaitons donner un r�le plus important � l'utilisateur dans le processus
de fouille, nous avons donc d�velopp� un algorithme g�n�tique semi-interactif
o� l'�valuation des solutions n'�limine pas compl�tement la fonction
d'�valuation mais la couple avec une �valuation de l'utilisateur. Enfin,
l'importante r�duction du nombre de dimensions nous permet de visualiser les
r�sultats de l'algorithme de d�tection d'outlier. Cette visualisation permet �
l'expert des donn�es d'�tiqueter les �l�ments atypiques (erreurs ou simplement
des individus diff�rents de la masse).