Séminaire PRISMa Virginie LEFORT 03/01/2005 Algorithmes génétiques : présentation et limitations Introduction à l’algorithme RBF-Gene Séminaire PRISMa Virginie LEFORT 03/01/2005
Plan de la présentation L’évolution de l’évolution Les algorithmes génétiques classiques Applications Limitations Nouvelles découvertes biologiques Notre algorithme : le RBF-Gene
L’évolution de l’évolution Le dualisme platonicien (5ème av JC) Aristote (4ème av JC) : espèces éternelles et de complexité différente Le créationnisme biblique Le fixisme : Dieu a créé le vivant tel quel Le catastrophisme (Cuvier, 1812) : des catastrophes permettent la création de nouvelles espèces L’élan vital (Lamarck, 1809) : Orthogénèse Hérédité
L’évolution de l’évolution L’évolution des espèces (Darwin, 1859) Des variations aléatoires Survie des plus adaptés Reproduction et transmission des nouveaux caractères MAIS : tous les caractères sont transmis (innés ou acquis) et un enfant est la « moyenne » de ses parents
L’évolution de l’évolution Naissance de la génétique (Mendel, 1866) Travail sur des petits pois Définition d’un gène Formalisation Lois de Mendel MAIS pas de support pour cette « information »
L’évolution de l’évolution Théorie synthétique de l’évolution (Haldane, Fisher, Wright, 1900) Cartographie des gènes (Morgan, 1910) Association gènes-chromosome (McClintock) L’ADN et le code génétique (Watson et Crick, 1953-1966)
Les AGs classiques Inspirés des travaux biologiques dans les années 70 Caractérisés par : Un problème Un espace de recherche (pour les solutions) Un codage des points de cet espace sur un chromosome Des opérateurs génétiques Sélection des plus adaptés Reproduction Mutation
Les AGs classiques Le codage Ex 1 : Optimisation d’une fonction Chromosome : liste de chaque paramètre Codage : Ex 2 : Problème du voyageur de commerce Chromosome : liste ordonnée des villes X1 X2 X3 X4 0110 1110 1010 0010 V1 V2 V3 V4 Lyon Paris Lille Nantes
Les AGs classiques Séléction des plus adaptés : Mise en place d’une fonction de fitness associant une valeur à un individu Mécanisme de sélection : roulette-wheel, par tournoi, élitisme…
Les AGs classiques Reproduction Mutation Optimisation Voyageur
Applications Biologie Simulation de la cellule (Weinberg, 1970) Synthèse de comportements animaux (Dumeur, 1995) Alignement de séquences ADN Phylogénie (création d’arbres) Réseaux de gènes
Applications - 2 Vie artificielle Jeux Comportement de robots : évitement d’obstacles, recherche de nourriture Créatures artificielles (Sims, 1994) Simulation de comportements sociaux Jeux L’hexapion de Bagley (1967) Le dilemme du prisonnier itéré (Axelrod, 1985) Programmation de l’IA de jeux vidéos
Applications - 3 Imagerie Design / physique Réalignement d’images médicales pour comparaison (Fitzpatrick, Grefenstette, Van Gucht, 1984) Reconnaissance de caractère (ex. La Poste) Classification d’images Design / physique Design de nouvelles formes (ailes d’avions, lentilles optiques….) Localisation et identification d’un dipôle magnétique (ENSIEG, 1998) Synthèse de systèmes de mesures redondants (Heyen, 2002)
Applications - 4 Finances Productique Création de profils de clients (Golden Eyes, 1997) Prévision de valeurs boursières Prévision de consommation (électricité, eau, produit…) Productique Ordonnancement de tâches (Bourazza, 2004) Prévision du risque de défaillance (Ben Salah, 2004) Simulation et transformation du processus d’innovation (Cartier) Simulation de la dynamique de l’adaptation d’industries (Cartier, 2003)
Limitations Phagocytage de la population Le codage Convergence trop rapide de la population Manque de diversité des solutions Modification des opérateurs Le codage Nombre de gènes fixés Précision dépendante du codage Quelques heuristiques, essais-erreur Liens entre les gènes Place des gènes fixée Quelques algorithmes permettant de changer l’ordre
Nouvelles découvertes biologiques Processus complet d’expression des gènes
Nouvelles découvertes biologiques La transcription
Nouvelles découvertes biologiques La suppression des exons
Nouvelles découvertes biologiques La traduction
Nouvelles découvertes biologiques Indépendance entre les structures du génotype et du phénotype : Nombre de gènes variables Ordre des gènes indifférent Rôle des séquences non codantes Utilité d’un code génétique
Le RBF-Gene Idée forte : se rapprocher de la biologie en rajoutant un niveau intermédiaire Kernels : morceaux de solution Passage chromosome kernels : transcription Passage kernel phénotype : combinaison des kernels Champ d’application actuel : régression non linéaire
Le RBF-Gene Notre problème : la régression non linéaire
Le RBF-Gene Définition d’un kernel « Fonction simple au nombre de paramètres faible et fixé, dont la combinaison peut permettre de créer n’importe quelle fonction (approximateurs universels) » Ex : sinusoïdes, gaussiennes, triangles, rectangles…
Le RBF-Gene : codage Code génétique w: 101(gray) 110(bin) 0.75 FE… B EFDGGCFDGHEG A …D G2 G3 G4 1 σ H G μ F E w D C Stop B Start A Val. Parametre Base Code génétique w: 101(gray) 110(bin) 0.75 μ: 0110(gray) 0100(bin) 0.25 σ: 00010(gray) 00010(bin) 0.0625 μ σ Kernel K1: Phenotype :
Le RBF-Gene Les opérateurs :
Le RBF-Gene Présentation du test : Fonction originale : sin(12x) Bruit sur les points : =0.02 2 ensembles : 50 points pour la validation 50 pour l’apprentissage Population : 100 individus 10000 générations
Le RBF-Gene T=0 T=500 T=4000 T=10000
Le RBF-Gene
Le RBF-Gene Travaux en cours Le futur de la thèse ? Etude fine de la sensibilité Tests sur d’autres benchmarks Passage du codage binaire au codage réel Le futur de la thèse ? Application à la robotique Amélioration des opérateurs …
Questions ? Discussions ?