Model de control optimal vs model de système dynamique Dynamics systems vs. optimal control — a unifying view Edouard Lopez-Sandrine Poupard
Introduction 3 axes d’opposition: Control optimal vs system dynamique Mouvement discret vs mouvement cyclique Ancien point de vue vs nouveau point de vue
Control optimal (OCT) ou (RL aproach) : contrôle moteur = résultat de l'évolution du SN qui tente d'optimisé l'organisation générale moteur: baser sur l’ action modélise pour tache précise pas flexible: milieu statique entièrement prédictible mouvement discret mouvement cyclique= cycle de suite mouvement discret apprentissage par renforcement (RL): cherche à optimiser somme des récompenses sur une période Trajectoire parfaite: trajectoire linéaire
Système dynamique (SDT) : contrôle moteur = processus d'auto organisation entre un individu et son milieu modélise :comportement d'entrainement et synchronisation cible = point attracteur, ou courbe attractive environnement pas prédictible ou instable baser sur état cinématique Trajectoire parfaite non linéarité mouvement périodique mouvement discret= mouvement cyclique interrompue
Bleu= discret- rythmique
Nouveau model modéliser: mouvement point à point et rythmique mouvement utilisant plusieurs articulations avec phase de blocage compenser par d'autre articulation mouvement a trajectoire plutôt complexe apprentissage et optimisation de mouvement phénomène de couplage temps Model de mouvement mouvement robuste
Fonctionnement Dynamic Movement Primitives (DMPs) basée sur un model system dynamique améliorer par model optimal cinématique désirer pour atteindre la cible transformer en command motrice (feedforward)
2 équation: équation canonique équation de sortie donne la phase et permet incrémentation dans l’equation de sortie équation de sortie exemple pour les point attracteur peut faire des application sur le déroulement du temps pour les mouvement cyclique:
mouvement multidimensionnel même équation canonique équation sortie différentes pour chaque articulation optimisation et apprentissage par renforcement = trouver le poids wi tout les calcul d'optimisation possible tennis
Capacités peut contrôler amplitude, fréquence et setpoint dans une oscillation indépendante peut incorporer toute les techniques et récente théorie qui prenne des entrée cinématiques pour planifier trajectoire
Conclusion Modèle concluent Pas de réel différence entre mouvement cyclique et discret Pas de réel différence entre control optimal et system dynamique