OPTIMISATION STATISTIQUE DU RENDEMENT PARAMETRIQUE DE MICROSYSTEMES (MEMS) Directeur de thèse : Christian Dufaza Co-directeur MEMSCAP : Bachar Affour Flavien Delauche Vendredi 23 mai 2003
Cadre de la thèse Sujet : Partenaires : LIRMM: Recherche universitaire Concevoir un algorithme innovant permettant l’optimisation statistique du rendement paramétrique de MEMS, le valider par son implémentation logicielle. Partenaires : LIRMM: Recherche universitaire Initiateur de la thèse Conception de structures MEMS MEMSCAP: fournisseur de solutions MEMS Accès à la CAO dédiée aux MEMS Accès à des technologies MEMS Co-initiateur LIRMM : conception (outils CAO), test, carac techno ICs et MEMS, pb d’optimisation MEMSCAP : fondée en 97, entrée en bourse en 2001, fab en 2002. Plan social en 2003, accès: - fab-technologues outils CAO-développeurs Applis MEMS-concepteurs
OPTIMISATION STATISTIQUE DU RENDEMENT PARAMETRIQUE DE MICROSYSTEMES Plan OPTIMISATION STATISTIQUE DU RENDEMENT PARAMETRIQUE DE MICROSYSTEMES Microtechnologies et rendement Définitions Exemple Estimation & optimisation du rendement Nouvelle stratégie Applications et résultats Conclusion & Perspectives Microtechnologies et rendement Estimation & optimisation du rendement Nouvelle stratégie Applications et résultats Conclusion & Perspectives
Technologies MEMS Micro-usinage en volume Micro-usinage en surface Polysilicium Gravure anisotropique du Si Pattern polysilicium Polysilicium Gravure couche sacrificielle Oxyde sacrificiel Pattern polysilicium Pattern oxyde Si Nitrure Si Systèmes simples : capteurs µcavité de précision Systèmes complexes : actionneurs contacts
MEMS : réussites industrielles sortie entrée matériau PZT ou actionneur thermique Tête d’imprimante à jet d’encre (HP) Clapet anti-retour Accéléromètre (Analog Devices) Micromiroir (TI) pompes : diabétique/insuline : lab-on-ship
CAO MEMS : Motivations MEMS en phase industrielle MEMSCAP, Intellisense, Coventor, CFDRC : pas de module d’optimisation du rendement 1/ réduction encombrement et masse (médical et spatial) MAIS techno complexes et jeunes : gros pb de rendement Semiconducteurs très concurrentiels : limiter les pertes en phase industrielle 2/ ROI, time to market… : CAO 3/ CMOS 4 paramètres de bruit critiques : Simple: pas de connaissances en maths ou stats Robuste: pas de choix d’algo fct du problème => un seul algo, robuste Modulaire : aisément utilisable avec les systèmes préexistant Beaucoup plus de paramètres technologiques critiques pour les MEMS que pour les ICs : approche différente Simple Robuste Modulaire
Rendement Catastrophique nb MEMS fonctionnant Rendement catastrophique = nb MEMS fabriqués règles de dessins? réglage machines? € ! qualité salle blanche? € ! Solutions : DRC+: limiter les surfaces de contact, espacer les structures si possible… collage, poussières, cassures Collage : défaut catastrophique
Rendement Paramétrique nb MEMS dans les specs Rendement paramétrique = nb MEMS fabriqués 80% 100% performance SH SB Nb de MEMS Solutions : MSP / APC / GPC : € ! performances P1 “fonction de transfert” - optimisation statistique MSP : carte de contrôle APC : boucle CR GPC : identification fine des signatures des anomalies opt stat: higher ROI MEMS robuste : au-delà de 100%! => marge de sécu, pas d’arrêt de production en cas de dérive. fct dans un environnement plus hostile que prévu (chocs, humidité, température, alim…) opt. stat. du rend. para. = optimisation du rendement
Plan Microtechnologies et rendement Estimation & optimisation du rendement Nature des paramètres du problème Estimation du rendement Optimisation du rendement Nouvelle stratégie Conclusion & Perspectives
Les paramètres de dessin : technologiques : mixtes : Nb de MEMS σ μ module d’Young μ σ Nb de MEMS technologiques : para techno : module d’Young, résistivité, densité, épaisseur… gaussienne (normale), loi de poisson… PM (carac) : Parametric Monitors : structures simples (beam, string…) pour carac élec ou méca des matériaux TCV (analyse de déf) : Technological Control Vehicle (1 compo de librairie : usure) : fractures méca, collages, usure, chocs, stress, décharges… SED (analyse de déf) : Standard Evaluation Devices (simple, sur dif wafers/lots) mixtes : dessin bruit
Régions remarquables P1 P2 Ra Région d’acceptabilité P1 Rt P2 Région de tolérance P2 S1 M1 S2 M2 P1 f T spécifications <-> espace vectoriel estimation : rendement<->surface mais ddp non uniforme…
Estimation du rendement Échantillonnage statistique : P1 P2 Rt Pi Monte-Carlo échantillonnage stratifié régionalisation P1 Ra Ra' Ra'' P2 exploration polyédrique : Méthodes géométriques : Pire cas : si l’on considère une seule performance et que l’analyse pire cas est dans les specs, le rendement est probablement de 100%. Autrement, on ne peut l’estimer. (arithmétique des intervalles, analyse des sommets). Rq: Comportement monotone de la fonction performance vis-à-vis du paramètre supputé généralement vérifié. PCA exploration radiale, ellipsoïdale, intégrales de surface, exploration orthogonale …
Optimisation du rendement 1 Analyse Optimisation 2 3 4 Dessin initial Analyse de sensibilité Analyse paramétrique Optimisation nominale Optimisation statistique Quand ? Cadence et MG : opt nominale et statistique Agilent : 11 opt. nom! + estimation Comment ? optimisation nominale bis optimisation basée sur une méthode géométrique optimisation à base d’échantillonnage statistique optimisation par les plans d’expériences
Optimisation du rendement Optimisation « nominale » : P2 P1 estimer le rendement : coûteux fonction performance : peut être coûteux citées : simplex, sensibilités marginales, approximation stochastique, recuit simulé, exploration axiale, intégrale de surface… ex: simplex Méthodes géométriques : Ra P2 P1 ex: optimisation polyédrique Opt nom = estimer le rendement à chaque itération : très onéreux! Si nb simus diminue, on augmente la variance de l’estimateur de MC : le bruit statistique généré peut empêcher de converger. DOE coûteux si nb important de paramètres, faible intervalle de validité. Méthodes géométriques : peu de paramètres de bruit, conditions sur Ra.
Optimisation du rendement Échantillonnage statistique : P1 P2 Rt Gr Ga Ra centre de gravité P1 P2 Rt Ra coupe méthode des coupes CoG: la plus utilisée (notamment par Aspire). Associé un facteur variable au déplacement envisagé. Economie : méthode des points communs (attention aux distributions) échantillonnage paramétrique…
Optimisation du rendement Plans d’expériences : 1. Choix d’un modèle, ex: 2. Choix d’un plan, ex: Largeur d'une poutre (X1) Longueur de la poutre (X2) Niveau bas (-) 12 μm 60 μm Niveau haut (+) 13 μm 62 μm Déf:: Un plan d’expériences est une stratégie optimale permettant de prédire avec le maximum de précision une réponse à partir d’un nombre minimal d’essais et en utilisant nu modèle postulé. Pas d’hypothèses sur la forme de Ra ou des distributions des paramètres. 1925: Fisher (agriculture : peu d’expériences), 1970: Taguchi les rend plus abordables (résolution du plan, plans fractionnaires=tables de Taguchi, graphe des effets, triangle des interactions=alias…), démarche qualité DOE=> PCA & AFC (Analyse Facteurs Communs) Il y a interaction qd l’effet de X1 sur Y est fonction de X2. X’: facteur centré. On comprend ainsi intuitivement comment il est possible de définir l'effet d'un facteur dans une série d'expériences où tous les facteurs bougent en même temps : on "annule" l'effet des autres facteurs en choisissant les expériences dont on traite les résultats. X1 X2 X1*X2 Y simulation n°1 - + Y1=2 simulation n°2 Y2=4 simulation n°3 Y3=1 simulation n°4 Y4=5 3. Écriture du modèle :
Fonctions coût indice de capabilité : performance SH Yo SB σ Nb de MEMS indice de capabilité : type de cible rapport signal/bruit nominale minimale maximale Approches et méthodes indirectes Taguchi: Japon en 70 : industries performantes, matériel d’après guerre => le produit ou procédé est une boite noire à améliorer (infos par tests et exp. du personnel). Approche occidentale moins empirique (« comprendre le problème »). 80 : les USA adopte Taguchi 90 : l’Europe suit (MFQ : 88?) Rq: l’indice de capabilité peut être décliné pour mettre l’accent (λ) sur la réduction de variance ou l’ajustement de la valeur moyenne. Taguchi : plus travaillé (min et max, tracé…) fonction perte de Taguchi (EQL) :
Bilan estimation & optimisation nombreuses méthodes analyse de Monte-Carlo : robuste facilité d’implémentation amélioration : variance de l’estimateur nombreuses méthodes restrictions sur le nombre de paramètres restrictions sur la forme de Ra différentes fonctions coût Optimisation : forme de Ra: convexe? Trous noirs? fonctions coût : dispersion et mean
Plan Microtechnologies et rendement Estimation & optimisation du rendement Nouvelle stratégie énoncé et justification plans multiples de Taguchi algorithme Applications et résultats Conclusion & Perspectives
Nouvelle stratégie Énoncé et justification : Performance P4 P3 P2 P1 Estimation du rendement 1 Estimation du rendement 2 Estimation du rendement 3 Saisie des données Réduction de la variance Ajustage de la valeur moyenne Affichage des résultats Techno jeune et complexe : dispersion critique MEMS=méca : robustesse aux chocs, inexistant pour les CIs Fonctions coût : mal adaptée à la réduction de la variance Algo pour circuits discret diffèrent des CIs Conclusion : approche en 2 temps
Nouvelle stratégie Aspect statistique : Circuits discrets : Pour réduire la variance, il faut : pour i≠j pour i=j Pour réduire la variance, il faut : Circuits intégrés : Les algorithmes mis au point pour des CD sont moins efficaces pour les CIs i=j si paramètre mixte CD: réduire variance en travaillant sur les termes quadratiques à fort coef (interactions aussi, mais généralement beaucoup plus faibles) ajuster valeur moyenne avec les termes à fort effet principal (linéaire), faible coef sur les termes quadratiques CI: un seul paramètre de bruit peut dégrader plusieurs paramètres de dessin réduire variance en travaillant sur les interactions à fort coef ajuster valeur moyenne avec les termes à fort effet principal (linéaire), si possible inutilisés à l’étape précédente Conclusion : nous postulons un modèle factoriel
Nouvelle stratégie Plans multiples de Taguchi : Exp. n°j 1 2 3 4 θ1 - + θ2 θ3 Exp. n°i x1 x2 x3 ε σ Y11 Y12 Y13 Y14 Y21 Y22 Y23 Y24 Y31 Y32 Y33 Y34 Y41 Y42 Y43 Y44 Exemple Plan principal et plan bruit (attention aux paramètres mixtes!) Définir fonction pour passer d’un scalaire à un vecteur Paramètre -> Facteur Obtention de et pour chaque paramètre
gabarit pour l'estimation du rendement Nouvelle stratégie Définition de la variance : T gabarit pour l'estimation du rendement réponse ciblée f f1 f2 f3 Y311 Y321 Y331 Y341 Y312 Y322 Y332 Y342 … Y31n Y32n Y33n Y34n Y31 Y32 Y33 Y34 scalaire vecteur
Nouvelle stratégie Définition de l’erreur : fonction complexe : xi xn simulation k cible f Gain limite gabarit courbe cible 1 2 3 4 5 6 7 8 fonction complexe : aspect « multiobjectifs » La fonction erreur est affinée pour chaque cas existant (specs). Comme pour Sigma, la perspective d’une optimisation multi-objectif entraîne des considérations supplémentaires complexes (/Yref liée aux contraintes)
Nouvelle stratégie Algorithme : 1. Réduction de la variance 2. Réduction de l’erreur Tous les xi sont fixés xi est fixé si : - Δσi négligeable - ou Δσi fait partie des moins important - ou Δσi*Δεi<0 avec Δεi non négligeable Plan d’expériences : simulations FIN Tous les xi sont fixés xi est fixé si : - Δεi négligeable ou Δεi fait partie des moins important ou faible Plan d’expériences : simulations Les paramètres évoluent dans la direction indiquée par l’itération précédente Pb du pas inter-niveaux: 2.sigma Pb du pas d’incrémentation: trop petit, amélioration non visible trop grand, minimum raté 4.sigma pour ne pas confondre les résultats de 2 itérations successives. Peu etre pris beaucoup plus faible si peu de paramètres de bruit, ou peu d’interactions. SON non implémenté, mais ça marche : on ne perd pas tout le gain de l’étape 1 car d’autres paramètres sont utilisés. Analyse de la variance (ANOVA) non nécessaire: dans la cadre de nos simulations par ordinateur, il n’existe pas de facteurs de bruit non pris en compte (non controlé) qui pourrait parasiter les résultats. Commentaires sur paramètres de l’algorithme variante : optimiseur nominal (pas de plan bruit)
Plan Microtechnologies et rendement Estimation & optimisation du rendement Nouvelle stratégie Applications et résultats Modélisation Implémentation Exemples (circuit discret, MEMS) Conclusion & Perspectives
modèle comportemental Modélisation Modèles : SPICE éléments finis comportementaux de qualité et paramétrés ! ADMS masque structure 3D FEM équations réduites modèle comportemental Verilog-A du masque au modèle comportemental spice: équations méca<->élec : module d’Young équivalent, capa planes… modèle comportementaux : modèles simples inutile pour une optimisation statistique : FEM, possibilité pour l’utilisateur d’y avoie recours si le composant recherché n’est pas en librairie exemple de la poutre (ou capas planes): dangerosité d’une modélisation trop sommaire (ancrage, over-etch) comportemental : paramétré que récemment demande des concepteurs : passerelles pour données entre les outils de conception
Modélisation Ajout de bruit intégré ou discret : Choix : y Ajout de bruit intégré ou discret : B L α D x W A C * Netlist ajout de bruit discret … plaque1 (A B C D) * Modèle … ajout de bruit intégré Si A ET B connectés : Sinon L’ajout de bruit discret nous permet de traiter des DCs ou du device-mismatch sur des ICs Bruit intégré : pas eu le temps de modifier tous les modèles. Choix : MEMS : Verilog-A (pas de bruit intégré) électronique : SPICE simulateur : Spectre
Données statistiques Dispersion des technologies : données du fondeur lot à lot wafer à wafer inter-puce intra-puce Absence de donnees en provenance des fabs : nous nous placons dans des valeurs extremes PM / TCV / SED
Réalisation d'un plan produit Implémentation Langage : JAVA Structure : Réalisation d'un plan produit n réécritures Netlist Simulation Analyse des résultats - facteurs fixés (si tous les facteurs sont fixés : FIN) - ou nouvelles valeurs attribuées et définition d'un nouveau plan produit Java : pc/unix portabilité, entretien du code aisé (+ de 4000 lignes de code) Note : ouverture de Cadence aux PC, Cadence plus utilisé: choix du Verilog-A Bottleneck : simulations, pas traitement des résultats : exit C++ Point sensible : paramètres mixtes Parser : point critique Simus : danger: check licences (threads) Pour validation : plusieurs circuits, grand nombre de paramètres => automatisation lecture/réecriture de la netlist, classement résultats Programmes extérieurs : Spectre Gnuplot Xview
Implémentation Saisie des données : 1. nom de la netlist et du technofile 2. choix des paramètres 3. description des paramètres paramètres de dessin : nom min max pas paramètres technologique : nom μ σ 4. description des spécifications : nom analyse nœud poids start stop step affichage Fréquence Valeur cible Valeur minimum Valeur maximum 200 NaN 211 -52 -46 … Valeur des fréq calculées (NaN) automatiquement avant de lancer le soft 20 log x implémenté pour AC, mais d’autres fonctions sont envisageables
Exemple circuit discret Filtre passe-bande : Suivi des paramètres : niveaux + et - ε+ et ε-, σ+ et σ- (Δε et Δσ) si fixé, pourquoi? Export sous Cadence Virtuoso, puis lecture par le parser
Exemple circuit discret Résultats chiffrés : Initial Yield : e1=0.0055 s1=1.4744 yield for simus=46.67% Yield after SR : e2=0.0017 s2=1.4378 yield for simus=86.67% Yield after MT1: e3=0.0007 s3=1.4489 yield for simus=93.33% 8 paramètres de dessin 8 paramètres de bruit σ=2% de la valeur initiale σréduc : 640 simus εréduc : 288 simus estimation : 30 simus pas : σ/2
Exemple circuit discret Analyse Monte-Carlo initiale Analyse Monte-Carlo finale
Exemple MEMS MEMS : peignes électrostatiques technologie : AMS CUP 0,6μm post-process : Carnegie Mellon University résonateur accéléromètre gyroscope filtre
Exemple MEMS Run AMS-CMU : 09/00 -> 06/01 f0=10 kHz, 10 doigts, L= 160 μm.
Exemple MEMS Saisie des données : analyse temporelle ahdli7 (net31 net32 net33 net34 net35 net36 0 0 0) BEAM_UxUyMz width=5.0E-6 length=2.0E-5 angle=-90.0 Saisie des données : x3 x1 x2 x4 beam x5 θ5 θ1, θ2, θ3 comb 20 comb 21 plate 1 plate 2 plate 3 plate 4 plate 5 θ4 analyse temporelle 5 paramètres technologiques 5 paramètres de dessin
Exemple MEMS Résultats : σréduc : 4.04e-9 4.03e-9 : 224 simus Initial Yield : e1=0.0020 s1=0.0000 yield for dots=99.80% yield for simus=80.00% Yield after SR : e2=0.0020 s2=0.0000 yield for dots=99.80% yield for simus=80.00% Yield after MT1: e3=0.0017 s3=0.0000 yield for dots=99.83% yield for simus=83.33% Yield after MT2: e4=0.0013 s4=0.0000 yield for dots=99.87% yield for simus=86.67% σréduc : 4.04e-9 4.03e-9 : 224 simus εréduc1 : 192 simus εréduc2 : 96 simus estimation : 30 simus pas : σ/2 puis σ/4
Plan Microtechnologies et rendement Estimation & optimisation du rendement Nouvelle stratégie Applications et résultats Conclusion & Perspectives
Conclusion Un algorithme d’optimisation du rendement bien adapté aux MEMS est proposé L’approche est validée par une analyse de Monte-Carlo avant et après optimisation. L’algorithme est robuste, son utilisation simple, et son implémentation d’actualité et modulaire.
Perspectives Logiciel CAO rendement et MEMS Implémenter : Estimateur de Monte Carlo à faible variance Choix des facteurs de bruit critiques Pas d’itération dynamique ACP et AFC RSM pour alléger l’algorithme CAO rendement et MEMS MEMS : secteur durement touche, mais reussites industrielles les grands intégrateurs s’impliquent dans les MEMS technologies submicroniques : criticité de la modélisation du rendement et de son amélioration MEMS : conception encore prioritaire sur rendement 1/ Stages Crolles 2 2/ MEMSCAP, Cronos, Coventor down 3/ STM MEMS
Estimation du rendement pires cas : θ1 θ2 θ3 sommet correspondant au pire cas θ1 Ra θ2 θ2 (1) θ2 (2) θ2 (3) θ2 (4) exploration orthogonale :
Modélisation et dispersions Difficultés de modélisation : Sur-gravure Poly2 Poly1 ancrage μ1 μ2 intra-puce inter-puce Valeur du facteur de bruit Θ1 (paramètre technologique) nb de mesures
Lecture des résultats Résultats : 8 paramètres de dessin GP: Initial Yield : e1=0.0055 s1=1.4744 yield for dots=99.47% yield for simus=46.67% GP: Yield after SR : e2=0.0017 s2=1.4378 yield for dots=99.83% yield for simus=86.67% GP: Yield after MT1: e3=0.0007 s3=1.4489 yield for dots=99.93% yield for simus=93.33% GP: Yield after MT2: e4=0.0007 s4=1.4475 yield for dots=99.93% yield for simus=93.33% 8 paramètres de dessin 8 paramètres de bruit σ=2% de la valeur initiale σréduc : 640 simus εréduc : 288 simus estimation : 30 simus pas : σ/2 puis σ/4