Un outil pour prédire la pertinence d’une structure secondaire d’ADN - Le point J. Cambefort, LEPG, 15 octobre 2007
Contexte (Rappel) Séquence fasta Mfold Extraction des entropies, du nombre de folds Graph dans JMP splitfasta.pl, callMfold.sh lire_mfold.pl callShuffle.sh Plus un programme qui appelle tous les autres. splitfasta.pl, callMfold.sh Shuffleseq (100 ou 1000 fois) J. Cambefort, LEPG, 15 octobre 2007
Contexte (Rappel) A la sortie de lire_mfold.pl: A la sortie de JMP: J. Cambefort, LEPG, 15 octobre 2007
Problème (Rappel) JMP est cher. Trouver un logiciel libre similaire à JMP (densité non-paramétrique), et utilisable en ligne de commande. J. Cambefort, LEPG, 15 octobre 2007
Première idée : Contourner JMP avec R Pas de fonction miracle ! Algorithme d’après JMP : J. Cambefort, LEPG, 15 octobre )Divide each axis into 50 binning intervals, for a total of 2,500 bins over the whole surface. 2)Count the points in each bin. 3)Decide the smoothing kernel standard deviation using the recommendations of Bowman and Foster (1992). 4)Run a bivariate normal kernel smoother using an FFT and inverse FFT to do the convolution. 5)Create a contour map on the 2,500 bins using a bilinear surface patch model.
Deuxième idée : Utiliser un Z score Définition du Z score : où est la moyenne, et l'écart type. J. Cambefort, LEPG, 15 octobre 2007
Deuxième idée : Utiliser un Z score Deux possibilités : 1.Calcul du Z score par séquences. 2.Calcul du Z score par nombres de repliements J. Cambefort, LEPG, 15 octobre 2007 Pour une séquence Pour un nombre de repliements
Conclusion A votre avis, dans les idées exposées, quelle est la meilleure, la plus juste ? Je n’ai pas beaucoup avancé, je suis lente et au LEPG, il y a d’autres priorités… J. Cambefort, LEPG, 15 octobre 2007