Mois de naissance Comment se répartissent les naissances ? Quelles données étudier ? Comment les étudier ?
Des stagiaires de l’IUFM de Grenoble ont demandé à leurs élèves leur mois de naissance Le mois d’Octobre est le mode * des résultats obtenus. *Mode : résultat le plus fréquent.
On calcule nt= 604/12 (effectif théorique d’équipartition) On va regarder si l’échantillon des 624 données peut être considéré comme un échantillon de nombres entiers entre 1 et 12, tirés au hasard Y a-t-il adéquation à une loi équirépartie (cf. programme de terminale S) ? On calcule nt= 604/12 (effectif théorique d’équipartition) puis d = [(n1- nt)2+…+ (n12- nt)2] / nt , où ni est le nombre de données qui valent i, i=1…12. (la construction de d est issue de résultats théoriques concernant la répartition des valeurs qu’elle prend :on montre que d suit une loi du khi-deux à 6 degrés de liberté) dobs= 9,8 : cette valeur se trouve « au milieu » des valeurs simulées de d (voir ci-dessous un histogramme de 1 000 valeurs simulées de d, calculées sur des échantillons de taille 624 de nombres entiers entre 1 et 12, tirés au hasard ). Le modèle équiréparti est, au vu des simulations, compatibles avec les données recueillies.
On peut regarder des données de l’INSEE, qui donnent toutes les naissances par mois entre 1975 et 2005 Les pics de naissance annuels ne sont jamais en octobre !
Naissances : trois quinquennats Lecture : la moyenne des nombres de naissances des mois d’ avril 2000,2001,2002,2003,2004 est environ 65000.
Pour ceux qui connaissent le test du khi-deux Y a-t-il équirépartition des moyennes mensuelles des naissances en 1975 ? Le khi-deux vaut environ 5000. L’équirépartition est rejetée. Y a-t-il équirépartition de la moyenne des naissances entre 1990 et1994 ? Le khi-deux vaut environ 1500. L’équirépartition est rejetée. Y a-t-il équirépartition de la moyenne des naissances en 2000 ? Le khi-deux vaut environ 800. L’équirépartition est rejetée. Comparaison des répartitions selon les mois entre les naissances de 1975 et celles de l’IUFM : différence non significative (khi-deux=10,6). Comparaison des répartitions selon les mois entre les naissances de 1990 et celles de l’IUFM : différence non significative (khi-deux=9). Comparaison des répartitions selon les mois entre les naissances de 2000 et celles de l’IUFM : différence non significative (khi-deux=9,3). Conclusion : Le pic d’octobre ne reflétait ici..que la fluctuation d’échantillonnage.
Tous les mois n’ont pas même nombre de jours, d’où l’idée de regarder le nombre moyen de naissances par jours. Le mois de février ne correspond plus toujours au mois le plus bas.
De 1975 à 1989, le pic de naissance est en mai De 1975 à 1989, le pic de naissance est en mai. Depuis 1991 , le pic des naissances est en juillet.
Complément : Taux mensuel de natalité : Nombre de naissances pour 1000 habitants
Conclusion : Il est intéressant de recueillir des données soi-même : cela motive les élèves... mais si on ne peut pas les comparer à d’autres données du même type, ici des données au niveau national, on risque de laisser aux élèves un souvenir qui ne correspond pas à la réalité. Une question surgit à la lecture de ce données : pourquoi, plusieurs années de suite, le pic des naissances est en mai, puis pourquoi il passe en juillet. On peut sur cette question interroger le sociologue, le démographe ou le biologiste.