Exercice 1 On donne la série statistique suivante, correspondant à la répartition des quotidiens de province, d’après l’importance du tirage moyen: de à moins de de à moins de de à moins de de à moins de de à moins de de à moins de de à moins de plus de polygone des fréquences histogramme: polygone des fréquences sum(v) fv=v/sum(v) fv y=c(0,fv,0) x=c(0,5,10,30,50,70,100,1 50,200,250) plot(x,y,type="l") autre possibilité : v=c(16,24,16,14,14,10,4,2 ) s=c(5500,15000,40000,6000 0,85000,125000,175000, ) r=rep(s,v) h s=rep( Exercice 2 On mesure, à un standard téléphonique, la durée de 500 communications. Le tableau ci-après donne le nombre de communications ayant duré plus de x minutes, pour x entier variant de 1 à 20. xyxy Calculer sa moyenne arithmétique x et son écart-type s. 2.Déterminer la médiane, les quartiles et l’intervalle interquartile. 3.Tracer les box-plots 4.Construire l’histogramme des fréquences et le polygone des fréquences cumulées croissantes de la durée des communications téléphoniques. x=c(0:20) y=c(460,395,310,242,195,1 66,141,118,98,80,63,50,35,23,17,10,5,3,2,0) z=c(500,y[-20]) ni=z-y pro=c(0.5+0:19) moyduree=sum(effectifs*pr o)/500 ********ou bien v=rep(pro,ni) mean(v); sd(v) summary(v) boxplot(v) hist(v) polygone des fréquences cumulées croissantes freqcum=cumsum(ni)/500 plot(pro,freqcum,type="l" ) Exercice 3 les recettes d’un commerçant, relevées pendant une période de 6 mois, sont les suivantes: Recettes en euroNombre de jours 400<R< <R< <R< <R< <R< <R< <R< <R< <R< <R< <R< <R< <R< Construire le polygone des fréquences cumulées croissantes de cette série statistique 2.Calculer sa moyenne arithmétique x et son écart-type s. ni=c(2,3,7,11,15,20,25,27,23,16,9,9,5) xi=c((4 :16)*100+50) freqcum=cumsum(ni)/sum(ni ) s=rep(xi,ni) hist(s) freqcumcrois=cumsum(table (s))/sum(table(s)) plot(xi,freqcumcrois,type ="l") #polygone des frequences cumulées croissantes moyenne arithmétique mean(s); sd(s) écart-type Exercice 4 Au poste de péage, on compte le nombre de voitures se présentant en une période de 5mn. Sur 100 observations de 5mn, faites entre 11h et 12h, observations réparties sur un mois, on obtient les résultats suivants : Nombre de voitures Nombre d’oservations Nvoi=c(0 :12) Nobs=c(0,2,8,14,20,19,15, 9,6,2,3,1,1) Construire le diagramme en bâtons et le polygône des fréquences. plot(Nvoi,Nobs,type="h"); points(Nvoi,Nobs,type="l" ); Calculer la moyenne et l’écart-type. s=rep(Nvoi,Nobs); mean(s);sd(s) Déterminer la médiane et l’écart rapporté à cette médiane. median(s); sqrt(sum(Nobs*(Nvoi- median(s))^2)/sum(Nobs)) Quelle valeur peut-on adopter pour la médiane de cette série statistique Exercice 5 Dans une importante université américaine, un échantillon au hasard de 5 professeurs femmes a donné la distribution des salaires annuels suivante (arrondis en milliers de dollars): 9,12,8,10,16. Dans la même université, un échantillon au hasard de 25 professeurs masculins a donné les salaires annuels suivants: Tracer les box plots A votre avis, que peut-on en conclure? f=c(9,12,8,10,16) m=c(13,11,19, 11, 22, 22, 13, 11,17, 13, 27,14, 16, 13, 24, 31, 9,12, 15, 15,21, 18, 11, 9, 13) boxplot(m,f) exercice 1 exercice 2 ************************* ************************* ***** exercice 3 ************************* ************************* ******** O=c(rep(1,2),rep(2,8),rep (3,14),rep(4,20),rep(5,19 ),rep(6,15),rep(7,9),rep( 8,6),rep(9,2), rep(10,3),11,12) table(O) #barplot(table(O)) #points(table(O),type="l" ) T=table(O)/100 plot(T,type="h") points(T,type="l")
Construire pour cette série statistique: 1) le polygone des fréquences cumulées saisie des données v=c(16,24,16,14,14,10,4,2) h=c(5,10,30,50,70,100,150,200,250) polygone vv=c(0,cumsum(v)) plot(h,vv,type="l")
2) le polygone des fréquences fv=v/sum(v) y=c(0,fv,0) x=c(0,h) plot(x,y,type="l")
3) l’histogramme attention il faut que les aires des rectangles soient proportionnelles aux effectifs : on enlève la dernière valeur vt=c(16,24,16,14,14,10,4) ht=c(5,10,30,50,70,100,150,200) amplitudes=c(5,20,20,20,30,50,50) ll=vt/amplitudes plot(c(5,h),c(0,ll,0),type=”s”) barplot(v,names.arg = c("5-10","10-30","30- 50","50-70","70-100"," "," "," "))
TP3 Partie 2 Statistiques Descriptives avec R