Diplôme: Licence Sciences Spécialité: Sciences du vivant Parcours: Biochimie et Biologie Moléculaire Biologie Cellulaire et Physiologie Chimie et Biologie Sciences de la Vie et de la Terre Année: 2012/2013 second semestre Session : contrôle continu, première épreuve Intitulé UE: VI00FUST Intitulé épreuve: Statistique pour Biologistes L3 S6 Durée: 1h Enseignant référent: R.Supper L’usage des téléphones portables (et autres appareils électroniques) est interdit pendant toute la durée de l'épreuve. Les appareils doivent impérativement être éteints et rangés pendant l'épreuve. Ils ne peuvent donc pas être utilisés comme chronomètre ou calculatrice. L'épreuve se déroulera sans document. Le seul type de calculatrice autorisé est le modèle basique quatre opérations. EXERCICE no.1 Coefficient Binomial Question 1. Déterminer le coefficient binomial: Question 2. On vous fournit les trois coefficients binomiaux ci-dessous: En déduire le coefficient binomial: EXERCICE no.2 Loi Binomiale Soit S une variable aléatoire qui suit la loi binomiale B ( 7 , ½ ). Question 1. Calculer P ( S = 4 ) Question 2. Calculer P ( S ≤ 2 ) EXERCICE no.3 Somme d'entiers consécutifs Question 1. Que vaut la somme des 2013 entiers ci-dessous ? 1 + 2 + 3 + 4 + ... ... ... + 2012 + 2013 = ? Question 2. Déterminer un nombre entier n tel que 1 + 2 + 3 + ... ... + n = 210. EXERCICE no.4 Loi Normale Soit Z une variable aléatoire qui suit la loi normale centrée réduite N ( 0 , 1). Question 1. Calculer P ( Z ≤ - 1,13 ) Question 2. Trouv er un nombre a >0 tel que P ( Z ≥ a ) = 0,0113 EXERCICE no.5 Test des Signes On étudie les variations saisonnières du stress vécu par les lémuriens à queue annelée de Madagascar ( Lemur catta ). Une mesure hormonale du stress est la concentration de cortisol dans les excréments de l'animal. Cette concentration est mesurée en nanogrammes de cortisol par gramme d'excréments. Les observations portent sur des lémuriens femelles, à deux époques différentes: en période de gestation, puis en période de lactation. Dans les colonnes (I) et (II) du tableau ci-dessous, sont consignées ces deux séries de mesures (appariées) du logarithme de la concentration. La colonne (III), obtenue par soustraction (II) - (I), représente la variation entre ces deux périodes. Le caractère étudié ici est la variable aléatoire X = variation du logarithme de la concentration. I II III Saison 1 période de gestation de mai à juillet Saison 2 période de lactation d'août à novembre Variation 0,80 0,30 0,25 -0,47 0,65 -0,22 -0,45 -0,10 -0,15 0,15 0,05 -0,05 -0,35 -0,05 -0,20 -0,30 -0,20 -0,20 -0,65 -0,25 -0,30 0,12 -0,70 0,02 0,15 -0,10 -0,05 Oxford Journals in Life Science, Behavioral Ecology (May/June 2005) 16 (3): 550-560, article de R. Ethan Pride A partir des colonnes (I) et (II), MINITAB a calculé les différences deux à deux, pour lesquelles il fournit ci-dessous quelques statistiques descriptives. De même pour les moyennes deux à deux calculées à partir de la colonne (III). Statistiques descriptives : moyennes 2 à 2 Variable Moyenne EcTyp Variance Somme Minimum Médiane Maximum moyennes 2 à 2 -0,1956 0,2195 0,0482 -8,8000 -0,7000 -0,1750 0,1500 Statistiques descriptives : différences 2 à 2 Variable Moyenne EcTyp Variance Somme Minimum Médiane Maximum diff 2 à 2 0,1956 0,4615 0,2130 15,8400 -0,6200 0,1000 1,1500 On vous fournit également quelques valeurs de P ( S ≤ k ) , où S est une variable aléatoire de loi binomiale B ( m , ½ ) , pour différents entiers k et m : m = 8 m = 9 m = 10 k = 0 k = 1 k = 2 k = 3 k = 4 0,003906 0,035156 0,144531 0,363281 0,636719 0,001953 0,019531 0,089844 0,253906 0,500000 0,000977 0,010742 0,054687 0,171875 0,376953 Question 1. Quelle est l'hypothèse (H0) du test des signes? choisir la bonne réponse parmi les phrases ci-dessous: a) le caractère X est de loi continue b) les populations (I) et (II) ont la même moyenne théorique c) le caractère X suit une loi normale d) les deux échantillons (I) et (II) sont homogènes e) le caractère X suit une loi discrète f) la médiane de X (ou médiane théorique) est nulle g) le caractère X suit une loi symétrique h) le caractère X suit une loi symétrique par rapport à l'origine i) la moyenne théorique est nulle Question 2. On note s la valeur observée pour la statistique du test des signes. On souhaite pratiquer le test des signes au seuil 5%. D éterminez l'intervalle I tel que: si s ∉ I , alors on rejette (H0) si s ∈ I , alors on considère (H0) vraie Question 3. Dans l'affichage MINITAB ci-dessous, les valeurs de s , p et m ont été effacées. Recalculez-les. Test du signe pour la médiane : variation de log(concentration) Test du signe de la médiane = 0,00000 contre test différent de 0,00000 N Au-dessous Egal Au-dessus P Médiane variation ? ?? ?? s = ? p = ? m = ? Question 4. Pour formuler la décision du test, choisissez parmi les phrases ci-dessous: a) on accepte (H0) car p >0,5 b) on accepte (H0) car p < 0,95 c) on rejette (H0) car p > 0,05 d) le stress a sensiblement diminué en période de lactation car m <0 e) on rejette (H0) car p > 0,5 f) on accepte (H0) car | m | < p g) on accepte (H0) car p > 0,05 h) on rejette (H0) car m < 0 i) on rejette (H0) car p < 0,95 Question 5. Pour évoquer le risque d'erreur dans cette prise de décision, choisissez parmi les phrases ci- dessous: a) on accepte (H0) avec un risque d'erreur de 5% b) on rejette (H0) avec un risque de première espèce c) on court un risque d'erreur de 5% car s ∈ I et cet intervalle I a été construit pour un seuil de 5% d) on rejette (H0) avec un risque de deuxième espèce e) le risque d'erreur est égal à p f) on accepte (H0) avec un risque de deuxième espèce g) le risque d'erreur est égal à | m | h) on accepte (H0) avec un risque de première espèce i) on rejette (H0) avec un risque d'erreur de 5% EXERCICE no.6 Test des Rangs Signés de Wilcoxon On reprend intégralement les données de l'exercice précédent. Question 1. Quelle est l'hypothèse (H0) du test de Wilcoxon? Choisir la bonne réponse parmi les phrases proposées à la question 1 de l'exercice 5. Question 2. Quand il pratique le test de Wilcoxon, MINITAB sous-entend implicitement que l'utilisateur a au préalable vérifié une certaine condition. Laquelle? choisir la bonne réponse parmi les phrases proposées à la question 1 de l'exercice 5. Question 3. La statistique du test de Wilcoxon est une variable aléatoire notée W qui peut prendre diverses valeurs, selon les échantillons considérés. Parmi toutes ces valeurs possibles, quelle est la valeur maximale? Question 4. Au niveau de l'échantillon particulier sur lequel porte notre expérience, quel est le rang associé à l'observation 0,15 dans la colonne (III) ? Question 5. On note w la valeur observée pour la statistique du test de Wilcoxon. On souhaite pratiquer le test de Wilcoxon au seuil 5%. D éterminez l'intervalle J tel que: si w ∉ J , alors on rejette (H0) si w ∈ J , alors on considère (H0) vraie Question 6. A partir des données de l'exercice précédent, MINITAB fournit l'affichage ci-dessous, dans lequel les valeurs de w et e ont été effacées. Recalculez-les. Test des rangs signés de Wilcoxon : variation de log(concentration) Test de médiane = 0,000000 contre médiane différente de 0,000000 N pour Statistique Médiane N test de Wilcoxon P estimée variation ? ? w = ? 0,155 e = ? Question 7. Parmi les formules ci-dessous, déterminer laquelle représente la P- valeur associée à notre expérience : a) 2 P ( W > w ) d) P ( W ≥ w ) g) P ( W ≤ w ) b) P ( W > w ) e) 2 P ( W < w ) h) 2 P ( W ≤ w ) c) 2 P ( W ≥ w ) f) P ( W < w ) i) P ( - w ≤ W ≤ w ) Question 8. Pour formuler la décision du test, choisissez parmi les phrases ci-dessous: a) le stress est significativement plus élevé en période de gestation b) on rejette (H0), en d'autres termes: il n'y a pas de modification significative du stress c) le stress est plus important en période de gestation car | e | > P d) on accepte (H0), en d'autres termes: il n'y a pas de modification significative du stress e) le stress a sensiblement diminué en période de lactation car e <0 f) on accepte (H0) autrement dit: le stress diminue en période de lactation g) il n'y a pas de modification significative du stress car P < 0,5 h) on rejette (H0), c'est-à-dire: le stress est significativement moindre en période de lactation i) le stress est plus important en période de gestation car P < 0,5 EXERCICE no.7 Analyse de la Variance Le coucou d'Europe pond fréquemment ses oeufs dans les nids d'oiseaux d'autres espèces et ceux-ci ne remarquent pas de différence entre leurs propres oeufs et ceux de l'intrus. On a mesuré le diamètre Y (en millimètres) de 30 oeufs de coucou pondus dans des nids de trois espèces différentes ( Fauvette , Rouge-Gorge , Bergeronnette ) à raison de dix observations pour chaque type de nid, en d'autres termes: I = 3, J = 10, n = 30. Les valeurs mesurées y ij sont rassemblées dans le tableau ci-dessous (1 ≤ i ≤ I , 1 ≤ j ≤ J ) On cherche à savoir si la taille de ces oeufs de coucou diffère selon le type de nid parasité. Nid de Fauvette Nid de Rouge-Gorge Nid de Bergeronnette 20,9 21,7 22,0 22,8 23,1 23,8 23,8 23,9 24,0 25,0 21,8 22,3 22,3 22,4 23,0 23,0 23,0 23,0 23,3 23,9 21,8 21,8 22,4 23,0 23,1 23,3 23,4 24,0 24,0 24,9 Biometrica (1902) Volume 1, pages 164-176, article de O.H.Latter On vous fournit la moyenne de chaque échantillon: Nid de Fauvette Nid de Rouge-Gorge Nid de Bergeronnette y 1 = 23,1 y 2 = 22,8 y 3 = 23,17 Question 1. Calculez la moyenne générale y Question 2. Le tableau d'analyse de la variance copié ci-dessous est incomplet. Retrouvez la valeur de la variation factorielle. Variation Degré de liberté Variance Factorielle SC F = ?? dln = 2 s F 2 = 0,387 f = 0,398 Résiduelle SC R = ?? dld = 27 s R 2 = 0,972 Question 3. De même pour la variation résiduelle. Question 4. On pratique un test ANOVA au seuil 5%. Quelle est la valeur critique c correspondante? Question 5. Pour formuler la décision, choisir parmi les phrases ci-dessous: a) il y a une différence significative entre ces trois catégories d'oeufs car s F 2 < s R 2 b) il n'y a pas de différence significative entre ces trois catégories d'oeufs car s F 2 < f c) il y a une différence significative entre ces trois catégories d'oeufs car s F 2 et s R 2 sont < c d) il y a une différence significative entre ces trois catégories d'oeufs car f < c e) il n'y a pas de différence significative entre ces trois catégories d'oeufs car s F 2 < s R 2 f) il y a une différence significative entre ces trois catégories d'oeufs car s F 2 < f g) il n'y a pas de différence significative entre ces trois catégories d'oeufs car f < c h) il y a une différence significative entre ces trois catégories d'oeufs car f < s R 2 i) il n'y a pas de différence significative entre ces trois catégories d'oeufs car f < s R 2 Table des valeurs critiques (au seuil 0,05) pour la loi de Fisher La fonction de répartition F d'une variable aléatoire Z de loi normale centrée réduite N ( 0 , 1) est définie par: F(x) = P ( Z ≤ x ) pour tout réel x. Le nombre F(x) peut être interprété comme la surface grisée: La table ci-dessous fournit des valeurs de F(x) : ou ou