Está en la página 1de 10

Universidad de Sevilla

Facultad de Física

COMPO

Entrega problemas estadísticos:

Autores
Antonio Jiménez Recio
Andrea Romero Salazar
Paula Guerrero Martinez

Marzo 2022
EJERCICIO 1.- Del siguiente ejercicio, calcular la varianza y la desviación típica:
a)

ni X Intervalo f .absoluta f .acumulada f .relativa f .r.acumulada f .X x2 fx2


1 52 50 − 54 7 7 0, 078 0, 078 364 2704 18928
2 56 54 − 58 10 17 0, 111 0, 189 560 3136 31360
3 60 58 − 62 16 33 0, 178 0, 367 960 3600 57600
4 64 62 − 66 20 53 0, 222 0, 589 1280 4096 81920
5 68 66 − 70 18 71 0, 200 0, 789 1224 4624 83232
6 72 70 − 74 11 82 0, 122 0, 911 792 5184 57024
7 76 74 − 78 8 90 0, 089 1, 000 608 5776 46208
448 90 1 5788 376272

Tabla 1: Tabla del apartado a) del ejercicio 1

b)

ni xi yi xi2 yi2 xi yi
1 0, 8 1 0, 64 1 0, 8
2 1 2 1 4 2
3 1, 2 3 1, 44 9 3, 6
4 1, 3 5 1, 69 25 6, 5
SUMA 4, 3 11 4, 77 39 12, 9

Tabla 2: Tabla del apartado b) del ejercicio 1

Para el apartado a) lo que tenemos es una tabla de frecuencias, por lo tanto, para obtener lo que
nos pide el ejercicio y en base a los datos que tenemos, las ecuaciones que han sido usadas son las que
aparecen en la Tabla 3.

Media Varianza muestral Desviación típica


√ muestral
1
Pn Pn
X̄ = N i=1 xi fi σ = N1 i=1 (xi − X̄)2 fi
2
σ = σ2

Tabla 3: Media, varianza y desviación típica para una distribución de datos con sus respectivas frecuencias.
Siendo N la frecuencia total acumulada y que representa el tamaño de la muestra y n el numero de valores
distintos que ha tomado la variable X

Para el apartado b) hemos usado otras ecuaciones puesto que lo que tenemos son dos variabes cuan-
titativas. Además hemos calculado la covarianza para hacer uso de la última columna de la tabla 2 y con
ello poder ver la relación entre ambas.

Media X Varianza x Desviaciónptípica x


Pn Pn
X̄ = n1 i=1 xi 2
σX = 1
n i=1 (xi − X̄)
2
σX = σX 2

Media Y Varianza y Desviaciónptípica y


Pn Pn
Ȳ = n1 i=1 yi σY = n1 i=1 (yi − Ȳ )2
2
σY = σY2

Tabla 4: Media, varianza y desviación típica para dos variables X e Y

1
Por tanto, para el apartado a) tenemos:

1
X̄ = 90 (52 · 7 + 56 · 10 + 60 · 16 · · · 76 · 8) = 64, 31
1
σ =√89 ((52 − 64, 31)2 7 + · · ·(76 − 64, 31)2 8) = 11, 79 + 7, 67 + · · · + 7, 23 + 12, 14 = 44, 88
2

σ = 45, 39 = 6, 70

Para el apartado b), por otra parte:

X̄ = 14 (0, 8 + 1 + 1, 2 + 1, 3) = 1, 08
2 1 2 2
σX =√ 4 ((0, 8 − 1, 08) + · · ·(1, 3 − 1, 08) ) = 0, 0189 + 0, 0014 + · · · + 0, 0127 = 0, 0369
σX = 0, 0369 = 0, 1920

Ȳ = 14 (1 + 2 + 3 + 5) = 2, 75
1
σY2=√ 2 2
4 ((1 − 2, 75) + · · ·(5 − 2, 75) ) = 0, 77 + 0, 14 + · · · + 0, 1, 27 = 2, 19
σY = 2, 19 = 1, 48

EJERCICIO 2.- Se supone que los resultados de un examen siguen una distribución
normal con media 78 y desviación típica 36. Se pide:
a). ¿Cuál es la probabilidad de que una persona que se presenta el examen obtenga una
calificación superior a 72?

En este caso, tenemos que µ = 78 y σ = 36, si la distribución normal sigue la función que aparece en
la Ec. 1.
1 1 (x−µ)
2

f (x) = √ e− 2 σ2 (1)
σ 2π
Lo que se ha hecho ha sido tipificar la variable ”x” para que nos quede una distribución normal
estándar. Por lo que haremos uso de la Ec. 2
x−µ
z= (2)
σ
Nos piden P (x > 72) = P (z > −0, 1666) y sabemos que P (z > −0, 1666) = P (z < 0, 1666), como
podemos ver en la Fig. 1

Figura 1: Representación gráfica de la distribución esbozada a mano por unos de los integrantes del grupo
de trabajo

Por lo que si hacemos uso de la tabla de distribución normal estandarizada llegamos al resultado de
que P (x > 72) = 0, 5636, lo que quiere decir que un 56, 36 % obtienen mas de un 72.

EJERCICIO 3.- Ejemplo de contraste de hipótesis para la media, µ con σ conocida (dos
colas).

Se desea contrastar con un nivel de significación del 5 % la hipótesis de que la talla media
de los hombres de 18 o más años de un país es igual a 180. Suponiendo que la desviación
típica de las tallas en la población vale 4, contraste dicha hipótesis frente a la alternativa
de que es distinta.

H0 : µ = 180

2
frente a la alternativa:

H1 : µ 6= 180
Los datos constituyen una muestra de n = 15 hombres seleccionados al azar, cuyas alturas
son:

167 167 168 168 168 169 171 172 173 175 175 175 177 182 195
Que el nivel de significación sea del 5 % es que α = 0, 05. Se quiere comprobar la hipótesis H : µ = 180,
es decir, que la talla media es igual a 180. Tenemos una desviación típica σ = 4.
Con los datos que se nos proporcionan podemos calcular la media aritmética de la la siguiente forma:
Pn k
(xi )
mk = i n donde k=1 por ser la media aritmética y n=15.
Es decir, la media es m1 = 173, 47. Como nos piden α = 0, 05, es decir, una confianza del 95 %, tenemos
que obtener un valor |Z| < z α2 , que para una confianza del 95 % sabemos que es 1,96. Comprobemos qué
se obtiene con la hipótesis de µ = 180.
−µ
m1√ 173,47−180
Z= σ/ n
= √
4/ 15
= −6, 32

Como podemos observar, |Z| es mucho mayor que z α2 , asi que tenemos que descartar la hipótesis
H0 : µ = 180, y llegamos a la conclusión de que no es correcta.

EJERCICIO 4.- Los miembros de un equipo ciclista se dividen al azar en tres grupos
que entrenan con métodos diferentes. El primer grupo realiza largos recorridos a ritmo
pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en
el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un mes de
entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado
de 9 Km. Los tiempos empreados fueron las siguientes:

Método I Método II Método III


15 14 13
16 13 12
14 15 11
15 16 14
17 14 11

A un nivel de confianza del 95 %. ¿Puede considerarse que los tres métodos producen
resultados equivalentes? O por el contrario, ¿ hay algún método superior a los demás?
Se empieza definiendo las variables de estudio:

-Hipótesis nula (H0): Los tres métodos de entrenamiento producen resultados equivalentes (no existe
diferencia entre los grupos).

-Hipótesis alternativa (H1): Alguno de los métodos es superior a los demás (existe diferencia entre los
grupos).

Una vez definidas estas variables, se define como factor el método de entrenamiento que tiene 3 niveles,
dependiendo si es el método I, II o III. Y las respuestas a los tiempos empleados por cada ciclista en
recorrer los 9 kilómetros después del mes.

Haciendo uso del software minitab, se procede a testar las hipótesis mediante el método ANOVA a
un solo factor, por lo que se obtienen las siguientes tablas representadas en las Figuras 2, 3 y 4:

3
Figura 2: Primera tabla obtenida con el software MINITAB

Figura 3: Segunda tabla obtenida con el software MINITAB

Figura 4: Tercera tabla obtenida con el software MINITAB

Donde:

-GL: grados de libertad

-SC: suma de cuadrados

-MC: media de cuadrados

-Valor F: Estadístico de contraste. Es un parámetro para tener en cuenta en el ajuste de Fisher.

-Valor p: Potencia estadística.

El valor p es 0,004 y α 0,05 . Como p es bastante menor que el nivel de significancia (α), rechazamos
la hipótesis nula y aceptamos la hipótesis alternativa. Esto quiere decir que no podemos considerar que

4
los tres métodos produzcan resultados equivalentes.

Para saber que método es el mejor, llevamos a cabo una comparación en parejas de Fisher que aparecen
en las gráficas representadas en las Figuras 5 y 6.

Figura 5: Primera gráfica obtenida con el software MINITAB

Figura 6: Segunda gráfica obtenida con el software MINITAB

Los resultados nos muestran como el método III es bastante diferente del método I y II, los cuales
son similares entre si. Por lo que el método III es el más eficaz de los tres.

5
EJERCICIO 5.- Se quiere estudiar el efecto de distintas dosis de un medicamento para
combatir un parásito de peces criados en acuicultura. Para ello, se tomaron 60 peces al azar,
y se dividieron en 5 grupos de 12 individuos cada uno. El primer grupo no fue medicado,
pero a los restantes se le suministró el medicamento en dosis crecientes. Tras una semana
de tratamiento, se contabilizaron los parásitos existentes en cada individuo, obteniendo los
resultados siguientes:

Control 50 65 72 46 38 29 70 85 72 40 57 59
25mg 49 47 30 602 62 60 19 28 56 62 55 40
50mg 20 59 64 61 28 47 29 41 60 57 61 38
100mg 20 23 38 31 27 16 27 18 22 12 24 11
125mg 18 30 22 26 31 11 15 12 31 36 16 13

Constrastar si el medicamento es efectivo contra los parásitos y si existen diferencias


según la dosis aplicada.

Para hacer un análisis de este problema sería conveniente realizar un test ANOVA, es decir, queremos
comprobar si existe alguna diferencia significativa entre nuestros grupos de estudio. De esa manera podre-
mos comprobar si tomar o no el medicamento afecta a la media de parásitos, y si existe alguna diferencia
entre las distintas dosis. Siendo la hipótesis nula H que la media no tiene diferencias significativas entre
grupos, si nuestros datos superan el test ANOVA podemos concluir que la hipótesis nula es cierta, es
decir, que el medicamento no sería efectivo. En caso contrario, si descartamos la hipótesis nula, sabremos
que la media es distinta en al menos algún grupo, es decir, que el medicamento esta causando algún efecto.

Vamos a utilizar el software Minitab para realizar este test. Para ello introducimos los datos y apli-
camos el test ANOVA de un solo factor. Vamos a imponer un nivel de confianza del 95 %.

Tras hacer un análisis inicial hemos tenido que eliminar el valor ’602’ de la fila ’25mg’, ya que es muy
extremo en comparación al resto de valores, es decir, un outlier. En la gráfica que aparece en la Figura 8
vemos lo mucho que se aleja de la media de su grupo.

Figura 7: Gráfica de caja para los valores, incluyendo el valor 602.

6
Figura 8: Gráfica de caja excluyendo el valor 602

Una vez hemos tomado esa decisión, realizamos el test ANOVA de un solo factor

Figura 9: Cuarta tabla obtenida con el software MINITAB

Solo tendríamos que mirar el Valor p (la potencia estadística) para ver que es muy pequeño, es decir,
tenemos que rechazar la hipótesis nula y aceptar la hipótesis alterna: Hay al menos un grupo que tiene
una media distinta al resto.

7
Podemos comprobarlo de manera más rigurosa comprobando el valor F en la tabla ANOVA, pero
sabiendo que ese valor debería ser cercano a 1, podemos concluir con seguridad que nuestros datos no
han pasado el test.

El test ANOVA no nos indica qué grupos difieren en media, solo que al menos uno lo hace, así que
nuestro siguiente paso para determinar si el medicamento es efectivo es hacer un análisis posterior. Usan-
do el mismo software podemos realizar tres análisis: Tuckey, Fisher y Dunnett.

Vemos que los tres coinciden en separar el Control, 25mg y 50mg de 100mg y 125mg, creando dos
grupos de medias distintas, con lo que podemos concluir que el medicamento sí es efectivo, ya que real-
mente causa un efecto a partir de 100mg.

Además de aquí podemos concluir que solo son necesarios 100mg para conseguir una dosis efectiva,
ya que la diferencia con los 125mg es despreciable.

Figura 10: Quinta tabla obtenida con el software MINITAB

8
Figura 11: ICs simultáneos de 95 % de Dunnet

También podría gustarte