Está en la página 1de 57

Estadística de medidas Repetidas

Tema 4
Si un experimento se
repite muchas veces y
si los errores son
puramente aleatorios,
entonces los resultados
tienden a agruparse
simétricamente sobre el
valor promedio.

Cuantas más veces se repite el experimento, más se acercan los resultados a


una curva ideal suave llamada distribución Gaussiana.
La media da el centro de
la distribución.

La desviación estándar
mide el ancho de la
distribución. Qué tanto se
agrupan los datos al
rededor de la media.

n-1 se llama grados de libertad.


media poblacional.

desviación estándar Poblacional


Varianza muestral: s2

Varianza Poblacional: σ2
Distribución Normal de Probabilidades

• Es simétrica
• Coeficiente de asimetría = 0
• Media punto más alto de la curva.
Desviación Estándar y Probabilidad

Ecuación para la Curva de Gauss:

La curva gaussiana cuya área es la unidad se denomina


Curva de Distribución Normal
En una distribución normal con media conocida y desviación estándar, la
proporción exacta de valores que caen dentro de un intervalo cualquiera puede
encontrarse a partir de tablas, con valores que se han estandarizado.

Variable Normal Estandarizada

La desviación estándar de una población de datos es una herramienta


útil para hacer predicciones.
La tabla de Distribución Normal proporciona las áreas de cada valor
z de la distribución normal tipificada.
z 0 1 2 3 4 5 6 7 8 9
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
Área bajo la curva 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
normal tipificada de 0.7 0.2580 0.2611 0.2642 0.2673 0.2703 0.2734 0.2764 0.2793 0.2823 0.2652
0az
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3364 0.3389
La tabla siempre 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
muestra el
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
porcentaje los
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
datos desde la
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
media a un punto
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
especifico
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4485 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4685 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4762 0.4767
2.0 0.4773 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
Ejemplo 3:

Haciendo uso de la tabla que proporciona áreas de


cada valor z de la distribución normal tipificada,
calcular la probabilidad (área) siguiente:

Pr (z < 1,35) = ?:
Se calcula el área entre −∞ y 0 que vale 0,5000 y se
le suma el área entre 0 y z (z tiene un valor ≤ 1,35);
este valor de área se busca en la tabla (0,4115) y se
suma con 0,5000; en total el área para el ejercicio tiene
un valor de 0,9115. ósea el 91,15 %
Ejemplo 1

Haciendo uso de la tabla que proporciona áreas de cada valor z de


la distribución normal tipificada, calcular la probabilidad (área)
siguiente:

Pr (z < – 0,338) ⇒ Pr (z < – 0,34) = ?:

Para calcular el área entre −∞ y z, se le resta al área entre −∞ y


0 que vale 0,5000 el valor del área entre 0 y – 0,338; este valor de
área se busca en la tabla (0,1331); en total el área para el ejercicio
tiene un valor de 0,3669.
Ejemplo 2

Haciendo uso de la tabla que proporciona áreas de cada valor z


de la distribución normal tipificada, calcular la probabilidad (área)
siguiente:

Pr (z > 2,1) ⇒ Pr (z > 2,10) = (0,5 – 0,4821) = 0,0179 o


(1 – 0,9821) = 0,0179
Ejemplo 3

Haciendo uso de la tabla que proporciona áreas de cada valor z de


la distribución normal tipificada, calcular la probabilidad (área)
siguiente:

Pr (z > -1) ⇒ Pr(z > -1,00) = 0,5000 + 0,3413 = 0,8413


Ejemplo 4

Haciendo uso de la tabla que proporciona áreas de cada valor z


de la distribución normal tipificada, calcular la probabilidad
(área) siguiente:

Pr (–1,39 < z ≤ – 0,44) = (1 – 2) = 0,4177 – 0,1700 = 0,2477


Ejemplo 5

Haciendo uso de la tabla que proporciona áreas de cada valor z de


la distribución normal tipificada, calcular la probabilidad (área)
siguiente:

Pr (- 1,52 ≤ z ≤ 0,897) ⇒ Pr (- 1,52 ≤ z ≤ 0,90) = (1 – 2) = 0,8159


– 0,0643 = 0,7516
Ejemplo 7

Calcular el valor de z que deja a su izquierda un área igual a 0,21 (el


21% del área total).

Haciendo la diferencia entre las áreas 0,5 – 0,21, tenemos el área


correspondiente a z, con este se busca en la tabla el valor de z.
0,5000 – 0,2100 = 0,2900; el z para 0,2900 es ≈ 0,81, que
para – z sería igual a – 0,81.
Ejercicio 8

Al analizar el contenido de mercurio en 500 peces (muertos por


aparente contaminación), provenientes de una ciénaga a la cual
llegan aguas provenientes de minas de oro, se encontró que los
resultados se distribuyen normalmente con media de 6,5 ppm en
mercurio y varianza 4.

a) Calcule la probabilidad de que en un pez se encuentre con una


contaminación mayor a 8 ppm de mercurio.

b) Determine la proporción de peces con contaminación inferior a 5


ppm de mercurio.

c) Cuántos peces presentan contaminación entre 5 y 7,5 ppm?


z 0 1 2 3 4 5 6 7 8 9
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2703 0.2734 0.2764 0.2793 0.2823 0.2652
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3364 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4485 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4685 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4762 0.4767
2.0 0.4773 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
Nos encontramos ante una distribución normal N (6,5, 2)

a)

8 − 6,5
Tipificamos el valor 8: 𝑧 = = 0,75
2

La probabilidad pedida es el área a la derecha de z = 0,75.

El área entre cero y 0,75 corresponde a 0,2734; como lo que


se quiere es el área a la derecha, entonces hacemos la
diferencia entre 0,5000 – 0,2734 = 0,2266.

Hay una probabilidad del 22,66 % de que se encuentre un pez


con una contaminación superior a 8 ppm en mercurio.
b)

5 − 6,5
Tipificamos el valor 5: 𝑧= = − 0,75
2

La probabilidad pedida es el área a la izquierda de z = – 0,75.

El área entre cero y – 0,75 corresponde a 0,2734; como lo que


se quiere es el área a la izquierda, entonces hacemos la
diferencia entre 0,5000 – 0,2734 = 0,2266.

Hay una probabilidad del 22,66 % de que se encuentre un pez


con una contaminación inferior a 5 ppm en mercurio.
c)

5 − 6,5 7,5 −6,5


Tipificamos 5: 𝑧 = = − 0,75 y 7,5: 𝑧 = = 0,50
2 2

El área comprendida entre ambos se obtiene sumando las áreas


obtenidas entre – 0,75 y 0 que es 0,2734 y el área obtenida entre
0 y 0,5 que es 0,1915, y tenemos un área total de 0,4649

Multiplicando la probabilidad total (área total ) por el número de


peces analizados, tenemos la cantidad de peces que presentan
contaminación entre 5 y 7,5 ppm de mercurio.

0,4649 x 500 = 232,45 ≅ 232 peces.


Ejercicio 10:

Hallar la media, desviación estándar, varianza y coeficiente de


variación (poblacional y muestral), utilizado la calculadora
científica, y Excel usando formulas y usando las funciones.
sobre masa (g)
Ejemplo 11 1 5,3232
2 5,1234
3 4,9844
a) Qué porcentaje de datos se encuentran
4 5,0055
Entre la masa media y 5,1500g 5 5,1201
6 5,0455
7 4,9702
8 4,8788
9 5,0123
10 5,0145
b) Para el caso anterior, que porcentaje de masas estarán
entre 4,9500g y 5,1500g

Pr (4,9500>z≤ 5,1500) = ?
c) Que porcentaje de los sobres tienen masas superiores de
4,9500g
Funciones Excel:

DISTR.NORM(x; media; desv_estándar;


=PROMEDIO(RANGO) acumulado)
=SUMA(RANGO)
x (obligatorio): El valor cuya distribución deseamos
=DESVEST.M(RANGO) obtener.
=DESVEST.P(RANGO) media (obligatorio): La media artitmética de la
distribución.
=DESVEST(RANGO) desv_estándar (obligatorio): La desviación estándar
=RAIZ(DATO) de la distribución.
acumulado (obligatorio): Indica si se utilizará la
=VAR.P(RANGO) función de distribución acumulativa.
=VAR.S (RANGO)
Intervalos de Confianza

Se llama intervalo de confianza a un par o varios pares de


números entre los cuales se estima que estará cierto valor
desconocido con una determinada probabilidad de acierto.

La probabilidad de éxito en la estimación se representa con


1-α y se denomina nivel de confianza. En estas
circunstancias, α es el llamado error aleatorio o nivel de
significación, esto es, una medida de las posibilidades de
fallar en la estimación mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varían
conjuntamente, de forma que un intervalo más amplio tendrá más
probabilidad de acierto (mayor nivel de confianza), mientras que
para un intervalo más pequeño, que ofrece una estimación más
precisa, aumenta su probabilidad de error.

Esta amplitud depende de cómo se estime la desviación estándar


poblacional s, a partir de la desviación estándar muestral s.
Intervalo de Confianza si se conoce s y se hace una
sola medida (muestras grandes)

Si se efectúa una sola medida de x de una distribución con s


conocida, se podría afirmar que la media verdadera debe estar en el
intervalo x ± zs con una probabilidad que depende de z.

Esta probabilidad es 90% con z = 1,64, 95% con z = 1,96 y 99%


con z =2,58 según los gráficos anteriores.

Intervalo de Confianza 𝑑𝑒 𝜇 = 𝑥 ± 𝑧𝝈
Intervalo de Confianza si se conoce s y se hace mas
de una medida (muestras grandes)

son pocos los casos en que se estima la media verdadera con una
sola medida.

ഥ de N medidas como
En su lugar, se usa la media experimental 𝒙
una mejor estimación de m. En este caso, se sustituye x de la
anterior ecuación con 𝒙 ഥ y s con el error estándar de la media,
𝜎
ൗ 𝑁 . teniendo lo siguiente:

𝑧𝜎
Intervalos de Confianza 𝑑𝑒 𝜇 = 𝑥ҧ ±
𝑁
Niveles de confianza con diversos
valores de z
Nivel de confianza, % z
50 0,67
68 1,00
80 1,28
90 1,64
95 1,96
95,4 2,00
99 2,58
99,7 3,00
99,9 3,29
Determinación del Intervalo de Confianza Para muestras
pequeñas

Debido al número limitado de muestras, o al tiempo de los


análisis no se tiene un valor de s que se pueda suponer
corresponde a s.

Cuando s se calcula a partir de un número pequeño de datos, esta


puede ser muy incierta, por lo tanto los intervalos de confianza
son necesariamente más amplios.
Para explicar la variabilidad de s se usa el parámetro estadístico t,
que se define exactamente como z, salvo que se sustituye s por s.

En el caso de una sola medida cuyo resultado es x, se puede


definir t como:

𝑥 − 𝜇
𝑡=
𝑠
En cuanto a la media de N medidas,

𝑥ҧ − 𝜇
𝑡=
𝑠Τ 𝑁

Al igual que z, t depende del nivel de confianza que


interese.

Pero t presenta dependencia respecto al número de grados


de libertad usados en el cálculo de s.

GRADOS DE LIBERTAD = N-1


El intervalo de confianza para un valor 𝒙 puede calcularse a
partir de t mediante la siguiente ecuación para una sola medida:
IC 𝑝𝑎𝑟𝑎 𝜇 = 𝑥 ± 𝑡𝑠


El intervalo de confianza de la media 𝒙 de N réplicas de
medidas puede calcularse a partir de t mediante la siguiente
ecuación:
𝑡𝑠
IC 𝑝𝑎𝑟𝑎 𝜇 = 𝑥ҧ ±
𝑁
Ejercicio:

El contenido de carbohidratos de una glucoproteína (una


proteína con azúcares unidos a él) se determina que es
12.6, 11.9, 13.0, 12.7 y 12.5 g de carbohidratos por 100 g
de proteína en análisis replicados. Encuentre los
intervalos de confianza del 50% y del 90% para el
contenido de carbohidratos.
Grafica de control
Ejercicio:

Supongamos que mide cinco veces el volumen de un


recipiente y observa valores de 6.375, 6.372, 6.374,
6.377 y 6.375 mL. Calcular el intervalo de confianza
para un nivel de confianza del 90%.
Ejemplo:

Un químico obtiene los datos siguientes sobre el contenido de


alcohol, C2H5OH (en %), en muestras de sangre: 0,084, 0,089,
0,079. Calcule el intervalo de confianza al 95% para la media en
el supuesto de que (a) los tres resultados son la única indicación
de la precisión del método, y (b) con base en la experiencia previa
de cientos de muestras se sabe que la desviación estándar del
método es s = 0,005% de C2H5OH y es una buena estimación de
s.
a) Calculando s y 𝑥ҧ se tiene s = 0,0050% y 𝑥ҧ = 0,084%
El valor de t tomado de la tabla al 95% y 2 grados de libertad, t = 4,30

𝑡𝑠 4,30 ×0,0050
IC 𝑑𝑒 95% = 𝑥ഥ ± = 0,084 ± = 0,084 ± 0,012% C2H5OH
𝑁 3

b) Puesto que s = 0,0050% es una buena estimación de s, se tiene

𝑧𝜎 1,96 ×0,0050
IC 𝑑𝑒 95% = 𝑥ഥ ± = 0,084 ± = 0,084 ± 0,006% C2H5OH
𝑁 3

Note que el conocimiento cierto de s disminuye el intervalo de confianza


Ejemplo:

Se comprueba la escala de absorbancia de un espectrofotómetro a una longitud de


onda concreta usando una solución estándar con una absorbancia de 0,470.

Diez mediciones de absorbancia con el espectrofotómetro dieron 𝒙 ഥ = 0,461 y


s = 0,003. Encuentre el intervalo de confianza al 95% de la absorbancia media y
decida si se encuentra presente un error sistemático.

Los límites de confianza al 95% de las absorbancias medidas por el


espectrofotómetro son:

𝑡𝑠 2,26 × 0,003
IC 𝑑𝑒 95% = 𝑥ഥ ± = 0,461 ± = 0,461 ± 0,002
𝑁 10

Ya que este intervalo de confianza no incluye la absorbancia conocida de 0,470, es


probable que exista un error sistemático
Intervalos de confianza para la
comparación de medidas de conjuntos de
datos

Desviación estándar para la comparación


de medidas de conjuntos de datos
Desviación estándar agrupada o combinada para diferentes
serie de datos

El valor combinado de s es una mejor estimación de s, por


tanto se puede considerar este valor como s.
Ejemplo:

Un examen que se practica de manera rutinaria a pacientes con


diabetes es el nivel de glucosa.

Se determinó, durante varios meses, la concentración de


glucosa en un paciente con niveles moderadamente altos,
utilizando un método analítico espectrofotométrico.

Se sometió al paciente a una dieta baja en azúcar, para


disminuir los niveles de glucosa.

Durante el estudio para determinar la efectividad de la dieta se


obtuvieron los resultados siguientes.
Calcule una estimación combinada de la desviación estándar del método.24
Suma de los
cuadrados de
Media de las desviaciones
Concentración glucosa, estándar de la Desviación
Tiempo de glucosa, mg/L mg/L media estándar
Mes 1 1108, 1122, 1075, 1099, 1100,3 1687,43 16,8
1115, 1083, 1100
Mes 2 992, 975, 1022, 1001, 991 996,2 1182,80 17,2
Mes 3 788, 805, 779, 822, 800 798,8 1086,80 16,5
Mes 4 799, 745, 750, 774, 777, 771,9 2950,86 22,2
800, 758

Número total de mediciones = 24 Total de la suma de los cuadrados = 6907,86

Calcule una estimación combinada de la desviación estándar del método.


Para el primer mes, la suma de los cuadrados de la penúltima columna se
calculó como sigue:

Suma de cuadrados = (1108 – 1100,3)2 + (1122 – 1100,3)2 + (1075 – 1100,3)2


+ (1099 – 1100,3)2 + (1115 – 1100,3)2 + (1083 – 1100,3)2 + (1100 – 1100,3)2
= 1687,43

Las demás sumas de los cuadrados se obtuvieron de forma similar. La


desviación estándar combinada es

6907,89
𝑠𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑑𝑎 = = 18,58 ≈ 19 𝑚𝑔/𝐿
24 − 𝟒

Este valor combinado de s es una mejor estimación de s, por tanto se puede


considerar este valor como s.
Para este ejemplo determine los intervalos de confianza al 80 % y 95% de

(a) el primer valor del mes 1 (1108 mg/L de glucosa) un solo dato
(a) el primer valor del mes 1 (1108 mg/L de glucosa) un solo dato

Utilizando la tabla anterior, se ve que z = 1,28 y 1,96 para los niveles de


confianza al 80% y 95%, respectivamente; con la ecuación se tiene:

80% IC = 1108 ± 1,28 X 19 = 1108 ± 24,3 mg/L

95% IC = 1108 ± 1,96 X 19 = 1108 ± 37,2 mg/L

Según estos cálculos, se puede concluir que existen probabilidades de 80%


de que m, la media poblacional se ubique en el intervalo de 1083,7 a 1132,3
mg/L de glucosa.

Por extensión, hay una probabilidad de 95% de que m esté en el intervalo


entre 1070,8 y 1145,2 mg/L.
(b) el valor medio (1100,3 mg/L) del mes 1; suponga que en ambos casos
s = 19 es una buena estimación de s. media
(b) el valor medio (1100,3 mg/L) del mes 1; suponga que en ambos casos s = 19
es una buena estimación de s. media

En relación con las siete medidas se tiene:

1,28 × 19
80% IC = 1100,3 ± = 1100,3 ± 9,2 𝑚𝑔/𝐿
7

1,96 × 19
95% IC = 1100,3 ± = 1100,3 ± 14,1 𝑚𝑔/𝐿
7

Así, se tienen probabilidades del 80% de que m se localice en el intervalo de


1091,1 a 1109,5 mg/L de glucosa, y del 95% de que esté entre 1086,2 y 1114,4
mg/L de glucosa.
c) Cuántas medidas se necesitan en el mes 1 para disminuir el intervalo de
confianza del 95% a 1100,3 ± 10,0 mg/L de glucosa?
𝑧𝜎
En este caso interesa que el término ± sea igual a ± 10,0 mg/L de glucosa.
𝑁

𝑧𝜎 1,96 × 19
= = 10
𝑁 𝑁

1,96 × 19
𝑁=
10

𝑁 = (3,724)2 = 13,9

Se concluye, que se necesitan 14 medidas para contar con una probabilidad


levemente mayor al 95% de que la media poblacional se ubique a ± 10 mg/L de la
media experimental.

También podría gustarte