Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bioestadistica PDF
Bioestadistica PDF
∑x i
µ̂ = x = 1
n
95%
µ − 1.96 σ x µ x
µ + 1.96 σ x
BIOESTADISTICA
Mg. Beatriz Castañeda Saldaña
Profesora de Bioestadística
Facultad de Ingeniería Ambiental
Universidad Nacional de Ingeniería
INDICE
INTRODUCCION 1
1. ESTADISTICA DESCRIPTIVA 5
1.1. Organización de datos 5
1.2. Medidas de Resumen 12
1.2.1. Medidas de Posición 13
1.2.2. Medidas de Dispersión 22
1.2.3. Medidas de Forma 25
Práctica Domiciliaria 1 28
1.2.4. Medición de datos nominales 32
Práctica Domiciliaria 2 44
Bibliografía del capítulo 49
2. PROBABILIDAD 51
2.1. Función Probabilidad 53
2.2. Asignación de probabilidad 54
2.3. Métodos de enumeración y conteo 56
2.4. Probabilidad Condicional. Probabilidad condicional de Bayes 62
2.5. Evaluación de procedimientos de detección. Sensibilidad,
especificidad, valor predictivo 67
Práctica Domiciliaria 3 70
Bibliografía del capítulo 79
3. VARIABLES ALEATORIAS Y
DISTRIBUCIONES DE PROBABILIDAD 80
3.1. Variable aleatoria. Función de cuantía. Función de densidad
Función de distribución 80
3.2. Valor esperado y Varianza 87
Práctica Domiciliaria 4 90
3.3. Distribuciones de variables discretas 95
3.3.1. Distribución de Bernoulli 95
3.3.2. Distribución Binomial 96
3.3.3. Distribución hipergeométrica 99
3.3.4. Distribución de Poisson 103
3.4. Distribuciones de variables continuas 106
3.4.1. Distribución Exponencial 106
3.4.2. Distribución Normal 108
Práctica Domiciliaria 5 118
3.5. Distribuciones de funciones de variables aleatorias 128
Bibliografía del capítulo 133
i
BIOESTADISTICA
5. ESTIMACION 154
5.1. Estimación Puntual 154
5.2. Estimación interválica 155
5.2.1. Estimación interválica para la media poblacional
Error de muestreo. Tamaño de muestra 156
5.2.2. Estimaciçon interválica para la varianza poblacional 161
5.2.2. Estimación interválica para la proporción poblacional
Error de muestreo. Tamaño de muestra 162
5.2.4. Estimación interválica para la diferencia de medias
poblacionales 167
5.2.5. Estimación interválica para la diferencia de proporciones
poblacionales 171
Práctica domiciliaria 7 173
Bibliografía del capítulo 177
ii
BIOESTADISTICA
iii
BIOESTADISTICA
Lista de Cuadros
de colesterol en bilis
catéter
poblaciones
iv
BIOESTADISTICA
Lista de Tablas
Lista de Gráficos
de colesterol en bilis
catéter
v
BIOESTADISTICA
vi
BIOESTADISTICA
Prólogo
Esta publicación es fruto de los apuntes de clase desarrollados para mis alumnos
los cuales empecé a compilar en el año 2003 como una guía del curso de
probabilidad para las poblaciones y las variables del muestreo. En los dos últimos
vii
BIOESTADISTICA
Para cada tema se ha elaborado ejemplos aplicados los cuales serán resueltos en
viii
BIOESTADISTICA
INTRODUCCIÓN
estadísticas, las que al ser utilizadas adecuadamente hacen más eficientes las
ESTADÍSTICA
BIOESTADÍSTICA
- Diseño de experimentos
distrito)
sus características.
investigación
dependiente.
características de interés.
Varones Mujeres
% de % de
Sujeto Edad Sobresaturación Sujeto Edad Sobresaturación
1 23 40 1 40 65
2 31 86 2 33 86
3 58 111 3 49 76
4 25 86 4 44 89
5 63 106 5 63 142
6 43 66 6 27 58
7 67 123 7 23 98
8 48 90 8 56 146
9 29 112 9 41 80
10 26 52 10 30 66
11 64 88 11 38 52
12 55 137 12 23 35
13 31 88 13 35 55
14 20 80 14 50 127
15 23 65 15 47 77
16 43 79 16 36 91
17 27 87 17 74 128
18 63 56 18 53 75
19 59 110 19 41 82
20 53 106 20 25 69
21 66 110 21 57 84
22 48 78 22 42 116
23 27 80 23 49 73
24 32 47 24 60 87
25 62 74 25 23 46
26 36 58 26 48 107
27 29 88 27 44 84
28 27 73 28 37 120
29 65 118 29 57 123
30 42 67
31 60 57
Fuente: Dawson, B y Trapo R. Bioestadística Médica. 2ª Edición, 1997 (36)
ascendentemente:
Varones Mujeres
% de % de
Orden Sujeto Edad Sobresaturación Orden Sujeto Edad Sobresaturación
1 14 20 80 1 7 23 98
2 1 23 40 2 12 23 35
3 15 23 65 3 25 23 46
4 4 25 86 4 20 25 69
5 10 26 52 5 6 27 58
6 17 27 87 6 10 30 66
7 23 27 80 7 2 33 86
8 28 27 73 8 13 35 55
9 9 29 112 9 16 36 91
10 27 29 88 10 28 37 120
11 2 31 86 11 11 38 52
12 13 31 88 12 1 40 65
13 24 32 47 13 9 41 80
14 26 36 58 14 19 41 82
15 30 42 67 15 22 42 116
16 6 43 66 16 4 44 89
17 16 43 79 17 27 44 84
18 8 48 90 18 15 47 77
19 22 48 78 19 26 48 107
20 20 53 106 20 3 49 76
21 12 55 137 21 23 49 73
22 3 58 111 22 14 50 127
23 19 59 110 23 18 53 75
24 31 60 57 24 8 56 146
25 25 62 74 25 21 57 84
26 5 63 106 26 29 57 123
27 18 63 56 27 24 60 87
28 11 64 88 28 5 63 142
29 29 65 118 29 17 74 128
30 21 66 110
31 7 67 123
Fuente: Dawson, B y Trapo R. Bioestadística Médica. 2ª Edición, 1997 (36)
tendencia de la edad para los varones y mujeres es mejor organizar los datos
en forma agrupada.
Agrupamiento de datos
(c), como:
K = R/c o c = R/k
Sugerencias:
a) 5 ≤ k ≤ 10
tratamos de no tener muchos, ni muy pocos. La razón básica para agrupar los
intervalos.
Histograma de frecuencias
intervalos de clase, luego se dibuja una serie de rectángulos que tienen como
base los intervalos de clase y cuyas superficies deben ser proporcionales a las
Gráfico 1
12
10
Nº de mujeres
8
6
4
2
0
10 - 19 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89
Edad (años)
Polígono de frecuencias
de gravedad de la enfermedad.
Etapa de la Número de
enfermedad pacientes Porcentaje
1 3 3%
2 28 24%
3 63 55%
4 21 18%
Total 115 100%
Fuente: Dawson, B y Trapo R. Bioestadística Médica. 2ª Edición, 1997 (31)
Gráfico de barras
Gráfico 2
70
60
50
40
30
20
10
0
1 2 3 4
Etapa de la enfermedad
Datos Nominales
Si los datos son nominales ilustramos sus frecuencias con un gráfico pastel, el
cual tiene por objeto mostrar que parte del todo es cada categoría, como se
Nº de
Bacteriemia pacientes %
Si 4 20%
No 16 80%
Total 20 100%
Fuente: Dawson, B y Trapo R. Bioestadística Médica. 2ª Edición, 1997 (28)
Gráfico 3
20%
Si
No
80%
Fuente: Dawson, B y Trapo R. Bioestadística Médica. 2ª Edición, Manual Moderno 1997 (28)
Llamadas también medidas descriptivas por que tienen por objeto describir la
Medidas de Posición. Indican los valores que tienden a tomar los datos
- Moda
- Amplitud o rango
- Coeficiente de Variación
- Asimetría
- Curtosis
- Proporciones y Porcentajes
- Razones
- Medición epidemiológica:
∑x i
Media Poblaciona l : µ = i =1
; N = Número de elementos en la población
N
∑x i
Media Muestral : x= i =1
; n = Número de elementos en la muestra
n
corresponda.
k k
∑x i ni ∑x i ni
Media Poblacional : µ = i =1
; Media Muestral : x= i =1
;
N n
x i = Valor individual o punto medio del intervalo
k = Número de valores diferentes o de intervalos
el número de hijos por familia y los productos del número de hijos (xi) por el
medios de cada intervalo, así como la frecuencia respectiva para una muestra
Edad xi * ni xi ni
5 – 14 9.5 5 47.5
15 – 24 19.5 10 195.0
25 – 34 29.5 20 590.0
35 – 44 39.5 22 869.0
45 – 54 49.5 13 643.5
55 – 64 59.5 5 297.5
TOTAL 75 2642.5
Fuente: Datos simulados por el autor
Moda
Es el valor que ocurre con mayor frecuencia, por lo que se considera que
el intervalo.
CUANTILAS O CUANTILES
Cuantila : X p
mayores o iguales a X p.
Mediana: Me = X0.50
Indica que la mitad o el 50% de los datos toma medidas menor o igual a Me y
Indica que el 50% de las personas tienen edad máxima 36 años y que el otro
Son puntos que dividen al conjunto de datos en 4 partes, esto es en cada parte
Indica que el 25% de las personas tienen hasta 27 años y que el 75% tiene a
Son puntos que dividen al conjunto de datos en 10 partes donde cada una
Indica que el 10% de las personas tienen a lo más 17 años y que el 80% tiene
máximo 52 años, también podemos deducir que el 70% de las personas tiene
Son puntos que dividen al conjunto de datos en 100 partes cada una con 1%
Indica que el 20% de las personas tiene máximo 20 años y que sólo el 5% de
las personas tiene más de 57 años, también podemos deducir que el 75% de
X p = X(r)
Ejemplo 1.5. Consideremos nuevamente los datos del ejemplo 1.1 ordenados
Varones Mujeres
% de % de
Orden Sujeto Edad Sobresaturación Orden Sujeto Edad Sobresaturación
1 14 20 80 1 7 23 98
2 1 23 40 2 12 23 35
3 15 23 65 3 25 23 46
4 4 25 86 4 20 25 69
5 10 26 52 5 6 27 58
6 17 27 87 6 10 30 66
7 23 27 80 7 2 33 86
8 28 27 73 8 13 35 55
9 9 29 112 9 16 36 91
10 27 29 88 10 28 37 120
11 2 31 86 11 11 38 52
12 13 31 88 12 1 40 65
13 24 32 47 13 9 41 80
14 26 36 58 14 19 41 82
15 30 42 67 15 22 42 116
16 6 43 66 16 4 44 89
17 16 43 79 17 27 44 84
18 8 48 90 18 15 47 77
19 22 48 78 19 26 48 107
20 20 53 106 20 3 49 76
21 12 55 137 21 23 49 73
22 3 58 111 22 14 50 127
23 19 59 110 23 18 53 75
24 31 60 57 24 8 56 146
25 25 62 74 25 21 57 84
26 5 63 106 26 29 57 123
27 18 63 56 27 24 60 87
28 11 64 88 28 5 63 142
29 29 65 118 29 17 74 128
30 21 66 110
31 7 67 123
Varones Mujeres
xi ni Ni
X1 n1 N1
X2 n2 N2
... ... ...
Xj-1 nj-1 Nj-1
xj nj Nj
... ... ...
xk nk Nk
Ejemplo 1.6. Del ejemplo 1.4. y del cuadro 4 obtenemos las frecuencias
acumuladas con las que determinamos los percentiles 10, 25, 50, 75, 90 y 95
nº de nº de Nº acumulado
hijos familias de familias
(xi) (ni) Ni
0 4 4
1 8 12
2 11 23
3 15 38
4 10 48
5 13 61
6 3 64
Total 64
Intervalos ni Ni
L1I – L1s n1 N1
L2I – L2s n2 N2
.......... ... ...
Lj-1 I – L1j-1 s nj-1 Nj-1
LjI – Ljs nj Nj
......... ... ...
L1I – L1s nk Nk
2) X p = L jI + c
(np − N )j −1
, donde
nj
LjI: Frontera de clase del intervalo j (el punto medio entre los extremos
continuos.
Nº de
Edad (años) mujeres Porcentaje Nº acumulado
20 - 29 5 17% 5
30 - 39 6 21% 11
40 - 49 10 34% 21
50 - 59 5 17% 26
60 - 69 2 7% 28
70 - 79 1 3% 29
Total 29 100%
acumuladas en porcentaje, para lo cual el gráfico debe ser hecho a escala para
Gráfico 4
70%
60%
50%
40%
30%
20%
10%
0%
20 29 39 49 59 69 79 Total
43 Edad (años)
1. Amplitud o rango:
Mide la variación total indicando los valores mínimo y máximo del conjunto de
datos, por ejemplo para las edades de las mujeres en el ejemplo 1.1,
Rango: 23 – 74 años
Miden la dispersión de los datos indicando en cuanto tienden a variar los datos
N N
∑ ( xi − µ )2 ∑x 2
i
σ2 = i
= 1
− µ 2 Varianza Poblaciona l
N N
n n
∑(x ∑x
2
i − x) 2 2
i −n x
S2 = i
= 1
Varianza muestral
n−1 n−1
Desviación estándar σ = σ2 S= S2
La varianza indica cuan representativa de los datos es la media aritmética, ya
que una varianza pequeña indica que los datos están cerca de la media, en
cambio una varianza grande indica que los datos están alejados de la media.
9,1 ; 10,0 ; 11,4 ; 12,4 ; 9,8 ; 8,3 ; 9,9 ; 9,1 ; 7,5 ; 6,7
S
Coeficiente de Variación: C .V . = x 100
x
Indica la variabilidad de los datos en unidades porcentuales de media.
1.7
Por ejemplo para la hemoglobina de los niños C .V . = x 100 = 18%
9.42
∑ ( x i − x ) 2 ni ∑x
2
2
i ni − n x
S2 = i
= 1
Varianza muestral
n−1 n−1
Donde: K: Número de intervalos
Xi: Punto medio de cada intervalo
ni: Frecuencia simple para el intervalo
2645.5
x= = 35.27 años
75
12.86
C .V . = x 100 = 36.5%
35.27
Los resultados nos indican que los pacientes en promedio tienen 35 años y
promedio.
Asimetría
situaciones:
Mo = x = Me
x Me Mo Mo Me x
3 ( x − Me )
Coeficiente de asimetría de Pearson: S kP =
S
Curtosis
( x0.75 − x0.25 )
Coeficiente de curtosis: K=
2 ( x0.90 − x0.10 )
Distribución Mesocúrtica: k → 0.25 , esto ocurre cuando los datos tienen una
mesocúrtica K = 0.263
pequeña.
PRACTICA DOMICILIARIA 1
agrícolas, los que fueron irrigados con agua de diferente calidad bacteriana.
Caso Proced T.C. Logcfa logcfv Calif-P Caso Proced T.C. Logcfa logcfv Calif-P
12 4 1 7.70 2.17 3 62 3 2 8.10 2.10 3
13 4 1 7.78 0.73 2 63 3 2 7.70 2.52 3
14 4 1 7.90 0.40 1 64 3 2 8.20 5.14 3
15 4 1 7.81 3.13 3 65 3 2 7.70 2.85 3
16 4 1 9.96 2.30 3 66 3 2 8.10 3.94 3
17 4 1 7.70 2.14 3 67 3 2 7.70 3.17 3
18 4 1 7.60 4.47 3 68 3 2 8.10 0.64 1
19 4 1 7.60 3.01 3 69 3 2 7.60 0.69 2
20 4 1 7.70 2.14 3 70 3 2 8.13 3.38 3
21 4 1 7.70 0.30 1 71 4 2 7.78 2.52 3
22 4 1 8.96 3.14 3 72 4 2 7.90 0.69 2
23 4 1 7.78 0.50 1 73 4 2 7.81 1.59 2
24 4 1 7.70 0.34 1 74 4 2 7.78 1.21 2
25 4 1 7.60 4.20 3 75 4 2 7.60 0.63 2
26 1 2 1.90 0.41 1 76 4 2 7.70 0.54 1
27 1 2 2.36 0.73 2 77 4 2 8.96 2.61 3
28 1 2 1.90 0.30 1 78 4 2 7.90 2.27 3
29 1 2 1.90 1.02 1 79 4 2 8.96 2.21 3
30 1 2 3.48 0.30 1 80 4 2 7.70 0.49 1
31 1 2 2.36 1.64 2 81 4 2 7.90 3.69 3
32 1 2 1.30 0.36 1 82 4 2 7.70 1.97 3
33 1 2 1.30 0.34 1 83 4 2 7.70 1.66 3
34 1 2 2.36 0.30 1 84 4 2 7.70 1.84 3
35 1 2 2.36 0.64 1 85 4 2 7.81 1.61 2
36 1 2 1.30 0.43 1 86 4 2 7.81 3.02 3
37 1 2 3.48 2.84 3 87 1 3 1.30 0.85 1
38 1 2 1.30 0.30 1 88 1 3 1.30 0.85 1
39 1 2 3.48 0.86 2 89 1 3 3.48 0.30 1
40 2 2 5.48 1.62 3 90 1 3 1.30 0.30 1
41 2 2 4.34 3.14 3 91 1 3 1.90 0.30 1
42 2 2 5.48 1.23 2 92 1 3 2.36 0.36 1
43 2 2 5.48 1.46 2 93 2 3 5.48 1.52 2
44 2 2 4.34 3.14 3 94 2 3 4.34 2.37 3
45 3 2 8.13 2.27 3 95 3 3 8.20 1.04 2
46 3 2 7.56 3.20 3 96 3 3 7.60 2.11 3
47 3 2 8.10 3.28 3 97 3 3 7.70 3.10 3
48 3 2 8.20 4.20 3 98 4 3 7.60 0.30 1
49 3 2 7.56 1.07 3 99 4 3 7.70 1.28 3
50 3 2 8.10 3.28 3 100 4 3 7.81 0.30 1
Fuente: Evaluación de Riesgos para la salud por el uso de aguas residuales en agricultura.
Anexo 3: Aspectos Microbiológicos. CEPIS-OPS. Lima, Perú. 1990
Persona Raza Sexo Edad Contextura Ejercicio Cigarrillos Tcortisona Lácteos DMO
1 Mestiza F 42 Delgada 2 2 No Mucho 0.79
2 Blanca F 36 Gruesa 0 1 No Poco 0.89
3 Negra F 28 Gruesa 4 2 si Mucho 1.12
4 Blanca M 51 Mediana 2 6 si Nada 0.73
5 Blanca F 47 Delgada 3 1 si Nada 0.69
6 Mestiza F 25 Delgada 1 2 No Poco 0.99
7 Negra M 53 Gruesa 1 0 si Poco 0.84
8 Mestiza F 44 Delgada 0 5 No Nada 0.74
9 Blanca F 70 Mediana 1 0 No Mucho 0.78
a
p=
a+b
Porcentaje
unidades por ciento, esta medida es más fácil de asimilar y trasmitir que la
Razón
Una razón es la comparación por cociente entre dos cifras de diferente o similar
a
naturaleza. R=
b
380 camas
R= = 4 camas / enfermera
95 enfermeras
R = 10 hab / vivienda
20 cirujanos
R= = 1 cirujano / 2 int ernistas .
40 int ernistas
en medicina.
R1 18 alumnos / docente
R= = = 1.8 ⇒ R = 180%
R2 10 alumnos / docente
Esta razón compara dos razones y nos indica que los docentes del grupo 1
tienen 80% más de intensidad de trabajo que los docentes del grupo 2, para la
denominador.
MEDICION EPIDEMIOLOGICA
TASA
lugar
Tasa = a x base
a+b
población.
Los datos que integran una tasa ocurrieron en un período anterior al actual y en
estables.
le ocurra el fenómeno.
multiplicarse por 100, 1.000, 10.000, o 100.000 para una mejor comprensión
y fácil lectura.
N º de defunciones ocurridas en
una región y año dado
Tasa anual bruta de mortalidad = x 1000
Estimación de la población a mitad de año
en la misma región y el mismo año
Ejemplo 1.10
Población A Población B
Distancia Habitantes Habitantes
(Km) Nº % Casos Nº % Casos
0 – 0,9 1 531 13,8 279 5 438 9,1 462
1,0 – 1,9 1 904 17,2 69 4 489 7,5 117
2,0 – 2,9 2 599 23,5 141 10 351 17,4 802
3,0 – 3,9 4 672 42,2 2 36 994 62,0 37
4,0 y más 368 3,3 119 2 384 4,0 665
TOTAL 11 074 100,0 610 59 656 100,0 2083
Fuente: Centro Panamericano de Ecología Humana y Salud. Evaluación Epidemiológica
de riesgos causados por agentes químicos ambientales. Edición de 1985. México: OPS;
1985.
610
Tasa de A = x1000 = 55,1 casos de calcificaciones / 1000 habi tan tes
11074
2083
Tasa de B = x1000 = 34,9 casos de calcificaciones / 1000 habi tan tes
59656
Tasa de A 55,1
Al comparar por cociente R = x100 = x100 = 158%
Tasa de B 34,9
Lo que nos indica que los habitantes de la población A tienen un riesgo 58%
AJUSTE DE TASAS
apropiado comparar las tasas globales ya que está comparación podría no ser
válida debido a éstas diferencias, lo que nos permite, además explicar las
razones de la diferencia y las posibles causas del mayor riesgo en una de las
poblaciones.
mayor)
Población A Población B
Distancia Habitantes Habitantes
(Km) Nº Casos Tasa Nº Casos Tasa
0 – 0,9 1 531 279 182,2 5 438 462 85,0
1,0 – 1,9 1 904 69 36,2 4 489 117 26,1
2,0 – 2,9 2 599 141 54,3 10 351 802 77,5
3,0 – 3,9 4 672 2 0,4 36 994 37 1,0
4,0 y más 368 119 323,4 2 384 665 278,9
TOTAL 11 074 610 55,1 59 656 2083 34,9
Fuente: Centro Panamericano de Ecología Humana y Salud. Evaluación
Epidemiológica de riesgos causados por agentes químicos ambientales. Edición
de 1985. México: OPS; 1985.
calcificaciones pulmonares.
La comparación luego del ajuste (44,2/34,9 = 1,3) nos indica que si la población
expuestas.
A1 / N 1 R EXP
RR = =
A0 / N 0 R No Exp
que
Estimación interválica
Para que podamos concluir, con certeza, que el factor considerado es un factor
sea significativamente mayor que 1, por ello para estar seguros de este
N 1 − A1 N 0 − A 0
ln( RR ) ± 1.96 +
N1A1 N0 A0
L=e
concluir que el factor considerado sea un factor de riesgo, porque con 95% de
Ejemplo 1.15
Este resultado nos indica que para los expuestos se tiene un 60% más de
100−20 200−25
ln(1.60 ) + 1.96 +
100 ( 20 ) 200 ( 25 )
Ls = e = 2.74
Este resultado nos indica que no podemos concluir que el factor de exposición
(OR)
a b axd
OR = =
c d b xc
expuestos.
Estimación interválica
Para que podamos concluir, con certeza, que el factor considerado es un factor
sea significativamente mayor que 1, por ello para estar seguros de este
1 1 1 1
ln( OR ) ± 1.96 + + +
L=e a b c d
donde
concluir que el factor considerado sea un factor de riesgo, porque con 95% de
Ejemplo 1.16
OR = 53/43 = 1.98
53/85
Este resultado nos indica que hubo 98% más de exposición a la dieta con
frituras para los casos que para los controles, lo que probablemente influyó en
Estimación interválica:
1 1 1 1
ln( 1.98 ) ± 1.96 + + +
Li = e 53 43 53 85
= 1.167
1 1 1 1
ln( 1.98 ) ± 1.96 + + +
LS = e 53 43 53 85
= 3.359
Este resultado nos indica que podemos concluir que la dieta con frituras es un
encontrada es significativa.
Práctica domiciliaria 2
tabla siguiente:
clasificación socio-económica
Plomo en la % de trabajadores
Sangre (µg/dl) 1989 1997
10 – 19 11 38
20 – 29 12 15
30 – 39 14 13
40 – 49 15 15
50 – 59 17 10
60 – 69 13 7
70 – 79 10 1
80 – 90 8 1
Nº trabajadores 280 325
a) ¿En cuál de los dos años tienden los trabajadores a presentar niveles
5. Con el objeto de evaluar el riesgo al que están expuestos los niños que
Plomo Numero
(µg/dl) de niños
〈5.0 – 5.5] 40
〈5.5 – 6.0] 219
〈6.0 – 6.5] 286
〈6.5 – 7.0] 282
〈7.0 – 7.5] 206
〈7.5 – 8.0] 584
〈8.0 – 8.5] 343
Interprete
X0.90 >7.5; pero X0.50< 7.5 y Alto, si X0.50 ≥7.5. Según este criterio, evaluar
País A País B
Edad Población Población
(miles) Muertes (miles) Muertes
0–4 10541 494 18152 666
5 – 14 22431 667 33860 1165
15 – 24 23922 1287 39021 2115
25 – 34 21339 3696 42779 5604
35 – 44 18333 11198 33070 14991
45 – 54 15512 26180 22815 37800
55 – 64 10572 39071 22232 98805
65 – 74 6377 44328 17332 146803
+ 75 2643 31279 11836 161381
Total 131670 158200 241097 469330
mensuales en promedio son de S/. 1200 para los obreros y de S/. 1800 para
35
Del grupo A
30
Del grupo B
25
20
15
10
5
0
0 1 2 3 4 5 6 7 8
Medida de
resumen Grupo A Grupo B
Media 3.2 4.3
Desv. Est. 3.4 2.3
Mediana 3 4
Percentil 90 5 6
Boston/Toronto. 1986
1990
CAPITULO 2. PROBABILIDAD
Es la medida de la posibilidad de que ocurra un hecho o evento.
Probabilidad
Subjetiva Objetiva
Teórica o Frecuencial o
a priori a posteriori
Probabilidad Subjetiva
Probabilidad Objetiva
Definiciones
- Experimento aleatorio:
Todo procedimiento o actividad que genera dos o más posibles resultados, por
- Espacio muestral: Ω, S
Ω = {BBB,BBD,BDB,BDD,DBB,DBD,DDB,DDD }
Evento elemental: w
Evento o Suceso:
lo cual al trabajar con los eventos son validas todas las propiedades y
Nomenclatura. Como los eventos tienen que ver con la ocurrencia de ciertos
Si A = φ, A es un evento imposible
Si A = Ω, A es un evento seguro
A ⊂ Ω → P ( A) = p
Donde p debe cumplir los tres axiomas siguientes:
2. P(Ω) = 1
3. Dados A1, A2, …., An, …. eventos definidos en Ω, tales que son
entonces.
∞
P ( U Ai ) = ∑ P ( Ai )
i =1
Propiedades
P(φ) = 0
P(Ac) = 1 – P(A)
0 ≤ P(A) ≤ 1
- Probabilidad Frecuencial n( A)
P ( A) =
n
Ejemplo 2.1
Afiliación Reacción
Total
partidaria A favor Neutral Se opone
A 120 20 20 160
B 50 30 60 140
Otra 50 10 40 100
Total 220 60 120 400
Probabilidad Teórica
Los posibles resultados del experimento los podemos ilustrar con el siguiente
8A 6B
8
6
A B
7 6 8 5
A B A B
96
Luego P (C ) = = 0.527
182
C S
C S C S
Ejemplo 2.6
n(Ω) = 3x5 = 15
Ejemplo 2.7
n(Ω) = 15 x 14
2. Principio de Adición
Ejemplo 2.8
A: El artículo extraído es b
B: el artículo extraído es n
Entonces n(A ó B) = 4 + 2 = 6
Ejemplo 2.9
3. Permutaciones u ordenamientos
1 2 3 . . . n
1º 2º n-1º nº
n n-1 . . . 2 1
N = n x n-1 x . . . x 2 x 1 = n!
Ejemplo 2.10
operadores que sepan cuando inspeccionará, varía el orden de las visitas. ¿de
n!
N = n x n-1 x . . . x n – (n-1) =
( n − r )!
Ejemplo 2.11
4. Combinaciones
sin interesar el orden entre ellos, el número de maneras de formar el grupo es:
n n!
N = =
r r !( n − r )!
Ejemplo 2.12
15 15!
N = = = 455
3 3! 12!
Ejemplo 2.13
7
N = = 35
3
Ejemplo 2.14
7F
10
N = = 120
3
5. Particiones
n1 + n2 + … + nk = n
n!
N =
n1! n2 ! . . . nk !
Ejemplo 2.15
personas, respectivamente?
9!
El número de maneras será: N = = 1260
3! 4! 2!
Si se tiene n elementos entre los que n1, n2, …, nk elementos son similares
n!
N =
n1! n2 ! . . . nk !
Ejemplo 2.16
5!
N = = 10
2! 3!
5! = 120
7. Ordenamiento en circulo
Ejemplo 2.17
siguiente diagrama.
a c b
a
b b a c
c
a b c
a
c c a b
b
como:
P ( AB ) n( AB ) , si P(B) > 0
P( A / B) = =
P( B) n( B )
Ejemplo 2.18
Con los datos del ejemplo 2.1, calculamos la probabilidad de que un ciudadano
este a favor del nuevo plan de impuestos dado que es de afiliación partidaria A
Afiliación Reacción
Total
partidaria A favor Neutral Se opone
A 120 20 20 160
B 50 30 60 140
Otra 50 10 40 100
Total 220 60 120 400
A: El ciudadano es de afiliación A
P ( AF ) 0.30 120
Entonces P ( F / A) = = = = 0.75
P ( A) 0.40 160
P(A) P(Ac)
P(AB)=P(A)P(B/A) A Ac
P(B/A)
B Bc B Bc
Mg. Beatriz Castañeda S. 63
BIOESTADISTICA
Prob.
A Ac
marginal
c
B P(AB) P(AB ) P(B)
BC c c c
P(PAB ) P(A B ) P(Bc)
Prob.
P(A) P(Ac)
marginal
Elaboración propia
3. Independencia de eventos
B y viceversa.
P(A) = P(A/B)
P(B) = P(B/A)
P(AB) = P(A) P(B)
Ejemplo 2.19
Calculamos la probabilidad de obtener 2 caras al lanzar dos veces una
moneda
Probabilidad Total
colectivamente exhaustivos
BiBj = φ ∀ i ≠ j y ∪ Bi = Ω
B1 B2 Bn
...
A A A A ... A A
B1 B2 … … Bn
A AB1 AB2 … … ABn
AC AcB1 AcB2 … … AcBn
P( A)= ∑i
P ( AB i ) = ∑
i
P (Bi )P ( A / Bi )
de Bayes
P ( AB j )
P (B j / A)=
P(A)
Ejemplo 2.20
con el precio en 1 de cada 20, Juan empaqueta el 40% de los regalos que
del precio?
compró, ¿cuál es la probabilidad de que el error haya sido cometido por Juan?.
Regalos
0.30
0.05
0.10 0.04
E
E E E E E
decir,
Regalos
Carmen Juan Sandra Total
empaquetados
Con etiqueta 0,015 0,02 0,02 0,055
Sin la etiqueta 0,285 0,018 0,48 0,945
Total 0,30 0.20 0.50 1,00
P ( JA) 0,02
Por consiguiente P ( J / A) = = = 0,364
P ( A) 0,055
tabla de 2 x 2
Especificidad = S - x 100
S
Valor predictivo
negativo
Prueba diagnóstica
Población Positivo (+) Negativo (-) TOTAL
Enfermos P(E + ) P(E-) P(E)
Sanos P(S+) P(S-) P(S)
TOTAL P(+) P(-)
Ejemplo 2.21
experiencias anteriores se sabe que los rayos X tienen una sensibilidad del
enferma?
Prueba diagnóstica
Población Positivo (+) Negativo (-) TOTAL
Enfermos 0.0099 0.0001 0.01
Sanos 0.099 0.891 0.99
TOTAL 0.1089 0.8911
Luego:
Ejercicios
Según los reportes médicos el 90% de las personas que dan positivo al
Práctica domiciliaria 3
pasantes, se inscriben 5 000 alumnos de los cuales 720 son irregulares, por
probabilidad de:
b) Dado que ambos resultaron defectuosos, uno haya sido producido por la
bolas blancas?
Prueba Diagnóstica
Persona + - Total
Con hepatitis 76 4 80
Sana 10 110 120
posiciones extremas?
1011, 1100, etc). Eso números tienen un papel importante en el uso de los
técnicas para una gran demanda de trabajo. Este tipo de copiadora está
probabilidad de que:
11. La irregularidad del corte de productos de papel aumenta a medida que las
cabo pronósticos de ventas a corto plazo, 38% de ellas hacen ambas cosas
14. Una urna contiene 5 bolas negras y 4 blancas, la otra urna contiene 4
0.1 0.1
negativo?
lotes, que consiste en extraer una muestra de 3 artículos de cada lote que
de datos?
que:
contiene 10 bolas de las cuales 6 son negras y el resto rojas, cada uno
extrae una bola empezando por A, seguido por B, seguido por C, y así
23. En un partido de voleibol 2 equipos juegan hasta que uno de ellos haya
probabilidad de que:
25. Arturo llega tarde a su trabajo el 25% de las veces. Suele olvidar su
portafolio el 20% de las veces. Suponiendo que estos dos sucesos son
resulta positivo a esta primera prueba pasa por una segunda prueba que
tiene 95% de exactitud tanto para los que tienen como para los que no
27. Una empresa de servicios que elabora proyectos de Plan Maestro para
90% de los proyectos que prepara son aceptados por las entidades que dan
aprobado?
aprobados?
promueve un juego para los que acierte con los pronósticos y premiará a los
29. Sean P(A) = 0.30, P(B) = 0.78 y P(AB) = 0.16, encontrar P(AUB) y P(A’B’)
de probabilidades:
México. 1987
X :Ω → R
w → X (w) = x
Ejemplo 3.1.
experimento es:
[X = x] ⇔ A = { wi ∈ Ω / X ( wi ) = x}
por ejemplo
[X = 0] ⇔ {sss}
[X = 3] ⇔ {ccc}
[X = 5] ⇔ φ
[X = -1] ⇔ φ
como x1, x2, …, xn, …. En el caso finito la lista termina y en el caso infinito
f(x) = P[X = x] = P( A = { wi ∈ Ω / X ( wi ) = x} )
La función f para que sea función de cuantía debe cumplir con las siguientes
restricciones:
1) f(x) ≥ 0 ∀ x ∈ R
2) ∑ f ( x ) = ∑ f ( x ) =1
−∞ x∈ R x
Ejemplo 3.2.
1) Forma tabular
x f(x)
0 1/8
1 3/8
2 3/8
3 1/8
Suma 1
2) Forma de función
1 / 8 , si x = 0, 3
f ( x ) = 3 / 8, si x = 1, 2
0 para otro valor x
3) Forma gráfica
f(x)
3/8
1/8
X
0 1 2 3
Gráfico 11. Función de cuantía de variable discreta
utilizado para ejecutar una cierta tarea, el peso de un objeto, la duración sin
Para asignar probabilidades a las v.a. continuas se parte del estudio empírico
probabilidad.
Gráfico 12
12
10
Nº de mujeres
8
6
4
2
0
10 - 19 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89
Edad (años)
condiciones siguientes:
1) f(x) ≥ 0 ∀ x ∈ R
∞
2)
−∞
∫ f ( x )∂x =1
3) Para cualquier intervalo, la probabilidad de X tome valor en el intervalo
P(a ≤ X ≤ b) = ∫ f ( x ) ∂x
a
Ejemplo 3.3.
Sea X la v.a. que mide la vida en horas de cierto tipo de lámpara de radio que
100
si x > 100
f ( x) = x2
0 si x ≤ 100
¿Cuál es la probabilidad de que una lámpara de radio de este tipo pueda durar
f(x)
1/3
X
100 150
F(x’0 ) = P(X ≤ x0 ) = ∑ f ( x)
x ≤ x0
F(x’0 ) = P(X ≤ x0 ) = ∫ f ( x ) ∂x
−∞
Ejemplo 3.4.
1. 0 ≤ F(x) ≤1
escalonada.
∂F ( x )
que = f ( x)
∂x
4. Si X es v.a. continua
P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b) = F(b) – F(a)
5. Si X es v.a. discreta
indica el valor alrededor del cuál toma medida la variable con mayor
variable aleatoria.
Ejemplo 3.5
x =3
µ = E( X ) = ∑ x f ( x)
x =0
= 0 (1/8) + 1(3/8) + 2 (3/8) + 3 (1/8) = 12/8 = 1.5
11 en pág. 83)
∞ ∞
100 1
µ = E ( X ) = ∫ x 2 ∂x = 100 ∫ ∂x = ln x ]100
∞
=∞
100 x 100
x
media.
1) Si X es v.a. discreta
σ 2
= V ( X ) = E [( X − µ ) 2 ] = ∑ (x − µ)
x∈ R x
2
f (x)
Simplificando la expresión
σ 2 = E(X 2 ) − µ 2 = ∑x
x∈ R x
2
f ( x) − µ 2
2) Si X es v.a. continua
∞
σ = V ( X ) = E[( X − µ ) ] = ∫ ( x − µ) f ( x) ∂x
2 2 2
−∞
Simplificando la expresión
∞
σ = E( X ) − µ = ∫x f ( x ) ∂x − µ 2
2 2 2 2
−∞
Ejemplo 3.6.
µ = 1.5
Obtenemos su varianza
σ 2 = E( X 2 ) − µ 2 = ∑x
x∈ R x
2
f ( x) − µ 2
= 24/8 – 2.25
= 0.75
σ2 = 0.87
obtiene como:
1) E (Y ) = E[G ( X )] = ∑ G( x ) f ( x )
−∞
Si X es v.a. discreta.
2) E (Y ) = E[G ( X )] = ∫ G ( x ) f ( x ) ∂x
−∞
Si X es v.a. continua.
Práctica domiciliaria 4
distribución acumulada:
0 , sí x < 1/8
0.2 , sí 1/8 < x < 1/4
F(x) = 0.9 , sí 1/4 < x < 3/8
1 , sí x > 3/8
esperanza matemática).
de lanzamientos.
operación completa?
independiente.
tres computadoras?
son independientes.
función de densidad f(x) = 600 /x2 para 100 µm < x < 120 µm; 0 en otro
caso.
12.Un blanco está formado por 2 círculos concéntricos de radio 2 y 4 cm. Los
disparos que impactan en el círculo interior valen 4 puntos, los que impactan
en el anillo valen 2 puntos y los que impactan fuera del blanco valen cero
puntos. Sea X la v.a. que representa la distancia del impacto al centro del
realizar 2 disparos.
disparos.
esperado de Y.
d!
a) Determinar el valor de k .
no mejorar
enfermedad o no desarrollarla
Entonces el recorrido es x : 0, 1
1 − P si x = 0
La función de cuantía: f ( x) =
P si x = 1
P(éxito) = P ; P(fracaso) = 1 – P = Q
modelo:
n
f ( x) = P( X = x ) = P x (1 − P)n−x si x : 0, 1, 2, ..., n
x
µ = E( X ) = nP
σ 2 =V( X ) = nP(1 − P)
Ejemplo 3.7.
respuestas.
probabilidades:
independientes
25
f ( x ) = 0.20 x 0.80 25 − x si x : 0, 1, 2, ..., 25
x
Aplicando el modelo
25
25
a) P ( X > 10) = P ( X ≥ 11) = ∑ x 0.20 x
0.80 25− x = 0.0056
11
rindan
Se espera que sólo uno de los 200 estudiantes apruebe el examen si responde
Ejercicio
Población N
A Ac
P=T
T N –T N
Proporción de elementos
A en la población
Muestra n
A Ac
p=x
x n-x n
Proporción de elementos
A en la muestra
Donde la v.a. X se define como
x: 0, 1, 2, …., n si y sólo si n ≤ T y n ≤ N -T
T N − T
x n − x
f ( x) = N x : 0, 1, 2, ..., n si n ≤ T y n ≤ N − T
n
0 para otro valor x
Media y Varianza
T T N − T N − n N −n
µ = E( X ) = n = nP; σ 2 = n = nP (1 − P )
N N N N − 1 N −1
Ejemplo 3.8
3 6
0 3
a) P ( X = 0) = = 0.238
9
3
3 6
2 1
b) P ( X = 2) = = 0.214
9
3
Ejercicio
el lote si contiene:
a) cinco defectuosos?
b) Dos defectuosos?
N grande)
T N − T
x n − x = n P x (1 − P )n − x
lim x ; haciendo P = T/N
n→ ∞ N
n
n
P ( X = x ) ≅ P x (1 − P ) n − x ;
x
N −n
µ = nP ; σ 2 = nP (1 − P ) ≅ nP (1 − P )
N −1
n
Para N tal que ≤ 0 . 10 decimos que N es grande
N
Ejemplo 3.9
artículo defectuoso.
fracción de muestreo
n 4
= = 0.02 < 0.10
N 200
4
Luego P ( X = 1) = 0.05 (0.95) 3 =0.1715
1
10 190
1 3
P ( X = 1) = = 0.1739
200
4
Donde X: 0, 1, 2, .....
entonces,
−λ λx
f ( x) = P( X = x) = e ; µ =λ ; σ 2 =λ
x!
evento.
Se desea calcular
Entonces definimos
0,8 0
P ( X = 0) = e − 0.8 = 0,449
0!
Ejercicio
c) No haya accidentes.
pequeña
n ≥ 100 y p ≤ 0,05
poisson,
P( X = x ) ≅ P( X = x )
Es decir :
n x −λ λ
x
lim P (1 − P ) n− x
= e , haciendo λ = nP
x x!
Ejemplo 3.11.
a) Más de 10 no se recuperen
b) Todos se recuperen
c) Sólo 3 no se recuperen
En este caso
tratamiento
Como n > 100 y P < 0.05 podemos aprximar a la Poisson con λ = nP =5,4
c) P( X= 3) = 0.1185
Ejercicio
año?
λ e − λx ; si x > 0
f ( x) = ; con λ > 0
0 para otro valor x
1 1 1
Media y Varianza: µ= ; σ2 = 2 ; σ =
λ λ λ
Ejemplo 3.14.
Sea la v.a.
Con λ = 20 llamadas/hora
20 llamadas.
Luego la variable
siguiente es de 3 minutos.
Si deseamos calcular
∫ 20 e
− 20 t
P(T > 5 min) = P(T > 1/12 h) = dt = e − 20 (1 / 12 ) = 0.189
1 / 12
2
1 x−µ
−
2 σ
e
f ( x) = ; −∞ < x < ∞
2π σ
Características
ˡ ˡ X
µ-k µ µ+k
X
µ
Mo
Me
68%
x
µ- σ µ µ+σ
95%
X
µ - 2σ µ µ + 2σ
99.7%
X
µ - 3σ µ µ + 3σ
Propiedades
Y = a + b X es normal
Con µy = a + b µx y σ2y = b2 σx
2. Si X1, X2, ...Xn son n variables independientes cada una con distribución
Y = a1 X1 + a2 X2 + ...... + an Xn es normal
Con µy = a1 µ1 + a2 µ2 + ..... + an µn
X −µ
Z=
σ
Se denomina variable estandarizada y tiene distribución normal con
µZ = 0 σ 2Z = 1
Simbolizamos Z es N(0,1)
P( Z ≤ z )
Z
z 0
6.7%
Z
-1.5
99.3%
Z
2.45
3) P(-1.5 < Z < 2.45) = P(Z < 2.45)- P(Z < -1.5)
92.6%
Z
-1.5 2.45
6.7% 6.7%
Z
-1.5 1.5
Ejemplo 3.15
es de 0,6 minutos.
0.273
X
2,1 2,45 3,55
Z = 0.58 Z= 2.42
Y = X 1 + X2 + X3 + X 4 + X 5
preguntas.
Y es normal con µ y = 2,1 x 5 = 10,5 min utos y σ y = 5 x (0.6) 2 = 1.34 min utos
99.96%
X
5 10,5 15
Z = -4.10 Z = 3.36
Luego
P( 5 < Y < 15 ) ≅ 1
c) El tiempo que necesita para la comprensión del tema el 10% más hábil
y el 10% menos hábil implica obtener las cuantilas del 10% y del 90%,
80%
10% 10%
X
X0.10 10.5 X0.90
X 0.10 − 10.5
Z 0.10 = = −1.28 ⇒ X 0.10 = 8.78 min utos
1.34
X 0.90 − 10.5
Z 0.90 = = 1.28 ⇒ X 0.90 = 12.22 min utos
1.34
Luego para la comprensión del tema el 10% de los alumnos más hábiles
requiere máximo 8,78 minutos y el 10% menos hábil requiere mínimo 12,22
minutos
Ejercicio
las vidas útiles de las pilas de cierta marca están distribuidas normalmente
alrededor de su media µ = np
.375
.375 .375
.50 .25 .25
0 1 2 0 1 2 3 0 1 2 3 4
x
0 np n
Luego si np > 5 y n(1-p) > 5, por el Teorema del límite Central (Pág.
P( X ≤ xo ) ≅ P[ X < xo + 0,5]
Binomial Normal
P( X ≥ xo ) ≅ P[ X > xo - 0,5]
Binomial Normal
Binomial Normal
Ejemplo 3.16.
Según los archivos el 15% de los trabajadores de las plantas de cemento son
neumoconiosis.
Se desea calcular
= P(X ≤ 4) = 0.921
Se desea calcular
10.5 − 6
= P ( X ≤ 10) ≅ P ( X ≤ 10.5) = P ( Z ≤ ) = P ( Z ≤ 1.99) = 0.9767
2.26
Ejercicio
a) exactamente de 32?
b) menor de 20?
c) De 20 o más?
d) Entre 15 y 20 inclusive?
PRACTICA DOMICILIARIA 5
llamadas de 15 minutos.
minutos?
10 minutos?
defectuosas.
defectuosas.
que las vidas de las pilas son independientes calcule la probabilidad de que
5. Una serie de ocho lámparas se conecta de tal forma que si una de ellas
cual recibe S/.60 por hora. El número de veces que la computadora falla
normal, con una media de 500 y una desviación estándar de 40 por día.
clientes?
esperado?
5% es defectuoso.
probabilidad de que pueda surtir un pedido de 100 artículos, sin tener que
componentes en almacén?
con cuidado. ¿Qué tan grande debe ser n si el fabricante desea que la
11. Supóngase que el 24% de los individuos de una población tiene el grupo
magnética ocurre a una tasa un defecto por cada 105 bits. Un sector de
13. Los mensajes a una computadora utilizada como servidor lo hacen con una
que no llegue ningún mensaje durante ese lapso de tiempo sea 0,90.
de 8 horas?
horas al mes.
diario de agua por vivienda tiene distribución normal con µ = 120 galones y
σ = 18 galones.
diarios?
las viviendas.
probabilidad de 99%?
reemplazada?
lavadoras?
20. Una compañía textil produce rollos de tela con un promedio de 2.2 defectos
3000 bombillas cuya duración tiene una distribución normal con una
reemplazo?
antibiótico.
aceptar el lote?
27. Un ingeniero industrial cree que el 30% de todos los accidentes industriales
esta causa.
pedidos. Suponga que los pedidos tienen una distribución de Poisson con
media 0.25 por semana para una ciudad de 100 000 habitantes.
periodo de 4 semanas?
b) Suponga que se hacen pedidos de una ciudad que tiene 800 000
30. El tiempo de vida de los reguladores de voltaje de los automóviles tiene una
años?
Si X1, X2, ...Xn son n variables independientes cada una con distribución
Y = a1 X1 + a2 X2 + ...... + an Xn es normal
Con µy = a1 µ1 + a2 µ2 + ..... + an µn
Sean x1, x2, …., xn una sucesión de variables aleatorias independientes tales
X = Σ xi
X − µx
Luego Z= → N (0,1) conforme n → ∞
σx
3. Distribución Ji-Cuadrado
1
f ( x) = x ( k / 2 ) −1 e − x / 2 , para x > 0
2 Γ ( k / 2)
k/2
µ = E( X ) = K ; σ 2 =V ( X ) = 2 K
0 k X2(K)
2
cuadrada con k grados de libertad ( X es χ (k) )
Propiedades
2
X −µ
Z =2
es χ (21)
σ
c) Si Y1, Y2, …., Yk son variables aleatorias independientes cada una con
aleatoria
n
X = Y +Y + .... +Y
1
2
2
2
n
2
es χ 2
(r ) donde r = ∑ k i
1
d) Si X1, X2, …., Xk son variables aleatorias independientes cada una con
2
x −µ
k
Y = ∑ i es χ (k2 )
1 σ
Uso de tablas
0.70
X2(12)
0 14
0.90
X2(12)
0 18.5
4. Distribución t-Student
Γ[( k + 1) / 2] 1
f ( x) = . , para − ∞ < x < ∞
πk Γ( k / 2) [( x 2 / k ) + 1]( k +1) / 2
k
µ = E( X ) = 0 ; σ 2 =V ( X ) = para k > 2
k−2
X
-t 0 +t
Propiedad
Z
T= es t(k )
Y
k
Uso de tablas
0.90
t(12)
0 1.782
0.98
0.01 0.01
T(12)
-2.681 0 2.681
5. Distribución F
u/ 2
u + v u
Γ x ( u / 2 )−1
2 v
f ( x) = , para 0 < x < ∞
Γ( u / 2) Γ(v / 2) [( u / v ) x + 1]
( u+ v ) / 2
v 2v 2 ( u + v − 2)
µ = E( X ) = ; σ2 = , para v > 4
v−2 u(v − 2)2 (v − 4)
F(u,v)
X es F(u,v)
Propiedad
W /u
respectivamente, entonces el cociente F= es F( u ,v )
Y /v
Uso de tablas
0.25
0.415 F(3,5)
y cada posible muestra tiene la misma probabilidad de ser elegida. Con este
proceso los elementos son elegidos por sorteo del conjunto de elementos que
constituyen la población.
N
K = para muestreo sin reposición
n
genera un espacio muestral constituido por todas las posibles muestras que se
Variable cuantitativa
x=
∑X i
Media muestral
n
S 2
=
∑(x i − x)2
Varianza muestral
n−1
Variable es categórica
x
p= proporción de elementos A en la muestra
n
Definiciones:
conjunto de variables (X1, X2, . . . , Xn) tales que son independientes entre si
Población:
x1 = 2 años x2 = 4 años x3 = 6 años
x4 = 8 años x5 = 10 años
µx = 6 σ x2 = 4 σx = 2
Podemos apreciar resultados que no son casuales sino que siguen una
estructura esperada
µx = 6= µ
Las muestras tienen media alrededor de la media de la población
σ2 8
σ =4=
2
x
=
n 2
La dispersión de las medias muestrales depende de la varianza de la población
y del tamaño de muestra.
µx = 6 σ x2 = 3 σ x = 1.73
Para muestreo sin reposición se obtiene que
µx = 6= µ
Las muestras tienen media alrededor de la media de la población
σ 2 N −n 8 5−2
σ =4=
2
=
x
n N −1 2 4
La dispersión de las medias muestrales depende de la varianza de la
población, del tamaño de muestra y del tamaño de la población.
Gráfico 14
Distribución de las edades de los niños
(Población)
1,2
Número de niños
1
0,8
0,6
0,4
0,2
0
2 4 6 8 10
Edad (años)
Gráfico 15
6
5
4
3
2
1
0
2 3 4 5 6 7 8 9 10
Media muestral
Gráfico 16
Distribución de la media muestral
(Muestreo sin reposición)
Número de muestras
2.5
2
1.5
1
0.5
0
3 4 5 6 7 8 9
Media muestral
tamaño “n”
Media µx = µ
σ2
Varianza σ = 2
x
n
Para todo tamaño de n, si la población es normal
Media µx = µ
σ2 N −n
Varianza σ 2
=
x
n N −1
95%
µ − 1.96 σ x µ µ + 1.96 σ x
x
Ejemplo 4.1
medio que requieren ciertas personas impedidas para realizar una tarea
a) De 26 segundos o más
b) Entre 24 y 27 segundos
c) Mayor de 22 segundos.
σ
x es normal con µ x = µ = 25 segundos y σ x = = 1 seg
n
0.1587
x
25 26
Z=1
0.81859
x
24 25 27
Z = -1 Z=2
0.99865
x
22
Z=-3
Ejercicios
distribuidas en forma casi normal con una media y una desviación estándar
a) Mayor de 6
b) Entre 5 y 6
c) Menor de 5.2
a) Mayor de 6 días.
b) Entre 4 y 6 días.
c) Entre 4 ½ y 5 ½ días.
tamaño “n”
S 2
=
∑(x i − x)2
la varianza muestral es tal que E(S2) = σ
2
n−1
( n − 1) S 2
X2 = es χ2(n-1)
σ 2
X2
0 n-1 ∞
Ejemplo 4.2
2 ( n − 1) S 2
X = es χ2(24)
σ 2
( n − 1) S 2 ( 24) 6 2
Así P(S > 6) = P( > ) = P (χ2(24) > 34.56) = 0.079
σ2 5 2
0.10
p
0.05
χ (224 )
33.2 34.56 36.4
Interpolando obtenemos:
X ……. P
33.2 ….. . 0.10 entonces D ……. d Luego por regla de tres
34.56 …… p -3.20 ….. 0.05 p = 0.07875
36.4 …... 0.05 -1.84……. p – 0.05
Población N
A Ac
P=T
T N –T N
Proporción de elemen-
tos A en la población
Muestra n
A Ac
p=x
x n-x n
Proporción de elemen-
tos A en la muestra
Donde:
P (1 − P ) N − n
µp = P y σ2 =
n N −1
Cuando para una muestra dada la población es relativamente grande, esto es,
n
≤ 0.10 , decimos que la población es grande o infinita y aproximamos a 1 el
N
N −n
factor de población finita, ≅1
N −1
P (1 − P )
σ 2p =
n
.
p
P
P (1 − P ) N − n
µp = P y σ2 =
n N −1
P (1 − P )
µp = P y σ2 =
n
Ejemplo 4.3
c) No mayor de 0.12
Solución:
µp = 0. 15; σp = 0.0357
Ejemplo 4.4
En cierta ciudad se observa que el 20% de las familias tienen por lo menos un
En una muestra al azar de 150 familias se obtuvo p = 0.27. Si el valor del 20%
Solución:
µp = 0. 20; σp = 0.033
Ejercicio.
PRACTICA DOMICILIARIA 6
por familia?
500.
estándar de 20.
una bebida gaseosa tiene una distribución normal con media 12,4 onzas de
a) Si se desechan todas las latas que tienen menos de 12,1 o más de 12,6
onzas?
tiene una vida útil media de 80,000 km y una desviación estándar de 8,000
que en más del 10% de los días se haya obtenido más de 200
b) El sector tiene 500 viviendas de las cuales el 60% está en mal estado y
10. Los precios que las diferentes farmacias cobran por un determinado
farmacias,
$10?
inferior a $2,50.
desarrollado asbestosis?
12. Una red de televisión pretende que su película del lunes por la tarde tenga
dos fumen.
México 2004
CAPITULO 5. ESTIMACIÓN
Estimación puntual
Estimación interválica
Parámetro Estimador
n
∑x i
Media poblacional: µ µ̂ = x = 1
n
n
∑(x i − x)2
Varianza poblacional : σ2 σˆ 2 = S 2 = 1
n−1
Proporción poblacional; P Pˆ = p
^
Diferencia de medias: µ1- µ2 µ1 − µ 2 = x 1 − x 2
^
Diferencia de proporciones: P1 - P2 P1 − P2 = p1 − p2
5.2. Estimación interválica
Para una estimación interválica, usamos los datos de la muestra para obtener
los límites del intervalo de manera que tengamos una probabilidad (1-α) de
poblacional.
95%
µ − 1.96 σ x µ x
µ + 1.96 σ x
σ
L = x ± 1 . 96
n
incluirá entre sus valores el valor de la media poblacional
95%
µ − 1.96 σ x µ x
Mg. Beatriz Castañeda S.
x µ + 1.96 σ x
155
x − 1.96 σ x x x + 1.96 σ x
BIOESTADISTICA
σ
L = x ± Z 1−α / 2
n
S
L = x ± Z 1 −α / 2
n
S
L = x ± t 1−α / 2
n
donde t1-α/2 es la cuantila 1-α/2 de la t-Student con n-1 grados de libertad
Ejemplo 5.1.
minuto del corazón para cierta población, se encontró que el número promedio
S
L = x ± Z 1 −α / 2
n
Luego
10 10
Li = 90 − 1.645 = 87.65 y Ls = 90 + 1.645 = 92.35
49 49
Ejemplo 5.2.
S
L = x ± t 1−α / 2
n
6 6
Li = 35.8 − 1.753 = 33.17 y Ls = 35.8 + 1.753 = 38.42
16 16
1- α
.
µ x
µ−E x µ+E
e _
E
Gráfico 17. Error de muestreo y cota superior
Entonces a
máximo E, es:
Z 12−α / 2 σ 2
n=
E2 , Si la población es grande o infinita
σ N −n
2
Si la población es finita, entonces E = Z 1−α / 2
n N −1
Z 12−α / 2 σ 2
E2 n0 Z 12−α / 2 σ 2
n= = ; n0 =
Z 12−α / 2 σ 2 n0 E2
1 + 1+
N E2 N
Ejemplo 5.3.
nacimientos si el administrador desea que el error máximo sea de 100 gr. con
en 200 gr.
Z 12−α / 2 σ 2
n=
E2
comprada por mes por sus clientes y acepta un error de no más de $ 2,50 al
Z12−α / 2 σ 2
Primero calculamos n0 =
E2
Luego 1.96 2 15 2
n0 = = 138.29 ≅ 139
2.5 3
139
Como la población es finita, entonces n= = 109
1 + 139 / 500
( n − 1) S 2 2
X2 = es χ (n-1)
σ 2
α/2 α/2
1-α
χ2(n-1)
χ α2 / 2 χ 12−α / 2
( n − 1) S 2
P χ α / 2 < < χ 1 − α / 2
= 1 − α
σ 2
( n − 1) S ² ( n − 1) S ²
P <σ 2 < = 1 − α
χ 2
α /2 χ 2
1−α / 2
( n − 1) S ² ( n − 1) S ²
Li = Ls =
χ 2
1−α / 2 χα2 / 2
p(1 − p )
L = p ± Z 1 −α / 2
n
p(1 − p ) N − n
L = p ± Z 1− α / 2
n N −1
Ejemplo 5.5.
del medicamento.
p = 180/200 = 0.90
0.90(0.10) 0.90(0.10)
Li = 0.90 − 1.96 = 0.858 y Ls = 0.90 + 1.96 = 0.942
200 200
Así concluimos que: con 95% de confianza se estima que el porcentaje de
Ejemplo 5.6.
Una muestra de tamaño 400 seleccionada de entre los 2000 alumnos que
psicosomática.
p(1 − p ) N − n
Luego L = p ± Z1−α / 2
n N −1
el 16,5% y el 23,5%
L (T) = N L(P)
psicosomática .
1- α
. p
P-E P p P+E
e _
E
Z 12−α / 2 P (1 − P )
n= , Si la población es grande o infinita
E2
Z 12−α / 2 P (1 − P )
E 2 n0 Z 12−α / 2 P (1 − P )
n= = ; n0 =
Z 12−α / 2 P (1 − P n0 E2
1 + 1+
N E 2
N
Ejemplo 5.7.
hospitalización.
5% al 95% de confianza?
Z12−α / 2 P (1 − P )
a) Si asumimos población grande n=
E2
1.96 2 (0.25)(0.75)
n= = 288
0.05 2
P 1.96 2 (0.50)(0.50)
0 0.50 1 n= = 384
0.05 2
L = ( x 1 − x 2 ) ± Z1−α / 2 σ x1 − x 2
σ 12 σ 22
donde σ x1 − x 2
= +
n1 n2
L = ( x 1 − x 2 ) ± Z 1−α / 2 S x1 − x 2
s 12 s 22
donde S x1 − x 2 = +
n1 n 2
normales
L = ( x 1 − x 2 ) ± t1−α / 2 S x1 − x 2
donde
( n1 − 1) S12 + ( n2 − 1) S 22 1 1 1 1
S x1 − x 2 = + = Sc +
n1 + n2 − 2 n1 n2 n1 n2
(t(n1+n2 -2))
Ejemplo 5.8.
L = ( x 1 − x 2 ) ± Z 1−α / 2 S x1 − x 2
Luego obtenemos
Li = 0.235 cm Ls = 1.865 cm
Con 95% de confianza estimamos que la dimensión promedio del tumor tipo
Los tumores de mama tipo A en promedio tienen mayor tamaño que los
tumores tipo B
Ejemplo 5.9.
Método 1: 15 20 11 23 16 21 18 16 27 24
Método 2: 23 31 13 19 23 17 28 26 25 28
Luego como las muestras son pequeñas y las poblaciones son normales,
L = ( x 1 − x 2 ) ± t1−α / 2 S x1 − x 2
Primero calculamos
( n1 − 1) S 12 + ( n2 − 1) S 22 1 1 9(4.8 2 ) + 9(5.9) 2 1 1
S x1 − x 2 = + = + = 2.405
n1 + n2 − 2 n1 n2 10 + 10 − 2 10 10
Li = - 8.25 Ls = 1.85
Este resultado nos indica que al 95% de confianza no podemos concluir que los
obreros capacitados con el método 1 sean en promedio más veloces que los
Ejercicio
mes.
Persona : A B C D E F G H
Triglicérido inicial: 310 295 287 305 270 323 277 299
Triglicérido final : 263 251 249 259 233 267 242 265
hacerse?
L = ( p1 − p2 ) ± Z 1−α / 2 S p1− p 2
donde
p1 (1 − p1 ) p2 (1 − p2 )
S p 1− p 2 = +
n1 n2
Ejemplo 5.10.
PRACTICA DOMICILIARIA 7
1. Una gran tienda desea estimar con una confianza de 98% y un error
proporción.
almacén desea estimar el promedio de cantidad comprada por mes por sus
clientes que usan cuenta de crédito, con un error de no más de $ 2,50 y una
4. En una conferencia de prensa, una alta autoridad anuncia que el 90% de los
del Gobierno. Una muestra aleatoria de 625 adultos indica que 55% están
Σx = 756 miligramos
3, 4, 4, 6, 2, 3, 4, 6, 2, 4, 6, 4, 3, 4, 4, 7, 3, 4, 5, 6, 1, 6, 4,
5, 4, 3, 2, 4, 3, 4
familias. La muestra dio un ingreso familiar anual medio de S/. 15 000 y una
estudiantes.
de naturaleza psicosomática
0.5 (mg/lt)² pero con media desconocida. Si se toma una muestra de tamaño
n = 10, que arroja los siguientes resultados en mg/lt: 1.8, 2.0, 2.1, 1.7, 1.2,
6.1.1. Definición
Ejemplo 6.1.
Ejemplo 6.2.
Ejemplo 6.3
más eficaz que uno antiguo porque suponemos que el porcentaje de pacientes
antiguo.
Entonces:
siguientes:
un valor específico k
hipótesis.
descripción alterna del estado del universo. Siempre existirá una alternativa,
nula propuesta.
respectiva de la otra alternativa. O sea que estos dos eventos son mutuamente
Las formas en las cuales se pueden presentar tanto las hipótesis nulas como
2) Decisión
proporciona una muestra, ésta nos puede indicar una de dos posibles
que se deba al azar del muestreo, sino a que en la población existe esta
muestreo, por ello se dice que no hay razones suficientes para rechazar la
hipótesis nula.
3) Estadística de la prueba
Ejemplo 6.4
Se piensa que la vitamina C puede disminuir los niveles del colesterol sérico, y
que esta disminución en promedio es mayor de 50 mg. por 100 ml. Para
Estas hipótesis son referidas al valor de la disminución promedio (µ), por lo que
De manera que si la hipótesis nula (H0) fuera cierta, esperaríamos que la media
H0 H1
x
µ ≤ 50 µ > 50
Así para la toma de decisión se considera una medida de la muestra, que esté
muy relacionada con las hipótesis planteadas, pero como los valores a
observar para la muestra están sujetos al azar del muestreo, entonces las
medidas, usando los datos de la muestra, para las cuales se pueda utilizar los
comparación.
Ejemplo 6.5
x − µ0
Z= ; cuya distribuci ón es N (0,1) si H 0 es cierta
S
n
obtenemos:
x − 50
Z= ; cuya distribución es N(0,1) si H 0 es cierta
S
n
De manera que si la hipótesis nula (H0) fuera cierta, esperaríamos que Z tome
Z
0
Si x ≈ 50 Si x > 50
construido en función del valor planteado en H0; por lo que la prueba, como ya
Ejemplo 6.6
x − µ0
Estadística de la prueba: Z=
S
n
H0 : µ = µ0 H0 : µ ≠ µ0
x − µ0
Estadística de la prueba: T =
S
n
H0 : P = P0 H1 : P ≠ P 0
p − P0
Estadística de la prueba: Z=
P0 (1− P0 )
n
la hipótesis alterna (H1). Así para la toma de decisión se considera una medida
Ejemplo 6.7
x − 50
Z =
S
n
Z
0 2
Si x ≈ 50 Si x > 50
5) Tipos de error
Población
H0 H0 H1
Verdadera Falsa verdadera
La muestra indica
No rechazar H0 Rechazar H0 No rechazar H0 Rechazar H0
(no error) (error tipo I) (error tipo II) (no error)
errores posibles
Ejemplo 6.8
valor mayor que 50, por ejemplo 60, luego las hipótesis quedan especificadas
como:
H0: µ = 50 H1: µ = 60
tenemos:
H0 H1
α
β
1-α 1- β
x
µ = 50 c µ = 60
Región de no rechazo Región crítica o de rechazo (R.C.)
= P( x ≤ c; cuando µ = 60)
que los datos observados se alejen del valor planteado en la hipótesis nula en
Ejemplo 6.9
n = 40 ; x = 58 ; S = 16
grande o mayor que 58, asumiendo que la verdadera media es igual a 50.
x − µ0 58 − 50
= P ≥ = P(Z ≥ 3.16) = 0.00079
S/ n 16 / 40
Gráficamente tenemos:
p p = 0.00079
x Z
50 58 0 3.16
mL.
Resumen
En esta unidad Ud. ha recibido las bases para la realización de una prueba de
Ejercicio Aplicativo
niños de 7-8 años de edad, mestizos que residen en la ciudad, hijos de madres
0,38; media ± ES) en la prueba de Bender cuando se les compara con los
adultas
4) Hipótesis estadísticas
Número de Variable
Hipótesis Prueba Estadística
Grupos de interés
Prueba de bondad de
Distribución de la ajuste
Cuantitativa, población tiene
Ordinal o un modelo deter- Prueba Ji-Cuadrado *
categórica minado Prueba de Kolmogorov –
Smirnov
Uno
Ordinal o Médición de efec- Prueba del signo*
cuantitativa to antes-después
(observaciones Prueba de Wilcoxon*
apareadas)
Categórica Prueba de McNemar *
Comparación de
mediciones
Ordinal o (grupos indepen- Prueba de
Dos cuantitativa dientes) Mann-Whitney *
Comparación de Prueba exacta
Categórica
proporciones de Fisher *
Comparación de
mediciones Prueba de Kruskal-
(grupos indepen- Wallis*
Ordinal o dientes
cuantitativa
Comparación de
mediciones Prueba de Friedman*
(grupos depen-
K dientes)
(K ≥ 3) Comparación de Prueba de comparación
Proporciones: de proporciones o de
P1j, P2j, ..., Pkj homogeneidad
Categórica Prueba Ji-Cuadrado
Comparación de
tratamientos
(Observaciones Prueba de Cochran *
relacionadas)
* Estas pruebas no son desarrolladas en este curso
Elaboración propia
Datos:
población
Requisitos:
1) La muestra es aleatoria
Hipótesis:
a) H0: µ = µ0 H1: µ ≠ µ0
Estadística de la prueba
x − µ0
Z=
σ/ n
Regla de decisión
α/2 α/2
Z
-Z1-α/2 0 Z1-α/2
R.C. R.C.
α
Z
0 Z1- α
R.C.
-Z1- α 0 Z
R.C.
Nota
x − µ0
Z =
S/ n
Ejemplo 6.10.
del estudio fue determinar si los habitantes de una región rural tenían un
210 calorías.
calorías y que el otro 50% consume más de 2000 calorías, por ello para que la
50% 50%
X
µ = 2000 µ > 2000
p = 0.0548
Z
1.598
Datos:
La muestra consiste de n valores cuantitativos independientes de una
población normal
Requisitos:
1) La muestra es aleatoria
Hipótesis:
a) H0: µ = µ0 H1: µ ≠ µ0
Estadística de la prueba
x − µ0
T =
S/ n
verdadera.
Regla de decisión
α/2 α/2
T
-t1-α/2 0 t1-α/2
R.C. R.C.
α
T
0 t1- α
R.C.
-t1- α 0 T
R.C.
Ejemplo 6.11.
anticuerpos de 1.9.
Para probar si la nueva vacuna es más eficaz que la vacuna antigua, se aplicó
1.2, 3.0, 2.5, 2.4, 1.9, 1.8, 1.5, 2.6, 2.7, 3.1, 1.7, 2.3, 2.2, 2.4, 2.2, 2.1
H1: El título promedio del anticuerpo de esta nueva vacuna es mayor que
distribución de los títulos del anticuerpo tienen distribución normal, por lo tanto
x = 2.225 S = 0.518
x −µ0 2 .225 − 1 .9
T= = = 2 .51
S/ n 0 .518 / 16
p = 0.012
t (15 )
2.51
Este resultado nos indica que los datos son concordantes con un valor
0.012).
a) H0: µ = µ0 H1: µ ≠ µ0
Distribución Decisión:
Prueba Requisitos Estadística de Rechazar H0
de la prueba La estadística Al nivel α si
Si H0 es cierta
Varianza σ2 conocida
-Todo n de población x − µ0 Normal a) Z < -Z1-
Z Normal Z= α/2
- n grande de σ/ n N(0,1) ó Z > Z1-α/2
cualquier b) Z > Z1-α
población c) Z < -Z1-α
Datos:
población normal.
Requisitos:
1) La muestra es aleatoria
2) La población es normal.
Hipótesis:
Estadística de la prueba:
(n − 1) S 2
X = 2
σ 02
X2 tiene distribución Ji-cuadrado χ 2( n −1) , si H0 es verdadera.
Regla de decisión:
α/2
α/2
X2
χ α2 / 2 χ 12−α / 2
R.C. R.C.
X2
χ 12− α
R.C.
X2
χ α2
R.C.
Ejemplo 6.12.
Para que un medicamento sea eficaz contra cierta enfermedad debe tener
cierta concentración del principio activo definida con exactitud. Por esta razón
elevadas o que podrían tener una concentración tan baja que los haría
ineficaces.
estándar
σ = ( 0.1) /3 = 0.033
gráficamente tendríamos:
99.7%
X
4.9 5 5.1
y
3σ = 0.1 3 σ = 0.1
H 0: µ = 5 H 1: µ ≠ 5
se tomó una muestra de 8 envases para los cuales se obtuvo las siguientes
concentraciones en mg /cc
(n − 1) S 2 7(0.00439)
Luego X =
2
= = 28.21
σ 20 (0.033) 2
p < 0.001
χ 2( 7)
28.21
Luego, este resultado nos indica que la diferencia encontrada es muy grande y
que es casi improbable que se deba a la variabilidad del muestreo por lo que
H 0: µ = 5 H 1: µ ≠ 5
De los datos de la muestra tenemos:
x − µ0 4.9875 − 5
T= = = − 0.533
S/ n 0.0663 / 8
p > 0.25
2
t (7)
- 0.533
Por ser una prueba de alternativa bilateral p > 0.50 > 0.05
Este resultado nos indica que los datos son concordantes con el valor 5 para la
Datos:
Requisitos:
pertenecer a la categoría 1
3. La muestra es grande
población(N) (n ≤ 0.10 N)
Hipótesis:
a) H0: P = P0 H 1: P ≠ P 0
b) H0: P ≤ P0 H 1: P > P 0
c) H0: P ≥ P0 H 1: P < P 0
Estadística de la prueba:
p − P0
Z= Z es N(0,1), si H0 es verdadera
P0 (1 − P0 )
n
Regla de decisión
α/2 α/2
Z
-Z1-α/2 0 Z1-α/2
R.C. R.C.
α
Z
0 Z1- α
R.C.
-Z1- α 0 Z
R.C.
Nota
p − P0
Z =
P0 (1 − P0 ) N − n
n N −1
Ejemplo 6.13.
informó que la inmunización había tenido una cobertura del 50% de los niños
cobertura del programa, por lo que aplicó una encuesta a 500 niños de
Calculamos la estadística Z
p − P0 0 . 30 − 0 . 50
Z = = = − 8 . 944
P 0 (1 − P 0 ) 0 . 50 ( 0 . 50 )
n 500
Este resultado nos indica la diferencia es tan grande que es improbable que
pueda deberse al azar del muestreo, por lo que para cualquier nivel de
inmunización.
Datos:
Una muestra de tamaño n1 (x1, x2, ....., xn1) de la población 1 y una muestra de
Requisitos:
Hipótesis:
Estadística de la prueba
( x1 − x 2 )
Z =
σ 12 σ 22
+
n1 n2
Regla de decisión
α/2 α/2
Z
-Z1-α/2 0 Z1-α/2
R.C. R.C.
α
Z
0 Z1- α
R.C.
-Z1- α 0 Z
R.C.
Nota
Si las varianzas σ21, σ22 son desconocidas, entonces sólo cuando las
como
( x1 − x2 )
Z =
S 12 S 22
+
n1 n2
Ejemplo 6.14.
Un epidemiólogo desea comparar dos vacunas para la rabia. Las personas que
estándar y tamaños de las muestras para los dos grupos fueron los siguientes:
µ 1 = µ2
µ 1 ≠ µ2
calculamos
( x1 − x 2 ) 4.5 − 2.5
Z= = = 3.71
S12 S 22 ( 2.5) 2 ( 2.0) 2
+ +
n1 n2 30 49
p = 0.0001
2
3.71 Z
efectividad de las dos vacunas utilizadas para dosis de refuerzo (p < 0.001)
Datos:
Una muestra de tamaño n1 (x1, x2, ....., xn1) de la población 1 y una muestra de
Requisitos:
suponen semejantes.
Hipótesis:
Estadística de la prueba
es verdadera.
Regla de decisión
α/2 α/2
T
-t1-α/2 0 t1-α/2
R.C. R.C.
α
T
0 t1- α
R.C.
-t1- α 0 T
R.C.
Nota
( x1 − x 2 )
T =
S 12 S 22
+
n1 n2
2
S 12 S 22
n +n
v= 1 2
−2
( ) +( )
S 12
n1
2
S 22
n2
2
n1 + 1 n2 + 1
Ejemplo 6.16
Con el objeto de determinar si la privación del sueño tiene algún efecto sobre la
personas voluntarias se dividió al azar en dos grupos. Las personas del grupo
Grupo A: 10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4
Grupo B: 11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9
las hipótesis:
la privación.
µ A = µB
la privación.
µ A ≠ µB
Por ser muestras pequeñas y no contar con las varianzas poblacionales, antes
para el nivel alfa en cada grupo, se debe comprobar si estas muestras validan
luego calculamos
Varianza común
Y la estadística T
( x1 − x2) 10 . 28 − 11 . 08
T = = = − 3 . 357
1 1 1 1
S p + 0 . 284 +
n1 n2 10 10
p < 0.005
2
t (18 )
-3.357
Luego concluimos que esta muestra es una evidencia de que existe diferencia
poblacionales en el cuadro Nº 15
a) H0: µ1 - µ2 = 0 H1: µ1 - µ2 ≠ 0
b) H0: µ1 - µ2 ≤ 0 H1: µ1 - µ2 > 0
c) H0: µ1 - µ2 ≥ 0 H1: µ1 - µ2 < 0
poblaciones norma- S 2p = 1 2
c) T < -t1-α
les n1 + n 2 − 2
t-Student t(n1 + n2 -2)
( x1 − x 2 ) a) T < -t1-α/2
T =
ó T > t1-α/2
Varianzas σ21, σ22 S 12 S 22
Desconocidas y dife-
+
n1 n2 b) T > t1-α
rentes
2
S 12 S 22 c) T < -t1-α
- n1 < 30, n2 < 30 de
T poblaciones norma- n +n
1 2
v = − 2
( ) +( )
les 2 2
S 12 S 22
n1 n2
n1 + 1 n2 + 1
t-Student t(v)
azar para que reciban dos tratamientos, de tal manera que los miembros de
que una de las partes se analice mediante un método y la otra por otro método.
observaciones.
Hipótesis
d − µ d0 d − µ d0
Z= o la
T=
Sd / n Sd / n
según el cumplimiento de los requisitos, antes indicados, para la aplicación de
Ejemplo 6.17
6 237 216 21
7 326 296 30
8 235 195 40
9 240 207 33
10 267 247 20
11 284 260 24
12 209 201 8
menos 10 unidades
menos 10 unidades
d = 18.75 ; S d = 13.11
diferencias tienen distribución normal (este requisito debe ser probado con los
d − µd0 18 . 75 − 10
T = = = 2 . 312
Sd / n 13 . 11 / 12
p = 0.0206
t (11)
2.312
Datos:
población 2
Requisitos:
Hipótesis:
a) H0 : σ21 = σ22 H 1 : σ2 1 ≠ σ2 2
Estadística de la Prueba
S12
F = 2
S2
Si H0 es cierta, F tiene distribución F(n1-1, n2-1) ; donde n1 -1 y n2 – 1 son los
Regla de decisión
α/2
α/2
F
Fα⁄2 F1− α⁄2
R.C. R.C.
F
F1− α
R.C.
F
Fα
R.C.
Ejemplo 6.18
nacidos para probar si la dispersión de los pesos es la misma para los dos
Hospital 1: 3.625, 3.430, 3.000, 3.625, 3.625, 3.150, 3.360, 3.230, 3.950, 3.400
Hospital 2: 3.800, 3.500, 3.350, 3.250, 4.100, 3.900, 3.900, 4.000, 3.670, 3.600
H 0 : σ 21 = σ 22 H 1 : σ 21 ≠ σ 22
0.025
0.025
↓ F(9,9)
0.2448 0.968 4.03
R.C. F R.C.
significativa.
Ejemplo 6.19
En el ejemplo 6.16, para poder aplicar la prueba T para comparar las medias
de dos grupos, uno de los requisitos que deben cumplir los datos es que las
prueba F
Hipótesis: H 0 : σ 2 A = σ 2B H 1 : σ 2 A ≠ σ 2B
Donde:
sensorial de 10 días
B es el grupo control
Grupo A: 10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4
Grupo B: 11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9
muestreo.
Datos:
independientes. Para cada muestra los resultados pueden estar en una de dos
Requisitos:
de estar en la categoría 1.
4. Las poblaciones son infinitas (n1 ≤ 0.10 N1 y n2 ≤ 0.10 N2), es decir las
Hipótesis:
a) H0: P1 – P2 = 0 H 1: P 1 – P 2 ≠ 0
b) H0: P1 – P2 ≤ 0 H 1: P 1 – P 2 > 0
c) H0: P1 – P2 ≥ 0 H 1: P 1 – P 2 < 0
p1 − p 2
Estadística de la prueba Z=
Sp1 − p2
Z es N(0,1), si H0 es verdadera
p(1 − p ) p(1 − p )
Donde: S p1 − p2 = +
n1 n2
x1 + x2
p =
n1 + n2
muestra.
x1 x2
p1 = y p2 =
n1 n2
Regla de decisión
α/2 α/2
Z
-Z1-α/2 0 Z1-α/2
R.C. R.C.
α
Z
0 Z1- α
R.C.
-Z1- α 0 Z
R.C.
Ejemplo 6.20
de errores que tiene el niño cuando trata de reproducir nueve figuras que le han
sido mostradas).
sido:
H0: µ1 = µ2
H1: µ1 > µ2
madres adolescentes que para los hijos de madres adultas ( lo que indica un
H 0: P 1 = P 2
El porcentaje de niños que desaprobó el año escolar es igual para los hijos
H 1: P 1 > P 2
El porcentaje de niños que desaprobó el año escolar es mayor para los hijos
de madres adolescentes que para los hijos de madres adultas. (lo que indica
calculamos la estadística Z:
( x1 − x 2 ) 6.34 − 4.75
Z= = = 3.53
2
S S 2
0.38 + 0.24
2 2
+
1 2
n1 n 2
calculamos la estadística Z:
x1 + x2 8+ 3
p = = = 0 . 083
n1 + n2 59 + 73
p1 − p2 0 . 136 − 0 . 041
Z = = = 1 . 979
S p1−p2 0 . 048
Datos:
sigue:
Requisitos:
1) La muestra es aleatoria
Hipótesis:
Estadística de la prueba:
D = máxima{ Pi – pi }
Decisión:
Ejemplo 6.21.
obtenidos fueron:
Grupo A: 10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4
Grupo B: 11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9
Para que la aplicación de la prueba T sea válida debe comprobarse que las
muestras validan que la distribución de los niveles alfa, para cada grupo tiene
distribución normal
1) H0: Los registros del nivel alfa para las personas del grupo A tienen
distribución normal
H1: La distribución de los registros del nivel alfa para las personas del
2) H0: Los registros del nivel alfa para las personas del grupo B tienen
distribución normal
H1: La distribución de los registros del nivel alfa para las personas del
cada caso.
xi − x
XA pi zi = Pi = P(Z ≤ zi) Di = Pi - pi
SA
9.5 0.1 -1.30 0.095983 0.004017
9.7 0.2 -0.97 0.165967 0.034033
9.8 0.3 -0.80 0.211003 0.088997
10 0.4 -0.47 0.319755 0.080245
10.1 0.5 -0.30 0.381668 0.118332
10.2 0.6 -0.13 0.446771 0.153229
10.4 0.7 0.20 0.579547 0.120453
10.8 0.8 0.87 0.807811 0.007811
10.9 0.9 1.04 0.850164 0.049836
11.4 1 1.87 0.969503 0.030497
0.258
xi − x
XB pi zi = Pi = P(Z ≤ zi) Di = Pi - pi
SB
10.1 0.1 -2.14 0.01638 0.08362
10.8 0.2 -0.61 0.27092 0.07092
10.9 0.4 -0.39 0.34747 0.05253
11 0.5 -0.17 0.43082 0.06918
11.2 0.7 0.26 0.60312 0.09688
11.4 0.8 0.70 0.75715 0.04285
11.6 0.9 1.13 0.87137 0.02863
11.7 1 1.35 0.91161 0.08839
Luego como se aprecia, para ambos casos se acepta que la distribución de los
registros del nivel alfa tiene distribución normal, ya que las diferencias
tabla de Lilliefors.
Ejemplo 6.22.
4 260 233 27
5 228 214 14
6 237 216 21
7 326 296 30
8 235 195 40
9 240 207 33
10 267 247 20
11 284 260 24
12 209 201 8
menos 10 unidades
menos 10 unidades
d = 18.75 ; S d = 13.11
para la media, asumiéndose que las diferencias tienen distribución normal; pero
este requisito debe ser probado con los datos obtenidos, por lo que ahora
(pi) y sus probabilidades acumuladas (Pi) con el modelo normal, utilizando los
di − d
di pi zi = Pi = P(Z ≤ zi) Di = Pi - pi
Sd
-5 0.0833 -1.812 0.0350 0.0483
5 0.1667 -1.049 0.1471 0.0196
8 0.3333 -0.820 0.2061 0.0439
14 0.4167 -0.820 0.2061 0.1272
20 0.5000 -0.362 0.3585 0.0581
21 0.5803 0.095 0.5380 0.0380
24 0.6667 0.172 0.5681 0.0152
27 0.7500 0.400 0.6556 0.0111
30 0.8333 0.629 0.7354 0.0146
33 0.9167 0.858 0.8046 0.0287
40 1.0000 1.087 0.8615 0.0552
la normal estandarizada.
obtenemos
Luego entonces, como D < 0.242, no podemos rechazar la hipótesis de que las
p (Prueba bilateral) p
n .80 .90 .95 .98 .99 n .80 .90 .95 .98 .99
1 .900 .950 .975 .990 .995 21 .226 .259 .287 .321 .344
2 .684 .776 .842 .900 .929 22 .221 .253 .281 .314 .337
3 .565 .636 .708 .785 .829 23 .216 .247 .275 .307 .330
4 .493 .565 .624 .689 .734 24 .212 .242 .269 .301 .323
5 .447 .509 .563 .627 .669 25 .208 .238 .264 .295 .317
6 .410 .468 .519 .577 .617 26 .204 .233 .259 .290 .311
7 .381 .436 .483 .538 .576 27 .200 .229 .254 .284 .305
8 .358 .410 .454 .507 .542 28 .197 .225 .250 .279 .300
9 .339 .387 .430 .480 .513 29 .193 .221 .246 .275 .295
10 .323 .369 .409 .457 .489 30 .190 .218 .242 .270 .290
11 .308 .352 .391 .437 .468 31 .187 .214 .238 .266 .285
12 .296 .338 .375 .419 .449 32 .184 .211 .234 .262 .281
13 .285 .325 .361 .404 .432 33 .182 .208 .231 .258 .277
14 .275 .314 .349 .390 .418 34 .179 .205 .227 .254 .273
15 .266 .304 .338 .377 .404 35 .177 .202 .224 .251 .269
16 .258 .295 .327 .366 .392 36 .174 .199 .221 .247 .265
17 .250 .286 .318 .355 .381 37 .172 .196 .218 .244 .262
18 .244 .279 .309 .346 .371 38 .170 .194 .215 .241 .258
19 .237 .271 .301 .337 .361 39 .168 .191 .213 .238 .255
20 .232 .265 .294 .329 .352 40 .165 .189 .210 .235 .252
1.07 1.22 1.36 1.52 1 . 63
Aproximación para n > 40 n n n n n
Fuente: CONOVER, W.J. Practical Non parametric Statistics 2ed. JOHN WILEY & SONS. New
P
n 0.80 0.85 0.90 0.95 0.99
4 0.300 0.319 0.352 0.381 0.417
5 0.285 0.299 0.315 0.337 0.405
6 0.265 0.277 0.294 0.319 0.364
7 0.247 0.258 0.276 0.300 0.348
8 0.233 0.244 0.261 0.285 0.331
9 0.223 0.233 0.249 0.271 0.311
10 0.215 0.224 0.239 0.258 0.294
11 0.206 0.217 0.230 0.249 0.284
12 0.199 0.212 0.223 0.242 0.275
13 0.190 0.202 0.214 0.234 0.268
14 0.183 0.194 0.207 0.227 0.261
15 0.177 0.187 0.201 0.220 0.257
16 0.173 0.182 0.195 0.213 0.250
17 0.169 0.177 0.189 0.206 0.245
18 0.166 0.173 0.184 0.200 0.239
19 0.163 0.169 0.179 0.195 0.235
20 0.160 0.166 0.174 0.190 0.231
25 0.142 0.147 0.158 0.173 0.200
30 0.131 0.136 0.144 0.161 0.187
> 30 0.736 0.768 0.805 0.886 1.031
n n n n n
Fuente: CONOVER, W.J. Practical Non parametric Statistics 2ed. JOHN WILEY & SONS. New
Datos:
Cada observación en cada una de las muestras puede ser clasificada dentro de
Población o Característica
Grupo Categoría1 Categoría 2 .......... Categoría c Totales
1 n11 n12 .......... n1c n1
2 n21 n22 n2c n2
.........
r nr1 nr2 nrc nr
Totales C1 C2 Cc n
n = n1 + n2 + ..... + nr
Requisitos:
muestra
Hipótesis:
H1: Para 2 o más grupos hay diferente proporción de elementos en una o más
categorías
Estadística de la prueba:
X = ∑∑
r c (n − E ij )
2 r c nij
2
∑∑ E
ij
2
= −n
i = 1 j =1 E ij i =1 j = 1 ij
Donde:
P j = Cj
n
Luego a Eij = ni Cj
n
Regla de decisión:
X2
. χ 12− α
R.C.
Observaciones:
1) Si alguna de las frecuencias esperadas Eij es pequeña, la aproximación
cualquiera de las Eij es menor que 1 o si más del 20% de las Eij es
2) Si r y c no son tan pequeños, y si parece que las Eij pueden ser tan
significado.
Variable
Población Categoría 1 Categoría 2 Total
Población 1 a b N1
Población 2 c d N2
Total C1 C2 n
n(ad − bc ) 2
X =
2
n 1 n 2 C1 C 2
como:
n( ad − bc − (n / 2)) 2
X 2
corregida =
n 1 n 2 C1 C 2
citada)
Ejemplo 6.23
sanguíneo:
y no portadores.
portadores y no portadores.
calculamos la estadística X2
FRECUENCIAS ESPERADAS
r c (n − E ij ) 2 r c nij
2
72 2 62
∑∑ ∑∑
ij
X =2
= −n= + ... + − 350 = 1.6289
i =1 j = 1 E ij i =1 j =1 E ij 70 8
p = P[ χ 2( 3) ≥ 1.6289] = 0.6258
Este resultado nos indica que la diferencia encontrada no alcanza significancia
estadística y que es muy probable que se deba al azar del muestreo, por lo
grupos sanguíneos.
Gráfico 21
60%
40%
20%
0%
O A B AB
Portadores Grupo sanguíneo
No portadores
Datos:
segunda variable.
Característica Característica y
x Categoría1 Categoría 2 .......... Categoría c Totales
Categoría 1 n11 n12 .......... n1c R1
Categoría 2 n21 n22 .......... n2c R2
......... .......... .......... .......... .......... ..........
Categoría r nr1 nr2 .......... nrc Rr
Totales C1 C2 .......... Cc n
Requisitos
Hipótesis
(Es decir cada observación puede ser clasificada en una categoría de una
otra variable).
Prueba Estadística
Ri Cj
Sea E ij =
n
El número esperado de observaciones en la celda i,j , entonces la estadística
r c (n
ij − E ij )
2 r c nij
2
X2 = ∑∑
i =1 j =1 E ij
= ∑∑ E
i =1 j =1
−n
ij
Regla de decisión:
X2
χ 12− α
R.C.
Ejemplo 6.24
siguiente:
producto.
producto
prueba
FRECUENCIAS ESPERADAS
Presencia de Nivel de exposición
síntomas Alto Medio Bajo Total
Sí 143.35 49.82 41.83 235
No 161.65 56.18 47.17 265
Total 305 106 89 500
Luego, podemos concluir que estos datos son una evidencia de que la
producto.
Ejemplo 6.25
Un psicólogo clínico toma una muestra de 200 pacientes que sufren ansiedad y
Tratamiento Restablecimiento
Con terapia curados No curados Total
Tratados 140 20 160
No tratados 10 30 40
Total 150 50 200
pacientes.
Luego, podemos concluir que estos datos son una evidencia de que el
Práctica Domiciliaria 8
cascos de protección.
protección.
14.8, 14.4, 16.6, 13.8, 14.0, 17.3, 17.4, 18.6, 16.2, 14.7, 15.7, 16.4,
13.9.
108 horas por mes con desviación estándar de 12 horas. ¿Son estos datos
trabajo?
proporcionada?
normal con una media de 4.5 kilos y una desviación estándar de 0.5 kilos. Si
suspensión de un mes.
kilos?
3.7, 3.9, 3.5, 2.8, 5.1, 4.2, 4.4, 2.1, 5.5, 2.6
lagos, sospecha que cierta población estaba usando un río como basurero
disuelto.
ppm con una desviación típica de 0.5 ppm, interprete estos resultados
la ciudad.
programa.
reporte.
programa
de 8 horas?
Nº de fallas: 0 1 2 3 4 5 6 7
Nº de días: 3 8 10 9 5 3 1 1
máquina puede llenar las cajas con el peso requerido con un rango de
onzas2?
49,6 onzas y una varianza de 0,018 onzas2. ¿Considera Ud. que estos
del fabricante.
indican que ven el noticiero de las 6 p.m. ¿Es ésta evidencia suficiente
residentes en otra ciudad vecina se encuentra que 267 están a favor del
aumento del límite de velocidad. ¿Estos datos indican que existe una
de esta prueba.
empleados satisfechos con sus trabajos, y determine una cota superior para
Persona: 1 2 3 4 5 6 7 8
Anuncio 1: 1 3 2 1 2 1 3 2
Anuncio 2: 4 2 3 3 1 2 3 3
fabricante.
x S
Niños enfermos 22.5 4.1
Niños sanos 26.9 3.2
= 150 contra H1: µ > 150. Explique porque esta elección de hipótesis
17. Se planeó una encuesta para determinar que porcentaje de los estudiantes
18. Varios investigadores desean saber si pueden concluir que dos poblaciones
Población A: 9.5, 10.5, 9.0, 9.75, 10.0, 13.0, 10.0, 13.5, 10.0, 9.5, 10.0, 9.75
19. Un fabricante afirma que al menos el 95% de las piezas que ha surtido para
son defectuosas.
prueba?
México 2004
3. CONOVER, W.J. Practical Non parametric Statistics 2ed. JOHN WILEY &
COMPANY.Boston/Toronto. 1986
México. 1987
8. REFERENCIAS BIBLIOGRAFICAS
México 2004
4. CONOVER, W.J. Practical Non parametric Statistics 2ed. JOHN WILEY &
1990
México. 1987
COMPANY.Boston/Toronto. 1986
Anexo
P1 – P2 p1 (1 − p1 ) p2 (1 − p2 )
S p 1− p 2 = +
n1 n2
Elaboración del autor
Distribución de Decisión:
HIPOTESIS Requisitos Estadística La estadística Rechazar H0
de la prueba Si H0 es cierta Al nivel α si
Varianza σ2 conocida x − µ0 a) Z < -Z1-α/2 ó Z > Z1-α/2
H0: µ = µ0 -Todo n de población Normal Z= Normal b) Z > Z1-α
- n grande de cualquier población σ/ n N(0,1) c) Z < -Z1-α
a) H1: µ ≠ µ0 Varianza σ2 desconocida x − µ0 Normal a) Z < -Z1-α/2 ó Z > Z1-α/2
b) H1: µ > µ0
- n grande (n > 30) de cualquier Z = b) Z > Z1-α
población S/ n N(0,1) c) Z < -Z1-α
c) H1: µ < µ0 Varianza σ2 desconocida x − µ0 a) T < -t1-α/2 ó T > t1-α/2
- n < 30 de población Normal T= t-Student b) T > t1-α
S/ n t(n -1) c) T < -t1-α
H0: σ = σ20
2
a) X2 < χ α2 / 2 ó X2 > χ 12−α / 2
a) H1: σ2 ≠ σ20 La población es normal
(n − 1) S 2 χ (2n −1) b) X2 > χ 12−α
b) H1: σ2 > σ20 X = 2
normales S p2 = 1 2
c) T < -t1-α
n1 + n2 − 2