Está en la página 1de 331

EP

UD

FACULTAD DE CIENCIAS ECONÓMICAS Y


A
IM

EMPRESARIALES-CAMPUS LIMA
-L

PROGRAMA:
S
PU

ADMINISTRACIÓN DE EMPRESAS
M
CA

ASIGNATURA:
ESTADÍSTICA 1
CAPÍTULOS: 1, 2, 3, 4, 5, 6 y 7
E

PROFESOR:
AD

Hugo Agurto Mejı́a


-I I

LIMA - PERÚ
22

2022
20
Índice general
EP

Índice de figuras VI
UD

Índice de tablas IX

1. Introducción a la estadı́stica 1
1.1. Definición de Estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
A
1.2. Estadı́stica Descriptiva y Estadı́stica Inferencial . . . . . . . . . . . . . . . . . 2
IM

1.3. Introducción a los términos básicos . . . . . . . . . . . . . . . . . . . . . . . . 2


-L

1.4. Tipos de Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4


S

1.5. Recolección de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8


PU

1.6. Fuentes de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14


M

1.7. Problemas propuestos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15


CA

2. Estadı́stica descriptiva 35
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2. Estadı́stica descriptiva:Técnicas tabulares y gráficas . . . . . . . . . . . . . . 35
2.2.1. Resumen de datos cualitativos . . . . . . . . . . . . . . . . . . . . . . 35
2.2.1.1. Tabla de frecuencias . . . . . . . . . . . . . . . . . . . . . . . 35
2.2.1.2. Diagrama de barras y gráfica de pastel . . . . . . . . . . . . 36
2.2.1.3. Diagrama de Pareto. . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.2. Resumen de datos cuantitativos . . . . . . . . . . . . . . . . . . . . . . 40
E
AD

2.2.2.1. Datos cuantitativos no agrupados . . . . . . . . . . . . . . . 40


2.2.2.2. Tabla de frecuencias . . . . . . . . . . . . . . . . . . . . . . . 40
2.2.2.3. Diagrama de barras . . . . . . . . . . . . . . . . . . . . . . . 41
2.2.2.4. Distribución acumulada: diagrama escalonado . . . . . . . . 42
2.2.2.5. Datos cuantitativos agrupados . . . . . . . . . . . . . . . . . 42
2.2.2.6. Tabla de frecuencias . . . . . . . . . . . . . . . . . . . . . . . 42
2.2.2.7. Histograma y polı́gono . . . . . . . . . . . . . . . . . . . . . 45
2.2.2.8. Distribución acumulada: Ojiva o polı́gono acumulado “menor
-I I

que” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
22

2.3. Estadı́stica descriptiva: Técnicas o medidas numéricas . . . . . . . . . . . . . 47


20

2.3.1. Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . 47


2.3.1.1. Media o promedio aritmético . . . . . . . . . . . . . . . . . . 47
2.3.1.2. Media para datos agrupados . . . . . . . . . . . . . . . . . . 50
2.3.1.3. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

ii
ÍNDICE GENERAL iii

2.3.1.4. Mediana para datos agrupados . . . . . . . . . . . . . . . . . 53


2.3.1.5. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.3.2. Medidas de variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.2.1. Rango, amplitud o recorrido . . . . . . . . . . . . . . . . . . 56
2.3.2.2. Varianza y desviación estándar o tı́pica . . . . . . . . . . . . 56
2.3.2.3. Varianza y desviación estándar o tı́pica para datos agrupados 58
2.3.2.4. Coeficiente de variación . . . . . . . . . . . . . . . . . . . . . 58
2.3.3. Teorema de Chebyshev . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.3.4. Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
EP

2.3.4.1. Coeficiente de asimetrı́a . . . . . . . . . . . . . . . . . . . . . 61


UD

2.3.4.2. Coeficiente de curtosis . . . . . . . . . . . . . . . . . . . . . . 62


2.3.5. Medidas de posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.3.5.1. Cuartiles y percentiles . . . . . . . . . . . . . . . . . . . . . . 63
2.3.5.2. Cálculo de los percentiles (cuartiles) para datos no agrupados. 63
A
IM

2.3.5.3. Cálculo de los percentiles y cuartiles para datos agrupados . 65


2.3.5.4. Diagrama de caja-bigotes . . . . . . . . . . . . . . . . . . . . 65
-L

2.3.5.5. Puntuaciones z . . . . . . . . . . . . . . . . . . . . . . . . . . 67
S
PU

2.4. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68


M

3. Teorı́a de probabilidad 108


CA

3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108


3.2. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3.2.1. Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
3.2.2. Enfoques de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . 110
3.2.3. Conceptos importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
3.2.4. Reglas de conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
3.3. Propiedades básicas de la probabilidad . . . . . . . . . . . . . . . . . . . . . . 115
3.3.1. Ley de adición de probabilidades . . . . . . . . . . . . . . . . . . . . . 115
E

3.3.2. Ley de multiplicación de probabilidades . . . . . . . . . . . . . . . . . 117


AD

3.3.3. Teorema de la probabilidad total y Teorema de Bayes . . . . . . . . . 123


3.4. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

4. Distribución de probabilidad discreta 151


4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.2. Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.3. Distribución de probabilidad discreta o función de probabilidad . . . . . . . . 152
4.4. Función de Distribución de una variable discreta . . . . . . . . . . . . . . . . 154
-I I

4.5. Media, Varianza y desviación estándar de una distribución de probabilidad


22

discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
20

4.5.1. Propiedades del valor esperado y de la varianza de una variable


aleatoria discreta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
4.6. Distribución de probabilidad binomial . . . . . . . . . . . . . . . . . . . . . . 160
ÍNDICE GENERAL iv

4.6.1. Usando Tablas de Probabilidades Binomiales para el cálculo de


probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
4.7. Distribución de probabilidad de Poisson . . . . . . . . . . . . . . . . . . . . . 165
4.7.1. Usando Tablas de Probabilidades de Poisson para el cálculo de
probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
4.7.2. Aproximación de la distribución binomial empleando la distribución de
Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
4.8. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
EP

5. Distribución de probabilidad continua 187


UD

5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187


5.2. Función densidad de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 187
5.3. Función de Distribución Acumulada . . . . . . . . . . . . . . . . . . . . . . . 188
5.4. Valor esperado y varianza de una Variable Aleatoria Continua. . . . . . . . . 189
A
5.4.1. Propiedades de la esperanza matemática y de la varianza de una
IM

variable aleatoria continua . . . . . . . . . . . . . . . . . . . . . . . . . 189


-L

5.5. Distribución de probabilidad normal . . . . . . . . . . . . . . . . . . . . . . . 197


S
PU

5.6. Cálculo de probabilidades asociadas a una curva normal especı́fica . . . . . . 200


5.6.1. Distribución normal estándar . . . . . . . . . . . . . . . . . . . . . . . 200
M

5.6.2. Estandarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201


CA

5.6.3. Cálculo de probabilidades (áreas) con la curva normal estándar . . . . 201


5.7. Aproximación normal para la distribución binomial . . . . . . . . . . . . . . . 210
5.7.1. Factor de corrección por continuidad . . . . . . . . . . . . . . . . . . . 211
5.8. Otras distribuciones continuas importantes . . . . . . . . . . . . . . . . . . . 214
5.8.1. Distribución Uniforme Continua . . . . . . . . . . . . . . . . . . . . . 214
5.8.2. Distribución exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . 217
5.9. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

6. Distribuciones muestrales 245


E
AD

6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245


6.2. Distribuciones muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
6.3. Distribución muestral de x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
6.3.1. Caracterı́sticas de la distribución de x . . . . . . . . . . . . . . . . . . 246
6.3.2. Uso de la Distribución muestral de x en el cálculo de probabilidades . 251
6.4. Distribución muestral de p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
6.4.1. Caracterı́sticas de la distribución de p . . . . . . . . . . . . . . . . . . 257
6.4.2. Uso de la Distribución muestral de p en el cálculo de probabilidades . 258
-I I

6.5. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264


22

7. Estimación de parámetros 272


20

7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272


7.2. Estimación de intervalo para una media poblacional (µ) . . . . . . . . . . . . 273
7.3. Estimación de intervalo para una proporción poblacional (p) . . . . . . . . . . 289
ÍNDICE GENERAL v

7.4. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296

A. Tablas 303
A.1. Tabla de números aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
A.2. Tabla: Probabilidades Binomiales . . . . . . . . . . . . . . . . . . . . . . . . . 305
A.3. Tabla: Probabilidades de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 311
A.4. Distribución normal estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
A.5. Distribución t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318
EP

Bibliografı́a 321
UD

A
IM
S -L
PU
M
CA

E
AD

-I I
22
20
Índice de figuras

2.1. Distribución de frecuencias para la variable estado civil . . . . . . . . . . . . 37


EP

2.2. Gráfica de pastel para la variable estado civil. . . . . . . . . . . . . . . . . . . 38


UD

2.3. Diagrama de Pareto para las razones de no conformidad. . . . . . . . . . . . . 40


2.4. Distribución de frecuencias para el número de palabras leı́das por 120 disléxicos. 41
2.5. Diagrama escalonado: diagrama de frecuencias acumuladas del número de
palabras leı́das. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
A
IM

2.6. Histograma y polı́gono de frecuencias del Número de veces que un cliente va


al supermercado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
-L

2.7. Ojiva del Número de veces que un cliente va al supermercado. . . . . . . . . . 47


S
PU

2.8. Distribuciones con diferentes asimetrı́as o sesgos. . . . . . . . . . . . . . . . . 62


M

2.9. Distribuciones con diferentes grados de curtosis. . . . . . . . . . . . . . . . . . 63


CA

2.10. Diagrama caja-bigote de las estaturas de 15 estudiantes. . . . . . . . . . . . . 67


2.11. Notas en la segunda práctica calificada de 36 alumnos. . . . . . . . . . . . . . 100
2.12. Millas por galón de gasolina utilizadas en la conducción para modelos de autos
pequeños y vehı́culos deportivos. . . . . . . . . . . . . . . . . . . . . . . . . . 104
2.13. Duración de las canciones (en segundos) de dos conciertos. . . . . . . . . . . . 105
2.14. Cantidad de clientes que poseen los gimnasios situados en los distritos de San
Miguel y Santiago de Surco. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

3.1. Representaciones de espacio muestra del lanzamiento de dos monedas . . . . 110


E

3.2. Representación de espacio muestra del lanzamiento de dos dados . . . . . . . 111


AD

3.3. Diagrama de árbol del lanzamiento de dos monedas o de lanzar una moneda
dos veces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3.4. Partición del espacio muestral S . . . . . . . . . . . . . . . . . . . . . . . . . . 123
3.5. Partición del aula en alumnos de segundo año, cuarto año y graduados . . . . 124
3.6. Diagrama de árbol para problema de clase de estadı́stica avanzada . . . . . . 125
3.7. Diagrama de árbol para problema de urnas A, B y C . . . . . . . . . . . . . . 125

4.1. Función de probabilidad de X:Número de puntos obtenidos . . . . . . . . . . 153


-I I

4.2. Función de probabilidad de Y:Número de puntos obtenidos al lanzar dado


22

cargado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
20

4.3. Función de probabilidad de X:Número de caras obtenidas al lanzar 3 veces


una moneda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
4.4. Función de distribución de X:Número de puntos obtenidos al lanzar un dado 156

vi
ÍNDICE DE FIGURAS vii

5.1. Gráfica de la Función de distribución de X pedida en 1b). . . . . . . . . . . . 191


5.2. Gráfica de la Función de distribución de X pedida en 3b). . . . . . . . . . . . 195
5.3. Curva normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
5.4. Curvas normales con diferentes medias e igual desviación estándar. . . . . . . 199
5.5. Curvas normales con igual media y diferente desviación estándar. . . . . . . . 199
5.6. Curvas normales con diferente media y desviación estándar. . . . . . . . . . . 199
5.7. Áreas bajo la curva comunmente utilizadas para cualquier distribución normal. 200
5.8. Curva normal estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
5.9. P (0 ≤ Z ≤ zc ) proporcionada por la tabla que aparece en el Apéndice A.4. . 202
EP

5.10. Ilustración del cálculo de probabilidades con la tabla de áreas bajo la curva
UD

normal estándar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203


5.11. Ilustración del cálculo de P (2 ≤ X ≤ 5) para X ∼ N (3, 4) . . . . . . . . . . . 204
5.12. Ilustración del cálculo de a) P (X ≤ 10000) y b) P (X ≥ 10000) para X ∼
N (10000, 15002 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
A
5.13. Ilustración del cálculo de P (12000 < X < 15000) para X ∼ N (10000, 15002 ).
IM

205
5.14. Ilustración del cálculo de P (X < 1) para X ∼ N (1.5, 0.252 ). . . . . . . . . . 206
-L

5.15. Ilustración del cálculo de P (X > 17) para X ∼ N (20, 22 ). . . . . . . . . . . . 207


S
PU

5.16. Ilustración del cálculo de a) P (24 < X < 54) y b) P (X > 39) para X ∼
N (45, 122 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
M

X > 51) para X ∼ N (45, 122 ). . . . 209


CA

5.17. Ilustración del cálculo de P (X < 30 o


5.18. Ubicación de los valores X = 50 y X = 70 para que se cumpla que
P (X ≤ 70) = 0.75 y P (X ≤ 50) = 0.30. . . . . . . . . . . . . . . . . . . . . . 210
5.19. Aproximación normal a la binomial con n=200 y p=0.4. Se muestra la
probabilidad de que al menos 75 clientes paguen con tarjeta de crédito. . . . 213
5.20. Aproximación normal a la binomial con n=200 y p=0.4. Se muestra la
probabilidad de que menos de 70 clientes paguen con tarjeta de crédito. . . . 214
5.21. Aproximación normal a la binomial con n=200 y p=0.4. Se muestra la
probabilidad de que entre 68 y 73 clientes, inclusive, paguen con tarjeta de
E

crédito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
AD

5.22. Función de densidad de X con distribución uniforme en el intervalo [a, b]. . . 215
5.23. Función de distribución acumulada de una variable aleatoria X con distribu-
ción uniforme en el intervalo [a, b]. . . . . . . . . . . . . . . . . . . . . . . . . 216
5.24. Función de densidad de X con distribución exponencial con parámetro λ = 0.5.218
5.25. Función de de distribución acumulada de la variable X con distribución
exponencial con parámetro λ = 0.5. . . . . . . . . . . . . . . . . . . . . . . . . 218

6.1. Proceso para realizar inferencias acerca de la media de la población, µ, a partir


-I I

de la media de una muestra, x, tomada de dicha población de estudio. . . . . 246


22

6.2. Distribución de probabilidad de las medias muestrales del ejemplo dado. . . . 248
20

6.3. Aplicación del Teorema del lı́mite Central para diferentes poblaciones.(Lind
et al., 2012) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
 
6.4. Ilustración del cálculo de P X > 181 para X ∼ N 178, 22 . . . . . . . . . . 252
 
6.5. Ilustración del cálculo de P 175 < X < 181 para X ∼ N 178, 22 . . . . . . 253
ÍNDICE DE FIGURAS viii

 
6.6. Ilustración del cálculo de P X < 58 para X ∼ N 60, 1.52 . . . . . . . . . . 255
 
6.7. Ilustración del cálculo de P 57 < X < 63 para X ∼ N 60, 1.52 . . . . . . . 256

6.8. Ilustración del cálculo de P (p > 0.50) para p ∼ N 0.52, 0.0292 . . . . . . . . 260

6.9. Ilustración del cálculo de P (0.15 < p < 0.25) para p ∼ N 0.20, 0.042 . . . . . 262
6.10. Ilustración de P (p1 < p < p2 ) = 0.95 . . . . . . . . . . . . . . . . . . . . . . . 262
6.11. Ilustración de P (p1 < p < p2 ) = 0.95 y definición de Z2 = 1.96 y por simetrı́a
Z1 = −1.96 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263

7.1. Ilustración sobre el nivel de confianza en la distribución muestral de x. . . . . 274


EP

7.2. Comparando la distribución normal estándar (Z) y la distribución t. . . . . . 283


7.3. Ilustración sobre el nivel de confianza en la distribución muestral de p. . . . . 291
UD

A
IM
S -L
PU
M
CA

E
AD

-I I
22
20
Índice de tablas

1.1. Operaciones apropiadas en los niveles o escalas de medición. . . . . . . . . . . 8


EP

1.2. Agrupación de las 352 empresas de acuerdo con su rendimiento porcentual


UD

sobre el capital. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3. Número seleccionado de una muestra aleatoria estratificada proporcional. . . 12

2.1. Distribución de frecuencias del estado civil de las personas encuestadas. . . . 36


A
2.2. Tabla de resumen para construir el diagrama de Pareto. . . . . . . . . . . . . 39
IM

2.3. Distribución de frecuencias del número de palabras leı́das por 120 disléxicos. . 41
-L

2.4. Distribución de frecuencias acumuladas del número de palabras leı́das. . . . . 42


S
PU

2.5. Distribución de frecuencias de datos agrupados considerando la marca de clase


de la variable:Número de veces que un cliente compra en el Supermercado
M

Plaza Lima. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
CA

3.1. Miles de usuarios de internet según el sexo en una ciudad . . . . . . . . . . . 122

4.1. Distribución de probabilidad de X:Número de puntos obtenidos al lanzar un


dado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
4.2. Valores seleccionados de la tabla de probabilidad binomial para el caso n=6,
x=2, p=0.05 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
4.3. Valores seleccionados de la tabla de probabilidad binomial para n=8, p=0.30
y x=3,4,5,6,7,8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
E

4.4. Valores seleccionados de la tabla de probabilidad binomial para n=8, p=0.30


AD

y x=0,1,2,3,4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
4.5. Valores seleccionados de la tabla de probabilidad de Poisson para λ = 6 y
x=0,1,2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

5.1. Casos de probabilidades binomiales y cómo aplicar el factor de corrección por


continuidad al utilizar la aproximación normal. Recuerde que a, b y c son
números enteros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
-I I

6.1. Las 16 muestras posibles de tamaño igual a 2 tomadas de la población de 4


valores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
22
20

7.1. Valores de “Z” para los niveles de confianza de uso común. . . . . . . . . . . 274
7.2. Extracto de la Tabla de Distribución t. En el Apéndice A.5 aparece una versión
más extensa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285

ix
ÍNDICE DE TABLAS x

7.3. Resumen de casos para realizar la estimación de intervalo para una media
poblacional (µ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
EP
UD

A
IM
S -L
PU
M
CA

E
AD

-I I
22
20
Capı́tulo 1

Introducción a la estadı́stica
EP
UD

1.1. Definición de Estadı́stica


La estadı́stica está expuesta muy a menudo en la vida diaria. Por ejemplo, considere las
siguientes afirmaciones:
A
IM

El Instituto Nacional de Estadı́stica e Informática (INEI) dio a conocer que, en el año


2021, el Índice de Precios al Consumidor de Lima Metropolitana aumentó en 6,43 %,
-L

variación superior a las registradas en los últimos trece años.


S
PU

En noviembre de 2021, el volumen de exportación de productos no tradicionales


M

aumentó en 12,3 % al compararlo con similar mes del año anterior.


CA

Una reciente investigación de IBM establece que el 64 % de los directores de marketing


estarán usando Inteligencia Artificial en los próximos dos años.

El 61 % de los peruanos es digital y el 43 % se conecta todos los dı́as, según un estudio


de Opinión realizado el último año.

La región de América Latina y el Caribe reanudó el crecimiento económico en 2021,


pero la reactivación de los mercados laborales fue limitada y se basó en gran medida
en el trabajo informal, dando como resultado un desempleo del 10 %, que disminuirı́a
E

a 9,3 % en 2022 y a 8,8 % en 2023, de acuerdo con la Organización Internacional del


AD

Trabajo (OIT).

La región de América Latina, África y Medio Oriente de General Motors, estableció un


nuevo récord anual de ventas, con un millón 235 mil 913 unidades vendidas durante el
año pasado.

En nuestro dı́a a dı́a es común relacionar la estadı́stica con información numérica que
resume o explica determinado contexto económico, social, etc; o también con conjuntos de
-I I

datos (entendiendo los datos como informaciones provenientes de observaciones, conteos,


22

medidas o respuestas). La Estadı́stica debe ser comprendida como una ciencia y como tal
20

se ocupa de la recopilación, organización, análisis e interpretación de datos para la toma de


decisiones. En los negocios, una razón básica para esa recopilación, organización, análisis e
interpretación de datos, es proporcionar a quienes toman decisiones una mejor comprensión
del entorno comercial y económico.

1
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 2

1.2. Estadı́stica Descriptiva y Estadı́stica Inferencial


La estadı́stica puede dividirse a grandes rasgos en dos partes: descriptiva e inferencial.

La estadı́stica descriptiva es la parte de la estadı́stica que involucra a la organización,


el resumen y representación de un conjunto de datos. Como generalmente se estudian
poblaciones muy grandes, este conjunto de datos suele ser una muestra. Aunque los
métodos de la estadı́stica descriptiva son importantes para caracterizar y presentar los
datos, el desarrollo de los métodos de estadı́stica inferencial -basado en las teorı́as de
probabilidad- es lo que llevó a la aplicación amplia de la estadı́stica en todos los campos
EP

de la investigación en la época actual.


UD

La estadı́stica inferencial es la parte de la estadı́stica que implica el uso de una muestra


para llegar a conclusiones válidas sobre una población. La estadı́stica inferencial emplea
métodos que hacen posible la estimación de una caracterı́stica de una población a partir
A
de los datos de una muestra extraı́da de la población analizada. Una herramienta básica
IM

en el estudio de la estadı́stica inferencial es la probabilidad. Es de esperarse que al


-L

obtener las conclusiones sobre la población siempre exista una pequeña probabilidad
S

de error pues la inferencia es inductiva (Angulo, 2011).


PU
M

1.3. Introducción a los términos básicos


CA

Para comenzar a estudiar estadı́stica primero es necesario definir y tener claro algunos
términos básicos (Johnson y Kuby, 2008):

1. Población o Universo: Es el conjunto de individuos, objetos, eventos, datos o


elementos cuyas propiedades serán analizadas. Dos aspectos importantes aquı́ son: que
en todo momento debe quedar muy claro qué elementos conforman la población a
estudiar y además aunque es común entender que el universo pueda estar conformado
solo por personas es posible que en otras situaciones la población pueda estar
conformada por objetos, animales o mediciones.
E
AD

Cuando se hace un levantamiento o recolección de datos sobre una determinada


población, es decir, contemplando cada uno de sus elementos, tenemos lo que se llama
un censo.
La población puede ser según su tamaño de dos tipos: Población finita, cuando el
número de elementos que la forman es finito, por ejemplo, el número de alumnos del
Campus Lima, el número de alumnos de un grupo de clase o los libros de la biblioteca de
la universidad; y Población infinita, cuando el número de elementos que la forman
es ilimitado, o tan grande que pudiese considerarse ilimitado, como por ejemplo, el
-I I

número de personas que podrı́an tomar aspirina o la producción de focos de 40 watts


22

que serán producidos por General Electric.


20

Debido a que las poblaciones suelen ser muy grandes, un objetivo común del uso de la
estadı́stica es obtener datos de una muestra para estudiarlos y emplear los resultados
para sacar una conclusión acerca de la población de la cual se extrajo la muestra.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 3

2. Muestra: Es un subconjunto o parte de la población. Una muestra consta de los


individuos, objetos o medidas seleccionados de la población, de tal forma que refleje
las caracterı́sticas de ésta. Una muestra debe ser representativa de una población para
que sus datos pueden usarse para sacar conclusiones (estimar caracterı́sticas) de la
población de la cual fue tomada.

3. Variable (o variable respuesta): Caracterı́stica de interés sobre cada elemento


individual de una población o muestra. Por ejemplo; la edad de una persona que labora
en una empresa, su estado civil, su estatura y su peso son cuatro variables.
EP

4. Dato: Valor de la variable asociada a un elemento de una población o muestra. Este


UD

valor puede ser un número, una palabra o un sı́mbolo. Por ejemplo, Roberto Jiménez
que labora en una empresa tiene 35 años, su estado civil es casado, mide 1.70 m y pesa
76 kg. Estas cuatro piezas de datos son los valores de las cuatro variables aplicadas a
Roberto Jiménez.
A
IM

5. Datos: Conjunto de valores recolectados para la variable de cada uno de los elementos
-L

que pertenece a la muestra. Por ejemplo el conjunto de 50 estaturas recolectadas de


S

una muestra de 50 estudiantes es un ejemplo de un conjunto de datos.


PU
M

6. Experimento: Actividad planeada cuyos resultados producen un conjunto de datos. El


CA

experimento incluye las actividades para seleccionar los elementos y obtener los valores
de los datos.

7. Parámetro: Es una medida de resumen que describe una caracterı́stica de toda una
población (o un valor numérico que resume o describe a todos los datos de una
población). Por ejemplo, la edad promedio de los estudiantes universitarios en el Perú
o la proporción de votantes que apoyarán al candidato del partido A en las próximas
elecciones, son ejemplos de dos parámetros poblacionales. A menudo se utiliza una
letra griega para simbolizar la denominación de un parámetro. Estos sı́mbolos serán
E

asignados a medida que se estudien los parámetros más adelante (por ejemplo: µ
AD

se emplea para simbolizar el promedio poblacional, σ para la desviación estándar


poblacional, etc).
Para todo parámetro existe un estadı́stico muestral correspondiente. El estadı́stico
describe a la muestra de la misma manera que el parámetro describe a la población.

8. Estadı́stico: Es una medida de resumen que se calcula para describir una caracterı́stica
de una muestra (o un valor numérico que resume o describe a todos los datos de una
muestra). Por ejemplo, la estatura promedio encontrada al utilizar el conjunto de 30
-I I

estaturas recolectadas o la proporción de votantes, en una muestra de 100 personas,


22

que apoyarán al candidato del partido A en las próximas elecciones son ejemplos de
20

estadı́sticos. Casi todos los estadı́sticos se determinan con ayuda de fórmulas y suele
asignárseles denominaciones simbólicas usando letras del alfabeto español (por ejemplo:
x, se emplea para simbolizar el promedio en una muestra; “s” para la desviación
estándar en una muestra, etc.)
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 4

Ejemplo. Un estudiante de estadı́stica está interesado en determinar algo sobre el valor


promedio (en dólares) de los automóviles que pertenecen al cuerpo docente de la universidad.
Identifique en esta situación cada uno de los ocho términos recientemente descritos.

1. La población es la colección de todos los automóviles que pertenecen a todos los


miembros del cuerpo docente de la universidad.

2. Una muestra es cualquier subconjunto de esa población. Por ejemplo, una muestra
podrı́an ser los automóviles que pertenecen a los profesores del programa de
administración de empresas.
EP
UD

3. La variable es el “valor en dólares” de cada automóvil individual.

4. Un dato podrı́a ser el “valor en dólares” de un automóvil en particular. El automóvil


del profesor Flores, por ejemplo, está valuado en 13400 dólares.
A
5. Los datos serı́an el conjunto de valores que corresponden a la muestra obtenida (13400,
IM

. . . , etc.).
-L
S

6. El experimento serı́an los métodos aplicados para seleccionar los automóviles que
PU

integren la muestra y determinar el valor de cada automóvil de la muestra. Podrı́a


M

efectuarse preguntando a cada profesor del programa de administración de empresas,


CA

o de otras formas.

7. El parámetro sobre el que se está buscando información es el valor “promedio” de todos


los automóviles de la población.

8. El estadı́stico que encontrará es el valor promedio de todos los automóviles de la muestra


elegida.

NOTA: Si se toma una segunda muestra, quizá el conjunto de elementos seleccionados


serı́a diferente, por ejemplo los automóviles de los profesores del programa de ingenierı́a,
E

y entonces para el estadı́stico promedio se anticiparı́a un valor diferente. Sin embargo, el


AD

valor promedio de “todos los autos que pertenecen al cuerpo docente de la universidad” no
cambiarı́a. Esto ayuda a entender que el valor de los parámetros es fijo, mientras que el de
los estadı́sticos varı́a.
Ejercicio. 36 % de la población adulta en el Perú padece una alergia. En una muestra de
1200 adultos se encontró que 32 % tiene una alergia. Describa cada uno de los ocho términos.
1.4. Tipos de Variables
Continuando con los conceptos, veamos la clasificación de las variables según su
-I I

naturaleza. Básicamente hay dos clases de variables:


22
20

Variable Cualitativa o categórica: Variable que clasifica o describe un ele-


mento de una población o muestra. Se dice que estas variables no pueden ex-
presarse numéricamente o solo pueden tener un número limitado de valores dis-
tintos o categorizados. Ejemplo: profesión, color de ojos, sexo, estado civil, etc.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 5

De una muestra de 4 clientes de un gimnasio se obtuvo la siguiente informa-


ción: ¿posee automóvil?, distrito en el que vive y “nivel de satisfacción con res-
pecto al servicio”. Las tres variables son ejemplos de variables cualitativas (atri-
butos) ya que describen alguna caracterı́stica de la persona, y todas las perso-
nas con el mismo atributo pertenecen a la misma categorı́a. Los datos recolecta-
dos fueron: {si, no, si, si}, {San Borja, Santiago de Surco, M iraf lores, San Borja} y
{satisf echo, muy satisf echo, algo satisf echo, muy satisf echo}. NOTA: Algunas ope-
raciones aritméticas, como sumar y promediar, no tienen sentido para datos que resultan
de una variable cualitativa.
EP

Variable Cuantitativa o numérica: Variable que cuantifica un elemento de una


UD

población o muestra. Este tipo de variable produce respuestas numéricas, como la


estatura (en centı́metros), el peso (en Kg.) o el “gasto semanal” de fotocopias (en
soles) de cada estudiante son ejemplos de variables cuantitativas (numéricas). De una
A
muestra de 4 alumnos se obtuvieron los datos siguientes: {1.60m, 1.63m, 1.68m, 1.68m},
IM

{60kg, 64kg, 65kg, 70kg} y {40 soles, 55 soles, 65 soles, 70 soles}. Por ejemplo, para
-L

encontrar el “peso promedio” de la muestra, simplemente se suman los cuatro valores


S

y el resultado se divide entre cuatro: (60+64+65+70)/4=64.75 kg. NOTA: Algunas


PU

operaciones aritméticas, como sumar y promediar, tienen sentido para datos que
M

resultan de una variable cuantitativa.


CA

Cada uno de estos tipos de variables (cualitativas y cuantitativas) puede subdividirse aún
más, como se aprecia a continuación:
E
AD

Las variables cualitativas se subdividen en dos clases:

Variable Nominal: Variable cualitativa que categoriza (describe o identifica) un


elemento de una población o muestra. Los datos o valores de una variable nominal
no poseen un orden o jerarquı́a natural entre sı́.
-I I

En la encuesta anterior a cuatro clientes de un gimnasio, las variables “¿posee


22

automóvil?” y el “distrito en que vive” son ejemplos de variables nominales pues en


20

ambas, sus valores son cualidades o atributos que no tienen un orden o jerarquı́a entre
sı́.

Variable Ordinal: Variable cualitativa cuyos valores presentan o poseen un orden


natural o jerarquı́a inherente.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 6

En la encuesta anterior de cuatro clientes de un gimnasio, la variable “nivel de


satisfacción” es un ejemplo de variable ordinal, ya que sus valores poseen un orden
implı́cito o natural. Otros ejemplos de estas variables podrı́an ser: nivel educativo de
una persona, grado de infección de una herida, etc.

Las variables cuantitativas o numéricas también pueden subdividirse en dos clases:

Variable Discreta: Variable cuantitativa que puede asumir un número contable


de valores. Esta variable produce respuestas numéricas que surgen de un conteo.
Intuitivamente, la variable discreta puede asumir los valores correspondientes a puntos
EP

aislados a lo largo de un intervalo o rango. Es decir, entre dos valores cualesquiera hay
UD

un “hueco”.

Variable Continua: Variable cuantitativa que puede asumir una cantidad incontable
de valores. Esta variable produce respuestas numéricas que surgen de una medición.
A
Intuitivamente, la variable continua puede asumir cualquier valor a lo largo de un
IM

intervalo o rango, incluyendo cualquier valor posible entre dos valores cualesquiera.
-L

Como se ha comentado en muchos casos es posible distinguir los dos tipos de variables
S
PU

decidiendo si las variables están relacionadas con un conteo o con una medición. La variable
“número de cursos en los que un alumno está matriculado actualmente” es un ejemplo de
M

variable discreta; sus valores se encuentran al contar el número de cursos matriculados. Al


CA

contar, no es posible que ocurran valores fraccionarios. Otros ejemplos son: el número de hijos
de una familia, número de televisores vendidos en una semana, número de clientes atendidos
en una hora, etc. La variable “peso de un cargamento” o “la estatura de una persona” son
ejemplos de variables aleatorias continuas pues los valores se encuentran midiendo el peso o
la estatura. Al medir, puede ocurrir cualquier valor en un rango continuo o intervalo, según la
precisión del instrumento de medición. Por ejemplo, la estatura de una persona puede ser 167
cms, 167,5 cms, 167,58 cms o 167,584 cms, dependiendo de la precisión de los instrumentos
que están disponibles. En teorı́a, dos personas no podrı́an tener exactamente la misma
E

estatura, porque cuanto más refinado es el instrumento de medición que se utiliza, aumenta la
AD

posibilidad de detectar la diferencia entre las mediciones. Sin embargo, la mayor parte de los
dispositivos de medición no tienen la precisión suficiente para detectar pequeñas diferencias.
Por tanto, muchas veces se obtienen observaciones empatadas en los datos experimentales o
en encuestas, aun cuando la variable aleatoria es en realidad continua.
Cuando intente determinar si una variable es continua o discreta, recuerde analizar la
variable y piense en los valores que podrı́a ocurrir. No considere los valores de los datos que
se han registrado; pueden ser engañosos.
Considere la variable “calificación asignada por un juez” en una competencia de patinaje
-I I

artı́stico. Si se consideran algunas calificaciones que ya han sido asignadas: 9.9; 9.5; 8.8;
22

10.0, y observa la presencia de cifras decimales, podrı́a pensarse que todas las fracciones son
20

posibles y concluir que la variable es continua. Sin embargo, esto no es cierto. Una calificación
de 9.134 no es posible; ası́, entre los valores posibles hay huecos y la variable es discreta.
NOTA: No deje que la apariencia de los datos lo engañe respecto a su tipo. Las variables
cualitativas no siempre son fáciles de reconocer. Algunas veces se presentan como números.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 7

La muestra anterior de distrito donde vive puede codificarse como: 1= San Borja, 2=Santiago
de Surco, 3 = Miraflores. Los datos de la muestra se verı́an como 1, 2, 3, 1, aunque siguen
siendo datos de atributos. Calcular el “distrito promedio” [(1+2+3+1)/4=1.75] carece de
sentido. Los distritos de residencia pueden identificarse usando códigos postales. El código
postal promedio tampoco tiene sentido; en consecuencia, el código postal también serı́a una
variable cualitativa.
Otro ejemplo de información engañosa es un número de identificación. Por ejemplo, el
DNI, número de vuelo: 256, número de cuenta de ahorros, parecen ser datos numéricos. El
256 no describe ninguna propiedad del vuelo: si está retrasado o a tiempo, la calidad del
EP

refrigerio servido, el número de pasajeros o cualquier cosa sobre el vuelo. El número solo
UD

identifica un vuelo especı́fico. Los números de licencias de conducir, DNI, seguro social, las
cuentas bancarias, son todos, números de identificación y por sı́ mismos no funcionan como
variables cuantitativas, si no como cualitativas.
Recuerde revisar la variable individual y un dato individual, y ası́ tendrá poca dificultad
A
IM

de distinguir entre variables cualitativas y cuantitativas. Para fines del análisis estadı́stico, la
diferencia que distingue a lo cualitativo de lo cuantitativo es que las operaciones aritméticas
-L

ordinarias sólo tienen sentido con los datos cuantitativos. Por ejemplo, cuando los datos son
S
PU

cuantitativos, sus valores se pueden sumar y después dividir entre la cantidad de valores
para calcular el valor promedio de ellos. Este promedio tiene sentido y, por lo general, se
M
CA

interpreta con facilidad. Sin embargo, cuando se registran datos cualitativos en forma de
valores numéricos, esas operaciones aritméticas producen resultados sin importancia.
Niveles o Escalas de Medición.
Otra clasificación de las variables es según su nivel de medición, donde una variable
puede ser: nominal, ordinal, de intervalo o de razón. La escala o nivel de medición determina la
cantidad de información contenida en los datos. Cuando se aplica la estadı́stica a problemas
reales, el nivel de medición de los datos ayuda a decidir qué procedimientos o métodos
estadı́sticos son apropiados para los datos.
Algunos autores explican esa clasificación haciendo referencia a otra forma de clasificar
E

los datos. Siguiendo Triola (2018) o Lind et al. (2012) tenemos las siguientes definiciones.
AD

El nivel nominal es la escala más elemental. Se caracteriza por datos que consisten
únicamente en nombres, etiquetas o categorı́as. Los datos carecen de un orden natural. Las
observaciones acerca de una variable con este nivel de medición sólo se clasifican y se cuentan.
A veces, para una mejor comprensión de lectura, estos conteos se convierten en porcentajes.
Ejemplos de variables con este nivel de medición pueden ser: Estado civil (Soltero, casado,
viudo, divorciado), Género (Masculino, femenino), Ciudad de Nacimiento de una persona o
preguntas de una encuesta que permiten respuestas “Sı́” o “No”, etc.
El nivel ordinal, es el nivel inmediato superior al nominal. Este nivel se caracteriza
-I I

por datos que además de exhibir las propiedades de los datos nominales también pueden
22

colocarse en cierto orden o tienen un orden inherente o natural. Ejemplos de variables con este
20

nivel de medición pueden ser: Calificación asignada en un curso (A=Muy bueno, B=Bueno,
C=promedio, D=malo, E=muy malo), Grado de escolaridad (Primaria, secundaria, técnico,
universitario, etc), Preferencia a la compra de un producto (siempre, frecuentemente,
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 8

ocasionalmente, nunca), Nivel socio-económico, Grado de desnutrición de la población


infantil, Calificar una experiencia con un “9” en una escala de 1 a 10 nos indica que fue
mejor que una experiencia calificada con un “6”, etc.
El nivel de intervalo es el nivel inmediato superior y se caracteriza por datos que exhiben
todas las caracterı́sticas del nivel ordinal, pero además las diferencias entre los valores de los
datos es significativa o tiene sentido. Los datos en este nivel no tienen un punto de inicio o
cero natural que exprese ausencia de lo que está siendo medido. Algunos autores coinciden
en decir que el “cero” en este nivel es relativo o arbitrario. Ejemplos de variables con este
nivel de medición pueden ser: La temperatura de un cuerpo en una escala de grados Celsius
EP

o Farenheit, el cociente intelectual de un individuo, etc.


UD

El nivel de razón, es el nivel o escala más alta y se caracteriza por datos que tienen
todas las propiedades de los datos de intervalo y además la razón o proporción de dos valores
es significativa. Los datos en este nivel tienen un cero natural que expresa ausencia de lo que
está siendo medido. Ejemplos de escalas de razón son la edad, peso, estatura, salario, precio,
A
IM

volumen de ventas, número de teléfonos celulares que posee una persona, etc.
La Tabla 1.1 resume cuáles operaciones son apropiadas en cada uno de los cuatro niveles
-L

o escalas de medición. Cuando identifique el nivel de medición de un conjunto de datos, use


S
PU

el nivel más alto que sea apropiado.


M

Nivel de Categorizar Ordenar Diferencias Razones o proporciones


CA

medición los datos los datos entre datos entre datos


Nominal Si No No No
Ordinal Si Si No No
Intervalo Si Si Si No
Razón Si Si Si Si

Tabla 1.1: Operaciones apropiadas en los niveles o escalas de medición.


E

1.5. Recolección de datos


AD

Uno de los primeros problemas que enfrentan quienes se dedican a la estadı́stica es


la obtención de datos. Los datos no ocurren simplemente: es necesario recolectarlos. Es
importante obtener “buenos datos” porque en última instancia las inferencias efectuadas
se basan en las estadı́sticas obtenidas a partir de los datos. Estas inferencias sólo pueden
ser tan buenas como lo sean los datos. Aunque es relativamente fácil definir “buenos datos”
como datos que representen con exactitud a la población de la cual se tomaron, no es fácil
garantizar que un método particular de muestreo produzca “buenos datos”. Se desea usar
-I I

métodos de muestreo (recolección de datos) insesgados.


22

A pesar de que sólo se debe llamar muestra a un conjunto de datos representativos del
20

universo, se suele clasificar las muestras en: no probabilı́sticas y probabilı́sticas.


La muestra no probabilı́stica es aquella cuyos elementos se eligen sin tomar en cuenta
su probabilidad de ocurrencia. La muestra no probabilı́stica no es un producto de un proceso
de selección aleatoria, es decir, puede dar lugar a una muestra que no sea representativa del
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 9

universo del cual fue extraı́da. En muchos casos dichos elementos se eligen con base en el
juicio o criterio del investigador (muestreo intencional u opinático). Como las muestras no
probabilı́sticas eligen a sus participantes sin conocer o tomar en cuenta sus probabilidades de
selección (y en algunos casos los participantes se autoseleccionan (muestreo voluntario)), no
se puede aplicar la teorı́a que se desarrolla para el muestreo probabilı́stico. Muchas compañı́as
realizan encuestas dando a los visitantes de su página de Internet la oportunidad de llenar
encuestas y entregarlas en forma de una respuesta electrónica. La respuesta a estas encuestas
puede proporcionar grandes cantidades de datos en poco tiempo, pero la muestra se compone
de usuarios de Internet que son seleccionados en forma automática. Para muchos estudios
EP

sólo se dispone de una muestra no probabilı́stica como una muestra subjetiva. En estos
UD

casos, la opinión de un experto en la materia es crucial para poder usar los resultados
obtenidos y realizar cambios en un proceso. Otros procedimientos comunes de muestreo no
probabilı́stico son el muestreo por cuotas (tı́picamente utilizado en estudios de mercado y
de opinión pública), el muestreo por grupos naturales, muestreo bola de nieve, etc. Éstos se
A
IM

analizan con detalle en libros especializados en métodos de muestreo.


Emplear muestras no probabilı́sticas tiene algunas ventajas como son conveniencia,
-L

rapidez y bajo costo. Por otro lado, hay dos desventajas importantes: falta de precisión
S
PU

debido al sesgo en la selección y falta de capacidad para generalizar los resultados, que
superan con mucho a las ventajas. En consecuencia, el uso de los métodos de muestreo no
M
CA

probabilı́stico se restringirá a situaciones en las que sólo se desea obtener aproximaciones de


bajo costo para satisfacer la curiosidad acerca de un tema especı́fico, o en estudios iniciales
de pequeña escala o estudios piloto que precederán a investigaciones más rigurosas.
Generalmente, cuando se hace una investigación, se extraen muestras probabilı́sticas, por
razones evidentes, ya que es la única forma de hacer inferencias estadı́sticas correctas a partir
de una muestra.
Se dice que una muestra es probabilı́stica cuando cada elemento del universo tiene una
probabilidad conocida de ser seleccionado en la muestra. Una muestra probabilı́stica puede
ser: aleatoria simple, sistemática, estratificada, o por conglomerados.
E

Se denomina muestra aleatoria simple a aquella que es seleccionada de tal forma que
AD

cada elemento de la población tiene la misma oportunidad o probabilidad de ser seleccionado.


Además, cada muestra de un tamaño n tiene la misma probabilidad de ser elegida que
cualquier otra del mismo tamaño. Esta es la técnica de muestreo aleatorio más elemental y
constituye la base para las otras técnicas. Un buen método para conseguir esto consiste en
enumerar previamente todos los elementos que conforman el universo, y, empleando números
aleatorios (ver Tabla de números aleatorios al final de este texto, Apéndice A.1), seleccionar
la muestra del tamaño deseado.
Por ejemplo si deseamos estudiar las caracterı́sticas socio económicas de los estudiantes
-I I

de una pequeña escuela de niños que tiene una población de 320 estudiantes y quisiéramos
22

seleccionar una muestra aleatoria simple de 45 estudiantes de esta población, procederı́amos


20

como sigue: primero se enumera a los estudiantes del 001 hasta 320. Luego mediante el
uso de una tabla de números aleatorios (que como su nombre lo indica estos números han
sido generados por un proceso aleatorio) se cumple que para cada dı́gito de un número, la
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 10

probabilidad de 0, 1, 2,. . . , 9 es la misma. Ası́ la probabilidad que el estudiante asignado con


el número 022 sea elegido es la misma que el estudiante asignado con el número 219, etc. Por
lo tanto queda eliminado ası́ el sesgo.
Las tablas de números aleatorios se caracterizan por dos aspectos que las hacen
particularmente útiles para el muestreo al azar. Una caracterı́stica es que los dı́gitos están
ordenados de tal manera que la probabilidad de que aparezca cualquiera en un punto
dado de una secuencia es igual a la probabilidad de que ocurra cualquier otro. La otra
es que todas las combinaciones de igual número de dı́gitos tienen la misma probabilidad de
ocurrir. Estas dos condiciones satisfacen los requisitos necesarios para el muestreo aleatorio,
EP

establecidos anteriormente. La primera condición significa que en una secuencia de números,


UD

1
la probabilidad de que aparezca cualquier dı́gito en cualquier punto de la secuencia es 10 .
La segunda condición significa que todas las combinaciones de dos dı́gitos son igualmente
probables, del mismo modo que todas las combinaciones de tres dı́gitos, y ası́ sucesivamente.
Volviendo a nuestro ejemplo, primero elegimos un número aleatorio de la tabla, que será el
A
IM

inicio (cualquier punto de comienzo servirá). Supongamos que elegimos el número 22368 (fila
2), como solo hay 320 estudiantes se utilizaran los tres primeros dı́gitos del número aleatorio
-L

de cinco cifras. De modo que 223 es el primer estudiante seleccionado en la muestra. A fin
S
PU

de seguir seleccionando se puede ir en cualquier dirección, siempre tomando grupos de tres


cifras, hasta completar los 45 estudiantes que conformarán la muestra.
M
CA

Cuando la población es muy grande y/o heterogénea, resulta muy difı́cil y costoso
conseguir la lista o marco poblacional actualizado de todos los elementos de la población. Por
ejemplo para estudiar la distribución del ingreso familiar en el distrito de Surco con base a una
muestra aleatoria simple, necesitaremos en principio, una lista o censo poblacional actualizado
de todas las familias residentes de dicho distrito, la cual no siempre está disponible. Por esta
razón, el muestreo aleatorio simple no resulta ser el procedimiento más común en la práctica.
Sin embargo, es importante prestar atención a este diseño muestral por dos razones:

1. Porque muchos de los diseños muestrales mas elaborados usan el muestreo aleatorio
simple en algún aspecto de su diseño y por lo tanto comprender el muestreo aleatorio
E
AD

simple es esencial para entender tales diseños.

2. Porque muchos procedimientos no aleatorios son diseñados para simular el muestreo


aleatorio simple en muchos aspectos.

Como se dijo, si el universo es de gran tamaño, puede resultar muy engorroso el muestreo
aleatorio simple pues se necesitarı́a mucho tiempo y/o dinero. Por eso una alternativa
al muestreo aleatorio simple es el muestreo sistemático. Para obtener una muestra
sistemática, primero se divide el tamaño de la población N entre el tamaño de la muestra
-I I

N
deseado n, y el resultado obtenido, k = , se redondea al entero más cercano, en caso de que
22

n
k no resulte ser entero. Luego, para obtener la muestra sistemática procedemos ası́: Elegimos
20

al primer elemento de la muestra entre los primeros k elementos de la lista poblacional usando
muestreo aleatorio simple y los otros elementos de la muestra se escogen cada k elementos a
partir del elemento seleccionado inicialmente. Ası́ k indicará, si cada décimo, cada onceavo,
o cada centésimo elemento en la población va a ser seleccionado.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 11

Supóngase que una población está constituida por los 884 empleados de una empresa
comercial. Se desea seleccionar una muestra de 52 empleados de esa población. Según el
884
muestreo sistemático debemos calcular k, osea k = = 17, luego usando muestreo aleatorio
52
simple elegimos al primer empleado que conformará la muestra entre los 17 primeros de la
lista y a partir de allı́ cada 17 se van seleccionando los otros elementos de la muestra, hasta
completar 52 empleados. Si al llegar hasta el número final no se ha completado entonces se
sigue contando regresando al inicio de la lista.
Veamos otro ejemplo sencillo. Supóngase seleccionar una muestra sistemática de 45
estudiantes de la lista de 45,000 estudiantes en una universidad. Entonces el valor de k es
EP

1000. Luego usando muestreo aleatorio simple elegimos al primer estudiante que conformará la
UD

muestra entre los 1000 primeros de la lista. Supongamos que el elegido fue el alumno numerado
con 583. Entonces los estudiantes numerados con 583, 1583, 2583 y ası́ sucesivamente hasta
completar 45 estudiantes, conformarán la muestra deseada.
En una muestra estratificada, primero se dividen los N individuos o elementos de la
A
IM

población en L subpoblaciones separadas (N1 , N2 , . . . , , NL ), o estratos, de acuerdo con


alguna caracterı́stica común. Estas subpoblaciones (estratos) no se superponen y juntas
-L

forman la totalidad de la población, es decir: N1 + N2 + . . . + NL = N . De cada estrato


S
PU

se extrae una muestra, y por tanto la muestra final estará compuesta por el conjunto de estas
submuestras.
M
CA

El muestreo estratificado tiene la ventaja en algunos casos, de reflejar con mayor precisión
las caracterı́sticas de la población. Pero su costo de obtención es mayor que en una muestra
aleatoria simple del mismo tamaño, ya que la estratificación implica el trabajo adicional de
clasificar a la población en diversos estratos.
En el muestreo estratificado hay dos conceptos a tener en cuenta:

1. Estratificación: El criterio a seguir en la formación de los estratos será formarlos de tal


manera que haya la máxima homogeneidad en relación a la variable de estudio dentro
de cada estrato y la máxima heterogeneidad entre los estratos. Para poder estratificar
E

debe contarse con información disponible y con la estructura de la población y además


AD

las variables utilizadas en la estratificación deben estar correlacionadas con la variable


objeto de estudio.

2. Afijación: Reparto del tamaño de la muestra en los diferentes estratos. Existen varios
criterios de afijación entre los que destacamos:

a) Afijación uniforme o simple; todos los estratos tienen el mismo número de


elementos en la muestra.
b) Afijación proporcional; cada estrato tiene un número de elementos en la muestra
-I I

proporcional a su tamaño.Es decir, el muestreo proporcional requiere que el


22

número de elementos en cada estrato tenga la misma proporción que se encuentra


20

en la población.

Veamos el siguiente ejemplo extraı́do de Lind et al. (2012). Suponga que el objetivo de
un estudio consiste en determinar si las empresas con altos rendimientos sobre el capital
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 12

(una medida de rentabilidad) gastan en publicidad la mayor parte del dinero ganado que las
empresas con un registro de bajo rendimiento o déficit. Considere que la población consta
de 352 empresas. Para asegurar que la muestra a elegir sea una representación imparcial de
las 352 empresas, éstas se deben agrupar de acuerdo con su rendimiento porcentual sobre el
capital como se aprecia en la Tabla 1.2.

Estrato Probabilidad Número de


(Recuperación de capital) Empresas
1 30 % a más 8
EP

2 De 20 % a 30 % 35
UD

3 De 10 % a 20 % 189
4 De 0 % a 10 % 115
5 Déficit 5
A
IM

Tabla 1.2: Agrupación de las 352 empresas de acuerdo con su rendimiento porcentual sobre el capital.
-L

Ahora determinemos el porcentaje de cada estrato en la población y por medio de afijación


S
PU

proporcional asignamos el número de compañı́as de cada estrato en la muestra, como se


M

aprecia en la Tabla 1.3.


CA

Estrato Probabilidad Número de %total Número


(Recuperación de capital) Empresas muestreado
1 30 % a más 8 2 1
2 De 20 % a 30 % 35 10 5
3 De 10 % a 20 % 189 54 27
4 De 0 % a 10 % 115 33 16
5 Déficit 5 1 1
E

Total 352 100 50


AD

Tabla 1.3: Número seleccionado de una muestra aleatoria estratificada proporcional.

Si aplicara el muestreo aleatorio simple, observe que las empresas del tercero y cuarto
estratos tienen una probabilidad alta de que se les seleccione (87 %), mientras que las empresas
de los demás estratos tienen menos (13 %). Podrı́a no seleccionar ninguna de las empresas
que aparecen en los estratos 1 o 5 sencillamente por azar. No obstante, el muestreo aleatorio
estratificado garantizará que por lo menos una empresa de los estratos 1 o 5 aparezca en la
-I I

muestra. Considere una selección de 50 compañı́as para llevar a cabo un estudio minucioso.
22

Entonces, como se aprecia en la Tabla 1.3, se seleccionará de forma aleatoria 1 (2 % de


20

50) empresa del estrato 1; 5 (10 % de 50), del estrato 2, etc. En este caso, el número
de empresas en cada estrato es proporcional al porcentaje del estrato en la población. El
muestreo estratificado ofrece la ventaja de que, en algunos casos, refleja con mayor fidelidad
las caracterı́sticas de la población que el muestreo aleatorio simple o el muestreo aleatorio
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 13

sistemático.
Por tanto, en algunos casos, el muestreo estratificado es más eficiente que el muestreo
aleatorio simple o el sistemático, porque garantiza la representación de individuos o elementos
de toda la población, lo que asegura una mayor precisión en las estimaciones de los parámetros
(poblacionales) fundamentales. Lo que proporciona la precisión, una vez combinados los
estratos, es la homogeneidad de individuos o elementos dentro de cada estrato.
En una muestra conglomerada, se dividen los N individuos o elementos de la
población en varios conglomerados, de manera que cada conglomerado sea representativo
de la población completa (un conglomerado es un subconjunto de la población que, en
EP

términos generales, posee una variabilidad parecida a la del global de dicha población respecto
UD

al carácter que estamos estudiando: podrı́a decirse que un conglomerado es una copia en
pequeño de la población). Después, se obtiene una muestra aleatoria de los conglomerados
y se estudian todos los individuos o elementos dentro de cada conglomerado seleccionado.
Los conglomerados pueden ser asignaciones naturales, como condados, distritos electorales,
A
IM

manzanas, edificios de departamentos o familias, escuelas, hospitales, etc.


Por ejemplo, supóngase que se quiere realizar una investigación en la que se trata de
-L

conocer el grado de satisfacción laboral de los profesores de institutos tecnológicos. Ante la


S
PU

dificultad de acceder individualmente a los profesores de todos los institutos tecnológicos se


decide seleccionar una muestra por conglomerados. Es decir a la población de profesores de
M
CA

institutos se les divide por institutos (esos son los conglomerados). Como hemos decidido
que necesitamos una muestra de 700 profesores y sabiendo que el número de profesores
por instituto es aproximadamente de 35, los pasos a seguir para conseguir la muestra
conglomerada serı́an los siguientes:

1. Recoger un listado de todos los institutos.

2. Asignar un número a cada uno de ellos.

3. Elegir por muestreo aleatorio simple o sistemático los 20 institutos (700/35=20) que
nos proporcionarán los 700 profesores que necesitamos.
E
AD

Los métodos de muestreo conglomerado pueden ser más eficientes (con relación a sus
costos) que los métodos de muestreo aleatorio simple, sobre todo si la población en cuestión
se encuentra esparcida en una vasta región geográfica. Sin embargo, los métodos de muestreo
conglomerado tienden a ser menos eficientes que los métodos de muestreo aleatorio simple o
de muestreo estratificado, y necesitan una muestra total más grande para obtener resultados
tan precisos como los que se obtienen con los procedimientos más eficientes.
Como conclusión, es conveniente tener en cuenta que el tipo de muestra que se debe
emplear depende de lo que se va a investigar, y para seleccionar ésta adecuadamente, en caso
-I I

que el universo sea grande y complicado, conviene estudiar con mucho más detalle la Teorı́a
22

del Muestreo.
20

La necesidad de uso de los métodos de estadı́stica inferencial se deriva de la necesidad


del muestreo. A medida que una población crece, por lo general resulta demasiado costoso,
tardado y tedioso obtener información de toda la población. Las decisiones respecto a las
caracterı́sticas de la población deben basarse en la información que está contenida en una
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 14

muestra de esa población. La teorı́a de probabilidad proporciona el vı́nculo al determinar la


posibilidad de que los resultados de la muestra reflejen los resultados de la población.
1.6. Fuentes de datos.
Para poder llevar a cabo un estudio estadı́stico de una población, primero se debe tener
muy claro qué se quiere analizar para recolectar los datos adecuados. Ahora, la recolección
se puede hacer recurriendo a diversas fuentes. En términos generales, las fuentes de donde
se obtienen los datos pueden clasificarse en primarias o secundarias. Primarias, mediante
la observación o realización de experimentos, encuestas o cuestionarios. Las Secundarias,
EP

como las bases de datos ya existentes, por ejemplo, la del Instituto Nacional de Estadı́stica
e Informática (INEI), Banco Central de Reserva del Perú (BCRP), etc.
UD

Por tanto como se ha comentado una fuente para recopilar datos es la experimentación.
En un experimento se ejerce un control estricto sobre los tratamientos; por ejemplo, en un
estudio para verificar la efectividad de un detergente para ropa, el investigador determinará
A
qué marcas son más efectivas para limpiar ropa manchada al lavar las prendas en lugar de
IM

preguntar a los consumidores cuál marca es la mejor. En general, los diseños experimentales
-L

adecuados son temas de estudio a niveles más avanzados, pues con frecuencia involucran
S

procedimientos estadı́sticos elaborados.


PU

También una manera de recopilar datos es realizando una encuesta. En ella no se ejerce
M

control sobre el comportamiento de las personas que se investigan. Sólo se hacen preguntas
CA

sobre sus creencias, actitudes, comportamiento y otras caracterı́sticas. Las respuestas se


editan, codifican y tabulan para su análisis.
Otro método para recopilar datos consiste en realizar un estudio observacional. Un
investigador observa el comportamiento, de manera directa, casi siempre en el entorno
natural. La mayor parte del conocimiento sobre la conducta de los animales se ha desarrollado
de esta manera, al igual que los conocimientos cientı́ficos en muchos campos, como en
astronomı́a y geologı́a, donde la experimentación y las encuestas son impracticables o
imposibles.
E

Los estudios observacionales se presentan en formas muy variadas en las empresas; todos
AD

están diseñados para recopilar información en un medio grupal, y ayudar en el proceso de


toma de decisiones. Como ejemplo, el grupo focal es una herramienta bastante conocida en
la investigación de mercado, se aplica para obtener respuestas no estructuradas a partir de
preguntas abiertas: un moderador conduce la discusión y todos los participantes responden
a las preguntas. Otros formatos más estructurados, que involucran dinámicas de grupo para
obtener información (y llegar a un consenso) incluyen varios métodos de psicologı́a industrial
y del comportamiento organizacional, como son la lluvia de ideas, la técnica Delphi y el
método de grupo nominal. Estas herramientas se han popularizado en los últimos años
-I I

debido al impacto de la filosofı́a de administración de la calidad total (TQM, Total Quality


22

Management) en las empresas. TQM hace hincapié en la importancia del trabajo en equipo
20

y el empowerment de los empleados, en un intento por mejorar cada producto o servicio.


Para diseñar un experimento, aplicar una encuesta o realizar un estudio por observación,
se deben comprender los distintos tipos de datos y niveles de medición.
La internet, no cabe duda se ha convertido también en una fuente importante de datos
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 15

e información estadı́stica. Casi todas las empresas mantienen sitios web que proporcionan
información general sobre la empresa, ası́ como datos sobre ventas, número de empleados,
número de productos, precios de productos y especificaciones de productos. Además, varias
compañı́as ahora se especializan en hacer que la información esté disponible a través de
Internet. Como resultado, uno puede obtener acceso a cotizaciones de acciones, precios de
comidas en restaurantes, datos de salarios y una variedad casi infinita de información.
Por último otra forma importante de obtener datos es consultar las fuentes gubernamen-
tales, industriales o individuales. De estas tres fuentes, el gobierno es el principal recopilador
de datos. La mayorı́a de las entidades gubernamentales que recopilan y procesan datos tam-
EP

bién hacen que los resultados estén disponibles a través de un sitio web. Existen también
UD

entidades privadas y publicaciones que se encargan de recopilar datos para realizar estudios
estadı́sticos de grupos o sectores especı́ficos.
1.7. Problemas propuestos.
A
1. Clasifique las siguientes variables según su naturaleza:
IM

a) ¿Posee Ud. licencia de conducir?


S -L

b) El número de televisores que hay en una casa.


PU

c) La marca de jabón de tocador que emplean en una familia.


M

d ) El peso que una persona ha perdido el mes pasado luego de seguir una dieta
CA

rigurosa.
e) La frecuencia de aplicación de protectores solares antes de exponerse al sol
(siempre, a menudo, algunas veces, rara vez, nunca).
f ) Lugar de procedencia
g) Número de teléfono
h) Profesión
i ) Nivel socioeconómico
E

j ) Placa de un auto
AD

k ) Número de créditos en los que se ha matriculado en el presente semestre.


l ) Marca del auto que maneja.
m) Temperatura del aire en grados Fahrenheit a las 2 de la tarde de un dı́a cualquiera.
n) El tiempo de vuelo de un avión que se desplaza entre Lima y Bogotá.
ñ) Preferencias polı́ticas (izquierda, derecha o centro).
o) Marcas de cerveza.
-I I

Km
p) Velocidad en
22

h
20

q) El peso en Kg.
r ) Nivel educativo (primario secundario, superior).
s) Tipo de enseñanza (privada o pública).
t) Número de empleados de una empresa.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 16

u) La temperatura de un enfermo en grados Celsius.


Nw
v ) La presión de un neumático en
cm2
2. Describa con sus propias palabras y proporcione un ejemplo de cada uno de los
siguientes términos. Sus ejemplos deben ser distintos a los proporcionados en este texto.

a) Variable d ) Población g) Muestreo probabilı́stico


b) Datos e) Estadı́stico h) Muestreo no proba-
c) Muestra f ) Parámetro bilı́stico
EP
UD

3. Suponga que la cafeterı́a del Campus vende jugos de fruta natural en tres presentaciones
o tamaños: pequeño, mediano y grande. Explique por qué el tamaño del jugo es una
variable categórica o cualitativa.
A
4. Suponga que se ha obtenido la siguiente información entre los estudiantes que salı́an
IM

de la biblioteca del Campus Lima la semana previa a exámenes parciales:


S -L

a) Gasto en fotocopias. f ) ¿Posee una laptop?


PU

b) Número de libros consultados. g) ¿Cómo califica el servicio en la bibliote-


M

c) Tiempo a la semana dedicado para leer ca?


CA

libros. h) Número de asignaturas en las que se


d ) Programa académico. matriculó en el semestre actual.
e) Género

Clasifique cada variable como cualitativa o cuantitativa. Si es cuantitativa, determine


si es discreta o continua. Si es cualitativa, determine si es nominal u ordinal.

5. Para una población de N =902, verifique cuántas filas de la tabla de números aleatorios
del Apéndice A.1 son necesarias para obtener una muestra de tamaño n=30 sin
E
AD

reemplazo. El punto de inicio debe ser en fila 5-columna 1, hacia la derecha y de


manera seguida)

6. ¿Cuál es la diferencia entre muestra y población?

7. ¿Cuál es la diferencia entre un estadı́stico y un parámetro?

8. ¿En qué difieren la estadı́stica descriptiva y la inferencia estadı́stica?

9. ¿Cuál es la diferencia entre muestreo probabilı́stico y muestreo no probabilı́stico?


-I I

10. ¿Cuál es la diferencia entre una muestra estratificada y una muestra conglomerada?
22
20

11. ¿Cuál es la diferencia entre una variable aleatoria discreta y una continua?¿y la
semejanza?

12. ¿Cuál es la diferencia entre muestreo con reemplazo y muestreo sin reemplazo?
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 17

13. Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase, se
utiliza en cada uno de los siguientes ejercicios:

a) Un economista estudia el efecto de la educación en el salario, y realiza una encuesta


a 150 trabajadores seleccionados al azar de cada una de estas categorı́as: estudios
menores que la secundaria, grado de escuela secundaria, estudios de mayor grado
que la secundaria.
b) Una universidad, motivada por un estudiante que murió en estado de ebriedad,
realizó una investigación de estudiantes que beben seleccionando aleatoriamente
EP

10 diferentes salones de clase y entrevistando a todos los estudiantes en cada uno


UD

de estos grupos.

14. Un laboratorio farmacéutico desea conocer la proporción de personas cuya hipertensión


puede ser controlada con un nuevo producto fabricado por ellos. Al realizar un estudio
A
en 10240 individuos hipertensos se encontró que 70 % de ellos pudo controlar su
IM

hipertensión utilizando el nuevo medicamento. Suponiendo que esas 10240 personas


-L

son representantes del grupo de hipertensos. Defina en términos del problema, cuál es:
S
PU

a) La población bajo estudio


b) La muestra
M
CA

c) La variable de interés y su tipo según naturaleza


d ) El parámetro y su valor
e) El estadı́stico y su valor

15. En el siguiente enunciado identifique (y sustente) qué variable (o variables) tienen


nivel de medición de intervalo: Para un pescador es importante el número de peces
capturados, la especie y el peso del pez.

16. El departamento de inscripciones desea calcular el costo de los libros de texto que
E

utilizan los estudiantes de la universidad. El plan es seleccionar aleatoriamente a 100


AD

estudiantes y preguntarles el costo total de todos los libros adquiridos en el último


semestre. El costo promedio de los 100 estudiantes será utilizado para estimar el costo
promedio para todos los estudiantes. Defina en términos del problema cuál es:

a) La población c) La variable que se debe medir

b) La muestra (indique además el ta- d ) El parámetro


maño) e) El estadı́stico
-I I

17. El encargado de deportes de la Universidad de Piura, Campus Lima, desea estimar la


22

resistencia media muscular de las estudiantes del campus. Para tal fin, el encargado,
20

realizó una investigación en un laboratorio midiendo la resistencia muscular a cada


una de las 120 estudiantes elegidas aleatoriamente de entre los diferentes programas,
encontrando que el puntaje de resistencia media muscular de dichas estudiantes fue de
140. Defina en términos del problema cuál es:
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 18

a) La población d ) El parámetro
b) La muestra
c) La variable de interés. e) El estadı́stico

18. Un fabricante de medicamentos veterinarios está interesado en la proporción de


animales que padecen infecciones locales cuya condición puede ser controlada por
un nuevo producto desarrollado por la empresa. Se condujo un estudio en el que
participaron 5000 animales que padecen infecciones locales y se encontró que 80 % de
los animales pueden controlar la infección con el medicamento. Suponiendo que los 5000
EP

animales son representativos del grupo de animales con infecciones locales, conteste las
UD

siguientes preguntas:

a) ¿Cuál es la población? d ) Defina el estadı́stico y proporcione su


b) ¿Cuál es la muestra? valor
A
IM

c) Defina el parámetro de interés e) ¿Se conoce el valor del parámetro?


S -L

19. Determine cuál de los niveles de medición es el más apropiado para la variable de
PU

interés, en los siguientes casos:


M

a) Los pesos de las mujeres que juegan fulbito en un campeonato.


CA

b) Las temperaturas actuales, en grados Celsius, en los salones de clase del campus
lima.
c) La clasificación del hábito de fumar como: fumador ligero, fumador moderado,
fumador intenso.
d ) El número de respuestas “sı́” recibidas cuando se les preguntó a 1250 conductores
si habı́an usado alguna vez un teléfono celular mientras conducı́an.
e) El credo religioso de un grupo de personas.
E

f ) La actitud de los limeños hacia la discriminación medida en una escala de (1 =


AD

desfavorable) hasta (5 = muy favorable).

20. Se realizó un estudio para conocer la prevalencia en el consumo de alcohol en los


estudiantes universitarios. La encuesta fue realizada en Lima entrevistándose a 315
estudiantes. Dentro de los resultados se evidenció que la edad promedio de inicio en el
consumo de bebidas alcóholicas era de 13 años, el número promedio de dı́as a la semana
en que se consume alcohol fue de 2, el 57.46 % manifiesta que suelen consumir alcohol
en bares cercanos a su centro de estudios. Defina en términos del problema:
-I I

a) La(s) variable(s) de interés y su tipo según naturaleza.


22

b) El(los) estadı́stico(s) y su(s) valor(es).


20

c) El(los) parámetro(s) y su(s) valor(es).

21. Clasifique cada variable como cualitativa (nominal u ordinal) o cuantitativa (discreta
o continua).
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 19

a) Calificación de un examen (Desaprobado, Aprobado, Notable, Sobresaliente)


b) Precio cotizado de las acciones de la empresa “A”.
c) Nacionalidad de los clientes.
d ) Tiempo dedicado a las tareas domésticas por los hombres y las mujeres que
trabajan fuera del hogar.
e) Colores de carrocerı́a de automóviles.
f ) Grado de enfermedad o lesión (leve, reservado, grave, muy grave)
EP

g) Número de celulares que posee una familia.


UD

h) Altura del tallo de 250 plantas


i ) Cantidad de vehı́culos que llegan en un dı́a por el peaje al Sur.
j ) El diámetro de las ruedas de varios autos.
A
k ) Sensación térmica (muy frı́o, frı́o, templado, caliente, muy caliente)
IM

l ) Cantidad de precipitación diaria en un poblado (mm3 )


-L

m) Distancia de una estrella cualquiera del cosmos al sistema solar, en años luz.
S
PU

n) Nombres de establecimientos.
M

ñ) Opinión sobre una propuesta polı́tica (muy en contra, en contra, indiferente, a
CA

favor, muy a favor)


o) Número de pacientes atendidos.
p) Número de teléfono.
q) Partido polı́tico por el que votarás en las próximas elecciones municipales.
r ) Número de palabras en una determinada página de un libro.
s) Raza.
t) Calidad de imagen de un televisor.
E

u) Tiempo de vida de una baterı́a.


AD

v ) Grado de infección de una herida ( “leve”, “moderado”, “grave”).

22. Las tiendas a nivel nacional dedicadas a la comercialización de artefactos eléctricos han
encargado realizar un estudio con la finalidad de obtener algunos indicadores. El estudio
se realizó tomando una muestra de 60 tiendas obteniéndose los siguientes resultados:

La utilidad neta promedio por artefacto vendido es de 5 dólares.


El 80 % de los artı́culos vendidos corresponden a la denominación “lı́nea blanca”.
-I I

Promedio de devolución: 2 artı́culos trimestralmente debido a fallas técnicas.


22
20

Defina en términos del problema, cuál es:

a) La población bajo estudio.


b) La muestra.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 20

c) La(s) variable(s) de interés y su tipo según naturaleza.


d ) El(Los) parámetro(s) y su(s) valor(es).
e) El(Los) estadı́stico(s) y su(s) valor(es).

23. Encuentre un artı́culo o un anuncio en un periódico o una revista, que ejemplifique el


uso de la estadı́stica.

a) Identifique y describa un estadı́stico reportado en el artı́culo.


b) Identifique y describa la variable relacionada con el estadı́stico del inciso (a).
EP

c) Identifique y describa el muestreo relacionado con el estadı́stico del inciso (a).


UD

d ) Identifique y describa la población de la cual se tomó la muestra del inciso (a).

24. Determine y sustente cuál de los niveles de medición es el más apropiado para la variable
de interés en los siguientes casos:
A
IM

a) El puntaje obtenido en un test psicológico para la medición de actitudes.


-L

b) Litros de agua consumidos por una persona al dı́a.


S
PU

c) Calidad de vida en una ciudad.


M

d ) ¿Ha consumido bebidas hipertónicas? (si, no).


CA

25. La empresa Aventis Pharmaceuticas realizó un estudio para medir los efectos colaterales
de Allegra, un medicamento que se utiliza en el tratamiento de alergias estacionales.
A un grupo de 679 personas que sufren alergias en EEUU se les administraron 60 mg
del medicamento dos veces al dı́a. Los pacientes informaron si durante ese periodo
experimentaron, o no, alivio de sus alergias, ası́ como si experimentaron cualquier
otro efecto colateral adverso (infección viral, náusea, somnolencia, etc). Fuente: Good
Housekeeping, febrero de 2005, p. 120.

a) ¿Cuál es la población bajo estudio?


E
AD

b) ¿Cuál es la muestra?
c) ¿Cuáles son las caracterı́sticas (variables) de interés acerca de cada uno de los
elementos de la población?
d ) Los datos recolectados, ¿son cualitativos (¿de qué tipo?) o cuantitativos (¿de qué
tipo?)?

26. Responda lo siguiente, expresándose adecuadamente:

a) Investigue y responda: ¿Cuál es la diferencia fundamental entre el nivel de medición


-I I

de intervalo y el nivel de medición de razón? De 1 ejemplo de cada caso.


22
20

b) ¿Qué es una muestra no probabilı́stica? ¿Cuáles son sus ventajas y desventajas?


c) Las tablas de números aleatorios se caracterizan por dos aspectos que las
hacen particularmente útiles para el muestreo aleatorio ¿Cuáles son esas dos
caracterı́sticas?
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 21

27. Identifique cuál de los tipos de muestreo vistos en clase, se utiliza en cada uno de los
siguientes ejercicios:

a) Un reportero de noticias de canal Zeta pretende conocer la reacción a una historia


triste entrevistando a las personas que van pasando frente a su estudio.
b) Ud. obtiene una lista de 42763 propietarios de automóviles y desea elegir una
muestra de propietarios para entrevistarlos, seleccionando cada 100-ésimo nombre
en esa lista.
c) En una encuesta de 1059 adultos, los sujetos entrevistados fueron seleccionados
EP

mediante el uso de una computadora, para generar aleatoriamente los números


UD

telefónicos a los que se llamó.


d ) La Superintendencia de Administración Tributaria dividió todos los automóviles
registrados en categorı́as de subcompacto, compacto, mediano, intermedio y
A
grande. Se encuestó a 200 propietarios de automóviles de cada categorı́a.
IM

e) Una ejecutiva de marketing de General Motors encontró que su departamento de


-L

relaciones públicas acababa de imprimir sobres con los nombres y direcciones de


S

todos los propietarios de un Corvette. Ella quiere hacer una prueba piloto de la
PU

nueva estrategia de mercadotecnia, ası́ que enumera todos los sobres y ayudada
M

de una tabla de números aleatorios, obtiene un grupo de muestra sacando 50 de


CA

esos sobres.
f ) En un operativo de sobriedad de la policı́a se detenı́a y entrevistaba a cada quinto
conductor.
g) Una empresa encuestadora está planeando realizar una encuesta de salida en que
se elegirán aleatoriamente 100 locales electorales y se entrevistará a todos los
votantes conforme vayan saliendo de los locales.
h) Un investigador de una universidad encuesta a todos los pacientes del área de
cardiologı́a en cada uno de 30 hospitales seleccionados al azar.
E
AD

i ) Un experto en marketing está planeando una encuesta para MTV, en la cual 500
personas se elegirán aleatoriamente de cada grupo de edades de 10 a 19, 20 a 29,
etc.

28. En el siguiente enunciado identifique: población, muestra, variable(s), tipo de


variable(s), Defina el(los) parámetro(s) y proporcione su(s) valor(es), Defina el(los)
estadı́stico(s) y proporcione su(s) valor(es): El dı́a 12/12/2012 en el aeropuerto Jorge
Chávez se hizo un estudio en el área de salidas internacionales, en el cual se encuestó
a 150 personas obteniéndose los siguientes resultados:
-I I
22

El 20 % de pasajeros es peruano.
20

La edad promedio de los pasajeros es de 29.3 años.


El 20 % dijo que el servicio en el aeropuerto era bueno.
En promedio cada pasajero llevaba 1.5 maletas.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 22

El costo promedio de un pasaje en avión es $126.50.


El tiempo de espera promedio antes de subir al avión es de 1.8 horas.

29. Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase, se
utiliza en el siguiente ejercicio: El sistema de cómputo de un gran hospital contiene
registros para 30 000 pacientes. Los registros están numerados del 1 al 30 000. Se
obtuvo una muestra de los registros, seleccionando a los pacientes cuyos números son
100, 200, 300,. . . , 30 000, obteniéndose ası́ una muestra de 300 enfermos.
EP

30. Conteste Verdadero(V) o Falso (F):


UD

a) La estadı́stica descriptiva permite hacer proyecciones o estimaciones acerca de la


población de la cual procede.
b) Un parámetro es una medida calculada de alguna caracterı́stica de una población.
A
c) Abrir una caja de manzanas y contar las que están en mal estado es un ejemplo
IM

de dato numérico continuo.


-L

d ) En una muestra aleatoria simple todos los elementos de la población tiene la misma
S

posibilidad de ser seleccionados.


PU
M

31. Suponga que el número de resfriados que una persona cualquiera contrae
CA

durante el invierno es una variable de interés en un estudio. Determine y sustente


(expresándose en términos del contexto), cuál de los niveles (o escalas) de medición es
el más apropiado para dicha variable de interés

32. Una empresa dedicada a la fabricación de conservas de pescado tiene planeado


introducir al mercado conservas de trucha. Para ello le encargó a una empresa
investigadora de mercado la realización de un estudio mediante el que le interesaba
averiguar, entre otras cosas, la aceptación del nuevo producto y el precio que
las personas estarı́an dispuestas a pagar. La encuesta fue realizada en Lima y se
E

entrevistaron a 250 personas. De los encuestados, el 67 % estarı́an dispuestos a consumir


AD

el nuevo producto. Además se concluyó que el precio del producto deberı́a oscilar entre
1,50 y 2,5 soles. Determinar:

a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) La(s) variable(s) y su(s) respectivo(s) tipo(s) y nivel(es) de medición.
d ) Defina el(los) parámetro(s) de interés y proporcione su(s) valor(es)
-I I

e) Defina el(los) estadı́stico(s) de interés y proporcione su(s) valor(es)


22

33. Un empresario tiene la idea de implementar la venta de chicha morada en envase no


20

retornable en la ciudad de Iquitos. Para ello realiza un estudio de factibilidad y el 90 %


de los 250 encuestados, está dispuesto a consumir el nuevo producto. También obtuvo
información acerca de la utilidad que lograrı́a obteniendo un promedio de 1.5 soles de
utilidad por producto. Determinar:
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 23

a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) La(s) variable(s) y su(s) respectivo(s) tipo(s) y nivel(es) de medición.
d ) Defina el(los) parámetro(s) de interés y proporcione su(s) valor(es)
e) Defina el(los) estadı́stico(s) de interés y proporcione su(s) valor(es)

34. Determine y sustente (expresándose en términos del contexto), cuál de los niveles (o
escalas) de medición es el más apropiado para la variable de interés siguiente: Cantidad
EP

de accidentes producidos por semana, en la fábrica de una conocida empresa.


UD

35. Una empresa realiza una encuesta sobre el uso de cajeros automáticos por parte de los
habitantes del distrito de San Martı́n de Porres. De las 1200 personas encuestadas se
tiene la siguiente información:
A
El 60 % usa la red de cajeros Unibanca.
IM

La edad promedio de los encuestados fue 38 años.


-L

El 72 % afirmó que únicamente los utiliza para retirar dinero.


S
PU

El 5 % de los encuestados afirmó haber sido asaltado al utilizar el cajero.


M
CA

a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) La(s) variable(s) y su(s) respectivo(s) tipo(s) y nivel(es) de medición.
d ) Defina el(los) parámetro(s) de interés y proporcione su(s) valor(es)
e) Defina el(los) estadı́stico(s) de interés y proporcione su(s) valor(es)

36. En una prueba de aptitud conformada por 25 preguntas, 4 son de cultura general. A
un alumno se le asignarán 18 preguntas al azar para que haga una tarea. Si se define
E

como variable de interés el número de preguntas de cultura general que se le


AD

asignan al alumno. Determine y sustente (expresándose en términos del contexto),


cuál de los niveles (o escalas) de medición es el más apropiado para dicha variable de
interés.

37. La SUNAT hace una auditorı́a para verificar si las tiendas de abarrotes en el distrito de
San Juan de Lurigancho entregan boleta de venta a sus clientes y para tal fin selecciona
aleatoriamente a 100 de dichas tiendas encontrando que el 65 % de ellas entregaban
boleta de venta. Defina en términos del problema:
-I I

a) ¿Cuál es la población bajo estudio?


22

b) ¿Cuál es la muestra?
20

c) La(s) variable(s) de interés y su tipo según naturaleza.


d ) El(Los) parámetro(s) y su(s) valor(es).
e) El(Los) estadı́stico(s) y su(s) valor(es).
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 24

38. En el siguiente enunciado identifique (y sustente) qué variable (o variables) tienen nivel
de medición de intervalo: Para el jefe de agencia de un banco es importante el número
de clientes atendidos al dı́a, el grado de satisfacción de los clientes hacia la atención
recibida y la cantidad de dinero que un cliente mantiene mensualmente en su cuenta.

39. Un comunicólogo (estudioso de la comunicación) desea estimar el porcentaje de


televidentes que ven el noticiario “Buenos dı́as Lima”. Se condujo un estudio en el
que participaron 1000 televidentes, y se encontró que el 60 % de las personas ven
el noticiario. Suponiendo que las 1000 personas son representativas del grupo de
EP

televidentes, Defina en términos del problema:


UD

a) ¿Cuál es la población bajo estudio?


b) ¿Cuál es la muestra?
c) ¿Cuál es la variable de interés? ¿de qué tipo es? ¿qué nivel de medición tiene?
A
d ) el parámetro de interés y proporcione su valor.
IM

e) el estadı́stico y proporcione su valor.


S -L

40. Piense bien y clasifique las siguientes variables según su nivel de medición:
PU
M

a) Altitud (altura, en metros sobre el nivel del mar) de una ciudad.


CA

b) Opinión de los limeños acerca de la gestión de un congresista, medida en una


escala de 1 hasta 5, donde: 1=pésima y 5=excelente.
c) El tipo de vitamina que contiene un grupo de alimentos (ej. vitamina E)
d ) El diámetro, en milı́metros, de un conjunto de tornillos.
e) La actitud de los peruanos hacia la discriminación racial medida en una escala de:
1 =desfavorable hasta 5 = muy favorable.
f ) Consumo mensual de electricidad (en Kw/h) en un hogar.
E

g) Opinión acerca de la posible construcción de un condominio multifamiliar en el


AD

área de un parque ( A favor, en contra).

41. Un comité de arqueólogos e historiadores ha sido nombrado por el Ministerio de Cultura,


para estudiar el grado de conservación de los monumentos históricos de la ciudad
de Lima. Se condujo un estudio en el que se eligieron aleatoriamente 100 de estos
monumentos, y se encontró que el 30 % están muy bien conservados. Suponiendo que
los 100 monumentos son representativos del grupo total de monumentos históricos,
defina en términos del problema:
-I I

a) ¿Cuál es la población bajo estudio?


22

b) ¿Cuál es la muestra?
20

c) ¿Cuál es la variable de interés? ¿qué nivel de medición tiene?


d ) el parámetro de interés y proporcione su valor.
e) el estadı́stico y proporcione su valor.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 25

42. En un estudio se clasifica la presión arterial de un paciente como: normal,


prehipertensiva, presión arterial alta en etapa 1 o presión arterial alta en etapa 2.
Determine y sustente (expresándose en términos del contexto), cuál de los niveles (o
escalas) de medición es el más apropiado para la variable de interés: presión arterial.

43. Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase, se
utiliza en el siguiente ejercicio. Se realizó una investigación para conocer las condiciones
en que viven los niños y adolescentes en los Centros de Atención Residencial del
INABIF. Para tal efecto se seleccionó al azar 6 de estos centros y se evaluó las
EP

condiciones de vida de los niños y adolescentes residentes en cada uno de ellos.


UD

44. Uno de los cuatro niveles o escalas de medición se denomina “de razón” ¿Por qué se le
denomina ası́? Explique claramente y exponga un ejemplo.

45. Clasifique las siguientes variables según su nivel de medición. Sustente la respuesta que
A
brinde en el apartado a) y c)
IM

a) El diámetro, en milı́metros, de un conjunto de tornillos.


S -L

b) Percepción de los usuarios del transporte público frente al servicio que se brinda,
PU

medido en una escala de: 1 =muy malo hasta 5 = muy bueno.


M

c) Altitud (altura, en metros sobre el nivel del mar) de una ciudad.


CA

d ) Número de bacterias por milı́metro cúbico.


e) Intensidad del dolor: Leve, Moderado, Intenso.
f ) Facultad a la que Ud. pertenece.

46. En el mes de Noviembre del 2011, se realizó un estudio en pacientes que pasaron consulta
en el servicio de cardiologı́a del Hospital Rebagliati, para conocer algo sobre: proporción
o porcentaje de pacientes con riesgos cardı́acos (si o no), peso promedio (kg),sexo del
paciente (masculino, femenino) y el grado de sedentarismo (alto, medio, bajo). Para
tal efecto, se eligieron aleatoriamente a 60 pacientes y se encontró que el 45 % tenı́an
E
AD

riesgo cardı́aco, el peso promedio fue de 75.2 kilos, el 70 % eran de sexo masculino y el
80 % tenı́an alto grado de sedentarismo. Defina en términos del problema:

a) ¿Cuál es la población bajo estudio?


b) ¿Cuál es la muestra?
c) ¿Cuáles son las variables de interés? ¿qué nivel de medición tiene cada una?
d ) parámetros de interés y proporcione sus valores.
e) estadı́sticos y proporcione sus valores.
-I I
22

47. Clasifique las siguientes variables según su nivel de medición. Sustente la respuesta que
20

brinde en los apartados b) y c)

a) El nivel educativo de una madre que vive en una comunidad de San Vicente de
Cañete y que se codifica con un número: 1 = Nivel Superior, 2 = Medio, 3 =
Básico, 4 = Ninguno
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 26

b) La puntuación obtenida en un test que mide el coeficiente intelectual.


c) El número de ases obtenidos al extraer 3 cartas de una baraja.
d ) Los códigos postales de las ciudades del paı́s.

48. La empresa Informat S.A. llevó a cabo un estudio para analizar el mercado de
internautas que compran servicios de internet, en Lima Metropolitana. Para el estudio
se consideró una muestra probabilı́stica de 1500 personas. Algunos de los resultados de
la encuesta fueron:
EP

De las 1500 personas seleccionadas, solo el 25 % de los internautas tienen alguna


computadora en casa.
UD

El número promedio de veces por semana que los encuestados usan el servicio de
Internet es 3.
El 80 % de los internautas opinó que el servicio de Internet es regular.
A
IM

El tiempo promedio de uso diario de Internet es de 2 horas.


-L

Defina en términos del problema, cuál es:


S
PU

a) La población bajo estudio.


M

b) La muestra.
CA

c) La(s) variable(s) de interés y su tipo según naturaleza.


d ) El(Los) parámetro(s) y su(s) valor(es).
e) El(Los) estadı́stico(s) y su(s) valor(es).

49. Determine y sustente (expresándose en términos del contexto), cuál de los niveles (o
escalas) de medición es el más apropiado para las variables de interés siguientes:

a) Nota o puntuación obtenida en el examen parcial.


E

b) Cantidad de “cincos” obtenida al lanzar un dado 8 veces.


AD

50. Explique claramente ¿Cuál es la diferencia fundamental entre la escala de medición


ordinal y la escala de medición de intervalo? De 1 ejemplo al respecto.

51. Con la finalidad de conocer en qué medida los propietarios de viviendas del distrito de
Lince pagan el impuesto predial, la Municipalidad correspondiente realizó un estudio.
De una muestra de 500 propietarios se obtuvo los siguientes resultados preliminares.

El ingreso promedio mensual por propietario es de S/. 425.50


-I I

El número de pisos promedio por propiedad es de 1.5


22

Solo el 63 % opina que puede pagar el impuesto predial.


20

El número de viviendas promedio por manzana es de 15.5 casas/manzana


El 49 % opina que la calidad de atención en el municipio para pagar el impuesto
predial es regular.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 27

Defina en términos del problema:

a) ¿Cuál es la población bajo estudio?


b) ¿Cuál es la muestra?
c) ¿Cuáles son las variables de interés? ¿qué nivel de medición tiene cada una?
d ) parámetros de interés y proporcione sus valores.
e) estadı́sticos y proporcione sus valores.

52. Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase, se
EP

utiliza en el siguiente ejercicio. Se realiza un estudio para estimar el consumo total de


UD

gasolina en una ciudad. Para esto, los vehı́culos se clasificaron en: particulares (1),
públicos (2) y oficiales (3) y se eligieron al azar 100 automóviles de cada grupo.

53. El Ministerio de Comercio Exterior y Turismo realizó un estudio sobre el perfil del
A
turista nacional. Se define al turista nacional como aquel peruano que se traslada a
IM

alguna zona del paı́s diferente de donde reside. El estudio se llevó a cabo con hombres y
-L

mujeres, entre 18 a 64 años, que vacacionaron en Lima, Arequipa, Trujillo, Huancayo y


S

Chiclayo. Se seleccionó una muestra probabilı́stica de 3359 turistas, de la que se obtuvo


PU

los siguientes resultados:


M
CA

El tiempo promedio (en dı́as) de permanencia por turista en estos lugares fue de
5 dı́as.
El gasto promedio diario por turista fue de 766 soles.
Los medios utilizados para búsqueda de información turı́stica: el 56 % por internet,
24 % por familiares, 12 % por folletos turı́sticos y por agentes turı́sticos 8 %.

Defina en términos del problema, cuál es:

a) La población bajo estudio.


E

b) La muestra.
AD

c) La(s) variable(s) de interés y su tipo según naturaleza.


d ) El(Los) parámetro(s) y su(s) valor(es).
e) El(Los) estadı́stico(s) y su(s) valor(es).

54. Clasifique las siguientes variables según su nivel de medición. Sustente la respuesta que
brinde en los apartados a) y d)

a) El tipo de sangre de un paciente.


-I I

b) Puntaje obtenido en un test de personalidad.


22
20

c) La cantidad de cincos obtenidos al lanzar 3 veces un dado.


d ) Percepción de los usuarios del servicio brindado en el Metropolitano, medido en
una escala de: 1 =muy malo hasta 5 = muy bueno
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 28

55. La empresa Mistercofi S.A., que entre otras cosas produce café, ha solicitado realizar
un estudio de mercado de las personas de clase media, de la ciudad de Lima, acerca del
consumo de dicho producto. Para realizar el estudio la empresa seleccionó una muestra
de 1200 personas de clase media de la ciudad de Lima. Algunos de los datos y resultados
de la encuesta fueron:

El precio promedio de un envase de café, pagado por persona,fue de 9 soles.


El 35 % de personas opinó que el café es un producto dañino para la salud.
EP

Defina en términos del problema, cuál es:


UD

a) La población bajo estudio.


b) La muestra.
c) La(s) variable(s) de interés y su tipo según naturaleza.
A
d ) El(Los) parámetro(s) y su(s) valor(es).
IM

e) El(Los) estadı́stico(s) y su(s) valor(es).


S -L

56. Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase, se
PU

utiliza en el siguiente ejercicio: Se realizó una investigación para conocer las condiciones
M

en que viven los presos en las cárceles peruanas. Para tal efecto se seleccionó al azar 5
CA

centros penitenciarios y se evaluó las condiciones de vida de todos los presos en cada
uno de esos centros.

57. Con la finalidad de conocer en qué medida los propietarios de automóviles del distrito
de Magdalena pagan el impuesto vehicular, el SAT realizó un estudio. De una muestra
de 600 propietarios se obtuvo los siguientes resultados preliminares.

El ingreso promedio mensual por propietario es de S/. 525.50


El 74 % opina que puede pagar el impuesto vehicular.
E

El número de automóviles promedio por propietario es de 1.5


AD

El 49 % opina que la calidad de atención en el SAT para pagar el impuesto predial


es muy buena.
El número de automóviles promedio por manzana es de 15.5

Defina en términos del problema:

a) ¿Cuál es la población bajo estudio?


b) ¿Cuál es la muestra?
-I I

c) ¿Cuáles son las variables de interés? ¿qué nivel de medición tiene cada una?
22
20

d ) parámetros de interés y proporcione sus valores.


e) estadı́sticos y proporcione sus valores.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 29

58. Suponga que se está investigando los tiempos obtenidos en una prueba de rendimiento
de observación visual en adolescentes de 17 años de edad que asisten a un curso de
un colegio de la ciudad de Lima. La prueba consiste en que se presentan dos dibujos
y se deben encontrar 7 errores, luego se toma el tiempo (en minutos) que tardan en
descubrirlos. La base de datos de la población es la siguiente:
EP
UD

A
IM
-L

a) Seleccione una muestra aleatoria simple de 6 estudiantes de esta población. Use la


S

tabla de números aleatorios adjunta, empezando en la fila 1 columna 1 y continúe


PU

seleccionando hacia la derecha. Describa la muestra seleccionada.


M

b) Calcule el tiempo medio que emplean para descubrir los 7 errores, los 6 adolescentes
CA

elegidos ¿Cuál es la proporción de hombres en la muestra? ¿los que acaba de


calcular son estadı́sticos o parámetros?
E
AD

59. Se realiza un estudio con el objetivo de estimar la relación entre la depresión y los
conflictos familiares en los adolescentes peruanos. Según una encuesta realizada a 342
participantes de entre 11 y 17 años, revela que la edad promedio de los encuestados es
de 13.7 años, el 52.6 % es de sexo masculino y el 16.7 % presenta un nivel de depresión
severa. Defina en términos del problema:

a) La población bajo estudio.


b) La muestra.
-I I

c) La(s) variable(s) de interés y su tipo según naturaleza.


22

d ) El(los) estadı́stico(s) y su(s) valor(es).


20

e) El(los) parámetro(s) y su(s) valor(es).

60. En una canasta se tienen 12 naranjas de las cuales 3 están malogradas. Imagı́nese
que usted elige al azar 5 naranjas de las 12 que hay en esa canasta y se define como
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 30

variable de interés el número de naranjas malogradas que obtuvo de las 5 seleccionadas.


Determine y sustente (expresándose en términos del contexto), cuál de los niveles (o
escalas) de medición es el más apropiado para dicha variable de interés.

61. Una encuestadora realizó un estudio en el mes de julio con la finalidad de conocer
en qué medida las personas adultas que viven en la capital reaccionan ante el clima
de inseguridad existente. Se encuestó a 1200 adultos y se obtuvieron los siguientes
resultados preliminares.

El 56 % se siente poco satisfecho respecto a la atención que el gobierno brinda al


EP

tema de seguridad.
UD

El tipo de delito más frecuente del que han sido vı́ctimas fue el robo al paso (bolso,
cartera, celular) (60 %).
El 70 % de los encuestados opinan que el distrito en el que viven es poco seguro.
A
El 68 % de los encuestados dice no haber realizado la denuncia respectiva luego
IM

de haber sido vı́ctima de un delito.


-L

Defina en términos del problema:


S
PU

a) ¿Cuál es la población bajo estudio?


M

b) ¿Cuál es la muestra?
CA

c) ¿Cuáles son las variables de interés? ¿qué nivel de medición tiene cada una?
d ) parámetros de interés y proporcione sus valores.
e) estadı́sticos y proporcione sus valores.

62. El profesor de estadı́stica quiere investigar sobre el tiempo diario de estudio (en horas)
de 20 estudiantes de una clase. Los datos son:

Etiqueta N ombre T iempo Etiqueta N ombre T iempo


01 Juan 2.0 11 M artha 3.0
E

02 Alicia 2.0 12 F ernando 0.5


AD

03 P edro 2.0 13 Julio 0.5


04 M arco 1.5 14 Rosa 1.0
05 Alberto 1.5 15 F abio 1.5
06 Jorge 2.5 16 Ana 2.5
07 David 2.5 17 Laura 1.0
08 Carlos 2.0 18 Enrique 0.5
09 M iguel 1.5 19 Carmen 1.0
-I I

10 V ictoria 1.5 20 M arcelo 1.5


22

a) Seleccione una muestra aleatoria simple de 7 estudiantes de esta población. Use


20

la tabla de números aleatorios adjunta, empezando en la fila 3 columna 1 y


continúe seleccionando hacia la derecha. ¿Qué alumnos conforman la muestra
seleccionada?¿Cuál es el tiempo diario de estudio que dedica cada uno de esos
alumnos?
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 31

b) Mostrando los cálculos responda: ¿Cuál es el tiempo medio de estudio en la


muestra? ¿Cuál es la proporción de mujeres en la muestra? ¿Cuál es el mayor
tiempo de estudio en la población?¿Cuál es la diferencia entre el mayor y el menor
tiempo de estudio en la muestra?¿Cuál es la diferencia entre el mayor y el menor
tiempo de estudio en la población?
c) ¿Los valores que acaba de calcular en el apartado anterior son parámetros o
estadı́sticos? Indique claramente en cada caso.
EP
UD

A
IM

63. Una bolsa contiene 25 caramelos de limón y 15 de menta. Imagı́nese que usted elige al
-L

azar 10 caramelos de los 40 que hay en esa bolsa y se define como variable de interés el
S

número de caramelos de limón que obtuvo de los 10 seleccionados. Determine


PU

y sustente (expresándose en términos del contexto), cuál de los niveles (o escalas) de


M

medición es el más apropiado para dicha variable de interés.


CA

64. Suponga que lo acaban de nombrar ejecutivo principal de mercadotecnia para Fun
Enterprise (F.E), compañı́a que se especializa en diseñar y construir parques de
diversiones cerca de grandes ciudades. F.E se interesa principalmente en un sitio al
Sur de Lima. Se realiza un estudio para poder averiguar la opinión acerca de la posible
instalación del parque de diversiones y el precio que en promedio las personas estarı́an
dispuestas a pagar en cada visita. La encuesta fue realizada a 1150 personas adultas
elegidas aleatoriamente y se encontró que el 90 % de los entrevistados declararon estar
a favor de la instalación del parque y que en promedio, el precio que ellas estarı́an
E

dispuestas a pagar serı́a de 8.8 soles.


AD

Defina en términos del problema, cuál es:

a) La población bajo estudio.


b) La muestra.
c) La(s) variable(s) de interés y su tipo según naturaleza.
d ) El(Los) parámetro(s) y su(s) valor(es).
e) El(Los) estadı́stico(s) y su(s) valor(es).
-I I
22

65. Clasifique las siguientes variables según su nivel de medición. Sustente la respuesta que
20

brinde en el apartado a), d) y e), expresándose adecuadamente:

a) Longitud de una ciudad (distancia angular entre un punto dado de la superficie


terrestre y el meridiano tomado como referencia, generalmente el meridiano base
es el meridiano de Greenwich).
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 32

b) Temperatura de un cuerpo en grados Farenheit.


c) Opinión acerca de la gestión del alcalde de Lima. (Buena,regular o mala).
d ) Código de cuenta interbancario.
e) La cantidad de “unos” obtenidos al lanzar 5 dados normales.

66. En un estudio que realizó una empresa de investigación de mercados, sobre la calidad del
servicio que brindan los supermercados en la ciudad de Lima, se aplicó una encuesta de
opinión a los clientes de dichos supermercados. Para realizar este estudio se seleccionó
EP

una muestra de 1200 clientes que asistieron a los supermercados de la ciudad de Lima.
Se presentan a continuación algunos de los resultados obtenidos:
UD

El 85 % de los encuestados calificó como “buena” la calidad del servicio de atención


en el supermercado.
El 40 % de clientes seleccionados señaló que los precios no eran cómodos.
A
IM

El número promedio de dı́as por semana que asisten los clientes seleccionados al
-L

supermercado es de 2.5 dı́as.


S

El tiempo promedio que permanece un cliente en caja para realizar un pago es de


PU

15 minutos.
M
CA

Defina en términos del problema, cuál es:

a) La población bajo estudio.


b) La muestra.
c) La(s) variable(s) de interés y su tipo según naturaleza.
d ) El(Los) parámetro(s) y su(s) valor(es).
e) El(Los) estadı́stico(s) y su(s) valor(es).

67. Una caja contiene 12 artı́culos de los cuales 4 son defectuosos. Imagı́nese que usted
E

elige al azar 5 artı́culos de los 12 que hay en esa caja y se define como variable de
AD

interés el número de artı́culos defectuosos que obtuvo de los 5 seleccionados.


Determine y sustente (expresándose en términos del contexto), cuál de los niveles (o
escalas) de medición es el más apropiado para dicha variable de interés.

68. Responda lo siguiente, expresándose adecuadamente:

a) Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en


clase, se utiliza en el siguiente ejercicio (Sustente la respuesta): Un gran club de
-I I

esparcimiento tiene registrados en su base informática a 42000 socios. Los registros


22

están numerados del 1 al 42000. Se obtuvo una muestra de dichos registros,


20

seleccionando a los socios cuyos números de registro son: 120, 240, 360,. . . , 42
000, obteniéndose ası́ la muestra de socios requerida.
b) Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase,
se utiliza en el siguiente ejercicio (Sustente la respuesta): En una investigación se
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 33

trata de conocer el grado de satisfacción laboral de los profesores de Institutos de


Educación Superior Tecnológica pública de Lima Metropolitana, para lo cual se
seleccionó al azar 10 institutos y se entrevistó a todos los profesores de cada uno
de esos institutos.
c) Un concepto importante en el muestreo estratificado es la “afijación”. Explique
qué significa ası́ como sus tipos.
d ) El muestreo bola de nieve es un tipo de muestreo no probabilı́stico. Investigue
al respecto y responda: ¿Cuándo se emplea y en qué consiste?
EP

69. La siguiente información recopilada corresponde a los pacientes atendidos por un


UD

Odontólogo recién egresado de la Universidad, durante su primer mes de trabajo:

Eti− N ombre del N úmero Distrito Eti− N ombre del N úmero Distrito
A
queta P aciente de caries queta P aciente de caries
IM

01 Luis 5 Ate 10 Leticia 6 Ate


-L

02 V iviana 7 Surco 11 F rancisco 1 Surco


S

03 N icolás 2 Lince 12 Blanca 0 Surco


PU

04 N atalia 0 Ate 13 Cecilia 0 Lince


M

05 Erika 1 Lince 14 P edro 2 Ate


CA

06 F ernando 2 Lince 15 Esteban 3 Lince


07 Ivette 0 Surco 16 Bárbara 5 Lince
08 Carolina 6 Lince 17 Diego 6 Ate
09 Cristóbal 7 Lince 18 Israel 4 Surco

a) Seleccione una muestra aleatoria simple de 8 pacientes de esta población. Use la


tabla de números aleatorios adjunta, empezando en la fila 5 columna 1 y continúe
seleccionando hacia la derecha (Si concluye con la fila 5 continúe seleccionando
números a partir de la fila 1 columna 1). Describa la muestra seleccionada.
E
AD

b) ¿Cuál es el número promedio de caries de los 8 pacientes elegidos? ¿Cuál es el


porcentaje de pacientes de la población, que viven en Lince? ¿Cuál es el porcentaje
de pacientes con al menos 4 caries, en los 8 pacientes elegidos? ¿los valores que
acaba de calcular son de parámetros o estadı́sticos? ¿por qué?
-I I
22
20

70. En una lista de 80 clientes que poseen tarjeta de crédito hay 10 clientes que no están al
dı́a en sus pagos (morosos). Imagı́nese que usted elige al azar 20 clientes de esa lista y
se define como variable de interés el número de clientes morosos dentro de los 20
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 34

seleccionados. Determine y sustente (expresándose en términos del contexto), cuál de


los niveles (o escalas) de medición es el más apropiado para dicha variable de interés.
EP
UD

A
IM
S -L
PU
M
CA

E
AD

-I I
22
20
Capı́tulo 2

Estadı́stica descriptiva: Organización, resumen, des-


EP

cripción y presentación de datos estadı́sticos


UD

2.1. Introducción
En este capı́tulo se van a estudiar las distintas formas de organizar, representar y describir
A
IM

conjuntos de datos. El objetivo es hacer que los datos sean más fáciles de ser entendidos
describiendo tendencias, medidas centrales, variaciones, etc. Las técnicas que emplea la
-L

estadı́stica descriptiva involucran el uso de tablas o de gráficos y además el cálculo de medidas


S
PU

que describan las caracterı́sticas principales del conjunto de datos analizado.


M

2.2. Estadı́stica descriptiva:Técnicas tabulares y gráficas


CA

Como se indicó en el capı́tulo 1, los datos se clasifican en cualitativos o cuantitativos.


Las observaciones pueden referirse a personas, organizaciones, naciones, familias, objetos,
etc. En la presentación de datos es necesario ser tan conciso como sea posible, pero sin
dejar de considerar información esencial. El objetivo principal no es simplemente obtener
alguna tabla o gráfica, sino entender los datos (Anderson y Sweeney, 2008). En esta parte del
capı́tulo veremos los métodos tabulares y gráficos empleados para presentar datos cualitativos
y cuantitativos. Los resúmenes gráficos o tabulares de datos se encuentran en reportes anuales,
en artı́culos en los periódicos y en estudios de investigación. Es común encontrarse con este
E

tipo de presentaciones. Por tanto, es útil saber cómo se hacen y se interpretan. Se verán los
AD

métodos tabulares y gráficos para resumir datos que se refieren a una sola variable.
2.2.1. Resumen de datos cualitativos
2.2.1.1. Tabla de frecuencias
Para utilizar la información estadı́stica necesaria, debemos organizarla y resumirla. Una
manera simple y conveniente de resumir los datos es en una tabla llamada distribución de
frecuencias, la cual es un resumen tabular de datos que muestra cada una de las diferentes
clases excluyentes (o valores de la variable) y el número o conteo (frecuencia absoluta)
-I I

de elementos en cada una de ellas. En particular, una distribución de frecuencias nos ayuda
22

a entender la naturaleza de la distribución de un conjunto de datos.


20

Asimismo la organización de la información además de comprender las columnas básicas:


Valores de la variable y las frecuencias absolutas, también a partir de ellas se forman dos
columnas más: la frecuencia relativa y el porcentaje (o frecuencia porcentual).
La frecuencia relativa de una clase es igual a la parte o proporción de los elementos

35
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 36

fi
que pertenecen a cada clase, es decir: , donde fi es la frecuencia absoluta de la clase i y n
n
es el tamaño de la muestra o cantidad de datos analizados. La frecuencia porcentual de una
clase es la frecuencia relativa multiplicada por 100.
Un detalle importante es que en una distribución de frecuencias: La suma de las
frecuencias absolutas es siempre igual al número de observaciones n, la suma de las frecuencias
relativas es siempre igual a 1, y la suma de los porcentajes es siempre igual a 100.
Con el ejemplo siguiente se muestra la elaboración e interpretación de una distribución
de frecuencia de datos cualitativos: Suponga que se encuesta a 123 personas para conocer su
opinión al respecto de diversos temas y dentro de la información que alcanzan se encuentra
EP

su estado civil.
UD

Para elaborar una distribución de frecuencia con estos datos, se cuenta el número de veces
que aparece cada categorı́a de estado civil. Supóngase que al contar, 25 personas son solteras,
50 son casadas, 20 divorciadas, 18 viudas y 10 tienen otros estados civiles que agruparemos
A
en “Otros”. Esto queda resumido en la distribución de frecuencias de la Tabla 2.1:
IM

Estado Número de personas Frecuencia relativa Porcentaje de


-L

Civil (frecuencia) de personas personas


S
PU

25
Soltero 25 123 20.3
M

50
Casado 50 123 40.7
CA

20
Divorciado 20 123 16.3
18
Viudo 18 123 14.6
10
Otros 10 123 8.1
Total 123 1 100

Tabla 2.1: Distribución de frecuencias del estado civil de las personas encuestadas.

Esta distribución de frecuencia proporciona un resumen de cómo se clasifican o


distribuyeron las 123 personas de acuerdo a su estado civil. El resumen aporta más claridad
E
AD

y al observar esta distribución de frecuencia, es claro que el estado civil más frecuente es
“casado”, “soltero” el segundo, “divorciado” el tercero, a continuación “viudo” y “otro”el
menos frecuente. En el cuadro 2.1 se presenta también la distribución de frecuencia relativa y
la distribución de frecuencia porcentual de los datos de estado civil. En esta tabla se observa
que la frecuencia relativa de “soltero” es 25/123=0.203, la de “casado” es 50/123=0.407,
etc. En la distribución de frecuencia porcentual, se muestra que 20.3 % de las personas son
solteros, 40.7 % casados, etc.
2.2.1.2. Diagrama de barras y gráfica de pastel
-I I
22

Una gráfica de barras o un diagrama de barras, es una gráfica para representar los
20

datos cualitativos de una distribución de frecuencia, de frecuencia relativa o de frecuencia


porcentual. En uno de los ejes de la gráfica (por lo general en el horizontal), se especifican
las etiquetas empleadas para las clases (categorı́as) o valores de la variable en estudio. Para
el otro eje de la gráfica (el vertical) se usa una escala adecuada para frecuencia, frecuencia
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 37

relativa o frecuencia porcentual. Después, empleando un ancho de barra fijo, se dibuja sobre
cada etiqueta de las clases una barra que se extiende hasta la frecuencia, frecuencia relativa o
frecuencia porcentual de la clase. Cuando se tienen datos cualitativos, las barras deben estar
separadas para hacer énfasis en que cada clase está separada o excluyente de las otras.
En la figura 2.1 se muestra una gráfica de barras correspondiente a la distribución
de frecuencia del estado civil de las 123 personas encuestadas. Advierta cómo en esta
representación gráfica se observa que “casado” y “otro” son las categorı́as de estado civil
con mayor y menor frecuencia respectivamente.
EP
UD

A
IM
S -L
PU
M
CA

Figura 2.1: Distribución de frecuencias para la variable estado civil

La gráfica de pastel proporciona otra gráfica para presentar distribuciones de frecuencia


relativa y de frecuencia porcentual de datos cualitativos. Para elaborar una gráfica de pastel,
primero se dibuja un cı́rculo que representa todos los datos. Después se usa la frecuencia
relativa para subdividir el cı́rculo en sectores, o partes, que corresponden a la frecuencia
relativa de cada clase. Por ejemplo, como un cı́rculo tiene 360 grados y “soltero” presenta
E

una frecuencia relativa de 0.203, el sector de la gráfica de pastel correspondiente a “soltero”


AD

resultará de 0.203*(360)=73.08 grados. El sector del pastel para “casado” resultará de


0.407*(360)=146.16 grados. Mediante cálculos semejantes para las demás clases se obtiene
la gráfica de pastel de la figura 2.2. Los números que aparecen en cada sector pueden ser
frecuencia, frecuencia relativa o frecuencia porcentual.
2.2.1.3. Diagrama de Pareto.
Un recurso gráfico que permite representar datos categóricos que a menudo proporciona
más información visual que los diagramas de barras y de pastel es el diagrama de Pareto
-I I

(Berenson et al., 2006). Esto ocurre a medida que aumenta el número de clases o grupos
22

de la variable categórica de interés. El diagrama de Pareto es un tipo especial de diagrama


20

de barras verticales, donde las respuestas categorizadas se grafican en orden descendente de


frecuencias y se combinan con un polı́gono acumulado en la misma escala. Fue creado sobre
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 38
EP
UD

Figura 2.2: Gráfica de pastel para la variable estado civil.


A
la base del principio de Pareto1 , según el cual, el 80 % de los problemas son provenientes de
IM

apenas el 20 % de las causas.


-L

El principio fundamental de esta gráfica es la posibilidad de distinguir a los “pocos


S

vitales”, de los “muchos triviales”, lo que permite dirigir la atención a las respuestas más
PU

importantes. Ası́, el diagrama alcanza su utilidad máxima cuando la variable cualitativa de


M

interés contiene muchas categorı́as. El diagrama de Pareto se usa ampliamente en el control


CA

estadı́stico de procesos y el control estadı́stico de la calidad del producto. Algunos ejemplos


de tales minorı́as vitales serı́an:

La minorı́a de clientes que representen la mayorı́a de las ventas.

La minorı́a de productos, procesos, o caracterı́sticas de la calidad causantes del grueso


de desperdicio o de los costos de reelaboración.

La minorı́a de rechazos que representa la mayorı́a de quejas de la clientela.


E

La minorı́a de vendedores que está vinculada a la mayorı́a de partes rechazadas.


AD

La minorı́a de problemas causantes del grueso del retraso de un proceso.

La minorı́a de productos que representan la mayorı́a de las ganancias obtenidas.

La minorı́a de elementos que representan al grueso del costo de un inventario.

Antes de construir un diagrama de Pareto, se elabora primero una tabla de resumen


de las categorı́as ordenadas de manera descendente según las frecuencias o porcentajes. Las
categorı́as con baja frecuencia deben ser agrupadas, como “otros” y colocadas al final de
-I I

la lista. Luego en la construcción de un diagrama de Pareto, el eje vertical contiene las


22

frecuencias o porcentajes, y el eje horizontal contiene las categorı́as de la variable de interés.


20

Las barras con separación uniforme tienen el mismo ancho. El punto en el polı́gono de
porcentajes acumulados para cada categorı́a se centra en el punto medio de cada barra.
1
Wilfredo Pareto fue un economista italiano que, en el siglo XIX, presentó una fórmula que mostraba la
desigualdad en la distribución de los salarios.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 39

Al estudiar un diagrama de Pareto se buscan dos cosas: las magnitudes de las diferencias en
las longitudes de las barras que corresponden a las categorı́as adyacentes decrecientes y los
porcentajes acumulados de estas categorı́as adyacentes.
Con el ejemplo siguiente se muestra la elaboración de un diagrama de Pareto: El gerente
de operaciones de una planta empacadora de cereales indicó que, según su experiencia, casi
siempre hay nueve razones que dan como resultado la producción de cajas de cartón no
conformes al final del proceso de empaque: cartón roto (R), cartón abultado (G), cartón
agrietado (C), cartón sucio (D), agujeros en el cartón (H), peso de empaque inadecuado (I),
error de impresión (P), etiqueta ilegible (U) y tapa superior sin sello (S).
EP

Los datos sin procesar que se muestran a continuación representan una muestra de 50
UD

cajas de cartón no conformes, las cuales se tomaron de la producción de la semana pasada,


las letras indican las razones de no conformidad:

UGUSHDDRIUSUSUGCSUDRSUDUSSDPRSISUDGSSUSD
A
GSCUDDSSSU
IM

Para construir el diagrama de Pareto con estos datos, primero, elaboramos una tabla de
-L

resumen ordenada de manera descendente respecto de las frecuencias o porcentajes de las


S
PU

razones de no conformidad, la cual se muestra en la Tabla 2.2:


M

Razones de Número de cajas Porcentaje Porcentaje


CA

no conformidad (frecuencia) de cajas acumulado


Tapa superior sin sello (S) 16 32 32
Etiqueta ilegible (U) 12 24 56
Cartón sucio (D) 9 18 74
Cartón abultado (G) 4 8 82
Cartón roto (R) 3 6 88
Cartón agrietado (C) 2 4 92
E
AD

Peso de empaque inadecuado (I) 2 4 96


Agujeros en el cartón (H) 1 2 98
Error de impresión (P) 1 2 100
Total 50 100

Tabla 2.2: Tabla de resumen para construir el diagrama de Pareto.

Ahora empleamos esta tabla de resumen para construir el diagrama de Pareto que aparece
-I I

en la figura 2.3:
22

Al separar los “pocos vitales” de los “muchos triviales”, se determina que las tapas sin
20

sello (32 %), las etiquetas ilegibles (24 %) y los cartones sucios (18 %) representan el 74 % de
las razones de no conformidad. Las otras seis razones representan el 26 %.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 40
EP
UD

Figura 2.3: Diagrama de Pareto para las razones de no conformidad.


A
IM

2.2.2. Resumen de datos cuantitativos


S -L

Para la organización de datos cuantitativos debemos primero decidir si se deben trabajar


PU

como datos no agrupados o como datos agrupados.


M

2.2.2.1. Datos cuantitativos no agrupados


CA

2.2.2.2. Tabla de frecuencias


Si al observar los datos del conjunto a analizar, se aprecia que existe poca cantidad de
valores diferentes para la variable de interés (no mayor a 12 ó 15), entonces es conveniente,
elaborar una distribución de datos no agrupados. La secuencia para elaborar dicha
distribución es la siguiente:

1. Establecer cuáles son los valores diferentes que se presentan en el conjunto de datos
(muestra o población), para la variable de interés, y ordenarlos según su magnitud.
E
AD

2. Colocar dichos valores en la primera columna de la tabla de frecuencias.

3. Establecer las frecuencias absolutas, frecuencias relativas y porcentajes.

Con el ejemplo siguiente se muestra la elaboración e interpretación de una distribución de


frecuencia de datos cuantitativos no agrupados: Un estudio en las diferentes escuelas y colegios
del paı́s consistió en anotar el número de palabras leı́das en 15 segundos por un grupo de
120 sujetos disléxicos. Luego de observar los 120 datos se encontró que la variable de interés:
Número de palabras leı́das en 15 segundos por estas personas disléxicas, solo tenı́a 6
-I I

valores diferentes: 25, 26, 27, 28, 29 y 30. Al ser pocos valores diferentes para la variable
22

de interés decidimos organizarlos en una distribución de frecuencias no agrupadas. Entonces


20

colocamos dichos valores en la primera columna de la tabla de frecuencias. Paso seguido, se


cuenta el número de disléxicos que leyeron 25 palabras, 26 palabras, etc. Supóngase que al
contar las observaciones encontramos que: 56 disléxicos leyeron 25 palabras en 15 segundos,
24 leyeron 26 palabras, 16 leyeron 27 palabras, 12 leyeron 28 palabras, 10 leyeron 29 palabras
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 41

y sólo 2 disléxicos leyeron 30 palabras. Esta información queda resumida en la distribución


de frecuencias de la Tabla 2.3:

X:N°de palabras Número de disléxicos Frecuencia relativa Porcentaje de


leı́das (frecuencia) de disléxicos disléxicos
56
25 56 120 47
24
26 24 120 20
16
27 16 120 13
EP

12
28 12 120 10
UD

10
29 10 120 8
2
30 2 120 2
Total 120 1 100
A
Tabla 2.3: Distribución de frecuencias del número de palabras leı́das por 120 disléxicos.
IM
-L

Esta distribución de frecuencia proporciona un resumen de cómo se clasifican o


S

distribuyeron los valores del número de palabras leı́das por los 120 disléxicos. El resumen
PU

aporta más claridad y al observar esta distribución de frecuencia, es claro que el número de
M

palabras leı́das más frecuente es 25 y 30 el menos frecuente. En el cuadro 2.3 se presenta


CA

también la distribución de frecuencia relativa y la distribución de frecuencia porcentual de


los datos del número de palabras leı́das. En esta tabla se observa que la frecuencia relativa
de 25 palabras leı́das es 56/120=0.47, la de 26 palabras leı́das es 24/120=0.20, etc. En
la distribución de frecuencia porcentual, se muestra que 47 % de los disléxicos leyeron 25
palabras, 20 % de los disléxicos leyeron 26 palabras, etc.
2.2.2.3. Diagrama de barras
La distribución de frecuencias de datos cuantitativos no agrupados se suele representar
mediante diagramas de barras, que representa cada una de las frecuencias en barras
E

proporcionales (similar al caso de variables cualitativas). El diagrama de barras para


AD

el número de palabras leı́das en 15 segundos por 120 disléxicos se muestra en la figura 2.4.
-I I
22
20

Figura 2.4: Distribución de frecuencias para el número de palabras leı́das por 120 disléxicos.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 42

2.2.2.4. Distribución acumulada: diagrama escalonado


Si en una distribución de frecuencias se suman sucesivamente las frecuencias, de tal forma
que éstas se vayan acumulando: f1 , f2 + f3 + · · · + fn , etc., se obtiene una distribución de
frecuencias acumuladas. Para el ejemplo anterior, esta distribución se representa en la Tabla
2.4:

N°de palabras leı́das 25 26 27 28 29 30


Número de disléxicos acumulado 56 80 96 108 118 120
EP

Tabla 2.4: Distribución de frecuencias acumuladas del número de palabras leı́das.


UD

Gráficamente, esta distribución se representa mediante un diagrama escalonado tal


como se muestra en la figura 2.5.
A
IM
S -L
PU
M
CA

Figura 2.5: Diagrama escalonado: diagrama de frecuencias acumuladas del número de palabras leı́das.
E

Esta representación muestra las frecuencias acumuladas (absolutas o relativas) para los
AD

distintos valores numéricos de la variable. Se aclara además que la frecuencia acumulada


(absoluta o relativa) de un valor numérico que no aparezca en la distribución de frecuencias
es igual a la frecuencia acumulada (absoluta o relativa) de la observación inmediatamente
anterior (ordenadas de menor a mayor). Por tanto, el gráfico de frecuencias acumuladas
siempre tiene forma de “escalera”. Algunas conclusiones del gráfico pueden ser: 80 disléxicos
leen 26 palabras o menos, 96 disléxicos leen 27 palabras o menos, etc.
2.2.2.5. Datos cuantitativos agrupados
-I I

2.2.2.6. Tabla de frecuencias


22

Si se tiene un conjunto de datos correspondiente a una variable aleatoria continua (o a una


20

variable aleatoria discreta que posee demasiados valores diferentes), es conveniente agrupar
los datos en intervalos, pues la distribución de frecuencias no agrupada y el diagrama de
barras correspondiente serı́a muy extenso y no ayudarı́an a realizar un apropiado análisis
estadı́stico impidiendo aclarar en qué forma se distribuyen los datos.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 43

Para la organización de datos cuantitativos de forma agrupada debemos tener en cuenta


lo siguiente:

Los intervalos a formar deben ser mutuamente excluyentes o no traslapados.

Se recomienda formar de 5 a 15 intervalos.

Se debe tener en cuenta la naturaleza de la variable de interés, el número de datos y la


amplitud del conjunto de datos.

Es muy importante respetar la precisión con que los datos son medidos. Por ejemplo,
EP

si los datos representan diámetros de ciertas piezas cilı́ndricas, en mm.: 125.5; 127.3;
UD

124.0; etc; expresados con una cifra decimal, entonces los lı́mites de los intervalos a
formar se expresarán también con una cifra decimal. Si los datos están expresados
con una precisión de dos decimales entonces los lı́mites de los intervalos a formar se
expresarán también con dos cifras decimales, etc.
A
IM

Es recomendable que los intervalos tengan igual tamaño cuando se desea hacer
-L

comparaciones entre ellos. Además, usualmente, los intervalos son cerrados a la


S
PU

izquierda y abiertos a la derecha; excepto el último intervalo que es cerrado en ambos


extremos.
M
CA

El procedimiento para la construcción de una tabla de frecuencias de datos


agrupados, aplicando la regla de Sturges, es el siguiente:

1. Determinar el rango o amplitud de los datos:

Rango = (Obsv. mayor valor) − (Obsv. M enor valor).

2. Establecer el número de intervalos mediante la regla de Sturges:

K∼
= 1 + 3.3 ∗ log(n), donde : n = número de datos
E
AD

3. Determinar el tamaño de intervalo de clase común (TIC):

Rango
T IC ∼
= ,
K

4. Establecer los lı́mites de cada uno de los intervalos. Se debe tener en cuenta los siguientes
aspectos:

La observación de menor valor será el lı́mite inferior del primer intervalo. El lı́mite
-I I

superior del primer intervalo se halla sumándole el TIC a la observación de menor


22

valor.
20

Los siguientes intervalos se forman teniendo en cuenta que el lı́mite inferior de un


intervalo es igual al lı́mite superior del intervalo anterior.
Los intervalos deben contener a todos los datos.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 44

5. Determinar las frecuencias absolutas (realizando el conteo, que consiste en asignar cada
observación al intervalo correspondiente).

6. Determinar las marcas de clase (o puntos medios de cada intervalo), las frecuencias
relativas y porcentajes.

Con el ejemplo siguiente se muestra la elaboración e interpretación de una distribución


de frecuencia de datos cuantitativos agrupados: El gerente de Supermercado Plaza Lima está
interesado en el número de veces que un cliente compra en su supermercado durante un
periodo de dos semanas. La respuesta de 51 clientes fue:
EP
UD

5 3 3 1 4 4 5 5 12 6 3 5 1
1 14 1 2 4 4 4 3 2 5 6 7 6
8 4 7 6 5 9 11 4 3 7 6 5 1
A
1 10 8 9 2 12 6 6 4 6 4 15
IM

Empecemos definiendo la variable de interés del problema la cual serı́a:


S -L

X: Número de veces que un cliente compra en el Supermercado Plaza Lima en un periodo


PU

de dos semanas.
M

Para construir una distribución de datos agrupados hay que seguir los siguientes pasos:
CA

1. Rango=Xmax -Xmin =15-1=14

2. Determinar el número de intervalos, por la regla de Sturges tenemos:

K∼
= 1 + 3.3 ∗ log(n) ∼
= 1 + 3.3 ∗ log(51) ∼
= 6.63 ⇒ tomamos K = 7

3. Determinar el tamaño del intervalo de clase (TIC):

Rango ∼ 14
T IC ∼
= = ⇒ tomamos T IC = 2
K 7
E
AD

4. Establecer los lı́mites de cada uno de los intervalos:


Lı́mite inferior del primer intervalo (LI1 )=Xmin =1
Lı́mite superior del primer intervalo (LS1 )=(LI1 )+TIC=1+2=3
Lı́mite inferior del segundo intervalo (LI2 )=(LS1 )=3
Lı́mite superior del segundo intervalo (LS2 )=(LI2 )+TIC=3+2=5
. . . y ası́ sucesivamente hasta completar los 7 intervalos.

5. Determinar las frecuencias absolutas (realizando el conteo, que consiste en asignar cada
-I I

observación al intervalo correspondiente).


22
20

6. Determinar las marcas de clase (o puntos medios de cada intervalo), las frecuencias
relativas y porcentajes.

Esta información queda resumida en la distribución de frecuencias de la Tabla 2.5.


Notas:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 45

X : N°de veces que Marca Número de frecuencia Porcentaje


un cliente compra de clientes relativa de de clientes
en el supermercado clase (Xc ) (frecuencia) clientes ( %)
9
[1 − 3⟩ 2 9 51 18
14
[3 − 5⟩ 4 14 51 27
15
[5 − 7⟩ 6 15 51 29
5
[7 − 9⟩ 8 5 51 10
EP

3
[9 − 11⟩ 10 3 51 6
UD

3
[11 − 13⟩ 12 3 51 6
2
[13 − 15] 14 2 51 4
Total 51 1 100
A
Tabla 2.5: Distribución de frecuencias de datos agrupados considerando la marca de clase de la
IM

variable:Número de veces que un cliente compra en el Supermercado Plaza Lima.


S -L

Vale la pena aclarar que, dado un conjunto de datos, éstos se pueden agrupar de varias
PU

maneras, sin que se pueda decir en muchos casos que sólo una es la manera correcta.
M

Se podrı́a decir; sin embargo, que la mejor agrupación es aquella que se elabora de una
CA

forma rápida y que permite mostrar de una manera clara cómo se distribuyen los datos,
ya sea de forma tabular o gráfica.

Marca de clase (Xc ) es el valor equidistante entre el lı́mite inferior y superior de un


intervalo. Se calcula como la semisuma de los lı́mites de cada intervalo. La razón de su
existencia es que cuando se agrupan datos se pierde la “individualidad” de los mismos,
por lo que la marca de clase es un valor numérico representativo de los datos que están
dentro de un intervalo determinado. Otra utilidad de la marca de clase es que se emplea
para calcular medidas descriptivas para datos agrupados, como se verá más adelante
E

en este capı́tulo.
AD

Esta distribución de frecuencia proporciona un resumen de cómo se distribuye el número


de veces que un cliente compra en el supermercado. El resumen aporta más claridad y al
observar esta distribución de frecuencia, se puede concluir por ejemplo que:
El grupo más numeroso de clientes (15) compra en el supermercado 5 ó 6 veces durante
un periodo de dos semanas.

Aproximadamente el 74 % de los clientes acude al supermercado menos de 7 veces en


un periodo de dos semanas.
-I I
22

Aproximadamente el 10 % de los clientes acude al supermercado al menos 11 veces.


20

2.2.2.7. Histograma y polı́gono


La distribución de frecuencias de datos cuantitativos agrupados se suele representar
mediante un histograma y el correspondiente polı́gono. Estas gráficas nos aclaran más
cómo están distribuidos los datos analizados.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 46

El histograma es una gráfica que expresa la frecuencia con que sucede cada clase o
intervalo. La forma que tenga el histograma permitirá formarse una idea no sólo de cómo
están distribuidos los datos, sino, en muchos casos, descubrir por qué causa los datos están
distribuidos de esa forma. En el eje de abscisas se identifica la variable de interés (X), ya sea
mediante los lı́mites de los intervalos o las marcas de clase. En el eje de ordenadas se expresan
las frecuencias de cada intervalo (o también la frecuencia relativa o los porcentajes). Cada
intervalo formará un rectángulo de altura igual a su frecuencia y base igual a la longitud del
intervalo.
El polı́gono de frecuencias se puede trazar fácilmente sobre el mismo histograma, uniendo
EP

los puntos medios de la parte superior de cada rectángulo, partiendo y finalizando en dos
UD

clases ficticias de frecuencia cero y de la misma longitud de clase. El polı́gono muestra la


variación de las frecuencias absolutas o relativas al pasar de un intervalo a otro.
El histograma y el polı́gono de frecuencias para el número de veces que un cliente
acude al supermercado se muestra en la figura 2.6.
A
IM

La figura 2.6 muestra el histograma y el polı́gono de frecuencias correspondientes al


ejemplo anterior. Considerando que las alturas de los rectángulos del histograma vienen dadas
-L

por las frecuencias de cada intervalo o clase (o también la frecuencia relativa o porcentajes), y
S
PU

que la base de estos rectángulos es el TIC (la longitud de intervalo o clase); se puede deducir
que el área que hay bajo el histograma, es exactamente igual que el área debajo del polı́gono.
M
CA

E
AD

Figura 2.6: Histograma y polı́gono de frecuencias del Número de veces que un cliente va al
supermercado.
-I I
22
20

2.2.2.8. Distribución acumulada: Ojiva o polı́gono acumulado “menor que”


Se le denomina ojiva o polı́gono de frecuencia acumulada “menor que”, a la
representación gráfica de la distribución de frecuencias acumuladas (o frecuencias relativas
acumuladas o porcentajes acumulados) expresando los lı́mites de clase en el eje de abscisas
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 47

y las frecuencias acumuladas (o frecuencias relativas acumuladas o porcentajes acumulados)


en el eje de ordenadas. La figura 2.7 muestra la ojiva del porcentaje acumulado de clientes
para la variable número de veces que un cliente va al superercado.
EP
UD

A
IM
-L

Figura 2.7: Ojiva del Número de veces que un cliente va al supermercado.


S
PU

Se puede concluir de la ojiva, que por ejemplo, el 84 % de los clientes del supermercado
M

asisten menos de 9 veces en un periodo de 2 semanas, etc.


CA

2.3. Estadı́stica descriptiva: Técnicas o medidas numéricas


En cualquier análisis o interpretación, se pueden usar muchas medidas descriptivas que
representan las propiedades de tendencia central, variación, posición y forma para resumir
las caracterı́sticas importantes de un conjunto de datos. Como hemos visto en el capı́tulo
1, si se calculan estas medidas descriptivas globales a partir de los datos de una muestra,
se denominan estadı́sticos; en cambio, si se calculan con los datos de una población se
denominan parámetros.
Estas medidas pueden ser como se adelantó en el párrafo anterior: de tendencia central,
E
AD

de variabilidad, de posición y de forma.


2.3.1. Medidas de tendencia central
Estas medidas se enfocan en las caracterı́sticas del centro de una distribución de datos.
Se busca obtener de alguna manera un número que permita ubicar la parte central de un
conjunto de datos o represente el valor central del conjunto. Las principales medidas de este
tipo son: La media o promedio aritmético, la mediana y la moda.
2.3.1.1. Media o promedio aritmético
-I I

La media (aritmética), por lo general, es la medida numérica más importante que se


22

utiliza para describir datos; comúnmente se le conoce como promedio. Si la media se calcula
20

con los datos de una muestra, la media se simboliza como x; y si se calcula con los datos de
una población, la media se simboliza con la letra griega µ.
La media se calcula con la suma de todas las observaciones en un conjunto de datos,
dividida entre el número de observaciones involucradas. Ası́, para una muestra que contiene
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 48

n observaciones: x1 , x2 , . . . , xn , la media aritmética puede escribirse como:

x1 + x2 + . . . + xn
x= (2.1)
n

esta expresión se puede simplificar usando la notación siguiente:

n
X
xi
i=1
x= (2.2)
n
EP

n
X
donde xi significa la suma de todos los valores o datos de la variable X.
UD

i=1
Ahora, dado el conjunto de los N datos de una población, la media se define como:

N
X
xi
A
i=1
µ= (2.3)
IM

N
-L

Por otro lado, si en una muestra, cuando a un conjunto de observaciones o valores:


S

x1 , x2 , . . . , xn de una variable X se les ha asignado un peso o ponderación :w1 , w2 , . . . , wn


PU

(que miden la importancia relativa de cada observación), entonces la media está dada por:
M

n
X
CA

wi x i
i=1
x= n (2.4)
X
wi
i=1

A esta última se le denomina media ponderada.


Si en lugar de contar con datos muestrales se tuviera los datos de una población, para
calcular la media ponderada se emplearı́a la misma fórmula.
Si se tienen k muestras de tamaños n1 , n2 , . . . , nk , con medias aritméticas x1 , x2 , . . . , xk
respectivamente; entonces la media aritmética del conjunto será:
E
AD

k
X
ni xi
i=1
x= k
(2.5)
X
ni
i=1

Algunas propiedades de la media aritmética son:

Al calcular la media se incluyen todos los datos u observaciones.


-I I

El valor de la media está siempre comprendido entre el mı́nimo y el máximo valor de


22

los datos.
20

La media tiene las mismas unidades de la variable de estudio.

Un conjunto de datos sólo tiene una media (un único valor). Se considera a la media
como un punto de equilibrio para un conjunto de datos.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 49

La media es útil para comparar 2 o más poblaciones. Por ejemplo, para comparar el
rendimiento de los alumnos de una sección respecto a los de otra sección de la misma
asignatura.

La media es la única medida para la cual se cumple que la suma de las desviaciones de
cada valor con respecto a la media, siempre será cero. Es decir, en una muestra con n
observaciones: x1 , x2 , . . . , xn se cumplirı́a que:
n
X
(xi − x) = 0 (2.6)
EP

i=1
UD

Debido a que el cálculo de la media aritmética se basa en todas las observaciones,


cualquier valor extremo (grande o pequeño) afecta a la media aritmética. En ese caso,
la media aritmética es una representación distorsionada de la tendencia central del
conjunto por lo que en estas situaciones la media no es adecuada para describir dicha
A
IM

propiedad.
-L

Para ilustrar el cálculo de la media veamos los siguientes ejemplos:


S
PU

1. Se toma una muestra de 10 estudiantes matriculados en estadı́stica 1 y se les pregunta


M

por el número de horas que emplearon en estudiar la asignatura en la semana anterior


CA

a la práctica N°2 y los datos obtenidos son: 12, 7, 5, 16, 21, 5, 9, 3, 11, 14 ¿Cuál es el
tiempo promedio de estudio?
Empleando la expresión (2.2), el tiempo medio de estudio serı́a:

10
X
xi
i=1 12 + 7 + 5 + 16 + 21 + 5 + 9 + 3 + 11 + 14
x= = = 10.3 horas
10 10

es decir, en esta muestra, en promedio por alumno estudiaron 10.3 horas. Como se
E

aprecia en este caso, es posible que el valor del promedio no necesariamente coincida
AD

con el valor de alguno de los datos analizados. Por esta razón, es un error redondear el
valor de la media a un valor entero, pues eso harı́a perder la noción de centralidad que
intenta describir esta medida en ese conjunto de datos.

2. Los siete miembros de un equipo de atletismo tienen las marcas de tiempo (en minutos)
para una cierta carrera: 4,2; 4,3; 4,7; 4,9; 5,0; 5,1; 9,0. ¿Cuál es el tiempo medio?
Empleando la expresión (2.3), el tiempo medio serı́a:

7
X
-I I

xi
22

i=1 4.2 + 4.3 + 4.7 + 4.9 + 5.0 + 5.1 + 9.0


µ= = = 5.31 min.
20

7 7

3. En la sección 2.2.2.2 se elaboró la distribución de frecuencias para el número de palabras


leı́das en 15 segundos por una muestra de 120 disléxicos ¿Cuántas palabras leyeron en
promedio esa muestra de disléxicos?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 50

Recordando la tabla de frecuencias tenemos:

X: N°de palabras leı́das 25 26 27 28 29 30


f: Número de disléxicos 56 24 16 12 10 2

Si se entiende que la frecuencia simplemente resume las veces que se repite una
determinada observación entonces, empleando la expresión (2.2), el número promedio
de palabras leı́das serı́a:
EP

120
X
xi
UD

i=1 25 ∗ 56 + 26 ∗ 24 + 27 ∗ 16 + 28 ∗ 12 + 29 ∗ 10 + 30 ∗ 2
x= = = 26.2 palabras
120 120

es decir, en esta muestra, en promedio se leyeron 26.2 palabras.


A
4. Evaluando el rendimiento de los alumnos matriculados en la asignatura de estadı́stica
IM

1, se tomó como referencia el semestre pasado en el cual hubieron dos secciones: A de


-L

52 alumnos y B de 42 alumnos. En la práctica 1 la sección A obtuvo en promedio 12.3


S

y la sección B obtuvo 14.6 ¿Cuál fue la nota promedio de las dos secciones en conjunto
PU

en la práctica 1?
M

Del problema tenemos que: n1 = 52, x1 = 12.3, n2 = 42, x2 = 14.6, luego empleando
CA

la expresión (2.5), la nota promedio de las dos secciones en conjunto serı́a:

2
X
ni xi
i=1 52 ∗ 12.3 + 42 ∗ 14.6
x= = = 13.33
X2 52 + 42
ni
i=1

2.3.1.2. Media para datos agrupados


E

Si los datos (asumiendo que son de una muestra) están agrupados en una tabla de
AD

frecuencias agrupada de k intervalos, entonces la media se define de la siguiente manera:

P
k
fc .xc
c=1
x= (2.7)
P
k
fc
c=1

donde: fc =frecuencia del intervalo “c” xc =Marca de clase del intervalo “c”
Para ilustrar el cálculo de la media con datos agrupados, lo haremos para el problema
-I I

visto en la sección 2.2.2.6 donde se elaboró la distribución de frecuencias agrupadas de la


22

variable X: número de veces que un cliente va al supermercado para una muestra de 51


20

clientes y que aparece en la Tabla 2.5. Con esa información nos preguntamos: ¿Cuántas veces
en promedio acuden los clientes al supermercado en el periodo de dos semanas?
Recordando la tabla de frecuencias agrupadas tenemos:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 51

X : N°de veces que un cliente Marca de Número de clientes


compra en el supermercado clase (Xc ) (frecuencia)
[1 − 3⟩ 2 9
[3 − 5⟩ 4 14
[5 − 7⟩ 6 15
[7 − 9⟩ 8 5
[9 − 11⟩ 10 3
EP

[11 − 13⟩ 12 3
UD

[13 − 15] 14 2
Total 51
A
Empleando la expresión (2.7), el número medio de veces que un cliente acude al
IM

supermercado serı́a:
-L

P
k
S

fc .xc
PU

c=1 2 ∗ 9 + 4 ∗ 14 + 6 ∗ 15 + 8 ∗ 5 + 10 ∗ 3 + 12 ∗ 3 + 14 ∗ 2
x= = = 5.84 veces
P
k 51
M

fc
c=1
CA

2.3.1.3. Mediana
Una desventaja de la media es su sensibilidad a valores extremos, es decir una puntuación
excepcional puede afectarla de manera drástica. La mediana resuelve, en gran medida, esa
desventaja.
Dado un conjunto de datos ordenados (en forma creciente o decreciente), la mediana es
el dato o valor que ocupa la posición central del conjunto, es decir que a lo sumo, la mitad
de los valores de los datos están por debajo de ella y la otra mitad por arriba de ella.
E

En la definición anterior el término “a lo sumo”, es importante pues significa que dentro


AD

del conjunto de datos no puede existir más del 50 % de ellos que sean estrictamente menores
que la mediana ni más del 50 % de ellos que sean estrictamente mayores que la mediana, y
que por lo tanto la mediana está ubicada en una posición tal que por ninguno de los dos
lados se excede este porcentaje del 50 %.
Para calcular la mediana de un conjunto de datos no agrupados, se sigue el siguiente
procedimiento:

1. Ordenar los valores (en forma creciente o decreciente).


-I I

n
2. Calcular el “ı́ndice de posición”(i) de la mediana, haciendo: i =, donce n es el número
22

2
de datos del conjunto. El ı́ndice de posición es un valor que nos indica en dónde (en
20

cuál término) se encuentra la mediana. Si i no es entero, se redondea. El valor entero


inmediato mayor que i, indica la posición de la mediana, por lo tanto la mediana será el
término que ocupe dicha posición. Si el valor de i es entero, quiere decir que la mediana
está ubicada entre la posición i y la posición i + 1, por lo tanto la mediana será el
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 52

promedio de los valores de los datos ubicados en los lugares i e i + 1.

Algunas propiedades de la mediana son:

La mediana tiene las mismas unidades de la variable de estudio.

Un conjunto de datos sólo tiene una mediana.

La mediana no es afectada por valores extremos (pequeños o grandes). Esta propiedad


hace que la mediana sea una medida de tendencia central muy recomendable en aquellos
conjuntos de datos donde existen valores atı́picos, que pueden desvirtuar el uso de la
EP

media aritmética como promedio.


UD

Para ilustrar el cálculo de la mediana veamos los siguientes ejemplos:

1. Encuesta a 11 recién egresados del programa de administración y les pregunta sobre el


A
sueldo mensual inicial (en soles) que recibirán y obtiene los siguientes datos: 3540, 3550,
IM

3310, 3480, 3490, 3520, 3650, 3925, 3355, 3450, 3480. Calcule e interprete la mediana
-L

de dichos sueldos.
S
PU

Primero ordenamos los sueldos:


M

3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3925
CA

11
Al tener 11 datos, calculamos el ı́ndice de posición de la mediana: i = = 5.5, como
2
“i” no es entero, se redondea, entonces i=6 e indica que la mediana será el dato que
ocupe dicha posición, entonces la mediana es 3490 soles. Eso quiere decir que a lo sumo
el 50 % de estos egresados gana menos de 3490 soles y a lo sumo el 50 % gana por
encima de esa cantidad.

2. Se toma una muestra de 12 personas y se les pregunta por su edad (años) y los datos
obtenidos son: 28,12,34,15,13,21,18,20,30,26,19,25 ¿Cuál es la mediana de estas edades?
E

Interprete.
AD

Primero ordenamos las edades:

12 13 15 18 19 20 21 25 26 28 30 34

12
Al tener 12 datos, calculamos el ı́ndice de posición de la mediana: i = = 6, como el
2
valor de “i” es entero, quiere decir que la mediana está ubicada entre la posición “6”
y la posición “7”, por lo tanto la mediana será el promedio de los valores de los datos
ubicados en los lugares “6” y “7”, es decir:
-I I
22

20 + 21
mediana = = 20.5
20

Eso quiere decir que a lo sumo el 50 % de estas personas tiene menos de 20.5 años y a
lo sumo el 50 % tiene más de 20.5 años.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 53

3. En la sección 2.2.2.2 se elaboró la distribución de frecuencias para el número de palabras


leı́das en 15 segundos por una muestra de 120 disléxicos ¿Cuál es la mediana del número
de palabras leı́das por esa muestra de disléxicos?
Recordando la tabla de frecuencias tenemos:

X: N°de palabras leı́das 25 26 27 28 29 30


f: Número de disléxicos 56 24 16 12 10 2

Debemos tener claro que en la distribución elaborada, los datos ya están ordenados.
EP

Tampoco olvide que la frecuencia simplemente resume las veces que se repite una
UD

determinada observación. Al tener 120 datos, calculamos el ı́ndice de posición de la


120
mediana: i = = 60, como el valor de “i” es entero, quiere decir que la mediana
2
está ubicada entre la posición “60” y la posición “61”, por lo tanto la mediana será el
promedio de los valores de los datos ubicados en los lugares “60” y “61”, es decir:
A
IM

26 + 26
mediana = = 26
-L

2
S
PU

Eso quiere decir que a lo sumo el 50 % de estas personas disléxicas leyeron menos de
26 palabras y a lo sumo el 50 % leyó más de 26 palabras.
M
CA

2.3.1.4. Mediana para datos agrupados


Si los datos están agrupados en una tabla de frecuencias agrupada de k intervalos, entonces
la mediana se define de la siguiente manera:
n 
− fA
M ediana = l +  2 ∗i (2.8)
f

donde:
E

l=lı́mite inferior del intervalo que contiene a la mediana


AD

n=número total de datos o sumatoria de las frecuencias


f=frecuencia del intervalo que contiene a la mediana
fA =frecuencia acumulada hasta el intervalo anterior al que contiene a la mediana
i=ancho del intervalo en que se encuentra la mediana(TIC)

Para ilustrar el cálculo de la mediana con datos agrupados, lo haremos para el problema
visto en la sección 2.2.2.6 donde se elaboró la distribución de frecuencias agrupadas de la
variable X: número de veces que un cliente va al supermercado para una muestra de 51
-I I

clientes y que aparece en la Tabla 2.5. Con esa información nos preguntamos: ¿Cuál es la
22

mediana del número de veces que los clientes acuden al supermercado?


20

Recordando la tabla de frecuencias agrupadas tenemos:


Debemos tener claro que en la distribución elaborada, los datos ya están ordenados. Al
51
tener 51 datos, calculamos el ı́ndice de posición de la mediana: i = = 25.5, como “i” no es
2
entero, se redondea, entonces i=26 e indica que la mediana será el dato o término que ocupa
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 54

X : N°de veces que un cliente Marca de Número de clientes


compra en el supermercado clase (Xc ) (frecuencia)
[1 − 3⟩ 2 9
[3 − 5⟩ 4 14
[5 − 7⟩ 6 15
[7 − 9⟩ 8 5
[9 − 11⟩ 10 3
EP

[11 − 13⟩ 12 3
UD

[13 − 15] 14 2
Total 51
A
dicha posición. Si entendemos que la frecuencia indica la cantidad de datos que están en un
IM

intervalo entonces por la posición de la mediana se deduce que ella está ubicada en el tercer
-L

intervalo: [5 − 7⟩. Ahora sabiendo en qué intervalo está ubicada la mediana empleamos la
S

expresión (2.8) para hallarla:


PU

n   
51
M

− fA − 23
M ediana = l +  2 ∗i=5+
 2

 ∗ 2 = 5.33 (2.9)
CA

f 15

Eso quiere decir que a lo sumo el 50 % de estos clientes van al supermercado menos de
5.33 veces y a lo sumo el 50 % acude más de 5.33 veces.
2.3.1.5. Moda
La moda de un conjunto de datos es el valor que se presenta con mayor frecuencia. Cuando
dos valores se presentan con la misma frecuencia y ésta es la más alta, ambos valores son
modas, por lo que el conjunto de datos es bimodal. Cuando más de dos valores se presentan
E

con la misma frecuencia y ésta es la más alta, esos valores son modas, por lo que el conjunto de
AD

datos es multimodal. Cuando ningún valor se repite (o se destaca por su mayor frecuencia),
se dice que no hay moda.
Algunas propiedades de la moda son:

La moda tiene las mismas unidades de la variable de estudio.

No es afectada por valores extremos.

Puede ser determinada para datos numéricos o cualitativos.


-I I

Para Datos agrupados: La moda es el punto medio o marca de clase del intervalo con
22

mayor frecuencia.
20

Para ilustrar el cálculo de la moda veamos los siguientes ejemplos:

1. Encuesta a 11 recién egresados del programa de administración y les pregunta sobre


el sueldo mensual inicial (en soles) que recibirán y obtiene los siguientes datos: 3540,
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 55

3550, 3310, 3480, 3490, 3520, 3650, 3925, 3355, 3450, 3480. Calcule e interprete la moda
de dichos sueldos.
El sueldo que más se repite es 3480 soles (2 veces), por tanto esa es la moda, es decir,
el sueldo más frecuente de esos egresados es 3480 soles.

2. Se toma una muestra de 12 personas y se les pregunta por su edad (años) y los datos
obtenidos son: 28,12,34,15,13,21,18,20,30,26,19,25 ¿Cuál es la moda de estas edades?
Como no hay edad que se repita, en este conjunto no hay moda.
EP

3. Para ilustrar el cálculo de la moda con datos agrupados, lo haremos para el problema
visto en la sección 2.2.2.6 donde se elaboró la distribución de frecuencias agrupadas de
UD

la variable X: número de veces que un cliente va al supermercado para una muestra de


51 clientes y que aparece en la Tabla 2.5. Con esa información nos preguntamos: ¿Cuál
es la moda del número de veces que los clientes acuden al supermercado? Interprete.
A
Recordando la tabla de frecuencias agrupadas tenemos:
IM

X : N°de veces que un cliente


-L

Marca de Número de clientes


S

compra en el supermercado clase (Xc ) (frecuencia)


PU

[1 − 3⟩ 2 9
M

[3 − 5⟩ 4 14
CA

[5 − 7⟩ 6 15
[7 − 9⟩ 8 5
[9 − 11⟩ 10 3
[11 − 13⟩ 12 3
[13 − 15] 14 2
Total 51
E

Para datos agrupados, la moda es la marca de clase del intervalo con mayor frecuencia,
AD

en este caso el intervalo con mayor frecuencia es [5 − 7⟩ y su marca de clase es 6, por


tanto la moda es 6 veces, es decir, en promedio, el número de veces más frecuente de
asistencia de estos clientes al supermercado es 6.

2.3.2. Medidas de variabilidad


Para realizar una descripción de una distribución de datos no es suficiente contar con
las medidas de tendencia central, es necesario también obtener información acerca de la
dispersión de los datos, es decir que las medidas de variabilidad permiten conocer el grado
-I I

de homogeneidad o heterogeneidad de un conjunto de datos, evaluando la dispersión que


22

presentan entre ellos.


20

Estas medidas nos proporcionan información adicional que nos permite juzgar la
confiabilidad de nuestra medida de tendencia central. Si los datos están muy dispersos la
posición central es menos representativa de los datos, como un todo, que cuando estos se
agrupan más estrechamente alrededor de la media.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 56

En muchas situaciones es importante conocer la variabilidad de los datos. Por ejemplo,


entre dos procesos de elaboración de planchas de acero del mismo espesor, es más eficiente
aquél cuyas medidas de espesor tienen una menor variabilidad. Igualmente, entre dos negocios
con similar promedio de ganancias, quien tiene aversión al riesgo preferirá aquél que tenga
menor variabilidad, pues ası́ puede evitar una posible ganancia muy baja o negativa.
Algunas de las medidas de variabilidad más usuales son:
2.3.2.1. Rango, amplitud o recorrido
Dado un conjunto de datos, el rango (R) es la diferencia entre el mayor y el menor, es
EP

decir: R = Xmax − Xmin . Se dice que el rango mide la dispersión total en el conjunto de
datos.
UD

Es una medida que puede ser muy útil, dada la facilidad con que se calcula; pero en
ciertas ocasiones puede dar una idea equivocada de la variabilidad de los datos, ya que no
toma en cuenta cómo se distribuyen los datos entre el valor más grande y más pequeño; por
A
ejemplo, cuando uno de los datos difiere significativamente de los demás (se ve influido por
IM

los valores extremos).


-L

Con los datos de la encuesta a 11 recién egresados del programa de administración donde
S

les preguntó sobre el sueldo mensual inicial (en soles) que recibieron y obtuvo los siguientes
PU

datos: 3540, 3550, 3310, 3480, 3490, 3520, 3650, 3925, 3355, 3450, 3480. El rango de sueldos
M

serı́a: R = Xmax − Xmin =3925-3310=615 soles.


CA

Suponga que uno de los recién egresados haya tenido $10 000 como sueldo inicial, entonces
el rango será: 10 000-3310 =6690 en lugar de 615. Un valor ası́ no serı́a muy descriptivo de la
variabilidad de los datos ya que 10 de los 11 sueldos se encuentran entre 3310 y 3650 soles.
Las descripciones más comprensibles de la dispersión son aquellas que tratan con la
desviación promedio con respecto a alguna medida de tendencia central. Veremos dos medidas
que nos dan una distancia promedio con respecto a la media de la distribución: la varianza
y la desviación estándar.
2.3.2.2. Varianza y desviación estándar o tı́pica
E

La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está
AD

basada en la diferencia entre el valor de cada observación (xi ) y la media. A la diferencia


entre cada valor xi y la media (x cuando se trata de una muestra, µ cuando se trata de
una población) se le llama desviación respecto de la media. Si se trata de una muestra,
una desviación respecto de la media se escribe (xi − x), y si se trata de una población se
escribe (xi − µ). Para calcular la varianza, estas desviaciones respecto de la media se elevan
al cuadrado.
Si los datos son de una población, el promedio de estas desviaciones elevadas al cuadrado
-I I

es la varianza poblacional. La varianza poblacional se denota como σ 2 . En una población en


22

la que hay N observaciones y la media poblacional es µ, la varianza poblacional se define


20

como sigue:
P
N
(xi − µ)2
i=1
σ2 = (2.10)
N
En la mayor parte de las aplicaciones de la estadı́stica, los datos a analizar provienen
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 57

de una muestra. Cuando se calcula la varianza muestral, lo que interesa es emplearla para
estimar la varianza poblacional σ 2 . Aunque una explicación detallada está más allá del alcance
de estos apuntes, es posible demostrar que si la suma de los cuadrados de las desviaciones
respecto de la media se divide entre n − 1, en lugar de entre n, la varianza muestral que se
obtiene constituye un estimador no sesgado de la varianza poblacional (Anderson y Sweeney,
2008). Por esta razón, la varianza muestral, que se denota por s2 , se define como sigue:

P
n
(xi − x)2
2 i=1
s = (2.11)
EP

n−1
UD

Las unidades de la varianza son las unidades de la variable en estudio, pero elevadas al
cuadrado (pesos al cuadrado, unidades al cuadrado, etc.) lo que hace que no sean claras o
fáciles de interpretar. Ante ese inconveniente surge la desviación estándar.
La desviación estándar se define como la raı́z cuadrada positiva de la varianza.
A
Continuando con la notación adoptada para la varianza muestral y para la varianza
IM

poblacional, se emplea s para denotar la desviación estándar muestral y σ para denotar


-L

la desviación estándar poblacional. La desviación estándar se obtiene de la varianza como


S
PU

sigue: v
uN
uP
M

u 2
t i=1 (xi − µ)
CA

Desviación estándar poblacional = σ = (2.12)


N
v
uP
u n
u (x − x)2
t i=1 i
Desviación estándar muestral = s = (2.13)
n−1
La desviación estándar es más fácil de interpretar que la varianza debido a que la
desviación estándar se expresa en las mismas unidades de la variable o que los datos y
su interpretación es “en promedio los valores se alejan de la media en . . . unidades”
(el alumno debe ser capaz de adaptar esta expresión al escenario que enfrenta).
E

Para ilustrar el cálculo de la varianza y la desviación estándar, lo haremos con el problema


AD

donde se encuesta a 11 recién egresados del programa de administración y se les pregunta


sobre el sueldo mensual inicial (en soles) que reciben y donde se obtuvieron los siguientes
datos: 3540, 3550, 3310, 3480, 3490, 3520, 3650, 3925, 3355, 3450, 3480.
Tratándose de una muestra calculamos la media empleando la expresión (2.2) y tenemos:

3540 + 3550 + . . . + 3480


x= = 3522.73 soles
11

Ahora para calcular la varianza se emplea la expresión (2.11):


-I I
22

(3540 − 3522.73)2 + . . . + (3480 − 3522.73)2 262468.18


s2 = = = 26246.82 soles2
20

11 − 1 10

Luego la desviación estándar será: s = 26246.82 = 162 soles, es decir, que en promedio
lo que se aleja o desvı́a algunos de esos sueldos respecto del sueldo promedio de la muestra
es 162 soles.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 58

2.3.2.3. Varianza y desviación estándar o tı́pica para datos agrupados


Si los datos (asumiendo que son de una muestra) están agrupados en una tabla de
frecuencias agrupada de k intervalos, entonces la varianza se define de la siguiente manera:

P
k
(xc − x)2 .fc
c=1
s2 = (2.14)
n−1
donde:
fc =frecuencia del intervalo respectivo xc =Marca de clase del intervalo respectivo
EP

n=número total de datos x=media muestral


UD

La desviación estándar “s” es la raı́z cuadrada positiva de la varianza.


En caso se trabaje con datos de una población deberá hacer los cambios respectivos según
se explicó en la sección 2.3.2.2.
Para ilustrar el cálculo de la varianza y desviación estándar con datos agrupados, lo
A
haremos para el problema visto en la sección 2.2.2.6 donde se elaboró la distribución de
IM

frecuencias agrupadas de la variable X: número de veces que un cliente va al supermercado


-L

para una muestra de 51 clientes y que aparece en la Tabla 2.5.


S
PU

Empleando los valores de dicha Tabla, primero se calcula la media de los datos agrupados
(ver sección 2.3.1.2), que resultó ser: x = 5.84 veces. Ahora aplicando la expresión (2.14)
M

calculamos la varianza:
CA

(2 − 5.84)2 ∗ 9 + . . . + (14 − 5.84)2 ∗ 2 502.7456


s2 = = = 10.06 veces2
51 − 1 50

Ası́ la desviación estándar será: s = 10.06 = 3.17 veces, es decir, que en promedio lo que
se aleja o desvı́a el número de veces que alguno de esos clientes va al supermercado respecto
del número de veces promedio es 3.17.
La desviación estándar encuentra mayor utilidad cuando se le emplea para comparar el
grado de dispersión de dos o más conjuntos de datos, ası́ el que tiene la mayor desviación
estándar, tiene la mayor dispersión o variabilidad siempre y cuando los conjuntos de datos
E
AD

tengan iguales unidades de medida y medias aritméticas iguales o similares.


Pero si los conjuntos de datos a comparar tienen diferentes unidades de medida y/o
medias aritméticas diferentes, entonces deberı́amos calcular el coeficiente de variación para
poder comparar las variabilidades.
2.3.2.4. Coeficiente de variación
Es una medida relativa de variabilidad que no presenta unidades y que expresa el número
de veces que la desviación estandar contiene a la media. Generalmente se expresa como
-I I

porcentaje. Esta medida estadı́stica se utiliza para comparar conjuntos de datos que tienen
diferentes unidades o cuyos valores medios son muy diferentes.
22
20

Según se trate de una muestra o población, el coeficiente de variación será:

s σ
CV = ∗ 100 % : muestral CV = ∗ 100 % : poblacional (2.15)
x µ
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 59

Para ilustrar el cálculo del coeficiente de variación, suponga que el gerente de operaciones
de un servicio de paqueterı́a desea adquirir una nueva flotilla de vehı́culos. Cuando los
paquetes se guardan con eficiencia en el interior de los vehı́culos durante la preparación de
las entregas, se deben considerar dos restricciones principales: el peso (en libras) y el volumen
(en pies cúbicos) de cada paquete. Ahora suponga que en una muestra de 200 paquetes, el
peso promedio es 26,0 libras con una desviación estándar de 3.9 libras. Además, suponga que
el volumen promedio de cada paquete es 8.8 pies cúbicos con una desviación estándar de 2.2
pies cúbicos. ¿Cómo se puede comparar la variación del peso y el volumen?
Como las unidades de medida difieren para las restricciones de peso y volumen, si el
EP

gerente de operaciones desea comparar las fluctuaciones en estas medidas, debe considerar la
UD

variabilidad relativa en ambos tipos de medidas. Para el peso, el coeficiente de variación es


3.9 2.2
CVp = ∗100 % = 15 %; para el volumen, el coeficiente de variación es CVv = ∗100 % =
26 8.8
25 %. Entonces, con relación a la media, el volumen de un paquete es mucho más variable
que su peso.
A
IM

Veamos otro ejemplo: un inversionista potencial piensa adquirir acciones en una de dos
compañı́as, A o B, listadas en la Bolsa de Valores de Lima. Si ninguna de las compañı́as
-L

ofrece dividendos a sus clientes y ambas tienen igual clasificación en términos de crecimiento
S
PU

potencial, el posible inversionista quizá considere la variabilidad de ambas acciones para


ayudar en la decisión de inversión. Ahora suponga que cada acción en la compañı́a A ha
M

promediado $ 50 en el último año, con una desviación estándar de $ 10. Además, suponga
CA

que durante el mismo periodo el precio promedio de las acciones en la compañı́a B fue de $ 12
con una desviación estándar de $4. ¿Cómo puede determinar el inversionista cuáles acciones
son más variables?
En términos de las desviaciones estándar, el precio de las acciones de A parece más
variable que el de las acciones de B. Sin embargo como los precios promedios por acción de
las dos compañı́as son tan diferentes, serı́a más conveniente que el inversionista potencial
considerara la variabilidad en precio respecto al promedio a fin de examinar la relación:
variabilidad / estabilidad de ambas acciones. Para la compañı́a, el coeficiente de variación
E

$10
es CVA = ∗ 100 % = 20 % y para la compañı́a B, el coeficiente de variación es
AD

$50
$4
CVB = ∗ 100 % = 33.3 %. Entonces, en relación con la media, el precio de las acciones B
$12
es mucho más variable que el de las acciones A.
Algunas propiedades del coeficiente de variación son:

No aplicable cuando la distribución tiene media cero..

Se afecta su valor cuando se suma una constante K a cada observación de un conjunto


de datos.
-I I
22

No cambia de valor cuando se multiplica por una constante K a cada una de las
20

observaciones.

Según el grado de dispersión una distribución de datos puede calificarse como:


CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 60

Coeficiente de variabilidad (en %) Calificación


0 Completamente homogénea
0< CV <10 Muy homogénea
10≤ CV <15 Regularmente homogénea
15≤ CV <20 Regularmente variable
20≤ CV ≤ 25 variable
CV>25 muy variable
EP
UD

2.3.3. Teorema de Chebyshev


Este teorema es un concepto útil para comprender o entender el valor de la desviación
estándar de un conjunto de datos. El teorema de Chebyshev, desarrollado por el
matemático ruso Chebyshev, se define como sigue: la proporción mı́nima de los valores de
A
IM

un conjunto que se encuentran dentro de k desviaciones estándar con respecto a la media del
conjunto es igual a:
-L

1
S

1− , (2.16)
k2
PU

donde k es cualquier positivo mayor que 1. Para ilustrar el uso del teorema de Chebyshev,
M

suponga que en una muestra de personas, la edad promedio es 30 años y la desviación estándar
CA

es 5 años. ¿Cuántas personas como mı́nimo tienen entre 20 y 40 años?, ¿y entre 22 y 38 años?
20 − 30
En el caso del intervalo de 20 a 40 se observa que: = −2, es decir 20 está dos
5
40 − 30
desviaciones estándar debajo de la media y que = 2, es decir, 40 está dos desviaciones
5
estándar por encima de la media, por lo tanto ese intervalo representa 2 desviaciones estándar
con respecto de la media, es decir, k=2. Entonces mediante el teorema de Chebyshev se
encuentra que:

1 1
1− = 1 − 2 = 0.75,
k2 2
E
AD

esto quiere decir, que de ese grupo de personas, por lo menos el 75 % tienen entre 20 y 40
años.
22 − 30
En el caso del intervalo de 22 a 38 se observa que: = −1.6, es decir 22 está
5
38 − 30
1.6 desviaciones estándar debajo de la media y que = 1.6, es decir, 38 está 1.6
5
desviaciones estándar por encima de la media, por lo tanto ese intervalo representa 1.6
desviaciones estándar con respecto de la media, es decir, k=1.6. Entonces mediante el teorema
de Chebyshev se encuentra que:
-I I

1 1
1− =1− = 0.61,
22

k 2 1.62
20

esto quiere decir, que de ese grupo de personas, por lo menos el 61 % tienen entre 22 y 38
años.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 61

2.3.4. Medidas de forma


Describen la forma general de la distribución de un conjunto de datos. En concreto se
intentan describir dos caracterı́sticas de la misma: la asimetrı́a (sesgo) y el apuntamiento (o
curtosis).
2.3.4.1. Coeficiente de asimetrı́a
Mide si el conjunto de datos está más disperso por encima de la media o por debajo de
ella. Si hay más datos dispersos por encima de la media, el coeficiente de asimetrı́a es positivo.
Si hay más datos dispersos por debajo de la media, el coeficiente de asimetrı́a es negativo. Si
EP

los datos están igualmente dispersos por encima y por debajo de la media, el coeficiente de
UD

asimetrı́a es igual a cero.


El coeficiente de asimetrı́a (en una muestra) puede calcularse mediante la siguiente
fórmula:  3
X n
n xi − x
Sk = (2.17)
A
(n − 1) (n − 2) s
IM

i=1

Otra forma usual para medir la asimetrı́a es mediante es el coeficiente de asimetrı́a de


-L

Pearson:
S
PU

3 ∗ (media − mediana)
Sk = (2.18)
M

s
CA

Con esta última expresión se busca describir la forma como se distribuyen los datos de un
conjunto, comparando la media y la mediana. Si ambas medidas son iguales, por lo general
se considera que los datos son simétricos (o con sesgo cero), por el contrario, los datos o
su distribución es asimétrica o sesgada, es decir: si la media excede a la mediana, los datos
se describen como sesgados a la derecha, o con sesgo positivo (el coeficiente de asimetrı́a es
positivo). Si la mediana excede a la media, los datos suelen llamarse sesgados a la izquierda,
o con sesgo negativo (el coeficiente de asimetrı́a es negativo).
El sesgo positivo surge cuando la media aumenta debido a algunos valores grandes y poco
usuales; el sesgo negativo ocurre cuando la media se reduce debido a algunos valores muy
E
AD

pequeños. Los datos son simétricos cuando en realidad no hay valores extremos en ninguna
dirección, de tal manera que la presencia de valores grandes y pequeños se equilibran.
La figura 2.8 muestra la forma de tres conjuntos de datos. Los datos en el cuadro (a) tienen
sesgo negativo o a la izquierda. Se observa una cola larga o distorsión hacia la izquierda,
causada por valores en extremo pequeños. Estos valores tan pequeños jalan a la media hacia
abajo y resulta menor que la mediana. Los datos en el cuadro (b) son simétricos; cada mitad
de la curva es la imagen de espejo de la otra mitad. Los valores grandes y pequeños se
compensan y la media es igual a la mediana. Los datos en el cuadro (c) tienen un sesgo
-I I

positivo o a la derecha. Se observa una cola larga o distorsión hacia la derecha, causada por
22

valores muy grandes. Estos valores en extremo grandes, jalan la media hacia arriba y resulta
20

mayor que la mediana.


Algunas propiedades del coeficiente de asimetrı́a son:

No depende de las unidades de medida de las variables, por tanto, no tiene unidades.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 62

Figura 2.8: Distribuciones con diferentes asimetrı́as o sesgos.


EP

Es invariante ante el cambio de escalas.


UD

Para ilustrar el cálculo e interpretación del coeficiente de asimetrı́a, supongamos que una
muestra de digitadoras de textos reveló que su rapidez media de tecleo es de 87 palabras por
minutos, con una mediana de 73. La desviación estándar es de 16.9 palabras por minuto.
A
Para calcular el coeficiente de asimetrı́a empleamos la expresión (2.18) y tenemos:
IM

3 ∗ (media − mediana) 3 ∗ (87 − 73)


-L

Sk = = = 2.49
s 16.9
S
PU

es decir, como teóricamente el coeficiente de asimetrı́a generalmente se encuentra entre


-3 y +3, el valor de 2.49 indica un grado importante de asimetrı́a con sesgo positivo en la
M

distribución de la rapidez de tecleo. Algunas operadoras muy rápidas hacen que la media sea
CA

mayor que la mediana.


2.3.4.2. Coeficiente de curtosis
Analiza el grado de concentración que presentan los valores alrededor de la zona central
de la distribución es decir, estudia la distribución de frecuencias en la “zona central”. La
mayor o menor concentración de frecuencias alrededor de la media y en la zona central de
la distribución, dará lugar a una distribución más o menos apuntada. Ası́ es por lo que a la
curtosis también se le llama apuntamiento.
Se estudia la curtosis de una distribución, comparándola con una distribución “tipo”, que
E
AD

tomaremos como referencia. Es la llamada distribución normal o campana de Gauss.


En la figura 2.9 podemos apreciar que: si el valor de la curtosis es positivo, se dice
que los datos tienen una distribución leptocúrtica (es más apuntada o puntiaguda que la
distribución normal); en caso contrario, si la curtosis es negativa, se dice que los datos tienen
una distribución platicúrtica (es menos apuntada o puntiaguda que la distribución normal).
Si la curtosis es cero, entonces los datos se distribuyen siguiendo una distribución normal, y
se dice que en este caso la distribución es mesocúrtica.
El coeficiente de curtosis (en una muestra) puede calcularse mediante la siguiente fórmula:
-I I

n
X
22

(xi − x)4
20

i=1
k= −3 (2.19)
n ∗ s4

Algunas propiedades del coeficiente de curtosis son:

No depende de las unidades de medida de las variables, por tanto, no tiene unidades.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 63

Figura 2.9: Distribuciones con diferentes grados de curtosis.


EP
UD

Se aplica a distribuciones unimodales, que sean simétricas o ligeramente simétricas.

2.3.5. Medidas de posición A


Establecen una relación entre un valor de la variable y la ubicación o localización que
IM

este valor tiene dentro del conjunto analizado o distribución de valores de la variable.
-L

2.3.5.1. Cuartiles y percentiles


S
PU

Los cuartiles son las medidas de posición “no central” que se utilizan con mayor
frecuencia y se emplean sobre todo para resumir o describir las propiedades de conjuntos
M

grandes de datos numéricos. Mientras que la mediana es un valor que parte el arreglo ordenado
CA

por la mitad (a lo sumo 50.0 % de las observaciones son menores, y 50.0 % son mayores), los
cuartiles son medidas descriptivas que parten los datos ordenados en cuatro partes.
Entonces, dado un conjunto de datos ordenados en forma ascendente, los cuartiles son
los valores que dividen en cuatro partes iguales al conjunto.
El primer cuartil, Q1 (o 25 % percentil) es un valor tal que, a lo sumo, la cuarta parte
de los datos es menor que Q1 , y, a lo sumo, las tres cuartas partes son mayores. El segundo
cuartil, Q2 , (o 50 % percentil) coincide con la mediana. El tercer cuartil, Q3 , (o 75 % percentil)
es un valor tal que, a lo sumo, las tres cuartas partes de los datos son menores que Q3 , y, a
E

lo sumo, la cuarta parte es mayor.


AD

Los percentiles de un conjunto de datos ordenado dividen al conjunto en cien partes


iguales. Ası́ como hay 3 cuartiles que separan un conjunto de datos en cuatro partes iguales,
también se tienen 99 percentiles, que se denotan como: P1 , P2 , . . . , P99 , los cuales separan los
datos ordenados en 100 grupos, con aproximadamente el 1 % de los valores en cada grupo.
Los cuartiles y percentiles son ejemplos de cuantiles o fractiles, que dividen los datos en
grupos con aproximadamente el mismo número de valores en cada grupo (Triola, 2018).
2.3.5.2. Cálculo de los percentiles (cuartiles) para datos no agrupados.
-I I

No hay un acuerdo universal sobre un procedimiento para encontrar cuartiles, tampoco


22

existe un solo procedimiento para calcular percentiles, y las diferentes técnicas a menudo dan
20

resultados diferentes. Si utiliza una calculadora o un software que incluyan cuartiles, puede
obtener resultados que difieran un poco de las respuestas obtenidas utilizando la forma con
que se procederá en este texto.
El procedimiento de determinación de percentiles (cuartiles) será de la siguiente manera:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 64

1. Ordenar los datos de manera ascendente.


 p 
2. Calcular el siguiente ı́ndice de posición: i = ∗ n, en donde p es el percentil de
100
interés y n es la cantidad de datos.

Si i no es entero, se redondea. El valor entero inmediato mayor que i, indica la


posición del p − ésimo percentil.
Si el valor de i es entero, el p − ésimo percentil es el promedio de los valores de
los datos ubicados en los lugares i e i + 1.
EP

 p 
Como los cuartiles son percentiles especı́ficos para calcularlos hallaremos: i = ∗n ,
100
UD

teniendo en cuenta que para el primer cuartil, Q1 , (o 25 % percentil), p=25; y para el tercer
cuartil, Q3 , (o 75 % percentil), p=75.
Para ilustrar el cálculo e interpretación de los cuartiles suponga que tenemos el número de
rifas que han vendido 10 alumnos: 19,10,17,28,15,27,12,16,26,23. Para hallar los cuartiles de
A
IM

este conjunto de datos seguimos el procedimiento explicado lı́neas arriba. Primero debemos
ordenarlos:
S -L

10,12,15,16,17,19,23,26,27,28.
PU
M

Hallamos el ı́ndice de posición


 del primer cuartil o sea del percentil 25 (p = 25), entonces:
 p  25
CA

i= ∗n = ∗ 10 = 2.5, como el valor de i no es entero, entonces se redondea


100 100
al valor entero inmediato mayor: i = 3, es decir, el percentil 25 o primer cuartil, es el valor
ubicado en la posición i = 3, entonces: Q1 = 15 rifas, es decir, que a lo sumo el 25 % de estas
personas vendió menos de 15 rifas y el 75 % vendió por encima de esa cantidad.
Hallamos el ı́ndice de posición del segundo cuartil (la mediana) o sea del percentil 50
(p = 50), entonces:  
 p  50
i = ∗n = ∗ 10 = 5, como el valor de i es entero, el percentil 50 o la
100 100
mediana, es el promedio de los valores ubicados en los lugares i = 5 e i + 1 = 6, entonces:
17 + 19
E

Q2 = = 18 rifas, es decir, que la mitad de estos alumnos vendió menos de 18 rifas y


AD

2
el 50 % vendió por encima de esa cantidad.
Hallamos el ı́ndice
 de posición
 del tercer cuartil o sea del percentil 75 (p = 75), entonces:
 p  75
i= ∗n = ∗ 10 = 7.5, como el valor de i no es entero, entonces se redondea
100 100
al valor entero inmediato mayor: i = 8, es decir, el percentil 75 o tercer cuartil, es el valor
ubicado en la posición i = 8, entonces: Q3 = 26 rifas, es decir, que a lo sumo el 75 % de estas
personas vendió menos de 26 rifas y el 25 % vendió por encima de esa cantidad.
Veamos otro ejemplo para el cálculo e interpretación de los cuartiles, suponga que tenemos
-I I

las edades de 12 personas: 28,12,34,15,13,21,18,20,30,26,19,25. Para hallar los cuartiles de


22

este conjunto de edades seguimos el procedimiento explicado lı́neas arriba. Primero debemos
20

ordenar los datos:

12,13,15,18,19,20,21,25,26,28,30,34

Hallamos el ı́ndice de posición del primer cuartil o sea del percentil 25 (p = 25), entonces:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 65

 p   
25
i= ∗n = ∗ 12 = 3, como el valor de i es entero, el percentil 25 o primer
100 100
cuartil, es el promedio de las edades ubicadas en los lugares i = 3 e i + 1 = 4, entonces:
15 + 18
Q1 = = 16.5 años, es decir, que el 25 % de estas personas tiene menos de 16.5 años
2
y el 75 % tiene una edad superior.
Hallamos el ı́ndice de posición del segundo cuartil (la mediana) o sea del percentil 50
(p = 50), entonces:  
 p  50
i = ∗n = ∗ 12 = 6, como el valor de i es entero, el percentil 50 o la
100 100
mediana, es el promedio de las edades ubicadas en los lugares i = 6 e i + 1 = 7, entonces:
EP

20 + 21
Q2 = = 20.5 años, es decir, que la mitad de estas personas tiene menos de 20.5 años
2
UD

y el 50 % tiene una edad superior.


Hallamos el ı́ndicede posición
 del tercer cuartil o sea del percentil 75 (p = 75), entonces:
 p  75
i= ∗n = ∗ 12 = 9, como el valor de i es entero, el percentil 75 o tercer
100 100
A
cuartil, es el promedio de las edades ubicadas en los lugares i = 9 e i + 1 = 10, entonces:
26 + 28
IM

Q3 = = 27 años, es decir, que el 75 % de estas personas tiene menos de 27 años y el


2
-L

25 % tiene una edad superior.


S

2.3.5.3. Cálculo de los percentiles y cuartiles para datos agrupados


PU

(Se sugiere revisar Agurto y Alvarado, 2009, capı́tulo 2, pp. 51,54).


M
CA

2.3.5.4. Diagrama de caja-bigotes


Este diagrama representa una forma del análisis exploratorio de un conjunto de datos cuyo
enfoque está basado en el denominado resumen de cinco números, el cual está constituı́do
por: el mı́nimo valor, el máximo valor, el primer cuartil, el segundo cuartil (mediana) y el
tercer cuartil.
Mediante este diagrama se visualiza fácilmente cómo están distribuidos los datos de un
conjunto.
Dado un conjunto de datos se siguen los siguientes pasos para construir un diagrama
caja-bigotes:
E
AD

1. Definir el resumen de cinco números del conjunto, es decir, identificar el valor mı́nimo,
el máximo y calcular los tres cuartiles (Q1 , Q2 , Q3 ).

2. Se dibuja una caja cuyos extremos se localicen en el primer y tercer cuartil. Esto
significa que la caja contiene el 50 % de los datos centrales.

3. En el punto dónde se localiza la mediana ( Q2 ) se traza una lı́nea horizontal o vertical


según se represente la caja en posición vertical u horizontal respectivamente. (Si se
-I I

quisiera comparar dos poblaciones a veces también se representa la media dentro de la


22

caja.)
20

4. Trazar las lı́neas denominadas bigotes. Si dibujáramos la caja horizontalmente,


entonces el bigote inferior (contiene el 25 % inferior de los datos) va desde el extremo
izquierdo de la caja hasta el mı́nimo valor y el bigote superior (contiene el 25 % superior
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 66

de los datos) va desde el extremo derecho de la caja hasta el máximo valor del conjunto
de datos.

Luego de dibujar el diagrama de caja-bigotes podemos identificar qué datos del conjunto
analizado son atı́picos. Para saberlo se sigue el siguiente proceso:

1. Calcular el rango intercuartı́lico: RIC = Q3 − Q1 .

2. Calcular 1.5*RIC.

3. Calcular Q1 − 1.5 ∗ RIC y Q3 + 1.5 ∗ RIC


EP
UD

4. Los datos que sean menores que Q1 − 1.5 ∗ RIC y mayores que Q3 + 1.5 ∗ RIC, se
consideran observaciones atı́picas.

Para ilustrar la construcción de un diagrama de caja-bigote y la detección de datos atı́picos


A
de un conjunto supongamos que se ha recolectado la estatura (en cm) de 15 alumnos de una
IM

determinada asignatura: 172,178,179,150,169,171,172,181,182,183,175,176,177,184,184.


-L

Primero ordenamos los datos para facilitar el análisis:


S
PU

150,169,171,172,172,175,176,177,178,179,181,182,183,184,184.
M

A continuación seguimos el procedimiento ya descrito: Definir el resumen de cinco números


CA

del conjunto, es decir, identificar el valor mı́nimo, el máximo y calcular los tres cuartiles
(Q1 , Q2 , Q3 ). La estatura mı́nima es 150 y la máxima es 184. Enseguida hallamos los cuartiles
de las estaturas:
Hallamos el ı́ndice
 de  posición del primer cuartil o sea del percentil 25 (p = 25), entonces:
 p  25
i= ∗n = ∗ 15 = 3.75, como el valor de i no es entero, entonces se redondea
100 100
al valor entero inmediato mayor: i = 4, es decir, el percentil 25 o primer cuartil, es el valor
ubicado en la posición i = 4, entonces: Q1 = 172 cm.
Hallamos el ı́ndice de posición del 
segundo
 cuartil (la mediana) o sea del percentil 50
 p  50
E

(p = 50), entonces: i = ∗n = ∗ 15 = 7.5, como el valor de i no es entero,


100 100
AD

entonces se redondea al valor entero inmediato mayor: i = 8, es decir, el percentil 50 o


segundo cuartil, es el valor ubicado en la posición i = 8, entonces: Q2 = 177 cm.
Hallamos el ı́ndice
 de
 posición del tercer cuartil o sea del percentil 75 (p = 75), entonces:
 p  75
i= ∗n= ∗ 15 = 11.25, como el valor de i no es entero, entonces se redondea
100 100
al valor entero inmediato mayor: i = 12, es decir, el percentil 75 o tercer cuartil, es el valor
ubicado en la posición i = 12, entonces: Q3 = 182 cm.
En la figura 2.10 se muestra el diagrama de caja-bigotes para los datos analizados:
-I I

Para identificar qué estaturas del conjunto analizado son atı́picas seguimos el proceso ya
22

descrito:
20

1. Calcular el rango intercuartı́lico: RIC = Q3 − Q1 = 182 − 172 = 10cm.

2. Calcular 1.5 ∗ RIC = 1.5 ∗ 10 = 15.

3. Calcular Q1 − 1.5 ∗ RIC = 172 − 15 = 157cm. y Q3 + 1.5 ∗ RIC = 182 + 15 = 197cm.


CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 67

Min Max
Q1 Q2 Q3
EP
UD

150 155 160 165 170 175 180 185

Estatura (cm)
A
IM

Figura 2.10: Diagrama caja-bigote de las estaturas de 15 estudiantes.


S -L
PU

4. Las estaturas menores que 157 cm y mayores que 197 cm., se consideran estaturas
atı́picas. Como se aprecia la única estatura atı́pica es 150 cm.
M
CA

2.3.5.5. Puntuaciones z
El valor o puntuación z, sirve para comparar valores de un mismo conjunto de datos o
para comparar valores de distintos conjuntos de datos (Triola, 2018).
Una puntuación z (o valor estandarizado) se calcula convirtiendo un valor a una escala
estandarizada, como se establece en la siguiente definición. Utilizaremos ampliamente las
puntuaciones z en el capı́tulo 5 y en capı́tulos posteriores, ya que son muy importantes.
Una puntuación z es el número de desviaciones estándar que un valor de la variable de
estudio se encuentra por arriba o por debajo de la media de la variable. Se calcula utilizando
las siguientes expresiones:
E
AD

Según se trate de una muestra o población, la puntuación z será:

x−x x−µ
z= : muestral o z= : poblacional (2.20)
s σ

Los valores de z mayores a cero corresponden a observaciones cuyo valor es mayor a la


media del conjunto, y valores de z menores que cero corresponden a observaciones cuyo valor
es menor a la media. Si el valor de z es cero, el valor de la observación correspondiente es
igual a la media.
-I I

El valor z de cualquier observación se interpreta como una medida relativa de la


localización de la observación en el conjunto de datos. Por tanto, observaciones de dos
22
20

conjuntos de datos distintos que tengan el mismo valor z tienen la misma localización relativa;
es decir, se encuentran al mismo número de desviaciones estándar de la media. Algunas
caracterı́sticas de las puntuaciones z son:

Se expresan como números sin unidades de medida.


CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 68

El valor de un dato es significativamente bajo, si su puntuación z es menor o igual a -2


o el valor es significativamente alto si su puntuación z es mayor o igual a +2.

A continuación presentamos el siguiente ejemplo para entender cómo utilizar las


puntuaciones z para hacer comparaciones.
Natalia rindió dos exámenes parciales, uno de contabilidad y otro de matemáticas. En
contabilidad obtuvo 82 puntos (sobre una base de 100) y en matemáticas, obtuvo 86. Los
resultados del examen de contabilidad tuvieron una media de 72 y una desviación estándar
de 8. Los resultados del examen de matemáticas tuvieron una media de 68 y una desviación
EP

estándar de 12. ¿En qué examen obtuvo Natalia un mejor resultado, en comparación con el
UD

resto de sus compañeros que rindieron estos exámenes?


El puntaje obtenido por Natalia en ambos exámenes puede estandarizarse convirtiéndolos
en puntuaciones z como vemos a continuación
El puntaje en contabilidad:
A
IM

x−x 82 − 72
z= = = 1.25
s 8
S -L

El puntaje en matemáticas:
PU

x−x 86 − 68
M

z= = = 1.50
s 12
CA

Dado que ambos puntajes z son positivos, Natalia obtuvo un puntaje superior al promedio
en ambos exámenes, pero dado que su puntaje z para el examen de matemáticas es más alto
que su puntaje z para el examen de contabilidad, obtuvo mejor resultado en el examen de
matemáticas.
2.4. Problemas propuestos
1. Complete los espacios en blanco con la palabra o frases correctas.

La . . . . . . . . . . . . se mide en las mismas unidades que la media aritmética y que los


E

datos.
AD

Las medidas de . . . . . . . . . . . . indican la forma de la distribución de un conjunto de


datos. Dos ejemplos de estas medidas son . . . . . . . . . . . .
Si un conjunto de datos tiene una distribución leptocúrtica se dice que tiene un
coeficiente de curtosis. . . . . . . . . . . . .
El sı́mbolo σ denota la . . . . . . . . . . . . de una . . . . . . . . . . . . y s denota la . . . . . . . . . . . . de
una . . . . . . . . . . . .
-I I

Si un conjunto de datos tiene una distribución con curtosis igual a cero se dice
que tiene una distribución denominada . . . . . . . . . . . .
22
20

El sı́mbolo µ denota la media de una . . . . . . . . . . . . y x denota la media de una


............
La expresión de la desviación estándar como porcentaje de la media es . . . . . . . . . . . .
Dos ejemplos de medidas de forma de una distribución de datos son:. . . . . . . . . . . . . . .
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 69

La . . . . . . . . . . . . . . . . . . . . . . . . es la raı́z cuadrada positiva de la . . . . . . . . . . . . . . . . . .


En un conjunto de datos, la mediana coincide con el cuartil. . . . . . . . . . . . , el
percentil 75 % coincidirá con el cuartil. . . . . . . . . . . . ; y el percentil 25 % coincidirá
con el cuartil. . . . . . . . . . . .

2. Diez expertos clasificaron un producto de nuevo desarrollo con una calificación del 1 al
5. Sus calificaciones fueron las siguientes: 3.4 3.5 4.1 2.8 2.6 2.9 3.2 3.6
3.8 4.0. Determine la media, la mediana, el rango, la desviación estándar, la varianza,
el coeficiente de variación. Establezca, ası́ mismo, al menos una conclusión acerca de la
EP

dispersión.
UD

3. Se han tomado 8 mediciones de la temperatura (en grados Farenheit) de diferentes


hornos usados en la fabricación de semiconductores, con los siguientes resultados:

953 955 957 950 951 954 948 955


A
IM

Mostrando cálculos:
S -L

a) Hallar la moda y los cuartiles.


PU

b) Obtener la media y desviación tı́pica e interprételas.


M
CA

c) ¿Cuánto podrı́a aumentar la temperatura máxima sin que cambie la mediana?

4. Calcule el rango, la varianza y la desviación estándar de las observaciones de la muestra


que se presentan a continuación: 63 45 39 55 69 21 50 25 33 25

5. Los siguientes datos son precios de renta mensual (en dólares) para una muestra de 10
departamentos en el centro de una ciudad grande, y una muestra de 10 departamentos
en un suburbio:

Centro de la ciudad : 955, 1000, 985, 980, 940, 975, 965, 999, 1247, 1119
E

Suburbio : 750, 775, 725, 705, 694, 725, 690, 745, 575, 800
AD

a) Para cada conjunto de datos, calcule e interprete la media, la mediana, la amplitud,


la varianza, la desviación estándar y el coeficiente de variación.
b) ¿Qué son más variables: los precios de renta de los departamentos del centro de
la ciudad o los precios de renta de los departamentos de los suburbios?

6. El promedio global de cierta asignatura es de 80 puntos. Los 60 hombres que llevaron


la asignatura obtuvieron un promedio de 84 puntos, en cambio las mujeres sólo
-I I

consiguieron una media de 70 puntos. ¿Cuántas mujeres cursaron la asignatura?


22
20

7. Suponga que una pequeña empresa de negocios emplea a ocho personas que gana entre
300 y 350 dólares al mes. El dueño de la empresa se remunera ası́ mismo con 1250
dólares al mes, y reporta al público en general que el salario medio en su empresa es
de 430 dólares al mes. Responda lo siguiente:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 70

a) Aritméticamente ¿Es posible que 8 empleados ganen entre 300 y 350 dólares y que
uno gane 1250 dólares al mes y que la media sea 430 dólares? Explique.
b) Estadı́sticamente ¿Se basarı́a en el sueldo promedio para describir la tendencia
central del conjunto de sueldos de esta empresa? ¿si o no? ¿por qué?

8. El supervisor de una carrera utiliza un cronómetro para determinar los tiempos de


llegada de los competidores. Cuando calcula el tiempo promedio de los tres primeros
finalistas, resulta que éste fue de 4.25 minutos. Después de revisar su cronómetro,
descubre que para su desgracia, lo puso en marcha cuando marcaba 15 segundos en
EP

lugar de cero, por lo cual cada uno de los tiempos fue medido con un excedente de 15
UD

segundos ¿ cuál fue entonces el tiempo medio correcto de los tres primeros finalistas?

9. Se conoce la información respecto de los ingresos de los trabajadores de dos secciones


de una empresa, A y B. El ingreso promedio de los trabajadores de la sección A es de
A
$950000 con una desviación tı́pica de $98000. Los trabajadores de la sección B tienen
IM

un ingreso promedio de $1200000 con una desviación tı́pica de $180000 ¿En cuál de las
-L

dos secciones existe una dispersión o variabilidad relativa mayor?


S
PU

10. Una compañı́a área estudia el peso de equipaje para cada pasajero. Para un grupo
grande de viajeros en vuelos nacionales, la media es 21.3 kg, con una desviación estándar
M

de 4.54 kg. Para un grupo grande de pasajeros de vuelos al extranjero, la media es 35.4
CA

kg y la desviación estándar, 6.8 kg. ¿Cuáles son más variables, los pesos de los equipajes
de los pasajeros de vuelos nacionales o los de vuelos al extranjero?

11. El promedio de sueldos de los empleados de una fábrica es una cierta cantidad. ¿Qué
contestarı́a usted, como jefe de personal, ante una queja de que nadie deberı́a ganar
por debajo del promedio, sea cual fuere éste?

12. Exprese cuál es la relación entre la mediana y la media de un conjunto de datos si dicho
conjunto tiene distribución con sesgo positivo. Explique a que se debe dicha relación.
E
AD

13. A continuación se presenta el número de cambios de aceite para los últimos 8 dı́as en
un taller de mantenimiento, localizado en San Borja: 41, 15, 39, 54, 31, 15, 56, 33.
Determine e interprete la media, la mediana,la moda, varianza, desviación estándar de
los datos.

14. ¿Cuál serı́a el valor modal que reportarı́a para un conjunto de observaciones si hay un
total de:

a) 10 observaciones (todas diferentes). b) 6 observaciones (todas iguales).


-I I
22

15. De un ejemplo de un conjunto de datos que sea trimodal, explicando por qué lo es.
20

16. Un hospital emplea 200 personas en su cuerpo de enfermeras. De ese personal, 50 son
ayudantes de enfermera, 50 son enfermeras prácticas y 100 son enfermeras registradas.
Las primeras reciben un sueldo de 615 soles mensuales, las segundas ganan 835 soles
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 71

mensuales, y las últimas 955 soles mensuales ¿Cuál es el sueldo promedio mensual
general?

17. Dados los siguientes conjuntos de datos:

Conjunto A: 7 5 11 8 3 6 2 1 9 8
Conjunto B: 7 5 6 6 6 4 8 6 9 3

Se le pide:
EP

a) Para cada conjunto hallar las medidas de tendencia central, variabilidad y posición.
UD

b) ¿Están sesgados los datos del conjunto A? Si es ası́, ¿cómo?


c) ¿Están sesgados los datos del conjunto B? Si es ası́, ¿cómo?

18. Una empresa productora de cı́tricos constata que las producciones de dos fincas son de
A
calidad distinta aunque utilizan la misma especie de árboles. Después de notar que los
IM

dos tipos de suelo son distintos (la finca A está constituida de suelo fino y homogéneo
-L

mientras que la finca B tiene una mezcla de suelo fino y suelo más grueso) decide hacer
S
PU

mediciones de la densidad del suelo en las dos fincas:


M

FINCA A: 85.9 88.2 90.4 91.1 92.7 92.8


CA

FINCA B: 86.8 87.5 90.3 91.4 92.4 92.6

a) En base a la variabilidad relativa: ¿Qué son más variables: las densidades del suelo
de la finca A o las densidades del suelo de la finca B respecto de sus promedios
respectivos?
b) Considerando los datos de la muestra de la finca A ¿Entre qué valores deberán caer
al menos 75 % de dichas observaciones, de acuerdo con el teorema de Chebyshev?

19. Complete con la palabra o frase correcta: Si un conjunto de datos tiene un


E
AD

coeficiente de asimetrı́a igual a cero se dice que tiene una distribución denominada
...............................

20. El siguiente histograma presenta la distribución de las notas en la práctica 1 de los


alumnos matriculados el semestre pasado en la asignatura Estadı́stica 2:
-I I
22
20
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 72

a) Calcule e interprete el promedio (o media), la mediana y la moda de las notas en


dicha práctica.
b) Calcule e interprete la desviación estándar de las notas en dicha práctica.
c) ¿Cuál es la nota que excede a la del 75 % de los alumnos?

21. Un alumno al realizar un estudio sobre el número de hijos de las familias que viven en
cierta urbanización olvidó anotar información en la tabla siguiente:

N° de N° de Frecuencia Porcentaje Frecuencia


EP

hijos familias relativa ( %) acumulada


UD

(frecuencia)
0 10 0.25
1 22
2 30
A
IM

3 0.15
4
S -L
PU

a) Complete la tabla.
b) Calcule e interprete en términos del problema:la media, la mediana,la moda y la
M

desviación estándar de los datos.


CA

c) Interprete, en términos del problema, el valor sombreado.

22. Un departamento de producción aplica un procedimiento de muestreo para verificar la


calidad de artı́culos recién elaborados. Para ello, recurre a la siguiente regla de decisión
en una estación de inspección: si una muestra de 14 artı́culos tiene varianza mayor que
0.005, se debe parar la lı́nea de producción y efectuar reparaciones necesarias. Suponga
que acaban de reunirse los siguientes datos:
E

3,43 3,45 3,43 3,48 3,52 3,50 3,39


AD

3,48 3,41 3,38 3,49 3,45 3,51 3,50

¿Debe detenerse la producción? ¿Por qué?

23. Una medida útil para comparar la dispersión relativa de dos o más distribuciones de
datos, si están en distintas unidades, es el. . . . . . . . . . . . . . . . . . . . . . . .

24. Una muestra de ciudadanos de la tercera edad revelo que su ingreso anual de jubilación
tiene una media de 1340 soles. Puesto que la media se basa en una muestra, se dice que
-I I

1340 soles es un. . . . . . . . . . . . . . . . . . . . . . . .


22
20

25. . . . . . . . . . . . . . . . . . . . . . . . . es una medida de resumen que describe una caracterı́stica de


toda una población.

26. La suma de las desviaciones de un conjunto de datos, respecto de su media aritmética


es igual a . . . . . . . . . . . . . . . . . . . . . . . .
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 73

27. La relación entre la media, la mediana y la moda, que se cumple en una distribución
asimétrica hacia la izquierda es . . . . . . . . . . . . . . . . . . . . . . . .

28. ¿Qué puede decirse de una distribución en la que s = 0?

29. Se quiere comparar la variación en los precios anuales de acciones que se venden a
menos de 10 dólares y la variación en los precios de aquellas que se venden por arriba
de 60 dólares. El precio promedio de las acciones que se venden a menos de 10 dólares
es 5,25 dólares, y la desviación estándar es 1,52 dólares. El precio medio de las acciones
que se negocian a más de 60 dólares es 92,50 dólares, y su desviación estándar; 5,28
EP

dólares. ¿Qué medida de variabilidad emplearı́a para hacer la comparación? ¿por qué
UD

emplearı́a dicha medida? Calcúlela e interprete sus resultados.

30. ¿Puede la varianza de un conjunto (suponga que el conjunto es una muestra) tener un
valor negativo? ¿si o no? ¿por qué?
A
IM

31. La producción media de papa, en toneladas, fue de 4000 con varianza de 3600 para el
departamento de Cuzco, mientras que para el departamento de Puno fue de 10 000 con
-L

varianza de 1440000 ¿en qué departamento se puede decir que la producción de papa
S
PU

es más homogénea?
M

32. El sueldo promedio de un conjunto (población) de gerentes, de diversas empresas, es


CA

de 11000 soles con una varianza de 2000. ¿Cuál serı́a el nuevo promedio y la nueva
varianza si se aumenta en 810 soles el salario de cada gerente? Demuestre y explique
cómo obtiene sus respuestas.

33. Para un determinado conjunto (muestra) de salarios, se obtuvo una media de $52,32 y
una desviación estándar de $10,25. Por efectos de recesión en el mercado, la gerencia
de la empresa se ve obligada a aplicar un factor de descuento k (0 < k < 1), a cada uno
de los salarios originales, es decir, cada salario queda multiplicado por esa constante
k. ¿Cuál serı́a el nuevo salario promedio y la nueva desviación estándar? ¿Cuál serı́a
E

el nuevo coeficiente de variación del conjunto de salarios? Demuestre y explique cómo


AD

obtiene sus respuestas.

34. Dados los siguientes datos calcular el primer, segundo y tercer cuartil.

955, 1000, 985, 980, 940, 975, 965, 999, 1247, 1119

35. El propietario de una pequeña empresa tiene asignado un salario de 4000 euros
mensuales. Los salarios de sus empleados son: 500, 550, 600, 700, 725, 770, 785, 800,
-I I

800, 825, 850, 900 930, 950, 1000, 1200, 1800. Considerando todos los salarios (incluido
el del propietario):
22
20

a) Determine cuál es el “resumen de cinco números” y empléelo para representar las


observaciones mediante un diagrama de caja-bigotes.
b) Calcule el rango intercuartı́lico y explique si existen datos atı́picos. En caso de que
existan diga cuáles son.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 74

c) Observando el diagrama de caja-bigotes que ha elaborado, explique qué tipo de


sesgo tiene la distribución de los salarios.

36. El sueldo medio de los obreros de una fábrica es de $286.

a) ¿Que porcentajes de hombres y mujeres trabajan en la fábrica si sus sueldos medios


respectivos son $300 y $260?
b) Si el 60 % de los obreros tienen menos de 30 años y percibe el 20 % del total de
los sueldos, ¿cuánto es el sueldo medio de los obreros de al menos 30 años?
EP

37. En una empresa el sueldo promedio por trabajador es de 360 dólares mensuales. Los
UD

trabajadores manuales constituyen el 40 % del total de trabajadores y perciben el 25 %


del monto total de la planilla, ¿cuánto recibe en promedio cada trabajador manual?

38. Se tiene una muestra con media de 30 y desviación estándar de 5. Determine qué
A
proporción o porcentaje de los datos de dicha muestra se encuentran dentro de cada
IM

uno de los siguientes intervalos:


-L

a) 20 a 40 c) 22 a 38 e) 12 a 48
S
PU

b) 15 a 45 d ) 18 a 42
M
CA

39. La media de recorrido de un lote de neumáticos es de 45.000 millas y la desviación


estándar 5.000 millas ¿En qué intervalo de recorridos se encuentra al menos el 86 % de
los neumáticos?

40. Se sabe que el 84 % de los sueldos en una compañı́a fluctúa entre 3000 y 8000 soles.
Sabiendo que la media de los sueldos es de 5500 soles, determine la desviación estándar.

41. La distribución de datos cuyo coeficiente de asimetrı́a es positivo se dice que tiene una
distribución. . . . . . . . . . . .
E

42. La distribución de datos cuyo coeficiente de curtosis es negativo se dice que tiene una
AD

distribución. . . . . . . . . . . .

43. Una distribución de datos que tiene curtosis positiva se le denomina. . . . . . . . . . . .

44. Si las unidades de la variable a analizar son pulgadas, entonces las unidades de la
desviación estándar estarán en . . . . . . . . . . . . y las de la varianza en . . . . . . . . . . . .

45. Una empresa de jardinerı́a ofrece sus servicios por vı́a telefónica. A continuación se
indica el número de citas que se hizo en cada una de las últimas 25 horas de llamadas:
-I I

9 5 2 6 5 6 4 4 7 2 3 6 3 4 4 7 8 4 4 5 5 4 8 3 3
22
20

a) Elabore una tabla de distribución de frecuencias y un diagrama de barras para


este conjunto de datos.
b) Elabore la distribución de frecuencias relativas y la distribución de porcentajes y
sus respectivos diagramas de barras. Comente sobre la distribución de los datos.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 75

46. El gerente de un almacén esta interesado en el número de veces que un cliente compra
en su almacén durante un periodo de dos semanas. Las respuestas de 36 clientes fueron:

5 6 3 11 4 4 5 6 4
2 6 6 6 7 1 8 6 14
15 4 1 2 4 1 7 10 6
5 12 9 5 4 3 12 4 5
EP

Se le pide elaborar una tabla de distribución de porcentajes de estos datos no


agrupados y represéntala mediante un diagrama de barras y comente como se agrupan
UD

o distribuyen las respuestas de los clientes.

47. Dos modos que usan los empleados para ir a trabajar diariamente son el transporte
público y el automóvil. A continuación vemos unas muestras de tiempos de cada modo.
A
Las cifras están en minutos.
IM
-L

Transporte público: 28 29 32 37 33 25 29 32 41 34
S
PU

Automóvil: 29 31 33 32 34 30 31 32 35 33
M

a) Calcule la media de la muestra del tiempo que se lleva en cada modo de transporte.
CA

b) Calcule la desviación estándar de la muestra para cada modo de transporte.


c) Con base en los resultados de los apartados a) y b),¿Qué modo de transporte debe
preferirse? Explique sus razones.

48. El gobierno desea averiguar si el número medio de hijos por familia ha descendido
respecto de la década anterior. Para ello ha encuestado a 50 familias respecto al número
de hijos, y ha obtenido los siguientes datos:
E

0 0 1 2 1 1 2 2 2 1
AD

2 2 2 2 2 2 2 2 2 2
2 2 2 3 2 2 3 2 3 3
3 3 2 3 3 3 3 3 3 3
4 4 3 4 3 4 5 6 4 4

a) ¿Cuál es la variable en estudio? ¿De qué tipo es? ¿qué nivel de medición tiene?
b) Defina la frecuencia en términos del problema.
-I I

c) Elabore una distribución de frecuencias no agrupadas de los datos. Grafique la


22

distribución de porcentajes correspondiente.


20

d ) ¿Cuál es el porcentaje de familias que tiene como máximo 2 hijos?


e) ¿Cuál es el número de familias que tienen más de 1 hijo, pero menos de 4?
f ) ¿Qué porcentaje de familias tienen más de 3 hijos?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 76

Una empresa ofrece asesorı́a financiera para solucionar deudas atrasadas con tarjetas
de crédito. Se realizó una encuesta a 12 jóvenes entre 18 y 25 años con una deuda en
su tarjeta de crédito por poco más de $ 5000, registrándose los montos (en dólares) que
cada uno de ellos pagó como abono a sus saldos el mes pasado:

439, 453, 457, 459, 475, 483, 526, 563, 566, 579, 599, 644.

a) Calcule e interprete la desviación estándar de los pagos de la muestra.


b) Calcule e interprete el primer cuartil, la mediana y el tercer cuartil de los pagos.
EP
UD

49. Se dice que la mediana de un conjunto de datos numéricos no se ve afectada por la


presencia de valores extremos. Explique esto a través de un ejemplo.

50. Dado un conjunto de datos, explique qué es el percentil 83 %


A
IM

51. Se sabe que el 84 % de los sueldos en una compañı́a fluctúa entre 3000 y 8000 soles.
También se sabe que el 75 % de los sueldos en dicha compañı́a fluctúa entre 3500 y 7500
-L

soles. Determine la media y la desviación estándar de dichos sueldos.


S
PU

52. Una muestra de las compras de varios clientes de una gran tienda de almacenes dio por
M

resultado la siguiente muestra de datos:


CA

X 1 2 3 4 5
f 6 10 9 8 7

X = número de artı́culos comprados por cliente.


Responda lo siguiente:

a) ¿Qué representa el “2”?


b) ¿Qué representa el “10”?
E
AD

c) ¿Cuántos clientes fueron necesarios para obtener esta muestra?


d ) ¿Cuántos artı́culos fueron comprados en total por los clientes de esta muestra?
e) ¿Cuál es el mayor número de artı́culos comprados por un cliente?
f ) Represente la distribución de frecuencias mostrada a través de un diagrama de
barras.

53. Se identificó una muestra de estudiantes del campus que poseı́a automóviles y se registró
las marcas de los mismos. A continuación se presenta la muestra que se obtuvo ( T
-I I

=Toyota, N=Nissan , Chevrolet=C, Ford=F, Volkswagen=V):


22
20

TFTNTCFTVTFVNCNNTNCCTFTFTNCVNTCTTFNT
VCTFFCTTCTTFTF

a) ¿Cuál es la variable en estudio?


CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 77

b) Elabore una distribución de frecuencias para dicha variable.


c) Trace un diagrama de barras que muestre los porcentajes para los distintos valores
de la variable en estudio.

54. Se registraron durante 40 dı́as, el número de habitaciones ocupadas en el hotel América,


y los datos se resumieron en la siguiente distribución de frecuencias:

X frecuencia Frecuencia Porcentaje frecuencia frecuencia Porcentaje


relativa ( %) acumulada relativa acumulado
EP

acumulada
UD

25 0.05
26 5
27 37.5
A
28 24
IM

29 0.30
S -L

30
PU
M

a) Defina la variable de interés (X), de qué tipo es y qué nivel de medición tiene.
CA

b) Defina la “frecuencia” en términos del problema.


c) Complete la distribución de frecuencias.
d ) Calcule e interprete la media, mediana y desviación estándar de los datos.
e) Interprete, en términos del problema, los valores sombreados.

55. Los siguientes datos ordenados son las edades de 50 personas que compraron televisores
plasma en la sucursal de Hiraoka en San Miguel, la semana anterior:
E

22 23 26 27 28 28 29 29 30 30
AD

30 31 31 31 32 32 32 32 33 33
33 34 35 35 35 35 36 36 36 36
37 37 37 38 40 40 40 41 41 41
42 43 44 45 46 48 50 51 55 56

Se le pide:
-I I

a) Elaborar una tabla de distribución de frecuencias agrupadas.


22

b) Calcular e interpretar la media, la mediana y la desviación estándar de los datos


20

agrupados.
c) Calcular e interpretar los cuartiles de los datos agrupados.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 78

56. En el diseño de encuestas de presupuestos familiares es crucial entre otros datos, el


número de hijos menores de edad en las familias del paı́s. Una encuesta sobre una
muestra piloto de 200 familias con matrimonios que llevaban menos de 10 años de
casados, proporcionaba la siguiente información:

N° de hijos 0 1 2 3 4
N° de familias 23 84 69 19 5

Mostrando los cálculos, halle e interprete en términos del problema:


EP

a) La media de los datos analizados. (2p)


UD

b) La mediana de los datos analizados. (2p)


c) La moda de los datos analizados. (1p)

57. El consumo de agua (en metros cúbicos.) de una muestra de hogares de Lima
A
Metropolitana se distribuye como sigue:
IM
-L

Consumo de agua (m3 ) [20 − 25⟩ [25 − 30⟩ [30 − 35⟩ [35 − 40⟩ [40 − 45]
S

N° de hogares 18 45 54 36 27
PU

Mostrando los cálculos, halle e interprete en términos del problema:


M
CA

a) La media de los datos analizados.


b) La mediana de los datos analizados.
c) La moda de los datos analizados.

58. Las edades de una muestra de los pacientes atendidos en la sección de Rayos X del
Hospital Almenara son las siguientes:

23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 67 92 85 55 76
E
AD

52 10 64 75 78 25 80 95 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61

Se le pide:

a) Elaborar una tabla de distribución de frecuencias agrupadas.


-I I

b) Represente gráficamente la distribución elaborada.


22

c) Calcular e interpretar la media, la mediana y la desviación estándar de los datos


20

agrupados.
d ) Calcular e interpretar los cuartiles de los datos agrupados.

59. Si se tienen los siguientes 46 datos ordenados:


CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 79

1, 76 1, 80 1, 90 2, 00 2, 05 2, 10 2, 18 2, 19 2, 21 2, 30 2, 34 2, 38
2, 40 2, 41 2, 46 2, 49 2, 55 2, 59 2, 60 2, 63 2, 64 2, 64 2, 68 2, 68
2, 71 2, 74 2, 76 2, 77 2, 80 2, 80 2, 85 2, 87 2, 89 2, 93 2, 93 3, 01
3, 05 3, 10 3, 11 3, 15 3, 22 3, 30 3, 35 3, 40 3, 50 3, 53

Se le pide:

a) Elaborar una tabla de distribución de frecuencias agrupadas.


b) Represente gráficamente la distribución elaborada.
EP

c) Calcular e interpretar la media, la mediana y la desviación estándar de los datos


UD

agrupados.
d ) Calcular e interpretar los cuartiles de los datos agrupados.

60. La distribución del contenido de jugo (en mililitros o ml.) en una muestra de cajas de
A
IM

la marca “refresh” es la siguiente:


S -L
PU

Volumen de jugo (ml.) [280 − 290⟩ [290 − 300⟩ [300 − 310⟩ [310 − 320⟩ [320 − 330]
N° de cajas 24 37 44 31 14
M
CA

Mostrando los cálculos, halle e interprete en términos del problema:

a) La media de los datos analizados.


b) La mediana de los datos analizados.
c) La moda de los datos analizados.

61. Se realizó una encuesta sobre los diferentes medios tecnológicos domésticos y el empleo
de ellos por parte de personas de 12 años a más. Los siguientes datos ordenados
representan el tiempo (en horas) de empleo de computadoras personales en casa durante
E

una semana para una muestra de 50 personas:


AD

1.5 3.4 4.1 5.7 8.8 1.5 3.5 4.2 5.9 9.2
1.6 3.7 4.3 5.9 9.5 2.0 3.7 4.4 6.1 10.3
2.8 3.9 4.7 6.1 10.4 3.0 3.9 4.8 6.1 10.8
3.1 4.0 5.4 6.2 11.1 3.1 4.1 5.6 7.1 12.1
3.1 4.1 5.7 7.2 12.9 3.3 4.1 5.7 7.6 14.8
-I I

a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
22

la “frecuencia” en términos del problema.


20

b) Elabore una distribución de frecuencias agrupadas.


c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1. ¿Qué porcentaje de personas emplea 11 horas o más, sus computadoras
personales en casa, durante una semana?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 80

c.2. ¿por debajo de qué cantidad de tiempo, emplean sus computadoras, el 52 %


de las personas?
c.3. Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente.
d ) Calcule e interprete en términos del problema: la media, la mediana, la moda, la
varianza y la desviación estándar de los datos agrupados. ¿Qué tipo de sesgo tiene
la distribución?
e) Si acaba de calcular la media y la desviación estándar del conjunto de datos
EP

agrupados, emplee el teorema de Chebyshev para definir en qué intervalo se


encuentra como mı́nimo el 60 % de los datos.
UD

f ) ¿Cuál es el tiempo de empleo que es excedido por el 75 % de las personas?

62. El volumen (en litros) de jugo de sauco que una máquina de llenado automático deposita
A
en botellas de 2 litros se controla periódicamente. La semana pasada se seleccionó una
IM

muestra aleatoria de 50 botellas llenadas por esta máquina y se registró el volumen


-L

de jugo de sauco en cada una de esas botellas. A continuación se presentan los datos
S

ordenados, aproximados a tres cifras decimales:


PU
M

1.894 1.908 1.938 1.941 1.941 1.947 1.951 1.951 1.953 1.957
CA

1.960 1.963 1.967 1.969 1.971 1.973 1.975 1.977 1.978 1.980
1.981 1.982 1.983 1.984 1.986 1.988 1.992 1.994 1.996 1.997
2.003 2.005 2.010 2.012 2.013 2.014 2.015 2.023 2.025 2.029
2.031 2.036 2.038 2.052 2.057 2.065 2.066 2.075 2.086 2.109

a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de la variable de estudio.
E
AD

c) Basándose en la distribución que ha elaborado, diga aproximadamente:


c.1 ¿Qué porcentaje de botellas contiene menos de 1.956 litros de jugo de sauco?
c.2 ¿Cuál es el mı́nimo volumen de jugo de sauco que contiene el 26 % de las
botellas analizadas?
c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente
c.4 Calcule e interprete en términos del problema: la media, la mediana y la
-I I

desviación estándar de los volúmenes agrupados.


22

c.5 Si compara la mediana y la media de los volúmenes agrupados ¿Qué tipo de


20

sesgo tiene la distribución de los mismos?


c.6 ¿Cuál es intervalo simétrico, alrededor del volumen promedio, en el que se
encuentra como mı́nimo el contenido del 73 % de las botellas analizadas?
c.7 Calcule exactamente el volumen que es excedido por el 25 % de las botellas.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 81

c.8 Calcule exactamente el volumen que es excedido por el 75 % de las botellas.


c.9 Construir una ojiva de porcentajes.

63. Se han tomado muestras de 64 sacos de un alimento balanceado para ganado que han
enviado dos proveedores, para medir el porcentaje de proteı́na. En la siguiente tabla se
muestran los valores obtenidos.

59.3 59.4 59.5 60.2 60.3 60.5 61.4 61.5


62.3 62.5 63.7 64.0 64.0 64.0 64.2 64.4
EP

64.4 64.6 64.8 64.9 65.3 65.5 66.0 66.3


UD

66.5 66.9 67.1 67.4 67.6 67.9 68.1 68.2


68.5 68.6 69.2 69.9 69.9 70.7 70.9 71.1
71.9 72.2 72.7 73.5 73.7 74.1 74.7 75.5
A
IM

76.0 76.7 77.2 77.4 77.7 78.0 78.5 78.6


-L

79.4 79.8 80.1 81.6 81.9 82.7 82.9 84.5


S
PU

a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
M
CA

b) Elabore una distribución de frecuencias agrupadas de los datos de la variable de


estudio.
c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1 ¿Qué porcentaje de sacos tienen un porcentaje de proteı́na menor a 77.3?
c.2 ¿Cuál es el porcentaje de proteı́na mı́nimo que contiene el 18 % de los sacos?
c.3 Representar el histograma y el polı́gono de frecuencias correspondiente
c.4 ¿Cuál es el porcentaje promedio de proteı́nas de estos sacos?¿Cuál es la
mediana de los porcentaje de proteı́na? Interprete los resultados.
E

d ) Calcule e interprete en términos del problema, la desviación estándar de los


AD

porcentajes de proteı́na agrupados. ¿Qué tipo de sesgo tiene la distribución de


los porcentajes de proteı́na?
e) Calcule exactamente el porcentaje de proteı́na que excede al del 75 % de los sacos.
f ) Calcule exactamente el porcentaje de proteı́na que excede al del 25 % de los sacos.
g) Grafique la ojiva de porcentajes.

64. Cierta fábrica tiene un departamento de producción y otro de ventas. Las tablas
-I I

a continuación muestran los salarios percibidos hasta fines de marzo de este año
22

(expresado en miles de nuevos soles):


20
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 82

Dpto. producción Dpto. ventas


Salario Nro. de Salario Nro. de
(miles de soles) trabajadores (miles de soles) trabajadores
[1.0 − 1.5⟩ 12 [6.0 − 8.0⟩ 4
[1.5 − 2.0⟩ 28 [8.0 − 10.0⟩ 6
[2.0 − 2.5⟩ 32 [10.0 − 12.0⟩ 12
[2.5 − 3.0⟩ 24 [12.0 − 14.0⟩ 15
[3.0 − 3.5⟩ 12 [14.0 − 16.0⟩ 3
[3.5 − 4.0] 12
EP
UD

a) ¿Cuáles son más variables: los salarios del departamento de producción o los
salarios del departamento de ventas?
b) Si compara la mediana y la media de los salarios respectivos: ¿Qué tipo de sesgo
tienen los salarios del departamento de producción?¿y los del departamento de
A
IM

ventas?
-L

c) Basándose en el rango intercuartı́lico, sustente ¿qué valores de salario se


S

considerarı́an atı́picos en el departamento de producción? y ¿en el departamento


PU

de ventas?
M

d ) ¿ Cuál es intervalo simétrico, alrededor del salario promedio del departamento de


CA

producción, en el que se encuentra como mı́nimo el 72 % de los salarios de los


trabajadores de dicho departamento?
e) ¿ Cuál es intervalo simétrico, alrededor del salrio promedio del departamento
de ventas, en el que se encuentra como mı́nimo el 72 % de los salarios de los
trabajadores de dicho departamento?

65. Los siguientes datos ordenados representan los precios (en soles) de las acciones al
cierre de la bolsa para una muestra aleatoria de 50 emisiones negociadas en la Bolsa de
Valores de Lima.
E
AD

3.75 6.00 12.30 15.88 21.40 23.50 25.00 33.38 37.50 53.88
3.75 6.12 12.38 18.75 21.88 24.00 26.00 35.0 46.0 57.50
4.75 8.25 12.88 19.00 22.50 24.00 27.12 35.25 46.20 59.12
5.50 8.62 14.25 20.38 22.62 25.00 29.38 36.12 46.38 64.75
5.75 8.75 15.50 20.62 23.50 25.00 31.00 36.50 48.30 80.50

a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
-I I

la “frecuencia” en términos del problema.


22
20

b) Elabore una distribución de frecuencias agrupadas de los datos de la variable de


estudio.
c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1 ¿Qué porcentaje de las emisiones cerraron con un precio inferior a 12.5 soles?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 83

c.2 ¿por encima de qué precio cerraron 18 % de las emisiones?


c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente
c.4 ¿Cuál es el precio promedio de las emisiones?¿Cuál es la mediana de dichos
precios? Interprete los resultados.
d ) Calcule e interprete en términos del problema, la desviación estándar de los precios
agrupados. ¿Qué tipo de sesgo tiene la distribución de precios?
e) Calcule exactamente el precio que es excedido por el 25 % de las emisiones.
EP

f ) Calcule exactamente el precio que es excedido por el 75 % de las emisiones.


UD

g) Grafique la ojiva de porcentajes.

66. El siguiente conjunto de datos ordenados representan el tiempo de reacción ante un


estı́mulo auditivo (en segundos), en una muestra de 50 estudiantes universitarios:
A
IM

0.094 0.101 0.106 0.109 0.111 0.113 0.117 0.119 0.122 0.129
-L

0.098 0.102 0.107 0.110 0.112 0.113 0.117 0.120 0.123 0.130
S
PU

0.099 0.103 0.107 0.110 0.112 0.115 0.118 0.120 0.124 0.132
M

0.100 0.103 0.108 0.111 0.112 0.115 0.118 0.121 0.126 0.134
CA

0.100 0.105 0.108 0.111 0.113 0.117 0.119 0.122 0.128 0.135

a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de los datos de la variable de
estudio.
c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1 ¿Qué porcentaje de estudiantes reaccionan a un estı́mulo en menos de 0.106
E

segundos?
AD

c.2 ¿por encima de qué tiempo reaccionan a un estı́mulo el 16 % de los estudiantes?


c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente
c.4 ¿Cuál es el tiempo promedio de reacción?¿Cuál es la mediana del tiempo de
reacción? Interprete los resultados.
d ) Calcule e interprete en términos del problema, la mediana y la desviación estándar
de las tiempos agrupados. ¿Qué tipo de sesgo tiene la distribución de los tiempos
-I I

de reacción?
22

e) Calcule exactamente el tiempo de reacción que es excedido por el 25 % de los


20

estudiantes.
f ) Calcule exactamente el tiempo de reacción que es excedido por el 75 % de los
estudiantes.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 84

g) Grafique la ojiva de porcentajes.

67. Se escogen 50 dı́as al azar y se computa el número de vehı́culos que usan una
determinada carretera. La media correspondiente a los datos obtenidos es 385; la
desviación tı́pica es 15. Calcule la proporción de dı́as en los que el número de autos que
usó dicha carretera estuvo entre 340 y 430.

68. Un agricultor obtuvo una gran cosecha de melones. De los 50 camiones que salieron
cargados, él seleccionó al azar un melón de cada uno y les midió el diámetro (en cm.).
Los resultados ordenados de esta muestra fueron los siguientes:
EP
UD

10.2 12.5 13.9 16.2 18.8


11.1 12.6 14.0 16.4 18.8
11.2 12.6 14.4 16.6 19.3
A
11.3 12.8 14.6 16.8 19.5
IM

11.5 12.9 14.7 16.9 19.8


S -L

11.6 13.0 15.2 16.9 20.4


PU

11.8 13.4 15.6 17.4 20.5


M

12.1 13.5 15.7 17.8 21.3


CA

12.3 13.6 15.8 17.9 21.4


12.5 13.6 15.9 18.3 22.3

a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de la variable de estudio.
c) Calcule e interprete en términos del problema: la media, la mediana, la moda, la
varianza y la desviación estándar de los datos agrupados. ¿Qué tipo de sesgo tiene
E
AD

la distribución?
d ) Si acaba de calcular la media y la desviación estándar del conjunto de datos
agrupados, defina mediante el Teorema de Chebyshev, en qué intervalo se
encuentra, como mı́nimo, el 45 % de los datos.
e) ¿Cuál es el diámetro que es excedido por el 75 % de los melones?
f ) Represente gráficamente la distribución elaborada en el apartado b) a través de
un histograma de porcentajes y el polı́gono de porcentajes correspondiente.
-I I

69. En una compañı́a, se toma una muestra de 200 empleados y se observa que en dicha
22

muestra el sueldo mı́nimo y máximo es de $150 y $300 respectivamente. Tales sueldos se


20

tabulan en una distribución de frecuencias agrupadas de 5 intervalos de igual tamaño. Si


se sabe que 20 empleados ganan al menos $150, pero menos de $180, 60 ganan menos
de $210, 110 ganan menos de $240, 180 ganan menos de $270 y el 10 % restante de
empleados ganan al menos $270 y a lo más $300. Se le pide lo siguiente:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 85

a) Reconstruir la tabla de distribución de frecuencias agrupadas.


b) Calculear e interpretar la media, la mediana y la desviación estándar de los sueldos
agrupados.

70. ¿Cómo se denomina el diagrama mostrado a continuación? Según su naturaleza, ¿qué


tipo de variable está siendo representada?

- Interprete el significado de los valores: 72 y 44, mostrados en el eje vertical.


EP
UD

A
IM
S -L
PU
M
CA

71. Los siguientes datos ordenados se refieren a la tasa de alfabetización de 21 paı́ses de


América del Sur:

53, 55, 57, 73, 73, 78, 81, 83, 85, 87, 87, 88, 88, 88, 90, 93, 93, 94, 95, 96, 99.

a) Determine cuál es el “resumen de cinco números” y empléelo para representar el


diagrama de caja-bigotes de estos datos no agrupados.
b) Calcule el rango intercuartı́lico y explique si existen datos atı́picos. En caso de que
E

existan diga cuáles son. Si no hay sustento se invalida su respuesta.


AD

72. La tabla adjunta indica la Distribución del Coeficiente Intelectual (CI) de una muestra
de 120 alumnos de un colegio:

CI (puntos) N°de Alumnos


[60 − 70⟩ 2
[70 − 80⟩ 3
[80 − 90⟩ 25
-I I

[90 − 100⟩ 46
22

[100 − 110⟩ 35
20

[110 − 120⟩ 5
[120 − 130⟩ 3
[130 − 140] 1
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 86

a) Calcule e interprete la media, mediana, moda y desviación estándar ?Qué tipo de


sesgo tiene la distribución?
b) ¿Cuál es el cociente intelectual que es superado por el 25 % de los alumnos?
c) ¿Un alumno con coeficiente intelectual 102 supera el percentil 75? Sustente.
d ) Basándose en el rango intercuartı́lico, sustente qué valores de CI se conside-
rarı́an atı́picos.
e) Si el coeficiente de variación de los CI de otra muestra de alumnos es 20 % ¿Cuál
de las dos muestras presenta una distribución de CI más homogénea? ¿Por qué?
EP

f ) Si calculó la media y la desviación estándar de los CI agrupados en el apartado


UD

a), responda lo siguiente: ¿Cuál es intervalo simétrico, alrededor de la media, en


el que se encuentra como mı́nimo el 72 % de los CI?

73. El siguiente conjunto de datos ordenados representan el diámetro de cintura (en cm.),
A
IM

de una muestra de 40 pacientes, cuyas edades oscilan entre 17 y 58 años, que acudieron
al Instituto Nacional de Nutrición el lunes pasado:
S -L
PU

75.2 78.8 85.0 87.7 91.3 94.9 102.9 103.8


75.6 79.6 86.7 88.0 91.5 95.0 103.0 104.0
M
CA

75.7 79.9 86.9 89.1 91.8 96.5 103.0 105.5


77.0 81.6 87.1 90.6 92.4 97.1 103.3 107.5
78.1 82.5 87.7 91.1 93.1 98.9 103.3 108.7

a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de los datos de la variable de
estudio.
E

c) Basándose en la distribución que ha elaborado, diga aproximadamente:


AD

c.1 ¿por encima de cuántos cm., mide el diámetro de cintura del 27.5 % de los
pacientes?
c.2 ¿Qué porcentaje de pacientes tiene menos de 92 cm. de diámetro de cintura?
c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente
c.4 ¿Cuál es el diámetro promedio de cintura de esa muestra de pacientes?¿Cuál
es la mediana del diámetro de cintura? Interprete los resultados.
-I I

d ) Calcule e interprete en términos del problema la moda y la desviación estándar


22

de los diámetros de cintura agrupados. ¿Qué tipo de sesgo tiene la distribución de


20

los diámetros de cintura?


e) Calcule exactamente el diámetro de cintura que es excedido por el 75 % de los
pacientes.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 87

f ) Calcule exactamente el diámetro de cintura que es excedido por el 25 % de los


pacientes.

74. Un programa corrector de textos contabiliza el número de errores tipográficos que


encuentra en cada página. Después de pasar este programa corrector por un texto de
50 páginas, se obtiene el siguiente número de errores tipográficos por página:

2, 3, 5, 0, 1, 4, 0, 6, 2, 1, 1, 0, 2, 4, 5, 3, 1, 2, 3, 2, 3, 1, 2, 4, 4,
2, 5, 4, 1, 3, 2, 6, 8, 2, 0, 1, 0, 2, 3, 1, 5, 10, 2, 1, 3, 6, 2, 0, 1, 3
EP

a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
UD

¿por qué?
b) Defina la frecuencia en términos del problema.
c) Elabore una distribución de frecuencias no agrupadas de los datos y grafı́quela.
d ) ¿Cuántas páginas presentan dos o más errores tipográficos, pero menos de 4?
A
IM

e) ¿Qué porcentaje de páginas presenta al menos 5 errores tipográficos?


-L

f ) ¿Cuántos errores tipográficos en promedio hay en el texto revisado?


S

g) ¿Cuál es la mediana del número de errores tipográficos del texto revisado?


PU

75. Los siguientes datos ordenados son los consumos en cafeterı́a (en soles) realizados por
M
CA

20 alumnos en la semana anterior:

36, 37, 41, 44, 45, 47, 47, 49, 50, 50, 54, 55, 56, 56, 62, 63, 68, 75, 87, 88.

a) Determine cuál es el “resumen de cinco números” y empléelo para representar el


diagrama de caja-bigotes de estos datos no agrupados.
b) Calcule el rango intercuartı́lico y explique si existen datos atı́picos. En caso de que
existan diga cuáles son. Si no hay sustento se invalida su respuesta.

76. El sueldo medio de los obreros de una fábrica es de $980. Mostrando el planteamiento y
E

cálculos correspondientes, responda lo siguiente: ¿Qué porcentaje de obreros de menos


AD

de 30 años y de obreros de al menos 30 años trabajan en la fábrica si sus sueldos medios


respectivos son $930 y $1100?

77. Se tiene la información de dos empresas correspondiente a los ingresos mensuales de


sus empleados:

Empresa A Empresa B
Ingreso mensual Nro. de Ingreso mensual Nro. de
(cientos de soles) empleados (cientos de soles) empleados
-I I

[10.5 − 12.5⟩ 120 [8.5 − 11.5⟩ 100


22

[12.5 − 14.5⟩ 400 [11.5 − 14.5⟩ 200


20

[14.5 − 16.5⟩ 160 [14.5 − 17.5⟩ 480


[16.5 − 18.5⟩ 80 [17.5 − 20.5⟩ 100
[18.5 − 20.5⟩ 32 [20.5 − 23.5⟩ 80
[20.5 − 22.5] 8 [23.5 − 26.5] 40
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 88

a) ¿Cuáles son más variables: los ingresos mensuales de los trabajadores de la empresa
A o de la empresa B?
b) Si compara la mediana y la media de los ingresos mensuales respectivos: ¿Qué tipo
de sesgo tienen los ingresos de la empresa A?¿y en la empresa B?
c) Basándose en el rango intercuartı́lico, sustente ¿qué valores de ingreso mensual
se considerarı́an atı́picos en la empresa A? y ¿en la empresa B?
d ) ¿ Cuál es intervalo simétrico, alrededor del ingreso mensual promedio de la empresa
A, en el que se encuentra como mı́nimo el 72 % de los ingresos mensuales de los
EP

trabajadores de dicha empresa?


UD

e) ¿ Cuál es intervalo simétrico, alrededor del ingreso mensual promedio de la empresa


B, en el que se encuentra como mı́nimo el 72 % de los ingresos mensuales de los
trabajadores de dicha empresa?
A
78. Elija cuatro números que se encuentren en el intervalo [4.1; 16.1] (se pueden escoger
IM

números repetidos) de manera que:


S -L

a) La desviación estándar (o tı́pica) de estos números sea la mayor posible.


PU

b) La desviación estándar (o tı́pica) de estos números sea la más pequeña posible.


M
CA

79. Explique (máximo en tres lı́neas) para qué sirve el Teorema de Chebyshev.

80. El siguiente conjunto de datos ordenados corresponden a los tiempos de sobrevivencia


(en horas) de unas ratas de laboratorio expuestas a un cierto veneno. El objetivo de la
investigación es comprobar la efectividad de dicho veneno:

0.03 0.11 0.23 0.33 0.61 0.93 1.11 1.40 1.91 2.63
0.03 0.12 0.24 0.36 0.73 0.97 1.14 1.44 1.93 2.66
0.04 0.14 0.29 0.47 0.85 0.99 1.18 1.71 1.96 2.93
E

0.05 0.22 0.29 0.51 0.86 1.05 1.21 1.79 2.21 3.20
AD

0.07 0.22 0.31 0.60 0.86 1.06 1.35 1.88 2.34 3.53

a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas.
c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1 ¿Qué porcentaje de ratas sobreviven menos de 2 horas?
-I I

c.2 ¿por encima de qué tiempo sobrevive el 10 % de las ratas?


22

c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes


20

correspondiente
c.4 ¿Cuál es el tiempo promedio de sobrevivencia? Interprete el resultado.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 89

d ) Calcule e interprete en términos del problema, la mediana y la desviación estándar


de lostiempos agrupados. ¿Qué tipo de sesgo tiene la distribución de los tiempos
de sobrevivencia?
e) Calcule exactamente el tiempo de sobrevivencia que es excedido por el 25 % de las
ratas.
f ) Calcule exactamente el tiempo de sobrevivencia que es excedido por el 75 % de las
ratas.

81. Se ha realizado una encuesta en 30 hogares en la que se les pregunta el número de


EP

individuos que conviven en el domicilio habitualmente. Las respuestas obtenidas han


UD

sido las siguientes:

4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
A
a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
IM

¿por qué?
-L

b) Defina la frecuencia en términos del problema.


S
PU

c) Elabore una distribución de frecuencias no agrupadas de los datos y grafı́quela.


M

d ) ¿Qué proporción de hogares está compuesto por tres o menos personas?


CA

e) ¿En cuántos hogares habitan más de 4 individuos pero menos de 8?


f ) ¿Qué proporción de individuos vive en hogares con tres o menos miembros ?
g) ¿Cuál es el número promedio de individuos que conviven en un domicilio cualquiera
de los encuestados?

82. Los responsables de calidad realizan periódicamente un análisis de la medición del


trabajo con el fin de determinar el tiempo requerido para generar una unidad de
producción. En una planta de procesamiento se registró durante 20 dı́as el número
E

de horas-obrero totales requeridas para realizar cierta tarea. Los datos recogidos son:
AD

95,97,100,106,109,111,112,116,119,124,124,125,128,131,131,132,133,135,135,145

a) Determine cuál es el “resumen de cinco números” y empléelo para representar el


diagrama de caja-bigotes de estos datos no agrupados.
b) Calcule el rango intercuartı́lico y explique si existen datos atı́picos. En caso de que
existan diga cuáles son. Si no hay sustento se invalida su respuesta.
-I I

83. Se ha registrado la cantidad de accidentes ocurridos en los últimos 21 meses en una


22

empresa productora de alimentos y se obtuvieron los siguientes datos:


20

1, 4, 1, 3, 5, 3, 2, 4, 1, 0, 2, 3, 2, 3, 2, 1, 0, 3, 1, 0, 1

a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
¿por qué?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 90

b) Defina la frecuencia en términos del problema.


c) Elabore una distribución de frecuencias no agrupadas de los datos y grafı́quela.
d ) ¿En qué porcentaje de meses hubo como máximo 1 accidente?
e) ¿En cuántos meses se produjeron más de 2 accidentes pero menos de 5?
f ) ¿En qué porcentaje de meses hubo más de 4 accidentes?

84. Javier Torres administra una cabina de internet y está buscando introducir mejoras
en el servicio. Para tal fin, Javier registró los tiempos (en minutos) que utilizaron 56
EP

usuarios de la cabina de internet.


UD

22.82 26.52 28.66 29.16 29.99 31.22 33.17


24.43 26.58 28.92 29.17 30.04 31.23 33.23
24.64 27.06 28.98 29.20 30.08 31.75 33.44
A
IM

24.70 27.09 29.04 29.36 30.18 32.09 34.06


-L

25.43 27.27 29.05 29.44 30.20 32.21 34.09


S

25.85 27.36 29.05 29.89 30.38 32.38 34.28


PU

26.33 27.38 29.05 29.90 30.92 32.48 34.55


M
CA

26.42 27.66 29.06 29.96 31.20 33.04 34.90

a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de los datos de la variable de
estudio.
c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1 ¿Qué porcentaje de usuarios emplean la cabina de internet por debajo de 28
minutos?
E
AD

c.2 ¿por encima de qué tiempo de uso se encuentran los tiempos de aproximada-
mente 26 % de los usuarios?
c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente
d ) Calcule e interprete en términos del problema, la media, la mediana y la desviación
estándar de las tiempos agrupados. ¿Qué tipo de sesgo tiene la distribución de los
tiempos?
e) Calcule exactamente el tiempo que es excedido por el 75 % de los usuarios.
-I I
22

f ) Calcule exactamente el tiempo que es excedido por el 25 % de los usuarios.


20

85. Los siguientes datos corresponden a la estatura en cm de los alumnos de un determinado


salón de clase:

150,169,171,172,172,175,176,177,178,179,181,182,183,184,184.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 91

a) Determine cuál es el “resumen de cinco números” y empléelo para representar el


diagrama de caja-bigotes de estos datos no agrupados.
b) Calcule el rango intercuartı́lico y explique si existe algún tiempo de hospitalización
atı́pico. En caso de que existan diga cuáles son. Si no hay sustento se invalida su
respuesta.

86. En un puerto se controla diariamente la entrada de barcos pesqueros según su tonelaje,


resultando para un cierto dı́a los siguientes datos:
EP

Peso (toneladas métricas) [5 − 25⟩ [25 − 45⟩ [45 − 65⟩ [65 − 85⟩ [85 − 105]
N° de barcos
UD

5 17 30 25 3

Mostrando cálculos:

a) Obtenga la desviación tı́pica de los pesos e interprétela.


A
IM

b) ¿Qué tipo de sesgo tiene la distribución de los pesos agrupados?


-L

87. El número de asignaturas en el que se matriculó una muestra de 100 alumnos en un


S
PU

semestre pasado, se distribuyó de la siguiente manera:


M

N° de asignaturas (X) 1 2 3 4 5 6
CA

N° de alumnos (f) 15 16 30 25 9 5

Mostrando cálculos:

a) Halle e interprete la desviación tı́pica de este conjunto de datos.


b) Calcule los cuartiles e interprételos.

88. La distribución de las edades de una muestra de personas que contrajeron matrimonio
durante el año pasado en un distrito es la siguiente:
E

Edad (años) [18 − 28⟩ [28 − 38⟩ [38 − 48⟩ [48 − 58⟩ [58 − 68]
AD

N° de personas 80 136 46 16 6

Mostrando cálculos:

a) Obtenga la desviación tı́pica de las edades e interprétela.


b) ¿Qué tipo de sesgo tiene la distribución de las edades agrupadas?

89. En la fabricación de cierto tipo de bombillas se han detectado algunas defectuosas.


-I I

Se han estudiado 200 cajas de 100 bombillas cada una, obteniéndose la siguiente
22

distribución:
20

N° de bombillas defectuosas (X) 1 2 3 4 5 6 7 8


N° de cajas (f) 5 15 38 42 49 31 18 2

Mostrando cálculos:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 92

a) Hallar la moda y los cuartiles e interprete dichas medidas.


b) Obtener la media y desviación tı́pica e interprételas.

90. En una comunidad formada por 100 vecinos, éstos han sido clasificados atendiendo al
número de personas que forman cada familia:

N° de personas por familia (X) 1 2 3 4 5 6 7


N° de familias (f) 15 30 25 10 8 7 5

Mostrando cálculos:
EP
UD

a) Hallar la moda y los cuartiles e interprete dichas medidas.


b) Obtener la media y desviación tı́pica e interprételas.

91. Un vendedor opera con dos empresas de las que percibe semanalmente alrededor de
A
165,66 y 216,87 dólares de comisión respectivamente. El importe de las comisiones
IM

que paga la primera empresa a sus vendedores es en promedio 114,46 dólares/semana


-L

y la desviación tı́pica es de 37,35 dólares/semana. La segunda empresa presenta


S

una comisión media de 191,57 dólares/semana y una desviación estándar de 56,63


PU

dólares/semana. ¿En cuál de las dos empresas el importe de las comisiones es más
M

variable? Sustente su respuesta.


CA

92. Indique cuál serı́a la relación existente entre la media y la mediana en una distribución
de datos con sesgo negativo. Explique claramente a qué se debe dicha relación.

93. Explique claramente qué es el percentil 23 de un conjunto ordenado de datos.

94. Un joven que desea adquirir un par de zapatillas deportivas, entra a un negocio donde
tienen a la venta una gran variedad de tipos y marcas de dichas zapatillas. Consulta a
un vendedor, quien le suministra una lista con todas las variedades y sus respectivos
precios. El joven calcula rápidamente el promedio y la desviación estándar de dichos
E

precios que resultan de $68 y $17 respectivamente. Luego consulta al vendedor acerca
AD

de las formas de pago posibles y éste le informa que los precios de la lista corresponden
a pagos al contado en efectivo, pero que además puede pagar con tarjeta. Si paga con
tarjeta, el precio de lista sufre un recargo de $2 en concepto de gastos administrativos.

a) Calcular el promedio y la desviación tı́pica de los precios de las zapatillas


deportivas cuando el pago se efectúa con tarjeta.
b) ¿En cuál de las dos formas de pago posibles la variabilidad de los precios resulta
menor? (Justificar claramente la respuesta)
-I I
22

95. Indique cuál serı́a la relación existente entre la mediana y la media en una distribución
20

de datos con sesgo positivo. Explique claramente a qué se debe dicha relación.(máximo
4 renglones)
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 93

96. En un programa para la detección de hipertensión, se toma una muestra de 30 pacientes


con edades entre 30 y 40 años y se observa que en dicha muestra la presión sanguı́nea
diastólica mı́nima y máxima es de 60 mm de Hg y 120 mm de Hg respectivamente.
Tales presiones se tabulan en una distribución de frecuencias agrupadas de 6 intervalos
de igual tamaño. Si se sabe que 3 hombres tienen al menos 60 mm de Hg de presión,
pero menos de 70 mm de Hg de presión; que 9 hombres tienen presión menor a 80
mm de Hg de presión; 16 hombres tienen presión menor a 90 mm de Hg de presión; 25
hombres tienen presión menor a 100 mm de Hg de presión; 27 hombres tienen presión
menor a 110 mm de Hg de presión y el 10 % restante de hombres tienen al menos una
EP

presión igual a 110 mm de Hg y a lo más de 120 mm de Hg. Se le pide lo siguiente:


UD

a) Defina la variable de interés y de qué tipo es. Defina la “frecuencia” en términos


del problema.
b) Reconstruir la tabla de distribución de las presiones agrupadas.
A
IM

c) Basándose en la distribución que ha elaborado, diga aproximadamente


-L

c.1 ¿Qué presión tiene como mı́nimo el 10 % de los pacientes?


S

c.2 ¿Qué porcentaje de pacientes tienen una presión menor a 90 mm de Hg?


PU

c.3 Grafique la ojiva de porcentajes.


M

c.4 ¿Cuál es la presión promedio de esa muestra de pacientes?¿Cuál es la mediana


CA

de dichos presiones? Interprete los resultados.

97. La Asociación de Propietarios de Hoteles llevó a cabo una encuesta relativa a las tarifas
de hotel entre semana. A continuación aparece la tarifa (en dólares) por cuarto para
huéspedes de negocios en una muestra de 10 hoteles:

78 80 87 88 97 101 101 103 106 110

Muestre los cálculos e interprete en términos del problema:


E
AD

a) La desviación tı́pica.
b) Los cuartiles.

98. Se ha realizado una encuesta a 31 hogares en la que se pregunta por el número de


celulares que poseen los miembros de la familia. Las respuestas obtenidas han sido las
siguientes:

1 4 4 1 3 5 3 2 4 1 6 2 3 4
5 5 6 2 3 3 2 2 1 8 3 5 3 4 7 2 3.
-I I
22

a) ¿Cuál es la variable en estudio? ¿De qué tipo es? ¿qué nivel de medición tiene?
20

b) Defina la frecuencia en términos del problema.


c) Elabore una distribución de frecuencias no agrupadas de los datos y grafı́quela.
d ) ¿Cuál es el porcentaje de hogares en los que hay como máximo 2 celulares?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 94

e) ¿Cuántos hogares tienen más de 2 y como máximo 4 celulares?


f ) ¿Qué porcentaje de hogares tienen más de 6 celulares?
g) Calcule e interprete en términos del problema, la media, la mediana y desviación
estándar de los datos.

99. Actualmente, existe una competencia creciente entre los operadores de estaciones de
servicio (grifos) en la ciudad de Ica. Los siguientes datos ordenados representan las
ventas diarias (miles de nuevos soles) en 40 grifos de la ciudad:
EP

17.9 25.6 28.2 30.0 31.7 35.1 37.3 37.9 38.9 39.0
UD

39.2 39.8 40.6 41.5 42.6 45.0 45.6 47.9 49.1 50.3
51.4 51.9 52.5 52.7 53.9 54.7 55.2 58.3 58.6 61.7
63.0 65.2 66.2 67.9 68.1 68.3 72.7 72.8 77.2 87.0
A
IM

a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
-L

la frecuencia en términos del problema.


S
PU

b) Elabore una distribución de frecuencias agrupadas.


c) Basándose en la distribución que ha elaborado, diga aproximadamente:
M
CA

c.1. ¿Qué porcentaje de grifos tiene ventas diarias por debajo de 41000 nuevos
soles?
c.2. ¿por encima de qué nivel de ventas diarias se encuentran las ventas de
aproximadamente 23 % de los grifos?
c.3. Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente.
d ) Calcule e interprete en términos del problema, la media, la mediana y la desviación
estándar de las ventas agrupadas. ¿Qué tipo de sesgo tiene la distribución de las
E

ventas?
AD

e) ¿Cuál es exactamente el nivel de ventas que es excedido por el 25 % de los grifos?


f ) ¿Cuál es exactamente el nivel de ventas que es excedido por el 75 % de los grifos?

100. Se han medido los niveles de ozono alrededor de la costa norte. Las concentraciones de
magnitud alrededor de 220 unidades por billón pueden ocasionar quemaduras en los
ojos y son peligrosas para la vida animal. Se han obtenido los siguientes datos:

160 160 161 161 162 162 162 163 163 163 164 165 167 167 168
-I I

169 170 172 173 176 178 179 180 185 196
22
20

a) Determine cuál es el “resumen de cinco números” y empléelo para representar el


diagrama de caja-bigotes de estos datos no agrupados.
b) Calcule el rango intercuartı́lico y explique si existen datos atı́picos. En caso de que
existan diga cuáles son. Si no hay sustento se invalida su respuesta.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 95

101. Una empresa ofrece asesorı́a financiera para solucionar deudas atrasadas con tarjetas
de crédito. Se realizó una encuesta a 10 jóvenes entre 18 y 25 años con una deuda en
su tarjeta de crédito por poco más de $5000, registrándose los montos (en dólares) que
cada uno de ellos pagó como abono a sus saldos el mes pasado:

435 465 495 505 515 545 550 555 565 630

Muestre los cálculos e interprete en términos del problema:

a) La desviación tı́pica.
EP

b) Los cuartiles.
UD

102. En un negocio de ventas de frutas del paı́s, se examinó un lote de 25 cajas de manzanas,
cada una teniendo un contenido de 48 manzanas. El número de manzanas en mal estado
en cada caja fue:
A
IM

3 4 1 2 1 2 5 2 1 2 3 0 1
-L

0 3 3 2 0 2 1 3 4 1 2 2
S
PU

a) ¿Cuál es la variable en estudio? ¿De qué tipo es? ¿qué nivel de medición tiene?
M

b) Defina la frecuencia en términos del problema.


CA

c) Elabore una distribución de frecuencias no agrupadas de los datos.


d ) ¿Cuál es el porcentaje de cajas que tienen como máximo 1 manzana en mal estado?
e) ¿Cuál es el número de cajas que tienen más de 2 manzanas en mal estado, pero
menos de 5?
f ) ¿Qué porcentaje de cajas tienen más de 4 manzanas en mal estado?
g) Calcule e interprete en términos del problema, el promedio, la mediana, la moda
y la desviación estándar de los datos.
E
AD

103. El sueldo promedio de los empleados de una empresa es de 134400 unidades monetarias.
El 30 % de los empleados son hombres y el porcentaje restante son mujeres. Si se sabe
que el sueldo promedio de los hombres es 40 % superior al sueldo promedio de las
mujeres ¿Cuál es el sueldo promedio de los hombres?¿y el sueldo promedio de las
mujeres? Explique la simbologı́a que defina y cálculos que realice.

104. A 48 madres de familia se les preguntó respecto al número de veces a la semana que
incluyen carne de res en el menú del dı́a. Las respuestas obtenidas fueron las siguientes:
-I I

2, 2, 1, 1, 3, 4, 0, 0, 0, 1, 1, 1, 2, 2, 1, 0, 0, 0, 0, 5, 5, 1, 2, 2,
22

1, 1, 1, 2, 1, 3, 4, 3, 4, 1, 2, 1, 1, 1, 2, 2, 2, 3, 5, 0, 0, 0, 2, 1.
20

a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
¿por qué?
b) Defina la frecuencia en términos del problema.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 96

c) Elabore una distribución de frecuencias no agrupadas de los datos y grafı́quela.


d ) ¿Cuántas madres incluyen carne de res en el menú diario, menos de 2 veces a la
semana?
e) ¿Qué porcentaje de madres de familia incluyen carne de res en el menú diario,
más de tres veces a la semana?
f ) ¿Cuántas veces en promedio se incluye la carne de res en el menú diario de las
madres encuestadas?
EP

105. La empresa textil DELTA contrata a una empresa que se dedica a preparar dietas
con el fin de mejorar la calidad nutricional del menú diario brindado en el comedor de
UD

empleados. La empresa contratada seleccionó una muestra de 50 empleados chequeando


sus pesos (kg.), obteniéndose los siguientes datos ordenados:
A
40.9 51.2 62.1 67.4 71.6 74.3 76.9 79.3 83.2 89.2
IM

41.8 52.7 62.3 67.9 71.7 74.6 76.9 80.2 85.7 90.4
-L

44.8 57.3 63.7 68.8 72.3 75.6 77.1 81.7 86.8 94.4
S
PU

46.4 60.2 65.2 70.4 73.2 75.8 77.4 82.1 87.3 94.6
M

49.9 61.4 67.3 71.4 73.6 76.3 78.3 82.9 88.3 99.3
CA

a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de los datos de la variable de
estudio.
c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1 ¿Qué porcentaje de empleados pesa menos de 66 kg.?
c.2 ¿Cuánto pesa como mı́nimo, el 22 % de los empleados?
E

c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes


AD

correspondiente
c.4 ¿Cuál es el peso promedio de esa muestra de empleados?¿Cuál es la mediana
de dichos pesos? Interprete los resultados.
c.5 Calcule e interprete en términos del problema la moda y la desviación estándar
de los pesos agrupados. ¿Qué tipo de sesgo tiene la distribución de los pesos?
c.6 ¿ Cuál es intervalo simétrico, alrededor del peso promedio, en el que se
encuentra por lo menos el peso del 70 % de los empleados?
-I I

c.7 Calcule exactamente el peso que excede al del 75 % de los empleados.


22

c.8 Calcule exactamente el peso que excede al del 25 % de los empleados.


20

106. El comité de seguridad vial de la municipalidad de Surquillo realizó el registro del


número de accidentes de tránsito ocurridos diariamente en el distrito durante un periodo
de 40 dı́as. La información obtenida fue la siguiente:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 97

2, 5, 0, 1, 3, 2, 3, 4, 2, 2, 1, 1, 0, 2, 3, 1, 0, 6, 2, 0,
0, 2, 3, 1, 2, 0, 4, 1, 1, 3, 4, 0, 2, 6, 1, 1, 4, 2, 2, 4

a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
¿por qué?
b) Defina la frecuencia en términos del problema.
c) Elabore una distribución de frecuencias no agrupadas de los datos y grafı́quela.
d ) ¿En cuántos dı́as ocurrieron entre 4 y 6 accidentes, inclusive?
EP

e) ¿En qué porcentaje de dı́as ocurrieron como máximo 2 accidentes de tránsito?


UD

f ) ¿Cuántos accidentes diarios en promedio ocurrieron?


g) ¿Cuál es la mediana del número de accidentes en el periodo analizado?

107. Se ha realizado un estudio sobre la amnesia postraumática tras una lesión en la cabeza.
A
Una variable estudiada es el tiempo de hospitalización en dı́as. Los datos ordenados
IM

obtenidos son los siguientes:


S -L
PU

8, 12, 20, 27, 30, 32, 35, 36, 40, 40, 40, 40, 41, 42, 45, 47, 50, 52, 61, 89, 108.
M

a) Determine cuál es el “resumen de cinco números” y empléelo para representar el


CA

diagrama de caja-bigotes de estos datos no agrupados.


b) Calcule el rango intercuartı́lico y explique si existe algún tiempo de hospitalización
atı́pico. En caso de que existan diga cuáles son. Si no hay sustento se invalida su
respuesta.

108. Se ha realizado una encuesta a 32 familias, y una de las preguntas realizadas hacı́a
referencia al número de celulares que poseen en el hogar. Las respuestas obtenidas han
sido las siguientes:
E

7, 6, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
AD

a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
¿por qué?
b) Defina la frecuencia en términos del problema.
c) Elabore una distribución de frecuencias no agrupadas de los datos y grafı́quela.
d ) ¿Qué proporción de familias poseen menos de tres celulares?
e) ¿Cuántas familias poseen cuatro o más celulares pero menos de ocho?
-I I
22

f ) ¿Qué proporción de celulares es poseı́da en familias con menos de cuatro de estos


20

aparatos?
g) ¿Cuál es el número promedio de celulares poseı́dos en una familia cualquiera de
las encuestadas?
h) Elabore un diagrama escalonado de porcentajes.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 98

109. El profesor del curso está interesado en estudiar los hábitos de sueño de los estudiantes
cuando acuden a la sala de lectura del segundo piso de la biblioteca. El profesor
registra el tiempo (en minutos) que demoran en quedarse dormidos los estudiantes
desde que empiezan a leer su material de estudio. A continuación se presentan los
tiempos ordenados registrados en una muestra de alumnos:

10.5 11.3 11.9 12.0 12.3 12.3 12.5 12.7 13.4 13.7
13.8 14.2 14.8 15.1 15.3 16.7 16.8 18.8 20.8
EP

a) Determine cuál es el “resumen de cinco números” y empléelo para representar el


diagrama de caja-bigotes de estos datos no agrupados.
UD

b) Calcule el rango intercuartı́lico y explique si existe algún tiempo atı́pico. En caso


de que existan diga cuáles son. Sustente su respuesta.
c) En la semana previa a los exámenes parciales, el profesor vuelve a realizar el mismo
A
IM

análisis con otra muestra de estudiantes que ocupan la sala de estudio de la bi-
blioteca. Registra los tiempos que demoran en quedarse dormidos esos estudiantes
-L

y construye un diagrama de caja-bigotes obteniendo el que aparece a continuación:


S
PU
M
CA

E
AD

c.1 ¿Qué porcentaje de alumnos se queda dormido antes de los 14 minutos en la


sala de estudio de la biblioteca?
c.2 ¿Cuánto podrı́a aumentar el tiempo máximo sin que cambie la mediana de
los tiempos?

110. La siguiente es la distribución de los coeficientes intelectuales (C.I) de los niños de


-I I

cuarto grado de una escuela primaria:


22
20
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 99

Coeficiente Intelectual (puntos) N° de niños


[70 − 78⟩ 4
[78 − 86⟩ 16
[86 − 94⟩ 45
[94 − 102⟩ 85
[102 − 110⟩ 54
[110 − 118⟩ 27
EP

[118 − 126⟩ 11
UD

[126 − 134] 2

a) Basándose en el rango intercuartı́lico, sustente ¿qué valores del coeficiente


intelectual se considerarı́an atı́picos?
A
b) Si una madre de familia afirma que la mitad de los niños del colegio tiene un
IM

coeficiente intelectual inferior al de su hijo,¿Qué coeficiente de inteligencia tiene


-L

su hijo?
S
PU

c) ¿Cuál es la moda de los coeficientes intelectuales?


M

111. La Figura 2.11 representa un gráfico de caja-bigotes correspondiente a las notas de 36


CA

alumnos que rindieron la segunda práctica calificada de la asignatura de Estadı́stica 1


en el semestre 2019-II. Observando el gráfico responda lo siguiente:

a) ¿Cuál es la mediana de las notas? ¿y el percentil 75 de las notas? ¿y el percentil 25


de las notas? Interprete en términos del problema, los valores que ha dado como
respuestas.
b) Calcule el rango intercuartı́lico y explique si existe alguna nota atı́pica. En caso
de que existan diga cuáles son. Sustente su respuesta.
E
AD

112. Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del
agua para consumo en términos de colonias de bacterias en un acuı́fero próximo a la
ciudad. Se toman muestras del agua y se obtienen los siguientes datos (del número de
colonias por 1000mm de agua) ordenados:

116, 139, 143, 147, 156, 156, 156, 158, 161, 161, 174, 188, 198, 220.

a) Determine cuál es el “resumen de cinco números” y empléelo para representar el


diagrama de caja-bigotes de estos datos no agrupados.
-I I

b) Calcule el rango intercuartı́lico y explique si existe algún número de colonias


22
20

atı́pico. En caso de que existan diga cuáles son. Si no hay sustento se invalida
su respuesta.

113. La concentración de sólidos suspendidos en el agua de un rı́o (medida en partes


por millón (ppm.) o miligramos por litro de agua) es una caracterı́stica ambiental
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 100
EP
UD

A
IM
S -L
PU
M
CA

Figura 2.11: Notas en la segunda práctica calificada de 36 alumnos.

importante. La Dirección General de Hidrologı́a y Recursos Hı́dricos, como parte de


sus actividades, programó una serie de comisiones de servicio a los distintos rı́os a
nivel nacional. El siguiente conjunto de datos ordenados representan la concentración
presente en muestras de 50 rı́os del paı́s:
E
AD

27.1 36.7 42.3 48.0 56.3 60.9 64.9 68.2 71.7 78.8
30.0 37.0 44.6 49.5 58.2 61.2 65.0 69.0 74.5 83.2
31.7 39.1 45.9 52.6 59.1 61.5 65.2 69.3 75.3 87.1
33.8 39.8 47.2 55.8 60.6 61.8 65.8 69.8 76.0 91.3
35.5 40.0 47.3 56.0 60.7 62.3 66.3 71.4 77.1 94.6

a) Defina la variable de interés, de qué tipo es y sustente qué nivel de medición tiene.
-I I

Defina la “frecuencia” en términos del problema.


22

b) Elabore una distribución de frecuencias agrupadas de la variable de estudio.


20

c) Basándose en la distribución que ha elaborado, diga aproximadamente:


c.1 ¿Cuál es la mı́nima concentración de sólidos presente en el 14 % de los rı́os
analizados?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 101

c.2 ¿Qué porcentaje de rı́os presentan una concentración menor a 56.2 ppm.?
c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente
c.4 Calcule e interprete en términos del problema: la media, la mediana y la
desviación estándar de las concentraciones agrupadas.
c.5 Si compara la mediana y la media de las concentraciones agrupadas ¿Qué tipo
de sesgo tiene la distribución de las mismas?
c.6 ¿Cuál es intervalo simétrico, alrededor de la concentración promedio, en el
EP

que se encuentra como mı́nimo la concentración de sólidos del 63 % de los rı́os


analizados?
UD

c.7 Calcule exactamente la concentración que es superada por la del 75 % de los


rı́os.
c.8 Calcule exactamente la concentración que es superada por la del 25 % de los
A
rı́os.
IM
-L

114. En la empresa FusiónPerú S.A, el salario promedio mensual (en dólares) de los hombres
S

es 458.4 y el de las mujeres 425. Las desviaciones tı́picas de los salarios mensuales en los
PU

dos grupos son, respectivamente, 372.3 dólares y 311.25 dólares. Mostrando los cálculos
M

correspondientes responda lo siguiente:


CA

a) Relativamente,¿cuáles son más variables, los salarios de los hombres o los de las
mujeres?
b) El salario de Jorge es de 1200 dólares y el de Mariela es 1100 dólares.
Relativamente, ¿Cuál de ellos puede, dentro de su grupo, considerarse mejor
retribuı́do?

115. La empresa TELMIC S.A.C vende computadoras y ha llevado a cabo un estudio para
analizar el número de computadoras de escritorio que existe en pequeñas empresas del
distrito. Para tal efecto TELMIC S.A.C toma una muestra aleatoria de 40 pequeñas
E
AD

empresas y los datos recogidos se resumen en la siguiente distribución de frecuencias:

X frecuencia Frecuencia Porcentaje frecuencia frecuencia Porcentaje


relativa ( %) acumulada relativa acumulado
acumulada
3 5
4 0.175
-I I

5 14
22

6 47.5
20

7 8
8 0.175
9
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 102

a) Defina la variable de interés (X), de qué tipo es y qué nivel de medición tiene.
b) Defina la “frecuencia” en términos del problema.
c) Complete la distribución de frecuencias no agrupada de la variable en cuestión.
d ) Interprete, en términos del problema, los valores sombreados.
e) ¿Qué porcentaje de las empresas analizadas poseı́an como mı́nimo 8 computado-
ras?
f ) ¿Cuántas empresas poseı́an menos de 5 computadores?
EP

g) Calcule e interprete la media, mediana y desviación estándar de los datos.


UD

116. Suponga que las calificaciones obtenidas en los exámenes parciales por 100 estudiantes
universitarios en un curso de estadı́stica para negocios tenı́an una media de 70
puntos y una desviación estándar de 5 puntos. ¿Qué porcentaje mı́nimo de alumnos
obtuvieron una calificación entre 58 y 82 puntos, en los exámenes? Muestre los cálculos
A
IM

correspondientes para sustentar su respuesta.


-L

117. En un examen final de lógica la puntuación media de un grupo de 150 estudiantes fue
S
PU

de 78 y la varianza 64. En álgebra, sin embargo, la puntuación media final del grupo
fue de 73 y la desviación tı́pica 7.6. Mostrando los cálculos correspondientes, responda
M

lo siguiente: Relativamente,¿ En qué asignatura las notas fueron más variables?


CA

118. La empresa PAFPerú S.A.C instala puertas automáticas para cocheras. La siguiente
información indica el tiempo (en minutos) necesarios para tal instalación en una muestra
de 10 puertas:

24.6 28.3 32.4 32.7 38.2 40.0 42.7 44.4 46.0 54.5

Muestre los cálculos e interprete en términos del problema:

a) La desviación tı́pica.
E
AD

b) Los cuartiles.

119. Se seleccionó una muestra de libros al azar de una biblioteca. Si la extensión media de
los libros de esta muestra fue de 300 páginas con una desviación estándar de 20 páginas,
¿cuál es el porcentaje mı́nimo de libros que debe tener entre 200 y 400 páginas? Muestre
los cálculos correspondientes para sustentar su respuesta.

120. En tres plantas industriales que pertenecen a una misma compañı́a, se producen ciertos
componentes electrónicos. La producción mensual de cada una de ellas se resume en el
-I I

siguiente cuadro:
22
20

Planta A Planta B Planta C


Promedio mensual 140500 83200 254300
Desviación estándar 45325 33456 63350
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 103

El gerente de la compañı́a está realizando un análisis de la producción de las plantas, y


desea establecer una estrategia que optimice la producción y que reduzca la variabilidad.
Para iniciar el trabajo desea comparar la variabilidad en la producción de las plantas
para determinar en cuál de ellas se genera la mayor dispersión. Mostrando los cálculos
correspondientes, ayude al gerente a responder lo siguiente: Relativamente,¿en cuál de
las plantas es más variable la producción mensual?

121. A continuación se presenta la distribución de las inversiones mensuales (en dólares) de


una muestra de clientes de la Caja Municipal de Sullana (CMAC Sullana) y de una
EP

muestra de clientes de la Caja Municipal de Tacna (CMAC Tacna):


UD

CMAC Sullana CMAC Tacna


Inversión mensual Nro. de Inversión mensual Nro. de
(dólares) clientes (dólares) clientes
A
[1050 − 1250⟩ 120 [850 − 1150⟩ 100
IM

[1250 − 1450⟩ 400 [1150 − 1450⟩ 200


-L

[1450 − 1650⟩ 160 [1450 − 1750⟩ 480


S

[1650 − 1850⟩ 80 [1750 − 2050⟩ 100


PU

[1850 − 2050⟩ 32 [2050 − 2350⟩ 80


M

[2050 − 2250] 8 [2350 − 2650] 40


CA

a) Mostrando cálculos responda ¿Cuáles son más variables: las inversiones mensuales
de los clientes de CMAC Sullana o de CMAC Tacna?
b) Si compara la mediana y la media de las inversiones mensuales respectivas: ¿Qué
tipo de sesgo tiene la distribución de las inversiones en CMAC Sullana?
c) La microempresaria Milagros Ruiz es cliente de una de las CMAC mencionadas y
ha realizado una inversión mensual de 1580 dólares. Si dicha inversión no supera
el percentil 75, ¿De qué CMAC es cliente Milagros Ruiz? Sustente mostrando los
cálculos respectivos.
E
AD

d ) Mostrando cálculos responda ¿ Cuál es intervalo simétrico, alrededor de la


inversión mensual promedio en CMAC Tacna, en el que se encuentra como mı́nimo
el 72 % de las inversiones mensuales de los clientes de dicha CMAC?

122. La Figura 2.12 presenta las gráficas de caja y bigotes que muestran los datos de millas
por galón de gasolina utilizadas en la conducción en la ciudad para modelos de autos
pequeños y vehı́culos deportivos. Responda lo siguiente:
-I I

a) ¿Aproximadamente qué porcentaje de los vehı́culos deportivos obtienen más de 19


22

millas por galón?


20

b) ¿Cuál es el valor del rango o amplitud de las millas por galón utilizadas para el
caso de los autos pequeños?
c) ¿Aproximadamente qué porcentaje de los autos pequeños obtienen menos de 29
millas por galón?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 104
EP
UD

A
IM
S -L
PU
M
CA

E
AD

Figura 2.12: Millas por galón de gasolina utilizadas en la conducción para modelos de autos pequeños
y vehı́culos deportivos.

d ) ¿Cuál es el valor del rango intercuartı́lico de las millas por galón utilizadas para
el caso de los vehı́culos deportivos?
e) ¿Hay valores atı́picos en el conjunto de datos referente a los vehı́culos deportivos?
Sustente su respuesta.
-I I

f ) ¿Hay valores atı́picos en el conjunto de datos referente a los autos pequeños?


22

Sustente su respuesta.
20

123. La Figura 2.13 presenta las gráficas de caja y bigotes de las duraciones (en segundos)
de las canciones de dos conciertos diferentes. Responda lo siguiente:

a) ¿Aproximadamente qué porcentaje de canciones en el concierto 2, duran más de


CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 105
EP
UD

A
IM
S -L
PU
M
CA

E
AD

Figura 2.13: Duración de las canciones (en segundos) de dos conciertos.

275 segundos?
b) ¿Cuál es el valor del rango intercuartı́lico de las duraciones en el concierto 1?
c) ¿Aproximadamente qué porcentaje de canciones en el concierto 1, duran menos
de 200 segundos?
d ) ¿Cuál es el valor del rango o amplitud de las duraciones en el concierto 2?
-I I

e) ¿Hay duraciones atı́picas en el conjunto de datos referente al concierto 2? Sustente


22

su respuesta.
20

f ) ¿Hay duraciones atı́picas en el conjunto de datos referente al concierto 1? Sustente


su respuesta.

124. La Figura 2.14 presenta las gráficas de caja y bigotes de la cantidad de clientes que
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 106

poseen los gimnasios situados en los distritos de San Miguel y Santiago de Surco.
Responda lo siguiente:
EP
UD

A
IM
S -L
PU
M
CA

E
AD

Figura 2.14: Cantidad de clientes que poseen los gimnasios situados en los distritos de San Miguel y
Santiago de Surco.

a) ¿Aproximadamente qué porcentaje de los gimnasios de Santiago de Surco poseen


menos de 115 clientes?
b) ¿Cuál es el valor del rango o amplitud de la cantidad de clientes para el caso de
-I I

los gimnasios de San Miguel?


22

c) ¿Aproximadamente qué porcentaje de los gimnasios de San Miguel poseen más de


20

70 clientes?
d ) ¿Cuál es el valor del rango intercuartı́lico de la cantidad de clientes para el caso
de los gimnasios de Santiago de Surco?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 107

e) ¿Hay valores atı́picos en el conjunto de datos referente a los gimnasios de Santiago


de Surco? Sustente su respuesta.
f ) ¿Hay valores atı́picos en el conjunto de datos referente a los gimnasios de San
Miguel? Sustente su respuesta.
EP
UD

A
IM
S -L
PU
M
CA

E
AD

-I I
22
20
Capı́tulo 3

Probabilidad
EP
UD

3.1. Introducción
En el Capı́tulo 2 nos centramos en la Estadı́stica descriptiva. En dicho capı́tulo se
organizó un conjunto de datos en una distribución de frecuencias para resumirla y también
A
se calcularon medidas para describir las propiedades de centralización, variabilidad, forma y
IM

posición del conjunto analizado. Por tanto, la Estadı́stica descriptiva se ocupa de hacer ver
-L

algo que ya ha ocurrido, pues se trabaja con datos que tomamos como información de algo
S

que ya ha acontecido.
PU

Ahora veremos la segunda faceta de la Estadı́stica, especı́ficamente, el cálculo de la


M

posibilidad o probabilidad de que algo ocurrirá en el futuro. Este aspecto es el fundamento


CA

de la denominada inferencia estadı́stica o estadı́stica inferencial.


Los administradores sustentan sus decisiones en un análisis de incertidumbres como las
siguientes (Anderson y Sweeney, 2008):

1. ¿Qué posibilidades hay de que disminuyan las ventas si aumentamos los precios?

2. ¿Qué posibilidad hay de que un método nuevo de ensamblado aumente la productivi-


dad?

3. ¿Cuáles son las posibilidades de que el producto se tenga listo a tiempo?


E
AD

4. ¿Qué oportunidad existe de que un nuevo producto sea rentable?

Debido a que existe una incertidumbre considerable al tomar decisiones, resulta


importante que todos los riesgos implı́citos conocidos, se evalúen en forma cientı́fica. Ayuda
en esta evaluación la teorı́a de la probabilidad, a la que frecuentemente se denomina “ciencia
de la incertidumbre”. El empleo de tal teorı́a probabilı́stica permite a quien toma decisiones,
analizar -con información limitada- los riesgos y minimizar el azar inherente. Por ejemplo,
al lanzar un nuevo producto o aceptar un embarque recién llegado que contenga partes
-I I

defectuosas.
22

3.2. Probabilidad
20

La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por


tanto, las probabilidades son una medida del grado de incertidumbre asociado con cada uno
de los eventos previamente enunciados. Si cuenta con las probabilidades, tiene la capacidad
de determinar la posibilidad de ocurrencia que tiene cada evento.

108
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 109

Los valores de probabilidad son proporciones o fracciones que se encuentran en una escala
de 0 a 1. Los valores cercanos a 0 indican que las posibilidades de que ocurra un evento
son muy pocas. Los cercanos a 1 indican que es casi seguro que ocurra un evento. Otras
probabilidades entre cero y uno representan distintos grados de posibilidad de que ocurra
un evento. Por ejemplo, si considera el evento “que llueva mañana”, se entiende que si el
pronóstico del tiempo dice “la probabilidad de que llueva es cercana a cero”, implica que casi
no hay posibilidades de que llueva. En cambio, si informan que la probabilidad de que llueva
es 0.90, sabe que es muy posible que llueva. La probabilidad de 0.50 indica que es igual de
posible que llueva como que no llueva.
EP

Como los conceptos de probabilidad son tan importantes en el campo de la inferencia


UD

estadı́stica (cuyo desarrollo se verá en capı́tulos posteriores), en este capı́tulo se introduce el


lenguaje básico de la probabilidad, incluyendo definiciones como experimento, evento, espacio
muestra, variable aleatoria, etc.
A
3.2.1. Definiciones
IM

En el contexto de la probabilidad, un experimento es definido como un proceso que


-L

genera resultados definidos. Y en cada una de las repeticiones del experimento, habrá uno
S

y sólo uno de los posibles resultados experimentales. Ejemplos de experimento pueden ser:
PU

Lanzar una moneda, lanzar un dado, elegir a una persona de un grupo de n personas, lanzar
M

n monedas o lanzar una moneda n veces, lanzar n dados o lanzar un dado n veces, Elegir k
CA

artı́culos de un conjunto de n artı́culos, elegir a 2 personas de un grupo de n personas, etc.


A los resultados de los experimentos se les denomina eventos, los cuales pueden ser
simples o compuestos. El evento simple es un resultado o un suceso que ya no puede
desglosarse en componentes más simples. Los eventos compuestos pueden contener dos o
más eventos simples.
Se denomina espacio muestra al conjunto de todos los eventos posibles de un
experimento. Al espacio muestra se le suele denotar con la letra S o con la letra griega
Ω.
Se define variable aleatoria como una función definida sobre un espacio muestra S,
E
AD

donde a cada evento (ei ) del espacio muestra le corresponde un número real:

X(ei ) = xi

Una variable aleatoria puede ser:

Discreta: si el número de eventos posibles es finito o numerablemente infinito.

Continua: si el número de eventos posibles es infinito (no numerable).


-I I

Dado un espacio muestra, se pueden definir varias variables aleatorias sobre él.
22

Para ilustrar estas definiciones veamos los siguientes ejemplos:


20

1. Si el experimento es lanzar una moneda, luego los posibles eventos o resultados son
cara(C) o sello(S), entonces el espacio muestra del experimento será: Ω = {C, S}.
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 110

2. Un experimento consiste en lanzar 2 monedas (o lanzar una moneda dos veces), luego
los posibles eventos simples son cuatro: CC, CS, SC, SS, entonces el espacio muestra
del experimento será: Ω = {CC, CS, SC, SS}.
Gráficamente, este espacio muestra se puede representar de dos formas, como se muestra
en la figura 3.1
EP
UD

A
IM
S -L
PU

Figura 3.1: Representaciones de espacio muestra del lanzamiento de dos monedas


M
CA

Para este espacio muestra se podrı́an definir por ejemplo las siguientes variables
aleatorias: X = N úmero de caras, Y = N úmero de sellos, Z = N úmero de caras −
N úmero de sellos, W = 2 ∗ N úmero de caras + (N úmero de sellos)2 , . . ., etc. En todos
estos casos la variable aleatoria es discreta.

3. Un experimento consiste en lanzar 2 dados (o lanzar un dado dos veces), luego los
posibles eventos simples son 36: (1,1), (1, 2), . . . , (6, 6), luego el espacio muestra del
experimento será: Ω = {(1, 1), (1, 2), . . . , (1, 6), . . . , (6, 6)}. En la figura 3.2 se representa
gráficamente este espacio muestra.
E
AD

4. Un experimento consiste en elegir aleatoriamente a un alumno y registrar la estatura


(en cm) del mismo. El espacio muestra en este caso estarı́a conformado por todas
las medidas posibles de estatura que podrı́amos encontrar. Este es un ejemplo de un
espacio muestra continuo pues sus elementos resultan de un proceso de medición y
están definidos sobre la recta de números reales.

3.2.2. Enfoques de la probabilidad


Existen diferentes formas para definir la probabilidad de un suceso. Se analizarán tres
-I I

enfoques: probabilidad clásica (a priori), empı́rica y subjetiva.


22

Antes de iniciar, presentamos las siguientes notaciones básicas: P denota una probabili-
20

dad, P(A) denota la probabilidad de que ocurra el evento A.


La probabilidad clásica se basa en la consideración de que los resultados de un
experimento son igualmente posibles. Empleando el punto de vista clásico, la probabilidad
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 111
EP
UD

A
Figura 3.2: Representación de espacio muestra del lanzamiento de dos dados
IM
-L

de que suceda un evento se calcula dividiendo el número de resultados favorables entre el


S
PU

número total de resultados posibles:


M

N úmero de resultados éxito o f avorables


CA

P (A) = (3.1)
N úmero total de posibles resultados
Por ejemplo, si consideramos el experimento de lanzar un dado normal. ¿Cuál es la
probabilidad del evento C=obtener un número par? Los resultados posibles del experimento
son: 1, 2, 3, 4, 5, 6 y son igualmente probables de ocurrir. Luego hay tres resultados
“favorables” 2, 4, 6 en el conjunto de seis resultados posibles. Por lo tanto:

N úmero de resultados éxito o f avorables 3


P (C) = = = 0.5
N úmero total de posibles resultados 6
Otra manera para definir la probabilidad es la probabilidad empı́rica la cual está basada
E
AD

en las frecuencias relativas, es decir, realice (u observe) un procedimiento un gran número


de veces y cuente las veces que el suceso A ocurre en realidad. Con base en estos resultados
reales, P(A) se estima de la siguiente forma:

N úmero de veces que ocurrió A


P (A) = (3.2)
N úmero total de observaciones

Suponga que se efectúa un estudio con 751 graduados en administración de empresas en


una Universidad. Este experimento reveló que 383 de los 751 no estaban empleados según su
principal área de estudio en la universidad. Por ejemplo, una persona que se graduó en un área
-I I

especializada en contabilidad, ahora es gerente de mercadeo de una empresa de procesamiento


22

de lácteos ¿Cuál es la probabilidad de que A=un graduado especı́fico en administración esté


20

empleado en un área distinta a la principal de sus estudios universitarios?

N úmero de veces que ocurrió A 383


P (A) = = = 0.51,
N úmero total de observaciones 751
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 112

puesto que 383 de 751, o sea, 0.51 en términos de probabilidad, están en un campo laboral
diferente al de su área académica en la universidad, podemos emplear esto como una
estimación de la probabilidad. En otras palabras, con base en la experiencia, existe una
probabilidad de 0.51 de que un graduado en administración esté empleado en un campo
distinto al de su área principal de estudios.
Por último, el enfoque subjetivo se aplica, si existe poca o ninguna experiencia en la cual
se pueda basar una probabilidad. Fundamentalmente, esto significa evaluar las opiniones
disponibles y otra información subjetiva para después estimar o asignar la probabilidad.
Atinadamente a este concepto se le denomina probabilidad subjetiva. La probabilidad
EP

de un suceso A, se estima con base en el conocimiento de las circunstancias relevantes. Un


UD

ejemplo de esto es cuando se trata de estimar la probabilidad de que mañana llueva y los
meteorólogos usan su conocimiento experto de las condiciones del tiempo para desarrollar
un estimado de la probabilidad. Otros ejemplos son responder a: ¿Cuál es la probabilidad de
que usted apruebe este curso? ¿Cuál es la probabilidad de que la selección peruana de fútbol
A
IM

clasifique al próximo mundial?


-L

3.2.3. Conceptos importantes


S

Evento imposible: Es aquel que no puede ocurrir al realizarse un experimento. Por


PU

ejemplo, si se lanza un dado normal, ¿Cuál es la probabilidad de obtener 9? o si se selecciona


M

una carta de una baraja ¿Cuál es la probabilidad de obtener una carta de diamante y trébol
CA

a la vez?
Complemento de un evento: El complemento de un evento A, consiste en todos los
resultados o eventos en los cuales dicho evento no ocurre. El complemento de A se denota
como A. Por ejemplo si lanzamos un dado normal y definimos el evento A=obtener 5, entonces
el complemento de A serı́a: A = No obtener 5.
Eventos mutuamente excluyentes: Un conjunto de eventos son mutuamente
excluyentes entre sı́, cuando realizado un experimento, dichos eventos no pueden ocurrir al
mismo tiempo. Por ejemplo: si lanzamos un dado normal y definimos los eventos: A=obtener
4 puntos o más, B=obtener 3 y C=Obtener 2 puntos o menos, podemos decir que A, B y C
E
AD

son eventos mutuamente excluyentes entre sı́.


Eventos colectivamente exhaustivos: Un conjunto de eventos es colectivamente
exhaustivo, si cuando realizado un experimento, uno de los eventos puede ocurrir. También se
dice que cuando un conjuntos de eventos es colectivamente exhaustivo es porque el conjunto
de eventos cubre la totalidad del espacio muestra del experimento. Por ejemplo: si lanzamos
un dado normal y definimos los eventos: A=obtener número mayor a 4, B=obtener número
menor a 4 y C=obtener 4, podemos decir que A,B y C son eventos colectivamente exhaustivos,
pues dichos eventos coleccionan exhaustivamente todos los resultados del experimento lanzar
-I I

un dado.
22

El siguiente enunciado se concluye de los conceptos vistos: “Si un conjunto de eventos es


20

colectivamente exhaustivo y los eventos son mutuamente excluyentes, entonces la suma de


sus probabilidades es igual a 1”.
Ejemplo: Si lanzamos un dado normal y definimos los eventos: A=obtener número mayor
a 4, B=obtener número menor a 4 y C=obtener 4, notamos que A, B y C son eventos
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 113

mutuamente excluyentes entre sı́ y al mismo tiempo constituyen un conjunto de eventos


2 3 1
colectivamente exhaustivo por lo que al ser: P (A) = , P (B) = , P (C) = , observamos
6 6 6
que: P (A) + P (B) + P (C) = 1.
Ejemplo: Si lanzamos un dado normal y definimos el evento A=obtener 5, y el
complemento de A como: A = No obtener 5, notamos que A y A son eventos mutuamente
excluyentes entre sı́ y al mismo tiempo constituyen un conjunto de eventos colectivamente
1 5
exhaustivo por lo que al ser: P (A) = , P (A) = , observamos que: P (A) + P (A) = 1.
6 6
3.2.4. Reglas de conteo
EP

Al asignar o calcular probabilidades es necesario saber identificar, entender y contar


UD

los resultados experimentales. En muchos problemas el experimento involucrado no es tan


simple, lo cual complica el conteo del número total de posibles resultados y el número de
éxitos que luego ayudarı́an a calcular la probabilidad de que acontezca un evento pedido. En
estas circunstancias se han desarrollado reglas muy útiles que ayudan a contar.
A
Regla de conteo N°1: Si cualquiera de los “k” eventos mutuamente excluyentes y
IM

colectivamente exhaustivos pueden ocurrir en cada uno de los “n” ensayos, el número de
-L

posibles resultados es igual a:


S
PU

k k . . . ∗ k} = k n .
| ∗ k ∗{z (3.3)
“n” veces
M

Lo que se debe entender es que un experimento se describe como una sucesión de “n” pasos
CA

(ensayos) en los que hay siempre “k” resultados (mutuamente excluyentes y colectivamente
exhaustivos) en cada paso (ensayo).
Ejemplo: Suponga que lanza una moneda al aire 2 veces (o lanza al aire 2 monedas, una
vez) ¿Cuál es el número de diferentes resultados posibles (la secuencia de caras y sellos)? Si
consideramos el experimento de lanzar una moneda ensayado 2 veces (n=2), entonces en el
primer ensayo (lanzamiento) tenemos k=2 resultados posibles (cara y sello), en el segundo
lanzamiento también tenemos k=2 resultados posibles, por lo tanto siguiendo la expresión
(3.3) tenemos: N úmero de posibles resultados = k ∗ k = 2 ∗ 2 = 22 = 4, los cuales se aprecian
E

en el diagrama de árbol de la figura 3.1.


AD

Ejemplo: Suponga que lanza un dado 2 veces (o lanza 2 dados una vez) ?Cuántos posibles
resultados diferentes pueden ocurrir? Si consideramos el experimento de lanzar un dado
ensayado 2 veces (n=2), entonces en el primer ensayo (lanzamiento) tenemos k=6 resultados
posibles (1,2,3,4,5,6), en el segundo lanzamiento también tenemos k=6 resultados posibles,
por lo tanto siguiendo la expresión (3.3) tenemos: N úmero de posibles resultados = k ∗ k =
62 = 36, los cuales se aprecian en el diagrama de la figura 3.2.
Regla de conteo N°2: Si hay “k1 ” eventos en el primer ensayo, “k2 ” eventos en
el segundo ensayo, y “kn ” eventos en el n-ésimo ensayo, entonces el número de posibles
-I I

resultados es igual a:
22

k1 ∗ k2 ∗ . . . ∗ kn . (3.4)
20

Ejemplo: El menú de un restaurante tienen un precio fijo para las cenas completas
que consisten en un aperitivo, un platillo principal, una bebida y un postre. Se tiene la
posibilidad de elegir entre 5 aperitivos, 10 platillos, tres bebidas y seis postres. ¿Cuál es
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 114

el número total de cenas posibles? Si consideramos el experimento de armar una cena


completa debemos entender que debemos elegir un aperitivo, un platillo, una bebida y un
postre, entonces en el primer ensayo (elegir un aperitivo) tenemos k1 = 5 opciones posibles,
en el segundo ensayo (elegir un platillo) tenemos k2 = 10 opciones posibles, en el tercer
ensayo (elegir una bebida) tenemos k3 = 3 opciones posibles, en el cuarto ensayo (elegir un
postre) tenemos k4 = 6 opciones posibles, por lo tanto siguiendo la expresión (3.4) tenemos:
N úmero de posibles resultados = k1 ∗ k2 ∗ k3 ∗ k4 ∗ = 5 ∗ 10 ∗ 3 ∗ 6 = 900 posibles cenas.
Regla de conteo N°3: Esta regla está relacionada con el cálculo de maneras en las que
un conjunto de “n” elementos puede arreglarse en orden. Por tanto, el número de maneras
EP

en que los “n” elementos de un conjunto puede arreglarse en orden es:


UD

n! = n ∗ (n − 1) ∗ (n − 2) ∗ . . . ∗ 1, (3.5)

donde n! se conoce como factorial de n. (Nota: 0!=1). Ası́ pues, entiéndase que los arreglos
A
difieren por el orden en el que están dispuestos sus elementos.
IM

Ejemplo: ¿De cuántas maneras diferentes se pueden alinear en una fila cinco personas
-L

para tomarse una foto? Siguiendo la expresión (3.5), se tendrı́a que el número de maneras o
S

sucesiones diferentes de las 5 personas serı́a: 5 ∗ 4 ∗ 3 ∗ 2 ∗ 1 = 5! = 120


PU

Regla de conteo N°4: En muchos casos se necesita saber el número de formas en las que
M

un subconjunto de “x” elementos, de un grupo total de “n” elementos, puede arreglarse


CA

en orden. A cada posible arreglo se le denomina permutación. Entonces se denomina


permutaciones al número de maneras para arreglar “x” elementos seleccionados de un total
de “n” elementos teniendo en cuenta que el orden de selección es relevante, y se calculan
ası́:
n!
Pxn = (3.6)
(n − x)!
Ejemplo: Si se tienen las letras: a, b, c ¿cuántas arreglos ordenados de 2 letras se pueden
formar? Si nos piden arreglos ordenados de x=2 letras de las n=3 letras que nos dan, se
podrı́an formar 6 permutaciones: ab, ba, ac, ca, bc, cb. Sabemos que hay 6 permutaciones
E

pues aplicando la expresión (3.6), tenemos:


AD

3! 3∗2∗1
P23 = = = 6 permutaciones
(3 − 2)! 1

Ejemplo: Si cinco corredores compiten en la final de los 100 m. ¿de cuántos maneras
pueden ganarse los tres primeros puestos? Analizar las maneras de ganar los tres primeros
puestos implica formar arreglos ordenados de x=3 corredores de los n=5 que compiten, por
tanto se trata de permutaciones, entonces siguiendo la expresión (3.6) tenemos:
-I I

5! 5 ∗ 4 ∗ 3 ∗ 2!
P35 = = = 5 ∗ 4 ∗ 3 = 60 maneras
22

(5 − 3)! 2!
20

Regla de conteo N°5: En muchos casos se necesita saber el número de formas en las que
un subconjunto de “x” elementos, de un grupo total de “n” elementos, puede arreglarse sin
considerar el orden de la selección. A cada posible resultado se le denomina combinación.
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 115

Entonces se denomina combinaciones al número de maneras de seleccionar “x” elementos de


un total de “n” elementos sin que el orden de selección importe, y se calculan ası́:

n!
Cxn = (3.7)
x!(n − x)!

Ejemplo: Si se tienen las letras: a, b, c ¿cuántas combinaciones de 2 letras se pueden


formar? Si nos piden formar grupos de x=2 letras (sin que importe el orden en la selección)
de las n=3 letras que nos dan, se podrı́an formar 3 combinaciones: ab, bc y ac. Sabemos que
hay 3 combinaciones pues aplicando la expresión (3.7), tenemos:
EP

3! 3 ∗ 2!
UD

C23 = = = 3 combinaciones
2!(3 − 2)! 2! ∗ 1!

Ejemplo: Un comité de 5 personas se va a seleccionar en un club de 12 miembros ¿De


cuántos modos puede seleccionarse ese comité?
A
Analizar las maneras de formar el comité de 5 personas implica formar grupos de x=5
IM

personas de las n=12 que existen. Para formar el comité, no interesa el orden en que se
-L

dispongan las 5 personas elegidas, entonces se trata de combinaciones, luego siguiendo la


S
PU

expresión (3.7) tenemos:


M

12! 12 ∗ 11 ∗ 10 ∗ 9 ∗ 8 ∗ 7!
C512 = = = 792 maneras
CA

5!(12 − 5)! 5!7!

3.3. Propiedades básicas de la probabilidad


Escala de la probabilidad

Sea S el espacio muestra de un experimento, entonces la P(S)=1. Es decir, la


probabilidad del evento seguro es 1.

La probabilidad del evento imposible es 0: P(ϕ)=0


E

La probabilidad de un evento A es un número comprendido entre 0 y 1: 0 ≤ P (A) ≤ 1


AD

Probabilidad del complemento de un evento: Sea A el complemento del evento A,


entonces: P(A)=1-P(A)
Ejemplo: En una bolsa hay 7 canicas azules, 3 verdes y 2 rojas. La probabilidad del
7
evento A = elegir una canica azul, es: P (A) = . El complemento de A es A= elegir
12
5
una canica verde o roja, luego su probabilidad será: P (A) = . Observe que todos
12
los eventos elementales (las 12 canicas) se han tenido en cuenta en A o en A. La suma
-I I

de todos los casos favorables es entonces igual al número de casos posibles. Por tanto:
7 5
22

P (A) + P (A) = + = 1 ⇒ P (A) = 1 − P (A)


12 12
20

3.3.1. Ley de adición de probabilidades


La ley de la adición sirve para para calcular probabilidades que pueden expresarse de la
forma P(A o B), es decir, la probabilidad de que ocurra el evento A o de que ocurra el evento
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 116

B (o de que ambos ocurran), como único resultado de un experimento. Para aplicar esta ley
debemos entender si los eventos involucrados son mutuamente excluyentes o no.
Nota:Recuerde que dos eventos A y B son mutuamente excluyentes si, cuando un evento
ocurre, el otro no puede ocurrir. Por tanto, para que A y B sean mutuamente excluyentes,
se requiere que su intersección no contenga ningún evento en común.
Ley especial de la adición:

Si dos eventos A y B, son mutuamente excluyentes, se cumple que:


EP

P (A o B) = P (A) + P (B) (3.8)


UD

Ejemplo: Suponga que lanza un dado ¿cuál es la probabilidad de que se obtenga


un número mayor de 4 o un número menor de 2? Se aprecia que el experimento
es claramente, lanzar un dado, el cual tiene 6 resultados posibles. Si definimos los
eventos: A= Obtener un número mayor de 4={5, 6} y B= Obtener un número
A
IM

menor de 2={1}, claramente A y B son eventos mutuamente excluyentes, por lo


que, empleando la expresión (3.8), la probabilidad de que ocurra uno u otro serı́a:
-L

2 1 3 1
S

P (AoB) = P (A) + P (B) = + = =


PU

6 6 6 2
La ley especial de la adición se puede extender a 2 o más eventos mutuamente
M

excluyentes, ası́:
CA

P (E1 o E2 o E3 o . . . o En ) = P (E1 ) + P (E2 ) + . . . + P (En ) (3.9)

Ejemplo: Suponga que lanza dos dados ¿Cuál es la probabilidad de que se obtenga
una suma igual a 5 ó una suma igual a 8 ó una suma igual a 10?
Se aprecia que el experimento es claramente, lanzar dos dados, el cual tie-
ne 36 resultados posibles. Si definimos los eventos: A= Obtener suma igual a
5={(1, 4); (2, 3); (3, 2); (4, 1)}, B= Obtener suma igual a 8={(2, 6); (3, 5); (4, 4); (5, 3); (6, 2)}
E

y C=Obtener suma igual a 10={(4, 6); (5, 5); (6, 4)}, claramente A,B y C son eventos
AD

mutuamente excluyentes entre sı́, por lo que, empleando la expresión (3.9), la probabili-
4 5 3
dad de que ocurra uno u otro serı́a: P (AoBoC) = P (A)+P (B)+P (C) = + + =
36 36 36
12 1
=
36 3
Ley general de la adición:

Si dos eventos A y B, no son mutuamente excluyentes, se cumple que:


-I I

P (A o B) = P (A) + P (B) − P (AyB) (3.10)


22

donde P(A y B) denota la probabilidad de que A y B ocurran al mismo tiempo como


20

resultado en un ensayo del experimento.


Ejemplo: Suponga que lanza un dado ¿Cuál es la probabilidad de que se obtenga un
número mayor de 3 o un número par?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 117

Se aprecia que el experimento es claramente, lanzar un dado, el cual tiene 6 resultados


posibles. Si definimos los eventos: A= Obtener un número mayor de 3={4, 5, 6} y
B= Obtener un número par={2, 4, 6}, claramente A y B no son eventos mutuamente
excluyentes, ya que los eventos 4 y 6 son comunes a ambos eventos. Entonces empleando
la expresión (3.10), la probabilidad de que ocurra A o B serı́a: P (AoB) = P (A)+P (B)−
3 3 2 4 2
P (AyB) = + − = = .
6 6 6 6 3
La clave aquı́ es entender que para calcular la probabilidad de que un evento A ocurra
o un evento B ocurra, se calcula el número total de formas en que A puede ocurrir
EP

y el número de formas en que B puede ocurrir, y, si hay eventos comunes, se debe


compensar restando el número de resultados que se contaron dos veces.
UD

Ejemplo: Se tiene una baraja de 52 cartas, y se selecciona aleatoriamente una carta


¿Cuál es la probabilidad de que la carta sea roja o un as?
Se aprecia que el experimento es claramente, elegir una carta de las 52 que hay, el
A
cual tiene 52 resultados posibles. Si definimos los eventos: A= Obtener una carta roja
IM

y B= Obtener un as, claramente A y B no son eventos mutuamente excluyentes, ya


-L

que en la baraja existen 2 ases que son rojos, es decir son comunes a ambos eventos.
S
PU

Entonces empleando la expresión (3.10), la probabilidad de que ocurra A o B serı́a:


26 4 2 28 7
P (AoB) = P (A) + P (B) − P (AyB) = + − = = .
M

52 52 52 52 13
CA

La ley general de la adición se puede extender a 2 o más eventos, ası́:


X
P (E1 o E2 o E3 o . . . o En ) = P (E1 ) + P (E2 ) + . . . + P (En ) − P (Ei yEj ) +
X
+ P (Ei yEj yEk ) − . . . ± P (E1 y E2 y E3 y . . . y En ) (3.11)

Ejemplo: Suponga que lanza un dado ¿Cuál es la probabilidad de que se obtenga un


número par o un número menor de 3 o un número entre 2 y 4, inclusive?
Se aprecia que el experimento es claramente, lanzar un dado, el cual tiene 6 resultados
E

posibles. Si definimos los eventos: A= Obtener un número par={2, 4, 6}, B= obtener


AD

un número menor de 3 ={1, 2} y C=Obtener un número entre 2 y 4, inclusive={2, 3, 4},


claramente A,B y C no son eventos mutuamente excluyentes entre sı́, por lo que,
empleando la expresión (3.11), la probabilidad de que ocurra A o B o C serı́a:

P (AoBoC) = P (A) + P (B) + P (C) − P (AyB) − P (AyC) − P (ByC) + P (AyByC)


3 2 3 1 2 1 1 5
= + + − − − + =
6 6 6 6 6 6 6 6
-I I

3.3.2. Ley de multiplicación de probabilidades


22

En la sección 3.3.1 se presentó la ley de la suma para calcular P(A o B), la probabilidad de
20

que un solo ensayo tenga un resultado de A o B o ambos eventos. En esta sección se presenta
la ley básica de la multiplicación, la cual se utiliza para calcular P(A y B)1 , la probabilidad
1
En esta sección, P(A y B) sirve para denotar la probabilidad de que el evento A ocurra en un ensayo,
seguido por el evento B en otro ensayo. En la sección 3.3.1, P(A y B) denotó la probabilidad de que tanto
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 118

de que el suceso A ocurra en un primer ensayo y que el suceso B ocurra en un segundo ensayo,
es decir, un resultado entendido como una secuencia de eventos. Si el resultado del primer
evento A afecta de alguna forma la probabilidad del segundo evento B, es importante ajustar
la probabilidad de B para que refleje la ocurrencia del suceso A. La ley para el cálculo de
P(A y B) se denomina ley de la multiplicación porque implica multiplicar la probabilidad
del evento A por la probabilidad del evento B (donde la probabilidad del evento B se ajusta
por el resultado del evento A).
Para aplicar la ley de la multiplicación debemos entender si los eventos involucrados son
independientes o no.
EP

Ley especial de la multiplicación:


UD

Si dos eventos A y B son independientes, entonces la probabilidad de que ocurran A y


B, será:
P (A y B) = P (A) ∗ P (B) (3.12)
A
Dos eventos A y B son independientes cuando la ocurrencia de uno no afecta la
IM

probabilidad de la ocurrencia del otro.


-L

Ejemplo: Se lanzan dos monedas al aire ¿Cuál es la probabilidad de que ambas caigan
S
PU

cara?
M

Se aprecia que el experimento es claramente, lanzar dos monedas. Si vemos este


CA

experimento como si tuviéramos que lanzar una moneda dos veces, la naturaleza de
los resultados serı́an los mismos. Entonces con esa idea, el resultado pedido (obtener
2 caras) lo entendemos como la secuencia de eventos: A= Obtener cara en el primer
lanzamiento y B= Obtener cara en el segundo lanzamiento y claramente A y B son
eventos independientes entre sı́, por que lo que se obtenga en el primer lanzamiento no
influirá en el resultado del segundo. Ası́ empleando la expresión (3.12), la probabilidad
1 1 1
de que ocurra A y B en secuencia serı́a: P (AyB) = P (A) ∗ P (B) = ∗ = .
2 2 4
E
AD

Figura 3.3: Diagrama de árbol del lanzamiento de dos monedas o de lanzar una moneda dos veces
-I I
22

Como se aprecia en la Figura 3.3 cada resultado del experimento viene dado por un
20

camino del diagrama en árbol; si indicamos sobre cada rama su probabilidad, vemos que
A como B ocurran en el mismo ensayo. Por lo tanto, el verdadero significado de P(A y B) sólo se determina
sabiendo si nos referimos a dos ensayos en donde el evento A ocurra en el primer ensayo y el evento B ocurra
en el segundo o si nos referimos a un solo ensayo que puede tener resultados de A y B al mismo tiempo. Ası́
pues, el significado de P(A y B) dependerá del contexto que se enfrente.
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 119

podemos obtener la probabilidad del camino pedido multiplicando las probabilidades


de cada una de sus ramas.

La ley especial de la multiplicación se puede extender a 2 o más eventos independientes,


diciendo que la probabilidad de que ocurran conjuntamente “n” eventos independientes,
uno tras otro, es:

P (E1 y E2 y E3 y . . . y En ) = P (E1 ) ∗ P (E2 ) ∗ P (E3 ) ∗ . . . ∗ P (En ) (3.13)


EP

Ejemplo: Una fábrica elabora los productos A, B, C y D mediante cuatro procesos


que son independientes entre sı́. Usualmente son defectuosos el 3 %, 5 %, 5 % y 4 % de
UD

los productos A, B, C y D respectivamente. Si se extrae aleatoriamente un producto


de cada tipo:

a) ¿Cuál es la probabilidad de que los cuatro sean defectuosos?


A
IM

Se aprecia que el experimento es claramente,elegir 4 productos, uno de cada tipo.


Si vemos los resultados de este experimento como una secuencia de extracciones,
-L

el resultado pedido (4 productos defectuosos) lo entendemos como la secuencia de


S
PU

eventos: Ad = Obtener un producto A defectuoso y Bd = Obtener un producto B


M

defectuoso y Cd = Obtener un producto C defectuoso y Dd = Obtener un producto


CA

D defectuoso. Luego al ser cada proceso independiente del otro, entonces al elegir
un producto del tipo A, esta elección no influirá en la elección de un producto del
tipo B, C o D. Luego al ser extracciones o elecciones independientes, empleando
la expresión (3.13), la probabilidad pedida será:

P (Ad y Bd y Cd y Dd ) = P (Ad )∗P (Bd )∗P (Cd )∗P (Dd ) = 0.03∗0.05∗0.05∗0.04 = 3∗10−6

b) ¿Cuál es la probabilidad de que A y B sean defectuosos, y C y D no lo sean? El


resultado pedido (A y B sean defectuosos, y C y D no lo sean) lo entendemos como
E

la secuencia de eventos: Ad = Obtener un producto A defectuoso y Bd = Obtener


AD

un producto B defectuoso y Cb = Obtener un producto C bueno y Db = Obtener


un producto D bueno, luego la probabilidad pedida será:

P (Ad y Bd y Cb y Db ) = P (Ad )∗P (Bd )∗P (Cb )∗P (Db ) = 0.03∗0.05∗0.95∗0.96 = 1.368∗10−3

Ejemplo: Se lanza un dado cinco veces.

a) ¿Cuál es la probabilidad de que sólo los 3 primeros lanzamientos sean 6?


-I I

Se aprecia que el experimento es claramente,lanza un dado cinco veces. Si vemos los


22

resultados de este experimento como una secuencia de lanzamientos, el resultado


20

pedido (que sólo los 3 primeros lanzamientos sean 6) lo entendemos como la


secuencia de eventos: 1L6 = Obtener 6 en el primer lanzamiento y 2L6 = Obtener
6 en el segundo lanzamiento y 3L6 = Obtener 6 en el tercer lanzamiento y 4Lno6 =
No Obtener 6 en el cuarto lanzamiento y 5Lno6 = No Obtener 6 en el quinto
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 120

lanzamiento. Luego al ser cada lanzamiento independiente del otro (por que lo
que se obtenga en un lanzamiento no influirá en el resultado que se obtenga en
los otros lanzamientos) empleamos la expresión (3.13) para hallar la probabilidad
pedida:

P (1L6 y 2L6 y 3L6 y 4Lno6 y 5Lno6 ) =


1 1 1 5 5
= P (1L6 ) ∗ P (2L6 ) ∗ P (3L6 ) ∗ P (4Lno6 ) ∗ P (5Lno6 ) = ∗ ∗ ∗ ∗ =
6 6 6 6 6
13 ∗ 52 25
= 5
=
6 7776
EP
UD

b) ¿Cuál es la probabilidad de que exactamente en tres de esos cinco lanzamientos


salga el seis?
El resultado pedido (que exactamente en tres de esos cinco lanzamientos salga
el seis), tiene muchas formas de ocurrir. Una podrı́a ser la que se definió en
A
el apartado a), pero no es la única pues los tres seises podrı́an haber ocurrido
IM

en cualesquiera 3 de los 5 lanzamientos. Entonces para calcular la probabilidad


-L

pedida debemos multiplicar la probabilidad de una secuencia particular (la del


S
PU

apartado a) por ejemplo) por el número de formas en que podemos tener a los
3 seises dispuestos en los 5 lanzamientos, lo cual se calcula con C35 . Entonces la
M

probabilidad pedida es:


CA

P (obtener exactamente 3 seises) =


= P (1L6 y 2L6 y 3L6 y 4Lno6 y 5Lno6 ) ∗ C35 =
= P (1L6 ) ∗ P (2L6 ) ∗ P (3L6 ) ∗ P (4Lno6 ) ∗ P (5Lno6 ) ∗ C35 =
1 1 1 5 5
∗ ∗ ∗ ∗ ∗ C35 =
6 6 6 6 6
13 ∗ 52 250
= 5
∗ C35 =
6 7776
E

Ley general de la multiplicación:


AD

Si dos eventos A y B no son independientes, entonces la probabilidad de que ocurran


A y B, uno tras otro, será:

P (A y B) = P (A) ∗ P (B \ A) (3.14)

donde P (B \ A) se denomina probabilidad condicional. La notación \ indica que se está


considerando la probabilidad del evento B dada la condición de que el evento A ha ocurrido.
-I I

Por tanto, la notación P (B \ A) se lee “la probabilidad de B dado A”.


22

La probabilidad condicional de un evento es un concepto importante porque es una


20

probabilidad obtenida con la información adicional de algún otro evento que ya ocurrió.
Entonces de la expresión (3.14), puede calcularse P (B \ A), dividiendo la probabilidad de
que ambos eventos A y B ocurran entre la probabilidad del evento que ocurrió A:
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 121

P (A y B)
P (B \ A) = (3.15)
P (A)
La expresión (3.15) permite hallar la probabilidad condicionada a partir de las
probabilidades calculadas considerando todo el espacio muestral inicial del experimento
involucrado. Desde el punto de vista práctico, cuando se condiciona a un evento, realmente
se produce una reducción del espacio muestra: se sabe no sólo que el resultado obtenido es
un evento del espacio muestra sino que concretamente está en A, por lo que el conjunto de
posibles resultados de los que ahora se parte es A.
EP

Ejemplo: Una caja contiene 4 canicas azules y 6 rojas. Si se extraen dos aleatoriamente,
UD

una tras otra y sin reemplazo:

a) ¿Cuál es la probabilidad de que sean azules?


Se aprecia que el experimento es claramente, extraer dos canicas sin reemplazo. Si
A
vemos los resultados de este experimento como una secuencia de dos extracciones, el
IM

resultado pedido (que las dos canicas sean azules) lo entendemos como la secuencia de
-L

eventos: Ai : la i-ésima canica extraı́da sea azul y Ri : la i-ésima canica extraı́da sea roja,
S

donde i=1,2. Luego al ser cada extracción dependiente de la otra (por que el muestreo
PU

es sin reemplazo, es decir, la segunda extracción se realiza teniendo una canica menos
M

del total inicial, lo cual la hace dependiente de la primera extracción) empleamos la


CA

expresión (3.14) para hallar la probabilidad pedida:

4 3 12 2
P (A1 y A2 ) = P (A1 ) ∗ P (A2 \ A1 ) = ∗ = =
10 9 90 15

b) ¿Cuál es la probabilidad de que la primera sea azul y la segunda sea roja?

4 6 24 4
P (A1 y R2 ) = P (A1 ) ∗ P (R2 \ A1 ) = ∗ = =
10 9 90 15
E

c) ¿Cuál es la probabilidad de que una sea azul y otra sea roja?


AD

P (una azul y otra roja) = P (A1 y R2 ) + P (R1 y A2 ) =


4 6 6 4 48 8
= P (A1 ) ∗ P (R2 \ A1 ) + P (R1 ) ∗ P (A2 \ R1 ) = ∗ + ∗ = =
10 9 10 9 90 15

d) ¿Cuál es la probabilidad de elegir al menos una azul?

P (al menos una azul) = P (Obtener una azul) + P (Obtener dos azules) =
4 6 6 4 4 3 60 2
= P (A1 y R2 ) + P (R1 y A2 ) + P (A1 y A2 ) = ∗ + ∗ + ∗ = =
-I I

10 9 10 9 10 9 90 3
22

o también:
20

P (al menos una azul) = 1 − P (Obtener ninguna azul) = 1 − P (Obtener dos rojas) =
6 5 30 60 2
= 1 − P (R1 y R2 ) = 1 − P (R1 ) ∗ P (R2 \ R1 ) = 1 − ∗ =1− = =
10 9 90 90 3
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 122

Ejemplo: Se lanza un dado y se sabe que el resultado fue impar ¿Cuál es la probabilidad
de que haya salido un cinco?
1
Si se lanza un dado, la probabilidad de que salga un cinco es:P (obtener 5) = , ya que
6
el espacio muestra es Ω = {1, 2, 3, 4, 5, 6}. Sin embargo, si sabemos que hemos obtenido
un resultado impar:{1, 3, 5}, la probabilidad de que haya salido un cinco es:P (obtener 5 \
1
{1, 3, 5}) = .
3
En este ejemplo tendrı́amos dos eventos B=obtener 5 y A={1, 3, 5}. Si sabemos que el
resultado obtenido ha sido impar, es decir, ha ocurrido A, en realidad el espacio muestral,
conjunto de los posibles resultados, se ha reducido a Ω∗ = A = {1, 3, 5}.
EP

También podrı́amos calcular la probabilidad anterior utilizando el espacio muestral inicial,


UD

haciendo uso de la expresión (3.15):

1
P (A y B) P ({1, 3, 5} y {5}) 1
P (B \ A) = = = 6 =
3
A
P (A) P ({1, 3, 5}) 3
IM

6
-L

Ejemplo: En una ciudad se estudia la cantidad de usuarios de internet según el sexo.


S

Supongamos que se tienen los siguientes datos (Tabla 3.1) , en miles de individuos:
PU
M

Hombre Mujer Total


CA

Usa internet 40 35 75
No usa internet 185 240 425
Total 225 275 500

Tabla 3.1: Miles de usuarios de internet según el sexo en una ciudad

Si seleccionamos un ciudadano al azar y consideramos los eventos: I=Usar internet,


75 225
H=Ser hombre, se verifica que: P (I) = = 0.15 y P (H) = = 0.45. Además,
500 500
40
P (I y H) = = 0.08.
E

500
AD

Ahora, si seleccionamos aleatoriamente a un ciudadano varón,¿Cuál es la probabilidad de


que use Internet?
Según lo pedido, como ya sabemos que es un hombre el elegido, nos restringimos al
40
conjunto de 225 hombres (cambiamos de espacio muestral) y, entonces: P (I \ H) = =
225
0.1b
7.
Si aplicáramos la definición de probabilidad condicionada, expresión (3.15):

P (I y H) 0.08
P (I \ H) = = = 0.1b
7,
P (H) 0.45
-I I

obtendrı́amos el mismo resultado.


22

Nota:De la definición de probabilidad condicionada dada en la expresión (3.15) y los


20

ejemplos anteriores vemos que en general, la P (B \ A) no tiene porque ser igual a la P (B).
De hecho se tienen los siguientes casos:

P (B \ A) > P (B), se dice que A favorece la aparición de B.


CAPÍTULO 3. TEORÍA DE PROBABILIDAD 123

P (B \ A) < P (B), se dice que A no favorece la aparición de B.

P (B \A) = P (B), se dice que la ocurrencia de A no altera la probabilidad de ocurrencia


de B, es decir, B y A son independientes.

En el ejemplo anterior, se deducı́a del cuadro 3.1 que:P (I) = 0.15; P (I \ H) = 0.1b
7. En
este caso, el evento I no es independiente del evento H. Es más, P (I) < P (I \ H), por lo que
la probabilidad de usar internet se incrementa cuando nos restringimos a los varones.
Por otro lado, si estudiamos la probabilidad de que una mujer escogida al azar use internet,
35 b < P (I), lo que nos dice que la probabilidad de usar
EP

tendrı́amos que: P (I \ H) = = 0.127


275
internet disminuye al restringirnos a las mujeres.
UD

En cambio si el cuadro que hubiéramos tenido fuera:

Hombre Mujer Total


A
Usa internet 90 110 200
IM

No usa internet 135 165 300


-L

Total 225 275 500


S
PU

200 90
Entonces: P (I) = = 0.40; P (I \ H) = = 0.40. En este caso, la probabilidad
M

500 225
de usar internet no varı́a cuando nos restringimos a los ciudadanos varones, por lo que I es
CA

independiente de H.
3.3.3. Teorema de la probabilidad total y Teorema de Bayes
La ley de multiplicación es útil para determinar la probabilidad de un evento que depende
o no de otros. En esta sección se verá otro modo de calcular la probabilidad de un evento
considerando a este como el resultado de la unión de otros eventos. Para esto es necesario
definir el concepto de partición del espacio muestral de un experimento, necesario para
poder enunciar luego el teorema de la probabilidad total y como consecuencia el teorema de
Bayes.
E

Sean los eventos E1 , E2 , E3 , . . . , EN una partición del espacio muestra S, es decir, todos
AD

mutuamente excluyentes, de tal forma que la unión de todos conformen el espacio muestral
S. Sea además un evento E, perteneciente a S, como se muestra (sombreado) en la figura 3.4:
-I I
22
20

Figura 3.4: Partición del espacio muestral S

El objetivo es definir ¿Cuál es la probabilidad de que ocurra el evento E?


CAPÍTULO 3. TEORÍA DE PROBABILIDAD 124

Por lo visto sabemos que S = E1 ∪ E2 ∪ E3 ∪ . . . ∪ EN , entonces podemos escribir que:

P (E) = P (E y S) = P [E y (E1 o E2 o . . . o EN )]
P (E) = P (E y E1 ) o P (E y E2 ) o . . . o P (E y EN )
P (E) = P (E1 ) ∗ P (E \ E1 ) + P (E2 ) ∗ P (E \ E2 ) + . . . + P (EN ) ∗ P (E \ EN )
N
X
P (E) = P (Ei )P (E \ Ei ) (3.16)
i=1
EP

A la expresión (3.16) se le conoce como el Teorema de la probabilidad total, es decir,


UD

la probabilidad total de un evento es la suma exhaustiva de las probabilidades de todos los


casos mutuamente excluyentes que conducen a dicho evento.
Ejemplo: Una clase de estadı́stica avanzada está formada por 10 estudiantes de segundo
año, 30 de cuarto año y 10 graduados. Tres estudiantes de segundo año, 10 de cuarto año y 5
A
IM

graduados obtuvieron una calificación A. Si se selecciona al azar un estudiante de esta clase


¿Cuál es la probabilidad de que haya obtenido una calificación A?
-L

Claramente el experimento es seleccionar a un estudiante de esa aula, por lo que el


S
PU

espacio muestra lo conforman los 50 estudiantes de esa clase. Ese espacio muestra se ha
particionado en tres eventos mutuamente excluyentes y colectivamente exhaustivos que son:
M
CA

E1=ser alumno de segundo año, E2=ser alumno de cuarto año y E3=ser alumno graduado,
como se muestra en la figura 3.5
E
AD

Figura 3.5: Partición del aula en alumnos de segundo año, cuarto año y graduados

Ahora Si definimos el evento E=obtener calificación A, entonces entendemos que eso


puede ocurrir tanto con alumnos de segundo, cuarto y graduados, es decir el evento E se
relaciona con las partes en que fue dividido el espacio muestra del experimento. Si dibujamos
un diagrama de árbol se puede apreciar igualmente esto, tal como se muestra en la figura 3.6
-I I

Por el teorema de la probabilidad total según la expresión (3.16):


22

P
P (E) = N i=1 P (Ei )P (E \ Ei ) donde i=1,2,3, es decir, la probabilidad de que un alumno
20

obtenga calificación A es igual a la probabilidad de que sea de segundo año por la probabilidad
de obtener calificación A dado que es de segundo año, más la probabilidad de que sea de
cuarto año por la probabilidad de obtener calificación A dado que es de cuarto año, más la
probabilidad de que sea graduado por la probabilidad de obtener calificación A dado que
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 125
EP
UD

Figura 3.6: Diagrama de árbol para problema de clase de estadı́stica avanzada


A
IM

es graduado, es decir, la probabilidad total del evento obtener calificación A es la suma


-L

exhaustiva de las probabilidades de todos los casos mutuamente excluyentes que conducen
S
PU

a dicho evento. Entonces la probabilidad de que un alumno elegido al azar haya obtenido
calificación A serı́a:
M
CA

P (E) = P (E1 ) ∗ P (E \ E1 ) + P (E2 ) ∗ P (E \ E2 ) + P (E3 ) ∗ P (E \ E3 )


10 3 30 10 10 5
P (E) = ∗ + ∗ + ∗
50 10 50 30 50 10
18
P (E) = = 0.36
50

Ejemplo:Tenemos tres urnas: A con 3 canicas rojas y 5 negras, B con 2 canicas rojas y
1 negra y C con 2 canicas rojas y 3 negras. Escogemos una urna al azar y de ella extraemos
una canica, ¿cuál es la probabilidad de que la canica extraı́da sea roja?
Claramente el experimento es seleccionar primero una urna y luego una canica de la
E
AD

urna elegida. Entonces si definimos los eventos: Llamamos R= extraer una canica roja y N=
extraer una canica negra, en el diagrama de árbol de la figura pueden verse las distintas
probabilidades de ocurrencia de los eventos R o N para cada una de las tres urnas.
-I I
22
20

Figura 3.7: Diagrama de árbol para problema de urnas A, B y C

Para calcular la probabilidad de que la canica elegida sea roja, P(R), por el Teorema de
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 126

la probabilidad total tenemos:

P (R) = P (A) ∗ P (R \ A) + P (B) ∗ P (R \ B) + P (C) ∗ P (R \ C)


1 3 1 2 1 2
P (R) = ∗ + ∗ + ∗
3 8 3 3 3 5
173
P (R) = ≈ 0.48
360

Teorema de Bayes. Este teorema se utiliza para revisar probabilidades previamente


calculadas cuando se posee nueva información. Desarrollado por el reverendo Thomas Bayes
EP

en el siglo XVII, el teorema de Bayes es una extensión de lo que hemos aprendido hasta ahora
acerca de la probabilidad condicional.
UD

En el estudio de la probabilidad condicional se vio que revisar las probabilidades cuando


se obtiene más información es parte importante del análisis de probabilidades. Por lo general,
se suele iniciar el análisis con una estimación de probabilidad inicial (probabilidad a priori)
A
o probabilidad previa de los eventos que interesan. Después, de fuentes como una muestra,
IM

una información especial o una prueba del producto, se obtiene más información sobre estos
-L

eventos. Dada esta nueva información, se modifican o revisan los valores de probabilidad
S

mediante el cálculo de probabilidades revisadas a las que se les conoce como probabilidades
PU

posteriores. El teorema de Bayes es un medio para calcular estas probabilidades.


M

El teorema de Bayes es aplicable cuando los eventos para los que se quiere calcular la
CA

probabilidad revisada son mutuamente excluyentes y su unión es todo el espacio muestral.


En el caso de “n” eventos mutuamente excluyentes A1 , A2 , . . . , An , cuya unión sea todo el
espacio muestral, el teorema de Bayes aplica para calcular cualquiera de las probabilidades
posteriores P (Ai \ B) como se muestra en la expresión (3.17)

P (Ai ) ∗ P (B \ Ai )
P (Ai \ B) = (3.17)
P (A1 ) ∗ P (B \ A1 ) + P (A2 ) ∗ P (B \ A2 ) + . . . + P (An ) ∗ P (B \ An )

Con las probabilidades a priori P (A1 ), P (A2 ), . . . , P (An ) y las probabilidades condiciona-
les adecuadas, P (B \ A1 ), P (B \ A2 ), . . . , P (B \ An ), se usa la expresión (3.17) para calcular
E
AD

la probabilidad posterior de los eventos A1 , A2 , . . . , An .


Ejemplo: Del problema de la clase de estadı́stica avanzada, se nos plantea lo siguiente:
Si se selecciona al azar un estudiante y se encuentra que su calificación es A, ¿Cuál es la
probabilidad de que sea un graduado?
La probabilidad pedida es P (E3 \ E). Teniendo en cuenta el diagrama de árbol de la
figura 3.6 y utilizando el teorema de Bayes, expresión (3.17), tenemos:

P (E3 ) ∗ P (E \ E3 )
P (E3 \ E) =
P (E1 ) ∗ P (E \ E1 ) + P (E2 ) ∗ P (E \ E2 ) + P (E3 ) ∗ P (E \ E3 )
-I I

10 5
22

∗ 5
P (E3 \ E) = 50 10 = ≈ 0.28
20

10 3 30 10 10 5 18
∗ + ∗ + ∗
50 10 50 30 50 10

Ejemplo: Del problema de las tres urnas A, B y C, se nos plantea lo siguiente: Si elegimos
una urna al azar y extraemos una canica. Si la canica ha sido roja, ¿cuál es la probabilidad
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 127

de haber sido extraı́da de la urna A?


La probabilidad pedida es P (A \ R). Teniendo en cuenta el diagrama de árbol de la figura
3.7 y utilizando el teorema de Bayes, expresión (3.17), tenemos:

P (A) ∗ P (R \ A)
P (A \ R) =
P (A) ∗ P (R \ A) + P (B) ∗ P (R \ B) + P (C) ∗ P (R \ C)
1 3
∗ 45
P (A \ R) = 3 8 = ≈ 0.26
1 3 1 2 1 2 173
∗ + ∗ + ∗
3 8 3 3 3 5
EP

3.4. Problemas propuestos


UD

1. Se ha desarrollado una nueva vacuna para curar el resfrı́o. Se aplicó a 50 pacientes para
probar su efectividad.

a) ¿Cuál es el experimento?
A
IM

b) ¿Cuál es un resultado posible?


-L

c) Suponga que 35 pacientes mejoraron, ¿35 es una probabilidad?


S
PU

d ) La probabilidad de que la nueva vacuna sea efectiva se calcula como -2. Comente
esto.
M
CA

2. Al lanzar un dado normal. ¿Cuál es la probabilidad de obtener un número par?

3. El número de veces que ocurrió un evento en el pasado se divide entre el número total
de ocurrencias. ¿Cómo se denomina a este enfoque de la probabilidad?

4. Si es verdad que no existe ninguna probabilidad de que una persona se recupere después
de recibir 50 heridas de bala, ¿la probabilidad asignada a este evento es -1? ¿Por qué?

5. Determine el valor de probabilidad aplicable a las siguientes situaciones e indicando el


enfoque aplicado para su hallazgo en cada caso.
E
AD

a) La probabilidad de sufrir un accidente de trabajo en una determinada industria a


lo largo de un año. Una muestra aleatoria de 10 empresas que emplean a un total
de 8000 personas reveló que ocurrieron 400 accidentes de trabajo en un periodo
reciente de 12 meses.
b) La probabilidad de que una franquicia de comida rápida vaya a tener éxito
financiero. El futuro inversionista obtiene datos de otras franquicias similares,
estudia el desarrollo del área residencial en el cual se ubica la instalación y
considera el volumen de venta que se requiere para el éxito financiero con base en
-I I

la inversión requerida de capital y en los costos de operación. En general, el criterio


22

del inversionista es que existe un 80 % de probabilidad de que la instalación tenga


20

éxito financiero y 20 % de que no lo tenga.

6. Si se lanza al aire una moneda siete veces, ¿Cuántos resultados diferentes son posibles?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 128

7. Los sistemas comunes de alarma para casas tienen un código que consta de cuatro
dı́gitos. Los dı́gitos (0 hasta 9) pueden estar repetidos, aunque deben ingresarse en
el orden correcto. Suponga que usted planea tener acceso intentando códigos hasta
encontrar el correcto, ¿Cuántos códigos diferentes son posibles?

8. Angélica tiene para vestirse 2 pantalones, 3 polos y 4 pares de zapatillas, todas prendas
distintas. ¿De cuántas maneras podrı́a vestirse?

9. ¿Cuántos números pares de 3 cifras existen?


EP

10. ¿De cuántas maneras se pueden ordenar 6 libros en un estante?


UD

11. ¿Cuántos números de cinco cifras distintas se pueden formar con las cifras impares?
¿Cuántos de ellos son mayores de 70.000?

12. Si se elige un número de cinco cifras distintas, formado con las cifras impares, ¿Cuál es
A
la probabilidad de que el número elegido sea mayor de 70000?
IM
-L

13. Hay un club con 15 socios. Se desea elegir una mesa directiva formada por un presidente,
S

un vicepresidente, un secretario y un tesorero. ¿De cuántas maneras se puede hacer la


PU

elección, suponiendo que un socio puede ocupar sólo un cargo?


M

14. En una carrera de 500 metros participan doce corredores ¿De cuántas maneras pueden
CA

adjudicarse las medallas de oro, plata y bronce?

15. En una clase de 24 alumnos se quiere elegir un comité formado por tres alumnos
¿Cuántos comités diferentes se pueden formar?

16. Tenemos un grupo de 12 personas, donde 5 son administradores y 7 son economistas.


Se quiere constituir una comisión de 5 personas donde 2 sean administradores y 3 sean
economistas.

a) ¿De cuántas formas podrá constituirse la comisión si todas las personas son
E
AD

elegibles?
b) ¿De cuántas formas podrá constituirse la comisión si un economista particular ha
de estar en esa comisión?
c) ¿De cuántas formas podrá constituirse la comisión si dos administradores concretos
no pueden estar juntos en esa comisión?

17. Supongamos que 20 miembros de una organización se dividirán en tres comités:


Reglamento, Presupuesto, Actividades. Los comités de Reglamento y de Presupuesto
-I I

tendrán 8 miembros cada uno y el comité de Actividades tendrá 4. ¿De cuántas maneras
22

se pueden asignar los miembros a esos comités?


20

18. Escribir o definir el espacio muestra de cada uno de los siguientes experimentos:

a) Lanzar primero una moneda y luego un dado.


b) Elegir una esfera de una caja que contiene: 6 esferas rojas, 4 blancas y 5 azules.
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 129

c) El papá de un bebé próximo a nacer quiere que su hijo se llame: Juan, Camilo o
Felipe. La mamá por su parte pretende que se llame: Andrés o Paolo. Para que
ambos queden felices deciden combinar los nombres propuestos considerando que
primero irá el del padre y luego el de la mamá. Defina las formas que se pueden
proponer para el nombre del bebé.

19. En la tinka se extraen 6 diferentes números del 1 al 45. Un jugador gana o comparte
el premio mayor cuando escoge correctamente los 6 números. Calcule la probabilidad
de ganar el premio mayor de la tinka (No se requiere que el jugador seleccione los seis
EP

números en el mismo orden en que se sacaron, por lo que el orden es irrelevante)


UD

20. Una moneda se lanza 7 veces, calcular la probabilidad que aparezcan exactamente 4
caras.

21. De una baraja de 52 cartas se sacan 3 cartas. Determinar la probabilidad que todas
A
sean corazones.
IM

22. Se lanza un dado cinco veces.


S -L

a) Determine la probabilidad de que en los tres primeros lanzamientos salga el seis.


PU

b) Determine la probabilidad de que exactamente en tres de esos cinco lanzamientos


M

salga el seis.
CA

23. Si la probabilidad de que un bebé que va a nacer sea varón es de 0.5. Calcule la
probabilidad de que de los siete hijos de un matrimonio dos sean varones y cinco sean
mujeres.

24. Una caja contiene 12 naranjas, tres de las cuales están malogradas. Si seleccionamos al
azar 5 naranjas para preparar jugo:

a) ¿Cuántos grupos de 5 naranjas se podrı́an formar?


E

b) ¿Cuántos grupos de 5 naranjas contienen 2 naranjas malogradas?


AD

c) ¿Cuál es la probabilidad que dos de las naranjas seleccionadas estén malogradas?


d ) ¿Cuál es la probabilidad de que ninguna de las naranjas seleccionadas esté
malograda?
e) ¿Cuál es la probabilidad de que haya seleccionado al menos una naranja
malograda?

25. Si cinco corredores compiten en la final de 100 metros planos, ¿De cuántos modos
pueden ganarse los tres primeros puestos?
-I I
22

26. Un entrevistador seleccionó al azar 4 de 10 personas disponibles ¿Cuántos grupos


20

diferentes de 4 son posibles?

27. En un grupo de teatro hay 10 hombres y 6 mujeres. Cuatro de los hombres pueden actuar
como actores masculinos principales y los otros actuarán en papeles secundarios, tres
de las mujeres pueden actuar en papeles femeninos principales y las otras en papeles
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 130

secundarios. ¿De cuántas maneras pueden elegirse los actores para una obra de teatro
que exige un actor principal, una actriz principal, dos actores secundarios y tres actrices
secundarias?

28. Se van a seleccionar cinco soldados de un grupo de doce voluntarios para una misión
peligrosa.

a) ¿De cuántos modos se podrán seleccionar?


b) ¿Cuántas veces podrán ser incluidos los dos más valientes?
EP

c) ¿Cuántas veces será incluido sólo uno de los dos más valientes?
UD

29. A usted le gustarı́a hacer una ensalada que contenga lechuga, tomate, pepino y
germinados. Se dirige hacia el supermercado con el fin de comprar un tipo de cada
uno de estos ingredientes. Ahı́ descubre que existen ocho tipos de lechugas, cuatro
tipos de tomates, tres tipos de pepinos y tres tipos de germinados en venta ¿Cuántos
A
IM

tipos diferentes de ensaladas tiene para elegir?


-L

30. Se lanzan dos dados:


S
PU

a) ¿Cuál es la probabilidad de que se obtenga una suma igual a 5 ó una suma igual
M

a 7?
CA

b) ¿Cuál es la probabilidad de que no se obtenga ni suma 5 ó 7?

31. Al tirar un dado ¿cuál es la probabilidad de que caiga un uno o un dos o un seis?

32. Se ha de entrevistar a un grupo selecto de empleados de una compañı́a con respecto a


un plan de pensiones. Se efectuarán entrevistas detalladas a cada uno de los empleados
seleccionados en la muestra. Éstos se clasificaron como sigue:

Clasificación Evento Número de empleados


Supervisores A 120
E
AD

De mantenimiento B 50
De producción C 1460
Gerencia D 275
Secretarial E 68

a) Si se elige a un empleado ¿ Cuál es la probabilidad de que sea de mantenimiento


o una secretaria?
-I I

b) Si se elige a un empleado ¿ Cuál es la probabilidad de que sea de gerencia?


22

c) ¿Los eventos en el apartado a) son complementarios? ¿son colectivamente


20

exhaustivos? ¿son mutuamente excluyentes?

33. ¿Cuál es la probabilidad de que una carta elegida al azar de una baraja sea un rey o
una de corazones?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 131

34. Al tirar un dado ¿cuál es la probabilidad de que se obtenga un número mayor de 3 o


un número par?

35. Al tirar un dado ¿cuál es la probabilidad de que se obtenga un número par o un número
menor de 3 o un número entre 2 y 4, inclusive?

36. Se lanzan dos monedas al aire,¿Cuál es la probabilidad de que ambas caigan cara?

37. Suponga que en una caja hay 10 rollos fotográficos, de los cuales 3 son defectuosos. Se
van a seleccionar aleatoriamente 2 rollos, uno después del otro ¿Cuál es la probabilidad
EP

de escoger un rollo con defecto seguido por otro con tal condición?
UD

38. La primera carta seleccionada de una baraja de 52 naipes fue un rey.

a) Si se devuelve a la baraja completa,¿Cuál es la probabilidad de que salga otro rey


en la segunda toma?
A
IM

b) Si no se repone dicha carta, ¿cuál es la probabilidad que aparezca un rey en la


segunda toma?
S -L

c) ¿Cuál es la probabilidad de que salga un rey en la primera toma y otro en la


PU

segunda (considerando que el primer rey no se repuso)?


M

39. La junta de directores de una compañı́a está formada por 8 hombres y 4 mujeres. Se
CA

seleccionará un comité de 4 miembros, en forma aleatoria, para recomendar a un nuevo


presidente de la compañı́a.

a) ¿Cuál es la probabilidad de que sean mujeres los cuatro miembros del comité de
investigación?
b) ¿Cuál es la probabilidad de que los cuatro miembros sean hombres?
c) ¿La suma de las probabilidades para a) y b) es igual a 1? Explique su respuesta.

40. Una caja contiene 4 canicas blancas y 6 negras. Si se extraen dos aleatoriamente, una
E
AD

tras otra y sin reemplazo:

a) ¿Cuál es la probabilidad de que sean blancas?


b) ¿Cuál es la probabilidad de que la primera sea blanca y la segunda sea negra?
c) ¿Cuál es la probabilidad de que una sea blanca y la otra sea negra?

41. Una caja contiene 4 canicas azules y 6 rojas. Si se extraen dos aleatoriamente, una tras
otra y sin reemplazo:
-I I

a) ¿Cuál es la probabilidad de que sean azules?


22

b) ¿Cuál es la probabilidad de que la primera sea azul y la segunda sea roja?


20

c) ¿Cuál es la probabilidad de que una sea azul y la otra sea roja?


d ) ¿Cuál es la probabilidad de elegir al menos una azul?
e) ¿Cuál es la probabilidad de que ninguna sea azul?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 132

42. Un lote consta de 10 artı́culos buenos, 4 con pequeños defectos y 2 con defectos graves.

a) Si se elige un artı́culo al azar. Encontrar la probabilidad de que no tenga defectos.


b) Si se elige un artı́culo al azar. Encontrar la probabilidad de que tenga un defecto
grave.
c) Si se elige un artı́culo al azar. Encontrar la probabilidad de que sea bueno o tenga
un defecto grave.
d ) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
de que ambos sean buenos.
EP

e) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
UD

de que ambos tengan defectos graves .


f ) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
de que a lo menos uno sea bueno.
A
g) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
IM

de que a lo más uno sea bueno.


-L

h) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
S
PU

de que exactamente uno sea bueno.


M

i ) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
CA

de que ninguno tenga defectos graves.


j ) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
de que ninguno sea bueno.

43. Se lanzan dos dados y se sabe que la suma resultó igual a 8 ¿Cuál es la probabilidad
de que la diferencia sea 2?

44. Se eligen 5 cartas de una baraja completa de 52. La baraja está conformada por cuatro
“palos” (corazones, espadas, tréboles y cocos) y por trece denominaciones (1, 2, ..., 13).
¿Cuál es la probabilidad de que:
E
AD

a) todas las cartas sean del mismo palo?


b) hayan dos “1” y tres “13”?
c) hayan dos cartas de una denominación y tres de otra?
d ) hayan dos corazones y tres espadas?
e) hayan dos cartas de un palo y tres de otro palo?

45. Un comerciante quiere comprar un lote de 25 piñas, y decide comprarlo solamente si


-I I

al seleccionar 3 aleatoriamente, ninguna está malograda. Supóngase que realmente hay


22

4 piñas malogradas (el comerciante no lo sabe), ¿Cuál es la probabilidad de que no


20

compre el lote?

46. José, Bruno y Mónica lanzan sucesivamente una moneda. Si el primero en obtener cara
gana el juego,¿Cuáles son las respectivas probabilidades de ganar el juego si cada uno
lanza sólo una vez?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 133

47. En una urna hay siete esferas, que tienen marcadas las siguientes letras: C, A, L, C,
U, L, O. Si se extraen, una por una, las siete esferas, y se van colocando de izquierda
a derecha, ¿Cuál es la probabilidad de que se forme la palabra CALCULO?

48. Un estudiante de estadı́stica ha estimado que en 4 horas puede estudiar un tema para el
examen del dı́a siguiente. Comienza a estudiar a las 8 p.m. con el riesgo de que haya un
“apagón” en cualquier momento. ¿Cuál es la probabilidad de que, como consecuencia
de un “apagón”, lo que le falte estudiar sea menos de la quinta parte de lo que haya
estudiado? Asuma que el apagón puede ocurrir en cualquier instante.
EP

49. Suponga que en una habitación oscura hay seis cajas blancas, cada una conteniendo
UD

tres esferas verdes y cinco amarillas, y dos cajas negras, cada una conteniendo dos
esferas verdes y cuatro amarillas. Si usted entrara en la habitación y seleccionara
aleatoriamente una caja y después aleatoriamente tomara de ella una esfera, ¿Cuál
es la probabilidad de que se seleccionara una esfera amarilla?
A
IM

50. En el jardinero del señor Rodrı́guez no se puede confiar. La probabilidad de que olvide
-L

regar el rosal durante la ausencia del señor Rodrı́guez es 2/3. El rosal está en estado
S

inseguro: si se le riega tiene igual probabilidad de progresar o de secarse, pero solamente


PU

un 0,25 de probabilidad de progresar si no se le riega. Después de su regreso, el señor


M

Rodrı́guez se encuentra que su rosal está seco. ¿Cuál es la probabilidad de que el


CA

jardinero no lo haya regado?

51. En un almacén se encuentran 80 cajas con 100 fusibles cada una. Veinte cajas contienen
fusibles producidos por la máquina A, 30 cajas contienen fusibles producidos por
la máquina B y 30 tienen fusibles producidos por la máquina C. las cajas están
almacenadas al azar, sin que importe la máquina de procedencia. La máquina A
produce, en promedio, 5 % de fusibles defectuosos; la máquina B, 3 % y la máquina
C, 2 %.
E

a) Si se selecciona una de estas cajas al azar y de ellas se selecciona uno de sus


AD

fusibles,¿Cuál es la probabilidad de que sea defectuoso?


b) Si se selecciona una de estas cajas al azar y de ellas se selecciona uno de sus
fusibles y se encuentra que es defectuoso, ¿Cuál es la probabilidad de que haya
sido producido por la máquina B?

52. Las caras numeradas 1, 2 y 3 de un dado, son de color rojo; las caras numeradas 4 y
5 son de color blanco, y la cara numerada 6 es azul. Al lanzar este dado, cuál es la
probabilidad:
-I I

a) que aparezca una cara roja o el 5?


22
20

b) Que aparezca una cara roja o un número impar?

53. Una compañı́a de seguros de automóviles clasifica a los conductores en tres clases: A,
alto riesgo, B, riesgo medio, y C bajo riesgo. La clase A constituye el 30 % de los
conductores que suscriben un seguro con la compañı́a; la probabilidad de que uno de
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 134

esos conductores sufra un accidente en un año es 0.1. Los datos correspondientes para
la clase B son 50 % y 0.03 y para la clase C son 20 % y 0.01.

a) Un determinado cliente seleccionado entre los asegurados, que probabilidad tiene


de que sufra un accidente en el primer año.
b) Si seleccionamos un cliente accidentado el primer año. ¿Cuál es la probabilidad de
que este cliente esté en cada una de las clases A, B, C.

54. Una compañı́a que fabrica zapatos tiene 3 fábricas. La primera produce 25 % de los
EP

zapatos de la compañı́a, la segunda el 60 %, y la tercera el 15 %. El tamaño de algunos


de los pares producidos es clasificado erróneamente. Esto ocurre en el 1, 0.5 y 2 % de los
UD

casos en las tres fábricas, respectivamente. Si se compra un par de zapatos fabricado


por esta empresa, ¿Cuál es la probabilidad de que su tamaño haya sido clasificado
erróneamente?
A
55. En un almacén hay doce pasillos. Nueve de ellos están en la sección de abarrotes
IM

marcados: A1 a A9, y 3 están en la sección de farmacia, marcados: F1, F2 y F3.


-L

Si el gerente de la tienda selecciona aleatoriamente un pasillo para utilizarlo de manera


S
PU

especial, obtenga la probabilidad de que:


M

a) El pasillo tenga numeración impar.


CA

b) El pasillo esté en la sección de abarrotes y tenga numeración par.


c) El pasillo esté en la sección de farmacia dado que tiene numeración impar.

56. En un poblado, el 55 % de los votantes están registrados en el partido polı́tico A y el


45 % de los votantes están registrados en el partido polı́tico B. hay dos candidatos a la
alcaldı́a: Rafael, del partido A, y Daniel del partido B. En la elección, 80 % de los del
partido A y 10 % de los del partido B votaron por Rafael. El 20 % de los del partido A
y 90 % de los del partido B votaron por Daniel.
E

a) Si se selecciona un votante al azar ¿Cuál es la probabilidad de que haya votado


AD

por Rafael?
b) Si se selecciona al azar un votante y se encuentra que ha votado por Rafael, ¿Cuál
es la probabilidad de que sea del partido A?

57. Se nos dan dos urnas como sigue: Una urna A contiene 5 bolas rojas 3 blancas y 8
azules. La urna B contiene 3 Bolas rojas y 5 blancas. Se lanza un dado corriente, si
aparece el 3 o el 6, se escoge una bola de B, de lo contrario se escoge una de A. Hallar
la probabilidad de que:
-I I
22

a) Aparezca una bola roja


20

b) Una bola blanca


c) Una bola azul
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 135

58. Se nos dan dos urnas como sigue: Una urna A contiene 5 bolas rojas y 3 blancas. La
otra urna B contiene 1 bola roja y 2 blancas. Se lanza un dado corriente si aparece 3 o
6 se saca una bola de B y se pone en A y luego se saca una bola de A, de lo contrario
se saca una de A y se pone en B y luego se saca una de B.

a) ¿Cuál es la probabilidad de que ambas sean rojas?


b) ¿Cuál es la probabilidad de que las dos sean blancas?

59. Una empresa dedicada a la fabricación de automóviles, desea lanzar al mercado un


nuevo modelo. Al estudiar la posible situación económica que existirá se contemplan
EP

tres únicas alternativas existencia de inflación, estabilidad o depresión. Se estima que:


UD

a) dichas alternativas son igualmente probables y b) la probabilidad de que se lance el


nuevo modelo es de 0.7 si existe inflación, 0.4 si existe estabilidad y de 0.1 si la situación
es de depresión.
A
a) Determinar la probabilidad de que el modelo salga al mercado.
IM

b) Supuesto que ha salido al mercado, ¿cuál es la probabilidad de que se haya lanzado


-L

existiendo depresión.
S
PU

60. Se lanza una moneda cinco veces. Muestre mediante un diagrama de árbol todos
M

los resultados posibles. ¿Cuál es la probabilidad de obtener al menos tres caras


CA

consecutivas?

61. Una clase de estadı́stica avanzada está formada por 10 estudiantes de segundo año, 30
de cuarto año y 10 graduados. Tres estudiantes de segundo año, 10 de cuarto año y 5
graduados obtuvieron una calificación A.

a) Si se selecciona al azar un estudiante de esta clase,¿Cuál es la probabilidad de que


haya obtenido una calificación A?
b) Si se selecciona al azar un estudiante y se encuentra que su calificación es A, ¿Cuál
es la probabilidad de que sea un graduado?
E
AD

62. Se ha observado que los hombres y las mujeres reaccionan de una manera diferente
en ciertas circunstancias; 70 % de las mujeres reaccionan positivamente en dichas
circunstancias, mientras que el porcentaje en los hombres es solamente del 40 %. Se
sometió a prueba a un grupo de 20 personas, 15 mujeres y 5 hombres, y se les pidió
llenar un cuestionario para descubrir sus reacciones. Una de las respuestas recogidas al
azar de las 20 resultó negativa, ¿Cuál es la probabilidad de que haya sido contestada
por un hombre?
-I I

63. En un conocido juego con dados el jugador participante lanza dos dados. Si obtiene
22

suma siete u once, gana. Si no, debe seguir lanzando hasta obtener el mismo resultado
20

del primer lanzamiento antes de que salga siete u once. Si sale siete u once antes de
conseguir el mismo resultado del primer lanzamiento, pierde.

a) ¿Cuál es la probabilidad de que el jugador obtenga suma 8 en el primer


lanzamiento, y luego pierda el juego?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 136

b) ¿Cuál es la probabilidad de que el jugador obtenga suma cinco en el primer


lanzamiento, y luego gane el juego?

1
Nota: Puede ser útil la siguiente fórmula: 1 + x + x2 + x3 + ... =
1−x
64. Las probabilidades que tienen tres alumnos de aprobar Estadı́stica son: 0,20; 0,40; 0,50.
Determine la probabilidad de que:

a) Solamente apruebe el segundo.


b) Solamente apruebe uno.
EP
UD

65. Suponga que hay tres semáforos entre la casa de Quique y la UDEP. Al llegar a cada
uno de ellos, éstos pueden estar en rojo (R) o verde (V). Considérese que el ámbar
dura un tiempo despreciable. Quique ha verificado que, en el primer semáforo, el rojo
dura tanto como el verde; pero en el segundo, el rojo dura el doble que el verde; y en
A
el tercero, el verde dura el doble que el rojo. ¿Cuál es la probabilidad de que en el
IM

siguiente viaje a la UDEP:


S -L

a) Tenga que parar por exactamente una luz roja?


PU

b) Tenga que parar al menos por una luz roja?


M
CA

66. El profesor Álvarez ha estado enseñando Matemática Básica durante varios años. Sabe
que 80 % de los estudiantes terminan los problemas asignados. Determinó que de los
alumnos que cumplen con su trabajo, 90 % aprobará el curso. De aquellos estudiantes
que no lo hacen ası́, 60 % será aprobado. Julio Manrique cursó Matemática básica
durante el semestre pasado con el profesor Álvarez y recibió una calificación aprobatoria.
¿Cuál es la probabilidad de que sı́ haya hecho las tareas?

67. Una familia tiene 5 hijos. Suponiendo que la probabilidad de que un hijo sea varón o
mujer es la misma, determine la probabilidad de que:
E

a) Los 5 sean del mismo sexo.


AD

b) Cuatro sean varones.

68. En un curso de Estadı́stica hay 5 alumnos del IV ciclo, 34 del V, 21 del VI, 5 del VII
y 2 del VIII. Si se eligiera un comité de 5 personas, ¿cuál es la probabilidad de que:

a) todos los ciclos estén representados en el comité?


b) sólo el VI ciclo tenga miembros en el comité?
-I I

69. En una prueba de aptitud conformada por 25 preguntas, 4 son de cultura general. Si a
22

cada alumno se le asignan 20 preguntas al azar, ¿Cuál es la probabilidad de que:


20

a) No se le asigne ninguna pregunta de cultura general?


b) Le asignen al menos 2 preguntas de cultura general?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 137

70. De los 20 proyectos presentados por un grupo de investigadores de una Universidad,


12 son del área de informática y los restantes del área tecnológica. Si tres de estos
proyectos son cancelados por recorte de presupuesto, esta cancelación se realizó al azar.
¿Cuál es la probabilidad de que:

a) Ninguno de los proyectos cancelados sean del área tecnológica ?


b) uno de los proyectos cancelados sea del área tecnológica?
c) Más de uno de los proyectos cancelados sea del área tecnológica?
EP

71. Se va a elegir por sorteo un comité de 4 personas a partir de un grupo de 7 hombres;


dos de los cuales son hermanos. ¿Cuál es la probabilidad de que:
UD

a) Los dos hermanos estén en el comité?


b) Por lo menos uno de los hermanos esté en el comité?
A
72. De un grupo de ocho hermanos se eligen tres al azar. Luis tiene 18 años, Jorge 17 años,
IM

Miguel 15 años, Raúl 12 años, Mario 10 años, Ana 9 años, Lucı́a 6 años y David 5 años.
-L

Determine la probabilidad de que:


S
PU

a) Luis sea elegido. c) El menor de los tres sea Raúl.


M

b) Ana y Lucı́a sean elegidas d ) El mayor de los tres sea Raúl.


CA

73. Se va a elegir por sorteo un comité de seis personas a partir de un grupo de diez
hombres; tres de los cuales son profesionales. ¿Cuál es la probabilidad de que:

a) No haya ningún profesional en el co- c) Haya un profesional en el comité?


mité? d ) Por lo menos haya dos profesionales en
b) hayan dos profesionales en el comité? el comité?
E

74. Dos amigos compraron pasajes para viajar en un pequeño ómnibus. El ómnibus consta
AD

de 48 asientos, en filas de 4, con 24 asientos al lado izquierdo y 24 al lado derecho. Si


los asientos fueron asignados aleatoriamente, determine la probabilidad de que los dos
amigos:

a) Se sienten en el mismo lado. b) Se sienten en la misma fila.

75. Un club está conformado por 5 abogados, 10 ingenieros y 3 médicos.

a) De cuántas maneras se puede elegir un comité conformado por 2 abogados, 2


-I I

ingenieros y 2 médicos.
22
20

b) En cuántos de estos comités estarán la ingeniera Peralta y el doctor Zapata.

76. Hay 8 amigos solteros y la probabilidad de que cualquiera de ellos se case en los próximos
1
15 años es . ¿Cuál es la probabilidad de que por lo menos uno se case?
4
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 138

77. Se va a elegir por sorteo el Comité de Deportes de la Facultad de Ciencias económicas


y Empresariales, entre los 30 alumnos que se han presentado a una reunión convocada
por la Directora de Estudios. De estos 30 alumnos, 20 son hombres y 10 mujeres. Si el
comité debe estar formado por 6 alumnos ¿Cuál es la probabilidad de que:

a) en el comité haya el doble número de hombres que de mujeres?


b) en el comité no haya hombres?
c) en el comité, la diferencia entre el número de hombres y mujeres sea impar?
EP

78. En un distrito universitario los estudiantes se distribuyen entre las tres carreras que
pueden cursarse del siguiente modo: el 20 % estudian arquitectura, el 35 % medicina y
UD

el 45 % economı́a. El porcentaje de alumnos que finalizan sus estudios en cada caso es


del 5 %, 12 % y del 18 %. Elegido un alumno al azar determinar la probabilidad de que
no haya acabado los estudios.
A
IM

79. Un método muy empleado por investigadores estadı́sticos para obtener información
es el de efectuar encuestas personales. A menudo resulta importante investigar sobre
S -L

temas muy personales, que pondrı́an en aprietos al sujeto encuestado, ocasionando que
PU

dé respuestas falsas o que no conteste, deformando ası́ los resultados de la encuesta.
M

Para aminorar este problema, Warner ideó la “Técnica de la respuesta aleatoria”, que
CA

permite que el encuestado escoja al azar una de dos preguntas: la pregunta personal,
motivo de la encuesta, o una pregunta de control. Ası́, sólo él sabrá qué pregunta
contestó en realidad, y se mantiene su privacidad. Por ejemplo, supóngase que se desea
estimar el porcentaje de alumnos secundarios de una ciudad que no resuelven por su
cuenta las tareas para la casa. Se hacen 1000 encuestas con las siguientes instrucciones:
Antes de contestar lance una moneda: si sale cara conteste la pregunta A, y si sale sello
conteste la pregunta B. Sólo conteste SÍ o NO.
A: ¿resuelve usted las tareas para la casa por su cuenta?
B: ¿nació su padre en enero, febrero, marzo, abril o mayo?
E
AD

Supóngase que, una vez efectuadas las encuestas, hay 455 respuestas afirmativas y 545
negativas. ¿Qué porcentaje de alumnos no resuelve por su cuenta las tareas para la
casa?

80. En una escuela el 25 % de los alumnos son hombres. El 25 % de los hombres y el 20 %


de las mujeres tuvieron muy buen rendimiento el año anterior. Si se escoge un alumno
azar. ¿Cuál es la probabilidad de que haya tenido muy bien rendimiento el año anterior?

81. El comisario de la policı́a de El Agustino clasifica los delitos por edad (en años) del
-I I

malhechor, y si el crimen es con violencia o no. Según se muestra a continuación, al


22

comisario se le informó de un total de 150 delitos cometidos durante el año pasado.


20

a) ¿Cuál es la probabilidad de seleccionar un caso para analizarlo y encontrar que se


trató de un delito con violencia?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 139

Edad (en años)


Tipo de delito Menos de 20 años 20 a menos de 40 40 o más Total
Con violencia 27 41 14 82
Sin violencia 12 34 22 68
Total 39 75 36 150

b) ¿Cuál es la probabilidad de seleccionar un caso para analizarlo y descubrir que el


delito lo cometió alguien con menos de 40 años de edad?
EP

c) ¿Cuál es la probabilidad de seleccionar un caso relacionado con un crimen violento


UD

o un delincuente de menos de 20 años de edad?


d ) Dado que se selecciona para análisis un delito con violencia,¿cuál es la probabilidad
de que lo haya cometido una persona de menos de 20 años de edad?
A
e) Un juez seleccionó dos casos para revisarlos,¿Cuál es la probabilidad de que ambos
IM

sean crı́menes cometidos con violencia?


S -L

82. Una tabla para jugar está conformada por 15 casilleros. En 11 de éstos se encuentran
PU

las letras de la palabra ESTADISTICA y los 4 restantes están en blanco. Un jugador


M

debe escoger, desconociendo lo que hay en cada casillero, casillero por casillero hasta
CA

que conforme la palabra ESTADISTICA, sin importar el orden. Por cada casillero en
blanco que se escoja, al jugador se le quita $20 de los $60 que le dan inicialmente. ¿Cuál
es la probabilidad de que el jugador:

a) Gane $60 c) Gane $20 e) Pierda $20


b) Gane $40 d ) No gane

83. Se lanza una moneda cuya probabilidad de que el resultado sea cara es 2/3. Si aparece
cara, se extrae una canica de una urna que contiene dos rojas y tres verdes. Si el
E
AD

resultado es sello, se extrae una canica de otra urna que contiene dos rojas y dos
verdes. ¿Cuál es la probabilidad de extraer una canica roja?

84. Se sabe que el veredicto dado por un jurado es un 90 % confiable cuando el sospechoso
es culpable y un 98 % confiable cuando es inocente. En otras palabras, declara inocente
al 10 % de los culpables y declara culpable al 2 % de los inocentes. Si el sospechoso se
selecciona entre un grupo de personas de las cuales sólo el 5 % ha cometido un delito
alguna vez, y el jurado lo declara culpable, ¿cuál es la probabilidad de que esa persona
sea inocente?
-I I
22

85. En el Campus Piura de la UDEP aproximadamente el 52 % del alumnado estudia


20

Ingenierı́a, el 21 % Administración de Empresas, el 18 % estudia Información y el 9 %


restante estudia Educación. En Ingenierı́a, el 82 % son varones, en Administración el
48 %, en Información el 15 % y en Educación el 5 %. Si se escoge una persona al azar y
resulta que es varón.
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 140

a) ¿Cuál es la probabilidad de que no estudie Ingenierı́a?


b) ¿Cuál es la probabilidad de que estudie Administración o Información?

86. Se tienen 20 dados normales y 2 cargados. La probabilidad de obtener 6 en estos últimos


es el doble que la de cualquier otra cara de los mismos dados. Se lanza un dado al azar
y sale 6. Hallar la probabilidad de que sea un dado cargado.

87. Suponga que en Campus Piura de la UDEP el 44 % de los alumnos estudian Ingenierı́a
y el 12 % de éstos son mujeres. Además, el 60 % de los otros programas son mujeres. Si
EP

se selecciona un alumno al azar y resulta que es hombre. ¿Cuál es la probabilidad de


que no estudie Ingenierı́a?
UD

88. Un profesor quiere escoger 8 alumnos de un conjunto de 15. ¿De cuántas formas puede
hacerlo? A
89. En un aula de 30 alumnos hay 20 deportistas, de los cuales 8 practican deportes
IM

individuales y 12 deportes colectivos.


-L

a) ¿Cuántos grupos de 5 alumnos se pueden formar?


S
PU

b) ¿En cuántos grupos todos son deportistas?


M

c) ¿En cuántos grupos hay 3 que practican deportes colectivos?


CA

d ) ¿En cuántos de los grupos donde todos son deportistas hay 3 que practican
deportes colectivos?
e) ¿En cuántos grupos hay al menos un alumno que no practica deportes individuales?

90. En un lote de 100 pernos hay 4 defectuosos. Si un comprador escoge 20 pernos


aleatoriamente, ¿cuál es la probabilidad de que se lleve 2 pernos defectuosos?

91. De una ciudad donde fuman el 30 % de los ciudadanos mayores de edad, se toma una
muestra de 6 de ellos. ¿Cuál es la probabilidad de que 3 de ellos fumen?
E
AD

92. Suponga que el concesionario de la cafeterı́a de la UDEP está tratando de reducir el


número de clientes no pagan sus cuentas al final del año. Él está dispuesto a cancelarle
el crédito a los clientes que se demoren más de una semana en los pagos que deben
realizar a fin de cada mes. El concesionario ha visto en sus archivos que, de todos
los clientes que finalmente no pagaron sus cuentas al final del año, el 95 % se habı́an
demorado más de una semana en sus pagos mensuales. Además, sabe que el 4 % de los
clientes que tienen crédito no pagan su cuenta, y que, de los que sı́ pagan su cuenta a
fin de año, el 35 % se ha demorado alguna vez más de una semana.
-I I
22

a) Si se elige a un cliente al azar,¿cuál es la probabilidad de que se haya demorado


20

alguna vez más de una semana en sus pagos mensuales?


b) Determine la probabilidad de que un cliente que se ha demorado alguna vez más
de una semana en sus pagos mensuales, no pague su cuenta al final del año.
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 141

93. Tenemos cien urnas de tres tipos. El primer tipo contiene 8 bolas blancas y 2 negras; el
segundo tipo, 4 blancas y 6 negras y el tercero tipo, 1 blanca y 9 negras. Se elige una
urna al azar y se extrae de ella una bola, que resulta blanca. Se devuelve la bola a la
16
urna y se repite el proceso, siendo ahora la bola extraı́da negra. Si sabemos que es
39
30
la posibilidad de que, siendo la bola blanca, proceda del primer tipo de urna y que
61
es la posibilidad de que, siendo la bola negra, proceda del segundo tipo de urna, calcule
el número de urnas de cada tipo.

94. Un banco ha estimado por experiencias anteriores que la probabilidad de que una
EP

persona no pague a tiempo un préstamo personal es de 0.3. También ha estimado que


UD

el 40 % de los préstamos no pagados a tiempo se han solicitado para financiar viajes de


vacaciones y el 60 % de los préstamos pagados a tiempo se han solicitado para viajes de
vacaciones. Si se elige un préstamo al azar y resulta que ha sido solicitado para financiar
un viaje de vacaciones ¿Cuál es la probabilidad de que no sea pagado a tiempo?
A
IM

95. Una persona lanza un dado cuyas seis caras muestran: un “1”, dos “2” y tres “3”. Si
-L

obtiene “1” en el primer lanzamiento, gana el juego. Si no obtiene “1” puede seguir
S

lanzando el dado y gana si repite el resultado del primer lanzamiento. Si obtiene “1”
PU

antes de repetir el resultado del primer lanzamiento, pierde el juego.


M
CA

a) ¿Cuál es la probabilidad de ganar?


b) ¿Cuál es la probabilidad de perder?
c) ¿Cuál es la probabilidad de obtener “3” en el primer lanzamiento y luego ganar
el juego?
1
Nota: Puede ser útil la siguiente fórmula: 1 + x + x2 + x3 + ... =
1−x
96. Una caja contiene 5 fichas de $10 cada una, 3 de $30 cada una y 2 de $50 cada una.
Si se escogen 3 fichas al azar, calcule la probabilidad de que la suma de los valores sea
E

$70.
AD

97. Para analizar el volumen de fraude en las declaraciones de Impuestos, un grupo de


investigación realiza el siguiente experimento. Sobre una amplia muestra de empresas
se les formulan dos preguntas: A) ¿Termina su R.U.C en número impar?, B) ¿Ha
cometido algún tipo de fraude en su declaración de impuestos? Para evitar la falta de
respuesta motivada por la naturaleza de la segunda pregunta, a las empresas que van a
responder se les hace la siguiente propuesta: lance una moneda al aire, de forma que si
sale cara responda la pregunta A y si sale sello responda la pregunta B. Sólo se contesta
-I I

SÍ o NO a una pregunta. En ningún caso la empresa encuestada indica qué pregunta ha
22

contestado. Después de realizado el experimento, resulta que el 37 % de las empresas


20

encuestadas dieron como respuesta “SI”. En estas condiciones: ¿Cuál es la probabilidad


de que una empresa haya cometido fraude en su declaración de impuestos?

98. En un club de varios miembros, el número de mujeres es el doble del número de hombres.
Si se van a elegir tres miembros para conformar un comité, ¿cuál es la probabilidad
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 142

de que dos sean hombres y uno sea mujer? Nota: Exprese la probabilidad pedida en
función del número de hombres y mujeres que forman el club.

99. A un examen de Estadı́stica se presentan alumnos de 4 grupos diferentes:


Grupo A: 80 alumnos, de los cuales el 35 % son mujeres,
Grupo B: 70 alumnos, de los cuales el 25 % son mujeres,
Grupo C: k alumnos, de los cuales el 80 % son varones,
Grupo D: 60 alumnos, de los cuales el 85 % son varones.
Se les reúne a todos en una gran aula y se elige a uno de ellos al azar para repartir el
EP

2
examen, resultando ser mujer. Si la probabilidad de que pertenezca al grupo D es .
15
UD

¿Cuántos alumnos hay en el grupo C?

100. Un maestro de matemáticas de secundaria iba a preparar una tarea de ejercicios sobre
ecuaciones de segundo grado para sus alumnos. Sólo debı́a poner números, en lugar de
A
los coeficientes a, b y c en la ecuación: ax2 + bx + c = 0 , por lo que para cada ecuación
IM

decidió lanzar un dado tres veces y usar como coeficientes los números que salieran. Una
-L

vez que tuvo cinco ecuaciones, fue a sacar copias de la tarea; mientras tanto, se le ocurrió
S

que en algunas de esas ecuaciones podrı́a no haber raı́ces reales, además de recordar
PU

que aún no habı́a enseñado los números complejos. Para una ecuación cualquiera de
M

esa tarea, calcule la probabilidad de que las dos raı́ces sean reales.
CA

Nota :Recuerde que,

* Las raı́ces de la ecuación ax2 + bx + c = 0,(a ̸= 0),vienen dadas por:



−b ± b2 − 4ac
x=
2a
* Las dos raı́ces serán reales cuando: b2 − 4ac ≥ 0

101. Se lanza un dado cuatro veces ¿Cuál es la probabilidad de que obtengamos al menos
un cinco?
E

102. Suponga que tiene 2 dados y los lanza n veces:


AD

a) ¿Cuál es la probabilidad de que obtenga al menos un seis doble?


b) ¿Cuántos lanzamientos habrı́a que realizar para tener una probabilidad igual a 0.5
de obtener al menos un seis doble?

103. El administrador de un hospital limeño revisa la encuesta realizada a sus miembros en


la Sociedad Nacional Médica, la cual registra género y edad. La siguiente tabla resume
los resultados:
-I I

Menor de 35 años De 35 a 54 años Mayor de 54 años


22

Masculino 27 87 26
20

Femenino 14 25 3

Si se selecciona al azar a un miembro de la sociedad, ¿Cuál es la probabilidad de que:


CAPÍTULO 3. TEORÍA DE PROBABILIDAD 143

a) Sea varón?
b) esté en edades de 35 a 54?
c) sea mujer o mayor de 54?
d ) sea varón o esté en edades de 35 a 54?
e) sea varón, dado que es menor de 35?
f ) sea mayor de 54, dado que es de género masculino?
g) sea mayor de 54, dado que es de género femenino?
EP

h) sea menor de 35, dado que es de género femenino?


UD

104. Un jurado formado por 3 miembros que deciden por mayorı́a, lo constituyen 2 personas
que deciden cada una de manera independiente el veredicto correcto con probabilidad
“p” y una tercera persona que lo decide lanzando una moneda.
A
a) Si un juez individual tiene una probabilidad “p” de dar el veredicto correcto ¿cuál
IM

de los dos métodos (juez individual o jurado de 3) da mayor probabilidad de


-L

acertar?
S
PU

b) Y si en el jurado de 3, los tres miembros tienen la misma probabilidad “p” de


acertar ¿cuál es entonces el mejor método?
M
CA

105. Lanzamos un dado normal tres veces. Si el segundo resultado es mayor que el primero,
¿Cuál es la probabilidad de que el tercero sea mayor que el primero?

106. Los empleados de una compañı́a se encuentran separados en tres divisiones: adminis-
tración, operación de planta y ventas. La siguiente tabla indica el número de empleados
en cada división clasificados por sexo:

MUJER HOMBRE
Administración 20 30
E

Operaciones 60 140
AD

Ventas 100 50

Si se elige aleatoriamente un empleado:

a) ¿Cuál es la probabilidad de que sea mujer?


b) ¿Cuál es la probabilidad de que trabaje en ventas?
c) ¿Cuál es la probabilidad de que sea hombre y trabaje en ventas?
-I I

d ) ¿Cuál es la probabilidad de que sea hombre y trabaje en administración?


22

e) ¿Cuál es la probabilidad de que trabaje en operaciones dado que es mujer?


20

f ) ¿Cuál es la probabilidad de que sea mujer dado que trabaja en operaciones?

107. En un examen de estadı́stica, un estudiante debe elegir siete preguntas de las diez
dadas. ¿Cuál es la probabilidad de que:
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 144

a) el estudiante responda tres de las cinco primeras preguntas?


b) el estudiante responda, por lo menos, tres de las cinco primeras preguntas?

108. A una fiesta asistieron un cierto número de personas, si al saludarse se produjeron 435
apretones y todos gentiles entre sı́ ¿Cuántas personas asistieron?

109. Un dado normal se lanza tres veces y la suma de los números obtenidos fue 15. Encuentre
la probabilidad de que en el primer lanzamiento haya salido 4.

110. ¿Qué es más probable: Sacar al menos un 6 al lanzar 5 veces un solo dado o sacar al
EP

menos un doce en 24 lanzamientos de 2 dados?


UD

111. Suponga que hay un grupo de n alumnos:

a) ¿Cuál es la probabilidad de que el dı́a de cumpleaños de algún alumno del grupo


coincida con el dı́a del cumpleaños del rector de la universidad? Asuma que un
A
IM

año tiene 365 dı́as.


-L

b) ¿Cuál es el número de alumnos que debe tener el grupo para que la probabilidad,
S

de que el dı́a de cumpleaños de algún alumno del grupo coincida con el dı́a del
PU

cumpleaños del rector de la universidad, sea por lo menos del 50 %?


M

112. Tenemos dos urnas; una A con 4 bolas rojas y 6 blancas, y otra B con 7 bolas rojas
CA

y 3 blancas. Se selecciona al azar una urna, se extrae una bola y se coloca en la otra
urna. A continuación, se extrae una bola de la segunda urna. Calcular la probabilidad
de que las 2 bolas extraı́das sean del mismo color.

113. El jugador A lanza 6 dados y gana si obtiene por lo menos un “1”. El jugador B lanza
12 dados y gana si obtiene por lo menos dos “1” ¿Quién tiene la mayor probabilidad
de ganar?

114. Si se elige al azar un número de tres cifras distintas, formado con los dı́gitos: 1, 2, 3, 4
E

y 5 ¿Cuál es la probabilidad de que el número elegido sea par?


AD

115. Se lanzan 5 dados honestos. Calcular la probabilidad de obtener:

a) Cinco números iguales. c) Tres de un número y dos de otro


b) Cuatro números iguales y uno distin- número.
to.

116. En un lote de 80 papayas hay 10 malogradas. Si un comprador escoge 20 papayas


-I I

aleatoriamente, ¿cuál es la probabilidad de que se lleve al menos 3 papayas malogradas?


22

117. Se lanzan tres monedas, y, si se obtienen 2 caras y un sello, se extraen dos canicas,
20

aleatoriamente, de una urna que contiene canicas numeradas del 1 al 100. Si las tres
monedas muestran el mismo resultado (tres caras o tres sellos), se extraen dos canicas,
de otra urna que contiene canicas numeradas del 1 al 50. ¿Cuál es la probabilidad de
que las canicas muestren dos números consecutivos?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 145

118. ¿Cuántos números impares de 3 cifras distintas, se pueden formar con los dı́gitos: 4, 5,
7, 8 y 9? ¿Cuántos de ellos son menores que 500?

119. Si se elige un número impar de tres cifras distintas, formado con los dı́gitos: 4, 5, 7, 8
y 9, ¿Cuál es la probabilidad de que el número elegido sea menor que 500?

120. Se lanza un dado, y a continuación, tantas monedas como puntuación se obtuvo en el


lanzamiento del dado.

a) Hallar la probabilidad de que se obtenga alguna cara.


EP

b) Si se ha obtenido alguna cara, ¿Cuál es la probabilidad de que el resultado del


UD

dado haya sido un “dos”?

121. Se lanza un dado 6 veces, ¿cuál es la probabilidad de obtener puntuación par en los
lanzamientos impares e impar en los lanzamientos pares.
A
IM

122. Con los dı́gitos 1, 2, 3, 4, 5, 6, 7, 8 y 9,:


-L

a) ¿Cuántos números diferentes de cuatro cifras pueden formarse sin que se repita
S

ninguna cifra?
PU

b) ¿Cuántos de estos números contienen el dı́gito “1”?


M
CA

c) Si se elige un número de los formados en el apartado a) ¿Cuál es la probabilidad


de que dicho número contenga el dı́gito “1”?

123. La diferencia entre el número de permutaciones de 2 elementos que se pueden formar


con “n” elementos distintos existentes y el número de combinaciones de 2 elementos
que se pueden formar con los mismos “n” elementos, es 190. Determine el valor de “n”.

124. Una caja contiene 8 canicas rojas, 3 blancas y 9 azules. Si se eligen 3 canicas al azar
¿Cuál es la probabilidad de que:
E

a) Las 3 sean rojas? c) 2 sean rojas y una blanca?


AD

b) Las 3 sean blancas? d ) Se elija una de cada color?

125. Seis parejas de casados se encuentran en un restaurante.

a) si se eligen 2 personas al azar, ¿cuál es la probabilidad de que sean esposos?


b) si se eligen 2 personas al azar, ¿cuál es la probabilidad de que una sea hombre y
otra mujer?
-I I

c) si se eligen 4 personas al azar, ¿cuál es la probabilidad de que se elijan dos parejas


de casados?
22
20

d ) si se eligen 4 personas al azar, ¿cuál es la probabilidad de que no hayan parejas


de casados?
e) si se eligen 4 personas al azar, ¿cuál es la probabilidad de que haya exactamente
una pareja de casados?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 146

126. Si se elige al azar un número de cinco dı́gitos, ¿cuál es la probabilidad de que al menos
dos de sus dı́gitos sean ”7”?

127. ¿Cuál es la probabilidad de que, en un grupo de “n” alumnos, por lo menos dos de ellos
coincidan en su cumpleaños?

128. Con los dı́gitos 1, 2, 3, 4, 5, 6, 7:

a) ¿Cuántos números de cuatro cifras pueden formarse?


b) ¿Cuántos números de cuatro cifras pueden formarse sin que se repita ninguna
EP

cifra?
UD

c) ¿Cuántos de los números formados en el apartado b) terminan en 3?


d ) ¿Cuántos de los números formados en el apartado a) son impares?
e) Si se elige un número de los formados en el apartado a) ¿Cuál es la probabilidad
A
de que dicho número termine en 3?
IM

129. Un representante de ventas debe visitar 5 ciudades de las 10 ciudades existentes en el


-L

área geográfica que le corresponde. De esas 10 ciudades: 5 son mercados grandes para
S
PU

el producto en cuestión, 3 son mercados medianos y 2 son mercados pequeños. Si el


vendedor elige al azar las 5 ciudades que visitará ¿Cuál es la probabilidad de que:
M
CA

a) cuatro sean mercados grandes?


b) dos sean mercados grandes, dos sean medianos y uno pequeño?
c) cuatro sean mercados grandes y uno sea mediano?
d ) todas sean mercados grandes?

130. Se le pide a tres personas que escriban al azar una vocal ¿Cuál es la probabilidad de
que las tres personas escriban la vocal “e”?

131. Tres personas lanzan cada una cuatro monedas al aire. Determinar la probabilidad de
E

que las tres obtengan el mismo número de caras.


AD

132. Se dispone de n+1 urnas numeradas: 0,1,...,n. La urna i (0 ≤ i ≤ n) contiene i canicas


blancas y n-i negras. Si se elige al azar una urna y se extrae de ella una bola:

a) Hallar la probabilidad de que la bola extraı́da sea blanca.


b) Si la bola extraı́da es blanca, ¿cuál es la probabilidad de que provenga de la urna
i?
n(n + 1)
Nota: Puede ser útil la siguiente fórmula: 1 + 2 + 3 + ... + n =
-I I

2
22

133. Ana, Beto, y Carlos lanzan sucesivamente y en ese orden un dado cargado. La primera
20

persona que saque un 6 gana. Si la probabilidad de sacar un 6 con ese dado cargado es
“p”, ¿cuál es la probabilidad de que gane Ana? ¿y de que gane Beto? ¿y de que gane
Carlos?
1
Nota: Puede ser útil la siguiente fórmula: 1 + x + x2 + x3 + ... =
1−x
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 147

134. Si elige al azar tres puntos de los nueve marcados en el plano cartesiano indicado en la
figura ¿Cuál es la probabilidad de que ellos se ubiquen sobre una misma recta?
EP
UD

135. Si se elige un número de seis cifras, ¿Cuál es la probabilidad de que tenga al menos una
A
cifra par?
IM

136. Se lanza una moneda ocho veces. Calcular la probabilidad de que el número de caras
-L

obtenidas en los primeros cuatro lanzamientos sea igual al número de caras obtenidas
S
PU

en los últimos cuatro.


M

137. ¿Qué es más probable: Sacar al menos un 5 al lanzar 3 veces un solo dado o sacar al
CA

menos un doce en 24 lanzamientos de 2 dados?

138. Si se elige al azar un número de cinco dı́gitos, ¿cuál es la probabilidad de que al menos
uno de sus dı́gitos sea “8”?

139. ¿Cuál es la probabilidad de que, en un grupo de 5 personas, por lo menos dos de ellas
hayan nacido el mismo dı́a de la semana (es decir, en lunes, martes,etc.)?

140. Drásticos cambios en el alfabeto y en las reglas de escritura contiene la nueva edición de
Ortografı́a elaborada por la Real Academia Española (RAE). Entre las modificaciones
E

más llamativas está la eliminación de algunas letras del alfabeto. Éstas son la “ch” y
AD

“ll”, que fueron suprimidas formalmente de la tabla del alfabeto, por lo que las letras
del abecedario ahora pasan a ser 27. Tomando en cuenta esto, si se le pidiera a cuatro
personas que escriban al azar, cada una en un papel, una letra del alfabeto:

a) ¿Cuál es la probabilidad de que las cuatro personas escriban la misma letra?


b) ¿Cuál es la probabilidad de que cada una escriba una letra distinta?

141. Se dispone de n+1 urnas numeradas: 0,1,...,n. La urna i (0 ≤ i ≤ n) contiene i canicas


-I I

blancas y n-i negras. Si se elige al azar una urna y se extraen de ella k canicas, una
22

tras otra con reemplazo ¿Cuál es la probabilidad de que las k canicas extraı́das sean
20

blancas?

142. En una lista de 80 clientes que poseen tarjeta de crédito hay 10 clientes que no están
al dı́a en sus pagos (morosos). Si selecciona aletoriamente 20 clientes de esa lista, ¿cuál
es la probabilidad de que al menos 3 de ellos sean morosos?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 148

143. Se eligen aleatoriamente dos letras de la palabra: PASO.

a) Describa el espacio muestra del experimento.


b) Hallar la probabilidad que las letras seleccionadas sean vocales.

144. Para requerir a sus deudores que cumplan con sus pagos, una compañı́a utiliza: el
teléfono, visita personal y correo electrónico. De los datos registrados se sabe que al
25 % se le sugiere por vı́a telefónica que paguen, 30 % son visitados personalmente
y al resto se le envı́a un correo electrónico. Las probabilidades de recibir respuesta
EP

positiva (que el cliente pague su deuda) al aplicar estos métodos son: 0.6, 0.8 y 0.4,
respectivamente.
UD

Responda lo siguiente mostrando los cálculos claramente:

a) ¿Cuál es la probabilidad de que un cliente pague su deuda?


A
b) Si acaban de informar que un cliente acaba de hacer efectivo el pago de una deuda,
IM

¿cuál es la probabilidad de que se le haya contacto por teléfono?


-L

c) Si acaban de informar que un cliente acaba de hacer efectivo el pago de una deuda,
S

¿cuál es la probabilidad de que se le haya visitado personalmente?


PU
M

145. En una ciudad se estudia la cantidad de usuarios de internet según el sexo. Suponga
CA

que se tienen los siguientes datos, en miles de individuos:

Hombre Mujer Total


Emplea Internet 40 35 75
No emplea Internet 185 240 425
Total 225 275 500

a) Si seleccionamos al azar a una persona ¿Cuál es la probabilidad de que no emplee


internet?
E
AD

b) Si seleccionamos al azar a una persona y resulta ser hombre ¿Cuál es la


probabilidad de que emplee internet?
c) Si seleccionamos al azar a dos personas ¿Cuál es la probabilidad de que ambas
empleen internet?

146. En una asignatura universitaria asisten a clase 100 alumnos de los 150 alumnos
matriculados. Se sabe que aprueban la asignatura, el 90 % de los alumnos que asisten
a clase y el 30 % de los que no asisten. Si se elige al azar a un estudiante ¿Cuál es la
-I I

probabilidad de que haya aprobado la asignatura?


22
20

147. De una encuesta de opinión realizada a 318 personas, sobre las condiciones del mercado
laboral en Lima Metropolitana, se obtuvo la siguiente información:
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 149

Independiente Planilla Otros Total


Hombre 110 31 41 182
Mujer 90 11 35 136
Total 200 42 76 318

a) Si se selecciona al azar a una persona de la muestra ¿Cuál es la probabilidad de


que esté en planilla o sea mujer?
b) Si seleccionamos al azar a una persona y resulta que está en planilla ¿Cuál es la
EP

probabilidad de que sea hombre?


UD

c) Si seleccionamos al azar a tres personas ¿Cuál es la probabilidad de que las tres


sean independientes?

148. Una empresa recibe billetes de tres bancos: A, B y C. Del Banco A recibe el 60 % de
A
todos los billetes, del banco B recibe el 30 %, y el resto los recibe del Banco C. Se ha
IM

determinado que la proporción de billetes falsos que provienen del Banco A es 0.1 %,
-L

de B, 0.2 % y de C, 0.1 %. Si se elige al azar un billete recibido por la empresa ¿Cuál


S

es la probabilidad de que sea falso?


PU

149. Se desea conocer la opinión de los habitantes de un distrito limeño sobre cierta propuesta
M
CA

de ley que se discute en la Municipalidad distrital. La siguiente tabla ilustra los


resultados de una encuesta realizada sobre una muestra representativa de 300 habitantes
del distrito:

A favor Neutral En contra Total


Hombre 45 15 10 70
Mujer 90 110 30 230
Total 135 125 40 300
E
AD

Responda a las siguientes preguntas explicando y mostrando claramente los


cálculos realizados:

a) Si seleccionamos, al azar, a un individuo de la muestra ¿Cuál es la probabilidad


de que la persona seleccionada sea hombre y que esté a favor de la propuesta de
ley?
b) Si seleccionamos, al azar, a dos individuos de la muestra ¿Cuál es la probabilidad
de que ambos estén en contra de la propuesta de ley?
-I I

c) Si seleccionamos, al azar, a un individuo de la muestra ¿Cuál es la probabilidad


22

de que la persona seleccionada sea mujer o sea neutral a la propuesta de ley?


20

d ) Si seleccionamos, al azar, a dos individuos de la muestra ¿Cuál es la probabilidad


de que ambos estén a favor de la propuesta de ley?
e) Si seleccionamos, al azar, a un individuo de la muestra ¿Cuál es la probabilidad
de que la persona seleccionada no sea neutral, sabiendo que es mujer?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 150

f ) Si seleccionamos, al azar, a dos individuos de la muestra ¿Cuál es la probabilidad


de que ambos sean neutrales a la propuesta de ley?
g) Si seleccionamos, al azar, a un individuo de la muestra ¿Cuál es la probabilidad de
que la persona seleccionada esté a favor de la propuesta de ley o sea un hombre?

150. Si se elige al azar un número de cinco cifras distintas:

a) ¿cuál es la probabilidad de que su primera cifra sea “4”?


b) ¿cuál es la probabilidad de que su tercera cifra sea “4”?
EP
UD

A
IM
S -L
PU
M
CA

E
AD

-I I
22
20
Capı́tulo 4

Distribución de probabilidad discreta


EP
UD

4.1. Introducción
El capı́tulo 2 se dedicó a la estadı́stica descriptiva, permitiéndonos describir datos
recogidos (muestrales, generalmente) organizándolos en una distribución de frecuencias y
A
representando gráficamente dicha distribución. Igualmente, como parte de la descripción del
IM

conjunto, se calcularon e interpretaron medidas como la media (aritmética) o la mediana


-L

para especificar un valor representativo cercano al centro de la distribución, la desviación


S

estándar para describir la dispersión o variabilidad de los mismos, ası́ como otras medidas
PU

de importancia (de forma y posición) para completar la descripción. Por tanto, ese capı́tulo
M

se centró en describir algo que ya habı́a sucedido.


CA

A partir del Capı́tulo 3, el punto de interés cambió: se enfocó en examinar algo que
tal vez sucederı́a, es decir, se analizó la posibilidad de que ocurriera algún resultado de un
experimento estadı́stico realizado y entendimos que se cuantificaba dicha probabilidad de
ocurrencia con un valor que estaba entre 0 y l, inclusive, y además se examinó la forma
cómo pueden manejarse las probabilidades de ocurrencia de los eventos de un experimento
utilizando las reglas de conteo o las leyes de adición y multiplicación de probabilidades, etc.
En el presente capı́tulo combinaremos los conceptos de los capı́tulos 2 y 3 creando
distribuciones de probabilidad que describan lo que probablemente sucederá, en vez de
lo que en realidad sucedió. La diferencia con el capı́tulo 2 es que allı́ elaboramos tablas
E
AD

de frecuencias e histogramas utilizando valores muestrales observados que se reunieron


en realidad; y en este capı́tulo construiremos distribuciones de probabilidad presentando
los resultados posibles junto con las frecuencias relativas que esperamos. En este capı́tulo
estudiaremos las distribuciones de probabilidad discretas y en el capı́tulo siguiente las
distribuciones de probabilidad continuas. Recuerde que estos temas son de vital importancia
para comprender los métodos que son parte de la estadı́stica inferencial y que trataremos en
capı́tulos posteriores.
4.2. Variables aleatorias
-I I

En el capı́tulo 3, sección 3.2.1, se introdujo la definición que emplearemos para una


22

variable aleatoria, y en resumen lo que se decı́a es que una variable aleatoria proporciona un
20

medio para describir los resultados experimentales empleando valores numéricos. También
aprendimos que el valor numérico de la variable aleatoria depende del resultado del
experimento. Una variable aleatoria puede ser discreta o continua dependiendo del tipo de

151
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 152

valores numéricos que asuma. Ası́, una variable aleatoria discreta puede asumir una cantidad
limitada de valores especı́ficos en un determinado intervalo y por lo general, los valores de una
variable aleatoria discreta es el resultado de contar algo. En cambio una variable aleatoria
continua, puede tomar una cantidad infinitamente grande de valores dentro de un intervalo y
por lo general, los valores de una variable aleatoria continua eran el resultado de medir algo.
Un aspecto importante de entender a partir de ahora es que los medios utilizados ası́
como las interpretaciones de probabilidad, son diferentes tanto para las variables aleatorias
discretas como para las variables aleatorias continuas. En este capı́tulo nos centraremos en
el tratamiento de las variables discretas.
EP

4.3. Distribución de probabilidad discreta o función de probabilidad


UD

La distribución de probabilidad de una variable aleatoria describe cómo se distribuyen


las probabilidades entre los valores de la variable aleatoria.
En el caso de una variable aleatoria discreta X, la distribución de probabilidad está
A
definida por una función de probabilidad, denotada por f (x) y conocida también como
IM

función de cuantı́a. Entonces, dada una variable aleatoria discreta X, se define su función
-L

de probabilidad como la función que a cada valor x le asigna su probabilidad de ocurrencia,


S

es decir, la función de probabilidad muestra a cada valor de la variable aleatoria discreta


PU

asociado con la probabilidad de ocurrencia de cada uno de esos valores.


M

Para que una función f (x) sea una función de probabilidad discreta, se deben satisfacer
CA

las siguientes condiciones:

1. Los valores de las probabilidades deben estar entre cero y uno, inclusive: 0 ≤ p(x) ≤ 1,
∀x.

2. Si llamamos n al conjunto de todos los valores que puede tomar X, entonces la suma
n
X
de las probabilidades de dichos valores debe ser igual a 1: p(xi ) = 1
i=1

Una ventaja importante de definir una variable aleatoria y su correspondiente distribución


E

de probabilidad es que una vez que se conoce la distribución de probabilidad, es relativamente


AD

fácil determinar la probabilidad de diversos eventos que pueden ser útiles para tomar
decisiones (Anderson y Sweeney, 2008).
El ejemplo más simple de una distribución de probabilidad discreta es la distribución de
probabilidad uniforme discreta. Su función de probabilidad está definida por

1
f (x) = (4.1)
n
donde, “n” es el número de valores que la variable aleatoria puede asumir.
-I I

Ejemplo: Si consideramos el experimento de lanzar un dado normal y definimos la


22

variable: X=Número de puntos obtenidos


20

a) ¿Cuál es la distribución de probabilidad de X? Grafı́quela.


Sabemos que al lanzar un dado los posibles resultados son: 1, 2, 3, 4, 5, 6 y cada uno de
estos resultados tendrá una probabilidad de ocurrir igual a 16 . Por tanto la distribución
de probabilidad para el lanzamiento de un dado se muestra en la siguiente Tabla 4.1:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 153

X 1 2 3 4 5 6
1 1 1 1 1 1
f(x) 6 6 6 6 6 6

Tabla 4.1: Distribución de probabilidad de X:Número de puntos obtenidos al lanzar un dado

Otra forma de expresar esta función de probabilidad de X serı́a:



 1

 6 si x = 1, 2, 3, 4, 5, 6
f (x) =


EP


0 en otros casos
UD

La función de probabilidad de X se grafica con el diagrama de barras de la figura


4.1. A
función de probabilidad de X
IM
0.5
S -L
0.4
PU
M
0.3
CA
f(x)

0.2
0.1
0.0

1 2 3 4 5 6

X:Nro. de puntos obtenidos al lanzar un dado

Figura 4.1: Función de probabilidad de X:Número de puntos obtenidos


E
AD

b) ¿Cuál es la probabilidad de obtener de 2 a 4 puntos?


1
Lo que se pide es: p(2 ≤ x ≤ 4) = p(x = 2) + p(x = 3) + p(x = 4) = 6 + 16 + 1
6 = 3
6 = 1
2

c) ¿Cuál es la probabilidad de obtener más de 2, pero como máximo 4 puntos? Lo que se


1 1 2 1
pide es: p(2 < x ≤ 4) = p(x = 3) + p(x = 4) = 6 + 6 = 6 = 3

d) Si lanza un dado y obtiene más de 2 puntos ¿Cuál es la probabilidad de que obtenga


menos de 5?
-I I
22

Lo que se pide es la probabilidad condicional:


20

p(x < 5 y x > 2) p(2 < x < 5)


p(x < 5 \ x > 2) = = =
p(x > 2) p(x > 2)
1
p(x = 3) + p(x = 4) +1 2
1
= = 1 61 16 1 = 64 =
p(x = 3) + p(x = 4) + p(x = 5) + p(x = 6) 6 + 6 + 6 + 6 6
2
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 154

Ejemplo. Un experimento consiste en lanzar un dado cargado donde se cumple que la


probabilidad de ocurrencia de cada cara es proporcional al número de puntos que tiene. Si
se define Y como el resultado de un lanzamiento, se deduce que:

y
f (y) =
21

De manera que la distribución de probabilidad de la variable Y es:

Y 1 2 3 4 5 6
EP

1 2 3 4 5 6
f(y) 21 21 21 21 21 21
UD

La gráfica de la función de probabilidad de Y se muestra en la figura 4.2.

función de probabilidad de Y
A
0.5

IM
-L
0.4
S
PU
0.3
f(y)
M
0.2
CA

0.1
0.0

1 2 3 4 5 6

Y:Nro. de puntos obtenidos al lanzar un dado cargado

Figura 4.2: Función de probabilidad de Y:Número de puntos obtenidos al lanzar dado cargado
E

Ejemplo: Suponga que se está interesado en el número de caras obtenidas al lanzar tres
AD

veces una moneda. El experimento claramente es lanzar una moneda repitiendo la experiencia
3 veces. Si definimos X: Número de caras obtenidas, los posibles resultados son: cero, uno,
dos y tres caras. ¿Cuál es la distribución de probabilidad de X?
La función de probabilidad de X será:

X 0 1 2 3
1 3 3 1
f(x) 8 8 8 8
-I I

La gráfica de la función de probabilidad de X: Número de caras obtenidas al lanzar tres


22

veces una moneda, se muestra en la figura 4.3.


20

4.4. Función de Distribución de una variable discreta


Existe otra función que está muy relacionada con la función de probabilidad discreta, la
cual se denomina función de distribución o función de acumulación de probabilidades, y se
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 155

función de probabilidad de X

0.5
0.4
0.3
f(x)

0.2
EP

0.1
UD

0.0

0 1 2 3

X:Nro. de caras obtenidas al lanzar tres veces una moneda


A
Figura 4.3: Función de probabilidad de X:Número de caras obtenidas al lanzar 3 veces una moneda
IM
S -L

denota por F (x). La función de distribución de una variable discreta recoge la probabilidad
PU

de que la variable tome valores menores o iguales a un valor dado, es decir, acumula las
M

probabilidades hasta un valor dado x. Esto, matemáticamente, quiere decir que:


CA

F (x) = P (X ≤ x) (4.2)

Para una variable aleatoria discreta X, F (x) satisface las siguientes propiedades:

0 ≤ F (x) ≤ 1. P (X > x) = 1 − F (x)

Si x ≤ y entonces F (x) ≤ F (y) F (−∞) = 0, F (+∞) = 1

Ejemplo: Si consideramos el experimento de lanzar un dado normal y definimos


la variable: X=Número de puntos obtenidos, ¿cuál es la función de distribución de X?
E
AD

Grafı́quela.
En la tabla 4.1 se elaboró la distribución de probabilidad o función de probabilidad
de X=Número de puntos obtenidos al lanzar un dado. Ahora para obtener la función de
distribución de X analizamos de la siguiente forma:
1 1
F (x = 1) = p(X ≤ 1) = p(X = 1) + p(X ≤ 0) = +0=
6 6
1 1 2
F (x = 2) = p(X ≤ 2) = p(X = 2)+p(X = 1)+p(X ≤ 0) = + +0 = , y análogamente
6 6 6
para los demás valores de X seguimos acumulando sucesivamente las probabilidades y
obtenemos:
-I I
22

X 1 2 3 4 5 6
20

1 2 3 4 5 6
F(x) 6 6 6 6 6 6

La función de distribución de X: Número de puntos obtenidos al lanzar un dado, se grafica


con el diagrama escalonado de la figura 4.4.
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 156

función de distribución de X

1.0

0.8

0.6
F(x)

0.4

0.2
EP


UD

0.0

0 1 2 3 4 5 6 7

A X

Figura 4.4: Función de distribución de X:Número de puntos obtenidos al lanzar un dado


IM
S -L

4.5. Media, Varianza y desviación estándar de una distribución de


PU

probabilidad discreta
M

La media (µ) de una variable aleatoria es una medida de la localización central de la


CA

misma y es un valor particular que sirve para representar una distribución de probabilidad.
Es el valor promedio a largo plazo de la variable aleatoria. A la media de una distribución
probabilı́stica se le denomina también valor esperado, E(x), o esperanza matemática.
La media, es un promedio ponderado para el que los valores posibles que se consideran
son afectados (o ”sopesados“) por las probabilidades correspondientes de ocurrencia. Por lo
tanto, para hallar µ ó E(x), se multiplica cada resultado posible de la variable aleatoria por
su probabilidad de ocurrencia: p(x), y luego se suman los productos obtenidos.
Por lo tanto, la media aritmética teórica o valor esperado de una distribución de
E

probabilidad discreta (o valor esperado de una variable aleatoria discreta) se expresa ası́:
AD

n
X
µ = E(X) = xi .p(xi ) (4.3)
i=1

Esto significa, que si un experimento se repite indefinidamente y se anotan los resultados


que se van obteniendo; es decir, los valores que va tomando la variable aleatoria X, la media
aritmética de éstos tenderá a µ.
Como se observó, la media es un valor caracterı́stico utilizado para representar una
distribución de probabilidad discreta. Sin embargo, no describe el grado de dispersión (o
-I I

variación) en una distribución. La varianza si lo hace. Como se explicó en el Capı́tulo 2, una


22

comparación de dos varianzas o de desviaciones estándar, permite confrontar la variación en


20

dos distribuciones que tengan la misma media, pero diferentes dispersiones. La varianza de
una distribución de probabilidad discreta es:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 157

n
X
σ 2 = E[(x − µ)2 ] = (xi − µ)2 .p(xi ) (4.4)
i=1

También se puede calcular la varianza con la siguiente forma equivalente:


n
X
σ 2 = E[x2 ] − [E(x)]2 = x2i .p(xi ) − µ2 (4.5)
i=1

Luego, la desviación estándar σ es la raı́z cuadrada positiva de la varianza. Recuerde que


EP

la desviación estándar se mide en las mismas unidades que la variable aleatoria y, por lo
tanto, a menudo se prefiere al describir la variabilidad de una variable aleatoria. La varianza
UD

se mide en unidades cuadradas y, por lo tanto, es más difı́cil de interpretar.


Ejemplo. Si se lanza un dado normal ¿Cuál es el número promedio de puntos
obtenidos?¿Cuál es la desviación estándar del número de puntos obtenidos?
A
Conocida la distribución de probabilidad de X:número de puntos obtenidos al lanzar un
IM

dado, la cual aparece en la tabla 4.1, entonces el valor esperado de X, siguiendo la expresión
-L

(4.3), será:
S
PU

n
X 1 1 1 1 1 1
µ = E(X) = xi .p(xi ) = 1 ∗ + 2 ∗ + 3 ∗ + 4 ∗ + 5 ∗ + 6 ∗ = 3.5 puntos
6 6 6 6 6 6
M

i=1
CA

Es decir que, si un dado se lanza infinitas veces, el número de puntos que en promedio se
obtendrı́a serı́a 3.5.
Para hallar la varianza de X aplicamos de forma más simple la expresión (4.5):
n
X
σ 2 = E[x2 ] − [E(x)]2 = x2i .p(xi ) − µ2 =
i=1
 
1 1 1 35
= 12 ∗ + 22 ∗ + . . . + 62 ∗ − 3.52 = ≈ 2.92 puntos2
6 6 6 12

E

Luego la desviación estándar será: σ = 2.92 ≈ 1.71 puntos, es decir que, si un dado se
AD

lanza infinitas veces,en promedio, lo que se desvı́a el número de puntos obtenidos respecto
del número promedio de puntos obtenidos será aproximadamente 1.71.
Ejemplo. Supóngase que una caja contiene 20 pequeños paquetes, todos iguales con
excepción del contenido. Supóngase que 10 de estos paquetes contienen una moneda de
l céntimo cada uno, cinco paquetes contienen una moneda de 5 céntimos cada uno, tres
contienen una moneda de 10 céntimos cada uno y dos contienen una moneda de 50 céntimos
cada uno. Si se selecciona un paquete al azar, ¿cuál es el valor esperado de la moneda
contenida en él?
-I I

El experimento es elegir un paquete al azar, luego el número de posibles resultados es 20.


22

Si definimos la variable Y: Dinero (en céntimos) contenido en el paquete elegido, luego esta
20

variable puede tener los siguintes valores: 1, 5, 10, 50. Entonces la probabilidad de elegir un
10 5
paquete que contenga 1 céntimo es: , de elegir un paquete que contenga 5 céntimos es: ,
20 20
3
de elegir un paquete que contenga 10 céntimo es: y de elegir un paquete que contenga 50
20
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 158

2
céntimo es: . Por tanto la distribución de probabilidad de Y, será:
20

Y 1 5 10 50
10 5 3 2
f(y) 20 20 20 20

Luego el valor esperado de Y, siguiendo la expresión (4.3), será:


n
X 10 5 3 2
µ = E(Y ) = yi .p(yi ) = 1 ∗ +5∗ + 10 ∗ + 50 ∗ = 8.25 céntimos
20 20 20 20
i=1
EP

La respuesta de 8.25 céntimos, puede interpretarse como sigue: si la selección de un


UD

paquete se repitiera un gran número de veces bajo las mismas condiciones, el valor medio de
las cantidades obtenidas serı́a, aproximadamente, 8,25 céntimos.
Ejemplo. Juan Ramı́rez vende automóviles nuevos. Generalmente, negocia el mayor
A
número de vehı́culos, los dı́as sábado. Ha establecido la siguiente distribución probabilı́stica
IM

para el número de autos que espera vender en un sábado en particular.


S -L

X:Número de autos vendidos 0 1 2 3 4


PU

Probabilidad, P(x) 0.10 0.20 0.30 0.30 0.10


M
CA

a) ¿Qué tipo de distribución es ésta? Este es un ejemplo de una distribución probabilı́stica


discreta. Observe que Juan espera la venta en sólo un cierto conjunto de automóviles; no
confı́a vender 5 ó más autos. Además, no puede vender la mitad de un vehı́culo. Puede
lograr la venta de sólo 0, 1,2,3 ó 4 autos. Asimismo, los resultados son mutuamente
excluyentes; no puede vender un total de 3 y 4 automóviles el mismo dı́a y por eso se
cumple que la suma de las probabilidades de ocurrencia de los valores de X es igual a
1.

b) En un sábado común, ¿cuántos autos debe esperar vender Juan? El número medio
E
AD

de autos vendidos se calcula ponderando la cantidad de vehı́culos negociados, por la


probabilidad de vender este número, y se totalizan luego los productos.
n
X
µ = E(X) = xi .p(xi ) = 0 ∗ 0.10 + 1 ∗ 0.20 + 2 ∗ 0.30 + 3 ∗ 0.30 + 4 ∗ 0.10 = 2.10 autos
i=1

Este valor indica que, para una gran cantidad de sábados, el Sr. Ramı́rez espera vender
en promedio 2.1 autos al dı́a. (Desde luego, no es posible vender exactamente 2.1 autos
en un sábado en particular.) Por tanto, a la media se le considera como la esperanza
-I I

matemática del valor de la variable.


22
20

c) ¿Cuál es la desviación estándar del número de autos vendidos? Primero hallamos la


CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 159

varianza de X aplicamos de forma más simple la expresión (4.5):


n
X
σ 2 = E[x2 ] − [E(x)]2 = x2i .p(xi ) − µ2 =
i=1
 
= 0 ∗ 0.10 + 1 ∗ 0.20 + 2 ∗ 0.30 + 3 ∗ 0.30 + 4 ∗ 0.10 − 2.12 = 1.29
2 2 2 2 2
autos2

Luego la desviación estándar será: σ = 1.29 ≈ 1.14 autos, es decir que, si se observan
infinitos sábados,en promedio, lo que se desvı́a el número de autos vendidos respecto del
número promedio de autos vendidos será aproximadamente 1.14. ¿Qué otra información
EP

nos proporciona la desviación estándar de 1.14 autos? Por ejemplo, si otro vendedor
UD

(Julio Pérez) también vendió una media de 2.1 autos los sábados, y la desviación
estándar en sus ventas fue 1.91 autos, se concluirá que existe más variabilidad en las
transacciones sabatinas de Julio Pérez que en las del Sr. Ramı́rez (debido a que 1.91 >
1.14).
A
IM

Ejemplo. Una persona juega a lanzar dos monedas y le dicen que recibirá $4 si aparecen
dos caras, perderá $2 si aparecen dos sellos y perderá $1 si en una moneda aparece cara y en
S -L

la otra sello, ¿Cuál es la ganancia o pérdida esperada para esta persona?


PU

El experimento es “jugar lanzando una vez las dos monedas”, luego la variable definida
M

sobre ese experimentos es Y: Ganancia o pérdida obtenida, entonces los valores que puede
CA

tener esta variable son tres: ganar 4 dólares, perder 2 dólares y perder l dólar. A cada uno de
estos resultados esta asociado un valor de probabilidad que se obtiene de lo que obtenga al
lanzar las dos monedas, ası́ la probabilidad de ganar 4 dólares está asociada a obtener 2 caras,
1
la cual es igual a = 0.25, la probabilidad de perder 2 dólares está asociada a obtener 2
4
1
sellos, la cual es igual a = 0.25 y , la probabilidad de perder l dólar está asociada a obtener
4
1 1 1
una cara y un sello, la cual es igual a + = = 0.50. La distribución de probabilidad
4 4 2
para este juego serı́a:
E

Y:Ganancia o pérdida -2 -1 4
AD

1 1 1
Probabilidad, P(x) 4 2 4

Luego lo que esperarı́a ganar o perder esta persona, serı́a:


n
X 1 1 1
µ = E(Y ) = yi .p(yi ) = (−2) ∗ + (−1) ∗ + (4) ∗ = 0 dólares
4 2 4
i=1

Esto quiere decir que si la persona jugara (lanzando dos monedas) infinitas veces entonces se
-I I

espera que no pierda ni gane.


22

4.5.1. Propiedades del valor esperado y de la varianza de una variable aleatoria


20

discreta.
Sea X una variable aleatoria discreta y sean a, b, c constantes; se verifica que:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 160

E(c) = c (4.6) E[c.g(X)] = c.E[g(X)] (4.8)

E(aX + b) = aE(X) + b (4.7) V ar(aX + b) = a2 .V ar(X) (4.9)

Ejemplo. Suponga que el número de autos que pasan por una estación de lavado un
domingo , entre las 12 y 16 horas, tiene la siguiente distribución de probabilidades:
EP

X:Número de autos 4 5 6 7 8 9
f(x) 0.083 0.083 0.25 0.25 0.17 0.164
UD

a) ¿Cuál es el valor esperado de autos que pasa por la estación un domingo cualquiera?
El número medio de autos que pasa por la estación un domingo cualquiera se calcula
A
IM

empleando la expresión (4.3)


-L

n
X
S

µ = E(X) = xi .f (xi ) = 6.833 autos


PU

i=1
M

b) Si Y=2X-1 representa la cantidad de dinero, en decenas de unidades monetarias, que


CA

el dueño de la estación paga a su empleado por lavar autos ¿Cuál es el valor esperado
de dinero que va a ganar el empleado un domingo cualquiera? ¿Cuál es la desviación
estándar de Y?
La ganancia esperada para el empleado, un domingo cualquiera, se calcula usando la
expresión (4.7)

E(Y ) = E(2X − 1) = 2E(X) − 1 = 2 × 6.833 − 1 = 12.666 dec.u.m ≈ 127 u.m


E

Para calcular la desviación estándar de Y, calcularemos primero la varianza de X, luego


AD

la varianza de Y utilizando la expresión (4.9) y luego extraeremos la raı́z cuadrada al


resultado
σ 2 (Y ) = σ 2 (2X − 1) = 22 × σ 2 (X) = 4 × σ 2 (X)

La varianza de X la calculamos utilizando la expresión (4.5)

σ 2 (X) = 42 × 0.083 + 52 × 0.083 + . . . + 92 × 0.164 − 6.8332 ≈ 2.13

Luego la varianza de Y serı́a: σ 2 (Y ) = 4×2.13 ≈ 8.52 y por tanto la desviación estándar


-I I


de Y: σ(Y ) = 8.52 ≈ 2.92
22
20

4.6. Distribución de probabilidad binomial


La distribución probabilı́stica binomial es un ejemplo de una distribución probabilı́stica
discreta la cual tiene muchas aplicaciones. Se asocia con un experimento de varios pasos que
llamamos el experimento binomial.
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 161

Experimento Binomial: Un experimento binomial tiene las siguientes cuatro propie-


dades:

1. El experimento consiste en una secuencia de “n” ensayos idénticos.

2. Dos resultados son posibles en cada ensayo. Nos referimos a un resultado como un éxito
y el otro como un fracaso.

3. La probabilidad de éxito, denotada por p, no cambia de un ensayo a otro. En


consecuencia, la probabilidad de un fracaso, denotada por q=1-p, no cambia de ensayo
EP

en ensayo.
UD

4. Los ensayos son independientes.

Si las propiedades 2, 3 y 4 están presentes, decimos que los ensayos son generados por
un proceso de Bernoulli. Si, además, la propiedad 1 está presente, decimos que tenemos un
A
experimento binomial.
IM

En un experimento binomial, estamos interesados en la cantidad de éxitos que se producen


-L

en los “n” ensayos. Si permitimos que “x” denote el número de éxitos que ocurren en los “n”
S

ensayos, vemos que “x” puede asumir los valores de 0, 1, 2, 3,. . ., n. Debido a que el número de
PU

valores es finito, x es una variable aleatoria discreta. La distribución de probabilidad asociada


M

con esta variable aleatoria se llama distribución de probabilidad binomial.


CA

Ejemplo. Consideremos el experimento de lanzar un dado equilibrado 3 veces y en cada


lanzamiento observando si el dado muestra o no el número 5. Supongamos que queremos
contar el número de veces que aparece el número 5 en los tres lanzamientos. ¿Este experimento
muestra las propiedades de un experimento binomial? ¿Cuál es la variable aleatoria de interés?
Tengamos en cuenta que:

1. El experimento consta de tres ensayos idénticos; cada ensayo implica el lanzamiento de


un dado.

2. Hay dos resultados posibles para cada ensayo: obtener 5 o no obtenerlo. Podemos
E
AD

designar un éxito a la obtención del número 5 y un fracaso a no obtenerlo.

3. La probabilidad de obtener un 5 y la probabilidad de no obtenerlo son las mismas para


1 5
cada ensayo, con p = y 1 − p = .
6 6
4. Los ensayos o lanzamientos son independientes porque el resultado de cualquier ensayo
no se ve afectado por lo que sucede en otros ensayos o lanzamientos.

Podemos apreciar que se satisfacen las propiedades de un experimento binomial. La variable


aleatoria de interés es x = el número de veces que aparece el número 5 en los tres ensayos.
-I I

En este caso, x puede asumir los valores de 0, 1, 2 o 3.


22

Aprovechando el ejemplo anterior respondamos lo siguiente: Si un dado equilibrado es


20

lanzado 3 veces. ¿Cuál es la probabilidad de obtener dos veces el número 5?


Si definimos los eventos: E=Obtener número 5 (eso es éxito en un lanzamiento) y F=No
obtener número 5 (eso es fracaso en un lanzamiento), luego la probabilidad de éxito en un
ensayo es p(E)=1/6 y la del fracaso es, p(F)=5/6, como habı́amos visto anteriormente.
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 162

Entonces los posibles resultados del experimento son:


Ω = {EEE, EEF, EF E, EF F, F EE, F EF, F F E, F F F } (Como se ha visto en el
Capı́tulo 3, a través de un diagrama de árbol, también podrı́amos visualizar estos resultados).
Entonces si queremos saber cuál es la probabilidad de obtener dos veces el número 5 (o sea
la probabilidad de obtener 2 éxitos exactamente), tendrı́amos por la regla de la multiplicación,
1 1 5
para eventos independientes: × × , sin embargo esto nos da la probabilidad asociada
6 6 6
a un orden particular de éxitos (que los dos primeros lanzamientos muestren el número 5 y
el tercero no) osea el evento EEF, pero esa no es la única manera. Entonces para encontrar
el número de maneras de obtener dos veces el número 5 en un total de 3 lanzamientos
EP

3!
tendrı́amos: , por lo tanto la probabilidad de que obtengamos 2 veces el número 5 en
2! × 1!
UD

los tres lanzamientos será igual a:


 2  1
1 1 5 3! 3! 1 5
P = × × × = × × = 0.069b
4
6 6 6 2! × 1! 2! × 1! 6 6
A
Entonces lo que hemos hecho para hallar la probabilidad pedida es aplicar la Regla
IM

generalizada de la multiplicación, para eventos independientes, y hemos multiplicado por


-L

el número de formas en que se puede obtener dos veces el número 5 en un total de tres
S
PU

lanzamientos.
Ejemplo. El 30 % de todos los vehı́culos que llegan por una calle a cierta intersección
M

giran hacia la izquierda. Si en un determinado momento se encuentran en dicha intersección


CA

8 autos detenidos por la luz roja del semáforo ¿cuál es la probabilidad de que giren hacia la
izquierda exactamente tres?
Entonces reconociendo las caracterı́sticas de una distribución binomial presentes en este
problema podemos decir, que el experimento consta de 8 ensayos idénticos, osea el número
de autos (8) en dicha intersección serian los “ensayos”. Cada ensayo implica lo que decida
hacer el conductor de un auto). Siguiendo con el análisis, sólo hay dos posibles resultados:
girar a la izquierda o no hacerlo. Ahora, la variable aleatoria o fenómeno de interés aquı́
es el “número de autos que giren a la izquierda” (aquı́, el girar a la izquierda está definido
E

como éxito), por ende si existen 8 carros en esa intersección el número de autos que giren
AD

a la izquierda podrı́an ser: 0, 1, 2, 3, 4, 5, 6, 7 u 8, es decir la variable aleatoria discreta


definida en este caso, sólo puede adoptar valores que van de 0 a 8. También, se ha definido
la probabilidad de éxito (p) en cada ensayo, pues nos dicen como dato que el 30 % de todos
los vehı́culos que llegan por una calle a cierta intersección giran hacia la izquierda y será
la misma en cada ensayo o auto, (quiere decir que la probabilidad de fracaso en un ensayo:
“No girar a la izquierda” es: q=1-p=1-0.3 = 0.7; y será igual para cada ensayo (auto)). Y la
última caracterı́stica es que los ensayos son independientes, es decir lo que cada auto haga
(“girar a la izquierda o no hacerlo”) es independiente de lo que hagan los otros.
-I I

Entonces si queremos saber cuál es la probabilidad de que exactamente 3 autos giren a


22

la izquierda (o sea la probabilidad de obtener 3 éxitos exactamente), tendrı́amos por la regla


20

de la multiplicación, para eventos independientes: 0.3 × 0.3 × 0.3 × 0.7 × 0.7 × 0.7 × 0.7 × 0.7,
sin embargo esto nos da la probabilidad asociada a un orden particular de éxitos (que los
tres primeros autos volteen a la izquierda y los 5 restantes no lo hagan). Si ahora se desea
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 163

8!
encontrar el número de maneras de seleccionar 3 autos de un total de 8 tendrı́amos:
3! × 5!
, por lo tanto la probabilidad de que exactamente 3 autos volteen a la izquierda será igual a:

8! 8!
P = 0.3 × 0.3 × 0.3 × 0.7 × 0.7 × 0.7 × 0.7 × 0.7 × = 0.33 × 0.75 = 0.2541
3! × 5! 3! × 5!

Entonces lo que hemos hecho para hallar la probabilidad pedida es aplicar la Regla
generalizada de la multiplicación, para eventos independientes, y hemos multiplicado por
el número de formas en que se pueden ordenar los 8 autos que conforman un subgrupo de 3
EP

y otro subgrupo de 5 autos.


UD

Se puede notar que en los ejemplos anteriores, se calcula la probabilidad de que, de una
muestra de “n” elementos (número de ensayos), “x” tengan cierta caracterı́stica (número
de “éxitos”), y los restantes “n - x” no la tengan (número de “fracasos”); siendo constante
la probabilidad (p) de que un elemento cualquiera tenga dicha caracterı́stica; ası́ como la
A
probabilidad de que no tenga la mencionada caracterı́stica (q = 1 - p).
IM

En situaciones como ésta, la probabilidad de que, de una muestra de n elementos, x


-L

elementos tengan dicha caracterı́stica (“éxito”), es:


S
PU

n!
P (X = x) = px (1 − p)n−x (4.10)
M

x!(n − x)!
CA

A esta expresión se le denomina distribución de probabilidad binomial, donde:


P(X=x) : Probabilidad de “x” éxitos dados los parámetros “n” y “p”.
n : Número de ensayos o pruebas binomiales (o tamaño de la muestra)
p : probabilidad de éxito en cada ensayo o prueba binomial.
q : probabilidad de fracaso en cada ensayo o prueba binomial = 1-p
x : Número de éxitos en el total de ensayos o en la muestra ( x = 0, 1, 2, 3,. . . , n)

Decimos pues que la v.a. X correspondente al número de éxitos en “n” ensayos de


Bernoulli independentes y con la misma probabilidad “p” de éxito, tiene distribuición
E
AD

binomial con parámetros “n” y “p”. La notación comunmente utilizada para expresar esto
es, X ∼ B(n, p).
Ejemplo. Tomando como referencia el problema de los autos, ¿Cuál serı́a la probabilidad
de que al menos 3 autos giren hacia la izquierda?
Para resolver esto debemos calcular: P(X=3), P(X=4), P(X=5), P(X=6), P(X=7) y
P(X=8); y sumar estas cantidades para obtener la probabilidad pedida. Entonces tendrı́amos:

P (X ≥ 3) = P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) + P (X = 7) + P (X = 8)
-I I

8! 8! 8!
= × 0.33 × 0.75 + 0.34 × 0.74 + 0.35 × 0.73 +
3! × 5! 4! × 4! 5! × 3!
22

8! 8! 8!
20

+ 0.36 × 0.72 + 0.37 × 0.71 + 0.38 × 0.70


6! × 2! 7! × 7! 8! × 0!
= 0.2541 + 0.1361 + 0.0467 + 0.0100 + 0.0012 + 0.0001 = 0.4482
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 164

4.6.1. Usando Tablas de Probabilidades Binomiales para el cálculo de probabi-


lidades
Existe una forma de simplificar considerablemente el cálculo de probabilidades binomiales
mediante el empleo de tablas, como las que aparecen al final de este texto en el Apéndice
A.2, que nos proporcionan directamente las probabilidades binomiales que necesitemos.
Estas tablas permiten calcular probabilidades para distribuciones binomiales con algunos
valores de “p” tales como 0.01, 0.05, 0.10, . . . , 0.80, 0.90, 0.95, y de “n” como 2, 3,. . . , 19,
20. Para estos dos parámetros, “n” y “p”, se puede calcular la probabilidad de “x” éxitos en
EP

“n” ensayos binomiales, siendo como ya se sabe “p” la probabilidad que se tenga éxito en un
ensayo.
UD

Por ejemplo, en la Tabla 4.2 para 6 ensayos (n=6) y probabilidad de éxito en un ensayo
de 0.05 (p=0.05); la probabilidad de 2 éxitos, (x=2) es 0.0305 (resaltado en negrita).

p
A
IM

n x 0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40


-L

6 0 0.9415 0.7351 0.5314 0.3771 0.2621 0.1780 0.1176 0.0754 0.0467


S

1 0.0571 0.2321 0.3543 0.3993 0.3932 0.3560 0.3025 0.2437 0.1866


PU

2 0.0014 0.0305 0.0984 0.1762 0.2458 0.2966 0.3241 0.3280 0.3110


M

3 0.0021 0.0146 0.0415 0.0819 0.1318 0.1852 0.2355 0.2765


CA

4 0.0001 0.0012 0.0055 0.0154 0.0330 0.0595 0.0951 0.1382


5 0.0001 0.0004 0.0015 0.0044 0.0102 0.0205 0.0369
6 0.0001 0.0002 0.0007 0.0018 0.0041

Tabla 4.2: Valores seleccionados de la tabla de probabilidad binomial para el caso n=6, x=2, p=0.05

De la misma forma si quiséramos resolver del problema de los autos, la pregunta del
ejemplo anterior: ¿Cuál serı́a la probabilidad de que al menos 3 autos giren hacia la
E

izquierda? utilizando las tablas debemos buscar: n = 8 y luego p = 0.3, para determinar las
AD

probabilidades: P(X=3), P(X=4), P(X=5), P(X=6), P(X=7) y P(X=8), para luego sumarlas
y hallar la probabilidad de que por lo menos 3 vehı́culos giren hacia la izquierda, o sea:
En las tablas encontraremos, para n = 8, p = 0,30, las probabilidades: P(X=3), P(X=4),
P(X=5), P(X=6), P(X=7) y P(X=8) tal como se muestran resaltadas en la Tabla 4.3 y las
cuales al ser sumadas definirán el resultado que halláramos (0.4482).
Valor esperado y varianza para la distribución binomial
Si X ∼ b(n, p) entonces:
µ = E(X) = n × p (4.11)
-I I

V ar(X) = σ 2 = n × p × (1 − p)
22

(4.12)
20

Ejemplo. Del problema de los autos. ¿Cuántos autos se esperarı́a giren a la izquierda?,
¿Cuál es la desviación estándar del número de autos que giran a la izquierda?
Recordando que para este problema: n=8, p = 0.30 y q =1-p= 0.70; se tiene que:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 165

p
n x 0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40
8 0 0.9227 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168
1 0.0746 0.2793 0.3826 0.3847 0.3355 0.2670 0.1977 0.1373 0.0896
2 0.0026 0.0515 0.1488 0.2376 0.2936 0.3115 0.2965 0.2587 0.2090
3 0.0001 0.0054 0.0331 0.0839 0.1468 0.2076 0.2541 0.2786 0.2787
4 0.0004 0.0046 0.0185 0.0459 0.0865 0.1361 0.1875 0.2322
EP

5 0.0004 0.0026 0.0092 0.0231 0.0467 0.0808 0.1239


UD

6 0.0002 0.0011 0.0038 0.0100 0.0217 0.0413


7 0.0001 0.0004 0.0012 0.0033 0.0079
8 0.0001 0.0002 0.0007
A
IM

Tabla 4.3: Valores seleccionados de la tabla de probabilidad binomial para n=8, p=0.30 y
x=3,4,5,6,7,8.
S -L
PU

µ = E(X) = n × p = 8 × 0.30 = 2.4 autos


M
CA

V ar(X) = σ 2 = n × p × (1 − p) = 8 × 0.3 × 0.7 = 1.68 autos2



σ = 1.68 ≈ 1.3 autos

A continuación resolvemos un ejemplo más con ayuda de las tablas de probabilidades


binomiales.
Ejemplo. Siguiendo con el problema de los autos, ¿Cuál será la probabilidad de que giren
hacia la izquierda menos de 5 vehı́culos?
Lo que se pide es
E

P (X < 5) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
AD

Entonces consultando las tablas binomiales, para n=8, p = 0.30, tomaremos los valores
de P(X=0), P(X=1), P(X=2), P(X=3), P(X=4); que aparecen en negrita como se aprecia
en la Tabla 4.4 y sumaremos estas cantidades para obtener la probabilidad pedida.
Luego la probabilidad pedida es:

P (X < 5) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
= 0.9420
-I I
22

4.7. Distribución de probabilidad de Poisson


20

Consideramos ahora una variable aleatoria discreta que a menudo es útil para estimar
el número de ocurrencias en un intervalo especı́fico de tiempo, longitud, área, espacio, etc.
Por ejemplo, la variable aleatoria de interés puede ser el número de vehı́culos que llegan a
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 166

p
n x 0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40
8 0 0.9227 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168
1 0.0746 0.2793 0.3826 0.3847 0.3355 0.2670 0.1977 0.1373 0.0896
2 0.0026 0.0515 0.1488 0.2376 0.2936 0.3115 0.2965 0.2587 0.2090
3 0.0001 0.0054 0.0331 0.0839 0.1468 0.2076 0.2541 0.2786 0.2787
4 0.0004 0.0046 0.0185 0.0459 0.0865 0.1361 0.1875 0.2322
EP

5 0.0004 0.0026 0.0092 0.0231 0.0467 0.0808 0.1239


UD

6 0.0002 0.0011 0.0038 0.0100 0.0217 0.0413


7 0.0001 0.0004 0.0012 0.0033 0.0079
8 0.0001 0.0002 0.0007
A
IM

Tabla 4.4: Valores seleccionados de la tabla de probabilidad binomial para n=8, p=0.30 y x=0,1,2,3,4
S -L

una gasolinera o el número de clientes que llega a un banco en un determinado intervalo de


PU

tiempo, el número de ralladuras y otras imperfecciones en paneles de automóvil recientemente


M

pintados, el número de partes defectuosas en embarques de salida, el número de clientes en


CA

espera de servicio en un restaurante, o los que aguardan a entrar a una de las atracciones en un
centro de diversiones, el número de accidentes en una carretera durante un perı́odo de tiempo
(tres meses, por ejemplo), etc. Si se satisfacen las dos propiedades siguientes, el número de
ocurrencias es una variable aleatoria descrita por la distribución de probabilidad de
Poisson.
Propiedades de un experimento de Poisson

1. La probabilidad de una ocurrencia es la misma para cualesquiera dos intervalos de igual


longitud.
E
AD

2. La ocurrencia o no ocurrencia en cualquier intervalo es independiente de la ocurrencia


o no ocurrencia en cualquier otro intervalo.

La función de probabilidad de Poisson es definida por la siguiente expresión

e−λ × λx
P (X = x) = (4.13)
x!
donde:
P(X=x) : Probabilidad de “x” ocurrencias en un intervalo.
-I I

λ : Valor esperado o número medio de ocurrencias en un intervalo especı́fico (o por unidad


22

especı́fica).
20

e : constante matemática, con valor aproximado de 2.71828


x : Número de ocurrencias por unidad especı́fica (x = 0, 1, 2, 3,. . . , ∞)


La desviación estándar de una variable con distribución de Poisson es λ. La notación
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 167

comunmente utilizada para expresar que una variable sigue distribución de Poisson es,
X ∼ P (λ).
En aplicaciones prácticas, x eventualmente se volverá lo suficientemente grande como
para que f (x) sea aproximadamente cero y la probabilidad de que cualquier valor mayor de
x se vuelva insignificante (Anderson et al., 2014).
Ejemplo. Usted es el gerente de una tienda y sabe que, fuera del horario de mayor
demanda, entran en promedio, 6 clientes cada 10 minutos. ¿Cuál es la probabilidad de que
entren:
EP

a) 5 clientes en un periodo cualquiera de 10 minutos fuera del horario de mayor demanda?


Inicialmente, percibimos que se trata de una variable con distribuición de Poisson e
UD

identificamos que:
X: número de clientes que entram en un perı́odo de 10 minutos;
λ =6 clientes/10 minutos
A
IM

Empleando la expresión 4.13 tenemos:


S -L
PU

e−6 × 65
P (X = 5) = = 0.1606
5!
M

b) máximo 2 clientes en un perı́odo de 10 minutos fuera del horario de mayor demanda?


CA

Lo que se pide es: P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2). Entonces:

P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2)
e−6 × 60 e−6 × 61 e−6 × 62
= + +
0! 1! 2!
= 0.0025 + 0.0149 + 0.0446 = 0.062

c) 3 clientes o más fuera del horario de mayor demanda a lo largo de 10 minutos?


E

Lo que se pide es: P (X ≥ 3) = P (X = 3) + P (X = 4) + . . ..


AD

Puesto que la suma de todas las probabilidades en una distribución de probabilidad


debe ser 1, los términos del lado derecho de la ecuación de P (X ≥ 3) representan
también el complemento de la probabilidad de que “x” sea menor que 3, es decir:
P (X ≥ 3) = 1 − P (X < 3). Por lo tanto,

P (X ≥ 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2))
e−6 × 60 e−6 × 61 e−6 × 62
= 1−( + + )
0! 1! 2!
-I I

= 1 − (0.0025 + 0.0149 + 0.0446) = 0.9380


22
20

4.7.1. Usando Tablas de Probabilidades de Poisson para el cálculo de


probabilidades
Existe una forma de simplificar considerablemente el cálculo de probabilidades de Poisson
mediante el empleo de tablas, como las que aparecen al final de este texto en el Apéndice
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 168

A.3, que nos proporcionan directamente las probabilidades que necesitemos.


Estas tablas permiten calcular probabilidades para distribuciones de Poisson con λ = 0.1,
0.2, 0.3,. . . , 1.0, 1.1,. . . , 10, 11,. . . , 20, y para x = 0,1, 2, 3,. . . , 39. Con el parámetro λ se
puede calcular la probabilidad de “x” éxitos en un proceso de Poisson con media: λ. Por
ejemplo utilizando directamente las tablas, podemos ver que cuando,λ = 2.5, la probabilidad
de 4 éxitos (x = 4) es 0.1336.
De la misma forma si quisiéramos resolver el apartado b) del ejemplo anterior: ¿Cuál serı́a
la probabilidad de que entren como máximo 2 clientes en un perı́odo de 10 minutos fuera
del horario de mayor demanda? Utilizando las tablas debemos buscar: λ = 6 y luego x = 0,
EP

1 y 2, para determinar las probabilidades: P(X=0), P(X=1), P(X=2), tal como se muestran
UD

resaltadas en la Tabla 4.5 y las cuales al ser sumadas definirán el resultado que halláramos
(0.062).

λ
A
IM

x 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6.0
0 0.0061 0.0055 0.0050 0.0045 0.0041 0.0037 0.0033 0.0030 0.0027 0.0025
S -L

1 0.0311 0.0287 0.0265 0.0244 0.0225 0.0207 0.0191 0.0176 0.0162 0.0149
PU

2 0.0793 0.0746 0.0701 0.0659 0.0618 0.0580 0.0544 0.0509 0.0477 0.0446
M

3 0.1348 0.1293 0.1239 0.1185 0.1133 0.1082 0.1033 0.0985 0.0938 0.0892
CA

4 0.1719 0.1681 0.1641 0.1600 0.1558 0.1515 0.1472 0.1428 0.1383 0.1339
5 0.1753 0.1748 0.1740 0.1728 0.1714 0.1697 0.1678 0.1656 0.1632 0.1606
6 0.1490 0.1515 0.1537 0.1555 0.1571 0.1587 0.1594 0.1601 0.1605 0.1606
7 0.1086 0.1125 0.1163 0.1200 0.1234 0.1267 0.1298 0.1326 0.1353 0.1377
8 0.0692 0.0731 0.0771 0.0810 0.0849 0.0887 0.0925 0.0962 0.0998 0.1033
9 0.0392 0.0423 0.0454 0.0486 0.0519 0.0552 0.0586 0.0620 0.0654 0.0688
E

10 0.0200 0.0220 0.0241 0.0262 0.0285 0.0309 0.0334 0.0359 0.0386 0.0413
AD

11 0.0093 0.0104 0.0116 0.0129 0.0143 0.0157 0.0173 0.0190 0.0207 0.0225
12 0.0039 0.0045 0.0051 0.0058 0.0065 0.0073 0.0082 0.0092 0.0102 0.0113
13 0.0015 0.0018 0.0021 0.0024 0.0028 0.0032 0.0036 0.0041 0.0046 0.0052
14 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013 0.0015 0.0017 0.0019 0.0022
15 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009
16 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003
-I I

17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001
22
20

Tabla 4.5: Valores seleccionados de la tabla de probabilidad de Poisson para λ = 6 y x=0,1,2


CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 169

4.7.2. Aproximación de la distribución binomial empleando la distribución de


Poisson
Ejemplo. El Gerente de Calidad de una empresa recibe un lote de 1000000 artı́culos
donde el 0.1 % es defectuoso. Se inspeccionan 1000 artı́culos y se decide aceptar el lote si el
número de artı́culos defectuosos es menor o igual a 4. ¿Cuál es la probabilidad de que el lote
sea aceptado?
Claramente la variable de interés es: X= número de artı́culos defectuosos en el lote y es
de naturaleza binomial con parámetros n=1000 y p=0.001, donde
EP

1000!
P (X = x) = 0.001x (1 − 0.001)1000−x
UD

x!(1000 − x)!
No hay tablas binomiales que muestren las probabilidades requeridas y puede ocurrir
que las calculadoras tengan problemas con los grandes factoriales involucrados aquı́. La
distribución de Poisson surge como el lı́mite de una secuencia de distribuciones binomiales
A
cuando p → 0+ y n → ∞ de tal manera que “n × p = µ” es constante.
IM

La distribución binomial puede ser aproximada por la distribución de Poisson, si la


-L

probabilidad de éxito es muy pequeña y el número de ensayos es muy grande. Una pequeña
S
PU

“p” significa que el éxito es un evento raro. Algunos autores consideran que la aproximación
de la distribución binomial B(n, p) con una distribución de Poisson es aceptable si n ≥ 50 y
M

p ≤ 0.05. La aproximación será mejor si crece “n” o se reduce “p”.


CA

En términos generales, la distribución de Poisson surge cuando intentamos lograr un


resultado raro muchas veces. La distribución de Poisson a veces se llama la “ley de eventos
raros” (Ubøe, 2017).
Retornando a la resolución del ejemplo dado, vemos que binomialmente µ = n × p =
1000 × 0.001 = 1, entonces si entramos a las tablas de probabilidad de Poisson utilizando el
valor de λ = 1 y tomamos los valores asociados a la probabilidad solicitada tendrı́amos:

P (X ≤ 4) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
E

= 0.3679 + 0.3679 + 0.1839 + 0.0613 + 0.0153 = 0.9963


AD

Nota: A manera de comparación, si hubiéramos empleado la expresión de la distribución


binomial para hallar las probabilidades asociadas a la probabilidad solicitada los valores
serı́an

P (X ≤ 4) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
= 0.3677 + 0.3681 + 0.1840 + 0.0613 + 0.0153 = 0.9964
-I I

Vemos que hay una diferencia pero es prácticamente insignificante.


22

4.8. Problemas propuestos


20

1. Si se propone un juego lanzando un dado, en las siguientes condiciones: si sale 1 se gana


$50, pero si sale cualquier otro número se pierde $ 10. ¿Aceptarı́a jugar? ¿Por qué?

2. Una persona va a lanzar un par de dados y recibirá un número de soles igual a la suma
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 170

que aparezca. ¿Cuál es el valor esperado?

3. Un psicólogo ha determinado que la cantidad de horas necesarias para obtener la


confianza de un nuevo paciente es de 1, 2, o 3. Sea “x” una variable aleatoria que
indica el tiempo, en horas, necesario para ganarse la confianza del paciente. Se ha
x
propuesto la siguiente función o distribución de probabilidad: f (x) = , para x = 1, 2
6
o 3.

a) ¿Es esta una distribución de probabilidad válida? Explique su respuesta.


EP

b) ¿Cuál es la probabilidad de que necesite exactamente 2 horas para ganarse la


confianza del paciente?
UD

c) ¿Cuál es la probabilidad de que necesite cuando menos 2 horas para ganarse la


confianza del paciente?

4. Una vendedora en un estadio local de fútbol debe decidir si vende helados o refrescos
A
IM

durante el juego de mañana. Ella piensa que el beneficio obtenido dependerá del clima.
La tabla de pagos es:
S -L
PU

ACCIÓN
M

EVENTO VENDER REFRESCOS VENDER HELADOS


CA

Clima frı́o $50 $30


Clima caliente $60 $90

Con base en su última experiencia en esta época del año, la vendedora estima la
probabilidad de que haga calor en 0.60

a) Calcule el valor esperado al vender helados y al vender refrescos.


b) Con base en los resultados del apartado a),¿Qué debe elegir la vendedora, refrescos
o helados?¿Por qué?
E
AD

c) Calcule el coeficiente de variación para la venta de helados y la de refrescos.

5. En la tabla siguiente se observan las distribuciones de probabilidades para las


calificaciones de satisfacción en el trabajo de altos ejecutivos y mandos medios de
sistemas de información. Las calificaciones van desde 1, para insatisfecho, hasta 5, para
muy satisfecho.

a) ¿Cuál es el valor esperado de calificación por parte de los ejecutivos?


b) ¿Cuál es el valor esperado de calificación por parte de los mandos medios?
-I I

c) Calcule la varianza y la desviación estándar de las calificaciones para los altos


22
20

ejecutivos y para los mandos medios


d) Compare la satisfacción general de los altos ejecutivos y de los mandos medios con
sus trabajos.
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 171

Probabilidad
Calificación de satisfacción en el trabajo Altos ejecutivos Mandos medios
1 0.05 0.04
2 0.09 0.10
3 0.03 0.12
4 0.42 0.46
5 0.41 0.28
EP

Total 1.00 1.00


UD

k
6. Determinar el valor de k para que la función P (x) = , donde x = 1, 2, 3, 4, sea la
x
función de probabilidad de x. Determinar P (1 ≤ x ≤ 3).
A
7. Una empresa ha medido el número de errores que cometen las secretarias recién
IM

contratadas a lo largo de los últimos tres años (X), encontrando que éstas cometen
-L

hasta cinco errores en una página de 20 lı́neas y que esta variable aleatoria representa
S

la siguiente función de probabilidad:


PU
M

X 0 1 2 3 4 5
CA

f(x) 0.5 0.28 0.07 0.06 0.05 0.04

a) La representación gráfica de la función de probabilidad.


b) Mostrando cálculos halle el valor esperado y la varianza de X
c) Si se escoge una secretaria al azar, ¿cuál es la probabilidad de que cometa máximo
2 errores? ¿y como mı́nimo 2 errores?

8. La variable V = “número de pólizas vendidas por un agente de una empresa de seguros”


E

tiene la siguiente distribución de probabilidad:


AD

X 0 1 2 3 4 5 6
f(x) 0.47 0.30 0.10 0.06 0.04 0.02 0.01

a) Mostrando cálculos halle el valor esperado y la varianza de V.


b) ¿Cuál es la probabilidad de que el agente venda más de una póliza?
c) ¿Cuál es la probabilidad de que venda menos de 3?
-I I

d) ¿Cuál es la probabilidad de que venda entre 1 y 4 pólizas (ambas inclusive)?


22
20

e) Si el agente vende más de 2 pólizas ¿Cuál es la probabilidad de haya vendido


menos de 5?

9. Supóngase que se selecciona al azar una palabra de la frase: LA MUJER SE PUSO SU


PRECIOSO SOMBRERO ROJO. Si X es el número de letras de la palabra seleccionada.
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 172

¿Cuál es el valor de E[X]? Supóngase que se selecciona al azar una de las 35 letras que
tiene la oración anterior. Si Y es el número de letras de la palabra en que aparece la
letra seleccionada ¿cuál es el valor de E[Y]?

10. En un juego de publicidad, la persona participante tiene una posibilidad en 10000 de


ganar $1000, dos posibilidades en 10000 de ganar $500, dos posibilidades en 10000 de
ganar $100, cinco posibilidades en 10000 de ganar $50 y 9990 posibilidades en 10000
de no ganar nada. ¿Cuál es la ganancia esperada?

11. Una urna contiene 8 canicas similares en todos los aspectos, con excepción del color.
EP

Cuatro de ellas son rojas, tres son blancas y una es negra. Se selecciona una canica al
UD

azar. Si es roja, la persona que la seleccionó recibe 10 céntimos, si es blanca, no recibe


nada; si es negra, pierde 50 céntimos. ¿Cuál es el valor esperado del jugador?

12. Una ruleta tiene 38 compartimientos numerados: 0, 00, 1, 2, ..., 36. La mitad de
A
los compartimientos entre 1 y 36 son rojos y la otra mitad son negros. Los dos
IM

compartimientos restantes, enumerados 0 y 00, están coloreados de verde. Suponga


-L

que se apuesta $1 en un compartimiento rojo. Cuando la bola se rota y cae en un


S

compartimiento rojo, el jugador gana $1. De otra manera, pierde $1. ¿Qué deberı́a
PU

esperar el jugador ganar en un juego? ¿Cuál es la desviación estándar de la variable


M

aleatoria involucrada? Interprete los resultados.


CA

13. Suponga que selecciona al azar una palabra de la frase: ANOCHE ME ROBARON EL
CARRO MIENTRAS DORMÍA. Si la variable X es el número de letras de la palabra
seleccionada, calcule E(X) y σ(X).

14. Un inversionista tiene $1,000 para invertir. Tiene dos opciones. En una, puede invertir
en una cuenta que paga 5 % anualmente. En la otra puede comprar un bono. Si compra
el bono, tiene una probabilidad igual a de perder $300 y una probabilidad igual a de
ganar $700. ¿Cuál opción debe escoger?
E
AD

15. Una persona que participa en un juego lanza un dado. Si obtiene 5 ó 6 en el primer
lanzamiento gana $10. Si no, vuelve a lanzar el dado, y si repite el resultado del primer
lanzamiento, gana $8.Si no repite este resultado, pero obtiene un número mayor, gana
$4; pero si obtiene un número menor, lanza el dado por tercera vez. Si esta vez repite
el resultado del primer lanzamiento, se retira sin ganar ni perder; pero si no se repite
dicho resultado, pierde $20. ¿Cuánto espera la persona ganar o perder?

16. En una prueba de aptitud conformada por 25 preguntas, 4 son de cultura general. A
un alumno se le asignarán 20 preguntas al azar para que haga una tarea. Si se define
-I I

X= Número de preguntas de cultura general que se le asignan al alumno:


22
20

a) Halle la función de probabilidad o distribución de probabilidad de la variable X.


b) Halle la función de distribución de la variable X.
c) Calcule el valor esperado de la variable X, e interprete dicho resultado.
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 173

17. En una loterı́a se venden 200 boletos, de los cuales dos son ganadores de $1000, ocho de
$500, 10 de $200, 12 de $100 y 60 de $10. Sea X una variable aleatoria que representa
la ganancia de un jugador:

a) Encuentre la distribución de probabilidad de la variable X.


b) Calcule la media y la desviación estándar de la variable X. e interprete los
resultados.

18. El 90 % de los árboles plantados en una campaña de reforestación sobrevive.


EP

a) ¿Cuál es la probabilidad de que sobrevivan como máximo 7 de los 10 árboles que


UD

acaban de ser plantados?


a) ¿Cuál es la probabilidad de que sobrevivan como mı́nimo 6 de los 10 árboles que
acaban de ser plantados?
A
a) ¿Cuál es la probabilidad de que no sobrevivan como máximo 3 de los 10 árboles
IM

que acaban de ser plantados?


-L

19. Según un informe de la OCDE, en el año 1981 el 35 % de la población mundial


S
PU

tenı́a menos de 15 años. Si fuera posible elegir una muestra aleatoria de la población
mundial formada por diez personas, ¿cuál es la probabilidad de que a lo sumo haya tres
M

individuos con edad inferior a 15 años?


CA

20. Una universidad se entero de que el 20 % de sus alumnos se retiran del curso de
introducción a la fı́sica cuántica. Suponga que en este semestre se inscribieron 20
alumnos a ese curso.

a) ¿Cuál es la probabilidad de que dos o menos se retiren del curso?


b) ¿Cuál es la probabilidad de que exactamente 4 alumnos se retiren del curso?
c) ¿Cuál es la probabilidad de que se retiren del curso más de tres alumnos?
E

d) ¿Cuál es la cantidad esperada de retiros?


AD

21. Los registros hospitalarios indican que el 10 % de los casos de cierta enfermedad es
fatal. Si hay 10 pacientes que sufren la enfermedad, encontrar la probabilidad:

a) De que todos sanen.


b) De que por lo menos tres mueran
c) De que exactamente tres mueran.

22. Si se lanza 12 veces un par de dados, ¿Cuál es la probabilidad de que la suma 5 ó 6


-I I

aparezca con menor frecuencia que el número esperado de veces?


22
20

23. Una secretaria que debe llegar a su trabajo todas las mañanas a las 8:00 se retrasa
como mı́nimo 15 minutos el 20 % de las veces. El jefe de la oficina, que no llega sino a
las nueve la mayorı́a de las veces, pero llama ocasionalmente a la oficina entre las 8:00
y las 8:15 para enterarse de las novedades
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 174

a) ¿Cuál es la probabilidad de que en dos mañanas de las cinco de la semana, que el


jefe llame, la secretaria no esté en la oficina?
b) Por lo menos 2 mañanas de las cinco, la secretaria esté.
c) ¿Cuál es el número de mañanas que se esperarı́a la secretaria esté?

24. Se sabe que X es una variable aleatoria binomial con un media igual a 8 y una desviación
estándar de 2. Elaborar la distribución de probabilidad de X.

25. Al probar una cierta clase de medicamento en 100 estudiantes se encontró que 25 de
EP

ellos perdieron el hábito de copiar en los exámenes. De los siguientes 15 estudiantes


que prueban ese medicamento, obtenga la probabilidad de que:
UD

a) Exactamente 8 pierdan el hábito de copiar.


b) Más de 5 pierdan el hábito de copiar.
A
c) De 3 a 6, inclusive, pierda el hábito de copiar.
IM

d) Menos de 4 pierdan el hábito de copiar


-L

e) Calcule el valor esperado y la varianza


S
PU

26. Suponga que selecciona al azar una palabra de la frase: SE ENSAYAN LOS BAILES
M

PARA LA GRAN INAUGURACIÓN. Si la variable X es el número de letras de la


CA

palabra seleccionada, calcule E(X) y σ(X).

27. Un examen tipo test consta de diez preguntas, las cuales tienen cuatro posibles
respuestas, siendo solo una de ellas correcta. Si una persona contestase al azar , es
decir, eligiese de forma aleatoria una de las cuatro respuestas posibles de cada una de
las 10 preguntas:

a) ¿Cuál serı́a el número esperado de respuestas correctas?


b) ¿Qué probabilidad tendrı́a de acertar la respuesta correcta de al menos seis
E

preguntas?
AD

c) ¿Qué probabilidad tendrı́a de no contestar ninguna pregunta correctamente?

28. La probabilidad de que un paciente se recupere de una operación para extirpar un


tumor cerebral es del 90 %. Hallar la probabilidad de que se recuperen cinco de siete
pacientes que esperan turno para ser operados.

29. En general, el 25 % de los candidatos fallan en una prueba de selección, Cual es la


probabilidad de que en una muestra de 15:
-I I

a) fallen por lo menos 8?


22

b) De que fallen más de 4?


20

c) De que fallen entre 5 y 9, inclusive?

30. La probabilidad de que un compact disc, dure al menos un año sin que falle es de 0.95,
calcular la probabilidad de que en 15 de estos aparatos:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 175

a) 12 duren menos de un año.


b) a lo más 5 duren menos de un año.
c) al menos 2 duren menos de un año.

31. La empresa Internacional Oil Company se dedica a operaciones de perforación


exploratoria en la selva peruana. Para financiar su funcionamiento, los inversionistas
forman sociedades que proporcionan financiamiento para perforar una cantidad fija de
pozos petroleros. Cada pozo perforado se clasifica como productivo o no productivo.
La experiencia en este tipo de exploraciones indica que el 15 % de los pozos perforados
EP

fueron productivos. Una sociedad recién formada proporciona el financiamiento para


UD

realizar perforaciones exploratorias en 12 lugares.

a) ¿Cuál es la probabilidad de que los 12 pozos sean productivos?


b) ¿Cuál es la probabilidad de que los 12 pozos sean improductivos?
A
IM

c) ¿Cuál es la probabilidad de que exactamente 1 pozo sea productivo?


-L

d) Para hacer rentable a la sociedad, cuando menos de tres de los pozos de exploración
S

deben ser productivos ¿Cuál es la probabilidad de que el negocio sea rentable?


PU

32. En cada una de las siguientes situaciones diga si X tiene o no una distribución binomial.
M

Si es afirmativa la respuesta, proporcione la distribución de X y Si no es ası́, explique


CA

por qué.

Lanzar una moneda justa 9 veces. Sea X el número de caras que usted observa.
El departamento de servicio de un concesionario de automóviles realiza un
seguimiento de cada atención de servicio con una encuesta de satisfacción del
cliente mediante una llamada telefónica. En un dı́a determinado, sea X el número
de clientes a los que debe llamar un representante de servicio hasta que el cliente
esté dispuesto a participar en la encuesta.
E
AD

33. Se sabe que un determinado medicamento produce mejorı́a de cierta enfermedad a dos
de cada tres pacientes. Se les administra a siete enfermos.

a) Calcular la probabilidad de que mejoren cuatro


b) Calcular la probabilidad de que mejoren al menos cuatro personas.

34. Carlos Pérez está a cargo de la sección electrónica de Ace Home Center de Surquillo.
Se ha dado cuenta de que la probabilidad de que un cliente que solamente se encuentre
curioseando compre algo es de 0.3. Suponga que 15 clientes visitan la sección de
-I I

electrónica cada hora.


22
20

a) ¿Cuál es la probabilidad de que al menos una de las personas que curiosea compre
algo durante una hora dada?
b) ¿Cuál es la probabilidad de que al menos 4 personas que curiosea compren algo
durante una hora dada?
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 176

c) ¿Cuál es la probabilidad de que ninguna de las personas que curiosea compren


algo durante una hora dada?
d) ¿Cuál es la probabilidad de que no más de 4 personas que curiosea compren algo
durante una hora dada?

35. Las llegadas de clientes a la tienda Wong de San Isidro siguen una distribución de
Poisson. Suponga que la llegada promedio de clientes es de 3 clientes por minuto.

a) ¿Cuál es la probabilidad de que llegue exactamente 3 clientes en un minuto?


EP

b) ¿Cuál es la probabilidad de que lleguen al menos 3 clientes en un minuto?


UD

36. Con base en la experiencia, se supone que el número de defectos por pie en rollos de
papel grado 2 sigue una distribución de Poisson con un promedio de 1 defecto por cada
5 pies de papel (0.2 defectos por pie).
A
a) ¿Cuál es la probabilidad de que en un rollo de 1 pie haya por lo menos 2 defectos?
IM

b) ¿Cuál es la probabilidad de que en un rollo de 12 pies haya por lo menos 1 defecto?


-L

c) ¿Cuál es la probabilidad de que en un rollo de 50 pies haya entre 5 y 15 defectos,


S
PU

inclusive?
M

37. En un proceso de manufactura textil se tiene, que el promedio de defectos es de 6 por


CA

cada 30 m. de tela, ¿Cuál es la probabilidad de obtener por lo menos 2 fallas o defectos:


a) En una pieza de 30 metros, b) En una pieza de 10 metros, c) En una pieza de 15
metros, d) En una pieza de 5 metros.

38. Al inspeccionar la aplicación de estaño por un proceso electrolı́tico continuo, se


descubren en promedio 0,2 imperfecciones por minuto. Calcular las probabilidades de
descubrir: a) Una imperfección en 3 minutos, b) Al menos dos imperfecciones en 5
minutos, c) A lo sumo 1 imperfección en 15 minutos.

39. La tasa de mortalidad de cierta enfermedad es del 0.25 %. ¿Cuál es la probabilidad de


E
AD

que en un grupo de 800 personas: a) mueran más de 2. b) como máximo mueran 2.

40. En una conocida intersección un policı́a de tránsito aplica en promedio 3 multas diarias.
Hallar la probabilidad de que un dı́a cualquiera levante: a) exactamente 5 infracciones,
b) menos de tres infracciones, c) Por lo menos 2 infracciones.

41. Una cajera novata de un tienda de autoservicio se equivoca en promedio 2 veces en el


cobro por dı́a. ¿Cuál es la probabilidad de que en un dı́a cualquiera: a) tenga 4 o más
equivocaciones, b) no tenga ninguna equivocación?
-I I

42. En una fábrica, el 0.5 % de la producción es defectuosa:


22
20

a) ¿Cuál es la probabilidad de que haya menos de 5 artı́culos defectuosos en un lote


de 2000 artı́culos?
b) ¿Cuál es la probabilidad de que haya menos de 5 artı́culos defectuosos en un lote
de 1000 artı́culos?
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 177

43. En una fábrica el número de accidentes por semana sigue una ley de Poisson con λ = 2.
Se pide la probabilidad de que haya 4 accidentes en dos semanas.

44. Suponga que en promedio una secretaria comete 3 errores de mecanografı́a por página.
Encuentre la probabilidad de que en una página tenga: a) Exactamente 5 errores, b)
Al menos 4 errores.

45. La probabilidad de que una persona muera de cólera o tifoidea por comer un caldo de
gallina en el centro de la ciudad es de 0.002. Encuentre la probabilidad de que mueran
menos de 5 de las siguientes 2000 personas que contrajeron estas enfermedades por
EP

comer caldo de gallina en el centro de la ciudad.


UD

46. Durante las horas de tráfico intenso los accidentes se presentan en una zona urbana con
una frecuencia de dos por hora. El periodo matutino de tráfico intenso dura una hora
y 30 minutos, y el vespertino dos horas.
A
IM

a) En determinado dı́a ¿Cuál es la probabilidad de que no haya accidentes durante


-L

el periodo matutino de tráfico intenso?


S

b) ¿Cuál es la probabilidad de dos accidentes durante el periodo vespertino de tráfico


PU

intenso?
M

c) ¿Cuál es la probabilidad de 4 o más accidentes durante el periodo matutino de


CA

tráfico intenso?

47. Los accidentes de trabajo que se producen en una fábrica por semana, siguen una ley de
16
Poisson tal que la probabilidad de que haya 5 accidentes es de que haya 2 accidentes.
15
Se pide:

a) Hallar el número medio de accidentes semanales.


b) Probabilidad de que no haya ningún accidente en cuatro semanas.
E

48. En promedio, 5 pájaros chocan y mueren contra el monumento a Grau en la plaza


AD

del mismo nombre. Un concejal ha solicitado que el Congreso asigne fondos para
adquirir equipos que alejen a las aves del monumento. Un subcomité del congreso le
ha respondido que no puede asignarle fondos para tal fin a menos que la probabilidad
de que mueran más de 3 pájaros cada semana sea mayor a 0.70, ¿Deben destinarse los
fondos para dichos equipos?

49. Consideremos que el número de trozos de chocolate de una galleta sigue una distribución
de Poisson. Queremos que la probabilidad de que una galleta seleccionada al azar tenga
-I I

por lo menos tres trozos de chocolate sea mayor que 0.8. Encontrar el menor valor entero
22

de la media de la distribución que asegura esa probabilidad.


20

50. Suponga que en una lı́nea aérea, el gerente se ha enterado que en promedio uno de
cada 150 vuelos se retrasan más de una hora. Si se hacen 1500 vuelos en un mes, ¿Cuál
es la probabilidad de que más de 5 vuelos se retrasen más de una hora? ¿Cuál es la
probabilidad de que menos de 4 vuelos se retrasen más de una hora?
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 178

51. Los pasajeros de las aerolı́neas llegan al azar e independientemente a la sección de


documentación en un gran aeropuerto internacional. La frecuencia promedio de llegadas
es de 10 pasajeros por minuto.

a) ¿Cuál es la probabilidad de que no hayan llegadas en un intervalo de un minuto?


b) ¿Cuál es la probabilidad de que lleguen tres pasajeros o menos en un intervalo de
un minuto?
c) ¿Cuál es la probabilidad de que no hayan llegadas en un intervalo de 15 segundos?
EP

d) ¿Cuál es la probabilidad de al menos dos llegadas en un periodo de 15 segundos?


UD

52. Al Departamento de reservaciones de aerolı́neas regionales llegan en promedio 48


llamadas por hora.

a) Calcule la probabilidad de recibir tres llamadas en un intervalo de 5 minutos.


A
b) Calcule la probabilidad de recibir exactamente 10 llamadas en un intervalo de 15
IM

minutos.
S -L

53. En la realización de un programa, el número de errores cometidos por página sigue una
PU

distribución de Poisson de varianza 2. ¿Cuál será la probabilidad de no cometerlos en


M

un programa de 20 páginas?
CA

54. Suponga que 1.5 % de los separadores de plástico producidos por una máquina de
inyección de moldeo de alta velocidad tienen defectos. Para una muestra aleatoria de
200 separadores,

a) ¿Cuál es la probabilidad de que ninguno de los separadores tenga defectos?


b) ¿Cuál es la probabilidad de que 3 o más separadores tengan defectos?

55. En un proceso de fabricación de pelı́cula fotográfica aparece por término medio 1 defecto
por cada 20 metros de pelı́cula. Si la distribución de defectos es del tipo de Poisson,
E

calcular la probabilidad de que haya 6 defectos en un rollo de 200 metros.


AD

56. El Departamento de Impresiones y grabados de EEUU es el responsable de imprimir


papel moneda en aquel paı́s. El departamento tiene una impresionante baja frecuencia
de errores de impresión; sólo 0.5 % de los billetes presentan errores graves que no
permiten su circulación. ¿Cuál es la probabilidad de que un fajo de 1000 billetes:
a) ninguno presente errores graves?, b) Diez presenten errores que no permitan su
circulación?, c) Quince presenten errores que no permitan su circulación?
-I I

57. Una caja contiene 20 canicas blancas y 2 negras. Se extraen sucesivamente “n” canicas
22

con reemplazo y se anota el color en cada caso. Determine el número mı́nimo de


20

extracciones que deben hacerse para que la probabilidad de sacar una canica negra,
al menos una vez, sea superior a 0.5.

58. Sólo el 80 % de los alumnos de la universidad porta su carné. Si llegan 10 alumnos a la


puerta de entrada, ¿cuál es la probabilidad de que el vigilante de la puerta encuentre:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 179

a) a 4 alumnos sin carné?, b) cómo mı́nimo a 5 alumnos con carné?, c) entre 4 y 7


alumnos sin carnet, inclusive?

59. La probabilidad de que una persona muera de cáncer es de 0.0003. Si se hace la autopsia
a 20,000 personas fallecidas.

a) ¿Cuál es la probabilidad de que nadie haya muerto de cáncer?


b) ¿Cuál es la probabilidad de que por lo menos dos hayan muerto de cáncer?
c) ¿Cuál es la probabilidad de que más de 6 hayan muerto de cáncer?
EP

d) Hallar la media, la varianza y la desviación estándar de la variable de interés.


UD

60. Una persona participa en un juego donde la probabilidad de ganar es 0.40, ¿Cuántas
veces debe jugar si quiere que la probabilidad de ganar al menos 3 veces sea mayor que
0.80?
A
61. Se ha comprobado que determinada prueba cultural es superada por el 70 % de las
IM

personas con estudio de grado medio y por el 55 % de las personas con estudios
-L

primarios. Un total de 10 personas (seis con estudios de grado medio y cuatro con
S
PU

estudios primarios) realizan dicha prueba cultural. Calcular:


M

a) La probabilidad de que exactamente cuatro de las personas con estudios de grado


CA

medio superen la prueba.


b) La probabilidad de que al menos una de las personas con estudios primarios supere
la prueba.
c) Si consideramos la variable “número de personas que superan la prueba entre
las 10 que la realizan”, ¿seguirı́a un modelo binomial de probabilidad? Razone y
justifique la respuesta.

62. En una población de la sierra donde la contaminación es prácticamente nula, la


probabilidad de que una persona contraiga una infección respiratoria es de 0.0004. Si se
E
AD

somete a un análisis médico a 10,000 personas de ese poblado, ¿Cuál es la probabilidad


de que,

a) a lo más 5 hayan contraı́do la enfermedad?


b) más de 8 hayan contraı́do la enfermedad?
c) Si se enferman más de dos personas ¿cuál es la probabilidad de que se enfermen
como máximo 5?
d) Hallar la media, la varianza y la desviación estándar de la variable de interés.
-I I

63. Los mensajes que llegan a una computadora utilizada como servidor lo hacen de acuerdo
22

con una distribución de Poisson con un promedio de 0.1 mensajes por minuto.
20

a) ¿Cuál es la probabilidad de que lleguen como máximo 2 mensajes en una hora?


b) Determinar el intervalo de tiempo necesario para que la probabilidad de que no
llegue ningún mensaje durante ese lapso de tiempo sea 0.8.
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 180

64. Las llamadas de teléfono recibidas en una casa siguen un proceso de Poisson con un
valor medio de 2 llamadas por hora.

a) Si una persona toma una ducha de 10 minutos ¿cuál es la probabilidad de que el


teléfono suene durante ese tiempo?
b) ¿Durante cuánto tiempo puede tomar una ducha si se desea que la probabilidad
de no recibir ninguna llamada sea 0.5?

65. Una máquina produce piezas metálicas, de las cuales 5 % son de calidad excelente.
EP

¿Cuántas piezas deberán producirse para que la probabilidad de que haya por lo menos
una pieza de calidad excelente sea mayor a 0.5?
UD

66. La probabilidad de que un estudiante presente problemas de escoliosis (desviación


lateral sufrida por la columna vertebral) en un colegio de la capital es de 0.004. De
los siguientes 1875 estudiantes revisados, encuentre la probabilidad de que:
A
IM

a) A lo sumo cinco presenten este problema.


-L

b) Entre ocho y diez, inclusive, presenten este problema.


S
PU

67. La probabilidad de obtener cara al lanzar una moneda es igual a p. Suponga que
M

lanzamos tres veces dicha moneda. Sea la variable aleatoria X=Número de caras que
CA

aparecen después del primer sello. Se le pide:

a) Hallar la distribución de probabilidad de X.


b) Calcular el valor esperado de X
c) ¿Cuál es el valor de p que hace máximo el valor esperado de X?

68. Una caja contiene 15 tornillos de los cuales 5 son defectuosos.

a) Calcular la distribución de probabilidad que corresponde a la variable aleatoria


correspondiente al número de tornillos defectuosos obtenidos al elegir 4 tornillos
E
AD

al azar y sin reemplazo de la citada caja.


b) Calcule el valor esperado y la desviación estándar de la variable aleatoria definida
e interprete dichos resultados.
c) Hallar la función de distribución de la variable aleatoria definida.

69. Se sabe que el 5 % de las velas, producidas por una determinada marca, son defectuosas.
Las velas se empaquetan en cajas de 10 unidades y las cajas en bolsas de 100 cajas. Se
le pide:
-I I

a) La probabilidad de que al comprar una bolsa, ésta contenga todas las cajas con
22

menos de 3 velas defectuosas.


20

b) La probabilidad de que en una bolsa, haya menos de 5 cajas, con 4 o más velas
defectuosas.
c) ¿Cuántas velas defectuosas esperarı́a encontrar en una caja?
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 181

70. Una empresa de limpieza recibe 100 euros diarios por la limpieza de unas oficinas. El
número de horas necesarias para la limpieza diaria varı́a de acuerdo con la siguiente
tabla:

número de horas Probabilidad


1 0.40
2 0.30
3 0.15
EP

4 0.10
UD

5 0.05

El costo diario de la limpieza consta de una cantidad fija de 50 euros (independiente


del número de horas) más 10 euros por hora trabajada.
A
IM

a) Calcular el valor esperado y la varianza del costo.


-L

b) Calcular la esperanza matemática y la desviación tı́pica del beneficio diario.


S
PU

c) ¿Cuál es la probabilidad de que el beneficio diario sea de 30 euros o más?


M

71. Supóngase que la producción de un dı́a de 850 piezas manufacturadas contiene 50 piezas
CA

que no cumplen con los requerimientos del cliente. Se seleccionan del lote dos piezas
al azar y sin reemplazo. Sea la variable aleatoria X igual al número de piezas de la
muestra que no cumplen con los requerimientos:

a) Hallar la función de probabilidad o distribución de probabilidad de la variable X.


b) Calcule el valor esperado y la desviación estándar de la variable X, e interprete
dichos resultados.
c) Hallar la función de distribución de X
E

72. Los automóviles que llegan a un semáforo siguen un proceso de Poisson con media de
AD

4 vehı́culos por minuto. El semáforo está 40 segundos en rojo y 80 segundos en verde.

a) ¿Cuál es la probabilidad de que haya 4 automóviles en cola cuando el semáforo se


pone en verde?
b) ¿Cuál es la probabilidad de que haya más de 7 automóviles en cola?
c) ¿Cuál es la probabilidad de que en un periodo de 6 horas haya al menos una
ocasión en la que haya más de 7 automóviles en cola?
-I I

73. Una urna contiene 2 esferas blancas y 3 negras. De la urna sacamos una esfera y la
22

devolvemos nuevamente a la urna. Si la esfera salió blanca sacamos a continuación dos


20

esferas, una tras otra y sin reemplazo. Si salió negra, sacamos una esfera. Sea la variable
aleatoria Y igual al número de esferas negras extraı́das la segunda vez.

a) Hallar la función de probabilidad o distribución de probabilidad de la variable Y.


CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 182

b) Calcule el valor esperado y la desviación estándar de la variable Y, e interprete


dichos resultados.

74. La probabilidad de que al administrársele un antibiótico a un ave rapaz en recuperación


se le presente una reacción negativa es 0.04. Si se le va a administrar el antibiótico a
80 de estas aves:

a) ¿Cuál es la probabilidad de que al menos dos aves presenten reacción negativa?


b) Si más de 2 aves presentaron reacción negativa, ¿cuál es la probabilidad de que
menos de 5 aves la presenten?
EP

c) Calcule e interprete el valor esperado y la desviación estándar de la variable de


UD

interés del problema.


d) Resuelva los apartados a) y b) mediante la aproximación de Poisson y compare
con los resultados obtenidos en dichos apartados argumentando por qué son tan
A
próximos.
IM

75. Se supone que el número de resfriados que una persona cualquiera contrae durante el
-L

invierno sigue una distribución de Poisson con un promedio λ = 3.


S
PU

a) Calcular la probabilidad de que una persona en un invierno determinado, contraiga


M

por lo menos 1 resfriado.


CA

b) Si en un invierno determinado una persona contrajo al menos 2 resfriados ¿Cuál


es la probabilidad de que contraiga menos de 5?
c) Calcular la probabilidad de que de 5 personas elegidas al azar, 4 contraigan 2
resfriados en un invierno.
d) Calcular la desviación estándar del número de resfriados que una persona
cualquiera contrae durante el invierno.

76. Para cada una de las siguientes situaciones, identifique el experimento, cuál es la variable
de interés y sustente si dicha variable sigue o no una distribución binomial (en caso
E
AD

afirmativo, identifique en ella los valores de n y p:

a) Extraemos diez cartas de una baraja (una tras otra y sin reemplazo) y nos interesa
contar cuántos ases obtenemos.
b) Lanzamos un dado cien veces y nos interesa el número de unos que obtenemos.

77. Una empresa electrónica observa que el número de componentes que fallan antes de
cumplir 100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número
promedio de estos fallos es de ocho.
-I I
22

a) ¿Cuál es la probabilidad de que falle un componente en 25 horas?


20

b) Si fallan como mı́nimo dos componentes en 100 horas, ¿Cuál es la probabilidad de


que fallen menos de 7?

78. Una urna contiene 5 canicas rojas, 4 blancas y 2 verdes. Extraemos una canica,
anotamos su color y la devolvemos a la urna. Si repetimos la experiencia 7 veces:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 183

a) ¿Cuál es la probabilidad de obtener alguna canica verde?


b) ¿Cuál es la probabilidad de obtener como máximo 3 canicas verdes?
c) Si se obtienen como mı́nimo 2 canicas verdes ¿Cuál es la probabilidad de que se
obtengan menos de 4 canicas verdes?
d) Si se obtienen como mı́nimo 3 canicas verdes ¿Cuál es la probabilidad de que se
obtengan al menos 5 canicas verdes?
e) Calcule e interprete el valor esperado y la desviación estándar de la variable de
interés del problema.
EP

79. Se supone que el número de bacterias por mm3 de agua en un estanque es una variable
UD

aleatoria que sigue una distribución de Poisson con un promedio λ = 0.5.

a) ¿Cuál es la probabilidad de que haya alguna bacteria en 1 mm3 de agua?


A
b) Si tomamos aleatoriamente una muestra de esa agua con un tubo de ensayo (de
IM

capacidad 1 mm3 ) y resulta que en dicha muestra hay alguna bacteria ¿Cuál es
-L

la probabilidad de que haya menos de 3 bacterias en dicho tubo?


S

c) Si se tienen 4 tubos de ensayo (de capacidad 1 mm3 cada uno), llenados con dicha
PU

agua. Hallar la probabilidad de que al menos la mitad de los tubos no contengan


M

bacterias.
CA

80. Una caja contiene 12 artı́culos de los cuales 4 son defectuosos.

a) Si se eligen al azar 3 artı́culos ¿cuál es la probabilidad de que ningún artı́culo sea


defectuoso?
b) Si se eligen al azar 3 artı́culos (uno tras otro con reemplazo) ¿cuál es la probabilidad
de que ningún artı́culo sea defectuoso?
c) Si se eligen al azar 3 artı́culos y se obtiene como mı́nimo 1 artı́culo defectuoso
¿Cuál es la probabilidad de que se obtengan menos de 3 artı́culos defectuosos?
E
AD

d) Si se eligen al azar 3 artı́culos (uno tras otro con reemplazo) y se obtiene como
mı́nimo 1 artı́culo defectuoso ¿Cuál es la probabilidad de que se obtengan menos
de 3 artı́culos defectuosos?
e) Calcule e interprete el valor esperado y la desviación estándar de la variable de
interés del apartado a.
f) Calcule e interprete el valor esperado y la desviación estándar de la variable de
interés del apartado b.
-I I

81. Ana, Benito y Carlos comparten un departamento donde hay un teléfono fijo. Ana
22

2 2 1
recibe de todas las llamadas, Benito y Carlos . Evidentemente no siempre están
20

5 5 5
en casa para atender las llamadas. Ana está fuera el 50 % del tiempo, Benito el 75 %,
y Carlos, el más casero, el 25 %. Calcule la probabilidad de que:

a) No haya nadie en el departamento para responder una llamada.


CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 184

b) esté la persona a la que se llama.


c) De “n” llamadas para Carlos, él esté para contestar exactamente “k” llamadas.
d) De “n” llamadas para Carlos, él esté para contestar al menos una llamada.

82. En el directorio de una empresa se tienen un total de 20 asientos contables, de los cuales
6 están mal asentados y el resto está correctamente asentado. La SUNAT envı́a un
auditor y este selecciona al azar 4 asientos contables para inspeccionarlos. La empresa
deberá pagar una multa de 600 nuevos soles por cada uno de los asientos contables mal
asentados.
EP

a) ¿Cuánto se esperarı́a sea el monto pagado en multas por la empresa luego de la


UD

inspección realizada por el auditor?


b) ¿Cuál es la probabilidad de que el monto de la multa para esta empresa supere
los 1500 nuevos soles?
A
c) Halle la función de distribución (F) del monto pagado en multas por la empresa.
IM
-L

83. Una bolsa contiene 25 caramelos de limón y 15 de menta.


S
PU

a) Si se eligen al azar 4 caramelos y se define X: Número de caramelos de limón


obtenidos. Calcule e interprete el valor esperado y la desviación estándar de X.
M

b) Si se eligen al azar 4 caramelos (uno tras otro con reemplazo) y se define Y:


CA

Número de caramelos de limón obtenidos. Calcule e interprete el valor esperado y


la desviación estándar de Y.

84. Se tienen 12 naranjas de las cuales 3 están malogradas. Si se eligen aleatoriamente 5


naranjas y se define la variable Y: Número de naranjas malogradas obtenidas:

a) Hallar la función de probabilidad de la variable Y: f(Y).


b) Si al elegir las 5 naranjas obtenemos como máximo 2 naranjas malogradas ¿Cuál
es la probabilidad de que se haya obtenido alguna naranja malograda?
E
AD

c) Si al elegir las 5 naranjas obtenemos alguna naranja malograda ¿Cuál es la


probabilidad de que se haya obtenido como mı́nimo 2 naranjas malogradas?
d ) Calcule el valor esperado y la desviación estándar de la variable Y, e interprete
dichos resultados.
e) Halle la función de distribución de X: F(X).
f ) Responda a los apartados a), b), c) d) y e), pero asumiendo que se realiza
el muestreo con reemplazo (es decir, se eligen las naranjas una tras otra con
reemplazo)
-I I
22

85. Suponga que el número de denuncias que realizan los trabajadores de cierta empresa
20

a la Superintendencia Nacional de Fiscalización Laboral (Sunafil) son en promedio 1.5


al año.

a) ¿Cuál es la probabilidad de que en un año determinado la empresa no sea


denunciada?
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 185

b) ¿Cuál es la probabilidad de que en un año determinado se produzcan más de 4


denuncias?
c) ¿Cuál es la probabilidad de que en en el primer cuatrimestre del año se produzcan
dos o más denuncias?
d ) Si en un año determinado hay alguna denuncia ¿Cuál es la probabilidad de que
en dicho año se produzcan al menos 3 denuncias?
e) Si en un año determinado hay como máximo 4 denuncias ¿Cuál es la probabilidad
de que en dicho año se produzcan como mı́nimo 2 denuncias?
EP

86. En un estudio de mercado, una empresa ha determinado que el 40 % de los consumidores


UD

son clientes habituales de sus productos. Si se eligen al azar 12 consumidores y se


encuentran como máximo 6 clientes habituales ¿Cuál es la probabilidad de encontrar
al menos 3 clientes habituales de los productos de dicha empresa?
A
87. La comisión de desarrollo económico de la Municipalidad distrital ha determinado que el
IM

número de pequeños negocios que se declaran en quiebra al mes sigue una distribución
-L

de Poisson con promedio de 2,6 . Si en un mes se declaran en quiebra menos de 5


S
PU

negocios ¿Cuál es la probabilidad de que se declaren en quiebra al menos 2 negocios?


M

88. Un vendedor de seguros vende en promedio 3 pólizas por semana (7 dı́as). Se supone
CA

que el número de pólizas vendidas sigue una distribución de Poisson. Si se eligen 6


semanas aleatoriamente ¿Cuál es la probabilidad de que, de dos a cuatro semanas se
hallan vendido 2 pólizas?

89. Se supone que el número de imperfecciones que puede encontrarse en una botella
de vidrio sigue una distribución de Poisson con media igual a 3. Si elegimos 6
botellas al azar ¿Cuál es la probabilidad de que menos de cuatro botellas contengan 2
imperfecciones?

90. Felipe Aldana es un agente de bolsa (también conocido como broker o corredor de
E
AD

bolsa). Suponga que el número de paquetes de 1000 acciones cada uno que Felipe
Aldana vende un dı́a jueves entre las 10 am y 11 am. es una variable aleatoria con la
siguiente distribución de probabilidad:

X: Número de paquetes (de 1000 acciones) 4 5 6 7 8 9


1 1 1 1 1 1
f (X)
12 12 4 4 6 6

Responda lo siguiente mostrando los cálculos claramente:


-I I

a) Si en un jueves cualquiera entre las 10 am y 11 am, Felipe Aldana vende más de


22

5 paquetes de acciones ¿Cuál es la probabilidad de que venda como máximo 8


20

paquetes de acciones?
b) ¿Cuál es la probabilidad de que Felipe Aldana venda al menos 7 paquetes de
acciones un jueves cualquiera entre las 10 am y 11 am?
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 186

c) Halle el valor esperado y la desviación estándar de la variable de interés e interprete


los resultados.
d ) Halle la función de distribución de X: F(X).
EP
UD

A
IM
S -L
PU
M
CA

E
AD

-I I
22
20
Capı́tulo 5

Distribución de probabilidad continua


EP
UD

5.1. Introducción
En el capı́tulo 4 estudiamos la variable aleatoria discreta y su distribución de probabilidad
en general y resaltamos dos distribuciones probabilı́sticas discretas usuales: la distribución
A
binomial y la distribución de Poisson. Recuérdese que las mismas se basan en variables
IM

aleatorias discretas, que pueden tomar sólo valores especı́ficos en un intervalo. En este capı́tulo
-L

veremos al estudio de las variables aleatorias continuas. Especı́ficamente, discutimos tres


S

distribuciones de probabilidad continua: normal, uniforme, y exponencial.


PU

Una diferencia fundamental que distingue a las variables aleatorias discretas de las
M

continuas es la forma cómo se calculan las probabilidades. Para una variable aleatoria discreta,
CA

la función de probabilidad f (x) proporciona la probabilidad de que la variable aleatoria


asuma un valor particular. Con variables aleatorias continuas, la contraparte de la función
de probabilidad es la función de densidad de probabilidad (fdp), también denotada por f (x).
La diferencia es que la función de densidad de probabilidad no proporciona probabilidades
directamente. Sin embargo, el área debajo de la gráfica de f (x) correspondiente a un intervalo
dado proporciona la probabilidad de que la variable aleatoria continua “x” asuma un valor en
ese intervalo. Entonces, cuando calculamos probabilidades para variables aleatorias continuas,
estamos calculando la probabilidad de que la variable aleatoria asuma cualquier valor en un
intervalo.
E
AD

Debido a que el área bajo la gráfica de la fdp en cualquier punto particular es cero, una
de las implicaciones de la definición de probabilidad para las variables aleatorias continuas
es que la probabilidad de cualquier valor particular de la variable aleatoria es cero. Esto es
lo que distingue a los fenómenos continuos (que se miden) de los fenómenos discretos (que se
cuentan).
Cuando la variable es continua, no tiene sentido hacer una suma de las probabilidades
de cada uno de los valores de la variable, ya que el conjunto de valores que puede tomar la
variable es no numerable. En este caso, lo que generaliza de modo natural el concepto de
P R
-I I

sumatoria ( ) es el de integral .
22

5.2. Función densidad de probabilidad


20

Sea X una variable aleatoria continua, entonces una función de densidad de probabilidad
de X es una función f(x) tal que para dos números cualesquiera a y b, siendo a ≤ b

187
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 188

Z b
P (a ≤ X ≤ b) = f (x)dx, (5.1)
a

es decir, la probabilidad de que X tome un valor en el intervalo [a, b] es el área bajo la gráfica
de una función de densidad, dentro de este intervalo. La curva f (x) se llama función de
densidad.
Para que f (x) sea una función de densidad de probabilidad, se deben satisfacer las
siguientes condiciones:
EP

1. f (x) ≥ 0, para todo x.


Z +∞
UD

2. f (x)dx = 1.
−∞

Proposición. Si X es una variable aleatoria continua, entonces para cualquier valor c,


P (X = c) = 0. Además, para dos números cualesquiera a y b con a < b
A
IM

P (a ≤ X ≤ b) = P (a < X ≤ b) = P (a ≤ X < b) = P (a < X < b).


S -L

En definitiva, la probabilidad asignada a algún valor en particular es cero, mientras que


PU

la probabilidad de un intervalo no depende de si está incluido en cualquiera de sus extremos.


M

5.3. Función de Distribución Acumulada


CA

Para una variable aleatoria continua se dispone de un conjunto no numerable de valores.


No es posible definir una probabilidad para cada uno. Por eso definimos previamente la
función de distribución acumulada, que sı́ tiene un significado inmediato y semejante al caso
discreto. La función de distribución acumulada (cdf) viene dada por:

F : R → [0, 1]

x → F (x) = P (X ≤ x)
E

La función de distribución acumulada, F (x), para una variable aleatoria continua X, está
AD

definida para todo número x mediante:


Z x
F (x) = P (X ≤ x) = f (y)dy, (5.2)
−∞

donde f es la función densidad de probabilidad de la función de distribución F (x). Para cada


x, F (x) es el área bajo la curva de densidad a la izquierda de x. F (x) se incrementará de
manera uniforme cuando aumenta x.
Existe una relación entre f (x) y F (x). Diferenciando tenemos
-I I

dF (x)
22

= f (x), (5.3)
dx
20

para cada x donde f(x) sea continua.


La función de distribución acumulada es útil también para calcular probabilidades de
la siguiente manera: Sea X una variable aleatoria continua con función de densidad de
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 189

probabilidad f (x) y función de distribución acumulada F (x). Entonces, para cualquier


número “a”, la probabilidad es:

P (X > a) = 1 − F (a) (5.4)

Y para dos números cualesquiera a y b, siendo a < b, la probabilidad es

P (a ≤ X ≤ b) = F (b) − F (a). (5.5)

5.4. Valor esperado y varianza de una Variable Aleatoria Continua.


EP

La esperanza matemática, valor esperado o media de una variable aleatoria continua X


UD

con función de densidad de probabilidad f (x) es


Z +∞
µ = E(X) = x.f (x)dx (5.6)
A
−∞
IM

La Varianza es
-L

Z +∞
S

σ 2 = V ar(X) = (x − µ)2 .f (x)dx (5.7)


PU

−∞

La desviación estándar de X es la raı́z cuadrada positiva de su varianza.


M
CA

5.4.1. Propiedades de la esperanza matemática y de la varianza de una variable


aleatoria continua
Sea X una variable aleatoria continua y sean a, b constantes; se verifica que

E(aX + b) = aE(X) + b (5.8)

V ar(aX + b) = a2 .V ar(X) (5.9)

V ar(X) = E(X 2 ) − [E(X)]2 (5.10)


E
AD

Si f (x) es la función densidad de una variable aleatoria continua X y consideremos la


v.a. Y=g(X). Entonces, el valor esperado de Y se puede calcular mediante
Z
E(Y ) = g(x)f (x)dx (5.11)
R

Ejercicios resueltos.

1. Sea X una variable aleatoria continua que tiene la siguiente función de densidad:
-I I


2

 c.x si 0≤x≤2
22

f (x) =
20



0 en otros casos

Hallar:
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 190

a) El valor de c para que f (x) sea una función de densidad.


Para que f (x) sea función de densidad deben cumplirse las 2 condiciones
mencionadas en la sección 5.2. Como se aprecia f (x) es mayor que cero por lo que
se cumple la primera condición. Para satisfacer la segunda condición evaluamos
cada uno de los intervalos en que está definida la función densidad
Z +∞
f (x)dx = 1
−∞
Z 0 Z 2 Z +∞
0.dx + c.x2 dx + 0dx = 1
EP

−∞ 0 2
x3 2
UD

0+c +0 = 1
3 0
c 3 
2 − 03 = 1
3
8
c = 1
A
3
IM

3
de lo cual obtenemos que c = . Por lo tanto, la función de densidad de la variable
-L

8
S

aleatoria continua X es
PU


 3 2
M


 8 x si 0≤x≤2
CA

f (x) =



0 en otros casos

b) Obtener la función de distribución y graficarla.


Para calcular la función de distribución empleamos (5.2) en los diferentes intervalos
en que se define la función densidad f (x). Entiéndase que en aquellos tramos donde
la función densidad es cero, la función de distribución igualmente será cero.
para x < 0 Z x
F (x) = f (y)dy = 0,
E

−∞
AD

para 0 ≤ x < 2
Z Z Z
x 0 x
3 2 1 x x3
F (x) = f (y)dy = 0.dy + y dy = 0 + y 3 = .
−∞ −∞ 0 8 8 0 8

para x ≥ 2
Z Z Z Z
x 0 2
3 2 x
1 2 23
F (x) = f (y)dy = 0.dy + y dy + 0.dy = 0 + y 3 + 0 = =1
−∞ −∞ 0 8 2 8 0 8
-I I
22

Por lo tanto, la función de distribución acumulada queda definida como


20
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 191



 0 si x<0





 3
x
F (x) = si 0 ≤ x < 2

 8






1 si x≥2

La gráfica de F(x) se muestra en la Figura 5.1.


EP

1.00
UD

0.75
A
IM
S -L
F(x)

PU

0.50
F(x)
M
CA

0.25

0.00

−4 −2 0 2 4
x

Figura 5.1: Gráfica de la Función de distribución de X pedida en 1b).


E
AD

c) Calcular P (1 ≤ X ≤ 2).
Para este cálculo podemos utilizar la función de densidad o la función de
distribución acumulada. Por ejemplo empleando ésta última através de (5.5)
tenemos
23 13 7
P (1 ≤ X ≤ 2) = F (2) − F (1) = − = .
8 8 8
Si hubiéramos utilizado la función densidad procederı́amos como en (5.1)
-I I

Z 2
3 2
22

P (1 ≤ X ≤ 2) = x dx,
8
20

obteniendo el mismo resultado.


d) Calcular la esperanza matemática, la varianza y la desviación estándar de X.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 192

Para el cálculo de la esperanza, empleamos (5.6)


Z +∞
µ = E(X) = x.f (x)dx =
−∞
Z 0 Z +∞Z 2
3 2
= x.0.dx + x x dx + x.0.dx =
−∞ 0 8 2
Z
3 2 3 3 2 3 4  3
= 0+ x dx + 0 = x4 = 2 − 04 =
8 0 32 0 32 2

Para el cálculo de la varianza podemos utilizar (5.7) o (5.10). Empleando ésta


EP

última tenemos
UD

Z +∞
σ 2 = V ar(X) = x2 .f (x)dx − µ2
−∞
Z 0 Z 2 Z +∞   2
3 3
= x2 .0.dx +
x2 . x2 dx + x2 .0.dx −
8 2
A
 −∞ 0   2
3 5 2
IM

9 3
= 0+ x +0 − =
40 0 4 20
S -L
PU

e) Si X es la cantidad diaria vendida de un producto y la ganancia del vendedor es 5


unidades monetarias por cada unidad de producto vendida si X ≤ 1, y 8 unidades
M

monetarias si X > 1, encontrar la ganancia esperada del vendedor para cualquier


CA

dı́a especificado.
Para este último apartado, tenemos expresada la ganancia en función de la v.a
continua X la cual sabemos que tiene una función densidad definida en el apartado
a). Entonces la función de la ganancia según el enunciado es


 5x si 0 ≤ x ≤ 1
g(x) =


8x si 1 < x ≤ 2
E
AD

Por tanto para obtener la ganancia esperada del vendedor, usamos (5.11)
Z +∞
E(Y ) = g(x)f (x)dx
−∞
Z 0 Z 1 Z 2 Z +∞
= 0.0.dx + g(x)f (x)dx + g(x)f (x)dx + 0.0.dx
−∞ 0 1 2
Z Z
1
3x2 2
3x2 15x4 1 15 453x4 2
375
= 0+ 5x dx + 8x dx + 0 = + = + =
0 8 1 8 32 0 4 1 32 4 32
-I I

2. Dada la función siguiente


22


 1 2
20


 7 .x si x ∈ [1, 2]
f (x) =



0 si x ̸∈ [1, 2]
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 193

¿Puede ser esta, la función de densidad de alguna distribución continua? ¿Por qué?
Para que la función dada sea una función densidad debe cumplir las 2 condiciones
mencionadas en la sección 5.2. Como se aprecia f (x) es mayor que cero en los intervalos
definidos por
Z lo que se cumple la primera condición. Para saber si se satisface la segunda
+∞
condición: f (x)dx = 1; evaluamos cada uno de los intervalos en que está definida
−∞
la función densidad
Z 1 Z Z
2
x2 +∞
x3 2 1 3  1
0.dx + dx + 0.dx = 0 + +0= 2 − 13 = ̸= 1
−∞ 7 21 1 21 3
EP

1 2

Como se aprecia no se cumple la segunda condición por tanto la función dada no es


UD

una función de densidad.

3. Dada la función siguiente:


 x
A

 si 2≤x≤4
IM


 10




-L

f (x) = k si 4≤x≤5
S




PU





 0 en otros casos
M
CA

a) Determinar k en la función, para que sea una función de densidad.


Para que la función dada sea una función densidad debe cumplir las 2 condiciones
mencionadas en la sección 5.2. Como se aprecia f (x) es mayor que cero en los
intervalos definidos por lo que seZcumple la primera condición. Para saber si
+∞
se satisface la segunda condición: f (x)dx = 1; evaluamos cada uno de los
−∞
intervalos en que está definida la función densidad
Z +∞
f (x)dx = 1
E

−∞
Z Z 5
AD

4
x
dx + kdx = 1
2 10 4
x2 4 5

+ kx = 1
20 2 4
12
+k = 1
20
2
k =
5
-I I
22
20
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 194

Por lo tanto, la función de densidad de la variable aleatoria continua X es


 x

 si 2≤x≤4

 10





f (x) = 2
 si 4≤x≤5

 5





 0 en otros casos

b) Calcular la función de distribución y graficarla.


EP

Para calcular la función de distribución empleamos (5.2) en los diferentes intervalos


UD

en que se define la función densidad f (x).


para x < 2 Z x
F (x) = f (y)dy = 0,
−∞
A
IM

para 2 ≤ x < 4
-L

Z Z Z
x 2 x
y y 2 x x2 1
S

F (x) = f (y)dy = 0.dy + dy = 0 + = −


10 20 2 20 5
PU

−∞ −∞ 2
M

para 4 ≤ x < 5
CA

Z Z ZZ x
x 2
y 4
2 y 2 4 2y x
F (x) = f (y)dy = 0.dy + dy + dy = 0 + + =
−∞ −∞ 2 10 4 5 20 2 5 4
12 2 2x
= + (x − 4) = −1
20 5 5

para x ≥ 5
Z x Z 2 Z 4 Z 5 Z +∞
2 y
F (x) = f (y)dy = 0.dy + dy + dy + 0.dy =
−∞ −∞ 2 4 5 10 5
y 2 4 2y 5 3 2
E

= 0+ + +0= + =1
AD

20 2 5 4 5 5

Por lo tanto, la función de distribución acumulada queda definida como




 0 si x<2







 x2 1


 20 − 5
 si 2 ≤ x < 4
F (x) =



 2x
-I I


 −1 si 4 ≤ x < 5

 5


22





20

1 si x≥5

La gráfica de F(x) se muestra en la Figura 5.2.


c) Calcular P(3 ≤ X ≤ 4.5).
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 195

1.00

0.75
EP

F(x)

0.50
F(x)
UD

0.25
A
IM
S-L

0.00
PU

0 2 4 6 8
x
M
CA

Figura 5.2: Gráfica de la Función de distribución de X pedida en 3b).

Para este cálculo podemos utilizar la función de densidad o la función de distribución


acumulada. Por ejemplo empleando ésta última através de (5.5) tenemos
   2 
2 3 1 4 1 11
P (3 ≤ X ≤ 4.5) = F (4.5) − F (3) = × 4.5 − 1 − − = − = .
5 20 5 5 4 20

Si hubiéramos utilizado la función densidad procederı́amos como en (5.1) cuidando de


E

tomar la adecuada expresión de f (x) según el tramo de valores analizado


AD

Z 4 Z 4.5
x 2
P (3 ≤ X ≤ 4.5) = dx + dx,
3 10 4 5

y resolviendo esas integrales obtendrı́amos el mismo resultado.


-I I
22
20
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 196

4. Sea una variable aleatoria continua definida por




 0 si x<0







 x3

 si 0 ≤ x < 1

 3






1
F (x) = si 1 ≤ x < 2

 3





 x2 + 2
EP




 si 2 ≤ x < 4

 k

UD






1 si x≥4

Determinar la función de densidad.


A
Como se denota en (5.3), la función de densidad f (x) puede ser obtenida derivando la
IM

función de distribución F (x). Dado que la forma de F (x) varı́a a lo largo del campo de
-L

variación de la variable, consideramos los siguientes intervalos


S
PU

para x < 0
d
M

f (x) = F (x) = 0,
dx
CA

para 0 ≤ x < 1  
d d x3
f (x) = F (x) = = x2 ,
dx dx 3
para 1 ≤ x < 2  
d d 1
f (x) = F (x) = = 0,
dx dx 3
para 2 ≤ x < 4  
d d x2 + 2 2x
f (x) = F (x) = = ,
dx dx k k
E

para x ≥ 4
AD

d
f (x) = F (x) = 0,
dx
Por tanto la función de densidad será


 x2 si 0≤x<1






2x
f (x) = si 2≤x<4

 k




-I I



0 en otros casos
22
20

Ahora bien, para que la función de densidad quede perfectamente especificada, debemos
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 197
Z +∞
hallar el valor de k, que verifique: f (x)dx = 1.
−∞

Z 1 Z 4
2 2x
x dx + dx = 1
0 2 k
x3 1 x2 4
+ = 1
3 0 k 2
1 12
+ = 1
3 k
k = 18
EP

Entonces la función densidad especı́fica es


UD



 x2 si 0≤x<1





 x
f (x) = si 2≤x<4
A
 9


IM





 0
-L

en otros casos
S
PU

5.5. Distribución de probabilidad normal


M

La más importante distribución de probabilidad en estadı́stica, utilizada para describir el


CA

comportamiento de una variable aleatoria continua es la Distribución de probabilidad normal.


Fue descubierta por el matemático alemán Carl Friedrich Gauss en el siglo XIX (por lo que
también se conoce como la distribución gaussiana).
¿Por qué es tan importante la distribución normal en estadı́stica?
Una primera razón es que esta distribución es una buena descripción para muchas
distribuciones de datos reales, es decir, muchas variables aleatorias continuas se comportan
muy próximas a esta distribución o se distribuyen aproximadamente de forma normal. Por
ejemplo, las estaturas de los hombres (o de las mujeres), los pesos, la presión sanguı́mea,
E

los puntajes de una prueba, el coeficiente intelectual, los cambios diarios en los precios de
AD

las acciones al cierre, etc. Otro ejemplo es el de una máquina que produce (digamos) pernos
con una longitud nominal de 5 cm que en realidad producirá pernos de longitud ligeramente
variable (estas diferencias probablemente serı́an extremadamente pequeñas) debido a factores
como el desgaste de la maquinaria, ligeras variaciones en la presión del lubricante, etc. Esto
darı́a como resultado pernos cuya longitud varı́a, de acuerdo con la distribución Normal. Este
tipo de proceso es extremadamente común, con el resultado de que la distribución Normal a
menudo ocurre en situaciones cotidianas.
La segunda razón es que puede ser utilizada para calcular, de forma aproximada,
-I I

probabilidades para otras distribuciones, como por ejemplo, para la distribuición binomial.
22

La tercera razón, y más importante, es que muchos de los procedimientos de inferencia


20

estadı́stica que estudiaremos en capı́tulos posteriores se basan en la distribución normal.


Se dice que una variable aleatoria X tiene distribución normal con media µ y varianza σ 2
si su función densidad de probabilidad es dada por
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 198

2
1 − 1 ( x−µ
σ ) , −∞ < x < ∞
f (x) = √ e 2 (5.12)
σ 2π
donde:

π y e son constantes matemáticas con valores aproximados de 3.14159 y 2.71828


respectivamente.

µ es el valor esperado de la variable X con −∞ < µ < ∞.


EP

σ 2 es la varianza de la variable X con σ 2 > 0.


UD

x es un valor cualquiera de la variable aleatoria X.

La notación empleada para expresar que una variable X sigue una distribución normal
con media µ y varianza σ 2 es: X ∼ N (µ, σ 2 ).
A
La representación gráfica de (5.12), conocida como curva normal o “campana de Gauss”,
IM

se muestra en la Figura 5.3 y presenta las siguientes caracterı́sticas:


S -L
PU
M
CA

x
µ−σ µ µ+σ

Figura 5.3: Curva normal

Tiene forma de campana.


E

Es unimodal presentando un único pico (punto más alto de la curva) el cual está en la
AD

media, que también es la mediana y la moda de la distribución.

La distribución probabilı́stica normal es simétrica con respecto a su media (µ). Si se


corta la curva normal verticalmente en este valor central, las dos mitades se reflejarán
como imágenes en un espejo. Por ser una función densidad, se puede comprobar también
que el área bajo la curva normal es igual a 1. De esta forma, la mitad del área bajo
la curva (0.5) se encuentra por arriba de este punto central, y la otra mitad (0.5) por
debajo.
-I I

La curva normal decrece uniformemente en ambas direcciones a partir del valor central.
22

La curva normal es asintótica, lo cual significa que las colas de la curva se extienden
20

hasta el infinito en ambas direcciones y, en teorı́a, nunca tocan el eje horizontal.

µ − σ y µ + σ son los puntos de inflexión de f (x).


CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 199

Como se aprecia la distribución normal depende de dos parámetros: µ y σ. Ası́, cada


vez que se especifica una combinación particular de µ y σ, se genera una distribución de
probabilidad normal diferente. Por ejemplo en la Figura 5.4 se muestran dos distribuciones
normales con diferentes medias y la misma desviación estándar, en la Figura 5.5 se muestran
dos distribuciones normales con igual media y diferente desviación estándar y en la Figura
5.6 se muestran dos distribuciones normales con diferente media y desviación estándar.

N (µ1 , σ 2 ) N (µ2 , σ 2 )
EP
UD

x
µ1 µ2
A
IM

Figura 5.4: Curvas normales con diferentes medias e igual desviación estándar.
S -L

N (µ3 , σb2 )
PU

σa > σb
M
CA

N (µ3 , σa2 )
x
µ3

Figura 5.5: Curvas normales con igual media y diferente desviación estándar.
E

N (µ5 , σ52 )
AD

N (µ4 , σ42 )

x
µ4 µ5

Figura 5.6: Curvas normales con diferente media y desviación estándar.

Aunque existen infinitas curvas normales, todas tienen propiedades comunes. En


particular, como se aprecia en la Figura 5.7 todas las distribuciones normales cumplen con
-I I

lo siguiente:
22
20

a) 68.3 % de los valores de una variable aleatoria normal están dentro de más una y menos
una desviación estándar de su media.

b) 95.4 % de los valores de una variable aleatoria normal están dentro de más dos y menos
dos desviaciones estándar de su media.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 200

c) 99.7 % de los valores de una variable aleatoria normal están dentro de más tres y menos
tres desviaciones estándar de su media.

x
EP

µ − 3σ µ − 2σ µ − 1σ µ µ + 1σ µ + 2σ µ + 3σ
UD

0.683
0.954
0.997

Figura 5.7: Áreas bajo la curva comunmente utilizadas para cualquier distribución normal.
A
IM
-L

5.6. Cálculo de probabilidades asociadas a una curva normal especı́fica


S

Como se mencionó anteriormente, cada combinación de µ y σ determina una distribución


PU

normal diferente, por tanto el número de distribuciones normales es ilimitado. Resultarı́a


M

fı́sicamente imposible proporcionar una tabla de probabilidades (como se hizo para la


CA

binomial y la de Poisson) para cada combinación de µ y σ, ya que si existe un número infinito


de combinaciones de los parámetros µ y σ se necesitarı́a un número infinito de tablas.
Por fortuna, puede utilizarse un elemento de la familia de distribuciones normales
para todos los problemas donde tal distribución resulte aplicable. Dicha distribución es
denominada Distribución normal estándar.
5.6.1. Distribución normal estándar
Una variable aleatoria que tiene una distribución normal con media igual a cero y
desviación estándar igual a 1 se dice que tiene una distribución de probabilidad normal
E

estándar. La letra Z es comunmente utilizada para representar a esta particular variable


AD

aleatoria, ası́ la notación empleada es Z ∼ N (0, 1). La Figura 5.8 muestra la curva normal
estándar. Tiene la misma apariencia general que otras distribuciones normales, pero con las
propiedades especiales de µ = 0 y σ = 1.

σ=1
-I I
22

z
20

Figura 5.8: Curva normal estándar

Debido a que µ = 0 y σ = 1, la expresión para la función de densidad de probabilidad


CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 201

normal estándar es mostrada en (5.13) y como se aprecia es una versión más simple de la
expresión (5.12).

1 − 12 z 2
f (z) = √

e (5.13)

La importancia de la distribución normal estándar radica en que se emplea para


representar las infinitas distribuciones normales existentes. Dicho de otra manera, cualquier
distribución normal puede convertirse en una “distribución normal estándar” mediante el
proceso llamado estandarización o tipificación.
EP

5.6.2. Estandarización
UD

Si x es una observación de una distribución que tiene media µ y desviación estándar σ,


el valor estandarizado de x es
x−µ
z= (5.14)
σ
A
Un valor estandarizado es comunmente conocido como z-score o puntuación z. Una
IM

puntuación z nos dice cuántas desviaciones estándar cae la observación original lejos de la
-L

media, y en qué dirección. Las observaciones mayores que la media son positivas cuando
S
PU

están estandarizadas, y las observaciones menores que la media son negativas cuando están
estandarizadas.
M

Si la variable que estandarizamos tiene distribución normal, la estandarización hace


CA

más que dar una escala común. Convierte todas las distribuciones normales en una sola
distribución, y esta distribución sigue siendo normal. La estandarización de una variable que
tiene una distribución normal produce una nueva variable que tiene distribución estándar
normal.
Cuando transformamos “X” en “Z”, lo que realmente hacemos es emplear una función
densidad normal que sea independiente de los valores y unidades que tenga la variable
continua analizada. Una ventaja de la puntuación z, es que nos permite comparar valores
provenientes de distribuciones normales diferentes, pues z no tiene unidades dimensionales.
E

5.6.3. Cálculo de probabilidades (áreas) con la curva normal estándar


AD

Para la distribución normal estándar, han sido calculadas áreas bajo la curva y están
disponibles en tablas que son utilizadas para calcular probabilidades. Un ejemplo de esas
tablas es la que aparece en el Apéndice A.4. Esta tabla permite hallar el área que hay entre
la media (µz = 0) y “zc ” desviaciones estándar por arriba de la media. La Figura 5.9 ilustra
la probabilidad obtenida mediante la tabla que emplearemos: P (0 ≤ Z ≤ zc ).
Si tomáramos por ejemplo: zc = 1.63, entonces de la tabla obtenemos que:
-I I

P (0 ≤ Z ≤ 1.63) = 0.44845
22
20

Calculando algunas probabilidades tenemos (Figura 5.10):

a) P (−1.63 ≤ Z ≤ 0) =?
Esta probabilidad es igual a la P (0 ≤ Z ≤ 1.63) = 0.44845, debido a la simetrı́a de la
curva.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 202

probabilidad
EP
UD

A 0 zc Z
IM
-L

Figura 5.9: P (0 ≤ Z ≤ zc ) proporcionada por la tabla que aparece en el Apéndice A.4.


S
PU
M

b) P (Z ≥ 1.63) =?
CA

Esta probabilidad es igual a: 0.5 − P (0 ≤ Z ≤ 1.63) = 0.5 − 0.44845 = 0.05155, esto es


porque la P (Z ≥ 0) = 0.5 = P (Z ≤ 0).

c) P (Z ≤ −1.63) =?
Esta probabilidad es igual a la P (Z ≥ 1.63) = 0.05155, debido a la simetrı́a de la curva.

d) P (0.46 ≤ Z ≤ 1.63) =?
Esta probabilidad es igual a: P (0 ≤ Z ≤ 1.63)−P (0 ≤ Z ≤ 0.46) = 0.44845−0.17724 =
0.27121.
E

e) P (−0.46 ≤ Z ≤ 1.63) =?
AD

Esta probabilidad es igual a: P (−0.46 ≤ Z ≤ 0) + P (0 ≤ Z ≤ 1.63) = 0.17724 +


0.44845 = 0.62569, esto es debido a que, por simetrı́a de la curva: P (0 ≤ Z ≤ 0.46) =
0.17724 = P (−0.46 ≤ Z ≤ 0).
-I I
22
20
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 203

−1.63 0 Z 0 1.63 Z
EP
UD

(a) (b)

A
IM
S -L
PU

−1.63 0 Z
M

0 0.46 1.63 Z
CA

(c) (d)
E

−0.46 0 1.63 Z
AD

(e)
Figura 5.10: Ilustración del cálculo de probabilidades con la tabla de áreas bajo la curva normal
estándar.

Suponga ahora que X sea una variable aleatoria con distribución normal, o sea, X ∼
N (µ, σ 2 ), con µ = 3 y σ 2 = 4, y queremos calcular P (2 ≤ X ≤ 5). Entonces empleando la
estandarización, expresión (5.14), tenemos
-I I

 
22

2−3 X −3 5−3
P (2 ≤ X ≤ 5) = P ≤ ≤
20

2 2 2
= P (−0.5 ≤ Z ≤ 1)
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 204

Por tanto, la probabilidad de que X esté entre 2 y 5, inclusive, es igual a la probabilidad de


que Z esté entre -0.5 y 1, inclusive (Figura 5.11). Utilizando la tabla de distribución normal
estándar vemos que

P (−0.5 ≤ Z ≤ 1) = 0.19146 + 0.34134 = 0.5328

o sea,

P (2 ≤ X ≤ 5) = 0.5328
EP
UD

A
IM
-L

x
S

2 3 5
PU
M
CA

z
-0.5 0 1

Figura 5.11: Ilustración del cálculo de P (2 ≤ X ≤ 5) para X ∼ N (3, 4)

Problemas resueltos.
E
AD

1. Los depósitos efectuados en el Banco Bradesco durante el mes de enero se distribuyen


normalmente, con un promedio de $ l0.000,00 y desviación estándar de $ 1.500,00. Un
depósito es seleccionado al azar entre todos los referentes al mes en cuestión. Encontrar
la probabilidad de que el depósito sea:

a) $ l0.000,00 o menos.
Tenemos que µ = 10000 y σ = 1500. Sea la variable aleatoria: X=“Depósito
efectuado en el mes de enero($)”, X ∼ N (10000, 15002 ).
-I I

 
10000 − 10000
22

P (X ≤ 10000) = P Z ≤ = P (Z ≤ 0) = 0.5 o 50 %
1500
20

Por tanto, la probabilidad de que X sea menor o igual que 10000, es igual a la
probabilidad de que Z sea menor o igual que cero (Figura 5.12 a)).
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 205

b) por lo menos $ l0.000,00

P (X ≥ 10000) = P (Z ≥ 0) = 0.50 o 50 %

Por tanto, la probabilidad de que X sea mayor o igual que 10000, es igual a la
probabilidad de que Z sea mayor o igual que cero (Figura 5.12 b)).
EP
UD

10000 X
10000 X

A
IM

0 Z 0 Z
-L

a) b)
S
PU

Figura 5.12: Ilustración del cálculo de a) P (X ≤ 10000) y b) P (X ≥ 10000) para X ∼


N (10000, 15002 ).
M
CA

c) un valor entre $ 12.000,00 y $ 15.000,00


 
12000 − 10000 X − 10000 15000 − 10000
P (12000 < X < 15000) = P < <
1500 1500 1500
 
4 10
=P <Z< = P (1.33 < Z < 3.33)
3 3
= 0.49957 − 0.40824 = 0.09133 o 9.13 %.

Por tanto P (12000 < X < 15000) es igual a P (1.33 < Z < 3.33) (Figura 5.13).
E
AD

10000 12000 15000 X


-I I
22
20

0 1.33 3.33 Z

Figura 5.13: Ilustración del cálculo de P (12000 < X < 15000) para X ∼ N (10000, 15002 ).
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 206

d) mayor que $ 20.000,00


 
20000 − 10000
P (X > 20000) = P Z> = P (Z > 6.67) ≃ 0.
1500

2. Un estudio indica que las personas conservan sus teléfonos celulares, en promedio, 1.5
años antes de comprar uno nuevo. La desviación estándar es 0.25 años. Un usuario
de teléfono celular es seleccionado aleatoriamente. Calcule la probabilidad de que el
usuario conservará su teléfono actual por menos de 1 año antes de comprar uno nuevo.
Considere que el tiempo (años) que las personas conservan sus teléfonos sigue una
EP

distribución normal.
UD

Sea la variable aleatoria: X=“Tiempo que las personas conservan sus teléfonos (años)”,
X ∼ N (1.5, 0.252 ). Deseamos calcular, P (X < 1), entonces:
 
1 − 1.5
A
P (X < 1) = P Z < = P (Z < −2) = 0.5 − 0.47725 = 0.02275 o 2.28 %.
0.25
IM
-L

Por tanto P (X < 1) es igual a P (Z < −2) (Figura 5.14).


S
PU
M
CA

1 1.5 X
E

−2 0 Z
AD

Figura 5.14: Ilustración del cálculo de P (X < 1) para X ∼ N (1.5, 0.252 ).

3. Suponga que una vez fijado un horizonte de tiempo, la tasa de retorno de una acción
puede ser modelada como una variable aleatoria con distribución normal de media 20 %
y desviación estándar de 2 %. Suponga también que la tasa de retorno de un tı́tulo de
renta fija es de 17 %. Entonces la acción es en promedio mas rentable que el tı́tulo,
-I I

aunque esté más sujeta a riesgo. ¿Cuál es la probabilidad de que el retorno de la acción
22

exceda al del tı́tulo?


20

Sea la variable aleatoria: X=“Tasa de retorno de la acción ( %)”, X ∼ N (20, 22 ).


Deseamos calcular, P (X > 17), entonces:
 
17 − 20
P (X > 17) = P Z > = P (Z > −1.5) = 0.43319 + 0.5 = 0.93319 o 93.32 %.
2
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 207

Por tanto P (X > 17) es igual a P (Z > −1.5) (Figura 5.15).

17 20 X
EP
UD

−1.5 0 Z
A
IM

Figura 5.15: Ilustración del cálculo de P (X > 17) para X ∼ N (20, 22 ).


S -L
PU

4. Una encuesta indica que, para cada ida al supermercado, un consumidor permanece
en el establecimiento en promedio 45 minutos, con varianza de 144 minutos2 . Asuma
M
CA

que el tiempo de permanencia en el establecimiento está distribuı́do normalmente. Si


un consumidor entra en la tienda.

a) ¿Cuál es la probabilidad de que se quede en el establecimiento entre 24 y 54


minutos?
Sea la variable aleatoria: X=“Tiempo de permanencia en el establecimiento
(minutos)”, X ∼ N (45, 122 ). Deseamos calcular, P (24 < X < 54), entonces:
 
24 − 45 X − 45 54 − 45
P (24 < X < 54) = P < <
12 12 12
E
AD

= P (−1.75 < Z < 0.75)


= 0.45994 + 0.27337 = 0.73331 o 73.33 %.

Por tanto P (24 < X < 54) es igual a P (−1.75 < Z < 0.75) (Figura 5.16 a)).
b) ¿Cuál es la probabilidad de que se quede más de 39 minutos? Deseamos calcular,
P (X > 39), entonces:
 
39 − 45
P (X > 39) = P Z > = P (Z > −0.5) = 0.19146 + 0.5 = 0.69146 o 69.15 %.
12
-I I
22

Por tanto P (X > 39) es igual a P (Z > −0.5) (Figura 5.16 b)).
20

c) Interprete su respuesta cuando 200 consumidores entran en el establecimiento.


¿Cuántos consumidores espera que estuvieran en la tienda para cada intervalo de
tiempo de los apartados a) y b)?
Cuando 200 consumidores entran en el supermercado, esperamos que en el caso del
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 208

24 45 54 X 39 45 X
EP
UD

−1.75 0 0.75 Z −0.5 0 Z

a) b)
A
Figura 5.16: Ilustración del cálculo de a) P (24 < X < 54) y b) P (X > 39) para X ∼ N (45, 122 ).
IM
-L

apartado a), 200×0.7333 = 146.662 o aproximadamente 147 clientes permanezcan


S

en la tienda entre 24 e 54 minutos y para el caso del apartado b), 200×0.69146


PU

= 138.292 o aproximadamente 138 clientes permanezcan en la tienda más de 39


M

minutos.
CA

d) ¿Cuál es la probabilidad de que se quede menos de 30 minutos o más de 51


minutos?

P (X < 30 o X > 51) = P (X < 30) + P (X > 51)


   
30 − 45 51 − 45
=P Z< +P Z >
12 12
= P (Z < −1.25) + P (Z > 0.50)
= (0.5 − 0.39435) + (0.5 − 0.19146)
E

= 0.10565 + 0.30854 = 0.41419 o 41.42 %.


AD

Por tanto P (X < 30 o X > 51) es igual a P (Z < −1.25 o Z > 0.5) (Figura
5.17).

5. El tiempo en minutos que a una persona le demanda realizar determinada tarea


sigue una distribución normal con media µ y desviación estándar σ. Se sabe que la
probabilidad de que la tarea se ejecute en 70 minutos como máximo es 0.75, y la
probabilidad de que la tarea se ejecute en un máximo de 50 minutos es 0.30.
-I I

a) Determine los valores de µ y σ.


22

Sea la variable aleatoria: X=“Tiempo que le demanda a una persona realizar


20

determinada tarea (minutos)”, X ∼ N (µ, σ 2 ). Como sabemos que P (X ≤ 70) =


0.75 y P (X ≤ 50) = 0.30, se deduce la ubicación de los valores 50 y 70 en el eje de
la variable aleatoria X como se muestra en la Figura 5.18. Ası́ también designamos
los correspondientes valores de Z: z1 y z2 .
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 209
EP

30 45 51 X
UD

A
IM
S -L
PU
M
CA

−1.25 0 0.5 Z

Figura 5.17: Ilustración del cálculo de P (X < 30 o X > 51) para X ∼ N (45, 122 ).

Ahora, vamos a la Tabla de Distribución normal estándar (TDNE) para saber que
valor de Z es el correspondiente al área de 0.25. Note que según la TDNE para
Z=0.67 el área correspondiente es 0.24857 y para Z=0.68 el área correspondiente
es 0.25175, entonces deducimos que un área de 0.25 será la correspondiente a un
E
AD

valor de Z entre 0.67 y 0.68. Pero, ¿Qué valor de Z tomaremos?, el criterio que
usaremos simplemente será tomar el valor de Z que defina el área más próxima a
la solicitada de 0.25. En este caso el área más próxima es 0.24857, ası́ el valor de
Z a emplear será 0.67. Entonces en la Figura tendremos que z2 = 0.67.
Ahora buscamos en la TDNE el área de 0.20 para saber qué valor de Z le
corresponde. Usando el mismo criterio, se deduce que aproximadamente un área
de 0.20 será la correspondiente a un valor de Z=0.52. Luego en la Figura 5.18
tendremos que por simetrı́a z1 = −0.52. Con la información obtenida definimos:
-I I

50 − µ
22

−0.52 =
σ
20

70 − µ
0.67 = ,
σ

el cual es un sistema de dos ecuaciones con dos incógnitas, µ y σ. Resolviendo el


CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 210

0,20

0,25

0,30
EP

50 µ 70 X
UD

0,20 A
IM
-L

0,25
S
PU

0,30
M
CA

z1 0 z2 Z

Figura 5.18: Ubicación de los valores X = 50 y X = 70 para que se cumpla que P (X ≤ 70) = 0.75 y
P (X ≤ 50) = 0.30.

sistema tenemos µ=58.74 y σ=16.81, ambos en minutos.


b) Si se selecciona una persona al azar y resulta que necesita más de 75 minutos para
ejecutar la tarea ¿Cuál es la probabilidad de que ejecute la tarea en más de 85
E

minutos?
AD

Tenemos que calcular una probabilidad condicional, a saber,

P (X > 85 y X > 75) P (X > 85)


P (X > 85 | X > 75) = = =
P (X > 75) P (X > 75)
 
85 − 58.74
P Z>
16.81 P (Z > 1.56)
=  = =
75 − 58.74 P (Z > 0.97)
P Z>
16.81
0.5 − 0.44062
-I I

= = 0.3577 o 35.77 %
0.5 − 0.33398
22
20

5.7. Aproximación normal para la distribución binomial


Sea X una variable aleatoria con distribución binomial de parámetros n y p, X ∼ b(n, p),
por lo tanto E(X) = µ = n × p y V ar(X) = σ 2 = n × p × (1 − p). Resulta que a medida
que n aumenta, la distribución binomial toma aproximadamente la misma forma que una
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 211

distribución normal con media µ = n × p y varianza σ 2 = n × p × (1 − p).


Esta aproximación es suficientemente precisa siempre que n × p ≥ 5 y n × (1 − p) ≥ 5,
por lo tanto, la aproximación puede no ser muy buena (incluso para valores grandes de n) si
la probabilidad de éxito p está muy cerca de cero o uno.
Otro ajuste importante es el hecho de que la distribución binomial utiliza valores discretos
y la distribución normal utiliza valores continuos. Por lo tanto si vamos a utilizar una
distribución continua (normal) para aproximar un problema discreto (binomial) es necesario
realizar una corrección por continuidad.
EP

5.7.1. Factor de corrección por continuidad


Cuando aproximamos una distribución binomial mediante una distribución normal,
UD

estamos convirtiendo una variable X discreta (toma un número determinado de valores en un


intervalo) en una variable continua X ′ (toma infinitos valores en un intervalo). Esa conversión
se manifiesta sumando o restando 0.5 (factor de corrección) al valor de la variable aleatoria
A
discreta dependiendo de la probabilidad solicitada. En la Tabla 5.1 se presentan algunas
IM

situaciones.
S -L

Binomial Aproximación normal Observación


PU


P (X = c) P c − 0.5 < X ′ < c + 0.5 Para que incluya a “c”
M


P (X > c) P X ′ > c + 0.5 Para que no incluya a “c”
CA


P (X ≥ c) P X ′ > c − 0.5 Para que incluya a “c”

P (X < c) P X ′ < c − 0.5 Para que no incluya a “c”

P (X ≤ c) P X ′ < c + 0.5 Para que incluya a “c”

P (a ≤ X ≤ b) P a − 0.5 < X ′ < b + 0.5 Para que incluya “a” y “b”

P (a < X < b) P a + 0.5 < X ′ < b − 0.5 Para que no incluya “a” y “b”

P (a < X ≤ b) P a + 0.5 < X ′ < b + 0.5 Para que no incluya “a” pero si “b”

E

P (a ≤ X < b) P a − 0.5 < X ′ < b − 0.5 Para que incluya “a” pero no “b”
AD

Tabla 5.1: Casos de probabilidades binomiales y cómo aplicar el factor de corrección por continuidad
al utilizar la aproximación normal. Recuerde que a, b y c son números enteros.
-I I
22
20
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 212

A continuación se presenta el siguiente ejercicio para comprender mejor cuándo utilizar


la aproximacion estudiada.

Ejercicio resuelto.
Basados en la experiencia se sabe que el 40 % de los clientes de la estación de servicio
automotriz “M illenium” pagan sus compras con tarjeta de crédito. Si se selecciona una
muestra aleatoria de 200 clientes, ¿cuál es la probabilidad de que

a) Al menos 75 paguen con tarjeta de crédito?


EP

Sea la variable aleatoria: X=“número de clientes que pagan sus compras con tarjeta de
UD

crédito”. Esta variable tiene las caracterı́sticas para considerar que X sigue distribución
binomial con parámetros n = 200 y p = 0.4, X ∼ b(200, 0.4). Lo que nos piden calcular
es: A
P (X ≥ 75) = P (X = 75) + P (X = 76) + . . .
IM

200! 200!
= × 0.475 × 0.6125 + 0.476 × 0.6124 + . . .
-L

75! × 125! 76! × 124!


S
PU

Claramente demandarı́a mucho trabajo realizar los cálculos utilizando la distribución


binomial. Como n×p = 200×0.4 = 80 y n×(1−p) = 200×(1−0.4) = 120, son cantidades
M

mayores que 5 podemos utilizar la aproximación normal para resolver el problema


CA

binomial. Por tanto, la distribución binomial X ∼ b(200, 0.4) puede ser aproximada
por una distribución normal con µ = 200×0.4 = 80 y varianza, σ 2 = 200×0.4×0.6 = 48,
X ′ ∼ N (80, 48). Entonces utilizando el factor de corrección por continuidad y luego la
TDNE tenemos que:
 
 74.5 − 80
P (X ≥ 75) ≈ P X ′ > 74.5 =P Z> √
48
= P (Z > −0.79) = 0.28524 + 0.5 = 0.78524 o 78.52 %,
E
AD

como se aprecia en la Figura 5.19.

Concluimos entonces que la probabilidad de que al menos 75 clientes paguen sus


compras con tarjeta de crédito es 78.52 %.

b) menos de 70 paguen con tarjeta de crédito?


Se desea calcular: P (X < 70) = P (X = 69) + P (X = 68) + P (X = 67) + . . ..
Utilizando la aproximación normal y el factor de corrección por continuidad tenemos
-I I

 
 69.5 − 80
22


P (X < 70) ≈ P X < 69.5 =P Z< √ =
48
20

= P (Z < −1.52) = 0.5 − 0.43574 = 0.06426 o 6.43 %,

como se aprecia en la Figura 5.20. Concluimos entonces que la probabilidad de que


menos de 70 clientes paguen sus compras con tarjeta de crédito es 6.43 %.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 213
EP

74.5 80 X´
UD

A
IM
S -L
PU
M
CA

−0.79 0 Z

Figura 5.19: Aproximación normal a la binomial con n=200 y p=0.4. Se muestra la probabilidad de
que al menos 75 clientes paguen con tarjeta de crédito.

c) entre 68 y 73, inclusive, paguen con tarjeta de crédito?

Se desea calcular: P (68 ≤ X ≤ 73) = P (X = 68) + P (X = 69) + . . . + P (X = 73).


E

Utilizando la aproximación normal y el factor de corrección por continuidad tenemos


AD

 

 67.5 − 80 73.5 − 80
P (68 ≤ X ≤ 73) ≈ P 67.5 < X < 73.5 =P √ <Z< √ =
48 48
= P (−1.80 < Z < −0.94) =
= 0.46407 − 0.32639 = 0.13768 o 13.77 %,

como se aprecia en la Figura 5.21.


Concluimos entonces que la probabilidad de que entre 68 y 73 clientes, inclusive, paguen
-I I

sus compras con tarjeta de crédito es 13.77 %.


22
20
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 214
EP

69.5 80 X´
UD

A
IM
S -L
PU
M
CA

−1.52 0 Z

Figura 5.20: Aproximación normal a la binomial con n=200 y p=0.4. Se muestra la probabilidad de
que menos de 70 clientes paguen con tarjeta de crédito.

5.8. Otras distribuciones continuas importantes


5.8.1. Distribución Uniforme Continua
E

Dados los números reales a y b (a < b), se dice que la variable aleatoria X tiene
AD

distribución uniforme en el intervalo [a, b], si su función de densidad f (x) es dada por (ver
Figura 5.22)

 1
si a≤x≤b
f (x) = b−a
 0 en otros casos
Para indicar que la variable aleatoria X sigue una distribución uniforme continua en el
intervalo [a, b] se denota de la siguiente forma: X ∼ U (a, b).
-I I

La distribución uniforme continua es el modelo más simple de ese tipo. Como se apre-
22

cia, aparece cuando una variable toma valores dentro de un intervalo [a, b] y su función de
20

densidad permanece constante dentro de ese intervalo. Esto implica que la probabilidad de
que la variable tome valores en subintervalos de igual amplitud es la misma. La distribución
uniforme también recibe el nombre de distribución rectangular.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 215
EP

67.5 73.5 80 X´
UD

A
IM
S -L
PU
M
CA

−1.80 −0.94 0 Z

Figura 5.21: Aproximación normal a la binomial con n=200 y p=0.4. Se muestra la probabilidad de
que entre 68 y 73 clientes, inclusive, paguen con tarjeta de crédito.
E
AD

Figura 5.22: Función de densidad de X con distribución uniforme en el intervalo [a, b].
-I I
22

a+b (b − a)2
Se puede mostrar que si X ∼ U (a, b) entonces: E(X) = y V ar(X) = .
20

2 12
También no es difı́cil verificar que, en este caso, la función de distribución acumulada
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 216

F (x) está dada por (ver Figura 5.23)




 0 si x<a
 x−a
F (x) = si a ≤ x < b

 b−a

1 si x≥b
EP
UD

A
IM
S -L
PU
M
CA

Figura 5.23: Función de distribución acumulada de una variable aleatoria X con distribución uniforme
en el intervalo [a, b].

Ejercicios resueltos.

1. Una empresa tiene una curva de costes que viene dada por la siguiente función:
C = 100+2X, donde X es la demanda. En el mercado vende cada unidad de su producto
a 5 dólares. Si la empresa considera que la demanda se distribuye uniformemente en el
intervalo [250, 300].
E

a) ¿Cuál serı́a el beneficio esperado?


AD

Sea la variable aleatoria: X=“Demanda en el intervalo [250, 300]”. Esta variable


se distribuye uniformemente, X ∼ U (250, 300), por lo que su función de densidad
f (x) es dada por

 1
si 250 ≤ x ≤ 300
f (x) = 300 − 250
 0 en otros casos

El beneficio será B = Ingresos − Costes = 5X − (100 + 2X) = 3X − 100. El


-I I

beneficio esperado será:


22
20

E (B) = E (3X − 100) = 3E (X) − 100.

a+b 250 + 300


Dado que X se distribuye uniformemente: E(X) = µ = = = 275
2 2
unidades, de manera que E (B) = 3E (X) − 100 = 3 × 275 − 100 = 725 dólares.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 217

b) ¿Cuál es la probabilidad de que la demanda esté entre 260 y 280 unidades?


La probabilidad de que X se encuentre entre 260 y 280 es igual al área bajo f (x)
entre 260 y 280. Ya que calcular el área del rectángulo formado es sencillo, tenemos

280 − 260
P (260 ≤ X ≤ 280) = = 0.40 o 40 %.
300 − 250

Podrı́amos haber llegado al mismo resultado si hubiéramos utilizado la función


densidad como en (5.1) para calcular la probabilidad (área)
Z
EP

280
1 1
P (260 ≤ X ≤ 280) = dx = × (280 − 260) = 0.40 o 40 %.
300 − 250 300 − 250
UD

260

Este cálculo también podrı́a haber sido realizado usando la función de distribución
acumulada, siguiendo la expresión (5.5) tenemos
A
280 − 250 260 − 250 20
IM

P (260 ≤ X ≤ 280) = F (280)−F (260) = − = = 0.40 o 40 %.


300 − 250 300 − 250 50
-L

2. Elena es alumna de Administración y todos los dı́as va en ómnibus hasta el Campus


S
PU

Lima de la Udep. Hay solamente un ómnibus que le sirve y suele pasar por el paradero,
cercano a su casa, en cualquier instante entre las 7 am. y las 7:30am. Si en un cierto dı́a
M

Elena llega al paradero a las 7:24am, ¿cuál es la probabilidad de que ella pueda tomar
CA

el ómnibus?
Sea X el instante de la llegada del ómnibus al paradero. Note que la uniformidad de X
está implı́cita en el enunciado. Entonces X ∼ U (0, 30), donde X es medida en minutos
y 0 (cero) corresponde a las 7 am. Para que Elena pueda tomar el ómnibus, este debe
llegar después de las 7:24am. (o sea, entre 7:24 y 7:30 am.).
6
Tenemos que P (X > 24) = P (24 < X ≤ 30) = = 0.20 o 20 %.
30

5.8.2. Distribución exponencial


E
AD

Sea λ una constante positiva, decimos que la variable aleatoria X sigue una distribución
exponencial con parámetro λ, si su función de densidad es dada por
(
0 si x < 0
f (x) =
λe−λx si x ≥ 0
Para indicar que la variable aleatoria X sigue una distribución exponencial con parámetro
λ se denota de la siguiente forma: X ∼ Exp (λ).
-I I

En la Figura 5.24 se muestra la función de densidad de la variable X con distribución


22

exponencial con parámetro λ = 0.5.


20

1 1
Se puede mostrar que si X ∼ Exp (λ) entonces: E(X) = y V ar(X) = 2 . Esto es,
λ λ
1
tanto la media como la desviación estándar de la distribución exponencial son iguales a .
λ
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 218

0.5

0.4

0.3

f(x)
0.2
EP

0.1
UD

0.0

0.0 2.5 5.0 7.5 10.0


x
A
IM

Figura 5.24: Función de densidad de X con distribución exponencial con parámetro λ = 0.5.
S -L
PU

También no es difı́cil verificar que la función de distribución acumulada F (x) está dada
por
M

(
0 si x < 0
CA

F (x) =
1 − e−λx si x ≥ 0
En la Figura 5.25 se muestra la función de distribución acumulada de la variable X con
distribución exponencial con parámetro λ = 0.5.

1.00
E

0.75
AD
F(x)

0.50

0.25
-I I
22

0.00
20

0.0 2.5 5.0 7.5 10.0


x

Figura 5.25: Función de de distribución acumulada de la variable X con distribución exponencial con
parámetro λ = 0.5.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 219

La distribución exponencial es un modelo que se emplea con frecuencia para modelar:

La distribución del tiempo de espera hasta la ocurrencia de un suceso de Poisson.

Tiempo transcurrido entre la presentación de sucesos consecutivos de Poisson.

La duración de vida de ciertos elementos que puede considerarse como el tiempo que
transcurre hasta que se produce la extinción, averı́a, falla, etc.

Una caracterı́stica importante de la distribución exponencial es la propiedad conocida


como “pérdida de memoria”. Esto significa que el tiempo transcurrido desde cualquier
EP

instante dado t0 hasta que ocurre un evento, no depende de lo que haya ocurrido antes del
UD

instante t0 . Matemáticamente, dados t0 y t1 , ambos reales positivos, la “pérdida de memoria”


se refleja mediante la expresión:

P (T > t0 + t1 | T > t0 ) = P (T > t1 ) (5.15)


A
IM

Esto se demuestra desarrollando la probabilidad condicional:


S -L

P (T > t0 + t1 y T > t0 ) P (T > t0 + t1 )


PU

P (T > t0 + t1 | T > t0 ) = = =
P (T > t0 ) P (T > t0 )

M

1 − F (t0 + t1 ) 1 − 1 − e−λ(t0 +t1 ) e−λ(t0 +t1 )


= = = =
CA

1 − F (t0 ) 1 − (1 − e−λt0 ) e−λt0


= e−λt1 = P (T > t1 ) .

Relación entre la distribución exponencial y la distribución de Poisson

Como se comentó anteriormente, la distribución exponencial se utiliza frecuentemente


como modelo para la distribución de los tiempos entre la ocurrencia de eventos sucesivos,
tales como clientes llegando a una unidad de atención o llamadas en una central telefónica. El
motivo de esto es que la distribución exponencial está fuertemente relacionada con el proceso
E

de Poisson discutido en el capı́tulo 4. Para comprender un poco más la relación entre estas
AD

distribuciones se presenta la siguiente proposición.

Proposición. Sea X que el número de eventos que se producen en un intervalo de tiempo de


duración t tiene distribución de Poisson con parámetro λt (donde λ, es el número esperado
de eventos que ocurren en una unidad de tiempo). Entonces la distribución de T, el tiempo
transcurrido entre la ocurrencia de dos eventos sucesivos, es exponencial con parámetro λ.

De hecho, suponga que X ∼ P (λt). Entonces, X=0 (es decir, no ocurre ningún evento en
-I I

el intervalo (0, t) si y sólo si T > t). Por tanto, P (X = 0) = P (T > t). Osea
22

e−λt × (λt)0
20

P (T > t) = P (X = 0) = = e−λt .
0!

Entonces, F (t) = P (T ≤ t) = 1 − e−λt . Como esta es la función de distribución acumulada


de una distribución exponencial, concluimos que T ∼ Exp (λ).
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 220

Por tanto, la distribución exponencial se aplica a las mismas situaciones que la distribu-
ción de Poisson, siendo que la exponencial modela el tiempo entre ocurrencias y la Poisson
modela el conteo de esas ocurrencias.

Ejercicios resueltos.

1. El tiempo que transcurre antes de que una persona sea atendida en una cafeterı́a es una
variable aleatoria que tiene una distribución exponencial con una media de 4 minutos.
¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3
EP

minutos en al menos 4 de los 6 dı́as siguientes?


UD

Sea la variable aleatoria: T=“tiempo que transcurre antes de que una persona sea
atendida en una cafeterı́a (min)”. Esta variable se distribuye exponencialmente con
1
parámetro λ, T ∼ Exp(λ). Según el enunciado E(T ) = = 4, por lo tanto λ = 0.25.
λ
Luego la función de densidad f (t) es dada por
A
IM

(
0 si t < 0
-L

f (t) =
0.25e−0.25t si t ≥ 0
S
PU

Ahora calculamos la probabilidad de que una persona sea atendida antes de que
M

transcurran 3 minutos (en un dı́a cualquiera)


CA

Z 3 3

P (T < 3) = 0.25e−0.25t dt = −e−0.25t = 0.5276 o 52.76 %.
0 0

Definimos ahora la variable aleatoria: X=“número de dı́as en que un cliente es atendido


antes de que transcurran 3 minutos”, siendo que X puede tomar los valores: 0,1,2,3,4,5,6.
Claramente la variable X es una variable binomial con parámetros: n = 6 y p = 0.5276,
X ∼ B(6, 0.5276), y lo que piden calcular es
E

P (X ≥ 4) = P (X = 4) + P (X = 5) + P (X = 6)
AD

6! 6!
= × 0.52764 × 0.47242 + × 0.52765 × 0.47241 +
4! × 2! 5! × 1!
6!
+ × 0.52766 × 0.47240
6! × 0!
= 0.2594 + 0.1159 + 0.0216 = 0.3969 o 39.69 %.

2. Suponga que el tiempo que necesita el cajero automático de un banco para atender a
un cliente tiene un distribución exponencial con una media de 40 segundos.
-I I

a) ¿Cuál es la probabilidad que el tiempo necesario para atender un cliente dado sea
22

más de 1.5 minutos?


20

Sea la variable aleatoria: T=“tiempo necesario para atender a un cliente (seg.)”.


Esta variable se distribuye exponencialmente con parámetro λ, T ∼ Exp(λ). Según
1 1
el enunciado E(T ) = = 40, por lo tanto λ = . Luego la función de densidad
λ 40
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 221

f (t) es dada por 


 0 si t < 0
f (t) = 1 −t
 e 40 si t ≥ 0
40
La probabilidad solicitada es P (T > 90) (1.5 minutos es igual a 90 segundos),
entonces tenemos
Z +∞ Z 90
1 −t 1 −t t 90
− 40
P (T > 90) = e 40 dt = 1 − e 40 dt = 1 + e =
90 40 0 40 0
 90 
− 40 0 − 94
EP

= 1+ e − e = e = 0.1054 o 10.54 %.
UD

b) ¿Cuál es la probabilidad que el tiempo necesario para atender a un cliente esté


comprendido entre 1 y 2 minutos?
La probabilidad solicitada es P (60 < T < 120). Para este cálculo podemos utilizar
A
tanto la función de densidad o la función de distribución acumulada. La función
IM

de distribución acumulada F (t) es dada por


-L

(
0 si t < 0
S

F (t) =
PU

t
− 40
1−e si t ≥ 0
M

Empleando F (t) como en (5.5) tenemos


CA

 120
  60

P (60 < T < 120) = F (120) − F (60) = 1 − e− 40 − 1 − e− 40 =
3
= e− 2 − e−3 = 0.1733 o 17.33 %.

Si hubiéramos utilizado la función densidad procederı́amos como en (5.1)


Z 120
1 −t
P (60 < T < 120) = e 40 dt,
60 40
E

obteniendo el mismo resultado.


AD

c) ¿Cuál es la probabilidad que el tiempo necesario para atender un cliente dado sea
menor de 50 segundos?
La probabilidad solicitada es P (T < 50). Empleando por ejemplo F (t) tenemos
 50

P (T < 50) = F (50) = 1 − e− 40 = 0.7135 o 71.35 %.

Si hubiéramos utilizado la función densidad serı́a


Z 50
-I I

1 −t
P (T < 50) = e 40 dt,
40
22

0
20

obteniendo el mismo resultado.


d) Si el cajero lleva atendiendo a un cliente más de 30 segundos, ¿cuál es la
probabilidad de que el cliente sea atendido en más de 55 segundos?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 222

Tenemos que calcular una probabilidad condicional, a saber,

P (T > 55 y T > 30) P (T > 55)


P (T > 55 | T > 30) = = =
P (T > 30) P (T > 30)
 
− 55
1 − F (55) 1 − 1 − e 40

= =  =
1 − F (30) 1 − 1 − e− 40
30

55
e− 40 25
= = e− 40 = 0.5353 o 53.53 %.
− 30
e 40
EP

Si nos hemos percatado, lo que hemos aplicado en realidad es la propiedad de pérdi-


UD

da de memoria, expresión (5.15), ası́ la probabilidad solicitada P (T > 55 | T > 30)


se podrı́a calcular directamente mediante P (T > 25).

3. En promedio, por un paradero de ómnibus poco transitado, pasan 3 ómnibus por hora
A
distribuidos según un proceso Poisson. ¿Cuál es la probabilidad de tener que esperar
IM

un ómnibus por más de 20 minutos?


-L

Sea la variable aleatoria: X=“Número de ómnibus que llegan a un paradero”. Esta


S

ómnibus
PU

variable se distribuye según Poisson con media λ = 3 o equivalentemente


hora
ómnibus
M

λ = 0.05 . Entonces la variable aleatoria: T=“tiempo de espera hasta llegar


minuto
CA

un ómnibus (minutos)” se distribuye exponencialmente con parámetro 0.05, ası́ T ∼


Exp(0.05). Por tanto, la probabilidad de esperar la llegada de un ómnibus por más de
20 minutos es
Z +∞ 20 Z 20
−0.05t
P (T > 20) = 0.05e
dt = 1 − 0.05e−0.05t dt = 1 + e−0.05t =
20 0 0
−0.05×20 0
 −1
= 1+ e − e = e = 0.3679 o 36.79 %.

4. En una tela, las fallas se distribuyen según un proceso Poisson, a razón de 1 falla cada
15 metros. ¿Cuál es la probabilidad de que la distancia entre la 4a falla y la 5a falla sea
E
AD

mayor a un metro?
Sea la variable aleatoria: X=“Número de fallas en una tela”. Esta variable se distribuye
1 f alla
según Poisson con media λ = . Entonces la variable aleatoria: D=“distancia
15 metros
1
entre fallas consecutivas” se distribuye exponencialmente con parámetro , ası́ T ∼
  15
1
Exp . Por tanto, la probabilidad de que la distancia entre la 4a falla y la 5a falla
15
sea mayor a un metro es
Z Z 1
-I I

+∞
1 −t/15 1 −t/15 1

P (D > 1) = e dt = 1 − e dt = 1 + e−t/15 =
22

1 15 0 15 0
 
20

= 1 + e−1/15 − e0 = e−1/15 = 0.9355 o 93.55 %.


CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 223

5.9. Problemas propuestos


1. El tiempo que espera un cliente para ser atendido en una agencia bancaria, expresado
en minutos, es una variable aleatoria continua cuya función de densidad es:

 1

 15 si 0 < x < 15
f (x) =



0 en otros casos
EP

Si se elige un cliente al azar ¿Cuál es la probabilidad de que el tiempo de espera esté


entre 12 y 14 minutos?
UD

2. La variable X=“longitud (en centı́metros) a la que queda del centro de un tablero, un


dardo al ser lanzado por una persona”, se observó que tenı́a por función de densidad
f(x): (
A
k si 0 ≤ x < 10
IM

f (x) =
0 en otros casos
-L

Se pide:
S
PU

a) Hallar k para que f (x) sea función de densidad y grafı́quela.


M

b) Hallar la función de distribución y grafı́quela.


CA

c) Hallar la media, varianza y desviación estándar o tı́pica.


d) Hallar P (X ≤ 1).

3. Sea X una variable aleatoria con función de densidad dada por:



2

 ax si 0≤x<1
f (x) = 2
a(2 − x) si 1≤x<2


0 en otros casos
E

Hallar:
AD

a) El valor de a.
b) La media y la desviación estándar de x.
c) La función de distribución.
d) Sabiendo que X < 1.75, calcule la probabilidad de que X sea mayor que 1.5.

4. Dada la siguiente función:


-I I



 x si 0≤x<1
22

f (x) = 2 − x si 1≤x<2
20



0 en otros casos

Compruebe si f (x) es una función densidad.


CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 224

5. Dada la siguiente función:



 1

 49 (7 + x) si −7 ≤ x ≤ 0
f (x) =
 a(7 − x)

si 0<x≤7

0 en otros casos

a) Calcular a para que f (x) sea función de densidad.


b) Calcular la media de la variable aleatoria.
EP

6. Sea X una variable aleatoria continua cuya función de distribución es:



UD


 0 si x≤0
F (x) = 3
kx si 0 < x ≤ 2


1 si x>2
A
a) ) Calcular k para que F (x) sea una verdadera función de distribución.
IM

 
1 3
b) ) Calcular P <x< .
-L

2 2
S

c) ) Calcular la función de densidad.


PU

d) ) Calcular la esperanza y varianza de la variable aleatoria.


M
CA

7. Una variable aleatoria tiene como función de densidad:


(
1 − mx si 2≤x≤4
f (x) =
0 en otros casos

a) Determinar m para que f (x) sea función de densidad.


b) Hallar la función de distribución.
1
c) Hallar aquel valor de a para que P (X ≤ a) = .
4
d) Calcular la esperanza de X.
E
AD

8. La función de densidad de una variable aleatoria X viene dada por:


(
kx2 (1 − x) si 0≤x≤1
f (x) =
0 en otros casos

a) Calcula el valor k para que f (x) sea una función de densidad.


b) Calcular la función de distribución.
c) Calcular la media y la varianza.
-I I

d) Calcular P (0.3 < x < 0.7).


22

9. Sea X una variable aleatoria continua con función de densidad


20



 a(1 + x) si 0<x≤1

2
f (x) = si 1<x≤2

 3

0 en otros casos
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 225

Se pide:

a) Valor de a para que f (x) sea función de densidad.


b) Hallar la función de distribución
c) Calcular P (0.5 < x < 1.5).

10. Dada la variable aleatoria continua, X, con función de densidad,


(
m(x + 2) si 0≤x≤4
f (x) =
EP

0 en otros casos
UD

Hallar:

a) El valor de m para que f (x) sea realmente una función de densidad.


b) La función de distribución.
A
IM

c) La media y la varianza.
d) P (2 ≤ x ≤ 3).
S -L
PU

11. La función de densidad de una variable aleatoria es,


(
M

ax2 + b si 0≤x≤2
f (x) =
CA

0 en otros casos
 
1
Sabiendo que P <x<1 = 0.1357, determinar a y b.
2
12. La cantidad de pan (en cientos de kilos) que se vende diariamente en una panaderı́a
del distrito donde Ud. vive, es una variable aleatoria X cuya función de densidad es:


 Ax si 0≤x<5
f (x) = A(10 − x) si 5 ≤ x ≤ 10


E

0 en otros casos
AD

a) Calcular el valor de la constante A para que f(x) sea una función de densidad.
b) Calcule la probabilidad de que, en un dı́a cualquiera, se vendan entre 240 y 715
kg. de pan.
c) Calcule la probabilidad de que, en un dı́a cualquiera, se vendan más de 350 kg. de
pan.
d) Calcule la probabilidad de que, en un dı́a cualquiera, se vendan menos de 830 kg.
-I I

de pan.
22

e) Si elegimos un dı́a al azar y resulta que ese dı́a se vendieron menos de 725 kg. de
20

pan ¿Cuál es la probabilidad de que se haya vendido más de 450 kg?


f) Si se eligen al azar 5 dı́as de ventas ¿Cuál es la probabilidad de que por lo menos
en 3 de ellos se haya vendido entre 240 y 715 kg. de pan?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 226

g) Calcule e interprete la venta diaria promedio y la desviación estándar de la venta


diaria de pan.
h) Si W = 4X − 1. Calcule E(W ).
i) ¿Cuál es la probabilidad de que, en un dı́a cualquiera, se haya vendido 325 kg de
pan?
j) Halle la función de distribución F (x), empleando el análisis visto en clase.

13. Ciertos estudios demuestran que el consumo de gasolina tiene una distribución normal
EP

con un consumo medio de 25.5 Km. por galón y una desviación estándar de 4.5 km.
por galón.
UD

a) ¿Qué porcentaje de autos medianos obtienen 30 o más km. por galón?


b) Si un fabricante desearı́a producir un automóvil mediano que tenga un mejor
rendimiento que el 97,5 % de los automóviles medianos existentes, ¿Cuántos
A
IM

kilómetros por galón debe recorrer este nuevo auto?


-L

14. La lluvia estacional media anual en cierto poblado es de 18.75 pulgadas, con una
S

desviación estándar de 6.50 pulgadas. Se supone que la lluvia estacional tiene una
PU

distribución normal. ¿En cuántos años, de un perı́odo de 50, se podrá esperar una
M

lluvia de 15.00 a 25 pulgadas?


CA

15. Los salarios de los trabajadores en cierta industria son en promedio 11.90 dólares por
hora, y la desviación estándar es de 0.40 dólares. Si se supone que los salarios tienen
una distribución normal:

a) ¿Qué porcentaje de trabajadores recibe salarios inferiores a 11,00 o superiores a


12,90 dólares por hora?
b) ¿Cuál debe ser el salario por hora si sólo 10 % de los trabajadores de esta industria
ganan más?
E

c) ¿Cuál debe ser el salario por hora si 19,5 % de los trabajadores de esta industria
AD

ganan menos?

16. Un abogado se traslada diariamente de su casa en los suburbios a su oficina en el centro


de la ciudad. En promedio el viaje le toma 24 minutos con una desviación estándar de
3.8 minutos. Asuma que la distribución de los tiempos de traslado está normalmente
distribuida.

a) ¿Cuál es la probabilidad de que un traslado le tome menos de media hora?


-I I

b) Si la oficina abre a las 9:00 am y él sale de su casa a las 8:45 am diariamente,
22

¿Qué porcentaje de las veces llega tarde a su trabajo?


20

c) Si deja su casa a las 8:35 am y en la oficina se sirve un café entre las 8:50 y las
9:00 am,¿Cuál es la probabilidad de que se pierda el café?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 227

17. La variable X sigue distribución normal con media µ y desviación estándar σ. Se sabe
que la media de X es cinco veces su desviación estándar y que la P (X ≤ 6) = 0.84134.
Mostrando el planteamiento y los cálculos respectivos halle la media y la desviación
estándar de X.

18. Los rectores de universidades americanas reciben una prestación para vivienda que, en
promedio es de 26234 dólares anuales. Suponga que se aplica una distribución normal
a las compensaciones, y que la desviación estándar es de 5000 dólares.

a) ¿Qué porcentajes de los rectores de universidades recibe una compensación anual


EP

de vivienda mayor de 35000 dólares?


UD

b) ¿Qué porcentaje recibe una compensación anual menor de 20000 dólares?


c) ¿Cuál es la compensación anual que corresponde al 10 % de los rectores de
universidades que recibe las compensaciones más altas?
A
19. Una máquina expendedora de refresco se ajusta para servir 7.00 onzas del lı́quido por
IM

vaso. La desviación estándar es de 0.10 onzas. Suponga que las cantidades de refresco
-L

vertidas por la máquina siguen una distribución normal.


S
PU

a) ¿Cuál es la probabilidad de que la máquina sirva entre 7.10 y 7.25 onzas?


M

b) ¿Cuál es la probabilidad de que la máquina sirva 7.25 onzas o más?


CA

c) ¿Cuál es la probabilidad de que la máquina sirva entre 6.8 onzas y 7.25 onzas?
d) ¿Cuánto refresco se sirve en el máximo 1 % de las bebidas?

20. Un productor de jugo de naranja compra todas sus naranjas en un huerto. La cantidad
de jugo que se exprime de cada naranja tiene una distribución normal aproximada con
una media de 4.70 onzas y una desviación estándar de 0.40 onzas.

a) ¿Cuál es la probabilidad de que una naranja seleccionada al azar contenga entre


4.70 y 5.00 onzas de jugo?
E

b) ¿Cuál es la probabilidad de que una naranja seleccionada al azar contenga entre


AD

5.00 y 5.50 onzas de jugo?

21. Suponga se ha encontrado que el nivel de llenado de unas botellas de refresco tiene
una distribución normal con media de 2.0 litros y desviación estándar de 0.05 litros.
Las botellas que contienen menos de 95 % del contenido neto anunciado (1.90 litros
en este caso) pueden causar una multa al fabricante por parte de la oficina estatal de
protección al consumidor, mientras que las botellas que contienen un contenido neto
mayor que 2,10 litros pueden provocar un derrame del exceso al abrirlas.
-I I
22

a) ¿Qué proporción de botellas contendrá entre 1.90 y 2.10 litros?


20

b) ¿Qué proporción de botellas contendrá menos de 1.90 litros o más de 2.10 litros?
c) ¿Qué proporción de botellas contendrá entre 2.05 y 2.10 litros?
d) ¿Entre qué dos valores (con distribución simétrica) se espera encontrar el contenido
del 99 % de las botellas?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 228

22. Las ventas anuales (en unidades monetarias, u.m.) de novelas policı́acas se distribuyen
normalmente con media y desviación estándar desconocidas. Un 40 % de las veces, las
ventas son por más de 470000 u.m. y 10 % de las veces son por más de 500000 u.m.
¿Cuál es el valor de la media y el de la desviación estándar?

23. Los salarios anuales de los ejecutivos de mandos medios en una compañı́a están
distribuidos normalmente, con una desviación estándar de $ 1200. Se tiene programado
un recorte de personal que implica el despido de aquellos que ganen menos de $ 18000. Si
tal medida representa el 9 % de los ejecutivos de mandos medios, ¿Cuál es actualmente
EP

el salario medio de este grupo de funcionarios?


UD

24. Los resultados de una prueba objetiva de selección pasada a 200 personas indicaron que
la distribución de puntuaciones era normal, con media 60 puntos y desviación estándar
de 6 puntos.
A
a) ¿Cuántos examinados han sacado más de 63 puntos?
IM

b) ¿Cuántos examinados han obtenido una puntuación entre 55 y 61 puntos?


-L

c) ¿Cuál es la puntuación por debajo de la cual están el 67 % de los examinados?


S
PU

25. Tras aplicar un test de cultura general se observa que las puntuaciones obtenidas siguen
M

una distribución normal con media de 65 puntos y una varianza de 324 puntos2 . Se desea
CA

clasificar a los examinados en tres grupos (de baja cultura general, de cultura general
aceptable y de excelente cultura general) de modo que haya en el primero un 19.5 % de
la población, un 65.5 % en el segundo y un 15 % en el tercero. ¿Cuáles han de ser las
puntuaciones que marcan el paso de un grupo al otro?

26. El tiempo necesario para terminar un examen final en determinado curso se distribuye
normalmente con 80 minutos de media y 10 minutos de desviación estándar. Con estos
datos conteste lo siguiente:

a) ¿Cuál es la probabilidad de terminar el examen en una hora o menos?


E
AD

b) ¿Cuál es la probabilidad de que un alumno termine el examen en más de 60


minutos, pero en menos de 75 minutos?
c) Suponga que en el grupo hay 60 alumnos, y que el tiempo del examen es de 90
minutos. ¿Cuántos alumnos espera que no puedan terminar el examen en el tiempo
indicado?

27. El Banco del Perú está revisando sus cobros por servicios y su polı́tica de pago de
intereses en las cuentas corrientes. El banco ha encontrado que el balance promedio
diario en las cuentas personales es de $55, con una desviación estándar de $15. Además,
-I I
22

se encontró que los balances promedio diarios se distribuyen normalmente.


20

a) ¿Qué porcentaje de las cuentas corrientes de los clientes tienen balances promedios
diarios mayores de $80?
b) ¿Qué porcentaje de las cuentas corrientes de los clientes tienen balances promedios
diarios menores de $70?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 229

c) El banco está considerando pagar intereses a clientes que tengan balances promedio
diarios mayores que cierta cantidad. Si el banco no quiere pagar intereses a más
del 15 % de sus clientes, cual es el monto mı́nimo del balance promedio diario al
cual está dispuesto a pagar intereses?

28. Una compañı́a produce focos de luz cuyo tiempo de vida sigue una distribución normal
con una media de 1200 horas y una desviación estándar de 250 horas. Un foco se
selecciona aleatoriamente de la producción de la compañı́a:

a) Encuentre la probabilidad de que dure menos de 1500 horas.


EP

b) Encuentre la probabilidad de que el foco seleccionado dure al menos de 1000 horas.


UD

c) Encuentre la probabilidad de que dure entre 1000 y 1300 horas.

29. El ancho (en mm.) de una pequeña pieza metálica sigue una distribución normal. Si se
estima que el 77 % de la producción miden menos de 12 mm. y el 85 % más de 7 mm.:
A
IM

a) ¿cuál es el ancho promedio y la desviación estándar de la anchura?


-L

b) ¿Qué porcentaje de piezas miden más de 10 mm?


S
PU

30. Los postulantes a una escuela militar tienen estaturas que se distribuyen normalmente
M

alrededor de 1.72m. con una desviación estándar de 0.04m. Las calificaciones que
CA

obtuvieron se encuentran distribuidas también normalmente alrededor de 220 puntos,


con una desviación estándar de 65. Si se desea que ingresen 200 postulantes de un total
de 880, con una estatura mı́nima de 1.70 m. ¿cuál debe ser la calificación mı́nima para
ingresar?

31. Suponga que los promedios de prácticas de los alumnos de un curso están distribuidos
normalmente alrededor de 12. Si el 95 % de estos promedios están comprendidos entre
09 y 15. ¿Qué porcentaje de alumnos estarán aprobados? (Considere que la nota
aprobatoria mı́nima es 10.5)
E
AD

32. Supongamos que los pesos de una población de individuos tiene distribución normal
con media de 74 kg y desviación estándar de 7 kg. ¿Qué peso debe tener un individuo
para que el 16,6 % de la población pese más que él?

33. El peso de los adultos de una población numerosa se distribuye normalmente con
media 65 kg y desviación tı́pica 3 kg. Se eligen dos individuos al azar. Calculando
las correspondientes probabilidades, justifica qué es más probable:

a) Que cada uno de los individuos tenga un peso comprendido entre 63,5 y 66,5 kg.
-I I

b) Que uno de ellos tenga un peso comprendido entre 62 y 68 kg. y el otro tenga un
22

peso no comprendido entre 62 y 68 kg.


20

34. La estatura de los individuos de una población se distribuye normalmente con media
de 174 cm. y desviación estándar de 5cm. Se le pide lo siguiente:
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 230

a) Calcular la probabilidad de que la estatura de un individuo elegido al azar esté


comprendida entre 164 y 184 cm.
b) Si elegimos a un individuo al azar y resulta tener una estatura superior a 164 cm.
¿Cuál es la probabilidad de que tenga una estatura menor a 184 cm?

35. El tiempo necesario para que una ambulancia llegue a un centro deportivo se distribuye
normalmente con una media 17 minutos y desviación tı́pica de 3 minutos.

a) Calcular la probabilidad de que el tiempo de llegada esté comprendido entre 13 y


21 minutos.
EP

b) ¿Para qué valor de t, la probabilidad de que la ambulancia emplee más de t minutos


UD

en llegar es el 5 %?

36. Para aprobar unas oposiciones se necesita obtener 100 puntos, o más, en una prueba.
Por experiencias anteriores, se sabe que la distribución de los puntos obtenidos por los
A
opositores es una normal de media 110 puntos y desviación tı́pica 15.
IM
-L

a) ¿Qué probabilidad hay de que un opositor apruebe?


S

b) Si sabemos que hay 1000 opositores y sólo 300 plazas, ¿Cuántos puntos se deberá
PU

exigir para ajustar el número de plazas al número de opositores aprobados?


M
CA

37. En una ciudad, la temperatura máxima durante el mes de junio está distribuida
normalmente con una media de 26ºC y una desviación tı́pica de 4ºC. Calcular el número
de dı́as que se espera tengan temperatura máxima comprendida entre 22ºC y 28ºC.

38. El tiempo de reemplazo de los reproductores de CD se distribuye normalmente, con


una media de 7.1 años y una desviación estándar de 1.4 años.

a) ¿Cuál es la probabilidad de que un reproductor de CD, seleccionado aleatoriamen-


te, tenga un tiempo de reemplazo menor de 8 años?
b) Si se ofrece una garantı́a tal que sólo el 2 % de los reproductores se reemplace
E

antes de que expire la garantı́a, ¿cuál debe ser la duración de la garantı́a?


AD

39. Las calificaciones de los estudiantes de un curso siguen una distribución normal. Si las
puntuaciones estandarizadas o tipificadas de dos estudiantes fueron 0.8 y -0.4 y sus
notas reales fueron 88 y 67.4 puntos. ¿Cuál es la media y la desviación estándar de las
puntuaciones del examen?

40. Se supone que los resultados de un examen siguen una distribución normal con media
87 y varianza 81. Se pide:
-I I

a) ¿Cuál es la probabilidad de que una persona que se presenta al examen obtenga


22

una calificación superior a 72?


20

b) Calcular el porcentaje de estudiantes que tienen puntuaciones que exceden por lo


menos en cinco puntos de la puntuación que marca la frontera entre el Apto y el
No-Apto (son declarados No-Aptos el 25 % de los estudiantes que obtuvieron las
puntuaciones más bajas).
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 231

c) Si elegimos al azar a un estudiante y resulta tener una calificación mayor que 72


¿Cuál es la probabilidad de que su calificación sea, de hecho, superior a 84?

41. El peso de los melocotones de un pedido se distribuyen normalmente. Se sabe que el


9 % de los melocotones tiene un peso inferior a 50 gramos y un 20 % de los melocotones
tienen un peso superior a 70 gramos ¿Qué porcentaje de los melocotones del pedido
tienen su peso comprendido entre 65 y 75 gramos?

42. Los ingresos diarios (en unidades monetarias) de una empresa tienen una distribución
normal con media 35560 um. y desviación tı́pica 2530 um. Justifica si es o no razonable
EP

el esperar obtener un dı́a unas ventas superiores a 55000 ptas. Calcular cuántos dı́as en
UD

un año se espera obtener unas ventas superiores a 40620 um.

43. Se supone que las retribuciones recibidas en una empresa se distribuyen normalmente
con media y desviación estándar desconocidas. Se conoce que el 1 % son superiores a
A
5800000 unidades monetarias y el 10 % inferiores a 1200000 unidades monetarias.
IM
-L

a) ¿Cuál es el valor de la media y el de la desviación estándar?


S

b) ¿Qué porcentaje de las retribuciones son superiores a 3 000 000 unidades


PU

monetarias?
M

44. Se ha estimado que el peso neto de un paquete que contiene determinado alimento
CA

precocido sigue una distribución normal. Un tercio de los paquetes pesan menos de 870
grs. y sólo dos de cada mil paquetes pesan más de 1 kg. Se pide:

a) ¿ Cuál es el peso neto promedio y la desviación estándar de los pesos netos de


dichos paquetes?
b) Calcular la probabilidad de que un paquete seleccionado al azar pese más de 860
gr.
c) Calcular la probabilidad de que un paquete seleccionado al azar pese menos de
E

880 gr.
AD

d) Cuál es la probabilidad de que un paquete seleccionado al azar pese exactamente


865gr?
e) Si se selecciona un paquete al azar y resulta tener un peso neto menor a 890 gr,
¿Cuál es la probabilidad que su peso neto sea mayor a 875 gr?
f) Si se seleccionan aleatoriamente 5 paquetes¿ Cuál es la probabilidad de que al
menos 2 de ellos pesen menos de 890 gr?
g) Si en una semana salen al mercado 40.000 paquetes ¿cuántos cabe esperar que
-I I

pesen más de 900 gr?


22
20

45. Se tiene un examen con 50 preguntas de opción múltiple. Cada pregunta tiene cuatro
alternativas, de las cuales sólo una es correcta. Suponga que un alumno que ha asistido
a clases, estudiado e investigado tiene una probabilidad de 0.75 de contestar cualquier
pregunta en forma correcta.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 232

a) Un alumno debe contestar en forma correcta 43 preguntas o más para alcanzar la


calificación A. ¿Qué porcentaje de alumnos que hayan asistido a clases, estudiado
e investigado alcanzan la clasificación A en este examen de opción múltiple?
b) Un alumno que contesta en forma correcta de 35 a 39 preguntas obtiene una
calificación C ¿Qué porcentaje de alumnos que hayan asistido a clases, estudiado
e investigado alcanzan una clasificación C en este examen?
c) Un alumno debe contestar en forma correcta 30 preguntas o más para pasar el
examen. ¿Qué porcentaje de alumnos que hayan asistido a clases, estudiado e
EP

investigado pasarán el examen?


UD

46. El tiempo que tarda un camión que transporta materiales de construcción, entre la
bodega de carga y la obra de construcción, es aproximadamente normal con una media
de 25 minutos y una desviación estándar de 4 minutos. ¿A qué hora debe salir el camión
de la bodega, para tener una probabilidad del 90 % de estar en la obra de construcción
A
IM

a las 10 de la mañana?
-L

47. El Departamento de Justicia de EEUU presentó una demanda contra Microsoft


S

Corporation, en diciembre de 1997, por ligar su navegador de red Internet Explorer, con
PU

su sistema operativo Windows 95. La opinión pública se dividió acerca de si Microsoft es


M

un monopolio. En una encuesta realizada, el 41 % de quienes contestaron concordaron


CA

con la afirmación ?Microsoft es un monopolio?.

a) En una muestra de 800 personas, ¿cuántas espera el lector que coincidan en que
Microsoft es un monopolio?
b) En esa muestra, ¿cuál es la probabilidad de que 300 personas o menos coincidan
en que Microsoft es un monopolio?
c) Nuevamente en una muestra de 800 personas, ¿cuál es la probabilidad de que más
de 335 personas pero menos de 350 concuerden en que Microsoft es un monopolio?
E

48. Se sabe que el 30 % de los clientes de una tarjeta de crédito a nivel nacional dejan en cero
AD

sus saldos para no incurrir en intereses moratorios. Conteste las siguientes preguntas
para un grupo de 150 poseedores esa tarjeta.

a) ¿Cuál es la probabilidad de que de 40 a 60 clientes paguen sus cuentas antes de


incurrir en el pago de intereses?
b) ¿Cuál es la probabilidad de que 30 clientes o menos paguen sus cuentas antes de
incurrir en el pago de intereses?
-I I

49. La investigación sobre nuevos delincuentes juveniles que fueron puestos en libertad bajo
22

palabra por un juez reveló que 38 % de ellos cometieron otro delito.


20

a) ¿Cuál es la probabilidad de que de los últimos 100 nuevos delincuentes juveniles


puestos en libertad condicional o bajo palabra, 30 o más delincan otra vez?
b) ¿Cuál es la probabilidad de que 40 o menos cometan otro delito?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 233

c) ¿Cuál es la probabilidad de que entre 30 y 40, inclusive, cometan otro acto ilı́cito?

50. En la lı́nea naviera Royal Express se informa que 80 % de sus camarotes se ocupa,
durante el mes de setiembre. En el caso de un navı́o que tenga 800 dormitorios, ¿Cuál
es la probabilidad de que de 650 a 665 dormitorios sean ocupados en dicho mes?

51. Tras una larga serie de observaciones, se llega a la conclusión de que sólo un 10 % de los
aspirantes superan una determinada prueba. Si la próxima convocatoria fuese firmada
por 500 aspirantes, ¿cuál es la probabilidad de que aprueben más de 80?
EP

52. Un examen tipo ”test ”tiene 100 preguntas y cada pregunta cuatro respuestas de las
UD

que sólo una es correcta.

a) Calcular la probabilidad de que un estudiante que responda al azar acierte más


de 20 preguntas.
A
b) Calcular la probabilidad de que de las 20 primeras preguntas acierte a los sumo 4.
IM

53. Al inyectar a una rata un determinado producto la probabilidad de que sobreviva es


-L

de 0.5. Si se inyecta a 100 ratas, calcula la probabilidad de que sobrevivan entre 40 y


S
PU

60 ratas, ambos extremos incluidos.


M

54. La cantidad de almendra que contiene una nueva barra de helado se distribuye
CA

normalmente con una media de 60 gr. y varianza de 4 gr2 . Se pide:

a) Las barras de helados se ponen a la venta cuando su cantidad de almendra está


dentro de ±4 gr. de la cantidad media ¿Qué porcentaje de ellas se ponen a la
venta?
b) Obtener la cantidad de almendra para la cual el 33 % de las barras tienen una
cantidad inferior a dicho valor.
c) Si las barras de helado se meten en cajas de 150 unidades, ¿Cuál es la probabilidad
de que una caja contenga por lo menos 140 y como máximo 148 barras aptas para
E
AD

la venta?

55. El contenido de calcio de la leche de un tetrabrik escogido al azar entre la producción


de una empresa láctea, sigue una distribución normal con una media de 1200 mg.
y desviación estándar igual a 50 mg. Se considera que el tetrabrik cumple con las
especificaciones del producto si su contenido en calcio está comprendido entre 1075 mg.
y 1325 mg.

a) Calcular el porcentaje de tetrabriks en la producción que no cumplen con las


-I I

especificaciones.
22

b) Un supermercado compró 2000 tetrabriks a la empresa, ¿Cuál es la probabilidad


20

de que haya más de 30 tetrabriks que no cumplen con las especificaciones?

56. Aproximando con una distribución normal, calcular la probabilidad de que al lanzar
una moneda 100 veces, el número de caras obtenido esté comprendido entre 45 y 55.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 234

57. En una urna hay 3 bolas rojas, 2 blancas y 5 verdes. Sacamos una bola, anotamos
su color y la devolvemos a la urna. Si repetimos la experiencia 50 veces, ¿cuál es la
probabilidad de sacar roja en más de 20 ocasiones?

58. Lanzamos un dado 300 veces. ¿Cuál es la probabilidad de que obtengamos más de 70
“unos”?

59. El 7 % de los pantalones de una determinada marca salen con algún defecto. Se
empaquetan en cajas de 80 para distribuirlos por diferentes tiendas ¿cuál es la
probabilidad de que en una caja hay más de 10 pantalones defectuosos?
EP
UD

60. El 60 % de una población de 20000 habitantes tiene los ojos oscuros. Si elegimos al
azar 50 personas de esa población, ¿Cuál es la probabilidad de que haya menos de 30
personas con los ojos oscuros?

61. La empresa Amazing Marketing, una compañı́a de ventas por teléfono, considera la
A
IM

posibilidad de adquirir una máquina que selecciona al azar y marca automáticamente


-L

los números telefónicos. Esa compañı́a realiza la mayorı́a de sus llamadas durante la
S

noche, por lo que se desperdician las que se hacen a establecimientos comerciales. El


PU

fabricante de la máquina asegura que está programada de manera que la probabilidad


M

de llamadas a establecimientos comerciales, es del 16 %. Como prueba, se examinó una


CA

muestra de 150 números que la máquina seleccionó. Si lo que asegura el fabricante es


cierto,

a) ¿Cuál es la probabilidad de que más de 30 de los números telefónicos seleccionados


sean de un establecimiento comercial?
b) ¿Cuál es la probabilidad de que entre 22 y 29 de los números telefónicos
seleccionados sean de un establecimiento comercial?
c) ¿Cuál es la probabilidad de que 28 o menos de los números telefónicos seleccionados
sean de un establecimiento comercial?
E
AD

62. El volumen que una máquina de llenado automático deposita en latas de una bebida
gaseosa tiene una distribución normal con media 340 ml y una desviación tı́pica 15 ml.

a) Si se desechan aquellas latas que tienen menos de 330 ml ¿cuál es la proporción


de latas desechadas?
b) Hallar el volumen medio al que la máquina de llenado debe ser ajustada para que
únicamente el 1 % de las latas tengan menos de 330 ml?
c) Si tomamos 10 latas llenadas con la máquina tal y como figura originalmente,
-I I

¿cuál es la probabilidad de que ninguna sea desechada?


22

d) Si ahora tomamos 500 latas llenadas con la máquina tal y como figura
20

originalmente, ¿cuál es la probabilidad de que al menos 100 sean desechadas?

63. Se sabe que el tiempo que tarda un jefe de personal en entrevistar a un aspirante
para una vacante en su compañı́a sigue una distribución normal. Si el 10 % de los
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 235

entrevistados tardan más de 60 minutos y el 4 % duran menos de 35 minutos, hallar


la media y la desviación estándar de la distribución del tiempo que tarda un jefe de
personal en entrevistar a un aspirante.

64. El puntaje medio de las pruebas de acceso correspondientes a los estudiantes que
querı́an ingresar a una universidad en una facultad de economı́a, en una universidad
extranjera, era de 5.8 y la desviación estándar de 1.75. Fueron admitidos los estudiantes
que tuvieron un puntaje superior a 6.

a) ¿Cuál fue el porcentaje de admitidos si la distribución de los puntajes es normal?


EP

b) ¿Cuál es la probabilidad de que 4 de 10 estudiantes sean admitidos?


UD

65. Suponga que las calificaciones de un examen siguen una distribución normal con media
de 72.8 y la desviación estándar de 8.3. El profesor registra en su lista solo números
enteros del 0 al 100, pero reporta las calificaciones a dirección de estudios con letras:
A
4 % de las calificaciones más altas tiene A, 16 % siguiente tiene B, 40 % siguiente tiene
IM

C y el resto tiene NA (no acreditado). ¿Cuáles han de ser las puntuaciones que marcan
-L

el paso de un grupo al otro?


S
PU

66. Un grupo grande de alumnos hace un examen de Economı́a. Las notas se distribuyen
M

según una normal de media 70, además la probabilidad de que un alumno elegido al
CA

azar obtenga una nota menor que 85 es 0.9332. Se eligen cuatro estudiantes al azar;
¿cuál es la probabilidad de que al menos uno de ellos obtenga más de 80 puntos en el
examen?

67. El promedio de tiempo en que un automóvil de una marca japonesa empieza a dar
problemas es 3.5 años con una desviación estándar de 0.5 años; un automóvil de
fabricación alemana tiene una media de 4 años con una desviación estándar de 0.4
años. En ambos casos el tiempo en que un automóvil empieza a dar problemas, sigue
una distribución normal. Si se elige al azar un automóvil de cada marca, ¿Cuál es la
E

probabilidad de que la marca japonesa dure más de 3 años y la marca alemana a lo


AD

más 4.2 años?

68. Una academia pre-universitaria de mucho prestigio cuenta con tres aulas A, B y C
con capacidades para 50, 70 y 80 alumnos, para administración de empresas. Como se
han presentado 500 alumnos, les han hecho rendir un examen de ingreso. Los puntajes
obtenidos por los 500 alumnos se distribuyen normalmente con media 151 y desviación
estándar 85. Si se desea seleccionar a los mejores en el aula A, B y C sucesivamente,
¿qué puntaje se debe establecer como mı́nimo para ingresar al aula A? ¿qué puntaje
-I I

mı́nimo se debe establecer para ingresar al aula B? y ¿qué puntaje como mı́nimo se
22

debe establecer para ingresar al aula C?


20

69. Cierta empresa tiene dos secciones de fabricación. Una de las secciones dispone de
maquinaria más antigua que la otra. En la sección en la que la maquinaria es más
antigua el número de piezas buenas que se fabrican es 7 veces mayor que el de las
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 236

piezas defectuosas. Calcule la probabilidad de que de las 400 piezas fabricadas en dicha
sección, más de 35 pero menos de 60 sean defectuosas.

70. El tiempo (en horas) que un estudiante necesita para aprender un tema de estadı́stica
es una variable aleatoria con distribución normal con media µ y desviación tı́pica σ. Si
el 83.147 % de los alumnos emplea más de tres horas y sólo el 2.275 % más de nueve.
¿Cuánto es el promedio y la desviación estándar del tiempo que necesitan los alumnos
para aprender dicho tema de estadı́stica?

71. Una empresa dedicada a la fabricación de abono ha adquirido una máquina de envasado.
EP

Según los datos que le suministra el fabricante de la envasadora, la cantidad de abono


UD

que proporciona por saco es una variable aleatoria normal con una media de 2000 gr.
y varianza de 2500gr2 . Sabiendo que un saco de abono se considera defectuoso si el
contenido de abono es inferior a 1900 gr:
A
a) Calcule la probabilidad de que un saco elegido al azar sea defectuoso.
IM

b) Si elegimos un saco al azar y resulta tener más de 2050 gr. de abono. ¿Cuál es la
-L

probabilidad de que tenga menos de 2110 gr. de abono?


S
PU

c) Si se toma al azar una muestra de 4 sacos, ¿cuál es la probabilidad de que al menos


dos sacos sean defectuosos?
M
CA

d) Si los sacos se almacenan en palés (plataforma de tablas para almacenar y


transportar mercancı́as) de 500 unidades, ¿Cuál es la probabilidad de que un
palé contenga, como mı́nimo, 18 sacos defectuosos?

72. La longitud de una cierta pieza se distribuye con función de densidad,


(
k(x − 1)(3 − x) si 1≤x≤3
f (x) =
0 en otros casos

Hallar:
E
AD

a) El valor de k para que f (x) sea realmente una función de densidad.


b) La función de distribución.
c) La media y la desviación estándar.
d) Si se consideran válidas las piezas cuya longitud esté comprendida entre 1.7 y 2.1
cm. Calcular la probabilidad de que una determinada pieza sea útil.

73. Dada la variable aleatoria continua, X, con función de densidad,


(
-I I

k(x2 + 2) si 0≤x≤4
f (x) =
22

0 en otros casos
20

Hallar:

a) El valor de k para que f (x) sea realmente una función de densidad.


b) La función de distribución.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 237

c) La media , la varianza y la desviación estándar


d) P (2 ≤ x ≤ 3).

74. Una empresa de seguridad recoge diariamente la recaudación de unos grandes


almacenes. Estudios realizados en meses anteriores permiten plantear la siguiente
función densidad para la variable aleatoria recaudación diaria , medida en decenas
de miles de soles:  1

 (x − 5) si 5≤x<7

 8

 k si 7≤x<9
EP

f (x) = 1

 (11 − x) si 9 ≤ x < 11


 8

UD

0 en otros casos

a) Obtener el valor de k
b) Calcular la recaudación media y la desviación estándar de la recaudación.
A
IM

c) Obtener la función de distribución de la recaudación diaria.


-L

d) ¿Qué porcentaje de dı́as los ingresos son inferiores a 85000 soles?


S

e) Sabiendo que la recaudación diaria ha sido menor de 80000 soles ¿cuál es la


PU

probabilidad de que la recaudación sea mayor que 75000 soles?


M

f) Los grandes almacenes deciden no contratar los servicios de la empresa diariamente


CA

por representar un alto costo. Deciden llamarla sólo los dı́as en que la recaudación
sea superior a 85000 soles ¿Cuál es la probabilidad de que vaya 10 dı́as al mes,
teniendo en cuenta que los almacenes están abiertos 26 dı́as al mes?

75. Una academia dedicada a la preparación de candidatos para la realización de los


exámenes exigidos en la adjudicación de plazas de administrativo de una sucursal
bancaria sabe por su experiencia anterior que suelen desaprobar 30 de cada 50
presentados a dicha prueba. Si un profesor de la academia corrige los exámenes de
150 alumnos ¿cuál es la probabilidad de que desaprueben más de 100?
E
AD

76. La variable aleatoria X representa la demanda de gasolina (en miles de galones), por
dı́a, en una refinerı́a. La función densidad de probabilidad de X es:


 2cx si 0<x≤1
f (x) = c(3 − x) si 1<x≤3


0 en otros casos

a) Determine el valor de c para que sea una función de densidad.


-I I

b) Calcule la probabilidad de que la demanda de gasolina en un dı́a cualquiera esté


22

entre los 800 y 1400 galones.


20

c) Calcule la probabilidad de que la demanda de gasolina en un dı́a cualquiera supere


los 1800 galones.
d) Si en un determinado dı́a la demanda de gasolina es mayor a 1500 galones ¿Cuál
es la probabilidad de que en dicho dı́a, la demanda sea menor 2200 galones?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 238

e) En una semana de trabajo (7 dı́as) ¿Cuál es la probabilidad de que haya algún


dı́a cuya demanda de gasolina supere los 1800 galones?
f) Calcule la demanda promedio de gasolina por dı́a en dicha refinerı́a.

77. Sea X una variable aleatoria con la siguiente función de densidad




 kx si 0≤x≤3
f (x) = k(6 − x) si 3<x≤6


0 en otros casos
EP

Hallar:
UD

a) El valor de k para que sea realmente una función de densidad.


b) La función de distribución.
c) La media y la varianza de x.
A
IM

d) P (2 ≤ x ≤ 5).
-L

78. Una máquina fabrica tornillos cuyas longitudes se distribuyen normalmente con media
S
PU

20 mm. y varianza 0.25 mm2. Un tornillo se considera defectuoso si su longitud difiere


de la media en más de 1 mm. Los tornillos se fabrican de forma independiente.
M
CA

a) ¿Cuál es la probabilidad de que un tornillo sea defectuoso?


b) Si los tornillos son envasados en cajas de 15 tornillos, ¿cuál es la probabilidad de
que una caja no tenga más de 2 tornillos defectuosos?

79. La duración (en años) de la baterı́a de cierto modelo de teléfono celular es una variable
aleatoria continua X con función de densidad
(
k(x2 − 4x + 4) si 2≤x≤4
f (x) =
0 en otros casos
E
AD

a) Calcule el valor de k para que f (x) sea realmente una función de densidad.
b) Calcule e interprete la duración media y la desviación tı́pica de la duración de las
baterı́as.
c) Halle F (x).
d) Calcula la probabilidad de que una baterı́a dure más de 2 años y medio.
e) ¿Cuál es la probabilidad de que una baterı́a cualquiera dure 2.35 años?
f) Si se elige una baterı́a al azar y resulta que su duración es mayor a 1 año ¿Cuál
-I I

es la probabilidad de que dure menos de 3 años?


22

g) Si estas baterı́as se embalan en cajas y cada caja contiene 15 baterı́as, ¿Cuál es


20

la probabilidad de que en una caja hayan alguna baterı́a que dure entre 3 y 3.5
años?
4
h) Si W = X + 1. Calcule E(W ) y σ 2 (W ).
5
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 239

80. Un estudio de la Dirección General de Transporte estima que el tiempo necesario (en
horas de práctica) para la obtención de la licencia de conducir sigue una distribución
normal con media de 24 y varianza de 9.

a) ¿Cuál es la probabilidad de obtener la licencia de conducir en menos de 20 horas?


b) ¿Cuántas horas de práctica ha necesitado un conductor para obtener la licencia
de conducir, si el 67 % de los conductores ha necesitado más horas de prácticas
que él?
c) Si se elige un conductor aleatoriamente y resulta que ha necesitado más de 22
EP

horas para obtener la licencia de conducir ¿Cuál es la probabilidad de que haya


UD

necesitado menos de 25 horas?


d) Si se elige un conductor aleatoriamente y resulta que ha necesitado más de 22
horas para obtener la licencia de conducir ¿Cuál es la probabilidad de que haya
necesitado más de 26 horas?
A
IM

e) Si se eligen a 5 conductores al azar, ¿Cuál es la probabilidad de que al menos 2 de


-L

ellos hayan necesitado entre 23 y 26 horas para obtener la licencia de conducir?


S
PU

81. El departamento de marketing de una marca de automóviles considera que el tiempo


(en años) que transcurre para que un cliente renueve su automóvil es una variable
M

aleatoria X cuya función de densidad es:


CA


2

 kx si 0≤x≤6
f (x) = 9k(10 − x) si 6 < x ≤ 10


0 en otros casos

a) Determine el valor de k para que f (x) sea una función de densidad.


b) Calcule la probabilidad de que un cliente tarde más de 3 años en renovar su
vehı́culo.
E

c) Calcule la probabilidad de que un cliente tarde más de 7 años en renovar su


AD

vehı́culo.
d) Calcule la probabilidad de que un cliente tarde entre 3 y 5 años en renovar su
vehı́culo.
e) Si un cliente elegido al azar ha tardado más de 4 años en renovar su vehı́culo,¿Cuál
es la probabilidad de que tarde más de 5.5 años en renovarlo?
f) Si se eligen al azar a 5 nuevos clientes ¿Cuál es la probabilidad de que por lo menos
2 de ellos tarden más de siete años en renovar su vehı́culo?
-I I

g) Calcule el tiempo promedio de renovación de un vehı́culo de dicha marca.


22

h) Calcule la probabilidad de que un cliente tarde entre 4 y 8 años en renovar su


20

vehı́culo.

82. Un saco que contiene 400 monedas honestas es vaciado sobre una mesa. Hallar:

a) La probabilidad de que aparezcan más de 210 caras.


CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 240

b) La probabilidad de que aparezcan menos de 180 caras.


c) La probabilidad de que aparezcan entre 195 y 211 caras, inclusive.
d) Si aparecen más de 208 caras ?Cuál es la probabilidad de que aparezcan menos
de 212 caras?

83. En una industria, la venta mensual de cierto producto, en miles de Kg, es una variable
aleatoria X cuya función de densidad es:
 x

 k si 0≤x<2

 7
EP

f (x) = (4 − x)
 k si 2≤x≤4

UD

 7
 0 en otros casos

a) Determine el valor de k para que f (x) sea una función de densidad. Grafique f (x).
A
b) Calcule la probabilidad de que la venta de ese producto, en un mes cualquiera,
IM

esté entre 1600 y 2250 Kg.


-L

c) Calcule la probabilidad de que la venta de ese producto, en un mes cualquiera,


S

sea mayor a 1900 Kg.


PU

d) Calcule la probabilidad de que la venta de ese producto, en un mes cualquiera,


M

sea menor a 1125 Kg.


CA

e) Si elegimos un mes al azar y resulta que las ventas en ese mes no fueron mayores
a 3110 Kg. ¿Cuál es la probabilidad de que se haya vendido al menos 1750 Kg?
f) Calcule e interprete la venta mensual promedio y la desviación estándar de las
ventas de dicho producto.
g) ¿Cuál es la probabilidad de que, en un mes seleccionado al azar, se haya vendido
1860 kg de dicho producto?
h) Si se eligen al azar 6 meses de ventas ¿Cuál es la probabilidad de que por lo menos
E

en 3 de ellos las ventas estén entre 1600 y 2250 Kg?


AD

84. El volumen de bebida energizante, que una máquina de llenado automático deposita en
latas de una conocida marca tiene una distribución normal con media de 340 ml. y una
desviación tı́pica de 15 ml. El llenado de una lata cualquiera se considera “incorrecto”
si la cantidad de bebida energizante vertida es inferior a 310 ml:

a) Calcule la probabilidad de que una lata elegida al azar haya sido llenada
incorrectamente.
b) Si elegimos una lata al azar y resulta tener más de 330ml. de bebida energizante
-I I

¿Cuál es la probabilidad de que tenga más de 345 ml?


22
20

c) Si tomamos 5 latas llenadas con dicha máquina ¿cuál es la probabilidad de que


alguna haya sido llenada incorrectamente?
d) Si ahora tomamos 400 latas llenadas con dicha máquina ¿cuál es la probabilidad
de que más de 15 hayan sido llenadas incorrectamente?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 241

85. Suponga que tiene un dado cargado en el cual se cumple que la probabilidad de obtener
“5” es el doble de la probabilidad de obtener cualquiera de los restantes valores. Si se
lanza dicho dado 35 veces. ¿Cuál es la probabilidad de obtener “5” más de 20 veces?

86. El peso de ciertos paquetes es una variable aleatoria que sigue distribución normal tal
que el 15 % pesa más de 50 kg. y el 2,5 % pesa menos de 44 kg.

a) ¿Cuál es el peso promedio y la desviación estándar de los pesos de dichos paquetes?


b) Para transportar los paquetes se cobran 3 tarifas: $10 por los que pesan más de
52 kg., $8 por los que pesan entre 46 y 52 kg. y $5 por los que pesan menos de 46
EP

Kg. Halle el precio esperado de transporte por paquete.


UD

87. El kilometraje (en miles de kilómetros) que los automovilistas logran de cierto tipo de
neumáticos, es una variable aleatoria con función densidad:

A
 1 e− 2k
x
si x>0
IM

f (x) = 20
 0 en otros casos
S -L

a) Determine el valor de k para que f (x) sea una función de densidad.


PU

b) Calcular la probabilidad de que un neumático cualquiera dure a lo sumo 10000


M

Km.
CA

c) Calcular la probabilidad de que un neumático cualquiera dure entre 16000 y


20000km.
d) Calcular la probabilidad de que un neumático cualquiera dure al menos 30000 Km.
e) Determinar la función de distribución: F(x).

88. Un grupo grande de alumnos rinde un examen (sobre 100 puntos) de Finanzas. Los
puntajes obtenidos siguen una distribución normal y además se sabe que la probabilidad
de que un alumno elegido al azar obtenga un puntaje que supere los 65 puntos es 0.69847
E

y que la probabilidad de que un alumno elegido al azar obtenga un puntaje menor a


AD

85 puntos es 0.89251. Si se eligen cuatro estudiantes al azar ¿cuál es la probabilidad de


que al menos dos de ellos obtengan entre 75 y 80 puntos en el examen?

89. El tiempo de operatividad (en dı́as) de un determinado tipo de explosivos tiene la


siguiente función de densidad:
( x
3ke− 7 si x>0
f (x) =
0 en otros casos
-I I

a) Determine el valor de k para que f(x) sea una función de densidad.


22
20

b) Determinar la función de distribución: F(x).


c) Calcular la probabilidad de que un explosivo deje de ser operativo antes de una
semana.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 242

d) La empresa encargada de fabricar dichos explosivos tiene una producción mensual


de 1000 unidades, proporcionando un 5 % de explosivos defectuosos.
d.1) ¿Cuál es el número medio de explosivos defectuosos fabricados en un mes?
d.2) Determinar la probabilidad de que en un mes se fabriquen más de 30 unidades
defectuosas.

90. Alberto y Beatriz realizan un juego bajo las siguientes condiciones: se lanza un dado,
si sale un número menor que 3, Alberto paga a Beatriz 6 dólares y si sale un número
mayor o igual que 3 Beatriz paga a Alberto 21 dólares. Se pide:
EP

a) Si juegan 300 partidas, hallar la probabilidad de que Alberto gane entre 190 y 212
UD

partidas, inclusive.
b) ¿Cuál es el beneficio esperado para Alberto en 300 partidas?¿y para Beatriz?

91. En una asignatura del colegio, la probabilidad de que saquen a un alumno a la pizarra
A
IM

en cada clase es del 12 %. A lo largo del año se tienen 125 clases de esa asignatura.
¿Cuál es la probabilidad de tener que salir a la pizarra más de 18 veces?
S -L

92. LUZBLANCA es una compañı́a de suministro de electricidad y ha deteminado que el


PU

consumo mensual (medido en Kw/h) de una vivienda familiar, sigue una distribución
M

normal con media igual 300 Kw/h y desviación estándar igual a 50 Kw/h.
CA

a) ¿Cuál es la probabilidad de que en un mes, se consuman entre 270 y 330 kw/h?


b) ¿Cuál es la probabilidad de que una familia consuma 280 kw/h en un mes?

93. Se sabe que el peso de los recién nacidos en un determinado poblado sigue una
distribución normal con media igual a 3600 gramos y varianza igual a 78400.

a) Calcule la probabilidad de que un recién nacido pese entre 3700 y 3800 gramos.
b) ¿Cuál es la probabilidad de que un recién nacido pese 3500 gramos?
E

c) Si se elige un recién nacido al azar y resulta que pesa más de 3450 gramos ¿Cuál
AD

es la probabilidad de que pese más de 3650 gramos?


d) Si se elige a 8 recién nacidos, ¿Cuál es la probabilidad de que hayan al menos 2
que pesen entre 3500 y 3750 gramos?

94. Un inversionista debe decidir entre dos alternativas: una acción o un tı́tulo de renta
fija. Una vez fijado un horizonte de tiempo, la tasa de retorno de la acción puede ser
modelada como una variable aleatoria con distribución normal de promedio 20 % y
desviación estándar 2 %. Sabiendo que la probabilidad de que el retorno de la acción
-I I

exceda al del tı́tulo es 0.63, determine la tasa de retorno del tı́tulo.


22

95. Suponga que un inversionista está considerando dos alternativas para invertir su capital.
20

En la alternativa A invertirı́a en una acción cuya tasa de retorno es una variable


aleatoria con distribución normal de promedio 15 % y desviación estándar 2 %. En
la alternativa B él apostarı́a en un juego donde la tasa de retorno es igual al 16 % con
probabilidad 0.6 e igual al 13 % con probabilidad 0.4.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 243

a) ¿En cuál de las dos alternativas serı́a mayor el retorno esperado?


b) ¿En cuál de las dos alternativas serı́a mayor la varianza del retorno?
c) Imagine una alternativa C para ese inversionista donde él apostarı́a en otro juego
con tasa de retorno igual a m % con probabilidad 0.5 e igual a n % con probabilidad
0.5. Obtenga los valores de m y n para que el valor esperado y la varianza del
retorno en la alternativa C sean respectivamente iguales al valor esperado y a la
varianza del retorno en la alternativa A.

96. El consumo familiar de cierto artı́culo se distribuye uniformemente con media 10 y


EP

varianza igual a uno. Determinar la probabilidad de que el consumo de dicho artı́culo


UD

se encuentre comprendido entre 8 y 12 unidades.

97. La cantidad de café diaria, en litros, que sirve una máquina que se localiza en el vestı́bulo
de un aeropuerto es una variable aleatoria X con distribución uniforme continua en el
A
intervalo [7, 10] . Encuentre la probabilidad de que en un dı́a dado la cantidad de café
IM

que sirve esta máquina sea


S -L

a) más de 7.4 litros, pero menos de 9.5 litros.


PU

b) a lo sumo 8.8 litros.


M

c) Hallar E(X) y V ar(X).


CA

98. Suponga que la duración de la baterı́a del Mini iPad se distribuye uniformemente con
un valor esperado de 13.25 horas y una varianza igual a 3. ¿Cuál es la probabilidad de
que la duración de la baterı́a de un minipad esté entre 9.5 y 11.4 horas?

99. Según informaciones de la Empresa Municipal Administradora de Peaje (Emape), todos


los usuarios cuentan con el servicio gratuito de auxilio vial, el cual corre por cuenta
de las concesionarias Rutas de Lima y Vı́a Parque Rı́mac. La Central de Atención de
Emergencias de Rutas de Lima ha comprobado que en las mañanas de los fines de
E

semana el número de llamadas que recibe, en promedio, es de 3 llamadas cada hora.


AD

Un operario comienza su jornada de sábado a las 8 de la mañana. Suponiendo que las


llamadas se realizan de forma independiente y con tasa constante:

a) ¿ Cuál es la probabilidad de que reciba la primera llamada antes de las 8:15 am?
b) ¿ Cuál es la probabilidad de que reciba 4 llamadas en las dos primeras horas de
su jornada de trabajo?
c) Si lleva 10 minutos sin recibir ninguna llamada, ¿cuál es la probabilidad de que
reciba una nueva llamada en menos de 15 minutos?
-I I
22

100. El precio (en nuevos soles) de un determinado artı́culo sigue distribución normal con
20

media µ y desviación tı́pica σ. Se sabe que la probabilidad de que el precio del artı́culo
sea menor que 1000 soles es 0.975 y que la probabilidad de que el precio del artı́culo sea
mayor que 910 es 0.7823. Si Usted tuviera 930 nuevos soles, ¿Cuál es la probabilidad
de que no pueda comprar dicho artı́culo?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 244

101. Las ventas diarias (X) en nuevos soles de una pequeña empresa tienen la siguiente fun-
ción de densidad:

 1

 si 300 ≤ x ≤ 600
300
f (x) =



0 en otros casos

a) ¿Cuál es la venta diaria esperada?


b) ¿Cuánto deben ser las ventas para que la probabilidad de vender por encima de
EP

dicha cantidad sea 0.95?


UD

c) ¿Cuál es la probabilidad de que en un dı́a se superen los 500 nuevos soles en


ventas?
d ) ¿Cuál es la probabilidad de que en un dı́a cualquiera las ventas sean 460 nuevos
A
soles?
IM
S -L
PU
M
CA

E
AD

-I I
22
20
Capı́tulo 6

Distribuciones muestrales
EP
UD

6.1. Introducción
En el capı́tulo 1 destacamos dos conceptos importantes en un estudio estadı́stico: La
población y la muestra. La población es el conjunto de todos los elementos de interés en un
A
estudio y una muestra es un subconjunto de la población. También en ese capı́tulo definimos
IM

la inferencia estadı́stica o estadı́stica inferencial como la parte de la estadı́stica que usa


-L

información proveniente de una muestra para generalizar y obtener conclusiones o tomar


S

decisiones acerca de la población en estudio.


PU

En el capı́tulo 2, estudiamos la estadı́stica descriptiva que cuenta con herramientas


M

útiles en el análisis exploratorio de los datos provenientes de una muestra, como tablas o
CA

distribuciones de frecuencias, gráficos y medidas descriptivas o resúmenes numéricos para


extraer información de interés que luego será útil para la inferencia.
En el capı́tulo 3 estudiamos el concepto fundamental para la inferencia estadı́stica: la
probabilidad. En el capı́tulo 4 definimos las variables aleatorias discretas y sus distribuciones
de probabilidad ası́ como algunos modelos discretos frecuentes como el binomial y de Poisson.
En el capı́tulo 5 aprendimos sobre las variables continuas y las funciones de densidad, ası́ como
algunos modelos continuos comunes como el normal, exponencial y uniforme. El objetivo en
los capı́tulos 4 y 5 era comprender el comportamiento de las poblaciones (y sus parámetros)
que pueden ser de interés y sobre las cuales nos interesa sacar conclusiones o tomar una
E
AD

decisión.
Como en la práctica uno no analiza o trabaja con todos los elementos de la población de
interés sino con una parte, osea una muestra, es necesario entender que las medidas de una
muestra, es decir los estadı́sticos, especialmente la media muestral: x y la proporción muestral:
p, serán ahora las variables de interés y por tanto deberemos estudiar sus caracterı́sticas
y como se comportan o distribuyen. Por tanto en el capı́tulo 6 abordaremos un concepto
importante: las distribuciones muestrales, es decir, la distribución de los estadı́sticos de una
muestra, especı́ficamente la distribución de x y la distribución de p.
-I I

6.2. Distribuciones muestrales


22

En muchas aplicaciones estamos interesados en realizar inferencias estadı́sticas, esto es,


20

utilizar estadı́sticos calculados a partir de muestras para estimar los valores de los parámetros
de la población. En este capı́tulo aprenderemos sobre la media muestral, x, un estadı́stico
utilizado para estimar µ, la media poblacional (parámetro). También aprenderemos acerca de

245
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 246

la proporción muestral, p, un estadı́stico utilizado para estimar p, la proporción poblacional


(parámetro). El principal problema al realizar una inferencia estadı́stica radica en obtener
conclusiones sobre la población, no sobre la muestra. Por ejemplo, una persona que se encarga
de realizar encuestas polı́ticas se interesa en los resultados muestrales sólo como mecanismo
para estimar la proporción de votos real que recibirá cada uno de los candidatos en la
población de votantes. En este caso sólo le interesa utilizar la proporción muestral calculada
a partir de una muestra de votantes para estimar la proporción poblacional.
Hipotéticamente, al utilizar un estadı́stico muestral para estimar un parámetro
poblacional, se debe examinar toda posible muestra que pudiera presentarse. Una
EP

distribución muestral es la distribución de probabilidad de un estadı́stico de la muestra y


UD

es formada cuando muestras de tamaño n son repetidamente seleccionadas de una población.


Si el estadı́stico de interés es la media muestral x, entonces se genera la distribución muestral
de las medias de las muestras o distribución de x. Si el estadı́stico de interés es la proporción
muestral p, entonces se genera la distribución muestral de las proporciones de las muestras o
A
IM

distribución de p.
-L

6.3. Distribución muestral de x


S

Uno de los procedimientos estadı́sticos más comunes es usar la media de la muestra, x,


PU

para hacer inferencias acerca de la media de la población, µ. Este proceso se muestra en


M

la figura 6.1. Esto nos debe llevar a entender la generación de la Distribución muestral de
CA

x. Ası́, en cada repetición del proceso podemos anticipar la obtención de un valor distinto
de la media de la muestra x, la cual se convierte en la variable de interés. Por lo tanto, La
distribución de probabilidad de todos los valores posibles de la media de la muestra x se le
conoce como distribución muestral de la media de la muestra o distribución muestral de x.

Seleccionar
una muestra
Población con media µ =?
de tamaño n
de la población
E
AD

Calcular la media
Se emplea el valor
en la muestra
de x para hacer
seleccionada y
inferencias acerca
obtenemos un
del valor de µ
valor para x

Figura 6.1: Proceso para realizar inferencias acerca de la media de la población, µ, a partir de la
-I I

media de una muestra, x, tomada de dicha población de estudio.


22
20

6.3.1. Caracterı́sticas de la distribución de x


El objetivo es describir las propiedades de la distribución muestral de x, incluyendo el
valor esperado o media de x, su desviación estándar y la forma de su distribución.
Como veremos, el conocimiento de la distribución muestral de x nos permitirá hacer
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 247

afirmaciones probabilı́sticas acerca del error incurrido cuando se usa x para estimar µ.
Comencemos considerando la media de todos los valores posibles de x, es decir, el valor
esperado de x.
Valor esperado de x (Propiedad de imparcialidad de la media muestral)
La media muestral es imparcial porque la media o promedio de todas las medias
muestrales posibles (de muestras con tamaño “n”) es igual a la media poblacional µ. Es
decir: E(x) = µ.
Esta propiedad se demuestra por medio de un sencillo ejemplo. Supogamos una población
de 4 valores: 1, 2, 3, 4. Si calculamos la media (µ) y la desviación estándar (σ) de esa población
EP

de 4 elementos tenemos que:


UD

1+2+3+4 (1 − 2.5)2 + (2 − 2.5)2 + (3 − 2.5)2 + (4 − 2.5)2 5


µ= = 2.5 y σ 2 = = = 1.25
4 4 4

y por lo tanto, σ = 1.25 ≈ 1.12.
A
IM

Consideremos ahora que tomamos muestras de tamaño igual a 2 de la población. Con sólo
4 valores en la población, hay únicamente 16 posibles muestras de tamaño igual a 2 (Recuerde
-L

la regla de conteo 1, vista en el capı́tulo 3: k 2 = 42 = 16) suponiendo que el muestreo se


S
PU

realiza con reemplazo, es decir, se reemplaza cada valor seleccionado antes de realizar una
nueva elección. La Tabla 6.1 presenta las 16 muestras posibles con sus respectivos promedios.
M
CA

Muestra Elementos de la muestra Media de la muestra


1 1,1 x1 =1
2 1,2 x2 =1.5
3 1,3 x3 =2
4 1,4 x4 =2.5
5 2,1 x5 =1.5
6 2,2 x6 =2
E

7 2,3 x7 =2.5
AD

8 2,4 x8 =3
9 3,1 x9 =2
10 3,2 x10 =2.5
11 3,3 x11 =3
12 3,4 x12 =3.5
13 4,1 x13 =2.5
-I I

14 4,2 x14 =3
22

15 4,3 x15 =3.5


20

16 4,4 x16 =4

Tabla 6.1: Las 16 muestras posibles de tamaño igual a 2 tomadas de la población de 4 valores.
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 248

Las 16 medias obtenidas forman la distribución de las medias de las muestras de tamaño
igual a 2 tomadas de la población de 4 valores. Si calcula el promedio de las medias de
las 16 muestras, la media de estos valores, µx = E(x), es igual a 2.5, que es también la
media poblacional µ. Puesto que la media de las 16 medias muestrales es igual a la media
poblacional, decimos que la media muestral es un estimador imparcial de la media poblacional.
Por lo tanto, aunque no sepa qué tan cercana está la media muestral de cualquier muestra
seleccionada a la media poblacional, al menos estará seguro de que la media de todas las
medias muestrales posibles que se pueden seleccionar es igual a la media poblacional.
En la Figura 6.2 aparece la distribución de probabilidad de las medias de las muestras de
EP

tamaño igual a 2 tomadas de la población de 4 valores.


UD

A
IM
S -L
PU
M
CA

E
AD

Figura 6.2: Distribución de probabilidad de las medias muestrales del ejemplo dado.

Desviación estándar de x (o Error estándar de la media)


-I I

Ahora nos referiremos a la desviación estándar de los valores de x, es decir, la desviación


22

estándar de la distribución de x. Dicha medida de dispersión la simbolizaremos ası́: σx .


20

Se puede demostrar que, con muestreo aleatorio simple, la expresión para la desviación
estándar de x dependerá de si la población es finita o infinita. Según sea el caso, la desviación
estándar de x tendrá las siguientes expresiones:
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 249

Si la población es finita: r
N −n σ
σx = .√ (6.1)
N −1 n
Si la población es infinita:
σ
σx = √ (6.2)
n
donde:
σ= Desviación estándar de la población.
n= Tamaño de la muestra.
EP

N = Tamaño de la población. r
N −n
UD

Al observar las expresiones (6.1) y (6.2), la diferencia está en el factor , el cual


N −1
es llamado factor de corrección para población finita. En muchos casos prácticos de muestreo
se ve que la población que se maneja aunque finita, es bastante “grande” comparado r con el
N −n
tamaño de la muestra, el cual es relativamente “pequeño”. En esos casos el factor
A
N −1
IM

es cercano a l. En consecuencia, la diferencia entre los valores de la desviación estándar de


x para los casos de población finita e infinita se hace despreciable. Cuando esto sucede, la
S -L

expresión (6.2) se vuelve una aproximación muy buena para la desviación estándar de x
PU

aunque la población sea finita.


M

Entonces, cuando se desee calcular la desviación estándar de x se empleará la expresión


CA

(6.2) siempre y cuando la población sea infinita o la población sea finita y el tamaño de la
n
muestra sea como máximo el 5 % del tamaño de la población, esto es ≤ 0.05. En caso
N
n
que > 0.05 deberá tomarse en cuenta el factor de corrección para población finita para
N
calcular σx .
Un detalle importante al analizar la expresión (6.2) es que cuando el tamaño de la
muestra aumenta, la medida de dispersión σx disminuye. Es decir, a medida que el número
de observaciones obtenidas aumenta, el promedio de los valores observados estará más cerca
de µ.
Posteriormente veremos que el valor de σx es útil para determinar lo alejado que pueda
E
AD

estar la media de la muestra de la media de la población. Debido al papel que desempeña


σx en el cálculo de los errores posibles es que se le conoce como error estándar de la media.
De manera general el término error estándar hace referencia a la desviación estándar de un
estimador puntual.
Forma de la distribución de x
La última caracterı́stica que nos hace falta para tener definida completamente la
distribución de x es lo que respecta a la forma de la misma. La forma de la distribución
de x depende de la distribución de la población. Tomaremos en cuenta dos situaciones:
-I I
22

1. Si la población tiene distribución normal, entonces la distribución de x será igualmente


20

normal, para cualquier tamaño de muestra.

2. Si la población no tiene distribución normal o la distribución es desconocida, entonces


debemos basarnos en una herramienta estadı́stica muy importante llamada: Teorema
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 250

del Lı́mite Central (TLC) para identificar la forma que tiene la distribución de x. Uno
de los enunciados del TLC aplicado a la distribución muestral de x es el siguiente:
Teorema del lı́mite central:Al seleccionar muestras aleatorias simples de tamaño
“n” de una población, la distribución muestral de la media x se puede aproximar con
una distribución normal, cuando el tamaño de la muestra es grande. Esta aproximación
mejora con muestras más grandes. Una muestra es grande en la práctica si el tamaño
de la misma es como mı́nimo de 30 elementos (n ≥ 30).

La figura 6.3 muestra cómo se aplica el teorema del lı́mite central para poblaciones con
EP

distintas distribuciones a la normal. Se observa la forma que va adoptando la distribución


UD

muestral de x cuando aumenta el tamaño de la muestra. Cuando las muestras son de tamaño
dos, vemos que la distribución muestral de x comienza a tener una apariencia distinta de la
distribución de la población. Para muestras de tamaño 6 vemos que las distribución muestral
de x comienzan a tener una apariencia acampanada. Finalmente, las muestras de tamaño 30
A
hacen que las distribuciones muestrales de x sean aproximadamente normales. Ası́ es que se
IM

concluye que para muestras suficientemente grandes (n ≥ 30), la distribución muestral de x


-L

se puede aproximar con una distribución normal.


S
PU
M
CA

E
AD

-I I
22
20

Figura 6.3: Aplicación del Teorema del lı́mite Central para diferentes poblaciones.(Lind et al., 2012)
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 251

6.3.2. Uso de la Distribución muestral de x en el cálculo de probabilidades


Como se comentó en 6.1, los estadı́sticos, en este caso la media muestral: x (y la proporción
muestral: p de la cual hablaremos más adelante), es ahora la variable de interés. Por lo tanto,
cuando se trabaja con la distribución muestral de x la expresión que se emplea para calcular
la variable normal estándar Z, es la siguiente:

x − µx x − µ
z= = σ (6.3)
σx √
EP

n
UD

Nota: Observe que para σx se está considerando la expresión (6.2), es decir, el caso de
población infinita. Si estuviera en el caso de población finita deberá usar para σx la expresión
(6.1).
A continuación presentamos algunos problemas resueltos para familiarizarse con el uso
A
IM

de la distribución muestral de x en el cálculo de probabilidades.


-L

Problemas resueltos.
S
PU

1. Se sabe que los pesos de una población de novillos de 18 meses de edad tienen una
M

distribución aproximadamente normal, con una media de 178 Kg y con desviación


CA

estándar de 6 kg. Si se toma una muestra de 9 novillos:

a) ¿Cuál es la probabilidad de que el peso promedio de la muestra sea mayor a 181


kg?
Sea la variable aleatoria: X=“peso del novillo (Kg)”. Según el enunciado X tiene
media µ = 178 kg, desviación estándar σ = 6 kg y sigue distribución normal, por
tanto, X ∼ N (178, 62 ). Esta variable hace referencia a la población de novillos.
Ahora si se toma una muestra de 9 novillos y la pregunta de este apartado hace
referencia a la probabilidad de que el peso promedio de la muestra asuma valores
E

superiores a 181 kg entonces estamos ante la variable de interés:


AD

X=“peso promedio en una muestra de 9 novillos (Kg)”.


Como se explica en la sección 6.3.1, las caracterı́sticas de la distribución de X
serán:
E(X) = µ, es decir, E(X) = µ = 178 kg.
Como no tenemos información sobre el tamaño de la población, consideramos
que es infinita, por tanto para la desviación estándar de x se empleará la
σ 6
expresión (6.2), es decir: σx = √ = √ = 2 kg.
n 9
-I I

Como la variable poblacional X=“peso del novillo (Kg)” tiene distribución


22

normal entonces la distribución de X tendrá igualmente distribución normal


20

(Como se explica en la sección 6.3.1 referente a la Forma de la distribución


de x).

Entonces concluimos que: X ∼ N 178, 22 . Sobre esta variable de interés

deseamos calcular, P X > 181 , entonces:
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 252

 
 181 − 178
P X > 181 = P Z > = P (Z > 1.5) = 0.5 − 0.43319 = 0.06681.
2

Por tanto P X > 181 es igual a P (Z > 1.5) (Figura 6.4).
EP
UD

A
IM

178 181 X
S -L
PU
M
CA

0 1.5 Z

 
Figura 6.4: Ilustración del cálculo de P X > 181 para X ∼ N 178, 22 .
E
AD

b) ¿Cuál es la probabilidad de que el peso promedio de la muestra esté entre 175 kg


y 181 kg?

Deseamos calcular, P 175 < X < 181 , entonces:
 
 175 − 178 X − 178 181 − 178
P 175 < X < 181 = P < <
2 2 2
= P (−1.5 < Z < 1.5)
-I I

= 0.43319 + 0.43319 = 0.86638 o 86.64 %.


22


20

Por tanto P 175 < X < 181 es igual a P (−1.5 < Z < 1.5) (Figura 6.5).
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 253
EP

175 178 181 X


UD

A
IM
S -L
PU
M
CA

−1.5 0 1.5 Z

 
Figura 6.5: Ilustración del cálculo de P 175 < X < 181 para X ∼ N 178, 22 .

c) y resulta que el peso promedio de la muestra es mayor que 179 kg.¿Cuál es la


probabilidad de que el peso promedio de la muestra sea mayor que 181 kg?
Tenemos que calcular una probabilidad condicional, a saber,
 
E

 P X > 181 y X > 179 P X > 181


AD

P X > 181 | X > 179 =  = =


P X > 179 P X > 179
 
181 − 178
P Z>
2 P (Z > 1.5)
=  = =
179 − 178 P (Z > 0.5)
P Z>
2
0.5 − 0.43319
= = 0.2165 o 21.65 %
0.5 − 0.19146

d ) y resulta que el peso promedio de la muestra es menor que 179 kg.¿Cuál es la


-I I

probabilidad de que el peso promedio de la muestra sea mayor que 177 kg?
22
20
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 254

Tenemos que calcular una probabilidad condicional, a saber,


 

P X > 177 y X < 179 P 177 < X < 179
P X > 177 | X < 179 =  =  =
P X < 179 P X < 179
 
177 − 178 179 − 178
P <Z<
2 2 P (−0.5 < Z < 0.5)
=   = =
179 − 178 P (Z < 0.5)
P Z<
2
0.19146 + 0.19146
= = 0.5538 o 55.38 %
0.5 + 0.19146
EP

2. La compañı́a de baterı́as RINDEMAX afirma que sus baterı́as tienen una vida media de
UD

60 meses y una desviación estándar de 9 meses. Si se toma una muestra de 36 baterı́as:

a) Calcule el error estándar de la media.


A
Sea la variable aleatoria: X=“Tiempo de vida de una baterı́a (meses)”. Según
IM

el enunciado X tiene media µ=60 meses, desviación estándar σ=9 meses, y no


-L

proporciona información alguna sobre su distribución, por lo que consideramos es


S

desconocida. Esta variable hace referencia a la población de baterı́as producidas


PU

por RINDEMAX.
M

Ahora si se toma una muestra de 36 baterı́as y las preguntas se centran en el


CA

tiempo de vida media de la muestra, entonces estamos ante la variable de interés:


X=“Tiempo de vida media en una muestra de 36 baterı́as (meses)”.
Como se comenta en la sección 6.3.1, el error estándar de la media no es
otra cosa más que la desviación estándar de x, es decir, σx . Como no tenemos
información sobre el tamaño de la población, consideramos que es infinita, por
tanto para la desviación estándar de x se empleará la expresión (6.2), es decir:
σ 9
σx = √ = √ = 1.5 meses.
n 36
b) ¿Cuál es la probabilidad de que la vida media de la muestra sea menor que 58
E

meses?
AD

Como se ha definido en el apartado anterior, la variable de interés es, X=“Tiempo


de vida media en una muestra de 36 baterı́as (meses)”. Como se explica en la
sección 6.3.1, las caracterı́sticas de la distribución de X serán:
E(X) = µ, es decir, E(X) = µ = 60 meses.
σ 9
Del apartado anterior sabemos que: σx = √ = √ = 1.5 meses.
n 36
Como en el problema no se menciona qué distribución tiene la variable
poblacional X=“Tiempo de vida de una baterı́a (meses)” y sabemos que la
-I I

muestra tomada es de 36 baterı́as (n ≥ 30), aplicando el Teorema del Lı́mite


22

Central podemos afirmar que la distribución de X se puede aproximar con una


20

distribución normal (Como se explica en la sección 6.3.1 referente a la Forma


de la distribución de x).

Entonces concluimos que: X ∼ N 60, 1.52 . Sobre esta variable de interés

deseamos calcular, P X < 58 , entonces:
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 255

 
 58 − 60
P X < 58 = P Z< = P (Z < −1.33) = 0.5 − 0.40824 = 0.09176
1.5

Por tanto P X < 58 es igual a P (Z < −1.33) (Figura 6.6).
EP
UD

A
IM

58 60 X
S -L
PU
M
CA

−1.33 0 Z

 
Figura 6.6: Ilustración del cálculo de P X < 58 para X ∼ N 60, 1.52 .
E
AD

c) Determine la probabilidad de que la vida media de la muestra esté entre 57 y 63


meses.

Deseamos calcular, P 57 < X < 63 , entonces:
 
 57 − 60 X − 60 63 − 60
P 57 < X < 63 = P < <
1.5 1.5 1.5
= P (−2 < Z < 2)
-I I

= 0.47725 + 0.47725 = 0.9545 o 95.45 %.


22


20

Por tanto P 57 < X < 63 es igual a P (−2 < Z < 2) (Figura 6.7).
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 256
EP

57 60 63 X
UD

A
IM
S -L
PU
M
CA

−2 0 2 Z

 
Figura 6.7: Ilustración del cálculo de P 57 < X < 63 para X ∼ N 60, 1.52 .

d ) y resulta que la vida media de la muestra es menor que 63 meses ¿Cuál es la


probabilidad de que la vida media de la muestra sea mayor que 60.5 meses?
Tenemos que calcular una probabilidad condicional, a saber,
 
E

 P X > 60.5 y X < 63 P 60.5 < X < 63


AD

P X > 60.5 | X < 63 =  =  =


P X < 63 P X < 63
 
60.5 − 60 63 − 60
P <Z<
1.5 1.5 P (0.33 < Z < 2)
=   = =
63 − 60 P (Z < 2)
P Z<
1.5
0.47725 − 0.12930
= = 0.3561 o 35.61 %
0.5 + 0.47725
-I I

6.4. Distribución muestral de p


22

Considere una variable categórica que cuente con dos clasificaciones: el cliente prefiere
20

su marca o el cliente no prefiere su marca. Lo que resulta de interés es la proporción de


elementos que forman parte de una de las categorı́as; por ejemplo, la proporción de clientes
que prefieren su marca.
La proporción de la población, que se representa por medio de p, es la razón entre el
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 257

número de elementos en la población que cuentan con la caracterı́stica de interés y el tamaño


de la población. La proporción muestral que se representa por medio de p, es la razón entre el
número de elementos en la muestra que cuentan con la carácterı́stica de interés y el tamaño
de la muestra.
La proporción muestral p es el estadı́stico que se utiliza para estimar la proporción
poblacional p (parámetro), es decir, en muchos situaciones en los negocios y la economı́a se usa
la proporción muestral p para hacer inferencias estadı́sticas sobre la proporción poblacional
p.
La proporción muestral p, al igual que la proporción poblacional p, asume valores que
EP

van de 0 a 1.
UD

La generación de la Distribución muestral de p es similar a la generación de la Distribución


muestral de x (ver Figura 6.1), pero entendiendo que ahora en cada repetición del proceso
podemos anticipar la obtención de un valor distinto de la proporción de la muestra p, la cual
se convierte en la variable de interés. Por lo tanto, La distribución de probabilidad de todos
A
IM

los valores posibles de la proporción de la muestra p se le conoce como distribución muestral


de la proporción de la muestra o distribución muestral de p.
S -L

6.4.1. Caracterı́sticas de la distribución de p


PU

El objetivo aquı́ es describir las propiedades de la distribución muestral de p, incluyendo


M

el valor esperado o media de p, su desviación estándar y la forma de su distribución.


CA

Como veremos, el conocimiento de la distribución muestral de p nos permitirá hacer


afirmaciones probabilı́sticas acerca del error incurrido cuando se usa p para estimar p.
Comencemos considerando el valor esperado de p.
Valor esperado de p
El valor esperado de p, es la media de todos los valores posibles de p, y se puede expresar
como sigue:
E(p) = p,

esta expresión indica que la media de todos los valores posibles de p es igual a la proporción
E

de la población, p.
AD

Desviación estándar de p (o Error estándar de la proporción)


Ahora nos referiremos a la desviación estándar de los valores de p, es decir, la desviación
estándar de la distribución de p. Dicha medida de dispersión la simbolizaremos ası́: σp .
La expresión para la desviación estándar de p, al igual que la desviación estándar de x,
dependerá de si la población es finita o infinita. Según sea el caso, la desviación estándar de
p tendrá las siguientes expresiones:

Si la población es finita:
-I I

r r
N −n p(1 − p)
22

σp = . (6.4)
N −1 n
20

Si la población es infinita: r
p(1 − p)
σp = (6.5)
n
donde:
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 258

p= proporción poblacional.
n= Tamaño de la muestra.
N = Tamaño de la población. r
N −n
Al observar las expresiones (6.4) y (6.5), la diferencia está en el factor , el cual
N −1
es llamado factor de corrección para población finita. En muchos casos prácticos de muestreo
se ve que la población que se maneja aunque finita, es bastante “grande” comparado r con el
N −n
tamaño de la muestra, el cual es relativamente “pequeño”. En esos casos el factor
N −1
es cercano a l. En consecuencia, la diferencia entre los valores de la desviación estándar de
EP

p para los casos de población finita e infinita se hace despreciable. Cuando esto sucede, la
UD

expresión (6.5) se vuelve una aproximación muy buena para la desviación estándar de p
aunque la población sea finita.
Entonces, cuando se desee calcular la desviación estándar de p se empleará la expresión
(6.5) siempre y cuando la población sea infinita o la población sea finita y el tamaño de la
A
n
muestra sea como máximo el 5 % del tamaño de la población, esto es ≤ 0.05. En caso
IM

N
n
que > 0.05 deberá tomarse en cuenta el factor de corrección para población finita para
-L

N
calcular σp .
S
PU

Un detalle importante al analizar la expresión (6.5) es que cuando el tamaño de la


muestra aumenta, la medida de dispersión σp disminuye. Es decir, a medida que el número
M

de observaciones obtenidas aumenta, la proporción muestral de los valores observados estará


CA

más cerca de p.
Posteriormente veremos que el valor de σp es útil para determinar lo alejado que pueda
estar la proporción de la muestra de la proporción de la población. Debido al papel que
desempeña σp en el cálculo de los errores posibles es que se le conoce como error estándar
de la proporción.
Forma de la distribución de p
La última caracterı́stica que nos hace falta para tener definida completamente la
distribución de p es lo que respecta a la forma de la misma. La forma de la distribución
E

de p se obtiene aplicando el TLC teniendo el siguiente resultado:


AD

Al seleccionar muestras aleatorias simples de tamaño “n” de una población, la distribución


muestral de la proporción p se puede aproximar con una distribución normal, cuando el
tamaño de la muestra es grande. En el caso de p, se puede considerar que el tamaño de la
muestra es suficientemente grande cuando se cumplen las dos condiciones siguientes:

n.p ≥ 5

n.(1 − p) ≥ 5
-I I

6.4.2. Uso de la Distribución muestral de p en el cálculo de probabilidades


22
20

Como se comentó en 6.1, los estadı́sticos, en este caso la proporción muestral: p, es ahora
la variable de interés. Por lo tanto, cuando se trabaja con la distribución muestral de p la
expresión que se emplea para calcular la variable normal estándar Z, es la siguiente:
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 259

p−p p−p
z= =r (6.6)
σp p(1 − p)
n
Nota: Observe que para σp se está considerando la expresión (6.5), es decir, el caso de
población infinita. Si estuviera en el caso de población finita deberá usar para σp la expresión
(6.4).
A continuación presentamos algunos problemas resueltos para familiarizarse con el uso
EP

de la distribución muestral de p en el cálculo de probabilidades.


UD

Problemas resueltos.

1. Un alcalde recibió el 52 % de los votos en la última elección. Un año después el


A
alcalde quiere estudiar su popularidad. Si su popularidad no ha cambiado, ¿cuál es
IM

la probabilidad de que más del 50 % de una muestra de 300 electores lo apoye?


-L

De acuerdo a la información del problema tenemos que la proporción de votantes que


S
PU

apoyaron al alcalde la última elección fue 0.52, osea, p=0.52.


M

Ahora si se toma una muestra de 300 electores y la pregunta de este apartado hace
CA

referencia a la probabilidad de que la proporción de votantes que lo apoyen en la muestra


sea mayor a 0.5, entonces estamos ante la variable de interés:
p=“proporción de votantes que apoyan al alcalde en una muestra de 300 electores”.
Como se explica en la sección 6.4.1, las caracterı́sticas de la distribución de p serán:

E(p) = p, es decir, E(p) = p = 0.52.


Como no tenemos información sobre el tamaño de la población de votates,
consideramos que es infinita, por tanto
r para la desviación
r estándar de p se empleará
p(1 − p) 0.52(1 − 0.52)
E

la expresión (6.5), es decir: σp = = ≈ 0.029.


n 300
AD

Como se trabaja con una muestra 300 electores, aplicamos el Teorema del Lı́mite
Central para verificar si se cumplen las dos condiciones: n.p =≥ 5 y n.(1 − p) ≥ 5,
para concluir que la distribución de p se puede aproximar con una distribución
normal (Como se explica en la sección 6.4.1 referente a la Forma de la distribución
de p). Operando tenemos que n.p = 300×0.52 = 156 y n.(1−p) = 300×0.48 = 144,
verificándose que dichas condiciones se cumplen, por tanto la distribución de p se
puede aproximar con una distribución normal.

-I I

Entonces concluimos que: p ∼ N 0.52, 0.0292 . Sobre esta variable de interés deseamos
22

calcular, P (p > 0.50), entonces:


20

 
0.50 − 0.52
P (p > 0.50) = P Z > = P (Z > −0.69) = 0.25490 + 0.50 = 0.7549.
0.029

Por tanto P (p > 0.50) es igual a P (Z > −0.69) (Figura 6.8)


CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 260
EP

0.50 0.52 p
UD

A
IM
S -L
PU
M
CA

−0.69 0 Z


Figura 6.8: Ilustración del cálculo de P (p > 0.50) para p ∼ N 0.52, 0.0292 .

2. De acuerdo con la Asociación Nacional de restaurantes, el 20 % de los restaurantes más


elegantes han establecido polı́ticas que restringen el uso de teléfonos celulares. Si usted
selecciona una muestra aleatoria de 100 de los restaurantes más elegantes,
E

a) ¿Cuál es la probabilidad de que la muestra contenga entre el 15 % y 25 % de los


AD

que han establecido polı́ticas que restringen el uso de teléfonos celulares?


De acuerdo a la información del problema tenemos que la proporción de
restaurantes más elegantes que han establecido polı́ticas que restringen el uso
de teléfonos celulares 0.20, osea, p=0.20.
Ahora si se toma una muestra de 100 de los restaurantes más elegantes y la
pregunta de este apartado hace referencia a la probabilidad de que la proporción
de restaurantes más elegantes que han establecido polı́ticas que restringen el uso
-I I

de teléfonos celulares en la muestra esté entre 0.15 y 0.25, entonces estamos ante
22

la variable de interés:
20

p=“proporción de restaurantes más elegantes que han establecido polı́ticas que


restringen el uso de teléfonos celulares en una muestra de 100”.
Como se explica en la sección 6.4.1, las caracterı́sticas de la distribución de p serán:
E(p) = p, es decir, E(p) = p = 0.20.
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 261

Como no tenemos información sobre el tamaño de la población de restaurantes


elegantes, consideramos que es bastante grande, por tanto parar la desviación
p(1 − p)
estándar de p se empleará la expresión (6.5), es decir: σp = =
r n
0.20(1 − 0.20)
= 0.04.
100
Como se trabaja con una muestra 100 restaurantes elegantes, aplicamos el
Teorema del Lı́mite Central para verificar si se cumplen las dos condiciones:
n.p =≥ 5 y n.(1 − p) ≥ 5, para concluir que la distribución de p se
puede aproximar con una distribución normal (Como se explica en la sección
EP

6.4.1 referente a la Forma de la distribución de p). Operando tenemos que


UD

n.p = 100 × 0.20 = 20 y n.(1 − p) = 100 × 0.80 = 80, verificándose que dichas
condiciones se cumplen, por tanto la distribución de p se puede aproximar con
una distribución normal.

A
Entonces concluimos que: p ∼ N 0.20, 0.042 . Sobre esta variable de interés
IM

deseamos calcular, P (0.15 < p < 0.25), entonces:


-L

 
0.15 − 0.20 0.25 − 0.20
S

P (0.15 < p < 0.25) = P <Z< =


PU

0.04 0.04
= P (−1.25 < Z < 1.25) = 0.39435 + 0.39435 = 0.7887.
M
CA

Por tanto P (0.15 < p < 0.25) es igual a P (−1.25 < Z < 1.25) (Figura 6.9)
b) Hay una probabilidad del 95 % de que la proporción muestral se encuentre ¿dentro
de cuáles lı́mites simétricos de la proporción poblacional?
Lo que se pide en este apartado es lo siguiente: P (p1 < p < p2 ) = 0.95, como se
aprecia en la Figura 6.10.
Entonces para hallar los lı́mites simétricos p1 y p2 respecto de la proporción
poblacional p=0.20, procedemos como sigue:
En la Tabla de distribución normal si leemos un área de 0.475, el valor de Z
E
AD

correspondiente será 1.96, por lo tanto Z2 = 1.96 y por simetrı́a Z1 = −1.96 (ver
Figura 6.11).
Conocidos Z1 y Z2 , podemos establecer las siguientes dos expresiones para despejar
y hallar p1 y p2 respectivamente:

p1 − 0.20
−1.96 =
0.04
p2 − 0.20
1.96 = ,
0.04
-I I

Despejando en cada caso obtenemos p1 =0.1216 y p2 =0.2784.


22
20

c) y resulta que la proporción de restaurantes más elegantes que restringen uso


de celular en la muestra es menor que 0.25 ¿Cuál es la probabilidad de que la
proporción en la muestra sea mayor que 0.18?
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 262
EP

0.15 0.20 0.25 p


UD

A
IM
S -L
PU
M
CA

−1.25 0 1.25 Z


Figura 6.9: Ilustración del cálculo de P (0.15 < p < 0.25) para p ∼ N 0.20, 0.042 .

0,475 0,475
E
AD

p1 0.20 p2 p
-I I
22
20

Figura 6.10: Ilustración de P (p1 < p < p2 ) = 0.95


CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 263

0,475 0,475
EP

p1 0.20 p2 p
UD

0,475 0,475
A
IM
S -L
PU
M
CA

Z1 = − 1.96 0 Z2 = 1.96 Z

Figura 6.11: Ilustración de P (p1 < p < p2 ) = 0.95 y definición de Z2 = 1.96 y por simetrı́a Z1 = −1.96

Tenemos que calcular una probabilidad condicional, a saber,

P (p > 0.18 y p < 0.25) P (0.18 < p < 0.25)


P (p > 0.18 | p < 0.25) = = =
P (p < 0.25) P (p < 0.25)
 
0.18 − 0.20 0.25 − 0.20
E

P <Z<
AD

0.04 0.04
=   =
0.25 − 0.20
P Z<
0.04
P (−0.50 < Z < 1.25)
= =
P (Z < 1.25)
0.19146 + 0.39435
= = 0.6550 o 65.50 %
0.50 + 0.39435
-I I
22
20
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 264

6.5. Problemas propuestos


1. El tiempo que un cajero de banco dedica a cada cliente tiene distribución normal con
media µ=3.10 minutos y desviación estándar σ=0.40 minutos. Si se selecciona una
muestra aleatoria de 16 clientes.

a) ¿Cuál es la probabilidad de que el tiempo medio dedicado a cada cliente sea al


menos de 3 minutos?
b) ¿Cuál es la probabilidad de que el tiempo medio dedicado a cada cliente se
encuentre entre 3.1 y 3.2 minutos?
EP

c) ¿Existe un 85 % de probabilidad de que el tiempo medio muestral sea menor a qué


UD

valor?
d ) ¿Existe un 75 % de probabilidad de que el tiempo medio muestral sea mayor a qué
valor?
A
e) Existe un 90 % de probabilidad de que el tiempo medio muestral se encuentre
IM

¿entre cuáles dos valores simétricamente distribuidos alrededor del tiempo medio
-L

poblacional?
S
PU

f ) Si se selecciona una muestra aleatoria de 64 clientes, existe un 85 % de probabilidad


M

de que el tiempo medio muestral se encuentre por debajo de cuántos minutos?


CA

2. Una muestra aleatoria simple de tamaño 50 se selecciona de una población con σ=10.
Calcule el error estándar de la media en cada uno de los casos siguientes:

a) El tamaño de población es enorme o infinito.


b) El tamaño de población es N = 50,000.
c) El tamaño de población es N = 5000.
d ) El tamaño de población es N = 500.

3. El tiempo medio necesario para descargar la página de un sitio web fue de 0.8 segundos.
E
AD

Suponga que el tiempo de descarga tiene una distribución normal con una desviación
estándar de 0.2 segundos. Si se selecciona una muestra aleatoria de 30 tiempos de
descarga.

a) ¿Cuál es la probabilidad de que el tiempo medio en la muestra sea menor que 0.75
segundos?
b) ¿Cuál es la probabilidad de que el tiempo medio en la muestra se encuentra entre
0.70 y 0.90 segundos?
-I I

c) La probabilidad de que el tiempo medio en la muestra se encuentra entre dos


22

valores simétricamente distribuidos alrededor de la media poblacional es del 80 %,


20

¿Cuáles son esos dos valores?


d ) ¿Existe un 90 % de probabilidad de que el tiempo medio en la muestra sea menor
a qué valor?
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 265

4. Suponga que usted está estudiando el crecimiento de la demanda de cierto producto


y para obtener información emplea una muestra aleatoria simple de 35 consumidores.
Después de analizar la información obtenida ud. cree que el error estándar de la media
es demasiado grande. ¿Qué tamaño de muestra aleatoria simple debe usar para reducir
el error estándar a la mitad de su valor actual?

5. La dieta que utilizan en una granja para el engorde de pollos produce animales que pesan
en promedio 1950 gramos con una desviación estándar de 220 gramos. Una franquicia
de pollos a la brasa ha seleccionado al azar 30 pollos, calcule la probabilidad que:
EP

a) El peso medio de los pollos en la muestra sea menor que 1900 gramos.
UD

b) El peso medio en la muestra sea por lo menos de 2 Kg.


c) El peso medio en la muestra esté entre 1850 y 2000 gramos.
d ) Existe 25 % de probabilidad de que el peso medio muestral se encuentra por encima
A
de qué valor?
IM

e) ¿Existe el 15 % de probabilidad de que el peso medio de la muestra sea menor a


-L

qué valor?
S
PU

6. Si se seleccionan todas las muestras posibles de 64 elementos, a partir de una


M

población con media igual a 100 y desviación estándar igual a 20, ¿entre cuáles lı́mites
CA

simétricamente distribuidos en torno de la media poblacional cabe esperar se encuentre


el 80 % de las medias muestrales?

7. La cantidad de libros encuadernados diariamente por una máquina automática es una


variable aleatoria con distribución desconocida y con desviación estándar de 16 libros
por dı́a. Si se selecciona una muestra aleatoria de 49 dı́as, determinar la probabilidad
de que el número medio de libros encuadernados durante esos dı́as se encuentre a lo
sumo a 3 libros de la cantidad promedio poblacional.
E

8. Según un estudio se informa que el 76 % de los consumidores leen los ingredientes


AD

que aparecen en la etiqueta de los productos. Suponga entonces que la proporción


poblacional p = 0.76, y que de la población se toma una muestra de 400 consumidores.

a) Describa la distribución de la proporción muestral (p) de los consumidores que


leen la lista de los ingredientes.
b) ¿Cuál es la probabilidad de que la proporción muestral (p) esté a ± 0.03 o menos
de la proporción poblacional p?
c) Conteste el apartado b) pero ahora con una muestra de 750 consumidores.
-I I
22

9. El presidente de Distribuidores Dı́az, S.A., cree que el 30 % de los pedidos a su empresa


20

provienen de clientes nuevos. Si se toma una muestra aleatoria simple de 100 pedidos:

a) Describa la distribución muestral de p.


b) ¿Cuál es la probabilidad de que la proporción muestral (p) esté entre 0,20 y 0,40?
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 266

c) ¿Cuál es la probabilidad de que la proporción muestral (p) esté a ± 0,05 o menos


de la proporción poblacional p?

10. Usted planea realizar un experimento de marketing en el que los estudiantes deben
probar dos marcas de bebidas gaseosas distintas. Su labor consiste en identificar
correctamente cuál es la marca que probaron. Usted selecciona una muestra aleatoria
de 200 estudiantes y supone que no cuentan con facultades para distinguir entre
ambas marcas. (Nota: Si un individuo carece de facultades para distinguir entre las
dos bebidas gaseosas, entonces ambas marcas tienen la misma probabilidad de resultar
EP

seleccionadas.)
UD

a) ¿Cuál es la probabilidad de que en la muestra obtenga entre 50 y 60 % de


identificaciones correctas?
b) Hay una probabilidad del 90 % de que el porcentaje de identificaciones correctas
A
en la muestra se encuentre dentro de ¿cuáles lı́mites simétricos del porcentaje
IM

poblacional?
-L

c) ¿Cuál es la probabilidad de que el porcentaje de identificaciones correctas en la


S

muestral sea mayor que 65 %?


PU

d ) ¿Qué es más probable que ocurra: más del 60 % de identificaciones correctas en la


M

muestra de 200, o más del 55 % de identificaciones correctas en una muestra de


CA

1000? Explique por qué.

11. De acuerdo con un estudio el 40 % de usuarios de teléfonos celulares cuenta con uno
de alta gama. Si se selecciona una muestra de aleatoria de 50 usuarios de teléfonos
celulares:

a) Calcule el error estándar de la proporción.


b) ¿Cuál es la probabilidad de que la proporción de usuarios con celulares de alta
gama en la muestra esté entre 0,35 y 0,45?
E
AD

c) y la proporción de usuarios con celulares de alta gama en la muestra es mayor que


0.38 ¿Cuál es la probabilidad de que la proporción de usuarios con celulares de
alta gama en la muestra sea mayor que 0,42?

12. Una empresa dedicada a la investigación realizó un estudio sobre las mujeres que ocupan
cargos importantes en ambientes corporativos. El estudio concluyó que el 15 % de los
funcionarios corporativos de las empresas son mujeres. Suponga que se selecciona una
muestra aleatoria de 200 funcionarios corporativos:
-I I

a) ¿Cuál es la probabilidad de que en esta muestra menos del 15 % de los funcionarios


22

corporativos sean mujeres?


20

b) ¿Cuál es la probabilidad de que en esta muestra entre el 13 % y el 17 % de los


funcionarios corporativos sean mujeres?
c) ¿Cuál es la probabilidad de que en esta muestra entre el 10 % y el 20 % de los
funcionarios corporativos sean mujeres?
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 267

d ) Si se hubiese seleccionado una muestra de 100 funcionarios corporativos, ¿Cómo


cambiarı́an sus respuestas de los apartados a), b) y c)?

13. En una determinada población el 30 % votarı́an por el candidato presidencial del partido
M en caso de que las elecciones fuesen mañana. Si seleccionamos al azar una muestra
de 200 electores y los encuestamos, obtenga la probabilidad de que:

a) El porcentaje de personas en la muestra que expresen esa intención de voto supere


el 38 %
EP

b) El porcentaje de personas en la muestra que expresen esa intención de voto se


separe del porcentaje poblacional en más del 5 %
UD

14. En un distrito limeño la proporción de personas que manifiesta estar de acuerdo con el
incremento de multas contra aquellos que cometan acoso callejero es 0.75. Si se extrae
de manera aleatoria una muestra de 115 adultos que viven en ese distrito
A
IM

a) ¿Cuál es la probabilidad de que la proporción muestral de adultos que están de


-L

acuerdo con el incremento de multas se encuentre entre 0.73 y 0.77?


S
PU

b) Hay una probabilidad del 95 % de que la proporción muestral se encuentre ¿dentro


de cuáles lı́mites simétricos alrededor de la proporción poblacional?
M

c) Hay una probabilidad del 99 % de que la proporción muestral se encuentre ¿dentro


CA

de cuáles lı́mites simétricos alrededor de la proporción poblacional?

15. La Gerencia de recursos humanos de una empresa de telecomunicaciones realizó una


investigación sobre clima organizacional y detectó que el 80 % de los empleados
manifestaban su inconformidad con el sistema de evaluación laboral de la organización.

a) Si se seleccionan muestras aleatorias de 64 empleados, describa la distribución


muestral de la proporción de empleados inconformes con el sistema de evaluación
laboral.
E

b) Si se seleccionan muestras aleatorias de 125 empleados, describa la distribución


AD

muestral de la proporción de empleados inconformes con el sistema de evaluación


laboral.
c) Para la distribución muestral del apartado b) responda lo siguiente: Hay una
probabilidad del 95 % de que el porcentaje muestral se encuentre ¿dentro de cuáles
lı́mites simétricos alrededor del porcentaje poblacional?
d ) Para la distribución muestral del apartado a) responda lo siguiente: Hay una
probabilidad del 95 % de que la proporción muestral se encuentre ¿dentro de cuáles
-I I

lı́mites simétricos alrededor de la proporción poblacional?


22
20

16. Un artı́culo analiza los planes de jubilación para personas con edades de 50 a 70 años que
fueron empleados de tiempo completo o parcial. De los entrevistados, el 29 % dijeron
que no pensaron trabajar para obtener un salario. Si usted selecciona una muestra
aleatoria de 400 personas con edades de 50 a 70 años que fueron empleados de tiempo
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 268

completo o parcial. ¿Cuál es la probabilidad de que la muestra contenga entre el 25 y


el 30 % de los que no pensaron en trabajar para obtener un salario?

17. Explique claramente qué es el error estándar de la media.

18. Un fabricante produce tabletas de chocolate cuyo peso en gramos sigue una distribución
normal de media 125 g. y desviación tı́pica 4 g.

a) Si las tabletas se empaquetan en lotes de 25, ¿cuál es la probabilidad de que el


peso medio de las tabletas de un lote se encuentre entre 124 y 126 gramos?
EP

b) Si los lotes fuesen de 64 tabletas, ¿cuál serı́a la probabilidad de que el peso medio
UD

de las tabletas del lote superase los 124 gramos?

19. Explique claramente qué es el error estándar de la proporción.

20. Se sabe que el 48 % de los internautas que visitan una página web están satisfechos
A
IM

con la calidad de su contenido. Si se selecciona aleatoriamente una muestra de 50


internautas, ¿Cuál es la probabilidad de que la proporción muestral de los que se
-L

manifiesten satisfechas con los contenidos del sitio web sea superior a 0,54?
S
PU

21. La edad de los televidentes de un conocido programa de televisión es en promedio 20


M

años con una varianza de 36. Si se selecciona al azar una muestra de 40 personas que
CA

ven el programa:

a) ¿Cuál es la probabilidad de que la edad promedio de los encuestados supere los


21 años?
b) ¿Cuál es la probabilidad de que la edad promedio de los encuestados esté entre 18
y 22 años?
c) Existe una probabilidad del 85 % de que la edad promedio de los encuestados se
encuentre ¿entre cuáles dos valores simétricamente distribuidos alrededor de la
edad promedio poblacional?
E
AD

d ) ¿Existe un 78 % de probabilidad de que la edad promedio de los encuestados sea


mayor a qué valor?

22. La duración de las baterı́as de un determinado modelo de teléfono móvil sigue una
distribución desconocida cuya media es de 34,5 horas y su desviación tı́pica es de 6,9
horas. Si se tomara una muestra aleatoria simple de 38 de estas baterı́as:

a) ¿Cuál es la probabilidad de que la duración promedio de la muestra supere las 37


horas?
-I I
22

b) ¿Cuál es la probabilidad de que la duración promedio de la muestra esté entre 33


20

y 36 horas?
c) Existe una probabilidad del 95 % de que la duración promedio de la muestra se
encuentre ¿entre cuáles dos valores simétricamente distribuidos alrededor de la
duración promedio poblacional?
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 269

d ) Existe un 79 % de probabilidad de que la duración promedio de la muestra sea


superada por qué valor?

23. Se sabe que el peso de los recién nacidos en un determinado poblado sigue una
distribución normal con media igual a 3600 gramos y varianza igual a 78400.

a) Calcule la probabilidad de que un recién nacido pese entre 3700 y 3800 gramos.
b) ¿Cuál es la probabilidad de que un recién nacido pese 3500 gramos?
c) Si se elige un recién nacido al azar y resulta que pesa más de 3450 gramos ¿Cuál
EP

es la probabilidad de que pese más de 3650 gramos?


UD

d ) Si se elige a 8 recién nacidos, ¿Cuál es la probabilidad de que hayan al menos 2


que pesen entre 3500 y 3750 gramos?
e) Si se toma una muestra aleatoria de 196 recién nacidos ¿Cuál es la probabilidad
de que el peso promedio de la muestra esté entre 3580 y 3620 gramos?
A
IM

f ) Si se toma una muestra aleatoria de 196 recién nacidos, existe una probabilidad
del 95 % de que el peso promedio de la muestra se encuentre ¿entre cuáles dos
-L

valores simétricamente distribuidos alrededor del peso promedio poblacional?


S
PU

g) Si se toma una muestra aleatoria de 196 recién nacidos ¿Existe un 25 % de


M

probabilidad de que el peso promedio de la muestra sea superado por qué valor?
CA

h) Si se toma una muestra aleatoria de 196 recién nacidos y el peso promedio de


dicha muestra es mayor a 3560 gramos ¿Cuál es la probabilidad de que el peso
promedio de la muestra sea menor a 3600 gramos?
i ) Si se toma una muestra aleatoria de 196 recién nacidos ¿Cuál es la probabilidad
de que el peso promedio de la muestra sea 3655 gramos?

24. Según el Departamento de Inspecciones Técnicas de Seguridad de la Municipalidad


de Lima el 30 % de los edificios antiguos del centro de la ciudad tienen instalaciones
eléctricas inseguras. Si se toma uma muestra de 250 de edificios antiguos:
E
AD

a) ¿Cuál es la probabilidad de que la proporción de edificios con instalación eléctrica


insegura en dicha muestra este entre 0,25 y 0,35?
b) Existe una probabilidad del 90 % de que la proporción de la muestra se encuentre
¿entre cuáles dos valores simétricamente distribuidos alrededor de la proporción
poblacional de edificios antiguos con instalaciones eléctricas inseguras?
c) ¿Existe un 80 % de probabilidad de que la proporción de edificios antiguos con
instalaciones inseguras en la muestra sea menor a qué valor?
-I I

d ) Calcular e interpretar el error estándar de la proporción para una muestra de 200


22

edificios antiguos.
20

25. Supongamos que el tiempo que un cliente pasa en un banco sigue distribución normal
con una media de 19 min y una desviación estándar de 5 min. Si selecciona una muestra
aleatoria simple de cinco clientes, ¿cuál es la probabilidad de que el tiempo promedio
empleado sea al menos 12 min?
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 270

26. Según eventos pasados, un concesionario de automóviles sabe que el 8 % de todos los
clientes que ingresan a la sala de exposición realizan una compra. Supongamos que 100
personas entran a la sala de exposición, ¿Cuál es la probabilidad de que la proporción
de clientes que realizan una compra en dicha muestra esté entre 0,05 y 0,10?

27. Se sabe que los sueldos de los trabajadores de una empresa tienen distribución
desconocida con una media de 800 dólares. Se toma una muestra aleatoria de 35
trabajadores y se encuentra que hay una probabilidad del 5 % de que el sueldo promedio
de la muestra exceda los 866 dólares. Hallar la desviación estándar de los sueldos de
EP

los trabajadores de dicha empresa.


UD

28. Muchos de los adultos peruanos alivian el estrés comiendo dulces. Según un estudio
del Ministerio de Salud, el 46 % de los adultos peruanos comen en exceso comidas
dulces cuando están estresados. Si se selecciona una muestra aleatoria de 100 adultos
peruanos, ¿Cuál es la probabilidad de que la proporción muestral de los que comen en
A
IM

exceso comidas dulces debido al estrés esté entre 0.3 y 0.4?


-L

29. Una fábrica de autos lanza al mercado el modelo SPIKE del que se sabe que sus pesos
S

siguen una distribución normal con media igual a 3100 kilos y una desviación estándar
PU

de 130 kilos.
M

a) Si se toma una muestra aleatoria de 100 autos ¿Cuál es la probabilidad de que el


CA

peso promedio de la muestra se encuentre entre 3110 y 3130 kilos?


b) Calcular e interpretar el error estándar de la media para una muestra de 150 autos.

30. Durante dos años las ventas han estado disminuyendo en la gran cantidad de sucursales
de una cadena de supermercados. Una empresa de análisis de datos ha determinado
que un 30 % de las sucursales tiene signos de una mala administración. Si se toma una
muestra aleatoria de 95 sucursales,

a) ¿Cuál es la probabilidad de que la proporción de sucursales con problemas en su


E

administración en la muestra se encuentre entre el 25 % y 40 %?


AD

b) Existe una probabilidad del 80 % de que la proporción de sucursales con problemas


en su administración en la muestra sea superada porqué valor?

31. El peso de los paquetes de harina que produce cierta fábrica sigue una distribución
normal con media de 105 gramos y desviación estándar de 5 gramos.

a) Si se elige al azar un paquete ¿cuál es la probabilidad de que pese entre 106 y 111
gramos?
-I I

b) Si se elige al azar un paquete ¿cuál es la probabilidad de que pese menos de 105


22

gramos?
20

c) Si se elige al azar un paquete resultando que pesa más de 107 gramos, ¿cuál es la
probabilidad de que pese menos de 110 gramos?
d ) Si se toma al azar una muestra de 6 paquetes ¿cuál es la probabilidad de que al
menos 4 paquetes pesen entre 107 y 110 gramos?
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 271

e) Si se elige al azar una muestra de 85 paquetes, ¿Cuál es la probabilidad de que


más de 23 pesen entre 106 y 111 gramos?
f ) Si se toma una muestra aleatoria de 60 paquetes ¿Cuál es la probabilidad de que
el peso promedio en la muestra esté entre 104.2 y 105.8 gramos?
g) Si se toma una muestra aleatoria de 60 paquetes y el peso promedio de dicha
muestra es mayor a 104 gramos ¿Cuál es la probabilidad de que el peso promedio
de la muestra sea menor a 105 gramos?
h) Si se toma una muestra aleatoria de 60 paquetes ¿Cuál es la probabilidad de que
EP

el peso promedio de la muestra sea igual a 104.7 gramos?


UD

32. La agencia de viajes WAWATUR ha comprobado que el 25 % de sus clientes prefieren


los paquetes vacacionales que incluyen un crucero.

a) Para la elaboración de los próximos catálogos publicitarios se han publicado 500


A
ejemplares de muestra distribuidos al azar entre los clientes habituales de la
IM

agencia. ¿Cuál es la probabilidad de que el porcentaje de clientes que prefieren


-L

los paquetes vacacionales que incluyen un crucero, en la muestra, sea menor que
S
PU

27 %?
b) Calcular e interpretar el error estándar de la proporción para una muestra de 650
M
CA

clientes.

33. Analice si la información suministrada es suficiente para resolver el problema que se


plantea: En la Udep|Campus Lima se sabe que el peso promedio de las mochilas que
llevan los alumnos es 6,3 kg. Si se toma al azar una muestra de 55 estudiantes y se
quiere saber la probabilidad de que el peso promedio de las mochilas de la muestra sea
inferior a 6 kg. Esta probabilidad:

a) Se puede calcular con los datos del problema.


b) Se podrı́a calcular con los datos del problema si nos aseguraran que los pesos de
E
AD

las mochilas se distribuyen según una distribución normal.


c) No se puede calcular sin saber el número total de los alumnos de instituto.
d ) No se puede calcular, ya que el tamaño de la muestra no es lo suficientemente
grande.
e) Se podrı́a calcular si conociéramos la desviación tı́pica de los pesos de la población
de partida.
-I I
22
20
Capı́tulo 7

Estimación de parámetros
EP
UD

7.1. Introducción
En el Capı́tulo anterior, declaramos que un estimador puntual es un estadı́stico de la
muestra y se utiliza para estimar un parámetro de la población. Por ejemplo, la media
A
muestral x es un estimador puntual de la media poblacional µ y la proporción muestral p
IM

es un estimador puntual de la proporción poblacional p. Ya que no se puede esperar que


-L

un estimador puntual proporcione el valor exacto del parámetro de interés de la población,


S

se entiende que la estimación puntual no es suficiente ya que no nos indica el error que se
PU

comete en la estimación. Por esa razón, un enfoque que nos arroja mayor información consiste
M

en presentar una estimación de intervalo, osea un intervalo de valores del que se espera que
CA

se estime el parámetro poblacional de interés. Dicho intervalo de valores se conoce como


intervalo de confianza. La confianza del intervalo debe ser entendida como la fracción de
intervalos calculados a partir de una gran serie de muestras de tamaño idéntico que contienen
el verdadero valor del parámetro poblacional de interés.
Como veremos, las distribuciones muestrales de x y p que presentamos en el capı́tulo 6
desempeñan un papel importante en el desarrollo de los estimados de intervalo de µ y p.
Para realizar la estimación de un parámetro poblacional existen dos formas: la estimación
puntual y la de intervalo. En la estimación puntual, como su nombre lo indica, el valor del
parámetro poblacional se estima mediante un único valor, el cual se obtiene de una muestra
E
AD

seleccionada de la población analizada. Como ya lo hemos venido diciendo, una estimación


puntual de la media poblacional µ es la media muestral x.
Ya que generalmente la estimación puntual no es suficiente ya que no nos indica el error
que se comete en la estimación, existe un enfoque que nos arroja mayor información y consiste
en presentar una estimación de intervalo, osea un intervalo de valores del que se espera que
se estime el parámetro poblacional de interés.
Una estimación de intervalo generalmente se calcula sumando y restando un valor, llamado
margen de error (E), a la estimación puntual. La forma general de una estimación de intervalo
-I I

es la siguiente:
22

Estimación puntual ± margen de error (7.1)


20

El objetivo de una estimación de intervalo es proporcionar información sobre qué tan cerca
está la estimación puntual, proporcionada por la muestra, al valor del parámetro poblacional
correspondiente.

272
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 273

7.2. Estimación de intervalo para una media poblacional (µ)


En esta sección mostraremos cómo usar la distribución muestral de x para determinar un
estimado de intervalo de una media poblacional µ.
Siguiendo la expresión (7.1) decimos que la forma general de una estimación de intervalo
de confianza para una media poblacional µ es:

x ± E (7.2)

donde E: Margen de error. La expresión (7.2) es lo mismo que decir que el intervalo de
EP

confianza para µ es:


UD

x − E < µ < x + E. (7.3)

Margen de error o Error muestral (E)


En general, el valor absoluto de la diferencia entre un estimador puntual insesgado y el
A
parámetro de población que estima se llama margen de error o error muestral. Para el caso
IM

en el que la media de una muestra estima a una media poblacional, el error muestral es:
S -L

E =| x − µ | (7.4)
PU

En la práctica no se puede determinar el valor del error muestral, porque no se conoce


M

µ, la media de la población. Sin embargo, se puede usar la distribución muestral de x


CA

para establecer márgenes de probabilidad acerca del tamaño del error muestral. Como la
distribución muestral de x indica cómo se distribuyen sus valores en torno o alrededor de µ,
nos proporciona información acerca de las diferencias posibles entre x y µ.
Es decir, se puede probabilı́sticamente afirmar cuál es el valor máximo para el error
muestral si:

1. Conociéramos la distribución muestral de x,

2. Definiéramos el nivel de confianza para la estimación.


E

Respecto al punto 1, las caracterı́sticas de la distribución muestral de x se sugiere revisar


AD

el Capı́tulo 6, sección 6.3.1. De ello sabemos que X se aproxima a una distribución normal
(ya sea si la población sigue distribución normal o el Teorema del Lı́mite Central (TLC)
  !
σ 2
ayude a identificar la forma que tiene la distribución de x), es decir, X ∼ N µ, √ ,
n
asumiendo que σ es conocido.
Respecto al punto 2, ¿Qué es el nivel de confianza? En el caso que el objetivo sea
estimar µ, se puede definir como, la probabilidad (1-α) de que la media muestral se encuentre,
como máximo, a una distancia E de la media poblacional µ (desconocida), como se aprecia
-I I

en la Figura 7.1. El nivel de confianza (1-α) es el área bajo la curva normal estándar entre
22

α
los valores −Zα/2 y Zα/2 . El área restante es en cada cola de la distribución. Por ejemplo
20

2
si la estimación se realiza con un nivel de confianza del 90 %, es decir, 1-α=0.90, entonces
α
=0.05, lo que hará que Zα/2 =1.645. Ası́, conociéndose el nivel de confianza obtenemos el
2
valor de Z a emplear. En la Tabla 7.1 aparecen, además del mencionado, otros niveles de
confianza de uso común.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 274
EP

µ E X
UD

nivel de confianza
(1 − α)
A
IM
-L

α 2 α 2
S
PU
M
CA

− Zα 2 0 Zα 2 Z

Figura 7.1: Ilustración sobre el nivel de confianza en la distribución muestral de x.

Nivel de confianza α α/2 Zα/2


90 % 0.10 0.05 1.645
95 % 0.05 0.025 1.96
99 % 0.01 0.005 2.576
E

Tabla 7.1: Valores de “Z” para los niveles de confianza de uso común.
AD

Basados en la explicación lı́neas arriba, decimos que: Dado un nivel de confianza (1-α),
el margen de error o error muestral (E) se calcula como:

E = Zα/2 × σx (7.5)

Para el caso de tratar con una población infinita la expresión (7.5) quedarı́a ası́:
-I I

σ
E = Zα/2 × √ (7.6)
n
22
20

No se olvide que para usar la expresión (7.5) asumimos que σ es conocida y el margen
de error está siendo medido en la distribución de la variable normal estándar (Z). En caso
que σ no sea conocida, debemos emplear la desviación estándar de la muestra “s” (de una
muestra grande, n ≥ 30) como un estimado puntual de σ. Por tanto estimaremos σx através
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 275

s
de Sx = √ , por lo que, el margen de error o error muestral (E) se calcula en este caso como:
n
s
E = Zα/2 × √ . (7.7)
n
Por tanto, empleando las expresiones (7.6) y (7.7) en la expresión (7.2), definimos algunos
casos para realizar la estimación de intervalo para una media poblacional (µ):

Intervalo de confianza para la media poblacional (µ) cuando población tiene


distribución normal y σ es conocida e Intervalo de confianza para la media
EP

poblacional (µ) cuando población tiene distribución desconocida (o no es


UD

Normal), σ es conocida y la muestra empleada es grande (n ≥ 30)-Uso del Teorema


del Lı́mite Central.

σ
x ± Zα/2 × √ (7.8)
n
A
IM

Intervalo de confianza para la media poblacional (µ) cuando población tiene


-L

distribución desconocida (o no es Normal), σ es desconocida y muestra es grande


S

(n ≥ 30)-Uso del Teorema del Lı́mite Central.


PU

s
M

x ± Zα/2 × √ (7.9)
n
CA

¿Cómo se interpreta el intervalo de confianza del (1 − α) × 100 % para una media


poblacional (µ)?
Después de construir un intervalo de confianza es importante interpretar correctamente
los resultados. Suponga que usted ha construido el intervalo de confianza del (1 − α) × 100 %
para una media poblacional (µ). Debido a que, aunque es desconocido, el valor de µ existe
y es fijo, por lo tanto dicho valor está o no en el intervalo construido. Por esta razón no
es correcto decir: hay una probabilidad del (1 − α) × 100 % de que el valor de µ esté en el
intervalo construido.
E

La forma correcta de interpretar el intervalo de confianza serı́a: Si seleccionamos una gran


AD

cantidad de muestras de tamaño n y calculamos un intervalo de confianza para µ con cada


una de las muestras, esperamos que alrededor del (1−α)×100 % de los intervalos construidos
contengan la media de la población, µ.

Tamaño de muestra requerido si el objetivo es estimar una media poblacional µ.


Para un mismo tamaño de muestra n, conforme aumenta el nivel de confianza, el intervalo
se hace más amplio. Conforme el intervalo se hace más amplio, la precisión de la estimación
decrece. Una forma de aumentar la precisión de la estimación es aumentar el tamaño de la
-I I

muestra. Pero, ¿cuál es el tamaño de la muestra necesario para garantizar cierto nivel de
22

confianza para un margen de error dado?


20

Eso dependerá de si estamos tratando con una población infinita o finita.


CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 276

Si la población es infinita, el tamaño de muestra requerido será: :


2
Zα/2 × σ 2
n= (7.10)
E2

Si la población es finita, el tamaño de muestra requerido será:


2
N × Zα/2 × σ2
n= 2 (7.11)
(N − 1)E 2 + Zα/2 × σ 2
EP

donde N =Tamaño de la población.


Notas:
UD

En caso que el cálculo del tamaño de la muestra n resulte un valor no entero deberá
redondear el resultado siempre al entero superior más próximo.
A
La expresión (7.10) es obtenida al despejar n de la expresión (7.6). Análogamente la
IM

expresión (7.11) es obtenida al despejar n de la expresión (7.5) considerando para σx


-L

la expresión (6.1).
S
PU

En caso que σ no sea conocida, podrı́amos emplear la desviación estándar de la muestra


“s” (de una muestra grande, n ≥ 30) como un estimado puntual de σ.
M
CA

A continuación presentamos algunos problemas resueltos para familiarizarse con la es-


timación de intervalo para una media poblacional (µ) para los casos mencionados en las
expresiones (7.8) y (7.9).

Problemas resueltos.

1. Se sabe que los pesos de una población de novillos de 18 meses de edad tienen una
distribución aproximadamente normal, con desviación estándar de 6 kg. Se tomó una
muestra de 9 novillos y se determinó que la media de esa muestra es de 180 kg.
E
AD

a) ¿Cuál es un estimado puntual para el peso medio de la población de novillos?


Como se sabe, la media muestral x es un estimador puntual de la media poblacional
µ, por tanto el peso promedio de los 9 novillos que conforman la muestra
seleccionada, 180 kg; serı́a un estimado puntual para el peso medio de la población
de novillos.
b) ¿Cuál es el error estándar de la media?
Sea la variable aleatoria: X=“peso del novillo (Kg)”. Según el enunciado no hay
información sobre la media µ de X, ya que el objetivo va ser estimarla. La
-I I

desviación estándar de X (variable poblacional) es conocida e igual a σ = 6 kg.


22

También sabemos por el enunciado que X sigue distribución normal, por tanto,
20

X ∼ N (µ, 62 ). Esta variable como hemos dicho hace referencia a la población de


novillos.
Ahora si se toma una muestra de 9 novillos y se va a emplear el peso promedio de
los 9 novillos para estimar el peso promedio de la población de novillos, µ, estamos
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 277

ante la variable de interés:


X=“peso promedio en una muestra de 9 novillos (Kg)”.
Como se vio en el capı́tulo 6, al no contar con información sobre el tamaño de la
población, consideramos que es infinita, por tanto para la desviación estándar
de x o error estándar de la media se empleará la expresión (6.2), es decir:
σ 6
σx = √ = √ = 2 kg.
n 9
c) Con el nivel de confianza de 95 % ¿Cuál es el margen de error? Interprete el
resultado.
EP

Como se ha definido en el apartado anterior, la variable de interés es, X=“peso


UD

promedio en una muestra de 9 novillos (Kg)”. Como se explica en la sección 6.3.1,


las caracterı́sticas de la distribución de X serán:
E(X) = µ, la cual es desconocida.
σ 6
A
Del apartado anterior sabemos que: σx = √ = √ = 2 kg.
n 9
IM

Como la variable poblacional X=“peso del novillo (Kg)” tiene distribución


-L

normal entonces la distribución de X tendrá igualmente distribución normal


S

(Como se explica en la sección 6.3.1 referente a la Forma de la distribución


PU

de x).
M


Entonces concluimos que: X ∼ N µ, 22 . De acuerdo a la expresión (7.6) tenemos
CA

σ
que el margen de error es: E = Zα/2 × √ . Como el nivel de confianza para la
n
estimación es del 95 % de acuerdo con la Tabla 7.1, el valor de “Z” que debemos
emplear es 1.96, por tanto, haciendo los reemplazos respectivos, el margen de error
o error muestral será:

σ 6
E = Zα/2 × √ = 1.96 × √ = 3.92 kg
n 9

Esto quiere decir, que si seleccionamos una muestra de 9 novillos y empleamos el


E

peso promedio de los 9 novillos para estimar el peso promedio de la población de


AD

novillos hay una probabilidad del 95 % de que el peso promedio de los 9 novillos
se aleje como máximo 3.92 kg. del peso promedio de la población de novillos.
d ) ¿Cuál es el intervalo de confianza de 95 % para el peso medio de la población de
novillos? Interpretar.
Por la información obtenida de este problema, para construir un intervalo de
confianza de 95 % para el peso medio de la población de novillos, µ, debemos
emplear la expresión (7.8), por lo que dicho intervalo de confianza será:
-I I

σ
22

x ± Zα/2 × √
n
20

180 ± 3.92 kg

Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de


CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 278

acuerdo a la expresión (7.3):

x − E < µ < x + E.

180 − 3.92 < µ < 180 + 3.92 kg

176.08 < µ < 183.92 kg

La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran


cantidad de muestras de 9 novillos y calculamos un intervalo de confianza para
EP

el peso promedio de la población de novillos (µ) con cada una de las muestras,
UD

esperamos que alrededor del 95 % de los intervalos construidos contengan el peso


promedio de la población de novillos, µ.
e) ¿Qué tamaño deberı́a tener la muestra para cometer un error menor de 2 kg en la
estimación del peso medio poblacional, con un nivel de confianza de 95 %?
A
IM

Antes de responder analicemos la respuesta del apartado c). En ese caso una
muestra de 9 novillos produjo un margen de error de máximo 3.92 kg en la
-L

estimación. Si ahora nos piden reducir el error de forma que sea no mayor a 2
S
PU

kg, con el mismo nivel de confianza y sabiendo que σ=6, entonces el tamaño de la
muestra deberá ser mayor. El tamaño de muestra requerido se hallará usando la
M
CA

expresión (7.10):
2
Zα/2 × σ 2 (1.96)2 × 62
n= = ≈ 34.57 = 35 novillos.
E2 22

2. Para tratar de estimar la media de consumo por cliente, en un gran restaurante, se


reunieron datos de una muestra de 49 clientes durante un periodo de tres semanas.
Suponga que la desviación estándar de los consumos de la población de clientes es de
2.50 dólares.
E

a) ¿Cuál es el error estándar de la media?


AD

Sea la variable aleatoria: X=“consumo por cliente (dólares)”. Según el enunciado


no hay información sobre la media µ de X, ya que el objetivo va ser estimarla. Se
conoce la desviación estándar de X (variable poblacional) y es igual a σ = 2.50
dólares. No se proporciona información alguna sobre la distribución de X, por lo
que consideramos es desconocida. Esta variable como hemos dicho hace referencia
a la población de clientes del restaurante.
Ahora si se toma una muestra de 49 clientes y se va a emplear el consumo promedio
de los 49 clientes para estimar el consumo promedio de la población de clientes,
-I I

µ, estamos ante la variable de interés:


22

X=“consumo promedio en una muestra de 49 clientes (dólares)”.


20

Como se vio en el capı́tulo 6, al no contar con información sobre el tamaño de la


población, consideramos que es infinita, por tanto para la desviación estándar
de x o error estándar de la media se empleará la expresión (6.2), es decir:
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 279

σ 2.50
σx = √ = √ ≈ 0.36 dólares.
n 49
b) Con el nivel de confianza de 95 %, ¿Cuál es el margen de error?
Como se ha definido en el apartado anterior, la variable de interés es, X=“consumo
promedio en una muestra de 49 clientes (dólares)”. Como se explica en la sección
6.3.1, las caracterı́sticas de la distribución de X serán:
E(X) = µ, la cual es desconocida.
σ 2.50
Del apartado anterior sabemos que: σx = √ = √ ≈ 0.36 dólares.
n 49
EP

Como en el problema no se menciona qué distribución tiene la variable


poblacional X=“consumo por cliente (dólares)” y sabemos que la muestra
UD

tomada es de 49 clientes (n ≥ 30), aplicando el Teorema del Lı́mite Central


podemos afirmar que la distribución de X se puede aproximar con una
distribución normal (Como se explica en la sección 6.3.1 referente a la Forma
A
de la distribución de x).
IM


Entonces concluimos que: X ∼ N µ, 0.362 . De acuerdo a la expresión (7.6)
-L

σ
tenemos que el margen de error es: E = Zα/2 × √ . Como el nivel de confianza
S

n
PU

para la estimación es del 95 % de acuerdo con la Tabla 7.1, el valor de “Z” que
debemos emplear es 1.96, por tanto, haciendo los reemplazos respectivos, el margen
M

de error o error muestral será:


CA

σ 2.50
E = Zα/2 × √ = 1.96 × √ = 0.70 dólares.
n 49

Esto quiere decir, que si seleccionamos una muestra de 49 clientes y empleamos


el consumo promedio de los 49 clientes para estimar el consumo promedio de la
población de clientes hay una probabilidad del 95 % de que el consumo promedio
de los 49 clientes se aleje como máximo 0.70 dólares del consumo promedio de la
población de clientes.
E

c) Si la media de la muestra es de 22.60 dólares, ¿Cuál es el intervalo de confianza


AD

de 95 % para el consumo promedio de la población de clientes del restaurante?


Interprete.
Por la información obtenida de este problema, para construir un intervalo de
confianza de 95 % para el consumo promedio de la población de clientes, µ,
debemos emplear la expresión (7.8), por lo que dicho intervalo de confianza será:

σ
x ± Zα/2 × √
n
-I I

22.60 ± 0.70 dólares


22
20

Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de


acuerdo a la expresión (7.3):

x − E < µ < x + E.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 280

22.60 − 0.70 < µ < 22.60 + 0.70 dólares

21.90 < µ < 23.30 dólares.

La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran


cantidad de muestras de 49 clientes y calculamos un intervalo de confianza
para el consumo promedio de la población de clientes (µ) con cada una de las
muestras, esperamos que alrededor del 95 % de los intervalos construidos contengan
el consumo promedio de la población de clientes, µ.
EP

3. Se determinó la rentabilidad de vender automóviles usados, en un estudio de la


Asociación Nacional de comerciantes de automóviles. Suponga que con una muestra
UD

de 200 vendedores de autos usados se obtuvo una ganancia promedio de $300 y una
desviación estándar muestral de $150. Con esa información defina e interprete un
estimado de intervalo de confianza de 90 % para la ganancia promedio de la población
A
de ventas de automóviles usados.
IM

Sea la variable aleatoria: X=“ganancia por venta de autos usados (dólares)”. Según
-L

el enunciado no hay información sobre la media µ de X, ya que el objetivo va ser


S
PU

estimarla y tampoco se conoce la desviación estándar de X (variable poblacional), σ.


El enunciado tampoco proporciona información alguna sobre la distribución de X, por
M

lo que consideramos es desconocida. Esta variable como hemos dicho hace referencia a
CA

la población de ventas de automóviles usados.


Ahora si se toma una muestra de 200 vendedores y se va a emplear la ganancia promedio
de los 200 vendedores para estimar la ganancia promedio de la población de ventas de
automóviles usados, µ, estamos ante la variable de interés:
X=“ganancia promedio por la venta de autos usados en una muestra de 200 vendedores
(dólares)”.
Como se vio en el capı́tulo 6, al no contar con información sobre el tamaño de la
población, consideramos que es infinita, por tanto para la desviación estándar de x
E

σ
o error estándar de la media se debe emplear la expresión (6.2), es decir: σx = √ .
AD

n
En esta ocasión, como se ha manifestado lı́neas arriba, no se conoce el valor de σ,
por lo que en realidad no podrı́amos calcular σx . Pero como se explicó en la sección
7.2, en caso que σ no sea conocida, debemos emplear la desviación estándar de una
muestra, “s” (debe ser una muestra grande, n ≥ 30) como un estimado puntual de
σ. En el enunciado del problema se dice que la desviación estándar encontrada en la
s
muestra es s = 150. Por tanto estimaremos σx através de Sx = √ , el cual es igual a
n
150
Sx = √ ≈ 10.61 dólares.
-I I

200
22

Continuando con el análisis, ahora debemos cuantificar el margen de error. Ya que se


20

ha definido que la variable de interés es, X=“ganancia promedio por la venta de autos
usados en una muestra de 200 vendedores (dólares)”, entonces de acuerdo a la sección
6.3.1, las caracterı́sticas de la distribución de X serán:

E(X) = µ, la cual es desconocida.


CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 281

150
Lı́neas arriba se ha estimado σx como Sx = √ ≈ 10.61 dólares.
200
Como en el problema no se menciona qué distribución tiene la variable poblacional
X=“ganancia por venta de autos usados (dólares)” y sabemos que la muestra
tomada es de 200 vendedores (n ≥ 30), aplicando el Teorema del Lı́mite Central
podemos afirmar que la distribución de X se puede aproximar con una distribución
normal (Como se explica en la sección 6.3.1 referente a la Forma de la distribución
de x).

Entonces concluimos que: X ∼ N µ, 10.612 . De acuerdo a la expresión (7.7) tenemos
EP

s
que el margen de error es: E = Zα/2 × √ . Como el nivel de confianza para la estimación
n
UD

es del 90 % de acuerdo con la Tabla 7.1, el valor de “Z” que debemos emplear es 1.645,
por tanto, haciendo los reemplazos respectivos, el margen de error o error muestral
será:
s 150
A
E = Zα/2 × √ = 1.645 × √ = 17.45 dólares.
n 200
IM

Esto quiere decir, que si seleccionamos una muestra de 200 vendedores y empleamos la
-L

ganancia promedio por la venta de autos usados de la muestra de 200 vendedores para
S
PU

estimar la ganancia promedio de la población de ventas de automóviles usados, hay


una probabilidad del 90 % de que la ganancia promedio por la venta de autos usados
M

de la muestra de 200 vendedores se aleje como máximo 17.45 dólares de la ganancia


CA

promedio de la población de ventas de automóviles usados.


Para concluir, emplearemos la información obtenida para construir un intervalo de
confianza de 90 % para la ganancia promedio de la población de ventas de automóviles
usados, µ. Si el enunciado del problema afirma que la media de la muestra empleada
es: x = 300 dólares, entonces siguiendo la expresión (7.9), tenemos que el intervalo de
confianza para µ será:
s
x ± Zα/2 × √
n
E

300 ± 17.45 dólares


AD

Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de acuerdo a
la expresión (7.3):
x − E < µ < x + E.

300 − 17.45 < µ < 300 + 17.45 dólares

282.55 < µ < 317.45 dólares.


-I I

La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran cantidad


22

de muestras de 200 vendedores y calculamos un intervalo de confianza para la ganan-


20

cia promedio de la población de ventas de automóviles usados (µ) con cada una de las
muestras, esperamos que alrededor del 90 % de los intervalos construidos contengan la
ganancia promedio de la población de ventas de automóviles usados, µ.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 282

Estimación de un intervalo de confianza para una media poblacional µ cuando


la población tiene distribución normal, la desviación estándar poblacional σ es
desconocida y la muestra es pequeña (n < 30).

Un caso no contemplado por las expresiones (7.8) y (7.9) para estimar un intervalo de
confianza para una media poblacional µ tiene que ver con la situación en que la desviación
estándar poblacional σ es desconocida y la muestra con la que contamos es
pequeña (n < 30). En muchas situaciones de la vida real la desviación estándar poblacional
σ es desconocida y además de eso, debido a limitaciones de tiempo y costo, no es posible
EP

recolectar muestras aleatorias simples grandes (n ≥ 30). Para construir un intervalo de


UD

confianza para una media poblacional µ en estas circunstancias se puede usar la llamada
distribución t-student (o simplemente distribución t), siempre y cuando la población de la
cual se extrae la muestra tenga distribución normal.
El uso de la distribución t surge porque nos vemos en la necesidad de emplear la
A
IM

desviación estándar (s) de una muestra pequeña (n < 30) para estimar la desviación estándar
poblacional σ. Esa estimación genera un mayor error muestral E el cual debe ser calculado o
-L

medido basándonos en la distribución t y no en la distribución de la variable normal estándar


S
PU

Z como ocurrió en los casos contemplados por las expresiones (7.8) y (7.9).
Si una variable aleatoria (poblacional) X sigue distribución normal (y σ es desconocido)
M
CA

y la muestra empleada es pequeña, entonces la distribución del estadı́stico

x−µ
t= s (7.12)

n
sigue una distribución t.
La distribución t es una distribución de probabilidad continua al igual que la distribución
normal estándar Z. Algunas caracterı́sticas de la distribución t son:

Tiene forma de campana y es simétrica respecto de la media t=0.


E
AD

No existe una sola distribución t, sino una familia de distribuciones t. Todas las
distribuciones t tienen una media de 0, y sus desviaciones estándares difieren de acuerdo
con el tamaño de la muestra, n. Existe una distribución t para un tamaño de muestra
de 20, otra para un tamaño de muestra de 22, etc. La desviación estándar de una
distribución t con 5 observaciones es mayor que en el caso de una distribución t con 20
observaciones.

Cada distribución t es determinada por un parámetro llamado: grados de libertad


-I I

(g.l.). Cuando usamos la distribución t para estimar uma media poblacional (µ), los
grados de libertad son iguales al tamaño de la muestra menos 1. (g.l. = n − 1).
22
20

La distribución t es más ancha y más plana en la parte central que la distribución normal
estándar (ver Figura 7.2). Como resultado de ello se tiene una mayor variabilidad en
las medias muestrales calculadas a partir de muestras más pequeñas. Sin embargo,
conforme se incrementa el tamaño de la muestra (y por ende, los grados de libertad),
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 283

la distribución t se aproxima a la distribución normal estándar, pues los errores que se


cometen al utilizar s para estimar σ disminuyen con muestras más grandes.

El área bajo la curva t es igual a 1.


EP

Distribución Z
UD

Distribución t
(5 grados de libertad)

Distribución t
A
(2 grados de libertad)
IM
S -L
PU
M
CA

Figura 7.2: Comparando la distribución normal estándar (Z) y la distribución t.


E
AD

La distribución t fue desarrollada en 1908 por William S. Gosset, mientras trabajaba


para la compañı́a cervecera Guinness, en Dublin (Irlanda). Gosset publicó sus estudios bajo
el seudónimo Student. A la distribución t a menudo se le denomina t de Student.
Entonces para elaborar un intervalo de confianza para una media poblacional µ cuando
la población tiene distribución normal, la desviación estándar poblacional σ es desconocida y
la muestra es pequeña (n < 30), debemos antes calcular el margen de error o error muestral
(E) empleando la distribución t ası́:
-I I

s
E = tα/2 × √ . (7.13)
22

n
20

Luego sustituyendo (7.13) en (7.2) tenemos que el:


CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 284

Intervalo de confianza para una media poblacional µ cuando la población tiene


distribución normal, la desviación estándar poblacional σ es desconocida y la
muestra es pequeña (n < 30) es:

s
x ± tα/2 × √ (7.14)
n
Nota: Como la distribución t de Student posee mayor dispersión que la distribución
z, el valor de t en un nivel de confianza dado tiene una magnitud mayor que el valor z
correspondiente.
EP

Como se aprecia en la expresión (7.14), utilizamos un subı́ndice en t para indicar el área


UD

(probabilidad) en el extremo superior de la distribución t. Es decir, ası́ como empleamos Zα/2


para indicar el valor de Z que determina un área de α/2 en la cola superior de la distribución
normal estándar, emplearemos tα/2 para indicar el valor de t que determina un área de α/2
en la cola (o extremo) superior de la distribución t.
A
En el Apéndice A.5 se muestra la Tabla de la Distribución t. Un extracto es mostrado en
IM

la Tabla 7.2. Para poder leer un valor de t en la Tabla debemos entrar con dos informaciones:
-L

los grados de libertad (a partir del tamaño de la muestra empleada) y el área en el extremo
S

superior de la distribución deducida a partir de un nivel de confianza dado.


PU

A continuación se muestra un ejemplo para entender el uso de la Tabla de distribución t.


M

Ejemplo. Encuentre el valor de t para un nivel de confianza de 90 % cuando el tamaño


CA

de la muestra es 11.
Si el tamaño de la muestra es n = 11, los grados de libertad serán: g.l. = n − 1 = 11 − 1 =
10. Por otro lado, si el nivel de confianza es del 90 %, es decir, 1-α=0.90, entonces el área en
α
el extremo superior de la distribución será: =0.05. Entonces en la Tabla observamos que el
2
valor a emplear será t=1.8125.
Para familiarizarse con la estimación de intervalo para una media poblacional (µ) para
el caso mencionado en la expresión (7.14) donde usamos la Distribución t, presentamos a
continuación algunos problemas resueltos.
E
AD

Problemas resueltos.

1. Al ensayar un nuevo método de producción, se seleccionaron 18 empleados al azar,


y se les pidió lo probaran. La tasa de producción promedio muestral para los 18
empleados fue 80 partes por hora y la desviación estándar muestral fue 10 partes
por hora. Determine e interprete un intervalo de confianza del 95 % para la tasa de
producción promedio poblacional con el nuevo método, suponiendo que la población
tiene una distribución normal de probabilidades.
-I I

Sea la variable aleatoria: X=“tasa de producción con el nuevo método (partes/hora)”.


22

Según el enunciado no hay información sobre la media µ de X, ya que el objetivo va


20

ser estimarla y tampoco se conoce la desviación estándar de X (variable poblacional),


σ. En el enunciado del problema se supone que X sigue distribución normal, por lo que

X ∼ N µ, σ 2 . Esta variable como hemos dicho hace referencia a la población de tasas
de producción de empleados.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 285

Área (probabilidad)
en extremo superior
EP

0 t
UD

Grados de Área en el extremo superior


A
libertad 0.10 0.05 0.025 0.01 0.005
IM

1 3.0777 6.3138 12.7062 31.8205 63.6567


2 1.8856 2.9200 4.3027 6.9646 9.9248
-L

3 1.6377 2.3534 3.1824 4.5407 5.8409


S

4 1.5332 2.1318 2.7764 3.7469 4.6041


PU

5 1.4759 2.0150 2.5706 3.3649 4.0321


M

6 1.4398 1.9432 2.4469 3.1427 3.7074


CA

7 1.4149 1.8946 2.3646 2.9980 3.4995


8 1.3968 1.8595 2.3060 2.8965 3.3554
9 1.3830 1.8331 2.2622 2.8214 3.2498
10 1.3722 1.8125 2.2281 2.7638 3.1693
11 1.3634 1.7959 2.2010 2.7181 3.1058
12 1.3562 1.7823 2.1788 2.6810 3.0545

Tabla 7.2: Extracto de la Tabla de Distribución t. En el Apéndice A.5 aparece una versión más extensa.

Ahora si se toma una muestra de 18 empleados y se va a emplear la tasa promedio de


los 18 empleados para estimar la tasa de producción promedio poblacional µ, estando
E
AD

en el caso en que la muestra n = 18 es pequeña (n < 30), σ es desconocida y que


la variable poblacional X sigue distribución normal, podemos utilizar la Distribución t
para cuantificar el margen de error.
Entonces, si el tamaño de la muestra es n = 18, los grados de libertad serán:
g.l. = n − 1 = 18 − 1 = 17. Por otro lado, la estimación se realizará a un nivel de
confianza del 95 %, es decir, 1-α=0.95, entonces el área en el extremo superior de la
α
distribución será: =0.025. De la Tabla de Distribución t observamos que el valor a
2
emplear será t=2.1098. Otra información que aparece en el enunciado del problema es
-I I

que la desviación estándar encontrada en la muestra es s = 10 partes/hora.


22

Luego de acuerdo a la expresión (7.13), el margen de error es:


20

s 10
E = tα/2 × √ = 2.1098 × √ = 4.97 partes/hora.
n 18
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 286

Esto quiere decir, que si seleccionamos una muestra de 18 empleados y empleamos


la tasa promedio de los 18 empleados para estimar la tasa de producción promedio
poblacional µ, hay una probabilidad del 95 % de que la tasa promedio de 18 empleados
se aleje como máximo 4.97 partes/hora de la tasa promedio poblacional.
Para concluir, emplearemos la información obtenida para construir un intervalo de
confianza de 95 % para la tasa promedio poblacional, µ. Si el enunciado del problema
afirma que la media de la muestra empleada es: x = 80 parte/hora, entonces siguiendo
la expresión (7.14), tenemos que el intervalo de confianza para µ será:
EP

s
x ± tα/2 × √
n
UD

80 ± 4.97 partes/hora

Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de acuerdo a
A
la expresión (7.3):
IM

x − E < µ < x + E.
S -L

80 − 4.97 < µ < 80 + 4.97 partes/hora


PU

75.03 < µ < 84.97 partes/hora.


M
CA

La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran cantidad de


muestras de 18 empleados y calculamos un intervalo de confianza para la tasa promedio
poblacional (µ) con cada una de las muestras, esperamos que alrededor del 95 % de los
intervalos construidos contengan la tasa promedio poblacional, µ.

2. Un estudio sobre la utilización del tiempo constató que 20 Administradores selecciona-


dos aleatoriamente gastan en promedio 2.40 horas por dı́a con una desviación estándar
de 1.30 horas, en realizar trabajo meramente burocrático. Construir e interpretar un
intervalo de confianza de 90 % para el tiempo medio que utiliza la población de admi-
E

nistradores en realizar trabajo meramente burocrático. Asuma que el tiempo empleado


AD

en labores burocráticas por los administradores sigue distribución normal.


Sea la variable aleatoria: X=“Tiempo empleado en labores burocráticas por los
administradores (horas)”. Según el enunciado no hay información sobre la media µ
de X, ya que el objetivo va ser estimarla y tampoco se conoce la desviación estándar
de X (variable poblacional), σ. En el enunciado del problema se supone que X sigue

distribución normal, por lo que X ∼ N µ, σ 2 . Esta variable como hemos dicho hace
referencia a la población.
-I I

Ahora si se toma una muestra de 20 administradores y se va a emplear el tiempo


22

promedio gastado en labores burocráticas por los 20 administradores para estimar el


20

tiempo promedio gastado en trabajo burocrático para la población de administradores


µ, estando en el caso en que la muestra n = 20 es pequeña (n < 30), σ es
desconocida y que la variable poblacional X sigue distribución normal, podemos utilizar
la Distribución t para cuantificar el margen de error.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 287

Entonces, si el tamaño de la muestra es n = 20, los grados de libertad serán:


g.l. = n − 1 = 20 − 1 = 19. Por otro lado, la estimación se realizará a un nivel de
confianza del 90 %, es decir, 1-α=0.90, entonces el área en el extremo superior de la
α
distribución será: =0.05. De la Tabla de Distribución t observamos que el valor a
2
emplear será t=1.7291. Otra información que aparece en el enunciado del problema es
que la desviación estándar encontrada en la muestra es s = 1.30 horas.
Luego de acuerdo a la expresión (7.13), el margen de error es:

s 1.30
E = tα/2 × √ = 1.7291 × √ = 0.50 horas.
EP

n 20
UD

Esto quiere decir, que si seleccionamos una muestra de 20 administradores y empleamos


el tiempo promedio gastado por los 20 administradores para estimar el tiempo promedio
gastado por la población de administradores µ, hay una probabilidad del 90 % de que
A
la tasa promedio de 20 administradores se aleje como máximo 0.50 horas del tiempo
IM

promedio gastado en trabajo burocrático para la población de administradores.


-L

Para concluir, emplearemos la información obtenida para construir un intervalo de


S
PU

confianza de 90 % para el tiempo promedio gastado en trabajo burocrático para la


población de administradores, µ. Si el enunciado del problema afirma que la media de
M

la muestra empleada es: x = 2.40 horas, entonces siguiendo la expresión (7.14), tenemos
CA

que el intervalo de confianza para µ será:

s
x ± tα/2 × √
n

2.40 ± 0.50 horas

Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de acuerdo a
la expresión (7.3):
x − E < µ < x + E.
E
AD

2.40 − 0.50 < µ < 2.40 + 0.50 /horas

1.90 < µ < 2.90 horas.

La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran cantidad de


muestras de 20 administradores y calculamos un intervalo de confianza para el tiempo
promedio gastado en trabajo burocrático para la población de administradores (µ) con
cada una de las muestras, esperamos que alrededor del 90 % de los intervalos construidos
contengan el tiempo promedio gastado en trabajo burocrático para la población de
-I I

administradores, µ.
22
20

3. Se desea estimar el tiempo promedio diario que un estudiante del Campus Lima usa su
teléfono celular. Para ello se selecciona aleatoriamente a 9 estudiantes y se obtienen los
siguientes datos del tiempo (en minutos) de uso diario: 89, 72, 105, 117, 156, 116, 125,
101, 100. Obtenga e interprete un intervalo de confianza para el tiempo medio diario
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 288

de uso del celular de los estudiantes del Campus con un nivel de confianza del 95 %.
Suponga que el tiempo diario de uso de celular sigue distribución normal.
Sea la variable aleatoria: X=“Tiempo diario de uso de celular por los estudiantes
(minutos)”. Según el enunciado no hay información sobre la media µ de X, ya que
el objetivo va ser estimarla y tampoco se conoce la desviación estándar de X (variable
poblacional), σ. En el enunciado del problema se supone que X sigue distribución

normal, por lo que X ∼ N µ, σ 2 . Esta variable como hemos dicho hace referencia a
la población.
EP

Empezamos calculando la media de la muestra, x y la desviación estándar de la muestra,


s:
UD

89 + 72 + 1.5 + 117 + 156 + 116 + 125 + 101 + 100


x= = 109 minutos.
9
s
(89 − 109)2 + (72 − 109)2 + (105 − 109)2 + . . . + (100 − 109)2
s= = 23.7 minutos.
A
9−1
IM

Ahora si se toma una muestra de 9 estudiantes y se va a emplear el tiempo promedio de


-L

uso del celular de los 9 estudiantes para estimar el tiempo promedio de uso de celular
S
PU

para la población de estudiantes µ, estando en el caso en que la muestra n = 9 es


pequeña (n < 30), σ es desconocida y que la variable poblacional X sigue distribución
M

normal, podemos utilizar la Distribución t para cuantificar el margen de error.


CA

Entonces, si el tamaño de la muestra es n = 9, los grados de libertad serán: g.l. =


n − 1 = 9 − 1 = 8. Por otro lado, la estimación se realizará a un nivel de confianza
del 95 %, es decir, 1-α=0.95, entonces el área en el extremo superior de la distribución
α
será: =0.025. De la Tabla de Distribución t observamos que el valor a emplear será
2
t=2.3060.
Luego de acuerdo a la expresión (7.13), el margen de error es:

s 23.7
E = tα/2 × √ = 2.3060 × √ = 18.22 minutos.
E

n 9
AD

Esto quiere decir, que si seleccionamos una muestra de 9 estudiantes y empleamos el


tiempo promedio de uso de celular de 9 estudiantes para estimar el tiempo promedio
de uso de celular de la población de estudiantes µ, hay una probabilidad del 95 % de
que el tiempo promedio de uso de celular de 9 estudiantes se aleje como máximo 18.22
minutos del tiempo promedio de uso de celular de la población de estudiantes.
Para concluir, emplearemos la información obtenida para construir un intervalo de
confianza de 95 % para el tiempo promedio de uso de celular de la población de
-I I

estudiantes, µ. Si la media de la muestra empleada es: x = 109 minutos, entonces


22

siguiendo la expresión (7.14), tenemos que el intervalo de confianza para µ será:


20

s
x ± tα/2 × √
n

109 ± 18.22 minutos


CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 289

Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de acuerdo a
la expresión (7.3):
x − E < µ < x + E.

109 − 18.22 < µ < 109 + 18.22 minutos

90.78 < µ < 127.22 minutos.

La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran cantidad


de muestras de 9 estudiantes y calculamos un intervalo de confianza para el tiempo
EP

promedio de uso de celular de la población de estudiantes (µ) con cada una de las
UD

muestras, esperamos que alrededor del 95 % de los intervalos construidos contengan el


tiempo promedio de uso de celular de la población de estudiantes, µ.

Como conclusión de esta sección, en la Tabla 7.3 se muestra un resumen de los casos
A
vistos para realizar la estimación de intervalo para una media poblacional (µ).
IM

Distribución Desviación Tamaño Uso del TLC Intervalo de


S -L

Caso de la estándar de la (para deducir confianza


PU

población Poblacional (σ) muestra distribución de X) para µ


M

σ
1 Normal Conocida n < 30 No x ± Zα/2 × √
CA

n
2 Desconocida Conocida n ≥ 30 Sı́
s
3 Desconocida Desconocida n ≥ 30 Sı́ x ± Zα/2 × √
n
s
4 Normal Desconocida n < 30 No x ± tα/2 × √
n
Tabla 7.3: Resumen de casos para realizar la estimación de intervalo para una media poblacional (µ).

7.3. Estimación de intervalo para una proporción poblacional (p)


E

En varios tipos de investigación, el mayor interés está en la proporción de elementos con


AD

cierta caracterı́stica de interés, que representa una determinada porción de una población
de estudio. Por ejemplo, podemos estar interesados en saber qué proporción de estudiantes
del Campus Lima fueron al teatro por lo menos una vez el último mes, o la proporción de
clientes que preferirá un nuevo producto que se piensa lanzar al mercado, o la proporción
de hogares que está sintonizando un determinado programa de televisión en cierto horario,
o la proporción de consumidores satisfechos con los servicios prestados por una empresa de
telefonı́a, o la proporción de electores de la ciudad de Lima que votarı́an por un determinado
candidato en caso la elección presidencial se realizara mañana, o la proporción de ciudadanos
-I I

que está de acuerdo con la gestión del actual alcalde de la ciudad, etc. Para este tipo de
22

investigaciones se emplean procedimientos de cálculo que tienen que ver con proporciones.
20

Ellos son muy empleados en estudios de mercado, de opinión, etc.


El objetivo es estimar una proporción poblacional p (desconocida) de elementos en
una población, que presentan cierta caracterı́stica de interés, a partir de la información
proporcionada por una muestra extraı́da de dicha población de estudio.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 290

Es por eso que en esta sección mostraremos cómo usar la distribución muestral de p para
determinar un estimado de intervalo de una proporción poblacional p.
Siguiendo la expresión (7.1) decimos que la forma general de una estimación de intervalo
de confianza para una proporción poblacional p es:

p ± E (7.15)

donde E: Margen de error. La expresión (7.15) es lo mismo que decir que el intervalo de
confianza para p es:
EP

p − E < p < p + E. (7.16)


UD

Margen de error o Error muestral (E)


Como ya fue explicado en la sección 7.2, el valor absoluto de la diferencia entre un
estimador puntual insesgado y el parámetro de población que estima se llama margen de
error o error muestral. Para el caso en el que la proporción de una muestra estima a una
A
IM

proporción poblacional, el error muestral es:


-L

E =| p − p | (7.17)
S
PU

En la práctica no se puede determinar el valor del error muestral, porque no se conoce


M

p, la proporción de la población. Sin embargo, se puede usar la distribución muestral de p


CA

para establecer márgenes de probabilidad acerca del tamaño del error muestral. Como la
distribución muestral de p indica cómo se distribuyen sus valores en torno o alrededor de p,
nos proporciona información acerca de las diferencias posibles entre p y p.
Es decir, se puede probabilı́sticamente afirmar cuál es el valor máximo para el error
muestral si:

1. Conociéramos la distribución muestral de p,

2. Definiéramos el nivel de confianza para la estimación.


E

Respecto al punto 1, las caracterı́sticas de la distribución muestral de p se sugiere


AD

revisar el Capı́tulo 6, sección 6.4.1. De ello sabemos que p se aproxima a una distribución
normal(aplicando el Teorema del Lı́mite Central (TLC) con ciertas condiciones). Por tanto
r !2 
p(1 − p) 
p ∼ N p, , asumiendo que la problación es infinita.
n
Respecto al punto 2, en el caso que el objetivo sea estimar p, el nivel de confianza se
puede definir como, la probabilidad (1-α) de que la proporción muestral se encuentre, como
máximo, a una distancia E de la proporción poblacional p (desconocida), como se aprecia
-I I

en la Figura 7.3. El nivel de confianza (1-α) es el área bajo la curva normal estándar entre
α
22

los valores −Zα/2 y Zα/2 . El área restante es en cada cola de la distribución. Por ejemplo
2
20

si la estimación se realiza con un nivel de confianza del 90 %, es decir, 1-α=0.90, entonces


α
=0.05, lo que hará que Zα/2 =1.645. Ası́, conociéndose el nivel de confianza obtenemos el
2
valor de Z a emplear. Como ya se comentó anteriormente, en la Tabla 7.1 aparecen además
del mencionado, otros niveles de confianza de uso común.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 291
EP

p E p
UD

nivel de confianza
(1 − α)
A
IM
-L

α 2 α 2
S
PU
M
CA

− Zα 2 0 Zα 2 Z

Figura 7.3: Ilustración sobre el nivel de confianza en la distribución muestral de p.

Basados en la explicación lı́neas arriba, decimos que: Dado un nivel de confianza (1-α),
el margen de error o error muestral (E) se calcula como:

E = Zα/2 × σp (7.18)
E
AD

Para el caso de tratar con una población infinita la expresión (7.18) quedarı́a ası́:
r
p(1 − p)
E = Zα/2 × (7.19)
n

Analizando la expresión (7.19) notamos que σp depende de la proporción poblacional p


la cual es desconocida ya que justamente es el valor que estamos intentando estimar. En la
práctica sustituimos
r p por una estimativa puntual, osea p. Esto nos conduce a estimar σp
p(1 − p)
-I I

através de Sp = , por lo que, el margen de error o error muestral (E) se calcula en


n
22

este caso como:


20

r
p(1 − p)
E = Zα/2 × . (7.20)
n
Con el margen de error dado por la expresión (7.20), la expresión para la estimación de
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 292

intervalo para una proporción poblacional (p):

Intervalo de confianza para la proporción poblacional (p).


r
p(1 − p)
p ± Zα/2 × . (7.21)
n
Nota: Recuerde que no debe olvidar verificar que la distribución muestral de p puede ser
aproximada por la distribución normal (Aplicación del Teorema del Lı́mite central, como se
explica en la sección 6.4.1 referente a la Forma de la distribución de p).
EP
UD

¿Cómo se interpreta el intervalo de confianza del (1 − α) × 100 % para una


proporción poblacional (p)?
Después de construir un intervalo de confianza es importante interpretar correctamente
los resultados. Suponga que usted ha construido el intervalo de confianza del (1 − α) × 100 %
A
para una proporción poblacional (p). Debido a que, aunque es desconocido, el valor de p
IM

existe y es fijo, por lo tanto dicho valor está o no en el intervalo construido. Por esta razón
-L

no es correcto decir: hay una probabilidad del (1 − α) × 100 % de que el valor de p esté en el
S
PU

intervalo construido.
La forma correcta de interpretar el intervalo de confianza serı́a: Si seleccionamos una gran
M

cantidad de muestras de tamaño n y calculamos un intervalo de confianza para p con cada


CA

una de las muestras, esperamos que alrededor del (1−α)×100 % de los intervalos construidos
contengan la proporción poblacional, p.

Tamaño de muestra requerido si el objetivo es estimar una proporción poblacional


p.
Para un mismo tamaño de muestra n, conforme aumenta el nivel de confianza, el intervalo
se hace más amplio. Conforme el intervalo se hace más amplio, la precisión de la estimación
decrece. Una forma de aumentar la precisión de la estimación es aumentar el tamaño de la
E

muestra. Pero, ¿cuál es el tamaño de la muestra necesario para garantizar cierto nivel de
AD

confianza para un margen de error dado?


Eso dependerá de si estamos tratando con una población infinita o finita.
Si la población es infinita, el tamaño de muestra requerido será: :
2
Zα/2 × p × (1 − p)
n= (7.22)
E2

Si la población es finita, el tamaño de muestra requerido será:


2
-I I

N × Zα/2 × p × (1 − p)
n= 2 (7.23)
22

(N − 1)E 2 + Zα/2 × p × (1 − p)
20

donde N =Tamaño de la población.


Notas:

En caso que el cálculo del tamaño de la muestra n resulte un valor no entero deberá
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 293

redondear el resultado siempre al entero superior más próximo.

La expresión (7.22) es obtenida al despejar n de la expresión (7.19). Análogamente la


expresión (7.23) es obtenida al despejar n de la expresión (7.18) considerando para σp
la expresión (6.4).

El empleo de las expresiones (7.22) y (7.23) requieren de un valor de planeación para


la proporción poblacional p. En la práctica se puede utilizar la proporción muestral de
una muestra preliminar o la proporción muestral de una muestra seleccionada a partir
de un estudio piloto. En caso de no poder contar con información alguna sobre el valor
EP

de p se suele emplear p = 0.5. La razón de usar 0.5 como valor de p cuando no hay
UD

estimativa preliminar disponible es porque para ese valor de p se obtiene el máximo


valor para el producto p(1 − p) que se traduce en el máximo valor para el tamaño de la
muestra n. En otras palabras, si no tenemos una estimación preliminar de p debemos
pagar la penalidad de emplear una muestra de mayor tamaño.
A
IM

A continuación presentamos algunos problemas resueltos para familiarizarse con la esti-


mación de intervalo para una proporción poblacional (p) mediante el empleo de la expresión
S -L

(7.21) y del cálculo del Tamaño de muestra requerido si el objetivo es estimar una proporción
PU

poblacional p mediante el empleo de las expresiones (7.22) o (7.23).


M
CA

Problemas resueltos.

1. Se realizó una encuesta a una muestra aleatoria simple de 100 votantes y 45 de ellos
dijeron que votarı́an por el congresista Pérez del partido NuestroPerú en las próximas
elecciones congresales. Usar esta información para estimar, con un nivel de confianza
de 95 % la proporción de electores que votarı́an por el congresista Pérez.
Del enunciado del problema encontramos que se pide estimar la proporción de electores
que votarı́an por el congresista Pérez en la población de votantes, osea p. Una estimación
puntual de p es la proporción de electores que votarı́an por el congresista Pérez en la
45
E

muestra encuestada: p = = 0.45.


AD

100
Como se trabaja con una muestra 100 votantes, aplicamos el Teorema del Lı́mite
Central para verificar si se cumplen las dos condiciones: n.p ≥ 5 y n.(1 − p) ≥ 5,
para concluir que la distribución de p se puede aproximar con una distribución normal
(Como se explica en la sección 6.4.1 referente a la Forma de la distribución de p).
Obviamente emplearemos p = 0.45, como estimación puntual de p. Operando tenemos
que n.p = 100 × 0.45 = 45 y n.(1 − p) = 100 × (1 − 0.45) = 55, verificándose que
dichas condiciones se cumplen, por tanto la distribución de p se puede aproximar con
una distribución normal.
-I I
22

Ahora, como el nivel de confianza para la estimación es del 95 % de acuerdo con la Tabla
20

7.1, el valor de “Z” que debemos emplear es 1.96, por tanto, siguiendo la expresión (7.20)
y haciendo los reemplazos respectivos, el margen de error o error muestral será:

r r
p(1 − p) 0.45(1 − 0.45)
E = Zα/2 × = 1.96 × ≈ 0.098.
n 100
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 294

Con el margen de error encontrado, construimos el intervalo de confianza de 95 % para


la proporción poblacional (p), de acuerdo a la expresión (7.21)

r
p(1 − p)
p ± Zα/2 × .
n
0.45 ± 0.098.

Lo anterior es lo mismo que decir que el intervalo de confianza para p es, de acuerdo a
la expresión (7.16):
EP

p − E < p < p + E.
UD

0.45 − 0.098 < p < 0.45 + 0.098.

A 0.352 < p < 0.548.

La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran cantidad


IM

de muestras de 100 electores y calculamos un intervalo de confianza para la proporción


-L

de electores que votarı́an por el congresista Pérez en la población de votantes (p)


S

con cada una de las muestras, esperamos que alrededor del 95 % de los intervalos
PU

construidos contengan la proporción de electores que votarı́an por el congresista Pérez


M

en la población de votantes, p.
CA

2. Una empresa está pensando en lanzar un nuevo producto al mercado por lo que desea
estimar, con un nivel de confianza de 95 % y un margen de error del 4 %, la proporción
de clientes que lo comprarı́an. Calcule el tamaño de la muestra necesaria para realizar
la estimación correspondiente.

a) Suponga que no cuenta con información de estudios o encuestas previas sobre


productos similares para definir un valor de planeamiento para p.
Del enunciado del problema tenemos que el nivel de confianza para la estimación
E

es del 95 % por lo que de acuerdo con la Tabla 7.1, el valor de “Z” que debemos
AD

emplear es 1.96. Además el margen de error admitido es del 4 %, osea E=0.04.


Como el objetivo del problema es estimar p: la proporción de clientes que
comprarı́an el producto que se piensa lanzar al mercado y no tenemos información
sobre el tamaño de la población asumimos el caso de población infinita, por lo
que para hallar el tamaño de la muestra necesaria para realizar la estimación
usaremos la expresión (7.22). Como en el enunciado nos dicen que no se cuenta con
información de estudios o encuestas previas sobre productos similares para definir
un valor de planeamiento para p, asumimos que p = 0.5. Entonces el tamaño de
-I I

la muestra requerida será


22

2
20

Zα/2 × p × (1 − p) (1.96)2 × 0.5 × (1 − 0.5)


n= = = 600.25 ≈ 601.
E2 0.042

Se deberı́a encuestar a 601 personas.


CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 295

b) En cuánto variará el tamaño de la muestra si el margen de error debe ser como


máximo 3 %?
Si el margen de error debe ser como máximo 3 % entonces el tamaño de la muestra
requerida será
2
Zα/2 × p × (1 − p) (1.96)2 × 0.5 × (1 − 0.5)
n= = = 1067.1 ≈ 1068.
E2 0.032

Se deberı́a encuestar a 1068 personas.


EP

3. Se encarga a una empresa de investigación de opinión evaluar el desempeño de un


UD

polı́tico en campaña. Para hacer esto, debe establecer el tamaño de muestra de votantes
a ser entrevistados. Se desea un margen de error de 2.8 puntos porcentuales y un nivel
de 95 % de confianza. A
a) Estudios previos mostraron que el polı́tico tenı́a el 18 % de las preferencias de los
IM

votantes.
-L

En este caso debemos emplear la expresión (7.22) en que el valor de “Z” que
S

debemos emplear es 1.96 (por ser 95 % el nivel de confianza), E = 0.028 y un


PU

valor preliminar de p igual a 0.18. Entonces


M

2
CA

Zα/2 × p × (1 − p) (1.96)2 × 0.18 × (1 − 0.18)


n= = = 723.24 ≈ 724
E2 0.0282

Se deberı́a entrevistar a 724 votantes.


b) No se tiene ninguna información anterior sobre el desempeño del polı́tico.
En este caso debemos emplear la expresión (7.22) en que el valor de “Z” que
debemos emplear es 1.96 (por ser 95 % el nivel de confianza), E = 0.028 y al no
contar con un valor preliminar de p usaremos p = 0.50. Entonces
2
Zα/2 × p × (1 − p) (1.96)2 × 0.50 × (1 − 0.50)
E

n= = = 1225
AD

E2 0.0282

Se deberı́a entrevistar a 1225 votantes.

4. La Municipalidad de un distrito limeño está buscando evaluar el Programa del Adulto


Mayor que funciona en su jurisdicción. El total de adultos mayores inscritos en el
programa son 2000. Se desea establecer el tamaño de muestra a considerar con un nivel
de confianza del 95 % y permitiéndose un margen de error de 3 puntos porcentuales.
En este caso debemos emplear la expresión (7.23) en que el valor de “Z” que debemos
-I I

emplear es 1.96 (por ser 95 % el nivel de confianza), E = 0.03 y al no contar con un


22

valor preliminar de p usaremos p = 0.50. Entonces


20

2
N × Zα/2 × p × (1 − p)
n= 2
(N − 1)E 2 + Zα/2 × p × (1 − p)
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 296

2000 × (1.96)2 × 0.5 × (1 − 0.5)


n= = 696.1 ≈ 697
(2000 − 1)0.032 + (1.96)2 × 0.5 × (1 − 0.5)
La muestra debe ser de 697 adultos mayores.

7.4. Problemas propuestos


1. Un investigador estudia los factores que afectan el rendimiento de los estudiantes
universitarios del paı́s. Para tal fin selecciona una muestra aleatoria simple de 130
estudiantes y encuentra que el tiempo que dedican al estudio fuera de sus horas de
clase es en promedio 3.4 horas con una varianza de 1.21. Determinar e interpretar un
EP

intervalo confianza del 90 % para el tiempo promedio que estudian fuera de sus horas
UD

de clase la población de estudiantes universitarios del paı́s.

2. Se desea estimar el gasto promedio mensual en dólares que una familia de la ciudad de
Lima gasta en embutidos.
A
IM

a) Calcule cuántas familias se deben tomar como muestra para que la estimación
tenga una confianza de 95 % y un margen de error de 2 dólares. Considere que σ=
-L

9 dólares.
S
PU

b) Realice el cálculo para una urbanización con 850 familias para que la estimación
M

tenga una confianza del 99 % y un margen de error de 1.5 dólares, considerando


CA

que σ= 9 dólares.

3. Una empresa está pensando en lanzar un nuevo producto al mercado por lo que desea
estimar con un nivel de confianza de 95 % y un margen de error del 3 %, el porcentaje
de clientes que lo comprarı́an. Suponga que no cuenta con información de estudios o
encuestas previas sobre productos similares. Calcule el tamaño de la muestra necesaria
para realizar la estimación correspondiente.

4. Se desea estimar la demanda media diaria de un producto que registra una empresa.
Para ello se seleccionan 10 dı́as al azar con los siguientes valores en miles:
E
AD

35, 44, 38, 55, 33, 56, 67, 45, 48, 40.

Obtenga el intervalo de confianza para la demanda media diaria a un nivel de confianza


del 90 %. Suponga que la demanda diaria del producto sigue distribución normal.

5. Se realiza un estudio para conocer la proporción de estudiantes universitarios peruanos


que sufren del sı́ndrome de fatiga crónica (SFC). En una muestra aleatoria simple
de 3066 estudiantes, 590 de ellos afirmaron haber sufrido de fatiga crónica. Usar
-I I

esta información para estimar, con un nivel de confianza de 99 %, la proporción de


22

estudiantes universitarios que sufren de fatiga crónica.


20

6. Se desea estimar la proporción de amas de casa de un pequeño distrito que prefieren


consumir el detergente ExtraClean con un nivel de confianza del 95 % y un margen de
error del 5 %. Calcule el tamaño de la muestra necesaria a encuestar para realizar la
estimación correspondiente en las siguientes situaciones:
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 297

a) Suponga que no se conoce el tamaño de la población y no cuenta con información


de estudios o encuestas previas.
b) Suponga que en el distrito hay 2500 familias y en una encuesta anterior, solamente
el 12 % de las amas de casa manifestaron consumir el producto.

7. El gerente de un conocido restaurante afirma que el tiempo de espera (en minutos) de


sus clientes sigue una distribución con varianza de 22.5 minutos2 . Se tomó una muestra
de 32 clientes y se encontró un tiempo medio de espera de 13 minutos. Construya e
interprete un intervalo de confianza del 95 % para el tiempo medio de espera de los
EP

clientes de ese restaurante.


UD

8. Supongamos que el tiempo (en horas) dedicado por los estudiantes de una determinada
asignatura a estudiar para el examen final tiene una distribución normal. Se toma una
muestra aleatoria de 6 estudiantes cuyos tiempos de estudio fueron los siguientes:
A
IM

12.2, 18.4, 23.1, 11.7, 8.2, 24


-L

Calcular e interpretar un intervalo de confianza del 99 % para el tiempo de estudio


S
PU

promedio poblacional
M

9. La Cruz Roja está organizando una campaña de donación de sangre en la Universidad


CA

y se quiere estimar la proporción de personas (entre estudiantes, profesores y


administrativos, etc.) que estarı́an dispuestos a donar sangre. Con una confianza del
99 % y un 4 % de margen de error ¿A cuántas personas se debe entrevistar? Suponga
que el tamaño de la población es de 3000 individuos.

10. Una encuesta reunió datos acerca de cómo consideran los peruanos la calidad de la
información en los diarios y en TV. Una de las preguntas fue si el encuestado cree que
lo que se dice de la economı́a peruana es equilibrado, muy negativo o muy positivo. Los
estimados preliminares son de que un 50 % de la población cree que la información es
E

equilibrada.
AD

a) ¿Qué tamaño de muestra se recomienda para que el margen deseado de error sea
de 3.3 %? Emplee el 95 % de nivel de confianza.
b) ¿Qué tamaño se recomienda para que el error sea de 2.5 %, con 95 % de confianza?

11. Se tomó al azar una muestra aleatoria de 120 estudiantes de la Universidad de


Piura|Campus Lima y se encontró que 54 de ellos hablaban inglés. Obtener e interpretar
un intervalo de confianza del 90 % para la proporción poblacional p de estudiantes de
-I I

la Universidad de Piura|Campus Lima que hablan inglés.


22

12. La ingesta diaria media de vitamina D en una muestra de 36 escolares de educación


20

primaria ha resultado ser de 4.5 microgramos y la correspondiente desviación tı́pica fue


de 2.02 microgramos. Obtener e interpretar un intervalo de confianza del 99 % para la
ingesta media de vitamina D en la población de escolares de primaria.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 298

13. El precio (en dólares) de ciertos electrodomésticos fabricados por una empresa, se puede
considerar una variable que sigue una distribución normal con desviación tı́pica igual a
100 dólares. Se toma una muestra aleatoria de 9 de estos electrodomésticos y el precio
de cada uno es:

255, 85, 120, 290, 80, 80, 275, 290, 135

Encontrar e interpretar un intervalo confianza del 95 %, para el precio promedio de


todos los electrodomésticos fabricados por dicha empresa.
EP

14. Una empresa de cable desea conocer qué proporción de sus clientes se informan de
UD

las noticias a través de los noticiarios que difunden. Para ello seleccionó una muestra
aleatoria simple de 200 clientes y 110 respondieron que se informan a través de los
noticiarios televisivos. Calcular e interpretar un intervalo de confianza del 95 % para la
proporción poblacional de clientes que se informan a través de los noticiarios televisivos.
A
IM

15. El gasto semanal de fotocopias, en soles, de los estudiantes de una escuela de posgrado
-L

sigue distribución normal con varianza igual a 144. Se toma una muestra aleatoria
S
PU

de 9 de estos estudiantes resultando los valores siguientes para esos gastos:100, 150,
90, 70, 75, 105, 200, 120, 80. Con el análisis visto en clase, determine e interprete un
M

intervalo confianza del 90 %, para el gasto promedio semanal en fotocopias para todos
CA

los estudiantes de dicha escuela.

16. Resuelva el problema anterior suponiendo que no conociera la varianza poblacional.

17. Un analista de investigación de mercados recopila datos de una muestra aleatoria de


100 clientes que adquirieron equipo electrónico de una tienda especializada. Los 100
clientes gastaron un promedio de 24570 soles con una desviación tı́pica de 660 soles.
Con el análisis visto en clase, determine e interprete un intervalo confianza del 90 %,
para el gasto promedio de todos los clientes de la tienda.
E
AD

18. Para estudiar la viabilidad de lanzar un nuevo producto al mercado, el gerente de


una gran empresa contrata a una empresa de consultorı́a estadı́stica para estudiar la
aceptación del producto entre los clientes potenciales. El gerente desea obtener una
estimación con un error máximo del 1 % y una confianza del 90 % y pide al consultor
estadı́stico que calcule el tamaño de muestra requerido.

a) Con la información proporcionada y sin tener información previa que sugiera un


posible valor para p, el consultor calcula el tamaño de muestra requerido ¿Cuál es
el tamaño de muestra obtenido por el consultor?
-I I
22

b) El gerente cree que el costo de tal muestra serı́a muy alto y autoriza al consultor a
20

realizar un estudio piloto con una muestra de 100 personas para obtener una
estimación puntual de la proporción verdadera p. El estudio piloto indicó un
76 % de aceptación del nuevo producto. Con base en esa información, el consultor
recalcula el tamaño de la muestra necesaria. ¿Cuál es ese tamaño?
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 299

c) Selecionada la muestra con el tamaño obtenido en el apartado anterior, se obtuvo


un 72 % de clientes favorables al produto. Construya e interprete un intervalo de
confianza del 95 % para la verdadera proporción p de clientes que aceptarı́an el
producto.

19. Un fabricante de una determinada marca de vehı́culos de lujo sabe que el consumo de
gasolina de sus vehı́culos se distribuye normalmente. Se selecciona una muestra aleatoria
de 6 automóviles (y observando el consumo cada 100 km.) se obtiene un promedio de
19.48 con una varianza de 0.96. Con el análisis visto en clase, determine e interprete
EP

un intervalo de confianza del 90 % para el consumo medio de gasolina de todos los


vehı́culos de esa marca.
UD

20. En una ciudad se hace un estudio de marketing de una nueva crema dental y se toma una
muestra aleatoria simple de 50 mujeres residentes de la ciudad. El 60 % de esas mujeres
responde que les gustó la nueva crema dental. Encontrar e interpretar un intervalo de
A
IM

confianza del 90 % para la proporción de mujeres en la ciudad que les gustarı́a la nueva
crema.
S -L

21. Muchas veces los padres prestan el teléfono celular a sus pequeños hijos para
PU

mantenerlos tranquilos y sin protestar. Se realizó un estudio para estimar el tiempo


M

promedio diario que un niño de entre 7 y 12 años usa el teléfono celular de sus padres
CA

para jugar. Para ello se seleccionó aleatoriamente a 8 niños con edades en ese rango y se
obtuvieron los siguientes datos del tiempo (en minutos) de uso diario: 116, 100, 116, 72,
156, 125, 89, 100. Obtenga e interprete un intervalo de confianza para el tiempo medio
diario de uso del celular por niños de entre 7 a 12 años con un nivel de confianza del
99 %. Suponga que el tiempo diario de uso de celular por los niños sigue distribución
normal.

22. Estamos interesados en conocer el consumo diario medio de cigarrillos entre los alumnos
de universidades de la ciudad. Seleccionada una muestra aleatoria simple de 100
E

alumnos se observó que fumaban en promedio, 8 cigarrillos diarios. Si admitimos que la


AD

varianza poblacional de dicho consumo es de 16, Encontrar e interpretar un intervalo de


confianza del 90 % para el consumo medio de cigarrillos de los alumnos universitarios.

23. Una cafeterı́a evalúa la posibilidad de poner una sala de fumadores si el porcentaje de
usuarios de la cafeterı́a que fuma supera el 60 %. Un estudio sobre 50 usuarios elegidos
aleatoriamente indica que 26 de ellos fuman y 24 no.

a) Construya un intervalo de confianza al 95 % para el porcentaje de usuarios de la


-I I

cafeterı́a que fuman.


22

b) ¿A qué número de personas habrı́a que encuestar, con el mismo nivel de confianza
20

anterior, para que la diferencia entre la proporción muestral y la proporción


poblacional (es decir, el margen de error) de fumadores, sea como máximo de
0.05? Suponga que no dispone de datos históricos para establecer un valor de
planeación para p.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 300

24. Una encuesta a una muestra 1,000 usuarios de smartphones encontró que el tiempo
diario promedio empleado en comunicación con el dispositivo era de 131.4 minutos. De
estudios anteriores, se supone que la desviación estándar poblacional es 21.2 minutos. La
comunicación incluye mensaje de texto, correo electrónico, redes sociales y conexiones.
Encuentre e interprete un intervalo de confiança de 95 % para el tempo medio diario
empleados en comunicación en un smartphone para la población de usuarios?

25. En un estudio se entrevistó a 1024 personas preguntándoles su opinión sobre


el calentamiento global. De los encuestados, 389 dijeron que pensaban que el
EP

calentamiento global representarı́a una seria amenaza para su estilo de vida durante su
existencia. Encuentre e interprete un intervalo de confianza de 90 % para la proporción
UD

poblacional de personas que creen que el calentamiento global representará una seria
amenaza a su estilo de vida durante su existencia.

26. Imagine que un compañero de su sección llevó a cabo un estudio e informó que el
A
IM

intervalo de confianza de 95 % de la media poblacional variaba de 46 a 54. Su compañero


estaba seguro de que la media de la muestra era de 50; de que la desviación estándar de
-L

la muestra que empleó era de 16, y de que el tamaño de la muestra era de por lo menos
S
PU

30 elementos, pero no recordaba el tamaño exacto. Encuentre el tamaño de muestra


M

empleado.
CA

27. Deseamos determinar con un margen de error de 4 %, la proporción de amas de casa que
usan e-mail. Asumiendo que queremos uma confianza de 90 % en nuestros resultados,
determine el tamaño de la muestra si:

a) Un estudo piloto indicó que 16,9 % de las amas de casa utilizan e-mail.
b) No hay información previa que sugiera un posible valor para p.

28. Se realizó una encuesta de opinión en una gran empresa con el objetivo, entre otras
cosas, estimar el ı́ndice promedio de satisfacción de los empleados con las condiciones
E

de trabajo que se les ofrecen (instalaciones, equipo, etc.). El ı́ndice de satisfacción de


AD

cada empleado se puede medir en una escala de cero a cien puntos, y su variabilidad es
tal que la desviación estándar de la población es de 30 puntos.

a) Si 324 empleados fueron seleccionados al azar para ser encuestados ¿cuál es el nivel
de confianza a emplear para que el margen de error sea como máximo 3 puntos?
b) ¿Cuál deberı́a ser el tamaño de la muestra de empleados a ser encuestados para que
el margen de error sea como máximo 1.5 puntos con el mismo nivel de confianza
encontrado en el apartado a)? Comente el resultado obtenido.
-I I
22

c) Con base en la muestra de 324 empleados, construya e interprete un intervalo de


20

95 % de confianza para el ı́ndice de satisfacción medio poblacional, µ, admitiendo


que el ı́ndice promedio de satisfacción de la muestra de encuestados fue de 72
puntos.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 301

29. En un estudio de mercado, 57 de las 150 personas entrevistadas dijeron que comprarı́an
cierto producto lanzado por una empresa. ¿Esta muestra es suficiente para estimar la
verdadera proporción de futuros compradores con un margen de error de 8 % y un 90 %
de confianza? En caso de no ser suficiente, calcule el tamaño de la muestra requerida.

30. Se desea realizar un estudio para estimar el salario promedio de los ejecutivos con
formación en Administración de empresas en el Perú. Para la estimación se establece
un nivel de confiança de 95 % y se admitirá un error máximo de 500 soles. Como no
se conoce la desviación estándar de los salarios de todos los ejecutivos con formación
EP

en Administración de empresas del paı́s, se realizó una pequeña encuesta entre 31


ejecutivos seleccionados aleatoriamente y se encontró una desviación estándar de 6538
UD

soles. Calcular cuántas entrevistas serán necesarias en este estudio.

31. Una compañı́a de seguros quiere estimar el porcentaje de conductores que usan
sus teléfonos celulares mientras conducen. En una muestra de 850 conductores, 544
A
IM

confirmaron usar el teléfono celular mientras conducen. Determinar e interpretar un


intervalo de confianza con 90 % de confianza para ese porcentaje.
S -L

32. En una encuesta aplicada a 10 personas se encontró que en promedio ven 2.5 horas de
PU

televisión al dı́a con una desviación estándar de 0.8 horas. Con un nivel de confianza del
M

95 % estime e interprete un intervalo de confianza para el tiempo promedio utilizado


CA

por la población en ver televisión. Asuma que el tiempo empleado en ver televisión
sigue distribución normal.

33. En un estudio de investigación de mercado, se entrevistó a 400 personas sobre su


preferencia por un producto. De estas 400 personas, 240 dijeron que prefieren el
producto.

a) Determine e interprete un intervalo confianza del 99 %, para la proporción de


preferencia del consumidor en general para este producto.
E

b) ¿A cuántas personas habrı́a que encuestar para realizar la estimación con un


AD

margen de error del 4 %, al nivel de confianza de 99 %? Suponga que no cuenta


con información para definir un valor preliminar para p.

34. Un operador de televisión por cable realizó una investigación de mercado con sus
suscriptores con el objetivo, entre otras cosas, estimar la proporción p de personas que
estarı́an dispuestas a contratar una mejora en el servicio que se les ofrece actualmente
a cambio de un cierto descuento en el precio.
-I I

a) Si se empleara una muestra de 30 suscriptores ¿cuál es el nivel de confianza a


emplear para que el margen de error sea como máximo 10 %?
22
20

b) Con base en la muestra de 30 suscriptores, construya e interprete un intervalo de


95 % de confianza para p, admitiendo que 9 de los 30 encuestados manifestaron
estar dispuestos a contratar la mejora propuesta.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 302

c) ¿Cuál es el tamaño de una nueva muestra suficiente para garantizar que la


proporción p de suscriptores dispuestos a contratar la mejora propuesta pueda
ser estimada con nivel de confianza de 95 % y un margen de error que sea como
máximo 8 %? Suponga que no se sabe nada sobre el valor de p.
d ) ¿Cuál es el tamaño de una nueva muestra suficiente para garantizar que la
proporción p de suscriptores dispuestos a contratar la mejora propuesta pueda
ser estimada con nivel de confianza de 95 % y un margen de error que sea como
máximo 8 %? Suponga que por estudios anteriores el valor de p es 0.35.
EP
UD

A
IM
S -L
PU
M
CA

E
AD

-I I
22
20
UD
EP

Tablas
Apéndice A
CA
M
PU
S -L
IM
A

303
AD
E

20
22
-I I
UD
EP
A.1.

Tabla de números aleatorios

columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-55 56-60 61-65 66-70
fila
CA
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 99570 91291 90700
2 22368 46573 25595 85393 30995 89198
M 37982 53402 93965 34095 52666 19174 39615 99505
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 19655 63348 58629
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 74917 97758 16379
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 06927 01263 54613
PU
6 77921 06907 11008 42751 27756 53498 18602S 70659 90665 15053 21916 81825 44394 42880
7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 21069 10634 12952
8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 84903 42508 32307
-L
9 89579 14342 63661 10228 17453 18103 57740 84378 25331 12566 58678 44947 05585 56941
10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 11458 18593 64952
IM
11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 85590 97610 78188
12 63553 40961 48235 03427 49626 69445 18663 72695 52180
A 20847 12234 90511 33703 90322
Tabla de números aleatorios

13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 27156 30613 74952
14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 20285 29975 89868
15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 74461 28551 90707
16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 63990 75601 40719
17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 44919 05944 55157
18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 01915 92747 64951
AD
19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 17752 35156 35749
20 07056
E
97628 33787 09998 42698 06691 76988 13602 51851 46104 88916 19509 25625 58104
21 48663 91245 85828 14346 09172 30168 90229 04734 59193 22178 30421 61666 99904 32812
22 54164 58492 22421 74103 47070 25306 76468 26384 58151 06646 21524 15227 96909 44592
23 32639 32363 05597 24200 13363 38005 94342 28728 35806 06912 17012 64161 18296 22851
24 29334 37001 87637 87308 58731 00256 45834 15398 46557 41135 10367 07684 36188 18510
25 02488 33062 28834 07351 19731 92420 60952 61280 50001 67658 32586 86679 50720 94953
26 81525 72295 04839 96423 24878 82651 66566 14778 76797 14780 13300 87074 79666 95725
27 29676 20591 68086 26432 46901 20849 89768 81536 86645 12659 92259 57102 80428 25280
28 00742 57392 39064 66432 84673 40027 32832 61362 98947 96067 64760 64584 96096 98253
29 05366 04213 25669 26422 44407 44048 37937 63904 45766 66134 75470 66520 34693 90449
30 91921 26418 64117 94305 26766 25940 39972 22209 71500 64568 91402 42416 07844 69618
31 00582 04711 87917 77341 42206 35126 74087 99547 81817 42607 43808 76655 62028 76630
32 00725 69884 62797 56170 86324 88072 76222 36086 84637 93161 76038 65855 77919 88006
33 69011 65795 95876 55293 18988 27354 26575 08625 40801 59920 29841 80150 12777 48501
34 25976 57948 29888 88604 67917 48708 18912 82271 65424 69774 33611 54262 85963 03547
35 09763 83473 73577 12908 30833 18317 28290 35797 05998 41688 34952 37888 38917 88050
20
22
-I I
APÉNDICE A. TABLAS 305

A.2. Tabla: Probabilidades Binomiales


EP
UD

A
IM
S -L
PU
M
CA

E
AD

-I I
22
20
Tabla: Probabilidades Binomiales
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 EP0,80 0,90 0,95
2 0 1 0,9801 0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500 0,1600 0,0900 0,0400 0,0100 0,0025


1 2 0,0198 0,0950 0,1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000 0,4800 0,4200 0,3200 0,1800 0,0950
2 1 0,0001 0,0025 0,0100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500 0,3600 0,4900 0,6400 0,8100 0,9025
3 0 1 0,9703 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250 0,0640 0,0270 0,0080 0,0010 0,0001
1 3 0,0294 0,1354 0,2430 0,3251 0,3840 0,4219 0,4410 0,4436 0,4320 0,4084 0,3750 0,2880 0,1890 0,0960 0,0270 0,0071
2 3 0,0003 0,0071 0,0270 0,0574 0,0960 0,1406 0,1890 0,2389 0,2880 0,3341 0,3750 0,4320 0,4410 0,3840 0,2430 0,1354
3 1 0,0001 0,0010 0,0034 0,0080 0,0156 0,0270 0,0429 0,0640 0,0911 0,1250 0,2160 0,3430 0,5120 0,7290 0,8574
4 0 1 0,9606 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0625 0,0256 0,0081 0,0016 0,0001
1 4 0,0388 0,1715 0,2916 0,3685 0,4096 0,4219 0,4116 0,3845 0,3456 0,2995 0,2500 0,1536 0,0756 0,0256 0,0036 0,0005
2 6 0,0006 0,0135 0,0486 0,0975 0,1536 0,2109 0,2646 0,3105 0,3456 0,3675 0,3750 0,3456 0,2646 0,1536 0,0486 0,0135
CA
3 4 0,0005 0,0036 0,0115 0,0256 0,0469 0,0756 0,1115 0,1536 0,2005 0,2500 0,3456 0,4116 0,4096 0,2916 0,1715
4 1 0,0001 0,0005 0,0016 0,0039 0,0081 0,0150 M
0,0256 0,0410 0,0625 0,1296 0,2401 0,4096 0,6561 0,8145
5 0 1 0,9510 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0313 0,0102 0,0024 0,0003
PU
1 5 0,0480 0,2036 0,3281 0,3915 0,4096 0,3955 0,3601 0,3124 0,2592 0,2059 0,1563 0,0768 0,0284 0,0064 0,0005
2 10 0,0010 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3456
S
0,3369 0,3125
-L 0,2304 0,1323 0,0512 0,0081 0,0011
3 10 0,0011 0,0081 0,0244 0,0512 0,0879 0,1323 0,1811 0,2304 0,2757 0,3125 0,3456 0,3087 0,2048 0,0729 0,0214
4 5 0,0005 0,0022 0,0064 0,0146 0,0284 0,0488 0,0768 0,1128 0,1563 0,2592 0,3602 0,4096 0,3280 0,2036
IM
5 1 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0185 0,0313 0,0778
A 0,1681 0,3277 0,5905 0,7738
6 0 1 0,9415 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0467 0,0277 0,0156 0,0041 0,0007 0,0001
1 6 0,0571 0,2321 0,3543 0,3993 0,3932 0,3560 0,3025 0,2437 0,1866 0,1359 0,0938 0,0369 0,0102 0,0015 0,0001
2 15 0,0014 0,0305 0,0984 0,1762 0,2458 0,2966 0,3241 0,3280 0,3110 0,2780 0,2344 0,1382 0,0595 0,0154 0,0012 0,0001
3 20 0,0021 0,0146 0,0415 0,0819 0,1318 0,1852 0,2355 0,2765 0,3032 0,3125 0,2765 0,1852 0,0819 0,0146 0,0021
4 15 0,0001 0,0012 0,0055 0,0154 0,0330 0,0595 0,0951 0,1382 0,1861 0,2344 0,3110 0,3241 0,2458 0,0984 0,0305
AD
5 6 0,0001 0,0004 0,0015 0,0044
E 0,0102 0,0205 0,0369 0,0609 0,0938 0,1866 0,3025 0,3932 0,3543 0,2321
6 1 0,0001 0,0002 0,0007 0,0018 0,0041 0,0083 0,0156 0,0467 0,1176 0,2621 0,5314 0,7351
7 0 1 0,9321 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078 0,0016 0,0002
1 7 0,0659 0,2573 0,3720 0,3960 0,3670 0,3115 0,2471 0,1848 0,1306 0,0872 0,0547 0,0172 0,0036 0,0004
2 21 0,0020 0,0406 0,1240 0,2097 0,2753 0,3115 0,3177 0,2985 0,2613 0,2140 0,1641 0,0774 0,0250 0,0043 0,0002
3 35 0,0036 0,0230 0,0617 0,1147 0,1730 0,2269 0,2679 0,2903 0,2918 0,2734 0,1935 0,0972 0,0287 0,0026 0,0002
4 35 0,0002 0,0026 0,0109 0,0287 0,0577 0,0972 0,1442 0,1935 0,2388 0,2734 0,2903 0,2269 0,1147 0,0230 0,0036
5 21 0,0002 0,0012 0,0043 0,0115 0,0250 0,0466 0,0774 0,1172 0,1641 0,2613 0,3177 0,2753 0,1240 0,0406
6 7 0,0001 0,0004 0,0013 0,0036 0,0084 0,0172 0,0320 0,0547 0,1306 0,2471 0,3670 0,3720 0,2573
7 1 0,0001 0,0002 0,0006 0,0016 0,0037 0,0078 0,0280 0,0824 0,2097 0,4783 0,6983
8 0 1 0,9227 0,6634 0,4305 0,2725 0,1678 0,1001 0,0576 0,0319 0,0168 0,0084 0,0039 0,0007 0,0001
1 8 0,0746 0,2793 0,3826 0,3847 0,3355 0,2670 0,1977 0,1373 0,0896 0,0548 0,0313 0,0079 0,0012 0,0001
20
2 28 0,0026
22 0,0515 0,1488 0,2376 0,2936 0,3115 0,2965 0,2587 0,2090 0,1569 0,1094 0,0413 0,0100 0,0011
3 56 0,0001 0,0054 0,0331 0,0839 0,1468 0,2076 0,2541 0,2786 0,2787 0,2568 0,2188 0,1239 0,0467 0,0092 0,0004
4 70 0,0004 0,0046 0,0185 0,0459 0,0865 0,1361 0,1875 0,2322 0,2627 0,2734 0,2322 0,1361 0,0459 0,0046 0,0004
-I I
5 56 0,0004 0,0026 0,0092 0,0231 0,0467 0,0808 0,1239 0,1719 0,2188 0,2787 0,2541 0,1468 0,0331 0,0054
6 28 0,0002 0,0011 0,0038 0,0100 0,0217 0,0413 0,0703 0,1094 0,2090 0,2965 0,2936 0,1488 0,0515
7 8 0,0001 0,0004 0,0012 0,0033 0,0079 0,0164 0,0313 0,0896 0,1977 0,3355 0,3826 0,2793
8 1 0,0001 0,0002 0,0007 0,0017 0,0039 0,0168 0,0576 0,1678 0,4305 0,6634
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95

Tabla: Probabilidades Binomiales
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
9 0 1 0,9135 0,6302 0,3874 0,2316 0,1342 0,0751 0,0404 0,0207 0,0101 0,0046 0,0020 0,0003


1 9 0,0830 0,2985 0,3874 0,3679 0,3020 0,2253 0,1556 0,1004 0,0605 0,0339 0,0176 0,0035 0,0004
2 36 0,0034 0,0629 0,1722 0,2597 0,3020 0,3003 0,2668 0,2162 0,1612 0,1110 0,0703 0,0212 0,0039 0,0003
3 84 0,0001 0,0077 0,0446 0,1069 0,1762 0,2336 0,2668 0,2716 0,2508 0,2119 0,1641 0,0743 0,0210 0,0028 0,0001
4 126 0,0006 0,0074 0,0283 0,0661 0,1168 0,1715 0,2194 0,2508 0,2600 0,2461 0,1672 0,0735 0,0165 0,0008
5 126 0,0008 0,0050 0,0165 0,0389 0,0735 0,1181 0,1672 0,2128 0,2461 0,2508 0,1715 0,0661 0,0074 0,0006
6 84 0,0001 0,0006 0,0028 0,0087 0,0210 0,0424 0,0743 0,1160 0,1641 0,2508 0,2668 0,1762 0,0446 0,0077
7 36 0,0000 0,0003 0,0012 0,0039 0,0098 0,0212 0,0407 0,0703 0,1612 0,2668 0,3020 0,1722 0,0629
8 9 0,0001 0,0004 0,0013 0,0035 0,0083 0,0176 0,0605 0,1556 0,3020 0,3874 0,2985
9 1 0,0001 0,0003
CA 0,0008 0,0020 0,0101 0,0404 0,1342 0,3874 0,6302
10 0 1 0,9044 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010 0,0001
1 10 0,0914 0,3151 0,3874 0,3474 0,2684 0,1877 0,1211 0,0725 0,0403
M 0,0207 0,0098 0,0016 0,0001
2 45 0,0042 0,0746 0,1937 0,2759 0,3020 0,2816 0,2335 0,1757 0,1209 0,0763 0,0439 0,0106 0,0014 0,0001
3 120 0,0001 0,0105 0,0574 0,1298 0,2013 0,2503 0,2668 0,2522 0,2150 0,1665 0,1172 0,0425 0,0090 0,0008
PU
4 210 0,0010 0,0112 0,0401 0,0881 0,1460 0,2001 0,2377 0,2508 0,2384
S 0,2051 0,1115 0,0368 0,0055 0,0001
5 252 0,0001 0,0015 0,0085 0,0264 0,0584 0,1029 0,1536 0,2007 0,2340 0,2461
-L 0,2007 0,1029 0,0264 0,0015 0,0001
6 210 0,0001 0,0012 0,0055 0,0162 0,0368 0,0689 0,1115 0,1596 0,2051
IM 0,2508 0,2001 0,0881 0,0112 0,0010
7 120 0,0001 0,0008 0,0031 0,0090 0,0212 0,0425 0,0746 0,1172 0,2150 0,2668 0,2013 0,0574 0,0105
8 45 0,0001 0,0004 0,0014 0,0043 0,0106 0,0229 0,0439 0,1209
A 0,2335 0,3020 0,1937 0,0746
9 10 0,0001 0,0005 0,0016 0,0042 0,0098 0,0403 0,1211 0,2684 0,3874 0,3151
10 1 0,0001 0,0003 0,0010 0,0060 0,0282 0,1074 0,3487 0,5987
11 0 1 0,8953 0,5688 0,3138 0,1673 0,0859 0,0422 0,0198 0,0088 0,0036 0,0014 0,0005 0,0000
1 11 0,0995 0,3293 0,3835 0,3248 0,2362 0,1549 0,0932 0,0518 0,0266 0,0125 0,0054 0,0007 0,0000
AD
2 55 0,0050 0,0867 0,2131 0,2866 0,2953 0,2581 0,1998 0,1395 0,0887 0,0513 0,0269 0,0052 0,0005
3 165 0,0002 0,0137 0,0710 0,1517 E
0,2215 0,2581 0,2568 0,2254 0,1774 0,1259 0,0806 0,0234 0,0037 0,0002
4 330 0,0014 0,0158 0,0536 0,1107 0,1721 0,2201 0,2428 0,2365 0,2060 0,1611 0,0701 0,0173 0,0017
5 462 0,0001 0,0025 0,0132 0,0388 0,0803 0,1321 0,1830 0,2207 0,2360 0,2256 0,1471 0,0566 0,0097 0,0003
6 462 0,0003 0,0023 0,0097 0,0268 0,0566 0,0985 0,1471 0,1931 0,2256 0,2207 0,1321 0,0388 0,0025 0,0001
7 330 0,0003 0,0017 0,0064 0,0173 0,0379 0,0701 0,1128 0,1611 0,2365 0,2201 0,1107 0,0158 0,0014
8 165 0,0002 0,0011 0,0037 0,0102 0,0234 0,0462 0,0806 0,1774 0,2568 0,2215 0,0710 0,0137
9 55 0,0001 0,0005 0,0018 0,0052 0,0126 0,0269 0,0887 0,1998 0,2953 0,2131 0,0867
10 11 0,0000 0,0002 0,0007 0,0021 0,0054 0,0266 0,0932 0,2362 0,3835 0,3293
11 1 0,0000 0,0002 0,0005 0,0036 0,0198 0,0859 0,3138 0,5688
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95


20
22
-I I
Tabla: Probabilidades Binomiales
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
12 0 1 0,8864 0,5404 0,2824 0,1422 0,0687 0,0317 0,0138 0,0057 0,0022 0,0008 0,0002


1 12 0,1074 0,3413 0,3766 0,3012 0,2062 0,1267 0,0712 0,0368 0,0174 0,0075 0,0029 0,0003
2 66 0,0060 0,0988 0,2301 0,2924 0,2835 0,2323 0,1678 0,1088 0,0639 0,0339 0,0161 0,0025 0,0002
3 220 0,0002 0,0173 0,0852 0,1720 0,2362 0,2581 0,2397 0,1954 0,1419 0,0923 0,0537 0,0125 0,0015 0,0001
4 495 0,0021 0,0213 0,0683 0,1329 0,1936 0,2311 0,2367 0,2128 0,1700 0,1208 0,0420 0,0078 0,0005
5 792 0,0002 0,0038 0,0193 0,0532 0,1032 0,1585 0,2039 0,2270 0,2225 0,1934 0,1009 0,0291 0,0033 0,0000
6 924 0,0005 0,0040 0,0155 0,0401 0,0792 0,1281 0,1766 0,2124 0,2256 0,1766 0,0792 0,0155 0,0005
7 792 0,0000 0,0006 0,0033 0,0115 0,0291 0,0591 0,1009 0,1489 0,1934 0,2270 0,1585 0,0532 0,0038 0,0002
8 495 0,0001 0,0005 0,0024 0,0078 0,0199 0,0420 0,0762 0,1208 0,2128 0,2311 0,1329 0,0213 0,0021
9 220 0,0001 0,0004 0,0015 0,0048 0,0125 0,0277 0,0537 0,1419 0,2397 0,2362 0,0852 0,0173
10 66 0,0002 0,0008 0,0025 0,0068 0,0161 0,0639 0,1678 0,2835 0,2301 0,0988
CA
11 12 0,0001 0,0003
M 0,0010 0,0029 0,0174 0,0712 0,2062 0,3766 0,3413
12 1 0,0001 0,0002 0,0022 0,0138 0,0687 0,2824 0,5404
13 0 1 0,8775 0,5133 0,2542 0,1209 0,0550 0,0238 0,0097 0,0037 0,0013 0,0004 0,0001
PU
1 13 0,1152 0,3512 0,3672 0,2774 0,1787 0,1029 0,0540 0,0259 0,0113 0,0045
S 0,0016 0,0001
2 78 0,0070 0,1109 0,2448 0,2937 0,2680 0,2059 0,1388 0,0836 0,0453 0,0220 -L0,0095 0,0012 0,0001
3 286 0,0003 0,0214 0,0997 0,1900 0,2457 0,2517 0,2181 0,1651 0,1107 0,0660 0,0349
IM 0,0065 0,0006
4 715 0,0028 0,0277 0,0838 0,1535 0,2097 0,2337 0,2222 0,1845 0,1350 0,0873 0,0243 0,0034 0,0001
5 1287 0,0003 0,0055 0,0266 0,0691 0,1258 0,1803 0,2154 0,2214 0,1989 0,1571A 0,0656 0,0142 0,0011
6 1716 0,0008 0,0063 0,0230 0,0559 0,1030 0,1546 0,1968 0,2169 0,2095 0,1312 0,0442 0,0058 0,0001
7 1716 0,0001 0,0011 0,0058 0,0186 0,0442 0,0833 0,1312 0,1775 0,2095 0,1968 0,1030 0,0230 0,0008
8 1287 0,0001 0,0011 0,0047 0,0142 0,0336 0,0656 0,1089 0,1571 0,2214 0,1803 0,0691 0,0055 0,0003
9 715 0,0001
AD 0,0009 0,0034 0,0101 0,0243 0,0495 0,0873 0,1845 0,2337 0,1535 0,0277 0,0028
10 286 0,0001 0,0006 0,0022 0,0065 0,0162 0,0349 0,1107 0,2181 0,2457 0,0997 0,0214
11 78 E 0,0001 0,0003 0,0012 0,0036 0,0095 0,0453 0,1388 0,2680 0,2448 0,1109
12 13 0,0001 0,0005 0,0016 0,0113 0,0540 0,1787 0,3672 0,3512
13 1 0,0001 0,0013 0,0097 0,0550 0,2542 0,5133
14 0 1 0,8687 0,4877 0,2288 0,1028 0,0440 0,0178 0,0068 0,0024 0,0008 0,0002 0,0001
1 14 0,1229 0,3593 0,3559 0,2539 0,1539 0,0832 0,0407 0,0181 0,0073 0,0027 0,0009 0,0001
2 91 0,0081 0,1229 0,2570 0,2912 0,2501 0,1802 0,1134 0,0634 0,0317 0,0141 0,0056 0,0005
3 364 0,0003 0,0259 0,1142 0,2056 0,2501 0,2402 0,1943 0,1366 0,0845 0,0462 0,0222 0,0033 0,0002
4 1001 0,0037 0,0349 0,0998 0,1720 0,2202 0,2290 0,2022 0,1549 0,1040 0,0611 0,0136 0,0014 0,0000
5 2002 0,0004 0,0078 0,0352 0,0860 0,1468 0,1963 0,2178 0,2066 0,1701 0,1222 0,0408 0,0066 0,0003
6 3003 0,0013 0,0093 0,0322 0,0734 0,1262 0,1759 0,2066 0,2088 0,1833 0,0918 0,0232 0,0020
7 3431 0,0002 0,0019 0,0092 0,0280 0,0618 0,1082 0,1574 0,1952 0,2094 0,1574 0,0618 0,0092 0,0002
8 3003 0,0003 0,0020 0,0082 0,0232 0,0510 0,0918 0,1398 0,1833 0,2066 0,1262 0,0322 0,0013
20
9 2002 22 0,0003 0,0018 0,0066 0,0183 0,0408 0,0762 0,1222 0,2066 0,1963 0,0860 0,0078 0,0004
10 1001 0,0000 0,0003 0,0014 0,0049 0,0136 0,0312 0,0611 0,1549 0,2290 0,1720 0,0349 0,0037
11 364 0,0002 0,0010 0,0033 0,0093 0,0222 0,0845 0,1943 0,2501 0,1142 0,0259
-I I
12 91 0,0001 0,0005 0,0019 0,0056 0,0317 0,1134 0,2501 0,2570 0,1229
13 14 0,0001 0,0002 0,0009 0,0073 0,0407 0,1539 0,3559 0,3593
14 1 0,0001 0,0008 0,0068 0,0440 0,2288 0,4877
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95

Tabla: Probabilidades Binomiales
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
15 0 1 0,8601 0,4633 0,2059 0,0874 0,0352 0,0134 0,0047 0,0016 0,0005 0,0001


1 15 0,1303 0,3658 0,3432 0,2312 0,1319 0,0668 0,0305 0,0126 0,0047 0,0016 0,0005
2 105 0,0092 0,1348 0,2669 0,2856 0,2309 0,1559 0,0916 0,0476 0,0219 0,0090 0,0032 0,0003
3 455 0,0004 0,0307 0,1285 0,2184 0,2501 0,2252 0,1700 0,1110 0,0634 0,0318 0,0139 0,0016 0,0001
4 1365 0,0049 0,0428 0,1156 0,1876 0,2252 0,2186 0,1792 0,1268 0,0780 0,0417 0,0074 0,0006
5 3003 0,0006 0,0105 0,0449 0,1032 0,1651 0,2061 0,2123 0,1859 0,1404 0,0916 0,0245 0,0030 0,0001
6 5005 0,0000 0,0019 0,0132 0,0430 0,0917 0,1472 0,1906 0,2066 0,1914 0,1527 0,0612 0,0116 0,0007
7 6435 0,0003 0,0030 0,0138 0,0393 0,0811 0,1319 0,1771 0,2013 0,1964 0,1181 0,0348 0,0035
8 6435 0,0005 0,0035 0,0131 0,0348 0,0710 0,1181 0,1647 0,1964 0,1771 0,0811 0,0138 0,0003
9 5005 0,0001 0,0007 0,0034 0,0116 0,0298 0,0612 0,1048 0,1527 0,2066 0,1472 0,0430 0,0019 0,0000
10 3003 0,0001 0,0007 0,0030 0,0096 0,0245 0,0515 0,0916 0,1859 0,2061 0,1032 0,0105 0,0006
CA
11 1365 0,0001 0,0006 0,0024 M 0,0074 0,0191 0,0417 0,1268 0,2186 0,1876 0,0428 0,0049
12 455 0,0001 0,0004 0,0016 0,0052 0,0139 0,0634 0,1700 0,2501 0,1285 0,0307
13 105 0,0001 0,0003 0,0010 0,0032 0,0219 0,0916 0,2309 0,2669 0,1348
PU
14 15 S0,0001 0,0005 0,0047 0,0305 0,1319 0,3432 0,3658
15 1 -L 0,0005 0,0047 0,0352 0,2059 0,4633
16 0 1 0,8515 0,4401 0,1853 0,0743 0,0281 0,0100 0,0033 0,0010 0,0003 0,0001 IM
1 16 0,1376 0,3706 0,3294 0,2097 0,1126 0,0535 0,0228 0,0087 0,0030 0,0009 0,0002
2 120 0,0104 0,1463 0,2745 0,2775 0,2111 0,1336 0,0732 0,0353 0,0150 0,0056 A
0,0018 0,0001
3 560 0,0005 0,0359 0,1423 0,2285 0,2463 0,2079 0,1465 0,0888 0,0468 0,0215 0,0085 0,0008
4 1820 0,0061 0,0514 0,1311 0,2001 0,2252 0,2040 0,1553 0,1014 0,0572 0,0278 0,0040 0,0002
5 4368 0,0008 0,0137 0,0555 0,1201 0,1802 0,2099 0,2008 0,1623 0,1123 0,0667 0,0142 0,0013
6 8008 0,0001 0,0028 0,0180 0,0550
AD 0,1101 0,1649 0,1982 0,1983 0,1684 0,1222 0,0392 0,0056 0,0002
7 11 439 0,0004 0,0045 0,0197 0,0524 0,1010 0,1524 0,1889 0,1969 0,1745 0,0839 0,0185 0,0012
8 12 868 0,0001 0,0009 0,0055
E 0,0197 0,0487 0,0923 0,1416 0,1812 0,1964 0,1416 0,0487 0,0055 0,0001
9 11 438 0,0001 0,0012 0,0058 0,0185 0,0442 0,0839 0,1318 0,1745 0,1889 0,1009 0,0197 0,0004
10 8007 0,0002 0,0014 0,0056 0,0167 0,0392 0,0755 0,1222 0,1983 0,1649 0,0550 0,0028 0,0001
11 4367 0,0002 0,0013 0,0049 0,0142 0,0337 0,0666 0,1622 0,2098 0,1200 0,0137 0,0008
12 1820 0,0002 0,0011 0,0040 0,0115 0,0278 0,1014 0,2040 0,2001 0,0514 0,0061
13 560 0,0002 0,0008 0,0029 0,0085 0,0468 0,1465 0,2463 0,1423 0,0359
14 120 0,0001 0,0005 0,0018 0,0150 0,0732 0,2111 0,2745 0,1463
15 16 0,0001 0,0002 0,0030 0,0228 0,1126 0,3294 0,3706
16 1 0,0003 0,0033 0,0281 0,1853 0,4401
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95


20
22
-I I
Tabla: Probabilidades Binomiales
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
19 0 1 0,8262 0,3774 0,1351 0,0456 0,0144 0,0042 0,0011 0,0003 0,0001


1 19 0,1586 0,3774 0,2852 0,1529 0,0685 0,0268 0,0093 0,0029 0,0008 0,0002
2 171 0,0144 0,1787 0,2852 0,2428 0,1540 0,0803 0,0358 0,0138 0,0046 0,0013 0,0003
3 969 0,0008 0,0533 0,1796 0,2428 0,2182 0,1517 0,0869 0,0422 0,0175 0,0062 0,0018 0,0001
4 3876 0,0112 0,0798 0,1714 0,2182 0,2023 0,1491 0,0909 0,0467 0,0203 0,0074 0,0005
5 11 628 0,0018 0,0266 0,0907 0,1636 0,2023 0,1916 0,1468 0,0933 0,0497 0,0222 0,0024 0,0001
6 27 130 0,0002 0,0069 0,0374 0,0955 0,1574 0,1916 0,1844 0,1451 0,0949 0,0517 0,0085 0,0005
7 50 383 0,0014 0,0122 0,0443 0,0974 0,1525 0,1844 0,1797 0,1443 0,0961 0,0237 0,0022 0,0000
8 75 574 0,0002 0,0032 0,0166 0,0487 0,0980 0,1489 0,1797 0,1770 0,1441 0,0532 0,0077 0,0003
9 92 368 0,0007 0,0051 0,0198 0,0514 0,0980 0,1464 0,1770 0,1762 0,0976 0,0220 0,0013
10 92 368 0,0001 0,0013 0,0066 0,0220 0,0528 0,0976 0,1448 0,1762 0,1464 0,0514 0,0051
CA
11 75 574 0,0003 0,0018 0,0077 0,0233M 0,0532 0,0970 0,1441 0,1797 0,0980 0,0166 0,0002
12 50 382 0,0000 0,0004 0,0022 0,0083 0,0237 0,0529 0,0961 0,1797 0,1525 0,0443 0,0014
13 27 129 0,0001 0,0005 0,0024 0,0085 0,0233 0,0517 0,1451 0,1916 0,0955 0,0069 0,0002
PU
14 11 627 0,0001 0,0006 0,0024 S 0,0082 0,0222 0,0933 0,1916 0,1636 0,0266 0,0018
15 3876 0,0001 0,0005 0,0022
-L 0,0074 0,0467 0,1491 0,2182 0,0798 0,0112
16 969 0,0001 0,0005 0,0018 0,0175 0,0869 0,2182 0,1796 0,0533
17 171 0,0001 0,0003 0,0046 0,0358 0,1540 0,2852 0,1787
IM
18 19 A 0,0008 0,0093 0,0685 0,2852 0,3774
19 1 0,0001 0,0011 0,0144 0,1351 0,3774
20 0 1 0,8179 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002
1 20 0,1652 0,3774 0,2702 0,1368 0,0576 0,0211 0,0068 0,0020 0,0005 0,0001
2 190 0,0159 0,1887 0,2852 0,2293
AD 0,1369 0,0669 0,0278 0,0100 0,0031 0,0008 0,0002
3 1140 0,0010 0,0596 0,1901 0,2428 0,2054 0,1339 0,0716 0,0323 0,0123 0,0040 0,0011 0,0000
4 4845 0,0000 0,0133 0,0898 0,1821 0,2182
E 0,1897 0,1304 0,0738 0,0350 0,0139 0,0046 0,0003
5 15 504 0,0022 0,0319 0,1028 0,1746 0,2023 0,1789 0,1272 0,0746 0,0365 0,0148 0,0013
6 38 759 0,0003 0,0089 0,0454 0,1091 0,1686 0,1916 0,1712 0,1244 0,0746 0,0370 0,0049 0,0002
7 77 518 0,0020 0,0160 0,0545 0,1124 0,1643 0,1844 0,1659 0,1221 0,0739 0,0146 0,0010
8 125 960 0,0004 0,0046 0,0222 0,0609 0,1144 0,1613 0,1797 0,1623 0,1201 0,0355 0,0039 0,0001
9 167 940 0,0001 0,0011 0,0074 0,0271 0,0654 0,1158 0,1597 0,1770 0,1602 0,0710 0,0120 0,0005
10 184 734 0,0002 0,0020 0,0099 0,0308 0,0686 0,1171 0,1593 0,1762 0,1171 0,0308 0,0020
11 167 940 0,0005 0,0030 0,0120 0,0336 0,0710 0,1185 0,1602 0,1597 0,0654 0,0074 0,0001
12 125 954 0,0001 0,0008 0,0039 0,0136 0,0355 0,0727 0,1201 0,1797 0,1144 0,0222 0,0004
13 77 510 0,0002 0,0010 0,0045 0,0146 0,0366 0,0739 0,1659 0,1642 0,0545 0,0020
14 38 755 0,0002 0,0012 0,0049 0,0150 0,0370 0,1244 0,1916 0,1091 0,0089 0,0003
15 15 502 20 0,0003 0,0013 0,0049 0,0148 0,0746 0,1788 0,1745 0,0319 0,0022
16 4844 0,0000 0,0003 0,0013 0,0046 0,0350 0,1304 0,2182 0,0898 0,0133
17 1140 0,0000 0,0002 0,0011 0,0123 0,0716 0,2054 0,1901 0,0596
22
18 190 -I I 0,0002 0,0031 0,0278 0,1369 0,2852 0,1887
19 20 0,0005 0,0068 0,0576 0,2702 0,3774
20 1 0,0008 0,0115 0,1216 0,3585
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95

APÉNDICE A. TABLAS 311

A.3. Tabla: Probabilidades de Poisson

λ
x 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
0 0.9048 0.8187 0.7408 0.6703 0.6065 0.5488 0.4966 0.4493 0.4066 0.3679
1 0.0905 0.1637 0.2222 0.2681 0.3033 0.3293 0.3476 0.3595 0.3659 0.3679
2 0.0045 0.0164 0.0333 0.0536 0.0758 0.0988 0.1217 0.1438 0.1647 0.1839
3 0.0002 0.0011 0.0033 0.0072 0.0126 0.0198 0.0284 0.0383 0.0494 0.0613
4 0.0000 0.0001 0.0003 0.0007 0.0016 0.0030 0.0050 0.0077 0.0111 0.0153
5 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0012 0.0020 0.0031
EP

6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0003 0.0005
UD

7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001

λ
A
x 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0
IM

0 0.3329 0.3012 0.2725 0.2466 0.2231 0.2019 0.1827 0.1653 0.1496 0.1353
1 0.3662 0.3614 0.3543 0.3452 0.3347 0.3230 0.3106 0.2975 0.2842 0.2707
-L

2 0.2014 0.2169 0.2303 0.2417 0.2510 0.2584 0.2640 0.2678 0.2700 0.2707
S
PU

3 0.0738 0.0867 0.0998 0.1128 0.1255 0.1378 0.1496 0.1607 0.1710 0.1804
4 0.0203 0.0260 0.0324 0.0395 0.0471 0.0551 0.0636 0.0723 0.0812 0.0902
M

5 0.0045 0.0062 0.0084 0.0111 0.0141 0.0176 0.0216 0.0260 0.0309 0.0361
CA

6 0.0008 0.0012 0.0018 0.0026 0.0035 0.0047 0.0061 0.0078 0.0098 0.0120
7 0.0001 0.0002 0.0003 0.0005 0.0008 0.0011 0.0015 0.0020 0.0027 0.0034
8 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0005 0.0006 0.0009
9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002

λ
x 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0
0 0.1225 0.1108 0.1003 0.0907 0.0821 0.0743 0.0672 0.0608 0.0550 0.0498
1 0.2572 0.2438 0.2306 0.2177 0.2052 0.1931 0.1815 0.1703 0.1596 0.1494
E

2 0.2700 0.2681 0.2652 0.2613 0.2565 0.2510 0.2450 0.2384 0.2314 0.2240
AD

3 0.1890 0.1966 0.2033 0.2090 0.2138 0.2176 0.2205 0.2225 0.2237 0.2240
4 0.0992 0.1082 0.1169 0.1254 0.1336 0.1414 0.1488 0.1557 0.1622 0.1680
5 0.0417 0.0476 0.0538 0.0602 0.0668 0.0735 0.0804 0.0872 0.0940 0.1008
6 0.0146 0.0174 0.0206 0.0241 0.0278 0.0319 0.0362 0.0407 0.0455 0.0504
7 0.0044 0.0055 0.0068 0.0083 0.0099 0.0118 0.0139 0.0163 0.0188 0.0216
8 0.0011 0.0015 0.0019 0.0025 0.0031 0.0038 0.0047 0.0057 0.0068 0.0081
9 0.0003 0.0004 0.0005 0.0007 0.0009 0.0011 0.0014 0.0018 0.0022 0.0027
10 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 0.0008
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
-I I
22
20
APÉNDICE A. TABLAS 312

Tabla: Probabilidades de Poisson (Continuación)

λ
x 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0
0 0.0450 0.0408 0.0369 0.0334 0.0302 0.0273 0.0247 0.0224 0.0202 0.0183
1 0.1397 0.1304 0.1217 0.1135 0.1057 0.0984 0.0915 0.0850 0.0789 0.0733
2 0.2165 0.2087 0.2008 0.1929 0.1850 0.1771 0.1692 0.1615 0.1539 0.1465
3 0.2237 0.2226 0.2209 0.2186 0.2158 0.2125 0.2087 0.2046 0.2001 0.1954
4 0.1733 0.1781 0.1823 0.1858 0.1888 0.1912 0.1931 0.1944 0.1951 0.1954
5 0.1075 0.1140 0.1203 0.1264 0.1322 0.1377 0.1429 0.1477 0.1522 0.1563
EP

6 0.0555 0.0608 0.0662 0.0716 0.0771 0.0826 0.0881 0.0936 0.0989 0.1042
7 0.0246 0.0278 0.0312 0.0348 0.0385 0.0425 0.0466 0.0508 0.0551 0.0595
UD

8 0.0095 0.0111 0.0129 0.0148 0.0169 0.0191 0.0215 0.0241 0.0269 0.0298
9 0.0033 0.0040 0.0047 0.0056 0.0066 0.0076 0.0089 0.0102 0.0116 0.0132
10 0.0010 0.0013 0.0016 0.0019 0.0023 0.0028 0.0033 0.0039 0.0045 0.0053
11 0.0003 0.0004 0.0005 0.0006 0.0007 0.0009 0.0011 0.0013 0.0016 0.0019
A
12 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006
IM

13 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002
14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
S-L
PU

λ
M

x 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5.0
CA

0 0.0166 0.0150 0.0136 0.0123 0.0111 0.0101 0.0091 0.0082 0.0074 0.0067
1 0.0679 0.0630 0.0583 0.0540 0.0500 0.0462 0.0427 0.0395 0.0365 0.0337
2 0.1393 0.1323 0.1254 0.1188 0.1125 0.1063 0.1005 0.0948 0.0894 0.0842
3 0.1904 0.1852 0.1798 0.1743 0.1687 0.1631 0.1574 0.1517 0.1460 0.1404
4 0.1951 0.1944 0.1933 0.1917 0.1898 0.1875 0.1849 0.1820 0.1789 0.1755
5 0.1600 0.1633 0.1662 0.1687 0.1708 0.1725 0.1738 0.1747 0.1753 0.1755
6 0.1093 0.1143 0.1191 0.1237 0.1281 0.1323 0.1362 0.1398 0.1432 0.1462
7 0.0640 0.0686 0.0732 0.0778 0.0824 0.0869 0.0914 0.0959 0.1002 0.1044
8 0.0328 0.0360 0.0393 0.0428 0.0463 0.0500 0.0537 0.0575 0.0614 0.0653
9 0.0150 0.0168 0.0188 0.0209 0.0232 0.0255 0.0281 0.0307 0.0334 0.0363
E

10 0.0061 0.0071 0.0081 0.0092 0.0104 0.0118 0.0132 0.0147 0.0164 0.0181
AD

11 0.0023 0.0027 0.0032 0.0037 0.0043 0.0049 0.0056 0.0064 0.0073 0.0082
12 0.0008 0.0009 0.0011 0.0013 0.0016 0.0019 0.0022 0.0026 0.0030 0.0034
13 0.0002 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013
14 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005
15 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002
-I I
22
20
APÉNDICE A. TABLAS 313

Tabla: Probabilidades de Poisson (Continuación)

λ
x 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6.0
0 0.0061 0.0055 0.0050 0.0045 0.0041 0.0037 0.0033 0.0030 0.0027 0.0025
1 0.0311 0.0287 0.0265 0.0244 0.0225 0.0207 0.0191 0.0176 0.0162 0.0149
2 0.0793 0.0746 0.0701 0.0659 0.0618 0.0580 0.0544 0.0509 0.0477 0.0446
3 0.1348 0.1293 0.1239 0.1185 0.1133 0.1082 0.1033 0.0985 0.0938 0.0892
4 0.1719 0.1681 0.1641 0.1600 0.1558 0.1515 0.1472 0.1428 0.1383 0.1339
5 0.1753 0.1748 0.1740 0.1728 0.1714 0.1697 0.1678 0.1656 0.1632 0.1606
EP

6 0.1490 0.1515 0.1537 0.1555 0.1571 0.1584 0.1594 0.1601 0.1605 0.1606
7 0.1086 0.1125 0.1163 0.1200 0.1234 0.1267 0.1298 0.1326 0.1353 0.1377
UD

8 0.0692 0.0731 0.0771 0.0810 0.0849 0.0887 0.0925 0.0962 0.0998 0.1033
9 0.0392 0.0423 0.0454 0.0486 0.0519 0.0552 0.0586 0.0620 0.0654 0.0688
10 0.0200 0.0220 0.0241 0.0262 0.0285 0.0309 0.0334 0.0359 0.0386 0.0413
11 0.0093 0.0104 0.0116 0.0129 0.0143 0.0157 0.0173 0.0190 0.0207 0.0225
A
12 0.0039 0.0045 0.0051 0.0058 0.0065 0.0073 0.0082 0.0092 0.0102 0.0113
IM

13 0.0015 0.0018 0.0021 0.0024 0.0028 0.0032 0.0036 0.0041 0.0046 0.0052
14 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013 0.0015 0.0017 0.0019 0.0022
-L

15 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009
S
PU

16 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003
17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001
M
CA

λ
x 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 7.0
0 0.0022 0.0020 0.0018 0.0017 0.0015 0.0014 0.0012 0.0011 0.0010 0.0009
1 0.0137 0.0126 0.0116 0.0106 0.0098 0.0090 0.0082 0.0076 0.0070 0.0064
2 0.0417 0.0390 0.0364 0.0340 0.0318 0.0296 0.0276 0.0258 0.0240 0.0223
3 0.0848 0.0806 0.0765 0.0726 0.0688 0.0652 0.0617 0.0584 0.0552 0.0521
4 0.1294 0.1249 0.1205 0.1162 0.1118 0.1076 0.1034 0.0992 0.0952 0.0912
5 0.1579 0.1549 0.1519 0.1487 0.1454 0.1420 0.1385 0.1349 0.1314 0.1277
6 0.1605 0.1601 0.1595 0.1586 0.1575 0.1562 0.1546 0.1529 0.1511 0.1490
E

7 0.1399 0.1418 0.1435 0.1450 0.1462 0.1472 0.1480 0.1486 0.1489 0.1490
AD

8 0.1066 0.1099 0.1130 0.1160 0.1188 0.1215 0.1240 0.1263 0.1284 0.1304
9 0.0723 0.0757 0.0791 0.0825 0.0858 0.0891 0.0923 0.0954 0.0985 0.1014
10 0.0441 0.0469 0.0498 0.0528 0.0558 0.0588 0.0618 0.0649 0.0679 0.0710
11 0.0244 0.0265 0.0285 0.0307 0.0330 0.0353 0.0377 0.0401 0.0426 0.0452
12 0.0124 0.0137 0.0150 0.0164 0.0179 0.0194 0.0210 0.0227 0.0245 0.0263
13 0.0058 0.0065 0.0073 0.0081 0.0089 0.0099 0.0108 0.0119 0.0130 0.0142
14 0.0025 0.0029 0.0033 0.0037 0.0041 0.0046 0.0052 0.0058 0.0064 0.0071
15 0.0010 0.0012 0.0014 0.0016 0.0018 0.0020 0.0023 0.0026 0.0029 0.0033
16 0.0004 0.0005 0.0005 0.0006 0.0007 0.0008 0.0010 0.0011 0.0013 0.0014
17 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006
-I I

18 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002
22

19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001
20
APÉNDICE A. TABLAS 314

Tabla: Probabilidades de Poisson (Continuación)

λ
x 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 8.0
0 0.0008 0.0007 0.0007 0.0006 0.0006 0.0005 0.0005 0.0004 0.0004 0.0003
1 0.0059 0.0054 0.0049 0.0045 0.0041 0.0038 0.0035 0.0032 0.0029 0.0027
2 0.0208 0.0194 0.0180 0.0167 0.0156 0.0145 0.0134 0.0125 0.0116 0.0107
3 0.0492 0.0464 0.0438 0.0413 0.0389 0.0366 0.0345 0.0324 0.0305 0.0286
4 0.0874 0.0836 0.0799 0.0764 0.0729 0.0696 0.0663 0.0632 0.0602 0.0573
5 0.1241 0.1204 0.1167 0.1130 0.1094 0.1057 0.1021 0.0986 0.0951 0.0916
6 0.1468 0.1445 0.1420 0.1394 0.1367 0.1339 0.1311 0.1282 0.1252 0.1221
EP

7 0.1489 0.1486 0.1481 0.1474 0.1465 0.1454 0.1442 0.1428 0.1413 0.1396
8 0.1321 0.1337 0.1351 0.1363 0.1373 0.1381 0.1388 0.1392 0.1395 0.1396
UD

9 0.1042 0.1070 0.1096 0.1121 0.1144 0.1167 0.1187 0.1207 0.1224 0.1241
10 0.0740 0.0770 0.0800 0.0829 0.0858 0.0887 0.0914 0.0941 0.0967 0.0993
11 0.0478 0.0504 0.0531 0.0558 0.0585 0.0613 0.0640 0.0667 0.0695 0.0722
12 0.0283 0.0303 0.0323 0.0344 0.0366 0.0388 0.0411 0.0434 0.0457 0.0481
13 0.0154 0.0168 0.0181 0.0196 0.0211 0.0227 0.0243 0.0260 0.0278 0.0296
A
14 0.0078 0.0086 0.0095 0.0104 0.0113 0.0123 0.0134 0.0145 0.0157 0.0169
IM

15 0.0037 0.0041 0.0046 0.0051 0.0057 0.0062 0.0069 0.0075 0.0083 0.0090
16 0.0016 0.0019 0.0021 0.0024 0.0026 0.0030 0.0033 0.0037 0.0041 0.0045
-L

17 0.0007 0.0008 0.0009 0.0010 0.0012 0.0013 0.0015 0.0017 0.0019 0.0021
S

18 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006 0.0006 0.0007 0.0008 0.0009
PU

19 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003 0.0003 0.0004
20 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002
M

21 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001
CA

λ
x 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 9.0
0 0.0003 0.0003 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0001 0.0001
1 0.0025 0.0023 0.0021 0.0019 0.0017 0.0016 0.0014 0.0013 0.0012 0.0011
2 0.0100 0.0092 0.0086 0.0079 0.0074 0.0068 0.0063 0.0058 0.0054 0.0050
3 0.0269 0.0252 0.0237 0.0222 0.0208 0.0195 0.0183 0.0171 0.0160 0.0150
4 0.0544 0.0517 0.0491 0.0466 0.0443 0.0420 0.0398 0.0377 0.0357 0.0337
5 0.0882 0.0849 0.0816 0.0784 0.0752 0.0722 0.0692 0.0663 0.0635 0.0607
6 0.1191 0.1160 0.1128 0.1097 0.1066 0.1034 0.1003 0.0972 0.0941 0.0911
7 0.1378 0.1358 0.1338 0.1317 0.1294 0.1271 0.1247 0.1222 0.1197 0.1171
E

8 0.1395 0.1392 0.1388 0.1382 0.1375 0.1366 0.1356 0.1344 0.1332 0.1318
AD

9 0.1256 0.1269 0.1280 0.1290 0.1299 0.1306 0.1311 0.1315 0.1317 0.1318
10 0.1017 0.1040 0.1063 0.1084 0.1104 0.1123 0.1140 0.1157 0.1172 0.1186
11 0.0749 0.0776 0.0802 0.0828 0.0853 0.0878 0.0902 0.0925 0.0948 0.0970
12 0.0505 0.0530 0.0555 0.0579 0.0604 0.0629 0.0654 0.0679 0.0703 0.0728
13 0.0315 0.0334 0.0354 0.0374 0.0395 0.0416 0.0438 0.0459 0.0481 0.0504
14 0.0182 0.0196 0.0210 0.0225 0.0240 0.0256 0.0272 0.0289 0.0306 0.0324
15 0.0098 0.0107 0.0116 0.0126 0.0136 0.0147 0.0158 0.0169 0.0182 0.0194
16 0.0050 0.0055 0.0060 0.0066 0.0072 0.0079 0.0086 0.0093 0.0101 0.0109
17 0.0024 0.0026 0.0029 0.0033 0.0036 0.0040 0.0044 0.0048 0.0053 0.0058
18 0.0011 0.0012 0.0014 0.0015 0.0017 0.0019 0.0021 0.0024 0.0026 0.0029
19 0.0005 0.0005 0.0006 0.0007 0.0008 0.0009 0.0010 0.0011 0.0012 0.0014
-I I

20 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004 0.0005 0.0005 0.0006
21 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0002 0.0003
22

22 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001
20
APÉNDICE A. TABLAS 315

Tabla: Probabilidades de Poisson (Continuación)

λ
x 9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8 9.9 10
0 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0000
1 0.0010 0.0009 0.0009 0.0008 0.0007 0.0007 0.0006 0.0005 0.0005 0.0005
2 0.0046 0.0043 0.0040 0.0037 0.0034 0.0031 0.0029 0.0027 0.0025 0.0023
3 0.0140 0.0131 0.0123 0.0115 0.0107 0.0100 0.0093 0.0087 0.0081 0.0076
4 0.0319 0.0302 0.0285 0.0269 0.0254 0.0240 0.0226 0.0213 0.0201 0.0189
EP

5 0.0581 0.0555 0.0530 0.0506 0.0483 0.0460 0.0439 0.0418 0.0398 0.0378
UD

6 0.0881 0.0851 0.0822 0.0793 0.0764 0.0736 0.0709 0.0682 0.0656 0.0631
7 0.1145 0.1118 0.1091 0.1064 0.1037 0.1010 0.0982 0.0955 0.0928 0.0901
8 0.1302 0.1286 0.1269 0.1251 0.1232 0.1212 0.1191 0.1170 0.1148 0.1126
9 0.1317 0.1315 0.1311 0.1306 0.1300 0.1293 0.1284 0.1274 0.1263 0.1251
A
10 0.1198 0.1210 0.1219 0.1228 0.1235 0.1241 0.1245 0.1249 0.1250 0.1251
IM

11 0.0991 0.1012 0.1031 0.1049 0.1067 0.1083 0.1098 0.1112 0.1125 0.1137
-L

12 0.0752 0.0776 0.0799 0.0822 0.0844 0.0866 0.0888 0.0908 0.0928 0.0948
S
PU

13 0.0526 0.0549 0.0572 0.0594 0.0617 0.0640 0.0662 0.0685 0.0707 0.0729
14 0.0342 0.0361 0.0380 0.0399 0.0419 0.0439 0.0459 0.0479 0.0500 0.0521
M

15 0.0208 0.0221 0.0235 0.0250 0.0265 0.0281 0.0297 0.0313 0.0330 0.0347
CA

16 0.0118 0.0127 0.0137 0.0147 0.0157 0.0168 0.0180 0.0192 0.0204 0.0217
17 0.0063 0.0069 0.0075 0.0081 0.0088 0.0095 0.0103 0.0111 0.0119 0.0128
18 0.0032 0.0035 0.0039 0.0042 0.0046 0.0051 0.0055 0.0060 0.0065 0.0071
19 0.0015 0.0017 0.0019 0.0021 0.0023 0.0026 0.0028 0.0031 0.0034 0.0037
20 0.0007 0.0008 0.0009 0.0010 0.0011 0.0012 0.0014 0.0015 0.0017 0.0019
21 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006 0.0006 0.0007 0.0008 0.0009
22 0.0001 0.0001 0.0002 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004
23 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002
E

24 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001
AD

-I I
22
20
APÉNDICE A. TABLAS 316

Tabla: Probabilidades de Poisson (Continuación)

λ
x 11 12 13 14 15 16 17 18 19 20
0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.0010 0.0004 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.0037 0.0018 0.0008 0.0004 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000
4 0.0102 0.0053 0.0027 0.0013 0.0006 0.0003 0.0001 0.0001 0.0000 0.0000
5 0.0224 0.0127 0.0070 0.0037 0.0019 0.0010 0.0005 0.0002 0.0001 0.0001
EP

6 0.0411 0.0255 0.0152 0.0087 0.0048 0.0026 0.0014 0.0007 0.0004 0.0002
7 0.0646 0.0437 0.0281 0.0174 0.0104 0.0060 0.0034 0.0019 0.0010 0.0005
UD

8 0.0888 0.0655 0.0457 0.0304 0.0194 0.0120 0.0072 0.0042 0.0024 0.0013
9 0.1085 0.0874 0.0661 0.0473 0.0324 0.0213 0.0135 0.0083 0.0050 0.0029
10 0.1194 0.1048 0.0859 0.0663 0.0486 0.0341 0.0230 0.0150 0.0095 0.0058
11 0.1194 0.1144 0.1015 0.0844 0.0663 0.0496 0.0355 0.0245 0.0164 0.0106
12 0.1094 0.1144 0.1099 0.0984 0.0829 0.0661 0.0504 0.0368 0.0259 0.0176
A
IM

13 0.0926 0.1056 0.1099 0.1060 0.0956 0.0814 0.0658 0.0509 0.0378 0.0271
14 0.0728 0.0905 0.1021 0.1060 0.1024 0.0930 0.0800 0.0655 0.0514 0.0387
-L

15 0.0534 0.0724 0.0885 0.0989 0.1024 0.0992 0.0906 0.0786 0.0650 0.0516
S

16 0.0367 0.0543 0.0719 0.0866 0.0960 0.0992 0.0963 0.0884 0.0772 0.0646
PU

17 0.0237 0.0383 0.0550 0.0713 0.0847 0.0934 0.0963 0.0936 0.0863 0.0760
18 0.0145 0.0255 0.0397 0.0554 0.0706 0.0830 0.0909 0.0936 0.0911 0.0844
M

19 0.0084 0.0161 0.0272 0.0409 0.0557 0.0699 0.0814 0.0887 0.0911 0.0888
CA

20 0.0046 0.0097 0.0177 0.0286 0.0418 0.0559 0.0692 0.0798 0.0866 0.0888
21 0.0024 0.0055 0.0109 0.0191 0.0299 0.0426 0.0560 0.0684 0.0783 0.0846
22 0.0012 0.0030 0.0065 0.0121 0.0204 0.0310 0.0433 0.0560 0.0676 0.0769
23 0.0006 0.0016 0.0037 0.0074 0.0133 0.0216 0.0320 0.0438 0.0559 0.0669
24 0.0003 0.0008 0.0020 0.0043 0.0083 0.0144 0.0226 0.0328 0.0442 0.0557
25 0.0001 0.0004 0.0010 0.0024 0.0050 0.0092 0.0154 0.0237 0.0336 0.0446
26 0.0000 0.0002 0.0005 0.0013 0.0029 0.0057 0.0101 0.0164 0.0246 0.0343
27 0.0000 0.0001 0.0002 0.0007 0.0016 0.0034 0.0063 0.0109 0.0173 0.0254
28 0.0000 0.0000 0.0001 0.0003 0.0009 0.0019 0.0038 0.0070 0.0117 0.0181
29 0.0000 0.0000 0.0001 0.0002 0.0004 0.0011 0.0023 0.0044 0.0077 0.0125
E

30 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0013 0.0026 0.0049 0.0083
AD

31 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0007 0.0015 0.0030 0.0054
32 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0004 0.0009 0.0018 0.0034
33 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0005 0.0010 0.0020
34 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0012
35 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0007
36 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004
37 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002
38 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
39 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
-I I
22
20
APÉNDICE A. TABLAS 317

A.4. Distribución normal estándar

P (0 < Z < Zc)


EP

0 Zc Z
UD

Zc 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
A
0.0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.03586
IM

0.1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535
0.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
-L

0.3 0.11791 0.12172 0.12552 0.12930 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173
S

0.4 0.15542 0.15910 0.16276 0.16640 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793
PU

0.5 0.19146 0.19497 0.19847 0.20194 0.20540 0.20884 0.21226 0.21566 0.21904 0.22240
0.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.25490
M

0.7 0.25804 0.26115 0.26424 0.26730 0.27035 0.27337 0.27637 0.27935 0.28230 0.28524
CA

0.8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.31327
0.9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891
1.0 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214
1.1 0.36433 0.36650 0.36864 0.37076 0.37286 0.37493 0.37698 0.37900 0.38100 0.38298
1.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.40147
1.3 0.40320 0.40490 0.40658 0.40824 0.40988 0.41149 0.41309 0.41466 0.41621 0.41774
1.4 0.41924 0.42073 0.42220 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189
1.5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408
1.6 0.44520 0.44630 0.44738 0.44845 0.44950 0.45053 0.45154 0.45254 0.45352 0.45449
1.7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46080 0.46164 0.46246 0.46327
1.8 0.46407 0.46485 0.46562 0.46638 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062
1.9 0.47128 0.47193 0.47257 0.47320 0.47381 0.47441 0.47500 0.47558 0.47615 0.47670
E

2.0 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.48030 0.48077 0.48124 0.48169
AD

2.1 0.48214 0.48257 0.48300 0.48341 0.48382 0.48422 0.48461 0.48500 0.48537 0.48574
2.2 0.48610 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.48840 0.48870 0.48899
2.3 0.48928 0.48956 0.48983 0.49010 0.49036 0.49061 0.49086 0.49111 0.49134 0.49158
2.4 0.49180 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361
2.5 0.49379 0.49396 0.49413 0.49430 0.49446 0.49461 0.49477 0.49492 0.49506 0.49520
2.6 0.49534 0.49547 0.49560 0.49573 0.49585 0.49598 0.49609 0.49621 0.49632 0.49643
2.7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.49720 0.49728 0.49736
2.8 0.49744 0.49752 0.49760 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807
2.9 0.49813 0.49819 0.49825 0.49831 0.49836 0.49841 0.49846 0.49851 0.49856 0.49861
3.0 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49896 0.49900
3.1 0.49903 0.49906 0.49910 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929
-I I

3.2 0.49931 0.49934 0.49936 0.49938 0.49940 0.49942 0.49944 0.49946 0.49948 0.49950
3.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.49960 0.49961 0.49962 0.49964 0.49965
22

3.4 0.49966 0.49968 0.49969 0.49970 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976
20

3.5 0.49977 0.49978 0.49978 0.49979 0.49980 0.49981 0.49981 0.49982 0.49983 0.49983
3.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989
3.7 0.49989 0.49990 0.49990 0.49990 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992
3.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995
3.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997
APÉNDICE A. TABLAS 318

A.5. Distribución t

Área (probabilidad)
EP

en extremo superior
UD

0 t
A
IM
S -L
PU

Grados de Área en el extremo superior


M

libertad 0.10 0.05 0.025 0.01 0.005


CA

1 3.0777 6.3138 12.7062 31.8205 63.6567


2 1.8856 2.9200 4.3027 6.9646 9.9248
3 1.6377 2.3534 3.1824 4.5407 5.8409
4 1.5332 2.1318 2.7764 3.7469 4.6041
5 1.4759 2.0150 2.5706 3.3649 4.0321
6 1.4398 1.9432 2.4469 3.1427 3.7074
7 1.4149 1.8946 2.3646 2.9980 3.4995
8 1.3968 1.8595 2.3060 2.8965 3.3554
9 1.3830 1.8331 2.2622 2.8214 3.2498
10 1.3722 1.8125 2.2281 2.7638 3.1693
E

11 1.3634 1.7959 2.2010 2.7181 3.1058


AD

12 1.3562 1.7823 2.1788 2.6810 3.0545


13 1.3502 1.7709 2.1604 2.6503 3.0123
14 1.3450 1.7613 2.1448 2.6245 2.9768
15 1.3406 1.7531 2.1314 2.6025 2.9467
16 1.3368 1.7459 2.1199 2.5835 2.9208
17 1.3334 1.7396 2.1098 2.5669 2.8982
18 1.3304 1.7341 2.1009 2.5524 2.8784
19 1.3277 1.7291 2.0930 2.5395 2.8609
20 1.3253 1.7247 2.0860 2.5280 2.8453
-I I

21 1.3232 1.7207 2.0796 2.5176 2.8314


22 1.3212 1.7171 2.0739 2.5083 2.8188
22

23 1.3195 1.7139 2.0687 2.4999 2.8073


20
APÉNDICE A. TABLAS 319

Tabla: Distribución t (Continuación)

Grados de Área en el extremo superior


libertad 0.10 0.05 0.025 0.01 0.005
24 1.3178 1.7109 2.0639 2.4922 2.7969
25 1.3163 1.7081 2.0595 2.4851 2.7874
26 1.3150 1.7056 2.0555 2.4786 2.7787
27 1.3137 1.7033 2.0518 2.4727 2.7707
28 1.3125 1.7011 2.0484 2.4671 2.7633
29 1.3114 1.6991 2.0452 2.4620 2.7564
30 1.3104 1.6973 2.0423 2.4573 2.7500
EP

31 1.3095 1.6955 2.0395 2.4528 2.7440


UD

32 1.3086 1.6939 2.0369 2.4487 2.7385


33 1.3077 1.6924 2.0345 2.4448 2.7333
34 1.3070 1.6909 2.0322 2.4411 2.7284
35 1.3062 1.6896 2.0301 2.4377 2.7238
36 1.3055 1.6883 2.0281 2.4345 2.7195
A
IM

37 1.3049 1.6871 2.0262 2.4314 2.7154


38 1.3042 1.6860 2.0244 2.4286 2.7116
-L

39 1.3036 1.6849 2.0227 2.4258 2.7079


S

40 1.3031 1.6839 2.0211 2.4233 2.7045


PU

41 1.3025 1.6829 2.0195 2.4208 2.7012


42 1.3020 1.6820 2.0181 2.4185 2.6981
M

43 1.3016 1.6811 2.0167 2.4163 2.6951


CA

44 1.3011 1.6802 2.0154 2.4141 2.6923


45 1.3006 1.6794 2.0141 2.4121 2.6896
46 1.3002 1.6787 2.0129 2.4102 2.6870
47 1.2998 1.6779 2.0117 2.4083 2.6846
48 1.2994 1.6772 2.0106 2.4066 2.6822
49 1.2991 1.6766 2.0096 2.4049 2.6800
50 1.2987 1.6759 2.0086 2.4033 2.6778
51 1.2984 1.6753 2.0076 2.4017 2.6757
52 1.2980 1.6747 2.0066 2.4002 2.6737
53 1.2977 1.6741 2.0057 2.3988 2.6718
E

54 1.2974 1.6736 2.0049 2.3974 2.6700


AD

55 1.2971 1.6730 2.0040 2.3961 2.6682


56 1.2969 1.6725 2.0032 2.3948 2.6665
57 1.2966 1.6720 2.0025 2.3936 2.6649
58 1.2963 1.6716 2.0017 2.3924 2.6633
59 1.2961 1.6711 2.0010 2.3912 2.6618
60 1.2958 1.6706 2.0003 2.3901 2.6603
-I I
22
20
APÉNDICE A. TABLAS 320

Tabla: Distribución t (Continuación)

Grados de Área en el extremo superior


libertad 0.10 0.05 0.025 0.01 0.005
61 1.2956 1.6702 1.9996 2.3890 2.6589
62 1.2954 1.6698 1.9990 2.3880 2.6575
63 1.2951 1.6694 1.9983 2.3870 2.6561
64 1.2949 1.6690 1.9977 2.3860 2.6549
65 1.2947 1.6686 1.9971 2.3851 2.6536
66 1.2945 1.6683 1.9966 2.3842 2.6524
67 1.2943 1.6679 1.9960 2.3833 2.6512
EP

68 1.2941 1.6676 1.9955 2.3824 2.6501


UD

69 1.2939 1.6672 1.9949 2.3816 2.6490


70 1.2938 1.6669 1.9944 2.3808 2.6479
71 1.2936 1.6666 1.9939 2.3800 2.6469
72 1.2934 1.6663 1.9935 2.3793 2.6459
73 1.2933 1.6660 1.9930 2.3785 2.6449
A
IM

74 1.2931 1.6657 1.9925 2.3778 2.6439


75 1.2929 1.6654 1.9921 2.3771 2.6430
-L

76 1.2928 1.6652 1.9917 2.3764 2.6421


S

77 1.2926 1.6649 1.9913 2.3758 2.6412


PU

78 1.2925 1.6646 1.9908 2.3751 2.6403


79 1.2924 1.6644 1.9905 2.3745 2.6395
M

80 1.2922 1.6641 1.9901 2.3739 2.6387


CA

81 1.2921 1.6639 1.9897 2.3733 2.6379


82 1.2920 1.6636 1.9893 2.3727 2.6371
83 1.2918 1.6634 1.9890 2.3721 2.6364
84 1.2917 1.6632 1.9886 2.3716 2.6356
85 1.2916 1.6630 1.9883 2.3710 2.6349
86 1.2915 1.6628 1.9879 2.3705 2.6342
87 1.2914 1.6626 1.9876 2.3700 2.6335
88 1.2912 1.6624 1.9873 2.3695 2.6329
89 1.2911 1.6622 1.9870 2.3690 2.6322
90 1.2910 1.6620 1.9867 2.3685 2.6316
E

91 1.2909 1.6618 1.9864 2.3680 2.6309


AD

92 1.2908 1.6616 1.9861 2.3676 2.6303


93 1.2907 1.6614 1.9858 2.3671 2.6297
94 1.2906 1.6612 1.9855 2.3667 2.6291
95 1.2905 1.6611 1.9853 2.3662 2.6286
96 1.2904 1.6609 1.9850 2.3658 2.6280
97 1.2903 1.6607 1.9847 2.3654 2.6275
98 1.2902 1.6606 1.9845 2.3650 2.6269
99 1.2902 1.6604 1.9842 2.3646 2.6264
100 1.2901 1.6602 1.9840 2.3642 2.6259
-I I
22
20
Bibliografı́a

Agurto, H. y Alvarado, L. (2009). Estadı́stica para administración y economı́a con


aplicaciones en Excel, San Marcos.

Anderson, D. y Sweeney, D. (2008). Estadı́stica Para administración y economı́a, 10 edn,


Cengage Learning Latin America.
EP

Anderson, D., Sweeney, D., Williams, T., Camm, J. y Cochran, J. (2014). Statistics for
UD

Business and Economics, 12 edn, Cengage Learning.

Angulo, C. (2011). Estadı́stica, Universidad de Piura.


A
M

Berenson, M., Levine, D. y Krehbiel, T. (2006). Estadı́stica para administración, Pearson


LI

Educación.
S-

Johnson, R. y Kuby, P. (2008). Estadı́stica elemental: Lo esencial, 10 edn, CRC Press.


PU

Lind, D., Marchal, W. y Wathen, S. (2012). Estadı́stica aplicada a los negocios y la economı́a.,
M

15 edn, McGraw-Hill Interamericana.


CA

Triola, M. (2018). Estadı́stica, 12 edn, Pearson.

Ubøe, J. (2017). Introductory Statistics for Business and Economics. Theory, Exercises and
Solutions, Springer.
E
AD

-II
22
20

321

También podría gustarte