Texto Guia ES1 (A y B) 2022-II Prof. Hugo Agurto

EP
UD
FACULTAD DE CIENCIAS ECONÓMICAS Y

A
IM
EMPRESARIALES-CAMPUS LIMA
-L
PROGRAMA:
S
PU
ADMINISTRACIÓN DE EMPRESAS
M
CA
ASIGNATURA:
ESTADÍSTICA 1
CAPÍTULOS: 1, 2, 3, 4, 5, 6 y 7
E
PROFESOR:
AD
Hugo Agurto Mejı́a

-I I
LIMA - PERÚ
22
2022
20
Índice general
EP
Índice de figuras VI
UD
Índice de tablas IX
1. Introducción a la estadı́stica 1
1.1. Definición de Estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
A
1.2. Estadı́stica Descriptiva y Estadı́stica Inferencial . . . . . . . . . . . . . . . . . 2
IM
1.3. Introducción a los términos básicos . . . . . . . . . . . . . . . . . . . . . . . . 2

-L
1.4. Tipos de Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

S
1.5. Recolección de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

PU
1.6. Fuentes de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

M
1.7. Problemas propuestos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

CA
2. Estadı́stica descriptiva 35
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2. Estadı́stica descriptiva:Técnicas tabulares y gráficas . . . . . . . . . . . . . . 35
2.2.1. Resumen de datos cualitativos . . . . . . . . . . . . . . . . . . . . . . 35
2.2.1.1. Tabla de frecuencias . . . . . . . . . . . . . . . . . . . . . . . 35
2.2.1.2. Diagrama de barras y gráfica de pastel . . . . . . . . . . . . 36
2.2.1.3. Diagrama de Pareto. . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.2. Resumen de datos cuantitativos . . . . . . . . . . . . . . . . . . . . . . 40
E
AD
2.2.2.1. Datos cuantitativos no agrupados . . . . . . . . . . . . . . . 40

2.2.2.3. Diagrama de barras . . . . . . . . . . . . . . . . . . . . . . . 41
2.2.2.4. Distribución acumulada: diagrama escalonado . . . . . . . . 42
2.2.2.5. Datos cuantitativos agrupados . . . . . . . . . . . . . . . . . 42
2.2.2.7. Histograma y polı́gono . . . . . . . . . . . . . . . . . . . . . 45
2.2.2.8. Distribución acumulada: Ojiva o polı́gono acumulado “menor
-I I
que” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
22
2.3. Estadı́stica descriptiva: Técnicas o medidas numéricas . . . . . . . . . . . . . 47

20
2.3.1. Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . 47

2.3.1.1. Media o promedio aritmético . . . . . . . . . . . . . . . . . . 47
2.3.1.2. Media para datos agrupados . . . . . . . . . . . . . . . . . . 50
2.3.1.3. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
ii
ÍNDICE GENERAL iii
2.3.1.4. Mediana para datos agrupados . . . . . . . . . . . . . . . . . 53

2.3.1.5. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.3.2. Medidas de variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.2.1. Rango, amplitud o recorrido . . . . . . . . . . . . . . . . . . 56
2.3.2.2. Varianza y desviación estándar o tı́pica . . . . . . . . . . . . 56
2.3.2.3. Varianza y desviación estándar o tı́pica para datos agrupados 58
2.3.2.4. Coeficiente de variación . . . . . . . . . . . . . . . . . . . . . 58
2.3.3. Teorema de Chebyshev . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.3.4. Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
EP
2.3.4.1. Coeficiente de asimetrı́a . . . . . . . . . . . . . . . . . . . . . 61

UD
2.3.4.2. Coeficiente de curtosis . . . . . . . . . . . . . . . . . . . . . . 62

2.3.5. Medidas de posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.3.5.1. Cuartiles y percentiles . . . . . . . . . . . . . . . . . . . . . . 63
2.3.5.2. Cálculo de los percentiles (cuartiles) para datos no agrupados. 63
A
IM
2.3.5.3. Cálculo de los percentiles y cuartiles para datos agrupados . 65

2.3.5.4. Diagrama de caja-bigotes . . . . . . . . . . . . . . . . . . . . 65
-L
2.3.5.5. Puntuaciones z . . . . . . . . . . . . . . . . . . . . . . . . . . 67
S
PU
2.4. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

M
3. Teorı́a de probabilidad 108

CA
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

3.2. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3.2.1. Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
3.2.2. Enfoques de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . 110
3.2.3. Conceptos importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
3.2.4. Reglas de conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
3.3. Propiedades básicas de la probabilidad . . . . . . . . . . . . . . . . . . . . . . 115
3.3.1. Ley de adición de probabilidades . . . . . . . . . . . . . . . . . . . . . 115
E
3.3.2. Ley de multiplicación de probabilidades . . . . . . . . . . . . . . . . . 117

AD
3.3.3. Teorema de la probabilidad total y Teorema de Bayes . . . . . . . . . 123

4. Distribución de probabilidad discreta 151

4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.2. Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.3. Distribución de probabilidad discreta o función de probabilidad . . . . . . . . 152
4.4. Función de Distribución de una variable discreta . . . . . . . . . . . . . . . . 154
-I I
4.5. Media, Varianza y desviación estándar de una distribución de probabilidad

22
discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
20
4.5.1. Propiedades del valor esperado y de la varianza de una variable

aleatoria discreta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
4.6. Distribución de probabilidad binomial . . . . . . . . . . . . . . . . . . . . . . 160
ÍNDICE GENERAL iv
4.6.1. Usando Tablas de Probabilidades Binomiales para el cálculo de

probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
4.7. Distribución de probabilidad de Poisson . . . . . . . . . . . . . . . . . . . . . 165
4.7.1. Usando Tablas de Probabilidades de Poisson para el cálculo de
probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
4.7.2. Aproximación de la distribución binomial empleando la distribución de
Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
EP
5. Distribución de probabilidad continua 187

UD
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

5.2. Función densidad de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 187
5.3. Función de Distribución Acumulada . . . . . . . . . . . . . . . . . . . . . . . 188
5.4. Valor esperado y varianza de una Variable Aleatoria Continua. . . . . . . . . 189
A
5.4.1. Propiedades de la esperanza matemática y de la varianza de una
IM
variable aleatoria continua . . . . . . . . . . . . . . . . . . . . . . . . . 189

-L
5.5. Distribución de probabilidad normal . . . . . . . . . . . . . . . . . . . . . . . 197

S
PU
5.6. Cálculo de probabilidades asociadas a una curva normal especı́fica . . . . . . 200

5.6.1. Distribución normal estándar . . . . . . . . . . . . . . . . . . . . . . . 200
M
5.6.2. Estandarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

CA
5.6.3. Cálculo de probabilidades (áreas) con la curva normal estándar . . . . 201

5.7. Aproximación normal para la distribución binomial . . . . . . . . . . . . . . . 210
5.7.1. Factor de corrección por continuidad . . . . . . . . . . . . . . . . . . . 211
5.8. Otras distribuciones continuas importantes . . . . . . . . . . . . . . . . . . . 214
5.8.1. Distribución Uniforme Continua . . . . . . . . . . . . . . . . . . . . . 214
5.8.2. Distribución exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . 217
6. Distribuciones muestrales 245

E
AD
6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

6.2. Distribuciones muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
6.3. Distribución muestral de x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
6.3.1. Caracterı́sticas de la distribución de x . . . . . . . . . . . . . . . . . . 246
6.3.2. Uso de la Distribución muestral de x en el cálculo de probabilidades . 251
6.4. Distribución muestral de p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
6.4.1. Caracterı́sticas de la distribución de p . . . . . . . . . . . . . . . . . . 257
6.4.2. Uso de la Distribución muestral de p en el cálculo de probabilidades . 258
-I I

22
7. Estimación de parámetros 272

20
7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272

7.2. Estimación de intervalo para una media poblacional (µ) . . . . . . . . . . . . 273
7.3. Estimación de intervalo para una proporción poblacional (p) . . . . . . . . . . 289
ÍNDICE GENERAL v
A. Tablas 303
A.1. Tabla de números aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
A.2. Tabla: Probabilidades Binomiales . . . . . . . . . . . . . . . . . . . . . . . . . 305
A.3. Tabla: Probabilidades de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 311
A.4. Distribución normal estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
A.5. Distribución t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318
EP
Bibliografı́a 321
UD
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Índice de figuras
2.1. Distribución de frecuencias para la variable estado civil . . . . . . . . . . . . 37

EP
2.2. Gráfica de pastel para la variable estado civil. . . . . . . . . . . . . . . . . . . 38

UD
2.3. Diagrama de Pareto para las razones de no conformidad. . . . . . . . . . . . . 40

2.4. Distribución de frecuencias para el número de palabras leı́das por 120 disléxicos. 41
2.5. Diagrama escalonado: diagrama de frecuencias acumuladas del número de
palabras leı́das. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
A
IM
2.6. Histograma y polı́gono de frecuencias del Número de veces que un cliente va

al supermercado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
-L
2.7. Ojiva del Número de veces que un cliente va al supermercado. . . . . . . . . . 47

S
PU
2.8. Distribuciones con diferentes asimetrı́as o sesgos. . . . . . . . . . . . . . . . . 62

M
2.9. Distribuciones con diferentes grados de curtosis. . . . . . . . . . . . . . . . . . 63

CA
2.10. Diagrama caja-bigote de las estaturas de 15 estudiantes. . . . . . . . . . . . . 67

2.11. Notas en la segunda práctica calificada de 36 alumnos. . . . . . . . . . . . . . 100
2.12. Millas por galón de gasolina utilizadas en la conducción para modelos de autos
pequeños y vehı́culos deportivos. . . . . . . . . . . . . . . . . . . . . . . . . . 104
2.13. Duración de las canciones (en segundos) de dos conciertos. . . . . . . . . . . . 105
2.14. Cantidad de clientes que poseen los gimnasios situados en los distritos de San
Miguel y Santiago de Surco. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
3.1. Representaciones de espacio muestra del lanzamiento de dos monedas . . . . 110

E
3.2. Representación de espacio muestra del lanzamiento de dos dados . . . . . . . 111

AD
3.3. Diagrama de árbol del lanzamiento de dos monedas o de lanzar una moneda
dos veces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3.4. Partición del espacio muestral S . . . . . . . . . . . . . . . . . . . . . . . . . . 123
3.5. Partición del aula en alumnos de segundo año, cuarto año y graduados . . . . 124
3.6. Diagrama de árbol para problema de clase de estadı́stica avanzada . . . . . . 125
3.7. Diagrama de árbol para problema de urnas A, B y C . . . . . . . . . . . . . . 125
4.1. Función de probabilidad de X:Número de puntos obtenidos . . . . . . . . . . 153

-I I
4.2. Función de probabilidad de Y:Número de puntos obtenidos al lanzar dado

22
cargado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
20
4.3. Función de probabilidad de X:Número de caras obtenidas al lanzar 3 veces

una moneda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
4.4. Función de distribución de X:Número de puntos obtenidos al lanzar un dado 156
vi
ÍNDICE DE FIGURAS vii
5.1. Gráfica de la Función de distribución de X pedida en 1b). . . . . . . . . . . . 191

5.2. Gráfica de la Función de distribución de X pedida en 3b). . . . . . . . . . . . 195
5.3. Curva normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
5.4. Curvas normales con diferentes medias e igual desviación estándar. . . . . . . 199
5.5. Curvas normales con igual media y diferente desviación estándar. . . . . . . . 199
5.6. Curvas normales con diferente media y desviación estándar. . . . . . . . . . . 199
5.7. Áreas bajo la curva comunmente utilizadas para cualquier distribución normal. 200
5.8. Curva normal estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
5.9. P (0 ≤ Z ≤ zc ) proporcionada por la tabla que aparece en el Apéndice A.4. . 202
EP
5.10. Ilustración del cálculo de probabilidades con la tabla de áreas bajo la curva
UD
normal estándar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203

5.11. Ilustración del cálculo de P (2 ≤ X ≤ 5) para X ∼ N (3, 4) . . . . . . . . . . . 204
5.12. Ilustración del cálculo de a) P (X ≤ 10000) y b) P (X ≥ 10000) para X ∼
N (10000, 15002 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
A
5.13. Ilustración del cálculo de P (12000 < X < 15000) para X ∼ N (10000, 15002 ).
IM
205
5.14. Ilustración del cálculo de P (X < 1) para X ∼ N (1.5, 0.252 ). . . . . . . . . . 206
-L
5.15. Ilustración del cálculo de P (X > 17) para X ∼ N (20, 22 ). . . . . . . . . . . . 207

S
PU
5.16. Ilustración del cálculo de a) P (24 < X < 54) y b) P (X > 39) para X ∼
N (45, 122 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
M
X > 51) para X ∼ N (45, 122 ). . . . 209

CA
5.17. Ilustración del cálculo de P (X < 30 o

5.18. Ubicación de los valores X = 50 y X = 70 para que se cumpla que
P (X ≤ 70) = 0.75 y P (X ≤ 50) = 0.30. . . . . . . . . . . . . . . . . . . . . . 210
5.19. Aproximación normal a la binomial con n=200 y p=0.4. Se muestra la
probabilidad de que al menos 75 clientes paguen con tarjeta de crédito. . . . 213
probabilidad de que menos de 70 clientes paguen con tarjeta de crédito. . . . 214
probabilidad de que entre 68 y 73 clientes, inclusive, paguen con tarjeta de
E
crédito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
AD
5.22. Función de densidad de X con distribución uniforme en el intervalo [a, b]. . . 215
5.23. Función de distribución acumulada de una variable aleatoria X con distribu-
ción uniforme en el intervalo [a, b]. . . . . . . . . . . . . . . . . . . . . . . . . 216
5.24. Función de densidad de X con distribución exponencial con parámetro λ = 0.5.218
5.25. Función de de distribución acumulada de la variable X con distribución
exponencial con parámetro λ = 0.5. . . . . . . . . . . . . . . . . . . . . . . . . 218
6.1. Proceso para realizar inferencias acerca de la media de la población, µ, a partir

-I I
de la media de una muestra, x, tomada de dicha población de estudio. . . . . 246

22
6.2. Distribución de probabilidad de las medias muestrales del ejemplo dado. . . . 248
20
6.3. Aplicación del Teorema del lı́mite Central para diferentes poblaciones.(Lind
et al., 2012) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250

6.4. Ilustración del cálculo de P X > 181 para X ∼ N 178, 22 . . . . . . . . . . 252

6.5. Ilustración del cálculo de P 175 < X < 181 para X ∼ N 178, 22 . . . . . . 253
ÍNDICE DE FIGURAS viii

6.6. Ilustración del cálculo de P X < 58 para X ∼ N 60, 1.52 . . . . . . . . . . 255

6.7. Ilustración del cálculo de P 57 < X < 63 para X ∼ N 60, 1.52 . . . . . . . 256

6.8. Ilustración del cálculo de P (p > 0.50) para p ∼ N 0.52, 0.0292 . . . . . . . . 260

6.9. Ilustración del cálculo de P (0.15 < p < 0.25) para p ∼ N 0.20, 0.042 . . . . . 262
6.10. Ilustración de P (p1 < p < p2 ) = 0.95 . . . . . . . . . . . . . . . . . . . . . . . 262
6.11. Ilustración de P (p1 < p < p2 ) = 0.95 y definición de Z2 = 1.96 y por simetrı́a
Z1 = −1.96 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
7.1. Ilustración sobre el nivel de confianza en la distribución muestral de x. . . . . 274

EP
7.2. Comparando la distribución normal estándar (Z) y la distribución t. . . . . . 283

7.3. Ilustración sobre el nivel de confianza en la distribución muestral de p. . . . . 291
UD
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Índice de tablas
1.1. Operaciones apropiadas en los niveles o escalas de medición. . . . . . . . . . . 8

EP
1.2. Agrupación de las 352 empresas de acuerdo con su rendimiento porcentual

UD
sobre el capital. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3. Número seleccionado de una muestra aleatoria estratificada proporcional. . . 12
2.1. Distribución de frecuencias del estado civil de las personas encuestadas. . . . 36

A
2.2. Tabla de resumen para construir el diagrama de Pareto. . . . . . . . . . . . . 39
IM
2.3. Distribución de frecuencias del número de palabras leı́das por 120 disléxicos. . 41
-L
2.4. Distribución de frecuencias acumuladas del número de palabras leı́das. . . . . 42

S
PU
2.5. Distribución de frecuencias de datos agrupados considerando la marca de clase

de la variable:Número de veces que un cliente compra en el Supermercado
M
Plaza Lima. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
CA
3.1. Miles de usuarios de internet según el sexo en una ciudad . . . . . . . . . . . 122
4.1. Distribución de probabilidad de X:Número de puntos obtenidos al lanzar un

dado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
4.2. Valores seleccionados de la tabla de probabilidad binomial para el caso n=6,
x=2, p=0.05 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
4.3. Valores seleccionados de la tabla de probabilidad binomial para n=8, p=0.30
y x=3,4,5,6,7,8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
E
4.4. Valores seleccionados de la tabla de probabilidad binomial para n=8, p=0.30

AD
y x=0,1,2,3,4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
4.5. Valores seleccionados de la tabla de probabilidad de Poisson para λ = 6 y
x=0,1,2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
5.1. Casos de probabilidades binomiales y cómo aplicar el factor de corrección por

continuidad al utilizar la aproximación normal. Recuerde que a, b y c son
números enteros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
-I I
6.1. Las 16 muestras posibles de tamaño igual a 2 tomadas de la población de 4

valores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
22
20
7.1. Valores de “Z” para los niveles de confianza de uso común. . . . . . . . . . . 274
7.2. Extracto de la Tabla de Distribución t. En el Apéndice A.5 aparece una versión
más extensa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
ix
ÍNDICE DE TABLAS x
7.3. Resumen de casos para realizar la estimación de intervalo para una media
poblacional (µ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
EP
UD
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Capı́tulo 1
Introducción a la estadı́stica
EP
UD
1.1. Definición de Estadı́stica

La estadı́stica está expuesta muy a menudo en la vida diaria. Por ejemplo, considere las
siguientes afirmaciones:
A
IM
El Instituto Nacional de Estadı́stica e Informática (INEI) dio a conocer que, en el año

2021, el Índice de Precios al Consumidor de Lima Metropolitana aumentó en 6,43 %,
-L
variación superior a las registradas en los últimos trece años.

S
PU
En noviembre de 2021, el volumen de exportación de productos no tradicionales

M
aumentó en 12,3 % al compararlo con similar mes del año anterior.

CA
Una reciente investigación de IBM establece que el 64 % de los directores de marketing

estarán usando Inteligencia Artificial en los próximos dos años.
El 61 % de los peruanos es digital y el 43 % se conecta todos los dı́as, según un estudio

de Opinión realizado el último año.
La región de América Latina y el Caribe reanudó el crecimiento económico en 2021,

pero la reactivación de los mercados laborales fue limitada y se basó en gran medida
en el trabajo informal, dando como resultado un desempleo del 10 %, que disminuirı́a
E
a 9,3 % en 2022 y a 8,8 % en 2023, de acuerdo con la Organización Internacional del

AD
Trabajo (OIT).
La región de América Latina, África y Medio Oriente de General Motors, estableció un

nuevo récord anual de ventas, con un millón 235 mil 913 unidades vendidas durante el
año pasado.
En nuestro dı́a a dı́a es común relacionar la estadı́stica con información numérica que
resume o explica determinado contexto económico, social, etc; o también con conjuntos de
-I I
datos (entendiendo los datos como informaciones provenientes de observaciones, conteos,

22
medidas o respuestas). La Estadı́stica debe ser comprendida como una ciencia y como tal
20
se ocupa de la recopilación, organización, análisis e interpretación de datos para la toma de

decisiones. En los negocios, una razón básica para esa recopilación, organización, análisis e
interpretación de datos, es proporcionar a quienes toman decisiones una mejor comprensión
del entorno comercial y económico.
1
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 2
1.2. Estadı́stica Descriptiva y Estadı́stica Inferencial

La estadı́stica puede dividirse a grandes rasgos en dos partes: descriptiva e inferencial.
La estadı́stica descriptiva es la parte de la estadı́stica que involucra a la organización,

el resumen y representación de un conjunto de datos. Como generalmente se estudian
poblaciones muy grandes, este conjunto de datos suele ser una muestra. Aunque los
métodos de la estadı́stica descriptiva son importantes para caracterizar y presentar los
datos, el desarrollo de los métodos de estadı́stica inferencial -basado en las teorı́as de
probabilidades lo que llevó a la aplicación amplia de la estadı́stica en todos los campos
EP
de la investigación en la época actual.

UD
La estadı́stica inferencial es la parte de la estadı́stica que implica el uso de una muestra

para llegar a conclusiones válidas sobre una población. La estadı́stica inferencial emplea
métodos que hacen posible la estimación de una caracterı́stica de una población a partir
A
de los datos de una muestra extraı́da de la población analizada. Una herramienta básica
IM
en el estudio de la estadı́stica inferencial es la probabilidad. Es de esperarse que al

-L
obtener las conclusiones sobre la población siempre exista una pequeña probabilidad
S
de error pues la inferencia es inductiva (Angulo, 2011).

PU
M
1.3. Introducción a los términos básicos

CA
Para comenzar a estudiar estadı́stica primero es necesario definir y tener claro algunos
términos básicos (Johnson y Kuby, 2008):
1. Población o Universo: Es el conjunto de individuos, objetos, eventos, datos o

elementos cuyas propiedades serán analizadas. Dos aspectos importantes aquı́ son: que
en todo momento debe quedar muy claro qué elementos conforman la población a
estudiar y además aunque es común entender que el universo pueda estar conformado
solo por personas es posible que en otras situaciones la población pueda estar
conformada por objetos, animales o mediciones.
E
AD
Cuando se hace un levantamiento o recolección de datos sobre una determinada

población, es decir, contemplando cada uno de sus elementos, tenemos lo que se llama
un censo.
La población puede ser según su tamaño de dos tipos: Población finita, cuando el
número de elementos que la forman es finito, por ejemplo, el número de alumnos del
Campus Lima, el número de alumnos de un grupo de clase o los libros de la biblioteca de
la universidad; y Población infinita, cuando el número de elementos que la forman
es ilimitado, o tan grande que pudiese considerarse ilimitado, como por ejemplo, el
-I I
número de personas que podrı́an tomar aspirina o la producción de focos de 40 watts

22
que serán producidos por General Electric.

20
Debido a que las poblaciones suelen ser muy grandes, un objetivo común del uso de la
estadı́stica es obtener datos de una muestra para estudiarlos y emplear los resultados
para sacar una conclusión acerca de la población de la cual se extrajo la muestra.
2. Muestra: Es un subconjunto o parte de la población. Una muestra consta de los

individuos, objetos o medidas seleccionados de la población, de tal forma que refleje
las caracterı́sticas de ésta. Una muestra debe ser representativa de una población para
que sus datos pueden usarse para sacar conclusiones (estimar caracterı́sticas) de la
población de la cual fue tomada.
3. Variable (o variable respuesta): Caracterı́stica de interés sobre cada elemento

individual de una población o muestra. Por ejemplo; la edad de una persona que labora
en una empresa, su estado civil, su estatura y su peso son cuatro variables.
EP
4. Dato: Valor de la variable asociada a un elemento de una población o muestra. Este

UD
valor puede ser un número, una palabra o un sı́mbolo. Por ejemplo, Roberto Jiménez
que labora en una empresa tiene 35 años, su estado civil es casado, mide 1.70 m y pesa
76 kg. Estas cuatro piezas de datos son los valores de las cuatro variables aplicadas a
Roberto Jiménez.
A
IM
5. Datos: Conjunto de valores recolectados para la variable de cada uno de los elementos
-L
que pertenece a la muestra. Por ejemplo el conjunto de 50 estaturas recolectadas de

S
una muestra de 50 estudiantes es un ejemplo de un conjunto de datos.

PU
M
6. Experimento: Actividad planeada cuyos resultados producen un conjunto de datos. El

CA
experimento incluye las actividades para seleccionar los elementos y obtener los valores
de los datos.
7. Parámetro: Es una medida de resumen que describe una caracterı́stica de toda una
población (o un valor numérico que resume o describe a todos los datos de una
población). Por ejemplo, la edad promedio de los estudiantes universitarios en el Perú
o la proporción de votantes que apoyarán al candidato del partido A en las próximas
elecciones, son ejemplos de dos parámetros poblacionales. A menudo se utiliza una
letra griega para simbolizar la denominación de un parámetro. Estos sı́mbolos serán
E
asignados a medida que se estudien los parámetros más adelante (por ejemplo: µ
AD
se emplea para simbolizar el promedio poblacional, σ para la desviación estándar

poblacional, etc).
Para todo parámetro existe un estadı́stico muestral correspondiente. El estadı́stico
describe a la muestra de la misma manera que el parámetro describe a la población.
8. Estadı́stico: Es una medida de resumen que se calcula para describir una caracterı́stica
de una muestra (o un valor numérico que resume o describe a todos los datos de una
muestra). Por ejemplo, la estatura promedio encontrada al utilizar el conjunto de 30
-I I
estaturas recolectadas o la proporción de votantes, en una muestra de 100 personas,

22
que apoyarán al candidato del partido A en las próximas elecciones son ejemplos de
20
estadı́sticos. Casi todos los estadı́sticos se determinan con ayuda de fórmulas y suele
asignárseles denominaciones simbólicas usando letras del alfabeto español (por ejemplo:
x, se emplea para simbolizar el promedio en una muestra; “s” para la desviación
estándar en una muestra, etc.)
Ejemplo. Un estudiante de estadı́stica está interesado en determinar algo sobre el valor

promedio (en dólares) de los automóviles que pertenecen al cuerpo docente de la universidad.
Identifique en esta situación cada uno de los ocho términos recientemente descritos.
1. La población es la colección de todos los automóviles que pertenecen a todos los

miembros del cuerpo docente de la universidad.
2. Una muestra es cualquier subconjunto de esa población. Por ejemplo, una muestra
podrı́an ser los automóviles que pertenecen a los profesores del programa de
administración de empresas.
EP
UD
3. La variable es el “valor en dólares” de cada automóvil individual.
4. Un dato podrı́a ser el “valor en dólares” de un automóvil en particular. El automóvil

del profesor Flores, por ejemplo, está valuado en 13400 dólares.
A
5. Los datos serı́an el conjunto de valores que corresponden a la muestra obtenida (13400,
IM
. . . , etc.).
-L
S
6. El experimento serı́an los métodos aplicados para seleccionar los automóviles que
PU
integren la muestra y determinar el valor de cada automóvil de la muestra. Podrı́a

M
efectuarse preguntando a cada profesor del programa de administración de empresas,

CA
o de otras formas.
7. El parámetro sobre el que se está buscando información es el valor “promedio” de todos

los automóviles de la población.
8. El estadı́stico que encontrará es el valor promedio de todos los automóviles de la muestra

elegida.
NOTA: Si se toma una segunda muestra, quizá el conjunto de elementos seleccionados

serı́a diferente, por ejemplo los automóviles de los profesores del programa de ingenierı́a,
E
y entonces para el estadı́stico promedio se anticiparı́a un valor diferente. Sin embargo, el

AD
valor promedio de “todos los autos que pertenecen al cuerpo docente de la universidad” no
cambiarı́a. Esto ayuda a entender que el valor de los parámetros es fijo, mientras que el de
los estadı́sticos varı́a.
Ejercicio. 36 % de la población adulta en el Perú padece una alergia. En una muestra de
1200 adultos se encontró que 32 % tiene una alergia. Describa cada uno de los ocho términos.
1.4. Tipos de Variables
Continuando con los conceptos, veamos la clasificación de las variables según su
-I I
naturaleza. Básicamente hay dos clases de variables:

22
20
Variable Cualitativa o categórica: Variable que clasifica o describe un ele-

mento de una población o muestra. Se dice que estas variables no pueden ex-
presarse numéricamente o solo pueden tener un número limitado de valores dis-
tintos o categorizados. Ejemplo: profesión, color de ojos, sexo, estado civil, etc.
De una muestra de 4 clientes de un gimnasio se obtuvo la siguiente informa-

ción: ¿posee automóvil?, distrito en el que vive y “nivel de satisfacción con res-
pecto al servicio”. Las tres variables son ejemplos de variables cualitativas (atri-
butos) ya que describen alguna caracterı́stica de la persona, y todas las perso-
nas con el mismo atributo pertenecen a la misma categorı́a. Los datos recolecta-
dos fueron: {si, no, si, si}, {San Borja, Santiago de Surco, M iraf lores, San Borja} y
{satisf echo, muy satisf echo, algo satisf echo, muy satisf echo}. NOTA: Algunas ope-
raciones aritméticas, como sumar y promediar, no tienen sentido para datos que resultan
de una variable cualitativa.
EP
Variable Cuantitativa o numérica: Variable que cuantifica un elemento de una

UD
población o muestra. Este tipo de variable produce respuestas numéricas, como la

estatura (en centı́metros), el peso (en Kg.) o el “gasto semanal” de fotocopias (en
soles) de cada estudiante son ejemplos de variables cuantitativas (numéricas). De una
A
muestra de 4 alumnos se obtuvieron los datos siguientes: {1.60m, 1.63m, 1.68m, 1.68m},
IM
{60kg, 64kg, 65kg, 70kg} y {40 soles, 55 soles, 65 soles, 70 soles}. Por ejemplo, para
-L
encontrar el “peso promedio” de la muestra, simplemente se suman los cuatro valores

S
y el resultado se divide entre cuatro: (60+64+65+70)/4=64.75 kg. NOTA: Algunas

PU
operaciones aritméticas, como sumar y promediar, tienen sentido para datos que
M
resultan de una variable cuantitativa.

CA
Cada uno de estos tipos de variables (cualitativas y cuantitativas) puede subdividirse aún
más, como se aprecia a continuación:
E
AD
Las variables cualitativas se subdividen en dos clases:
Variable Nominal: Variable cualitativa que categoriza (describe o identifica) un

elemento de una población o muestra. Los datos o valores de una variable nominal
no poseen un orden o jerarquı́a natural entre sı́.
-I I
En la encuesta anterior a cuatro clientes de un gimnasio, las variables “¿posee

22
automóvil?” y el “distrito en que vive” son ejemplos de variables nominales pues en

20
ambas, sus valores son cualidades o atributos que no tienen un orden o jerarquı́a entre
sı́.
Variable Ordinal: Variable cualitativa cuyos valores presentan o poseen un orden

natural o jerarquı́a inherente.
En la encuesta anterior de cuatro clientes de un gimnasio, la variable “nivel de

satisfacción” es un ejemplo de variable ordinal, ya que sus valores poseen un orden
implı́cito o natural. Otros ejemplos de estas variables podrı́an ser: nivel educativo de
una persona, grado de infección de una herida, etc.
Las variables cuantitativas o numéricas también pueden subdividirse en dos clases:
Variable Discreta: Variable cuantitativa que puede asumir un número contable

de valores. Esta variable produce respuestas numéricas que surgen de un conteo.
Intuitivamente, la variable discreta puede asumir los valores correspondientes a puntos
EP
aislados a lo largo de un intervalo o rango. Es decir, entre dos valores cualesquiera hay
UD
un “hueco”.
Variable Continua: Variable cuantitativa que puede asumir una cantidad incontable
de valores. Esta variable produce respuestas numéricas que surgen de una medición.
A
Intuitivamente, la variable continua puede asumir cualquier valor a lo largo de un
IM
intervalo o rango, incluyendo cualquier valor posible entre dos valores cualesquiera.
-L
Como se ha comentado en muchos casos es posible distinguir los dos tipos de variables
S
PU
decidiendo si las variables están relacionadas con un conteo o con una medición. La variable
“número de cursos en los que un alumno está matriculado actualmente” es un ejemplo de
M
variable discreta; sus valores se encuentran al contar el número de cursos matriculados. Al

CA
contar, no es posible que ocurran valores fraccionarios. Otros ejemplos son: el número de hijos
de una familia, número de televisores vendidos en una semana, número de clientes atendidos
en una hora, etc. La variable “peso de un cargamento” o “la estatura de una persona” son
ejemplos de variables aleatorias continuas pues los valores se encuentran midiendo el peso o
la estatura. Al medir, puede ocurrir cualquier valor en un rango continuo o intervalo, según la
precisión del instrumento de medición. Por ejemplo, la estatura de una persona puede ser 167
cms, 167,5 cms, 167,58 cms o 167,584 cms, dependiendo de la precisión de los instrumentos
que están disponibles. En teorı́a, dos personas no podrı́an tener exactamente la misma
E
estatura, porque cuanto más refinado es el instrumento de medición que se utiliza, aumenta la
AD
posibilidad de detectar la diferencia entre las mediciones. Sin embargo, la mayor parte de los
dispositivos de medición no tienen la precisión suficiente para detectar pequeñas diferencias.
Por tanto, muchas veces se obtienen observaciones empatadas en los datos experimentales o
en encuestas, aun cuando la variable aleatoria es en realidad continua.
Cuando intente determinar si una variable es continua o discreta, recuerde analizar la
variable y piense en los valores que podrı́a ocurrir. No considere los valores de los datos que
se han registrado; pueden ser engañosos.
Considere la variable “calificación asignada por un juez” en una competencia de patinaje
-I I
artı́stico. Si se consideran algunas calificaciones que ya han sido asignadas: 9.9; 9.5; 8.8;
22
10.0, y observa la presencia de cifras decimales, podrı́a pensarse que todas las fracciones son
20
posibles y concluir que la variable es continua. Sin embargo, esto no es cierto. Una calificación
de 9.134 no es posible; ası́, entre los valores posibles hay huecos y la variable es discreta.
NOTA: No deje que la apariencia de los datos lo engañe respecto a su tipo. Las variables
cualitativas no siempre son fáciles de reconocer. Algunas veces se presentan como números.
La muestra anterior de distrito donde vive puede codificarse como: 1= San Borja, 2=Santiago
de Surco, 3 = Miraflores. Los datos de la muestra se verı́an como 1, 2, 3, 1, aunque siguen
siendo datos de atributos. Calcular el “distrito promedio” [(1+2+3+1)/4=1.75] carece de
sentido. Los distritos de residencia pueden identificarse usando códigos postales. El código
postal promedio tampoco tiene sentido; en consecuencia, el código postal también serı́a una
variable cualitativa.
Otro ejemplo de información engañosa es un número de identificación. Por ejemplo, el
DNI, número de vuelo: 256, número de cuenta de ahorros, parecen ser datos numéricos. El
256 no describe ninguna propiedad del vuelo: si está retrasado o a tiempo, la calidad del
EP
refrigerio servido, el número de pasajeros o cualquier cosa sobre el vuelo. El número solo
UD
identifica un vuelo especı́fico. Los números de licencias de conducir, DNI, seguro social, las
cuentas bancarias, son todos, números de identificación y por sı́ mismos no funcionan como
variables cuantitativas, si no como cualitativas.
Recuerde revisar la variable individual y un dato individual, y ası́ tendrá poca dificultad
A
IM
de distinguir entre variables cualitativas y cuantitativas. Para fines del análisis estadı́stico, la
diferencia que distingue a lo cualitativo de lo cuantitativo es que las operaciones aritméticas
-L
ordinarias sólo tienen sentido con los datos cuantitativos. Por ejemplo, cuando los datos son
S
PU
cuantitativos, sus valores se pueden sumar y después dividir entre la cantidad de valores
para calcular el valor promedio de ellos. Este promedio tiene sentido y, por lo general, se
M
CA
interpreta con facilidad. Sin embargo, cuando se registran datos cualitativos en forma de
valores numéricos, esas operaciones aritméticas producen resultados sin importancia.
Niveles o Escalas de Medición.
Otra clasificación de las variables es según su nivel de medición, donde una variable
puede ser: nominal, ordinal, de intervalo o de razón. La escala o nivel de medición determina la
cantidad de información contenida en los datos. Cuando se aplica la estadı́stica a problemas
reales, el nivel de medición de los datos ayuda a decidir qué procedimientos o métodos
estadı́sticos son apropiados para los datos.
Algunos autores explican esa clasificación haciendo referencia a otra forma de clasificar
E
los datos. Siguiendo Triola (2018) o Lind et al. (2012) tenemos las siguientes definiciones.
AD
El nivel nominal es la escala más elemental. Se caracteriza por datos que consisten
únicamente en nombres, etiquetas o categorı́as. Los datos carecen de un orden natural. Las
observaciones acerca de una variable con este nivel de medición sólo se clasifican y se cuentan.
A veces, para una mejor comprensión de lectura, estos conteos se convierten en porcentajes.
Ejemplos de variables con este nivel de medición pueden ser: Estado civil (Soltero, casado,
viudo, divorciado), Género (Masculino, femenino), Ciudad de Nacimiento de una persona o
preguntas de una encuesta que permiten respuestas “Sı́” o “No”, etc.
El nivel ordinal, es el nivel inmediato superior al nominal. Este nivel se caracteriza
-I I
por datos que además de exhibir las propiedades de los datos nominales también pueden
22
colocarse en cierto orden o tienen un orden inherente o natural. Ejemplos de variables con este
20
nivel de medición pueden ser: Calificación asignada en un curso (A=Muy bueno, B=Bueno,
C=promedio, D=malo, E=muy malo), Grado de escolaridad (Primaria, secundaria, técnico,
universitario, etc), Preferencia a la compra de un producto (siempre, frecuentemente,
ocasionalmente, nunca), Nivel socio-económico, Grado de desnutrición de la población

infantil, Calificar una experiencia con un “9” en una escala de 1 a 10 nos indica que fue
mejor que una experiencia calificada con un “6”, etc.
El nivel de intervalo es el nivel inmediato superior y se caracteriza por datos que exhiben
todas las caracterı́sticas del nivel ordinal, pero además las diferencias entre los valores de los
datos es significativa o tiene sentido. Los datos en este nivel no tienen un punto de inicio o
cero natural que exprese ausencia de lo que está siendo medido. Algunos autores coinciden
en decir que el “cero” en este nivel es relativo o arbitrario. Ejemplos de variables con este
nivel de medición pueden ser: La temperatura de un cuerpo en una escala de grados Celsius
EP
o Farenheit, el cociente intelectual de un individuo, etc.

UD
El nivel de razón, es el nivel o escala más alta y se caracteriza por datos que tienen
todas las propiedades de los datos de intervalo y además la razón o proporción de dos valores
es significativa. Los datos en este nivel tienen un cero natural que expresa ausencia de lo que
está siendo medido. Ejemplos de escalas de razón son la edad, peso, estatura, salario, precio,
A
IM
volumen de ventas, número de teléfonos celulares que posee una persona, etc.
La Tabla 1.1 resume cuáles operaciones son apropiadas en cada uno de los cuatro niveles
-L
o escalas de medición. Cuando identifique el nivel de medición de un conjunto de datos, use

S
PU
el nivel más alto que sea apropiado.

M
Nivel de Categorizar Ordenar Diferencias Razones o proporciones

CA
medición los datos los datos entre datos entre datos

Nominal Si No No No
Ordinal Si Si No No
Intervalo Si Si Si No
Razón Si Si Si Si
Tabla 1.1: Operaciones apropiadas en los niveles o escalas de medición.

E
1.5. Recolección de datos

AD
Uno de los primeros problemas que enfrentan quienes se dedican a la estadı́stica es

la obtención de datos. Los datos no ocurren simplemente: es necesario recolectarlos. Es
importante obtener “buenos datos” porque en última instancia las inferencias efectuadas
se basan en las estadı́sticas obtenidas a partir de los datos. Estas inferencias sólo pueden
ser tan buenas como lo sean los datos. Aunque es relativamente fácil definir “buenos datos”
como datos que representen con exactitud a la población de la cual se tomaron, no es fácil
garantizar que un método particular de muestreo produzca “buenos datos”. Se desea usar
-I I
métodos de muestreo (recolección de datos) insesgados.

22
A pesar de que sólo se debe llamar muestra a un conjunto de datos representativos del
20
universo, se suele clasificar las muestras en: no probabilı́sticas y probabilı́sticas.

La muestra no probabilı́stica es aquella cuyos elementos se eligen sin tomar en cuenta
su probabilidad de ocurrencia. La muestra no probabilı́stica no es un producto de un proceso
de selección aleatoria, es decir, puede dar lugar a una muestra que no sea representativa del
universo del cual fue extraı́da. En muchos casos dichos elementos se eligen con base en el
juicio o criterio del investigador (muestreo intencional u opinático). Como las muestras no
probabilı́sticas eligen a sus participantes sin conocer o tomar en cuenta sus probabilidades de
selección (y en algunos casos los participantes se autoseleccionan (muestreo voluntario)), no
se puede aplicar la teorı́a que se desarrolla para el muestreo probabilı́stico. Muchas compañı́as
realizan encuestas dando a los visitantes de su página de Internet la oportunidad de llenar
encuestas y entregarlas en forma de una respuesta electrónica. La respuesta a estas encuestas
puede proporcionar grandes cantidades de datos en poco tiempo, pero la muestra se compone
de usuarios de Internet que son seleccionados en forma automática. Para muchos estudios
EP
sólo se dispone de una muestra no probabilı́stica como una muestra subjetiva. En estos
UD
casos, la opinión de un experto en la materia es crucial para poder usar los resultados
obtenidos y realizar cambios en un proceso. Otros procedimientos comunes de muestreo no
probabilı́stico son el muestreo por cuotas (tı́picamente utilizado en estudios de mercado y
de opinión pública), el muestreo por grupos naturales, muestreo bola de nieve, etc. Éstos se
A
IM
analizan con detalle en libros especializados en métodos de muestreo.

Emplear muestras no probabilı́sticas tiene algunas ventajas como son conveniencia,
-L
rapidez y bajo costo. Por otro lado, hay dos desventajas importantes: falta de precisión
S
PU
debido al sesgo en la selección y falta de capacidad para generalizar los resultados, que
superan con mucho a las ventajas. En consecuencia, el uso de los métodos de muestreo no
M
CA
probabilı́stico se restringirá a situaciones en las que sólo se desea obtener aproximaciones de

bajo costo para satisfacer la curiosidad acerca de un tema especı́fico, o en estudios iniciales
de pequeña escala o estudios piloto que precederán a investigaciones más rigurosas.
Generalmente, cuando se hace una investigación, se extraen muestras probabilı́sticas, por
razones evidentes, ya que es la única forma de hacer inferencias estadı́sticas correctas a partir
de una muestra.
Se dice que una muestra es probabilı́stica cuando cada elemento del universo tiene una
probabilidad conocida de ser seleccionado en la muestra. Una muestra probabilı́stica puede
ser: aleatoria simple, sistemática, estratificada, o por conglomerados.
E
Se denomina muestra aleatoria simple a aquella que es seleccionada de tal forma que
AD
cada elemento de la población tiene la misma oportunidad o probabilidad de ser seleccionado.

Además, cada muestra de un tamaño n tiene la misma probabilidad de ser elegida que
cualquier otra del mismo tamaño. Esta es la técnica de muestreo aleatorio más elemental y
constituye la base para las otras técnicas. Un buen método para conseguir esto consiste en
enumerar previamente todos los elementos que conforman el universo, y, empleando números
aleatorios (ver Tabla de números aleatorios al final de este texto, Apéndice A.1), seleccionar
la muestra del tamaño deseado.
Por ejemplo si deseamos estudiar las caracterı́sticas socio económicas de los estudiantes
-I I
de una pequeña escuela de niños que tiene una población de 320 estudiantes y quisiéramos
22
seleccionar una muestra aleatoria simple de 45 estudiantes de esta población, procederı́amos

20
como sigue: primero se enumera a los estudiantes del 001 hasta 320. Luego mediante el
uso de una tabla de números aleatorios (que como su nombre lo indica estos números han
sido generados por un proceso aleatorio) se cumple que para cada dı́gito de un número, la
probabilidad de 0, 1, 2,. . . , 9 es la misma. Ası́ la probabilidad que el estudiante asignado con

el número 022 sea elegido es la misma que el estudiante asignado con el número 219, etc. Por
lo tanto queda eliminado ası́ el sesgo.
Las tablas de números aleatorios se caracterizan por dos aspectos que las hacen
particularmente útiles para el muestreo al azar. Una caracterı́stica es que los dı́gitos están
ordenados de tal manera que la probabilidad de que aparezca cualquiera en un punto
dado de una secuencia es igual a la probabilidad de que ocurra cualquier otro. La otra
es que todas las combinaciones de igual número de dı́gitos tienen la misma probabilidad de
ocurrir. Estas dos condiciones satisfacen los requisitos necesarios para el muestreo aleatorio,
EP
establecidos anteriormente. La primera condición significa que en una secuencia de números,

UD
1
la probabilidad de que aparezca cualquier dı́gito en cualquier punto de la secuencia es 10 .
La segunda condición significa que todas las combinaciones de dos dı́gitos son igualmente
probables, del mismo modo que todas las combinaciones de tres dı́gitos, y ası́ sucesivamente.
Volviendo a nuestro ejemplo, primero elegimos un número aleatorio de la tabla, que será el
A
IM
inicio (cualquier punto de comienzo servirá). Supongamos que elegimos el número 22368 (fila
2), como solo hay 320 estudiantes se utilizaran los tres primeros dı́gitos del número aleatorio
-L
de cinco cifras. De modo que 223 es el primer estudiante seleccionado en la muestra. A fin
S
PU
de seguir seleccionando se puede ir en cualquier dirección, siempre tomando grupos de tres

cifras, hasta completar los 45 estudiantes que conformarán la muestra.
M
CA
Cuando la población es muy grande y/o heterogénea, resulta muy difı́cil y costoso
conseguir la lista o marco poblacional actualizado de todos los elementos de la población. Por
ejemplo para estudiar la distribución del ingreso familiar en el distrito de Surco con base a una
muestra aleatoria simple, necesitaremos en principio, una lista o censo poblacional actualizado
de todas las familias residentes de dicho distrito, la cual no siempre está disponible. Por esta
razón, el muestreo aleatorio simple no resulta ser el procedimiento más común en la práctica.
Sin embargo, es importante prestar atención a este diseño muestral por dos razones:
1. Porque muchos de los diseños muestrales mas elaborados usan el muestreo aleatorio
simple en algún aspecto de su diseño y por lo tanto comprender el muestreo aleatorio
E
AD
simple es esencial para entender tales diseños.
2. Porque muchos procedimientos no aleatorios son diseñados para simular el muestreo

aleatorio simple en muchos aspectos.
Como se dijo, si el universo es de gran tamaño, puede resultar muy engorroso el muestreo
aleatorio simple pues se necesitarı́a mucho tiempo y/o dinero. Por eso una alternativa
al muestreo aleatorio simple es el muestreo sistemático. Para obtener una muestra
sistemática, primero se divide el tamaño de la población N entre el tamaño de la muestra
-I I
N
deseado n, y el resultado obtenido, k = , se redondea al entero más cercano, en caso de que
22
n
k no resulte ser entero. Luego, para obtener la muestra sistemática procedemos ası́: Elegimos
20
al primer elemento de la muestra entre los primeros k elementos de la lista poblacional usando
muestreo aleatorio simple y los otros elementos de la muestra se escogen cada k elementos a
partir del elemento seleccionado inicialmente. Ası́ k indicará, si cada décimo, cada onceavo,
o cada centésimo elemento en la población va a ser seleccionado.
Supóngase que una población está constituida por los 884 empleados de una empresa
comercial. Se desea seleccionar una muestra de 52 empleados de esa población. Según el
884
muestreo sistemático debemos calcular k, osea k = = 17, luego usando muestreo aleatorio
52
simple elegimos al primer empleado que conformará la muestra entre los 17 primeros de la
lista y a partir de allı́ cada 17 se van seleccionando los otros elementos de la muestra, hasta
completar 52 empleados. Si al llegar hasta el número final no se ha completado entonces se
sigue contando regresando al inicio de la lista.
Veamos otro ejemplo sencillo. Supóngase seleccionar una muestra sistemática de 45
estudiantes de la lista de 45,000 estudiantes en una universidad. Entonces el valor de k es
EP
1000. Luego usando muestreo aleatorio simple elegimos al primer estudiante que conformará la
UD
muestra entre los 1000 primeros de la lista. Supongamos que el elegido fue el alumno numerado
con 583. Entonces los estudiantes numerados con 583, 1583, 2583 y ası́ sucesivamente hasta
completar 45 estudiantes, conformarán la muestra deseada.
En una muestra estratificada, primero se dividen los N individuos o elementos de la
A
IM
población en L subpoblaciones separadas (N1 , N2 , . . . , , NL ), o estratos, de acuerdo con

alguna caracterı́stica común. Estas subpoblaciones (estratos) no se superponen y juntas
-L
forman la totalidad de la población, es decir: N1 + N2 + . . . + NL = N . De cada estrato

S
PU
se extrae una muestra, y por tanto la muestra final estará compuesta por el conjunto de estas
submuestras.
M
CA
El muestreo estratificado tiene la ventaja en algunos casos, de reflejar con mayor precisión
las caracterı́sticas de la población. Pero su costo de obtención es mayor que en una muestra
aleatoria simple del mismo tamaño, ya que la estratificación implica el trabajo adicional de
clasificar a la población en diversos estratos.
En el muestreo estratificado hay dos conceptos a tener en cuenta:
1. Estratificación: El criterio a seguir en la formación de los estratos será formarlos de tal

manera que haya la máxima homogeneidad en relación a la variable de estudio dentro
de cada estrato y la máxima heterogeneidad entre los estratos. Para poder estratificar
E
debe contarse con información disponible y con la estructura de la población y además

AD
las variables utilizadas en la estratificación deben estar correlacionadas con la variable

objeto de estudio.
2. Afijación: Reparto del tamaño de la muestra en los diferentes estratos. Existen varios
criterios de afijación entre los que destacamos:
a) Afijación uniforme o simple; todos los estratos tienen el mismo número de

elementos en la muestra.
b) Afijación proporcional; cada estrato tiene un número de elementos en la muestra
-I I
proporcional a su tamaño.Es decir, el muestreo proporcional requiere que el

22
número de elementos en cada estrato tenga la misma proporción que se encuentra

20
en la población.
Veamos el siguiente ejemplo extraı́do de Lind et al. (2012). Suponga que el objetivo de
un estudio consiste en determinar si las empresas con altos rendimientos sobre el capital
(una medida de rentabilidad) gastan en publicidad la mayor parte del dinero ganado que las
empresas con un registro de bajo rendimiento o déficit. Considere que la población consta
de 352 empresas. Para asegurar que la muestra a elegir sea una representación imparcial de
las 352 empresas, éstas se deben agrupar de acuerdo con su rendimiento porcentual sobre el
capital como se aprecia en la Tabla 1.2.
Estrato Probabilidad Número de

(Recuperación de capital) Empresas
1 30 % a más 8
EP
2 De 20 % a 30 % 35
UD
3 De 10 % a 20 % 189
4 De 0 % a 10 % 115
5 Déficit 5
A
IM
Tabla 1.2: Agrupación de las 352 empresas de acuerdo con su rendimiento porcentual sobre el capital.
-L
Ahora determinemos el porcentaje de cada estrato en la población y por medio de afijación

S
PU
proporcional asignamos el número de compañı́as de cada estrato en la muestra, como se

M
aprecia en la Tabla 1.3.

CA
Estrato Probabilidad Número de %total Número

(Recuperación de capital) Empresas muestreado
1 30 % a más 8 2 1
2 De 20 % a 30 % 35 10 5
3 De 10 % a 20 % 189 54 27
4 De 0 % a 10 % 115 33 16
5 Déficit 5 1 1
E
Total 352 100 50

AD
Tabla 1.3: Número seleccionado de una muestra aleatoria estratificada proporcional.
Si aplicara el muestreo aleatorio simple, observe que las empresas del tercero y cuarto
estratos tienen una probabilidad alta de que se les seleccione (87 %), mientras que las empresas
de los demás estratos tienen menos (13 %). Podrı́a no seleccionar ninguna de las empresas
que aparecen en los estratos 1 o 5 sencillamente por azar. No obstante, el muestreo aleatorio
estratificado garantizará que por lo menos una empresa de los estratos 1 o 5 aparezca en la
-I I
muestra. Considere una selección de 50 compañı́as para llevar a cabo un estudio minucioso.
22
Entonces, como se aprecia en la Tabla 1.3, se seleccionará de forma aleatoria 1 (2 % de

20
50) empresa del estrato 1; 5 (10 % de 50), del estrato 2, etc. En este caso, el número
de empresas en cada estrato es proporcional al porcentaje del estrato en la población. El
muestreo estratificado ofrece la ventaja de que, en algunos casos, refleja con mayor fidelidad
las caracterı́sticas de la población que el muestreo aleatorio simple o el muestreo aleatorio
sistemático.
Por tanto, en algunos casos, el muestreo estratificado es más eficiente que el muestreo
aleatorio simple o el sistemático, porque garantiza la representación de individuos o elementos
de toda la población, lo que asegura una mayor precisión en las estimaciones de los parámetros
(poblacionales) fundamentales. Lo que proporciona la precisión, una vez combinados los
estratos, es la homogeneidad de individuos o elementos dentro de cada estrato.
En una muestra conglomerada, se dividen los N individuos o elementos de la
población en varios conglomerados, de manera que cada conglomerado sea representativo
de la población completa (un conglomerado es un subconjunto de la población que, en
EP
términos generales, posee una variabilidad parecida a la del global de dicha población respecto
UD
al carácter que estamos estudiando: podrı́a decirse que un conglomerado es una copia en
pequeño de la población). Después, se obtiene una muestra aleatoria de los conglomerados
y se estudian todos los individuos o elementos dentro de cada conglomerado seleccionado.
Los conglomerados pueden ser asignaciones naturales, como condados, distritos electorales,
A
IM
manzanas, edificios de departamentos o familias, escuelas, hospitales, etc.

Por ejemplo, supóngase que se quiere realizar una investigación en la que se trata de
-L
conocer el grado de satisfacción laboral de los profesores de institutos tecnológicos. Ante la

S
PU
dificultad de acceder individualmente a los profesores de todos los institutos tecnológicos se

decide seleccionar una muestra por conglomerados. Es decir a la población de profesores de
M
CA
institutos se les divide por institutos (esos son los conglomerados). Como hemos decidido
que necesitamos una muestra de 700 profesores y sabiendo que el número de profesores
por instituto es aproximadamente de 35, los pasos a seguir para conseguir la muestra
conglomerada serı́an los siguientes:
1. Recoger un listado de todos los institutos.
2. Asignar un número a cada uno de ellos.
3. Elegir por muestreo aleatorio simple o sistemático los 20 institutos (700/35=20) que
nos proporcionarán los 700 profesores que necesitamos.
E
AD
Los métodos de muestreo conglomerado pueden ser más eficientes (con relación a sus
costos) que los métodos de muestreo aleatorio simple, sobre todo si la población en cuestión
se encuentra esparcida en una vasta región geográfica. Sin embargo, los métodos de muestreo
conglomerado tienden a ser menos eficientes que los métodos de muestreo aleatorio simple o
de muestreo estratificado, y necesitan una muestra total más grande para obtener resultados
tan precisos como los que se obtienen con los procedimientos más eficientes.
Como conclusión, es conveniente tener en cuenta que el tipo de muestra que se debe
emplear depende de lo que se va a investigar, y para seleccionar ésta adecuadamente, en caso
-I I
que el universo sea grande y complicado, conviene estudiar con mucho más detalle la Teorı́a
22
del Muestreo.
20
La necesidad de uso de los métodos de estadı́stica inferencial se deriva de la necesidad

del muestreo. A medida que una población crece, por lo general resulta demasiado costoso,
tardado y tedioso obtener información de toda la población. Las decisiones respecto a las
caracterı́sticas de la población deben basarse en la información que está contenida en una
muestra de esa población. La teorı́a de probabilidad proporciona el vı́nculo al determinar la

posibilidad de que los resultados de la muestra reflejen los resultados de la población.
1.6. Fuentes de datos.
Para poder llevar a cabo un estudio estadı́stico de una población, primero se debe tener
muy claro qué se quiere analizar para recolectar los datos adecuados. Ahora, la recolección
se puede hacer recurriendo a diversas fuentes. En términos generales, las fuentes de donde
se obtienen los datos pueden clasificarse en primarias o secundarias. Primarias, mediante
la observación o realización de experimentos, encuestas o cuestionarios. Las Secundarias,
EP
como las bases de datos ya existentes, por ejemplo, la del Instituto Nacional de Estadı́stica
e Informática (INEI), Banco Central de Reserva del Perú (BCRP), etc.
UD
Por tanto como se ha comentado una fuente para recopilar datos es la experimentación.
En un experimento se ejerce un control estricto sobre los tratamientos; por ejemplo, en un
estudio para verificar la efectividad de un detergente para ropa, el investigador determinará
A
qué marcas son más efectivas para limpiar ropa manchada al lavar las prendas en lugar de
IM
preguntar a los consumidores cuál marca es la mejor. En general, los diseños experimentales
-L
adecuados son temas de estudio a niveles más avanzados, pues con frecuencia involucran
S
procedimientos estadı́sticos elaborados.

PU
También una manera de recopilar datos es realizando una encuesta. En ella no se ejerce
M
control sobre el comportamiento de las personas que se investigan. Sólo se hacen preguntas
CA
sobre sus creencias, actitudes, comportamiento y otras caracterı́sticas. Las respuestas se

editan, codifican y tabulan para su análisis.
Otro método para recopilar datos consiste en realizar un estudio observacional. Un
investigador observa el comportamiento, de manera directa, casi siempre en el entorno
natural. La mayor parte del conocimiento sobre la conducta de los animales se ha desarrollado
de esta manera, al igual que los conocimientos cientı́ficos en muchos campos, como en
astronomı́a y geologı́a, donde la experimentación y las encuestas son impracticables o
imposibles.
E
Los estudios observacionales se presentan en formas muy variadas en las empresas; todos
AD
están diseñados para recopilar información en un medio grupal, y ayudar en el proceso de

toma de decisiones. Como ejemplo, el grupo focal es una herramienta bastante conocida en
la investigación de mercado, se aplica para obtener respuestas no estructuradas a partir de
preguntas abiertas: un moderador conduce la discusión y todos los participantes responden
a las preguntas. Otros formatos más estructurados, que involucran dinámicas de grupo para
obtener información (y llegar a un consenso) incluyen varios métodos de psicologı́a industrial
y del comportamiento organizacional, como son la lluvia de ideas, la técnica Delphi y el
método de grupo nominal. Estas herramientas se han popularizado en los últimos años
-I I
debido al impacto de la filosofı́a de administración de la calidad total (TQM, Total Quality

22
Management) en las empresas. TQM hace hincapié en la importancia del trabajo en equipo
20
y el empowerment de los empleados, en un intento por mejorar cada producto o servicio.

Para diseñar un experimento, aplicar una encuesta o realizar un estudio por observación,
se deben comprender los distintos tipos de datos y niveles de medición.
La internet, no cabe duda se ha convertido también en una fuente importante de datos
e información estadı́stica. Casi todas las empresas mantienen sitios web que proporcionan
información general sobre la empresa, ası́ como datos sobre ventas, número de empleados,
número de productos, precios de productos y especificaciones de productos. Además, varias
compañı́as ahora se especializan en hacer que la información esté disponible a través de
Internet. Como resultado, uno puede obtener acceso a cotizaciones de acciones, precios de
comidas en restaurantes, datos de salarios y una variedad casi infinita de información.
Por último otra forma importante de obtener datos es consultar las fuentes gubernamen-
tales, industriales o individuales. De estas tres fuentes, el gobierno es el principal recopilador
de datos. La mayorı́a de las entidades gubernamentales que recopilan y procesan datos tam-
EP
bién hacen que los resultados estén disponibles a través de un sitio web. Existen también
UD
entidades privadas y publicaciones que se encargan de recopilar datos para realizar estudios
estadı́sticos de grupos o sectores especı́ficos.
1.7. Problemas propuestos.
A
1. Clasifique las siguientes variables según su naturaleza:
IM
a) ¿Posee Ud. licencia de conducir?

S -L
b) El número de televisores que hay en una casa.

PU
c) La marca de jabón de tocador que emplean en una familia.

M
d ) El peso que una persona ha perdido el mes pasado luego de seguir una dieta
CA
rigurosa.
e) La frecuencia de aplicación de protectores solares antes de exponerse al sol
(siempre, a menudo, algunas veces, rara vez, nunca).
f ) Lugar de procedencia
g) Número de teléfono
h) Profesión
i ) Nivel socioeconómico
E
j ) Placa de un auto
AD
k ) Número de créditos en los que se ha matriculado en el presente semestre.

l ) Marca del auto que maneja.
m) Temperatura del aire en grados Fahrenheit a las 2 de la tarde de un dı́a cualquiera.
n) El tiempo de vuelo de un avión que se desplaza entre Lima y Bogotá.
ñ) Preferencias polı́ticas (izquierda, derecha o centro).
o) Marcas de cerveza.
-I I
Km
p) Velocidad en
22
h
20
q) El peso en Kg.
r ) Nivel educativo (primario secundario, superior).
s) Tipo de enseñanza (privada o pública).
t) Número de empleados de una empresa.
u) La temperatura de un enfermo en grados Celsius.

Nw
v ) La presión de un neumático en
cm2
2. Describa con sus propias palabras y proporcione un ejemplo de cada uno de los
siguientes términos. Sus ejemplos deben ser distintos a los proporcionados en este texto.
a) Variable d ) Población g) Muestreo probabilı́stico

b) Datos e) Estadı́stico h) Muestreo no proba-
c) Muestra f ) Parámetro bilı́stico
EP
UD
3. Suponga que la cafeterı́a del Campus vende jugos de fruta natural en tres presentaciones
o tamaños: pequeño, mediano y grande. Explique por qué el tamaño del jugo es una
variable categórica o cualitativa.
A
4. Suponga que se ha obtenido la siguiente información entre los estudiantes que salı́an
IM
de la biblioteca del Campus Lima la semana previa a exámenes parciales:

S -L
a) Gasto en fotocopias. f ) ¿Posee una laptop?

PU
b) Número de libros consultados. g) ¿Cómo califica el servicio en la bibliote-

M
c) Tiempo a la semana dedicado para leer ca?

CA
libros. h) Número de asignaturas en las que se

d ) Programa académico. matriculó en el semestre actual.
e) Género
Clasifique cada variable como cualitativa o cuantitativa. Si es cuantitativa, determine

si es discreta o continua. Si es cualitativa, determine si es nominal u ordinal.
5. Para una población de N =902, verifique cuántas filas de la tabla de números aleatorios
del Apéndice A.1 son necesarias para obtener una muestra de tamaño n=30 sin
E
AD
reemplazo. El punto de inicio debe ser en fila 5-columna 1, hacia la derecha y de

manera seguida)
6. ¿Cuál es la diferencia entre muestra y población?
7. ¿Cuál es la diferencia entre un estadı́stico y un parámetro?
8. ¿En qué difieren la estadı́stica descriptiva y la inferencia estadı́stica?
9. ¿Cuál es la diferencia entre muestreo probabilı́stico y muestreo no probabilı́stico?

-I I
10. ¿Cuál es la diferencia entre una muestra estratificada y una muestra conglomerada?
22
20
11. ¿Cuál es la diferencia entre una variable aleatoria discreta y una continua?¿y la
semejanza?
12. ¿Cuál es la diferencia entre muestreo con reemplazo y muestreo sin reemplazo?
13. Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase, se
utiliza en cada uno de los siguientes ejercicios:
a) Un economista estudia el efecto de la educación en el salario, y realiza una encuesta

a 150 trabajadores seleccionados al azar de cada una de estas categorı́as: estudios
menores que la secundaria, grado de escuela secundaria, estudios de mayor grado
que la secundaria.
b) Una universidad, motivada por un estudiante que murió en estado de ebriedad,
realizó una investigación de estudiantes que beben seleccionando aleatoriamente
EP
10 diferentes salones de clase y entrevistando a todos los estudiantes en cada uno

UD
de estos grupos.
14. Un laboratorio farmacéutico desea conocer la proporción de personas cuya hipertensión

puede ser controlada con un nuevo producto fabricado por ellos. Al realizar un estudio
A
en 10240 individuos hipertensos se encontró que 70 % de ellos pudo controlar su
IM
hipertensión utilizando el nuevo medicamento. Suponiendo que esas 10240 personas

-L
son representantes del grupo de hipertensos. Defina en términos del problema, cuál es:
S
PU
a) La población bajo estudio

b) La muestra
M
CA
c) La variable de interés y su tipo según naturaleza

d ) El parámetro y su valor
e) El estadı́stico y su valor
15. En el siguiente enunciado identifique (y sustente) qué variable (o variables) tienen

nivel de medición de intervalo: Para un pescador es importante el número de peces
capturados, la especie y el peso del pez.
16. El departamento de inscripciones desea calcular el costo de los libros de texto que
E
utilizan los estudiantes de la universidad. El plan es seleccionar aleatoriamente a 100

AD
estudiantes y preguntarles el costo total de todos los libros adquiridos en el último

semestre. El costo promedio de los 100 estudiantes será utilizado para estimar el costo
promedio para todos los estudiantes. Defina en términos del problema cuál es:
a) La población c) La variable que se debe medir
b) La muestra (indique además el ta- d ) El parámetro

maño) e) El estadı́stico
-I I
17. El encargado de deportes de la Universidad de Piura, Campus Lima, desea estimar la

22
resistencia media muscular de las estudiantes del campus. Para tal fin, el encargado,
20
realizó una investigación en un laboratorio midiendo la resistencia muscular a cada

una de las 120 estudiantes elegidas aleatoriamente de entre los diferentes programas,
encontrando que el puntaje de resistencia media muscular de dichas estudiantes fue de
140. Defina en términos del problema cuál es:
a) La población d ) El parámetro
b) La muestra
c) La variable de interés. e) El estadı́stico
18. Un fabricante de medicamentos veterinarios está interesado en la proporción de

animales que padecen infecciones locales cuya condición puede ser controlada por
un nuevo producto desarrollado por la empresa. Se condujo un estudio en el que
participaron 5000 animales que padecen infecciones locales y se encontró que 80 % de
los animales pueden controlar la infección con el medicamento. Suponiendo que los 5000
EP
animales son representativos del grupo de animales con infecciones locales, conteste las
UD
siguientes preguntas:
a) ¿Cuál es la población? d ) Defina el estadı́stico y proporcione su

b) ¿Cuál es la muestra? valor
A
IM
c) Defina el parámetro de interés e) ¿Se conoce el valor del parámetro?

S -L
19. Determine cuál de los niveles de medición es el más apropiado para la variable de
PU
interés, en los siguientes casos:

M
a) Los pesos de las mujeres que juegan fulbito en un campeonato.

CA
b) Las temperaturas actuales, en grados Celsius, en los salones de clase del campus
lima.
c) La clasificación del hábito de fumar como: fumador ligero, fumador moderado,
fumador intenso.
d ) El número de respuestas “sı́” recibidas cuando se les preguntó a 1250 conductores
si habı́an usado alguna vez un teléfono celular mientras conducı́an.
e) El credo religioso de un grupo de personas.
E
f ) La actitud de los limeños hacia la discriminación medida en una escala de (1 =

AD
desfavorable) hasta (5 = muy favorable).
20. Se realizó un estudio para conocer la prevalencia en el consumo de alcohol en los

estudiantes universitarios. La encuesta fue realizada en Lima entrevistándose a 315
estudiantes. Dentro de los resultados se evidenció que la edad promedio de inicio en el
consumo de bebidas alcóholicas era de 13 años, el número promedio de dı́as a la semana
en que se consume alcohol fue de 2, el 57.46 % manifiesta que suelen consumir alcohol
en bares cercanos a su centro de estudios. Defina en términos del problema:
-I I
a) La(s) variable(s) de interés y su tipo según naturaleza.

22
b) El(los) estadı́stico(s) y su(s) valor(es).

20
c) El(los) parámetro(s) y su(s) valor(es).
21. Clasifique cada variable como cualitativa (nominal u ordinal) o cuantitativa (discreta
o continua).
a) Calificación de un examen (Desaprobado, Aprobado, Notable, Sobresaliente)

b) Precio cotizado de las acciones de la empresa “A”.
c) Nacionalidad de los clientes.
d ) Tiempo dedicado a las tareas domésticas por los hombres y las mujeres que
trabajan fuera del hogar.
e) Colores de carrocerı́a de automóviles.
f ) Grado de enfermedad o lesión (leve, reservado, grave, muy grave)
EP
g) Número de celulares que posee una familia.

UD
h) Altura del tallo de 250 plantas

i ) Cantidad de vehı́culos que llegan en un dı́a por el peaje al Sur.
j ) El diámetro de las ruedas de varios autos.
A
k ) Sensación térmica (muy frı́o, frı́o, templado, caliente, muy caliente)
IM
l ) Cantidad de precipitación diaria en un poblado (mm3 )

-L
m) Distancia de una estrella cualquiera del cosmos al sistema solar, en años luz.
S
PU
n) Nombres de establecimientos.
M
ñ) Opinión sobre una propuesta polı́tica (muy en contra, en contra, indiferente, a
CA
favor, muy a favor)

o) Número de pacientes atendidos.
p) Número de teléfono.
q) Partido polı́tico por el que votarás en las próximas elecciones municipales.
r ) Número de palabras en una determinada página de un libro.
s) Raza.
t) Calidad de imagen de un televisor.
E
u) Tiempo de vida de una baterı́a.

AD
v ) Grado de infección de una herida ( “leve”, “moderado”, “grave”).
22. Las tiendas a nivel nacional dedicadas a la comercialización de artefactos eléctricos han
encargado realizar un estudio con la finalidad de obtener algunos indicadores. El estudio
se realizó tomando una muestra de 60 tiendas obteniéndose los siguientes resultados:
La utilidad neta promedio por artefacto vendido es de 5 dólares.

El 80 % de los artı́culos vendidos corresponden a la denominación “lı́nea blanca”.
-I I
Promedio de devolución: 2 artı́culos trimestralmente debido a fallas técnicas.

22
20
Defina en términos del problema, cuál es:
a) La población bajo estudio.

b) La muestra.
c) La(s) variable(s) de interés y su tipo según naturaleza.

d ) El(Los) parámetro(s) y su(s) valor(es).
e) El(Los) estadı́stico(s) y su(s) valor(es).
23. Encuentre un artı́culo o un anuncio en un periódico o una revista, que ejemplifique el

uso de la estadı́stica.
a) Identifique y describa un estadı́stico reportado en el artı́culo.

b) Identifique y describa la variable relacionada con el estadı́stico del inciso (a).
EP
c) Identifique y describa el muestreo relacionado con el estadı́stico del inciso (a).

UD
d ) Identifique y describa la población de la cual se tomó la muestra del inciso (a).
24. Determine y sustente cuál de los niveles de medición es el más apropiado para la variable
de interés en los siguientes casos:
A
IM
a) El puntaje obtenido en un test psicológico para la medición de actitudes.

-L
b) Litros de agua consumidos por una persona al dı́a.

S
PU
c) Calidad de vida en una ciudad.

M
d ) ¿Ha consumido bebidas hipertónicas? (si, no).

CA
25. La empresa Aventis Pharmaceuticas realizó un estudio para medir los efectos colaterales
de Allegra, un medicamento que se utiliza en el tratamiento de alergias estacionales.
A un grupo de 679 personas que sufren alergias en EEUU se les administraron 60 mg
del medicamento dos veces al dı́a. Los pacientes informaron si durante ese periodo
experimentaron, o no, alivio de sus alergias, ası́ como si experimentaron cualquier
otro efecto colateral adverso (infección viral, náusea, somnolencia, etc). Fuente: Good
Housekeeping, febrero de 2005, p. 120.
a) ¿Cuál es la población bajo estudio?

E
AD
b) ¿Cuál es la muestra?
c) ¿Cuáles son las caracterı́sticas (variables) de interés acerca de cada uno de los
elementos de la población?
d ) Los datos recolectados, ¿son cualitativos (¿de qué tipo?) o cuantitativos (¿de qué
tipo?)?
26. Responda lo siguiente, expresándose adecuadamente:
a) Investigue y responda: ¿Cuál es la diferencia fundamental entre el nivel de medición

-I I
de intervalo y el nivel de medición de razón? De 1 ejemplo de cada caso.

22
20
b) ¿Qué es una muestra no probabilı́stica? ¿Cuáles son sus ventajas y desventajas?

c) Las tablas de números aleatorios se caracterizan por dos aspectos que las
hacen particularmente útiles para el muestreo aleatorio ¿Cuáles son esas dos
caracterı́sticas?
27. Identifique cuál de los tipos de muestreo vistos en clase, se utiliza en cada uno de los
siguientes ejercicios:
a) Un reportero de noticias de canal Zeta pretende conocer la reacción a una historia

triste entrevistando a las personas que van pasando frente a su estudio.
b) Ud. obtiene una lista de 42763 propietarios de automóviles y desea elegir una
muestra de propietarios para entrevistarlos, seleccionando cada 100-ésimo nombre
en esa lista.
c) En una encuesta de 1059 adultos, los sujetos entrevistados fueron seleccionados
EP
mediante el uso de una computadora, para generar aleatoriamente los números

UD
telefónicos a los que se llamó.

d ) La Superintendencia de Administración Tributaria dividió todos los automóviles
registrados en categorı́as de subcompacto, compacto, mediano, intermedio y
A
grande. Se encuestó a 200 propietarios de automóviles de cada categorı́a.
IM
e) Una ejecutiva de marketing de General Motors encontró que su departamento de

-L
relaciones públicas acababa de imprimir sobres con los nombres y direcciones de

S
todos los propietarios de un Corvette. Ella quiere hacer una prueba piloto de la
PU
nueva estrategia de mercadotecnia, ası́ que enumera todos los sobres y ayudada
M
de una tabla de números aleatorios, obtiene un grupo de muestra sacando 50 de

CA
esos sobres.
f ) En un operativo de sobriedad de la policı́a se detenı́a y entrevistaba a cada quinto
conductor.
g) Una empresa encuestadora está planeando realizar una encuesta de salida en que
se elegirán aleatoriamente 100 locales electorales y se entrevistará a todos los
votantes conforme vayan saliendo de los locales.
h) Un investigador de una universidad encuesta a todos los pacientes del área de
cardiologı́a en cada uno de 30 hospitales seleccionados al azar.
E
AD
i ) Un experto en marketing está planeando una encuesta para MTV, en la cual 500
personas se elegirán aleatoriamente de cada grupo de edades de 10 a 19, 20 a 29,
etc.
28. En el siguiente enunciado identifique: población, muestra, variable(s), tipo de

variable(s), Defina el(los) parámetro(s) y proporcione su(s) valor(es), Defina el(los)
estadı́stico(s) y proporcione su(s) valor(es): El dı́a 12/12/2012 en el aeropuerto Jorge
Chávez se hizo un estudio en el área de salidas internacionales, en el cual se encuestó
a 150 personas obteniéndose los siguientes resultados:
-I I
22
El 20 % de pasajeros es peruano.
20
La edad promedio de los pasajeros es de 29.3 años.

El 20 % dijo que el servicio en el aeropuerto era bueno.
En promedio cada pasajero llevaba 1.5 maletas.
El costo promedio de un pasaje en avión es $126.50.

El tiempo de espera promedio antes de subir al avión es de 1.8 horas.
utiliza en el siguiente ejercicio: El sistema de cómputo de un gran hospital contiene
registros para 30 000 pacientes. Los registros están numerados del 1 al 30 000. Se
obtuvo una muestra de los registros, seleccionando a los pacientes cuyos números son
100, 200, 300,. . . , 30 000, obteniéndose ası́ una muestra de 300 enfermos.
EP
30. Conteste Verdadero(V) o Falso (F):

UD
a) La estadı́stica descriptiva permite hacer proyecciones o estimaciones acerca de la

población de la cual procede.
b) Un parámetro es una medida calculada de alguna caracterı́stica de una población.
A
c) Abrir una caja de manzanas y contar las que están en mal estado es un ejemplo
IM
de dato numérico continuo.

-L
d ) En una muestra aleatoria simple todos los elementos de la población tiene la misma
S
posibilidad de ser seleccionados.

PU
M
31. Suponga que el número de resfriados que una persona cualquiera contrae
CA
durante el invierno es una variable de interés en un estudio. Determine y sustente

(expresándose en términos del contexto), cuál de los niveles (o escalas) de medición es
el más apropiado para dicha variable de interés
32. Una empresa dedicada a la fabricación de conservas de pescado tiene planeado

introducir al mercado conservas de trucha. Para ello le encargó a una empresa
investigadora de mercado la realización de un estudio mediante el que le interesaba
averiguar, entre otras cosas, la aceptación del nuevo producto y el precio que
las personas estarı́an dispuestas a pagar. La encuesta fue realizada en Lima y se
E
entrevistaron a 250 personas. De los encuestados, el 67 % estarı́an dispuestos a consumir

AD
el nuevo producto. Además se concluyó que el precio del producto deberı́a oscilar entre
1,50 y 2,5 soles. Determinar:
a) ¿Cuál es la población?
c) La(s) variable(s) y su(s) respectivo(s) tipo(s) y nivel(es) de medición.
d ) Defina el(los) parámetro(s) de interés y proporcione su(s) valor(es)
-I I
e) Defina el(los) estadı́stico(s) de interés y proporcione su(s) valor(es)

22
33. Un empresario tiene la idea de implementar la venta de chicha morada en envase no

20
retornable en la ciudad de Iquitos. Para ello realiza un estudio de factibilidad y el 90 %

de los 250 encuestados, está dispuesto a consumir el nuevo producto. También obtuvo
información acerca de la utilidad que lograrı́a obteniendo un promedio de 1.5 soles de
utilidad por producto. Determinar:
34. Determine y sustente (expresándose en términos del contexto), cuál de los niveles (o
escalas) de medición es el más apropiado para la variable de interés siguiente: Cantidad
EP
de accidentes producidos por semana, en la fábrica de una conocida empresa.

UD
35. Una empresa realiza una encuesta sobre el uso de cajeros automáticos por parte de los
habitantes del distrito de San Martı́n de Porres. De las 1200 personas encuestadas se
tiene la siguiente información:
A
El 60 % usa la red de cajeros Unibanca.
IM
La edad promedio de los encuestados fue 38 años.

-L
El 72 % afirmó que únicamente los utiliza para retirar dinero.

S
PU
El 5 % de los encuestados afirmó haber sido asaltado al utilizar el cajero.

M
CA
36. En una prueba de aptitud conformada por 25 preguntas, 4 son de cultura general. A
un alumno se le asignarán 18 preguntas al azar para que haga una tarea. Si se define
E
como variable de interés el número de preguntas de cultura general que se le

AD
asignan al alumno. Determine y sustente (expresándose en términos del contexto),

cuál de los niveles (o escalas) de medición es el más apropiado para dicha variable de
interés.
37. La SUNAT hace una auditorı́a para verificar si las tiendas de abarrotes en el distrito de
San Juan de Lurigancho entregan boleta de venta a sus clientes y para tal fin selecciona
aleatoriamente a 100 de dichas tiendas encontrando que el 65 % de ellas entregaban
boleta de venta. Defina en términos del problema:
-I I

22
20

38. En el siguiente enunciado identifique (y sustente) qué variable (o variables) tienen nivel
de medición de intervalo: Para el jefe de agencia de un banco es importante el número
de clientes atendidos al dı́a, el grado de satisfacción de los clientes hacia la atención
recibida y la cantidad de dinero que un cliente mantiene mensualmente en su cuenta.
39. Un comunicólogo (estudioso de la comunicación) desea estimar el porcentaje de

televidentes que ven el noticiario “Buenos dı́as Lima”. Se condujo un estudio en el
que participaron 1000 televidentes, y se encontró que el 60 % de las personas ven
el noticiario. Suponiendo que las 1000 personas son representativas del grupo de
EP
televidentes, Defina en términos del problema:

UD

c) ¿Cuál es la variable de interés? ¿de qué tipo es? ¿qué nivel de medición tiene?
A
d ) el parámetro de interés y proporcione su valor.
IM
e) el estadı́stico y proporcione su valor.

S -L
40. Piense bien y clasifique las siguientes variables según su nivel de medición:
PU
M
a) Altitud (altura, en metros sobre el nivel del mar) de una ciudad.

CA
b) Opinión de los limeños acerca de la gestión de un congresista, medida en una

escala de 1 hasta 5, donde: 1=pésima y 5=excelente.
c) El tipo de vitamina que contiene un grupo de alimentos (ej. vitamina E)
d ) El diámetro, en milı́metros, de un conjunto de tornillos.
e) La actitud de los peruanos hacia la discriminación racial medida en una escala de:
1 =desfavorable hasta 5 = muy favorable.
f ) Consumo mensual de electricidad (en Kw/h) en un hogar.
E
g) Opinión acerca de la posible construcción de un condominio multifamiliar en el

AD
área de un parque ( A favor, en contra).
41. Un comité de arqueólogos e historiadores ha sido nombrado por el Ministerio de Cultura,

para estudiar el grado de conservación de los monumentos históricos de la ciudad
de Lima. Se condujo un estudio en el que se eligieron aleatoriamente 100 de estos
monumentos, y se encontró que el 30 % están muy bien conservados. Suponiendo que
los 100 monumentos son representativos del grupo total de monumentos históricos,
defina en términos del problema:
-I I

22
20
c) ¿Cuál es la variable de interés? ¿qué nivel de medición tiene?

d ) el parámetro de interés y proporcione su valor.
e) el estadı́stico y proporcione su valor.
42. En un estudio se clasifica la presión arterial de un paciente como: normal,

prehipertensiva, presión arterial alta en etapa 1 o presión arterial alta en etapa 2.
Determine y sustente (expresándose en términos del contexto), cuál de los niveles (o
escalas) de medición es el más apropiado para la variable de interés: presión arterial.
utiliza en el siguiente ejercicio. Se realizó una investigación para conocer las condiciones
en que viven los niños y adolescentes en los Centros de Atención Residencial del
INABIF. Para tal efecto se seleccionó al azar 6 de estos centros y se evaluó las
EP
condiciones de vida de los niños y adolescentes residentes en cada uno de ellos.

UD
44. Uno de los cuatro niveles o escalas de medición se denomina “de razón” ¿Por qué se le
denomina ası́? Explique claramente y exponga un ejemplo.
45. Clasifique las siguientes variables según su nivel de medición. Sustente la respuesta que
A
brinde en el apartado a) y c)
IM
a) El diámetro, en milı́metros, de un conjunto de tornillos.

S -L
b) Percepción de los usuarios del transporte público frente al servicio que se brinda,
PU
medido en una escala de: 1 =muy malo hasta 5 = muy bueno.

M
c) Altitud (altura, en metros sobre el nivel del mar) de una ciudad.

CA
d ) Número de bacterias por milı́metro cúbico.

e) Intensidad del dolor: Leve, Moderado, Intenso.
f ) Facultad a la que Ud. pertenece.
46. En el mes de Noviembre del 2011, se realizó un estudio en pacientes que pasaron consulta
en el servicio de cardiologı́a del Hospital Rebagliati, para conocer algo sobre: proporción
o porcentaje de pacientes con riesgos cardı́acos (si o no), peso promedio (kg),sexo del
paciente (masculino, femenino) y el grado de sedentarismo (alto, medio, bajo). Para
tal efecto, se eligieron aleatoriamente a 60 pacientes y se encontró que el 45 % tenı́an
E
AD
riesgo cardı́aco, el peso promedio fue de 75.2 kilos, el 70 % eran de sexo masculino y el
80 % tenı́an alto grado de sedentarismo. Defina en términos del problema:

c) ¿Cuáles son las variables de interés? ¿qué nivel de medición tiene cada una?
d ) parámetros de interés y proporcione sus valores.
e) estadı́sticos y proporcione sus valores.
-I I
22
20
brinde en los apartados b) y c)
a) El nivel educativo de una madre que vive en una comunidad de San Vicente de
Cañete y que se codifica con un número: 1 = Nivel Superior, 2 = Medio, 3 =
Básico, 4 = Ninguno
b) La puntuación obtenida en un test que mide el coeficiente intelectual.

c) El número de ases obtenidos al extraer 3 cartas de una baraja.
d ) Los códigos postales de las ciudades del paı́s.
48. La empresa Informat S.A. llevó a cabo un estudio para analizar el mercado de
internautas que compran servicios de internet, en Lima Metropolitana. Para el estudio
se consideró una muestra probabilı́stica de 1500 personas. Algunos de los resultados de
la encuesta fueron:
EP
De las 1500 personas seleccionadas, solo el 25 % de los internautas tienen alguna

computadora en casa.
UD
El número promedio de veces por semana que los encuestados usan el servicio de
Internet es 3.
El 80 % de los internautas opinó que el servicio de Internet es regular.
A
IM
El tiempo promedio de uso diario de Internet es de 2 horas.

-L

S
PU

M
b) La muestra.
CA

49. Determine y sustente (expresándose en términos del contexto), cuál de los niveles (o
escalas) de medición es el más apropiado para las variables de interés siguientes:
a) Nota o puntuación obtenida en el examen parcial.

E
b) Cantidad de “cincos” obtenida al lanzar un dado 8 veces.

AD
50. Explique claramente ¿Cuál es la diferencia fundamental entre la escala de medición

ordinal y la escala de medición de intervalo? De 1 ejemplo al respecto.
51. Con la finalidad de conocer en qué medida los propietarios de viviendas del distrito de
Lince pagan el impuesto predial, la Municipalidad correspondiente realizó un estudio.
De una muestra de 500 propietarios se obtuvo los siguientes resultados preliminares.
El ingreso promedio mensual por propietario es de S/. 425.50

-I I
El número de pisos promedio por propiedad es de 1.5

22
Solo el 63 % opina que puede pagar el impuesto predial.

20
El número de viviendas promedio por manzana es de 15.5 casas/manzana

El 49 % opina que la calidad de atención en el municipio para pagar el impuesto
predial es regular.
Defina en términos del problema:

EP
utiliza en el siguiente ejercicio. Se realiza un estudio para estimar el consumo total de

UD
gasolina en una ciudad. Para esto, los vehı́culos se clasificaron en: particulares (1),
públicos (2) y oficiales (3) y se eligieron al azar 100 automóviles de cada grupo.
53. El Ministerio de Comercio Exterior y Turismo realizó un estudio sobre el perfil del
A
turista nacional. Se define al turista nacional como aquel peruano que se traslada a
IM
alguna zona del paı́s diferente de donde reside. El estudio se llevó a cabo con hombres y
-L
mujeres, entre 18 a 64 años, que vacacionaron en Lima, Arequipa, Trujillo, Huancayo y

S
Chiclayo. Se seleccionó una muestra probabilı́stica de 3359 turistas, de la que se obtuvo

PU
los siguientes resultados:

M
CA
El tiempo promedio (en dı́as) de permanencia por turista en estos lugares fue de
5 dı́as.
El gasto promedio diario por turista fue de 766 soles.
Los medios utilizados para búsqueda de información turı́stica: el 56 % por internet,
24 % por familiares, 12 % por folletos turı́sticos y por agentes turı́sticos 8 %.

E
b) La muestra.
AD

brinde en los apartados a) y d)
a) El tipo de sangre de un paciente.

-I I
b) Puntaje obtenido en un test de personalidad.

22
20
c) La cantidad de cincos obtenidos al lanzar 3 veces un dado.

d ) Percepción de los usuarios del servicio brindado en el Metropolitano, medido en
una escala de: 1 =muy malo hasta 5 = muy bueno
55. La empresa Mistercofi S.A., que entre otras cosas produce café, ha solicitado realizar
un estudio de mercado de las personas de clase media, de la ciudad de Lima, acerca del
consumo de dicho producto. Para realizar el estudio la empresa seleccionó una muestra
de 1200 personas de clase media de la ciudad de Lima. Algunos de los datos y resultados
de la encuesta fueron:
El precio promedio de un envase de café, pagado por persona,fue de 9 soles.

El 35 % de personas opinó que el café es un producto dañino para la salud.
EP

UD

b) La muestra.
A
IM

S -L
PU
utiliza en el siguiente ejercicio: Se realizó una investigación para conocer las condiciones
M
en que viven los presos en las cárceles peruanas. Para tal efecto se seleccionó al azar 5
CA
centros penitenciarios y se evaluó las condiciones de vida de todos los presos en cada
uno de esos centros.
57. Con la finalidad de conocer en qué medida los propietarios de automóviles del distrito
de Magdalena pagan el impuesto vehicular, el SAT realizó un estudio. De una muestra
de 600 propietarios se obtuvo los siguientes resultados preliminares.
El ingreso promedio mensual por propietario es de S/. 525.50

El 74 % opina que puede pagar el impuesto vehicular.
E
El número de automóviles promedio por propietario es de 1.5

AD
El 49 % opina que la calidad de atención en el SAT para pagar el impuesto predial

es muy buena.
El número de automóviles promedio por manzana es de 15.5

-I I
22
20

58. Suponga que se está investigando los tiempos obtenidos en una prueba de rendimiento
de observación visual en adolescentes de 17 años de edad que asisten a un curso de
un colegio de la ciudad de Lima. La prueba consiste en que se presentan dos dibujos
y se deben encontrar 7 errores, luego se toma el tiempo (en minutos) que tardan en
descubrirlos. La base de datos de la población es la siguiente:
EP
UD
A
IM
-L
a) Seleccione una muestra aleatoria simple de 6 estudiantes de esta población. Use la

S
tabla de números aleatorios adjunta, empezando en la fila 1 columna 1 y continúe

PU
seleccionando hacia la derecha. Describa la muestra seleccionada.

M
b) Calcule el tiempo medio que emplean para descubrir los 7 errores, los 6 adolescentes
CA
elegidos ¿Cuál es la proporción de hombres en la muestra? ¿los que acaba de

calcular son estadı́sticos o parámetros?
E
AD
59. Se realiza un estudio con el objetivo de estimar la relación entre la depresión y los
conflictos familiares en los adolescentes peruanos. Según una encuesta realizada a 342
participantes de entre 11 y 17 años, revela que la edad promedio de los encuestados es
de 13.7 años, el 52.6 % es de sexo masculino y el 16.7 % presenta un nivel de depresión
severa. Defina en términos del problema:

b) La muestra.
-I I

22
d ) El(los) estadı́stico(s) y su(s) valor(es).

20
e) El(los) parámetro(s) y su(s) valor(es).
60. En una canasta se tienen 12 naranjas de las cuales 3 están malogradas. Imagı́nese
que usted elige al azar 5 naranjas de las 12 que hay en esa canasta y se define como
variable de interés el número de naranjas malogradas que obtuvo de las 5 seleccionadas.

escalas) de medición es el más apropiado para dicha variable de interés.
61. Una encuestadora realizó un estudio en el mes de julio con la finalidad de conocer
en qué medida las personas adultas que viven en la capital reaccionan ante el clima
de inseguridad existente. Se encuestó a 1200 adultos y se obtuvieron los siguientes
resultados preliminares.
El 56 % se siente poco satisfecho respecto a la atención que el gobierno brinda al

EP
tema de seguridad.
UD
El tipo de delito más frecuente del que han sido vı́ctimas fue el robo al paso (bolso,
cartera, celular) (60 %).
El 70 % de los encuestados opinan que el distrito en el que viven es poco seguro.
A
El 68 % de los encuestados dice no haber realizado la denuncia respectiva luego
IM
de haber sido vı́ctima de un delito.

-L

S
PU

M
CA
62. El profesor de estadı́stica quiere investigar sobre el tiempo diario de estudio (en horas)
de 20 estudiantes de una clase. Los datos son:
Etiqueta N ombre T iempo Etiqueta N ombre T iempo

01 Juan 2.0 11 M artha 3.0
E
02 Alicia 2.0 12 F ernando 0.5

AD
03 P edro 2.0 13 Julio 0.5

04 M arco 1.5 14 Rosa 1.0
05 Alberto 1.5 15 F abio 1.5
06 Jorge 2.5 16 Ana 2.5
07 David 2.5 17 Laura 1.0
08 Carlos 2.0 18 Enrique 0.5
09 M iguel 1.5 19 Carmen 1.0
-I I
10 V ictoria 1.5 20 M arcelo 1.5

22
a) Seleccione una muestra aleatoria simple de 7 estudiantes de esta población. Use

20
la tabla de números aleatorios adjunta, empezando en la fila 3 columna 1 y

continúe seleccionando hacia la derecha. ¿Qué alumnos conforman la muestra
seleccionada?¿Cuál es el tiempo diario de estudio que dedica cada uno de esos
alumnos?
b) Mostrando los cálculos responda: ¿Cuál es el tiempo medio de estudio en la

muestra? ¿Cuál es la proporción de mujeres en la muestra? ¿Cuál es el mayor
tiempo de estudio en la población?¿Cuál es la diferencia entre el mayor y el menor
tiempo de estudio en la muestra?¿Cuál es la diferencia entre el mayor y el menor
tiempo de estudio en la población?
c) ¿Los valores que acaba de calcular en el apartado anterior son parámetros o
estadı́sticos? Indique claramente en cada caso.
EP
UD
A
IM
63. Una bolsa contiene 25 caramelos de limón y 15 de menta. Imagı́nese que usted elige al
-L
azar 10 caramelos de los 40 que hay en esa bolsa y se define como variable de interés el
S
número de caramelos de limón que obtuvo de los 10 seleccionados. Determine

PU
y sustente (expresándose en términos del contexto), cuál de los niveles (o escalas) de

M
medición es el más apropiado para dicha variable de interés.

CA
64. Suponga que lo acaban de nombrar ejecutivo principal de mercadotecnia para Fun
Enterprise (F.E), compañı́a que se especializa en diseñar y construir parques de
diversiones cerca de grandes ciudades. F.E se interesa principalmente en un sitio al
Sur de Lima. Se realiza un estudio para poder averiguar la opinión acerca de la posible
instalación del parque de diversiones y el precio que en promedio las personas estarı́an
dispuestas a pagar en cada visita. La encuesta fue realizada a 1150 personas adultas
elegidas aleatoriamente y se encontró que el 90 % de los entrevistados declararon estar
a favor de la instalación del parque y que en promedio, el precio que ellas estarı́an
E
dispuestas a pagar serı́a de 8.8 soles.

AD

b) La muestra.
-I I
22
20
brinde en el apartado a), d) y e), expresándose adecuadamente:
a) Longitud de una ciudad (distancia angular entre un punto dado de la superficie

terrestre y el meridiano tomado como referencia, generalmente el meridiano base
es el meridiano de Greenwich).
b) Temperatura de un cuerpo en grados Farenheit.

c) Opinión acerca de la gestión del alcalde de Lima. (Buena,regular o mala).
d ) Código de cuenta interbancario.
e) La cantidad de “unos” obtenidos al lanzar 5 dados normales.
66. En un estudio que realizó una empresa de investigación de mercados, sobre la calidad del
servicio que brindan los supermercados en la ciudad de Lima, se aplicó una encuesta de
opinión a los clientes de dichos supermercados. Para realizar este estudio se seleccionó
EP
una muestra de 1200 clientes que asistieron a los supermercados de la ciudad de Lima.
Se presentan a continuación algunos de los resultados obtenidos:
UD
El 85 % de los encuestados calificó como “buena” la calidad del servicio de atención

en el supermercado.
El 40 % de clientes seleccionados señaló que los precios no eran cómodos.
A
IM
El número promedio de dı́as por semana que asisten los clientes seleccionados al
-L
supermercado es de 2.5 dı́as.

S
El tiempo promedio que permanece un cliente en caja para realizar un pago es de

PU
15 minutos.
M
CA

b) La muestra.
67. Una caja contiene 12 artı́culos de los cuales 4 son defectuosos. Imagı́nese que usted
E
elige al azar 5 artı́culos de los 12 que hay en esa caja y se define como variable de
AD
interés el número de artı́culos defectuosos que obtuvo de los 5 seleccionados.

escalas) de medición es el más apropiado para dicha variable de interés.
68. Responda lo siguiente, expresándose adecuadamente:
a) Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en

clase, se utiliza en el siguiente ejercicio (Sustente la respuesta): Un gran club de
-I I
esparcimiento tiene registrados en su base informática a 42000 socios. Los registros

22
están numerados del 1 al 42000. Se obtuvo una muestra de dichos registros,

20
seleccionando a los socios cuyos números de registro son: 120, 240, 360,. . . , 42
000, obteniéndose ası́ la muestra de socios requerida.
b) Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase,
se utiliza en el siguiente ejercicio (Sustente la respuesta): En una investigación se
trata de conocer el grado de satisfacción laboral de los profesores de Institutos de

Educación Superior Tecnológica pública de Lima Metropolitana, para lo cual se
seleccionó al azar 10 institutos y se entrevistó a todos los profesores de cada uno
de esos institutos.
c) Un concepto importante en el muestreo estratificado es la “afijación”. Explique
qué significa ası́ como sus tipos.
d ) El muestreo bola de nieve es un tipo de muestreo no probabilı́stico. Investigue
al respecto y responda: ¿Cuándo se emplea y en qué consiste?
EP
69. La siguiente información recopilada corresponde a los pacientes atendidos por un

UD
Odontólogo recién egresado de la Universidad, durante su primer mes de trabajo:
Eti− N ombre del N úmero Distrito Eti− N ombre del N úmero Distrito
A
queta P aciente de caries queta P aciente de caries
IM
01 Luis 5 Ate 10 Leticia 6 Ate

-L
02 V iviana 7 Surco 11 F rancisco 1 Surco

S
03 N icolás 2 Lince 12 Blanca 0 Surco

PU
04 N atalia 0 Ate 13 Cecilia 0 Lince

M
05 Erika 1 Lince 14 P edro 2 Ate

CA
06 F ernando 2 Lince 15 Esteban 3 Lince

07 Ivette 0 Surco 16 Bárbara 5 Lince
08 Carolina 6 Lince 17 Diego 6 Ate
09 Cristóbal 7 Lince 18 Israel 4 Surco
a) Seleccione una muestra aleatoria simple de 8 pacientes de esta población. Use la

tabla de números aleatorios adjunta, empezando en la fila 5 columna 1 y continúe
seleccionando hacia la derecha (Si concluye con la fila 5 continúe seleccionando
números a partir de la fila 1 columna 1). Describa la muestra seleccionada.
E
AD
b) ¿Cuál es el número promedio de caries de los 8 pacientes elegidos? ¿Cuál es el

porcentaje de pacientes de la población, que viven en Lince? ¿Cuál es el porcentaje
de pacientes con al menos 4 caries, en los 8 pacientes elegidos? ¿los valores que
acaba de calcular son de parámetros o estadı́sticos? ¿por qué?
-I I
22
20
70. En una lista de 80 clientes que poseen tarjeta de crédito hay 10 clientes que no están al
dı́a en sus pagos (morosos). Imagı́nese que usted elige al azar 20 clientes de esa lista y
se define como variable de interés el número de clientes morosos dentro de los 20
seleccionados. Determine y sustente (expresándose en términos del contexto), cuál de

los niveles (o escalas) de medición es el más apropiado para dicha variable de interés.
EP
UD
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Capı́tulo 2
Estadı́stica descriptiva: Organización, resumen, des-

EP
cripción y presentación de datos estadı́sticos

UD
2.1. Introducción
En este capı́tulo se van a estudiar las distintas formas de organizar, representar y describir
A
IM
conjuntos de datos. El objetivo es hacer que los datos sean más fáciles de ser entendidos
describiendo tendencias, medidas centrales, variaciones, etc. Las técnicas que emplea la
-L
estadı́stica descriptiva involucran el uso de tablas o de gráficos y además el cálculo de medidas

S
PU
que describan las caracterı́sticas principales del conjunto de datos analizado.

M
2.2. Estadı́stica descriptiva:Técnicas tabulares y gráficas

CA
Como se indicó en el capı́tulo 1, los datos se clasifican en cualitativos o cuantitativos.

Las observaciones pueden referirse a personas, organizaciones, naciones, familias, objetos,
etc. En la presentación de datos es necesario ser tan conciso como sea posible, pero sin
dejar de considerar información esencial. El objetivo principal no es simplemente obtener
alguna tabla o gráfica, sino entender los datos (Anderson y Sweeney, 2008). En esta parte del
capı́tulo veremos los métodos tabulares y gráficos empleados para presentar datos cualitativos
y cuantitativos. Los resúmenes gráficos o tabulares de datos se encuentran en reportes anuales,
en artı́culos en los periódicos y en estudios de investigación. Es común encontrarse con este
E
tipo de presentaciones. Por tanto, es útil saber cómo se hacen y se interpretan. Se verán los
AD
métodos tabulares y gráficos para resumir datos que se refieren a una sola variable.
2.2.1. Resumen de datos cualitativos
2.2.1.1. Tabla de frecuencias
Para utilizar la información estadı́stica necesaria, debemos organizarla y resumirla. Una
manera simple y conveniente de resumir los datos es en una tabla llamada distribución de
frecuencias, la cual es un resumen tabular de datos que muestra cada una de las diferentes
clases excluyentes (o valores de la variable) y el número o conteo (frecuencia absoluta)
-I I
de elementos en cada una de ellas. En particular, una distribución de frecuencias nos ayuda
22
a entender la naturaleza de la distribución de un conjunto de datos.

20
Asimismo la organización de la información además de comprender las columnas básicas:

Valores de la variable y las frecuencias absolutas, también a partir de ellas se forman dos
columnas más: la frecuencia relativa y el porcentaje (o frecuencia porcentual).
La frecuencia relativa de una clase es igual a la parte o proporción de los elementos
35
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 36
fi
que pertenecen a cada clase, es decir: , donde fi es la frecuencia absoluta de la clase i y n
n
es el tamaño de la muestra o cantidad de datos analizados. La frecuencia porcentual de una
clase es la frecuencia relativa multiplicada por 100.
Un detalle importante es que en una distribución de frecuencias: La suma de las
frecuencias absolutas es siempre igual al número de observaciones n, la suma de las frecuencias
relativas es siempre igual a 1, y la suma de los porcentajes es siempre igual a 100.
Con el ejemplo siguiente se muestra la elaboración e interpretación de una distribución
de frecuencia de datos cualitativos: Suponga que se encuesta a 123 personas para conocer su
opinión al respecto de diversos temas y dentro de la información que alcanzan se encuentra
EP
su estado civil.
UD
Para elaborar una distribución de frecuencia con estos datos, se cuenta el número de veces
que aparece cada categorı́a de estado civil. Supóngase que al contar, 25 personas son solteras,
50 son casadas, 20 divorciadas, 18 viudas y 10 tienen otros estados civiles que agruparemos
A
en “Otros”. Esto queda resumido en la distribución de frecuencias de la Tabla 2.1:
IM
Estado Número de personas Frecuencia relativa Porcentaje de

-L
Civil (frecuencia) de personas personas

S
PU
25
Soltero 25 123 20.3
M
50
Casado 50 123 40.7
CA
20
Divorciado 20 123 16.3
18
Viudo 18 123 14.6
10
Otros 10 123 8.1
Total 123 1 100
Tabla 2.1: Distribución de frecuencias del estado civil de las personas encuestadas.
Esta distribución de frecuencia proporciona un resumen de cómo se clasifican o

distribuyeron las 123 personas de acuerdo a su estado civil. El resumen aporta más claridad
E
AD
y al observar esta distribución de frecuencia, es claro que el estado civil más frecuente es
“casado”, “soltero” el segundo, “divorciado” el tercero, a continuación “viudo” y “otro”el
menos frecuente. En el cuadro 2.1 se presenta también la distribución de frecuencia relativa y
la distribución de frecuencia porcentual de los datos de estado civil. En esta tabla se observa
que la frecuencia relativa de “soltero” es 25/123=0.203, la de “casado” es 50/123=0.407,
etc. En la distribución de frecuencia porcentual, se muestra que 20.3 % de las personas son
solteros, 40.7 % casados, etc.
2.2.1.2. Diagrama de barras y gráfica de pastel
-I I
22
Una gráfica de barras o un diagrama de barras, es una gráfica para representar los
20
datos cualitativos de una distribución de frecuencia, de frecuencia relativa o de frecuencia

porcentual. En uno de los ejes de la gráfica (por lo general en el horizontal), se especifican
las etiquetas empleadas para las clases (categorı́as) o valores de la variable en estudio. Para
el otro eje de la gráfica (el vertical) se usa una escala adecuada para frecuencia, frecuencia
relativa o frecuencia porcentual. Después, empleando un ancho de barra fijo, se dibuja sobre
cada etiqueta de las clases una barra que se extiende hasta la frecuencia, frecuencia relativa o
frecuencia porcentual de la clase. Cuando se tienen datos cualitativos, las barras deben estar
separadas para hacer énfasis en que cada clase está separada o excluyente de las otras.
En la figura 2.1 se muestra una gráfica de barras correspondiente a la distribución
de frecuencia del estado civil de las 123 personas encuestadas. Advierta cómo en esta
representación gráfica se observa que “casado” y “otro” son las categorı́as de estado civil
con mayor y menor frecuencia respectivamente.
EP
UD
A
IM
S -L
PU
M
CA
Figura 2.1: Distribución de frecuencias para la variable estado civil
La gráfica de pastel proporciona otra gráfica para presentar distribuciones de frecuencia

relativa y de frecuencia porcentual de datos cualitativos. Para elaborar una gráfica de pastel,
primero se dibuja un cı́rculo que representa todos los datos. Después se usa la frecuencia
relativa para subdividir el cı́rculo en sectores, o partes, que corresponden a la frecuencia
relativa de cada clase. Por ejemplo, como un cı́rculo tiene 360 grados y “soltero” presenta
E
una frecuencia relativa de 0.203, el sector de la gráfica de pastel correspondiente a “soltero”

AD
resultará de 0.203*(360)=73.08 grados. El sector del pastel para “casado” resultará de

0.407*(360)=146.16 grados. Mediante cálculos semejantes para las demás clases se obtiene
la gráfica de pastel de la figura 2.2. Los números que aparecen en cada sector pueden ser
frecuencia, frecuencia relativa o frecuencia porcentual.
2.2.1.3. Diagrama de Pareto.
Un recurso gráfico que permite representar datos categóricos que a menudo proporciona
más información visual que los diagramas de barras y de pastel es el diagrama de Pareto
-I I
(Berenson et al., 2006). Esto ocurre a medida que aumenta el número de clases o grupos
22
de la variable categórica de interés. El diagrama de Pareto es un tipo especial de diagrama

20
de barras verticales, donde las respuestas categorizadas se grafican en orden descendente de

frecuencias y se combinan con un polı́gono acumulado en la misma escala. Fue creado sobre
EP
UD
Figura 2.2: Gráfica de pastel para la variable estado civil.

A
la base del principio de Pareto1 , según el cual, el 80 % de los problemas son provenientes de
IM
apenas el 20 % de las causas.

-L
El principio fundamental de esta gráfica es la posibilidad de distinguir a los “pocos

S
vitales”, de los “muchos triviales”, lo que permite dirigir la atención a las respuestas más
PU
importantes. Ası́, el diagrama alcanza su utilidad máxima cuando la variable cualitativa de

M
interés contiene muchas categorı́as. El diagrama de Pareto se usa ampliamente en el control

CA
estadı́stico de procesos y el control estadı́stico de la calidad del producto. Algunos ejemplos

de tales minorı́as vitales serı́an:
La minorı́a de clientes que representen la mayorı́a de las ventas.
La minorı́a de productos, procesos, o caracterı́sticas de la calidad causantes del grueso

de desperdicio o de los costos de reelaboración.
La minorı́a de rechazos que representa la mayorı́a de quejas de la clientela.

E
La minorı́a de vendedores que está vinculada a la mayorı́a de partes rechazadas.

AD
La minorı́a de problemas causantes del grueso del retraso de un proceso.
La minorı́a de productos que representan la mayorı́a de las ganancias obtenidas.
La minorı́a de elementos que representan al grueso del costo de un inventario.
Antes de construir un diagrama de Pareto, se elabora primero una tabla de resumen

de las categorı́as ordenadas de manera descendente según las frecuencias o porcentajes. Las
categorı́as con baja frecuencia deben ser agrupadas, como “otros” y colocadas al final de
-I I
la lista. Luego en la construcción de un diagrama de Pareto, el eje vertical contiene las

22
frecuencias o porcentajes, y el eje horizontal contiene las categorı́as de la variable de interés.

20
Las barras con separación uniforme tienen el mismo ancho. El punto en el polı́gono de
porcentajes acumulados para cada categorı́a se centra en el punto medio de cada barra.
1
Wilfredo Pareto fue un economista italiano que, en el siglo XIX, presentó una fórmula que mostraba la
desigualdad en la distribución de los salarios.
Al estudiar un diagrama de Pareto se buscan dos cosas: las magnitudes de las diferencias en
las longitudes de las barras que corresponden a las categorı́as adyacentes decrecientes y los
porcentajes acumulados de estas categorı́as adyacentes.
Con el ejemplo siguiente se muestra la elaboración de un diagrama de Pareto: El gerente
de operaciones de una planta empacadora de cereales indicó que, según su experiencia, casi
siempre hay nueve razones que dan como resultado la producción de cajas de cartón no
conformes al final del proceso de empaque: cartón roto (R), cartón abultado (G), cartón
agrietado (C), cartón sucio (D), agujeros en el cartón (H), peso de empaque inadecuado (I),
error de impresión (P), etiqueta ilegible (U) y tapa superior sin sello (S).
EP
Los datos sin procesar que se muestran a continuación representan una muestra de 50
UD
cajas de cartón no conformes, las cuales se tomaron de la producción de la semana pasada,

las letras indican las razones de no conformidad:
UGUSHDDRIUSUSUGCSUDRSUDUSSDPRSISUDGSSUSD
A
GSCUDDSSSU
IM
Para construir el diagrama de Pareto con estos datos, primero, elaboramos una tabla de
-L
resumen ordenada de manera descendente respecto de las frecuencias o porcentajes de las

S
PU
razones de no conformidad, la cual se muestra en la Tabla 2.2:

M
Razones de Número de cajas Porcentaje Porcentaje

CA
no conformidad (frecuencia) de cajas acumulado

Tapa superior sin sello (S) 16 32 32
Etiqueta ilegible (U) 12 24 56
Cartón sucio (D) 9 18 74
Cartón abultado (G) 4 8 82
Cartón roto (R) 3 6 88
Cartón agrietado (C) 2 4 92
E
AD
Peso de empaque inadecuado (I) 2 4 96

Agujeros en el cartón (H) 1 2 98
Error de impresión (P) 1 2 100
Total 50 100
Tabla 2.2: Tabla de resumen para construir el diagrama de Pareto.
Ahora empleamos esta tabla de resumen para construir el diagrama de Pareto que aparece
-I I
en la figura 2.3:
22
Al separar los “pocos vitales” de los “muchos triviales”, se determina que las tapas sin
20
sello (32 %), las etiquetas ilegibles (24 %) y los cartones sucios (18 %) representan el 74 % de
las razones de no conformidad. Las otras seis razones representan el 26 %.
EP
UD
Figura 2.3: Diagrama de Pareto para las razones de no conformidad.

A
IM
2.2.2. Resumen de datos cuantitativos

S -L
Para la organización de datos cuantitativos debemos primero decidir si se deben trabajar

PU
como datos no agrupados o como datos agrupados.

M
2.2.2.1. Datos cuantitativos no agrupados

CA

Si al observar los datos del conjunto a analizar, se aprecia que existe poca cantidad de
valores diferentes para la variable de interés (no mayor a 12 ó 15), entonces es conveniente,
elaborar una distribución de datos no agrupados. La secuencia para elaborar dicha
distribución es la siguiente:
1. Establecer cuáles son los valores diferentes que se presentan en el conjunto de datos
(muestra o población), para la variable de interés, y ordenarlos según su magnitud.
E
AD
2. Colocar dichos valores en la primera columna de la tabla de frecuencias.
3. Establecer las frecuencias absolutas, frecuencias relativas y porcentajes.
Con el ejemplo siguiente se muestra la elaboración e interpretación de una distribución de

frecuencia de datos cuantitativos no agrupados: Un estudio en las diferentes escuelas y colegios
del paı́s consistió en anotar el número de palabras leı́das en 15 segundos por un grupo de
120 sujetos disléxicos. Luego de observar los 120 datos se encontró que la variable de interés:
Número de palabras leı́das en 15 segundos por estas personas disléxicas, solo tenı́a 6
-I I
valores diferentes: 25, 26, 27, 28, 29 y 30. Al ser pocos valores diferentes para la variable
22
de interés decidimos organizarlos en una distribución de frecuencias no agrupadas. Entonces

20
colocamos dichos valores en la primera columna de la tabla de frecuencias. Paso seguido, se

cuenta el número de disléxicos que leyeron 25 palabras, 26 palabras, etc. Supóngase que al
contar las observaciones encontramos que: 56 disléxicos leyeron 25 palabras en 15 segundos,
24 leyeron 26 palabras, 16 leyeron 27 palabras, 12 leyeron 28 palabras, 10 leyeron 29 palabras
y sólo 2 disléxicos leyeron 30 palabras. Esta información queda resumida en la distribución

de frecuencias de la Tabla 2.3:
X:N°de palabras Número de disléxicos Frecuencia relativa Porcentaje de

leı́das (frecuencia) de disléxicos disléxicos
56
25 56 120 47
24
26 24 120 20
16
27 16 120 13
EP
12
28 12 120 10
UD
10
29 10 120 8
2
30 2 120 2
Total 120 1 100
A
Tabla 2.3: Distribución de frecuencias del número de palabras leı́das por 120 disléxicos.
IM
-L
Esta distribución de frecuencia proporciona un resumen de cómo se clasifican o

S
distribuyeron los valores del número de palabras leı́das por los 120 disléxicos. El resumen
PU
aporta más claridad y al observar esta distribución de frecuencia, es claro que el número de
M
palabras leı́das más frecuente es 25 y 30 el menos frecuente. En el cuadro 2.3 se presenta

CA
también la distribución de frecuencia relativa y la distribución de frecuencia porcentual de

los datos del número de palabras leı́das. En esta tabla se observa que la frecuencia relativa
de 25 palabras leı́das es 56/120=0.47, la de 26 palabras leı́das es 24/120=0.20, etc. En
la distribución de frecuencia porcentual, se muestra que 47 % de los disléxicos leyeron 25
palabras, 20 % de los disléxicos leyeron 26 palabras, etc.
2.2.2.3. Diagrama de barras
La distribución de frecuencias de datos cuantitativos no agrupados se suele representar
mediante diagramas de barras, que representa cada una de las frecuencias en barras
E
proporcionales (similar al caso de variables cualitativas). El diagrama de barras para

AD
el número de palabras leı́das en 15 segundos por 120 disléxicos se muestra en la figura 2.4.
-I I
22
20
Figura 2.4: Distribución de frecuencias para el número de palabras leı́das por 120 disléxicos.
2.2.2.4. Distribución acumulada: diagrama escalonado

Si en una distribución de frecuencias se suman sucesivamente las frecuencias, de tal forma
que éstas se vayan acumulando: f1 , f2 + f3 + · · · + fn , etc., se obtiene una distribución de
frecuencias acumuladas. Para el ejemplo anterior, esta distribución se representa en la Tabla
2.4:
N°de palabras leı́das 25 26 27 28 29 30

Número de disléxicos acumulado 56 80 96 108 118 120
EP
Tabla 2.4: Distribución de frecuencias acumuladas del número de palabras leı́das.

UD
Gráficamente, esta distribución se representa mediante un diagrama escalonado tal

como se muestra en la figura 2.5.
A
IM
S -L
PU
M
CA
Figura 2.5: Diagrama escalonado: diagrama de frecuencias acumuladas del número de palabras leı́das.
E
Esta representación muestra las frecuencias acumuladas (absolutas o relativas) para los
AD
distintos valores numéricos de la variable. Se aclara además que la frecuencia acumulada

(absoluta o relativa) de un valor numérico que no aparezca en la distribución de frecuencias
es igual a la frecuencia acumulada (absoluta o relativa) de la observación inmediatamente
anterior (ordenadas de menor a mayor). Por tanto, el gráfico de frecuencias acumuladas
siempre tiene forma de “escalera”. Algunas conclusiones del gráfico pueden ser: 80 disléxicos
leen 26 palabras o menos, 96 disléxicos leen 27 palabras o menos, etc.
2.2.2.5. Datos cuantitativos agrupados
-I I

22
Si se tiene un conjunto de datos correspondiente a una variable aleatoria continua (o a una

20
variable aleatoria discreta que posee demasiados valores diferentes), es conveniente agrupar
los datos en intervalos, pues la distribución de frecuencias no agrupada y el diagrama de
barras correspondiente serı́a muy extenso y no ayudarı́an a realizar un apropiado análisis
estadı́stico impidiendo aclarar en qué forma se distribuyen los datos.
Para la organización de datos cuantitativos de forma agrupada debemos tener en cuenta

lo siguiente:
Los intervalos a formar deben ser mutuamente excluyentes o no traslapados.
Se recomienda formar de 5 a 15 intervalos.
Se debe tener en cuenta la naturaleza de la variable de interés, el número de datos y la

amplitud del conjunto de datos.
Es muy importante respetar la precisión con que los datos son medidos. Por ejemplo,
EP
si los datos representan diámetros de ciertas piezas cilı́ndricas, en mm.: 125.5; 127.3;
UD
124.0; etc; expresados con una cifra decimal, entonces los lı́mites de los intervalos a
formar se expresarán también con una cifra decimal. Si los datos están expresados
con una precisión de dos decimales entonces los lı́mites de los intervalos a formar se
expresarán también con dos cifras decimales, etc.
A
IM
Es recomendable que los intervalos tengan igual tamaño cuando se desea hacer
-L
comparaciones entre ellos. Además, usualmente, los intervalos son cerrados a la

S
PU
izquierda y abiertos a la derecha; excepto el último intervalo que es cerrado en ambos

extremos.
M
CA
El procedimiento para la construcción de una tabla de frecuencias de datos

agrupados, aplicando la regla de Sturges, es el siguiente:
1. Determinar el rango o amplitud de los datos:
Rango = (Obsv. mayor valor) − (Obsv. M enor valor).
2. Establecer el número de intervalos mediante la regla de Sturges:
K∼
= 1 + 3.3 ∗ log(n), donde : n = número de datos
E
AD
3. Determinar el tamaño de intervalo de clase común (TIC):
Rango
T IC ∼
= ,
K
4. Establecer los lı́mites de cada uno de los intervalos. Se debe tener en cuenta los siguientes
aspectos:
La observación de menor valor será el lı́mite inferior del primer intervalo. El lı́mite
-I I
superior del primer intervalo se halla sumándole el TIC a la observación de menor

22
valor.
20
Los siguientes intervalos se forman teniendo en cuenta que el lı́mite inferior de un

intervalo es igual al lı́mite superior del intervalo anterior.
Los intervalos deben contener a todos los datos.
5. Determinar las frecuencias absolutas (realizando el conteo, que consiste en asignar cada
observación al intervalo correspondiente).
6. Determinar las marcas de clase (o puntos medios de cada intervalo), las frecuencias
relativas y porcentajes.
Con el ejemplo siguiente se muestra la elaboración e interpretación de una distribución

de frecuencia de datos cuantitativos agrupados: El gerente de Supermercado Plaza Lima está
interesado en el número de veces que un cliente compra en su supermercado durante un
periodo de dos semanas. La respuesta de 51 clientes fue:
EP
UD
5 3 3 1 4 4 5 5 12 6 3 5 1
1 14 1 2 4 4 4 3 2 5 6 7 6
8 4 7 6 5 9 11 4 3 7 6 5 1
A
1 10 8 9 2 12 6 6 4 6 4 15
IM
Empecemos definiendo la variable de interés del problema la cual serı́a:

S -L
X: Número de veces que un cliente compra en el Supermercado Plaza Lima en un periodo

PU
de dos semanas.
M
Para construir una distribución de datos agrupados hay que seguir los siguientes pasos:
CA
1. Rango=Xmax -Xmin =15-1=14
2. Determinar el número de intervalos, por la regla de Sturges tenemos:
K∼
= 1 + 3.3 ∗ log(n) ∼
= 1 + 3.3 ∗ log(51) ∼
= 6.63 ⇒ tomamos K = 7
3. Determinar el tamaño del intervalo de clase (TIC):
Rango ∼ 14
T IC ∼
= = ⇒ tomamos T IC = 2
K 7
E
AD
4. Establecer los lı́mites de cada uno de los intervalos:

Lı́mite inferior del primer intervalo (LI1 )=Xmin =1
Lı́mite superior del primer intervalo (LS1 )=(LI1 )+TIC=1+2=3
Lı́mite inferior del segundo intervalo (LI2 )=(LS1 )=3
Lı́mite superior del segundo intervalo (LS2 )=(LI2 )+TIC=3+2=5
. . . y ası́ sucesivamente hasta completar los 7 intervalos.
5. Determinar las frecuencias absolutas (realizando el conteo, que consiste en asignar cada
-I I
observación al intervalo correspondiente).

22
20
6. Determinar las marcas de clase (o puntos medios de cada intervalo), las frecuencias
relativas y porcentajes.
Esta información queda resumida en la distribución de frecuencias de la Tabla 2.5.

Notas:
X : N°de veces que Marca Número de frecuencia Porcentaje

un cliente compra de clientes relativa de de clientes
en el supermercado clase (Xc ) (frecuencia) clientes ( %)
9
[1 − 3⟩ 2 9 51 18
14
[3 − 5⟩ 4 14 51 27
15
[5 − 7⟩ 6 15 51 29
5
[7 − 9⟩ 8 5 51 10
EP
3
[9 − 11⟩ 10 3 51 6
UD
3
[11 − 13⟩ 12 3 51 6
2
[13 − 15] 14 2 51 4
Total 51 1 100
A
Tabla 2.5: Distribución de frecuencias de datos agrupados considerando la marca de clase de la
IM
variable:Número de veces que un cliente compra en el Supermercado Plaza Lima.

S -L
Vale la pena aclarar que, dado un conjunto de datos, éstos se pueden agrupar de varias
PU
maneras, sin que se pueda decir en muchos casos que sólo una es la manera correcta.
M
Se podrı́a decir; sin embargo, que la mejor agrupación es aquella que se elabora de una
CA
forma rápida y que permite mostrar de una manera clara cómo se distribuyen los datos,
ya sea de forma tabular o gráfica.
Marca de clase (Xc ) es el valor equidistante entre el lı́mite inferior y superior de un

intervalo. Se calcula como la semisuma de los lı́mites de cada intervalo. La razón de su
existencia es que cuando se agrupan datos se pierde la “individualidad” de los mismos,
por lo que la marca de clase es un valor numérico representativo de los datos que están
dentro de un intervalo determinado. Otra utilidad de la marca de clase es que se emplea
para calcular medidas descriptivas para datos agrupados, como se verá más adelante
E
en este capı́tulo.
AD
Esta distribución de frecuencia proporciona un resumen de cómo se distribuye el número

de veces que un cliente compra en el supermercado. El resumen aporta más claridad y al
observar esta distribución de frecuencia, se puede concluir por ejemplo que:
El grupo más numeroso de clientes (15) compra en el supermercado 5 ó 6 veces durante
un periodo de dos semanas.
Aproximadamente el 74 % de los clientes acude al supermercado menos de 7 veces en

un periodo de dos semanas.
-I I
22
Aproximadamente el 10 % de los clientes acude al supermercado al menos 11 veces.

20
2.2.2.7. Histograma y polı́gono

La distribución de frecuencias de datos cuantitativos agrupados se suele representar
mediante un histograma y el correspondiente polı́gono. Estas gráficas nos aclaran más
cómo están distribuidos los datos analizados.
El histograma es una gráfica que expresa la frecuencia con que sucede cada clase o
intervalo. La forma que tenga el histograma permitirá formarse una idea no sólo de cómo
están distribuidos los datos, sino, en muchos casos, descubrir por qué causa los datos están
distribuidos de esa forma. En el eje de abscisas se identifica la variable de interés (X), ya sea
mediante los lı́mites de los intervalos o las marcas de clase. En el eje de ordenadas se expresan
las frecuencias de cada intervalo (o también la frecuencia relativa o los porcentajes). Cada
intervalo formará un rectángulo de altura igual a su frecuencia y base igual a la longitud del
intervalo.
El polı́gono de frecuencias se puede trazar fácilmente sobre el mismo histograma, uniendo
EP
los puntos medios de la parte superior de cada rectángulo, partiendo y finalizando en dos
UD
clases ficticias de frecuencia cero y de la misma longitud de clase. El polı́gono muestra la

variación de las frecuencias absolutas o relativas al pasar de un intervalo a otro.
El histograma y el polı́gono de frecuencias para el número de veces que un cliente
acude al supermercado se muestra en la figura 2.6.
A
IM
La figura 2.6 muestra el histograma y el polı́gono de frecuencias correspondientes al

ejemplo anterior. Considerando que las alturas de los rectángulos del histograma vienen dadas
-L
por las frecuencias de cada intervalo o clase (o también la frecuencia relativa o porcentajes), y
S
PU
que la base de estos rectángulos es el TIC (la longitud de intervalo o clase); se puede deducir
que el área que hay bajo el histograma, es exactamente igual que el área debajo del polı́gono.
M
CA
E
AD
Figura 2.6: Histograma y polı́gono de frecuencias del Número de veces que un cliente va al
supermercado.
-I I
22
20
2.2.2.8. Distribución acumulada: Ojiva o polı́gono acumulado “menor que”

Se le denomina ojiva o polı́gono de frecuencia acumulada “menor que”, a la
representación gráfica de la distribución de frecuencias acumuladas (o frecuencias relativas
acumuladas o porcentajes acumulados) expresando los lı́mites de clase en el eje de abscisas
y las frecuencias acumuladas (o frecuencias relativas acumuladas o porcentajes acumulados)

en el eje de ordenadas. La figura 2.7 muestra la ojiva del porcentaje acumulado de clientes
para la variable número de veces que un cliente va al superercado.
EP
UD
A
IM
-L
Figura 2.7: Ojiva del Número de veces que un cliente va al supermercado.

S
PU
Se puede concluir de la ojiva, que por ejemplo, el 84 % de los clientes del supermercado
M
asisten menos de 9 veces en un periodo de 2 semanas, etc.

CA
2.3. Estadı́stica descriptiva: Técnicas o medidas numéricas

En cualquier análisis o interpretación, se pueden usar muchas medidas descriptivas que
representan las propiedades de tendencia central, variación, posición y forma para resumir
las caracterı́sticas importantes de un conjunto de datos. Como hemos visto en el capı́tulo
1, si se calculan estas medidas descriptivas globales a partir de los datos de una muestra,
se denominan estadı́sticos; en cambio, si se calculan con los datos de una población se
denominan parámetros.
Estas medidas pueden ser como se adelantó en el párrafo anterior: de tendencia central,
E
AD
de variabilidad, de posición y de forma.

2.3.1. Medidas de tendencia central
Estas medidas se enfocan en las caracterı́sticas del centro de una distribución de datos.
Se busca obtener de alguna manera un número que permita ubicar la parte central de un
conjunto de datos o represente el valor central del conjunto. Las principales medidas de este
tipo son: La media o promedio aritmético, la mediana y la moda.
2.3.1.1. Media o promedio aritmético
-I I
La media (aritmética), por lo general, es la medida numérica más importante que se

22
utiliza para describir datos; comúnmente se le conoce como promedio. Si la media se calcula
20
con los datos de una muestra, la media se simboliza como x; y si se calcula con los datos de
una población, la media se simboliza con la letra griega µ.
La media se calcula con la suma de todas las observaciones en un conjunto de datos,
dividida entre el número de observaciones involucradas. Ası́, para una muestra que contiene
n observaciones: x1 , x2 , . . . , xn , la media aritmética puede escribirse como:
x1 + x2 + . . . + xn
x= (2.1)
n
esta expresión se puede simplificar usando la notación siguiente:
n
X
xi
i=1
x= (2.2)
n
EP
n
X
donde xi significa la suma de todos los valores o datos de la variable X.
UD
i=1
Ahora, dado el conjunto de los N datos de una población, la media se define como:
N
X
xi
A
i=1
µ= (2.3)
IM
N
-L
Por otro lado, si en una muestra, cuando a un conjunto de observaciones o valores:

S
x1 , x2 , . . . , xn de una variable X se les ha asignado un peso o ponderación :w1 , w2 , . . . , wn

PU
(que miden la importancia relativa de cada observación), entonces la media está dada por:
M
n
X
CA
wi x i
i=1
x= n (2.4)
X
wi
i=1
A esta última se le denomina media ponderada.

Si en lugar de contar con datos muestrales se tuviera los datos de una población, para
calcular la media ponderada se emplearı́a la misma fórmula.
Si se tienen k muestras de tamaños n1 , n2 , . . . , nk , con medias aritméticas x1 , x2 , . . . , xk
respectivamente; entonces la media aritmética del conjunto será:
E
AD
k
X
ni xi
i=1
x= k
(2.5)
X
ni
i=1
Algunas propiedades de la media aritmética son:
Al calcular la media se incluyen todos los datos u observaciones.

-I I
El valor de la media está siempre comprendido entre el mı́nimo y el máximo valor de

22
los datos.
20
La media tiene las mismas unidades de la variable de estudio.
Un conjunto de datos sólo tiene una media (un único valor). Se considera a la media
como un punto de equilibrio para un conjunto de datos.
La media es útil para comparar 2 o más poblaciones. Por ejemplo, para comparar el
rendimiento de los alumnos de una sección respecto a los de otra sección de la misma
asignatura.
La media es la única medida para la cual se cumple que la suma de las desviaciones de
cada valor con respecto a la media, siempre será cero. Es decir, en una muestra con n
observaciones: x1 , x2 , . . . , xn se cumplirı́a que:
n
X
(xi − x) = 0 (2.6)
EP
i=1
UD
Debido a que el cálculo de la media aritmética se basa en todas las observaciones,

cualquier valor extremo (grande o pequeño) afecta a la media aritmética. En ese caso,
la media aritmética es una representación distorsionada de la tendencia central del
conjunto por lo que en estas situaciones la media no es adecuada para describir dicha
A
IM
propiedad.
-L
Para ilustrar el cálculo de la media veamos los siguientes ejemplos:

S
PU
1. Se toma una muestra de 10 estudiantes matriculados en estadı́stica 1 y se les pregunta

M
por el número de horas que emplearon en estudiar la asignatura en la semana anterior

CA
a la práctica N°2 y los datos obtenidos son: 12, 7, 5, 16, 21, 5, 9, 3, 11, 14 ¿Cuál es el
tiempo promedio de estudio?
Empleando la expresión (2.2), el tiempo medio de estudio serı́a:
10
X
xi
i=1 12 + 7 + 5 + 16 + 21 + 5 + 9 + 3 + 11 + 14
x= = = 10.3 horas
10 10
es decir, en esta muestra, en promedio por alumno estudiaron 10.3 horas. Como se
E
aprecia en este caso, es posible que el valor del promedio no necesariamente coincida
AD
con el valor de alguno de los datos analizados. Por esta razón, es un error redondear el
valor de la media a un valor entero, pues eso harı́a perder la noción de centralidad que
intenta describir esta medida en ese conjunto de datos.
2. Los siete miembros de un equipo de atletismo tienen las marcas de tiempo (en minutos)
para una cierta carrera: 4,2; 4,3; 4,7; 4,9; 5,0; 5,1; 9,0. ¿Cuál es el tiempo medio?
Empleando la expresión (2.3), el tiempo medio serı́a:
7
X
-I I
xi
22
i=1 4.2 + 4.3 + 4.7 + 4.9 + 5.0 + 5.1 + 9.0

µ= = = 5.31 min.
20
7 7
3. En la sección 2.2.2.2 se elaboró la distribución de frecuencias para el número de palabras

leı́das en 15 segundos por una muestra de 120 disléxicos ¿Cuántas palabras leyeron en
promedio esa muestra de disléxicos?
Recordando la tabla de frecuencias tenemos:
X: N°de palabras leı́das 25 26 27 28 29 30

f: Número de disléxicos 56 24 16 12 10 2
Si se entiende que la frecuencia simplemente resume las veces que se repite una
determinada observación entonces, empleando la expresión (2.2), el número promedio
de palabras leı́das serı́a:
EP
120
X
xi
UD
i=1 25 ∗ 56 + 26 ∗ 24 + 27 ∗ 16 + 28 ∗ 12 + 29 ∗ 10 + 30 ∗ 2
x= = = 26.2 palabras
120 120
es decir, en esta muestra, en promedio se leyeron 26.2 palabras.

A
4. Evaluando el rendimiento de los alumnos matriculados en la asignatura de estadı́stica
IM
1, se tomó como referencia el semestre pasado en el cual hubieron dos secciones: A de

-L
52 alumnos y B de 42 alumnos. En la práctica 1 la sección A obtuvo en promedio 12.3

S
y la sección B obtuvo 14.6 ¿Cuál fue la nota promedio de las dos secciones en conjunto
PU
en la práctica 1?
M
Del problema tenemos que: n1 = 52, x1 = 12.3, n2 = 42, x2 = 14.6, luego empleando
CA
la expresión (2.5), la nota promedio de las dos secciones en conjunto serı́a:
2
X
ni xi
i=1 52 ∗ 12.3 + 42 ∗ 14.6
x= = = 13.33
X2 52 + 42
ni
i=1
2.3.1.2. Media para datos agrupados

E
Si los datos (asumiendo que son de una muestra) están agrupados en una tabla de
AD
frecuencias agrupada de k intervalos, entonces la media se define de la siguiente manera:
P
k
fc .xc
c=1
x= (2.7)
P
k
fc
c=1
donde: fc =frecuencia del intervalo “c” xc =Marca de clase del intervalo “c”
Para ilustrar el cálculo de la media con datos agrupados, lo haremos para el problema
-I I
visto en la sección 2.2.2.6 donde se elaboró la distribución de frecuencias agrupadas de la

22
variable X: número de veces que un cliente va al supermercado para una muestra de 51

20
clientes y que aparece en la Tabla 2.5. Con esa información nos preguntamos: ¿Cuántas veces
en promedio acuden los clientes al supermercado en el periodo de dos semanas?
Recordando la tabla de frecuencias agrupadas tenemos:
X : N°de veces que un cliente Marca de Número de clientes

compra en el supermercado clase (Xc ) (frecuencia)
[1 − 3⟩ 2 9
[3 − 5⟩ 4 14
[5 − 7⟩ 6 15
[7 − 9⟩ 8 5
[9 − 11⟩ 10 3
EP
[11 − 13⟩ 12 3
UD
[13 − 15] 14 2
Total 51
A
Empleando la expresión (2.7), el número medio de veces que un cliente acude al
IM
supermercado serı́a:
-L
P
k
S
fc .xc
PU
c=1 2 ∗ 9 + 4 ∗ 14 + 6 ∗ 15 + 8 ∗ 5 + 10 ∗ 3 + 12 ∗ 3 + 14 ∗ 2
x= = = 5.84 veces
P
k 51
M
fc
c=1
CA
2.3.1.3. Mediana
Una desventaja de la media es su sensibilidad a valores extremos, es decir una puntuación
excepcional puede afectarla de manera drástica. La mediana resuelve, en gran medida, esa
desventaja.
Dado un conjunto de datos ordenados (en forma creciente o decreciente), la mediana es
el dato o valor que ocupa la posición central del conjunto, es decir que a lo sumo, la mitad
de los valores de los datos están por debajo de ella y la otra mitad por arriba de ella.
E
En la definición anterior el término “a lo sumo”, es importante pues significa que dentro

AD
del conjunto de datos no puede existir más del 50 % de ellos que sean estrictamente menores
que la mediana ni más del 50 % de ellos que sean estrictamente mayores que la mediana, y
que por lo tanto la mediana está ubicada en una posición tal que por ninguno de los dos
lados se excede este porcentaje del 50 %.
Para calcular la mediana de un conjunto de datos no agrupados, se sigue el siguiente
procedimiento:
1. Ordenar los valores (en forma creciente o decreciente).

-I I
n
2. Calcular el “ı́ndice de posición”(i) de la mediana, haciendo: i =, donce n es el número
22
2
de datos del conjunto. El ı́ndice de posición es un valor que nos indica en dónde (en
20
cuál término) se encuentra la mediana. Si i no es entero, se redondea. El valor entero

inmediato mayor que i, indica la posición de la mediana, por lo tanto la mediana será el
término que ocupe dicha posición. Si el valor de i es entero, quiere decir que la mediana
está ubicada entre la posición i y la posición i + 1, por lo tanto la mediana será el
promedio de los valores de los datos ubicados en los lugares i e i + 1.
Algunas propiedades de la mediana son:
La mediana tiene las mismas unidades de la variable de estudio.
Un conjunto de datos sólo tiene una mediana.
La mediana no es afectada por valores extremos (pequeños o grandes). Esta propiedad

hace que la mediana sea una medida de tendencia central muy recomendable en aquellos
conjuntos de datos donde existen valores atı́picos, que pueden desvirtuar el uso de la
EP
media aritmética como promedio.

UD
Para ilustrar el cálculo de la mediana veamos los siguientes ejemplos:
1. Encuesta a 11 recién egresados del programa de administración y les pregunta sobre el

A
sueldo mensual inicial (en soles) que recibirán y obtiene los siguientes datos: 3540, 3550,
IM
3310, 3480, 3490, 3520, 3650, 3925, 3355, 3450, 3480. Calcule e interprete la mediana
-L
de dichos sueldos.
S
PU
Primero ordenamos los sueldos:

M
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3925
CA
11
Al tener 11 datos, calculamos el ı́ndice de posición de la mediana: i = = 5.5, como
2
“i” no es entero, se redondea, entonces i=6 e indica que la mediana será el dato que
ocupe dicha posición, entonces la mediana es 3490 soles. Eso quiere decir que a lo sumo
el 50 % de estos egresados gana menos de 3490 soles y a lo sumo el 50 % gana por
encima de esa cantidad.
2. Se toma una muestra de 12 personas y se les pregunta por su edad (años) y los datos
obtenidos son: 28,12,34,15,13,21,18,20,30,26,19,25 ¿Cuál es la mediana de estas edades?
E
Interprete.
AD
Primero ordenamos las edades:
12 13 15 18 19 20 21 25 26 28 30 34
12
Al tener 12 datos, calculamos el ı́ndice de posición de la mediana: i = = 6, como el
2
valor de “i” es entero, quiere decir que la mediana está ubicada entre la posición “6”
y la posición “7”, por lo tanto la mediana será el promedio de los valores de los datos
ubicados en los lugares “6” y “7”, es decir:
-I I
22
20 + 21
mediana = = 20.5
20
Eso quiere decir que a lo sumo el 50 % de estas personas tiene menos de 20.5 años y a
lo sumo el 50 % tiene más de 20.5 años.
3. En la sección 2.2.2.2 se elaboró la distribución de frecuencias para el número de palabras

leı́das en 15 segundos por una muestra de 120 disléxicos ¿Cuál es la mediana del número
de palabras leı́das por esa muestra de disléxicos?
Recordando la tabla de frecuencias tenemos:
X: N°de palabras leı́das 25 26 27 28 29 30

f: Número de disléxicos 56 24 16 12 10 2
Debemos tener claro que en la distribución elaborada, los datos ya están ordenados.
EP
Tampoco olvide que la frecuencia simplemente resume las veces que se repite una
UD
determinada observación. Al tener 120 datos, calculamos el ı́ndice de posición de la

120
mediana: i = = 60, como el valor de “i” es entero, quiere decir que la mediana
2
está ubicada entre la posición “60” y la posición “61”, por lo tanto la mediana será el
promedio de los valores de los datos ubicados en los lugares “60” y “61”, es decir:
A
IM
26 + 26
mediana = = 26
-L
2
S
PU
Eso quiere decir que a lo sumo el 50 % de estas personas disléxicas leyeron menos de
26 palabras y a lo sumo el 50 % leyó más de 26 palabras.
M
CA
2.3.1.4. Mediana para datos agrupados

Si los datos están agrupados en una tabla de frecuencias agrupada de k intervalos, entonces
la mediana se define de la siguiente manera:
n 
− fA
M ediana = l +  2 ∗i (2.8)
f
donde:
E
l=lı́mite inferior del intervalo que contiene a la mediana

AD
n=número total de datos o sumatoria de las frecuencias

f=frecuencia del intervalo que contiene a la mediana
fA =frecuencia acumulada hasta el intervalo anterior al que contiene a la mediana
i=ancho del intervalo en que se encuentra la mediana(TIC)
Para ilustrar el cálculo de la mediana con datos agrupados, lo haremos para el problema
visto en la sección 2.2.2.6 donde se elaboró la distribución de frecuencias agrupadas de la
variable X: número de veces que un cliente va al supermercado para una muestra de 51
-I I
clientes y que aparece en la Tabla 2.5. Con esa información nos preguntamos: ¿Cuál es la
22
mediana del número de veces que los clientes acuden al supermercado?

20

Debemos tener claro que en la distribución elaborada, los datos ya están ordenados. Al
51
tener 51 datos, calculamos el ı́ndice de posición de la mediana: i = = 25.5, como “i” no es
2
entero, se redondea, entonces i=26 e indica que la mediana será el dato o término que ocupa
X : N°de veces que un cliente Marca de Número de clientes

[1 − 3⟩ 2 9
[3 − 5⟩ 4 14
[5 − 7⟩ 6 15
[7 − 9⟩ 8 5
[9 − 11⟩ 10 3
EP
[11 − 13⟩ 12 3
UD
[13 − 15] 14 2
Total 51
A
dicha posición. Si entendemos que la frecuencia indica la cantidad de datos que están en un
IM
intervalo entonces por la posición de la mediana se deduce que ella está ubicada en el tercer
-L
intervalo: [5 − 7⟩. Ahora sabiendo en qué intervalo está ubicada la mediana empleamos la
S
expresión (2.8) para hallarla:

PU
n   
51
M
− fA − 23
M ediana = l +  2 ∗i=5+
 2

 ∗ 2 = 5.33 (2.9)
CA
f 15
Eso quiere decir que a lo sumo el 50 % de estos clientes van al supermercado menos de
5.33 veces y a lo sumo el 50 % acude más de 5.33 veces.
2.3.1.5. Moda
La moda de un conjunto de datos es el valor que se presenta con mayor frecuencia. Cuando
dos valores se presentan con la misma frecuencia y ésta es la más alta, ambos valores son
modas, por lo que el conjunto de datos es bimodal. Cuando más de dos valores se presentan
E
con la misma frecuencia y ésta es la más alta, esos valores son modas, por lo que el conjunto de
AD
datos es multimodal. Cuando ningún valor se repite (o se destaca por su mayor frecuencia),
se dice que no hay moda.
Algunas propiedades de la moda son:
La moda tiene las mismas unidades de la variable de estudio.
No es afectada por valores extremos.
Puede ser determinada para datos numéricos o cualitativos.

-I I
Para Datos agrupados: La moda es el punto medio o marca de clase del intervalo con
22
mayor frecuencia.
20
Para ilustrar el cálculo de la moda veamos los siguientes ejemplos:
1. Encuesta a 11 recién egresados del programa de administración y les pregunta sobre

el sueldo mensual inicial (en soles) que recibirán y obtiene los siguientes datos: 3540,
3550, 3310, 3480, 3490, 3520, 3650, 3925, 3355, 3450, 3480. Calcule e interprete la moda
de dichos sueldos.
El sueldo que más se repite es 3480 soles (2 veces), por tanto esa es la moda, es decir,
el sueldo más frecuente de esos egresados es 3480 soles.
2. Se toma una muestra de 12 personas y se les pregunta por su edad (años) y los datos
obtenidos son: 28,12,34,15,13,21,18,20,30,26,19,25 ¿Cuál es la moda de estas edades?
Como no hay edad que se repita, en este conjunto no hay moda.
EP
3. Para ilustrar el cálculo de la moda con datos agrupados, lo haremos para el problema
visto en la sección 2.2.2.6 donde se elaboró la distribución de frecuencias agrupadas de
UD
la variable X: número de veces que un cliente va al supermercado para una muestra de

51 clientes y que aparece en la Tabla 2.5. Con esa información nos preguntamos: ¿Cuál
es la moda del número de veces que los clientes acuden al supermercado? Interprete.
A
IM
X : N°de veces que un cliente

-L
Marca de Número de clientes

S

PU
[1 − 3⟩ 2 9
M
[3 − 5⟩ 4 14
CA
[5 − 7⟩ 6 15
[7 − 9⟩ 8 5
[9 − 11⟩ 10 3
[11 − 13⟩ 12 3
[13 − 15] 14 2
Total 51
E
Para datos agrupados, la moda es la marca de clase del intervalo con mayor frecuencia,
AD
en este caso el intervalo con mayor frecuencia es [5 − 7⟩ y su marca de clase es 6, por

tanto la moda es 6 veces, es decir, en promedio, el número de veces más frecuente de
asistencia de estos clientes al supermercado es 6.
2.3.2. Medidas de variabilidad

Para realizar una descripción de una distribución de datos no es suficiente contar con
las medidas de tendencia central, es necesario también obtener información acerca de la
dispersión de los datos, es decir que las medidas de variabilidad permiten conocer el grado
-I I
de homogeneidad o heterogeneidad de un conjunto de datos, evaluando la dispersión que

22
presentan entre ellos.

20
Estas medidas nos proporcionan información adicional que nos permite juzgar la
confiabilidad de nuestra medida de tendencia central. Si los datos están muy dispersos la
posición central es menos representativa de los datos, como un todo, que cuando estos se
agrupan más estrechamente alrededor de la media.
En muchas situaciones es importante conocer la variabilidad de los datos. Por ejemplo,

entre dos procesos de elaboración de planchas de acero del mismo espesor, es más eficiente
aquél cuyas medidas de espesor tienen una menor variabilidad. Igualmente, entre dos negocios
con similar promedio de ganancias, quien tiene aversión al riesgo preferirá aquél que tenga
menor variabilidad, pues ası́ puede evitar una posible ganancia muy baja o negativa.
Algunas de las medidas de variabilidad más usuales son:
2.3.2.1. Rango, amplitud o recorrido
Dado un conjunto de datos, el rango (R) es la diferencia entre el mayor y el menor, es
EP
decir: R = Xmax − Xmin . Se dice que el rango mide la dispersión total en el conjunto de
datos.
UD
Es una medida que puede ser muy útil, dada la facilidad con que se calcula; pero en
ciertas ocasiones puede dar una idea equivocada de la variabilidad de los datos, ya que no
toma en cuenta cómo se distribuyen los datos entre el valor más grande y más pequeño; por
A
ejemplo, cuando uno de los datos difiere significativamente de los demás (se ve influido por
IM
los valores extremos).

-L
Con los datos de la encuesta a 11 recién egresados del programa de administración donde
S
les preguntó sobre el sueldo mensual inicial (en soles) que recibieron y obtuvo los siguientes
PU
datos: 3540, 3550, 3310, 3480, 3490, 3520, 3650, 3925, 3355, 3450, 3480. El rango de sueldos
M
serı́a: R = Xmax − Xmin =3925-3310=615 soles.

CA
Suponga que uno de los recién egresados haya tenido $10 000 como sueldo inicial, entonces
el rango será: 10 000-3310 =6690 en lugar de 615. Un valor ası́ no serı́a muy descriptivo de la
variabilidad de los datos ya que 10 de los 11 sueldos se encuentran entre 3310 y 3650 soles.
Las descripciones más comprensibles de la dispersión son aquellas que tratan con la
desviación promedio con respecto a alguna medida de tendencia central. Veremos dos medidas
que nos dan una distancia promedio con respecto a la media de la distribución: la varianza
y la desviación estándar.
2.3.2.2. Varianza y desviación estándar o tı́pica
E
La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está
AD
basada en la diferencia entre el valor de cada observación (xi ) y la media. A la diferencia

entre cada valor xi y la media (x cuando se trata de una muestra, µ cuando se trata de
una población) se le llama desviación respecto de la media. Si se trata de una muestra,
una desviación respecto de la media se escribe (xi − x), y si se trata de una población se
escribe (xi − µ). Para calcular la varianza, estas desviaciones respecto de la media se elevan
al cuadrado.
Si los datos son de una población, el promedio de estas desviaciones elevadas al cuadrado
-I I
es la varianza poblacional. La varianza poblacional se denota como σ 2 . En una población en

22
la que hay N observaciones y la media poblacional es µ, la varianza poblacional se define

20
como sigue:
P
N
(xi − µ)2
i=1
σ2 = (2.10)
N
En la mayor parte de las aplicaciones de la estadı́stica, los datos a analizar provienen
de una muestra. Cuando se calcula la varianza muestral, lo que interesa es emplearla para
estimar la varianza poblacional σ 2 . Aunque una explicación detallada está más allá del alcance
de estos apuntes, es posible demostrar que si la suma de los cuadrados de las desviaciones
respecto de la media se divide entre n − 1, en lugar de entre n, la varianza muestral que se
obtiene constituye un estimador no sesgado de la varianza poblacional (Anderson y Sweeney,
2008). Por esta razón, la varianza muestral, que se denota por s2 , se define como sigue:
P
n
(xi − x)2
2 i=1
s = (2.11)
EP
n−1
UD
Las unidades de la varianza son las unidades de la variable en estudio, pero elevadas al
cuadrado (pesos al cuadrado, unidades al cuadrado, etc.) lo que hace que no sean claras o
fáciles de interpretar. Ante ese inconveniente surge la desviación estándar.
La desviación estándar se define como la raı́z cuadrada positiva de la varianza.
A
Continuando con la notación adoptada para la varianza muestral y para la varianza
IM
poblacional, se emplea s para denotar la desviación estándar muestral y σ para denotar

-L
la desviación estándar poblacional. La desviación estándar se obtiene de la varianza como

S
PU
sigue: v
uN
uP
M
u 2
t i=1 (xi − µ)
CA
Desviación estándar poblacional = σ = (2.12)

N
v
uP
u n
u (x − x)2
t i=1 i
Desviación estándar muestral = s = (2.13)
n−1
La desviación estándar es más fácil de interpretar que la varianza debido a que la
desviación estándar se expresa en las mismas unidades de la variable o que los datos y
su interpretación es “en promedio los valores se alejan de la media en . . . unidades”
(el alumno debe ser capaz de adaptar esta expresión al escenario que enfrenta).
E
Para ilustrar el cálculo de la varianza y la desviación estándar, lo haremos con el problema

AD
donde se encuesta a 11 recién egresados del programa de administración y se les pregunta

sobre el sueldo mensual inicial (en soles) que reciben y donde se obtuvieron los siguientes
datos: 3540, 3550, 3310, 3480, 3490, 3520, 3650, 3925, 3355, 3450, 3480.
Tratándose de una muestra calculamos la media empleando la expresión (2.2) y tenemos:
3540 + 3550 + . . . + 3480

x= = 3522.73 soles
11
Ahora para calcular la varianza se emplea la expresión (2.11):

-I I
22
(3540 − 3522.73)2 + . . . + (3480 − 3522.73)2 262468.18

s2 = = = 26246.82 soles2
20
11 − 1 10
√
Luego la desviación estándar será: s = 26246.82 = 162 soles, es decir, que en promedio
lo que se aleja o desvı́a algunos de esos sueldos respecto del sueldo promedio de la muestra
es 162 soles.
2.3.2.3. Varianza y desviación estándar o tı́pica para datos agrupados

Si los datos (asumiendo que son de una muestra) están agrupados en una tabla de
frecuencias agrupada de k intervalos, entonces la varianza se define de la siguiente manera:
P
k
(xc − x)2 .fc
c=1
s2 = (2.14)
n−1
donde:
fc =frecuencia del intervalo respectivo xc =Marca de clase del intervalo respectivo
EP
n=número total de datos x=media muestral

UD
La desviación estándar “s” es la raı́z cuadrada positiva de la varianza.

En caso se trabaje con datos de una población deberá hacer los cambios respectivos según
se explicó en la sección 2.3.2.2.
Para ilustrar el cálculo de la varianza y desviación estándar con datos agrupados, lo
A
haremos para el problema visto en la sección 2.2.2.6 donde se elaboró la distribución de
IM
frecuencias agrupadas de la variable X: número de veces que un cliente va al supermercado

-L
para una muestra de 51 clientes y que aparece en la Tabla 2.5.

S
PU
Empleando los valores de dicha Tabla, primero se calcula la media de los datos agrupados
(ver sección 2.3.1.2), que resultó ser: x = 5.84 veces. Ahora aplicando la expresión (2.14)
M
calculamos la varianza:
CA
(2 − 5.84)2 ∗ 9 + . . . + (14 − 5.84)2 ∗ 2 502.7456

s2 = = = 10.06 veces2
51 − 1 50
√
Ası́ la desviación estándar será: s = 10.06 = 3.17 veces, es decir, que en promedio lo que
se aleja o desvı́a el número de veces que alguno de esos clientes va al supermercado respecto
del número de veces promedio es 3.17.
La desviación estándar encuentra mayor utilidad cuando se le emplea para comparar el
grado de dispersión de dos o más conjuntos de datos, ası́ el que tiene la mayor desviación
estándar, tiene la mayor dispersión o variabilidad siempre y cuando los conjuntos de datos
E
AD
tengan iguales unidades de medida y medias aritméticas iguales o similares.

Pero si los conjuntos de datos a comparar tienen diferentes unidades de medida y/o
medias aritméticas diferentes, entonces deberı́amos calcular el coeficiente de variación para
poder comparar las variabilidades.
2.3.2.4. Coeficiente de variación
Es una medida relativa de variabilidad que no presenta unidades y que expresa el número
de veces que la desviación estandar contiene a la media. Generalmente se expresa como
-I I
porcentaje. Esta medida estadı́stica se utiliza para comparar conjuntos de datos que tienen
diferentes unidades o cuyos valores medios son muy diferentes.
22
20
Según se trate de una muestra o población, el coeficiente de variación será:
s σ
CV = ∗ 100 % : muestral CV = ∗ 100 % : poblacional (2.15)
x µ
Para ilustrar el cálculo del coeficiente de variación, suponga que el gerente de operaciones
de un servicio de paqueterı́a desea adquirir una nueva flotilla de vehı́culos. Cuando los
paquetes se guardan con eficiencia en el interior de los vehı́culos durante la preparación de
las entregas, se deben considerar dos restricciones principales: el peso (en libras) y el volumen
(en pies cúbicos) de cada paquete. Ahora suponga que en una muestra de 200 paquetes, el
peso promedio es 26,0 libras con una desviación estándar de 3.9 libras. Además, suponga que
el volumen promedio de cada paquete es 8.8 pies cúbicos con una desviación estándar de 2.2
pies cúbicos. ¿Cómo se puede comparar la variación del peso y el volumen?
Como las unidades de medida difieren para las restricciones de peso y volumen, si el
EP
gerente de operaciones desea comparar las fluctuaciones en estas medidas, debe considerar la
UD
variabilidad relativa en ambos tipos de medidas. Para el peso, el coeficiente de variación es

3.9 2.2
CVp = ∗100 % = 15 %; para el volumen, el coeficiente de variación es CVv = ∗100 % =
26 8.8
25 %. Entonces, con relación a la media, el volumen de un paquete es mucho más variable
que su peso.
A
IM
Veamos otro ejemplo: un inversionista potencial piensa adquirir acciones en una de dos
compañı́as, A o B, listadas en la Bolsa de Valores de Lima. Si ninguna de las compañı́as
-L
ofrece dividendos a sus clientes y ambas tienen igual clasificación en términos de crecimiento
S
PU
potencial, el posible inversionista quizá considere la variabilidad de ambas acciones para

ayudar en la decisión de inversión. Ahora suponga que cada acción en la compañı́a A ha
M
promediado $ 50 en el último año, con una desviación estándar de $ 10. Además, suponga
CA
que durante el mismo periodo el precio promedio de las acciones en la compañı́a B fue de $ 12
con una desviación estándar de $4. ¿Cómo puede determinar el inversionista cuáles acciones
son más variables?
En términos de las desviaciones estándar, el precio de las acciones de A parece más
variable que el de las acciones de B. Sin embargo como los precios promedios por acción de
las dos compañı́as son tan diferentes, serı́a más conveniente que el inversionista potencial
considerara la variabilidad en precio respecto al promedio a fin de examinar la relación:
variabilidad / estabilidad de ambas acciones. Para la compañı́a, el coeficiente de variación
E
$10
es CVA = ∗ 100 % = 20 % y para la compañı́a B, el coeficiente de variación es
AD
$50
$4
CVB = ∗ 100 % = 33.3 %. Entonces, en relación con la media, el precio de las acciones B
$12
es mucho más variable que el de las acciones A.
Algunas propiedades del coeficiente de variación son:
No aplicable cuando la distribución tiene media cero..
Se afecta su valor cuando se suma una constante K a cada observación de un conjunto

de datos.
-I I
22
No cambia de valor cuando se multiplica por una constante K a cada una de las
20
observaciones.
Según el grado de dispersión una distribución de datos puede calificarse como:

Coeficiente de variabilidad (en %) Calificación

0 Completamente homogénea
0< CV <10 Muy homogénea
10≤ CV <15 Regularmente homogénea
15≤ CV <20 Regularmente variable
20≤ CV ≤ 25 variable
CV>25 muy variable
EP
UD
2.3.3. Teorema de Chebyshev

Este teorema es un concepto útil para comprender o entender el valor de la desviación
estándar de un conjunto de datos. El teorema de Chebyshev, desarrollado por el
matemático ruso Chebyshev, se define como sigue: la proporción mı́nima de los valores de
A
IM
un conjunto que se encuentran dentro de k desviaciones estándar con respecto a la media del
conjunto es igual a:
-L
1
S
1− , (2.16)
k2
PU
donde k es cualquier positivo mayor que 1. Para ilustrar el uso del teorema de Chebyshev,
M
suponga que en una muestra de personas, la edad promedio es 30 años y la desviación estándar
CA
es 5 años. ¿Cuántas personas como mı́nimo tienen entre 20 y 40 años?, ¿y entre 22 y 38 años?
20 − 30
En el caso del intervalo de 20 a 40 se observa que: = −2, es decir 20 está dos
5
40 − 30
desviaciones estándar debajo de la media y que = 2, es decir, 40 está dos desviaciones
5
estándar por encima de la media, por lo tanto ese intervalo representa 2 desviaciones estándar
con respecto de la media, es decir, k=2. Entonces mediante el teorema de Chebyshev se
encuentra que:
1 1
1− = 1 − 2 = 0.75,
k2 2
E
AD
esto quiere decir, que de ese grupo de personas, por lo menos el 75 % tienen entre 20 y 40
años.
22 − 30
En el caso del intervalo de 22 a 38 se observa que: = −1.6, es decir 22 está
5
38 − 30
1.6 desviaciones estándar debajo de la media y que = 1.6, es decir, 38 está 1.6
5
desviaciones estándar por encima de la media, por lo tanto ese intervalo representa 1.6
desviaciones estándar con respecto de la media, es decir, k=1.6. Entonces mediante el teorema
de Chebyshev se encuentra que:
-I I
1 1
1− =1− = 0.61,
22
k 2 1.62
20
esto quiere decir, que de ese grupo de personas, por lo menos el 61 % tienen entre 22 y 38
años.
2.3.4. Medidas de forma

Describen la forma general de la distribución de un conjunto de datos. En concreto se
intentan describir dos caracterı́sticas de la misma: la asimetrı́a (sesgo) y el apuntamiento (o
curtosis).
2.3.4.1. Coeficiente de asimetrı́a
Mide si el conjunto de datos está más disperso por encima de la media o por debajo de
ella. Si hay más datos dispersos por encima de la media, el coeficiente de asimetrı́a es positivo.
Si hay más datos dispersos por debajo de la media, el coeficiente de asimetrı́a es negativo. Si
EP
los datos están igualmente dispersos por encima y por debajo de la media, el coeficiente de
UD
asimetrı́a es igual a cero.

El coeficiente de asimetrı́a (en una muestra) puede calcularse mediante la siguiente
fórmula: 3
X n
n xi − x
Sk = (2.17)
A
(n − 1) (n − 2) s
IM
i=1
Otra forma usual para medir la asimetrı́a es mediante es el coeficiente de asimetrı́a de

-L
Pearson:
S
PU
3 ∗ (media − mediana)
Sk = (2.18)
M
s
CA
Con esta última expresión se busca describir la forma como se distribuyen los datos de un
conjunto, comparando la media y la mediana. Si ambas medidas son iguales, por lo general
se considera que los datos son simétricos (o con sesgo cero), por el contrario, los datos o
su distribución es asimétrica o sesgada, es decir: si la media excede a la mediana, los datos
se describen como sesgados a la derecha, o con sesgo positivo (el coeficiente de asimetrı́a es
positivo). Si la mediana excede a la media, los datos suelen llamarse sesgados a la izquierda,
o con sesgo negativo (el coeficiente de asimetrı́a es negativo).
El sesgo positivo surge cuando la media aumenta debido a algunos valores grandes y poco
usuales; el sesgo negativo ocurre cuando la media se reduce debido a algunos valores muy
E
AD
pequeños. Los datos son simétricos cuando en realidad no hay valores extremos en ninguna
dirección, de tal manera que la presencia de valores grandes y pequeños se equilibran.
La figura 2.8 muestra la forma de tres conjuntos de datos. Los datos en el cuadro (a) tienen
sesgo negativo o a la izquierda. Se observa una cola larga o distorsión hacia la izquierda,
causada por valores en extremo pequeños. Estos valores tan pequeños jalan a la media hacia
abajo y resulta menor que la mediana. Los datos en el cuadro (b) son simétricos; cada mitad
de la curva es la imagen de espejo de la otra mitad. Los valores grandes y pequeños se
compensan y la media es igual a la mediana. Los datos en el cuadro (c) tienen un sesgo
-I I
positivo o a la derecha. Se observa una cola larga o distorsión hacia la derecha, causada por
22
valores muy grandes. Estos valores en extremo grandes, jalan la media hacia arriba y resulta
20
mayor que la mediana.

Algunas propiedades del coeficiente de asimetrı́a son:
No depende de las unidades de medida de las variables, por tanto, no tiene unidades.
Figura 2.8: Distribuciones con diferentes asimetrı́as o sesgos.

EP
Es invariante ante el cambio de escalas.

UD
Para ilustrar el cálculo e interpretación del coeficiente de asimetrı́a, supongamos que una
muestra de digitadoras de textos reveló que su rapidez media de tecleo es de 87 palabras por
minutos, con una mediana de 73. La desviación estándar es de 16.9 palabras por minuto.
A
Para calcular el coeficiente de asimetrı́a empleamos la expresión (2.18) y tenemos:
IM
3 ∗ (media − mediana) 3 ∗ (87 − 73)

-L
Sk = = = 2.49
s 16.9
S
PU
es decir, como teóricamente el coeficiente de asimetrı́a generalmente se encuentra entre

-3 y +3, el valor de 2.49 indica un grado importante de asimetrı́a con sesgo positivo en la
M
distribución de la rapidez de tecleo. Algunas operadoras muy rápidas hacen que la media sea
CA
mayor que la mediana.

2.3.4.2. Coeficiente de curtosis
Analiza el grado de concentración que presentan los valores alrededor de la zona central
de la distribución es decir, estudia la distribución de frecuencias en la “zona central”. La
mayor o menor concentración de frecuencias alrededor de la media y en la zona central de
la distribución, dará lugar a una distribución más o menos apuntada. Ası́ es por lo que a la
curtosis también se le llama apuntamiento.
Se estudia la curtosis de una distribución, comparándola con una distribución “tipo”, que
E
AD
tomaremos como referencia. Es la llamada distribución normal o campana de Gauss.

En la figura 2.9 podemos apreciar que: si el valor de la curtosis es positivo, se dice
que los datos tienen una distribución leptocúrtica (es más apuntada o puntiaguda que la
distribución normal); en caso contrario, si la curtosis es negativa, se dice que los datos tienen
una distribución platicúrtica (es menos apuntada o puntiaguda que la distribución normal).
Si la curtosis es cero, entonces los datos se distribuyen siguiendo una distribución normal, y
se dice que en este caso la distribución es mesocúrtica.
El coeficiente de curtosis (en una muestra) puede calcularse mediante la siguiente fórmula:
-I I
n
X
22
(xi − x)4
20
i=1
k= −3 (2.19)
n ∗ s4
Algunas propiedades del coeficiente de curtosis son:
No depende de las unidades de medida de las variables, por tanto, no tiene unidades.
Figura 2.9: Distribuciones con diferentes grados de curtosis.

EP
UD
Se aplica a distribuciones unimodales, que sean simétricas o ligeramente simétricas.
2.3.5. Medidas de posición A

Establecen una relación entre un valor de la variable y la ubicación o localización que
IM
este valor tiene dentro del conjunto analizado o distribución de valores de la variable.
-L
2.3.5.1. Cuartiles y percentiles

S
PU
Los cuartiles son las medidas de posición “no central” que se utilizan con mayor
frecuencia y se emplean sobre todo para resumir o describir las propiedades de conjuntos
M
grandes de datos numéricos. Mientras que la mediana es un valor que parte el arreglo ordenado
CA
por la mitad (a lo sumo 50.0 % de las observaciones son menores, y 50.0 % son mayores), los
cuartiles son medidas descriptivas que parten los datos ordenados en cuatro partes.
Entonces, dado un conjunto de datos ordenados en forma ascendente, los cuartiles son
los valores que dividen en cuatro partes iguales al conjunto.
El primer cuartil, Q1 (o 25 % percentil) es un valor tal que, a lo sumo, la cuarta parte
de los datos es menor que Q1 , y, a lo sumo, las tres cuartas partes son mayores. El segundo
cuartil, Q2 , (o 50 % percentil) coincide con la mediana. El tercer cuartil, Q3 , (o 75 % percentil)
es un valor tal que, a lo sumo, las tres cuartas partes de los datos son menores que Q3 , y, a
E
lo sumo, la cuarta parte es mayor.

AD
Los percentiles de un conjunto de datos ordenado dividen al conjunto en cien partes

iguales. Ası́ como hay 3 cuartiles que separan un conjunto de datos en cuatro partes iguales,
también se tienen 99 percentiles, que se denotan como: P1 , P2 , . . . , P99 , los cuales separan los
datos ordenados en 100 grupos, con aproximadamente el 1 % de los valores en cada grupo.
Los cuartiles y percentiles son ejemplos de cuantiles o fractiles, que dividen los datos en
grupos con aproximadamente el mismo número de valores en cada grupo (Triola, 2018).
2.3.5.2. Cálculo de los percentiles (cuartiles) para datos no agrupados.
-I I
No hay un acuerdo universal sobre un procedimiento para encontrar cuartiles, tampoco

22
existe un solo procedimiento para calcular percentiles, y las diferentes técnicas a menudo dan
20
resultados diferentes. Si utiliza una calculadora o un software que incluyan cuartiles, puede
obtener resultados que difieran un poco de las respuestas obtenidas utilizando la forma con
que se procederá en este texto.
El procedimiento de determinación de percentiles (cuartiles) será de la siguiente manera:
1. Ordenar los datos de manera ascendente.

p
2. Calcular el siguiente ı́ndice de posición: i = ∗ n, en donde p es el percentil de
100
interés y n es la cantidad de datos.
Si i no es entero, se redondea. El valor entero inmediato mayor que i, indica la

posición del p − ésimo percentil.
Si el valor de i es entero, el p − ésimo percentil es el promedio de los valores de
los datos ubicados en los lugares i e i + 1.
EP
p
Como los cuartiles son percentiles especı́ficos para calcularlos hallaremos: i = ∗n ,
100
UD
teniendo en cuenta que para el primer cuartil, Q1 , (o 25 % percentil), p=25; y para el tercer
cuartil, Q3 , (o 75 % percentil), p=75.
Para ilustrar el cálculo e interpretación de los cuartiles suponga que tenemos el número de
rifas que han vendido 10 alumnos: 19,10,17,28,15,27,12,16,26,23. Para hallar los cuartiles de
A
IM
este conjunto de datos seguimos el procedimiento explicado lı́neas arriba. Primero debemos
ordenarlos:
S -L
10,12,15,16,17,19,23,26,27,28.
PU
M
Hallamos el ı́ndice de posición

del primer cuartil o sea del percentil 25 (p = 25), entonces:
p 25
CA
i= ∗n = ∗ 10 = 2.5, como el valor de i no es entero, entonces se redondea

100 100
al valor entero inmediato mayor: i = 3, es decir, el percentil 25 o primer cuartil, es el valor
ubicado en la posición i = 3, entonces: Q1 = 15 rifas, es decir, que a lo sumo el 25 % de estas
personas vendió menos de 15 rifas y el 75 % vendió por encima de esa cantidad.
Hallamos el ı́ndice de posición del segundo cuartil (la mediana) o sea del percentil 50
(p = 50), entonces:
p 50
i = ∗n = ∗ 10 = 5, como el valor de i es entero, el percentil 50 o la
100 100
mediana, es el promedio de los valores ubicados en los lugares i = 5 e i + 1 = 6, entonces:
17 + 19
E
Q2 = = 18 rifas, es decir, que la mitad de estos alumnos vendió menos de 18 rifas y

AD
2
el 50 % vendió por encima de esa cantidad.
Hallamos el ı́ndice
de posición
del tercer cuartil o sea del percentil 75 (p = 75), entonces:
p 75
100 100
al valor entero inmediato mayor: i = 8, es decir, el percentil 75 o tercer cuartil, es el valor
ubicado en la posición i = 8, entonces: Q3 = 26 rifas, es decir, que a lo sumo el 75 % de estas
personas vendió menos de 26 rifas y el 25 % vendió por encima de esa cantidad.
Veamos otro ejemplo para el cálculo e interpretación de los cuartiles, suponga que tenemos
-I I
las edades de 12 personas: 28,12,34,15,13,21,18,20,30,26,19,25. Para hallar los cuartiles de

22
este conjunto de edades seguimos el procedimiento explicado lı́neas arriba. Primero debemos
20
ordenar los datos:
12,13,15,18,19,20,21,25,26,28,30,34
Hallamos el ı́ndice de posición del primer cuartil o sea del percentil 25 (p = 25), entonces:
p
25
i= ∗n = ∗ 12 = 3, como el valor de i es entero, el percentil 25 o primer
100 100
cuartil, es el promedio de las edades ubicadas en los lugares i = 3 e i + 1 = 4, entonces:
15 + 18
Q1 = = 16.5 años, es decir, que el 25 % de estas personas tiene menos de 16.5 años
2
y el 75 % tiene una edad superior.
Hallamos el ı́ndice de posición del segundo cuartil (la mediana) o sea del percentil 50
(p = 50), entonces:
p 50
i = ∗n = ∗ 12 = 6, como el valor de i es entero, el percentil 50 o la
100 100
mediana, es el promedio de las edades ubicadas en los lugares i = 6 e i + 1 = 7, entonces:
EP
20 + 21
Q2 = = 20.5 años, es decir, que la mitad de estas personas tiene menos de 20.5 años
2
UD
y el 50 % tiene una edad superior.

Hallamos el ı́ndicede posición
del tercer cuartil o sea del percentil 75 (p = 75), entonces:
p 75
i= ∗n = ∗ 12 = 9, como el valor de i es entero, el percentil 75 o tercer
100 100
A
cuartil, es el promedio de las edades ubicadas en los lugares i = 9 e i + 1 = 10, entonces:
26 + 28
IM
Q3 = = 27 años, es decir, que el 75 % de estas personas tiene menos de 27 años y el

2
-L
25 % tiene una edad superior.

S
2.3.5.3. Cálculo de los percentiles y cuartiles para datos agrupados

PU
(Se sugiere revisar Agurto y Alvarado, 2009, capı́tulo 2, pp. 51,54).

M
CA
2.3.5.4. Diagrama de caja-bigotes

Este diagrama representa una forma del análisis exploratorio de un conjunto de datos cuyo
enfoque está basado en el denominado resumen de cinco números, el cual está constituı́do
por: el mı́nimo valor, el máximo valor, el primer cuartil, el segundo cuartil (mediana) y el
tercer cuartil.
Mediante este diagrama se visualiza fácilmente cómo están distribuidos los datos de un
conjunto.
Dado un conjunto de datos se siguen los siguientes pasos para construir un diagrama
caja-bigotes:
E
AD
1. Definir el resumen de cinco números del conjunto, es decir, identificar el valor mı́nimo,
el máximo y calcular los tres cuartiles (Q1 , Q2 , Q3 ).
2. Se dibuja una caja cuyos extremos se localicen en el primer y tercer cuartil. Esto
significa que la caja contiene el 50 % de los datos centrales.
3. En el punto dónde se localiza la mediana ( Q2 ) se traza una lı́nea horizontal o vertical

según se represente la caja en posición vertical u horizontal respectivamente. (Si se
-I I
quisiera comparar dos poblaciones a veces también se representa la media dentro de la

22
caja.)
20
4. Trazar las lı́neas denominadas bigotes. Si dibujáramos la caja horizontalmente,

entonces el bigote inferior (contiene el 25 % inferior de los datos) va desde el extremo
izquierdo de la caja hasta el mı́nimo valor y el bigote superior (contiene el 25 % superior
de los datos) va desde el extremo derecho de la caja hasta el máximo valor del conjunto
de datos.
Luego de dibujar el diagrama de caja-bigotes podemos identificar qué datos del conjunto
analizado son atı́picos. Para saberlo se sigue el siguiente proceso:
1. Calcular el rango intercuartı́lico: RIC = Q3 − Q1 .
2. Calcular 1.5*RIC.
3. Calcular Q1 − 1.5 ∗ RIC y Q3 + 1.5 ∗ RIC

EP
UD
4. Los datos que sean menores que Q1 − 1.5 ∗ RIC y mayores que Q3 + 1.5 ∗ RIC, se
consideran observaciones atı́picas.
Para ilustrar la construcción de un diagrama de caja-bigote y la detección de datos atı́picos

A
de un conjunto supongamos que se ha recolectado la estatura (en cm) de 15 alumnos de una
IM
determinada asignatura: 172,178,179,150,169,171,172,181,182,183,175,176,177,184,184.

-L
Primero ordenamos los datos para facilitar el análisis:

S
PU
150,169,171,172,172,175,176,177,178,179,181,182,183,184,184.
M
A continuación seguimos el procedimiento ya descrito: Definir el resumen de cinco números

CA
del conjunto, es decir, identificar el valor mı́nimo, el máximo y calcular los tres cuartiles
(Q1 , Q2 , Q3 ). La estatura mı́nima es 150 y la máxima es 184. Enseguida hallamos los cuartiles
de las estaturas:
de posición del primer cuartil o sea del percentil 25 (p = 25), entonces:
p 25
100 100
al valor entero inmediato mayor: i = 4, es decir, el percentil 25 o primer cuartil, es el valor
ubicado en la posición i = 4, entonces: Q1 = 172 cm.
Hallamos el ı́ndice de posición del
segundo
cuartil (la mediana) o sea del percentil 50
p 50
E
(p = 50), entonces: i = ∗n = ∗ 15 = 7.5, como el valor de i no es entero,

100 100
AD
entonces se redondea al valor entero inmediato mayor: i = 8, es decir, el percentil 50 o

segundo cuartil, es el valor ubicado en la posición i = 8, entonces: Q2 = 177 cm.
de
posición del tercer cuartil o sea del percentil 75 (p = 75), entonces:
p 75
i= ∗n= ∗ 15 = 11.25, como el valor de i no es entero, entonces se redondea
100 100
al valor entero inmediato mayor: i = 12, es decir, el percentil 75 o tercer cuartil, es el valor
ubicado en la posición i = 12, entonces: Q3 = 182 cm.
En la figura 2.10 se muestra el diagrama de caja-bigotes para los datos analizados:
-I I
Para identificar qué estaturas del conjunto analizado son atı́picas seguimos el proceso ya
22
descrito:
20
1. Calcular el rango intercuartı́lico: RIC = Q3 − Q1 = 182 − 172 = 10cm.
2. Calcular 1.5 ∗ RIC = 1.5 ∗ 10 = 15.
3. Calcular Q1 − 1.5 ∗ RIC = 172 − 15 = 157cm. y Q3 + 1.5 ∗ RIC = 182 + 15 = 197cm.

Min Max
Q1 Q2 Q3
EP
UD
150 155 160 165 170 175 180 185
Estatura (cm)
A
IM
Figura 2.10: Diagrama caja-bigote de las estaturas de 15 estudiantes.

S -L
PU
4. Las estaturas menores que 157 cm y mayores que 197 cm., se consideran estaturas
atı́picas. Como se aprecia la única estatura atı́pica es 150 cm.
M
CA
2.3.5.5. Puntuaciones z
El valor o puntuación z, sirve para comparar valores de un mismo conjunto de datos o
para comparar valores de distintos conjuntos de datos (Triola, 2018).
Una puntuación z (o valor estandarizado) se calcula convirtiendo un valor a una escala
estandarizada, como se establece en la siguiente definición. Utilizaremos ampliamente las
puntuaciones z en el capı́tulo 5 y en capı́tulos posteriores, ya que son muy importantes.
Una puntuación z es el número de desviaciones estándar que un valor de la variable de
estudio se encuentra por arriba o por debajo de la media de la variable. Se calcula utilizando
las siguientes expresiones:
E
AD
Según se trate de una muestra o población, la puntuación z será:
x−x x−µ
z= : muestral o z= : poblacional (2.20)
s σ
Los valores de z mayores a cero corresponden a observaciones cuyo valor es mayor a la

media del conjunto, y valores de z menores que cero corresponden a observaciones cuyo valor
es menor a la media. Si el valor de z es cero, el valor de la observación correspondiente es
igual a la media.
-I I
El valor z de cualquier observación se interpreta como una medida relativa de la

localización de la observación en el conjunto de datos. Por tanto, observaciones de dos
22
20
conjuntos de datos distintos que tengan el mismo valor z tienen la misma localización relativa;
es decir, se encuentran al mismo número de desviaciones estándar de la media. Algunas
caracterı́sticas de las puntuaciones z son:
Se expresan como números sin unidades de medida.

El valor de un dato es significativamente bajo, si su puntuación z es menor o igual a -2

o el valor es significativamente alto si su puntuación z es mayor o igual a +2.
A continuación presentamos el siguiente ejemplo para entender cómo utilizar las

puntuaciones z para hacer comparaciones.
Natalia rindió dos exámenes parciales, uno de contabilidad y otro de matemáticas. En
contabilidad obtuvo 82 puntos (sobre una base de 100) y en matemáticas, obtuvo 86. Los
resultados del examen de contabilidad tuvieron una media de 72 y una desviación estándar
de 8. Los resultados del examen de matemáticas tuvieron una media de 68 y una desviación
EP
estándar de 12. ¿En qué examen obtuvo Natalia un mejor resultado, en comparación con el
UD
resto de sus compañeros que rindieron estos exámenes?

El puntaje obtenido por Natalia en ambos exámenes puede estandarizarse convirtiéndolos
en puntuaciones z como vemos a continuación
El puntaje en contabilidad:
A
IM
x−x 82 − 72
z= = = 1.25
s 8
S -L
El puntaje en matemáticas:
PU
x−x 86 − 68
M
z= = = 1.50
s 12
CA
Dado que ambos puntajes z son positivos, Natalia obtuvo un puntaje superior al promedio
en ambos exámenes, pero dado que su puntaje z para el examen de matemáticas es más alto
que su puntaje z para el examen de contabilidad, obtuvo mejor resultado en el examen de
matemáticas.
2.4. Problemas propuestos
1. Complete los espacios en blanco con la palabra o frases correctas.
La . . . . . . . . . . . . se mide en las mismas unidades que la media aritmética y que los

E
datos.
AD
Las medidas de . . . . . . . . . . . . indican la forma de la distribución de un conjunto de

datos. Dos ejemplos de estas medidas son . . . . . . . . . . . .
Si un conjunto de datos tiene una distribución leptocúrtica se dice que tiene un
coeficiente de curtosis. . . . . . . . . . . . .
El sı́mbolo σ denota la . . . . . . . . . . . . de una . . . . . . . . . . . . y s denota la . . . . . . . . . . . . de
una . . . . . . . . . . . .
-I I
Si un conjunto de datos tiene una distribución con curtosis igual a cero se dice
que tiene una distribución denominada . . . . . . . . . . . .
22
20
El sı́mbolo µ denota la media de una . . . . . . . . . . . . y x denota la media de una

............
La expresión de la desviación estándar como porcentaje de la media es . . . . . . . . . . . .
Dos ejemplos de medidas de forma de una distribución de datos son:. . . . . . . . . . . . . . .
La . . . . . . . . . . . . . . . . . . . . . . . . es la raı́z cuadrada positiva de la . . . . . . . . . . . . . . . . . .

En un conjunto de datos, la mediana coincide con el cuartil. . . . . . . . . . . . , el
percentil 75 % coincidirá con el cuartil. . . . . . . . . . . . ; y el percentil 25 % coincidirá
con el cuartil. . . . . . . . . . . .
2. Diez expertos clasificaron un producto de nuevo desarrollo con una calificación del 1 al
5. Sus calificaciones fueron las siguientes: 3.4 3.5 4.1 2.8 2.6 2.9 3.2 3.6
3.8 4.0. Determine la media, la mediana, el rango, la desviación estándar, la varianza,
el coeficiente de variación. Establezca, ası́ mismo, al menos una conclusión acerca de la
EP
dispersión.
UD
3. Se han tomado 8 mediciones de la temperatura (en grados Farenheit) de diferentes

hornos usados en la fabricación de semiconductores, con los siguientes resultados:
953 955 957 950 951 954 948 955

A
IM
Mostrando cálculos:
S -L
a) Hallar la moda y los cuartiles.

PU
b) Obtener la media y desviación tı́pica e interprételas.

M
CA
c) ¿Cuánto podrı́a aumentar la temperatura máxima sin que cambie la mediana?
4. Calcule el rango, la varianza y la desviación estándar de las observaciones de la muestra

que se presentan a continuación: 63 45 39 55 69 21 50 25 33 25
5. Los siguientes datos son precios de renta mensual (en dólares) para una muestra de 10
departamentos en el centro de una ciudad grande, y una muestra de 10 departamentos
en un suburbio:
Centro de la ciudad : 955, 1000, 985, 980, 940, 975, 965, 999, 1247, 1119
E
Suburbio : 750, 775, 725, 705, 694, 725, 690, 745, 575, 800
AD
a) Para cada conjunto de datos, calcule e interprete la media, la mediana, la amplitud,

la varianza, la desviación estándar y el coeficiente de variación.
b) ¿Qué son más variables: los precios de renta de los departamentos del centro de
la ciudad o los precios de renta de los departamentos de los suburbios?
6. El promedio global de cierta asignatura es de 80 puntos. Los 60 hombres que llevaron

la asignatura obtuvieron un promedio de 84 puntos, en cambio las mujeres sólo
-I I
consiguieron una media de 70 puntos. ¿Cuántas mujeres cursaron la asignatura?

22
20
7. Suponga que una pequeña empresa de negocios emplea a ocho personas que gana entre
300 y 350 dólares al mes. El dueño de la empresa se remunera ası́ mismo con 1250
dólares al mes, y reporta al público en general que el salario medio en su empresa es
de 430 dólares al mes. Responda lo siguiente:
a) Aritméticamente ¿Es posible que 8 empleados ganen entre 300 y 350 dólares y que
uno gane 1250 dólares al mes y que la media sea 430 dólares? Explique.
b) Estadı́sticamente ¿Se basarı́a en el sueldo promedio para describir la tendencia
central del conjunto de sueldos de esta empresa? ¿si o no? ¿por qué?
8. El supervisor de una carrera utiliza un cronómetro para determinar los tiempos de

llegada de los competidores. Cuando calcula el tiempo promedio de los tres primeros
finalistas, resulta que éste fue de 4.25 minutos. Después de revisar su cronómetro,
descubre que para su desgracia, lo puso en marcha cuando marcaba 15 segundos en
EP
lugar de cero, por lo cual cada uno de los tiempos fue medido con un excedente de 15
UD
segundos ¿ cuál fue entonces el tiempo medio correcto de los tres primeros finalistas?
9. Se conoce la información respecto de los ingresos de los trabajadores de dos secciones

de una empresa, A y B. El ingreso promedio de los trabajadores de la sección A es de
A
$950000 con una desviación tı́pica de $98000. Los trabajadores de la sección B tienen
IM
un ingreso promedio de $1200000 con una desviación tı́pica de $180000 ¿En cuál de las
-L
dos secciones existe una dispersión o variabilidad relativa mayor?

S
PU
10. Una compañı́a área estudia el peso de equipaje para cada pasajero. Para un grupo
grande de viajeros en vuelos nacionales, la media es 21.3 kg, con una desviación estándar
M
de 4.54 kg. Para un grupo grande de pasajeros de vuelos al extranjero, la media es 35.4
CA
kg y la desviación estándar, 6.8 kg. ¿Cuáles son más variables, los pesos de los equipajes
de los pasajeros de vuelos nacionales o los de vuelos al extranjero?
11. El promedio de sueldos de los empleados de una fábrica es una cierta cantidad. ¿Qué
contestarı́a usted, como jefe de personal, ante una queja de que nadie deberı́a ganar
por debajo del promedio, sea cual fuere éste?
12. Exprese cuál es la relación entre la mediana y la media de un conjunto de datos si dicho
conjunto tiene distribución con sesgo positivo. Explique a que se debe dicha relación.
E
AD
13. A continuación se presenta el número de cambios de aceite para los últimos 8 dı́as en
un taller de mantenimiento, localizado en San Borja: 41, 15, 39, 54, 31, 15, 56, 33.
Determine e interprete la media, la mediana,la moda, varianza, desviación estándar de
los datos.
14. ¿Cuál serı́a el valor modal que reportarı́a para un conjunto de observaciones si hay un
total de:
a) 10 observaciones (todas diferentes). b) 6 observaciones (todas iguales).

-I I
22
15. De un ejemplo de un conjunto de datos que sea trimodal, explicando por qué lo es.
20
16. Un hospital emplea 200 personas en su cuerpo de enfermeras. De ese personal, 50 son
ayudantes de enfermera, 50 son enfermeras prácticas y 100 son enfermeras registradas.
Las primeras reciben un sueldo de 615 soles mensuales, las segundas ganan 835 soles
mensuales, y las últimas 955 soles mensuales ¿Cuál es el sueldo promedio mensual
general?
17. Dados los siguientes conjuntos de datos:
Conjunto A: 7 5 11 8 3 6 2 1 9 8
Conjunto B: 7 5 6 6 6 4 8 6 9 3
Se le pide:
EP
a) Para cada conjunto hallar las medidas de tendencia central, variabilidad y posición.
UD
b) ¿Están sesgados los datos del conjunto A? Si es ası́, ¿cómo?

c) ¿Están sesgados los datos del conjunto B? Si es ası́, ¿cómo?
18. Una empresa productora de cı́tricos constata que las producciones de dos fincas son de
A
calidad distinta aunque utilizan la misma especie de árboles. Después de notar que los
IM
dos tipos de suelo son distintos (la finca A está constituida de suelo fino y homogéneo
-L
mientras que la finca B tiene una mezcla de suelo fino y suelo más grueso) decide hacer
S
PU
mediciones de la densidad del suelo en las dos fincas:

M
FINCA A: 85.9 88.2 90.4 91.1 92.7 92.8

CA
FINCA B: 86.8 87.5 90.3 91.4 92.4 92.6
a) En base a la variabilidad relativa: ¿Qué son más variables: las densidades del suelo
de la finca A o las densidades del suelo de la finca B respecto de sus promedios
respectivos?
b) Considerando los datos de la muestra de la finca A ¿Entre qué valores deberán caer
al menos 75 % de dichas observaciones, de acuerdo con el teorema de Chebyshev?
19. Complete con la palabra o frase correcta: Si un conjunto de datos tiene un

E
AD
coeficiente de asimetrı́a igual a cero se dice que tiene una distribución denominada
...............................
20. El siguiente histograma presenta la distribución de las notas en la práctica 1 de los

alumnos matriculados el semestre pasado en la asignatura Estadı́stica 2:
-I I
22
20
a) Calcule e interprete el promedio (o media), la mediana y la moda de las notas en

dicha práctica.
b) Calcule e interprete la desviación estándar de las notas en dicha práctica.
c) ¿Cuál es la nota que excede a la del 75 % de los alumnos?
21. Un alumno al realizar un estudio sobre el número de hijos de las familias que viven en
cierta urbanización olvidó anotar información en la tabla siguiente:
N° de N° de Frecuencia Porcentaje Frecuencia

EP
hijos familias relativa ( %) acumulada

UD
(frecuencia)
0 10 0.25
1 22
2 30
A
IM
3 0.15
4
S -L
PU
a) Complete la tabla.
b) Calcule e interprete en términos del problema:la media, la mediana,la moda y la
M
desviación estándar de los datos.

CA
c) Interprete, en términos del problema, el valor sombreado.
22. Un departamento de producción aplica un procedimiento de muestreo para verificar la

calidad de artı́culos recién elaborados. Para ello, recurre a la siguiente regla de decisión
en una estación de inspección: si una muestra de 14 artı́culos tiene varianza mayor que
0.005, se debe parar la lı́nea de producción y efectuar reparaciones necesarias. Suponga
que acaban de reunirse los siguientes datos:
E
3,43 3,45 3,43 3,48 3,52 3,50 3,39

AD
3,48 3,41 3,38 3,49 3,45 3,51 3,50
¿Debe detenerse la producción? ¿Por qué?
23. Una medida útil para comparar la dispersión relativa de dos o más distribuciones de
datos, si están en distintas unidades, es el. . . . . . . . . . . . . . . . . . . . . . . .
24. Una muestra de ciudadanos de la tercera edad revelo que su ingreso anual de jubilación
tiene una media de 1340 soles. Puesto que la media se basa en una muestra, se dice que
-I I
1340 soles es un. . . . . . . . . . . . . . . . . . . . . . . .

22
20
25. . . . . . . . . . . . . . . . . . . . . . . . . es una medida de resumen que describe una caracterı́stica de

toda una población.
26. La suma de las desviaciones de un conjunto de datos, respecto de su media aritmética

es igual a . . . . . . . . . . . . . . . . . . . . . . . .
27. La relación entre la media, la mediana y la moda, que se cumple en una distribución
asimétrica hacia la izquierda es . . . . . . . . . . . . . . . . . . . . . . . .
28. ¿Qué puede decirse de una distribución en la que s = 0?
29. Se quiere comparar la variación en los precios anuales de acciones que se venden a
menos de 10 dólares y la variación en los precios de aquellas que se venden por arriba
de 60 dólares. El precio promedio de las acciones que se venden a menos de 10 dólares
es 5,25 dólares, y la desviación estándar es 1,52 dólares. El precio medio de las acciones
que se negocian a más de 60 dólares es 92,50 dólares, y su desviación estándar; 5,28
EP
dólares. ¿Qué medida de variabilidad emplearı́a para hacer la comparación? ¿por qué
UD
emplearı́a dicha medida? Calcúlela e interprete sus resultados.
30. ¿Puede la varianza de un conjunto (suponga que el conjunto es una muestra) tener un
valor negativo? ¿si o no? ¿por qué?
A
IM
31. La producción media de papa, en toneladas, fue de 4000 con varianza de 3600 para el
departamento de Cuzco, mientras que para el departamento de Puno fue de 10 000 con
-L
varianza de 1440000 ¿en qué departamento se puede decir que la producción de papa
S
PU
es más homogénea?
M
32. El sueldo promedio de un conjunto (población) de gerentes, de diversas empresas, es

CA
de 11000 soles con una varianza de 2000. ¿Cuál serı́a el nuevo promedio y la nueva
varianza si se aumenta en 810 soles el salario de cada gerente? Demuestre y explique
cómo obtiene sus respuestas.
33. Para un determinado conjunto (muestra) de salarios, se obtuvo una media de $52,32 y
una desviación estándar de $10,25. Por efectos de recesión en el mercado, la gerencia
de la empresa se ve obligada a aplicar un factor de descuento k (0 < k < 1), a cada uno
de los salarios originales, es decir, cada salario queda multiplicado por esa constante
k. ¿Cuál serı́a el nuevo salario promedio y la nueva desviación estándar? ¿Cuál serı́a
E
el nuevo coeficiente de variación del conjunto de salarios? Demuestre y explique cómo

AD
obtiene sus respuestas.
34. Dados los siguientes datos calcular el primer, segundo y tercer cuartil.
955, 1000, 985, 980, 940, 975, 965, 999, 1247, 1119
35. El propietario de una pequeña empresa tiene asignado un salario de 4000 euros
mensuales. Los salarios de sus empleados son: 500, 550, 600, 700, 725, 770, 785, 800,
-I I
800, 825, 850, 900 930, 950, 1000, 1200, 1800. Considerando todos los salarios (incluido
el del propietario):
22
20
a) Determine cuál es el “resumen de cinco números” y empléelo para representar las

observaciones mediante un diagrama de caja-bigotes.
b) Calcule el rango intercuartı́lico y explique si existen datos atı́picos. En caso de que
existan diga cuáles son.
c) Observando el diagrama de caja-bigotes que ha elaborado, explique qué tipo de

sesgo tiene la distribución de los salarios.
36. El sueldo medio de los obreros de una fábrica es de $286.
a) ¿Que porcentajes de hombres y mujeres trabajan en la fábrica si sus sueldos medios

respectivos son $300 y $260?
b) Si el 60 % de los obreros tienen menos de 30 años y percibe el 20 % del total de
los sueldos, ¿cuánto es el sueldo medio de los obreros de al menos 30 años?
EP
37. En una empresa el sueldo promedio por trabajador es de 360 dólares mensuales. Los
UD
trabajadores manuales constituyen el 40 % del total de trabajadores y perciben el 25 %

del monto total de la planilla, ¿cuánto recibe en promedio cada trabajador manual?
38. Se tiene una muestra con media de 30 y desviación estándar de 5. Determine qué
A
proporción o porcentaje de los datos de dicha muestra se encuentran dentro de cada
IM
uno de los siguientes intervalos:

-L
a) 20 a 40 c) 22 a 38 e) 12 a 48
S
PU
b) 15 a 45 d ) 18 a 42
M
CA
39. La media de recorrido de un lote de neumáticos es de 45.000 millas y la desviación

estándar 5.000 millas ¿En qué intervalo de recorridos se encuentra al menos el 86 % de
los neumáticos?
40. Se sabe que el 84 % de los sueldos en una compañı́a fluctúa entre 3000 y 8000 soles.
Sabiendo que la media de los sueldos es de 5500 soles, determine la desviación estándar.
41. La distribución de datos cuyo coeficiente de asimetrı́a es positivo se dice que tiene una
distribución. . . . . . . . . . . .
E
42. La distribución de datos cuyo coeficiente de curtosis es negativo se dice que tiene una
AD
distribución. . . . . . . . . . . .
43. Una distribución de datos que tiene curtosis positiva se le denomina. . . . . . . . . . . .
44. Si las unidades de la variable a analizar son pulgadas, entonces las unidades de la
desviación estándar estarán en . . . . . . . . . . . . y las de la varianza en . . . . . . . . . . . .
45. Una empresa de jardinerı́a ofrece sus servicios por vı́a telefónica. A continuación se
indica el número de citas que se hizo en cada una de las últimas 25 horas de llamadas:
-I I
9 5 2 6 5 6 4 4 7 2 3 6 3 4 4 7 8 4 4 5 5 4 8 3 3
22
20
a) Elabore una tabla de distribución de frecuencias y un diagrama de barras para

este conjunto de datos.
b) Elabore la distribución de frecuencias relativas y la distribución de porcentajes y
sus respectivos diagramas de barras. Comente sobre la distribución de los datos.
46. El gerente de un almacén esta interesado en el número de veces que un cliente compra
en su almacén durante un periodo de dos semanas. Las respuestas de 36 clientes fueron:
5 6 3 11 4 4 5 6 4
2 6 6 6 7 1 8 6 14
15 4 1 2 4 1 7 10 6
5 12 9 5 4 3 12 4 5
EP
Se le pide elaborar una tabla de distribución de porcentajes de estos datos no

agrupados y represéntala mediante un diagrama de barras y comente como se agrupan
UD
o distribuyen las respuestas de los clientes.
47. Dos modos que usan los empleados para ir a trabajar diariamente son el transporte
público y el automóvil. A continuación vemos unas muestras de tiempos de cada modo.
A
Las cifras están en minutos.
IM
-L
Transporte público: 28 29 32 37 33 25 29 32 41 34
S
PU
Automóvil: 29 31 33 32 34 30 31 32 35 33
M
a) Calcule la media de la muestra del tiempo que se lleva en cada modo de transporte.
CA
b) Calcule la desviación estándar de la muestra para cada modo de transporte.

c) Con base en los resultados de los apartados a) y b),¿Qué modo de transporte debe
preferirse? Explique sus razones.
48. El gobierno desea averiguar si el número medio de hijos por familia ha descendido
respecto de la década anterior. Para ello ha encuestado a 50 familias respecto al número
de hijos, y ha obtenido los siguientes datos:
E
0 0 1 2 1 1 2 2 2 1
AD
2 2 2 2 2 2 2 2 2 2
2 2 2 3 2 2 3 2 3 3
3 3 2 3 3 3 3 3 3 3
4 4 3 4 3 4 5 6 4 4
a) ¿Cuál es la variable en estudio? ¿De qué tipo es? ¿qué nivel de medición tiene?
b) Defina la frecuencia en términos del problema.
-I I
c) Elabore una distribución de frecuencias no agrupadas de los datos. Grafique la

22
distribución de porcentajes correspondiente.

20
d ) ¿Cuál es el porcentaje de familias que tiene como máximo 2 hijos?

e) ¿Cuál es el número de familias que tienen más de 1 hijo, pero menos de 4?
f ) ¿Qué porcentaje de familias tienen más de 3 hijos?
Una empresa ofrece asesorı́a financiera para solucionar deudas atrasadas con tarjetas
de crédito. Se realizó una encuesta a 12 jóvenes entre 18 y 25 años con una deuda en
su tarjeta de crédito por poco más de $ 5000, registrándose los montos (en dólares) que
cada uno de ellos pagó como abono a sus saldos el mes pasado:
439, 453, 457, 459, 475, 483, 526, 563, 566, 579, 599, 644.
a) Calcule e interprete la desviación estándar de los pagos de la muestra.

b) Calcule e interprete el primer cuartil, la mediana y el tercer cuartil de los pagos.
EP
UD
49. Se dice que la mediana de un conjunto de datos numéricos no se ve afectada por la

presencia de valores extremos. Explique esto a través de un ejemplo.
50. Dado un conjunto de datos, explique qué es el percentil 83 %

A
IM
51. Se sabe que el 84 % de los sueldos en una compañı́a fluctúa entre 3000 y 8000 soles.
También se sabe que el 75 % de los sueldos en dicha compañı́a fluctúa entre 3500 y 7500
-L
soles. Determine la media y la desviación estándar de dichos sueldos.

S
PU
52. Una muestra de las compras de varios clientes de una gran tienda de almacenes dio por
M
resultado la siguiente muestra de datos:

CA
X 1 2 3 4 5
f 6 10 9 8 7
X = número de artı́culos comprados por cliente.

Responda lo siguiente:
a) ¿Qué representa el “2”?

b) ¿Qué representa el “10”?
E
AD
c) ¿Cuántos clientes fueron necesarios para obtener esta muestra?

d ) ¿Cuántos artı́culos fueron comprados en total por los clientes de esta muestra?
e) ¿Cuál es el mayor número de artı́culos comprados por un cliente?
f ) Represente la distribución de frecuencias mostrada a través de un diagrama de
barras.
53. Se identificó una muestra de estudiantes del campus que poseı́a automóviles y se registró
las marcas de los mismos. A continuación se presenta la muestra que se obtuvo ( T
-I I
=Toyota, N=Nissan , Chevrolet=C, Ford=F, Volkswagen=V):

22
20
TFTNTCFTVTFVNCNNTNCCTFTFTNCVNTCTTFNT
VCTFFCTTCTTFTF
a) ¿Cuál es la variable en estudio?

b) Elabore una distribución de frecuencias para dicha variable.

c) Trace un diagrama de barras que muestre los porcentajes para los distintos valores
de la variable en estudio.
54. Se registraron durante 40 dı́as, el número de habitaciones ocupadas en el hotel América,

y los datos se resumieron en la siguiente distribución de frecuencias:
X frecuencia Frecuencia Porcentaje frecuencia frecuencia Porcentaje

relativa ( %) acumulada relativa acumulado
EP
acumulada
UD
25 0.05
26 5
27 37.5
A
28 24
IM
29 0.30
S -L
30
PU
M
a) Defina la variable de interés (X), de qué tipo es y qué nivel de medición tiene.
CA
b) Defina la “frecuencia” en términos del problema.

c) Complete la distribución de frecuencias.
d ) Calcule e interprete la media, mediana y desviación estándar de los datos.
e) Interprete, en términos del problema, los valores sombreados.
55. Los siguientes datos ordenados son las edades de 50 personas que compraron televisores
plasma en la sucursal de Hiraoka en San Miguel, la semana anterior:
E
22 23 26 27 28 28 29 29 30 30
AD
30 31 31 31 32 32 32 32 33 33
33 34 35 35 35 35 36 36 36 36
37 37 37 38 40 40 40 41 41 41
42 43 44 45 46 48 50 51 55 56
Se le pide:
-I I
a) Elaborar una tabla de distribución de frecuencias agrupadas.

22
b) Calcular e interpretar la media, la mediana y la desviación estándar de los datos

20
agrupados.
c) Calcular e interpretar los cuartiles de los datos agrupados.
56. En el diseño de encuestas de presupuestos familiares es crucial entre otros datos, el

número de hijos menores de edad en las familias del paı́s. Una encuesta sobre una
muestra piloto de 200 familias con matrimonios que llevaban menos de 10 años de
casados, proporcionaba la siguiente información:
N° de hijos 0 1 2 3 4
N° de familias 23 84 69 19 5
Mostrando los cálculos, halle e interprete en términos del problema:

EP
a) La media de los datos analizados. (2p)

UD
b) La mediana de los datos analizados. (2p)

c) La moda de los datos analizados. (1p)
57. El consumo de agua (en metros cúbicos.) de una muestra de hogares de Lima
A
Metropolitana se distribuye como sigue:
IM
-L
Consumo de agua (m3 ) [20 − 25⟩ [25 − 30⟩ [30 − 35⟩ [35 − 40⟩ [40 − 45]
S
N° de hogares 18 45 54 36 27
PU

M
CA
a) La media de los datos analizados.

b) La mediana de los datos analizados.
c) La moda de los datos analizados.
58. Las edades de una muestra de los pacientes atendidos en la sección de Rayos X del
Hospital Almenara son las siguientes:
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 67 92 85 55 76
E
AD
52 10 64 75 78 25 80 95 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
Se le pide:

-I I
b) Represente gráficamente la distribución elaborada.

22
c) Calcular e interpretar la media, la mediana y la desviación estándar de los datos

20
agrupados.
d ) Calcular e interpretar los cuartiles de los datos agrupados.
59. Si se tienen los siguientes 46 datos ordenados:

1, 76 1, 80 1, 90 2, 00 2, 05 2, 10 2, 18 2, 19 2, 21 2, 30 2, 34 2, 38
2, 40 2, 41 2, 46 2, 49 2, 55 2, 59 2, 60 2, 63 2, 64 2, 64 2, 68 2, 68
2, 71 2, 74 2, 76 2, 77 2, 80 2, 80 2, 85 2, 87 2, 89 2, 93 2, 93 3, 01
3, 05 3, 10 3, 11 3, 15 3, 22 3, 30 3, 35 3, 40 3, 50 3, 53
Se le pide:

b) Represente gráficamente la distribución elaborada.
EP
c) Calcular e interpretar la media, la mediana y la desviación estándar de los datos

UD
agrupados.
d ) Calcular e interpretar los cuartiles de los datos agrupados.
60. La distribución del contenido de jugo (en mililitros o ml.) en una muestra de cajas de
A
IM
la marca “refresh” es la siguiente:

S -L
PU
Volumen de jugo (ml.) [280 − 290⟩ [290 − 300⟩ [300 − 310⟩ [310 − 320⟩ [320 − 330]
N° de cajas 24 37 44 31 14
M
CA
a) La media de los datos analizados.

b) La mediana de los datos analizados.
c) La moda de los datos analizados.
61. Se realizó una encuesta sobre los diferentes medios tecnológicos domésticos y el empleo
de ellos por parte de personas de 12 años a más. Los siguientes datos ordenados
representan el tiempo (en horas) de empleo de computadoras personales en casa durante
E
una semana para una muestra de 50 personas:

AD
1.5 3.4 4.1 5.7 8.8 1.5 3.5 4.2 5.9 9.2
1.6 3.7 4.3 5.9 9.5 2.0 3.7 4.4 6.1 10.3
2.8 3.9 4.7 6.1 10.4 3.0 3.9 4.8 6.1 10.8
3.1 4.0 5.4 6.2 11.1 3.1 4.1 5.6 7.1 12.1
3.1 4.1 5.7 7.2 12.9 3.3 4.1 5.7 7.6 14.8
-I I
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
22
la “frecuencia” en términos del problema.

20
b) Elabore una distribución de frecuencias agrupadas.

c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1. ¿Qué porcentaje de personas emplea 11 horas o más, sus computadoras
personales en casa, durante una semana?
c.2. ¿por debajo de qué cantidad de tiempo, emplean sus computadoras, el 52 %

de las personas?
c.3. Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente.
d ) Calcule e interprete en términos del problema: la media, la mediana, la moda, la
varianza y la desviación estándar de los datos agrupados. ¿Qué tipo de sesgo tiene
la distribución?
e) Si acaba de calcular la media y la desviación estándar del conjunto de datos
EP
agrupados, emplee el teorema de Chebyshev para definir en qué intervalo se

encuentra como mı́nimo el 60 % de los datos.
UD
f ) ¿Cuál es el tiempo de empleo que es excedido por el 75 % de las personas?
62. El volumen (en litros) de jugo de sauco que una máquina de llenado automático deposita
A
en botellas de 2 litros se controla periódicamente. La semana pasada se seleccionó una
IM
muestra aleatoria de 50 botellas llenadas por esta máquina y se registró el volumen

-L
de jugo de sauco en cada una de esas botellas. A continuación se presentan los datos
S
ordenados, aproximados a tres cifras decimales:

PU
M
1.894 1.908 1.938 1.941 1.941 1.947 1.951 1.951 1.953 1.957
CA
1.960 1.963 1.967 1.969 1.971 1.973 1.975 1.977 1.978 1.980
1.981 1.982 1.983 1.984 1.986 1.988 1.992 1.994 1.996 1.997
2.003 2.005 2.010 2.012 2.013 2.014 2.015 2.023 2.025 2.029
2.031 2.036 2.038 2.052 2.057 2.065 2.066 2.075 2.086 2.109
b) Elabore una distribución de frecuencias agrupadas de la variable de estudio.
E
AD

c.1 ¿Qué porcentaje de botellas contiene menos de 1.956 litros de jugo de sauco?
c.2 ¿Cuál es el mı́nimo volumen de jugo de sauco que contiene el 26 % de las
botellas analizadas?
c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente
c.4 Calcule e interprete en términos del problema: la media, la mediana y la
-I I
desviación estándar de los volúmenes agrupados.

22
c.5 Si compara la mediana y la media de los volúmenes agrupados ¿Qué tipo de

20
sesgo tiene la distribución de los mismos?

c.6 ¿Cuál es intervalo simétrico, alrededor del volumen promedio, en el que se
encuentra como mı́nimo el contenido del 73 % de las botellas analizadas?
c.7 Calcule exactamente el volumen que es excedido por el 25 % de las botellas.
c.8 Calcule exactamente el volumen que es excedido por el 75 % de las botellas.

c.9 Construir una ojiva de porcentajes.
63. Se han tomado muestras de 64 sacos de un alimento balanceado para ganado que han
enviado dos proveedores, para medir el porcentaje de proteı́na. En la siguiente tabla se
muestran los valores obtenidos.
59.3 59.4 59.5 60.2 60.3 60.5 61.4 61.5

62.3 62.5 63.7 64.0 64.0 64.0 64.2 64.4
EP
64.4 64.6 64.8 64.9 65.3 65.5 66.0 66.3

UD
66.5 66.9 67.1 67.4 67.6 67.9 68.1 68.2

68.5 68.6 69.2 69.9 69.9 70.7 70.9 71.1
71.9 72.2 72.7 73.5 73.7 74.1 74.7 75.5
A
IM
76.0 76.7 77.2 77.4 77.7 78.0 78.5 78.6

-L
79.4 79.8 80.1 81.6 81.9 82.7 82.9 84.5

S
PU
M
CA
b) Elabore una distribución de frecuencias agrupadas de los datos de la variable de

estudio.
c.1 ¿Qué porcentaje de sacos tienen un porcentaje de proteı́na menor a 77.3?
c.2 ¿Cuál es el porcentaje de proteı́na mı́nimo que contiene el 18 % de los sacos?
c.3 Representar el histograma y el polı́gono de frecuencias correspondiente
c.4 ¿Cuál es el porcentaje promedio de proteı́nas de estos sacos?¿Cuál es la
mediana de los porcentaje de proteı́na? Interprete los resultados.
E
d ) Calcule e interprete en términos del problema, la desviación estándar de los

AD
porcentajes de proteı́na agrupados. ¿Qué tipo de sesgo tiene la distribución de

los porcentajes de proteı́na?
e) Calcule exactamente el porcentaje de proteı́na que excede al del 75 % de los sacos.
f ) Calcule exactamente el porcentaje de proteı́na que excede al del 25 % de los sacos.
g) Grafique la ojiva de porcentajes.
64. Cierta fábrica tiene un departamento de producción y otro de ventas. Las tablas
-I I
a continuación muestran los salarios percibidos hasta fines de marzo de este año
22
(expresado en miles de nuevos soles):

20
Dpto. producción Dpto. ventas

Salario Nro. de Salario Nro. de
(miles de soles) trabajadores (miles de soles) trabajadores
[1.0 − 1.5⟩ 12 [6.0 − 8.0⟩ 4
[1.5 − 2.0⟩ 28 [8.0 − 10.0⟩ 6
[2.0 − 2.5⟩ 32 [10.0 − 12.0⟩ 12
[2.5 − 3.0⟩ 24 [12.0 − 14.0⟩ 15
[3.0 − 3.5⟩ 12 [14.0 − 16.0⟩ 3
[3.5 − 4.0] 12
EP
UD
a) ¿Cuáles son más variables: los salarios del departamento de producción o los
salarios del departamento de ventas?
b) Si compara la mediana y la media de los salarios respectivos: ¿Qué tipo de sesgo
tienen los salarios del departamento de producción?¿y los del departamento de
A
IM
ventas?
-L
c) Basándose en el rango intercuartı́lico, sustente ¿qué valores de salario se

S
considerarı́an atı́picos en el departamento de producción? y ¿en el departamento

PU
de ventas?
M
d ) ¿ Cuál es intervalo simétrico, alrededor del salario promedio del departamento de

CA
producción, en el que se encuentra como mı́nimo el 72 % de los salarios de los

trabajadores de dicho departamento?
e) ¿ Cuál es intervalo simétrico, alrededor del salrio promedio del departamento
de ventas, en el que se encuentra como mı́nimo el 72 % de los salarios de los
trabajadores de dicho departamento?
65. Los siguientes datos ordenados representan los precios (en soles) de las acciones al
cierre de la bolsa para una muestra aleatoria de 50 emisiones negociadas en la Bolsa de
Valores de Lima.
E
AD
3.75 6.00 12.30 15.88 21.40 23.50 25.00 33.38 37.50 53.88
3.75 6.12 12.38 18.75 21.88 24.00 26.00 35.0 46.0 57.50
4.75 8.25 12.88 19.00 22.50 24.00 27.12 35.25 46.20 59.12
5.50 8.62 14.25 20.38 22.62 25.00 29.38 36.12 46.38 64.75
5.75 8.75 15.50 20.62 23.50 25.00 31.00 36.50 48.30 80.50
-I I

22
20

estudio.
c.1 ¿Qué porcentaje de las emisiones cerraron con un precio inferior a 12.5 soles?
c.2 ¿por encima de qué precio cerraron 18 % de las emisiones?

correspondiente
c.4 ¿Cuál es el precio promedio de las emisiones?¿Cuál es la mediana de dichos
precios? Interprete los resultados.
d ) Calcule e interprete en términos del problema, la desviación estándar de los precios
agrupados. ¿Qué tipo de sesgo tiene la distribución de precios?
e) Calcule exactamente el precio que es excedido por el 25 % de las emisiones.
EP
f ) Calcule exactamente el precio que es excedido por el 75 % de las emisiones.

UD
66. El siguiente conjunto de datos ordenados representan el tiempo de reacción ante un

estı́mulo auditivo (en segundos), en una muestra de 50 estudiantes universitarios:
A
IM
0.094 0.101 0.106 0.109 0.111 0.113 0.117 0.119 0.122 0.129
-L
0.098 0.102 0.107 0.110 0.112 0.113 0.117 0.120 0.123 0.130
S
PU
0.099 0.103 0.107 0.110 0.112 0.115 0.118 0.120 0.124 0.132
M
0.100 0.103 0.108 0.111 0.112 0.115 0.118 0.121 0.126 0.134
CA
0.100 0.105 0.108 0.111 0.113 0.117 0.119 0.122 0.128 0.135
estudio.
c.1 ¿Qué porcentaje de estudiantes reaccionan a un estı́mulo en menos de 0.106
E
segundos?
AD
c.2 ¿por encima de qué tiempo reaccionan a un estı́mulo el 16 % de los estudiantes?

correspondiente
c.4 ¿Cuál es el tiempo promedio de reacción?¿Cuál es la mediana del tiempo de
reacción? Interprete los resultados.
d ) Calcule e interprete en términos del problema, la mediana y la desviación estándar
de las tiempos agrupados. ¿Qué tipo de sesgo tiene la distribución de los tiempos
-I I
de reacción?
22
e) Calcule exactamente el tiempo de reacción que es excedido por el 25 % de los

20
estudiantes.
f ) Calcule exactamente el tiempo de reacción que es excedido por el 75 % de los
estudiantes.
67. Se escogen 50 dı́as al azar y se computa el número de vehı́culos que usan una
determinada carretera. La media correspondiente a los datos obtenidos es 385; la
desviación tı́pica es 15. Calcule la proporción de dı́as en los que el número de autos que
usó dicha carretera estuvo entre 340 y 430.
68. Un agricultor obtuvo una gran cosecha de melones. De los 50 camiones que salieron
cargados, él seleccionó al azar un melón de cada uno y les midió el diámetro (en cm.).
Los resultados ordenados de esta muestra fueron los siguientes:
EP
UD
10.2 12.5 13.9 16.2 18.8

11.1 12.6 14.0 16.4 18.8
11.2 12.6 14.4 16.6 19.3
A
11.3 12.8 14.6 16.8 19.5
IM
11.5 12.9 14.7 16.9 19.8

S -L
11.6 13.0 15.2 16.9 20.4

PU
11.8 13.4 15.6 17.4 20.5

M
12.1 13.5 15.7 17.8 21.3

CA
12.3 13.6 15.8 17.9 21.4

12.5 13.6 15.9 18.3 22.3
c) Calcule e interprete en términos del problema: la media, la mediana, la moda, la
varianza y la desviación estándar de los datos agrupados. ¿Qué tipo de sesgo tiene
E
AD
la distribución?
d ) Si acaba de calcular la media y la desviación estándar del conjunto de datos
agrupados, defina mediante el Teorema de Chebyshev, en qué intervalo se
encuentra, como mı́nimo, el 45 % de los datos.
e) ¿Cuál es el diámetro que es excedido por el 75 % de los melones?
f ) Represente gráficamente la distribución elaborada en el apartado b) a través de
un histograma de porcentajes y el polı́gono de porcentajes correspondiente.
-I I
69. En una compañı́a, se toma una muestra de 200 empleados y se observa que en dicha
22
muestra el sueldo mı́nimo y máximo es de $150 y $300 respectivamente. Tales sueldos se

20
tabulan en una distribución de frecuencias agrupadas de 5 intervalos de igual tamaño. Si

se sabe que 20 empleados ganan al menos $150, pero menos de $180, 60 ganan menos
de $210, 110 ganan menos de $240, 180 ganan menos de $270 y el 10 % restante de
empleados ganan al menos $270 y a lo más $300. Se le pide lo siguiente:
a) Reconstruir la tabla de distribución de frecuencias agrupadas.

b) Calculear e interpretar la media, la mediana y la desviación estándar de los sueldos
agrupados.
70. ¿Cómo se denomina el diagrama mostrado a continuación? Según su naturaleza, ¿qué

tipo de variable está siendo representada?
- Interprete el significado de los valores: 72 y 44, mostrados en el eje vertical.

EP
UD
A
IM
S -L
PU
M
CA
71. Los siguientes datos ordenados se refieren a la tasa de alfabetización de 21 paı́ses de

América del Sur:
53, 55, 57, 73, 73, 78, 81, 83, 85, 87, 87, 88, 88, 88, 90, 93, 93, 94, 95, 96, 99.
a) Determine cuál es el “resumen de cinco números” y empléelo para representar el

diagrama de caja-bigotes de estos datos no agrupados.
E
existan diga cuáles son. Si no hay sustento se invalida su respuesta.

AD
72. La tabla adjunta indica la Distribución del Coeficiente Intelectual (CI) de una muestra
de 120 alumnos de un colegio:
CI (puntos) N°de Alumnos

[60 − 70⟩ 2
[70 − 80⟩ 3
[80 − 90⟩ 25
-I I
[90 − 100⟩ 46
22
[100 − 110⟩ 35
20
[110 − 120⟩ 5
[120 − 130⟩ 3
[130 − 140] 1
a) Calcule e interprete la media, mediana, moda y desviación estándar ?Qué tipo de

sesgo tiene la distribución?
b) ¿Cuál es el cociente intelectual que es superado por el 25 % de los alumnos?
c) ¿Un alumno con coeficiente intelectual 102 supera el percentil 75? Sustente.
d ) Basándose en el rango intercuartı́lico, sustente qué valores de CI se conside-
rarı́an atı́picos.
e) Si el coeficiente de variación de los CI de otra muestra de alumnos es 20 % ¿Cuál
de las dos muestras presenta una distribución de CI más homogénea? ¿Por qué?
EP
f ) Si calculó la media y la desviación estándar de los CI agrupados en el apartado

UD
a), responda lo siguiente: ¿Cuál es intervalo simétrico, alrededor de la media, en

el que se encuentra como mı́nimo el 72 % de los CI?
73. El siguiente conjunto de datos ordenados representan el diámetro de cintura (en cm.),
A
IM
de una muestra de 40 pacientes, cuyas edades oscilan entre 17 y 58 años, que acudieron
al Instituto Nacional de Nutrición el lunes pasado:
S -L
PU
75.2 78.8 85.0 87.7 91.3 94.9 102.9 103.8

75.6 79.6 86.7 88.0 91.5 95.0 103.0 104.0
M
CA
75.7 79.9 86.9 89.1 91.8 96.5 103.0 105.5

77.0 81.6 87.1 90.6 92.4 97.1 103.3 107.5
78.1 82.5 87.7 91.1 93.1 98.9 103.3 108.7
estudio.
E

AD
c.1 ¿por encima de cuántos cm., mide el diámetro de cintura del 27.5 % de los
pacientes?
c.2 ¿Qué porcentaje de pacientes tiene menos de 92 cm. de diámetro de cintura?
correspondiente
c.4 ¿Cuál es el diámetro promedio de cintura de esa muestra de pacientes?¿Cuál
es la mediana del diámetro de cintura? Interprete los resultados.
-I I
d ) Calcule e interprete en términos del problema la moda y la desviación estándar

22
de los diámetros de cintura agrupados. ¿Qué tipo de sesgo tiene la distribución de

20
los diámetros de cintura?

e) Calcule exactamente el diámetro de cintura que es excedido por el 75 % de los
pacientes.
f ) Calcule exactamente el diámetro de cintura que es excedido por el 25 % de los

pacientes.
74. Un programa corrector de textos contabiliza el número de errores tipográficos que

encuentra en cada página. Después de pasar este programa corrector por un texto de
50 páginas, se obtiene el siguiente número de errores tipográficos por página:
2, 3, 5, 0, 1, 4, 0, 6, 2, 1, 1, 0, 2, 4, 5, 3, 1, 2, 3, 2, 3, 1, 2, 4, 4,
2, 5, 4, 1, 3, 2, 6, 8, 2, 0, 1, 0, 2, 3, 1, 5, 10, 2, 1, 3, 6, 2, 0, 1, 3
EP
a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
UD
¿por qué?
c) Elabore una distribución de frecuencias no agrupadas de los datos y grafı́quela.
d ) ¿Cuántas páginas presentan dos o más errores tipográficos, pero menos de 4?
A
IM
e) ¿Qué porcentaje de páginas presenta al menos 5 errores tipográficos?

-L
f ) ¿Cuántos errores tipográficos en promedio hay en el texto revisado?

S
g) ¿Cuál es la mediana del número de errores tipográficos del texto revisado?

PU
75. Los siguientes datos ordenados son los consumos en cafeterı́a (en soles) realizados por
M
CA
20 alumnos en la semana anterior:
36, 37, 41, 44, 45, 47, 47, 49, 50, 50, 54, 55, 56, 56, 62, 63, 68, 75, 87, 88.

76. El sueldo medio de los obreros de una fábrica es de $980. Mostrando el planteamiento y
E
cálculos correspondientes, responda lo siguiente: ¿Qué porcentaje de obreros de menos

AD
de 30 años y de obreros de al menos 30 años trabajan en la fábrica si sus sueldos medios

respectivos son $930 y $1100?
77. Se tiene la información de dos empresas correspondiente a los ingresos mensuales de

sus empleados:
Empresa A Empresa B
Ingreso mensual Nro. de Ingreso mensual Nro. de
(cientos de soles) empleados (cientos de soles) empleados
-I I
[10.5 − 12.5⟩ 120 [8.5 − 11.5⟩ 100

22
[12.5 − 14.5⟩ 400 [11.5 − 14.5⟩ 200

20
[14.5 − 16.5⟩ 160 [14.5 − 17.5⟩ 480

[16.5 − 18.5⟩ 80 [17.5 − 20.5⟩ 100
[18.5 − 20.5⟩ 32 [20.5 − 23.5⟩ 80
[20.5 − 22.5] 8 [23.5 − 26.5] 40
a) ¿Cuáles son más variables: los ingresos mensuales de los trabajadores de la empresa
A o de la empresa B?
b) Si compara la mediana y la media de los ingresos mensuales respectivos: ¿Qué tipo
de sesgo tienen los ingresos de la empresa A?¿y en la empresa B?
c) Basándose en el rango intercuartı́lico, sustente ¿qué valores de ingreso mensual
se considerarı́an atı́picos en la empresa A? y ¿en la empresa B?
d ) ¿ Cuál es intervalo simétrico, alrededor del ingreso mensual promedio de la empresa
A, en el que se encuentra como mı́nimo el 72 % de los ingresos mensuales de los
EP
trabajadores de dicha empresa?

UD
e) ¿ Cuál es intervalo simétrico, alrededor del ingreso mensual promedio de la empresa

B, en el que se encuentra como mı́nimo el 72 % de los ingresos mensuales de los
trabajadores de dicha empresa?
A
78. Elija cuatro números que se encuentren en el intervalo [4.1; 16.1] (se pueden escoger
IM
números repetidos) de manera que:

S -L
a) La desviación estándar (o tı́pica) de estos números sea la mayor posible.

PU
b) La desviación estándar (o tı́pica) de estos números sea la más pequeña posible.

M
CA
79. Explique (máximo en tres lı́neas) para qué sirve el Teorema de Chebyshev.
80. El siguiente conjunto de datos ordenados corresponden a los tiempos de sobrevivencia

(en horas) de unas ratas de laboratorio expuestas a un cierto veneno. El objetivo de la
investigación es comprobar la efectividad de dicho veneno:
0.03 0.11 0.23 0.33 0.61 0.93 1.11 1.40 1.91 2.63
0.03 0.12 0.24 0.36 0.73 0.97 1.14 1.44 1.93 2.66
0.04 0.14 0.29 0.47 0.85 0.99 1.18 1.71 1.96 2.93
E
0.05 0.22 0.29 0.51 0.86 1.05 1.21 1.79 2.21 3.20
AD
0.07 0.22 0.31 0.60 0.86 1.06 1.35 1.88 2.34 3.53
c.1 ¿Qué porcentaje de ratas sobreviven menos de 2 horas?
-I I
c.2 ¿por encima de qué tiempo sobrevive el 10 % de las ratas?

22

20
correspondiente
c.4 ¿Cuál es el tiempo promedio de sobrevivencia? Interprete el resultado.
d ) Calcule e interprete en términos del problema, la mediana y la desviación estándar

de lostiempos agrupados. ¿Qué tipo de sesgo tiene la distribución de los tiempos
de sobrevivencia?
e) Calcule exactamente el tiempo de sobrevivencia que es excedido por el 25 % de las
ratas.
f ) Calcule exactamente el tiempo de sobrevivencia que es excedido por el 75 % de las
ratas.
81. Se ha realizado una encuesta en 30 hogares en la que se les pregunta el número de

EP
individuos que conviven en el domicilio habitualmente. Las respuestas obtenidas han

UD
sido las siguientes:
4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
A
IM
¿por qué?
-L

S
PU

M
d ) ¿Qué proporción de hogares está compuesto por tres o menos personas?

CA
e) ¿En cuántos hogares habitan más de 4 individuos pero menos de 8?

f ) ¿Qué proporción de individuos vive en hogares con tres o menos miembros ?
g) ¿Cuál es el número promedio de individuos que conviven en un domicilio cualquiera
de los encuestados?
82. Los responsables de calidad realizan periódicamente un análisis de la medición del

trabajo con el fin de determinar el tiempo requerido para generar una unidad de
producción. En una planta de procesamiento se registró durante 20 dı́as el número
E
de horas-obrero totales requeridas para realizar cierta tarea. Los datos recogidos son:
AD
95,97,100,106,109,111,112,116,119,124,124,125,128,131,131,132,133,135,135,145

-I I
83. Se ha registrado la cantidad de accidentes ocurridos en los últimos 21 meses en una

22
empresa productora de alimentos y se obtuvieron los siguientes datos:

20
1, 4, 1, 3, 5, 3, 2, 4, 1, 0, 2, 3, 2, 3, 2, 1, 0, 3, 1, 0, 1
¿por qué?

d ) ¿En qué porcentaje de meses hubo como máximo 1 accidente?
e) ¿En cuántos meses se produjeron más de 2 accidentes pero menos de 5?
f ) ¿En qué porcentaje de meses hubo más de 4 accidentes?
84. Javier Torres administra una cabina de internet y está buscando introducir mejoras
en el servicio. Para tal fin, Javier registró los tiempos (en minutos) que utilizaron 56
EP
usuarios de la cabina de internet.

UD
22.82 26.52 28.66 29.16 29.99 31.22 33.17

24.43 26.58 28.92 29.17 30.04 31.23 33.23
24.64 27.06 28.98 29.20 30.08 31.75 33.44
A
IM
24.70 27.09 29.04 29.36 30.18 32.09 34.06

-L
25.43 27.27 29.05 29.44 30.20 32.21 34.09

S
25.85 27.36 29.05 29.89 30.38 32.38 34.28

PU
26.33 27.38 29.05 29.90 30.92 32.48 34.55

M
CA
26.42 27.66 29.06 29.96 31.20 33.04 34.90
estudio.
c.1 ¿Qué porcentaje de usuarios emplean la cabina de internet por debajo de 28
minutos?
E
AD
c.2 ¿por encima de qué tiempo de uso se encuentran los tiempos de aproximada-
mente 26 % de los usuarios?
correspondiente
d ) Calcule e interprete en términos del problema, la media, la mediana y la desviación
estándar de las tiempos agrupados. ¿Qué tipo de sesgo tiene la distribución de los
tiempos?
e) Calcule exactamente el tiempo que es excedido por el 75 % de los usuarios.
-I I
22
f ) Calcule exactamente el tiempo que es excedido por el 25 % de los usuarios.

20
85. Los siguientes datos corresponden a la estatura en cm de los alumnos de un determinado

salón de clase:
150,169,171,172,172,175,176,177,178,179,181,182,183,184,184.

b) Calcule el rango intercuartı́lico y explique si existe algún tiempo de hospitalización
atı́pico. En caso de que existan diga cuáles son. Si no hay sustento se invalida su
respuesta.
86. En un puerto se controla diariamente la entrada de barcos pesqueros según su tonelaje,

resultando para un cierto dı́a los siguientes datos:
EP
Peso (toneladas métricas) [5 − 25⟩ [25 − 45⟩ [45 − 65⟩ [65 − 85⟩ [85 − 105]
N° de barcos
UD
5 17 30 25 3
a) Obtenga la desviación tı́pica de los pesos e interprétela.

A
IM
b) ¿Qué tipo de sesgo tiene la distribución de los pesos agrupados?

-L
87. El número de asignaturas en el que se matriculó una muestra de 100 alumnos en un

S
PU
semestre pasado, se distribuyó de la siguiente manera:

M
N° de asignaturas (X) 1 2 3 4 5 6
CA
N° de alumnos (f) 15 16 30 25 9 5
a) Halle e interprete la desviación tı́pica de este conjunto de datos.

b) Calcule los cuartiles e interprételos.
88. La distribución de las edades de una muestra de personas que contrajeron matrimonio
durante el año pasado en un distrito es la siguiente:
E
Edad (años) [18 − 28⟩ [28 − 38⟩ [38 − 48⟩ [48 − 58⟩ [58 − 68]
AD
N° de personas 80 136 46 16 6
a) Obtenga la desviación tı́pica de las edades e interprétela.

b) ¿Qué tipo de sesgo tiene la distribución de las edades agrupadas?
89. En la fabricación de cierto tipo de bombillas se han detectado algunas defectuosas.

-I I
Se han estudiado 200 cajas de 100 bombillas cada una, obteniéndose la siguiente
22
distribución:
20
N° de bombillas defectuosas (X) 1 2 3 4 5 6 7 8

N° de cajas (f) 5 15 38 42 49 31 18 2
a) Hallar la moda y los cuartiles e interprete dichas medidas.

90. En una comunidad formada por 100 vecinos, éstos han sido clasificados atendiendo al
número de personas que forman cada familia:
N° de personas por familia (X) 1 2 3 4 5 6 7

N° de familias (f) 15 30 25 10 8 7 5
EP
UD
a) Hallar la moda y los cuartiles e interprete dichas medidas.

91. Un vendedor opera con dos empresas de las que percibe semanalmente alrededor de
A
165,66 y 216,87 dólares de comisión respectivamente. El importe de las comisiones
IM
que paga la primera empresa a sus vendedores es en promedio 114,46 dólares/semana

-L
y la desviación tı́pica es de 37,35 dólares/semana. La segunda empresa presenta

S
una comisión media de 191,57 dólares/semana y una desviación estándar de 56,63

PU
dólares/semana. ¿En cuál de las dos empresas el importe de las comisiones es más
M
variable? Sustente su respuesta.

CA
92. Indique cuál serı́a la relación existente entre la media y la mediana en una distribución
de datos con sesgo negativo. Explique claramente a qué se debe dicha relación.
93. Explique claramente qué es el percentil 23 de un conjunto ordenado de datos.
94. Un joven que desea adquirir un par de zapatillas deportivas, entra a un negocio donde
tienen a la venta una gran variedad de tipos y marcas de dichas zapatillas. Consulta a
un vendedor, quien le suministra una lista con todas las variedades y sus respectivos
precios. El joven calcula rápidamente el promedio y la desviación estándar de dichos
E
precios que resultan de $68 y $17 respectivamente. Luego consulta al vendedor acerca
AD
de las formas de pago posibles y éste le informa que los precios de la lista corresponden
a pagos al contado en efectivo, pero que además puede pagar con tarjeta. Si paga con
tarjeta, el precio de lista sufre un recargo de $2 en concepto de gastos administrativos.
a) Calcular el promedio y la desviación tı́pica de los precios de las zapatillas

deportivas cuando el pago se efectúa con tarjeta.
b) ¿En cuál de las dos formas de pago posibles la variabilidad de los precios resulta
menor? (Justificar claramente la respuesta)
-I I
22
95. Indique cuál serı́a la relación existente entre la mediana y la media en una distribución
20
de datos con sesgo positivo. Explique claramente a qué se debe dicha relación.(máximo
4 renglones)
96. En un programa para la detección de hipertensión, se toma una muestra de 30 pacientes

con edades entre 30 y 40 años y se observa que en dicha muestra la presión sanguı́nea
diastólica mı́nima y máxima es de 60 mm de Hg y 120 mm de Hg respectivamente.
Tales presiones se tabulan en una distribución de frecuencias agrupadas de 6 intervalos
de igual tamaño. Si se sabe que 3 hombres tienen al menos 60 mm de Hg de presión,
pero menos de 70 mm de Hg de presión; que 9 hombres tienen presión menor a 80
mm de Hg de presión; 16 hombres tienen presión menor a 90 mm de Hg de presión; 25
hombres tienen presión menor a 100 mm de Hg de presión; 27 hombres tienen presión
menor a 110 mm de Hg de presión y el 10 % restante de hombres tienen al menos una
EP
presión igual a 110 mm de Hg y a lo más de 120 mm de Hg. Se le pide lo siguiente:

UD
a) Defina la variable de interés y de qué tipo es. Defina la “frecuencia” en términos

del problema.
b) Reconstruir la tabla de distribución de las presiones agrupadas.
A
IM
c) Basándose en la distribución que ha elaborado, diga aproximadamente

-L
c.1 ¿Qué presión tiene como mı́nimo el 10 % de los pacientes?

S
c.2 ¿Qué porcentaje de pacientes tienen una presión menor a 90 mm de Hg?

PU
c.3 Grafique la ojiva de porcentajes.

M
c.4 ¿Cuál es la presión promedio de esa muestra de pacientes?¿Cuál es la mediana

CA
de dichos presiones? Interprete los resultados.
97. La Asociación de Propietarios de Hoteles llevó a cabo una encuesta relativa a las tarifas
de hotel entre semana. A continuación aparece la tarifa (en dólares) por cuarto para
huéspedes de negocios en una muestra de 10 hoteles:
78 80 87 88 97 101 101 103 106 110
Muestre los cálculos e interprete en términos del problema:

E
AD
a) La desviación tı́pica.
b) Los cuartiles.
98. Se ha realizado una encuesta a 31 hogares en la que se pregunta por el número de

celulares que poseen los miembros de la familia. Las respuestas obtenidas han sido las
siguientes:
1 4 4 1 3 5 3 2 4 1 6 2 3 4
5 5 6 2 3 3 2 2 1 8 3 5 3 4 7 2 3.
-I I
22
20

d ) ¿Cuál es el porcentaje de hogares en los que hay como máximo 2 celulares?
e) ¿Cuántos hogares tienen más de 2 y como máximo 4 celulares?

f ) ¿Qué porcentaje de hogares tienen más de 6 celulares?
g) Calcule e interprete en términos del problema, la media, la mediana y desviación
estándar de los datos.
99. Actualmente, existe una competencia creciente entre los operadores de estaciones de
servicio (grifos) en la ciudad de Ica. Los siguientes datos ordenados representan las
ventas diarias (miles de nuevos soles) en 40 grifos de la ciudad:
EP
17.9 25.6 28.2 30.0 31.7 35.1 37.3 37.9 38.9 39.0
UD
39.2 39.8 40.6 41.5 42.6 45.0 45.6 47.9 49.1 50.3
51.4 51.9 52.5 52.7 53.9 54.7 55.2 58.3 58.6 61.7
63.0 65.2 66.2 67.9 68.1 68.3 72.7 72.8 77.2 87.0
A
IM
-L
la frecuencia en términos del problema.

S
PU

M
CA
c.1. ¿Qué porcentaje de grifos tiene ventas diarias por debajo de 41000 nuevos
soles?
c.2. ¿por encima de qué nivel de ventas diarias se encuentran las ventas de
aproximadamente 23 % de los grifos?
c.3. Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente.
d ) Calcule e interprete en términos del problema, la media, la mediana y la desviación
estándar de las ventas agrupadas. ¿Qué tipo de sesgo tiene la distribución de las
E
ventas?
AD
e) ¿Cuál es exactamente el nivel de ventas que es excedido por el 25 % de los grifos?

f ) ¿Cuál es exactamente el nivel de ventas que es excedido por el 75 % de los grifos?
100. Se han medido los niveles de ozono alrededor de la costa norte. Las concentraciones de
magnitud alrededor de 220 unidades por billón pueden ocasionar quemaduras en los
ojos y son peligrosas para la vida animal. Se han obtenido los siguientes datos:
160 160 161 161 162 162 162 163 163 163 164 165 167 167 168
-I I
169 170 172 173 176 178 179 180 185 196
22
20

101. Una empresa ofrece asesorı́a financiera para solucionar deudas atrasadas con tarjetas
de crédito. Se realizó una encuesta a 10 jóvenes entre 18 y 25 años con una deuda en
su tarjeta de crédito por poco más de $5000, registrándose los montos (en dólares) que
cada uno de ellos pagó como abono a sus saldos el mes pasado:
435 465 495 505 515 545 550 555 565 630
EP
b) Los cuartiles.
UD
102. En un negocio de ventas de frutas del paı́s, se examinó un lote de 25 cajas de manzanas,
cada una teniendo un contenido de 48 manzanas. El número de manzanas en mal estado
en cada caja fue:
A
IM
3 4 1 2 1 2 5 2 1 2 3 0 1
-L
0 3 3 2 0 2 1 3 4 1 2 2
S
PU
M

CA
c) Elabore una distribución de frecuencias no agrupadas de los datos.

d ) ¿Cuál es el porcentaje de cajas que tienen como máximo 1 manzana en mal estado?
e) ¿Cuál es el número de cajas que tienen más de 2 manzanas en mal estado, pero
menos de 5?
f ) ¿Qué porcentaje de cajas tienen más de 4 manzanas en mal estado?
g) Calcule e interprete en términos del problema, el promedio, la mediana, la moda
y la desviación estándar de los datos.
E
AD
103. El sueldo promedio de los empleados de una empresa es de 134400 unidades monetarias.
El 30 % de los empleados son hombres y el porcentaje restante son mujeres. Si se sabe
que el sueldo promedio de los hombres es 40 % superior al sueldo promedio de las
mujeres ¿Cuál es el sueldo promedio de los hombres?¿y el sueldo promedio de las
mujeres? Explique la simbologı́a que defina y cálculos que realice.
104. A 48 madres de familia se les preguntó respecto al número de veces a la semana que
incluyen carne de res en el menú del dı́a. Las respuestas obtenidas fueron las siguientes:
-I I
2, 2, 1, 1, 3, 4, 0, 0, 0, 1, 1, 1, 2, 2, 1, 0, 0, 0, 0, 5, 5, 1, 2, 2,
22
1, 1, 1, 2, 1, 3, 4, 3, 4, 1, 2, 1, 1, 1, 2, 2, 2, 3, 5, 0, 0, 0, 2, 1.
20
¿por qué?

d ) ¿Cuántas madres incluyen carne de res en el menú diario, menos de 2 veces a la
semana?
e) ¿Qué porcentaje de madres de familia incluyen carne de res en el menú diario,
más de tres veces a la semana?
f ) ¿Cuántas veces en promedio se incluye la carne de res en el menú diario de las
madres encuestadas?
EP
105. La empresa textil DELTA contrata a una empresa que se dedica a preparar dietas
con el fin de mejorar la calidad nutricional del menú diario brindado en el comedor de
UD
empleados. La empresa contratada seleccionó una muestra de 50 empleados chequeando

sus pesos (kg.), obteniéndose los siguientes datos ordenados:
A
40.9 51.2 62.1 67.4 71.6 74.3 76.9 79.3 83.2 89.2
IM
41.8 52.7 62.3 67.9 71.7 74.6 76.9 80.2 85.7 90.4
-L
44.8 57.3 63.7 68.8 72.3 75.6 77.1 81.7 86.8 94.4
S
PU
46.4 60.2 65.2 70.4 73.2 75.8 77.4 82.1 87.3 94.6
M
49.9 61.4 67.3 71.4 73.6 76.3 78.3 82.9 88.3 99.3
CA
estudio.
c.1 ¿Qué porcentaje de empleados pesa menos de 66 kg.?
c.2 ¿Cuánto pesa como mı́nimo, el 22 % de los empleados?
E

AD
correspondiente
c.4 ¿Cuál es el peso promedio de esa muestra de empleados?¿Cuál es la mediana
de dichos pesos? Interprete los resultados.
c.5 Calcule e interprete en términos del problema la moda y la desviación estándar
de los pesos agrupados. ¿Qué tipo de sesgo tiene la distribución de los pesos?
c.6 ¿ Cuál es intervalo simétrico, alrededor del peso promedio, en el que se
encuentra por lo menos el peso del 70 % de los empleados?
-I I
c.7 Calcule exactamente el peso que excede al del 75 % de los empleados.

22
c.8 Calcule exactamente el peso que excede al del 25 % de los empleados.

20
106. El comité de seguridad vial de la municipalidad de Surquillo realizó el registro del

número de accidentes de tránsito ocurridos diariamente en el distrito durante un periodo
de 40 dı́as. La información obtenida fue la siguiente:
2, 5, 0, 1, 3, 2, 3, 4, 2, 2, 1, 1, 0, 2, 3, 1, 0, 6, 2, 0,
0, 2, 3, 1, 2, 0, 4, 1, 1, 3, 4, 0, 2, 6, 1, 1, 4, 2, 2, 4
¿por qué?
d ) ¿En cuántos dı́as ocurrieron entre 4 y 6 accidentes, inclusive?
EP
e) ¿En qué porcentaje de dı́as ocurrieron como máximo 2 accidentes de tránsito?

UD
f ) ¿Cuántos accidentes diarios en promedio ocurrieron?

g) ¿Cuál es la mediana del número de accidentes en el periodo analizado?
107. Se ha realizado un estudio sobre la amnesia postraumática tras una lesión en la cabeza.
A
Una variable estudiada es el tiempo de hospitalización en dı́as. Los datos ordenados
IM
obtenidos son los siguientes:

S -L
PU
8, 12, 20, 27, 30, 32, 35, 36, 40, 40, 40, 40, 41, 42, 45, 47, 50, 52, 61, 89, 108.
M

CA

b) Calcule el rango intercuartı́lico y explique si existe algún tiempo de hospitalización
atı́pico. En caso de que existan diga cuáles son. Si no hay sustento se invalida su
respuesta.
108. Se ha realizado una encuesta a 32 familias, y una de las preguntas realizadas hacı́a
referencia al número de celulares que poseen en el hogar. Las respuestas obtenidas han
sido las siguientes:
E
7, 6, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
AD
¿por qué?
d ) ¿Qué proporción de familias poseen menos de tres celulares?
e) ¿Cuántas familias poseen cuatro o más celulares pero menos de ocho?
-I I
22
f ) ¿Qué proporción de celulares es poseı́da en familias con menos de cuatro de estos

20
aparatos?
g) ¿Cuál es el número promedio de celulares poseı́dos en una familia cualquiera de
las encuestadas?
h) Elabore un diagrama escalonado de porcentajes.
109. El profesor del curso está interesado en estudiar los hábitos de sueño de los estudiantes
cuando acuden a la sala de lectura del segundo piso de la biblioteca. El profesor
registra el tiempo (en minutos) que demoran en quedarse dormidos los estudiantes
desde que empiezan a leer su material de estudio. A continuación se presentan los
tiempos ordenados registrados en una muestra de alumnos:
10.5 11.3 11.9 12.0 12.3 12.3 12.5 12.7 13.4 13.7
13.8 14.2 14.8 15.1 15.3 16.7 16.8 18.8 20.8
EP

UD
b) Calcule el rango intercuartı́lico y explique si existe algún tiempo atı́pico. En caso

de que existan diga cuáles son. Sustente su respuesta.
c) En la semana previa a los exámenes parciales, el profesor vuelve a realizar el mismo
A
IM
análisis con otra muestra de estudiantes que ocupan la sala de estudio de la bi-
blioteca. Registra los tiempos que demoran en quedarse dormidos esos estudiantes
-L
y construye un diagrama de caja-bigotes obteniendo el que aparece a continuación:

S
PU
M
CA
E
AD
c.1 ¿Qué porcentaje de alumnos se queda dormido antes de los 14 minutos en la

sala de estudio de la biblioteca?
c.2 ¿Cuánto podrı́a aumentar el tiempo máximo sin que cambie la mediana de
los tiempos?
110. La siguiente es la distribución de los coeficientes intelectuales (C.I) de los niños de

-I I
cuarto grado de una escuela primaria:

22
20
Coeficiente Intelectual (puntos) N° de niños

[70 − 78⟩ 4
[78 − 86⟩ 16
[86 − 94⟩ 45
[94 − 102⟩ 85
[102 − 110⟩ 54
[110 − 118⟩ 27
EP
[118 − 126⟩ 11
UD
[126 − 134] 2
a) Basándose en el rango intercuartı́lico, sustente ¿qué valores del coeficiente

intelectual se considerarı́an atı́picos?
A
b) Si una madre de familia afirma que la mitad de los niños del colegio tiene un
IM
coeficiente intelectual inferior al de su hijo,¿Qué coeficiente de inteligencia tiene

-L
su hijo?
S
PU
c) ¿Cuál es la moda de los coeficientes intelectuales?

M
111. La Figura 2.11 representa un gráfico de caja-bigotes correspondiente a las notas de 36

CA
alumnos que rindieron la segunda práctica calificada de la asignatura de Estadı́stica 1

en el semestre 2019-II. Observando el gráfico responda lo siguiente:
a) ¿Cuál es la mediana de las notas? ¿y el percentil 75 de las notas? ¿y el percentil 25

de las notas? Interprete en términos del problema, los valores que ha dado como
respuestas.
b) Calcule el rango intercuartı́lico y explique si existe alguna nota atı́pica. En caso
de que existan diga cuáles son. Sustente su respuesta.
E
AD
112. Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del
agua para consumo en términos de colonias de bacterias en un acuı́fero próximo a la
ciudad. Se toman muestras del agua y se obtienen los siguientes datos (del número de
colonias por 1000mm de agua) ordenados:
116, 139, 143, 147, 156, 156, 156, 158, 161, 161, 174, 188, 198, 220.

-I I
b) Calcule el rango intercuartı́lico y explique si existe algún número de colonias

22
20
atı́pico. En caso de que existan diga cuáles son. Si no hay sustento se invalida
su respuesta.
113. La concentración de sólidos suspendidos en el agua de un rı́o (medida en partes

por millón (ppm.) o miligramos por litro de agua) es una caracterı́stica ambiental
EP
UD
A
IM
S -L
PU
M
CA
Figura 2.11: Notas en la segunda práctica calificada de 36 alumnos.
importante. La Dirección General de Hidrologı́a y Recursos Hı́dricos, como parte de

sus actividades, programó una serie de comisiones de servicio a los distintos rı́os a
nivel nacional. El siguiente conjunto de datos ordenados representan la concentración
presente en muestras de 50 rı́os del paı́s:
E
AD
27.1 36.7 42.3 48.0 56.3 60.9 64.9 68.2 71.7 78.8
30.0 37.0 44.6 49.5 58.2 61.2 65.0 69.0 74.5 83.2
31.7 39.1 45.9 52.6 59.1 61.5 65.2 69.3 75.3 87.1
33.8 39.8 47.2 55.8 60.6 61.8 65.8 69.8 76.0 91.3
35.5 40.0 47.3 56.0 60.7 62.3 66.3 71.4 77.1 94.6
a) Defina la variable de interés, de qué tipo es y sustente qué nivel de medición tiene.
-I I
Defina la “frecuencia” en términos del problema.

22

20

c.1 ¿Cuál es la mı́nima concentración de sólidos presente en el 14 % de los rı́os
analizados?
c.2 ¿Qué porcentaje de rı́os presentan una concentración menor a 56.2 ppm.?
correspondiente
c.4 Calcule e interprete en términos del problema: la media, la mediana y la
desviación estándar de las concentraciones agrupadas.
c.5 Si compara la mediana y la media de las concentraciones agrupadas ¿Qué tipo
de sesgo tiene la distribución de las mismas?
c.6 ¿Cuál es intervalo simétrico, alrededor de la concentración promedio, en el
EP
que se encuentra como mı́nimo la concentración de sólidos del 63 % de los rı́os

analizados?
UD
c.7 Calcule exactamente la concentración que es superada por la del 75 % de los

rı́os.
c.8 Calcule exactamente la concentración que es superada por la del 25 % de los
A
rı́os.
IM
-L
114. En la empresa FusiónPerú S.A, el salario promedio mensual (en dólares) de los hombres
S
es 458.4 y el de las mujeres 425. Las desviaciones tı́picas de los salarios mensuales en los
PU
dos grupos son, respectivamente, 372.3 dólares y 311.25 dólares. Mostrando los cálculos
M
correspondientes responda lo siguiente:

CA
a) Relativamente,¿cuáles son más variables, los salarios de los hombres o los de las
mujeres?
b) El salario de Jorge es de 1200 dólares y el de Mariela es 1100 dólares.
Relativamente, ¿Cuál de ellos puede, dentro de su grupo, considerarse mejor
retribuı́do?
115. La empresa TELMIC S.A.C vende computadoras y ha llevado a cabo un estudio para
analizar el número de computadoras de escritorio que existe en pequeñas empresas del
distrito. Para tal efecto TELMIC S.A.C toma una muestra aleatoria de 40 pequeñas
E
AD
empresas y los datos recogidos se resumen en la siguiente distribución de frecuencias:
X frecuencia Frecuencia Porcentaje frecuencia frecuencia Porcentaje

relativa ( %) acumulada relativa acumulado
acumulada
3 5
4 0.175
-I I
5 14
22
6 47.5
20
7 8
8 0.175
9
a) Defina la variable de interés (X), de qué tipo es y qué nivel de medición tiene.
b) Defina la “frecuencia” en términos del problema.
c) Complete la distribución de frecuencias no agrupada de la variable en cuestión.
d ) Interprete, en términos del problema, los valores sombreados.
e) ¿Qué porcentaje de las empresas analizadas poseı́an como mı́nimo 8 computado-
ras?
f ) ¿Cuántas empresas poseı́an menos de 5 computadores?
EP
g) Calcule e interprete la media, mediana y desviación estándar de los datos.

UD
116. Suponga que las calificaciones obtenidas en los exámenes parciales por 100 estudiantes
universitarios en un curso de estadı́stica para negocios tenı́an una media de 70
puntos y una desviación estándar de 5 puntos. ¿Qué porcentaje mı́nimo de alumnos
obtuvieron una calificación entre 58 y 82 puntos, en los exámenes? Muestre los cálculos
A
IM
correspondientes para sustentar su respuesta.

-L
117. En un examen final de lógica la puntuación media de un grupo de 150 estudiantes fue
S
PU
de 78 y la varianza 64. En álgebra, sin embargo, la puntuación media final del grupo
fue de 73 y la desviación tı́pica 7.6. Mostrando los cálculos correspondientes, responda
M
lo siguiente: Relativamente,¿ En qué asignatura las notas fueron más variables?

CA
118. La empresa PAFPerú S.A.C instala puertas automáticas para cocheras. La siguiente
información indica el tiempo (en minutos) necesarios para tal instalación en una muestra
de 10 puertas:
24.6 28.3 32.4 32.7 38.2 40.0 42.7 44.4 46.0 54.5
E
AD
b) Los cuartiles.
119. Se seleccionó una muestra de libros al azar de una biblioteca. Si la extensión media de
los libros de esta muestra fue de 300 páginas con una desviación estándar de 20 páginas,
¿cuál es el porcentaje mı́nimo de libros que debe tener entre 200 y 400 páginas? Muestre
los cálculos correspondientes para sustentar su respuesta.
120. En tres plantas industriales que pertenecen a una misma compañı́a, se producen ciertos
componentes electrónicos. La producción mensual de cada una de ellas se resume en el
-I I
siguiente cuadro:
22
20
Planta A Planta B Planta C

Promedio mensual 140500 83200 254300
Desviación estándar 45325 33456 63350
El gerente de la compañı́a está realizando un análisis de la producción de las plantas, y

desea establecer una estrategia que optimice la producción y que reduzca la variabilidad.
Para iniciar el trabajo desea comparar la variabilidad en la producción de las plantas
para determinar en cuál de ellas se genera la mayor dispersión. Mostrando los cálculos
correspondientes, ayude al gerente a responder lo siguiente: Relativamente,¿en cuál de
las plantas es más variable la producción mensual?
121. A continuación se presenta la distribución de las inversiones mensuales (en dólares) de

una muestra de clientes de la Caja Municipal de Sullana (CMAC Sullana) y de una
EP
muestra de clientes de la Caja Municipal de Tacna (CMAC Tacna):

UD
CMAC Sullana CMAC Tacna

Inversión mensual Nro. de Inversión mensual Nro. de
(dólares) clientes (dólares) clientes
A
[1050 − 1250⟩ 120 [850 − 1150⟩ 100
IM
[1250 − 1450⟩ 400 [1150 − 1450⟩ 200

-L
[1450 − 1650⟩ 160 [1450 − 1750⟩ 480

S
[1650 − 1850⟩ 80 [1750 − 2050⟩ 100

PU
[1850 − 2050⟩ 32 [2050 − 2350⟩ 80

M
[2050 − 2250] 8 [2350 − 2650] 40

CA
a) Mostrando cálculos responda ¿Cuáles son más variables: las inversiones mensuales
de los clientes de CMAC Sullana o de CMAC Tacna?
b) Si compara la mediana y la media de las inversiones mensuales respectivas: ¿Qué
tipo de sesgo tiene la distribución de las inversiones en CMAC Sullana?
c) La microempresaria Milagros Ruiz es cliente de una de las CMAC mencionadas y
ha realizado una inversión mensual de 1580 dólares. Si dicha inversión no supera
el percentil 75, ¿De qué CMAC es cliente Milagros Ruiz? Sustente mostrando los
cálculos respectivos.
E
AD
d ) Mostrando cálculos responda ¿ Cuál es intervalo simétrico, alrededor de la

inversión mensual promedio en CMAC Tacna, en el que se encuentra como mı́nimo
el 72 % de las inversiones mensuales de los clientes de dicha CMAC?
122. La Figura 2.12 presenta las gráficas de caja y bigotes que muestran los datos de millas
por galón de gasolina utilizadas en la conducción en la ciudad para modelos de autos
pequeños y vehı́culos deportivos. Responda lo siguiente:
-I I
a) ¿Aproximadamente qué porcentaje de los vehı́culos deportivos obtienen más de 19

22
millas por galón?

20
b) ¿Cuál es el valor del rango o amplitud de las millas por galón utilizadas para el
caso de los autos pequeños?
c) ¿Aproximadamente qué porcentaje de los autos pequeños obtienen menos de 29
millas por galón?
EP
UD
A
IM
S -L
PU
M
CA
E
AD
Figura 2.12: Millas por galón de gasolina utilizadas en la conducción para modelos de autos pequeños
y vehı́culos deportivos.
d ) ¿Cuál es el valor del rango intercuartı́lico de las millas por galón utilizadas para
el caso de los vehı́culos deportivos?
e) ¿Hay valores atı́picos en el conjunto de datos referente a los vehı́culos deportivos?
Sustente su respuesta.
-I I
f ) ¿Hay valores atı́picos en el conjunto de datos referente a los autos pequeños?

22
Sustente su respuesta.
20
123. La Figura 2.13 presenta las gráficas de caja y bigotes de las duraciones (en segundos)
de las canciones de dos conciertos diferentes. Responda lo siguiente:
a) ¿Aproximadamente qué porcentaje de canciones en el concierto 2, duran más de

EP
UD
A
IM
S -L
PU
M
CA
E
AD
Figura 2.13: Duración de las canciones (en segundos) de dos conciertos.
275 segundos?
b) ¿Cuál es el valor del rango intercuartı́lico de las duraciones en el concierto 1?
c) ¿Aproximadamente qué porcentaje de canciones en el concierto 1, duran menos
de 200 segundos?
d ) ¿Cuál es el valor del rango o amplitud de las duraciones en el concierto 2?
-I I
e) ¿Hay duraciones atı́picas en el conjunto de datos referente al concierto 2? Sustente

22
su respuesta.
20
f ) ¿Hay duraciones atı́picas en el conjunto de datos referente al concierto 1? Sustente

su respuesta.
124. La Figura 2.14 presenta las gráficas de caja y bigotes de la cantidad de clientes que
poseen los gimnasios situados en los distritos de San Miguel y Santiago de Surco.
Responda lo siguiente:
EP
UD
A
IM
S -L
PU
M
CA
E
AD
Figura 2.14: Cantidad de clientes que poseen los gimnasios situados en los distritos de San Miguel y
Santiago de Surco.
a) ¿Aproximadamente qué porcentaje de los gimnasios de Santiago de Surco poseen

menos de 115 clientes?
b) ¿Cuál es el valor del rango o amplitud de la cantidad de clientes para el caso de
-I I
los gimnasios de San Miguel?

22
c) ¿Aproximadamente qué porcentaje de los gimnasios de San Miguel poseen más de

20
70 clientes?
d ) ¿Cuál es el valor del rango intercuartı́lico de la cantidad de clientes para el caso
de los gimnasios de Santiago de Surco?
e) ¿Hay valores atı́picos en el conjunto de datos referente a los gimnasios de Santiago

de Surco? Sustente su respuesta.
f ) ¿Hay valores atı́picos en el conjunto de datos referente a los gimnasios de San
Miguel? Sustente su respuesta.
EP
UD
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Capı́tulo 3
Probabilidad
EP
UD
3.1. Introducción
En el Capı́tulo 2 nos centramos en la Estadı́stica descriptiva. En dicho capı́tulo se
organizó un conjunto de datos en una distribución de frecuencias para resumirla y también
A
se calcularon medidas para describir las propiedades de centralización, variabilidad, forma y
IM
posición del conjunto analizado. Por tanto, la Estadı́stica descriptiva se ocupa de hacer ver
-L
algo que ya ha ocurrido, pues se trabaja con datos que tomamos como información de algo
S
que ya ha acontecido.
PU
Ahora veremos la segunda faceta de la Estadı́stica, especı́ficamente, el cálculo de la

M
posibilidad o probabilidad de que algo ocurrirá en el futuro. Este aspecto es el fundamento

CA
de la denominada inferencia estadı́stica o estadı́stica inferencial.

Los administradores sustentan sus decisiones en un análisis de incertidumbres como las
siguientes (Anderson y Sweeney, 2008):
1. ¿Qué posibilidades hay de que disminuyan las ventas si aumentamos los precios?
2. ¿Qué posibilidad hay de que un método nuevo de ensamblado aumente la productivi-

dad?
3. ¿Cuáles son las posibilidades de que el producto se tenga listo a tiempo?

E
AD
4. ¿Qué oportunidad existe de que un nuevo producto sea rentable?
Debido a que existe una incertidumbre considerable al tomar decisiones, resulta

importante que todos los riesgos implı́citos conocidos, se evalúen en forma cientı́fica. Ayuda
en esta evaluación la teorı́a de la probabilidad, a la que frecuentemente se denomina “ciencia
de la incertidumbre”. El empleo de tal teorı́a probabilı́stica permite a quien toma decisiones,
analizar -con información limitada- los riesgos y minimizar el azar inherente. Por ejemplo,
al lanzar un nuevo producto o aceptar un embarque recién llegado que contenga partes
-I I
defectuosas.
22
3.2. Probabilidad
20
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por

tanto, las probabilidades son una medida del grado de incertidumbre asociado con cada uno
de los eventos previamente enunciados. Si cuenta con las probabilidades, tiene la capacidad
de determinar la posibilidad de ocurrencia que tiene cada evento.
108
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 109
Los valores de probabilidad son proporciones o fracciones que se encuentran en una escala
de 0 a 1. Los valores cercanos a 0 indican que las posibilidades de que ocurra un evento
son muy pocas. Los cercanos a 1 indican que es casi seguro que ocurra un evento. Otras
probabilidades entre cero y uno representan distintos grados de posibilidad de que ocurra
un evento. Por ejemplo, si considera el evento “que llueva mañana”, se entiende que si el
pronóstico del tiempo dice “la probabilidad de que llueva es cercana a cero”, implica que casi
no hay posibilidades de que llueva. En cambio, si informan que la probabilidad de que llueva
es 0.90, sabe que es muy posible que llueva. La probabilidad de 0.50 indica que es igual de
posible que llueva como que no llueva.
EP
Como los conceptos de probabilidad son tan importantes en el campo de la inferencia

UD
estadı́stica (cuyo desarrollo se verá en capı́tulos posteriores), en este capı́tulo se introduce el

lenguaje básico de la probabilidad, incluyendo definiciones como experimento, evento, espacio
muestra, variable aleatoria, etc.
A
3.2.1. Definiciones
IM
En el contexto de la probabilidad, un experimento es definido como un proceso que

-L
genera resultados definidos. Y en cada una de las repeticiones del experimento, habrá uno
S
y sólo uno de los posibles resultados experimentales. Ejemplos de experimento pueden ser:
PU
Lanzar una moneda, lanzar un dado, elegir a una persona de un grupo de n personas, lanzar
M
n monedas o lanzar una moneda n veces, lanzar n dados o lanzar un dado n veces, Elegir k
CA
artı́culos de un conjunto de n artı́culos, elegir a 2 personas de un grupo de n personas, etc.

A los resultados de los experimentos se les denomina eventos, los cuales pueden ser
simples o compuestos. El evento simple es un resultado o un suceso que ya no puede
desglosarse en componentes más simples. Los eventos compuestos pueden contener dos o
más eventos simples.
Se denomina espacio muestra al conjunto de todos los eventos posibles de un
experimento. Al espacio muestra se le suele denotar con la letra S o con la letra griega
Ω.
Se define variable aleatoria como una función definida sobre un espacio muestra S,
E
AD
donde a cada evento (ei ) del espacio muestra le corresponde un número real:
X(ei ) = xi
Una variable aleatoria puede ser:
Discreta: si el número de eventos posibles es finito o numerablemente infinito.
Continua: si el número de eventos posibles es infinito (no numerable).

-I I
Dado un espacio muestra, se pueden definir varias variables aleatorias sobre él.
22
Para ilustrar estas definiciones veamos los siguientes ejemplos:

20
1. Si el experimento es lanzar una moneda, luego los posibles eventos o resultados son
cara(C) o sello(S), entonces el espacio muestra del experimento será: Ω = {C, S}.
2. Un experimento consiste en lanzar 2 monedas (o lanzar una moneda dos veces), luego
los posibles eventos simples son cuatro: CC, CS, SC, SS, entonces el espacio muestra
del experimento será: Ω = {CC, CS, SC, SS}.
Gráficamente, este espacio muestra se puede representar de dos formas, como se muestra
en la figura 3.1
EP
UD
A
IM
S -L
PU
Figura 3.1: Representaciones de espacio muestra del lanzamiento de dos monedas

M
CA
Para este espacio muestra se podrı́an definir por ejemplo las siguientes variables
aleatorias: X = N úmero de caras, Y = N úmero de sellos, Z = N úmero de caras −
N úmero de sellos, W = 2 ∗ N úmero de caras + (N úmero de sellos)2 , . . ., etc. En todos
estos casos la variable aleatoria es discreta.
3. Un experimento consiste en lanzar 2 dados (o lanzar un dado dos veces), luego los
posibles eventos simples son 36: (1,1), (1, 2), . . . , (6, 6), luego el espacio muestra del
experimento será: Ω = {(1, 1), (1, 2), . . . , (1, 6), . . . , (6, 6)}. En la figura 3.2 se representa
gráficamente este espacio muestra.
E
AD
4. Un experimento consiste en elegir aleatoriamente a un alumno y registrar la estatura

(en cm) del mismo. El espacio muestra en este caso estarı́a conformado por todas
las medidas posibles de estatura que podrı́amos encontrar. Este es un ejemplo de un
espacio muestra continuo pues sus elementos resultan de un proceso de medición y
están definidos sobre la recta de números reales.
3.2.2. Enfoques de la probabilidad

Existen diferentes formas para definir la probabilidad de un suceso. Se analizarán tres
-I I
enfoques: probabilidad clásica (a priori), empı́rica y subjetiva.

22
Antes de iniciar, presentamos las siguientes notaciones básicas: P denota una probabili-
20
dad, P(A) denota la probabilidad de que ocurra el evento A.

La probabilidad clásica se basa en la consideración de que los resultados de un
experimento son igualmente posibles. Empleando el punto de vista clásico, la probabilidad
EP
UD
A
Figura 3.2: Representación de espacio muestra del lanzamiento de dos dados
IM
-L
de que suceda un evento se calcula dividiendo el número de resultados favorables entre el

S
PU
número total de resultados posibles:

M
N úmero de resultados éxito o f avorables

CA
P (A) = (3.1)
N úmero total de posibles resultados
Por ejemplo, si consideramos el experimento de lanzar un dado normal. ¿Cuál es la
probabilidad del evento C=obtener un número par? Los resultados posibles del experimento
son: 1, 2, 3, 4, 5, 6 y son igualmente probables de ocurrir. Luego hay tres resultados
“favorables” 2, 4, 6 en el conjunto de seis resultados posibles. Por lo tanto:
N úmero de resultados éxito o f avorables 3

P (C) = = = 0.5
N úmero total de posibles resultados 6
Otra manera para definir la probabilidad es la probabilidad empı́rica la cual está basada
E
AD
en las frecuencias relativas, es decir, realice (u observe) un procedimiento un gran número

de veces y cuente las veces que el suceso A ocurre en realidad. Con base en estos resultados
reales, P(A) se estima de la siguiente forma:
N úmero de veces que ocurrió A

P (A) = (3.2)
N úmero total de observaciones
Suponga que se efectúa un estudio con 751 graduados en administración de empresas en

una Universidad. Este experimento reveló que 383 de los 751 no estaban empleados según su
principal área de estudio en la universidad. Por ejemplo, una persona que se graduó en un área
-I I
especializada en contabilidad, ahora es gerente de mercadeo de una empresa de procesamiento

22
de lácteos ¿Cuál es la probabilidad de que A=un graduado especı́fico en administración esté

20
empleado en un área distinta a la principal de sus estudios universitarios?
N úmero de veces que ocurrió A 383

P (A) = = = 0.51,
N úmero total de observaciones 751
puesto que 383 de 751, o sea, 0.51 en términos de probabilidad, están en un campo laboral
diferente al de su área académica en la universidad, podemos emplear esto como una
estimación de la probabilidad. En otras palabras, con base en la experiencia, existe una
probabilidad de 0.51 de que un graduado en administración esté empleado en un campo
distinto al de su área principal de estudios.
Por último, el enfoque subjetivo se aplica, si existe poca o ninguna experiencia en la cual
se pueda basar una probabilidad. Fundamentalmente, esto significa evaluar las opiniones
disponibles y otra información subjetiva para después estimar o asignar la probabilidad.
Atinadamente a este concepto se le denomina probabilidad subjetiva. La probabilidad
EP
de un suceso A, se estima con base en el conocimiento de las circunstancias relevantes. Un

UD
ejemplo de esto es cuando se trata de estimar la probabilidad de que mañana llueva y los
meteorólogos usan su conocimiento experto de las condiciones del tiempo para desarrollar
un estimado de la probabilidad. Otros ejemplos son responder a: ¿Cuál es la probabilidad de
que usted apruebe este curso? ¿Cuál es la probabilidad de que la selección peruana de fútbol
A
IM
clasifique al próximo mundial?

-L
3.2.3. Conceptos importantes

S
Evento imposible: Es aquel que no puede ocurrir al realizarse un experimento. Por

PU
ejemplo, si se lanza un dado normal, ¿Cuál es la probabilidad de obtener 9? o si se selecciona

M
una carta de una baraja ¿Cuál es la probabilidad de obtener una carta de diamante y trébol
CA
a la vez?
Complemento de un evento: El complemento de un evento A, consiste en todos los
resultados o eventos en los cuales dicho evento no ocurre. El complemento de A se denota
como A. Por ejemplo si lanzamos un dado normal y definimos el evento A=obtener 5, entonces
el complemento de A serı́a: A = No obtener 5.
Eventos mutuamente excluyentes: Un conjunto de eventos son mutuamente
excluyentes entre sı́, cuando realizado un experimento, dichos eventos no pueden ocurrir al
mismo tiempo. Por ejemplo: si lanzamos un dado normal y definimos los eventos: A=obtener
4 puntos o más, B=obtener 3 y C=Obtener 2 puntos o menos, podemos decir que A, B y C
E
AD
son eventos mutuamente excluyentes entre sı́.

Eventos colectivamente exhaustivos: Un conjunto de eventos es colectivamente
exhaustivo, si cuando realizado un experimento, uno de los eventos puede ocurrir. También se
dice que cuando un conjuntos de eventos es colectivamente exhaustivo es porque el conjunto
de eventos cubre la totalidad del espacio muestra del experimento. Por ejemplo: si lanzamos
un dado normal y definimos los eventos: A=obtener número mayor a 4, B=obtener número
menor a 4 y C=obtener 4, podemos decir que A,B y C son eventos colectivamente exhaustivos,
pues dichos eventos coleccionan exhaustivamente todos los resultados del experimento lanzar
-I I
un dado.
22
El siguiente enunciado se concluye de los conceptos vistos: “Si un conjunto de eventos es

20
colectivamente exhaustivo y los eventos son mutuamente excluyentes, entonces la suma de

sus probabilidades es igual a 1”.
Ejemplo: Si lanzamos un dado normal y definimos los eventos: A=obtener número mayor
a 4, B=obtener número menor a 4 y C=obtener 4, notamos que A, B y C son eventos
mutuamente excluyentes entre sı́ y al mismo tiempo constituyen un conjunto de eventos

2 3 1
colectivamente exhaustivo por lo que al ser: P (A) = , P (B) = , P (C) = , observamos
6 6 6
que: P (A) + P (B) + P (C) = 1.
Ejemplo: Si lanzamos un dado normal y definimos el evento A=obtener 5, y el
complemento de A como: A = No obtener 5, notamos que A y A son eventos mutuamente
excluyentes entre sı́ y al mismo tiempo constituyen un conjunto de eventos colectivamente
1 5
exhaustivo por lo que al ser: P (A) = , P (A) = , observamos que: P (A) + P (A) = 1.
6 6
3.2.4. Reglas de conteo
EP
Al asignar o calcular probabilidades es necesario saber identificar, entender y contar

UD
los resultados experimentales. En muchos problemas el experimento involucrado no es tan

simple, lo cual complica el conteo del número total de posibles resultados y el número de
éxitos que luego ayudarı́an a calcular la probabilidad de que acontezca un evento pedido. En
estas circunstancias se han desarrollado reglas muy útiles que ayudan a contar.
A
Regla de conteo N°1: Si cualquiera de los “k” eventos mutuamente excluyentes y
IM
colectivamente exhaustivos pueden ocurrir en cada uno de los “n” ensayos, el número de
-L
posibles resultados es igual a:

S
PU
k k . . . ∗ k} = k n .
| ∗ k ∗{z (3.3)
“n” veces
M
Lo que se debe entender es que un experimento se describe como una sucesión de “n” pasos
CA
(ensayos) en los que hay siempre “k” resultados (mutuamente excluyentes y colectivamente
exhaustivos) en cada paso (ensayo).
Ejemplo: Suponga que lanza una moneda al aire 2 veces (o lanza al aire 2 monedas, una
vez) ¿Cuál es el número de diferentes resultados posibles (la secuencia de caras y sellos)? Si
consideramos el experimento de lanzar una moneda ensayado 2 veces (n=2), entonces en el
primer ensayo (lanzamiento) tenemos k=2 resultados posibles (cara y sello), en el segundo
lanzamiento también tenemos k=2 resultados posibles, por lo tanto siguiendo la expresión
(3.3) tenemos: N úmero de posibles resultados = k ∗ k = 2 ∗ 2 = 22 = 4, los cuales se aprecian
E
en el diagrama de árbol de la figura 3.1.

AD
Ejemplo: Suponga que lanza un dado 2 veces (o lanza 2 dados una vez) ?Cuántos posibles
resultados diferentes pueden ocurrir? Si consideramos el experimento de lanzar un dado
ensayado 2 veces (n=2), entonces en el primer ensayo (lanzamiento) tenemos k=6 resultados
posibles (1,2,3,4,5,6), en el segundo lanzamiento también tenemos k=6 resultados posibles,
por lo tanto siguiendo la expresión (3.3) tenemos: N úmero de posibles resultados = k ∗ k =
62 = 36, los cuales se aprecian en el diagrama de la figura 3.2.
Regla de conteo N°2: Si hay “k1 ” eventos en el primer ensayo, “k2 ” eventos en
el segundo ensayo, y “kn ” eventos en el n-ésimo ensayo, entonces el número de posibles
-I I
resultados es igual a:
22
k1 ∗ k2 ∗ . . . ∗ kn . (3.4)
20
Ejemplo: El menú de un restaurante tienen un precio fijo para las cenas completas
que consisten en un aperitivo, un platillo principal, una bebida y un postre. Se tiene la
posibilidad de elegir entre 5 aperitivos, 10 platillos, tres bebidas y seis postres. ¿Cuál es
el número total de cenas posibles? Si consideramos el experimento de armar una cena

completa debemos entender que debemos elegir un aperitivo, un platillo, una bebida y un
postre, entonces en el primer ensayo (elegir un aperitivo) tenemos k1 = 5 opciones posibles,
en el segundo ensayo (elegir un platillo) tenemos k2 = 10 opciones posibles, en el tercer
ensayo (elegir una bebida) tenemos k3 = 3 opciones posibles, en el cuarto ensayo (elegir un
postre) tenemos k4 = 6 opciones posibles, por lo tanto siguiendo la expresión (3.4) tenemos:
N úmero de posibles resultados = k1 ∗ k2 ∗ k3 ∗ k4 ∗ = 5 ∗ 10 ∗ 3 ∗ 6 = 900 posibles cenas.
Regla de conteo N°3: Esta regla está relacionada con el cálculo de maneras en las que
un conjunto de “n” elementos puede arreglarse en orden. Por tanto, el número de maneras
EP
en que los “n” elementos de un conjunto puede arreglarse en orden es:

UD
n! = n ∗ (n − 1) ∗ (n − 2) ∗ . . . ∗ 1, (3.5)
donde n! se conoce como factorial de n. (Nota: 0!=1). Ası́ pues, entiéndase que los arreglos
A
difieren por el orden en el que están dispuestos sus elementos.
IM
Ejemplo: ¿De cuántas maneras diferentes se pueden alinear en una fila cinco personas
-L
para tomarse una foto? Siguiendo la expresión (3.5), se tendrı́a que el número de maneras o
S
sucesiones diferentes de las 5 personas serı́a: 5 ∗ 4 ∗ 3 ∗ 2 ∗ 1 = 5! = 120

PU
Regla de conteo N°4: En muchos casos se necesita saber el número de formas en las que
M
un subconjunto de “x” elementos, de un grupo total de “n” elementos, puede arreglarse

CA
en orden. A cada posible arreglo se le denomina permutación. Entonces se denomina

permutaciones al número de maneras para arreglar “x” elementos seleccionados de un total
de “n” elementos teniendo en cuenta que el orden de selección es relevante, y se calculan
ası́:
n!
Pxn = (3.6)
(n − x)!
Ejemplo: Si se tienen las letras: a, b, c ¿cuántas arreglos ordenados de 2 letras se pueden
formar? Si nos piden arreglos ordenados de x=2 letras de las n=3 letras que nos dan, se
podrı́an formar 6 permutaciones: ab, ba, ac, ca, bc, cb. Sabemos que hay 6 permutaciones
E
pues aplicando la expresión (3.6), tenemos:

AD
3! 3∗2∗1
P23 = = = 6 permutaciones
(3 − 2)! 1
Ejemplo: Si cinco corredores compiten en la final de los 100 m. ¿de cuántos maneras
pueden ganarse los tres primeros puestos? Analizar las maneras de ganar los tres primeros
puestos implica formar arreglos ordenados de x=3 corredores de los n=5 que compiten, por
tanto se trata de permutaciones, entonces siguiendo la expresión (3.6) tenemos:
-I I
5! 5 ∗ 4 ∗ 3 ∗ 2!
P35 = = = 5 ∗ 4 ∗ 3 = 60 maneras
22
(5 − 3)! 2!
20
Regla de conteo N°5: En muchos casos se necesita saber el número de formas en las que
un subconjunto de “x” elementos, de un grupo total de “n” elementos, puede arreglarse sin
considerar el orden de la selección. A cada posible resultado se le denomina combinación.
Entonces se denomina combinaciones al número de maneras de seleccionar “x” elementos de

un total de “n” elementos sin que el orden de selección importe, y se calculan ası́:
n!
Cxn = (3.7)
x!(n − x)!
Ejemplo: Si se tienen las letras: a, b, c ¿cuántas combinaciones de 2 letras se pueden

formar? Si nos piden formar grupos de x=2 letras (sin que importe el orden en la selección)
de las n=3 letras que nos dan, se podrı́an formar 3 combinaciones: ab, bc y ac. Sabemos que
hay 3 combinaciones pues aplicando la expresión (3.7), tenemos:
EP
3! 3 ∗ 2!
UD
C23 = = = 3 combinaciones
2!(3 − 2)! 2! ∗ 1!
Ejemplo: Un comité de 5 personas se va a seleccionar en un club de 12 miembros ¿De

cuántos modos puede seleccionarse ese comité?
A
Analizar las maneras de formar el comité de 5 personas implica formar grupos de x=5
IM
personas de las n=12 que existen. Para formar el comité, no interesa el orden en que se
-L
dispongan las 5 personas elegidas, entonces se trata de combinaciones, luego siguiendo la

S
PU
expresión (3.7) tenemos:

M
12! 12 ∗ 11 ∗ 10 ∗ 9 ∗ 8 ∗ 7!
C512 = = = 792 maneras
CA
5!(12 − 5)! 5!7!
3.3. Propiedades básicas de la probabilidad

Escala de la probabilidad
Sea S el espacio muestra de un experimento, entonces la P(S)=1. Es decir, la

probabilidad del evento seguro es 1.
La probabilidad del evento imposible es 0: P(ϕ)=0

E
La probabilidad de un evento A es un número comprendido entre 0 y 1: 0 ≤ P (A) ≤ 1

AD
Probabilidad del complemento de un evento: Sea A el complemento del evento A,

entonces: P(A)=1-P(A)
Ejemplo: En una bolsa hay 7 canicas azules, 3 verdes y 2 rojas. La probabilidad del
7
evento A = elegir una canica azul, es: P (A) = . El complemento de A es A= elegir
12
5
una canica verde o roja, luego su probabilidad será: P (A) = . Observe que todos
12
los eventos elementales (las 12 canicas) se han tenido en cuenta en A o en A. La suma
-I I
de todos los casos favorables es entonces igual al número de casos posibles. Por tanto:
7 5
22
P (A) + P (A) = + = 1 ⇒ P (A) = 1 − P (A)

12 12
20
3.3.1. Ley de adición de probabilidades

La ley de la adición sirve para para calcular probabilidades que pueden expresarse de la
forma P(A o B), es decir, la probabilidad de que ocurra el evento A o de que ocurra el evento
B (o de que ambos ocurran), como único resultado de un experimento. Para aplicar esta ley
debemos entender si los eventos involucrados son mutuamente excluyentes o no.
Nota:Recuerde que dos eventos A y B son mutuamente excluyentes si, cuando un evento
ocurre, el otro no puede ocurrir. Por tanto, para que A y B sean mutuamente excluyentes,
se requiere que su intersección no contenga ningún evento en común.
Ley especial de la adición:
Si dos eventos A y B, son mutuamente excluyentes, se cumple que:

EP
P (A o B) = P (A) + P (B) (3.8)

UD
Ejemplo: Suponga que lanza un dado ¿cuál es la probabilidad de que se obtenga

un número mayor de 4 o un número menor de 2? Se aprecia que el experimento
es claramente, lanzar un dado, el cual tiene 6 resultados posibles. Si definimos los
eventos: A= Obtener un número mayor de 4={5, 6} y B= Obtener un número
A
IM
menor de 2={1}, claramente A y B son eventos mutuamente excluyentes, por lo

que, empleando la expresión (3.8), la probabilidad de que ocurra uno u otro serı́a:
-L
2 1 3 1
S
P (AoB) = P (A) + P (B) = + = =

PU
6 6 6 2
La ley especial de la adición se puede extender a 2 o más eventos mutuamente
M
excluyentes, ası́:
CA
P (E1 o E2 o E3 o . . . o En ) = P (E1 ) + P (E2 ) + . . . + P (En ) (3.9)
Ejemplo: Suponga que lanza dos dados ¿Cuál es la probabilidad de que se obtenga
una suma igual a 5 ó una suma igual a 8 ó una suma igual a 10?
Se aprecia que el experimento es claramente, lanzar dos dados, el cual tie-
ne 36 resultados posibles. Si definimos los eventos: A= Obtener suma igual a
5={(1, 4); (2, 3); (3, 2); (4, 1)}, B= Obtener suma igual a 8={(2, 6); (3, 5); (4, 4); (5, 3); (6, 2)}
E
y C=Obtener suma igual a 10={(4, 6); (5, 5); (6, 4)}, claramente A,B y C son eventos
AD
mutuamente excluyentes entre sı́, por lo que, empleando la expresión (3.9), la probabili-
4 5 3
dad de que ocurra uno u otro serı́a: P (AoBoC) = P (A)+P (B)+P (C) = + + =
36 36 36
12 1
=
36 3
Ley general de la adición:
Si dos eventos A y B, no son mutuamente excluyentes, se cumple que:

-I I
P (A o B) = P (A) + P (B) − P (AyB) (3.10)

22
donde P(A y B) denota la probabilidad de que A y B ocurran al mismo tiempo como

20
resultado en un ensayo del experimento.

Ejemplo: Suponga que lanza un dado ¿Cuál es la probabilidad de que se obtenga un
número mayor de 3 o un número par?
Se aprecia que el experimento es claramente, lanzar un dado, el cual tiene 6 resultados

posibles. Si definimos los eventos: A= Obtener un número mayor de 3={4, 5, 6} y
B= Obtener un número par={2, 4, 6}, claramente A y B no son eventos mutuamente
excluyentes, ya que los eventos 4 y 6 son comunes a ambos eventos. Entonces empleando
la expresión (3.10), la probabilidad de que ocurra A o B serı́a: P (AoB) = P (A)+P (B)−
3 3 2 4 2
P (AyB) = + − = = .
6 6 6 6 3
La clave aquı́ es entender que para calcular la probabilidad de que un evento A ocurra
o un evento B ocurra, se calcula el número total de formas en que A puede ocurrir
EP
y el número de formas en que B puede ocurrir, y, si hay eventos comunes, se debe

compensar restando el número de resultados que se contaron dos veces.
UD
Ejemplo: Se tiene una baraja de 52 cartas, y se selecciona aleatoriamente una carta

¿Cuál es la probabilidad de que la carta sea roja o un as?
Se aprecia que el experimento es claramente, elegir una carta de las 52 que hay, el
A
cual tiene 52 resultados posibles. Si definimos los eventos: A= Obtener una carta roja
IM
y B= Obtener un as, claramente A y B no son eventos mutuamente excluyentes, ya

-L
que en la baraja existen 2 ases que son rojos, es decir son comunes a ambos eventos.
S
PU
Entonces empleando la expresión (3.10), la probabilidad de que ocurra A o B serı́a:

26 4 2 28 7
P (AoB) = P (A) + P (B) − P (AyB) = + − = = .
M
52 52 52 52 13
CA
La ley general de la adición se puede extender a 2 o más eventos, ası́:

X
P (E1 o E2 o E3 o . . . o En ) = P (E1 ) + P (E2 ) + . . . + P (En ) − P (Ei yEj ) +
X
+ P (Ei yEj yEk ) − . . . ± P (E1 y E2 y E3 y . . . y En ) (3.11)
Ejemplo: Suponga que lanza un dado ¿Cuál es la probabilidad de que se obtenga un

número par o un número menor de 3 o un número entre 2 y 4, inclusive?
Se aprecia que el experimento es claramente, lanzar un dado, el cual tiene 6 resultados
E
posibles. Si definimos los eventos: A= Obtener un número par={2, 4, 6}, B= obtener

AD
un número menor de 3 ={1, 2} y C=Obtener un número entre 2 y 4, inclusive={2, 3, 4},

claramente A,B y C no son eventos mutuamente excluyentes entre sı́, por lo que,
empleando la expresión (3.11), la probabilidad de que ocurra A o B o C serı́a:
P (AoBoC) = P (A) + P (B) + P (C) − P (AyB) − P (AyC) − P (ByC) + P (AyByC)

3 2 3 1 2 1 1 5
= + + − − − + =
6 6 6 6 6 6 6 6
-I I
3.3.2. Ley de multiplicación de probabilidades

22
En la sección 3.3.1 se presentó la ley de la suma para calcular P(A o B), la probabilidad de
20
que un solo ensayo tenga un resultado de A o B o ambos eventos. En esta sección se presenta
la ley básica de la multiplicación, la cual se utiliza para calcular P(A y B)1 , la probabilidad
1
En esta sección, P(A y B) sirve para denotar la probabilidad de que el evento A ocurra en un ensayo,
seguido por el evento B en otro ensayo. En la sección 3.3.1, P(A y B) denotó la probabilidad de que tanto
de que el suceso A ocurra en un primer ensayo y que el suceso B ocurra en un segundo ensayo,
es decir, un resultado entendido como una secuencia de eventos. Si el resultado del primer
evento A afecta de alguna forma la probabilidad del segundo evento B, es importante ajustar
la probabilidad de B para que refleje la ocurrencia del suceso A. La ley para el cálculo de
P(A y B) se denomina ley de la multiplicación porque implica multiplicar la probabilidad
del evento A por la probabilidad del evento B (donde la probabilidad del evento B se ajusta
por el resultado del evento A).
Para aplicar la ley de la multiplicación debemos entender si los eventos involucrados son
independientes o no.
EP
Ley especial de la multiplicación:

UD
Si dos eventos A y B son independientes, entonces la probabilidad de que ocurran A y

B, será:
P (A y B) = P (A) ∗ P (B) (3.12)
A
Dos eventos A y B son independientes cuando la ocurrencia de uno no afecta la
IM
probabilidad de la ocurrencia del otro.

-L
Ejemplo: Se lanzan dos monedas al aire ¿Cuál es la probabilidad de que ambas caigan
S
PU
cara?
M
Se aprecia que el experimento es claramente, lanzar dos monedas. Si vemos este

CA
experimento como si tuviéramos que lanzar una moneda dos veces, la naturaleza de
los resultados serı́an los mismos. Entonces con esa idea, el resultado pedido (obtener
2 caras) lo entendemos como la secuencia de eventos: A= Obtener cara en el primer
lanzamiento y B= Obtener cara en el segundo lanzamiento y claramente A y B son
eventos independientes entre sı́, por que lo que se obtenga en el primer lanzamiento no
influirá en el resultado del segundo. Ası́ empleando la expresión (3.12), la probabilidad
1 1 1
de que ocurra A y B en secuencia serı́a: P (AyB) = P (A) ∗ P (B) = ∗ = .
2 2 4
E
AD
Figura 3.3: Diagrama de árbol del lanzamiento de dos monedas o de lanzar una moneda dos veces
-I I
22
Como se aprecia en la Figura 3.3 cada resultado del experimento viene dado por un
20
camino del diagrama en árbol; si indicamos sobre cada rama su probabilidad, vemos que
A como B ocurran en el mismo ensayo. Por lo tanto, el verdadero significado de P(A y B) sólo se determina
sabiendo si nos referimos a dos ensayos en donde el evento A ocurra en el primer ensayo y el evento B ocurra
en el segundo o si nos referimos a un solo ensayo que puede tener resultados de A y B al mismo tiempo. Ası́
pues, el significado de P(A y B) dependerá del contexto que se enfrente.
podemos obtener la probabilidad del camino pedido multiplicando las probabilidades

de cada una de sus ramas.
La ley especial de la multiplicación se puede extender a 2 o más eventos independientes,

diciendo que la probabilidad de que ocurran conjuntamente “n” eventos independientes,
uno tras otro, es:
P (E1 y E2 y E3 y . . . y En ) = P (E1 ) ∗ P (E2 ) ∗ P (E3 ) ∗ . . . ∗ P (En ) (3.13)

EP
Ejemplo: Una fábrica elabora los productos A, B, C y D mediante cuatro procesos

que son independientes entre sı́. Usualmente son defectuosos el 3 %, 5 %, 5 % y 4 % de
UD
los productos A, B, C y D respectivamente. Si se extrae aleatoriamente un producto

de cada tipo:
a) ¿Cuál es la probabilidad de que los cuatro sean defectuosos?

A
IM
Se aprecia que el experimento es claramente,elegir 4 productos, uno de cada tipo.

Si vemos los resultados de este experimento como una secuencia de extracciones,
-L
el resultado pedido (4 productos defectuosos) lo entendemos como la secuencia de

S
PU
eventos: Ad = Obtener un producto A defectuoso y Bd = Obtener un producto B

M
defectuoso y Cd = Obtener un producto C defectuoso y Dd = Obtener un producto

CA
D defectuoso. Luego al ser cada proceso independiente del otro, entonces al elegir
un producto del tipo A, esta elección no influirá en la elección de un producto del
tipo B, C o D. Luego al ser extracciones o elecciones independientes, empleando
la expresión (3.13), la probabilidad pedida será:
P (Ad y Bd y Cd y Dd ) = P (Ad )∗P (Bd )∗P (Cd )∗P (Dd ) = 0.03∗0.05∗0.05∗0.04 = 3∗10−6
b) ¿Cuál es la probabilidad de que A y B sean defectuosos, y C y D no lo sean? El

resultado pedido (A y B sean defectuosos, y C y D no lo sean) lo entendemos como
E
la secuencia de eventos: Ad = Obtener un producto A defectuoso y Bd = Obtener

AD
un producto B defectuoso y Cb = Obtener un producto C bueno y Db = Obtener

un producto D bueno, luego la probabilidad pedida será:
P (Ad y Bd y Cb y Db ) = P (Ad )∗P (Bd )∗P (Cb )∗P (Db ) = 0.03∗0.05∗0.95∗0.96 = 1.368∗10−3
Ejemplo: Se lanza un dado cinco veces.
a) ¿Cuál es la probabilidad de que sólo los 3 primeros lanzamientos sean 6?

-I I
Se aprecia que el experimento es claramente,lanza un dado cinco veces. Si vemos los

22
resultados de este experimento como una secuencia de lanzamientos, el resultado

20
pedido (que sólo los 3 primeros lanzamientos sean 6) lo entendemos como la

secuencia de eventos: 1L6 = Obtener 6 en el primer lanzamiento y 2L6 = Obtener
6 en el segundo lanzamiento y 3L6 = Obtener 6 en el tercer lanzamiento y 4Lno6 =
No Obtener 6 en el cuarto lanzamiento y 5Lno6 = No Obtener 6 en el quinto
lanzamiento. Luego al ser cada lanzamiento independiente del otro (por que lo
que se obtenga en un lanzamiento no influirá en el resultado que se obtenga en
los otros lanzamientos) empleamos la expresión (3.13) para hallar la probabilidad
pedida:
P (1L6 y 2L6 y 3L6 y 4Lno6 y 5Lno6 ) =

1 1 1 5 5
= P (1L6 ) ∗ P (2L6 ) ∗ P (3L6 ) ∗ P (4Lno6 ) ∗ P (5Lno6 ) = ∗ ∗ ∗ ∗ =
6 6 6 6 6
13 ∗ 52 25
= 5
=
6 7776
EP
UD
b) ¿Cuál es la probabilidad de que exactamente en tres de esos cinco lanzamientos

salga el seis?
El resultado pedido (que exactamente en tres de esos cinco lanzamientos salga
el seis), tiene muchas formas de ocurrir. Una podrı́a ser la que se definió en
A
el apartado a), pero no es la única pues los tres seises podrı́an haber ocurrido
IM
en cualesquiera 3 de los 5 lanzamientos. Entonces para calcular la probabilidad

-L
pedida debemos multiplicar la probabilidad de una secuencia particular (la del

S
PU
apartado a) por ejemplo) por el número de formas en que podemos tener a los
3 seises dispuestos en los 5 lanzamientos, lo cual se calcula con C35 . Entonces la
M
probabilidad pedida es:

CA
P (obtener exactamente 3 seises) =

= P (1L6 y 2L6 y 3L6 y 4Lno6 y 5Lno6 ) ∗ C35 =
= P (1L6 ) ∗ P (2L6 ) ∗ P (3L6 ) ∗ P (4Lno6 ) ∗ P (5Lno6 ) ∗ C35 =
1 1 1 5 5
∗ ∗ ∗ ∗ ∗ C35 =
6 6 6 6 6
13 ∗ 52 250
= 5
∗ C35 =
6 7776
E
Ley general de la multiplicación:

AD
Si dos eventos A y B no son independientes, entonces la probabilidad de que ocurran

A y B, uno tras otro, será:
P (A y B) = P (A) ∗ P (B \ A) (3.14)
donde P (B \ A) se denomina probabilidad condicional. La notación \ indica que se está

considerando la probabilidad del evento B dada la condición de que el evento A ha ocurrido.
-I I
Por tanto, la notación P (B \ A) se lee “la probabilidad de B dado A”.

22
La probabilidad condicional de un evento es un concepto importante porque es una

20
probabilidad obtenida con la información adicional de algún otro evento que ya ocurrió.
Entonces de la expresión (3.14), puede calcularse P (B \ A), dividiendo la probabilidad de
que ambos eventos A y B ocurran entre la probabilidad del evento que ocurrió A:
P (A y B)
P (B \ A) = (3.15)
P (A)
La expresión (3.15) permite hallar la probabilidad condicionada a partir de las
probabilidades calculadas considerando todo el espacio muestral inicial del experimento
involucrado. Desde el punto de vista práctico, cuando se condiciona a un evento, realmente
se produce una reducción del espacio muestra: se sabe no sólo que el resultado obtenido es
un evento del espacio muestra sino que concretamente está en A, por lo que el conjunto de
posibles resultados de los que ahora se parte es A.
EP
Ejemplo: Una caja contiene 4 canicas azules y 6 rojas. Si se extraen dos aleatoriamente,
UD
una tras otra y sin reemplazo:
a) ¿Cuál es la probabilidad de que sean azules?

Se aprecia que el experimento es claramente, extraer dos canicas sin reemplazo. Si
A
vemos los resultados de este experimento como una secuencia de dos extracciones, el
IM
resultado pedido (que las dos canicas sean azules) lo entendemos como la secuencia de
-L
eventos: Ai : la i-ésima canica extraı́da sea azul y Ri : la i-ésima canica extraı́da sea roja,
S
donde i=1,2. Luego al ser cada extracción dependiente de la otra (por que el muestreo
PU
es sin reemplazo, es decir, la segunda extracción se realiza teniendo una canica menos
M
del total inicial, lo cual la hace dependiente de la primera extracción) empleamos la

CA
expresión (3.14) para hallar la probabilidad pedida:
4 3 12 2
P (A1 y A2 ) = P (A1 ) ∗ P (A2 \ A1 ) = ∗ = =
10 9 90 15
b) ¿Cuál es la probabilidad de que la primera sea azul y la segunda sea roja?
4 6 24 4
P (A1 y R2 ) = P (A1 ) ∗ P (R2 \ A1 ) = ∗ = =
10 9 90 15
E
c) ¿Cuál es la probabilidad de que una sea azul y otra sea roja?

AD
P (una azul y otra roja) = P (A1 y R2 ) + P (R1 y A2 ) =

4 6 6 4 48 8
= P (A1 ) ∗ P (R2 \ A1 ) + P (R1 ) ∗ P (A2 \ R1 ) = ∗ + ∗ = =
10 9 10 9 90 15
d) ¿Cuál es la probabilidad de elegir al menos una azul?
P (al menos una azul) = P (Obtener una azul) + P (Obtener dos azules) =
4 6 6 4 4 3 60 2
= P (A1 y R2 ) + P (R1 y A2 ) + P (A1 y A2 ) = ∗ + ∗ + ∗ = =
-I I
10 9 10 9 10 9 90 3
22
o también:
20
P (al menos una azul) = 1 − P (Obtener ninguna azul) = 1 − P (Obtener dos rojas) =
6 5 30 60 2
= 1 − P (R1 y R2 ) = 1 − P (R1 ) ∗ P (R2 \ R1 ) = 1 − ∗ =1− = =
10 9 90 90 3
Ejemplo: Se lanza un dado y se sabe que el resultado fue impar ¿Cuál es la probabilidad
de que haya salido un cinco?
1
Si se lanza un dado, la probabilidad de que salga un cinco es:P (obtener 5) = , ya que
6
el espacio muestra es Ω = {1, 2, 3, 4, 5, 6}. Sin embargo, si sabemos que hemos obtenido
un resultado impar:{1, 3, 5}, la probabilidad de que haya salido un cinco es:P (obtener 5 \
1
{1, 3, 5}) = .
3
En este ejemplo tendrı́amos dos eventos B=obtener 5 y A={1, 3, 5}. Si sabemos que el
resultado obtenido ha sido impar, es decir, ha ocurrido A, en realidad el espacio muestral,
conjunto de los posibles resultados, se ha reducido a Ω∗ = A = {1, 3, 5}.
EP
También podrı́amos calcular la probabilidad anterior utilizando el espacio muestral inicial,

UD
haciendo uso de la expresión (3.15):
1
P (A y B) P ({1, 3, 5} y {5}) 1
P (B \ A) = = = 6 =
3
A
P (A) P ({1, 3, 5}) 3
IM
6
-L
Ejemplo: En una ciudad se estudia la cantidad de usuarios de internet según el sexo.

S
Supongamos que se tienen los siguientes datos (Tabla 3.1) , en miles de individuos:
PU
M
Hombre Mujer Total

CA
Usa internet 40 35 75
No usa internet 185 240 425
Total 225 275 500
Tabla 3.1: Miles de usuarios de internet según el sexo en una ciudad
Si seleccionamos un ciudadano al azar y consideramos los eventos: I=Usar internet,

75 225
H=Ser hombre, se verifica que: P (I) = = 0.15 y P (H) = = 0.45. Además,
500 500
40
P (I y H) = = 0.08.
E
500
AD
Ahora, si seleccionamos aleatoriamente a un ciudadano varón,¿Cuál es la probabilidad de

que use Internet?
Según lo pedido, como ya sabemos que es un hombre el elegido, nos restringimos al
40
conjunto de 225 hombres (cambiamos de espacio muestral) y, entonces: P (I \ H) = =
225
0.1b
7.
Si aplicáramos la definición de probabilidad condicionada, expresión (3.15):
P (I y H) 0.08
P (I \ H) = = = 0.1b
7,
P (H) 0.45
-I I
obtendrı́amos el mismo resultado.

22
Nota:De la definición de probabilidad condicionada dada en la expresión (3.15) y los

20
ejemplos anteriores vemos que en general, la P (B \ A) no tiene porque ser igual a la P (B).
De hecho se tienen los siguientes casos:
P (B \ A) > P (B), se dice que A favorece la aparición de B.

P (B \ A) < P (B), se dice que A no favorece la aparición de B.
P (B \A) = P (B), se dice que la ocurrencia de A no altera la probabilidad de ocurrencia

de B, es decir, B y A son independientes.
En el ejemplo anterior, se deducı́a del cuadro 3.1 que:P (I) = 0.15; P (I \ H) = 0.1b
7. En
este caso, el evento I no es independiente del evento H. Es más, P (I) < P (I \ H), por lo que
la probabilidad de usar internet se incrementa cuando nos restringimos a los varones.
Por otro lado, si estudiamos la probabilidad de que una mujer escogida al azar use internet,
35 b < P (I), lo que nos dice que la probabilidad de usar
EP
tendrı́amos que: P (I \ H) = = 0.127

275
internet disminuye al restringirnos a las mujeres.
UD
En cambio si el cuadro que hubiéramos tenido fuera:
Hombre Mujer Total

A
Usa internet 90 110 200
IM
No usa internet 135 165 300

-L
Total 225 275 500

S
PU
200 90
Entonces: P (I) = = 0.40; P (I \ H) = = 0.40. En este caso, la probabilidad
M
500 225
de usar internet no varı́a cuando nos restringimos a los ciudadanos varones, por lo que I es
CA
independiente de H.
3.3.3. Teorema de la probabilidad total y Teorema de Bayes
La ley de multiplicación es útil para determinar la probabilidad de un evento que depende
o no de otros. En esta sección se verá otro modo de calcular la probabilidad de un evento
considerando a este como el resultado de la unión de otros eventos. Para esto es necesario
definir el concepto de partición del espacio muestral de un experimento, necesario para
poder enunciar luego el teorema de la probabilidad total y como consecuencia el teorema de
Bayes.
E
Sean los eventos E1 , E2 , E3 , . . . , EN una partición del espacio muestra S, es decir, todos
AD
mutuamente excluyentes, de tal forma que la unión de todos conformen el espacio muestral
S. Sea además un evento E, perteneciente a S, como se muestra (sombreado) en la figura 3.4:
-I I
22
20
Figura 3.4: Partición del espacio muestral S
El objetivo es definir ¿Cuál es la probabilidad de que ocurra el evento E?

Por lo visto sabemos que S = E1 ∪ E2 ∪ E3 ∪ . . . ∪ EN , entonces podemos escribir que:
P (E) = P (E y S) = P [E y (E1 o E2 o . . . o EN )]
P (E) = P (E y E1 ) o P (E y E2 ) o . . . o P (E y EN )
P (E) = P (E1 ) ∗ P (E \ E1 ) + P (E2 ) ∗ P (E \ E2 ) + . . . + P (EN ) ∗ P (E \ EN )
N
X
P (E) = P (Ei )P (E \ Ei ) (3.16)
i=1
EP
A la expresión (3.16) se le conoce como el Teorema de la probabilidad total, es decir,

UD
la probabilidad total de un evento es la suma exhaustiva de las probabilidades de todos los

casos mutuamente excluyentes que conducen a dicho evento.
Ejemplo: Una clase de estadı́stica avanzada está formada por 10 estudiantes de segundo
año, 30 de cuarto año y 10 graduados. Tres estudiantes de segundo año, 10 de cuarto año y 5
A
IM
graduados obtuvieron una calificación A. Si se selecciona al azar un estudiante de esta clase

¿Cuál es la probabilidad de que haya obtenido una calificación A?
-L
Claramente el experimento es seleccionar a un estudiante de esa aula, por lo que el

S
PU
espacio muestra lo conforman los 50 estudiantes de esa clase. Ese espacio muestra se ha
particionado en tres eventos mutuamente excluyentes y colectivamente exhaustivos que son:
M
CA
E1=ser alumno de segundo año, E2=ser alumno de cuarto año y E3=ser alumno graduado,
como se muestra en la figura 3.5
E
AD
Figura 3.5: Partición del aula en alumnos de segundo año, cuarto año y graduados
Ahora Si definimos el evento E=obtener calificación A, entonces entendemos que eso

puede ocurrir tanto con alumnos de segundo, cuarto y graduados, es decir el evento E se
relaciona con las partes en que fue dividido el espacio muestra del experimento. Si dibujamos
un diagrama de árbol se puede apreciar igualmente esto, tal como se muestra en la figura 3.6
-I I
Por el teorema de la probabilidad total según la expresión (3.16):

22
P
P (E) = N i=1 P (Ei )P (E \ Ei ) donde i=1,2,3, es decir, la probabilidad de que un alumno
20
obtenga calificación A es igual a la probabilidad de que sea de segundo año por la probabilidad
de obtener calificación A dado que es de segundo año, más la probabilidad de que sea de
cuarto año por la probabilidad de obtener calificación A dado que es de cuarto año, más la
probabilidad de que sea graduado por la probabilidad de obtener calificación A dado que
EP
UD
Figura 3.6: Diagrama de árbol para problema de clase de estadı́stica avanzada

A
IM
es graduado, es decir, la probabilidad total del evento obtener calificación A es la suma

-L
exhaustiva de las probabilidades de todos los casos mutuamente excluyentes que conducen
S
PU
a dicho evento. Entonces la probabilidad de que un alumno elegido al azar haya obtenido
calificación A serı́a:
M
CA
P (E) = P (E1 ) ∗ P (E \ E1 ) + P (E2 ) ∗ P (E \ E2 ) + P (E3 ) ∗ P (E \ E3 )

10 3 30 10 10 5
P (E) = ∗ + ∗ + ∗
50 10 50 30 50 10
18
P (E) = = 0.36
50
Ejemplo:Tenemos tres urnas: A con 3 canicas rojas y 5 negras, B con 2 canicas rojas y
1 negra y C con 2 canicas rojas y 3 negras. Escogemos una urna al azar y de ella extraemos
una canica, ¿cuál es la probabilidad de que la canica extraı́da sea roja?
Claramente el experimento es seleccionar primero una urna y luego una canica de la
E
AD
urna elegida. Entonces si definimos los eventos: Llamamos R= extraer una canica roja y N=
extraer una canica negra, en el diagrama de árbol de la figura pueden verse las distintas
probabilidades de ocurrencia de los eventos R o N para cada una de las tres urnas.
-I I
22
20
Figura 3.7: Diagrama de árbol para problema de urnas A, B y C
Para calcular la probabilidad de que la canica elegida sea roja, P(R), por el Teorema de
la probabilidad total tenemos:
P (R) = P (A) ∗ P (R \ A) + P (B) ∗ P (R \ B) + P (C) ∗ P (R \ C)

1 3 1 2 1 2
P (R) = ∗ + ∗ + ∗
3 8 3 3 3 5
173
P (R) = ≈ 0.48
360
Teorema de Bayes. Este teorema se utiliza para revisar probabilidades previamente

calculadas cuando se posee nueva información. Desarrollado por el reverendo Thomas Bayes
EP
en el siglo XVII, el teorema de Bayes es una extensión de lo que hemos aprendido hasta ahora
acerca de la probabilidad condicional.
UD
En el estudio de la probabilidad condicional se vio que revisar las probabilidades cuando

se obtiene más información es parte importante del análisis de probabilidades. Por lo general,
se suele iniciar el análisis con una estimación de probabilidad inicial (probabilidad a priori)
A
o probabilidad previa de los eventos que interesan. Después, de fuentes como una muestra,
IM
una información especial o una prueba del producto, se obtiene más información sobre estos
-L
eventos. Dada esta nueva información, se modifican o revisan los valores de probabilidad
S
mediante el cálculo de probabilidades revisadas a las que se les conoce como probabilidades
PU
posteriores. El teorema de Bayes es un medio para calcular estas probabilidades.

M
El teorema de Bayes es aplicable cuando los eventos para los que se quiere calcular la
CA
probabilidad revisada son mutuamente excluyentes y su unión es todo el espacio muestral.

En el caso de “n” eventos mutuamente excluyentes A1 , A2 , . . . , An , cuya unión sea todo el
espacio muestral, el teorema de Bayes aplica para calcular cualquiera de las probabilidades
posteriores P (Ai \ B) como se muestra en la expresión (3.17)
P (Ai ) ∗ P (B \ Ai )
P (Ai \ B) = (3.17)
P (A1 ) ∗ P (B \ A1 ) + P (A2 ) ∗ P (B \ A2 ) + . . . + P (An ) ∗ P (B \ An )
Con las probabilidades a priori P (A1 ), P (A2 ), . . . , P (An ) y las probabilidades condiciona-
les adecuadas, P (B \ A1 ), P (B \ A2 ), . . . , P (B \ An ), se usa la expresión (3.17) para calcular
E
AD
la probabilidad posterior de los eventos A1 , A2 , . . . , An .

Ejemplo: Del problema de la clase de estadı́stica avanzada, se nos plantea lo siguiente:
Si se selecciona al azar un estudiante y se encuentra que su calificación es A, ¿Cuál es la
probabilidad de que sea un graduado?
La probabilidad pedida es P (E3 \ E). Teniendo en cuenta el diagrama de árbol de la
figura 3.6 y utilizando el teorema de Bayes, expresión (3.17), tenemos:
P (E3 ) ∗ P (E \ E3 )
P (E3 \ E) =
P (E1 ) ∗ P (E \ E1 ) + P (E2 ) ∗ P (E \ E2 ) + P (E3 ) ∗ P (E \ E3 )
-I I
10 5
22
∗ 5
P (E3 \ E) = 50 10 = ≈ 0.28
20
10 3 30 10 10 5 18
∗ + ∗ + ∗
50 10 50 30 50 10
Ejemplo: Del problema de las tres urnas A, B y C, se nos plantea lo siguiente: Si elegimos
una urna al azar y extraemos una canica. Si la canica ha sido roja, ¿cuál es la probabilidad
de haber sido extraı́da de la urna A?

La probabilidad pedida es P (A \ R). Teniendo en cuenta el diagrama de árbol de la figura
3.7 y utilizando el teorema de Bayes, expresión (3.17), tenemos:
P (A) ∗ P (R \ A)
P (A \ R) =
P (A) ∗ P (R \ A) + P (B) ∗ P (R \ B) + P (C) ∗ P (R \ C)
1 3
∗ 45
P (A \ R) = 3 8 = ≈ 0.26
1 3 1 2 1 2 173
∗ + ∗ + ∗
3 8 3 3 3 5
EP

UD
1. Se ha desarrollado una nueva vacuna para curar el resfrı́o. Se aplicó a 50 pacientes para
probar su efectividad.
a) ¿Cuál es el experimento?
A
IM
b) ¿Cuál es un resultado posible?

-L
c) Suponga que 35 pacientes mejoraron, ¿35 es una probabilidad?

S
PU
d ) La probabilidad de que la nueva vacuna sea efectiva se calcula como -2. Comente
esto.
M
CA
2. Al lanzar un dado normal. ¿Cuál es la probabilidad de obtener un número par?
3. El número de veces que ocurrió un evento en el pasado se divide entre el número total
de ocurrencias. ¿Cómo se denomina a este enfoque de la probabilidad?
4. Si es verdad que no existe ninguna probabilidad de que una persona se recupere después
de recibir 50 heridas de bala, ¿la probabilidad asignada a este evento es -1? ¿Por qué?
5. Determine el valor de probabilidad aplicable a las siguientes situaciones e indicando el

enfoque aplicado para su hallazgo en cada caso.
E
AD
a) La probabilidad de sufrir un accidente de trabajo en una determinada industria a

lo largo de un año. Una muestra aleatoria de 10 empresas que emplean a un total
de 8000 personas reveló que ocurrieron 400 accidentes de trabajo en un periodo
reciente de 12 meses.
b) La probabilidad de que una franquicia de comida rápida vaya a tener éxito
financiero. El futuro inversionista obtiene datos de otras franquicias similares,
estudia el desarrollo del área residencial en el cual se ubica la instalación y
considera el volumen de venta que se requiere para el éxito financiero con base en
-I I
la inversión requerida de capital y en los costos de operación. En general, el criterio

22
del inversionista es que existe un 80 % de probabilidad de que la instalación tenga

20
éxito financiero y 20 % de que no lo tenga.
6. Si se lanza al aire una moneda siete veces, ¿Cuántos resultados diferentes son posibles?
7. Los sistemas comunes de alarma para casas tienen un código que consta de cuatro
dı́gitos. Los dı́gitos (0 hasta 9) pueden estar repetidos, aunque deben ingresarse en
el orden correcto. Suponga que usted planea tener acceso intentando códigos hasta
encontrar el correcto, ¿Cuántos códigos diferentes son posibles?
8. Angélica tiene para vestirse 2 pantalones, 3 polos y 4 pares de zapatillas, todas prendas
distintas. ¿De cuántas maneras podrı́a vestirse?
9. ¿Cuántos números pares de 3 cifras existen?

EP
10. ¿De cuántas maneras se pueden ordenar 6 libros en un estante?

UD
11. ¿Cuántos números de cinco cifras distintas se pueden formar con las cifras impares?
¿Cuántos de ellos son mayores de 70.000?
12. Si se elige un número de cinco cifras distintas, formado con las cifras impares, ¿Cuál es
A
la probabilidad de que el número elegido sea mayor de 70000?
IM
-L
13. Hay un club con 15 socios. Se desea elegir una mesa directiva formada por un presidente,
S
un vicepresidente, un secretario y un tesorero. ¿De cuántas maneras se puede hacer la

PU
elección, suponiendo que un socio puede ocupar sólo un cargo?

M
14. En una carrera de 500 metros participan doce corredores ¿De cuántas maneras pueden
CA
adjudicarse las medallas de oro, plata y bronce?
15. En una clase de 24 alumnos se quiere elegir un comité formado por tres alumnos
¿Cuántos comités diferentes se pueden formar?
16. Tenemos un grupo de 12 personas, donde 5 son administradores y 7 son economistas.

Se quiere constituir una comisión de 5 personas donde 2 sean administradores y 3 sean
economistas.
a) ¿De cuántas formas podrá constituirse la comisión si todas las personas son
E
AD
elegibles?
b) ¿De cuántas formas podrá constituirse la comisión si un economista particular ha
de estar en esa comisión?
c) ¿De cuántas formas podrá constituirse la comisión si dos administradores concretos
no pueden estar juntos en esa comisión?
17. Supongamos que 20 miembros de una organización se dividirán en tres comités:

Reglamento, Presupuesto, Actividades. Los comités de Reglamento y de Presupuesto
-I I
tendrán 8 miembros cada uno y el comité de Actividades tendrá 4. ¿De cuántas maneras
22
se pueden asignar los miembros a esos comités?

20
18. Escribir o definir el espacio muestra de cada uno de los siguientes experimentos:
a) Lanzar primero una moneda y luego un dado.

b) Elegir una esfera de una caja que contiene: 6 esferas rojas, 4 blancas y 5 azules.
c) El papá de un bebé próximo a nacer quiere que su hijo se llame: Juan, Camilo o
Felipe. La mamá por su parte pretende que se llame: Andrés o Paolo. Para que
ambos queden felices deciden combinar los nombres propuestos considerando que
primero irá el del padre y luego el de la mamá. Defina las formas que se pueden
proponer para el nombre del bebé.
19. En la tinka se extraen 6 diferentes números del 1 al 45. Un jugador gana o comparte
el premio mayor cuando escoge correctamente los 6 números. Calcule la probabilidad
de ganar el premio mayor de la tinka (No se requiere que el jugador seleccione los seis
EP
números en el mismo orden en que se sacaron, por lo que el orden es irrelevante)

UD
20. Una moneda se lanza 7 veces, calcular la probabilidad que aparezcan exactamente 4
caras.
21. De una baraja de 52 cartas se sacan 3 cartas. Determinar la probabilidad que todas
A
sean corazones.
IM
22. Se lanza un dado cinco veces.

S -L
a) Determine la probabilidad de que en los tres primeros lanzamientos salga el seis.

PU
b) Determine la probabilidad de que exactamente en tres de esos cinco lanzamientos

M
salga el seis.
CA
23. Si la probabilidad de que un bebé que va a nacer sea varón es de 0.5. Calcule la
probabilidad de que de los siete hijos de un matrimonio dos sean varones y cinco sean
mujeres.
24. Una caja contiene 12 naranjas, tres de las cuales están malogradas. Si seleccionamos al
azar 5 naranjas para preparar jugo:
a) ¿Cuántos grupos de 5 naranjas se podrı́an formar?

E
b) ¿Cuántos grupos de 5 naranjas contienen 2 naranjas malogradas?

AD
c) ¿Cuál es la probabilidad que dos de las naranjas seleccionadas estén malogradas?

d ) ¿Cuál es la probabilidad de que ninguna de las naranjas seleccionadas esté
malograda?
e) ¿Cuál es la probabilidad de que haya seleccionado al menos una naranja
malograda?
25. Si cinco corredores compiten en la final de 100 metros planos, ¿De cuántos modos
pueden ganarse los tres primeros puestos?
-I I
22
26. Un entrevistador seleccionó al azar 4 de 10 personas disponibles ¿Cuántos grupos

20
diferentes de 4 son posibles?
27. En un grupo de teatro hay 10 hombres y 6 mujeres. Cuatro de los hombres pueden actuar
como actores masculinos principales y los otros actuarán en papeles secundarios, tres
de las mujeres pueden actuar en papeles femeninos principales y las otras en papeles
secundarios. ¿De cuántas maneras pueden elegirse los actores para una obra de teatro
que exige un actor principal, una actriz principal, dos actores secundarios y tres actrices
secundarias?
28. Se van a seleccionar cinco soldados de un grupo de doce voluntarios para una misión
peligrosa.
a) ¿De cuántos modos se podrán seleccionar?

b) ¿Cuántas veces podrán ser incluidos los dos más valientes?
EP
c) ¿Cuántas veces será incluido sólo uno de los dos más valientes?
UD
29. A usted le gustarı́a hacer una ensalada que contenga lechuga, tomate, pepino y
germinados. Se dirige hacia el supermercado con el fin de comprar un tipo de cada
uno de estos ingredientes. Ahı́ descubre que existen ocho tipos de lechugas, cuatro
tipos de tomates, tres tipos de pepinos y tres tipos de germinados en venta ¿Cuántos
A
IM
tipos diferentes de ensaladas tiene para elegir?

-L
30. Se lanzan dos dados:

S
PU
a) ¿Cuál es la probabilidad de que se obtenga una suma igual a 5 ó una suma igual
M
a 7?
CA
b) ¿Cuál es la probabilidad de que no se obtenga ni suma 5 ó 7?
31. Al tirar un dado ¿cuál es la probabilidad de que caiga un uno o un dos o un seis?
32. Se ha de entrevistar a un grupo selecto de empleados de una compañı́a con respecto a

un plan de pensiones. Se efectuarán entrevistas detalladas a cada uno de los empleados
seleccionados en la muestra. Éstos se clasificaron como sigue:
Clasificación Evento Número de empleados

Supervisores A 120
E
AD
De mantenimiento B 50
De producción C 1460
Gerencia D 275
Secretarial E 68
a) Si se elige a un empleado ¿ Cuál es la probabilidad de que sea de mantenimiento

o una secretaria?
-I I
b) Si se elige a un empleado ¿ Cuál es la probabilidad de que sea de gerencia?

22
c) ¿Los eventos en el apartado a) son complementarios? ¿son colectivamente

20
exhaustivos? ¿son mutuamente excluyentes?
33. ¿Cuál es la probabilidad de que una carta elegida al azar de una baraja sea un rey o
una de corazones?
34. Al tirar un dado ¿cuál es la probabilidad de que se obtenga un número mayor de 3 o

un número par?
35. Al tirar un dado ¿cuál es la probabilidad de que se obtenga un número par o un número
menor de 3 o un número entre 2 y 4, inclusive?
36. Se lanzan dos monedas al aire,¿Cuál es la probabilidad de que ambas caigan cara?
37. Suponga que en una caja hay 10 rollos fotográficos, de los cuales 3 son defectuosos. Se
van a seleccionar aleatoriamente 2 rollos, uno después del otro ¿Cuál es la probabilidad
EP
de escoger un rollo con defecto seguido por otro con tal condición?
UD
38. La primera carta seleccionada de una baraja de 52 naipes fue un rey.
a) Si se devuelve a la baraja completa,¿Cuál es la probabilidad de que salga otro rey

en la segunda toma?
A
IM
b) Si no se repone dicha carta, ¿cuál es la probabilidad que aparezca un rey en la

segunda toma?
S -L
c) ¿Cuál es la probabilidad de que salga un rey en la primera toma y otro en la

PU
segunda (considerando que el primer rey no se repuso)?

M
39. La junta de directores de una compañı́a está formada por 8 hombres y 4 mujeres. Se
CA
seleccionará un comité de 4 miembros, en forma aleatoria, para recomendar a un nuevo

presidente de la compañı́a.
a) ¿Cuál es la probabilidad de que sean mujeres los cuatro miembros del comité de
investigación?
b) ¿Cuál es la probabilidad de que los cuatro miembros sean hombres?
c) ¿La suma de las probabilidades para a) y b) es igual a 1? Explique su respuesta.
40. Una caja contiene 4 canicas blancas y 6 negras. Si se extraen dos aleatoriamente, una
E
AD
tras otra y sin reemplazo:
a) ¿Cuál es la probabilidad de que sean blancas?

b) ¿Cuál es la probabilidad de que la primera sea blanca y la segunda sea negra?
c) ¿Cuál es la probabilidad de que una sea blanca y la otra sea negra?
41. Una caja contiene 4 canicas azules y 6 rojas. Si se extraen dos aleatoriamente, una tras
otra y sin reemplazo:
-I I
a) ¿Cuál es la probabilidad de que sean azules?

22
b) ¿Cuál es la probabilidad de que la primera sea azul y la segunda sea roja?

20
c) ¿Cuál es la probabilidad de que una sea azul y la otra sea roja?

d ) ¿Cuál es la probabilidad de elegir al menos una azul?
e) ¿Cuál es la probabilidad de que ninguna sea azul?
42. Un lote consta de 10 artı́culos buenos, 4 con pequeños defectos y 2 con defectos graves.
a) Si se elige un artı́culo al azar. Encontrar la probabilidad de que no tenga defectos.

b) Si se elige un artı́culo al azar. Encontrar la probabilidad de que tenga un defecto
grave.
c) Si se elige un artı́culo al azar. Encontrar la probabilidad de que sea bueno o tenga
un defecto grave.
d ) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
de que ambos sean buenos.
EP
e) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
UD
de que ambos tengan defectos graves .

f ) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
de que a lo menos uno sea bueno.
A
g) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
IM
de que a lo más uno sea bueno.

-L
h) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
S
PU
de que exactamente uno sea bueno.

M
i ) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
CA
de que ninguno tenga defectos graves.

j ) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
de que ninguno sea bueno.
43. Se lanzan dos dados y se sabe que la suma resultó igual a 8 ¿Cuál es la probabilidad
de que la diferencia sea 2?
44. Se eligen 5 cartas de una baraja completa de 52. La baraja está conformada por cuatro
“palos” (corazones, espadas, tréboles y cocos) y por trece denominaciones (1, 2, ..., 13).
¿Cuál es la probabilidad de que:
E
AD
a) todas las cartas sean del mismo palo?

b) hayan dos “1” y tres “13”?
c) hayan dos cartas de una denominación y tres de otra?
d ) hayan dos corazones y tres espadas?
e) hayan dos cartas de un palo y tres de otro palo?
45. Un comerciante quiere comprar un lote de 25 piñas, y decide comprarlo solamente si

-I I
al seleccionar 3 aleatoriamente, ninguna está malograda. Supóngase que realmente hay

22
4 piñas malogradas (el comerciante no lo sabe), ¿Cuál es la probabilidad de que no

20
compre el lote?
46. José, Bruno y Mónica lanzan sucesivamente una moneda. Si el primero en obtener cara
gana el juego,¿Cuáles son las respectivas probabilidades de ganar el juego si cada uno
lanza sólo una vez?
47. En una urna hay siete esferas, que tienen marcadas las siguientes letras: C, A, L, C,
U, L, O. Si se extraen, una por una, las siete esferas, y se van colocando de izquierda
a derecha, ¿Cuál es la probabilidad de que se forme la palabra CALCULO?
48. Un estudiante de estadı́stica ha estimado que en 4 horas puede estudiar un tema para el
examen del dı́a siguiente. Comienza a estudiar a las 8 p.m. con el riesgo de que haya un
“apagón” en cualquier momento. ¿Cuál es la probabilidad de que, como consecuencia
de un “apagón”, lo que le falte estudiar sea menos de la quinta parte de lo que haya
estudiado? Asuma que el apagón puede ocurrir en cualquier instante.
EP
49. Suponga que en una habitación oscura hay seis cajas blancas, cada una conteniendo
UD
tres esferas verdes y cinco amarillas, y dos cajas negras, cada una conteniendo dos
esferas verdes y cuatro amarillas. Si usted entrara en la habitación y seleccionara
aleatoriamente una caja y después aleatoriamente tomara de ella una esfera, ¿Cuál
es la probabilidad de que se seleccionara una esfera amarilla?
A
IM
50. En el jardinero del señor Rodrı́guez no se puede confiar. La probabilidad de que olvide
-L
regar el rosal durante la ausencia del señor Rodrı́guez es 2/3. El rosal está en estado
S
inseguro: si se le riega tiene igual probabilidad de progresar o de secarse, pero solamente

PU
un 0,25 de probabilidad de progresar si no se le riega. Después de su regreso, el señor

M
Rodrı́guez se encuentra que su rosal está seco. ¿Cuál es la probabilidad de que el

CA
jardinero no lo haya regado?
51. En un almacén se encuentran 80 cajas con 100 fusibles cada una. Veinte cajas contienen
fusibles producidos por la máquina A, 30 cajas contienen fusibles producidos por
la máquina B y 30 tienen fusibles producidos por la máquina C. las cajas están
almacenadas al azar, sin que importe la máquina de procedencia. La máquina A
produce, en promedio, 5 % de fusibles defectuosos; la máquina B, 3 % y la máquina
C, 2 %.
E
a) Si se selecciona una de estas cajas al azar y de ellas se selecciona uno de sus

AD
fusibles,¿Cuál es la probabilidad de que sea defectuoso?

b) Si se selecciona una de estas cajas al azar y de ellas se selecciona uno de sus
fusibles y se encuentra que es defectuoso, ¿Cuál es la probabilidad de que haya
sido producido por la máquina B?
52. Las caras numeradas 1, 2 y 3 de un dado, son de color rojo; las caras numeradas 4 y
5 son de color blanco, y la cara numerada 6 es azul. Al lanzar este dado, cuál es la
probabilidad:
-I I
a) que aparezca una cara roja o el 5?

22
20
b) Que aparezca una cara roja o un número impar?
53. Una compañı́a de seguros de automóviles clasifica a los conductores en tres clases: A,
alto riesgo, B, riesgo medio, y C bajo riesgo. La clase A constituye el 30 % de los
conductores que suscriben un seguro con la compañı́a; la probabilidad de que uno de
esos conductores sufra un accidente en un año es 0.1. Los datos correspondientes para
la clase B son 50 % y 0.03 y para la clase C son 20 % y 0.01.
a) Un determinado cliente seleccionado entre los asegurados, que probabilidad tiene

de que sufra un accidente en el primer año.
b) Si seleccionamos un cliente accidentado el primer año. ¿Cuál es la probabilidad de
que este cliente esté en cada una de las clases A, B, C.
54. Una compañı́a que fabrica zapatos tiene 3 fábricas. La primera produce 25 % de los
EP
zapatos de la compañı́a, la segunda el 60 %, y la tercera el 15 %. El tamaño de algunos

de los pares producidos es clasificado erróneamente. Esto ocurre en el 1, 0.5 y 2 % de los
UD
casos en las tres fábricas, respectivamente. Si se compra un par de zapatos fabricado

por esta empresa, ¿Cuál es la probabilidad de que su tamaño haya sido clasificado
erróneamente?
A
55. En un almacén hay doce pasillos. Nueve de ellos están en la sección de abarrotes
IM
marcados: A1 a A9, y 3 están en la sección de farmacia, marcados: F1, F2 y F3.

-L
Si el gerente de la tienda selecciona aleatoriamente un pasillo para utilizarlo de manera

S
PU
especial, obtenga la probabilidad de que:

M
a) El pasillo tenga numeración impar.

CA
b) El pasillo esté en la sección de abarrotes y tenga numeración par.

c) El pasillo esté en la sección de farmacia dado que tiene numeración impar.
56. En un poblado, el 55 % de los votantes están registrados en el partido polı́tico A y el

45 % de los votantes están registrados en el partido polı́tico B. hay dos candidatos a la
alcaldı́a: Rafael, del partido A, y Daniel del partido B. En la elección, 80 % de los del
partido A y 10 % de los del partido B votaron por Rafael. El 20 % de los del partido A
y 90 % de los del partido B votaron por Daniel.
E
a) Si se selecciona un votante al azar ¿Cuál es la probabilidad de que haya votado

AD
por Rafael?
b) Si se selecciona al azar un votante y se encuentra que ha votado por Rafael, ¿Cuál
es la probabilidad de que sea del partido A?
57. Se nos dan dos urnas como sigue: Una urna A contiene 5 bolas rojas 3 blancas y 8
azules. La urna B contiene 3 Bolas rojas y 5 blancas. Se lanza un dado corriente, si
aparece el 3 o el 6, se escoge una bola de B, de lo contrario se escoge una de A. Hallar
la probabilidad de que:
-I I
22
a) Aparezca una bola roja

20
b) Una bola blanca

c) Una bola azul
58. Se nos dan dos urnas como sigue: Una urna A contiene 5 bolas rojas y 3 blancas. La
otra urna B contiene 1 bola roja y 2 blancas. Se lanza un dado corriente si aparece 3 o
6 se saca una bola de B y se pone en A y luego se saca una bola de A, de lo contrario
se saca una de A y se pone en B y luego se saca una de B.
a) ¿Cuál es la probabilidad de que ambas sean rojas?

b) ¿Cuál es la probabilidad de que las dos sean blancas?
59. Una empresa dedicada a la fabricación de automóviles, desea lanzar al mercado un

nuevo modelo. Al estudiar la posible situación económica que existirá se contemplan
EP
tres únicas alternativas existencia de inflación, estabilidad o depresión. Se estima que:

UD
a) dichas alternativas son igualmente probables y b) la probabilidad de que se lance el

nuevo modelo es de 0.7 si existe inflación, 0.4 si existe estabilidad y de 0.1 si la situación
es de depresión.
A
a) Determinar la probabilidad de que el modelo salga al mercado.
IM
b) Supuesto que ha salido al mercado, ¿cuál es la probabilidad de que se haya lanzado

-L
existiendo depresión.
S
PU
60. Se lanza una moneda cinco veces. Muestre mediante un diagrama de árbol todos
M
los resultados posibles. ¿Cuál es la probabilidad de obtener al menos tres caras

CA
consecutivas?
61. Una clase de estadı́stica avanzada está formada por 10 estudiantes de segundo año, 30
de cuarto año y 10 graduados. Tres estudiantes de segundo año, 10 de cuarto año y 5
graduados obtuvieron una calificación A.
a) Si se selecciona al azar un estudiante de esta clase,¿Cuál es la probabilidad de que

haya obtenido una calificación A?
b) Si se selecciona al azar un estudiante y se encuentra que su calificación es A, ¿Cuál
es la probabilidad de que sea un graduado?
E
AD
62. Se ha observado que los hombres y las mujeres reaccionan de una manera diferente
en ciertas circunstancias; 70 % de las mujeres reaccionan positivamente en dichas
circunstancias, mientras que el porcentaje en los hombres es solamente del 40 %. Se
sometió a prueba a un grupo de 20 personas, 15 mujeres y 5 hombres, y se les pidió
llenar un cuestionario para descubrir sus reacciones. Una de las respuestas recogidas al
azar de las 20 resultó negativa, ¿Cuál es la probabilidad de que haya sido contestada
por un hombre?
-I I
63. En un conocido juego con dados el jugador participante lanza dos dados. Si obtiene
22
suma siete u once, gana. Si no, debe seguir lanzando hasta obtener el mismo resultado
20
del primer lanzamiento antes de que salga siete u once. Si sale siete u once antes de
conseguir el mismo resultado del primer lanzamiento, pierde.
a) ¿Cuál es la probabilidad de que el jugador obtenga suma 8 en el primer

lanzamiento, y luego pierda el juego?
b) ¿Cuál es la probabilidad de que el jugador obtenga suma cinco en el primer

lanzamiento, y luego gane el juego?
1
Nota: Puede ser útil la siguiente fórmula: 1 + x + x2 + x3 + ... =
1−x
64. Las probabilidades que tienen tres alumnos de aprobar Estadı́stica son: 0,20; 0,40; 0,50.
Determine la probabilidad de que:
a) Solamente apruebe el segundo.

b) Solamente apruebe uno.
EP
UD
65. Suponga que hay tres semáforos entre la casa de Quique y la UDEP. Al llegar a cada
uno de ellos, éstos pueden estar en rojo (R) o verde (V). Considérese que el ámbar
dura un tiempo despreciable. Quique ha verificado que, en el primer semáforo, el rojo
dura tanto como el verde; pero en el segundo, el rojo dura el doble que el verde; y en
A
el tercero, el verde dura el doble que el rojo. ¿Cuál es la probabilidad de que en el
IM
siguiente viaje a la UDEP:

S -L
a) Tenga que parar por exactamente una luz roja?

PU
b) Tenga que parar al menos por una luz roja?

M
CA
66. El profesor Álvarez ha estado enseñando Matemática Básica durante varios años. Sabe
que 80 % de los estudiantes terminan los problemas asignados. Determinó que de los
alumnos que cumplen con su trabajo, 90 % aprobará el curso. De aquellos estudiantes
que no lo hacen ası́, 60 % será aprobado. Julio Manrique cursó Matemática básica
durante el semestre pasado con el profesor Álvarez y recibió una calificación aprobatoria.
¿Cuál es la probabilidad de que sı́ haya hecho las tareas?
67. Una familia tiene 5 hijos. Suponiendo que la probabilidad de que un hijo sea varón o
mujer es la misma, determine la probabilidad de que:
E
a) Los 5 sean del mismo sexo.

AD
b) Cuatro sean varones.
68. En un curso de Estadı́stica hay 5 alumnos del IV ciclo, 34 del V, 21 del VI, 5 del VII
y 2 del VIII. Si se eligiera un comité de 5 personas, ¿cuál es la probabilidad de que:
a) todos los ciclos estén representados en el comité?

b) sólo el VI ciclo tenga miembros en el comité?
-I I
69. En una prueba de aptitud conformada por 25 preguntas, 4 son de cultura general. Si a
22
cada alumno se le asignan 20 preguntas al azar, ¿Cuál es la probabilidad de que:

20
a) No se le asigne ninguna pregunta de cultura general?

b) Le asignen al menos 2 preguntas de cultura general?
70. De los 20 proyectos presentados por un grupo de investigadores de una Universidad,

12 son del área de informática y los restantes del área tecnológica. Si tres de estos
proyectos son cancelados por recorte de presupuesto, esta cancelación se realizó al azar.
a) Ninguno de los proyectos cancelados sean del área tecnológica ?

b) uno de los proyectos cancelados sea del área tecnológica?
c) Más de uno de los proyectos cancelados sea del área tecnológica?
EP
71. Se va a elegir por sorteo un comité de 4 personas a partir de un grupo de 7 hombres;

dos de los cuales son hermanos. ¿Cuál es la probabilidad de que:
UD
a) Los dos hermanos estén en el comité?

b) Por lo menos uno de los hermanos esté en el comité?
A
72. De un grupo de ocho hermanos se eligen tres al azar. Luis tiene 18 años, Jorge 17 años,
IM
Miguel 15 años, Raúl 12 años, Mario 10 años, Ana 9 años, Lucı́a 6 años y David 5 años.
-L
Determine la probabilidad de que:

S
PU
a) Luis sea elegido. c) El menor de los tres sea Raúl.

M
b) Ana y Lucı́a sean elegidas d ) El mayor de los tres sea Raúl.

CA
73. Se va a elegir por sorteo un comité de seis personas a partir de un grupo de diez
hombres; tres de los cuales son profesionales. ¿Cuál es la probabilidad de que:
a) No haya ningún profesional en el co- c) Haya un profesional en el comité?

mité? d ) Por lo menos haya dos profesionales en
b) hayan dos profesionales en el comité? el comité?
E
74. Dos amigos compraron pasajes para viajar en un pequeño ómnibus. El ómnibus consta
AD
de 48 asientos, en filas de 4, con 24 asientos al lado izquierdo y 24 al lado derecho. Si

los asientos fueron asignados aleatoriamente, determine la probabilidad de que los dos
amigos:
a) Se sienten en el mismo lado. b) Se sienten en la misma fila.
75. Un club está conformado por 5 abogados, 10 ingenieros y 3 médicos.
a) De cuántas maneras se puede elegir un comité conformado por 2 abogados, 2

-I I
ingenieros y 2 médicos.
22
20
b) En cuántos de estos comités estarán la ingeniera Peralta y el doctor Zapata.
76. Hay 8 amigos solteros y la probabilidad de que cualquiera de ellos se case en los próximos
1
15 años es . ¿Cuál es la probabilidad de que por lo menos uno se case?
4
77. Se va a elegir por sorteo el Comité de Deportes de la Facultad de Ciencias económicas

y Empresariales, entre los 30 alumnos que se han presentado a una reunión convocada
por la Directora de Estudios. De estos 30 alumnos, 20 son hombres y 10 mujeres. Si el
comité debe estar formado por 6 alumnos ¿Cuál es la probabilidad de que:
a) en el comité haya el doble número de hombres que de mujeres?

b) en el comité no haya hombres?
c) en el comité, la diferencia entre el número de hombres y mujeres sea impar?
EP
78. En un distrito universitario los estudiantes se distribuyen entre las tres carreras que
pueden cursarse del siguiente modo: el 20 % estudian arquitectura, el 35 % medicina y
UD
el 45 % economı́a. El porcentaje de alumnos que finalizan sus estudios en cada caso es

del 5 %, 12 % y del 18 %. Elegido un alumno al azar determinar la probabilidad de que
no haya acabado los estudios.
A
IM
79. Un método muy empleado por investigadores estadı́sticos para obtener información
es el de efectuar encuestas personales. A menudo resulta importante investigar sobre
S -L
temas muy personales, que pondrı́an en aprietos al sujeto encuestado, ocasionando que
PU
dé respuestas falsas o que no conteste, deformando ası́ los resultados de la encuesta.
M
Para aminorar este problema, Warner ideó la “Técnica de la respuesta aleatoria”, que
CA
permite que el encuestado escoja al azar una de dos preguntas: la pregunta personal,
motivo de la encuesta, o una pregunta de control. Ası́, sólo él sabrá qué pregunta
contestó en realidad, y se mantiene su privacidad. Por ejemplo, supóngase que se desea
estimar el porcentaje de alumnos secundarios de una ciudad que no resuelven por su
cuenta las tareas para la casa. Se hacen 1000 encuestas con las siguientes instrucciones:
Antes de contestar lance una moneda: si sale cara conteste la pregunta A, y si sale sello
conteste la pregunta B. Sólo conteste SÍ o NO.
A: ¿resuelve usted las tareas para la casa por su cuenta?
B: ¿nació su padre en enero, febrero, marzo, abril o mayo?
E
AD
Supóngase que, una vez efectuadas las encuestas, hay 455 respuestas afirmativas y 545
negativas. ¿Qué porcentaje de alumnos no resuelve por su cuenta las tareas para la
casa?
80. En una escuela el 25 % de los alumnos son hombres. El 25 % de los hombres y el 20 %

de las mujeres tuvieron muy buen rendimiento el año anterior. Si se escoge un alumno
azar. ¿Cuál es la probabilidad de que haya tenido muy bien rendimiento el año anterior?
81. El comisario de la policı́a de El Agustino clasifica los delitos por edad (en años) del
-I I
malhechor, y si el crimen es con violencia o no. Según se muestra a continuación, al

22
comisario se le informó de un total de 150 delitos cometidos durante el año pasado.

20
a) ¿Cuál es la probabilidad de seleccionar un caso para analizarlo y encontrar que se

trató de un delito con violencia?
Edad (en años)

Tipo de delito Menos de 20 años 20 a menos de 40 40 o más Total
Con violencia 27 41 14 82
Sin violencia 12 34 22 68
Total 39 75 36 150
b) ¿Cuál es la probabilidad de seleccionar un caso para analizarlo y descubrir que el

delito lo cometió alguien con menos de 40 años de edad?
EP
c) ¿Cuál es la probabilidad de seleccionar un caso relacionado con un crimen violento

UD
o un delincuente de menos de 20 años de edad?

d ) Dado que se selecciona para análisis un delito con violencia,¿cuál es la probabilidad
de que lo haya cometido una persona de menos de 20 años de edad?
A
e) Un juez seleccionó dos casos para revisarlos,¿Cuál es la probabilidad de que ambos
IM
sean crı́menes cometidos con violencia?

S -L
82. Una tabla para jugar está conformada por 15 casilleros. En 11 de éstos se encuentran
PU
las letras de la palabra ESTADISTICA y los 4 restantes están en blanco. Un jugador

M
debe escoger, desconociendo lo que hay en cada casillero, casillero por casillero hasta
CA
que conforme la palabra ESTADISTICA, sin importar el orden. Por cada casillero en
blanco que se escoja, al jugador se le quita $20 de los $60 que le dan inicialmente. ¿Cuál
es la probabilidad de que el jugador:
a) Gane $60 c) Gane $20 e) Pierda $20

b) Gane $40 d ) No gane
83. Se lanza una moneda cuya probabilidad de que el resultado sea cara es 2/3. Si aparece
cara, se extrae una canica de una urna que contiene dos rojas y tres verdes. Si el
E
AD
resultado es sello, se extrae una canica de otra urna que contiene dos rojas y dos
verdes. ¿Cuál es la probabilidad de extraer una canica roja?
84. Se sabe que el veredicto dado por un jurado es un 90 % confiable cuando el sospechoso
es culpable y un 98 % confiable cuando es inocente. En otras palabras, declara inocente
al 10 % de los culpables y declara culpable al 2 % de los inocentes. Si el sospechoso se
selecciona entre un grupo de personas de las cuales sólo el 5 % ha cometido un delito
alguna vez, y el jurado lo declara culpable, ¿cuál es la probabilidad de que esa persona
sea inocente?
-I I
22
85. En el Campus Piura de la UDEP aproximadamente el 52 % del alumnado estudia

20
Ingenierı́a, el 21 % Administración de Empresas, el 18 % estudia Información y el 9 %

restante estudia Educación. En Ingenierı́a, el 82 % son varones, en Administración el
48 %, en Información el 15 % y en Educación el 5 %. Si se escoge una persona al azar y
resulta que es varón.
a) ¿Cuál es la probabilidad de que no estudie Ingenierı́a?

b) ¿Cuál es la probabilidad de que estudie Administración o Información?
86. Se tienen 20 dados normales y 2 cargados. La probabilidad de obtener 6 en estos últimos

es el doble que la de cualquier otra cara de los mismos dados. Se lanza un dado al azar
y sale 6. Hallar la probabilidad de que sea un dado cargado.
87. Suponga que en Campus Piura de la UDEP el 44 % de los alumnos estudian Ingenierı́a
y el 12 % de éstos son mujeres. Además, el 60 % de los otros programas son mujeres. Si
EP
se selecciona un alumno al azar y resulta que es hombre. ¿Cuál es la probabilidad de

que no estudie Ingenierı́a?
UD
88. Un profesor quiere escoger 8 alumnos de un conjunto de 15. ¿De cuántas formas puede
hacerlo? A
89. En un aula de 30 alumnos hay 20 deportistas, de los cuales 8 practican deportes
IM
individuales y 12 deportes colectivos.

-L
a) ¿Cuántos grupos de 5 alumnos se pueden formar?

S
PU
b) ¿En cuántos grupos todos son deportistas?

M
c) ¿En cuántos grupos hay 3 que practican deportes colectivos?

CA
d ) ¿En cuántos de los grupos donde todos son deportistas hay 3 que practican
deportes colectivos?
e) ¿En cuántos grupos hay al menos un alumno que no practica deportes individuales?
90. En un lote de 100 pernos hay 4 defectuosos. Si un comprador escoge 20 pernos

aleatoriamente, ¿cuál es la probabilidad de que se lleve 2 pernos defectuosos?
91. De una ciudad donde fuman el 30 % de los ciudadanos mayores de edad, se toma una
muestra de 6 de ellos. ¿Cuál es la probabilidad de que 3 de ellos fumen?
E
AD
92. Suponga que el concesionario de la cafeterı́a de la UDEP está tratando de reducir el

número de clientes no pagan sus cuentas al final del año. Él está dispuesto a cancelarle
el crédito a los clientes que se demoren más de una semana en los pagos que deben
realizar a fin de cada mes. El concesionario ha visto en sus archivos que, de todos
los clientes que finalmente no pagaron sus cuentas al final del año, el 95 % se habı́an
demorado más de una semana en sus pagos mensuales. Además, sabe que el 4 % de los
clientes que tienen crédito no pagan su cuenta, y que, de los que sı́ pagan su cuenta a
fin de año, el 35 % se ha demorado alguna vez más de una semana.
-I I
22
a) Si se elige a un cliente al azar,¿cuál es la probabilidad de que se haya demorado

20
alguna vez más de una semana en sus pagos mensuales?

b) Determine la probabilidad de que un cliente que se ha demorado alguna vez más
de una semana en sus pagos mensuales, no pague su cuenta al final del año.
93. Tenemos cien urnas de tres tipos. El primer tipo contiene 8 bolas blancas y 2 negras; el
segundo tipo, 4 blancas y 6 negras y el tercero tipo, 1 blanca y 9 negras. Se elige una
urna al azar y se extrae de ella una bola, que resulta blanca. Se devuelve la bola a la
16
urna y se repite el proceso, siendo ahora la bola extraı́da negra. Si sabemos que es
39
30
la posibilidad de que, siendo la bola blanca, proceda del primer tipo de urna y que
61
es la posibilidad de que, siendo la bola negra, proceda del segundo tipo de urna, calcule
el número de urnas de cada tipo.
94. Un banco ha estimado por experiencias anteriores que la probabilidad de que una
EP
persona no pague a tiempo un préstamo personal es de 0.3. También ha estimado que

UD
el 40 % de los préstamos no pagados a tiempo se han solicitado para financiar viajes de

vacaciones y el 60 % de los préstamos pagados a tiempo se han solicitado para viajes de
vacaciones. Si se elige un préstamo al azar y resulta que ha sido solicitado para financiar
un viaje de vacaciones ¿Cuál es la probabilidad de que no sea pagado a tiempo?
A
IM
95. Una persona lanza un dado cuyas seis caras muestran: un “1”, dos “2” y tres “3”. Si
-L
obtiene “1” en el primer lanzamiento, gana el juego. Si no obtiene “1” puede seguir
S
lanzando el dado y gana si repite el resultado del primer lanzamiento. Si obtiene “1”
PU
antes de repetir el resultado del primer lanzamiento, pierde el juego.

M
CA
a) ¿Cuál es la probabilidad de ganar?

b) ¿Cuál es la probabilidad de perder?
c) ¿Cuál es la probabilidad de obtener “3” en el primer lanzamiento y luego ganar
el juego?
1
1−x
96. Una caja contiene 5 fichas de $10 cada una, 3 de $30 cada una y 2 de $50 cada una.
Si se escogen 3 fichas al azar, calcule la probabilidad de que la suma de los valores sea
E
$70.
AD
97. Para analizar el volumen de fraude en las declaraciones de Impuestos, un grupo de

investigación realiza el siguiente experimento. Sobre una amplia muestra de empresas
se les formulan dos preguntas: A) ¿Termina su R.U.C en número impar?, B) ¿Ha
cometido algún tipo de fraude en su declaración de impuestos? Para evitar la falta de
respuesta motivada por la naturaleza de la segunda pregunta, a las empresas que van a
responder se les hace la siguiente propuesta: lance una moneda al aire, de forma que si
sale cara responda la pregunta A y si sale sello responda la pregunta B. Sólo se contesta
-I I
SÍ o NO a una pregunta. En ningún caso la empresa encuestada indica qué pregunta ha
22
contestado. Después de realizado el experimento, resulta que el 37 % de las empresas

20
encuestadas dieron como respuesta “SI”. En estas condiciones: ¿Cuál es la probabilidad

de que una empresa haya cometido fraude en su declaración de impuestos?
98. En un club de varios miembros, el número de mujeres es el doble del número de hombres.
Si se van a elegir tres miembros para conformar un comité, ¿cuál es la probabilidad
de que dos sean hombres y uno sea mujer? Nota: Exprese la probabilidad pedida en
función del número de hombres y mujeres que forman el club.
99. A un examen de Estadı́stica se presentan alumnos de 4 grupos diferentes:

Grupo A: 80 alumnos, de los cuales el 35 % son mujeres,
Grupo B: 70 alumnos, de los cuales el 25 % son mujeres,
Grupo C: k alumnos, de los cuales el 80 % son varones,
Grupo D: 60 alumnos, de los cuales el 85 % son varones.
Se les reúne a todos en una gran aula y se elige a uno de ellos al azar para repartir el
EP
2
examen, resultando ser mujer. Si la probabilidad de que pertenezca al grupo D es .
15
UD
¿Cuántos alumnos hay en el grupo C?
100. Un maestro de matemáticas de secundaria iba a preparar una tarea de ejercicios sobre
ecuaciones de segundo grado para sus alumnos. Sólo debı́a poner números, en lugar de
A
los coeficientes a, b y c en la ecuación: ax2 + bx + c = 0 , por lo que para cada ecuación
IM
decidió lanzar un dado tres veces y usar como coeficientes los números que salieran. Una
-L
vez que tuvo cinco ecuaciones, fue a sacar copias de la tarea; mientras tanto, se le ocurrió
S
que en algunas de esas ecuaciones podrı́a no haber raı́ces reales, además de recordar
PU
que aún no habı́a enseñado los números complejos. Para una ecuación cualquiera de
M
esa tarea, calcule la probabilidad de que las dos raı́ces sean reales.
CA
Nota :Recuerde que,
* Las raı́ces de la ecuación ax2 + bx + c = 0,(a ̸= 0),vienen dadas por:

√
−b ± b2 − 4ac
x=
2a
* Las dos raı́ces serán reales cuando: b2 − 4ac ≥ 0
101. Se lanza un dado cuatro veces ¿Cuál es la probabilidad de que obtengamos al menos
un cinco?
E
102. Suponga que tiene 2 dados y los lanza n veces:

AD
a) ¿Cuál es la probabilidad de que obtenga al menos un seis doble?

b) ¿Cuántos lanzamientos habrı́a que realizar para tener una probabilidad igual a 0.5
de obtener al menos un seis doble?
103. El administrador de un hospital limeño revisa la encuesta realizada a sus miembros en

la Sociedad Nacional Médica, la cual registra género y edad. La siguiente tabla resume
los resultados:
-I I
Menor de 35 años De 35 a 54 años Mayor de 54 años

22
Masculino 27 87 26
20
Femenino 14 25 3
Si se selecciona al azar a un miembro de la sociedad, ¿Cuál es la probabilidad de que:

a) Sea varón?
b) esté en edades de 35 a 54?
c) sea mujer o mayor de 54?
d ) sea varón o esté en edades de 35 a 54?
e) sea varón, dado que es menor de 35?
f ) sea mayor de 54, dado que es de género masculino?
g) sea mayor de 54, dado que es de género femenino?
EP
h) sea menor de 35, dado que es de género femenino?

UD
104. Un jurado formado por 3 miembros que deciden por mayorı́a, lo constituyen 2 personas
que deciden cada una de manera independiente el veredicto correcto con probabilidad
“p” y una tercera persona que lo decide lanzando una moneda.
A
a) Si un juez individual tiene una probabilidad “p” de dar el veredicto correcto ¿cuál
IM
de los dos métodos (juez individual o jurado de 3) da mayor probabilidad de

-L
acertar?
S
PU
b) Y si en el jurado de 3, los tres miembros tienen la misma probabilidad “p” de

acertar ¿cuál es entonces el mejor método?
M
CA
105. Lanzamos un dado normal tres veces. Si el segundo resultado es mayor que el primero,
¿Cuál es la probabilidad de que el tercero sea mayor que el primero?
106. Los empleados de una compañı́a se encuentran separados en tres divisiones: adminis-
tración, operación de planta y ventas. La siguiente tabla indica el número de empleados
en cada división clasificados por sexo:
MUJER HOMBRE
Administración 20 30
E
Operaciones 60 140
AD
Ventas 100 50
Si se elige aleatoriamente un empleado:
a) ¿Cuál es la probabilidad de que sea mujer?

b) ¿Cuál es la probabilidad de que trabaje en ventas?
c) ¿Cuál es la probabilidad de que sea hombre y trabaje en ventas?
-I I
d ) ¿Cuál es la probabilidad de que sea hombre y trabaje en administración?

22
e) ¿Cuál es la probabilidad de que trabaje en operaciones dado que es mujer?

20
f ) ¿Cuál es la probabilidad de que sea mujer dado que trabaja en operaciones?
107. En un examen de estadı́stica, un estudiante debe elegir siete preguntas de las diez
dadas. ¿Cuál es la probabilidad de que:
a) el estudiante responda tres de las cinco primeras preguntas?

b) el estudiante responda, por lo menos, tres de las cinco primeras preguntas?
108. A una fiesta asistieron un cierto número de personas, si al saludarse se produjeron 435
apretones y todos gentiles entre sı́ ¿Cuántas personas asistieron?
109. Un dado normal se lanza tres veces y la suma de los números obtenidos fue 15. Encuentre
la probabilidad de que en el primer lanzamiento haya salido 4.
110. ¿Qué es más probable: Sacar al menos un 6 al lanzar 5 veces un solo dado o sacar al
EP
menos un doce en 24 lanzamientos de 2 dados?

UD
111. Suponga que hay un grupo de n alumnos:
a) ¿Cuál es la probabilidad de que el dı́a de cumpleaños de algún alumno del grupo

coincida con el dı́a del cumpleaños del rector de la universidad? Asuma que un
A
IM
año tiene 365 dı́as.

-L
b) ¿Cuál es el número de alumnos que debe tener el grupo para que la probabilidad,
S
de que el dı́a de cumpleaños de algún alumno del grupo coincida con el dı́a del
PU
cumpleaños del rector de la universidad, sea por lo menos del 50 %?

M
112. Tenemos dos urnas; una A con 4 bolas rojas y 6 blancas, y otra B con 7 bolas rojas
CA
y 3 blancas. Se selecciona al azar una urna, se extrae una bola y se coloca en la otra
urna. A continuación, se extrae una bola de la segunda urna. Calcular la probabilidad
de que las 2 bolas extraı́das sean del mismo color.
113. El jugador A lanza 6 dados y gana si obtiene por lo menos un “1”. El jugador B lanza
12 dados y gana si obtiene por lo menos dos “1” ¿Quién tiene la mayor probabilidad
de ganar?
114. Si se elige al azar un número de tres cifras distintas, formado con los dı́gitos: 1, 2, 3, 4
E
y 5 ¿Cuál es la probabilidad de que el número elegido sea par?

AD
115. Se lanzan 5 dados honestos. Calcular la probabilidad de obtener:
a) Cinco números iguales. c) Tres de un número y dos de otro

b) Cuatro números iguales y uno distin- número.
to.
116. En un lote de 80 papayas hay 10 malogradas. Si un comprador escoge 20 papayas

-I I
aleatoriamente, ¿cuál es la probabilidad de que se lleve al menos 3 papayas malogradas?

22
117. Se lanzan tres monedas, y, si se obtienen 2 caras y un sello, se extraen dos canicas,
20
aleatoriamente, de una urna que contiene canicas numeradas del 1 al 100. Si las tres
monedas muestran el mismo resultado (tres caras o tres sellos), se extraen dos canicas,
de otra urna que contiene canicas numeradas del 1 al 50. ¿Cuál es la probabilidad de
que las canicas muestren dos números consecutivos?
118. ¿Cuántos números impares de 3 cifras distintas, se pueden formar con los dı́gitos: 4, 5,
7, 8 y 9? ¿Cuántos de ellos son menores que 500?
119. Si se elige un número impar de tres cifras distintas, formado con los dı́gitos: 4, 5, 7, 8
y 9, ¿Cuál es la probabilidad de que el número elegido sea menor que 500?
120. Se lanza un dado, y a continuación, tantas monedas como puntuación se obtuvo en el

lanzamiento del dado.
a) Hallar la probabilidad de que se obtenga alguna cara.

EP
b) Si se ha obtenido alguna cara, ¿Cuál es la probabilidad de que el resultado del

UD
dado haya sido un “dos”?
121. Se lanza un dado 6 veces, ¿cuál es la probabilidad de obtener puntuación par en los
lanzamientos impares e impar en los lanzamientos pares.
A
IM
122. Con los dı́gitos 1, 2, 3, 4, 5, 6, 7, 8 y 9,:

-L
a) ¿Cuántos números diferentes de cuatro cifras pueden formarse sin que se repita
S
ninguna cifra?
PU
b) ¿Cuántos de estos números contienen el dı́gito “1”?

M
CA
c) Si se elige un número de los formados en el apartado a) ¿Cuál es la probabilidad

de que dicho número contenga el dı́gito “1”?
123. La diferencia entre el número de permutaciones de 2 elementos que se pueden formar

con “n” elementos distintos existentes y el número de combinaciones de 2 elementos
que se pueden formar con los mismos “n” elementos, es 190. Determine el valor de “n”.
124. Una caja contiene 8 canicas rojas, 3 blancas y 9 azules. Si se eligen 3 canicas al azar
E
a) Las 3 sean rojas? c) 2 sean rojas y una blanca?

AD
b) Las 3 sean blancas? d ) Se elija una de cada color?
125. Seis parejas de casados se encuentran en un restaurante.
a) si se eligen 2 personas al azar, ¿cuál es la probabilidad de que sean esposos?

b) si se eligen 2 personas al azar, ¿cuál es la probabilidad de que una sea hombre y
otra mujer?
-I I
c) si se eligen 4 personas al azar, ¿cuál es la probabilidad de que se elijan dos parejas

de casados?
22
20
d ) si se eligen 4 personas al azar, ¿cuál es la probabilidad de que no hayan parejas

de casados?
e) si se eligen 4 personas al azar, ¿cuál es la probabilidad de que haya exactamente
una pareja de casados?
126. Si se elige al azar un número de cinco dı́gitos, ¿cuál es la probabilidad de que al menos
dos de sus dı́gitos sean ”7”?
127. ¿Cuál es la probabilidad de que, en un grupo de “n” alumnos, por lo menos dos de ellos
coincidan en su cumpleaños?
128. Con los dı́gitos 1, 2, 3, 4, 5, 6, 7:
a) ¿Cuántos números de cuatro cifras pueden formarse?

b) ¿Cuántos números de cuatro cifras pueden formarse sin que se repita ninguna
EP
cifra?
UD
c) ¿Cuántos de los números formados en el apartado b) terminan en 3?

d ) ¿Cuántos de los números formados en el apartado a) son impares?
e) Si se elige un número de los formados en el apartado a) ¿Cuál es la probabilidad
A
de que dicho número termine en 3?
IM
129. Un representante de ventas debe visitar 5 ciudades de las 10 ciudades existentes en el

-L
área geográfica que le corresponde. De esas 10 ciudades: 5 son mercados grandes para
S
PU
el producto en cuestión, 3 son mercados medianos y 2 son mercados pequeños. Si el

vendedor elige al azar las 5 ciudades que visitará ¿Cuál es la probabilidad de que:
M
CA
a) cuatro sean mercados grandes?

b) dos sean mercados grandes, dos sean medianos y uno pequeño?
c) cuatro sean mercados grandes y uno sea mediano?
d ) todas sean mercados grandes?
130. Se le pide a tres personas que escriban al azar una vocal ¿Cuál es la probabilidad de
que las tres personas escriban la vocal “e”?
131. Tres personas lanzan cada una cuatro monedas al aire. Determinar la probabilidad de
E
que las tres obtengan el mismo número de caras.

AD
132. Se dispone de n+1 urnas numeradas: 0,1,...,n. La urna i (0 ≤ i ≤ n) contiene i canicas

blancas y n-i negras. Si se elige al azar una urna y se extrae de ella una bola:
a) Hallar la probabilidad de que la bola extraı́da sea blanca.

b) Si la bola extraı́da es blanca, ¿cuál es la probabilidad de que provenga de la urna
i?
n(n + 1)
Nota: Puede ser útil la siguiente fórmula: 1 + 2 + 3 + ... + n =
-I I
2
22
133. Ana, Beto, y Carlos lanzan sucesivamente y en ese orden un dado cargado. La primera
20
persona que saque un 6 gana. Si la probabilidad de sacar un 6 con ese dado cargado es
“p”, ¿cuál es la probabilidad de que gane Ana? ¿y de que gane Beto? ¿y de que gane
Carlos?
1
1−x
134. Si elige al azar tres puntos de los nueve marcados en el plano cartesiano indicado en la
figura ¿Cuál es la probabilidad de que ellos se ubiquen sobre una misma recta?
EP
UD
135. Si se elige un número de seis cifras, ¿Cuál es la probabilidad de que tenga al menos una
A
cifra par?
IM
136. Se lanza una moneda ocho veces. Calcular la probabilidad de que el número de caras
-L
obtenidas en los primeros cuatro lanzamientos sea igual al número de caras obtenidas
S
PU
en los últimos cuatro.

M
137. ¿Qué es más probable: Sacar al menos un 5 al lanzar 3 veces un solo dado o sacar al
CA
menos un doce en 24 lanzamientos de 2 dados?
138. Si se elige al azar un número de cinco dı́gitos, ¿cuál es la probabilidad de que al menos
uno de sus dı́gitos sea “8”?
139. ¿Cuál es la probabilidad de que, en un grupo de 5 personas, por lo menos dos de ellas
hayan nacido el mismo dı́a de la semana (es decir, en lunes, martes,etc.)?
140. Drásticos cambios en el alfabeto y en las reglas de escritura contiene la nueva edición de
Ortografı́a elaborada por la Real Academia Española (RAE). Entre las modificaciones
E
más llamativas está la eliminación de algunas letras del alfabeto. Éstas son la “ch” y
AD
“ll”, que fueron suprimidas formalmente de la tabla del alfabeto, por lo que las letras
del abecedario ahora pasan a ser 27. Tomando en cuenta esto, si se le pidiera a cuatro
personas que escriban al azar, cada una en un papel, una letra del alfabeto:
a) ¿Cuál es la probabilidad de que las cuatro personas escriban la misma letra?

b) ¿Cuál es la probabilidad de que cada una escriba una letra distinta?
141. Se dispone de n+1 urnas numeradas: 0,1,...,n. La urna i (0 ≤ i ≤ n) contiene i canicas

-I I
blancas y n-i negras. Si se elige al azar una urna y se extraen de ella k canicas, una
22
tras otra con reemplazo ¿Cuál es la probabilidad de que las k canicas extraı́das sean
20
blancas?
142. En una lista de 80 clientes que poseen tarjeta de crédito hay 10 clientes que no están
al dı́a en sus pagos (morosos). Si selecciona aletoriamente 20 clientes de esa lista, ¿cuál
es la probabilidad de que al menos 3 de ellos sean morosos?
143. Se eligen aleatoriamente dos letras de la palabra: PASO.
a) Describa el espacio muestra del experimento.

b) Hallar la probabilidad que las letras seleccionadas sean vocales.
144. Para requerir a sus deudores que cumplan con sus pagos, una compañı́a utiliza: el
teléfono, visita personal y correo electrónico. De los datos registrados se sabe que al
25 % se le sugiere por vı́a telefónica que paguen, 30 % son visitados personalmente
y al resto se le envı́a un correo electrónico. Las probabilidades de recibir respuesta
EP
positiva (que el cliente pague su deuda) al aplicar estos métodos son: 0.6, 0.8 y 0.4,
respectivamente.
UD
Responda lo siguiente mostrando los cálculos claramente:
a) ¿Cuál es la probabilidad de que un cliente pague su deuda?

A
b) Si acaban de informar que un cliente acaba de hacer efectivo el pago de una deuda,
IM
¿cuál es la probabilidad de que se le haya contacto por teléfono?

-L
c) Si acaban de informar que un cliente acaba de hacer efectivo el pago de una deuda,
S
¿cuál es la probabilidad de que se le haya visitado personalmente?

PU
M
145. En una ciudad se estudia la cantidad de usuarios de internet según el sexo. Suponga
CA
que se tienen los siguientes datos, en miles de individuos:
Hombre Mujer Total

Emplea Internet 40 35 75
No emplea Internet 185 240 425
Total 225 275 500
a) Si seleccionamos al azar a una persona ¿Cuál es la probabilidad de que no emplee

internet?
E
AD
b) Si seleccionamos al azar a una persona y resulta ser hombre ¿Cuál es la

probabilidad de que emplee internet?
c) Si seleccionamos al azar a dos personas ¿Cuál es la probabilidad de que ambas
empleen internet?
146. En una asignatura universitaria asisten a clase 100 alumnos de los 150 alumnos
matriculados. Se sabe que aprueban la asignatura, el 90 % de los alumnos que asisten
a clase y el 30 % de los que no asisten. Si se elige al azar a un estudiante ¿Cuál es la
-I I
probabilidad de que haya aprobado la asignatura?

22
20
147. De una encuesta de opinión realizada a 318 personas, sobre las condiciones del mercado
laboral en Lima Metropolitana, se obtuvo la siguiente información:
Independiente Planilla Otros Total

Hombre 110 31 41 182
Mujer 90 11 35 136
Total 200 42 76 318
a) Si se selecciona al azar a una persona de la muestra ¿Cuál es la probabilidad de

que esté en planilla o sea mujer?
b) Si seleccionamos al azar a una persona y resulta que está en planilla ¿Cuál es la
EP
probabilidad de que sea hombre?

UD
c) Si seleccionamos al azar a tres personas ¿Cuál es la probabilidad de que las tres

sean independientes?
148. Una empresa recibe billetes de tres bancos: A, B y C. Del Banco A recibe el 60 % de
A
todos los billetes, del banco B recibe el 30 %, y el resto los recibe del Banco C. Se ha
IM
determinado que la proporción de billetes falsos que provienen del Banco A es 0.1 %,
-L
de B, 0.2 % y de C, 0.1 %. Si se elige al azar un billete recibido por la empresa ¿Cuál

S
es la probabilidad de que sea falso?

PU
149. Se desea conocer la opinión de los habitantes de un distrito limeño sobre cierta propuesta
M
CA
de ley que se discute en la Municipalidad distrital. La siguiente tabla ilustra los

resultados de una encuesta realizada sobre una muestra representativa de 300 habitantes
del distrito:
A favor Neutral En contra Total

Hombre 45 15 10 70
Mujer 90 110 30 230
Total 135 125 40 300
E
AD
Responda a las siguientes preguntas explicando y mostrando claramente los

cálculos realizados:
a) Si seleccionamos, al azar, a un individuo de la muestra ¿Cuál es la probabilidad

de que la persona seleccionada sea hombre y que esté a favor de la propuesta de
ley?
b) Si seleccionamos, al azar, a dos individuos de la muestra ¿Cuál es la probabilidad
de que ambos estén en contra de la propuesta de ley?
-I I
c) Si seleccionamos, al azar, a un individuo de la muestra ¿Cuál es la probabilidad

22
de que la persona seleccionada sea mujer o sea neutral a la propuesta de ley?

20
d ) Si seleccionamos, al azar, a dos individuos de la muestra ¿Cuál es la probabilidad

de que ambos estén a favor de la propuesta de ley?
e) Si seleccionamos, al azar, a un individuo de la muestra ¿Cuál es la probabilidad
de que la persona seleccionada no sea neutral, sabiendo que es mujer?
f ) Si seleccionamos, al azar, a dos individuos de la muestra ¿Cuál es la probabilidad

de que ambos sean neutrales a la propuesta de ley?
g) Si seleccionamos, al azar, a un individuo de la muestra ¿Cuál es la probabilidad de
que la persona seleccionada esté a favor de la propuesta de ley o sea un hombre?
150. Si se elige al azar un número de cinco cifras distintas:
a) ¿cuál es la probabilidad de que su primera cifra sea “4”?

b) ¿cuál es la probabilidad de que su tercera cifra sea “4”?
EP
UD
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Capı́tulo 4
Distribución de probabilidad discreta

EP
UD
4.1. Introducción
El capı́tulo 2 se dedicó a la estadı́stica descriptiva, permitiéndonos describir datos
recogidos (muestrales, generalmente) organizándolos en una distribución de frecuencias y
A
representando gráficamente dicha distribución. Igualmente, como parte de la descripción del
IM
conjunto, se calcularon e interpretaron medidas como la media (aritmética) o la mediana

-L
para especificar un valor representativo cercano al centro de la distribución, la desviación

S
estándar para describir la dispersión o variabilidad de los mismos, ası́ como otras medidas
PU
de importancia (de forma y posición) para completar la descripción. Por tanto, ese capı́tulo
M
se centró en describir algo que ya habı́a sucedido.

CA
A partir del Capı́tulo 3, el punto de interés cambió: se enfocó en examinar algo que
tal vez sucederı́a, es decir, se analizó la posibilidad de que ocurriera algún resultado de un
experimento estadı́stico realizado y entendimos que se cuantificaba dicha probabilidad de
ocurrencia con un valor que estaba entre 0 y l, inclusive, y además se examinó la forma
cómo pueden manejarse las probabilidades de ocurrencia de los eventos de un experimento
utilizando las reglas de conteo o las leyes de adición y multiplicación de probabilidades, etc.
En el presente capı́tulo combinaremos los conceptos de los capı́tulos 2 y 3 creando
distribuciones de probabilidad que describan lo que probablemente sucederá, en vez de
lo que en realidad sucedió. La diferencia con el capı́tulo 2 es que allı́ elaboramos tablas
E
AD
de frecuencias e histogramas utilizando valores muestrales observados que se reunieron

en realidad; y en este capı́tulo construiremos distribuciones de probabilidad presentando
los resultados posibles junto con las frecuencias relativas que esperamos. En este capı́tulo
estudiaremos las distribuciones de probabilidad discretas y en el capı́tulo siguiente las
distribuciones de probabilidad continuas. Recuerde que estos temas son de vital importancia
para comprender los métodos que son parte de la estadı́stica inferencial y que trataremos en
capı́tulos posteriores.
4.2. Variables aleatorias
-I I
En el capı́tulo 3, sección 3.2.1, se introdujo la definición que emplearemos para una

22
variable aleatoria, y en resumen lo que se decı́a es que una variable aleatoria proporciona un
20
medio para describir los resultados experimentales empleando valores numéricos. También
aprendimos que el valor numérico de la variable aleatoria depende del resultado del
experimento. Una variable aleatoria puede ser discreta o continua dependiendo del tipo de
151
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 152
valores numéricos que asuma. Ası́, una variable aleatoria discreta puede asumir una cantidad
limitada de valores especı́ficos en un determinado intervalo y por lo general, los valores de una
variable aleatoria discreta es el resultado de contar algo. En cambio una variable aleatoria
continua, puede tomar una cantidad infinitamente grande de valores dentro de un intervalo y
por lo general, los valores de una variable aleatoria continua eran el resultado de medir algo.
Un aspecto importante de entender a partir de ahora es que los medios utilizados ası́
como las interpretaciones de probabilidad, son diferentes tanto para las variables aleatorias
discretas como para las variables aleatorias continuas. En este capı́tulo nos centraremos en
el tratamiento de las variables discretas.
EP
4.3. Distribución de probabilidad discreta o función de probabilidad

UD
La distribución de probabilidad de una variable aleatoria describe cómo se distribuyen

las probabilidades entre los valores de la variable aleatoria.
En el caso de una variable aleatoria discreta X, la distribución de probabilidad está
A
definida por una función de probabilidad, denotada por f (x) y conocida también como
IM
función de cuantı́a. Entonces, dada una variable aleatoria discreta X, se define su función
-L
de probabilidad como la función que a cada valor x le asigna su probabilidad de ocurrencia,

S
es decir, la función de probabilidad muestra a cada valor de la variable aleatoria discreta

PU
asociado con la probabilidad de ocurrencia de cada uno de esos valores.

M
Para que una función f (x) sea una función de probabilidad discreta, se deben satisfacer
CA
las siguientes condiciones:
1. Los valores de las probabilidades deben estar entre cero y uno, inclusive: 0 ≤ p(x) ≤ 1,
∀x.
2. Si llamamos n al conjunto de todos los valores que puede tomar X, entonces la suma
n
X
de las probabilidades de dichos valores debe ser igual a 1: p(xi ) = 1
i=1
Una ventaja importante de definir una variable aleatoria y su correspondiente distribución

E
de probabilidad es que una vez que se conoce la distribución de probabilidad, es relativamente

AD
fácil determinar la probabilidad de diversos eventos que pueden ser útiles para tomar
decisiones (Anderson y Sweeney, 2008).
El ejemplo más simple de una distribución de probabilidad discreta es la distribución de
probabilidad uniforme discreta. Su función de probabilidad está definida por
1
f (x) = (4.1)
n
donde, “n” es el número de valores que la variable aleatoria puede asumir.
-I I
Ejemplo: Si consideramos el experimento de lanzar un dado normal y definimos la

22
variable: X=Número de puntos obtenidos

20
a) ¿Cuál es la distribución de probabilidad de X? Grafı́quela.

Sabemos que al lanzar un dado los posibles resultados son: 1, 2, 3, 4, 5, 6 y cada uno de
estos resultados tendrá una probabilidad de ocurrir igual a 16 . Por tanto la distribución
de probabilidad para el lanzamiento de un dado se muestra en la siguiente Tabla 4.1:
X 1 2 3 4 5 6
1 1 1 1 1 1
f(x) 6 6 6 6 6 6
Tabla 4.1: Distribución de probabilidad de X:Número de puntos obtenidos al lanzar un dado
Otra forma de expresar esta función de probabilidad de X serı́a:


 1

 6 si x = 1, 2, 3, 4, 5, 6
f (x) =


EP

0 en otros casos
UD
La función de probabilidad de X se grafica con el diagrama de barras de la figura

4.1. A
función de probabilidad de X
IM
0.5
S -L
0.4
PU
M
0.3
CA
f(x)
0.2
0.1
0.0
1 2 3 4 5 6
X:Nro. de puntos obtenidos al lanzar un dado
Figura 4.1: Función de probabilidad de X:Número de puntos obtenidos

E
AD
b) ¿Cuál es la probabilidad de obtener de 2 a 4 puntos?

1
Lo que se pide es: p(2 ≤ x ≤ 4) = p(x = 2) + p(x = 3) + p(x = 4) = 6 + 16 + 1
6 = 3
6 = 1
2
c) ¿Cuál es la probabilidad de obtener más de 2, pero como máximo 4 puntos? Lo que se

1 1 2 1
pide es: p(2 < x ≤ 4) = p(x = 3) + p(x = 4) = 6 + 6 = 6 = 3
d) Si lanza un dado y obtiene más de 2 puntos ¿Cuál es la probabilidad de que obtenga

menos de 5?
-I I
22
Lo que se pide es la probabilidad condicional:

20
p(x < 5 y x > 2) p(2 < x < 5)

p(x < 5 \ x > 2) = = =
p(x > 2) p(x > 2)
1
p(x = 3) + p(x = 4) +1 2
1
= = 1 61 16 1 = 64 =
p(x = 3) + p(x = 4) + p(x = 5) + p(x = 6) 6 + 6 + 6 + 6 6
2
Ejemplo. Un experimento consiste en lanzar un dado cargado donde se cumple que la

probabilidad de ocurrencia de cada cara es proporcional al número de puntos que tiene. Si
se define Y como el resultado de un lanzamiento, se deduce que:
y
f (y) =
21
De manera que la distribución de probabilidad de la variable Y es:
Y 1 2 3 4 5 6
EP
1 2 3 4 5 6
f(y) 21 21 21 21 21 21
UD
La gráfica de la función de probabilidad de Y se muestra en la figura 4.2.
función de probabilidad de Y
A
0.5
IM
-L
0.4
S
PU
0.3
f(y)
M
0.2
CA
0.1
0.0
1 2 3 4 5 6
Y:Nro. de puntos obtenidos al lanzar un dado cargado
Figura 4.2: Función de probabilidad de Y:Número de puntos obtenidos al lanzar dado cargado
E
Ejemplo: Suponga que se está interesado en el número de caras obtenidas al lanzar tres
AD
veces una moneda. El experimento claramente es lanzar una moneda repitiendo la experiencia
3 veces. Si definimos X: Número de caras obtenidas, los posibles resultados son: cero, uno,
dos y tres caras. ¿Cuál es la distribución de probabilidad de X?
La función de probabilidad de X será:
X 0 1 2 3
1 3 3 1
f(x) 8 8 8 8
-I I
La gráfica de la función de probabilidad de X: Número de caras obtenidas al lanzar tres

22
veces una moneda, se muestra en la figura 4.3.

20
4.4. Función de Distribución de una variable discreta

Existe otra función que está muy relacionada con la función de probabilidad discreta, la
cual se denomina función de distribución o función de acumulación de probabilidades, y se
función de probabilidad de X
0.5
0.4
0.3
f(x)
0.2
EP
0.1
UD
0.0
0 1 2 3
X:Nro. de caras obtenidas al lanzar tres veces una moneda

A
Figura 4.3: Función de probabilidad de X:Número de caras obtenidas al lanzar 3 veces una moneda
IM
S -L
denota por F (x). La función de distribución de una variable discreta recoge la probabilidad
PU
de que la variable tome valores menores o iguales a un valor dado, es decir, acumula las
M
probabilidades hasta un valor dado x. Esto, matemáticamente, quiere decir que:

CA
F (x) = P (X ≤ x) (4.2)
Para una variable aleatoria discreta X, F (x) satisface las siguientes propiedades:
0 ≤ F (x) ≤ 1. P (X > x) = 1 − F (x)
Si x ≤ y entonces F (x) ≤ F (y) F (−∞) = 0, F (+∞) = 1
Ejemplo: Si consideramos el experimento de lanzar un dado normal y definimos

la variable: X=Número de puntos obtenidos, ¿cuál es la función de distribución de X?
E
AD
Grafı́quela.
En la tabla 4.1 se elaboró la distribución de probabilidad o función de probabilidad
de X=Número de puntos obtenidos al lanzar un dado. Ahora para obtener la función de
distribución de X analizamos de la siguiente forma:
1 1
F (x = 1) = p(X ≤ 1) = p(X = 1) + p(X ≤ 0) = +0=
6 6
1 1 2
F (x = 2) = p(X ≤ 2) = p(X = 2)+p(X = 1)+p(X ≤ 0) = + +0 = , y análogamente
6 6 6
para los demás valores de X seguimos acumulando sucesivamente las probabilidades y
obtenemos:
-I I
22
X 1 2 3 4 5 6
20
1 2 3 4 5 6
F(x) 6 6 6 6 6 6
La función de distribución de X: Número de puntos obtenidos al lanzar un dado, se grafica

con el diagrama escalonado de la figura 4.4.
función de distribución de X
1.0
●
0.8
●
0.6
F(x)
●
0.4
●
0.2
EP
●
UD
0.0
0 1 2 3 4 5 6 7
A X
Figura 4.4: Función de distribución de X:Número de puntos obtenidos al lanzar un dado

IM
S -L
4.5. Media, Varianza y desviación estándar de una distribución de

PU
probabilidad discreta
M
La media (µ) de una variable aleatoria es una medida de la localización central de la

CA
misma y es un valor particular que sirve para representar una distribución de probabilidad.
Es el valor promedio a largo plazo de la variable aleatoria. A la media de una distribución
probabilı́stica se le denomina también valor esperado, E(x), o esperanza matemática.
La media, es un promedio ponderado para el que los valores posibles que se consideran
son afectados (o ”sopesados“) por las probabilidades correspondientes de ocurrencia. Por lo
tanto, para hallar µ ó E(x), se multiplica cada resultado posible de la variable aleatoria por
su probabilidad de ocurrencia: p(x), y luego se suman los productos obtenidos.
Por lo tanto, la media aritmética teórica o valor esperado de una distribución de
E
probabilidad discreta (o valor esperado de una variable aleatoria discreta) se expresa ası́:
AD
n
X
µ = E(X) = xi .p(xi ) (4.3)
i=1
Esto significa, que si un experimento se repite indefinidamente y se anotan los resultados

que se van obteniendo; es decir, los valores que va tomando la variable aleatoria X, la media
aritmética de éstos tenderá a µ.
Como se observó, la media es un valor caracterı́stico utilizado para representar una
distribución de probabilidad discreta. Sin embargo, no describe el grado de dispersión (o
-I I
variación) en una distribución. La varianza si lo hace. Como se explicó en el Capı́tulo 2, una

22
comparación de dos varianzas o de desviaciones estándar, permite confrontar la variación en

20
dos distribuciones que tengan la misma media, pero diferentes dispersiones. La varianza de
una distribución de probabilidad discreta es:
n
X
σ 2 = E[(x − µ)2 ] = (xi − µ)2 .p(xi ) (4.4)
i=1
También se puede calcular la varianza con la siguiente forma equivalente:

n
X
σ 2 = E[x2 ] − [E(x)]2 = x2i .p(xi ) − µ2 (4.5)
i=1
Luego, la desviación estándar σ es la raı́z cuadrada positiva de la varianza. Recuerde que

EP
la desviación estándar se mide en las mismas unidades que la variable aleatoria y, por lo
tanto, a menudo se prefiere al describir la variabilidad de una variable aleatoria. La varianza
UD
se mide en unidades cuadradas y, por lo tanto, es más difı́cil de interpretar.

Ejemplo. Si se lanza un dado normal ¿Cuál es el número promedio de puntos
obtenidos?¿Cuál es la desviación estándar del número de puntos obtenidos?
A
Conocida la distribución de probabilidad de X:número de puntos obtenidos al lanzar un
IM
dado, la cual aparece en la tabla 4.1, entonces el valor esperado de X, siguiendo la expresión
-L
(4.3), será:
S
PU
n
X 1 1 1 1 1 1
µ = E(X) = xi .p(xi ) = 1 ∗ + 2 ∗ + 3 ∗ + 4 ∗ + 5 ∗ + 6 ∗ = 3.5 puntos
6 6 6 6 6 6
M
i=1
CA
Es decir que, si un dado se lanza infinitas veces, el número de puntos que en promedio se
obtendrı́a serı́a 3.5.
Para hallar la varianza de X aplicamos de forma más simple la expresión (4.5):
n
X
σ 2 = E[x2 ] − [E(x)]2 = x2i .p(xi ) − µ2 =
i=1

1 1 1 35
= 12 ∗ + 22 ∗ + . . . + 62 ∗ − 3.52 = ≈ 2.92 puntos2
6 6 6 12
√
E
Luego la desviación estándar será: σ = 2.92 ≈ 1.71 puntos, es decir que, si un dado se
AD
lanza infinitas veces,en promedio, lo que se desvı́a el número de puntos obtenidos respecto
del número promedio de puntos obtenidos será aproximadamente 1.71.
Ejemplo. Supóngase que una caja contiene 20 pequeños paquetes, todos iguales con
excepción del contenido. Supóngase que 10 de estos paquetes contienen una moneda de
l céntimo cada uno, cinco paquetes contienen una moneda de 5 céntimos cada uno, tres
contienen una moneda de 10 céntimos cada uno y dos contienen una moneda de 50 céntimos
cada uno. Si se selecciona un paquete al azar, ¿cuál es el valor esperado de la moneda
contenida en él?
-I I
El experimento es elegir un paquete al azar, luego el número de posibles resultados es 20.

22
Si definimos la variable Y: Dinero (en céntimos) contenido en el paquete elegido, luego esta
20
variable puede tener los siguintes valores: 1, 5, 10, 50. Entonces la probabilidad de elegir un
10 5
paquete que contenga 1 céntimo es: , de elegir un paquete que contenga 5 céntimos es: ,
20 20
3
de elegir un paquete que contenga 10 céntimo es: y de elegir un paquete que contenga 50
20
2
céntimo es: . Por tanto la distribución de probabilidad de Y, será:
20
Y 1 5 10 50
10 5 3 2
f(y) 20 20 20 20
Luego el valor esperado de Y, siguiendo la expresión (4.3), será:

n
X 10 5 3 2
µ = E(Y ) = yi .p(yi ) = 1 ∗ +5∗ + 10 ∗ + 50 ∗ = 8.25 céntimos
20 20 20 20
i=1
EP
La respuesta de 8.25 céntimos, puede interpretarse como sigue: si la selección de un

UD
paquete se repitiera un gran número de veces bajo las mismas condiciones, el valor medio de
las cantidades obtenidas serı́a, aproximadamente, 8,25 céntimos.
Ejemplo. Juan Ramı́rez vende automóviles nuevos. Generalmente, negocia el mayor
A
número de vehı́culos, los dı́as sábado. Ha establecido la siguiente distribución probabilı́stica
IM
para el número de autos que espera vender en un sábado en particular.

S -L
X:Número de autos vendidos 0 1 2 3 4

PU
Probabilidad, P(x) 0.10 0.20 0.30 0.30 0.10

M
CA
a) ¿Qué tipo de distribución es ésta? Este es un ejemplo de una distribución probabilı́stica

discreta. Observe que Juan espera la venta en sólo un cierto conjunto de automóviles; no
confı́a vender 5 ó más autos. Además, no puede vender la mitad de un vehı́culo. Puede
lograr la venta de sólo 0, 1,2,3 ó 4 autos. Asimismo, los resultados son mutuamente
excluyentes; no puede vender un total de 3 y 4 automóviles el mismo dı́a y por eso se
cumple que la suma de las probabilidades de ocurrencia de los valores de X es igual a
1.
b) En un sábado común, ¿cuántos autos debe esperar vender Juan? El número medio
E
AD
de autos vendidos se calcula ponderando la cantidad de vehı́culos negociados, por la

probabilidad de vender este número, y se totalizan luego los productos.
n
X
µ = E(X) = xi .p(xi ) = 0 ∗ 0.10 + 1 ∗ 0.20 + 2 ∗ 0.30 + 3 ∗ 0.30 + 4 ∗ 0.10 = 2.10 autos
i=1
Este valor indica que, para una gran cantidad de sábados, el Sr. Ramı́rez espera vender
en promedio 2.1 autos al dı́a. (Desde luego, no es posible vender exactamente 2.1 autos
en un sábado en particular.) Por tanto, a la media se le considera como la esperanza
-I I
matemática del valor de la variable.

22
20
c) ¿Cuál es la desviación estándar del número de autos vendidos? Primero hallamos la

varianza de X aplicamos de forma más simple la expresión (4.5):

n
X
σ 2 = E[x2 ] − [E(x)]2 = x2i .p(xi ) − µ2 =
i=1

= 0 ∗ 0.10 + 1 ∗ 0.20 + 2 ∗ 0.30 + 3 ∗ 0.30 + 4 ∗ 0.10 − 2.12 = 1.29
2 2 2 2 2
autos2
√
Luego la desviación estándar será: σ = 1.29 ≈ 1.14 autos, es decir que, si se observan
infinitos sábados,en promedio, lo que se desvı́a el número de autos vendidos respecto del
número promedio de autos vendidos será aproximadamente 1.14. ¿Qué otra información
EP
nos proporciona la desviación estándar de 1.14 autos? Por ejemplo, si otro vendedor
UD
(Julio Pérez) también vendió una media de 2.1 autos los sábados, y la desviación
estándar en sus ventas fue 1.91 autos, se concluirá que existe más variabilidad en las
transacciones sabatinas de Julio Pérez que en las del Sr. Ramı́rez (debido a que 1.91 >
1.14).
A
IM
Ejemplo. Una persona juega a lanzar dos monedas y le dicen que recibirá $4 si aparecen
dos caras, perderá $2 si aparecen dos sellos y perderá $1 si en una moneda aparece cara y en
S -L
la otra sello, ¿Cuál es la ganancia o pérdida esperada para esta persona?

PU
El experimento es “jugar lanzando una vez las dos monedas”, luego la variable definida
M
sobre ese experimentos es Y: Ganancia o pérdida obtenida, entonces los valores que puede
CA
tener esta variable son tres: ganar 4 dólares, perder 2 dólares y perder l dólar. A cada uno de
estos resultados esta asociado un valor de probabilidad que se obtiene de lo que obtenga al
lanzar las dos monedas, ası́ la probabilidad de ganar 4 dólares está asociada a obtener 2 caras,
1
la cual es igual a = 0.25, la probabilidad de perder 2 dólares está asociada a obtener 2
4
1
sellos, la cual es igual a = 0.25 y , la probabilidad de perder l dólar está asociada a obtener
4
1 1 1
una cara y un sello, la cual es igual a + = = 0.50. La distribución de probabilidad
4 4 2
para este juego serı́a:
E
Y:Ganancia o pérdida -2 -1 4
AD
1 1 1
Probabilidad, P(x) 4 2 4
Luego lo que esperarı́a ganar o perder esta persona, serı́a:

n
X 1 1 1
µ = E(Y ) = yi .p(yi ) = (−2) ∗ + (−1) ∗ + (4) ∗ = 0 dólares
4 2 4
i=1
Esto quiere decir que si la persona jugara (lanzando dos monedas) infinitas veces entonces se
-I I
espera que no pierda ni gane.

22
4.5.1. Propiedades del valor esperado y de la varianza de una variable aleatoria

20
discreta.
Sea X una variable aleatoria discreta y sean a, b, c constantes; se verifica que:
E(c) = c (4.6) E[c.g(X)] = c.E[g(X)] (4.8)
E(aX + b) = aE(X) + b (4.7) V ar(aX + b) = a2 .V ar(X) (4.9)
Ejemplo. Suponga que el número de autos que pasan por una estación de lavado un
domingo , entre las 12 y 16 horas, tiene la siguiente distribución de probabilidades:
EP
X:Número de autos 4 5 6 7 8 9
f(x) 0.083 0.083 0.25 0.25 0.17 0.164
UD
a) ¿Cuál es el valor esperado de autos que pasa por la estación un domingo cualquiera?
El número medio de autos que pasa por la estación un domingo cualquiera se calcula
A
IM
empleando la expresión (4.3)

-L
n
X
S
µ = E(X) = xi .f (xi ) = 6.833 autos

PU
i=1
M
b) Si Y=2X-1 representa la cantidad de dinero, en decenas de unidades monetarias, que

CA
el dueño de la estación paga a su empleado por lavar autos ¿Cuál es el valor esperado
de dinero que va a ganar el empleado un domingo cualquiera? ¿Cuál es la desviación
estándar de Y?
La ganancia esperada para el empleado, un domingo cualquiera, se calcula usando la
expresión (4.7)
E(Y ) = E(2X − 1) = 2E(X) − 1 = 2 × 6.833 − 1 = 12.666 dec.u.m ≈ 127 u.m

E
Para calcular la desviación estándar de Y, calcularemos primero la varianza de X, luego

AD
la varianza de Y utilizando la expresión (4.9) y luego extraeremos la raı́z cuadrada al

resultado
σ 2 (Y ) = σ 2 (2X − 1) = 22 × σ 2 (X) = 4 × σ 2 (X)
La varianza de X la calculamos utilizando la expresión (4.5)
σ 2 (X) = 42 × 0.083 + 52 × 0.083 + . . . + 92 × 0.164 − 6.8332 ≈ 2.13
Luego la varianza de Y serı́a: σ 2 (Y ) = 4×2.13 ≈ 8.52 y por tanto la desviación estándar

-I I
√
de Y: σ(Y ) = 8.52 ≈ 2.92
22
20
4.6. Distribución de probabilidad binomial

La distribución probabilı́stica binomial es un ejemplo de una distribución probabilı́stica
discreta la cual tiene muchas aplicaciones. Se asocia con un experimento de varios pasos que
llamamos el experimento binomial.
Experimento Binomial: Un experimento binomial tiene las siguientes cuatro propie-

dades:
1. El experimento consiste en una secuencia de “n” ensayos idénticos.
2. Dos resultados son posibles en cada ensayo. Nos referimos a un resultado como un éxito
y el otro como un fracaso.
3. La probabilidad de éxito, denotada por p, no cambia de un ensayo a otro. En

consecuencia, la probabilidad de un fracaso, denotada por q=1-p, no cambia de ensayo
EP
en ensayo.
UD
4. Los ensayos son independientes.
Si las propiedades 2, 3 y 4 están presentes, decimos que los ensayos son generados por
un proceso de Bernoulli. Si, además, la propiedad 1 está presente, decimos que tenemos un
A
experimento binomial.
IM
En un experimento binomial, estamos interesados en la cantidad de éxitos que se producen

-L
en los “n” ensayos. Si permitimos que “x” denote el número de éxitos que ocurren en los “n”
S
ensayos, vemos que “x” puede asumir los valores de 0, 1, 2, 3,. . ., n. Debido a que el número de
PU
valores es finito, x es una variable aleatoria discreta. La distribución de probabilidad asociada

M
con esta variable aleatoria se llama distribución de probabilidad binomial.

CA
Ejemplo. Consideremos el experimento de lanzar un dado equilibrado 3 veces y en cada

lanzamiento observando si el dado muestra o no el número 5. Supongamos que queremos
contar el número de veces que aparece el número 5 en los tres lanzamientos. ¿Este experimento
muestra las propiedades de un experimento binomial? ¿Cuál es la variable aleatoria de interés?
Tengamos en cuenta que:
1. El experimento consta de tres ensayos idénticos; cada ensayo implica el lanzamiento de

un dado.
2. Hay dos resultados posibles para cada ensayo: obtener 5 o no obtenerlo. Podemos
E
AD
designar un éxito a la obtención del número 5 y un fracaso a no obtenerlo.
3. La probabilidad de obtener un 5 y la probabilidad de no obtenerlo son las mismas para

1 5
cada ensayo, con p = y 1 − p = .
6 6
4. Los ensayos o lanzamientos son independientes porque el resultado de cualquier ensayo
no se ve afectado por lo que sucede en otros ensayos o lanzamientos.
Podemos apreciar que se satisfacen las propiedades de un experimento binomial. La variable

aleatoria de interés es x = el número de veces que aparece el número 5 en los tres ensayos.
-I I
En este caso, x puede asumir los valores de 0, 1, 2 o 3.

22
Aprovechando el ejemplo anterior respondamos lo siguiente: Si un dado equilibrado es

20
lanzado 3 veces. ¿Cuál es la probabilidad de obtener dos veces el número 5?

Si definimos los eventos: E=Obtener número 5 (eso es éxito en un lanzamiento) y F=No
obtener número 5 (eso es fracaso en un lanzamiento), luego la probabilidad de éxito en un
ensayo es p(E)=1/6 y la del fracaso es, p(F)=5/6, como habı́amos visto anteriormente.
Entonces los posibles resultados del experimento son:

Ω = {EEE, EEF, EF E, EF F, F EE, F EF, F F E, F F F } (Como se ha visto en el
Capı́tulo 3, a través de un diagrama de árbol, también podrı́amos visualizar estos resultados).
Entonces si queremos saber cuál es la probabilidad de obtener dos veces el número 5 (o sea
la probabilidad de obtener 2 éxitos exactamente), tendrı́amos por la regla de la multiplicación,
1 1 5
para eventos independientes: × × , sin embargo esto nos da la probabilidad asociada
6 6 6
a un orden particular de éxitos (que los dos primeros lanzamientos muestren el número 5 y
el tercero no) osea el evento EEF, pero esa no es la única manera. Entonces para encontrar
el número de maneras de obtener dos veces el número 5 en un total de 3 lanzamientos
EP
3!
tendrı́amos: , por lo tanto la probabilidad de que obtengamos 2 veces el número 5 en
2! × 1!
UD
los tres lanzamientos será igual a:

2 1
1 1 5 3! 3! 1 5
P = × × × = × × = 0.069b
4
6 6 6 2! × 1! 2! × 1! 6 6
A
Entonces lo que hemos hecho para hallar la probabilidad pedida es aplicar la Regla
IM
generalizada de la multiplicación, para eventos independientes, y hemos multiplicado por

-L
el número de formas en que se puede obtener dos veces el número 5 en un total de tres
S
PU
lanzamientos.
Ejemplo. El 30 % de todos los vehı́culos que llegan por una calle a cierta intersección
M
giran hacia la izquierda. Si en un determinado momento se encuentran en dicha intersección

CA
8 autos detenidos por la luz roja del semáforo ¿cuál es la probabilidad de que giren hacia la
izquierda exactamente tres?
Entonces reconociendo las caracterı́sticas de una distribución binomial presentes en este
problema podemos decir, que el experimento consta de 8 ensayos idénticos, osea el número
de autos (8) en dicha intersección serian los “ensayos”. Cada ensayo implica lo que decida
hacer el conductor de un auto). Siguiendo con el análisis, sólo hay dos posibles resultados:
girar a la izquierda o no hacerlo. Ahora, la variable aleatoria o fenómeno de interés aquı́
es el “número de autos que giren a la izquierda” (aquı́, el girar a la izquierda está definido
E
como éxito), por ende si existen 8 carros en esa intersección el número de autos que giren
AD
a la izquierda podrı́an ser: 0, 1, 2, 3, 4, 5, 6, 7 u 8, es decir la variable aleatoria discreta

definida en este caso, sólo puede adoptar valores que van de 0 a 8. También, se ha definido
la probabilidad de éxito (p) en cada ensayo, pues nos dicen como dato que el 30 % de todos
los vehı́culos que llegan por una calle a cierta intersección giran hacia la izquierda y será
la misma en cada ensayo o auto, (quiere decir que la probabilidad de fracaso en un ensayo:
“No girar a la izquierda” es: q=1-p=1-0.3 = 0.7; y será igual para cada ensayo (auto)). Y la
última caracterı́stica es que los ensayos son independientes, es decir lo que cada auto haga
(“girar a la izquierda o no hacerlo”) es independiente de lo que hagan los otros.
-I I
Entonces si queremos saber cuál es la probabilidad de que exactamente 3 autos giren a

22
la izquierda (o sea la probabilidad de obtener 3 éxitos exactamente), tendrı́amos por la regla

20
de la multiplicación, para eventos independientes: 0.3 × 0.3 × 0.3 × 0.7 × 0.7 × 0.7 × 0.7 × 0.7,
sin embargo esto nos da la probabilidad asociada a un orden particular de éxitos (que los
tres primeros autos volteen a la izquierda y los 5 restantes no lo hagan). Si ahora se desea
8!
encontrar el número de maneras de seleccionar 3 autos de un total de 8 tendrı́amos:
3! × 5!
, por lo tanto la probabilidad de que exactamente 3 autos volteen a la izquierda será igual a:
8! 8!
P = 0.3 × 0.3 × 0.3 × 0.7 × 0.7 × 0.7 × 0.7 × 0.7 × = 0.33 × 0.75 = 0.2541
3! × 5! 3! × 5!
Entonces lo que hemos hecho para hallar la probabilidad pedida es aplicar la Regla
generalizada de la multiplicación, para eventos independientes, y hemos multiplicado por
el número de formas en que se pueden ordenar los 8 autos que conforman un subgrupo de 3
EP
y otro subgrupo de 5 autos.

UD
Se puede notar que en los ejemplos anteriores, se calcula la probabilidad de que, de una
muestra de “n” elementos (número de ensayos), “x” tengan cierta caracterı́stica (número
de “éxitos”), y los restantes “n - x” no la tengan (número de “fracasos”); siendo constante
la probabilidad (p) de que un elemento cualquiera tenga dicha caracterı́stica; ası́ como la
A
probabilidad de que no tenga la mencionada caracterı́stica (q = 1 - p).
IM
En situaciones como ésta, la probabilidad de que, de una muestra de n elementos, x

-L
elementos tengan dicha caracterı́stica (“éxito”), es:

S
PU
n!
P (X = x) = px (1 − p)n−x (4.10)
M
x!(n − x)!
CA
A esta expresión se le denomina distribución de probabilidad binomial, donde:

P(X=x) : Probabilidad de “x” éxitos dados los parámetros “n” y “p”.
n : Número de ensayos o pruebas binomiales (o tamaño de la muestra)
p : probabilidad de éxito en cada ensayo o prueba binomial.
q : probabilidad de fracaso en cada ensayo o prueba binomial = 1-p
x : Número de éxitos en el total de ensayos o en la muestra ( x = 0, 1, 2, 3,. . . , n)
Decimos pues que la v.a. X correspondente al número de éxitos en “n” ensayos de

Bernoulli independentes y con la misma probabilidad “p” de éxito, tiene distribuición
E
AD
binomial con parámetros “n” y “p”. La notación comunmente utilizada para expresar esto
es, X ∼ B(n, p).
Ejemplo. Tomando como referencia el problema de los autos, ¿Cuál serı́a la probabilidad
de que al menos 3 autos giren hacia la izquierda?
Para resolver esto debemos calcular: P(X=3), P(X=4), P(X=5), P(X=6), P(X=7) y
P(X=8); y sumar estas cantidades para obtener la probabilidad pedida. Entonces tendrı́amos:
P (X ≥ 3) = P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) + P (X = 7) + P (X = 8)
-I I
8! 8! 8!
= × 0.33 × 0.75 + 0.34 × 0.74 + 0.35 × 0.73 +
3! × 5! 4! × 4! 5! × 3!
22
8! 8! 8!
20
+ 0.36 × 0.72 + 0.37 × 0.71 + 0.38 × 0.70

6! × 2! 7! × 7! 8! × 0!
= 0.2541 + 0.1361 + 0.0467 + 0.0100 + 0.0012 + 0.0001 = 0.4482
4.6.1. Usando Tablas de Probabilidades Binomiales para el cálculo de probabi-

lidades
Existe una forma de simplificar considerablemente el cálculo de probabilidades binomiales
mediante el empleo de tablas, como las que aparecen al final de este texto en el Apéndice
A.2, que nos proporcionan directamente las probabilidades binomiales que necesitemos.
Estas tablas permiten calcular probabilidades para distribuciones binomiales con algunos
valores de “p” tales como 0.01, 0.05, 0.10, . . . , 0.80, 0.90, 0.95, y de “n” como 2, 3,. . . , 19,
20. Para estos dos parámetros, “n” y “p”, se puede calcular la probabilidad de “x” éxitos en
EP
“n” ensayos binomiales, siendo como ya se sabe “p” la probabilidad que se tenga éxito en un
ensayo.
UD
Por ejemplo, en la Tabla 4.2 para 6 ensayos (n=6) y probabilidad de éxito en un ensayo
de 0.05 (p=0.05); la probabilidad de 2 éxitos, (x=2) es 0.0305 (resaltado en negrita).
p
A
IM
n x 0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40

-L
6 0 0.9415 0.7351 0.5314 0.3771 0.2621 0.1780 0.1176 0.0754 0.0467

S
1 0.0571 0.2321 0.3543 0.3993 0.3932 0.3560 0.3025 0.2437 0.1866

PU
2 0.0014 0.0305 0.0984 0.1762 0.2458 0.2966 0.3241 0.3280 0.3110

M
3 0.0021 0.0146 0.0415 0.0819 0.1318 0.1852 0.2355 0.2765

CA
4 0.0001 0.0012 0.0055 0.0154 0.0330 0.0595 0.0951 0.1382

5 0.0001 0.0004 0.0015 0.0044 0.0102 0.0205 0.0369
6 0.0001 0.0002 0.0007 0.0018 0.0041
Tabla 4.2: Valores seleccionados de la tabla de probabilidad binomial para el caso n=6, x=2, p=0.05
De la misma forma si quiséramos resolver del problema de los autos, la pregunta del
ejemplo anterior: ¿Cuál serı́a la probabilidad de que al menos 3 autos giren hacia la
E
izquierda? utilizando las tablas debemos buscar: n = 8 y luego p = 0.3, para determinar las
AD
probabilidades: P(X=3), P(X=4), P(X=5), P(X=6), P(X=7) y P(X=8), para luego sumarlas
y hallar la probabilidad de que por lo menos 3 vehı́culos giren hacia la izquierda, o sea:
En las tablas encontraremos, para n = 8, p = 0,30, las probabilidades: P(X=3), P(X=4),
P(X=5), P(X=6), P(X=7) y P(X=8) tal como se muestran resaltadas en la Tabla 4.3 y las
cuales al ser sumadas definirán el resultado que halláramos (0.4482).
Valor esperado y varianza para la distribución binomial
Si X ∼ b(n, p) entonces:
µ = E(X) = n × p (4.11)
-I I
V ar(X) = σ 2 = n × p × (1 − p)
22
(4.12)
20
Ejemplo. Del problema de los autos. ¿Cuántos autos se esperarı́a giren a la izquierda?,
¿Cuál es la desviación estándar del número de autos que giran a la izquierda?
Recordando que para este problema: n=8, p = 0.30 y q =1-p= 0.70; se tiene que:
p
n x 0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40
8 0 0.9227 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168
1 0.0746 0.2793 0.3826 0.3847 0.3355 0.2670 0.1977 0.1373 0.0896
2 0.0026 0.0515 0.1488 0.2376 0.2936 0.3115 0.2965 0.2587 0.2090
3 0.0001 0.0054 0.0331 0.0839 0.1468 0.2076 0.2541 0.2786 0.2787
4 0.0004 0.0046 0.0185 0.0459 0.0865 0.1361 0.1875 0.2322
EP
5 0.0004 0.0026 0.0092 0.0231 0.0467 0.0808 0.1239

UD
6 0.0002 0.0011 0.0038 0.0100 0.0217 0.0413

7 0.0001 0.0004 0.0012 0.0033 0.0079
8 0.0001 0.0002 0.0007
A
IM
Tabla 4.3: Valores seleccionados de la tabla de probabilidad binomial para n=8, p=0.30 y
x=3,4,5,6,7,8.
S -L
PU
µ = E(X) = n × p = 8 × 0.30 = 2.4 autos

M
CA
V ar(X) = σ 2 = n × p × (1 − p) = 8 × 0.3 × 0.7 = 1.68 autos2

√
σ = 1.68 ≈ 1.3 autos
A continuación resolvemos un ejemplo más con ayuda de las tablas de probabilidades

binomiales.
Ejemplo. Siguiendo con el problema de los autos, ¿Cuál será la probabilidad de que giren
hacia la izquierda menos de 5 vehı́culos?
Lo que se pide es
E
P (X < 5) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
AD
Entonces consultando las tablas binomiales, para n=8, p = 0.30, tomaremos los valores
de P(X=0), P(X=1), P(X=2), P(X=3), P(X=4); que aparecen en negrita como se aprecia
en la Tabla 4.4 y sumaremos estas cantidades para obtener la probabilidad pedida.
Luego la probabilidad pedida es:
P (X < 5) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
= 0.9420
-I I
22
4.7. Distribución de probabilidad de Poisson

20
Consideramos ahora una variable aleatoria discreta que a menudo es útil para estimar
el número de ocurrencias en un intervalo especı́fico de tiempo, longitud, área, espacio, etc.
Por ejemplo, la variable aleatoria de interés puede ser el número de vehı́culos que llegan a
p
n x 0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40
8 0 0.9227 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168
1 0.0746 0.2793 0.3826 0.3847 0.3355 0.2670 0.1977 0.1373 0.0896
2 0.0026 0.0515 0.1488 0.2376 0.2936 0.3115 0.2965 0.2587 0.2090
3 0.0001 0.0054 0.0331 0.0839 0.1468 0.2076 0.2541 0.2786 0.2787
4 0.0004 0.0046 0.0185 0.0459 0.0865 0.1361 0.1875 0.2322
EP
5 0.0004 0.0026 0.0092 0.0231 0.0467 0.0808 0.1239

UD
6 0.0002 0.0011 0.0038 0.0100 0.0217 0.0413

7 0.0001 0.0004 0.0012 0.0033 0.0079
8 0.0001 0.0002 0.0007
A
IM
Tabla 4.4: Valores seleccionados de la tabla de probabilidad binomial para n=8, p=0.30 y x=0,1,2,3,4
S -L
una gasolinera o el número de clientes que llega a un banco en un determinado intervalo de

PU
tiempo, el número de ralladuras y otras imperfecciones en paneles de automóvil recientemente

M
pintados, el número de partes defectuosas en embarques de salida, el número de clientes en

CA
espera de servicio en un restaurante, o los que aguardan a entrar a una de las atracciones en un
centro de diversiones, el número de accidentes en una carretera durante un perı́odo de tiempo
(tres meses, por ejemplo), etc. Si se satisfacen las dos propiedades siguientes, el número de
ocurrencias es una variable aleatoria descrita por la distribución de probabilidad de
Poisson.
Propiedades de un experimento de Poisson
1. La probabilidad de una ocurrencia es la misma para cualesquiera dos intervalos de igual

longitud.
E
AD
2. La ocurrencia o no ocurrencia en cualquier intervalo es independiente de la ocurrencia

o no ocurrencia en cualquier otro intervalo.
La función de probabilidad de Poisson es definida por la siguiente expresión
e−λ × λx
P (X = x) = (4.13)
x!
donde:
P(X=x) : Probabilidad de “x” ocurrencias en un intervalo.
-I I
λ : Valor esperado o número medio de ocurrencias en un intervalo especı́fico (o por unidad

22
especı́fica).
20
e : constante matemática, con valor aproximado de 2.71828

x : Número de ocurrencias por unidad especı́fica (x = 0, 1, 2, 3,. . . , ∞)
√
La desviación estándar de una variable con distribución de Poisson es λ. La notación
comunmente utilizada para expresar que una variable sigue distribución de Poisson es,
X ∼ P (λ).
En aplicaciones prácticas, x eventualmente se volverá lo suficientemente grande como
para que f (x) sea aproximadamente cero y la probabilidad de que cualquier valor mayor de
x se vuelva insignificante (Anderson et al., 2014).
Ejemplo. Usted es el gerente de una tienda y sabe que, fuera del horario de mayor
demanda, entran en promedio, 6 clientes cada 10 minutos. ¿Cuál es la probabilidad de que
entren:
EP
a) 5 clientes en un periodo cualquiera de 10 minutos fuera del horario de mayor demanda?

Inicialmente, percibimos que se trata de una variable con distribuición de Poisson e
UD
identificamos que:
X: número de clientes que entram en un perı́odo de 10 minutos;
λ =6 clientes/10 minutos
A
IM
Empleando la expresión 4.13 tenemos:

S -L
PU
e−6 × 65
P (X = 5) = = 0.1606
5!
M
b) máximo 2 clientes en un perı́odo de 10 minutos fuera del horario de mayor demanda?

CA
Lo que se pide es: P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2). Entonces:
P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2)
e−6 × 60 e−6 × 61 e−6 × 62
= + +
0! 1! 2!
= 0.0025 + 0.0149 + 0.0446 = 0.062
c) 3 clientes o más fuera del horario de mayor demanda a lo largo de 10 minutos?

E
Lo que se pide es: P (X ≥ 3) = P (X = 3) + P (X = 4) + . . ..

AD
Puesto que la suma de todas las probabilidades en una distribución de probabilidad

debe ser 1, los términos del lado derecho de la ecuación de P (X ≥ 3) representan
también el complemento de la probabilidad de que “x” sea menor que 3, es decir:
P (X ≥ 3) = 1 − P (X < 3). Por lo tanto,
P (X ≥ 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2))
e−6 × 60 e−6 × 61 e−6 × 62
= 1−( + + )
0! 1! 2!
-I I
= 1 − (0.0025 + 0.0149 + 0.0446) = 0.9380

22
20
4.7.1. Usando Tablas de Probabilidades de Poisson para el cálculo de

probabilidades
Existe una forma de simplificar considerablemente el cálculo de probabilidades de Poisson
mediante el empleo de tablas, como las que aparecen al final de este texto en el Apéndice
A.3, que nos proporcionan directamente las probabilidades que necesitemos.

Estas tablas permiten calcular probabilidades para distribuciones de Poisson con λ = 0.1,
0.2, 0.3,. . . , 1.0, 1.1,. . . , 10, 11,. . . , 20, y para x = 0,1, 2, 3,. . . , 39. Con el parámetro λ se
puede calcular la probabilidad de “x” éxitos en un proceso de Poisson con media: λ. Por
ejemplo utilizando directamente las tablas, podemos ver que cuando,λ = 2.5, la probabilidad
de 4 éxitos (x = 4) es 0.1336.
De la misma forma si quisiéramos resolver el apartado b) del ejemplo anterior: ¿Cuál serı́a
la probabilidad de que entren como máximo 2 clientes en un perı́odo de 10 minutos fuera
del horario de mayor demanda? Utilizando las tablas debemos buscar: λ = 6 y luego x = 0,
EP
1 y 2, para determinar las probabilidades: P(X=0), P(X=1), P(X=2), tal como se muestran
UD
resaltadas en la Tabla 4.5 y las cuales al ser sumadas definirán el resultado que halláramos
(0.062).
λ
A
IM
x 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6.0
0 0.0061 0.0055 0.0050 0.0045 0.0041 0.0037 0.0033 0.0030 0.0027 0.0025
S -L
1 0.0311 0.0287 0.0265 0.0244 0.0225 0.0207 0.0191 0.0176 0.0162 0.0149
PU
2 0.0793 0.0746 0.0701 0.0659 0.0618 0.0580 0.0544 0.0509 0.0477 0.0446
M
3 0.1348 0.1293 0.1239 0.1185 0.1133 0.1082 0.1033 0.0985 0.0938 0.0892
CA
4 0.1719 0.1681 0.1641 0.1600 0.1558 0.1515 0.1472 0.1428 0.1383 0.1339
5 0.1753 0.1748 0.1740 0.1728 0.1714 0.1697 0.1678 0.1656 0.1632 0.1606
6 0.1490 0.1515 0.1537 0.1555 0.1571 0.1587 0.1594 0.1601 0.1605 0.1606
7 0.1086 0.1125 0.1163 0.1200 0.1234 0.1267 0.1298 0.1326 0.1353 0.1377
8 0.0692 0.0731 0.0771 0.0810 0.0849 0.0887 0.0925 0.0962 0.0998 0.1033
9 0.0392 0.0423 0.0454 0.0486 0.0519 0.0552 0.0586 0.0620 0.0654 0.0688
E
10 0.0200 0.0220 0.0241 0.0262 0.0285 0.0309 0.0334 0.0359 0.0386 0.0413
AD
11 0.0093 0.0104 0.0116 0.0129 0.0143 0.0157 0.0173 0.0190 0.0207 0.0225
12 0.0039 0.0045 0.0051 0.0058 0.0065 0.0073 0.0082 0.0092 0.0102 0.0113
13 0.0015 0.0018 0.0021 0.0024 0.0028 0.0032 0.0036 0.0041 0.0046 0.0052
14 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013 0.0015 0.0017 0.0019 0.0022
15 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009
16 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003
-I I
17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001
22
20
Tabla 4.5: Valores seleccionados de la tabla de probabilidad de Poisson para λ = 6 y x=0,1,2

4.7.2. Aproximación de la distribución binomial empleando la distribución de

Poisson
Ejemplo. El Gerente de Calidad de una empresa recibe un lote de 1000000 artı́culos
donde el 0.1 % es defectuoso. Se inspeccionan 1000 artı́culos y se decide aceptar el lote si el
número de artı́culos defectuosos es menor o igual a 4. ¿Cuál es la probabilidad de que el lote
sea aceptado?
Claramente la variable de interés es: X= número de artı́culos defectuosos en el lote y es
de naturaleza binomial con parámetros n=1000 y p=0.001, donde
EP
1000!
P (X = x) = 0.001x (1 − 0.001)1000−x
UD
x!(1000 − x)!
No hay tablas binomiales que muestren las probabilidades requeridas y puede ocurrir
que las calculadoras tengan problemas con los grandes factoriales involucrados aquı́. La
distribución de Poisson surge como el lı́mite de una secuencia de distribuciones binomiales
A
cuando p → 0+ y n → ∞ de tal manera que “n × p = µ” es constante.
IM
La distribución binomial puede ser aproximada por la distribución de Poisson, si la

-L
probabilidad de éxito es muy pequeña y el número de ensayos es muy grande. Una pequeña
S
PU
“p” significa que el éxito es un evento raro. Algunos autores consideran que la aproximación
de la distribución binomial B(n, p) con una distribución de Poisson es aceptable si n ≥ 50 y
M
p ≤ 0.05. La aproximación será mejor si crece “n” o se reduce “p”.

CA
En términos generales, la distribución de Poisson surge cuando intentamos lograr un

resultado raro muchas veces. La distribución de Poisson a veces se llama la “ley de eventos
raros” (Ubøe, 2017).
Retornando a la resolución del ejemplo dado, vemos que binomialmente µ = n × p =
1000 × 0.001 = 1, entonces si entramos a las tablas de probabilidad de Poisson utilizando el
valor de λ = 1 y tomamos los valores asociados a la probabilidad solicitada tendrı́amos:
P (X ≤ 4) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
E
= 0.3679 + 0.3679 + 0.1839 + 0.0613 + 0.0153 = 0.9963

AD
Nota: A manera de comparación, si hubiéramos empleado la expresión de la distribución

binomial para hallar las probabilidades asociadas a la probabilidad solicitada los valores
serı́an
P (X ≤ 4) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
= 0.3677 + 0.3681 + 0.1840 + 0.0613 + 0.0153 = 0.9964
-I I
Vemos que hay una diferencia pero es prácticamente insignificante.

22

20
1. Si se propone un juego lanzando un dado, en las siguientes condiciones: si sale 1 se gana

$50, pero si sale cualquier otro número se pierde $ 10. ¿Aceptarı́a jugar? ¿Por qué?
2. Una persona va a lanzar un par de dados y recibirá un número de soles igual a la suma
que aparezca. ¿Cuál es el valor esperado?
3. Un psicólogo ha determinado que la cantidad de horas necesarias para obtener la

confianza de un nuevo paciente es de 1, 2, o 3. Sea “x” una variable aleatoria que
indica el tiempo, en horas, necesario para ganarse la confianza del paciente. Se ha
x
propuesto la siguiente función o distribución de probabilidad: f (x) = , para x = 1, 2
6
o 3.
a) ¿Es esta una distribución de probabilidad válida? Explique su respuesta.

EP
b) ¿Cuál es la probabilidad de que necesite exactamente 2 horas para ganarse la

confianza del paciente?
UD
c) ¿Cuál es la probabilidad de que necesite cuando menos 2 horas para ganarse la

confianza del paciente?
4. Una vendedora en un estadio local de fútbol debe decidir si vende helados o refrescos
A
IM
durante el juego de mañana. Ella piensa que el beneficio obtenido dependerá del clima.
La tabla de pagos es:
S -L
PU
ACCIÓN
M
EVENTO VENDER REFRESCOS VENDER HELADOS

CA
Clima frı́o $50 $30

Clima caliente $60 $90
Con base en su última experiencia en esta época del año, la vendedora estima la
probabilidad de que haga calor en 0.60
a) Calcule el valor esperado al vender helados y al vender refrescos.

b) Con base en los resultados del apartado a),¿Qué debe elegir la vendedora, refrescos
o helados?¿Por qué?
E
AD
c) Calcule el coeficiente de variación para la venta de helados y la de refrescos.
5. En la tabla siguiente se observan las distribuciones de probabilidades para las

calificaciones de satisfacción en el trabajo de altos ejecutivos y mandos medios de
sistemas de información. Las calificaciones van desde 1, para insatisfecho, hasta 5, para
muy satisfecho.
a) ¿Cuál es el valor esperado de calificación por parte de los ejecutivos?

b) ¿Cuál es el valor esperado de calificación por parte de los mandos medios?
-I I
c) Calcule la varianza y la desviación estándar de las calificaciones para los altos

22
20
ejecutivos y para los mandos medios

d) Compare la satisfacción general de los altos ejecutivos y de los mandos medios con
sus trabajos.
Probabilidad
Calificación de satisfacción en el trabajo Altos ejecutivos Mandos medios
1 0.05 0.04
2 0.09 0.10
3 0.03 0.12
4 0.42 0.46
5 0.41 0.28
EP
Total 1.00 1.00

UD
k
6. Determinar el valor de k para que la función P (x) = , donde x = 1, 2, 3, 4, sea la
x
función de probabilidad de x. Determinar P (1 ≤ x ≤ 3).
A
7. Una empresa ha medido el número de errores que cometen las secretarias recién
IM
contratadas a lo largo de los últimos tres años (X), encontrando que éstas cometen
-L
hasta cinco errores en una página de 20 lı́neas y que esta variable aleatoria representa
S
la siguiente función de probabilidad:

PU
M
X 0 1 2 3 4 5
CA
f(x) 0.5 0.28 0.07 0.06 0.05 0.04
a) La representación gráfica de la función de probabilidad.

b) Mostrando cálculos halle el valor esperado y la varianza de X
c) Si se escoge una secretaria al azar, ¿cuál es la probabilidad de que cometa máximo
2 errores? ¿y como mı́nimo 2 errores?
8. La variable V = “número de pólizas vendidas por un agente de una empresa de seguros”

E
tiene la siguiente distribución de probabilidad:

AD
X 0 1 2 3 4 5 6
f(x) 0.47 0.30 0.10 0.06 0.04 0.02 0.01
a) Mostrando cálculos halle el valor esperado y la varianza de V.

b) ¿Cuál es la probabilidad de que el agente venda más de una póliza?
c) ¿Cuál es la probabilidad de que venda menos de 3?
-I I
d) ¿Cuál es la probabilidad de que venda entre 1 y 4 pólizas (ambas inclusive)?

22
20
e) Si el agente vende más de 2 pólizas ¿Cuál es la probabilidad de haya vendido

menos de 5?
9. Supóngase que se selecciona al azar una palabra de la frase: LA MUJER SE PUSO SU

PRECIOSO SOMBRERO ROJO. Si X es el número de letras de la palabra seleccionada.
¿Cuál es el valor de E[X]? Supóngase que se selecciona al azar una de las 35 letras que
tiene la oración anterior. Si Y es el número de letras de la palabra en que aparece la
letra seleccionada ¿cuál es el valor de E[Y]?
10. En un juego de publicidad, la persona participante tiene una posibilidad en 10000 de

ganar $1000, dos posibilidades en 10000 de ganar $500, dos posibilidades en 10000 de
ganar $100, cinco posibilidades en 10000 de ganar $50 y 9990 posibilidades en 10000
de no ganar nada. ¿Cuál es la ganancia esperada?
11. Una urna contiene 8 canicas similares en todos los aspectos, con excepción del color.
EP
Cuatro de ellas son rojas, tres son blancas y una es negra. Se selecciona una canica al
UD
azar. Si es roja, la persona que la seleccionó recibe 10 céntimos, si es blanca, no recibe

nada; si es negra, pierde 50 céntimos. ¿Cuál es el valor esperado del jugador?
12. Una ruleta tiene 38 compartimientos numerados: 0, 00, 1, 2, ..., 36. La mitad de
A
los compartimientos entre 1 y 36 son rojos y la otra mitad son negros. Los dos
IM
compartimientos restantes, enumerados 0 y 00, están coloreados de verde. Suponga

-L
que se apuesta $1 en un compartimiento rojo. Cuando la bola se rota y cae en un

S
compartimiento rojo, el jugador gana $1. De otra manera, pierde $1. ¿Qué deberı́a
PU
esperar el jugador ganar en un juego? ¿Cuál es la desviación estándar de la variable

M
aleatoria involucrada? Interprete los resultados.

CA
13. Suponga que selecciona al azar una palabra de la frase: ANOCHE ME ROBARON EL
CARRO MIENTRAS DORMÍA. Si la variable X es el número de letras de la palabra
seleccionada, calcule E(X) y σ(X).
14. Un inversionista tiene $1,000 para invertir. Tiene dos opciones. En una, puede invertir
en una cuenta que paga 5 % anualmente. En la otra puede comprar un bono. Si compra
el bono, tiene una probabilidad igual a de perder $300 y una probabilidad igual a de
ganar $700. ¿Cuál opción debe escoger?
E
AD
15. Una persona que participa en un juego lanza un dado. Si obtiene 5 ó 6 en el primer
lanzamiento gana $10. Si no, vuelve a lanzar el dado, y si repite el resultado del primer
lanzamiento, gana $8.Si no repite este resultado, pero obtiene un número mayor, gana
$4; pero si obtiene un número menor, lanza el dado por tercera vez. Si esta vez repite
el resultado del primer lanzamiento, se retira sin ganar ni perder; pero si no se repite
dicho resultado, pierde $20. ¿Cuánto espera la persona ganar o perder?
16. En una prueba de aptitud conformada por 25 preguntas, 4 son de cultura general. A
un alumno se le asignarán 20 preguntas al azar para que haga una tarea. Si se define
-I I
X= Número de preguntas de cultura general que se le asignan al alumno:

22
20
a) Halle la función de probabilidad o distribución de probabilidad de la variable X.

b) Halle la función de distribución de la variable X.
c) Calcule el valor esperado de la variable X, e interprete dicho resultado.
17. En una loterı́a se venden 200 boletos, de los cuales dos son ganadores de $1000, ocho de
$500, 10 de $200, 12 de $100 y 60 de $10. Sea X una variable aleatoria que representa
la ganancia de un jugador:
a) Encuentre la distribución de probabilidad de la variable X.

b) Calcule la media y la desviación estándar de la variable X. e interprete los
resultados.
18. El 90 % de los árboles plantados en una campaña de reforestación sobrevive.

EP
a) ¿Cuál es la probabilidad de que sobrevivan como máximo 7 de los 10 árboles que

UD
acaban de ser plantados?

a) ¿Cuál es la probabilidad de que sobrevivan como mı́nimo 6 de los 10 árboles que
acaban de ser plantados?
A
a) ¿Cuál es la probabilidad de que no sobrevivan como máximo 3 de los 10 árboles
IM
que acaban de ser plantados?

-L
19. Según un informe de la OCDE, en el año 1981 el 35 % de la población mundial

S
PU
tenı́a menos de 15 años. Si fuera posible elegir una muestra aleatoria de la población
mundial formada por diez personas, ¿cuál es la probabilidad de que a lo sumo haya tres
M
individuos con edad inferior a 15 años?

CA
20. Una universidad se entero de que el 20 % de sus alumnos se retiran del curso de
introducción a la fı́sica cuántica. Suponga que en este semestre se inscribieron 20
alumnos a ese curso.
a) ¿Cuál es la probabilidad de que dos o menos se retiren del curso?

b) ¿Cuál es la probabilidad de que exactamente 4 alumnos se retiren del curso?
c) ¿Cuál es la probabilidad de que se retiren del curso más de tres alumnos?
E
d) ¿Cuál es la cantidad esperada de retiros?

AD
21. Los registros hospitalarios indican que el 10 % de los casos de cierta enfermedad es
fatal. Si hay 10 pacientes que sufren la enfermedad, encontrar la probabilidad:
a) De que todos sanen.

b) De que por lo menos tres mueran
c) De que exactamente tres mueran.
22. Si se lanza 12 veces un par de dados, ¿Cuál es la probabilidad de que la suma 5 ó 6

-I I
aparezca con menor frecuencia que el número esperado de veces?

22
20
23. Una secretaria que debe llegar a su trabajo todas las mañanas a las 8:00 se retrasa
como mı́nimo 15 minutos el 20 % de las veces. El jefe de la oficina, que no llega sino a
las nueve la mayorı́a de las veces, pero llama ocasionalmente a la oficina entre las 8:00
y las 8:15 para enterarse de las novedades
a) ¿Cuál es la probabilidad de que en dos mañanas de las cinco de la semana, que el

jefe llame, la secretaria no esté en la oficina?
b) Por lo menos 2 mañanas de las cinco, la secretaria esté.
c) ¿Cuál es el número de mañanas que se esperarı́a la secretaria esté?
24. Se sabe que X es una variable aleatoria binomial con un media igual a 8 y una desviación
estándar de 2. Elaborar la distribución de probabilidad de X.
25. Al probar una cierta clase de medicamento en 100 estudiantes se encontró que 25 de
EP
ellos perdieron el hábito de copiar en los exámenes. De los siguientes 15 estudiantes

que prueban ese medicamento, obtenga la probabilidad de que:
UD
a) Exactamente 8 pierdan el hábito de copiar.

b) Más de 5 pierdan el hábito de copiar.
A
c) De 3 a 6, inclusive, pierda el hábito de copiar.
IM
d) Menos de 4 pierdan el hábito de copiar

-L
e) Calcule el valor esperado y la varianza

S
PU
26. Suponga que selecciona al azar una palabra de la frase: SE ENSAYAN LOS BAILES
M
PARA LA GRAN INAUGURACIÓN. Si la variable X es el número de letras de la

CA
palabra seleccionada, calcule E(X) y σ(X).
27. Un examen tipo test consta de diez preguntas, las cuales tienen cuatro posibles
respuestas, siendo solo una de ellas correcta. Si una persona contestase al azar , es
decir, eligiese de forma aleatoria una de las cuatro respuestas posibles de cada una de
las 10 preguntas:
a) ¿Cuál serı́a el número esperado de respuestas correctas?

b) ¿Qué probabilidad tendrı́a de acertar la respuesta correcta de al menos seis
E
preguntas?
AD
c) ¿Qué probabilidad tendrı́a de no contestar ninguna pregunta correctamente?
28. La probabilidad de que un paciente se recupere de una operación para extirpar un

tumor cerebral es del 90 %. Hallar la probabilidad de que se recuperen cinco de siete
pacientes que esperan turno para ser operados.
29. En general, el 25 % de los candidatos fallan en una prueba de selección, Cual es la

probabilidad de que en una muestra de 15:
-I I
a) fallen por lo menos 8?

22
b) De que fallen más de 4?

20
c) De que fallen entre 5 y 9, inclusive?
30. La probabilidad de que un compact disc, dure al menos un año sin que falle es de 0.95,
calcular la probabilidad de que en 15 de estos aparatos:
a) 12 duren menos de un año.

b) a lo más 5 duren menos de un año.
c) al menos 2 duren menos de un año.
31. La empresa Internacional Oil Company se dedica a operaciones de perforación

exploratoria en la selva peruana. Para financiar su funcionamiento, los inversionistas
forman sociedades que proporcionan financiamiento para perforar una cantidad fija de
pozos petroleros. Cada pozo perforado se clasifica como productivo o no productivo.
La experiencia en este tipo de exploraciones indica que el 15 % de los pozos perforados
EP
fueron productivos. Una sociedad recién formada proporciona el financiamiento para

UD
realizar perforaciones exploratorias en 12 lugares.
a) ¿Cuál es la probabilidad de que los 12 pozos sean productivos?

b) ¿Cuál es la probabilidad de que los 12 pozos sean improductivos?
A
IM
c) ¿Cuál es la probabilidad de que exactamente 1 pozo sea productivo?

-L
d) Para hacer rentable a la sociedad, cuando menos de tres de los pozos de exploración
S
deben ser productivos ¿Cuál es la probabilidad de que el negocio sea rentable?

PU
32. En cada una de las siguientes situaciones diga si X tiene o no una distribución binomial.
M
Si es afirmativa la respuesta, proporcione la distribución de X y Si no es ası́, explique

CA
por qué.
Lanzar una moneda justa 9 veces. Sea X el número de caras que usted observa.
El departamento de servicio de un concesionario de automóviles realiza un
seguimiento de cada atención de servicio con una encuesta de satisfacción del
cliente mediante una llamada telefónica. En un dı́a determinado, sea X el número
de clientes a los que debe llamar un representante de servicio hasta que el cliente
esté dispuesto a participar en la encuesta.
E
AD
33. Se sabe que un determinado medicamento produce mejorı́a de cierta enfermedad a dos
de cada tres pacientes. Se les administra a siete enfermos.
a) Calcular la probabilidad de que mejoren cuatro

b) Calcular la probabilidad de que mejoren al menos cuatro personas.
34. Carlos Pérez está a cargo de la sección electrónica de Ace Home Center de Surquillo.
Se ha dado cuenta de que la probabilidad de que un cliente que solamente se encuentre
curioseando compre algo es de 0.3. Suponga que 15 clientes visitan la sección de
-I I
electrónica cada hora.

22
20
a) ¿Cuál es la probabilidad de que al menos una de las personas que curiosea compre
algo durante una hora dada?
b) ¿Cuál es la probabilidad de que al menos 4 personas que curiosea compren algo
durante una hora dada?
c) ¿Cuál es la probabilidad de que ninguna de las personas que curiosea compren

algo durante una hora dada?
d) ¿Cuál es la probabilidad de que no más de 4 personas que curiosea compren algo
durante una hora dada?
35. Las llegadas de clientes a la tienda Wong de San Isidro siguen una distribución de
Poisson. Suponga que la llegada promedio de clientes es de 3 clientes por minuto.
a) ¿Cuál es la probabilidad de que llegue exactamente 3 clientes en un minuto?

EP
b) ¿Cuál es la probabilidad de que lleguen al menos 3 clientes en un minuto?

UD
36. Con base en la experiencia, se supone que el número de defectos por pie en rollos de
papel grado 2 sigue una distribución de Poisson con un promedio de 1 defecto por cada
5 pies de papel (0.2 defectos por pie).
A
a) ¿Cuál es la probabilidad de que en un rollo de 1 pie haya por lo menos 2 defectos?
IM
b) ¿Cuál es la probabilidad de que en un rollo de 12 pies haya por lo menos 1 defecto?

-L
c) ¿Cuál es la probabilidad de que en un rollo de 50 pies haya entre 5 y 15 defectos,

S
PU
inclusive?
M
37. En un proceso de manufactura textil se tiene, que el promedio de defectos es de 6 por

CA
cada 30 m. de tela, ¿Cuál es la probabilidad de obtener por lo menos 2 fallas o defectos:

a) En una pieza de 30 metros, b) En una pieza de 10 metros, c) En una pieza de 15
metros, d) En una pieza de 5 metros.
38. Al inspeccionar la aplicación de estaño por un proceso electrolı́tico continuo, se

descubren en promedio 0,2 imperfecciones por minuto. Calcular las probabilidades de
descubrir: a) Una imperfección en 3 minutos, b) Al menos dos imperfecciones en 5
minutos, c) A lo sumo 1 imperfección en 15 minutos.
39. La tasa de mortalidad de cierta enfermedad es del 0.25 %. ¿Cuál es la probabilidad de

E
AD
que en un grupo de 800 personas: a) mueran más de 2. b) como máximo mueran 2.
40. En una conocida intersección un policı́a de tránsito aplica en promedio 3 multas diarias.
Hallar la probabilidad de que un dı́a cualquiera levante: a) exactamente 5 infracciones,
b) menos de tres infracciones, c) Por lo menos 2 infracciones.
41. Una cajera novata de un tienda de autoservicio se equivoca en promedio 2 veces en el

cobro por dı́a. ¿Cuál es la probabilidad de que en un dı́a cualquiera: a) tenga 4 o más
equivocaciones, b) no tenga ninguna equivocación?
-I I
42. En una fábrica, el 0.5 % de la producción es defectuosa:

22
20
a) ¿Cuál es la probabilidad de que haya menos de 5 artı́culos defectuosos en un lote

de 2000 artı́culos?
b) ¿Cuál es la probabilidad de que haya menos de 5 artı́culos defectuosos en un lote
de 1000 artı́culos?
43. En una fábrica el número de accidentes por semana sigue una ley de Poisson con λ = 2.
Se pide la probabilidad de que haya 4 accidentes en dos semanas.
44. Suponga que en promedio una secretaria comete 3 errores de mecanografı́a por página.
Encuentre la probabilidad de que en una página tenga: a) Exactamente 5 errores, b)
Al menos 4 errores.
45. La probabilidad de que una persona muera de cólera o tifoidea por comer un caldo de
gallina en el centro de la ciudad es de 0.002. Encuentre la probabilidad de que mueran
menos de 5 de las siguientes 2000 personas que contrajeron estas enfermedades por
EP
comer caldo de gallina en el centro de la ciudad.

UD
46. Durante las horas de tráfico intenso los accidentes se presentan en una zona urbana con
una frecuencia de dos por hora. El periodo matutino de tráfico intenso dura una hora
y 30 minutos, y el vespertino dos horas.
A
IM
a) En determinado dı́a ¿Cuál es la probabilidad de que no haya accidentes durante

-L
el periodo matutino de tráfico intenso?

S
b) ¿Cuál es la probabilidad de dos accidentes durante el periodo vespertino de tráfico

PU
intenso?
M
c) ¿Cuál es la probabilidad de 4 o más accidentes durante el periodo matutino de

CA
tráfico intenso?
47. Los accidentes de trabajo que se producen en una fábrica por semana, siguen una ley de
16
Poisson tal que la probabilidad de que haya 5 accidentes es de que haya 2 accidentes.
15
Se pide:
a) Hallar el número medio de accidentes semanales.

b) Probabilidad de que no haya ningún accidente en cuatro semanas.
E
48. En promedio, 5 pájaros chocan y mueren contra el monumento a Grau en la plaza

AD
del mismo nombre. Un concejal ha solicitado que el Congreso asigne fondos para
adquirir equipos que alejen a las aves del monumento. Un subcomité del congreso le
ha respondido que no puede asignarle fondos para tal fin a menos que la probabilidad
de que mueran más de 3 pájaros cada semana sea mayor a 0.70, ¿Deben destinarse los
fondos para dichos equipos?
49. Consideremos que el número de trozos de chocolate de una galleta sigue una distribución
de Poisson. Queremos que la probabilidad de que una galleta seleccionada al azar tenga
-I I
por lo menos tres trozos de chocolate sea mayor que 0.8. Encontrar el menor valor entero
22
de la media de la distribución que asegura esa probabilidad.

20
50. Suponga que en una lı́nea aérea, el gerente se ha enterado que en promedio uno de
cada 150 vuelos se retrasan más de una hora. Si se hacen 1500 vuelos en un mes, ¿Cuál
es la probabilidad de que más de 5 vuelos se retrasen más de una hora? ¿Cuál es la
probabilidad de que menos de 4 vuelos se retrasen más de una hora?
51. Los pasajeros de las aerolı́neas llegan al azar e independientemente a la sección de

documentación en un gran aeropuerto internacional. La frecuencia promedio de llegadas
es de 10 pasajeros por minuto.
a) ¿Cuál es la probabilidad de que no hayan llegadas en un intervalo de un minuto?

b) ¿Cuál es la probabilidad de que lleguen tres pasajeros o menos en un intervalo de
un minuto?
c) ¿Cuál es la probabilidad de que no hayan llegadas en un intervalo de 15 segundos?
EP
d) ¿Cuál es la probabilidad de al menos dos llegadas en un periodo de 15 segundos?

UD
52. Al Departamento de reservaciones de aerolı́neas regionales llegan en promedio 48

llamadas por hora.
a) Calcule la probabilidad de recibir tres llamadas en un intervalo de 5 minutos.

A
b) Calcule la probabilidad de recibir exactamente 10 llamadas en un intervalo de 15
IM
minutos.
S -L
53. En la realización de un programa, el número de errores cometidos por página sigue una
PU
distribución de Poisson de varianza 2. ¿Cuál será la probabilidad de no cometerlos en

M
un programa de 20 páginas?
CA
54. Suponga que 1.5 % de los separadores de plástico producidos por una máquina de
inyección de moldeo de alta velocidad tienen defectos. Para una muestra aleatoria de
200 separadores,
a) ¿Cuál es la probabilidad de que ninguno de los separadores tenga defectos?

b) ¿Cuál es la probabilidad de que 3 o más separadores tengan defectos?
55. En un proceso de fabricación de pelı́cula fotográfica aparece por término medio 1 defecto
por cada 20 metros de pelı́cula. Si la distribución de defectos es del tipo de Poisson,
E
calcular la probabilidad de que haya 6 defectos en un rollo de 200 metros.

AD
56. El Departamento de Impresiones y grabados de EEUU es el responsable de imprimir

papel moneda en aquel paı́s. El departamento tiene una impresionante baja frecuencia
de errores de impresión; sólo 0.5 % de los billetes presentan errores graves que no
permiten su circulación. ¿Cuál es la probabilidad de que un fajo de 1000 billetes:
a) ninguno presente errores graves?, b) Diez presenten errores que no permitan su
circulación?, c) Quince presenten errores que no permitan su circulación?
-I I
57. Una caja contiene 20 canicas blancas y 2 negras. Se extraen sucesivamente “n” canicas
22
con reemplazo y se anota el color en cada caso. Determine el número mı́nimo de

20
extracciones que deben hacerse para que la probabilidad de sacar una canica negra,
al menos una vez, sea superior a 0.5.
58. Sólo el 80 % de los alumnos de la universidad porta su carné. Si llegan 10 alumnos a la

puerta de entrada, ¿cuál es la probabilidad de que el vigilante de la puerta encuentre:
a) a 4 alumnos sin carné?, b) cómo mı́nimo a 5 alumnos con carné?, c) entre 4 y 7

alumnos sin carnet, inclusive?
59. La probabilidad de que una persona muera de cáncer es de 0.0003. Si se hace la autopsia
a 20,000 personas fallecidas.
a) ¿Cuál es la probabilidad de que nadie haya muerto de cáncer?

b) ¿Cuál es la probabilidad de que por lo menos dos hayan muerto de cáncer?
c) ¿Cuál es la probabilidad de que más de 6 hayan muerto de cáncer?
EP
d) Hallar la media, la varianza y la desviación estándar de la variable de interés.

UD
60. Una persona participa en un juego donde la probabilidad de ganar es 0.40, ¿Cuántas
veces debe jugar si quiere que la probabilidad de ganar al menos 3 veces sea mayor que
0.80?
A
61. Se ha comprobado que determinada prueba cultural es superada por el 70 % de las
IM
personas con estudio de grado medio y por el 55 % de las personas con estudios
-L
primarios. Un total de 10 personas (seis con estudios de grado medio y cuatro con
S
PU
estudios primarios) realizan dicha prueba cultural. Calcular:

M
a) La probabilidad de que exactamente cuatro de las personas con estudios de grado

CA
medio superen la prueba.

b) La probabilidad de que al menos una de las personas con estudios primarios supere
la prueba.
c) Si consideramos la variable “número de personas que superan la prueba entre
las 10 que la realizan”, ¿seguirı́a un modelo binomial de probabilidad? Razone y
justifique la respuesta.
62. En una población de la sierra donde la contaminación es prácticamente nula, la

probabilidad de que una persona contraiga una infección respiratoria es de 0.0004. Si se
E
AD
somete a un análisis médico a 10,000 personas de ese poblado, ¿Cuál es la probabilidad

de que,
a) a lo más 5 hayan contraı́do la enfermedad?

b) más de 8 hayan contraı́do la enfermedad?
c) Si se enferman más de dos personas ¿cuál es la probabilidad de que se enfermen
como máximo 5?
d) Hallar la media, la varianza y la desviación estándar de la variable de interés.
-I I
63. Los mensajes que llegan a una computadora utilizada como servidor lo hacen de acuerdo
22
con una distribución de Poisson con un promedio de 0.1 mensajes por minuto.
20
a) ¿Cuál es la probabilidad de que lleguen como máximo 2 mensajes en una hora?

b) Determinar el intervalo de tiempo necesario para que la probabilidad de que no
llegue ningún mensaje durante ese lapso de tiempo sea 0.8.
64. Las llamadas de teléfono recibidas en una casa siguen un proceso de Poisson con un
valor medio de 2 llamadas por hora.
a) Si una persona toma una ducha de 10 minutos ¿cuál es la probabilidad de que el

teléfono suene durante ese tiempo?
b) ¿Durante cuánto tiempo puede tomar una ducha si se desea que la probabilidad
de no recibir ninguna llamada sea 0.5?
65. Una máquina produce piezas metálicas, de las cuales 5 % son de calidad excelente.
EP
¿Cuántas piezas deberán producirse para que la probabilidad de que haya por lo menos
una pieza de calidad excelente sea mayor a 0.5?
UD
66. La probabilidad de que un estudiante presente problemas de escoliosis (desviación

lateral sufrida por la columna vertebral) en un colegio de la capital es de 0.004. De
los siguientes 1875 estudiantes revisados, encuentre la probabilidad de que:
A
IM
a) A lo sumo cinco presenten este problema.

-L
b) Entre ocho y diez, inclusive, presenten este problema.

S
PU
67. La probabilidad de obtener cara al lanzar una moneda es igual a p. Suponga que
M
lanzamos tres veces dicha moneda. Sea la variable aleatoria X=Número de caras que
CA
aparecen después del primer sello. Se le pide:
a) Hallar la distribución de probabilidad de X.

b) Calcular el valor esperado de X
c) ¿Cuál es el valor de p que hace máximo el valor esperado de X?
68. Una caja contiene 15 tornillos de los cuales 5 son defectuosos.
a) Calcular la distribución de probabilidad que corresponde a la variable aleatoria

correspondiente al número de tornillos defectuosos obtenidos al elegir 4 tornillos
E
AD
al azar y sin reemplazo de la citada caja.

b) Calcule el valor esperado y la desviación estándar de la variable aleatoria definida
e interprete dichos resultados.
c) Hallar la función de distribución de la variable aleatoria definida.
69. Se sabe que el 5 % de las velas, producidas por una determinada marca, son defectuosas.
Las velas se empaquetan en cajas de 10 unidades y las cajas en bolsas de 100 cajas. Se
le pide:
-I I
a) La probabilidad de que al comprar una bolsa, ésta contenga todas las cajas con
22
menos de 3 velas defectuosas.

20
b) La probabilidad de que en una bolsa, haya menos de 5 cajas, con 4 o más velas
defectuosas.
c) ¿Cuántas velas defectuosas esperarı́a encontrar en una caja?
70. Una empresa de limpieza recibe 100 euros diarios por la limpieza de unas oficinas. El
número de horas necesarias para la limpieza diaria varı́a de acuerdo con la siguiente
tabla:
número de horas Probabilidad

1 0.40
2 0.30
3 0.15
EP
4 0.10
UD
5 0.05
El costo diario de la limpieza consta de una cantidad fija de 50 euros (independiente

del número de horas) más 10 euros por hora trabajada.
A
IM
a) Calcular el valor esperado y la varianza del costo.

-L
b) Calcular la esperanza matemática y la desviación tı́pica del beneficio diario.

S
PU
c) ¿Cuál es la probabilidad de que el beneficio diario sea de 30 euros o más?

M
71. Supóngase que la producción de un dı́a de 850 piezas manufacturadas contiene 50 piezas
CA
que no cumplen con los requerimientos del cliente. Se seleccionan del lote dos piezas
al azar y sin reemplazo. Sea la variable aleatoria X igual al número de piezas de la
muestra que no cumplen con los requerimientos:
a) Hallar la función de probabilidad o distribución de probabilidad de la variable X.

b) Calcule el valor esperado y la desviación estándar de la variable X, e interprete
dichos resultados.
c) Hallar la función de distribución de X
E
72. Los automóviles que llegan a un semáforo siguen un proceso de Poisson con media de
AD
4 vehı́culos por minuto. El semáforo está 40 segundos en rojo y 80 segundos en verde.
a) ¿Cuál es la probabilidad de que haya 4 automóviles en cola cuando el semáforo se

pone en verde?
b) ¿Cuál es la probabilidad de que haya más de 7 automóviles en cola?
c) ¿Cuál es la probabilidad de que en un periodo de 6 horas haya al menos una
ocasión en la que haya más de 7 automóviles en cola?
-I I
73. Una urna contiene 2 esferas blancas y 3 negras. De la urna sacamos una esfera y la
22
devolvemos nuevamente a la urna. Si la esfera salió blanca sacamos a continuación dos

20
esferas, una tras otra y sin reemplazo. Si salió negra, sacamos una esfera. Sea la variable
aleatoria Y igual al número de esferas negras extraı́das la segunda vez.
a) Hallar la función de probabilidad o distribución de probabilidad de la variable Y.

b) Calcule el valor esperado y la desviación estándar de la variable Y, e interprete

dichos resultados.
74. La probabilidad de que al administrársele un antibiótico a un ave rapaz en recuperación

se le presente una reacción negativa es 0.04. Si se le va a administrar el antibiótico a
80 de estas aves:
a) ¿Cuál es la probabilidad de que al menos dos aves presenten reacción negativa?

b) Si más de 2 aves presentaron reacción negativa, ¿cuál es la probabilidad de que
menos de 5 aves la presenten?
EP
c) Calcule e interprete el valor esperado y la desviación estándar de la variable de

UD
interés del problema.

d) Resuelva los apartados a) y b) mediante la aproximación de Poisson y compare
con los resultados obtenidos en dichos apartados argumentando por qué son tan
A
próximos.
IM
75. Se supone que el número de resfriados que una persona cualquiera contrae durante el
-L
invierno sigue una distribución de Poisson con un promedio λ = 3.

S
PU
a) Calcular la probabilidad de que una persona en un invierno determinado, contraiga

M
por lo menos 1 resfriado.

CA
b) Si en un invierno determinado una persona contrajo al menos 2 resfriados ¿Cuál

es la probabilidad de que contraiga menos de 5?
c) Calcular la probabilidad de que de 5 personas elegidas al azar, 4 contraigan 2
resfriados en un invierno.
d) Calcular la desviación estándar del número de resfriados que una persona
cualquiera contrae durante el invierno.
76. Para cada una de las siguientes situaciones, identifique el experimento, cuál es la variable
de interés y sustente si dicha variable sigue o no una distribución binomial (en caso
E
AD
afirmativo, identifique en ella los valores de n y p:
a) Extraemos diez cartas de una baraja (una tras otra y sin reemplazo) y nos interesa
contar cuántos ases obtenemos.
b) Lanzamos un dado cien veces y nos interesa el número de unos que obtenemos.
77. Una empresa electrónica observa que el número de componentes que fallan antes de
cumplir 100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número
promedio de estos fallos es de ocho.
-I I
22
a) ¿Cuál es la probabilidad de que falle un componente en 25 horas?

20
b) Si fallan como mı́nimo dos componentes en 100 horas, ¿Cuál es la probabilidad de

que fallen menos de 7?
78. Una urna contiene 5 canicas rojas, 4 blancas y 2 verdes. Extraemos una canica,
anotamos su color y la devolvemos a la urna. Si repetimos la experiencia 7 veces:
a) ¿Cuál es la probabilidad de obtener alguna canica verde?

b) ¿Cuál es la probabilidad de obtener como máximo 3 canicas verdes?
c) Si se obtienen como mı́nimo 2 canicas verdes ¿Cuál es la probabilidad de que se
obtengan menos de 4 canicas verdes?
d) Si se obtienen como mı́nimo 3 canicas verdes ¿Cuál es la probabilidad de que se
obtengan al menos 5 canicas verdes?
e) Calcule e interprete el valor esperado y la desviación estándar de la variable de
interés del problema.
EP
79. Se supone que el número de bacterias por mm3 de agua en un estanque es una variable
UD
aleatoria que sigue una distribución de Poisson con un promedio λ = 0.5.
a) ¿Cuál es la probabilidad de que haya alguna bacteria en 1 mm3 de agua?

A
b) Si tomamos aleatoriamente una muestra de esa agua con un tubo de ensayo (de
IM
capacidad 1 mm3 ) y resulta que en dicha muestra hay alguna bacteria ¿Cuál es
-L
la probabilidad de que haya menos de 3 bacterias en dicho tubo?

S
c) Si se tienen 4 tubos de ensayo (de capacidad 1 mm3 cada uno), llenados con dicha
PU
agua. Hallar la probabilidad de que al menos la mitad de los tubos no contengan

M
bacterias.
CA
80. Una caja contiene 12 artı́culos de los cuales 4 son defectuosos.
a) Si se eligen al azar 3 artı́culos ¿cuál es la probabilidad de que ningún artı́culo sea

defectuoso?
b) Si se eligen al azar 3 artı́culos (uno tras otro con reemplazo) ¿cuál es la probabilidad
de que ningún artı́culo sea defectuoso?
c) Si se eligen al azar 3 artı́culos y se obtiene como mı́nimo 1 artı́culo defectuoso
¿Cuál es la probabilidad de que se obtengan menos de 3 artı́culos defectuosos?
E
AD
d) Si se eligen al azar 3 artı́culos (uno tras otro con reemplazo) y se obtiene como
mı́nimo 1 artı́culo defectuoso ¿Cuál es la probabilidad de que se obtengan menos
de 3 artı́culos defectuosos?
e) Calcule e interprete el valor esperado y la desviación estándar de la variable de
interés del apartado a.
f) Calcule e interprete el valor esperado y la desviación estándar de la variable de
interés del apartado b.
-I I
81. Ana, Benito y Carlos comparten un departamento donde hay un teléfono fijo. Ana
22
2 2 1
recibe de todas las llamadas, Benito y Carlos . Evidentemente no siempre están
20
5 5 5
en casa para atender las llamadas. Ana está fuera el 50 % del tiempo, Benito el 75 %,
y Carlos, el más casero, el 25 %. Calcule la probabilidad de que:
a) No haya nadie en el departamento para responder una llamada.

b) esté la persona a la que se llama.

c) De “n” llamadas para Carlos, él esté para contestar exactamente “k” llamadas.
d) De “n” llamadas para Carlos, él esté para contestar al menos una llamada.
82. En el directorio de una empresa se tienen un total de 20 asientos contables, de los cuales
6 están mal asentados y el resto está correctamente asentado. La SUNAT envı́a un
auditor y este selecciona al azar 4 asientos contables para inspeccionarlos. La empresa
deberá pagar una multa de 600 nuevos soles por cada uno de los asientos contables mal
asentados.
EP
a) ¿Cuánto se esperarı́a sea el monto pagado en multas por la empresa luego de la

UD
inspección realizada por el auditor?

b) ¿Cuál es la probabilidad de que el monto de la multa para esta empresa supere
los 1500 nuevos soles?
A
c) Halle la función de distribución (F) del monto pagado en multas por la empresa.
IM
-L
83. Una bolsa contiene 25 caramelos de limón y 15 de menta.

S
PU
a) Si se eligen al azar 4 caramelos y se define X: Número de caramelos de limón

obtenidos. Calcule e interprete el valor esperado y la desviación estándar de X.
M
b) Si se eligen al azar 4 caramelos (uno tras otro con reemplazo) y se define Y:

CA
Número de caramelos de limón obtenidos. Calcule e interprete el valor esperado y

la desviación estándar de Y.
84. Se tienen 12 naranjas de las cuales 3 están malogradas. Si se eligen aleatoriamente 5

naranjas y se define la variable Y: Número de naranjas malogradas obtenidas:
a) Hallar la función de probabilidad de la variable Y: f(Y).

b) Si al elegir las 5 naranjas obtenemos como máximo 2 naranjas malogradas ¿Cuál
es la probabilidad de que se haya obtenido alguna naranja malograda?
E
AD
c) Si al elegir las 5 naranjas obtenemos alguna naranja malograda ¿Cuál es la

probabilidad de que se haya obtenido como mı́nimo 2 naranjas malogradas?
d ) Calcule el valor esperado y la desviación estándar de la variable Y, e interprete
dichos resultados.
e) Halle la función de distribución de X: F(X).
f ) Responda a los apartados a), b), c) d) y e), pero asumiendo que se realiza
el muestreo con reemplazo (es decir, se eligen las naranjas una tras otra con
reemplazo)
-I I
22
85. Suponga que el número de denuncias que realizan los trabajadores de cierta empresa
20
a la Superintendencia Nacional de Fiscalización Laboral (Sunafil) son en promedio 1.5

al año.
a) ¿Cuál es la probabilidad de que en un año determinado la empresa no sea

denunciada?
b) ¿Cuál es la probabilidad de que en un año determinado se produzcan más de 4

denuncias?
c) ¿Cuál es la probabilidad de que en en el primer cuatrimestre del año se produzcan
dos o más denuncias?
d ) Si en un año determinado hay alguna denuncia ¿Cuál es la probabilidad de que
en dicho año se produzcan al menos 3 denuncias?
e) Si en un año determinado hay como máximo 4 denuncias ¿Cuál es la probabilidad
de que en dicho año se produzcan como mı́nimo 2 denuncias?
EP
86. En un estudio de mercado, una empresa ha determinado que el 40 % de los consumidores

UD
son clientes habituales de sus productos. Si se eligen al azar 12 consumidores y se

encuentran como máximo 6 clientes habituales ¿Cuál es la probabilidad de encontrar
al menos 3 clientes habituales de los productos de dicha empresa?
A
87. La comisión de desarrollo económico de la Municipalidad distrital ha determinado que el
IM
número de pequeños negocios que se declaran en quiebra al mes sigue una distribución
-L
de Poisson con promedio de 2,6 . Si en un mes se declaran en quiebra menos de 5

S
PU
negocios ¿Cuál es la probabilidad de que se declaren en quiebra al menos 2 negocios?

M
88. Un vendedor de seguros vende en promedio 3 pólizas por semana (7 dı́as). Se supone
CA
que el número de pólizas vendidas sigue una distribución de Poisson. Si se eligen 6

semanas aleatoriamente ¿Cuál es la probabilidad de que, de dos a cuatro semanas se
hallan vendido 2 pólizas?
89. Se supone que el número de imperfecciones que puede encontrarse en una botella
de vidrio sigue una distribución de Poisson con media igual a 3. Si elegimos 6
botellas al azar ¿Cuál es la probabilidad de que menos de cuatro botellas contengan 2
imperfecciones?
90. Felipe Aldana es un agente de bolsa (también conocido como broker o corredor de
E
AD
bolsa). Suponga que el número de paquetes de 1000 acciones cada uno que Felipe
Aldana vende un dı́a jueves entre las 10 am y 11 am. es una variable aleatoria con la
siguiente distribución de probabilidad:
X: Número de paquetes (de 1000 acciones) 4 5 6 7 8 9

1 1 1 1 1 1
f (X)
12 12 4 4 6 6
Responda lo siguiente mostrando los cálculos claramente:

-I I
a) Si en un jueves cualquiera entre las 10 am y 11 am, Felipe Aldana vende más de

22
5 paquetes de acciones ¿Cuál es la probabilidad de que venda como máximo 8

20
paquetes de acciones?
b) ¿Cuál es la probabilidad de que Felipe Aldana venda al menos 7 paquetes de
acciones un jueves cualquiera entre las 10 am y 11 am?
c) Halle el valor esperado y la desviación estándar de la variable de interés e interprete

los resultados.
d ) Halle la función de distribución de X: F(X).
EP
UD
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Capı́tulo 5
Distribución de probabilidad continua

EP
UD
5.1. Introducción
En el capı́tulo 4 estudiamos la variable aleatoria discreta y su distribución de probabilidad
en general y resaltamos dos distribuciones probabilı́sticas discretas usuales: la distribución
A
binomial y la distribución de Poisson. Recuérdese que las mismas se basan en variables
IM
aleatorias discretas, que pueden tomar sólo valores especı́ficos en un intervalo. En este capı́tulo
-L
veremos al estudio de las variables aleatorias continuas. Especı́ficamente, discutimos tres

S
distribuciones de probabilidad continua: normal, uniforme, y exponencial.

PU
Una diferencia fundamental que distingue a las variables aleatorias discretas de las
M
continuas es la forma cómo se calculan las probabilidades. Para una variable aleatoria discreta,
CA
la función de probabilidad f (x) proporciona la probabilidad de que la variable aleatoria

asuma un valor particular. Con variables aleatorias continuas, la contraparte de la función
de probabilidad es la función de densidad de probabilidad (fdp), también denotada por f (x).
La diferencia es que la función de densidad de probabilidad no proporciona probabilidades
directamente. Sin embargo, el área debajo de la gráfica de f (x) correspondiente a un intervalo
dado proporciona la probabilidad de que la variable aleatoria continua “x” asuma un valor en
ese intervalo. Entonces, cuando calculamos probabilidades para variables aleatorias continuas,
estamos calculando la probabilidad de que la variable aleatoria asuma cualquier valor en un
intervalo.
E
AD
Debido a que el área bajo la gráfica de la fdp en cualquier punto particular es cero, una
de las implicaciones de la definición de probabilidad para las variables aleatorias continuas
es que la probabilidad de cualquier valor particular de la variable aleatoria es cero. Esto es
lo que distingue a los fenómenos continuos (que se miden) de los fenómenos discretos (que se
cuentan).
Cuando la variable es continua, no tiene sentido hacer una suma de las probabilidades
de cada uno de los valores de la variable, ya que el conjunto de valores que puede tomar la
variable es no numerable. En este caso, lo que generaliza de modo natural el concepto de
P R
-I I
sumatoria ( ) es el de integral .
22
5.2. Función densidad de probabilidad

20
Sea X una variable aleatoria continua, entonces una función de densidad de probabilidad
de X es una función f(x) tal que para dos números cualesquiera a y b, siendo a ≤ b
187
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 188
Z b
P (a ≤ X ≤ b) = f (x)dx, (5.1)
a
es decir, la probabilidad de que X tome un valor en el intervalo [a, b] es el área bajo la gráfica
de una función de densidad, dentro de este intervalo. La curva f (x) se llama función de
densidad.
Para que f (x) sea una función de densidad de probabilidad, se deben satisfacer las
siguientes condiciones:
EP
1. f (x) ≥ 0, para todo x.

Z +∞
UD
2. f (x)dx = 1.
−∞
Proposición. Si X es una variable aleatoria continua, entonces para cualquier valor c,

P (X = c) = 0. Además, para dos números cualesquiera a y b con a < b
A
IM
P (a ≤ X ≤ b) = P (a < X ≤ b) = P (a ≤ X < b) = P (a < X < b).

S -L
En definitiva, la probabilidad asignada a algún valor en particular es cero, mientras que

PU
la probabilidad de un intervalo no depende de si está incluido en cualquiera de sus extremos.

M
5.3. Función de Distribución Acumulada

CA
Para una variable aleatoria continua se dispone de un conjunto no numerable de valores.

No es posible definir una probabilidad para cada uno. Por eso definimos previamente la
función de distribución acumulada, que sı́ tiene un significado inmediato y semejante al caso
discreto. La función de distribución acumulada (cdf) viene dada por:
F : R → [0, 1]
x → F (x) = P (X ≤ x)
E
La función de distribución acumulada, F (x), para una variable aleatoria continua X, está
AD
definida para todo número x mediante:

Z x
F (x) = P (X ≤ x) = f (y)dy, (5.2)
−∞
donde f es la función densidad de probabilidad de la función de distribución F (x). Para cada

x, F (x) es el área bajo la curva de densidad a la izquierda de x. F (x) se incrementará de
manera uniforme cuando aumenta x.
Existe una relación entre f (x) y F (x). Diferenciando tenemos
-I I
dF (x)
22
= f (x), (5.3)
dx
20
para cada x donde f(x) sea continua.

La función de distribución acumulada es útil también para calcular probabilidades de
la siguiente manera: Sea X una variable aleatoria continua con función de densidad de
probabilidad f (x) y función de distribución acumulada F (x). Entonces, para cualquier

número “a”, la probabilidad es:
P (X > a) = 1 − F (a) (5.4)
Y para dos números cualesquiera a y b, siendo a < b, la probabilidad es
P (a ≤ X ≤ b) = F (b) − F (a). (5.5)
5.4. Valor esperado y varianza de una Variable Aleatoria Continua.

EP
La esperanza matemática, valor esperado o media de una variable aleatoria continua X

UD
con función de densidad de probabilidad f (x) es

Z +∞
µ = E(X) = x.f (x)dx (5.6)
A
−∞
IM
La Varianza es
-L
Z +∞
S
σ 2 = V ar(X) = (x − µ)2 .f (x)dx (5.7)

PU
−∞
La desviación estándar de X es la raı́z cuadrada positiva de su varianza.

M
CA
5.4.1. Propiedades de la esperanza matemática y de la varianza de una variable

aleatoria continua
Sea X una variable aleatoria continua y sean a, b constantes; se verifica que
E(aX + b) = aE(X) + b (5.8)
V ar(aX + b) = a2 .V ar(X) (5.9)
V ar(X) = E(X 2 ) − [E(X)]2 (5.10)

E
AD
Si f (x) es la función densidad de una variable aleatoria continua X y consideremos la

v.a. Y=g(X). Entonces, el valor esperado de Y se puede calcular mediante
Z
E(Y ) = g(x)f (x)dx (5.11)
R
Ejercicios resueltos.
1. Sea X una variable aleatoria continua que tiene la siguiente función de densidad:
-I I

2

 c.x si 0≤x≤2
22
f (x) =
20


0 en otros casos
Hallar:
a) El valor de c para que f (x) sea una función de densidad.

Para que f (x) sea función de densidad deben cumplirse las 2 condiciones
mencionadas en la sección 5.2. Como se aprecia f (x) es mayor que cero por lo que
se cumple la primera condición. Para satisfacer la segunda condición evaluamos
cada uno de los intervalos en que está definida la función densidad
Z +∞
f (x)dx = 1
−∞
Z 0 Z 2 Z +∞
0.dx + c.x2 dx + 0dx = 1
EP
−∞ 0 2
x3 2
UD
0+c +0 = 1
3 0
c 3
2 − 03 = 1
3
8
c = 1
A
3
IM
3
de lo cual obtenemos que c = . Por lo tanto, la función de densidad de la variable
-L
8
S
aleatoria continua X es
PU

 3 2
M

 8 x si 0≤x≤2
CA
f (x) =



0 en otros casos
b) Obtener la función de distribución y graficarla.

Para calcular la función de distribución empleamos (5.2) en los diferentes intervalos
en que se define la función densidad f (x). Entiéndase que en aquellos tramos donde
la función densidad es cero, la función de distribución igualmente será cero.
para x < 0 Z x
F (x) = f (y)dy = 0,
E
−∞
AD
para 0 ≤ x < 2
Z Z Z
x 0 x
3 2 1 x x3
F (x) = f (y)dy = 0.dy + y dy = 0 + y 3 = .
−∞ −∞ 0 8 8 0 8
para x ≥ 2
Z Z Z Z
x 0 2
3 2 x
1 2 23
F (x) = f (y)dy = 0.dy + y dy + 0.dy = 0 + y 3 + 0 = =1
−∞ −∞ 0 8 2 8 0 8
-I I
22
Por lo tanto, la función de distribución acumulada queda definida como

20


 0 si x<0





 3
x
F (x) = si 0 ≤ x < 2

 8






1 si x≥2
La gráfica de F(x) se muestra en la Figura 5.1.

EP
1.00
UD
0.75
A
IM
S -L
F(x)
PU
0.50
F(x)
M
CA
0.25
0.00
−4 −2 0 2 4
x
Figura 5.1: Gráfica de la Función de distribución de X pedida en 1b).

E
AD
c) Calcular P (1 ≤ X ≤ 2).
Para este cálculo podemos utilizar la función de densidad o la función de
distribución acumulada. Por ejemplo empleando ésta última através de (5.5)
tenemos
23 13 7
P (1 ≤ X ≤ 2) = F (2) − F (1) = − = .
8 8 8
Si hubiéramos utilizado la función densidad procederı́amos como en (5.1)
-I I
Z 2
3 2
22
P (1 ≤ X ≤ 2) = x dx,
8
20
obteniendo el mismo resultado.

d) Calcular la esperanza matemática, la varianza y la desviación estándar de X.
Para el cálculo de la esperanza, empleamos (5.6)

Z +∞
µ = E(X) = x.f (x)dx =
−∞
Z 0 Z +∞Z 2
3 2
= x.0.dx + x x dx + x.0.dx =
−∞ 0 8 2
Z
3 2 3 3 2 3 4 3
= 0+ x dx + 0 = x4 = 2 − 04 =
8 0 32 0 32 2
Para el cálculo de la varianza podemos utilizar (5.7) o (5.10). Empleando ésta

EP
última tenemos
UD
Z +∞
σ 2 = V ar(X) = x2 .f (x)dx − µ2
−∞
Z 0 Z 2 Z +∞ 2
3 3
= x2 .0.dx +
x2 . x2 dx + x2 .0.dx −
8 2
A
−∞ 0 2
3 5 2
IM
9 3
= 0+ x +0 − =
40 0 4 20
S -L
PU
e) Si X es la cantidad diaria vendida de un producto y la ganancia del vendedor es 5

unidades monetarias por cada unidad de producto vendida si X ≤ 1, y 8 unidades
M
monetarias si X > 1, encontrar la ganancia esperada del vendedor para cualquier

CA
dı́a especificado.
Para este último apartado, tenemos expresada la ganancia en función de la v.a
continua X la cual sabemos que tiene una función densidad definida en el apartado
a). Entonces la función de la ganancia según el enunciado es


 5x si 0 ≤ x ≤ 1
g(x) =


8x si 1 < x ≤ 2
E
AD
Por tanto para obtener la ganancia esperada del vendedor, usamos (5.11)
Z +∞
E(Y ) = g(x)f (x)dx
−∞
Z 0 Z 1 Z 2 Z +∞
= 0.0.dx + g(x)f (x)dx + g(x)f (x)dx + 0.0.dx
−∞ 0 1 2
Z Z
1
3x2 2
3x2 15x4 1 15 453x4 2
375
= 0+ 5x dx + 8x dx + 0 = + = + =
0 8 1 8 32 0 4 1 32 4 32
-I I
2. Dada la función siguiente

22

 1 2
20

 7 .x si x ∈ [1, 2]
f (x) =



0 si x ̸∈ [1, 2]
¿Puede ser esta, la función de densidad de alguna distribución continua? ¿Por qué?
Para que la función dada sea una función densidad debe cumplir las 2 condiciones
mencionadas en la sección 5.2. Como se aprecia f (x) es mayor que cero en los intervalos
definidos por
Z lo que se cumple la primera condición. Para saber si se satisface la segunda
+∞
condición: f (x)dx = 1; evaluamos cada uno de los intervalos en que está definida
−∞
la función densidad
Z 1 Z Z
2
x2 +∞
x3 2 1 3 1
0.dx + dx + 0.dx = 0 + +0= 2 − 13 = ̸= 1
−∞ 7 21 1 21 3
EP
1 2
Como se aprecia no se cumple la segunda condición por tanto la función dada no es

UD
una función de densidad.
3. Dada la función siguiente:

 x
A

 si 2≤x≤4
IM

 10




-L
f (x) = k si 4≤x≤5
S



PU




 0 en otros casos
M
CA
a) Determinar k en la función, para que sea una función de densidad.

Para que la función dada sea una función densidad debe cumplir las 2 condiciones
mencionadas en la sección 5.2. Como se aprecia f (x) es mayor que cero en los
intervalos definidos por lo que seZcumple la primera condición. Para saber si
+∞
se satisface la segunda condición: f (x)dx = 1; evaluamos cada uno de los
−∞
intervalos en que está definida la función densidad
Z +∞
f (x)dx = 1
E
−∞
Z Z 5
AD
4
x
dx + kdx = 1
2 10 4
x2 4 5

+ kx = 1
20 2 4
12
+k = 1
20
2
k =
5
-I I
22
20
Por lo tanto, la función de densidad de la variable aleatoria continua X es

 x

 si 2≤x≤4

 10





f (x) = 2
 si 4≤x≤5

 5





b) Calcular la función de distribución y graficarla.

EP
Para calcular la función de distribución empleamos (5.2) en los diferentes intervalos

UD
en que se define la función densidad f (x).

para x < 2 Z x
F (x) = f (y)dy = 0,
−∞
A
IM
para 2 ≤ x < 4
-L
Z Z Z
x 2 x
y y 2 x x2 1
S
F (x) = f (y)dy = 0.dy + dy = 0 + = −

10 20 2 20 5
PU
−∞ −∞ 2
M
para 4 ≤ x < 5
CA
Z Z ZZ x
x 2
y 4
2 y 2 4 2y x
F (x) = f (y)dy = 0.dy + dy + dy = 0 + + =
−∞ −∞ 2 10 4 5 20 2 5 4
12 2 2x
= + (x − 4) = −1
20 5 5
para x ≥ 5
Z x Z 2 Z 4 Z 5 Z +∞
2 y
F (x) = f (y)dy = 0.dy + dy + dy + 0.dy =
−∞ −∞ 2 4 5 10 5
y 2 4 2y 5 3 2
E
= 0+ + +0= + =1
AD
20 2 5 4 5 5
Por lo tanto, la función de distribución acumulada queda definida como



 0 si x<2







 x2 1


 20 − 5
 si 2 ≤ x < 4
F (x) =



 2x
-I I

 −1 si 4 ≤ x < 5

 5


22




20
1 si x≥5
La gráfica de F(x) se muestra en la Figura 5.2.

c) Calcular P(3 ≤ X ≤ 4.5).
1.00
0.75
EP
F(x)
0.50
F(x)
UD
0.25
A
IM
S-L
0.00
PU
0 2 4 6 8
x
M
CA
Figura 5.2: Gráfica de la Función de distribución de X pedida en 3b).
Para este cálculo podemos utilizar la función de densidad o la función de distribución

acumulada. Por ejemplo empleando ésta última através de (5.5) tenemos
2
2 3 1 4 1 11
P (3 ≤ X ≤ 4.5) = F (4.5) − F (3) = × 4.5 − 1 − − = − = .
5 20 5 5 4 20
Si hubiéramos utilizado la función densidad procederı́amos como en (5.1) cuidando de

E
tomar la adecuada expresión de f (x) según el tramo de valores analizado

AD
Z 4 Z 4.5
x 2
P (3 ≤ X ≤ 4.5) = dx + dx,
3 10 4 5
y resolviendo esas integrales obtendrı́amos el mismo resultado.

-I I
22
20
4. Sea una variable aleatoria continua definida por



 0 si x<0







 x3

 si 0 ≤ x < 1

 3






1
F (x) = si 1 ≤ x < 2

 3





 x2 + 2
EP



 si 2 ≤ x < 4

 k

UD





1 si x≥4
Determinar la función de densidad.

A
Como se denota en (5.3), la función de densidad f (x) puede ser obtenida derivando la
IM
función de distribución F (x). Dado que la forma de F (x) varı́a a lo largo del campo de
-L
variación de la variable, consideramos los siguientes intervalos

S
PU
para x < 0
d
M
f (x) = F (x) = 0,
dx
CA
para 0 ≤ x < 1
d d x3
f (x) = F (x) = = x2 ,
dx dx 3
para 1 ≤ x < 2
d d 1
f (x) = F (x) = = 0,
dx dx 3
para 2 ≤ x < 4
d d x2 + 2 2x
f (x) = F (x) = = ,
dx dx k k
E
para x ≥ 4
AD
d
f (x) = F (x) = 0,
dx
Por tanto la función de densidad será


 x2 si 0≤x<1






2x
f (x) = si 2≤x<4

 k




-I I


0 en otros casos
22
20
Ahora bien, para que la función de densidad quede perfectamente especificada, debemos
Z +∞
hallar el valor de k, que verifique: f (x)dx = 1.
−∞
Z 1 Z 4
2 2x
x dx + dx = 1
0 2 k
x3 1 x2 4
+ = 1
3 0 k 2
1 12
+ = 1
3 k
k = 18
EP
Entonces la función densidad especı́fica es

UD


 x2 si 0≤x<1





 x
f (x) = si 2≤x<4
A
 9


IM




 0
-L
en otros casos
S
PU
5.5. Distribución de probabilidad normal

M
La más importante distribución de probabilidad en estadı́stica, utilizada para describir el

CA
comportamiento de una variable aleatoria continua es la Distribución de probabilidad normal.

Fue descubierta por el matemático alemán Carl Friedrich Gauss en el siglo XIX (por lo que
también se conoce como la distribución gaussiana).
¿Por qué es tan importante la distribución normal en estadı́stica?
Una primera razón es que esta distribución es una buena descripción para muchas
distribuciones de datos reales, es decir, muchas variables aleatorias continuas se comportan
muy próximas a esta distribución o se distribuyen aproximadamente de forma normal. Por
ejemplo, las estaturas de los hombres (o de las mujeres), los pesos, la presión sanguı́mea,
E
los puntajes de una prueba, el coeficiente intelectual, los cambios diarios en los precios de
AD
las acciones al cierre, etc. Otro ejemplo es el de una máquina que produce (digamos) pernos
con una longitud nominal de 5 cm que en realidad producirá pernos de longitud ligeramente
variable (estas diferencias probablemente serı́an extremadamente pequeñas) debido a factores
como el desgaste de la maquinaria, ligeras variaciones en la presión del lubricante, etc. Esto
darı́a como resultado pernos cuya longitud varı́a, de acuerdo con la distribución Normal. Este
tipo de proceso es extremadamente común, con el resultado de que la distribución Normal a
menudo ocurre en situaciones cotidianas.
La segunda razón es que puede ser utilizada para calcular, de forma aproximada,
-I I
probabilidades para otras distribuciones, como por ejemplo, para la distribuición binomial.
22
La tercera razón, y más importante, es que muchos de los procedimientos de inferencia

20
estadı́stica que estudiaremos en capı́tulos posteriores se basan en la distribución normal.

Se dice que una variable aleatoria X tiene distribución normal con media µ y varianza σ 2
si su función densidad de probabilidad es dada por
2
1 − 1 ( x−µ
σ ) , −∞ < x < ∞
f (x) = √ e 2 (5.12)
σ 2π
donde:
π y e son constantes matemáticas con valores aproximados de 3.14159 y 2.71828

respectivamente.
µ es el valor esperado de la variable X con −∞ < µ < ∞.

EP
σ 2 es la varianza de la variable X con σ 2 > 0.

UD
x es un valor cualquiera de la variable aleatoria X.
La notación empleada para expresar que una variable X sigue una distribución normal
con media µ y varianza σ 2 es: X ∼ N (µ, σ 2 ).
A
La representación gráfica de (5.12), conocida como curva normal o “campana de Gauss”,
IM
se muestra en la Figura 5.3 y presenta las siguientes caracterı́sticas:

S -L
PU
M
CA
x
µ−σ µ µ+σ
Figura 5.3: Curva normal
Tiene forma de campana.

E
Es unimodal presentando un único pico (punto más alto de la curva) el cual está en la
AD
media, que también es la mediana y la moda de la distribución.
La distribución probabilı́stica normal es simétrica con respecto a su media (µ). Si se

corta la curva normal verticalmente en este valor central, las dos mitades se reflejarán
como imágenes en un espejo. Por ser una función densidad, se puede comprobar también
que el área bajo la curva normal es igual a 1. De esta forma, la mitad del área bajo
la curva (0.5) se encuentra por arriba de este punto central, y la otra mitad (0.5) por
debajo.
-I I
La curva normal decrece uniformemente en ambas direcciones a partir del valor central.
22
La curva normal es asintótica, lo cual significa que las colas de la curva se extienden
20
hasta el infinito en ambas direcciones y, en teorı́a, nunca tocan el eje horizontal.
µ − σ y µ + σ son los puntos de inflexión de f (x).

Como se aprecia la distribución normal depende de dos parámetros: µ y σ. Ası́, cada

vez que se especifica una combinación particular de µ y σ, se genera una distribución de
probabilidad normal diferente. Por ejemplo en la Figura 5.4 se muestran dos distribuciones
normales con diferentes medias y la misma desviación estándar, en la Figura 5.5 se muestran
dos distribuciones normales con igual media y diferente desviación estándar y en la Figura
5.6 se muestran dos distribuciones normales con diferente media y desviación estándar.
N (µ1 , σ 2 ) N (µ2 , σ 2 )
EP
UD
x
µ1 µ2
A
IM
Figura 5.4: Curvas normales con diferentes medias e igual desviación estándar.
S -L
N (µ3 , σb2 )
PU
σa > σb
M
CA
N (µ3 , σa2 )
x
µ3
Figura 5.5: Curvas normales con igual media y diferente desviación estándar.
E
N (µ5 , σ52 )
AD
N (µ4 , σ42 )
x
µ4 µ5
Figura 5.6: Curvas normales con diferente media y desviación estándar.
Aunque existen infinitas curvas normales, todas tienen propiedades comunes. En

particular, como se aprecia en la Figura 5.7 todas las distribuciones normales cumplen con
-I I
lo siguiente:
22
20
a) 68.3 % de los valores de una variable aleatoria normal están dentro de más una y menos
una desviación estándar de su media.
b) 95.4 % de los valores de una variable aleatoria normal están dentro de más dos y menos
dos desviaciones estándar de su media.
c) 99.7 % de los valores de una variable aleatoria normal están dentro de más tres y menos
tres desviaciones estándar de su media.
x
EP
µ − 3σ µ − 2σ µ − 1σ µ µ + 1σ µ + 2σ µ + 3σ
UD
0.683
0.954
0.997
Figura 5.7: Áreas bajo la curva comunmente utilizadas para cualquier distribución normal.
A
IM
-L
5.6. Cálculo de probabilidades asociadas a una curva normal especı́fica

S
Como se mencionó anteriormente, cada combinación de µ y σ determina una distribución

PU
normal diferente, por tanto el número de distribuciones normales es ilimitado. Resultarı́a

M
fı́sicamente imposible proporcionar una tabla de probabilidades (como se hizo para la

CA
binomial y la de Poisson) para cada combinación de µ y σ, ya que si existe un número infinito

de combinaciones de los parámetros µ y σ se necesitarı́a un número infinito de tablas.
Por fortuna, puede utilizarse un elemento de la familia de distribuciones normales
para todos los problemas donde tal distribución resulte aplicable. Dicha distribución es
denominada Distribución normal estándar.
5.6.1. Distribución normal estándar
Una variable aleatoria que tiene una distribución normal con media igual a cero y
desviación estándar igual a 1 se dice que tiene una distribución de probabilidad normal
E
estándar. La letra Z es comunmente utilizada para representar a esta particular variable

AD
aleatoria, ası́ la notación empleada es Z ∼ N (0, 1). La Figura 5.8 muestra la curva normal
estándar. Tiene la misma apariencia general que otras distribuciones normales, pero con las
propiedades especiales de µ = 0 y σ = 1.
σ=1
-I I
22
z
20
Figura 5.8: Curva normal estándar
Debido a que µ = 0 y σ = 1, la expresión para la función de densidad de probabilidad

normal estándar es mostrada en (5.13) y como se aprecia es una versión más simple de la
expresión (5.12).
1 − 12 z 2
f (z) = √
2π
e (5.13)
La importancia de la distribución normal estándar radica en que se emplea para

representar las infinitas distribuciones normales existentes. Dicho de otra manera, cualquier
distribución normal puede convertirse en una “distribución normal estándar” mediante el
proceso llamado estandarización o tipificación.
EP
5.6.2. Estandarización
UD
Si x es una observación de una distribución que tiene media µ y desviación estándar σ,

el valor estandarizado de x es
x−µ
z= (5.14)
σ
A
Un valor estandarizado es comunmente conocido como z-score o puntuación z. Una
IM
puntuación z nos dice cuántas desviaciones estándar cae la observación original lejos de la
-L
media, y en qué dirección. Las observaciones mayores que la media son positivas cuando
S
PU
están estandarizadas, y las observaciones menores que la media son negativas cuando están
estandarizadas.
M
Si la variable que estandarizamos tiene distribución normal, la estandarización hace

CA
más que dar una escala común. Convierte todas las distribuciones normales en una sola
distribución, y esta distribución sigue siendo normal. La estandarización de una variable que
tiene una distribución normal produce una nueva variable que tiene distribución estándar
normal.
Cuando transformamos “X” en “Z”, lo que realmente hacemos es emplear una función
densidad normal que sea independiente de los valores y unidades que tenga la variable
continua analizada. Una ventaja de la puntuación z, es que nos permite comparar valores
provenientes de distribuciones normales diferentes, pues z no tiene unidades dimensionales.
E
5.6.3. Cálculo de probabilidades (áreas) con la curva normal estándar

AD
Para la distribución normal estándar, han sido calculadas áreas bajo la curva y están
disponibles en tablas que son utilizadas para calcular probabilidades. Un ejemplo de esas
tablas es la que aparece en el Apéndice A.4. Esta tabla permite hallar el área que hay entre
la media (µz = 0) y “zc ” desviaciones estándar por arriba de la media. La Figura 5.9 ilustra
la probabilidad obtenida mediante la tabla que emplearemos: P (0 ≤ Z ≤ zc ).
Si tomáramos por ejemplo: zc = 1.63, entonces de la tabla obtenemos que:
-I I
P (0 ≤ Z ≤ 1.63) = 0.44845
22
20
Calculando algunas probabilidades tenemos (Figura 5.10):
a) P (−1.63 ≤ Z ≤ 0) =?
Esta probabilidad es igual a la P (0 ≤ Z ≤ 1.63) = 0.44845, debido a la simetrı́a de la
curva.
probabilidad
EP
UD
A 0 zc Z
IM
-L
Figura 5.9: P (0 ≤ Z ≤ zc ) proporcionada por la tabla que aparece en el Apéndice A.4.

S
PU
M
b) P (Z ≥ 1.63) =?
CA
Esta probabilidad es igual a: 0.5 − P (0 ≤ Z ≤ 1.63) = 0.5 − 0.44845 = 0.05155, esto es

porque la P (Z ≥ 0) = 0.5 = P (Z ≤ 0).
c) P (Z ≤ −1.63) =?
Esta probabilidad es igual a la P (Z ≥ 1.63) = 0.05155, debido a la simetrı́a de la curva.
d) P (0.46 ≤ Z ≤ 1.63) =?
Esta probabilidad es igual a: P (0 ≤ Z ≤ 1.63)−P (0 ≤ Z ≤ 0.46) = 0.44845−0.17724 =
0.27121.
E
e) P (−0.46 ≤ Z ≤ 1.63) =?
AD
Esta probabilidad es igual a: P (−0.46 ≤ Z ≤ 0) + P (0 ≤ Z ≤ 1.63) = 0.17724 +

0.44845 = 0.62569, esto es debido a que, por simetrı́a de la curva: P (0 ≤ Z ≤ 0.46) =
0.17724 = P (−0.46 ≤ Z ≤ 0).
-I I
22
20
−1.63 0 Z 0 1.63 Z
EP
UD
(a) (b)
A
IM
S -L
PU
−1.63 0 Z
M
0 0.46 1.63 Z
CA
(c) (d)
E
−0.46 0 1.63 Z
AD
(e)
Figura 5.10: Ilustración del cálculo de probabilidades con la tabla de áreas bajo la curva normal
estándar.
Suponga ahora que X sea una variable aleatoria con distribución normal, o sea, X ∼
N (µ, σ 2 ), con µ = 3 y σ 2 = 4, y queremos calcular P (2 ≤ X ≤ 5). Entonces empleando la
estandarización, expresión (5.14), tenemos
-I I

22
2−3 X −3 5−3
P (2 ≤ X ≤ 5) = P ≤ ≤
20
2 2 2
= P (−0.5 ≤ Z ≤ 1)
Por tanto, la probabilidad de que X esté entre 2 y 5, inclusive, es igual a la probabilidad de

que Z esté entre -0.5 y 1, inclusive (Figura 5.11). Utilizando la tabla de distribución normal
estándar vemos que
P (−0.5 ≤ Z ≤ 1) = 0.19146 + 0.34134 = 0.5328
o sea,
P (2 ≤ X ≤ 5) = 0.5328
EP
UD
A
IM
-L
x
S
2 3 5
PU
M
CA
z
-0.5 0 1
Figura 5.11: Ilustración del cálculo de P (2 ≤ X ≤ 5) para X ∼ N (3, 4)
Problemas resueltos.
E
AD
1. Los depósitos efectuados en el Banco Bradesco durante el mes de enero se distribuyen

normalmente, con un promedio de $ l0.000,00 y desviación estándar de $ 1.500,00. Un
depósito es seleccionado al azar entre todos los referentes al mes en cuestión. Encontrar
la probabilidad de que el depósito sea:
a) $ l0.000,00 o menos.
Tenemos que µ = 10000 y σ = 1500. Sea la variable aleatoria: X=“Depósito
efectuado en el mes de enero($)”, X ∼ N (10000, 15002 ).
-I I

10000 − 10000
22
P (X ≤ 10000) = P Z ≤ = P (Z ≤ 0) = 0.5 o 50 %
1500
20
Por tanto, la probabilidad de que X sea menor o igual que 10000, es igual a la
probabilidad de que Z sea menor o igual que cero (Figura 5.12 a)).
b) por lo menos $ l0.000,00
P (X ≥ 10000) = P (Z ≥ 0) = 0.50 o 50 %
Por tanto, la probabilidad de que X sea mayor o igual que 10000, es igual a la
probabilidad de que Z sea mayor o igual que cero (Figura 5.12 b)).
EP
UD
10000 X
10000 X
A
IM
0 Z 0 Z
-L
a) b)
S
PU
Figura 5.12: Ilustración del cálculo de a) P (X ≤ 10000) y b) P (X ≥ 10000) para X ∼

N (10000, 15002 ).
M
CA
c) un valor entre $ 12.000,00 y $ 15.000,00

12000 − 10000 X − 10000 15000 − 10000
P (12000 < X < 15000) = P < <
1500 1500 1500

4 10
=P <Z< = P (1.33 < Z < 3.33)
3 3
= 0.49957 − 0.40824 = 0.09133 o 9.13 %.
Por tanto P (12000 < X < 15000) es igual a P (1.33 < Z < 3.33) (Figura 5.13).
E
AD
10000 12000 15000 X

-I I
22
20
0 1.33 3.33 Z
Figura 5.13: Ilustración del cálculo de P (12000 < X < 15000) para X ∼ N (10000, 15002 ).
d) mayor que $ 20.000,00

20000 − 10000
P (X > 20000) = P Z> = P (Z > 6.67) ≃ 0.
1500
2. Un estudio indica que las personas conservan sus teléfonos celulares, en promedio, 1.5
años antes de comprar uno nuevo. La desviación estándar es 0.25 años. Un usuario
de teléfono celular es seleccionado aleatoriamente. Calcule la probabilidad de que el
usuario conservará su teléfono actual por menos de 1 año antes de comprar uno nuevo.
Considere que el tiempo (años) que las personas conservan sus teléfonos sigue una
EP
distribución normal.
UD
Sea la variable aleatoria: X=“Tiempo que las personas conservan sus teléfonos (años)”,
X ∼ N (1.5, 0.252 ). Deseamos calcular, P (X < 1), entonces:

1 − 1.5
A
P (X < 1) = P Z < = P (Z < −2) = 0.5 − 0.47725 = 0.02275 o 2.28 %.
0.25
IM
-L
Por tanto P (X < 1) es igual a P (Z < −2) (Figura 5.14).

S
PU
M
CA
1 1.5 X
E
−2 0 Z
AD
Figura 5.14: Ilustración del cálculo de P (X < 1) para X ∼ N (1.5, 0.252 ).
3. Suponga que una vez fijado un horizonte de tiempo, la tasa de retorno de una acción
puede ser modelada como una variable aleatoria con distribución normal de media 20 %
y desviación estándar de 2 %. Suponga también que la tasa de retorno de un tı́tulo de
renta fija es de 17 %. Entonces la acción es en promedio mas rentable que el tı́tulo,
-I I
aunque esté más sujeta a riesgo. ¿Cuál es la probabilidad de que el retorno de la acción
22
exceda al del tı́tulo?

20
Sea la variable aleatoria: X=“Tasa de retorno de la acción ( %)”, X ∼ N (20, 22 ).

Deseamos calcular, P (X > 17), entonces:

17 − 20
P (X > 17) = P Z > = P (Z > −1.5) = 0.43319 + 0.5 = 0.93319 o 93.32 %.
2
Por tanto P (X > 17) es igual a P (Z > −1.5) (Figura 5.15).
17 20 X
EP
UD
−1.5 0 Z
A
IM
Figura 5.15: Ilustración del cálculo de P (X > 17) para X ∼ N (20, 22 ).

S -L
PU
4. Una encuesta indica que, para cada ida al supermercado, un consumidor permanece
en el establecimiento en promedio 45 minutos, con varianza de 144 minutos2 . Asuma
M
CA
que el tiempo de permanencia en el establecimiento está distribuı́do normalmente. Si

un consumidor entra en la tienda.
a) ¿Cuál es la probabilidad de que se quede en el establecimiento entre 24 y 54

minutos?
Sea la variable aleatoria: X=“Tiempo de permanencia en el establecimiento
(minutos)”, X ∼ N (45, 122 ). Deseamos calcular, P (24 < X < 54), entonces:

24 − 45 X − 45 54 − 45
P (24 < X < 54) = P < <
12 12 12
E
AD
= P (−1.75 < Z < 0.75)

= 0.45994 + 0.27337 = 0.73331 o 73.33 %.
Por tanto P (24 < X < 54) es igual a P (−1.75 < Z < 0.75) (Figura 5.16 a)).
b) ¿Cuál es la probabilidad de que se quede más de 39 minutos? Deseamos calcular,
P (X > 39), entonces:

39 − 45
P (X > 39) = P Z > = P (Z > −0.5) = 0.19146 + 0.5 = 0.69146 o 69.15 %.
12
-I I
22
Por tanto P (X > 39) es igual a P (Z > −0.5) (Figura 5.16 b)).
20
c) Interprete su respuesta cuando 200 consumidores entran en el establecimiento.

¿Cuántos consumidores espera que estuvieran en la tienda para cada intervalo de
tiempo de los apartados a) y b)?
Cuando 200 consumidores entran en el supermercado, esperamos que en el caso del
24 45 54 X 39 45 X
EP
UD
−1.75 0 0.75 Z −0.5 0 Z
a) b)
A
Figura 5.16: Ilustración del cálculo de a) P (24 < X < 54) y b) P (X > 39) para X ∼ N (45, 122 ).
IM
-L
apartado a), 200×0.7333 = 146.662 o aproximadamente 147 clientes permanezcan

S
en la tienda entre 24 e 54 minutos y para el caso del apartado b), 200×0.69146

PU
= 138.292 o aproximadamente 138 clientes permanezcan en la tienda más de 39

M
minutos.
CA
d) ¿Cuál es la probabilidad de que se quede menos de 30 minutos o más de 51

minutos?
P (X < 30 o X > 51) = P (X < 30) + P (X > 51)

30 − 45 51 − 45
=P Z< +P Z >
12 12
= P (Z < −1.25) + P (Z > 0.50)
= (0.5 − 0.39435) + (0.5 − 0.19146)
E
= 0.10565 + 0.30854 = 0.41419 o 41.42 %.

AD
Por tanto P (X < 30 o X > 51) es igual a P (Z < −1.25 o Z > 0.5) (Figura
5.17).
5. El tiempo en minutos que a una persona le demanda realizar determinada tarea

sigue una distribución normal con media µ y desviación estándar σ. Se sabe que la
probabilidad de que la tarea se ejecute en 70 minutos como máximo es 0.75, y la
probabilidad de que la tarea se ejecute en un máximo de 50 minutos es 0.30.
-I I
a) Determine los valores de µ y σ.

22
Sea la variable aleatoria: X=“Tiempo que le demanda a una persona realizar

20
determinada tarea (minutos)”, X ∼ N (µ, σ 2 ). Como sabemos que P (X ≤ 70) =

0.75 y P (X ≤ 50) = 0.30, se deduce la ubicación de los valores 50 y 70 en el eje de
la variable aleatoria X como se muestra en la Figura 5.18. Ası́ también designamos
los correspondientes valores de Z: z1 y z2 .
EP
30 45 51 X
UD
A
IM
S -L
PU
M
CA
−1.25 0 0.5 Z
Figura 5.17: Ilustración del cálculo de P (X < 30 o X > 51) para X ∼ N (45, 122 ).
Ahora, vamos a la Tabla de Distribución normal estándar (TDNE) para saber que
valor de Z es el correspondiente al área de 0.25. Note que según la TDNE para
Z=0.67 el área correspondiente es 0.24857 y para Z=0.68 el área correspondiente
es 0.25175, entonces deducimos que un área de 0.25 será la correspondiente a un
E
AD
valor de Z entre 0.67 y 0.68. Pero, ¿Qué valor de Z tomaremos?, el criterio que
usaremos simplemente será tomar el valor de Z que defina el área más próxima a
la solicitada de 0.25. En este caso el área más próxima es 0.24857, ası́ el valor de
Z a emplear será 0.67. Entonces en la Figura tendremos que z2 = 0.67.
Ahora buscamos en la TDNE el área de 0.20 para saber qué valor de Z le
corresponde. Usando el mismo criterio, se deduce que aproximadamente un área
de 0.20 será la correspondiente a un valor de Z=0.52. Luego en la Figura 5.18
tendremos que por simetrı́a z1 = −0.52. Con la información obtenida definimos:
-I I
50 − µ
22
−0.52 =
σ
20
70 − µ
0.67 = ,
σ
el cual es un sistema de dos ecuaciones con dos incógnitas, µ y σ. Resolviendo el

0,20
0,25
0,30
EP
50 µ 70 X
UD
0,20 A
IM
-L
0,25
S
PU
0,30
M
CA
z1 0 z2 Z
Figura 5.18: Ubicación de los valores X = 50 y X = 70 para que se cumpla que P (X ≤ 70) = 0.75 y
P (X ≤ 50) = 0.30.
sistema tenemos µ=58.74 y σ=16.81, ambos en minutos.

b) Si se selecciona una persona al azar y resulta que necesita más de 75 minutos para
ejecutar la tarea ¿Cuál es la probabilidad de que ejecute la tarea en más de 85
E
minutos?
AD
Tenemos que calcular una probabilidad condicional, a saber,
P (X > 85 y X > 75) P (X > 85)

P (X > 85 | X > 75) = = =
P (X > 75) P (X > 75)

85 − 58.74
P Z>
16.81 P (Z > 1.56)
= = =
75 − 58.74 P (Z > 0.97)
P Z>
16.81
0.5 − 0.44062
-I I
= = 0.3577 o 35.77 %
0.5 − 0.33398
22
20
5.7. Aproximación normal para la distribución binomial

Sea X una variable aleatoria con distribución binomial de parámetros n y p, X ∼ b(n, p),
por lo tanto E(X) = µ = n × p y V ar(X) = σ 2 = n × p × (1 − p). Resulta que a medida
que n aumenta, la distribución binomial toma aproximadamente la misma forma que una
distribución normal con media µ = n × p y varianza σ 2 = n × p × (1 − p).

Esta aproximación es suficientemente precisa siempre que n × p ≥ 5 y n × (1 − p) ≥ 5,
por lo tanto, la aproximación puede no ser muy buena (incluso para valores grandes de n) si
la probabilidad de éxito p está muy cerca de cero o uno.
Otro ajuste importante es el hecho de que la distribución binomial utiliza valores discretos
y la distribución normal utiliza valores continuos. Por lo tanto si vamos a utilizar una
distribución continua (normal) para aproximar un problema discreto (binomial) es necesario
realizar una corrección por continuidad.
EP
5.7.1. Factor de corrección por continuidad

Cuando aproximamos una distribución binomial mediante una distribución normal,
UD
estamos convirtiendo una variable X discreta (toma un número determinado de valores en un

intervalo) en una variable continua X ′ (toma infinitos valores en un intervalo). Esa conversión
se manifiesta sumando o restando 0.5 (factor de corrección) al valor de la variable aleatoria
A
discreta dependiendo de la probabilidad solicitada. En la Tabla 5.1 se presentan algunas
IM
situaciones.
S -L
Binomial Aproximación normal Observación

PU

P (X = c) P c − 0.5 < X ′ < c + 0.5 Para que incluya a “c”
M

P (X > c) P X ′ > c + 0.5 Para que no incluya a “c”
CA

P (X ≥ c) P X ′ > c − 0.5 Para que incluya a “c”

P (X < c) P X ′ < c − 0.5 Para que no incluya a “c”

P (X ≤ c) P X ′ < c + 0.5 Para que incluya a “c”

P (a ≤ X ≤ b) P a − 0.5 < X ′ < b + 0.5 Para que incluya “a” y “b”

P (a < X < b) P a + 0.5 < X ′ < b − 0.5 Para que no incluya “a” y “b”

P (a < X ≤ b) P a + 0.5 < X ′ < b + 0.5 Para que no incluya “a” pero si “b”

E
P (a ≤ X < b) P a − 0.5 < X ′ < b − 0.5 Para que incluya “a” pero no “b”
AD
Tabla 5.1: Casos de probabilidades binomiales y cómo aplicar el factor de corrección por continuidad
al utilizar la aproximación normal. Recuerde que a, b y c son números enteros.
-I I
22
20
A continuación se presenta el siguiente ejercicio para comprender mejor cuándo utilizar

la aproximacion estudiada.
Ejercicio resuelto.
Basados en la experiencia se sabe que el 40 % de los clientes de la estación de servicio
automotriz “M illenium” pagan sus compras con tarjeta de crédito. Si se selecciona una
muestra aleatoria de 200 clientes, ¿cuál es la probabilidad de que
a) Al menos 75 paguen con tarjeta de crédito?

EP
Sea la variable aleatoria: X=“número de clientes que pagan sus compras con tarjeta de
UD
crédito”. Esta variable tiene las caracterı́sticas para considerar que X sigue distribución
binomial con parámetros n = 200 y p = 0.4, X ∼ b(200, 0.4). Lo que nos piden calcular
es: A
P (X ≥ 75) = P (X = 75) + P (X = 76) + . . .
IM
200! 200!
= × 0.475 × 0.6125 + 0.476 × 0.6124 + . . .
-L
75! × 125! 76! × 124!

S
PU
Claramente demandarı́a mucho trabajo realizar los cálculos utilizando la distribución

binomial. Como n×p = 200×0.4 = 80 y n×(1−p) = 200×(1−0.4) = 120, son cantidades
M
mayores que 5 podemos utilizar la aproximación normal para resolver el problema

CA
binomial. Por tanto, la distribución binomial X ∼ b(200, 0.4) puede ser aproximada
por una distribución normal con µ = 200×0.4 = 80 y varianza, σ 2 = 200×0.4×0.6 = 48,
X ′ ∼ N (80, 48). Entonces utilizando el factor de corrección por continuidad y luego la
TDNE tenemos que:

74.5 − 80
P (X ≥ 75) ≈ P X ′ > 74.5 =P Z> √
48
= P (Z > −0.79) = 0.28524 + 0.5 = 0.78524 o 78.52 %,
E
AD
como se aprecia en la Figura 5.19.
Concluimos entonces que la probabilidad de que al menos 75 clientes paguen sus

compras con tarjeta de crédito es 78.52 %.
b) menos de 70 paguen con tarjeta de crédito?

Se desea calcular: P (X < 70) = P (X = 69) + P (X = 68) + P (X = 67) + . . ..
Utilizando la aproximación normal y el factor de corrección por continuidad tenemos
-I I

69.5 − 80
22
′
P (X < 70) ≈ P X < 69.5 =P Z< √ =
48
20
= P (Z < −1.52) = 0.5 − 0.43574 = 0.06426 o 6.43 %,
como se aprecia en la Figura 5.20. Concluimos entonces que la probabilidad de que

menos de 70 clientes paguen sus compras con tarjeta de crédito es 6.43 %.
EP
74.5 80 X´
UD
A
IM
S -L
PU
M
CA
−0.79 0 Z
Figura 5.19: Aproximación normal a la binomial con n=200 y p=0.4. Se muestra la probabilidad de
que al menos 75 clientes paguen con tarjeta de crédito.
c) entre 68 y 73, inclusive, paguen con tarjeta de crédito?
Se desea calcular: P (68 ≤ X ≤ 73) = P (X = 68) + P (X = 69) + . . . + P (X = 73).

E
Utilizando la aproximación normal y el factor de corrección por continuidad tenemos

AD

′
67.5 − 80 73.5 − 80
P (68 ≤ X ≤ 73) ≈ P 67.5 < X < 73.5 =P √ <Z< √ =
48 48
= P (−1.80 < Z < −0.94) =
= 0.46407 − 0.32639 = 0.13768 o 13.77 %,
como se aprecia en la Figura 5.21.

Concluimos entonces que la probabilidad de que entre 68 y 73 clientes, inclusive, paguen
-I I
sus compras con tarjeta de crédito es 13.77 %.

22
20
EP
69.5 80 X´
UD
A
IM
S -L
PU
M
CA
−1.52 0 Z
que menos de 70 clientes paguen con tarjeta de crédito.
5.8. Otras distribuciones continuas importantes

5.8.1. Distribución Uniforme Continua
E
Dados los números reales a y b (a < b), se dice que la variable aleatoria X tiene
AD
distribución uniforme en el intervalo [a, b], si su función de densidad f (x) es dada por (ver
Figura 5.22)

 1
si a≤x≤b
f (x) = b−a
Para indicar que la variable aleatoria X sigue una distribución uniforme continua en el
intervalo [a, b] se denota de la siguiente forma: X ∼ U (a, b).
-I I
La distribución uniforme continua es el modelo más simple de ese tipo. Como se apre-
22
cia, aparece cuando una variable toma valores dentro de un intervalo [a, b] y su función de
20
densidad permanece constante dentro de ese intervalo. Esto implica que la probabilidad de
que la variable tome valores en subintervalos de igual amplitud es la misma. La distribución
uniforme también recibe el nombre de distribución rectangular.
EP
67.5 73.5 80 X´
UD
A
IM
S -L
PU
M
CA
−1.80 −0.94 0 Z
que entre 68 y 73 clientes, inclusive, paguen con tarjeta de crédito.
E
AD
Figura 5.22: Función de densidad de X con distribución uniforme en el intervalo [a, b].
-I I
22
a+b (b − a)2
Se puede mostrar que si X ∼ U (a, b) entonces: E(X) = y V ar(X) = .
20
2 12
También no es difı́cil verificar que, en este caso, la función de distribución acumulada
F (x) está dada por (ver Figura 5.23)



 0 si x<a
 x−a
F (x) = si a ≤ x < b

 b−a

1 si x≥b
EP
UD
A
IM
S -L
PU
M
CA
Figura 5.23: Función de distribución acumulada de una variable aleatoria X con distribución uniforme
en el intervalo [a, b].
1. Una empresa tiene una curva de costes que viene dada por la siguiente función:
C = 100+2X, donde X es la demanda. En el mercado vende cada unidad de su producto
a 5 dólares. Si la empresa considera que la demanda se distribuye uniformemente en el
intervalo [250, 300].
E
a) ¿Cuál serı́a el beneficio esperado?

AD
Sea la variable aleatoria: X=“Demanda en el intervalo [250, 300]”. Esta variable

se distribuye uniformemente, X ∼ U (250, 300), por lo que su función de densidad
f (x) es dada por

 1
si 250 ≤ x ≤ 300
f (x) = 300 − 250
El beneficio será B = Ingresos − Costes = 5X − (100 + 2X) = 3X − 100. El

-I I
beneficio esperado será:

22
20
E (B) = E (3X − 100) = 3E (X) − 100.
a+b 250 + 300

Dado que X se distribuye uniformemente: E(X) = µ = = = 275
2 2
unidades, de manera que E (B) = 3E (X) − 100 = 3 × 275 − 100 = 725 dólares.
b) ¿Cuál es la probabilidad de que la demanda esté entre 260 y 280 unidades?

La probabilidad de que X se encuentre entre 260 y 280 es igual al área bajo f (x)
entre 260 y 280. Ya que calcular el área del rectángulo formado es sencillo, tenemos
280 − 260
P (260 ≤ X ≤ 280) = = 0.40 o 40 %.
300 − 250
Podrı́amos haber llegado al mismo resultado si hubiéramos utilizado la función

densidad como en (5.1) para calcular la probabilidad (área)
Z
EP
280
1 1
P (260 ≤ X ≤ 280) = dx = × (280 − 260) = 0.40 o 40 %.
300 − 250 300 − 250
UD
260
Este cálculo también podrı́a haber sido realizado usando la función de distribución
acumulada, siguiendo la expresión (5.5) tenemos
A
280 − 250 260 − 250 20
IM
P (260 ≤ X ≤ 280) = F (280)−F (260) = − = = 0.40 o 40 %.

300 − 250 300 − 250 50
-L
2. Elena es alumna de Administración y todos los dı́as va en ómnibus hasta el Campus

S
PU
Lima de la Udep. Hay solamente un ómnibus que le sirve y suele pasar por el paradero,
cercano a su casa, en cualquier instante entre las 7 am. y las 7:30am. Si en un cierto dı́a
M
Elena llega al paradero a las 7:24am, ¿cuál es la probabilidad de que ella pueda tomar
CA
el ómnibus?
Sea X el instante de la llegada del ómnibus al paradero. Note que la uniformidad de X
está implı́cita en el enunciado. Entonces X ∼ U (0, 30), donde X es medida en minutos
y 0 (cero) corresponde a las 7 am. Para que Elena pueda tomar el ómnibus, este debe
llegar después de las 7:24am. (o sea, entre 7:24 y 7:30 am.).
6
Tenemos que P (X > 24) = P (24 < X ≤ 30) = = 0.20 o 20 %.
30
5.8.2. Distribución exponencial

E
AD
Sea λ una constante positiva, decimos que la variable aleatoria X sigue una distribución
exponencial con parámetro λ, si su función de densidad es dada por
(
0 si x < 0
f (x) =
λe−λx si x ≥ 0
Para indicar que la variable aleatoria X sigue una distribución exponencial con parámetro
λ se denota de la siguiente forma: X ∼ Exp (λ).
-I I
En la Figura 5.24 se muestra la función de densidad de la variable X con distribución

22
exponencial con parámetro λ = 0.5.

20
1 1
Se puede mostrar que si X ∼ Exp (λ) entonces: E(X) = y V ar(X) = 2 . Esto es,
λ λ
1
tanto la media como la desviación estándar de la distribución exponencial son iguales a .
λ
0.5
0.4
0.3
f(x)
0.2
EP
0.1
UD
0.0
0.0 2.5 5.0 7.5 10.0

x
A
IM
Figura 5.24: Función de densidad de X con distribución exponencial con parámetro λ = 0.5.
S -L
PU
También no es difı́cil verificar que la función de distribución acumulada F (x) está dada
por
M
(
0 si x < 0
CA
F (x) =
1 − e−λx si x ≥ 0
En la Figura 5.25 se muestra la función de distribución acumulada de la variable X con
distribución exponencial con parámetro λ = 0.5.
1.00
E
0.75
AD
F(x)
0.50
0.25
-I I
22
0.00
20
0.0 2.5 5.0 7.5 10.0

x
Figura 5.25: Función de de distribución acumulada de la variable X con distribución exponencial con
parámetro λ = 0.5.
La distribución exponencial es un modelo que se emplea con frecuencia para modelar:
La distribución del tiempo de espera hasta la ocurrencia de un suceso de Poisson.
Tiempo transcurrido entre la presentación de sucesos consecutivos de Poisson.
La duración de vida de ciertos elementos que puede considerarse como el tiempo que
transcurre hasta que se produce la extinción, averı́a, falla, etc.
Una caracterı́stica importante de la distribución exponencial es la propiedad conocida

como “pérdida de memoria”. Esto significa que el tiempo transcurrido desde cualquier
EP
instante dado t0 hasta que ocurre un evento, no depende de lo que haya ocurrido antes del
UD
instante t0 . Matemáticamente, dados t0 y t1 , ambos reales positivos, la “pérdida de memoria”

se refleja mediante la expresión:
P (T > t0 + t1 | T > t0 ) = P (T > t1 ) (5.15)

A
IM
Esto se demuestra desarrollando la probabilidad condicional:

S -L
P (T > t0 + t1 y T > t0 ) P (T > t0 + t1 )

PU
P (T > t0 + t1 | T > t0 ) = = =
P (T > t0 ) P (T > t0 )

M
1 − F (t0 + t1 ) 1 − 1 − e−λ(t0 +t1 ) e−λ(t0 +t1 )

= = = =
CA
1 − F (t0 ) 1 − (1 − e−λt0 ) e−λt0

= e−λt1 = P (T > t1 ) .
Relación entre la distribución exponencial y la distribución de Poisson
Como se comentó anteriormente, la distribución exponencial se utiliza frecuentemente

como modelo para la distribución de los tiempos entre la ocurrencia de eventos sucesivos,
tales como clientes llegando a una unidad de atención o llamadas en una central telefónica. El
motivo de esto es que la distribución exponencial está fuertemente relacionada con el proceso
E
de Poisson discutido en el capı́tulo 4. Para comprender un poco más la relación entre estas
AD
distribuciones se presenta la siguiente proposición.
Proposición. Sea X que el número de eventos que se producen en un intervalo de tiempo de

duración t tiene distribución de Poisson con parámetro λt (donde λ, es el número esperado
de eventos que ocurren en una unidad de tiempo). Entonces la distribución de T, el tiempo
transcurrido entre la ocurrencia de dos eventos sucesivos, es exponencial con parámetro λ.
De hecho, suponga que X ∼ P (λt). Entonces, X=0 (es decir, no ocurre ningún evento en
-I I
el intervalo (0, t) si y sólo si T > t). Por tanto, P (X = 0) = P (T > t). Osea
22
e−λt × (λt)0
20
P (T > t) = P (X = 0) = = e−λt .
0!
Entonces, F (t) = P (T ≤ t) = 1 − e−λt . Como esta es la función de distribución acumulada

de una distribución exponencial, concluimos que T ∼ Exp (λ).
Por tanto, la distribución exponencial se aplica a las mismas situaciones que la distribu-
ción de Poisson, siendo que la exponencial modela el tiempo entre ocurrencias y la Poisson
modela el conteo de esas ocurrencias.
1. El tiempo que transcurre antes de que una persona sea atendida en una cafeterı́a es una
variable aleatoria que tiene una distribución exponencial con una media de 4 minutos.
¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3
EP
minutos en al menos 4 de los 6 dı́as siguientes?

UD
Sea la variable aleatoria: T=“tiempo que transcurre antes de que una persona sea
atendida en una cafeterı́a (min)”. Esta variable se distribuye exponencialmente con
1
parámetro λ, T ∼ Exp(λ). Según el enunciado E(T ) = = 4, por lo tanto λ = 0.25.
λ
Luego la función de densidad f (t) es dada por
A
IM
(
0 si t < 0
-L
f (t) =
0.25e−0.25t si t ≥ 0
S
PU
Ahora calculamos la probabilidad de que una persona sea atendida antes de que
M
transcurran 3 minutos (en un dı́a cualquiera)

CA
Z 3 3

P (T < 3) = 0.25e−0.25t dt = −e−0.25t = 0.5276 o 52.76 %.
0 0
Definimos ahora la variable aleatoria: X=“número de dı́as en que un cliente es atendido

antes de que transcurran 3 minutos”, siendo que X puede tomar los valores: 0,1,2,3,4,5,6.
Claramente la variable X es una variable binomial con parámetros: n = 6 y p = 0.5276,
X ∼ B(6, 0.5276), y lo que piden calcular es
E
P (X ≥ 4) = P (X = 4) + P (X = 5) + P (X = 6)
AD
6! 6!
= × 0.52764 × 0.47242 + × 0.52765 × 0.47241 +
4! × 2! 5! × 1!
6!
+ × 0.52766 × 0.47240
6! × 0!
= 0.2594 + 0.1159 + 0.0216 = 0.3969 o 39.69 %.
2. Suponga que el tiempo que necesita el cajero automático de un banco para atender a
un cliente tiene un distribución exponencial con una media de 40 segundos.
-I I
a) ¿Cuál es la probabilidad que el tiempo necesario para atender un cliente dado sea
22
más de 1.5 minutos?

20
Sea la variable aleatoria: T=“tiempo necesario para atender a un cliente (seg.)”.

Esta variable se distribuye exponencialmente con parámetro λ, T ∼ Exp(λ). Según
1 1
el enunciado E(T ) = = 40, por lo tanto λ = . Luego la función de densidad
λ 40
f (t) es dada por 

 0 si t < 0
f (t) = 1 −t
 e 40 si t ≥ 0
40
La probabilidad solicitada es P (T > 90) (1.5 minutos es igual a 90 segundos),
entonces tenemos
Z +∞ Z 90
1 −t 1 −t t 90
− 40
P (T > 90) = e 40 dt = 1 − e 40 dt = 1 + e =
90 40 0 40 0
90
− 40 0 − 94
EP
= 1+ e − e = e = 0.1054 o 10.54 %.
UD
b) ¿Cuál es la probabilidad que el tiempo necesario para atender a un cliente esté

comprendido entre 1 y 2 minutos?
La probabilidad solicitada es P (60 < T < 120). Para este cálculo podemos utilizar
A
tanto la función de densidad o la función de distribución acumulada. La función
IM
de distribución acumulada F (t) es dada por

-L
(
0 si t < 0
S
F (t) =
PU
t
− 40
1−e si t ≥ 0
M
Empleando F (t) como en (5.5) tenemos

CA
120
60

P (60 < T < 120) = F (120) − F (60) = 1 − e− 40 − 1 − e− 40 =
3
= e− 2 − e−3 = 0.1733 o 17.33 %.
Si hubiéramos utilizado la función densidad procederı́amos como en (5.1)

Z 120
1 −t
P (60 < T < 120) = e 40 dt,
60 40
E

AD
c) ¿Cuál es la probabilidad que el tiempo necesario para atender un cliente dado sea
menor de 50 segundos?
La probabilidad solicitada es P (T < 50). Empleando por ejemplo F (t) tenemos
50

P (T < 50) = F (50) = 1 − e− 40 = 0.7135 o 71.35 %.
Si hubiéramos utilizado la función densidad serı́a

Z 50
-I I
1 −t
P (T < 50) = e 40 dt,
40
22
0
20

d) Si el cajero lleva atendiendo a un cliente más de 30 segundos, ¿cuál es la
probabilidad de que el cliente sea atendido en más de 55 segundos?
P (T > 55 y T > 30) P (T > 55)

P (T > 55 | T > 30) = = =
P (T > 30) P (T > 30)

− 55
1 − F (55) 1 − 1 − e 40
= = =
1 − F (30) 1 − 1 − e− 40
30
55
e− 40 25
= = e− 40 = 0.5353 o 53.53 %.
− 30
e 40
EP
Si nos hemos percatado, lo que hemos aplicado en realidad es la propiedad de pérdi-

UD
da de memoria, expresión (5.15), ası́ la probabilidad solicitada P (T > 55 | T > 30)

se podrı́a calcular directamente mediante P (T > 25).
3. En promedio, por un paradero de ómnibus poco transitado, pasan 3 ómnibus por hora
A
distribuidos según un proceso Poisson. ¿Cuál es la probabilidad de tener que esperar
IM
un ómnibus por más de 20 minutos?

-L
Sea la variable aleatoria: X=“Número de ómnibus que llegan a un paradero”. Esta

S
ómnibus
PU
variable se distribuye según Poisson con media λ = 3 o equivalentemente

hora
ómnibus
M
λ = 0.05 . Entonces la variable aleatoria: T=“tiempo de espera hasta llegar

minuto
CA
un ómnibus (minutos)” se distribuye exponencialmente con parámetro 0.05, ası́ T ∼

Exp(0.05). Por tanto, la probabilidad de esperar la llegada de un ómnibus por más de
20 minutos es
Z +∞ 20 Z 20
−0.05t
P (T > 20) = 0.05e
dt = 1 − 0.05e−0.05t dt = 1 + e−0.05t =
20 0 0
−0.05×20 0
−1
= 1+ e − e = e = 0.3679 o 36.79 %.
4. En una tela, las fallas se distribuyen según un proceso Poisson, a razón de 1 falla cada
15 metros. ¿Cuál es la probabilidad de que la distancia entre la 4a falla y la 5a falla sea
E
AD
mayor a un metro?
Sea la variable aleatoria: X=“Número de fallas en una tela”. Esta variable se distribuye
1 f alla
según Poisson con media λ = . Entonces la variable aleatoria: D=“distancia
15 metros
1
entre fallas consecutivas” se distribuye exponencialmente con parámetro , ası́ T ∼
15
1
Exp . Por tanto, la probabilidad de que la distancia entre la 4a falla y la 5a falla
15
sea mayor a un metro es
Z Z 1
-I I
+∞
1 −t/15 1 −t/15 1

P (D > 1) = e dt = 1 − e dt = 1 + e−t/15 =
22
1 15 0 15 0

20
= 1 + e−1/15 − e0 = e−1/15 = 0.9355 o 93.55 %.


1. El tiempo que espera un cliente para ser atendido en una agencia bancaria, expresado
en minutos, es una variable aleatoria continua cuya función de densidad es:

 1

 15 si 0 < x < 15
f (x) =



0 en otros casos
EP
Si se elige un cliente al azar ¿Cuál es la probabilidad de que el tiempo de espera esté

entre 12 y 14 minutos?
UD
2. La variable X=“longitud (en centı́metros) a la que queda del centro de un tablero, un

dardo al ser lanzado por una persona”, se observó que tenı́a por función de densidad
f(x): (
A
k si 0 ≤ x < 10
IM
f (x) =
0 en otros casos
-L
Se pide:
S
PU
a) Hallar k para que f (x) sea función de densidad y grafı́quela.

M
b) Hallar la función de distribución y grafı́quela.

CA
c) Hallar la media, varianza y desviación estándar o tı́pica.

d) Hallar P (X ≤ 1).
3. Sea X una variable aleatoria con función de densidad dada por:


2

 ax si 0≤x<1
f (x) = 2
a(2 − x) si 1≤x<2


0 en otros casos
E
Hallar:
AD
a) El valor de a.
b) La media y la desviación estándar de x.
c) La función de distribución.
d) Sabiendo que X < 1.75, calcule la probabilidad de que X sea mayor que 1.5.
4. Dada la siguiente función:

-I I


 x si 0≤x<1
22
f (x) = 2 − x si 1≤x<2
20


0 en otros casos
Compruebe si f (x) es una función densidad.

5. Dada la siguiente función:


 1

 49 (7 + x) si −7 ≤ x ≤ 0
f (x) =
 a(7 − x)

si 0<x≤7

0 en otros casos
a) Calcular a para que f (x) sea función de densidad.

b) Calcular la media de la variable aleatoria.
EP
6. Sea X una variable aleatoria continua cuya función de distribución es:


UD

 0 si x≤0
F (x) = 3
kx si 0 < x ≤ 2


1 si x>2
A
a) ) Calcular k para que F (x) sea una verdadera función de distribución.
IM

1 3
b) ) Calcular P <x< .
-L
2 2
S
c) ) Calcular la función de densidad.

PU
d) ) Calcular la esperanza y varianza de la variable aleatoria.

M
CA
7. Una variable aleatoria tiene como función de densidad:

(
1 − mx si 2≤x≤4
f (x) =
0 en otros casos
a) Determinar m para que f (x) sea función de densidad.

b) Hallar la función de distribución.
1
c) Hallar aquel valor de a para que P (X ≤ a) = .
4
d) Calcular la esperanza de X.
E
AD
8. La función de densidad de una variable aleatoria X viene dada por:

(
kx2 (1 − x) si 0≤x≤1
f (x) =
0 en otros casos
a) Calcula el valor k para que f (x) sea una función de densidad.

b) Calcular la función de distribución.
c) Calcular la media y la varianza.
-I I
d) Calcular P (0.3 < x < 0.7).

22
9. Sea X una variable aleatoria continua con función de densidad

20


 a(1 + x) si 0<x≤1

2
f (x) = si 1<x≤2

 3

0 en otros casos
Se pide:
a) Valor de a para que f (x) sea función de densidad.

b) Hallar la función de distribución
c) Calcular P (0.5 < x < 1.5).
10. Dada la variable aleatoria continua, X, con función de densidad,

(
m(x + 2) si 0≤x≤4
f (x) =
EP
0 en otros casos
UD
Hallar:
a) El valor de m para que f (x) sea realmente una función de densidad.

b) La función de distribución.
A
IM
c) La media y la varianza.
d) P (2 ≤ x ≤ 3).
S -L
PU
11. La función de densidad de una variable aleatoria es,

(
M
ax2 + b si 0≤x≤2
f (x) =
CA
0 en otros casos

1
Sabiendo que P <x<1 = 0.1357, determinar a y b.
2
12. La cantidad de pan (en cientos de kilos) que se vende diariamente en una panaderı́a
del distrito donde Ud. vive, es una variable aleatoria X cuya función de densidad es:


 Ax si 0≤x<5
f (x) = A(10 − x) si 5 ≤ x ≤ 10


E
0 en otros casos
AD
a) Calcular el valor de la constante A para que f(x) sea una función de densidad.
b) Calcule la probabilidad de que, en un dı́a cualquiera, se vendan entre 240 y 715
kg. de pan.
c) Calcule la probabilidad de que, en un dı́a cualquiera, se vendan más de 350 kg. de
pan.
d) Calcule la probabilidad de que, en un dı́a cualquiera, se vendan menos de 830 kg.
-I I
de pan.
22
e) Si elegimos un dı́a al azar y resulta que ese dı́a se vendieron menos de 725 kg. de
20
pan ¿Cuál es la probabilidad de que se haya vendido más de 450 kg?

f) Si se eligen al azar 5 dı́as de ventas ¿Cuál es la probabilidad de que por lo menos
en 3 de ellos se haya vendido entre 240 y 715 kg. de pan?
g) Calcule e interprete la venta diaria promedio y la desviación estándar de la venta

diaria de pan.
h) Si W = 4X − 1. Calcule E(W ).
i) ¿Cuál es la probabilidad de que, en un dı́a cualquiera, se haya vendido 325 kg de
pan?
j) Halle la función de distribución F (x), empleando el análisis visto en clase.
13. Ciertos estudios demuestran que el consumo de gasolina tiene una distribución normal
EP
con un consumo medio de 25.5 Km. por galón y una desviación estándar de 4.5 km.
por galón.
UD
a) ¿Qué porcentaje de autos medianos obtienen 30 o más km. por galón?

b) Si un fabricante desearı́a producir un automóvil mediano que tenga un mejor
rendimiento que el 97,5 % de los automóviles medianos existentes, ¿Cuántos
A
IM
kilómetros por galón debe recorrer este nuevo auto?

-L
14. La lluvia estacional media anual en cierto poblado es de 18.75 pulgadas, con una
S
desviación estándar de 6.50 pulgadas. Se supone que la lluvia estacional tiene una
PU
distribución normal. ¿En cuántos años, de un perı́odo de 50, se podrá esperar una
M
lluvia de 15.00 a 25 pulgadas?

CA
15. Los salarios de los trabajadores en cierta industria son en promedio 11.90 dólares por
hora, y la desviación estándar es de 0.40 dólares. Si se supone que los salarios tienen
una distribución normal:
a) ¿Qué porcentaje de trabajadores recibe salarios inferiores a 11,00 o superiores a

12,90 dólares por hora?
b) ¿Cuál debe ser el salario por hora si sólo 10 % de los trabajadores de esta industria
ganan más?
E
c) ¿Cuál debe ser el salario por hora si 19,5 % de los trabajadores de esta industria
AD
ganan menos?
16. Un abogado se traslada diariamente de su casa en los suburbios a su oficina en el centro

de la ciudad. En promedio el viaje le toma 24 minutos con una desviación estándar de
3.8 minutos. Asuma que la distribución de los tiempos de traslado está normalmente
distribuida.
a) ¿Cuál es la probabilidad de que un traslado le tome menos de media hora?

-I I
b) Si la oficina abre a las 9:00 am y él sale de su casa a las 8:45 am diariamente,
22
¿Qué porcentaje de las veces llega tarde a su trabajo?

20
c) Si deja su casa a las 8:35 am y en la oficina se sirve un café entre las 8:50 y las
9:00 am,¿Cuál es la probabilidad de que se pierda el café?
17. La variable X sigue distribución normal con media µ y desviación estándar σ. Se sabe
que la media de X es cinco veces su desviación estándar y que la P (X ≤ 6) = 0.84134.
Mostrando el planteamiento y los cálculos respectivos halle la media y la desviación
estándar de X.
18. Los rectores de universidades americanas reciben una prestación para vivienda que, en
promedio es de 26234 dólares anuales. Suponga que se aplica una distribución normal
a las compensaciones, y que la desviación estándar es de 5000 dólares.
a) ¿Qué porcentajes de los rectores de universidades recibe una compensación anual

EP
de vivienda mayor de 35000 dólares?

UD
b) ¿Qué porcentaje recibe una compensación anual menor de 20000 dólares?

c) ¿Cuál es la compensación anual que corresponde al 10 % de los rectores de
universidades que recibe las compensaciones más altas?
A
19. Una máquina expendedora de refresco se ajusta para servir 7.00 onzas del lı́quido por
IM
vaso. La desviación estándar es de 0.10 onzas. Suponga que las cantidades de refresco
-L
vertidas por la máquina siguen una distribución normal.

S
PU
a) ¿Cuál es la probabilidad de que la máquina sirva entre 7.10 y 7.25 onzas?

M
b) ¿Cuál es la probabilidad de que la máquina sirva 7.25 onzas o más?

CA
c) ¿Cuál es la probabilidad de que la máquina sirva entre 6.8 onzas y 7.25 onzas?
d) ¿Cuánto refresco se sirve en el máximo 1 % de las bebidas?
20. Un productor de jugo de naranja compra todas sus naranjas en un huerto. La cantidad
de jugo que se exprime de cada naranja tiene una distribución normal aproximada con
una media de 4.70 onzas y una desviación estándar de 0.40 onzas.
a) ¿Cuál es la probabilidad de que una naranja seleccionada al azar contenga entre

4.70 y 5.00 onzas de jugo?
E
b) ¿Cuál es la probabilidad de que una naranja seleccionada al azar contenga entre

AD
5.00 y 5.50 onzas de jugo?
21. Suponga se ha encontrado que el nivel de llenado de unas botellas de refresco tiene
una distribución normal con media de 2.0 litros y desviación estándar de 0.05 litros.
Las botellas que contienen menos de 95 % del contenido neto anunciado (1.90 litros
en este caso) pueden causar una multa al fabricante por parte de la oficina estatal de
protección al consumidor, mientras que las botellas que contienen un contenido neto
mayor que 2,10 litros pueden provocar un derrame del exceso al abrirlas.
-I I
22
a) ¿Qué proporción de botellas contendrá entre 1.90 y 2.10 litros?

20
b) ¿Qué proporción de botellas contendrá menos de 1.90 litros o más de 2.10 litros?
c) ¿Qué proporción de botellas contendrá entre 2.05 y 2.10 litros?
d) ¿Entre qué dos valores (con distribución simétrica) se espera encontrar el contenido
del 99 % de las botellas?
22. Las ventas anuales (en unidades monetarias, u.m.) de novelas policı́acas se distribuyen
normalmente con media y desviación estándar desconocidas. Un 40 % de las veces, las
ventas son por más de 470000 u.m. y 10 % de las veces son por más de 500000 u.m.
¿Cuál es el valor de la media y el de la desviación estándar?
23. Los salarios anuales de los ejecutivos de mandos medios en una compañı́a están
distribuidos normalmente, con una desviación estándar de $ 1200. Se tiene programado
un recorte de personal que implica el despido de aquellos que ganen menos de $ 18000. Si
tal medida representa el 9 % de los ejecutivos de mandos medios, ¿Cuál es actualmente
EP
el salario medio de este grupo de funcionarios?

UD
24. Los resultados de una prueba objetiva de selección pasada a 200 personas indicaron que
la distribución de puntuaciones era normal, con media 60 puntos y desviación estándar
de 6 puntos.
A
a) ¿Cuántos examinados han sacado más de 63 puntos?
IM
b) ¿Cuántos examinados han obtenido una puntuación entre 55 y 61 puntos?

-L
c) ¿Cuál es la puntuación por debajo de la cual están el 67 % de los examinados?

S
PU
25. Tras aplicar un test de cultura general se observa que las puntuaciones obtenidas siguen
M
una distribución normal con media de 65 puntos y una varianza de 324 puntos2 . Se desea
CA
clasificar a los examinados en tres grupos (de baja cultura general, de cultura general
aceptable y de excelente cultura general) de modo que haya en el primero un 19.5 % de
la población, un 65.5 % en el segundo y un 15 % en el tercero. ¿Cuáles han de ser las
puntuaciones que marcan el paso de un grupo al otro?
26. El tiempo necesario para terminar un examen final en determinado curso se distribuye
normalmente con 80 minutos de media y 10 minutos de desviación estándar. Con estos
datos conteste lo siguiente:
a) ¿Cuál es la probabilidad de terminar el examen en una hora o menos?

E
AD
b) ¿Cuál es la probabilidad de que un alumno termine el examen en más de 60

minutos, pero en menos de 75 minutos?
c) Suponga que en el grupo hay 60 alumnos, y que el tiempo del examen es de 90
minutos. ¿Cuántos alumnos espera que no puedan terminar el examen en el tiempo
indicado?
27. El Banco del Perú está revisando sus cobros por servicios y su polı́tica de pago de
intereses en las cuentas corrientes. El banco ha encontrado que el balance promedio
diario en las cuentas personales es de $55, con una desviación estándar de $15. Además,
-I I
22
se encontró que los balances promedio diarios se distribuyen normalmente.

20
a) ¿Qué porcentaje de las cuentas corrientes de los clientes tienen balances promedios
diarios mayores de $80?
b) ¿Qué porcentaje de las cuentas corrientes de los clientes tienen balances promedios
diarios menores de $70?
c) El banco está considerando pagar intereses a clientes que tengan balances promedio
diarios mayores que cierta cantidad. Si el banco no quiere pagar intereses a más
del 15 % de sus clientes, cual es el monto mı́nimo del balance promedio diario al
cual está dispuesto a pagar intereses?
28. Una compañı́a produce focos de luz cuyo tiempo de vida sigue una distribución normal
con una media de 1200 horas y una desviación estándar de 250 horas. Un foco se
selecciona aleatoriamente de la producción de la compañı́a:
a) Encuentre la probabilidad de que dure menos de 1500 horas.

EP
b) Encuentre la probabilidad de que el foco seleccionado dure al menos de 1000 horas.

UD
c) Encuentre la probabilidad de que dure entre 1000 y 1300 horas.
29. El ancho (en mm.) de una pequeña pieza metálica sigue una distribución normal. Si se
estima que el 77 % de la producción miden menos de 12 mm. y el 85 % más de 7 mm.:
A
IM
a) ¿cuál es el ancho promedio y la desviación estándar de la anchura?

-L
b) ¿Qué porcentaje de piezas miden más de 10 mm?

S
PU
30. Los postulantes a una escuela militar tienen estaturas que se distribuyen normalmente
M
alrededor de 1.72m. con una desviación estándar de 0.04m. Las calificaciones que
CA
obtuvieron se encuentran distribuidas también normalmente alrededor de 220 puntos,

con una desviación estándar de 65. Si se desea que ingresen 200 postulantes de un total
de 880, con una estatura mı́nima de 1.70 m. ¿cuál debe ser la calificación mı́nima para
ingresar?
31. Suponga que los promedios de prácticas de los alumnos de un curso están distribuidos
normalmente alrededor de 12. Si el 95 % de estos promedios están comprendidos entre
09 y 15. ¿Qué porcentaje de alumnos estarán aprobados? (Considere que la nota
aprobatoria mı́nima es 10.5)
E
AD
32. Supongamos que los pesos de una población de individuos tiene distribución normal
con media de 74 kg y desviación estándar de 7 kg. ¿Qué peso debe tener un individuo
para que el 16,6 % de la población pese más que él?
33. El peso de los adultos de una población numerosa se distribuye normalmente con
media 65 kg y desviación tı́pica 3 kg. Se eligen dos individuos al azar. Calculando
las correspondientes probabilidades, justifica qué es más probable:
a) Que cada uno de los individuos tenga un peso comprendido entre 63,5 y 66,5 kg.
-I I
b) Que uno de ellos tenga un peso comprendido entre 62 y 68 kg. y el otro tenga un
22
peso no comprendido entre 62 y 68 kg.

20
34. La estatura de los individuos de una población se distribuye normalmente con media
de 174 cm. y desviación estándar de 5cm. Se le pide lo siguiente:
a) Calcular la probabilidad de que la estatura de un individuo elegido al azar esté

comprendida entre 164 y 184 cm.
b) Si elegimos a un individuo al azar y resulta tener una estatura superior a 164 cm.
¿Cuál es la probabilidad de que tenga una estatura menor a 184 cm?
35. El tiempo necesario para que una ambulancia llegue a un centro deportivo se distribuye
normalmente con una media 17 minutos y desviación tı́pica de 3 minutos.
a) Calcular la probabilidad de que el tiempo de llegada esté comprendido entre 13 y

21 minutos.
EP
b) ¿Para qué valor de t, la probabilidad de que la ambulancia emplee más de t minutos

UD
en llegar es el 5 %?
36. Para aprobar unas oposiciones se necesita obtener 100 puntos, o más, en una prueba.
Por experiencias anteriores, se sabe que la distribución de los puntos obtenidos por los
A
opositores es una normal de media 110 puntos y desviación tı́pica 15.
IM
-L
a) ¿Qué probabilidad hay de que un opositor apruebe?

S
b) Si sabemos que hay 1000 opositores y sólo 300 plazas, ¿Cuántos puntos se deberá
PU
exigir para ajustar el número de plazas al número de opositores aprobados?

M
CA
37. En una ciudad, la temperatura máxima durante el mes de junio está distribuida
normalmente con una media de 26ºC y una desviación tı́pica de 4ºC. Calcular el número
de dı́as que se espera tengan temperatura máxima comprendida entre 22ºC y 28ºC.
38. El tiempo de reemplazo de los reproductores de CD se distribuye normalmente, con

una media de 7.1 años y una desviación estándar de 1.4 años.
a) ¿Cuál es la probabilidad de que un reproductor de CD, seleccionado aleatoriamen-

te, tenga un tiempo de reemplazo menor de 8 años?
b) Si se ofrece una garantı́a tal que sólo el 2 % de los reproductores se reemplace
E
antes de que expire la garantı́a, ¿cuál debe ser la duración de la garantı́a?

AD
39. Las calificaciones de los estudiantes de un curso siguen una distribución normal. Si las
puntuaciones estandarizadas o tipificadas de dos estudiantes fueron 0.8 y -0.4 y sus
notas reales fueron 88 y 67.4 puntos. ¿Cuál es la media y la desviación estándar de las
puntuaciones del examen?
40. Se supone que los resultados de un examen siguen una distribución normal con media
87 y varianza 81. Se pide:
-I I
a) ¿Cuál es la probabilidad de que una persona que se presenta al examen obtenga

22
una calificación superior a 72?

20
b) Calcular el porcentaje de estudiantes que tienen puntuaciones que exceden por lo

menos en cinco puntos de la puntuación que marca la frontera entre el Apto y el
No-Apto (son declarados No-Aptos el 25 % de los estudiantes que obtuvieron las
puntuaciones más bajas).
c) Si elegimos al azar a un estudiante y resulta tener una calificación mayor que 72

¿Cuál es la probabilidad de que su calificación sea, de hecho, superior a 84?
41. El peso de los melocotones de un pedido se distribuyen normalmente. Se sabe que el

9 % de los melocotones tiene un peso inferior a 50 gramos y un 20 % de los melocotones
tienen un peso superior a 70 gramos ¿Qué porcentaje de los melocotones del pedido
tienen su peso comprendido entre 65 y 75 gramos?
42. Los ingresos diarios (en unidades monetarias) de una empresa tienen una distribución
normal con media 35560 um. y desviación tı́pica 2530 um. Justifica si es o no razonable
EP
el esperar obtener un dı́a unas ventas superiores a 55000 ptas. Calcular cuántos dı́as en
UD
un año se espera obtener unas ventas superiores a 40620 um.
43. Se supone que las retribuciones recibidas en una empresa se distribuyen normalmente
con media y desviación estándar desconocidas. Se conoce que el 1 % son superiores a
A
5800000 unidades monetarias y el 10 % inferiores a 1200000 unidades monetarias.
IM
-L
a) ¿Cuál es el valor de la media y el de la desviación estándar?

S
b) ¿Qué porcentaje de las retribuciones son superiores a 3 000 000 unidades

PU
monetarias?
M
44. Se ha estimado que el peso neto de un paquete que contiene determinado alimento
CA
precocido sigue una distribución normal. Un tercio de los paquetes pesan menos de 870
grs. y sólo dos de cada mil paquetes pesan más de 1 kg. Se pide:
a) ¿ Cuál es el peso neto promedio y la desviación estándar de los pesos netos de

dichos paquetes?
b) Calcular la probabilidad de que un paquete seleccionado al azar pese más de 860
gr.
c) Calcular la probabilidad de que un paquete seleccionado al azar pese menos de
E
880 gr.
AD
d) Cuál es la probabilidad de que un paquete seleccionado al azar pese exactamente

865gr?
e) Si se selecciona un paquete al azar y resulta tener un peso neto menor a 890 gr,
¿Cuál es la probabilidad que su peso neto sea mayor a 875 gr?
f) Si se seleccionan aleatoriamente 5 paquetes¿ Cuál es la probabilidad de que al
menos 2 de ellos pesen menos de 890 gr?
g) Si en una semana salen al mercado 40.000 paquetes ¿cuántos cabe esperar que
-I I
pesen más de 900 gr?

22
20
45. Se tiene un examen con 50 preguntas de opción múltiple. Cada pregunta tiene cuatro
alternativas, de las cuales sólo una es correcta. Suponga que un alumno que ha asistido
a clases, estudiado e investigado tiene una probabilidad de 0.75 de contestar cualquier
pregunta en forma correcta.
a) Un alumno debe contestar en forma correcta 43 preguntas o más para alcanzar la

calificación A. ¿Qué porcentaje de alumnos que hayan asistido a clases, estudiado
e investigado alcanzan la clasificación A en este examen de opción múltiple?
b) Un alumno que contesta en forma correcta de 35 a 39 preguntas obtiene una
calificación C ¿Qué porcentaje de alumnos que hayan asistido a clases, estudiado
e investigado alcanzan una clasificación C en este examen?
c) Un alumno debe contestar en forma correcta 30 preguntas o más para pasar el
examen. ¿Qué porcentaje de alumnos que hayan asistido a clases, estudiado e
EP
investigado pasarán el examen?

UD
46. El tiempo que tarda un camión que transporta materiales de construcción, entre la
bodega de carga y la obra de construcción, es aproximadamente normal con una media
de 25 minutos y una desviación estándar de 4 minutos. ¿A qué hora debe salir el camión
de la bodega, para tener una probabilidad del 90 % de estar en la obra de construcción
A
IM
a las 10 de la mañana?
-L
47. El Departamento de Justicia de EEUU presentó una demanda contra Microsoft

S
Corporation, en diciembre de 1997, por ligar su navegador de red Internet Explorer, con
PU
su sistema operativo Windows 95. La opinión pública se dividió acerca de si Microsoft es

M
un monopolio. En una encuesta realizada, el 41 % de quienes contestaron concordaron

CA
con la afirmación ?Microsoft es un monopolio?.
a) En una muestra de 800 personas, ¿cuántas espera el lector que coincidan en que
Microsoft es un monopolio?
b) En esa muestra, ¿cuál es la probabilidad de que 300 personas o menos coincidan
en que Microsoft es un monopolio?
c) Nuevamente en una muestra de 800 personas, ¿cuál es la probabilidad de que más
de 335 personas pero menos de 350 concuerden en que Microsoft es un monopolio?
E
48. Se sabe que el 30 % de los clientes de una tarjeta de crédito a nivel nacional dejan en cero
AD
sus saldos para no incurrir en intereses moratorios. Conteste las siguientes preguntas
para un grupo de 150 poseedores esa tarjeta.
a) ¿Cuál es la probabilidad de que de 40 a 60 clientes paguen sus cuentas antes de

incurrir en el pago de intereses?
b) ¿Cuál es la probabilidad de que 30 clientes o menos paguen sus cuentas antes de
incurrir en el pago de intereses?
-I I
49. La investigación sobre nuevos delincuentes juveniles que fueron puestos en libertad bajo
22
palabra por un juez reveló que 38 % de ellos cometieron otro delito.

20
a) ¿Cuál es la probabilidad de que de los últimos 100 nuevos delincuentes juveniles

puestos en libertad condicional o bajo palabra, 30 o más delincan otra vez?
b) ¿Cuál es la probabilidad de que 40 o menos cometan otro delito?
c) ¿Cuál es la probabilidad de que entre 30 y 40, inclusive, cometan otro acto ilı́cito?
50. En la lı́nea naviera Royal Express se informa que 80 % de sus camarotes se ocupa,
durante el mes de setiembre. En el caso de un navı́o que tenga 800 dormitorios, ¿Cuál
es la probabilidad de que de 650 a 665 dormitorios sean ocupados en dicho mes?
51. Tras una larga serie de observaciones, se llega a la conclusión de que sólo un 10 % de los
aspirantes superan una determinada prueba. Si la próxima convocatoria fuese firmada
por 500 aspirantes, ¿cuál es la probabilidad de que aprueben más de 80?
EP
52. Un examen tipo ”test ”tiene 100 preguntas y cada pregunta cuatro respuestas de las
UD
que sólo una es correcta.
a) Calcular la probabilidad de que un estudiante que responda al azar acierte más

de 20 preguntas.
A
b) Calcular la probabilidad de que de las 20 primeras preguntas acierte a los sumo 4.
IM
53. Al inyectar a una rata un determinado producto la probabilidad de que sobreviva es

-L
de 0.5. Si se inyecta a 100 ratas, calcula la probabilidad de que sobrevivan entre 40 y

S
PU
60 ratas, ambos extremos incluidos.

M
54. La cantidad de almendra que contiene una nueva barra de helado se distribuye
CA
normalmente con una media de 60 gr. y varianza de 4 gr2 . Se pide:
a) Las barras de helados se ponen a la venta cuando su cantidad de almendra está

dentro de ±4 gr. de la cantidad media ¿Qué porcentaje de ellas se ponen a la
venta?
b) Obtener la cantidad de almendra para la cual el 33 % de las barras tienen una
cantidad inferior a dicho valor.
c) Si las barras de helado se meten en cajas de 150 unidades, ¿Cuál es la probabilidad
de que una caja contenga por lo menos 140 y como máximo 148 barras aptas para
E
AD
la venta?
55. El contenido de calcio de la leche de un tetrabrik escogido al azar entre la producción

de una empresa láctea, sigue una distribución normal con una media de 1200 mg.
y desviación estándar igual a 50 mg. Se considera que el tetrabrik cumple con las
especificaciones del producto si su contenido en calcio está comprendido entre 1075 mg.
y 1325 mg.
a) Calcular el porcentaje de tetrabriks en la producción que no cumplen con las

-I I
especificaciones.
22
b) Un supermercado compró 2000 tetrabriks a la empresa, ¿Cuál es la probabilidad

20
de que haya más de 30 tetrabriks que no cumplen con las especificaciones?
56. Aproximando con una distribución normal, calcular la probabilidad de que al lanzar
una moneda 100 veces, el número de caras obtenido esté comprendido entre 45 y 55.
57. En una urna hay 3 bolas rojas, 2 blancas y 5 verdes. Sacamos una bola, anotamos
su color y la devolvemos a la urna. Si repetimos la experiencia 50 veces, ¿cuál es la
probabilidad de sacar roja en más de 20 ocasiones?
58. Lanzamos un dado 300 veces. ¿Cuál es la probabilidad de que obtengamos más de 70
“unos”?
59. El 7 % de los pantalones de una determinada marca salen con algún defecto. Se
empaquetan en cajas de 80 para distribuirlos por diferentes tiendas ¿cuál es la
probabilidad de que en una caja hay más de 10 pantalones defectuosos?
EP
UD
60. El 60 % de una población de 20000 habitantes tiene los ojos oscuros. Si elegimos al
azar 50 personas de esa población, ¿Cuál es la probabilidad de que haya menos de 30
personas con los ojos oscuros?
61. La empresa Amazing Marketing, una compañı́a de ventas por teléfono, considera la
A
IM
posibilidad de adquirir una máquina que selecciona al azar y marca automáticamente

-L
los números telefónicos. Esa compañı́a realiza la mayorı́a de sus llamadas durante la
S
noche, por lo que se desperdician las que se hacen a establecimientos comerciales. El

PU
fabricante de la máquina asegura que está programada de manera que la probabilidad

M
de llamadas a establecimientos comerciales, es del 16 %. Como prueba, se examinó una

CA
muestra de 150 números que la máquina seleccionó. Si lo que asegura el fabricante es

cierto,
a) ¿Cuál es la probabilidad de que más de 30 de los números telefónicos seleccionados

sean de un establecimiento comercial?
b) ¿Cuál es la probabilidad de que entre 22 y 29 de los números telefónicos
seleccionados sean de un establecimiento comercial?
c) ¿Cuál es la probabilidad de que 28 o menos de los números telefónicos seleccionados
sean de un establecimiento comercial?
E
AD
62. El volumen que una máquina de llenado automático deposita en latas de una bebida
gaseosa tiene una distribución normal con media 340 ml y una desviación tı́pica 15 ml.
a) Si se desechan aquellas latas que tienen menos de 330 ml ¿cuál es la proporción

de latas desechadas?
b) Hallar el volumen medio al que la máquina de llenado debe ser ajustada para que
únicamente el 1 % de las latas tengan menos de 330 ml?
c) Si tomamos 10 latas llenadas con la máquina tal y como figura originalmente,
-I I
¿cuál es la probabilidad de que ninguna sea desechada?

22
d) Si ahora tomamos 500 latas llenadas con la máquina tal y como figura
20
originalmente, ¿cuál es la probabilidad de que al menos 100 sean desechadas?
63. Se sabe que el tiempo que tarda un jefe de personal en entrevistar a un aspirante
para una vacante en su compañı́a sigue una distribución normal. Si el 10 % de los
entrevistados tardan más de 60 minutos y el 4 % duran menos de 35 minutos, hallar

la media y la desviación estándar de la distribución del tiempo que tarda un jefe de
personal en entrevistar a un aspirante.
64. El puntaje medio de las pruebas de acceso correspondientes a los estudiantes que
querı́an ingresar a una universidad en una facultad de economı́a, en una universidad
extranjera, era de 5.8 y la desviación estándar de 1.75. Fueron admitidos los estudiantes
que tuvieron un puntaje superior a 6.
a) ¿Cuál fue el porcentaje de admitidos si la distribución de los puntajes es normal?

EP
b) ¿Cuál es la probabilidad de que 4 de 10 estudiantes sean admitidos?

UD
65. Suponga que las calificaciones de un examen siguen una distribución normal con media
de 72.8 y la desviación estándar de 8.3. El profesor registra en su lista solo números
enteros del 0 al 100, pero reporta las calificaciones a dirección de estudios con letras:
A
4 % de las calificaciones más altas tiene A, 16 % siguiente tiene B, 40 % siguiente tiene
IM
C y el resto tiene NA (no acreditado). ¿Cuáles han de ser las puntuaciones que marcan
-L
el paso de un grupo al otro?

S
PU
66. Un grupo grande de alumnos hace un examen de Economı́a. Las notas se distribuyen
M
según una normal de media 70, además la probabilidad de que un alumno elegido al
CA
azar obtenga una nota menor que 85 es 0.9332. Se eligen cuatro estudiantes al azar;
¿cuál es la probabilidad de que al menos uno de ellos obtenga más de 80 puntos en el
examen?
67. El promedio de tiempo en que un automóvil de una marca japonesa empieza a dar
problemas es 3.5 años con una desviación estándar de 0.5 años; un automóvil de
fabricación alemana tiene una media de 4 años con una desviación estándar de 0.4
años. En ambos casos el tiempo en que un automóvil empieza a dar problemas, sigue
una distribución normal. Si se elige al azar un automóvil de cada marca, ¿Cuál es la
E
probabilidad de que la marca japonesa dure más de 3 años y la marca alemana a lo

AD
más 4.2 años?
68. Una academia pre-universitaria de mucho prestigio cuenta con tres aulas A, B y C
con capacidades para 50, 70 y 80 alumnos, para administración de empresas. Como se
han presentado 500 alumnos, les han hecho rendir un examen de ingreso. Los puntajes
obtenidos por los 500 alumnos se distribuyen normalmente con media 151 y desviación
estándar 85. Si se desea seleccionar a los mejores en el aula A, B y C sucesivamente,
¿qué puntaje se debe establecer como mı́nimo para ingresar al aula A? ¿qué puntaje
-I I
mı́nimo se debe establecer para ingresar al aula B? y ¿qué puntaje como mı́nimo se
22
debe establecer para ingresar al aula C?

20
69. Cierta empresa tiene dos secciones de fabricación. Una de las secciones dispone de
maquinaria más antigua que la otra. En la sección en la que la maquinaria es más
antigua el número de piezas buenas que se fabrican es 7 veces mayor que el de las
piezas defectuosas. Calcule la probabilidad de que de las 400 piezas fabricadas en dicha
sección, más de 35 pero menos de 60 sean defectuosas.
70. El tiempo (en horas) que un estudiante necesita para aprender un tema de estadı́stica
es una variable aleatoria con distribución normal con media µ y desviación tı́pica σ. Si
el 83.147 % de los alumnos emplea más de tres horas y sólo el 2.275 % más de nueve.
¿Cuánto es el promedio y la desviación estándar del tiempo que necesitan los alumnos
para aprender dicho tema de estadı́stica?
71. Una empresa dedicada a la fabricación de abono ha adquirido una máquina de envasado.
EP
Según los datos que le suministra el fabricante de la envasadora, la cantidad de abono

UD
que proporciona por saco es una variable aleatoria normal con una media de 2000 gr.
y varianza de 2500gr2 . Sabiendo que un saco de abono se considera defectuoso si el
contenido de abono es inferior a 1900 gr:
A
a) Calcule la probabilidad de que un saco elegido al azar sea defectuoso.
IM
b) Si elegimos un saco al azar y resulta tener más de 2050 gr. de abono. ¿Cuál es la
-L
probabilidad de que tenga menos de 2110 gr. de abono?

S
PU
c) Si se toma al azar una muestra de 4 sacos, ¿cuál es la probabilidad de que al menos

dos sacos sean defectuosos?
M
CA
d) Si los sacos se almacenan en palés (plataforma de tablas para almacenar y

transportar mercancı́as) de 500 unidades, ¿Cuál es la probabilidad de que un
palé contenga, como mı́nimo, 18 sacos defectuosos?
72. La longitud de una cierta pieza se distribuye con función de densidad,

(
k(x − 1)(3 − x) si 1≤x≤3
f (x) =
0 en otros casos
Hallar:
E
AD
a) El valor de k para que f (x) sea realmente una función de densidad.

c) La media y la desviación estándar.
d) Si se consideran válidas las piezas cuya longitud esté comprendida entre 1.7 y 2.1
cm. Calcular la probabilidad de que una determinada pieza sea útil.
73. Dada la variable aleatoria continua, X, con función de densidad,

(
-I I
k(x2 + 2) si 0≤x≤4
f (x) =
22
0 en otros casos
20
Hallar:
a) El valor de k para que f (x) sea realmente una función de densidad.

c) La media , la varianza y la desviación estándar

d) P (2 ≤ x ≤ 3).
74. Una empresa de seguridad recoge diariamente la recaudación de unos grandes

almacenes. Estudios realizados en meses anteriores permiten plantear la siguiente
función densidad para la variable aleatoria recaudación diaria , medida en decenas
de miles de soles:  1

 (x − 5) si 5≤x<7

 8

 k si 7≤x<9
EP
f (x) = 1

 (11 − x) si 9 ≤ x < 11


 8

UD
0 en otros casos
a) Obtener el valor de k
b) Calcular la recaudación media y la desviación estándar de la recaudación.
A
IM
c) Obtener la función de distribución de la recaudación diaria.

-L
d) ¿Qué porcentaje de dı́as los ingresos son inferiores a 85000 soles?

S
e) Sabiendo que la recaudación diaria ha sido menor de 80000 soles ¿cuál es la

PU
probabilidad de que la recaudación sea mayor que 75000 soles?

M
f) Los grandes almacenes deciden no contratar los servicios de la empresa diariamente

CA
por representar un alto costo. Deciden llamarla sólo los dı́as en que la recaudación
sea superior a 85000 soles ¿Cuál es la probabilidad de que vaya 10 dı́as al mes,
teniendo en cuenta que los almacenes están abiertos 26 dı́as al mes?
75. Una academia dedicada a la preparación de candidatos para la realización de los

exámenes exigidos en la adjudicación de plazas de administrativo de una sucursal
bancaria sabe por su experiencia anterior que suelen desaprobar 30 de cada 50
presentados a dicha prueba. Si un profesor de la academia corrige los exámenes de
150 alumnos ¿cuál es la probabilidad de que desaprueben más de 100?
E
AD
76. La variable aleatoria X representa la demanda de gasolina (en miles de galones), por
dı́a, en una refinerı́a. La función densidad de probabilidad de X es:


 2cx si 0<x≤1
f (x) = c(3 − x) si 1<x≤3


0 en otros casos
a) Determine el valor de c para que sea una función de densidad.

-I I
b) Calcule la probabilidad de que la demanda de gasolina en un dı́a cualquiera esté

22
entre los 800 y 1400 galones.

20
c) Calcule la probabilidad de que la demanda de gasolina en un dı́a cualquiera supere

los 1800 galones.
d) Si en un determinado dı́a la demanda de gasolina es mayor a 1500 galones ¿Cuál
es la probabilidad de que en dicho dı́a, la demanda sea menor 2200 galones?
e) En una semana de trabajo (7 dı́as) ¿Cuál es la probabilidad de que haya algún

dı́a cuya demanda de gasolina supere los 1800 galones?
f) Calcule la demanda promedio de gasolina por dı́a en dicha refinerı́a.
77. Sea X una variable aleatoria con la siguiente función de densidad



 kx si 0≤x≤3
f (x) = k(6 − x) si 3<x≤6


0 en otros casos
EP
Hallar:
UD
a) El valor de k para que sea realmente una función de densidad.

c) La media y la varianza de x.
A
IM
d) P (2 ≤ x ≤ 5).
-L
78. Una máquina fabrica tornillos cuyas longitudes se distribuyen normalmente con media
S
PU
20 mm. y varianza 0.25 mm2. Un tornillo se considera defectuoso si su longitud difiere

de la media en más de 1 mm. Los tornillos se fabrican de forma independiente.
M
CA
a) ¿Cuál es la probabilidad de que un tornillo sea defectuoso?

b) Si los tornillos son envasados en cajas de 15 tornillos, ¿cuál es la probabilidad de
que una caja no tenga más de 2 tornillos defectuosos?
79. La duración (en años) de la baterı́a de cierto modelo de teléfono celular es una variable
aleatoria continua X con función de densidad
(
k(x2 − 4x + 4) si 2≤x≤4
f (x) =
0 en otros casos
E
AD
a) Calcule el valor de k para que f (x) sea realmente una función de densidad.
b) Calcule e interprete la duración media y la desviación tı́pica de la duración de las
baterı́as.
c) Halle F (x).
d) Calcula la probabilidad de que una baterı́a dure más de 2 años y medio.
e) ¿Cuál es la probabilidad de que una baterı́a cualquiera dure 2.35 años?
f) Si se elige una baterı́a al azar y resulta que su duración es mayor a 1 año ¿Cuál
-I I
es la probabilidad de que dure menos de 3 años?

22
g) Si estas baterı́as se embalan en cajas y cada caja contiene 15 baterı́as, ¿Cuál es

20
la probabilidad de que en una caja hayan alguna baterı́a que dure entre 3 y 3.5
años?
4
h) Si W = X + 1. Calcule E(W ) y σ 2 (W ).
5
80. Un estudio de la Dirección General de Transporte estima que el tiempo necesario (en
horas de práctica) para la obtención de la licencia de conducir sigue una distribución
normal con media de 24 y varianza de 9.
a) ¿Cuál es la probabilidad de obtener la licencia de conducir en menos de 20 horas?

b) ¿Cuántas horas de práctica ha necesitado un conductor para obtener la licencia
de conducir, si el 67 % de los conductores ha necesitado más horas de prácticas
que él?
c) Si se elige un conductor aleatoriamente y resulta que ha necesitado más de 22
EP
horas para obtener la licencia de conducir ¿Cuál es la probabilidad de que haya

UD
necesitado menos de 25 horas?

d) Si se elige un conductor aleatoriamente y resulta que ha necesitado más de 22
horas para obtener la licencia de conducir ¿Cuál es la probabilidad de que haya
necesitado más de 26 horas?
A
IM
e) Si se eligen a 5 conductores al azar, ¿Cuál es la probabilidad de que al menos 2 de

-L
ellos hayan necesitado entre 23 y 26 horas para obtener la licencia de conducir?

S
PU
81. El departamento de marketing de una marca de automóviles considera que el tiempo

(en años) que transcurre para que un cliente renueve su automóvil es una variable
M
aleatoria X cuya función de densidad es:

CA

2

 kx si 0≤x≤6
f (x) = 9k(10 − x) si 6 < x ≤ 10


0 en otros casos
a) Determine el valor de k para que f (x) sea una función de densidad.

b) Calcule la probabilidad de que un cliente tarde más de 3 años en renovar su
vehı́culo.
E
c) Calcule la probabilidad de que un cliente tarde más de 7 años en renovar su

AD
vehı́culo.
d) Calcule la probabilidad de que un cliente tarde entre 3 y 5 años en renovar su
vehı́culo.
e) Si un cliente elegido al azar ha tardado más de 4 años en renovar su vehı́culo,¿Cuál
es la probabilidad de que tarde más de 5.5 años en renovarlo?
f) Si se eligen al azar a 5 nuevos clientes ¿Cuál es la probabilidad de que por lo menos
2 de ellos tarden más de siete años en renovar su vehı́culo?
-I I
g) Calcule el tiempo promedio de renovación de un vehı́culo de dicha marca.

22
h) Calcule la probabilidad de que un cliente tarde entre 4 y 8 años en renovar su

20
vehı́culo.
82. Un saco que contiene 400 monedas honestas es vaciado sobre una mesa. Hallar:
a) La probabilidad de que aparezcan más de 210 caras.

b) La probabilidad de que aparezcan menos de 180 caras.

c) La probabilidad de que aparezcan entre 195 y 211 caras, inclusive.
d) Si aparecen más de 208 caras ?Cuál es la probabilidad de que aparezcan menos
de 212 caras?
83. En una industria, la venta mensual de cierto producto, en miles de Kg, es una variable
aleatoria X cuya función de densidad es:
 x

 k si 0≤x<2

 7
EP
f (x) = (4 − x)
 k si 2≤x≤4

UD
 7
a) Determine el valor de k para que f (x) sea una función de densidad. Grafique f (x).
A
b) Calcule la probabilidad de que la venta de ese producto, en un mes cualquiera,
IM
esté entre 1600 y 2250 Kg.

-L
c) Calcule la probabilidad de que la venta de ese producto, en un mes cualquiera,

S
sea mayor a 1900 Kg.

PU
d) Calcule la probabilidad de que la venta de ese producto, en un mes cualquiera,

M
sea menor a 1125 Kg.

CA
e) Si elegimos un mes al azar y resulta que las ventas en ese mes no fueron mayores
a 3110 Kg. ¿Cuál es la probabilidad de que se haya vendido al menos 1750 Kg?
f) Calcule e interprete la venta mensual promedio y la desviación estándar de las
ventas de dicho producto.
g) ¿Cuál es la probabilidad de que, en un mes seleccionado al azar, se haya vendido
1860 kg de dicho producto?
h) Si se eligen al azar 6 meses de ventas ¿Cuál es la probabilidad de que por lo menos
E
en 3 de ellos las ventas estén entre 1600 y 2250 Kg?

AD
84. El volumen de bebida energizante, que una máquina de llenado automático deposita en
latas de una conocida marca tiene una distribución normal con media de 340 ml. y una
desviación tı́pica de 15 ml. El llenado de una lata cualquiera se considera “incorrecto”
si la cantidad de bebida energizante vertida es inferior a 310 ml:
a) Calcule la probabilidad de que una lata elegida al azar haya sido llenada
incorrectamente.
b) Si elegimos una lata al azar y resulta tener más de 330ml. de bebida energizante
-I I
¿Cuál es la probabilidad de que tenga más de 345 ml?

22
20
c) Si tomamos 5 latas llenadas con dicha máquina ¿cuál es la probabilidad de que

alguna haya sido llenada incorrectamente?
d) Si ahora tomamos 400 latas llenadas con dicha máquina ¿cuál es la probabilidad
de que más de 15 hayan sido llenadas incorrectamente?
85. Suponga que tiene un dado cargado en el cual se cumple que la probabilidad de obtener
“5” es el doble de la probabilidad de obtener cualquiera de los restantes valores. Si se
lanza dicho dado 35 veces. ¿Cuál es la probabilidad de obtener “5” más de 20 veces?
86. El peso de ciertos paquetes es una variable aleatoria que sigue distribución normal tal
que el 15 % pesa más de 50 kg. y el 2,5 % pesa menos de 44 kg.
a) ¿Cuál es el peso promedio y la desviación estándar de los pesos de dichos paquetes?

b) Para transportar los paquetes se cobran 3 tarifas: $10 por los que pesan más de
52 kg., $8 por los que pesan entre 46 y 52 kg. y $5 por los que pesan menos de 46
EP
Kg. Halle el precio esperado de transporte por paquete.

UD
87. El kilometraje (en miles de kilómetros) que los automovilistas logran de cierto tipo de
neumáticos, es una variable aleatoria con función densidad:

A
 1 e− 2k
x
si x>0
IM
f (x) = 20
S -L
a) Determine el valor de k para que f (x) sea una función de densidad.

PU
b) Calcular la probabilidad de que un neumático cualquiera dure a lo sumo 10000

M
Km.
CA
c) Calcular la probabilidad de que un neumático cualquiera dure entre 16000 y

20000km.
d) Calcular la probabilidad de que un neumático cualquiera dure al menos 30000 Km.
e) Determinar la función de distribución: F(x).
88. Un grupo grande de alumnos rinde un examen (sobre 100 puntos) de Finanzas. Los
puntajes obtenidos siguen una distribución normal y además se sabe que la probabilidad
de que un alumno elegido al azar obtenga un puntaje que supere los 65 puntos es 0.69847
E
y que la probabilidad de que un alumno elegido al azar obtenga un puntaje menor a

AD
85 puntos es 0.89251. Si se eligen cuatro estudiantes al azar ¿cuál es la probabilidad de

que al menos dos de ellos obtengan entre 75 y 80 puntos en el examen?
89. El tiempo de operatividad (en dı́as) de un determinado tipo de explosivos tiene la

siguiente función de densidad:
( x
3ke− 7 si x>0
f (x) =
0 en otros casos
-I I
a) Determine el valor de k para que f(x) sea una función de densidad.

22
20
b) Determinar la función de distribución: F(x).

c) Calcular la probabilidad de que un explosivo deje de ser operativo antes de una
semana.
d) La empresa encargada de fabricar dichos explosivos tiene una producción mensual

de 1000 unidades, proporcionando un 5 % de explosivos defectuosos.
d.1) ¿Cuál es el número medio de explosivos defectuosos fabricados en un mes?
d.2) Determinar la probabilidad de que en un mes se fabriquen más de 30 unidades
defectuosas.
90. Alberto y Beatriz realizan un juego bajo las siguientes condiciones: se lanza un dado,
si sale un número menor que 3, Alberto paga a Beatriz 6 dólares y si sale un número
mayor o igual que 3 Beatriz paga a Alberto 21 dólares. Se pide:
EP
a) Si juegan 300 partidas, hallar la probabilidad de que Alberto gane entre 190 y 212
UD
partidas, inclusive.
b) ¿Cuál es el beneficio esperado para Alberto en 300 partidas?¿y para Beatriz?
91. En una asignatura del colegio, la probabilidad de que saquen a un alumno a la pizarra
A
IM
en cada clase es del 12 %. A lo largo del año se tienen 125 clases de esa asignatura.
¿Cuál es la probabilidad de tener que salir a la pizarra más de 18 veces?
S -L
92. LUZBLANCA es una compañı́a de suministro de electricidad y ha deteminado que el

PU
consumo mensual (medido en Kw/h) de una vivienda familiar, sigue una distribución
M
normal con media igual 300 Kw/h y desviación estándar igual a 50 Kw/h.
CA
a) ¿Cuál es la probabilidad de que en un mes, se consuman entre 270 y 330 kw/h?

b) ¿Cuál es la probabilidad de que una familia consuma 280 kw/h en un mes?
93. Se sabe que el peso de los recién nacidos en un determinado poblado sigue una
distribución normal con media igual a 3600 gramos y varianza igual a 78400.
a) Calcule la probabilidad de que un recién nacido pese entre 3700 y 3800 gramos.
b) ¿Cuál es la probabilidad de que un recién nacido pese 3500 gramos?
E
c) Si se elige un recién nacido al azar y resulta que pesa más de 3450 gramos ¿Cuál
AD
es la probabilidad de que pese más de 3650 gramos?

d) Si se elige a 8 recién nacidos, ¿Cuál es la probabilidad de que hayan al menos 2
que pesen entre 3500 y 3750 gramos?
94. Un inversionista debe decidir entre dos alternativas: una acción o un tı́tulo de renta
fija. Una vez fijado un horizonte de tiempo, la tasa de retorno de la acción puede ser
modelada como una variable aleatoria con distribución normal de promedio 20 % y
desviación estándar 2 %. Sabiendo que la probabilidad de que el retorno de la acción
-I I
exceda al del tı́tulo es 0.63, determine la tasa de retorno del tı́tulo.

22
95. Suponga que un inversionista está considerando dos alternativas para invertir su capital.
20
En la alternativa A invertirı́a en una acción cuya tasa de retorno es una variable

aleatoria con distribución normal de promedio 15 % y desviación estándar 2 %. En
la alternativa B él apostarı́a en un juego donde la tasa de retorno es igual al 16 % con
probabilidad 0.6 e igual al 13 % con probabilidad 0.4.
a) ¿En cuál de las dos alternativas serı́a mayor el retorno esperado?

b) ¿En cuál de las dos alternativas serı́a mayor la varianza del retorno?
c) Imagine una alternativa C para ese inversionista donde él apostarı́a en otro juego
con tasa de retorno igual a m % con probabilidad 0.5 e igual a n % con probabilidad
0.5. Obtenga los valores de m y n para que el valor esperado y la varianza del
retorno en la alternativa C sean respectivamente iguales al valor esperado y a la
varianza del retorno en la alternativa A.
96. El consumo familiar de cierto artı́culo se distribuye uniformemente con media 10 y

EP
varianza igual a uno. Determinar la probabilidad de que el consumo de dicho artı́culo

UD
se encuentre comprendido entre 8 y 12 unidades.
97. La cantidad de café diaria, en litros, que sirve una máquina que se localiza en el vestı́bulo
de un aeropuerto es una variable aleatoria X con distribución uniforme continua en el
A
intervalo [7, 10] . Encuentre la probabilidad de que en un dı́a dado la cantidad de café
IM
que sirve esta máquina sea

S -L
a) más de 7.4 litros, pero menos de 9.5 litros.

PU
b) a lo sumo 8.8 litros.

M
c) Hallar E(X) y V ar(X).

CA
98. Suponga que la duración de la baterı́a del Mini iPad se distribuye uniformemente con
un valor esperado de 13.25 horas y una varianza igual a 3. ¿Cuál es la probabilidad de
que la duración de la baterı́a de un minipad esté entre 9.5 y 11.4 horas?
99. Según informaciones de la Empresa Municipal Administradora de Peaje (Emape), todos

los usuarios cuentan con el servicio gratuito de auxilio vial, el cual corre por cuenta
de las concesionarias Rutas de Lima y Vı́a Parque Rı́mac. La Central de Atención de
Emergencias de Rutas de Lima ha comprobado que en las mañanas de los fines de
E
semana el número de llamadas que recibe, en promedio, es de 3 llamadas cada hora.

AD
Un operario comienza su jornada de sábado a las 8 de la mañana. Suponiendo que las

llamadas se realizan de forma independiente y con tasa constante:
a) ¿ Cuál es la probabilidad de que reciba la primera llamada antes de las 8:15 am?
b) ¿ Cuál es la probabilidad de que reciba 4 llamadas en las dos primeras horas de
su jornada de trabajo?
c) Si lleva 10 minutos sin recibir ninguna llamada, ¿cuál es la probabilidad de que
reciba una nueva llamada en menos de 15 minutos?
-I I
22
100. El precio (en nuevos soles) de un determinado artı́culo sigue distribución normal con
20
media µ y desviación tı́pica σ. Se sabe que la probabilidad de que el precio del artı́culo
sea menor que 1000 soles es 0.975 y que la probabilidad de que el precio del artı́culo sea
mayor que 910 es 0.7823. Si Usted tuviera 930 nuevos soles, ¿Cuál es la probabilidad
de que no pueda comprar dicho artı́culo?
101. Las ventas diarias (X) en nuevos soles de una pequeña empresa tienen la siguiente fun-
ción de densidad:

 1

 si 300 ≤ x ≤ 600
300
f (x) =



0 en otros casos
a) ¿Cuál es la venta diaria esperada?

b) ¿Cuánto deben ser las ventas para que la probabilidad de vender por encima de
EP
dicha cantidad sea 0.95?

UD
c) ¿Cuál es la probabilidad de que en un dı́a se superen los 500 nuevos soles en

ventas?
d ) ¿Cuál es la probabilidad de que en un dı́a cualquiera las ventas sean 460 nuevos
A
soles?
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Capı́tulo 6
Distribuciones muestrales
EP
UD
6.1. Introducción
En el capı́tulo 1 destacamos dos conceptos importantes en un estudio estadı́stico: La
población y la muestra. La población es el conjunto de todos los elementos de interés en un
A
estudio y una muestra es un subconjunto de la población. También en ese capı́tulo definimos
IM
la inferencia estadı́stica o estadı́stica inferencial como la parte de la estadı́stica que usa

-L
información proveniente de una muestra para generalizar y obtener conclusiones o tomar

S
decisiones acerca de la población en estudio.

PU
En el capı́tulo 2, estudiamos la estadı́stica descriptiva que cuenta con herramientas

M
útiles en el análisis exploratorio de los datos provenientes de una muestra, como tablas o
CA
distribuciones de frecuencias, gráficos y medidas descriptivas o resúmenes numéricos para

extraer información de interés que luego será útil para la inferencia.
En el capı́tulo 3 estudiamos el concepto fundamental para la inferencia estadı́stica: la
probabilidad. En el capı́tulo 4 definimos las variables aleatorias discretas y sus distribuciones
de probabilidad ası́ como algunos modelos discretos frecuentes como el binomial y de Poisson.
En el capı́tulo 5 aprendimos sobre las variables continuas y las funciones de densidad, ası́ como
algunos modelos continuos comunes como el normal, exponencial y uniforme. El objetivo en
los capı́tulos 4 y 5 era comprender el comportamiento de las poblaciones (y sus parámetros)
que pueden ser de interés y sobre las cuales nos interesa sacar conclusiones o tomar una
E
AD
decisión.
Como en la práctica uno no analiza o trabaja con todos los elementos de la población de
interés sino con una parte, osea una muestra, es necesario entender que las medidas de una
muestra, es decir los estadı́sticos, especialmente la media muestral: x y la proporción muestral:
p, serán ahora las variables de interés y por tanto deberemos estudiar sus caracterı́sticas
y como se comportan o distribuyen. Por tanto en el capı́tulo 6 abordaremos un concepto
importante: las distribuciones muestrales, es decir, la distribución de los estadı́sticos de una
muestra, especı́ficamente la distribución de x y la distribución de p.
-I I
6.2. Distribuciones muestrales

22
En muchas aplicaciones estamos interesados en realizar inferencias estadı́sticas, esto es,

20
utilizar estadı́sticos calculados a partir de muestras para estimar los valores de los parámetros
de la población. En este capı́tulo aprenderemos sobre la media muestral, x, un estadı́stico
utilizado para estimar µ, la media poblacional (parámetro). También aprenderemos acerca de
245
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 246
la proporción muestral, p, un estadı́stico utilizado para estimar p, la proporción poblacional

(parámetro). El principal problema al realizar una inferencia estadı́stica radica en obtener
conclusiones sobre la población, no sobre la muestra. Por ejemplo, una persona que se encarga
de realizar encuestas polı́ticas se interesa en los resultados muestrales sólo como mecanismo
para estimar la proporción de votos real que recibirá cada uno de los candidatos en la
población de votantes. En este caso sólo le interesa utilizar la proporción muestral calculada
a partir de una muestra de votantes para estimar la proporción poblacional.
Hipotéticamente, al utilizar un estadı́stico muestral para estimar un parámetro
poblacional, se debe examinar toda posible muestra que pudiera presentarse. Una
EP
distribución muestral es la distribución de probabilidad de un estadı́stico de la muestra y

UD
es formada cuando muestras de tamaño n son repetidamente seleccionadas de una población.

Si el estadı́stico de interés es la media muestral x, entonces se genera la distribución muestral
de las medias de las muestras o distribución de x. Si el estadı́stico de interés es la proporción
muestral p, entonces se genera la distribución muestral de las proporciones de las muestras o
A
IM
distribución de p.
-L
6.3. Distribución muestral de x

S
Uno de los procedimientos estadı́sticos más comunes es usar la media de la muestra, x,

PU
para hacer inferencias acerca de la media de la población, µ. Este proceso se muestra en

M
la figura 6.1. Esto nos debe llevar a entender la generación de la Distribución muestral de
CA
x. Ası́, en cada repetición del proceso podemos anticipar la obtención de un valor distinto
de la media de la muestra x, la cual se convierte en la variable de interés. Por lo tanto, La
distribución de probabilidad de todos los valores posibles de la media de la muestra x se le
conoce como distribución muestral de la media de la muestra o distribución muestral de x.
Seleccionar
una muestra
Población con media µ =?
de tamaño n
de la población
E
AD
Calcular la media
Se emplea el valor
en la muestra
de x para hacer
seleccionada y
inferencias acerca
obtenemos un
del valor de µ
valor para x
Figura 6.1: Proceso para realizar inferencias acerca de la media de la población, µ, a partir de la
-I I
media de una muestra, x, tomada de dicha población de estudio.

22
20
6.3.1. Caracterı́sticas de la distribución de x

El objetivo es describir las propiedades de la distribución muestral de x, incluyendo el
valor esperado o media de x, su desviación estándar y la forma de su distribución.
Como veremos, el conocimiento de la distribución muestral de x nos permitirá hacer
afirmaciones probabilı́sticas acerca del error incurrido cuando se usa x para estimar µ.
Comencemos considerando la media de todos los valores posibles de x, es decir, el valor
esperado de x.
Valor esperado de x (Propiedad de imparcialidad de la media muestral)
La media muestral es imparcial porque la media o promedio de todas las medias
muestrales posibles (de muestras con tamaño “n”) es igual a la media poblacional µ. Es
decir: E(x) = µ.
Esta propiedad se demuestra por medio de un sencillo ejemplo. Supogamos una población
de 4 valores: 1, 2, 3, 4. Si calculamos la media (µ) y la desviación estándar (σ) de esa población
EP
de 4 elementos tenemos que:

UD
1+2+3+4 (1 − 2.5)2 + (2 − 2.5)2 + (3 − 2.5)2 + (4 − 2.5)2 5

µ= = 2.5 y σ 2 = = = 1.25
4 4 4
√
y por lo tanto, σ = 1.25 ≈ 1.12.
A
IM
Consideremos ahora que tomamos muestras de tamaño igual a 2 de la población. Con sólo
4 valores en la población, hay únicamente 16 posibles muestras de tamaño igual a 2 (Recuerde
-L
la regla de conteo 1, vista en el capı́tulo 3: k 2 = 42 = 16) suponiendo que el muestreo se

S
PU
realiza con reemplazo, es decir, se reemplaza cada valor seleccionado antes de realizar una
nueva elección. La Tabla 6.1 presenta las 16 muestras posibles con sus respectivos promedios.
M
CA
Muestra Elementos de la muestra Media de la muestra

1 1,1 x1 =1
2 1,2 x2 =1.5
3 1,3 x3 =2
4 1,4 x4 =2.5
5 2,1 x5 =1.5
6 2,2 x6 =2
E
7 2,3 x7 =2.5
AD
8 2,4 x8 =3
9 3,1 x9 =2
10 3,2 x10 =2.5
11 3,3 x11 =3
12 3,4 x12 =3.5
13 4,1 x13 =2.5
-I I
14 4,2 x14 =3
22
15 4,3 x15 =3.5

20
16 4,4 x16 =4
Tabla 6.1: Las 16 muestras posibles de tamaño igual a 2 tomadas de la población de 4 valores.
Las 16 medias obtenidas forman la distribución de las medias de las muestras de tamaño
igual a 2 tomadas de la población de 4 valores. Si calcula el promedio de las medias de
las 16 muestras, la media de estos valores, µx = E(x), es igual a 2.5, que es también la
media poblacional µ. Puesto que la media de las 16 medias muestrales es igual a la media
poblacional, decimos que la media muestral es un estimador imparcial de la media poblacional.
Por lo tanto, aunque no sepa qué tan cercana está la media muestral de cualquier muestra
seleccionada a la media poblacional, al menos estará seguro de que la media de todas las
medias muestrales posibles que se pueden seleccionar es igual a la media poblacional.
En la Figura 6.2 aparece la distribución de probabilidad de las medias de las muestras de
EP
tamaño igual a 2 tomadas de la población de 4 valores.

UD
A
IM
S -L
PU
M
CA
E
AD
Figura 6.2: Distribución de probabilidad de las medias muestrales del ejemplo dado.
Desviación estándar de x (o Error estándar de la media)

-I I
Ahora nos referiremos a la desviación estándar de los valores de x, es decir, la desviación

22
estándar de la distribución de x. Dicha medida de dispersión la simbolizaremos ası́: σx .

20
Se puede demostrar que, con muestreo aleatorio simple, la expresión para la desviación
estándar de x dependerá de si la población es finita o infinita. Según sea el caso, la desviación
estándar de x tendrá las siguientes expresiones:
Si la población es finita: r
N −n σ
σx = .√ (6.1)
N −1 n
Si la población es infinita:
σ
σx = √ (6.2)
n
donde:
σ= Desviación estándar de la población.
n= Tamaño de la muestra.
EP
N = Tamaño de la población. r
N −n
UD
Al observar las expresiones (6.1) y (6.2), la diferencia está en el factor , el cual

N −1
es llamado factor de corrección para población finita. En muchos casos prácticos de muestreo
se ve que la población que se maneja aunque finita, es bastante “grande” comparado r con el
N −n
tamaño de la muestra, el cual es relativamente “pequeño”. En esos casos el factor
A
N −1
IM
es cercano a l. En consecuencia, la diferencia entre los valores de la desviación estándar de

x para los casos de población finita e infinita se hace despreciable. Cuando esto sucede, la
S -L
expresión (6.2) se vuelve una aproximación muy buena para la desviación estándar de x
PU
aunque la población sea finita.

M
Entonces, cuando se desee calcular la desviación estándar de x se empleará la expresión

CA
(6.2) siempre y cuando la población sea infinita o la población sea finita y el tamaño de la
n
muestra sea como máximo el 5 % del tamaño de la población, esto es ≤ 0.05. En caso
N
n
que > 0.05 deberá tomarse en cuenta el factor de corrección para población finita para
N
calcular σx .
Un detalle importante al analizar la expresión (6.2) es que cuando el tamaño de la
muestra aumenta, la medida de dispersión σx disminuye. Es decir, a medida que el número
de observaciones obtenidas aumenta, el promedio de los valores observados estará más cerca
de µ.
Posteriormente veremos que el valor de σx es útil para determinar lo alejado que pueda
E
AD
estar la media de la muestra de la media de la población. Debido al papel que desempeña

σx en el cálculo de los errores posibles es que se le conoce como error estándar de la media.
De manera general el término error estándar hace referencia a la desviación estándar de un
estimador puntual.
Forma de la distribución de x
La última caracterı́stica que nos hace falta para tener definida completamente la
distribución de x es lo que respecta a la forma de la misma. La forma de la distribución
de x depende de la distribución de la población. Tomaremos en cuenta dos situaciones:
-I I
22
1. Si la población tiene distribución normal, entonces la distribución de x será igualmente

20
normal, para cualquier tamaño de muestra.
2. Si la población no tiene distribución normal o la distribución es desconocida, entonces

debemos basarnos en una herramienta estadı́stica muy importante llamada: Teorema
del Lı́mite Central (TLC) para identificar la forma que tiene la distribución de x. Uno
de los enunciados del TLC aplicado a la distribución muestral de x es el siguiente:
Teorema del lı́mite central:Al seleccionar muestras aleatorias simples de tamaño
“n” de una población, la distribución muestral de la media x se puede aproximar con
una distribución normal, cuando el tamaño de la muestra es grande. Esta aproximación
mejora con muestras más grandes. Una muestra es grande en la práctica si el tamaño
de la misma es como mı́nimo de 30 elementos (n ≥ 30).
La figura 6.3 muestra cómo se aplica el teorema del lı́mite central para poblaciones con
EP
distintas distribuciones a la normal. Se observa la forma que va adoptando la distribución

UD
muestral de x cuando aumenta el tamaño de la muestra. Cuando las muestras son de tamaño
dos, vemos que la distribución muestral de x comienza a tener una apariencia distinta de la
distribución de la población. Para muestras de tamaño 6 vemos que las distribución muestral
de x comienzan a tener una apariencia acampanada. Finalmente, las muestras de tamaño 30
A
hacen que las distribuciones muestrales de x sean aproximadamente normales. Ası́ es que se
IM
concluye que para muestras suficientemente grandes (n ≥ 30), la distribución muestral de x

-L
se puede aproximar con una distribución normal.

S
PU
M
CA
E
AD
-I I
22
20
Figura 6.3: Aplicación del Teorema del lı́mite Central para diferentes poblaciones.(Lind et al., 2012)
6.3.2. Uso de la Distribución muestral de x en el cálculo de probabilidades

Como se comentó en 6.1, los estadı́sticos, en este caso la media muestral: x (y la proporción
muestral: p de la cual hablaremos más adelante), es ahora la variable de interés. Por lo tanto,
cuando se trabaja con la distribución muestral de x la expresión que se emplea para calcular
la variable normal estándar Z, es la siguiente:
x − µx x − µ
z= = σ (6.3)
σx √
EP
n
UD
Nota: Observe que para σx se está considerando la expresión (6.2), es decir, el caso de
población infinita. Si estuviera en el caso de población finita deberá usar para σx la expresión
(6.1).
A continuación presentamos algunos problemas resueltos para familiarizarse con el uso
A
IM
de la distribución muestral de x en el cálculo de probabilidades.

-L
S
PU
1. Se sabe que los pesos de una población de novillos de 18 meses de edad tienen una
M
distribución aproximadamente normal, con una media de 178 Kg y con desviación

CA
estándar de 6 kg. Si se toma una muestra de 9 novillos:
a) ¿Cuál es la probabilidad de que el peso promedio de la muestra sea mayor a 181

kg?
Sea la variable aleatoria: X=“peso del novillo (Kg)”. Según el enunciado X tiene
media µ = 178 kg, desviación estándar σ = 6 kg y sigue distribución normal, por
tanto, X ∼ N (178, 62 ). Esta variable hace referencia a la población de novillos.
Ahora si se toma una muestra de 9 novillos y la pregunta de este apartado hace
referencia a la probabilidad de que el peso promedio de la muestra asuma valores
E
superiores a 181 kg entonces estamos ante la variable de interés:

AD
X=“peso promedio en una muestra de 9 novillos (Kg)”.

Como se explica en la sección 6.3.1, las caracterı́sticas de la distribución de X
serán:
E(X) = µ, es decir, E(X) = µ = 178 kg.
Como no tenemos información sobre el tamaño de la población, consideramos
que es infinita, por tanto para la desviación estándar de x se empleará la
σ 6
expresión (6.2), es decir: σx = √ = √ = 2 kg.
n 9
-I I
Como la variable poblacional X=“peso del novillo (Kg)” tiene distribución

22
normal entonces la distribución de X tendrá igualmente distribución normal

20
(Como se explica en la sección 6.3.1 referente a la Forma de la distribución

de x).

Entonces concluimos que: X ∼ N 178, 22 . Sobre esta variable de interés

deseamos calcular, P X > 181 , entonces:

181 − 178
P X > 181 = P Z > = P (Z > 1.5) = 0.5 − 0.43319 = 0.06681.
2

Por tanto P X > 181 es igual a P (Z > 1.5) (Figura 6.4).
EP
UD
A
IM
178 181 X
S -L
PU
M
CA
0 1.5 Z

Figura 6.4: Ilustración del cálculo de P X > 181 para X ∼ N 178, 22 .
E
AD
b) ¿Cuál es la probabilidad de que el peso promedio de la muestra esté entre 175 kg

y 181 kg?

Deseamos calcular, P 175 < X < 181 , entonces:

175 − 178 X − 178 181 − 178
P 175 < X < 181 = P < <
2 2 2
= P (−1.5 < Z < 1.5)
-I I
= 0.43319 + 0.43319 = 0.86638 o 86.64 %.

22

20
Por tanto P 175 < X < 181 es igual a P (−1.5 < Z < 1.5) (Figura 6.5).
EP
175 178 181 X

UD
A
IM
S -L
PU
M
CA
−1.5 0 1.5 Z

Figura 6.5: Ilustración del cálculo de P 175 < X < 181 para X ∼ N 178, 22 .
c) y resulta que el peso promedio de la muestra es mayor que 179 kg.¿Cuál es la

probabilidad de que el peso promedio de la muestra sea mayor que 181 kg?

E
P X > 181 y X > 179 P X > 181

AD
P X > 181 | X > 179 = = =

P X > 179 P X > 179

181 − 178
P Z>
2 P (Z > 1.5)
= = =
179 − 178 P (Z > 0.5)
P Z>
2
0.5 − 0.43319
= = 0.2165 o 21.65 %
0.5 − 0.19146
d ) y resulta que el peso promedio de la muestra es menor que 179 kg.¿Cuál es la

-I I
probabilidad de que el peso promedio de la muestra sea mayor que 177 kg?
22
20

P X > 177 y X < 179 P 177 < X < 179
P X > 177 | X < 179 = = =
P X < 179 P X < 179

177 − 178 179 − 178
P <Z<
2 2 P (−0.5 < Z < 0.5)
= = =
179 − 178 P (Z < 0.5)
P Z<
2
0.19146 + 0.19146
= = 0.5538 o 55.38 %
0.5 + 0.19146
EP
2. La compañı́a de baterı́as RINDEMAX afirma que sus baterı́as tienen una vida media de
UD
60 meses y una desviación estándar de 9 meses. Si se toma una muestra de 36 baterı́as:
a) Calcule el error estándar de la media.

A
Sea la variable aleatoria: X=“Tiempo de vida de una baterı́a (meses)”. Según
IM
el enunciado X tiene media µ=60 meses, desviación estándar σ=9 meses, y no

-L
proporciona información alguna sobre su distribución, por lo que consideramos es

S
desconocida. Esta variable hace referencia a la población de baterı́as producidas

PU
por RINDEMAX.
M
Ahora si se toma una muestra de 36 baterı́as y las preguntas se centran en el

CA
tiempo de vida media de la muestra, entonces estamos ante la variable de interés:

X=“Tiempo de vida media en una muestra de 36 baterı́as (meses)”.
Como se comenta en la sección 6.3.1, el error estándar de la media no es
otra cosa más que la desviación estándar de x, es decir, σx . Como no tenemos
información sobre el tamaño de la población, consideramos que es infinita, por
tanto para la desviación estándar de x se empleará la expresión (6.2), es decir:
σ 9
σx = √ = √ = 1.5 meses.
n 36
b) ¿Cuál es la probabilidad de que la vida media de la muestra sea menor que 58
E
meses?
AD
Como se ha definido en el apartado anterior, la variable de interés es, X=“Tiempo

de vida media en una muestra de 36 baterı́as (meses)”. Como se explica en la
sección 6.3.1, las caracterı́sticas de la distribución de X serán:
E(X) = µ, es decir, E(X) = µ = 60 meses.
σ 9
Del apartado anterior sabemos que: σx = √ = √ = 1.5 meses.
n 36
Como en el problema no se menciona qué distribución tiene la variable
poblacional X=“Tiempo de vida de una baterı́a (meses)” y sabemos que la
-I I
muestra tomada es de 36 baterı́as (n ≥ 30), aplicando el Teorema del Lı́mite

22
Central podemos afirmar que la distribución de X se puede aproximar con una

20
distribución normal (Como se explica en la sección 6.3.1 referente a la Forma

de la distribución de x).

Entonces concluimos que: X ∼ N 60, 1.52 . Sobre esta variable de interés

deseamos calcular, P X < 58 , entonces:

58 − 60
P X < 58 = P Z< = P (Z < −1.33) = 0.5 − 0.40824 = 0.09176
1.5

Por tanto P X < 58 es igual a P (Z < −1.33) (Figura 6.6).
EP
UD
A
IM
58 60 X
S -L
PU
M
CA
−1.33 0 Z

Figura 6.6: Ilustración del cálculo de P X < 58 para X ∼ N 60, 1.52 .
E
AD
c) Determine la probabilidad de que la vida media de la muestra esté entre 57 y 63

meses.

Deseamos calcular, P 57 < X < 63 , entonces:

57 − 60 X − 60 63 − 60
P 57 < X < 63 = P < <
1.5 1.5 1.5
= P (−2 < Z < 2)
-I I
= 0.47725 + 0.47725 = 0.9545 o 95.45 %.

22

20
Por tanto P 57 < X < 63 es igual a P (−2 < Z < 2) (Figura 6.7).
EP
57 60 63 X
UD
A
IM
S -L
PU
M
CA
−2 0 2 Z

Figura 6.7: Ilustración del cálculo de P 57 < X < 63 para X ∼ N 60, 1.52 .
d ) y resulta que la vida media de la muestra es menor que 63 meses ¿Cuál es la

probabilidad de que la vida media de la muestra sea mayor que 60.5 meses?

E
P X > 60.5 y X < 63 P 60.5 < X < 63

AD
P X > 60.5 | X < 63 = = =

P X < 63 P X < 63

60.5 − 60 63 − 60
P <Z<
1.5 1.5 P (0.33 < Z < 2)
= = =
63 − 60 P (Z < 2)
P Z<
1.5
0.47725 − 0.12930
= = 0.3561 o 35.61 %
0.5 + 0.47725
-I I
6.4. Distribución muestral de p

22
Considere una variable categórica que cuente con dos clasificaciones: el cliente prefiere
20
su marca o el cliente no prefiere su marca. Lo que resulta de interés es la proporción de

elementos que forman parte de una de las categorı́as; por ejemplo, la proporción de clientes
que prefieren su marca.
La proporción de la población, que se representa por medio de p, es la razón entre el
número de elementos en la población que cuentan con la caracterı́stica de interés y el tamaño

de la población. La proporción muestral que se representa por medio de p, es la razón entre el
número de elementos en la muestra que cuentan con la carácterı́stica de interés y el tamaño
de la muestra.
La proporción muestral p es el estadı́stico que se utiliza para estimar la proporción
poblacional p (parámetro), es decir, en muchos situaciones en los negocios y la economı́a se usa
la proporción muestral p para hacer inferencias estadı́sticas sobre la proporción poblacional
p.
La proporción muestral p, al igual que la proporción poblacional p, asume valores que
EP
van de 0 a 1.
UD
La generación de la Distribución muestral de p es similar a la generación de la Distribución

muestral de x (ver Figura 6.1), pero entendiendo que ahora en cada repetición del proceso
podemos anticipar la obtención de un valor distinto de la proporción de la muestra p, la cual
se convierte en la variable de interés. Por lo tanto, La distribución de probabilidad de todos
A
IM
los valores posibles de la proporción de la muestra p se le conoce como distribución muestral

de la proporción de la muestra o distribución muestral de p.
S -L
6.4.1. Caracterı́sticas de la distribución de p

PU
El objetivo aquı́ es describir las propiedades de la distribución muestral de p, incluyendo

M
el valor esperado o media de p, su desviación estándar y la forma de su distribución.

CA
Como veremos, el conocimiento de la distribución muestral de p nos permitirá hacer

afirmaciones probabilı́sticas acerca del error incurrido cuando se usa p para estimar p.
Comencemos considerando el valor esperado de p.
Valor esperado de p
El valor esperado de p, es la media de todos los valores posibles de p, y se puede expresar
como sigue:
E(p) = p,
esta expresión indica que la media de todos los valores posibles de p es igual a la proporción
E
de la población, p.
AD
Desviación estándar de p (o Error estándar de la proporción)

Ahora nos referiremos a la desviación estándar de los valores de p, es decir, la desviación
estándar de la distribución de p. Dicha medida de dispersión la simbolizaremos ası́: σp .
La expresión para la desviación estándar de p, al igual que la desviación estándar de x,
dependerá de si la población es finita o infinita. Según sea el caso, la desviación estándar de
p tendrá las siguientes expresiones:
Si la población es finita:
-I I
r r
N −n p(1 − p)
22
σp = . (6.4)
N −1 n
20
Si la población es infinita: r
p(1 − p)
σp = (6.5)
n
donde:
p= proporción poblacional.
n= Tamaño de la muestra.
N = Tamaño de la población. r
N −n
Al observar las expresiones (6.4) y (6.5), la diferencia está en el factor , el cual
N −1
es llamado factor de corrección para población finita. En muchos casos prácticos de muestreo
se ve que la población que se maneja aunque finita, es bastante “grande” comparado r con el
N −n
tamaño de la muestra, el cual es relativamente “pequeño”. En esos casos el factor
N −1
es cercano a l. En consecuencia, la diferencia entre los valores de la desviación estándar de
EP
p para los casos de población finita e infinita se hace despreciable. Cuando esto sucede, la
UD
expresión (6.5) se vuelve una aproximación muy buena para la desviación estándar de p
aunque la población sea finita.
Entonces, cuando se desee calcular la desviación estándar de p se empleará la expresión
(6.5) siempre y cuando la población sea infinita o la población sea finita y el tamaño de la
A
n
muestra sea como máximo el 5 % del tamaño de la población, esto es ≤ 0.05. En caso
IM
N
n
que > 0.05 deberá tomarse en cuenta el factor de corrección para población finita para
-L
N
calcular σp .
S
PU
Un detalle importante al analizar la expresión (6.5) es que cuando el tamaño de la

muestra aumenta, la medida de dispersión σp disminuye. Es decir, a medida que el número
M
de observaciones obtenidas aumenta, la proporción muestral de los valores observados estará

CA
más cerca de p.
Posteriormente veremos que el valor de σp es útil para determinar lo alejado que pueda
estar la proporción de la muestra de la proporción de la población. Debido al papel que
desempeña σp en el cálculo de los errores posibles es que se le conoce como error estándar
de la proporción.
Forma de la distribución de p
La última caracterı́stica que nos hace falta para tener definida completamente la
distribución de p es lo que respecta a la forma de la misma. La forma de la distribución
E
de p se obtiene aplicando el TLC teniendo el siguiente resultado:

AD
Al seleccionar muestras aleatorias simples de tamaño “n” de una población, la distribución

muestral de la proporción p se puede aproximar con una distribución normal, cuando el
tamaño de la muestra es grande. En el caso de p, se puede considerar que el tamaño de la
muestra es suficientemente grande cuando se cumplen las dos condiciones siguientes:
n.p ≥ 5
n.(1 − p) ≥ 5
-I I
6.4.2. Uso de la Distribución muestral de p en el cálculo de probabilidades

22
20
Como se comentó en 6.1, los estadı́sticos, en este caso la proporción muestral: p, es ahora
la variable de interés. Por lo tanto, cuando se trabaja con la distribución muestral de p la
expresión que se emplea para calcular la variable normal estándar Z, es la siguiente:
p−p p−p
z= =r (6.6)
σp p(1 − p)
n
Nota: Observe que para σp se está considerando la expresión (6.5), es decir, el caso de
población infinita. Si estuviera en el caso de población finita deberá usar para σp la expresión
(6.4).
A continuación presentamos algunos problemas resueltos para familiarizarse con el uso
EP
de la distribución muestral de p en el cálculo de probabilidades.

UD
1. Un alcalde recibió el 52 % de los votos en la última elección. Un año después el

A
alcalde quiere estudiar su popularidad. Si su popularidad no ha cambiado, ¿cuál es
IM
la probabilidad de que más del 50 % de una muestra de 300 electores lo apoye?

-L
De acuerdo a la información del problema tenemos que la proporción de votantes que

S
PU
apoyaron al alcalde la última elección fue 0.52, osea, p=0.52.

M
Ahora si se toma una muestra de 300 electores y la pregunta de este apartado hace
CA
referencia a la probabilidad de que la proporción de votantes que lo apoyen en la muestra

sea mayor a 0.5, entonces estamos ante la variable de interés:
p=“proporción de votantes que apoyan al alcalde en una muestra de 300 electores”.
Como se explica en la sección 6.4.1, las caracterı́sticas de la distribución de p serán:
E(p) = p, es decir, E(p) = p = 0.52.

Como no tenemos información sobre el tamaño de la población de votates,
consideramos que es infinita, por tanto
r para la desviación
r estándar de p se empleará
p(1 − p) 0.52(1 − 0.52)
E
la expresión (6.5), es decir: σp = = ≈ 0.029.

n 300
AD
Como se trabaja con una muestra 300 electores, aplicamos el Teorema del Lı́mite
Central para verificar si se cumplen las dos condiciones: n.p =≥ 5 y n.(1 − p) ≥ 5,
para concluir que la distribución de p se puede aproximar con una distribución
normal (Como se explica en la sección 6.4.1 referente a la Forma de la distribución
de p). Operando tenemos que n.p = 300×0.52 = 156 y n.(1−p) = 300×0.48 = 144,
verificándose que dichas condiciones se cumplen, por tanto la distribución de p se
puede aproximar con una distribución normal.

-I I
Entonces concluimos que: p ∼ N 0.52, 0.0292 . Sobre esta variable de interés deseamos
22
calcular, P (p > 0.50), entonces:

20

0.50 − 0.52
P (p > 0.50) = P Z > = P (Z > −0.69) = 0.25490 + 0.50 = 0.7549.
0.029
Por tanto P (p > 0.50) es igual a P (Z > −0.69) (Figura 6.8)

EP
0.50 0.52 p
UD
A
IM
S -L
PU
M
CA
−0.69 0 Z

Figura 6.8: Ilustración del cálculo de P (p > 0.50) para p ∼ N 0.52, 0.0292 .
2. De acuerdo con la Asociación Nacional de restaurantes, el 20 % de los restaurantes más

elegantes han establecido polı́ticas que restringen el uso de teléfonos celulares. Si usted
selecciona una muestra aleatoria de 100 de los restaurantes más elegantes,
E
a) ¿Cuál es la probabilidad de que la muestra contenga entre el 15 % y 25 % de los

AD
que han establecido polı́ticas que restringen el uso de teléfonos celulares?

De acuerdo a la información del problema tenemos que la proporción de
restaurantes más elegantes que han establecido polı́ticas que restringen el uso
de teléfonos celulares 0.20, osea, p=0.20.
Ahora si se toma una muestra de 100 de los restaurantes más elegantes y la
pregunta de este apartado hace referencia a la probabilidad de que la proporción
de restaurantes más elegantes que han establecido polı́ticas que restringen el uso
-I I
de teléfonos celulares en la muestra esté entre 0.15 y 0.25, entonces estamos ante
22
la variable de interés:
20
p=“proporción de restaurantes más elegantes que han establecido polı́ticas que

restringen el uso de teléfonos celulares en una muestra de 100”.
Como se explica en la sección 6.4.1, las caracterı́sticas de la distribución de p serán:
E(p) = p, es decir, E(p) = p = 0.20.
Como no tenemos información sobre el tamaño de la población de restaurantes

elegantes, consideramos que es bastante grande, por tanto parar la desviación
p(1 − p)
estándar de p se empleará la expresión (6.5), es decir: σp = =
r n
0.20(1 − 0.20)
= 0.04.
100
Como se trabaja con una muestra 100 restaurantes elegantes, aplicamos el
Teorema del Lı́mite Central para verificar si se cumplen las dos condiciones:
n.p =≥ 5 y n.(1 − p) ≥ 5, para concluir que la distribución de p se
puede aproximar con una distribución normal (Como se explica en la sección
EP
6.4.1 referente a la Forma de la distribución de p). Operando tenemos que

UD
n.p = 100 × 0.20 = 20 y n.(1 − p) = 100 × 0.80 = 80, verificándose que dichas
condiciones se cumplen, por tanto la distribución de p se puede aproximar con
una distribución normal.

A
Entonces concluimos que: p ∼ N 0.20, 0.042 . Sobre esta variable de interés
IM
deseamos calcular, P (0.15 < p < 0.25), entonces:

-L

0.15 − 0.20 0.25 − 0.20
S
P (0.15 < p < 0.25) = P <Z< =

PU
0.04 0.04
= P (−1.25 < Z < 1.25) = 0.39435 + 0.39435 = 0.7887.
M
CA
Por tanto P (0.15 < p < 0.25) es igual a P (−1.25 < Z < 1.25) (Figura 6.9)
b) Hay una probabilidad del 95 % de que la proporción muestral se encuentre ¿dentro
de cuáles lı́mites simétricos de la proporción poblacional?
Lo que se pide en este apartado es lo siguiente: P (p1 < p < p2 ) = 0.95, como se
aprecia en la Figura 6.10.
Entonces para hallar los lı́mites simétricos p1 y p2 respecto de la proporción
poblacional p=0.20, procedemos como sigue:
En la Tabla de distribución normal si leemos un área de 0.475, el valor de Z
E
AD
correspondiente será 1.96, por lo tanto Z2 = 1.96 y por simetrı́a Z1 = −1.96 (ver
Figura 6.11).
Conocidos Z1 y Z2 , podemos establecer las siguientes dos expresiones para despejar
y hallar p1 y p2 respectivamente:
p1 − 0.20
−1.96 =
0.04
p2 − 0.20
1.96 = ,
0.04
-I I
Despejando en cada caso obtenemos p1 =0.1216 y p2 =0.2784.

22
20
c) y resulta que la proporción de restaurantes más elegantes que restringen uso

de celular en la muestra es menor que 0.25 ¿Cuál es la probabilidad de que la
proporción en la muestra sea mayor que 0.18?
EP
0.15 0.20 0.25 p

UD
A
IM
S -L
PU
M
CA
−1.25 0 1.25 Z

Figura 6.9: Ilustración del cálculo de P (0.15 < p < 0.25) para p ∼ N 0.20, 0.042 .
0,475 0,475
E
AD
p1 0.20 p2 p
-I I
22
20
Figura 6.10: Ilustración de P (p1 < p < p2 ) = 0.95

0,475 0,475
EP
p1 0.20 p2 p
UD
0,475 0,475
A
IM
S -L
PU
M
CA
Z1 = − 1.96 0 Z2 = 1.96 Z
Figura 6.11: Ilustración de P (p1 < p < p2 ) = 0.95 y definición de Z2 = 1.96 y por simetrı́a Z1 = −1.96
P (p > 0.18 y p < 0.25) P (0.18 < p < 0.25)

P (p > 0.18 | p < 0.25) = = =
P (p < 0.25) P (p < 0.25)

0.18 − 0.20 0.25 − 0.20
E
P <Z<
AD
0.04 0.04
= =
0.25 − 0.20
P Z<
0.04
P (−0.50 < Z < 1.25)
= =
P (Z < 1.25)
0.19146 + 0.39435
= = 0.6550 o 65.50 %
0.50 + 0.39435
-I I
22
20

1. El tiempo que un cajero de banco dedica a cada cliente tiene distribución normal con
media µ=3.10 minutos y desviación estándar σ=0.40 minutos. Si se selecciona una
muestra aleatoria de 16 clientes.
a) ¿Cuál es la probabilidad de que el tiempo medio dedicado a cada cliente sea al

menos de 3 minutos?
b) ¿Cuál es la probabilidad de que el tiempo medio dedicado a cada cliente se
encuentre entre 3.1 y 3.2 minutos?
EP
c) ¿Existe un 85 % de probabilidad de que el tiempo medio muestral sea menor a qué

UD
valor?
d ) ¿Existe un 75 % de probabilidad de que el tiempo medio muestral sea mayor a qué
valor?
A
e) Existe un 90 % de probabilidad de que el tiempo medio muestral se encuentre
IM
¿entre cuáles dos valores simétricamente distribuidos alrededor del tiempo medio
-L
poblacional?
S
PU
f ) Si se selecciona una muestra aleatoria de 64 clientes, existe un 85 % de probabilidad

M
de que el tiempo medio muestral se encuentre por debajo de cuántos minutos?

CA
2. Una muestra aleatoria simple de tamaño 50 se selecciona de una población con σ=10.
Calcule el error estándar de la media en cada uno de los casos siguientes:
a) El tamaño de población es enorme o infinito.

b) El tamaño de población es N = 50,000.
c) El tamaño de población es N = 5000.
d ) El tamaño de población es N = 500.
3. El tiempo medio necesario para descargar la página de un sitio web fue de 0.8 segundos.
E
AD
Suponga que el tiempo de descarga tiene una distribución normal con una desviación
estándar de 0.2 segundos. Si se selecciona una muestra aleatoria de 30 tiempos de
descarga.
a) ¿Cuál es la probabilidad de que el tiempo medio en la muestra sea menor que 0.75
segundos?
b) ¿Cuál es la probabilidad de que el tiempo medio en la muestra se encuentra entre
0.70 y 0.90 segundos?
-I I
c) La probabilidad de que el tiempo medio en la muestra se encuentra entre dos

22
valores simétricamente distribuidos alrededor de la media poblacional es del 80 %,

20
¿Cuáles son esos dos valores?

d ) ¿Existe un 90 % de probabilidad de que el tiempo medio en la muestra sea menor
a qué valor?
4. Suponga que usted está estudiando el crecimiento de la demanda de cierto producto

y para obtener información emplea una muestra aleatoria simple de 35 consumidores.
Después de analizar la información obtenida ud. cree que el error estándar de la media
es demasiado grande. ¿Qué tamaño de muestra aleatoria simple debe usar para reducir
el error estándar a la mitad de su valor actual?
5. La dieta que utilizan en una granja para el engorde de pollos produce animales que pesan
en promedio 1950 gramos con una desviación estándar de 220 gramos. Una franquicia
de pollos a la brasa ha seleccionado al azar 30 pollos, calcule la probabilidad que:
EP
a) El peso medio de los pollos en la muestra sea menor que 1900 gramos.
UD
b) El peso medio en la muestra sea por lo menos de 2 Kg.

c) El peso medio en la muestra esté entre 1850 y 2000 gramos.
d ) Existe 25 % de probabilidad de que el peso medio muestral se encuentra por encima
A
de qué valor?
IM
e) ¿Existe el 15 % de probabilidad de que el peso medio de la muestra sea menor a

-L
qué valor?
S
PU
6. Si se seleccionan todas las muestras posibles de 64 elementos, a partir de una

M
población con media igual a 100 y desviación estándar igual a 20, ¿entre cuáles lı́mites
CA
simétricamente distribuidos en torno de la media poblacional cabe esperar se encuentre

el 80 % de las medias muestrales?
7. La cantidad de libros encuadernados diariamente por una máquina automática es una

variable aleatoria con distribución desconocida y con desviación estándar de 16 libros
por dı́a. Si se selecciona una muestra aleatoria de 49 dı́as, determinar la probabilidad
de que el número medio de libros encuadernados durante esos dı́as se encuentre a lo
sumo a 3 libros de la cantidad promedio poblacional.
E
8. Según un estudio se informa que el 76 % de los consumidores leen los ingredientes

AD
que aparecen en la etiqueta de los productos. Suponga entonces que la proporción

poblacional p = 0.76, y que de la población se toma una muestra de 400 consumidores.
a) Describa la distribución de la proporción muestral (p) de los consumidores que

leen la lista de los ingredientes.
b) ¿Cuál es la probabilidad de que la proporción muestral (p) esté a ± 0.03 o menos
de la proporción poblacional p?
c) Conteste el apartado b) pero ahora con una muestra de 750 consumidores.
-I I
22
9. El presidente de Distribuidores Dı́az, S.A., cree que el 30 % de los pedidos a su empresa

20
provienen de clientes nuevos. Si se toma una muestra aleatoria simple de 100 pedidos:
a) Describa la distribución muestral de p.

b) ¿Cuál es la probabilidad de que la proporción muestral (p) esté entre 0,20 y 0,40?
c) ¿Cuál es la probabilidad de que la proporción muestral (p) esté a ± 0,05 o menos

de la proporción poblacional p?
10. Usted planea realizar un experimento de marketing en el que los estudiantes deben
probar dos marcas de bebidas gaseosas distintas. Su labor consiste en identificar
correctamente cuál es la marca que probaron. Usted selecciona una muestra aleatoria
de 200 estudiantes y supone que no cuentan con facultades para distinguir entre
ambas marcas. (Nota: Si un individuo carece de facultades para distinguir entre las
dos bebidas gaseosas, entonces ambas marcas tienen la misma probabilidad de resultar
EP
seleccionadas.)
UD
a) ¿Cuál es la probabilidad de que en la muestra obtenga entre 50 y 60 % de

identificaciones correctas?
b) Hay una probabilidad del 90 % de que el porcentaje de identificaciones correctas
A
en la muestra se encuentre dentro de ¿cuáles lı́mites simétricos del porcentaje
IM
poblacional?
-L
c) ¿Cuál es la probabilidad de que el porcentaje de identificaciones correctas en la

S
muestral sea mayor que 65 %?

PU
d ) ¿Qué es más probable que ocurra: más del 60 % de identificaciones correctas en la

M
muestra de 200, o más del 55 % de identificaciones correctas en una muestra de

CA
1000? Explique por qué.
11. De acuerdo con un estudio el 40 % de usuarios de teléfonos celulares cuenta con uno
de alta gama. Si se selecciona una muestra de aleatoria de 50 usuarios de teléfonos
celulares:
a) Calcule el error estándar de la proporción.

b) ¿Cuál es la probabilidad de que la proporción de usuarios con celulares de alta
gama en la muestra esté entre 0,35 y 0,45?
E
AD
c) y la proporción de usuarios con celulares de alta gama en la muestra es mayor que

0.38 ¿Cuál es la probabilidad de que la proporción de usuarios con celulares de
alta gama en la muestra sea mayor que 0,42?
12. Una empresa dedicada a la investigación realizó un estudio sobre las mujeres que ocupan
cargos importantes en ambientes corporativos. El estudio concluyó que el 15 % de los
funcionarios corporativos de las empresas son mujeres. Suponga que se selecciona una
muestra aleatoria de 200 funcionarios corporativos:
-I I
a) ¿Cuál es la probabilidad de que en esta muestra menos del 15 % de los funcionarios

22
corporativos sean mujeres?

20
b) ¿Cuál es la probabilidad de que en esta muestra entre el 13 % y el 17 % de los

funcionarios corporativos sean mujeres?
c) ¿Cuál es la probabilidad de que en esta muestra entre el 10 % y el 20 % de los
funcionarios corporativos sean mujeres?
d ) Si se hubiese seleccionado una muestra de 100 funcionarios corporativos, ¿Cómo

cambiarı́an sus respuestas de los apartados a), b) y c)?
13. En una determinada población el 30 % votarı́an por el candidato presidencial del partido
M en caso de que las elecciones fuesen mañana. Si seleccionamos al azar una muestra
de 200 electores y los encuestamos, obtenga la probabilidad de que:
a) El porcentaje de personas en la muestra que expresen esa intención de voto supere

el 38 %
EP
b) El porcentaje de personas en la muestra que expresen esa intención de voto se

separe del porcentaje poblacional en más del 5 %
UD
14. En un distrito limeño la proporción de personas que manifiesta estar de acuerdo con el
incremento de multas contra aquellos que cometan acoso callejero es 0.75. Si se extrae
de manera aleatoria una muestra de 115 adultos que viven en ese distrito
A
IM
a) ¿Cuál es la probabilidad de que la proporción muestral de adultos que están de

-L
acuerdo con el incremento de multas se encuentre entre 0.73 y 0.77?

S
PU
b) Hay una probabilidad del 95 % de que la proporción muestral se encuentre ¿dentro

de cuáles lı́mites simétricos alrededor de la proporción poblacional?
M
c) Hay una probabilidad del 99 % de que la proporción muestral se encuentre ¿dentro

CA
de cuáles lı́mites simétricos alrededor de la proporción poblacional?
15. La Gerencia de recursos humanos de una empresa de telecomunicaciones realizó una

investigación sobre clima organizacional y detectó que el 80 % de los empleados
manifestaban su inconformidad con el sistema de evaluación laboral de la organización.
a) Si se seleccionan muestras aleatorias de 64 empleados, describa la distribución

muestral de la proporción de empleados inconformes con el sistema de evaluación
laboral.
E
b) Si se seleccionan muestras aleatorias de 125 empleados, describa la distribución

AD
muestral de la proporción de empleados inconformes con el sistema de evaluación

laboral.
c) Para la distribución muestral del apartado b) responda lo siguiente: Hay una
probabilidad del 95 % de que el porcentaje muestral se encuentre ¿dentro de cuáles
lı́mites simétricos alrededor del porcentaje poblacional?
d ) Para la distribución muestral del apartado a) responda lo siguiente: Hay una
probabilidad del 95 % de que la proporción muestral se encuentre ¿dentro de cuáles
-I I
lı́mites simétricos alrededor de la proporción poblacional?

22
20
16. Un artı́culo analiza los planes de jubilación para personas con edades de 50 a 70 años que
fueron empleados de tiempo completo o parcial. De los entrevistados, el 29 % dijeron
que no pensaron trabajar para obtener un salario. Si usted selecciona una muestra
aleatoria de 400 personas con edades de 50 a 70 años que fueron empleados de tiempo
completo o parcial. ¿Cuál es la probabilidad de que la muestra contenga entre el 25 y

el 30 % de los que no pensaron en trabajar para obtener un salario?
17. Explique claramente qué es el error estándar de la media.
18. Un fabricante produce tabletas de chocolate cuyo peso en gramos sigue una distribución
normal de media 125 g. y desviación tı́pica 4 g.
a) Si las tabletas se empaquetan en lotes de 25, ¿cuál es la probabilidad de que el

peso medio de las tabletas de un lote se encuentre entre 124 y 126 gramos?
EP
b) Si los lotes fuesen de 64 tabletas, ¿cuál serı́a la probabilidad de que el peso medio
UD
de las tabletas del lote superase los 124 gramos?
19. Explique claramente qué es el error estándar de la proporción.
20. Se sabe que el 48 % de los internautas que visitan una página web están satisfechos
A
IM
con la calidad de su contenido. Si se selecciona aleatoriamente una muestra de 50

internautas, ¿Cuál es la probabilidad de que la proporción muestral de los que se
-L
manifiesten satisfechas con los contenidos del sitio web sea superior a 0,54?
S
PU
21. La edad de los televidentes de un conocido programa de televisión es en promedio 20

M
años con una varianza de 36. Si se selecciona al azar una muestra de 40 personas que
CA
ven el programa:
a) ¿Cuál es la probabilidad de que la edad promedio de los encuestados supere los

21 años?
b) ¿Cuál es la probabilidad de que la edad promedio de los encuestados esté entre 18
y 22 años?
c) Existe una probabilidad del 85 % de que la edad promedio de los encuestados se
encuentre ¿entre cuáles dos valores simétricamente distribuidos alrededor de la
edad promedio poblacional?
E
AD
d ) ¿Existe un 78 % de probabilidad de que la edad promedio de los encuestados sea

mayor a qué valor?
22. La duración de las baterı́as de un determinado modelo de teléfono móvil sigue una
distribución desconocida cuya media es de 34,5 horas y su desviación tı́pica es de 6,9
horas. Si se tomara una muestra aleatoria simple de 38 de estas baterı́as:
a) ¿Cuál es la probabilidad de que la duración promedio de la muestra supere las 37

horas?
-I I
22
b) ¿Cuál es la probabilidad de que la duración promedio de la muestra esté entre 33

20
y 36 horas?
c) Existe una probabilidad del 95 % de que la duración promedio de la muestra se
encuentre ¿entre cuáles dos valores simétricamente distribuidos alrededor de la
duración promedio poblacional?
d ) Existe un 79 % de probabilidad de que la duración promedio de la muestra sea

superada por qué valor?
23. Se sabe que el peso de los recién nacidos en un determinado poblado sigue una
distribución normal con media igual a 3600 gramos y varianza igual a 78400.
a) Calcule la probabilidad de que un recién nacido pese entre 3700 y 3800 gramos.
b) ¿Cuál es la probabilidad de que un recién nacido pese 3500 gramos?
c) Si se elige un recién nacido al azar y resulta que pesa más de 3450 gramos ¿Cuál
EP
es la probabilidad de que pese más de 3650 gramos?

UD
d ) Si se elige a 8 recién nacidos, ¿Cuál es la probabilidad de que hayan al menos 2

que pesen entre 3500 y 3750 gramos?
e) Si se toma una muestra aleatoria de 196 recién nacidos ¿Cuál es la probabilidad
de que el peso promedio de la muestra esté entre 3580 y 3620 gramos?
A
IM
f ) Si se toma una muestra aleatoria de 196 recién nacidos, existe una probabilidad
del 95 % de que el peso promedio de la muestra se encuentre ¿entre cuáles dos
-L
valores simétricamente distribuidos alrededor del peso promedio poblacional?

S
PU
g) Si se toma una muestra aleatoria de 196 recién nacidos ¿Existe un 25 % de

M
probabilidad de que el peso promedio de la muestra sea superado por qué valor?
CA
h) Si se toma una muestra aleatoria de 196 recién nacidos y el peso promedio de

dicha muestra es mayor a 3560 gramos ¿Cuál es la probabilidad de que el peso
promedio de la muestra sea menor a 3600 gramos?
i ) Si se toma una muestra aleatoria de 196 recién nacidos ¿Cuál es la probabilidad
de que el peso promedio de la muestra sea 3655 gramos?
24. Según el Departamento de Inspecciones Técnicas de Seguridad de la Municipalidad

de Lima el 30 % de los edificios antiguos del centro de la ciudad tienen instalaciones
eléctricas inseguras. Si se toma uma muestra de 250 de edificios antiguos:
E
AD
a) ¿Cuál es la probabilidad de que la proporción de edificios con instalación eléctrica

insegura en dicha muestra este entre 0,25 y 0,35?
b) Existe una probabilidad del 90 % de que la proporción de la muestra se encuentre
¿entre cuáles dos valores simétricamente distribuidos alrededor de la proporción
poblacional de edificios antiguos con instalaciones eléctricas inseguras?
c) ¿Existe un 80 % de probabilidad de que la proporción de edificios antiguos con
instalaciones inseguras en la muestra sea menor a qué valor?
-I I
d ) Calcular e interpretar el error estándar de la proporción para una muestra de 200

22
edificios antiguos.
20
25. Supongamos que el tiempo que un cliente pasa en un banco sigue distribución normal
con una media de 19 min y una desviación estándar de 5 min. Si selecciona una muestra
aleatoria simple de cinco clientes, ¿cuál es la probabilidad de que el tiempo promedio
empleado sea al menos 12 min?
26. Según eventos pasados, un concesionario de automóviles sabe que el 8 % de todos los
clientes que ingresan a la sala de exposición realizan una compra. Supongamos que 100
personas entran a la sala de exposición, ¿Cuál es la probabilidad de que la proporción
de clientes que realizan una compra en dicha muestra esté entre 0,05 y 0,10?
27. Se sabe que los sueldos de los trabajadores de una empresa tienen distribución
desconocida con una media de 800 dólares. Se toma una muestra aleatoria de 35
trabajadores y se encuentra que hay una probabilidad del 5 % de que el sueldo promedio
de la muestra exceda los 866 dólares. Hallar la desviación estándar de los sueldos de
EP
los trabajadores de dicha empresa.

UD
28. Muchos de los adultos peruanos alivian el estrés comiendo dulces. Según un estudio
del Ministerio de Salud, el 46 % de los adultos peruanos comen en exceso comidas
dulces cuando están estresados. Si se selecciona una muestra aleatoria de 100 adultos
peruanos, ¿Cuál es la probabilidad de que la proporción muestral de los que comen en
A
IM
exceso comidas dulces debido al estrés esté entre 0.3 y 0.4?

-L
29. Una fábrica de autos lanza al mercado el modelo SPIKE del que se sabe que sus pesos
S
siguen una distribución normal con media igual a 3100 kilos y una desviación estándar
PU
de 130 kilos.
M
a) Si se toma una muestra aleatoria de 100 autos ¿Cuál es la probabilidad de que el

CA
peso promedio de la muestra se encuentre entre 3110 y 3130 kilos?

b) Calcular e interpretar el error estándar de la media para una muestra de 150 autos.
30. Durante dos años las ventas han estado disminuyendo en la gran cantidad de sucursales
de una cadena de supermercados. Una empresa de análisis de datos ha determinado
que un 30 % de las sucursales tiene signos de una mala administración. Si se toma una
muestra aleatoria de 95 sucursales,
a) ¿Cuál es la probabilidad de que la proporción de sucursales con problemas en su

E
administración en la muestra se encuentre entre el 25 % y 40 %?

AD
b) Existe una probabilidad del 80 % de que la proporción de sucursales con problemas

en su administración en la muestra sea superada porqué valor?
31. El peso de los paquetes de harina que produce cierta fábrica sigue una distribución
normal con media de 105 gramos y desviación estándar de 5 gramos.
a) Si se elige al azar un paquete ¿cuál es la probabilidad de que pese entre 106 y 111
gramos?
-I I
b) Si se elige al azar un paquete ¿cuál es la probabilidad de que pese menos de 105

22
gramos?
20
c) Si se elige al azar un paquete resultando que pesa más de 107 gramos, ¿cuál es la
probabilidad de que pese menos de 110 gramos?
d ) Si se toma al azar una muestra de 6 paquetes ¿cuál es la probabilidad de que al
menos 4 paquetes pesen entre 107 y 110 gramos?
e) Si se elige al azar una muestra de 85 paquetes, ¿Cuál es la probabilidad de que

más de 23 pesen entre 106 y 111 gramos?
f ) Si se toma una muestra aleatoria de 60 paquetes ¿Cuál es la probabilidad de que
el peso promedio en la muestra esté entre 104.2 y 105.8 gramos?
g) Si se toma una muestra aleatoria de 60 paquetes y el peso promedio de dicha
muestra es mayor a 104 gramos ¿Cuál es la probabilidad de que el peso promedio
de la muestra sea menor a 105 gramos?
h) Si se toma una muestra aleatoria de 60 paquetes ¿Cuál es la probabilidad de que
EP
el peso promedio de la muestra sea igual a 104.7 gramos?

UD
32. La agencia de viajes WAWATUR ha comprobado que el 25 % de sus clientes prefieren

los paquetes vacacionales que incluyen un crucero.
a) Para la elaboración de los próximos catálogos publicitarios se han publicado 500

A
ejemplares de muestra distribuidos al azar entre los clientes habituales de la
IM
agencia. ¿Cuál es la probabilidad de que el porcentaje de clientes que prefieren

-L
los paquetes vacacionales que incluyen un crucero, en la muestra, sea menor que
S
PU
27 %?
b) Calcular e interpretar el error estándar de la proporción para una muestra de 650
M
CA
clientes.
33. Analice si la información suministrada es suficiente para resolver el problema que se

plantea: En la Udep|Campus Lima se sabe que el peso promedio de las mochilas que
llevan los alumnos es 6,3 kg. Si se toma al azar una muestra de 55 estudiantes y se
quiere saber la probabilidad de que el peso promedio de las mochilas de la muestra sea
inferior a 6 kg. Esta probabilidad:
a) Se puede calcular con los datos del problema.

b) Se podrı́a calcular con los datos del problema si nos aseguraran que los pesos de
E
AD
las mochilas se distribuyen según una distribución normal.

c) No se puede calcular sin saber el número total de los alumnos de instituto.
d ) No se puede calcular, ya que el tamaño de la muestra no es lo suficientemente
grande.
e) Se podrı́a calcular si conociéramos la desviación tı́pica de los pesos de la población
de partida.
-I I
22
20
Capı́tulo 7
Estimación de parámetros
EP
UD
7.1. Introducción
En el Capı́tulo anterior, declaramos que un estimador puntual es un estadı́stico de la
muestra y se utiliza para estimar un parámetro de la población. Por ejemplo, la media
A
muestral x es un estimador puntual de la media poblacional µ y la proporción muestral p
IM
es un estimador puntual de la proporción poblacional p. Ya que no se puede esperar que

-L
un estimador puntual proporcione el valor exacto del parámetro de interés de la población,

S
se entiende que la estimación puntual no es suficiente ya que no nos indica el error que se
PU
comete en la estimación. Por esa razón, un enfoque que nos arroja mayor información consiste
M
en presentar una estimación de intervalo, osea un intervalo de valores del que se espera que
CA
se estime el parámetro poblacional de interés. Dicho intervalo de valores se conoce como

intervalo de confianza. La confianza del intervalo debe ser entendida como la fracción de
intervalos calculados a partir de una gran serie de muestras de tamaño idéntico que contienen
el verdadero valor del parámetro poblacional de interés.
Como veremos, las distribuciones muestrales de x y p que presentamos en el capı́tulo 6
desempeñan un papel importante en el desarrollo de los estimados de intervalo de µ y p.
Para realizar la estimación de un parámetro poblacional existen dos formas: la estimación
puntual y la de intervalo. En la estimación puntual, como su nombre lo indica, el valor del
parámetro poblacional se estima mediante un único valor, el cual se obtiene de una muestra
E
AD
seleccionada de la población analizada. Como ya lo hemos venido diciendo, una estimación

puntual de la media poblacional µ es la media muestral x.
Ya que generalmente la estimación puntual no es suficiente ya que no nos indica el error
que se comete en la estimación, existe un enfoque que nos arroja mayor información y consiste
en presentar una estimación de intervalo, osea un intervalo de valores del que se espera que
se estime el parámetro poblacional de interés.
Una estimación de intervalo generalmente se calcula sumando y restando un valor, llamado
margen de error (E), a la estimación puntual. La forma general de una estimación de intervalo
-I I
es la siguiente:
22
Estimación puntual ± margen de error (7.1)

20
El objetivo de una estimación de intervalo es proporcionar información sobre qué tan cerca
está la estimación puntual, proporcionada por la muestra, al valor del parámetro poblacional
correspondiente.
272
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 273
7.2. Estimación de intervalo para una media poblacional (µ)

En esta sección mostraremos cómo usar la distribución muestral de x para determinar un
estimado de intervalo de una media poblacional µ.
Siguiendo la expresión (7.1) decimos que la forma general de una estimación de intervalo
de confianza para una media poblacional µ es:
x ± E (7.2)
donde E: Margen de error. La expresión (7.2) es lo mismo que decir que el intervalo de
EP
confianza para µ es:

UD
x − E < µ < x + E. (7.3)
Margen de error o Error muestral (E)

En general, el valor absoluto de la diferencia entre un estimador puntual insesgado y el
A
parámetro de población que estima se llama margen de error o error muestral. Para el caso
IM
en el que la media de una muestra estima a una media poblacional, el error muestral es:
S -L
E =| x − µ | (7.4)
PU
En la práctica no se puede determinar el valor del error muestral, porque no se conoce

M
µ, la media de la población. Sin embargo, se puede usar la distribución muestral de x

CA
para establecer márgenes de probabilidad acerca del tamaño del error muestral. Como la
distribución muestral de x indica cómo se distribuyen sus valores en torno o alrededor de µ,
nos proporciona información acerca de las diferencias posibles entre x y µ.
Es decir, se puede probabilı́sticamente afirmar cuál es el valor máximo para el error
muestral si:
1. Conociéramos la distribución muestral de x,
2. Definiéramos el nivel de confianza para la estimación.

E
Respecto al punto 1, las caracterı́sticas de la distribución muestral de x se sugiere revisar

AD
el Capı́tulo 6, sección 6.3.1. De ello sabemos que X se aproxima a una distribución normal
(ya sea si la población sigue distribución normal o el Teorema del Lı́mite Central (TLC)
!
σ 2
ayude a identificar la forma que tiene la distribución de x), es decir, X ∼ N µ, √ ,
n
asumiendo que σ es conocido.
Respecto al punto 2, ¿Qué es el nivel de confianza? En el caso que el objetivo sea
estimar µ, se puede definir como, la probabilidad (1-α) de que la media muestral se encuentre,
como máximo, a una distancia E de la media poblacional µ (desconocida), como se aprecia
-I I
en la Figura 7.1. El nivel de confianza (1-α) es el área bajo la curva normal estándar entre
22
α
los valores −Zα/2 y Zα/2 . El área restante es en cada cola de la distribución. Por ejemplo
20
2
si la estimación se realiza con un nivel de confianza del 90 %, es decir, 1-α=0.90, entonces
α
=0.05, lo que hará que Zα/2 =1.645. Ası́, conociéndose el nivel de confianza obtenemos el
2
valor de Z a emplear. En la Tabla 7.1 aparecen, además del mencionado, otros niveles de
confianza de uso común.
EP
µ E X
UD
nivel de confianza
(1 − α)
A
IM
-L
α 2 α 2
S
PU
M
CA
− Zα 2 0 Zα 2 Z
Figura 7.1: Ilustración sobre el nivel de confianza en la distribución muestral de x.
Nivel de confianza α α/2 Zα/2

90 % 0.10 0.05 1.645
95 % 0.05 0.025 1.96
99 % 0.01 0.005 2.576
E
Tabla 7.1: Valores de “Z” para los niveles de confianza de uso común.
AD
Basados en la explicación lı́neas arriba, decimos que: Dado un nivel de confianza (1-α),
el margen de error o error muestral (E) se calcula como:
E = Zα/2 × σx (7.5)
Para el caso de tratar con una población infinita la expresión (7.5) quedarı́a ası́:
-I I
σ
E = Zα/2 × √ (7.6)
n
22
20
No se olvide que para usar la expresión (7.5) asumimos que σ es conocida y el margen
de error está siendo medido en la distribución de la variable normal estándar (Z). En caso
que σ no sea conocida, debemos emplear la desviación estándar de la muestra “s” (de una
muestra grande, n ≥ 30) como un estimado puntual de σ. Por tanto estimaremos σx através
s
de Sx = √ , por lo que, el margen de error o error muestral (E) se calcula en este caso como:
n
s
E = Zα/2 × √ . (7.7)
n
Por tanto, empleando las expresiones (7.6) y (7.7) en la expresión (7.2), definimos algunos
casos para realizar la estimación de intervalo para una media poblacional (µ):
Intervalo de confianza para la media poblacional (µ) cuando población tiene

distribución normal y σ es conocida e Intervalo de confianza para la media
EP
poblacional (µ) cuando población tiene distribución desconocida (o no es

UD
Normal), σ es conocida y la muestra empleada es grande (n ≥ 30)-Uso del Teorema

del Lı́mite Central.
σ
x ± Zα/2 × √ (7.8)
n
A
IM
Intervalo de confianza para la media poblacional (µ) cuando población tiene

-L
distribución desconocida (o no es Normal), σ es desconocida y muestra es grande

S
(n ≥ 30)-Uso del Teorema del Lı́mite Central.

PU
s
M
x ± Zα/2 × √ (7.9)
n
CA
¿Cómo se interpreta el intervalo de confianza del (1 − α) × 100 % para una media

poblacional (µ)?
Después de construir un intervalo de confianza es importante interpretar correctamente
los resultados. Suponga que usted ha construido el intervalo de confianza del (1 − α) × 100 %
para una media poblacional (µ). Debido a que, aunque es desconocido, el valor de µ existe
y es fijo, por lo tanto dicho valor está o no en el intervalo construido. Por esta razón no
es correcto decir: hay una probabilidad del (1 − α) × 100 % de que el valor de µ esté en el
intervalo construido.
E
La forma correcta de interpretar el intervalo de confianza serı́a: Si seleccionamos una gran

AD
cantidad de muestras de tamaño n y calculamos un intervalo de confianza para µ con cada

una de las muestras, esperamos que alrededor del (1−α)×100 % de los intervalos construidos
contengan la media de la población, µ.
Tamaño de muestra requerido si el objetivo es estimar una media poblacional µ.

Para un mismo tamaño de muestra n, conforme aumenta el nivel de confianza, el intervalo
se hace más amplio. Conforme el intervalo se hace más amplio, la precisión de la estimación
decrece. Una forma de aumentar la precisión de la estimación es aumentar el tamaño de la
-I I
muestra. Pero, ¿cuál es el tamaño de la muestra necesario para garantizar cierto nivel de
22
confianza para un margen de error dado?

20
Eso dependerá de si estamos tratando con una población infinita o finita.

Si la población es infinita, el tamaño de muestra requerido será: :

2
Zα/2 × σ 2
n= (7.10)
E2
Si la población es finita, el tamaño de muestra requerido será:

2
N × Zα/2 × σ2
n= 2 (7.11)
(N − 1)E 2 + Zα/2 × σ 2
EP
donde N =Tamaño de la población.

Notas:
UD
En caso que el cálculo del tamaño de la muestra n resulte un valor no entero deberá
redondear el resultado siempre al entero superior más próximo.
A
La expresión (7.10) es obtenida al despejar n de la expresión (7.6). Análogamente la
IM
expresión (7.11) es obtenida al despejar n de la expresión (7.5) considerando para σx

-L
la expresión (6.1).
S
PU
En caso que σ no sea conocida, podrı́amos emplear la desviación estándar de la muestra

“s” (de una muestra grande, n ≥ 30) como un estimado puntual de σ.
M
CA
A continuación presentamos algunos problemas resueltos para familiarizarse con la es-

timación de intervalo para una media poblacional (µ) para los casos mencionados en las
expresiones (7.8) y (7.9).
1. Se sabe que los pesos de una población de novillos de 18 meses de edad tienen una
distribución aproximadamente normal, con desviación estándar de 6 kg. Se tomó una
muestra de 9 novillos y se determinó que la media de esa muestra es de 180 kg.
E
AD
a) ¿Cuál es un estimado puntual para el peso medio de la población de novillos?

Como se sabe, la media muestral x es un estimador puntual de la media poblacional
µ, por tanto el peso promedio de los 9 novillos que conforman la muestra
seleccionada, 180 kg; serı́a un estimado puntual para el peso medio de la población
de novillos.
b) ¿Cuál es el error estándar de la media?
Sea la variable aleatoria: X=“peso del novillo (Kg)”. Según el enunciado no hay
información sobre la media µ de X, ya que el objetivo va ser estimarla. La
-I I
desviación estándar de X (variable poblacional) es conocida e igual a σ = 6 kg.

22
También sabemos por el enunciado que X sigue distribución normal, por tanto,
20
X ∼ N (µ, 62 ). Esta variable como hemos dicho hace referencia a la población de

novillos.
Ahora si se toma una muestra de 9 novillos y se va a emplear el peso promedio de
los 9 novillos para estimar el peso promedio de la población de novillos, µ, estamos
ante la variable de interés:

X=“peso promedio en una muestra de 9 novillos (Kg)”.
Como se vio en el capı́tulo 6, al no contar con información sobre el tamaño de la
población, consideramos que es infinita, por tanto para la desviación estándar
de x o error estándar de la media se empleará la expresión (6.2), es decir:
σ 6
σx = √ = √ = 2 kg.
n 9
c) Con el nivel de confianza de 95 % ¿Cuál es el margen de error? Interprete el
resultado.
EP
Como se ha definido en el apartado anterior, la variable de interés es, X=“peso

UD
promedio en una muestra de 9 novillos (Kg)”. Como se explica en la sección 6.3.1,

las caracterı́sticas de la distribución de X serán:
E(X) = µ, la cual es desconocida.
σ 6
A
Del apartado anterior sabemos que: σx = √ = √ = 2 kg.
n 9
IM
Como la variable poblacional X=“peso del novillo (Kg)” tiene distribución

-L
normal entonces la distribución de X tendrá igualmente distribución normal

S
(Como se explica en la sección 6.3.1 referente a la Forma de la distribución

PU
de x).
M

Entonces concluimos que: X ∼ N µ, 22 . De acuerdo a la expresión (7.6) tenemos
CA
σ
que el margen de error es: E = Zα/2 × √ . Como el nivel de confianza para la
n
estimación es del 95 % de acuerdo con la Tabla 7.1, el valor de “Z” que debemos
emplear es 1.96, por tanto, haciendo los reemplazos respectivos, el margen de error
o error muestral será:
σ 6
E = Zα/2 × √ = 1.96 × √ = 3.92 kg
n 9
Esto quiere decir, que si seleccionamos una muestra de 9 novillos y empleamos el

E
peso promedio de los 9 novillos para estimar el peso promedio de la población de

AD
novillos hay una probabilidad del 95 % de que el peso promedio de los 9 novillos
se aleje como máximo 3.92 kg. del peso promedio de la población de novillos.
d ) ¿Cuál es el intervalo de confianza de 95 % para el peso medio de la población de
novillos? Interpretar.
Por la información obtenida de este problema, para construir un intervalo de
confianza de 95 % para el peso medio de la población de novillos, µ, debemos
emplear la expresión (7.8), por lo que dicho intervalo de confianza será:
-I I
σ
22
x ± Zα/2 × √
n
20
180 ± 3.92 kg
Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de

acuerdo a la expresión (7.3):
x − E < µ < x + E.
180 − 3.92 < µ < 180 + 3.92 kg
176.08 < µ < 183.92 kg
La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran

cantidad de muestras de 9 novillos y calculamos un intervalo de confianza para
EP
el peso promedio de la población de novillos (µ) con cada una de las muestras,
UD
esperamos que alrededor del 95 % de los intervalos construidos contengan el peso

promedio de la población de novillos, µ.
e) ¿Qué tamaño deberı́a tener la muestra para cometer un error menor de 2 kg en la
estimación del peso medio poblacional, con un nivel de confianza de 95 %?
A
IM
Antes de responder analicemos la respuesta del apartado c). En ese caso una
muestra de 9 novillos produjo un margen de error de máximo 3.92 kg en la
-L
estimación. Si ahora nos piden reducir el error de forma que sea no mayor a 2
S
PU
kg, con el mismo nivel de confianza y sabiendo que σ=6, entonces el tamaño de la
muestra deberá ser mayor. El tamaño de muestra requerido se hallará usando la
M
CA
expresión (7.10):
2
Zα/2 × σ 2 (1.96)2 × 62
n= = ≈ 34.57 = 35 novillos.
E2 22
2. Para tratar de estimar la media de consumo por cliente, en un gran restaurante, se

reunieron datos de una muestra de 49 clientes durante un periodo de tres semanas.
Suponga que la desviación estándar de los consumos de la población de clientes es de
2.50 dólares.
E
a) ¿Cuál es el error estándar de la media?

AD
Sea la variable aleatoria: X=“consumo por cliente (dólares)”. Según el enunciado

no hay información sobre la media µ de X, ya que el objetivo va ser estimarla. Se
conoce la desviación estándar de X (variable poblacional) y es igual a σ = 2.50
dólares. No se proporciona información alguna sobre la distribución de X, por lo
que consideramos es desconocida. Esta variable como hemos dicho hace referencia
a la población de clientes del restaurante.
Ahora si se toma una muestra de 49 clientes y se va a emplear el consumo promedio
de los 49 clientes para estimar el consumo promedio de la población de clientes,
-I I
µ, estamos ante la variable de interés:

22
X=“consumo promedio en una muestra de 49 clientes (dólares)”.

20

población, consideramos que es infinita, por tanto para la desviación estándar
de x o error estándar de la media se empleará la expresión (6.2), es decir:
σ 2.50
σx = √ = √ ≈ 0.36 dólares.
n 49
b) Con el nivel de confianza de 95 %, ¿Cuál es el margen de error?
Como se ha definido en el apartado anterior, la variable de interés es, X=“consumo
promedio en una muestra de 49 clientes (dólares)”. Como se explica en la sección
6.3.1, las caracterı́sticas de la distribución de X serán:
σ 2.50
Del apartado anterior sabemos que: σx = √ = √ ≈ 0.36 dólares.
n 49
EP
Como en el problema no se menciona qué distribución tiene la variable

poblacional X=“consumo por cliente (dólares)” y sabemos que la muestra
UD
tomada es de 49 clientes (n ≥ 30), aplicando el Teorema del Lı́mite Central

podemos afirmar que la distribución de X se puede aproximar con una
distribución normal (Como se explica en la sección 6.3.1 referente a la Forma
A
de la distribución de x).
IM

Entonces concluimos que: X ∼ N µ, 0.362 . De acuerdo a la expresión (7.6)
-L
σ
tenemos que el margen de error es: E = Zα/2 × √ . Como el nivel de confianza
S
n
PU
para la estimación es del 95 % de acuerdo con la Tabla 7.1, el valor de “Z” que
debemos emplear es 1.96, por tanto, haciendo los reemplazos respectivos, el margen
M
de error o error muestral será:

CA
σ 2.50
E = Zα/2 × √ = 1.96 × √ = 0.70 dólares.
n 49
Esto quiere decir, que si seleccionamos una muestra de 49 clientes y empleamos

el consumo promedio de los 49 clientes para estimar el consumo promedio de la
población de clientes hay una probabilidad del 95 % de que el consumo promedio
de los 49 clientes se aleje como máximo 0.70 dólares del consumo promedio de la
población de clientes.
E
c) Si la media de la muestra es de 22.60 dólares, ¿Cuál es el intervalo de confianza

AD
de 95 % para el consumo promedio de la población de clientes del restaurante?

Interprete.
Por la información obtenida de este problema, para construir un intervalo de
confianza de 95 % para el consumo promedio de la población de clientes, µ,
debemos emplear la expresión (7.8), por lo que dicho intervalo de confianza será:
σ
x ± Zα/2 × √
n
-I I
22.60 ± 0.70 dólares

22
20
Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de

acuerdo a la expresión (7.3):
x − E < µ < x + E.
22.60 − 0.70 < µ < 22.60 + 0.70 dólares
21.90 < µ < 23.30 dólares.
La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran

cantidad de muestras de 49 clientes y calculamos un intervalo de confianza
para el consumo promedio de la población de clientes (µ) con cada una de las
muestras, esperamos que alrededor del 95 % de los intervalos construidos contengan
el consumo promedio de la población de clientes, µ.
EP
3. Se determinó la rentabilidad de vender automóviles usados, en un estudio de la

Asociación Nacional de comerciantes de automóviles. Suponga que con una muestra
UD
de 200 vendedores de autos usados se obtuvo una ganancia promedio de $300 y una
desviación estándar muestral de $150. Con esa información defina e interprete un
estimado de intervalo de confianza de 90 % para la ganancia promedio de la población
A
de ventas de automóviles usados.
IM
Sea la variable aleatoria: X=“ganancia por venta de autos usados (dólares)”. Según
-L
el enunciado no hay información sobre la media µ de X, ya que el objetivo va ser

S
PU
estimarla y tampoco se conoce la desviación estándar de X (variable poblacional), σ.

El enunciado tampoco proporciona información alguna sobre la distribución de X, por
M
lo que consideramos es desconocida. Esta variable como hemos dicho hace referencia a
CA
la población de ventas de automóviles usados.

Ahora si se toma una muestra de 200 vendedores y se va a emplear la ganancia promedio
de los 200 vendedores para estimar la ganancia promedio de la población de ventas de
automóviles usados, µ, estamos ante la variable de interés:
X=“ganancia promedio por la venta de autos usados en una muestra de 200 vendedores
(dólares)”.
población, consideramos que es infinita, por tanto para la desviación estándar de x
E
σ
o error estándar de la media se debe emplear la expresión (6.2), es decir: σx = √ .
AD
n
En esta ocasión, como se ha manifestado lı́neas arriba, no se conoce el valor de σ,
por lo que en realidad no podrı́amos calcular σx . Pero como se explicó en la sección
7.2, en caso que σ no sea conocida, debemos emplear la desviación estándar de una
muestra, “s” (debe ser una muestra grande, n ≥ 30) como un estimado puntual de
σ. En el enunciado del problema se dice que la desviación estándar encontrada en la
s
muestra es s = 150. Por tanto estimaremos σx através de Sx = √ , el cual es igual a
n
150
Sx = √ ≈ 10.61 dólares.
-I I
200
22
Continuando con el análisis, ahora debemos cuantificar el margen de error. Ya que se

20
ha definido que la variable de interés es, X=“ganancia promedio por la venta de autos
usados en una muestra de 200 vendedores (dólares)”, entonces de acuerdo a la sección
6.3.1, las caracterı́sticas de la distribución de X serán:

150
Lı́neas arriba se ha estimado σx como Sx = √ ≈ 10.61 dólares.
200
Como en el problema no se menciona qué distribución tiene la variable poblacional
X=“ganancia por venta de autos usados (dólares)” y sabemos que la muestra
tomada es de 200 vendedores (n ≥ 30), aplicando el Teorema del Lı́mite Central
podemos afirmar que la distribución de X se puede aproximar con una distribución
normal (Como se explica en la sección 6.3.1 referente a la Forma de la distribución
de x).

Entonces concluimos que: X ∼ N µ, 10.612 . De acuerdo a la expresión (7.7) tenemos
EP
s
que el margen de error es: E = Zα/2 × √ . Como el nivel de confianza para la estimación
n
UD
es del 90 % de acuerdo con la Tabla 7.1, el valor de “Z” que debemos emplear es 1.645,
por tanto, haciendo los reemplazos respectivos, el margen de error o error muestral
será:
s 150
A
E = Zα/2 × √ = 1.645 × √ = 17.45 dólares.
n 200
IM
Esto quiere decir, que si seleccionamos una muestra de 200 vendedores y empleamos la
-L
ganancia promedio por la venta de autos usados de la muestra de 200 vendedores para
S
PU
estimar la ganancia promedio de la población de ventas de automóviles usados, hay

una probabilidad del 90 % de que la ganancia promedio por la venta de autos usados
M
de la muestra de 200 vendedores se aleje como máximo 17.45 dólares de la ganancia

CA
promedio de la población de ventas de automóviles usados.

Para concluir, emplearemos la información obtenida para construir un intervalo de
confianza de 90 % para la ganancia promedio de la población de ventas de automóviles
usados, µ. Si el enunciado del problema afirma que la media de la muestra empleada
es: x = 300 dólares, entonces siguiendo la expresión (7.9), tenemos que el intervalo de
confianza para µ será:
s
x ± Zα/2 × √
n
E
300 ± 17.45 dólares

AD
Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de acuerdo a
la expresión (7.3):
x − E < µ < x + E.
300 − 17.45 < µ < 300 + 17.45 dólares
282.55 < µ < 317.45 dólares.

-I I
La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran cantidad

22
de muestras de 200 vendedores y calculamos un intervalo de confianza para la ganan-

20
cia promedio de la población de ventas de automóviles usados (µ) con cada una de las
muestras, esperamos que alrededor del 90 % de los intervalos construidos contengan la
ganancia promedio de la población de ventas de automóviles usados, µ.
Estimación de un intervalo de confianza para una media poblacional µ cuando

la población tiene distribución normal, la desviación estándar poblacional σ es
desconocida y la muestra es pequeña (n < 30).
Un caso no contemplado por las expresiones (7.8) y (7.9) para estimar un intervalo de
confianza para una media poblacional µ tiene que ver con la situación en que la desviación
estándar poblacional σ es desconocida y la muestra con la que contamos es
pequeña (n < 30). En muchas situaciones de la vida real la desviación estándar poblacional
σ es desconocida y además de eso, debido a limitaciones de tiempo y costo, no es posible
EP
recolectar muestras aleatorias simples grandes (n ≥ 30). Para construir un intervalo de

UD
confianza para una media poblacional µ en estas circunstancias se puede usar la llamada
distribución t-student (o simplemente distribución t), siempre y cuando la población de la
cual se extrae la muestra tenga distribución normal.
El uso de la distribución t surge porque nos vemos en la necesidad de emplear la
A
IM
desviación estándar (s) de una muestra pequeña (n < 30) para estimar la desviación estándar
poblacional σ. Esa estimación genera un mayor error muestral E el cual debe ser calculado o
-L
medido basándonos en la distribución t y no en la distribución de la variable normal estándar

S
PU
Z como ocurrió en los casos contemplados por las expresiones (7.8) y (7.9).
Si una variable aleatoria (poblacional) X sigue distribución normal (y σ es desconocido)
M
CA
y la muestra empleada es pequeña, entonces la distribución del estadı́stico
x−µ
t= s (7.12)
√
n
sigue una distribución t.
La distribución t es una distribución de probabilidad continua al igual que la distribución
normal estándar Z. Algunas caracterı́sticas de la distribución t son:
Tiene forma de campana y es simétrica respecto de la media t=0.

E
AD
No existe una sola distribución t, sino una familia de distribuciones t. Todas las
distribuciones t tienen una media de 0, y sus desviaciones estándares difieren de acuerdo
con el tamaño de la muestra, n. Existe una distribución t para un tamaño de muestra
de 20, otra para un tamaño de muestra de 22, etc. La desviación estándar de una
distribución t con 5 observaciones es mayor que en el caso de una distribución t con 20
observaciones.
Cada distribución t es determinada por un parámetro llamado: grados de libertad

-I I
(g.l.). Cuando usamos la distribución t para estimar uma media poblacional (µ), los
grados de libertad son iguales al tamaño de la muestra menos 1. (g.l. = n − 1).
22
20
La distribución t es más ancha y más plana en la parte central que la distribución normal
estándar (ver Figura 7.2). Como resultado de ello se tiene una mayor variabilidad en
las medias muestrales calculadas a partir de muestras más pequeñas. Sin embargo,
conforme se incrementa el tamaño de la muestra (y por ende, los grados de libertad),
la distribución t se aproxima a la distribución normal estándar, pues los errores que se

cometen al utilizar s para estimar σ disminuyen con muestras más grandes.
El área bajo la curva t es igual a 1.

EP
Distribución Z
UD
Distribución t
(5 grados de libertad)
Distribución t
A
(2 grados de libertad)
IM
S -L
PU
M
CA
Figura 7.2: Comparando la distribución normal estándar (Z) y la distribución t.

E
AD
La distribución t fue desarrollada en 1908 por William S. Gosset, mientras trabajaba

para la compañı́a cervecera Guinness, en Dublin (Irlanda). Gosset publicó sus estudios bajo
el seudónimo Student. A la distribución t a menudo se le denomina t de Student.
Entonces para elaborar un intervalo de confianza para una media poblacional µ cuando
la población tiene distribución normal, la desviación estándar poblacional σ es desconocida y
la muestra es pequeña (n < 30), debemos antes calcular el margen de error o error muestral
(E) empleando la distribución t ası́:
-I I
s
E = tα/2 × √ . (7.13)
22
n
20
Luego sustituyendo (7.13) en (7.2) tenemos que el:

Intervalo de confianza para una media poblacional µ cuando la población tiene

distribución normal, la desviación estándar poblacional σ es desconocida y la
muestra es pequeña (n < 30) es:
s
x ± tα/2 × √ (7.14)
n
Nota: Como la distribución t de Student posee mayor dispersión que la distribución
z, el valor de t en un nivel de confianza dado tiene una magnitud mayor que el valor z
correspondiente.
EP
Como se aprecia en la expresión (7.14), utilizamos un subı́ndice en t para indicar el área

UD
(probabilidad) en el extremo superior de la distribución t. Es decir, ası́ como empleamos Zα/2

para indicar el valor de Z que determina un área de α/2 en la cola superior de la distribución
normal estándar, emplearemos tα/2 para indicar el valor de t que determina un área de α/2
en la cola (o extremo) superior de la distribución t.
A
En el Apéndice A.5 se muestra la Tabla de la Distribución t. Un extracto es mostrado en
IM
la Tabla 7.2. Para poder leer un valor de t en la Tabla debemos entrar con dos informaciones:
-L
los grados de libertad (a partir del tamaño de la muestra empleada) y el área en el extremo
S
superior de la distribución deducida a partir de un nivel de confianza dado.

PU
A continuación se muestra un ejemplo para entender el uso de la Tabla de distribución t.

M
Ejemplo. Encuentre el valor de t para un nivel de confianza de 90 % cuando el tamaño

CA
de la muestra es 11.
Si el tamaño de la muestra es n = 11, los grados de libertad serán: g.l. = n − 1 = 11 − 1 =
10. Por otro lado, si el nivel de confianza es del 90 %, es decir, 1-α=0.90, entonces el área en
α
el extremo superior de la distribución será: =0.05. Entonces en la Tabla observamos que el
2
valor a emplear será t=1.8125.
Para familiarizarse con la estimación de intervalo para una media poblacional (µ) para
el caso mencionado en la expresión (7.14) donde usamos la Distribución t, presentamos a
continuación algunos problemas resueltos.
E
AD
1. Al ensayar un nuevo método de producción, se seleccionaron 18 empleados al azar,

y se les pidió lo probaran. La tasa de producción promedio muestral para los 18
empleados fue 80 partes por hora y la desviación estándar muestral fue 10 partes
por hora. Determine e interprete un intervalo de confianza del 95 % para la tasa de
producción promedio poblacional con el nuevo método, suponiendo que la población
tiene una distribución normal de probabilidades.
-I I
Sea la variable aleatoria: X=“tasa de producción con el nuevo método (partes/hora)”.

22
Según el enunciado no hay información sobre la media µ de X, ya que el objetivo va

20
ser estimarla y tampoco se conoce la desviación estándar de X (variable poblacional),

σ. En el enunciado del problema se supone que X sigue distribución normal, por lo que

X ∼ N µ, σ 2 . Esta variable como hemos dicho hace referencia a la población de tasas
de producción de empleados.
Área (probabilidad)
en extremo superior
EP
0 t
UD
Grados de Área en el extremo superior

A
libertad 0.10 0.05 0.025 0.01 0.005
IM
1 3.0777 6.3138 12.7062 31.8205 63.6567

2 1.8856 2.9200 4.3027 6.9646 9.9248
-L
3 1.6377 2.3534 3.1824 4.5407 5.8409

S
4 1.5332 2.1318 2.7764 3.7469 4.6041

PU
5 1.4759 2.0150 2.5706 3.3649 4.0321

M
6 1.4398 1.9432 2.4469 3.1427 3.7074

CA
7 1.4149 1.8946 2.3646 2.9980 3.4995

8 1.3968 1.8595 2.3060 2.8965 3.3554
9 1.3830 1.8331 2.2622 2.8214 3.2498
10 1.3722 1.8125 2.2281 2.7638 3.1693
11 1.3634 1.7959 2.2010 2.7181 3.1058
12 1.3562 1.7823 2.1788 2.6810 3.0545
Tabla 7.2: Extracto de la Tabla de Distribución t. En el Apéndice A.5 aparece una versión más extensa.
Ahora si se toma una muestra de 18 empleados y se va a emplear la tasa promedio de

los 18 empleados para estimar la tasa de producción promedio poblacional µ, estando
E
AD
en el caso en que la muestra n = 18 es pequeña (n < 30), σ es desconocida y que

la variable poblacional X sigue distribución normal, podemos utilizar la Distribución t
para cuantificar el margen de error.
Entonces, si el tamaño de la muestra es n = 18, los grados de libertad serán:
g.l. = n − 1 = 18 − 1 = 17. Por otro lado, la estimación se realizará a un nivel de
confianza del 95 %, es decir, 1-α=0.95, entonces el área en el extremo superior de la
α
distribución será: =0.025. De la Tabla de Distribución t observamos que el valor a
2
emplear será t=2.1098. Otra información que aparece en el enunciado del problema es
-I I
que la desviación estándar encontrada en la muestra es s = 10 partes/hora.

22
Luego de acuerdo a la expresión (7.13), el margen de error es:

20
s 10
E = tα/2 × √ = 2.1098 × √ = 4.97 partes/hora.
n 18
Esto quiere decir, que si seleccionamos una muestra de 18 empleados y empleamos

la tasa promedio de los 18 empleados para estimar la tasa de producción promedio
poblacional µ, hay una probabilidad del 95 % de que la tasa promedio de 18 empleados
se aleje como máximo 4.97 partes/hora de la tasa promedio poblacional.
confianza de 95 % para la tasa promedio poblacional, µ. Si el enunciado del problema
afirma que la media de la muestra empleada es: x = 80 parte/hora, entonces siguiendo
la expresión (7.14), tenemos que el intervalo de confianza para µ será:
EP
s
x ± tα/2 × √
n
UD
80 ± 4.97 partes/hora
A
IM
x − E < µ < x + E.
S -L
80 − 4.97 < µ < 80 + 4.97 partes/hora

PU
75.03 < µ < 84.97 partes/hora.

M
CA
La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran cantidad de

muestras de 18 empleados y calculamos un intervalo de confianza para la tasa promedio
poblacional (µ) con cada una de las muestras, esperamos que alrededor del 95 % de los
intervalos construidos contengan la tasa promedio poblacional, µ.
2. Un estudio sobre la utilización del tiempo constató que 20 Administradores selecciona-

dos aleatoriamente gastan en promedio 2.40 horas por dı́a con una desviación estándar
de 1.30 horas, en realizar trabajo meramente burocrático. Construir e interpretar un
intervalo de confianza de 90 % para el tiempo medio que utiliza la población de admi-
E
nistradores en realizar trabajo meramente burocrático. Asuma que el tiempo empleado

AD
en labores burocráticas por los administradores sigue distribución normal.

Sea la variable aleatoria: X=“Tiempo empleado en labores burocráticas por los
administradores (horas)”. Según el enunciado no hay información sobre la media µ
de X, ya que el objetivo va ser estimarla y tampoco se conoce la desviación estándar
de X (variable poblacional), σ. En el enunciado del problema se supone que X sigue

distribución normal, por lo que X ∼ N µ, σ 2 . Esta variable como hemos dicho hace
referencia a la población.
-I I
Ahora si se toma una muestra de 20 administradores y se va a emplear el tiempo

22
promedio gastado en labores burocráticas por los 20 administradores para estimar el

20
tiempo promedio gastado en trabajo burocrático para la población de administradores

µ, estando en el caso en que la muestra n = 20 es pequeña (n < 30), σ es
desconocida y que la variable poblacional X sigue distribución normal, podemos utilizar
la Distribución t para cuantificar el margen de error.
Entonces, si el tamaño de la muestra es n = 20, los grados de libertad serán:

g.l. = n − 1 = 20 − 1 = 19. Por otro lado, la estimación se realizará a un nivel de
confianza del 90 %, es decir, 1-α=0.90, entonces el área en el extremo superior de la
α
distribución será: =0.05. De la Tabla de Distribución t observamos que el valor a
2
emplear será t=1.7291. Otra información que aparece en el enunciado del problema es
que la desviación estándar encontrada en la muestra es s = 1.30 horas.
s 1.30
E = tα/2 × √ = 1.7291 × √ = 0.50 horas.
EP
n 20
UD
Esto quiere decir, que si seleccionamos una muestra de 20 administradores y empleamos

el tiempo promedio gastado por los 20 administradores para estimar el tiempo promedio
gastado por la población de administradores µ, hay una probabilidad del 90 % de que
A
la tasa promedio de 20 administradores se aleje como máximo 0.50 horas del tiempo
IM
promedio gastado en trabajo burocrático para la población de administradores.

-L

S
PU
confianza de 90 % para el tiempo promedio gastado en trabajo burocrático para la

población de administradores, µ. Si el enunciado del problema afirma que la media de
M
la muestra empleada es: x = 2.40 horas, entonces siguiendo la expresión (7.14), tenemos
CA
que el intervalo de confianza para µ será:
s
x ± tα/2 × √
n
2.40 ± 0.50 horas
x − E < µ < x + E.
E
AD
2.40 − 0.50 < µ < 2.40 + 0.50 /horas
1.90 < µ < 2.90 horas.
La interpretación del intervalo de confianza serı́a: Si seleccionamos una gran cantidad de

muestras de 20 administradores y calculamos un intervalo de confianza para el tiempo
promedio gastado en trabajo burocrático para la población de administradores (µ) con
cada una de las muestras, esperamos que alrededor del 90 % de los intervalos construidos
contengan el tiempo promedio gastado en trabajo burocrático para la población de
-I I
administradores, µ.
22
20
3. Se desea estimar el tiempo promedio diario que un estudiante del Campus Lima usa su
teléfono celular. Para ello se selecciona aleatoriamente a 9 estudiantes y se obtienen los
siguientes datos del tiempo (en minutos) de uso diario: 89, 72, 105, 117, 156, 116, 125,
101, 100. Obtenga e interprete un intervalo de confianza para el tiempo medio diario
de uso del celular de los estudiantes del Campus con un nivel de confianza del 95 %.
Suponga que el tiempo diario de uso de celular sigue distribución normal.
Sea la variable aleatoria: X=“Tiempo diario de uso de celular por los estudiantes
(minutos)”. Según el enunciado no hay información sobre la media µ de X, ya que
el objetivo va ser estimarla y tampoco se conoce la desviación estándar de X (variable
poblacional), σ. En el enunciado del problema se supone que X sigue distribución

normal, por lo que X ∼ N µ, σ 2 . Esta variable como hemos dicho hace referencia a
la población.
EP
Empezamos calculando la media de la muestra, x y la desviación estándar de la muestra,

s:
UD
89 + 72 + 1.5 + 117 + 156 + 116 + 125 + 101 + 100

x= = 109 minutos.
9
s
(89 − 109)2 + (72 − 109)2 + (105 − 109)2 + . . . + (100 − 109)2
s= = 23.7 minutos.
A
9−1
IM
Ahora si se toma una muestra de 9 estudiantes y se va a emplear el tiempo promedio de

-L
uso del celular de los 9 estudiantes para estimar el tiempo promedio de uso de celular
S
PU
para la población de estudiantes µ, estando en el caso en que la muestra n = 9 es

pequeña (n < 30), σ es desconocida y que la variable poblacional X sigue distribución
M
normal, podemos utilizar la Distribución t para cuantificar el margen de error.

CA
Entonces, si el tamaño de la muestra es n = 9, los grados de libertad serán: g.l. =

n − 1 = 9 − 1 = 8. Por otro lado, la estimación se realizará a un nivel de confianza
del 95 %, es decir, 1-α=0.95, entonces el área en el extremo superior de la distribución
α
será: =0.025. De la Tabla de Distribución t observamos que el valor a emplear será
2
t=2.3060.
s 23.7
E = tα/2 × √ = 2.3060 × √ = 18.22 minutos.
E
n 9
AD
Esto quiere decir, que si seleccionamos una muestra de 9 estudiantes y empleamos el

tiempo promedio de uso de celular de 9 estudiantes para estimar el tiempo promedio
de uso de celular de la población de estudiantes µ, hay una probabilidad del 95 % de
que el tiempo promedio de uso de celular de 9 estudiantes se aleje como máximo 18.22
minutos del tiempo promedio de uso de celular de la población de estudiantes.
confianza de 95 % para el tiempo promedio de uso de celular de la población de
-I I
estudiantes, µ. Si la media de la muestra empleada es: x = 109 minutos, entonces

22
siguiendo la expresión (7.14), tenemos que el intervalo de confianza para µ será:

20
s
x ± tα/2 × √
n
109 ± 18.22 minutos

x − E < µ < x + E.
109 − 18.22 < µ < 109 + 18.22 minutos
90.78 < µ < 127.22 minutos.

de muestras de 9 estudiantes y calculamos un intervalo de confianza para el tiempo
EP
promedio de uso de celular de la población de estudiantes (µ) con cada una de las
UD
muestras, esperamos que alrededor del 95 % de los intervalos construidos contengan el

tiempo promedio de uso de celular de la población de estudiantes, µ.
Como conclusión de esta sección, en la Tabla 7.3 se muestra un resumen de los casos
A
vistos para realizar la estimación de intervalo para una media poblacional (µ).
IM
Distribución Desviación Tamaño Uso del TLC Intervalo de

S -L
Caso de la estándar de la (para deducir confianza

PU
población Poblacional (σ) muestra distribución de X) para µ

M
σ
1 Normal Conocida n < 30 No x ± Zα/2 × √
CA
n
2 Desconocida Conocida n ≥ 30 Sı́
s
3 Desconocida Desconocida n ≥ 30 Sı́ x ± Zα/2 × √
n
s
4 Normal Desconocida n < 30 No x ± tα/2 × √
n
Tabla 7.3: Resumen de casos para realizar la estimación de intervalo para una media poblacional (µ).
7.3. Estimación de intervalo para una proporción poblacional (p)

E
En varios tipos de investigación, el mayor interés está en la proporción de elementos con

AD
cierta caracterı́stica de interés, que representa una determinada porción de una población
de estudio. Por ejemplo, podemos estar interesados en saber qué proporción de estudiantes
del Campus Lima fueron al teatro por lo menos una vez el último mes, o la proporción de
clientes que preferirá un nuevo producto que se piensa lanzar al mercado, o la proporción
de hogares que está sintonizando un determinado programa de televisión en cierto horario,
o la proporción de consumidores satisfechos con los servicios prestados por una empresa de
telefonı́a, o la proporción de electores de la ciudad de Lima que votarı́an por un determinado
candidato en caso la elección presidencial se realizara mañana, o la proporción de ciudadanos
-I I
que está de acuerdo con la gestión del actual alcalde de la ciudad, etc. Para este tipo de
22
investigaciones se emplean procedimientos de cálculo que tienen que ver con proporciones.
20
Ellos son muy empleados en estudios de mercado, de opinión, etc.

El objetivo es estimar una proporción poblacional p (desconocida) de elementos en
una población, que presentan cierta caracterı́stica de interés, a partir de la información
proporcionada por una muestra extraı́da de dicha población de estudio.
Es por eso que en esta sección mostraremos cómo usar la distribución muestral de p para
determinar un estimado de intervalo de una proporción poblacional p.
Siguiendo la expresión (7.1) decimos que la forma general de una estimación de intervalo
de confianza para una proporción poblacional p es:
p ± E (7.15)
donde E: Margen de error. La expresión (7.15) es lo mismo que decir que el intervalo de
confianza para p es:
EP
p − E < p < p + E. (7.16)

UD
Margen de error o Error muestral (E)

Como ya fue explicado en la sección 7.2, el valor absoluto de la diferencia entre un
estimador puntual insesgado y el parámetro de población que estima se llama margen de
error o error muestral. Para el caso en el que la proporción de una muestra estima a una
A
IM
proporción poblacional, el error muestral es:

-L
E =| p − p | (7.17)
S
PU
En la práctica no se puede determinar el valor del error muestral, porque no se conoce

M
p, la proporción de la población. Sin embargo, se puede usar la distribución muestral de p

CA
para establecer márgenes de probabilidad acerca del tamaño del error muestral. Como la
distribución muestral de p indica cómo se distribuyen sus valores en torno o alrededor de p,
nos proporciona información acerca de las diferencias posibles entre p y p.
Es decir, se puede probabilı́sticamente afirmar cuál es el valor máximo para el error
muestral si:
1. Conociéramos la distribución muestral de p,
2. Definiéramos el nivel de confianza para la estimación.

E
Respecto al punto 1, las caracterı́sticas de la distribución muestral de p se sugiere

AD
revisar el Capı́tulo 6, sección 6.4.1. De ello sabemos que p se aproxima a una distribución
normal(aplicando el Teorema del Lı́mite Central (TLC) con ciertas condiciones). Por tanto
r !2 
p(1 − p) 
p ∼ N p, , asumiendo que la problación es infinita.
n
Respecto al punto 2, en el caso que el objetivo sea estimar p, el nivel de confianza se
puede definir como, la probabilidad (1-α) de que la proporción muestral se encuentre, como
máximo, a una distancia E de la proporción poblacional p (desconocida), como se aprecia
-I I
en la Figura 7.3. El nivel de confianza (1-α) es el área bajo la curva normal estándar entre
α
22
los valores −Zα/2 y Zα/2 . El área restante es en cada cola de la distribución. Por ejemplo
2
20
si la estimación se realiza con un nivel de confianza del 90 %, es decir, 1-α=0.90, entonces

α
=0.05, lo que hará que Zα/2 =1.645. Ası́, conociéndose el nivel de confianza obtenemos el
2
valor de Z a emplear. Como ya se comentó anteriormente, en la Tabla 7.1 aparecen además
del mencionado, otros niveles de confianza de uso común.
EP
p E p
UD
nivel de confianza
(1 − α)
A
IM
-L
α 2 α 2
S
PU
M
CA
− Zα 2 0 Zα 2 Z
Figura 7.3: Ilustración sobre el nivel de confianza en la distribución muestral de p.
Basados en la explicación lı́neas arriba, decimos que: Dado un nivel de confianza (1-α),
el margen de error o error muestral (E) se calcula como:
E = Zα/2 × σp (7.18)
E
AD
Para el caso de tratar con una población infinita la expresión (7.18) quedarı́a ası́:
r
p(1 − p)
E = Zα/2 × (7.19)
n
Analizando la expresión (7.19) notamos que σp depende de la proporción poblacional p

la cual es desconocida ya que justamente es el valor que estamos intentando estimar. En la
práctica sustituimos
r p por una estimativa puntual, osea p. Esto nos conduce a estimar σp
p(1 − p)
-I I
através de Sp = , por lo que, el margen de error o error muestral (E) se calcula en

n
22
este caso como:

20
r
p(1 − p)
E = Zα/2 × . (7.20)
n
Con el margen de error dado por la expresión (7.20), la expresión para la estimación de
intervalo para una proporción poblacional (p):
Intervalo de confianza para la proporción poblacional (p).

r
p(1 − p)
p ± Zα/2 × . (7.21)
n
Nota: Recuerde que no debe olvidar verificar que la distribución muestral de p puede ser
aproximada por la distribución normal (Aplicación del Teorema del Lı́mite central, como se
explica en la sección 6.4.1 referente a la Forma de la distribución de p).
EP
UD
¿Cómo se interpreta el intervalo de confianza del (1 − α) × 100 % para una

proporción poblacional (p)?
Después de construir un intervalo de confianza es importante interpretar correctamente
los resultados. Suponga que usted ha construido el intervalo de confianza del (1 − α) × 100 %
A
para una proporción poblacional (p). Debido a que, aunque es desconocido, el valor de p
IM
existe y es fijo, por lo tanto dicho valor está o no en el intervalo construido. Por esta razón
-L
no es correcto decir: hay una probabilidad del (1 − α) × 100 % de que el valor de p esté en el
S
PU
intervalo construido.
La forma correcta de interpretar el intervalo de confianza serı́a: Si seleccionamos una gran
M
cantidad de muestras de tamaño n y calculamos un intervalo de confianza para p con cada

CA
una de las muestras, esperamos que alrededor del (1−α)×100 % de los intervalos construidos
contengan la proporción poblacional, p.
Tamaño de muestra requerido si el objetivo es estimar una proporción poblacional

p.
Para un mismo tamaño de muestra n, conforme aumenta el nivel de confianza, el intervalo
se hace más amplio. Conforme el intervalo se hace más amplio, la precisión de la estimación
decrece. Una forma de aumentar la precisión de la estimación es aumentar el tamaño de la
E
muestra. Pero, ¿cuál es el tamaño de la muestra necesario para garantizar cierto nivel de
AD
confianza para un margen de error dado?

Eso dependerá de si estamos tratando con una población infinita o finita.
Si la población es infinita, el tamaño de muestra requerido será: :
2
Zα/2 × p × (1 − p)
n= (7.22)
E2
Si la población es finita, el tamaño de muestra requerido será:

2
-I I
N × Zα/2 × p × (1 − p)
n= 2 (7.23)
22
(N − 1)E 2 + Zα/2 × p × (1 − p)
20
donde N =Tamaño de la población.

Notas:
En caso que el cálculo del tamaño de la muestra n resulte un valor no entero deberá
redondear el resultado siempre al entero superior más próximo.
La expresión (7.22) es obtenida al despejar n de la expresión (7.19). Análogamente la

expresión (7.23) es obtenida al despejar n de la expresión (7.18) considerando para σp
la expresión (6.4).
El empleo de las expresiones (7.22) y (7.23) requieren de un valor de planeación para

la proporción poblacional p. En la práctica se puede utilizar la proporción muestral de
una muestra preliminar o la proporción muestral de una muestra seleccionada a partir
de un estudio piloto. En caso de no poder contar con información alguna sobre el valor
EP
de p se suele emplear p = 0.5. La razón de usar 0.5 como valor de p cuando no hay
UD
estimativa preliminar disponible es porque para ese valor de p se obtiene el máximo

valor para el producto p(1 − p) que se traduce en el máximo valor para el tamaño de la
muestra n. En otras palabras, si no tenemos una estimación preliminar de p debemos
pagar la penalidad de emplear una muestra de mayor tamaño.
A
IM
A continuación presentamos algunos problemas resueltos para familiarizarse con la esti-

mación de intervalo para una proporción poblacional (p) mediante el empleo de la expresión
S -L
(7.21) y del cálculo del Tamaño de muestra requerido si el objetivo es estimar una proporción
PU
poblacional p mediante el empleo de las expresiones (7.22) o (7.23).

M
CA
1. Se realizó una encuesta a una muestra aleatoria simple de 100 votantes y 45 de ellos
dijeron que votarı́an por el congresista Pérez del partido NuestroPerú en las próximas
elecciones congresales. Usar esta información para estimar, con un nivel de confianza
de 95 % la proporción de electores que votarı́an por el congresista Pérez.
Del enunciado del problema encontramos que se pide estimar la proporción de electores
que votarı́an por el congresista Pérez en la población de votantes, osea p. Una estimación
puntual de p es la proporción de electores que votarı́an por el congresista Pérez en la
45
E
muestra encuestada: p = = 0.45.

AD
100
Como se trabaja con una muestra 100 votantes, aplicamos el Teorema del Lı́mite
Central para verificar si se cumplen las dos condiciones: n.p ≥ 5 y n.(1 − p) ≥ 5,
para concluir que la distribución de p se puede aproximar con una distribución normal
(Como se explica en la sección 6.4.1 referente a la Forma de la distribución de p).
Obviamente emplearemos p = 0.45, como estimación puntual de p. Operando tenemos
que n.p = 100 × 0.45 = 45 y n.(1 − p) = 100 × (1 − 0.45) = 55, verificándose que
dichas condiciones se cumplen, por tanto la distribución de p se puede aproximar con
una distribución normal.
-I I
22
Ahora, como el nivel de confianza para la estimación es del 95 % de acuerdo con la Tabla
20
7.1, el valor de “Z” que debemos emplear es 1.96, por tanto, siguiendo la expresión (7.20)
y haciendo los reemplazos respectivos, el margen de error o error muestral será:
r r
p(1 − p) 0.45(1 − 0.45)
E = Zα/2 × = 1.96 × ≈ 0.098.
n 100
Con el margen de error encontrado, construimos el intervalo de confianza de 95 % para

la proporción poblacional (p), de acuerdo a la expresión (7.21)
r
p(1 − p)
p ± Zα/2 × .
n
0.45 ± 0.098.
Lo anterior es lo mismo que decir que el intervalo de confianza para p es, de acuerdo a
EP
p − E < p < p + E.
UD
0.45 − 0.098 < p < 0.45 + 0.098.
A 0.352 < p < 0.548.

IM
de muestras de 100 electores y calculamos un intervalo de confianza para la proporción

-L
de electores que votarı́an por el congresista Pérez en la población de votantes (p)

S
con cada una de las muestras, esperamos que alrededor del 95 % de los intervalos
PU
construidos contengan la proporción de electores que votarı́an por el congresista Pérez

M
en la población de votantes, p.
CA
2. Una empresa está pensando en lanzar un nuevo producto al mercado por lo que desea
estimar, con un nivel de confianza de 95 % y un margen de error del 4 %, la proporción
de clientes que lo comprarı́an. Calcule el tamaño de la muestra necesaria para realizar
la estimación correspondiente.
a) Suponga que no cuenta con información de estudios o encuestas previas sobre

productos similares para definir un valor de planeamiento para p.
Del enunciado del problema tenemos que el nivel de confianza para la estimación
E
es del 95 % por lo que de acuerdo con la Tabla 7.1, el valor de “Z” que debemos
AD
emplear es 1.96. Además el margen de error admitido es del 4 %, osea E=0.04.

Como el objetivo del problema es estimar p: la proporción de clientes que
comprarı́an el producto que se piensa lanzar al mercado y no tenemos información
sobre el tamaño de la población asumimos el caso de población infinita, por lo
que para hallar el tamaño de la muestra necesaria para realizar la estimación
usaremos la expresión (7.22). Como en el enunciado nos dicen que no se cuenta con
información de estudios o encuestas previas sobre productos similares para definir
un valor de planeamiento para p, asumimos que p = 0.5. Entonces el tamaño de
-I I
la muestra requerida será

22
2
20
Zα/2 × p × (1 − p) (1.96)2 × 0.5 × (1 − 0.5)

n= = = 600.25 ≈ 601.
E2 0.042
Se deberı́a encuestar a 601 personas.

b) En cuánto variará el tamaño de la muestra si el margen de error debe ser como

máximo 3 %?
Si el margen de error debe ser como máximo 3 % entonces el tamaño de la muestra
requerida será
2
Zα/2 × p × (1 − p) (1.96)2 × 0.5 × (1 − 0.5)
n= = = 1067.1 ≈ 1068.
E2 0.032
Se deberı́a encuestar a 1068 personas.

EP
3. Se encarga a una empresa de investigación de opinión evaluar el desempeño de un

UD
polı́tico en campaña. Para hacer esto, debe establecer el tamaño de muestra de votantes
a ser entrevistados. Se desea un margen de error de 2.8 puntos porcentuales y un nivel
de 95 % de confianza. A
a) Estudios previos mostraron que el polı́tico tenı́a el 18 % de las preferencias de los
IM
votantes.
-L
En este caso debemos emplear la expresión (7.22) en que el valor de “Z” que
S
debemos emplear es 1.96 (por ser 95 % el nivel de confianza), E = 0.028 y un

PU
valor preliminar de p igual a 0.18. Entonces

M
2
CA
Zα/2 × p × (1 − p) (1.96)2 × 0.18 × (1 − 0.18)

n= = = 723.24 ≈ 724
E2 0.0282
Se deberı́a entrevistar a 724 votantes.

b) No se tiene ninguna información anterior sobre el desempeño del polı́tico.
En este caso debemos emplear la expresión (7.22) en que el valor de “Z” que
debemos emplear es 1.96 (por ser 95 % el nivel de confianza), E = 0.028 y al no
contar con un valor preliminar de p usaremos p = 0.50. Entonces
2
Zα/2 × p × (1 − p) (1.96)2 × 0.50 × (1 − 0.50)
E
n= = = 1225
AD
E2 0.0282
Se deberı́a entrevistar a 1225 votantes.
4. La Municipalidad de un distrito limeño está buscando evaluar el Programa del Adulto

Mayor que funciona en su jurisdicción. El total de adultos mayores inscritos en el
programa son 2000. Se desea establecer el tamaño de muestra a considerar con un nivel
de confianza del 95 % y permitiéndose un margen de error de 3 puntos porcentuales.
En este caso debemos emplear la expresión (7.23) en que el valor de “Z” que debemos
-I I
emplear es 1.96 (por ser 95 % el nivel de confianza), E = 0.03 y al no contar con un

22
valor preliminar de p usaremos p = 0.50. Entonces

20
2
N × Zα/2 × p × (1 − p)
n= 2
(N − 1)E 2 + Zα/2 × p × (1 − p)
2000 × (1.96)2 × 0.5 × (1 − 0.5)

n= = 696.1 ≈ 697
(2000 − 1)0.032 + (1.96)2 × 0.5 × (1 − 0.5)
La muestra debe ser de 697 adultos mayores.

1. Un investigador estudia los factores que afectan el rendimiento de los estudiantes
universitarios del paı́s. Para tal fin selecciona una muestra aleatoria simple de 130
estudiantes y encuentra que el tiempo que dedican al estudio fuera de sus horas de
clase es en promedio 3.4 horas con una varianza de 1.21. Determinar e interpretar un
EP
intervalo confianza del 90 % para el tiempo promedio que estudian fuera de sus horas
UD
de clase la población de estudiantes universitarios del paı́s.
2. Se desea estimar el gasto promedio mensual en dólares que una familia de la ciudad de
Lima gasta en embutidos.
A
IM
a) Calcule cuántas familias se deben tomar como muestra para que la estimación
tenga una confianza de 95 % y un margen de error de 2 dólares. Considere que σ=
-L
9 dólares.
S
PU
b) Realice el cálculo para una urbanización con 850 familias para que la estimación
M
tenga una confianza del 99 % y un margen de error de 1.5 dólares, considerando

CA
que σ= 9 dólares.
3. Una empresa está pensando en lanzar un nuevo producto al mercado por lo que desea
estimar con un nivel de confianza de 95 % y un margen de error del 3 %, el porcentaje
de clientes que lo comprarı́an. Suponga que no cuenta con información de estudios o
encuestas previas sobre productos similares. Calcule el tamaño de la muestra necesaria
para realizar la estimación correspondiente.
4. Se desea estimar la demanda media diaria de un producto que registra una empresa.
Para ello se seleccionan 10 dı́as al azar con los siguientes valores en miles:
E
AD
35, 44, 38, 55, 33, 56, 67, 45, 48, 40.
Obtenga el intervalo de confianza para la demanda media diaria a un nivel de confianza

del 90 %. Suponga que la demanda diaria del producto sigue distribución normal.
5. Se realiza un estudio para conocer la proporción de estudiantes universitarios peruanos

que sufren del sı́ndrome de fatiga crónica (SFC). En una muestra aleatoria simple
de 3066 estudiantes, 590 de ellos afirmaron haber sufrido de fatiga crónica. Usar
-I I
esta información para estimar, con un nivel de confianza de 99 %, la proporción de

22
estudiantes universitarios que sufren de fatiga crónica.

20
6. Se desea estimar la proporción de amas de casa de un pequeño distrito que prefieren

consumir el detergente ExtraClean con un nivel de confianza del 95 % y un margen de
error del 5 %. Calcule el tamaño de la muestra necesaria a encuestar para realizar la
estimación correspondiente en las siguientes situaciones:
a) Suponga que no se conoce el tamaño de la población y no cuenta con información

de estudios o encuestas previas.
b) Suponga que en el distrito hay 2500 familias y en una encuesta anterior, solamente
el 12 % de las amas de casa manifestaron consumir el producto.
7. El gerente de un conocido restaurante afirma que el tiempo de espera (en minutos) de

sus clientes sigue una distribución con varianza de 22.5 minutos2 . Se tomó una muestra
de 32 clientes y se encontró un tiempo medio de espera de 13 minutos. Construya e
interprete un intervalo de confianza del 95 % para el tiempo medio de espera de los
EP
clientes de ese restaurante.

UD
8. Supongamos que el tiempo (en horas) dedicado por los estudiantes de una determinada
asignatura a estudiar para el examen final tiene una distribución normal. Se toma una
muestra aleatoria de 6 estudiantes cuyos tiempos de estudio fueron los siguientes:
A
IM
12.2, 18.4, 23.1, 11.7, 8.2, 24

-L
Calcular e interpretar un intervalo de confianza del 99 % para el tiempo de estudio

S
PU
promedio poblacional
M
9. La Cruz Roja está organizando una campaña de donación de sangre en la Universidad

CA
y se quiere estimar la proporción de personas (entre estudiantes, profesores y

administrativos, etc.) que estarı́an dispuestos a donar sangre. Con una confianza del
99 % y un 4 % de margen de error ¿A cuántas personas se debe entrevistar? Suponga
que el tamaño de la población es de 3000 individuos.
10. Una encuesta reunió datos acerca de cómo consideran los peruanos la calidad de la
información en los diarios y en TV. Una de las preguntas fue si el encuestado cree que
lo que se dice de la economı́a peruana es equilibrado, muy negativo o muy positivo. Los
estimados preliminares son de que un 50 % de la población cree que la información es
E
equilibrada.
AD
a) ¿Qué tamaño de muestra se recomienda para que el margen deseado de error sea
de 3.3 %? Emplee el 95 % de nivel de confianza.
b) ¿Qué tamaño se recomienda para que el error sea de 2.5 %, con 95 % de confianza?
11. Se tomó al azar una muestra aleatoria de 120 estudiantes de la Universidad de

Piura|Campus Lima y se encontró que 54 de ellos hablaban inglés. Obtener e interpretar
un intervalo de confianza del 90 % para la proporción poblacional p de estudiantes de
-I I
la Universidad de Piura|Campus Lima que hablan inglés.

22
12. La ingesta diaria media de vitamina D en una muestra de 36 escolares de educación

20
primaria ha resultado ser de 4.5 microgramos y la correspondiente desviación tı́pica fue

de 2.02 microgramos. Obtener e interpretar un intervalo de confianza del 99 % para la
ingesta media de vitamina D en la población de escolares de primaria.
13. El precio (en dólares) de ciertos electrodomésticos fabricados por una empresa, se puede
considerar una variable que sigue una distribución normal con desviación tı́pica igual a
100 dólares. Se toma una muestra aleatoria de 9 de estos electrodomésticos y el precio
de cada uno es:
255, 85, 120, 290, 80, 80, 275, 290, 135
Encontrar e interpretar un intervalo confianza del 95 %, para el precio promedio de

todos los electrodomésticos fabricados por dicha empresa.
EP
14. Una empresa de cable desea conocer qué proporción de sus clientes se informan de
UD
las noticias a través de los noticiarios que difunden. Para ello seleccionó una muestra
aleatoria simple de 200 clientes y 110 respondieron que se informan a través de los
noticiarios televisivos. Calcular e interpretar un intervalo de confianza del 95 % para la
proporción poblacional de clientes que se informan a través de los noticiarios televisivos.
A
IM
15. El gasto semanal de fotocopias, en soles, de los estudiantes de una escuela de posgrado
-L
sigue distribución normal con varianza igual a 144. Se toma una muestra aleatoria
S
PU
de 9 de estos estudiantes resultando los valores siguientes para esos gastos:100, 150,
90, 70, 75, 105, 200, 120, 80. Con el análisis visto en clase, determine e interprete un
M
intervalo confianza del 90 %, para el gasto promedio semanal en fotocopias para todos
CA
los estudiantes de dicha escuela.
16. Resuelva el problema anterior suponiendo que no conociera la varianza poblacional.
17. Un analista de investigación de mercados recopila datos de una muestra aleatoria de

100 clientes que adquirieron equipo electrónico de una tienda especializada. Los 100
clientes gastaron un promedio de 24570 soles con una desviación tı́pica de 660 soles.
Con el análisis visto en clase, determine e interprete un intervalo confianza del 90 %,
para el gasto promedio de todos los clientes de la tienda.
E
AD
18. Para estudiar la viabilidad de lanzar un nuevo producto al mercado, el gerente de

una gran empresa contrata a una empresa de consultorı́a estadı́stica para estudiar la
aceptación del producto entre los clientes potenciales. El gerente desea obtener una
estimación con un error máximo del 1 % y una confianza del 90 % y pide al consultor
estadı́stico que calcule el tamaño de muestra requerido.
a) Con la información proporcionada y sin tener información previa que sugiera un

posible valor para p, el consultor calcula el tamaño de muestra requerido ¿Cuál es
el tamaño de muestra obtenido por el consultor?
-I I
22
b) El gerente cree que el costo de tal muestra serı́a muy alto y autoriza al consultor a
20
realizar un estudio piloto con una muestra de 100 personas para obtener una
estimación puntual de la proporción verdadera p. El estudio piloto indicó un
76 % de aceptación del nuevo producto. Con base en esa información, el consultor
recalcula el tamaño de la muestra necesaria. ¿Cuál es ese tamaño?
c) Selecionada la muestra con el tamaño obtenido en el apartado anterior, se obtuvo

un 72 % de clientes favorables al produto. Construya e interprete un intervalo de
confianza del 95 % para la verdadera proporción p de clientes que aceptarı́an el
producto.
19. Un fabricante de una determinada marca de vehı́culos de lujo sabe que el consumo de
gasolina de sus vehı́culos se distribuye normalmente. Se selecciona una muestra aleatoria
de 6 automóviles (y observando el consumo cada 100 km.) se obtiene un promedio de
19.48 con una varianza de 0.96. Con el análisis visto en clase, determine e interprete
EP
un intervalo de confianza del 90 % para el consumo medio de gasolina de todos los

vehı́culos de esa marca.
UD
20. En una ciudad se hace un estudio de marketing de una nueva crema dental y se toma una
muestra aleatoria simple de 50 mujeres residentes de la ciudad. El 60 % de esas mujeres
responde que les gustó la nueva crema dental. Encontrar e interpretar un intervalo de
A
IM
confianza del 90 % para la proporción de mujeres en la ciudad que les gustarı́a la nueva
crema.
S -L
21. Muchas veces los padres prestan el teléfono celular a sus pequeños hijos para
PU
mantenerlos tranquilos y sin protestar. Se realizó un estudio para estimar el tiempo

M
promedio diario que un niño de entre 7 y 12 años usa el teléfono celular de sus padres
CA
para jugar. Para ello se seleccionó aleatoriamente a 8 niños con edades en ese rango y se
obtuvieron los siguientes datos del tiempo (en minutos) de uso diario: 116, 100, 116, 72,
156, 125, 89, 100. Obtenga e interprete un intervalo de confianza para el tiempo medio
diario de uso del celular por niños de entre 7 a 12 años con un nivel de confianza del
99 %. Suponga que el tiempo diario de uso de celular por los niños sigue distribución
normal.
22. Estamos interesados en conocer el consumo diario medio de cigarrillos entre los alumnos
de universidades de la ciudad. Seleccionada una muestra aleatoria simple de 100
E
alumnos se observó que fumaban en promedio, 8 cigarrillos diarios. Si admitimos que la

AD
varianza poblacional de dicho consumo es de 16, Encontrar e interpretar un intervalo de

confianza del 90 % para el consumo medio de cigarrillos de los alumnos universitarios.
23. Una cafeterı́a evalúa la posibilidad de poner una sala de fumadores si el porcentaje de
usuarios de la cafeterı́a que fuma supera el 60 %. Un estudio sobre 50 usuarios elegidos
aleatoriamente indica que 26 de ellos fuman y 24 no.
a) Construya un intervalo de confianza al 95 % para el porcentaje de usuarios de la

-I I
cafeterı́a que fuman.

22
b) ¿A qué número de personas habrı́a que encuestar, con el mismo nivel de confianza
20
anterior, para que la diferencia entre la proporción muestral y la proporción

poblacional (es decir, el margen de error) de fumadores, sea como máximo de
0.05? Suponga que no dispone de datos históricos para establecer un valor de
planeación para p.
24. Una encuesta a una muestra 1,000 usuarios de smartphones encontró que el tiempo
diario promedio empleado en comunicación con el dispositivo era de 131.4 minutos. De
estudios anteriores, se supone que la desviación estándar poblacional es 21.2 minutos. La
comunicación incluye mensaje de texto, correo electrónico, redes sociales y conexiones.
Encuentre e interprete un intervalo de confiança de 95 % para el tempo medio diario
empleados en comunicación en un smartphone para la población de usuarios?
25. En un estudio se entrevistó a 1024 personas preguntándoles su opinión sobre

el calentamiento global. De los encuestados, 389 dijeron que pensaban que el
EP
calentamiento global representarı́a una seria amenaza para su estilo de vida durante su
existencia. Encuentre e interprete un intervalo de confianza de 90 % para la proporción
UD
poblacional de personas que creen que el calentamiento global representará una seria
amenaza a su estilo de vida durante su existencia.
26. Imagine que un compañero de su sección llevó a cabo un estudio e informó que el
A
IM
intervalo de confianza de 95 % de la media poblacional variaba de 46 a 54. Su compañero

estaba seguro de que la media de la muestra era de 50; de que la desviación estándar de
-L
la muestra que empleó era de 16, y de que el tamaño de la muestra era de por lo menos
S
PU
30 elementos, pero no recordaba el tamaño exacto. Encuentre el tamaño de muestra

M
empleado.
CA
27. Deseamos determinar con un margen de error de 4 %, la proporción de amas de casa que
usan e-mail. Asumiendo que queremos uma confianza de 90 % en nuestros resultados,
determine el tamaño de la muestra si:
a) Un estudo piloto indicó que 16,9 % de las amas de casa utilizan e-mail.
b) No hay información previa que sugiera un posible valor para p.
28. Se realizó una encuesta de opinión en una gran empresa con el objetivo, entre otras
cosas, estimar el ı́ndice promedio de satisfacción de los empleados con las condiciones
E
de trabajo que se les ofrecen (instalaciones, equipo, etc.). El ı́ndice de satisfacción de

AD
cada empleado se puede medir en una escala de cero a cien puntos, y su variabilidad es
tal que la desviación estándar de la población es de 30 puntos.
a) Si 324 empleados fueron seleccionados al azar para ser encuestados ¿cuál es el nivel
de confianza a emplear para que el margen de error sea como máximo 3 puntos?
b) ¿Cuál deberı́a ser el tamaño de la muestra de empleados a ser encuestados para que
el margen de error sea como máximo 1.5 puntos con el mismo nivel de confianza
encontrado en el apartado a)? Comente el resultado obtenido.
-I I
22
c) Con base en la muestra de 324 empleados, construya e interprete un intervalo de

20
95 % de confianza para el ı́ndice de satisfacción medio poblacional, µ, admitiendo

que el ı́ndice promedio de satisfacción de la muestra de encuestados fue de 72
puntos.
29. En un estudio de mercado, 57 de las 150 personas entrevistadas dijeron que comprarı́an
cierto producto lanzado por una empresa. ¿Esta muestra es suficiente para estimar la
verdadera proporción de futuros compradores con un margen de error de 8 % y un 90 %
de confianza? En caso de no ser suficiente, calcule el tamaño de la muestra requerida.
30. Se desea realizar un estudio para estimar el salario promedio de los ejecutivos con
formación en Administración de empresas en el Perú. Para la estimación se establece
un nivel de confiança de 95 % y se admitirá un error máximo de 500 soles. Como no
se conoce la desviación estándar de los salarios de todos los ejecutivos con formación
EP
en Administración de empresas del paı́s, se realizó una pequeña encuesta entre 31

ejecutivos seleccionados aleatoriamente y se encontró una desviación estándar de 6538
UD
soles. Calcular cuántas entrevistas serán necesarias en este estudio.
31. Una compañı́a de seguros quiere estimar el porcentaje de conductores que usan
sus teléfonos celulares mientras conducen. En una muestra de 850 conductores, 544
A
IM
confirmaron usar el teléfono celular mientras conducen. Determinar e interpretar un

intervalo de confianza con 90 % de confianza para ese porcentaje.
S -L
32. En una encuesta aplicada a 10 personas se encontró que en promedio ven 2.5 horas de
PU
televisión al dı́a con una desviación estándar de 0.8 horas. Con un nivel de confianza del
M
95 % estime e interprete un intervalo de confianza para el tiempo promedio utilizado

CA
por la población en ver televisión. Asuma que el tiempo empleado en ver televisión
sigue distribución normal.
33. En un estudio de investigación de mercado, se entrevistó a 400 personas sobre su

preferencia por un producto. De estas 400 personas, 240 dijeron que prefieren el
producto.
a) Determine e interprete un intervalo confianza del 99 %, para la proporción de

preferencia del consumidor en general para este producto.
E
b) ¿A cuántas personas habrı́a que encuestar para realizar la estimación con un

AD
margen de error del 4 %, al nivel de confianza de 99 %? Suponga que no cuenta

con información para definir un valor preliminar para p.
34. Un operador de televisión por cable realizó una investigación de mercado con sus
suscriptores con el objetivo, entre otras cosas, estimar la proporción p de personas que
estarı́an dispuestas a contratar una mejora en el servicio que se les ofrece actualmente
a cambio de un cierto descuento en el precio.
-I I
a) Si se empleara una muestra de 30 suscriptores ¿cuál es el nivel de confianza a

emplear para que el margen de error sea como máximo 10 %?
22
20
b) Con base en la muestra de 30 suscriptores, construya e interprete un intervalo de

95 % de confianza para p, admitiendo que 9 de los 30 encuestados manifestaron
estar dispuestos a contratar la mejora propuesta.
c) ¿Cuál es el tamaño de una nueva muestra suficiente para garantizar que la

proporción p de suscriptores dispuestos a contratar la mejora propuesta pueda
ser estimada con nivel de confianza de 95 % y un margen de error que sea como
máximo 8 %? Suponga que no se sabe nada sobre el valor de p.
d ) ¿Cuál es el tamaño de una nueva muestra suficiente para garantizar que la
proporción p de suscriptores dispuestos a contratar la mejora propuesta pueda
ser estimada con nivel de confianza de 95 % y un margen de error que sea como
máximo 8 %? Suponga que por estudios anteriores el valor de p es 0.35.
EP
UD
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
UD
EP
Tablas
Apéndice A
CA
M
PU
S -L
IM
A
303
AD
E
20
22
-I I
UD
EP
A.1.
Tabla de números aleatorios
columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-55 56-60 61-65 66-70
fila
CA
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 99570 91291 90700
2 22368 46573 25595 85393 30995 89198
M 37982 53402 93965 34095 52666 19174 39615 99505
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 19655 63348 58629
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 74917 97758 16379
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 06927 01263 54613
PU
6 77921 06907 11008 42751 27756 53498 18602S 70659 90665 15053 21916 81825 44394 42880
7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 21069 10634 12952
8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 84903 42508 32307
-L
9 89579 14342 63661 10228 17453 18103 57740 84378 25331 12566 58678 44947 05585 56941
10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 11458 18593 64952
IM
11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 85590 97610 78188
12 63553 40961 48235 03427 49626 69445 18663 72695 52180
A 20847 12234 90511 33703 90322
Tabla de números aleatorios
13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 27156 30613 74952
14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 20285 29975 89868
15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 74461 28551 90707
16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 63990 75601 40719
17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 44919 05944 55157
18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 01915 92747 64951
AD
19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 17752 35156 35749
20 07056
E
97628 33787 09998 42698 06691 76988 13602 51851 46104 88916 19509 25625 58104
21 48663 91245 85828 14346 09172 30168 90229 04734 59193 22178 30421 61666 99904 32812
22 54164 58492 22421 74103 47070 25306 76468 26384 58151 06646 21524 15227 96909 44592
23 32639 32363 05597 24200 13363 38005 94342 28728 35806 06912 17012 64161 18296 22851
24 29334 37001 87637 87308 58731 00256 45834 15398 46557 41135 10367 07684 36188 18510
25 02488 33062 28834 07351 19731 92420 60952 61280 50001 67658 32586 86679 50720 94953
26 81525 72295 04839 96423 24878 82651 66566 14778 76797 14780 13300 87074 79666 95725
27 29676 20591 68086 26432 46901 20849 89768 81536 86645 12659 92259 57102 80428 25280
28 00742 57392 39064 66432 84673 40027 32832 61362 98947 96067 64760 64584 96096 98253
29 05366 04213 25669 26422 44407 44048 37937 63904 45766 66134 75470 66520 34693 90449
30 91921 26418 64117 94305 26766 25940 39972 22209 71500 64568 91402 42416 07844 69618
31 00582 04711 87917 77341 42206 35126 74087 99547 81817 42607 43808 76655 62028 76630
32 00725 69884 62797 56170 86324 88072 76222 36086 84637 93161 76038 65855 77919 88006
33 69011 65795 95876 55293 18988 27354 26575 08625 40801 59920 29841 80150 12777 48501
34 25976 57948 29888 88604 67917 48708 18912 82271 65424 69774 33611 54262 85963 03547
35 09763 83473 73577 12908 30833 18317 28290 35797 05998 41688 34952 37888 38917 88050
20
22
-I I
APÉNDICE A. TABLAS 305
A.2. Tabla: Probabilidades Binomiales

EP
UD
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Tabla: Probabilidades Binomiales
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 EP0,80 0,90 0,95
2 0 1 0,9801 0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500 0,1600 0,0900 0,0400 0,0100 0,0025

1 2 0,0198 0,0950 0,1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000 0,4800 0,4200 0,3200 0,1800 0,0950
2 1 0,0001 0,0025 0,0100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500 0,3600 0,4900 0,6400 0,8100 0,9025
3 0 1 0,9703 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250 0,0640 0,0270 0,0080 0,0010 0,0001
1 3 0,0294 0,1354 0,2430 0,3251 0,3840 0,4219 0,4410 0,4436 0,4320 0,4084 0,3750 0,2880 0,1890 0,0960 0,0270 0,0071
2 3 0,0003 0,0071 0,0270 0,0574 0,0960 0,1406 0,1890 0,2389 0,2880 0,3341 0,3750 0,4320 0,4410 0,3840 0,2430 0,1354
3 1 0,0001 0,0010 0,0034 0,0080 0,0156 0,0270 0,0429 0,0640 0,0911 0,1250 0,2160 0,3430 0,5120 0,7290 0,8574
4 0 1 0,9606 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0625 0,0256 0,0081 0,0016 0,0001
1 4 0,0388 0,1715 0,2916 0,3685 0,4096 0,4219 0,4116 0,3845 0,3456 0,2995 0,2500 0,1536 0,0756 0,0256 0,0036 0,0005
2 6 0,0006 0,0135 0,0486 0,0975 0,1536 0,2109 0,2646 0,3105 0,3456 0,3675 0,3750 0,3456 0,2646 0,1536 0,0486 0,0135
CA
3 4 0,0005 0,0036 0,0115 0,0256 0,0469 0,0756 0,1115 0,1536 0,2005 0,2500 0,3456 0,4116 0,4096 0,2916 0,1715
4 1 0,0001 0,0005 0,0016 0,0039 0,0081 0,0150 M
0,0256 0,0410 0,0625 0,1296 0,2401 0,4096 0,6561 0,8145
5 0 1 0,9510 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0313 0,0102 0,0024 0,0003
PU
1 5 0,0480 0,2036 0,3281 0,3915 0,4096 0,3955 0,3601 0,3124 0,2592 0,2059 0,1563 0,0768 0,0284 0,0064 0,0005
2 10 0,0010 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3456
S
0,3369 0,3125
-L 0,2304 0,1323 0,0512 0,0081 0,0011
3 10 0,0011 0,0081 0,0244 0,0512 0,0879 0,1323 0,1811 0,2304 0,2757 0,3125 0,3456 0,3087 0,2048 0,0729 0,0214
4 5 0,0005 0,0022 0,0064 0,0146 0,0284 0,0488 0,0768 0,1128 0,1563 0,2592 0,3602 0,4096 0,3280 0,2036
IM
5 1 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0185 0,0313 0,0778
A 0,1681 0,3277 0,5905 0,7738
6 0 1 0,9415 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0467 0,0277 0,0156 0,0041 0,0007 0,0001
1 6 0,0571 0,2321 0,3543 0,3993 0,3932 0,3560 0,3025 0,2437 0,1866 0,1359 0,0938 0,0369 0,0102 0,0015 0,0001
2 15 0,0014 0,0305 0,0984 0,1762 0,2458 0,2966 0,3241 0,3280 0,3110 0,2780 0,2344 0,1382 0,0595 0,0154 0,0012 0,0001
3 20 0,0021 0,0146 0,0415 0,0819 0,1318 0,1852 0,2355 0,2765 0,3032 0,3125 0,2765 0,1852 0,0819 0,0146 0,0021
4 15 0,0001 0,0012 0,0055 0,0154 0,0330 0,0595 0,0951 0,1382 0,1861 0,2344 0,3110 0,3241 0,2458 0,0984 0,0305
AD
5 6 0,0001 0,0004 0,0015 0,0044
E 0,0102 0,0205 0,0369 0,0609 0,0938 0,1866 0,3025 0,3932 0,3543 0,2321
6 1 0,0001 0,0002 0,0007 0,0018 0,0041 0,0083 0,0156 0,0467 0,1176 0,2621 0,5314 0,7351
7 0 1 0,9321 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078 0,0016 0,0002
1 7 0,0659 0,2573 0,3720 0,3960 0,3670 0,3115 0,2471 0,1848 0,1306 0,0872 0,0547 0,0172 0,0036 0,0004
2 21 0,0020 0,0406 0,1240 0,2097 0,2753 0,3115 0,3177 0,2985 0,2613 0,2140 0,1641 0,0774 0,0250 0,0043 0,0002
3 35 0,0036 0,0230 0,0617 0,1147 0,1730 0,2269 0,2679 0,2903 0,2918 0,2734 0,1935 0,0972 0,0287 0,0026 0,0002
4 35 0,0002 0,0026 0,0109 0,0287 0,0577 0,0972 0,1442 0,1935 0,2388 0,2734 0,2903 0,2269 0,1147 0,0230 0,0036
5 21 0,0002 0,0012 0,0043 0,0115 0,0250 0,0466 0,0774 0,1172 0,1641 0,2613 0,3177 0,2753 0,1240 0,0406
6 7 0,0001 0,0004 0,0013 0,0036 0,0084 0,0172 0,0320 0,0547 0,1306 0,2471 0,3670 0,3720 0,2573
7 1 0,0001 0,0002 0,0006 0,0016 0,0037 0,0078 0,0280 0,0824 0,2097 0,4783 0,6983
8 0 1 0,9227 0,6634 0,4305 0,2725 0,1678 0,1001 0,0576 0,0319 0,0168 0,0084 0,0039 0,0007 0,0001
1 8 0,0746 0,2793 0,3826 0,3847 0,3355 0,2670 0,1977 0,1373 0,0896 0,0548 0,0313 0,0079 0,0012 0,0001
20
2 28 0,0026
22 0,0515 0,1488 0,2376 0,2936 0,3115 0,2965 0,2587 0,2090 0,1569 0,1094 0,0413 0,0100 0,0011
3 56 0,0001 0,0054 0,0331 0,0839 0,1468 0,2076 0,2541 0,2786 0,2787 0,2568 0,2188 0,1239 0,0467 0,0092 0,0004
4 70 0,0004 0,0046 0,0185 0,0459 0,0865 0,1361 0,1875 0,2322 0,2627 0,2734 0,2322 0,1361 0,0459 0,0046 0,0004
-I I
5 56 0,0004 0,0026 0,0092 0,0231 0,0467 0,0808 0,1239 0,1719 0,2188 0,2787 0,2541 0,1468 0,0331 0,0054
6 28 0,0002 0,0011 0,0038 0,0100 0,0217 0,0413 0,0703 0,1094 0,2090 0,2965 0,2936 0,1488 0,0515
7 8 0,0001 0,0004 0,0012 0,0033 0,0079 0,0164 0,0313 0,0896 0,1977 0,3355 0,3826 0,2793
8 1 0,0001 0,0002 0,0007 0,0017 0,0039 0,0168 0,0576 0,1678 0,4305 0,6634
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95

UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
9 0 1 0,9135 0,6302 0,3874 0,2316 0,1342 0,0751 0,0404 0,0207 0,0101 0,0046 0,0020 0,0003

1 9 0,0830 0,2985 0,3874 0,3679 0,3020 0,2253 0,1556 0,1004 0,0605 0,0339 0,0176 0,0035 0,0004
2 36 0,0034 0,0629 0,1722 0,2597 0,3020 0,3003 0,2668 0,2162 0,1612 0,1110 0,0703 0,0212 0,0039 0,0003
3 84 0,0001 0,0077 0,0446 0,1069 0,1762 0,2336 0,2668 0,2716 0,2508 0,2119 0,1641 0,0743 0,0210 0,0028 0,0001
4 126 0,0006 0,0074 0,0283 0,0661 0,1168 0,1715 0,2194 0,2508 0,2600 0,2461 0,1672 0,0735 0,0165 0,0008
5 126 0,0008 0,0050 0,0165 0,0389 0,0735 0,1181 0,1672 0,2128 0,2461 0,2508 0,1715 0,0661 0,0074 0,0006
6 84 0,0001 0,0006 0,0028 0,0087 0,0210 0,0424 0,0743 0,1160 0,1641 0,2508 0,2668 0,1762 0,0446 0,0077
7 36 0,0000 0,0003 0,0012 0,0039 0,0098 0,0212 0,0407 0,0703 0,1612 0,2668 0,3020 0,1722 0,0629
8 9 0,0001 0,0004 0,0013 0,0035 0,0083 0,0176 0,0605 0,1556 0,3020 0,3874 0,2985
9 1 0,0001 0,0003
CA 0,0008 0,0020 0,0101 0,0404 0,1342 0,3874 0,6302
10 0 1 0,9044 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010 0,0001
1 10 0,0914 0,3151 0,3874 0,3474 0,2684 0,1877 0,1211 0,0725 0,0403
M 0,0207 0,0098 0,0016 0,0001
2 45 0,0042 0,0746 0,1937 0,2759 0,3020 0,2816 0,2335 0,1757 0,1209 0,0763 0,0439 0,0106 0,0014 0,0001
3 120 0,0001 0,0105 0,0574 0,1298 0,2013 0,2503 0,2668 0,2522 0,2150 0,1665 0,1172 0,0425 0,0090 0,0008
PU
4 210 0,0010 0,0112 0,0401 0,0881 0,1460 0,2001 0,2377 0,2508 0,2384
S 0,2051 0,1115 0,0368 0,0055 0,0001
5 252 0,0001 0,0015 0,0085 0,0264 0,0584 0,1029 0,1536 0,2007 0,2340 0,2461
-L 0,2007 0,1029 0,0264 0,0015 0,0001
6 210 0,0001 0,0012 0,0055 0,0162 0,0368 0,0689 0,1115 0,1596 0,2051
IM 0,2508 0,2001 0,0881 0,0112 0,0010
7 120 0,0001 0,0008 0,0031 0,0090 0,0212 0,0425 0,0746 0,1172 0,2150 0,2668 0,2013 0,0574 0,0105
8 45 0,0001 0,0004 0,0014 0,0043 0,0106 0,0229 0,0439 0,1209
A 0,2335 0,3020 0,1937 0,0746
9 10 0,0001 0,0005 0,0016 0,0042 0,0098 0,0403 0,1211 0,2684 0,3874 0,3151
10 1 0,0001 0,0003 0,0010 0,0060 0,0282 0,1074 0,3487 0,5987
11 0 1 0,8953 0,5688 0,3138 0,1673 0,0859 0,0422 0,0198 0,0088 0,0036 0,0014 0,0005 0,0000
1 11 0,0995 0,3293 0,3835 0,3248 0,2362 0,1549 0,0932 0,0518 0,0266 0,0125 0,0054 0,0007 0,0000
AD
2 55 0,0050 0,0867 0,2131 0,2866 0,2953 0,2581 0,1998 0,1395 0,0887 0,0513 0,0269 0,0052 0,0005
3 165 0,0002 0,0137 0,0710 0,1517 E
0,2215 0,2581 0,2568 0,2254 0,1774 0,1259 0,0806 0,0234 0,0037 0,0002
4 330 0,0014 0,0158 0,0536 0,1107 0,1721 0,2201 0,2428 0,2365 0,2060 0,1611 0,0701 0,0173 0,0017
5 462 0,0001 0,0025 0,0132 0,0388 0,0803 0,1321 0,1830 0,2207 0,2360 0,2256 0,1471 0,0566 0,0097 0,0003
6 462 0,0003 0,0023 0,0097 0,0268 0,0566 0,0985 0,1471 0,1931 0,2256 0,2207 0,1321 0,0388 0,0025 0,0001
7 330 0,0003 0,0017 0,0064 0,0173 0,0379 0,0701 0,1128 0,1611 0,2365 0,2201 0,1107 0,0158 0,0014
8 165 0,0002 0,0011 0,0037 0,0102 0,0234 0,0462 0,0806 0,1774 0,2568 0,2215 0,0710 0,0137
9 55 0,0001 0,0005 0,0018 0,0052 0,0126 0,0269 0,0887 0,1998 0,2953 0,2131 0,0867
10 11 0,0000 0,0002 0,0007 0,0021 0,0054 0,0266 0,0932 0,2362 0,3835 0,3293
11 1 0,0000 0,0002 0,0005 0,0036 0,0198 0,0859 0,3138 0,5688
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95

20
22
-I I
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
12 0 1 0,8864 0,5404 0,2824 0,1422 0,0687 0,0317 0,0138 0,0057 0,0022 0,0008 0,0002

1 12 0,1074 0,3413 0,3766 0,3012 0,2062 0,1267 0,0712 0,0368 0,0174 0,0075 0,0029 0,0003
2 66 0,0060 0,0988 0,2301 0,2924 0,2835 0,2323 0,1678 0,1088 0,0639 0,0339 0,0161 0,0025 0,0002
3 220 0,0002 0,0173 0,0852 0,1720 0,2362 0,2581 0,2397 0,1954 0,1419 0,0923 0,0537 0,0125 0,0015 0,0001
4 495 0,0021 0,0213 0,0683 0,1329 0,1936 0,2311 0,2367 0,2128 0,1700 0,1208 0,0420 0,0078 0,0005
5 792 0,0002 0,0038 0,0193 0,0532 0,1032 0,1585 0,2039 0,2270 0,2225 0,1934 0,1009 0,0291 0,0033 0,0000
6 924 0,0005 0,0040 0,0155 0,0401 0,0792 0,1281 0,1766 0,2124 0,2256 0,1766 0,0792 0,0155 0,0005
7 792 0,0000 0,0006 0,0033 0,0115 0,0291 0,0591 0,1009 0,1489 0,1934 0,2270 0,1585 0,0532 0,0038 0,0002
8 495 0,0001 0,0005 0,0024 0,0078 0,0199 0,0420 0,0762 0,1208 0,2128 0,2311 0,1329 0,0213 0,0021
9 220 0,0001 0,0004 0,0015 0,0048 0,0125 0,0277 0,0537 0,1419 0,2397 0,2362 0,0852 0,0173
10 66 0,0002 0,0008 0,0025 0,0068 0,0161 0,0639 0,1678 0,2835 0,2301 0,0988
CA
11 12 0,0001 0,0003
M 0,0010 0,0029 0,0174 0,0712 0,2062 0,3766 0,3413
12 1 0,0001 0,0002 0,0022 0,0138 0,0687 0,2824 0,5404
13 0 1 0,8775 0,5133 0,2542 0,1209 0,0550 0,0238 0,0097 0,0037 0,0013 0,0004 0,0001
PU
1 13 0,1152 0,3512 0,3672 0,2774 0,1787 0,1029 0,0540 0,0259 0,0113 0,0045
S 0,0016 0,0001
2 78 0,0070 0,1109 0,2448 0,2937 0,2680 0,2059 0,1388 0,0836 0,0453 0,0220 -L0,0095 0,0012 0,0001
3 286 0,0003 0,0214 0,0997 0,1900 0,2457 0,2517 0,2181 0,1651 0,1107 0,0660 0,0349
IM 0,0065 0,0006
4 715 0,0028 0,0277 0,0838 0,1535 0,2097 0,2337 0,2222 0,1845 0,1350 0,0873 0,0243 0,0034 0,0001
5 1287 0,0003 0,0055 0,0266 0,0691 0,1258 0,1803 0,2154 0,2214 0,1989 0,1571A 0,0656 0,0142 0,0011
6 1716 0,0008 0,0063 0,0230 0,0559 0,1030 0,1546 0,1968 0,2169 0,2095 0,1312 0,0442 0,0058 0,0001
7 1716 0,0001 0,0011 0,0058 0,0186 0,0442 0,0833 0,1312 0,1775 0,2095 0,1968 0,1030 0,0230 0,0008
8 1287 0,0001 0,0011 0,0047 0,0142 0,0336 0,0656 0,1089 0,1571 0,2214 0,1803 0,0691 0,0055 0,0003
9 715 0,0001
AD 0,0009 0,0034 0,0101 0,0243 0,0495 0,0873 0,1845 0,2337 0,1535 0,0277 0,0028
10 286 0,0001 0,0006 0,0022 0,0065 0,0162 0,0349 0,1107 0,2181 0,2457 0,0997 0,0214
11 78 E 0,0001 0,0003 0,0012 0,0036 0,0095 0,0453 0,1388 0,2680 0,2448 0,1109
12 13 0,0001 0,0005 0,0016 0,0113 0,0540 0,1787 0,3672 0,3512
13 1 0,0001 0,0013 0,0097 0,0550 0,2542 0,5133
14 0 1 0,8687 0,4877 0,2288 0,1028 0,0440 0,0178 0,0068 0,0024 0,0008 0,0002 0,0001
1 14 0,1229 0,3593 0,3559 0,2539 0,1539 0,0832 0,0407 0,0181 0,0073 0,0027 0,0009 0,0001
2 91 0,0081 0,1229 0,2570 0,2912 0,2501 0,1802 0,1134 0,0634 0,0317 0,0141 0,0056 0,0005
3 364 0,0003 0,0259 0,1142 0,2056 0,2501 0,2402 0,1943 0,1366 0,0845 0,0462 0,0222 0,0033 0,0002
4 1001 0,0037 0,0349 0,0998 0,1720 0,2202 0,2290 0,2022 0,1549 0,1040 0,0611 0,0136 0,0014 0,0000
5 2002 0,0004 0,0078 0,0352 0,0860 0,1468 0,1963 0,2178 0,2066 0,1701 0,1222 0,0408 0,0066 0,0003
6 3003 0,0013 0,0093 0,0322 0,0734 0,1262 0,1759 0,2066 0,2088 0,1833 0,0918 0,0232 0,0020
7 3431 0,0002 0,0019 0,0092 0,0280 0,0618 0,1082 0,1574 0,1952 0,2094 0,1574 0,0618 0,0092 0,0002
8 3003 0,0003 0,0020 0,0082 0,0232 0,0510 0,0918 0,1398 0,1833 0,2066 0,1262 0,0322 0,0013
20
9 2002 22 0,0003 0,0018 0,0066 0,0183 0,0408 0,0762 0,1222 0,2066 0,1963 0,0860 0,0078 0,0004
10 1001 0,0000 0,0003 0,0014 0,0049 0,0136 0,0312 0,0611 0,1549 0,2290 0,1720 0,0349 0,0037
11 364 0,0002 0,0010 0,0033 0,0093 0,0222 0,0845 0,1943 0,2501 0,1142 0,0259
-I I
12 91 0,0001 0,0005 0,0019 0,0056 0,0317 0,1134 0,2501 0,2570 0,1229
13 14 0,0001 0,0002 0,0009 0,0073 0,0407 0,1539 0,3559 0,3593
14 1 0,0001 0,0008 0,0068 0,0440 0,2288 0,4877
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95

UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
15 0 1 0,8601 0,4633 0,2059 0,0874 0,0352 0,0134 0,0047 0,0016 0,0005 0,0001

1 15 0,1303 0,3658 0,3432 0,2312 0,1319 0,0668 0,0305 0,0126 0,0047 0,0016 0,0005
2 105 0,0092 0,1348 0,2669 0,2856 0,2309 0,1559 0,0916 0,0476 0,0219 0,0090 0,0032 0,0003
3 455 0,0004 0,0307 0,1285 0,2184 0,2501 0,2252 0,1700 0,1110 0,0634 0,0318 0,0139 0,0016 0,0001
4 1365 0,0049 0,0428 0,1156 0,1876 0,2252 0,2186 0,1792 0,1268 0,0780 0,0417 0,0074 0,0006
5 3003 0,0006 0,0105 0,0449 0,1032 0,1651 0,2061 0,2123 0,1859 0,1404 0,0916 0,0245 0,0030 0,0001
6 5005 0,0000 0,0019 0,0132 0,0430 0,0917 0,1472 0,1906 0,2066 0,1914 0,1527 0,0612 0,0116 0,0007
7 6435 0,0003 0,0030 0,0138 0,0393 0,0811 0,1319 0,1771 0,2013 0,1964 0,1181 0,0348 0,0035
8 6435 0,0005 0,0035 0,0131 0,0348 0,0710 0,1181 0,1647 0,1964 0,1771 0,0811 0,0138 0,0003
9 5005 0,0001 0,0007 0,0034 0,0116 0,0298 0,0612 0,1048 0,1527 0,2066 0,1472 0,0430 0,0019 0,0000
10 3003 0,0001 0,0007 0,0030 0,0096 0,0245 0,0515 0,0916 0,1859 0,2061 0,1032 0,0105 0,0006
CA
11 1365 0,0001 0,0006 0,0024 M 0,0074 0,0191 0,0417 0,1268 0,2186 0,1876 0,0428 0,0049
12 455 0,0001 0,0004 0,0016 0,0052 0,0139 0,0634 0,1700 0,2501 0,1285 0,0307
13 105 0,0001 0,0003 0,0010 0,0032 0,0219 0,0916 0,2309 0,2669 0,1348
PU
14 15 S0,0001 0,0005 0,0047 0,0305 0,1319 0,3432 0,3658
15 1 -L 0,0005 0,0047 0,0352 0,2059 0,4633
16 0 1 0,8515 0,4401 0,1853 0,0743 0,0281 0,0100 0,0033 0,0010 0,0003 0,0001 IM
1 16 0,1376 0,3706 0,3294 0,2097 0,1126 0,0535 0,0228 0,0087 0,0030 0,0009 0,0002
2 120 0,0104 0,1463 0,2745 0,2775 0,2111 0,1336 0,0732 0,0353 0,0150 0,0056 A
0,0018 0,0001
3 560 0,0005 0,0359 0,1423 0,2285 0,2463 0,2079 0,1465 0,0888 0,0468 0,0215 0,0085 0,0008
4 1820 0,0061 0,0514 0,1311 0,2001 0,2252 0,2040 0,1553 0,1014 0,0572 0,0278 0,0040 0,0002
5 4368 0,0008 0,0137 0,0555 0,1201 0,1802 0,2099 0,2008 0,1623 0,1123 0,0667 0,0142 0,0013
6 8008 0,0001 0,0028 0,0180 0,0550
AD 0,1101 0,1649 0,1982 0,1983 0,1684 0,1222 0,0392 0,0056 0,0002
7 11 439 0,0004 0,0045 0,0197 0,0524 0,1010 0,1524 0,1889 0,1969 0,1745 0,0839 0,0185 0,0012
8 12 868 0,0001 0,0009 0,0055
E 0,0197 0,0487 0,0923 0,1416 0,1812 0,1964 0,1416 0,0487 0,0055 0,0001
9 11 438 0,0001 0,0012 0,0058 0,0185 0,0442 0,0839 0,1318 0,1745 0,1889 0,1009 0,0197 0,0004
10 8007 0,0002 0,0014 0,0056 0,0167 0,0392 0,0755 0,1222 0,1983 0,1649 0,0550 0,0028 0,0001
11 4367 0,0002 0,0013 0,0049 0,0142 0,0337 0,0666 0,1622 0,2098 0,1200 0,0137 0,0008
12 1820 0,0002 0,0011 0,0040 0,0115 0,0278 0,1014 0,2040 0,2001 0,0514 0,0061
13 560 0,0002 0,0008 0,0029 0,0085 0,0468 0,1465 0,2463 0,1423 0,0359
14 120 0,0001 0,0005 0,0018 0,0150 0,0732 0,2111 0,2745 0,1463
15 16 0,0001 0,0002 0,0030 0,0228 0,1126 0,3294 0,3706
16 1 0,0003 0,0033 0,0281 0,1853 0,4401
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95

20
22
-I I
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
19 0 1 0,8262 0,3774 0,1351 0,0456 0,0144 0,0042 0,0011 0,0003 0,0001

1 19 0,1586 0,3774 0,2852 0,1529 0,0685 0,0268 0,0093 0,0029 0,0008 0,0002
2 171 0,0144 0,1787 0,2852 0,2428 0,1540 0,0803 0,0358 0,0138 0,0046 0,0013 0,0003
3 969 0,0008 0,0533 0,1796 0,2428 0,2182 0,1517 0,0869 0,0422 0,0175 0,0062 0,0018 0,0001
4 3876 0,0112 0,0798 0,1714 0,2182 0,2023 0,1491 0,0909 0,0467 0,0203 0,0074 0,0005
5 11 628 0,0018 0,0266 0,0907 0,1636 0,2023 0,1916 0,1468 0,0933 0,0497 0,0222 0,0024 0,0001
6 27 130 0,0002 0,0069 0,0374 0,0955 0,1574 0,1916 0,1844 0,1451 0,0949 0,0517 0,0085 0,0005
7 50 383 0,0014 0,0122 0,0443 0,0974 0,1525 0,1844 0,1797 0,1443 0,0961 0,0237 0,0022 0,0000
8 75 574 0,0002 0,0032 0,0166 0,0487 0,0980 0,1489 0,1797 0,1770 0,1441 0,0532 0,0077 0,0003
9 92 368 0,0007 0,0051 0,0198 0,0514 0,0980 0,1464 0,1770 0,1762 0,0976 0,0220 0,0013
10 92 368 0,0001 0,0013 0,0066 0,0220 0,0528 0,0976 0,1448 0,1762 0,1464 0,0514 0,0051
CA
11 75 574 0,0003 0,0018 0,0077 0,0233M 0,0532 0,0970 0,1441 0,1797 0,0980 0,0166 0,0002
12 50 382 0,0000 0,0004 0,0022 0,0083 0,0237 0,0529 0,0961 0,1797 0,1525 0,0443 0,0014
13 27 129 0,0001 0,0005 0,0024 0,0085 0,0233 0,0517 0,1451 0,1916 0,0955 0,0069 0,0002
PU
14 11 627 0,0001 0,0006 0,0024 S 0,0082 0,0222 0,0933 0,1916 0,1636 0,0266 0,0018
15 3876 0,0001 0,0005 0,0022
-L 0,0074 0,0467 0,1491 0,2182 0,0798 0,0112
16 969 0,0001 0,0005 0,0018 0,0175 0,0869 0,2182 0,1796 0,0533
17 171 0,0001 0,0003 0,0046 0,0358 0,1540 0,2852 0,1787
IM
18 19 A 0,0008 0,0093 0,0685 0,2852 0,3774
19 1 0,0001 0,0011 0,0144 0,1351 0,3774
20 0 1 0,8179 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002
1 20 0,1652 0,3774 0,2702 0,1368 0,0576 0,0211 0,0068 0,0020 0,0005 0,0001
2 190 0,0159 0,1887 0,2852 0,2293
AD 0,1369 0,0669 0,0278 0,0100 0,0031 0,0008 0,0002
3 1140 0,0010 0,0596 0,1901 0,2428 0,2054 0,1339 0,0716 0,0323 0,0123 0,0040 0,0011 0,0000
4 4845 0,0000 0,0133 0,0898 0,1821 0,2182
E 0,1897 0,1304 0,0738 0,0350 0,0139 0,0046 0,0003
5 15 504 0,0022 0,0319 0,1028 0,1746 0,2023 0,1789 0,1272 0,0746 0,0365 0,0148 0,0013
6 38 759 0,0003 0,0089 0,0454 0,1091 0,1686 0,1916 0,1712 0,1244 0,0746 0,0370 0,0049 0,0002
7 77 518 0,0020 0,0160 0,0545 0,1124 0,1643 0,1844 0,1659 0,1221 0,0739 0,0146 0,0010
8 125 960 0,0004 0,0046 0,0222 0,0609 0,1144 0,1613 0,1797 0,1623 0,1201 0,0355 0,0039 0,0001
9 167 940 0,0001 0,0011 0,0074 0,0271 0,0654 0,1158 0,1597 0,1770 0,1602 0,0710 0,0120 0,0005
10 184 734 0,0002 0,0020 0,0099 0,0308 0,0686 0,1171 0,1593 0,1762 0,1171 0,0308 0,0020
11 167 940 0,0005 0,0030 0,0120 0,0336 0,0710 0,1185 0,1602 0,1597 0,0654 0,0074 0,0001
12 125 954 0,0001 0,0008 0,0039 0,0136 0,0355 0,0727 0,1201 0,1797 0,1144 0,0222 0,0004
13 77 510 0,0002 0,0010 0,0045 0,0146 0,0366 0,0739 0,1659 0,1642 0,0545 0,0020
14 38 755 0,0002 0,0012 0,0049 0,0150 0,0370 0,1244 0,1916 0,1091 0,0089 0,0003
15 15 502 20 0,0003 0,0013 0,0049 0,0148 0,0746 0,1788 0,1745 0,0319 0,0022
16 4844 0,0000 0,0003 0,0013 0,0046 0,0350 0,1304 0,2182 0,0898 0,0133
17 1140 0,0000 0,0002 0,0011 0,0123 0,0716 0,2054 0,1901 0,0596
22
18 190 -I I 0,0002 0,0031 0,0278 0,1369 0,2852 0,1887
19 20 0,0005 0,0068 0,0576 0,2702 0,3774
20 1 0,0008 0,0115 0,1216 0,3585
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95

A.3. Tabla: Probabilidades de Poisson
λ
x 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
0 0.9048 0.8187 0.7408 0.6703 0.6065 0.5488 0.4966 0.4493 0.4066 0.3679
1 0.0905 0.1637 0.2222 0.2681 0.3033 0.3293 0.3476 0.3595 0.3659 0.3679
2 0.0045 0.0164 0.0333 0.0536 0.0758 0.0988 0.1217 0.1438 0.1647 0.1839
3 0.0002 0.0011 0.0033 0.0072 0.0126 0.0198 0.0284 0.0383 0.0494 0.0613
4 0.0000 0.0001 0.0003 0.0007 0.0016 0.0030 0.0050 0.0077 0.0111 0.0153
5 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0012 0.0020 0.0031
EP
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0003 0.0005
UD
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
λ
A
x 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0
IM
0 0.3329 0.3012 0.2725 0.2466 0.2231 0.2019 0.1827 0.1653 0.1496 0.1353
1 0.3662 0.3614 0.3543 0.3452 0.3347 0.3230 0.3106 0.2975 0.2842 0.2707
-L
2 0.2014 0.2169 0.2303 0.2417 0.2510 0.2584 0.2640 0.2678 0.2700 0.2707
S
PU
3 0.0738 0.0867 0.0998 0.1128 0.1255 0.1378 0.1496 0.1607 0.1710 0.1804
4 0.0203 0.0260 0.0324 0.0395 0.0471 0.0551 0.0636 0.0723 0.0812 0.0902
M
5 0.0045 0.0062 0.0084 0.0111 0.0141 0.0176 0.0216 0.0260 0.0309 0.0361
CA
6 0.0008 0.0012 0.0018 0.0026 0.0035 0.0047 0.0061 0.0078 0.0098 0.0120
7 0.0001 0.0002 0.0003 0.0005 0.0008 0.0011 0.0015 0.0020 0.0027 0.0034
8 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0005 0.0006 0.0009
9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002
λ
x 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0
0 0.1225 0.1108 0.1003 0.0907 0.0821 0.0743 0.0672 0.0608 0.0550 0.0498
1 0.2572 0.2438 0.2306 0.2177 0.2052 0.1931 0.1815 0.1703 0.1596 0.1494
E
2 0.2700 0.2681 0.2652 0.2613 0.2565 0.2510 0.2450 0.2384 0.2314 0.2240
AD
3 0.1890 0.1966 0.2033 0.2090 0.2138 0.2176 0.2205 0.2225 0.2237 0.2240
4 0.0992 0.1082 0.1169 0.1254 0.1336 0.1414 0.1488 0.1557 0.1622 0.1680
5 0.0417 0.0476 0.0538 0.0602 0.0668 0.0735 0.0804 0.0872 0.0940 0.1008
6 0.0146 0.0174 0.0206 0.0241 0.0278 0.0319 0.0362 0.0407 0.0455 0.0504
7 0.0044 0.0055 0.0068 0.0083 0.0099 0.0118 0.0139 0.0163 0.0188 0.0216
8 0.0011 0.0015 0.0019 0.0025 0.0031 0.0038 0.0047 0.0057 0.0068 0.0081
9 0.0003 0.0004 0.0005 0.0007 0.0009 0.0011 0.0014 0.0018 0.0022 0.0027
10 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 0.0008
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
-I I
22
20
Tabla: Probabilidades de Poisson (Continuación)
λ
x 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0
0 0.0450 0.0408 0.0369 0.0334 0.0302 0.0273 0.0247 0.0224 0.0202 0.0183
1 0.1397 0.1304 0.1217 0.1135 0.1057 0.0984 0.0915 0.0850 0.0789 0.0733
2 0.2165 0.2087 0.2008 0.1929 0.1850 0.1771 0.1692 0.1615 0.1539 0.1465
3 0.2237 0.2226 0.2209 0.2186 0.2158 0.2125 0.2087 0.2046 0.2001 0.1954
4 0.1733 0.1781 0.1823 0.1858 0.1888 0.1912 0.1931 0.1944 0.1951 0.1954
5 0.1075 0.1140 0.1203 0.1264 0.1322 0.1377 0.1429 0.1477 0.1522 0.1563
EP
6 0.0555 0.0608 0.0662 0.0716 0.0771 0.0826 0.0881 0.0936 0.0989 0.1042
7 0.0246 0.0278 0.0312 0.0348 0.0385 0.0425 0.0466 0.0508 0.0551 0.0595
UD
8 0.0095 0.0111 0.0129 0.0148 0.0169 0.0191 0.0215 0.0241 0.0269 0.0298
9 0.0033 0.0040 0.0047 0.0056 0.0066 0.0076 0.0089 0.0102 0.0116 0.0132
10 0.0010 0.0013 0.0016 0.0019 0.0023 0.0028 0.0033 0.0039 0.0045 0.0053
11 0.0003 0.0004 0.0005 0.0006 0.0007 0.0009 0.0011 0.0013 0.0016 0.0019
A
12 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006
IM
13 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002
14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
S-L
PU
λ
M
x 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5.0
CA
0 0.0166 0.0150 0.0136 0.0123 0.0111 0.0101 0.0091 0.0082 0.0074 0.0067
1 0.0679 0.0630 0.0583 0.0540 0.0500 0.0462 0.0427 0.0395 0.0365 0.0337
2 0.1393 0.1323 0.1254 0.1188 0.1125 0.1063 0.1005 0.0948 0.0894 0.0842
3 0.1904 0.1852 0.1798 0.1743 0.1687 0.1631 0.1574 0.1517 0.1460 0.1404
4 0.1951 0.1944 0.1933 0.1917 0.1898 0.1875 0.1849 0.1820 0.1789 0.1755
5 0.1600 0.1633 0.1662 0.1687 0.1708 0.1725 0.1738 0.1747 0.1753 0.1755
6 0.1093 0.1143 0.1191 0.1237 0.1281 0.1323 0.1362 0.1398 0.1432 0.1462
7 0.0640 0.0686 0.0732 0.0778 0.0824 0.0869 0.0914 0.0959 0.1002 0.1044
8 0.0328 0.0360 0.0393 0.0428 0.0463 0.0500 0.0537 0.0575 0.0614 0.0653
9 0.0150 0.0168 0.0188 0.0209 0.0232 0.0255 0.0281 0.0307 0.0334 0.0363
E
10 0.0061 0.0071 0.0081 0.0092 0.0104 0.0118 0.0132 0.0147 0.0164 0.0181
AD
11 0.0023 0.0027 0.0032 0.0037 0.0043 0.0049 0.0056 0.0064 0.0073 0.0082
12 0.0008 0.0009 0.0011 0.0013 0.0016 0.0019 0.0022 0.0026 0.0030 0.0034
13 0.0002 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013
14 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005
15 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002
-I I
22
20
λ
x 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6.0
0 0.0061 0.0055 0.0050 0.0045 0.0041 0.0037 0.0033 0.0030 0.0027 0.0025
1 0.0311 0.0287 0.0265 0.0244 0.0225 0.0207 0.0191 0.0176 0.0162 0.0149
2 0.0793 0.0746 0.0701 0.0659 0.0618 0.0580 0.0544 0.0509 0.0477 0.0446
3 0.1348 0.1293 0.1239 0.1185 0.1133 0.1082 0.1033 0.0985 0.0938 0.0892
4 0.1719 0.1681 0.1641 0.1600 0.1558 0.1515 0.1472 0.1428 0.1383 0.1339
5 0.1753 0.1748 0.1740 0.1728 0.1714 0.1697 0.1678 0.1656 0.1632 0.1606
EP
6 0.1490 0.1515 0.1537 0.1555 0.1571 0.1584 0.1594 0.1601 0.1605 0.1606
7 0.1086 0.1125 0.1163 0.1200 0.1234 0.1267 0.1298 0.1326 0.1353 0.1377
UD
8 0.0692 0.0731 0.0771 0.0810 0.0849 0.0887 0.0925 0.0962 0.0998 0.1033
9 0.0392 0.0423 0.0454 0.0486 0.0519 0.0552 0.0586 0.0620 0.0654 0.0688
10 0.0200 0.0220 0.0241 0.0262 0.0285 0.0309 0.0334 0.0359 0.0386 0.0413
11 0.0093 0.0104 0.0116 0.0129 0.0143 0.0157 0.0173 0.0190 0.0207 0.0225
A
12 0.0039 0.0045 0.0051 0.0058 0.0065 0.0073 0.0082 0.0092 0.0102 0.0113
IM
13 0.0015 0.0018 0.0021 0.0024 0.0028 0.0032 0.0036 0.0041 0.0046 0.0052
14 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013 0.0015 0.0017 0.0019 0.0022
-L
15 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009
S
PU
16 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003
17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001
M
CA
λ
x 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 7.0
0 0.0022 0.0020 0.0018 0.0017 0.0015 0.0014 0.0012 0.0011 0.0010 0.0009
1 0.0137 0.0126 0.0116 0.0106 0.0098 0.0090 0.0082 0.0076 0.0070 0.0064
2 0.0417 0.0390 0.0364 0.0340 0.0318 0.0296 0.0276 0.0258 0.0240 0.0223
3 0.0848 0.0806 0.0765 0.0726 0.0688 0.0652 0.0617 0.0584 0.0552 0.0521
4 0.1294 0.1249 0.1205 0.1162 0.1118 0.1076 0.1034 0.0992 0.0952 0.0912
5 0.1579 0.1549 0.1519 0.1487 0.1454 0.1420 0.1385 0.1349 0.1314 0.1277
6 0.1605 0.1601 0.1595 0.1586 0.1575 0.1562 0.1546 0.1529 0.1511 0.1490
E
7 0.1399 0.1418 0.1435 0.1450 0.1462 0.1472 0.1480 0.1486 0.1489 0.1490
AD
8 0.1066 0.1099 0.1130 0.1160 0.1188 0.1215 0.1240 0.1263 0.1284 0.1304
9 0.0723 0.0757 0.0791 0.0825 0.0858 0.0891 0.0923 0.0954 0.0985 0.1014
10 0.0441 0.0469 0.0498 0.0528 0.0558 0.0588 0.0618 0.0649 0.0679 0.0710
11 0.0244 0.0265 0.0285 0.0307 0.0330 0.0353 0.0377 0.0401 0.0426 0.0452
12 0.0124 0.0137 0.0150 0.0164 0.0179 0.0194 0.0210 0.0227 0.0245 0.0263
13 0.0058 0.0065 0.0073 0.0081 0.0089 0.0099 0.0108 0.0119 0.0130 0.0142
14 0.0025 0.0029 0.0033 0.0037 0.0041 0.0046 0.0052 0.0058 0.0064 0.0071
15 0.0010 0.0012 0.0014 0.0016 0.0018 0.0020 0.0023 0.0026 0.0029 0.0033
16 0.0004 0.0005 0.0005 0.0006 0.0007 0.0008 0.0010 0.0011 0.0013 0.0014
17 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006
-I I
18 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002
22
19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001
20
λ
x 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 8.0
0 0.0008 0.0007 0.0007 0.0006 0.0006 0.0005 0.0005 0.0004 0.0004 0.0003
1 0.0059 0.0054 0.0049 0.0045 0.0041 0.0038 0.0035 0.0032 0.0029 0.0027
2 0.0208 0.0194 0.0180 0.0167 0.0156 0.0145 0.0134 0.0125 0.0116 0.0107
3 0.0492 0.0464 0.0438 0.0413 0.0389 0.0366 0.0345 0.0324 0.0305 0.0286
4 0.0874 0.0836 0.0799 0.0764 0.0729 0.0696 0.0663 0.0632 0.0602 0.0573
5 0.1241 0.1204 0.1167 0.1130 0.1094 0.1057 0.1021 0.0986 0.0951 0.0916
6 0.1468 0.1445 0.1420 0.1394 0.1367 0.1339 0.1311 0.1282 0.1252 0.1221
EP
7 0.1489 0.1486 0.1481 0.1474 0.1465 0.1454 0.1442 0.1428 0.1413 0.1396
8 0.1321 0.1337 0.1351 0.1363 0.1373 0.1381 0.1388 0.1392 0.1395 0.1396
UD
9 0.1042 0.1070 0.1096 0.1121 0.1144 0.1167 0.1187 0.1207 0.1224 0.1241
10 0.0740 0.0770 0.0800 0.0829 0.0858 0.0887 0.0914 0.0941 0.0967 0.0993
11 0.0478 0.0504 0.0531 0.0558 0.0585 0.0613 0.0640 0.0667 0.0695 0.0722
12 0.0283 0.0303 0.0323 0.0344 0.0366 0.0388 0.0411 0.0434 0.0457 0.0481
13 0.0154 0.0168 0.0181 0.0196 0.0211 0.0227 0.0243 0.0260 0.0278 0.0296
A
14 0.0078 0.0086 0.0095 0.0104 0.0113 0.0123 0.0134 0.0145 0.0157 0.0169
IM
15 0.0037 0.0041 0.0046 0.0051 0.0057 0.0062 0.0069 0.0075 0.0083 0.0090
16 0.0016 0.0019 0.0021 0.0024 0.0026 0.0030 0.0033 0.0037 0.0041 0.0045
-L
17 0.0007 0.0008 0.0009 0.0010 0.0012 0.0013 0.0015 0.0017 0.0019 0.0021
S
18 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006 0.0006 0.0007 0.0008 0.0009
PU
19 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003 0.0003 0.0004
20 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002
M
21 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001
CA
λ
x 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 9.0
0 0.0003 0.0003 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0001 0.0001
1 0.0025 0.0023 0.0021 0.0019 0.0017 0.0016 0.0014 0.0013 0.0012 0.0011
2 0.0100 0.0092 0.0086 0.0079 0.0074 0.0068 0.0063 0.0058 0.0054 0.0050
3 0.0269 0.0252 0.0237 0.0222 0.0208 0.0195 0.0183 0.0171 0.0160 0.0150
4 0.0544 0.0517 0.0491 0.0466 0.0443 0.0420 0.0398 0.0377 0.0357 0.0337
5 0.0882 0.0849 0.0816 0.0784 0.0752 0.0722 0.0692 0.0663 0.0635 0.0607
6 0.1191 0.1160 0.1128 0.1097 0.1066 0.1034 0.1003 0.0972 0.0941 0.0911
7 0.1378 0.1358 0.1338 0.1317 0.1294 0.1271 0.1247 0.1222 0.1197 0.1171
E
8 0.1395 0.1392 0.1388 0.1382 0.1375 0.1366 0.1356 0.1344 0.1332 0.1318
AD
9 0.1256 0.1269 0.1280 0.1290 0.1299 0.1306 0.1311 0.1315 0.1317 0.1318
10 0.1017 0.1040 0.1063 0.1084 0.1104 0.1123 0.1140 0.1157 0.1172 0.1186
11 0.0749 0.0776 0.0802 0.0828 0.0853 0.0878 0.0902 0.0925 0.0948 0.0970
12 0.0505 0.0530 0.0555 0.0579 0.0604 0.0629 0.0654 0.0679 0.0703 0.0728
13 0.0315 0.0334 0.0354 0.0374 0.0395 0.0416 0.0438 0.0459 0.0481 0.0504
14 0.0182 0.0196 0.0210 0.0225 0.0240 0.0256 0.0272 0.0289 0.0306 0.0324
15 0.0098 0.0107 0.0116 0.0126 0.0136 0.0147 0.0158 0.0169 0.0182 0.0194
16 0.0050 0.0055 0.0060 0.0066 0.0072 0.0079 0.0086 0.0093 0.0101 0.0109
17 0.0024 0.0026 0.0029 0.0033 0.0036 0.0040 0.0044 0.0048 0.0053 0.0058
18 0.0011 0.0012 0.0014 0.0015 0.0017 0.0019 0.0021 0.0024 0.0026 0.0029
19 0.0005 0.0005 0.0006 0.0007 0.0008 0.0009 0.0010 0.0011 0.0012 0.0014
-I I
20 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004 0.0005 0.0005 0.0006
21 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0002 0.0003
22
22 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001
20
λ
x 9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8 9.9 10
0 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0000
1 0.0010 0.0009 0.0009 0.0008 0.0007 0.0007 0.0006 0.0005 0.0005 0.0005
2 0.0046 0.0043 0.0040 0.0037 0.0034 0.0031 0.0029 0.0027 0.0025 0.0023
3 0.0140 0.0131 0.0123 0.0115 0.0107 0.0100 0.0093 0.0087 0.0081 0.0076
4 0.0319 0.0302 0.0285 0.0269 0.0254 0.0240 0.0226 0.0213 0.0201 0.0189
EP
5 0.0581 0.0555 0.0530 0.0506 0.0483 0.0460 0.0439 0.0418 0.0398 0.0378
UD
6 0.0881 0.0851 0.0822 0.0793 0.0764 0.0736 0.0709 0.0682 0.0656 0.0631
7 0.1145 0.1118 0.1091 0.1064 0.1037 0.1010 0.0982 0.0955 0.0928 0.0901
8 0.1302 0.1286 0.1269 0.1251 0.1232 0.1212 0.1191 0.1170 0.1148 0.1126
9 0.1317 0.1315 0.1311 0.1306 0.1300 0.1293 0.1284 0.1274 0.1263 0.1251
A
10 0.1198 0.1210 0.1219 0.1228 0.1235 0.1241 0.1245 0.1249 0.1250 0.1251
IM
11 0.0991 0.1012 0.1031 0.1049 0.1067 0.1083 0.1098 0.1112 0.1125 0.1137
-L
12 0.0752 0.0776 0.0799 0.0822 0.0844 0.0866 0.0888 0.0908 0.0928 0.0948
S
PU
13 0.0526 0.0549 0.0572 0.0594 0.0617 0.0640 0.0662 0.0685 0.0707 0.0729
14 0.0342 0.0361 0.0380 0.0399 0.0419 0.0439 0.0459 0.0479 0.0500 0.0521
M
15 0.0208 0.0221 0.0235 0.0250 0.0265 0.0281 0.0297 0.0313 0.0330 0.0347
CA
16 0.0118 0.0127 0.0137 0.0147 0.0157 0.0168 0.0180 0.0192 0.0204 0.0217
17 0.0063 0.0069 0.0075 0.0081 0.0088 0.0095 0.0103 0.0111 0.0119 0.0128
18 0.0032 0.0035 0.0039 0.0042 0.0046 0.0051 0.0055 0.0060 0.0065 0.0071
19 0.0015 0.0017 0.0019 0.0021 0.0023 0.0026 0.0028 0.0031 0.0034 0.0037
20 0.0007 0.0008 0.0009 0.0010 0.0011 0.0012 0.0014 0.0015 0.0017 0.0019
21 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006 0.0006 0.0007 0.0008 0.0009
22 0.0001 0.0001 0.0002 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004
23 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002
E
24 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001
AD
-I I
22
20
λ
x 11 12 13 14 15 16 17 18 19 20
0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.0010 0.0004 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.0037 0.0018 0.0008 0.0004 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000
4 0.0102 0.0053 0.0027 0.0013 0.0006 0.0003 0.0001 0.0001 0.0000 0.0000
5 0.0224 0.0127 0.0070 0.0037 0.0019 0.0010 0.0005 0.0002 0.0001 0.0001
EP
6 0.0411 0.0255 0.0152 0.0087 0.0048 0.0026 0.0014 0.0007 0.0004 0.0002
7 0.0646 0.0437 0.0281 0.0174 0.0104 0.0060 0.0034 0.0019 0.0010 0.0005
UD
8 0.0888 0.0655 0.0457 0.0304 0.0194 0.0120 0.0072 0.0042 0.0024 0.0013
9 0.1085 0.0874 0.0661 0.0473 0.0324 0.0213 0.0135 0.0083 0.0050 0.0029
10 0.1194 0.1048 0.0859 0.0663 0.0486 0.0341 0.0230 0.0150 0.0095 0.0058
11 0.1194 0.1144 0.1015 0.0844 0.0663 0.0496 0.0355 0.0245 0.0164 0.0106
12 0.1094 0.1144 0.1099 0.0984 0.0829 0.0661 0.0504 0.0368 0.0259 0.0176
A
IM
13 0.0926 0.1056 0.1099 0.1060 0.0956 0.0814 0.0658 0.0509 0.0378 0.0271
14 0.0728 0.0905 0.1021 0.1060 0.1024 0.0930 0.0800 0.0655 0.0514 0.0387
-L
15 0.0534 0.0724 0.0885 0.0989 0.1024 0.0992 0.0906 0.0786 0.0650 0.0516
S
16 0.0367 0.0543 0.0719 0.0866 0.0960 0.0992 0.0963 0.0884 0.0772 0.0646
PU
17 0.0237 0.0383 0.0550 0.0713 0.0847 0.0934 0.0963 0.0936 0.0863 0.0760
18 0.0145 0.0255 0.0397 0.0554 0.0706 0.0830 0.0909 0.0936 0.0911 0.0844
M
19 0.0084 0.0161 0.0272 0.0409 0.0557 0.0699 0.0814 0.0887 0.0911 0.0888
CA
20 0.0046 0.0097 0.0177 0.0286 0.0418 0.0559 0.0692 0.0798 0.0866 0.0888
21 0.0024 0.0055 0.0109 0.0191 0.0299 0.0426 0.0560 0.0684 0.0783 0.0846
22 0.0012 0.0030 0.0065 0.0121 0.0204 0.0310 0.0433 0.0560 0.0676 0.0769
23 0.0006 0.0016 0.0037 0.0074 0.0133 0.0216 0.0320 0.0438 0.0559 0.0669
24 0.0003 0.0008 0.0020 0.0043 0.0083 0.0144 0.0226 0.0328 0.0442 0.0557
25 0.0001 0.0004 0.0010 0.0024 0.0050 0.0092 0.0154 0.0237 0.0336 0.0446
26 0.0000 0.0002 0.0005 0.0013 0.0029 0.0057 0.0101 0.0164 0.0246 0.0343
27 0.0000 0.0001 0.0002 0.0007 0.0016 0.0034 0.0063 0.0109 0.0173 0.0254
28 0.0000 0.0000 0.0001 0.0003 0.0009 0.0019 0.0038 0.0070 0.0117 0.0181
29 0.0000 0.0000 0.0001 0.0002 0.0004 0.0011 0.0023 0.0044 0.0077 0.0125
E
30 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0013 0.0026 0.0049 0.0083
AD
31 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0007 0.0015 0.0030 0.0054
32 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0004 0.0009 0.0018 0.0034
33 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0005 0.0010 0.0020
34 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0012
35 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0007
36 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004
37 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002
38 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
39 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
-I I
22
20
A.4. Distribución normal estándar
P (0 < Z < Zc)

EP
0 Zc Z
UD
Zc 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
A
0.0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.03586
IM
0.1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535
0.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
-L
0.3 0.11791 0.12172 0.12552 0.12930 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173
S
0.4 0.15542 0.15910 0.16276 0.16640 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793
PU
0.5 0.19146 0.19497 0.19847 0.20194 0.20540 0.20884 0.21226 0.21566 0.21904 0.22240
0.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.25490
M
0.7 0.25804 0.26115 0.26424 0.26730 0.27035 0.27337 0.27637 0.27935 0.28230 0.28524
CA
0.8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.31327
0.9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891
1.0 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214
1.1 0.36433 0.36650 0.36864 0.37076 0.37286 0.37493 0.37698 0.37900 0.38100 0.38298
1.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.40147
1.3 0.40320 0.40490 0.40658 0.40824 0.40988 0.41149 0.41309 0.41466 0.41621 0.41774
1.4 0.41924 0.42073 0.42220 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189
1.5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408
1.6 0.44520 0.44630 0.44738 0.44845 0.44950 0.45053 0.45154 0.45254 0.45352 0.45449
1.7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46080 0.46164 0.46246 0.46327
1.8 0.46407 0.46485 0.46562 0.46638 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062
1.9 0.47128 0.47193 0.47257 0.47320 0.47381 0.47441 0.47500 0.47558 0.47615 0.47670
E
2.0 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.48030 0.48077 0.48124 0.48169
AD
2.1 0.48214 0.48257 0.48300 0.48341 0.48382 0.48422 0.48461 0.48500 0.48537 0.48574
2.2 0.48610 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.48840 0.48870 0.48899
2.3 0.48928 0.48956 0.48983 0.49010 0.49036 0.49061 0.49086 0.49111 0.49134 0.49158
2.4 0.49180 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361
2.5 0.49379 0.49396 0.49413 0.49430 0.49446 0.49461 0.49477 0.49492 0.49506 0.49520
2.6 0.49534 0.49547 0.49560 0.49573 0.49585 0.49598 0.49609 0.49621 0.49632 0.49643
2.7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.49720 0.49728 0.49736
2.8 0.49744 0.49752 0.49760 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807
2.9 0.49813 0.49819 0.49825 0.49831 0.49836 0.49841 0.49846 0.49851 0.49856 0.49861
3.0 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49896 0.49900
3.1 0.49903 0.49906 0.49910 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929
-I I
3.2 0.49931 0.49934 0.49936 0.49938 0.49940 0.49942 0.49944 0.49946 0.49948 0.49950
3.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.49960 0.49961 0.49962 0.49964 0.49965
22
3.4 0.49966 0.49968 0.49969 0.49970 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976
20
3.5 0.49977 0.49978 0.49978 0.49979 0.49980 0.49981 0.49981 0.49982 0.49983 0.49983
3.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989
3.7 0.49989 0.49990 0.49990 0.49990 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992
3.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995
3.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997
A.5. Distribución t
Área (probabilidad)
EP
en extremo superior
UD
0 t
A
IM
S -L
PU

M
libertad 0.10 0.05 0.025 0.01 0.005

CA
1 3.0777 6.3138 12.7062 31.8205 63.6567

2 1.8856 2.9200 4.3027 6.9646 9.9248
3 1.6377 2.3534 3.1824 4.5407 5.8409
4 1.5332 2.1318 2.7764 3.7469 4.6041
5 1.4759 2.0150 2.5706 3.3649 4.0321
6 1.4398 1.9432 2.4469 3.1427 3.7074
7 1.4149 1.8946 2.3646 2.9980 3.4995
8 1.3968 1.8595 2.3060 2.8965 3.3554
9 1.3830 1.8331 2.2622 2.8214 3.2498
10 1.3722 1.8125 2.2281 2.7638 3.1693
E
11 1.3634 1.7959 2.2010 2.7181 3.1058

AD
12 1.3562 1.7823 2.1788 2.6810 3.0545

13 1.3502 1.7709 2.1604 2.6503 3.0123
14 1.3450 1.7613 2.1448 2.6245 2.9768
15 1.3406 1.7531 2.1314 2.6025 2.9467
16 1.3368 1.7459 2.1199 2.5835 2.9208
17 1.3334 1.7396 2.1098 2.5669 2.8982
18 1.3304 1.7341 2.1009 2.5524 2.8784
19 1.3277 1.7291 2.0930 2.5395 2.8609
20 1.3253 1.7247 2.0860 2.5280 2.8453
-I I
21 1.3232 1.7207 2.0796 2.5176 2.8314

22 1.3212 1.7171 2.0739 2.5083 2.8188
22
23 1.3195 1.7139 2.0687 2.4999 2.8073

20
Tabla: Distribución t (Continuación)

libertad 0.10 0.05 0.025 0.01 0.005
24 1.3178 1.7109 2.0639 2.4922 2.7969
25 1.3163 1.7081 2.0595 2.4851 2.7874
26 1.3150 1.7056 2.0555 2.4786 2.7787
27 1.3137 1.7033 2.0518 2.4727 2.7707
28 1.3125 1.7011 2.0484 2.4671 2.7633
29 1.3114 1.6991 2.0452 2.4620 2.7564
30 1.3104 1.6973 2.0423 2.4573 2.7500
EP
31 1.3095 1.6955 2.0395 2.4528 2.7440

UD
32 1.3086 1.6939 2.0369 2.4487 2.7385

33 1.3077 1.6924 2.0345 2.4448 2.7333
34 1.3070 1.6909 2.0322 2.4411 2.7284
35 1.3062 1.6896 2.0301 2.4377 2.7238
36 1.3055 1.6883 2.0281 2.4345 2.7195
A
IM
37 1.3049 1.6871 2.0262 2.4314 2.7154

38 1.3042 1.6860 2.0244 2.4286 2.7116
-L
39 1.3036 1.6849 2.0227 2.4258 2.7079

S
40 1.3031 1.6839 2.0211 2.4233 2.7045

PU
41 1.3025 1.6829 2.0195 2.4208 2.7012

42 1.3020 1.6820 2.0181 2.4185 2.6981
M
43 1.3016 1.6811 2.0167 2.4163 2.6951

CA
44 1.3011 1.6802 2.0154 2.4141 2.6923

45 1.3006 1.6794 2.0141 2.4121 2.6896
46 1.3002 1.6787 2.0129 2.4102 2.6870
47 1.2998 1.6779 2.0117 2.4083 2.6846
48 1.2994 1.6772 2.0106 2.4066 2.6822
49 1.2991 1.6766 2.0096 2.4049 2.6800
50 1.2987 1.6759 2.0086 2.4033 2.6778
51 1.2984 1.6753 2.0076 2.4017 2.6757
52 1.2980 1.6747 2.0066 2.4002 2.6737
53 1.2977 1.6741 2.0057 2.3988 2.6718
E
54 1.2974 1.6736 2.0049 2.3974 2.6700

AD
55 1.2971 1.6730 2.0040 2.3961 2.6682

56 1.2969 1.6725 2.0032 2.3948 2.6665
57 1.2966 1.6720 2.0025 2.3936 2.6649
58 1.2963 1.6716 2.0017 2.3924 2.6633
59 1.2961 1.6711 2.0010 2.3912 2.6618
60 1.2958 1.6706 2.0003 2.3901 2.6603
-I I
22
20
Tabla: Distribución t (Continuación)

libertad 0.10 0.05 0.025 0.01 0.005
61 1.2956 1.6702 1.9996 2.3890 2.6589
62 1.2954 1.6698 1.9990 2.3880 2.6575
63 1.2951 1.6694 1.9983 2.3870 2.6561
64 1.2949 1.6690 1.9977 2.3860 2.6549
65 1.2947 1.6686 1.9971 2.3851 2.6536
66 1.2945 1.6683 1.9966 2.3842 2.6524
67 1.2943 1.6679 1.9960 2.3833 2.6512
EP
68 1.2941 1.6676 1.9955 2.3824 2.6501

UD
69 1.2939 1.6672 1.9949 2.3816 2.6490

70 1.2938 1.6669 1.9944 2.3808 2.6479
71 1.2936 1.6666 1.9939 2.3800 2.6469
72 1.2934 1.6663 1.9935 2.3793 2.6459
73 1.2933 1.6660 1.9930 2.3785 2.6449
A
IM
74 1.2931 1.6657 1.9925 2.3778 2.6439

75 1.2929 1.6654 1.9921 2.3771 2.6430
-L
76 1.2928 1.6652 1.9917 2.3764 2.6421

S
77 1.2926 1.6649 1.9913 2.3758 2.6412

PU
78 1.2925 1.6646 1.9908 2.3751 2.6403

79 1.2924 1.6644 1.9905 2.3745 2.6395
M
80 1.2922 1.6641 1.9901 2.3739 2.6387

CA
81 1.2921 1.6639 1.9897 2.3733 2.6379

82 1.2920 1.6636 1.9893 2.3727 2.6371
83 1.2918 1.6634 1.9890 2.3721 2.6364
84 1.2917 1.6632 1.9886 2.3716 2.6356
85 1.2916 1.6630 1.9883 2.3710 2.6349
86 1.2915 1.6628 1.9879 2.3705 2.6342
87 1.2914 1.6626 1.9876 2.3700 2.6335
88 1.2912 1.6624 1.9873 2.3695 2.6329
89 1.2911 1.6622 1.9870 2.3690 2.6322
90 1.2910 1.6620 1.9867 2.3685 2.6316
E
91 1.2909 1.6618 1.9864 2.3680 2.6309

AD
92 1.2908 1.6616 1.9861 2.3676 2.6303

93 1.2907 1.6614 1.9858 2.3671 2.6297
94 1.2906 1.6612 1.9855 2.3667 2.6291
95 1.2905 1.6611 1.9853 2.3662 2.6286
96 1.2904 1.6609 1.9850 2.3658 2.6280
97 1.2903 1.6607 1.9847 2.3654 2.6275
98 1.2902 1.6606 1.9845 2.3650 2.6269
99 1.2902 1.6604 1.9842 2.3646 2.6264
100 1.2901 1.6602 1.9840 2.3642 2.6259
-I I
22
20
Bibliografı́a
Agurto, H. y Alvarado, L. (2009). Estadı́stica para administración y economı́a con

aplicaciones en Excel, San Marcos.
Anderson, D. y Sweeney, D. (2008). Estadı́stica Para administración y economı́a, 10 edn,

Cengage Learning Latin America.
EP
Anderson, D., Sweeney, D., Williams, T., Camm, J. y Cochran, J. (2014). Statistics for
UD
Business and Economics, 12 edn, Cengage Learning.
Angulo, C. (2011). Estadı́stica, Universidad de Piura.

A
M
Berenson, M., Levine, D. y Krehbiel, T. (2006). Estadı́stica para administración, Pearson

LI
Educación.
S-
Johnson, R. y Kuby, P. (2008). Estadı́stica elemental: Lo esencial, 10 edn, CRC Press.

PU
Lind, D., Marchal, W. y Wathen, S. (2012). Estadı́stica aplicada a los negocios y la economı́a.,
M
15 edn, McGraw-Hill Interamericana.

CA
Triola, M. (2018). Estadı́stica, 12 edn, Pearson.
Ubøe, J. (2017). Introductory Statistics for Business and Economics. Theory, Exercises and
Solutions, Springer.
E
AD
-II
22
20
321

Texto Guia ES1 (A y B) 2022-II Prof. Hugo Agurto

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Texto Guia ES1 (A y B) 2022-II Prof. Hugo Agurto

Cargado por

Copyright:

Formatos disponibles

EP

FACULTAD DE CIENCIAS ECONÓMICAS Y

Hugo Agurto Mejı́a

1.3. Introducción a los términos básicos . . . . . . . . . . . . . . . . . . . . . . . . 2

1.4. Tipos de Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.5. Recolección de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.6. Fuentes de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.7. Problemas propuestos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2.2.1. Datos cuantitativos no agrupados . . . . . . . . . . . . . . . 40

2.3. Estadı́stica descriptiva: Técnicas o medidas numéricas . . . . . . . . . . . . . 47

2.3.1. Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . 47

2.3.1.4. Mediana para datos agrupados . . . . . . . . . . . . . . . . . 53

2.3.4.1. Coeficiente de asimetrı́a . . . . . . . . . . . . . . . . . . . . . 61

2.3.4.2. Coeficiente de curtosis . . . . . . . . . . . . . . . . . . . . . . 62

2.3.5.3. Cálculo de los percentiles y cuartiles para datos agrupados . 65

2.4. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

3. Teorı́a de probabilidad 108

3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

3.3.2. Ley de multiplicación de probabilidades . . . . . . . . . . . . . . . . . 117

3.3.3. Teorema de la probabilidad total y Teorema de Bayes . . . . . . . . . 123

4. Distribución de probabilidad discreta 151

4.5. Media, Varianza y desviación estándar de una distribución de probabilidad

4.5.1. Propiedades del valor esperado y de la varianza de una variable

4.6.1. Usando Tablas de Probabilidades Binomiales para el cálculo de

5. Distribución de probabilidad continua 187

5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

variable aleatoria continua . . . . . . . . . . . . . . . . . . . . . . . . . 189

5.5. Distribución de probabilidad normal . . . . . . . . . . . . . . . . . . . . . . . 197

5.6. Cálculo de probabilidades asociadas a una curva normal especı́fica . . . . . . 200

5.6.2. Estandarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

5.6.3. Cálculo de probabilidades (áreas) con la curva normal estándar . . . . 201

6. Distribuciones muestrales 245

6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

6.5. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264

7. Estimación de parámetros 272

7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272

7.4. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296

2.1. Distribución de frecuencias para la variable estado civil . . . . . . . . . . . . 37

2.2. Gráfica de pastel para la variable estado civil. . . . . . . . . . . . . . . . . . . 38

2.3. Diagrama de Pareto para las razones de no conformidad. . . . . . . . . . . . . 40

2.6. Histograma y polı́gono de frecuencias del Número de veces que un cliente va

2.7. Ojiva del Número de veces que un cliente va al supermercado. . . . . . . . . . 47

2.8. Distribuciones con diferentes asimetrı́as o sesgos. . . . . . . . . . . . . . . . . 62

2.9. Distribuciones con diferentes grados de curtosis. . . . . . . . . . . . . . . . . . 63

2.10. Diagrama caja-bigote de las estaturas de 15 estudiantes. . . . . . . . . . . . . 67

3.1. Representaciones de espacio muestra del lanzamiento de dos monedas . . . . 110

3.2. Representación de espacio muestra del lanzamiento de dos dados . . . . . . . 111

4.1. Función de probabilidad de X:Número de puntos obtenidos . . . . . . . . . . 153

4.2. Función de probabilidad de Y:Número de puntos obtenidos al lanzar dado

4.3. Función de probabilidad de X:Número de caras obtenidas al lanzar 3 veces

5.1. Gráfica de la Función de distribución de X pedida en 1b). . . . . . . . . . . . 191

normal estándar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203

5.15. Ilustración del cálculo de P (X > 17) para X ∼ N (20, 22 ). . . . . . . . . . . . 207

X > 51) para X ∼ N (45, 122 ). . . . 209

5.17. Ilustración del cálculo de P (X < 30 o

6.1. Proceso para realizar inferencias acerca de la media de la población, µ, a partir

de la media de una muestra, x, tomada de dicha población de estudio. . . . . 246

7.1. Ilustración sobre el nivel de confianza en la distribución muestral de x. . . . . 274

7.2. Comparando la distribución normal estándar (Z) y la distribución t. . . . . . 283

1.1. Operaciones apropiadas en los niveles o escalas de medición. . . . . . . . . . . 8

1.2. Agrupación de las 352 empresas de acuerdo con su rendimiento porcentual

2.1. Distribución de frecuencias del estado civil de las personas encuestadas. . . . 36

2.4. Distribución de frecuencias acumuladas del número de palabras leı́das. . . . . 42