Está en la página 1de 564

Título:

ESTADÍSTICA GENERAL PARA CPEL


2017.
© De esta edición
Fondo Editorial
Universidad San Ignacio de Loyola
Av. La Fontana 750, La Molina.
Teléfono 317-1000, anexo 3705
Dirección de Formación Básica
Autores:
Coordinación de producción:
María Olivera Cano
Fondo Editorial – USIL
moliverac@usil.edu.pe
Corrección de estilo:
Rafael Felices Taboada
Diagramación y diseño de portada:
Sergio Pastor Segura
ISBN:
Hecho en Depósito Legal en la Biblioteca Nacional del Perú Nº
Impresión:
Tarea Asociación Gráfica Educativa
Psje. María Auxiliadora 156, Lima 5, Perú
Impreso en el Perú
Derechos reservados conforme a ley. Prohibida la reproducción total o parcial
de esta publicación, por cualquier medio, sin permiso del editor.
ÍNDICE

Agradecimientos 17

CAPÍTULO 1: Conceptos Básicos y Organización de datos

Lección 1
Conceptos Básicos 21
1.1 Definición de la estadística 21
1.2 Ramas de la estadística 21
1.2.1 Estadística Descriptiva 21
1.2.2 Estadística Inferencial 21
1.3 Población, muestra y unidad elemental 22
1.3.1 Población 22
1.3.2 Tipos de población 22
1.3.3 Muestra 22
1.3.4 Unidad elemental 23
1.4 Tipos de muestreo 24
1.4.1 Muestreo probabilístico 24
1.4.2 Muestreo no probabilístico 26
1.5 Variable 27
1.5.1 Tipos de variables 27
1.6 Parámetro 29
1.7 Estadístico o estadígrafo 29
1.8 Organización de datos 32
1.9 Tablas de frecuencias 32
1.10 Tablas de frecuencias para variables cualitativas 33
1.11 Gráficos para variables cualitativas 34
1.12 Ejercicios resueltos 39
1.13 Trabajo colaborativo (Para trabajar en clase) 43
1.14 Trabajo autónomo 46
Lección 2
Tablas de frecuencia para
variables cuantitativas discretas y continuas 51
2.1 Tablas de frecuencia para variables cuantitativas discretas 51
2.2 Gráfico de líneas o bastones 52
2.3 Tablas de frecuencias por intervalos 59
2.4 Gráficos para variables cuantitativas continuas 61
2.4.1 Histograma 61
2.4.2 Polígono de frecuencias 62
2.5 Ejercicios resueltos 63
2.6 Trabajo colaborativo (Para trabajar en clase) 67
2.7 Trabajo autónomo 69
2.8 Problemas de reforzamiento del capítulo 72
2.9 Portafolio (Para subir al campus virtual) 74
2.10 Organización de datos con MINITAB 77
Tarea Académica N°1 103
2.11 Bibliografía 105

CAPÍTULO 2: Medidas de Tendencia Central y No Central

Lección 3
Medidas de tendencia central 109
3.1 Media Aritmética 109
3.1.1 Cálculo de la media aritmética para datos no agrupados 109
3.1.2 Ventajas y desventajas de la media aritmética 111
3.1.3 Propiedades de la media aritmética 112
3.2 Mediana 114
3.2.1 Cálculo de la mediana para datos no agrupados 114
3.2.2 Ventajas y desventajas de la mediana 116
3.3 Moda 117
3.3.1 Cálculo de la moda para datos no agrupados 117
3.4 Relación entre la media aritmética, mediana y moda 117
3.5 Media ponderada 119
3.6 Media Total 120
3.7 Ejercicios resueltos 121
3.8 Trabajo colaborativo (Para trabajar en clase) 124
3.9 Trabajo autónomo 126

Lección 4
Medidas de Tendencia No Central 129
4.1 Cuartiles 129
4.2 Deciles 129
4.3 Percentiles 130
4.3.1 Cálculo de percentiles para datos no agrupados 131
4.4 Ejercicios resueltos 134
4.5 Trabajo colaborativo (Para trabajar en clase) 138
4.6 Trabajo autónomo 140
4.7 Problemas de reforzamiento del capítulo 142
4.8 Portafolio (Para subir al campus virtual) 144
4.9 Medidas de tendencia central y no central con MINITAB 145
Bibliografía 149

CAPÍTULO 3: Medidas de Variabilidad, Asimetría y Curtosis

Lección 5
Medidas de variabilidad o dispersión 154
5.1 Rango 154
5.2 Rango intercuartílico 155
5.3 Varianza poblacional 155
5.4 Varianza muestral 156
5.5 Desviación estándar poblacional 157
5.6 Desviación estándar muestral 157
5.7 Coeficiente de variación 158
5.8 Propiedades de la varianza y la desviación estándar 159
5.9 Ejercicios resueltos 161
5.10 Trabajo colaborativo (Para trabajar en clase) 165
5.11 Trabajo autónomo 167

Lección 6
Medidas de asimetría y curtosis. Diagrama de caja. 171
6.1 Medidas de asimetría 171
6.2 Medidas de curtosis 173
6.3 Diagrama de caja 175
6.4 Ejercicios resueltos 177
6.5 Trabajo colaborativo (Para trabajar en clase) 179
6.6 Trabajo autónomo 182
6.7 Problemas de reforzamiento del capítulo 185
6.8 Portafolio (Para subir al campus virtual) 188
6.9 Medidas de dispersión con MINITAB 189
Tarea Académica N°2 191
6.10 Bibliografía 194

CAPÍTULO 4: Probabilidades

Lección 7
Conceptos básicos 197
7.1 Experimento aleatorio 197
7.2 Espacio muestral 197
7.3 Evento 197
7.4 Ocurrencia de un evento 198
7.5 Operaciones entre eventos 198
7.6 Probabilidad de un evento 201
7.7 Definición clásica de probabilidad 201
7.8 Principio de adición para dos eventos 203
7.9 Ejercicios resueltos 203
7.10 Trabajo colaborativo (Para trabajar en clase) 207
7.11 Trabajo autónomo 208

Lección 8
Probabilidad condicional 210
8.1 Definición 210
8.2 Principio de multiplicación para dos eventos 213
8.3 Principio de multiplicación para n eventos 213
8.4 Ejercicios resueltos 215
8.5 Trabajo colaborativo (Para trabajar en clase) 218
8.6 Trabajo autónomo 220

Lección 9
Eventos independientes 222
9.1 Definición 222
9.2 Ejercicios resueltos 225
9.3 Trabajo colaborativo (Para trabajar en clase) 227
9.4 Trabajo autónomo 229

Lección 10
Probabilidad Total y Bayes 231
10.1 Probabilidad Total 231
10.2 Teorema de Bayes 233
10.3 Ejercicios resueltos 234
10.4 Trabajo colaborativo (Para trabajar en clase) 239
10.5 Trabajo autónomo 240
10.6 Problemas de reforzamiento del capítulo 242
10.7 Portafolio (Para subir al campus virtual) 243
10.8 Bibliografía 244
CAPÍTULO 5: Distribuciones Discretas Importantes

Lección 11
Distribución Binomial 247
11.1 Definición 247
11.2 Medidas de resumen 247
11.3 Gráfica de la distribución Binomial 248
11.4 Ejercicios Resueltos 250
11.5 Trabajo Colaborativo (Para trabajar en clase) 252
11.6 Trabajo Autónomo 254

Lección 12
Distribución Poisson 256
12.1 Definición 256
12.2 Medidas de resumen 256
12.3 Gráfica de la distribución Poisson 257
12.4 Ejercicios Resueltos 258
12.5 Trabajo Colaborativo (Para trabajar en clase) 260
12.6 Trabajo Autónomo 261
12.7 Problemas de reforzamiento del capítulo 263
12.8 Portafolio (Para subir al campus virtual) 264
12.9 Distribuciones discretas (Binomial y Poisson) con MINITAB 265
12.10 Bibliografía 268

CAPÍTULO 6: Distribuciones Continuas Importantes

Lección 13
Distribución Normal 271
13.1 Definición 271
13.2 Propiedades de la curva de la distribución Normal 271
13.3 Distribución Normal Estándar 273
13.4 Tabla de la Distribución Normal Estándar 273
13.5 Ejercicios Resueltos 282
13.6 Trabajo Colaborativo (Para trabajar en clase) 286
13.7 Trabajo Autónomo 287

Lección 14
Distribuciones: Chi-Cuadrado, T-Student y F-Fisher 289
14.1 Distribución Chi – Cuadrado 289
14.1.1 Gráfica de la distribución Chi – Cuadrado 289
14.1.2 Medidas de resumen para la distribución Chi – Cuadrado 290
14.1.3 Relación entre las distribución Normal y Chi – Cuadrado 290
14.1.4 Uso de la tabla de la distribución Chi – Cuadrado 291
14.2 Distribución T-Student 294
14.2.1 Gráfica de la distribución T-Student 294
14.2.2 Propiedades de la distribución T-Student 295
14.2.3 Medidas de resumen para la distribución T-Student 295
14.2.4 Uso de la tabla de la distribución T-Student
14.3 Distribución F-Fisher 299
14.3.1 Gráfica de la distribución F-Fisher 299
14.3.2 Medidas de resumen para la distribución F-Fisher 299
14.3.3 Relación entre las distribuciones F-Fisher y Chi-Cuadrado 300
14.3.4 Uso de la tabla de la distribución F-Fisher 300
14.4 Ejercicios resueltos 302
14.5 Trabajo colaborativo (Para trabajar en clase) 303
14.6 Trabajo autónomo 303
14.7 Problemas de reforzamiento del capítulo 304
14.8 Portafolio (Para subir al campus virtual) 305
14.9 Distribuciones continuas (Normal) con MINITAB 306
14.10 Bibliografía 309
Capítulo 7: Estimación por intervalos

Lección 15
Estimación de parámetros.
Estimación por intervalos para la media poblacional (𝝁) 312
15.1 Estimación puntual de parámetros 312
15.2 Estimación por intervalo 312
15.3 Intervalo de confianza para la media poblacional (𝝁) 313
15.4 Ejercicios resueltos 319
15.5 Trabajo colaborativo (Para trabajar en clase) 322
15.6 Trabajo autónomo 323

Lección 16
Estimación por intervalos para la varianza
poblacional (𝝈𝟐) y la Proporción poblacional 325
16.1 Intervalo de confianza para la varianza poblacional (𝝈𝟐) 325
16.2 Intervalo de confianza para la proporción poblacional (𝝅) 327
16.3 Tamaño de muestra 329
16.3.1 Tamaño de muestra cuando se estima la media poblacional 329
16.3.2 Tamaño de muestra cuando se estima la proporción poblacional 331
16.4 Ejercicios resueltos 332
16.5 Trabajo colaborativo (Para trabajar en clase) 336
16.6 Trabajo autónomo 337

Lección 17
Estimación de intervalos para el
cociente de varianzas y diferencia de medias 339
17.1 Intervalo de confianza para el cociente de varianzas 339
17.2 Intervalo de confianza para la diferencia de dos medias poblacionales 341
17.3 Ejercicios resueltos 346
17.4 Trabajo colaborativo (Para trabajar en clase) 350
17.5 Trabajo autónomo 352
Lección 18
Estimación por intervalos para la
diferencia de proporciones poblacionales 354
18.1 Intervalos de confianza para la
diferencia de proporciones poblacionales 354
18.2 Ejercicios resueltos 355
18.3 Trabajo colaborativo (Para trabajar en clase) 359
18.4 Trabajo autónomo 360
18.5 Problemas de reforzamiento del capítulo 361
18.6 Portafolio (Para subir al campus virtual) 363

Capítulo 8: Prueba de hipótesis

Lección 19
Conceptos básicos y prueba
de hipótesis para la media poblacional (𝝁) 367
19.1 Prueba de hipótesis 367
19.2 Hipótesis estadística 367
19.3 Tipos de hipótesis 367
19.4 Tipos de errores 368
19.5 Tipos de hipótesis 369
19.6 Prueba de hipótesis para la media poblacional (𝝁) 370
19.7 Ejercicios resueltos 375
19.8 Trabajo colaborativo (Para trabajar en clase) 381
19.9 Trabajo autónomo 384

Lección 20
Prueba de hipótesis para la
proporción y la varianza poblacional (𝝈𝟐) 386
20.1 Prueba de hipótesis para la proporción poblacional 386
20.2 Prueba de hipótesis para la varianza poblacional (𝝈𝟐) 388
20.3 Ejercicios resueltos 389
20.4 Trabajo colaborativo (Para trabajar en clase) 393
20.5 Trabajo autónomo 395

Lección 21
Prueba de hipótesis para el
cociente de varianzas y para la diferencia de medias 398
21.1 Prueba de hipótesis para el cociente de varianzas 398
21.2 Prueba de hipótesis para la diferencia de medias poblacionales 401
21.3 Ejercicios resueltos 405
21.4 Trabajo colaborativo (Para trabajar en clase) 413
21.5 Trabajo autónomo 415

Lección 22
Prueba de hipótesis para la diferencia de proporciones
22.1 Prueba de hipótesis para la diferencia de proporciones 417
22.2 Ejercicios resueltos 419
22.3 Trabajo colaborativo (Para trabajar en clase) 422
22.4 Trabajo autónomo 423
22.5 Problemas de reforzamiento del capítulo 425
22.6 Portafolio (Para subir al campus virtual) 427

Capítulo 9: Diseño completamente aleatorizado para un factor

Lección 23
23.1 Conceptos básicos 431
23.1.1 Factor 431
23.1.2 Niveles del factor 431
23.1.3 Tratamiento 431
23.1.4 Unidad experimental 431
23.1.5 Variable respuesta 432
23.1.6 Dato u observación 432
23.1.7 Experimento 432
23.2 Diseño Experimental 432
23.3 Error Experimental 433
23.4 Principios Básicos de un Diseño Experimental 433
23.5 Modelo Aditivo Lineal 433
23.6 Análisis del modelo con efectos fijos 434
23.7 Análisis de Varianza (ANOVA) 435
23.7.1 Tabla ANOVA 436
23.8 Supuestos del Modelo 438
23.9 Ejercicios resueltos 443
23.10 Trabajo colaborativo (Para trabajar en clase) 456
23.11 Trabajo autónomo 459

Lección 24
Comparaciones Múltiples De Tukey 464
24.1 Método de Tukey 464
24.2 Ejercicios resueltos 465
24.3 Trabajo Colaborativo (Para trabajar en clase) 469
24.4 Trabajo Autónomo 475
24.5 Problemas de reforzamiento del capítulo 479
24.6 Portafolio (Para subir al campus virtual) 483

Capítulo 10: Pruebas chi-cuadrado

Lección 25
25.1 Prueba de Independencia 486
25.1.1 Disposición de los datos 487
25.1.2 Pasos para realizar una prueba de Independencia 488
25.2 Coeficiente de contingencia 489
25.3 Ejercicios resueltos 489
25.4 Trabajo colaborativo (Para trabajar en clase) 495
25.5 Trabajo autónomo 497
Lección 26 500
26.1 Prueba de Homogeneidad 500
26.1.1 Disposición de los datos 501
26.1.2 Pasos para realizar una prueba de homogeneidad 502
26.2 Ejercicios resueltos 503
26.3 Trabajo colaborativo (Para trabajar en clase) 505
26.4 Trabajo autónomo 507
26.5 Problemas de reforzamiento del capítulo 509
26.6 Portafolio (Para subir al campus virtual) 512

Capítulo 11: Regresión lineal simple

Lección 27 516
27.1 Gráfica de dispersión 516
27.2 Análisis de regresión 518
27.2.1 Regresión lineal simple 518
27.2.2 Estimación de los parámetros del modelo 519
27.2.3 Prueba de Hipótesis para validar la recta de regresión 521
27.3 Coeficiente de correlación de Pearson (r) 524
27.4 Coeficiente de Determinación (R2) 526
27.5 Ejercicios resueltos 528
27.6 Trabajo colaborativo (Para trabajar en clase) 537
27.7 Trabajo autónomo 539
27.8 Problemas de reforzamiento del capítulo 541
27.9 Portafolio (Para subir al campus virtual) 543

Claves de preguntas 544


Tablas Estadísticas 559
AGRADECIMIENTOS
Este libro de Estadística General es el producto de un trabajo colectivo en la
Universidad San Ignacio de Loyola. En este trabajo ha sido importante el espíritu
cooperativo de los docentes: tanto de los autores, como de aquellos que han
contribuido, de una u otra forma, en la elaboración de este trabajo.
Un agradecimiento muy especial al Vicerrector Académico, Juan Carlos Fonseca
y a nuestro Director de Estudios Generales, Luis Enrique Eyzaguirre, por su
interés permanente en optimizar el proceso de enseñanza-aprendizaje en la
USIL. A nuestros colegas que han contribuido con la revisión de este trabajo,
los profesores Jorge Chue Gallardo, Rosa Inga Santivañez y José Cruz Cabrera.

Luis Felipe Montesinos Ruiz


Coordinador de Estadística
Capítulo 1
CONCEPTOS BÁSICOS Y
ORGANIZACIÓN DE DATOS

Capacidades por desarrollar


Al finalizar el capítulo, se espera que el estudiante logre las siguientes capacidades:

• Identificar los conceptos básicos de la estadística y reconocerlos en


problemas contextualizados.
• Construir tablas de frecuencias para variables cualitativas y cuantitativas
(discretas y continuas) en problemas contextualizados.
• Construir gráficos para representar variables cualitativas y cuantitativas
(discretas y continuas) en problemas contextualizados.

ESTADÍSTICA GENERAL 19
Motivación
La recolección de datos y la presentación de resultados suelen ser la principal
preocupación de las personas que usan la estadística como herramienta para
tales objetivos. Sin embargo, hay que tener claro que, para lograr un buen reporte
estadístico que ayude a los involucrados a tomar las decisiones adecuadas
basados en resultados estadísticos, es necesario que todos ellos manejen de
forma clara los conceptos e interpreten adecuadamente los resultados que se
obtienen. De esta forma se logra un lenguaje claro y horizontal.

En un estudio acerca de la longitud (en cm) que puede alcanzar una variedad
de yucas en la selva del Cusco se está considerando una muestra de estos
productos, los resultados de tales medidas se presentan haciendo uso de
histogramas. De esta manera se puede visualizar el rango de las longitudes
presentadas en las yucas que forman parte de la muestra y, con esto, tener una
idea clara a cerca de la distribución de las longitudes.

¿Cuál es la longitud máxima para que las yucas se encuentren dentro del 25%
de yucas con mayor longitud?

Al finalizar el capítulo, el estudiante estará en capacidad de responder esta


pregunta y otras más, utilizando los conceptos básicos y la organización de
datos.

Saberes previos
• Nociones de población
• Operaciones algebraicas

20 ESTADÍSTICA GENERAL
Lección 1
Conceptos básicos
1.1 Definición de Estadística
La estadística es una ciencia que permite un trabajo interdisciplinario en diferentes
áreas de investigación proporcionando un conjunto de técnicas que ayudan al
profesional en la recolección, organización, resumen, análisis e interpretación de
los datos, los cuales le orientan en la toma de decisiones.

1.2 Ramas de la estadística


1.2.1 Estadística Descriptiva
Esta rama de la estadística proporciona un conjunto de métodos para organizar,
analizar, presentar e interpretar los datos de manera apropiada. Cabe indicar
que los resultados obtenidos son válidos solo para el conjunto de datos con el
que se trabajó.

Ejemplo 1.1
Según el IV Censo Nacional Agropecuario 2012, realizado por el INEI y el Ministerio
de Agricultura y Riego, el Perú tiene 1,6 millones más de hectáreas agrícolas,
así como medio millón más de productores y de unidades agropecuarias, en
comparación con los resultados del censo de 1994.

Observación
Un censo es un conjunto de procedimientos en el que se recolecta datos, de
la totalidad de sus elementos, en un periodo de tiempo específico.

1.2.2 Estadística Inferencial


A partir de un subconjunto de datos tomados de una población (muestra), esta
rama de la estadística proporciona un conjunto de técnicas que sirven para
generalizar los resultados obtenidos de la muestra para toda la población.

Ejemplo 1.2
En el Ministerio del Ambiente se realizaron estudios acerca de la calidad del
agua en los ríos cercanos a zonas mineras; para esto, se consideró una cantidad
limitada de ríos a ser estudiados por razones de tiempo y de capacidad de
ejecución. Los resultados del estudio se generalizan para la población utilizando
técnicas estadísticas adecuadas.

ESTADÍSTICA GENERAL 21
1.3 Población, muestra y unidad elemental
1.3.1 Población
Es un conjunto de elementos o individuos que poseen, al menos, una característica
en común delimitado en un espacio y tiempo.

Observación
Se utiliza la letra N para representar el tamaño de la población.

1.3.2 Tipos de población


De acuerdo con el número de elementos, la población puede ser:

a) Población finita
Una población es finita cuando tiene un número limitado o finito de
elementos.

Ejemplo 1.3
Un funcionario de la Municipalidad de Lima Metropolitana está realizando
estudios acerca de la seguridad por parte de las empresas constructoras
de viviendas en Lima Metropolitana en el último año. En este caso, la
población está compuesta por todas las empresas constructoras en Lima
Metropolitana, la cual representa una población finita.

b) Población infinita
Una población es infinita cuando tiene un número infinito de elementos.
Además, una población finita con un número grande de elementos se puede
considerar como una población infinita.

Ejemplo 1.4
Todos los libros de Estadística publicados en los últimos 20 años.

1.3.3 Muestra
Es un subconjunto que se selecciona de la población. Una muestra debe ser
representativa; es decir, debe mostrar las características típicas que poseen los
elementos de toda la población. Una muestra aleatoria y representativa contiene
la información necesaria para tomar decisiones respecto a la población.

22 ESTADÍSTICA GENERAL
¿Por qué razones se trabaja con los datos de una muestra y no con los datos
de toda la población?
Un estudio de toda la población es una tarea compleja y costosa por razones de
tiempo, dinero, recursos, seguridad y acceso a ciertos lugares, entre otras. Por
lo que estudiar la población a partir de una muestra es, muchas veces, lo más
recomendable.

Observación
Se utiliza la letra n para representar el tamaño de la muestra.

Ejemplo 1.5
En una compañía financiera, el gerente general quiere conocer el nivel de
satisfacción de los clientes sobre la atención recibida por parte de sus
trabajadores; para esto, se seleccionará a 67 clientes y se les preguntará sobre
el tiempo de atención, el trato recibido por parte del trabajador, la información
brindada, entre otras. En este caso, la muestra estará conformada por los 67
clientes.

1.3.4 Unidad elemental


Es cualquier elemento de la población que posee la información sobre el
fenómeno que se estudia.

Ejemplo 1.6
En un organismo de salud se desea supervisar a las pequeñas fábricas de
alimentos que están registradas hasta el mes de diciembre del año 2014 en el
distrito de Surquillo, sobre si cumplen con los requerimientos para la producción
de alimentos. En este caso, la unidad elemental es una fábrica de alimentos que
se encuentra registrada hasta el mes de diciembre del año 2014 en el distrito de
Surquillo.

Ejemplo 1.7
En la Superintendencia de Banca y Seguros se evaluó el nivel de endeudamiento,
en el año 2014, de los clientes de los diferentes bancos en Lima Metropolitana.
Para esto, se contrató a una empresa encuestadora que consideró una muestra
de 600 clientes de los diferentes bancos que se endeudaron en el año 2014.
Determine la población de estudio, la muestra y la unidad elemental en el
problema planteado.

ESTADÍSTICA GENERAL 23
Solución
Población: Todos los clientes de los diferentes bancos en Lima Metropolitana que
se endeudaron en el año 2014.
Muestra: Los 600 clientes seleccionados de los diferentes bancos en Lima
Metropolitana que se endeudaron en el año 2014.
Unidad Un cliente de los diferentes bancos en Lima Metropolitana que se
elemental: endeudó en el año 2014.

1.4 Tipos de muestreo


Los tipos de muestreo son: probabilístico y no probabilístico.

1.4.1 Muestreo probabilístico


Los elementos son seleccionados utilizando criterios técnicos. En este tipo de
muestreo, todos los elementos que pertenecen a la población tienen una pro-
babilidad de ser incluidos en la muestra. A continuación, se presentan algunos
tipos de muestreo probabilístico:

a) Muestreo aleatorio simple


En este tipo de muestreo, todos los elementos de la población tienen la
misma probabilidad de ser incluidos en la muestra dado que todos poseen
características homogéneas.

Ejemplo 1.8
Un editor debe hacer la revisión de un compendio recién escrito que consta
de 1,000 páginas con las mismas características para corregir los errores
ortográficos. Para estimar el promedio del número de errores por página en
el compendio, el editor elige una muestra aleatoria de 80 páginas. Teniendo
en cuenta la enumeración de dichas páginas, se procede con la selección
aleatoria de las páginas a ser revisadas según el muestreo aleatorio simple.

b) Muestreo aleatorio sistemático


En este tipo de muestreo, las unidades son ordenadas en forma sucesiva,
de tal forma que la población se pueda dividir en pequeños intervalos. El
punto de partida en el primer intervalo es elegido aleatoriamente, para luego
extraer los siguientes elementos de manera ordenada y sistemática.

Ejemplo 1.9
El jefe de control de calidad de una empresa textil que produce pantalones
realizó un estudio para evaluar los defectos más frecuentes en el proceso de

24 ESTADÍSTICA GENERAL
fabricación de estos. La compañía tiene una línea de producción de 1 000
pantalones diariamente, y en un día determinado se ha fijado el tamaño
de la muestra en 90 unidades. Entonces, el intervalo de selección de cada
elemento de la muestra será de 11 en 11 (1 000/90=11.1). El primer elemento
de la muestra se selecciona aleatoriamente entre los 11 primeros pantalones
producidos (por lo obtenido anteriormente). De suponer que el primer
elemento es el quinto de la lista, entonces el segundo será el décimo sexto
(5+11=16); el tercero, el vigésimo séptimo (16+11=27); y así sucesivamente
hasta completar los 90 pantalones.

c) Muestreo estratificado
Este tipo de muestreo se recomienda cuando la población se divide en grupos,
denominados estratos; de tal manera que los estratos sean heterogéneos, y
los elementos dentro de los estratos, homogéneos.

Ejemplo 1.10
Se desea conocer el tiempo promedio semanal dedicado al deporte
en jóvenes de 15 a 29 años de edad en las áreas rural y urbana de un
departamento de la sierra; por lo tanto, para estimar dicho promedio se
procederá al muestreo estratificado debido a que, dentro de cada área, los
jóvenes presentan características similares y, a la vez, las características
de los jóvenes de las áreas rural y urbana son diferentes. Si se estableció
el tamaño de muestra en 400 jóvenes, y teniendo en cuenta que en
este departamento el 70% de la población joven (entre 15 y 29 años)
vive en el área urbana, se considerará una muestra conformada por 280
jóvenes del área urbana y 120 jóvenes del área rural, los mismos que
participarán en el estudio.

d) Muestreo por conglomerados


Este tipo de muestreo se recomienda cuando la población se divide en grupos,
denominados conglomerados; de tal manera que los conglomerados sean
homogéneos, y los elementos dentro de los conglomerados, heterogéneos.

Ejemplo 1.11
En un distrito de Lima se estimará el porcentaje de electores que favorecen
al candidato A, minutos después de la hora final del proceso de votación.
La información para estimar el porcentaje será recopilada a partir de una
encuesta a boca de urna. Se considerará a cada mesa de votación como un
conglomerado, ya que cada mesa posee electores con diversas preferencias
y, a su vez, estas mesas son homogéneas entre sí.

ESTADÍSTICA GENERAL 25
1.4.2 Muestreo no probabilístico
Los elementos son seleccionados mediante criterios subjetivos, es decir, la
muestra no se selecciona utilizando criterios técnicos. En este tipo de muestreo
no se conocen las probabilidades de selección de los elementos que conforman
la población.
A continuación, se presentan algunos tipos de muestreo no probabilístico:

a) Muestreo por conveniencia


Los elementos son seleccionados por conveniencia del investigador, ya sea
por el fácil acceso o porque tienen características específicas propicias para
el objetivo del estudio. Este tipo de muestreo se utiliza con frecuencia en
estudios pilotos para establecer la muestra final.

Ejemplo 1.12
Un grupo de investigadores de una universidad de Lima desea estudiar
la influencia de la civilización en las tribus amazónicas en los aspectos
sociodemográfico de su población. Para este propósito se considera una
muestra por conveniencia que está formada por un grupo de personas
provenientes de dichas tribus y que viven habitualmente en Lima.

b) Muestreo por juicio


Un elemento es seleccionado por un experto en el tema que se investiga.

Ejemplo 1.13
Se quiere evaluar las condiciones de la pesca y del océano en los puertos del
norte del país. Para esto, se necesita la opinión especializada de un grupo de
biólogos marinos y dado que no existe un marco de muestreo de biólogos
marinos, se accede a ellos a través de personas referidas.

c) Muestreo por cuotas


En este tipo de muestreo se fija una “cuota” que consiste en un número
de individuos que tienen características determinadas. Una vez establecida
la cuota, se elige a los primeros individuos que cumplan con dichas
características. Este método es muy utilizado en las encuestas de opinión.

Ejemplo 1.14
Se desea entrevistar a 100 pobladores, entre 25 y 35 años, sobre su posición
acerca de la construcción de plantas de saneamiento de aguas residuales en
su distrito; para esto se realizarán entrevistas puerta por puerta a los jefes
de hogares, hasta llegar a completar la cuota de la cantidad de pobladores
requeridos por cada entrevistador.

26 ESTADÍSTICA GENERAL
d) Muestreo por bola de nieve
Se utiliza en poblaciones de difícil identificación y/o poco acceso. Un
elemento se selecciona de acuerdo con la información suministrada por
otros elementos de la población con las mismas características.

Ejemplo 1.15
La institución encargada de la defensa de los derechos de la mujer, el
niño y el adolescente realizó un estudio en un asentamiento humano de
la ciudad sobre el riesgo delictivo de los jóvenes provenientes de familias
disfuncionales entre las edades de 11 y 17 años. Para esto se entrevistó a uno
de los dirigentes del asentamiento humano y se le pidió datos de jóvenes
con estas características. Posteriormente se procedió a entrevistarlos y, a
través de ellos, se contactó con otros jóvenes con similares características.

1.5 Variable
Es una característica de la unidad elemental que es de interés para el investigador
y que puede ser expresada como un dato cualitativo o cuantitativo.

Observación
La unidad elemental puede proveer información relacionada con muchas
variables (características).

Ejemplo 1.16
En una empresa que se dedica a la limpieza de oficinas se desea obtener
información acerca de la satisfacción de los empleados con respecto al sueldo
que perciben por realizar la tarea de limpieza y del tiempo (en horas) que
dedican a esta tarea durante su turno de trabajo. En este caso, la variable
cualitativa es la satisfacción del empleado con respecto al sueldo que
perciben (muy satisfecho, satisfecho, ni satisfecho ni insatisfecho, insatisfecho
y muy insatisfecho) y la variable cuantitativa es el tiempo que les toma
realizar la tarea.

1.5.1 Tipos de variables


Las variables se clasifican en dos: variables cualitativas y variables cuantitativas.

a) Variables cualitativas
Sus valores están asociados a una característica cualitativa y se clasifican
en nominales y ordinales. Estas variables también son conocidas como
categóricas.

ESTADÍSTICA GENERAL 27
a.1) Variable cualitativa nominal
Son las que establecen dos o más categorías, entre las cuales no existe
un orden o jerarquía.

Ejemplo 1.17
Nacionalidad de las personas que llegan al Santuario de Machu Picchu
(peruano, brasilero, estadounidense, alemán, chino, entre otros).

a.2) Variable cualitativa ordinal


Son las que establecen categorías que guardan entre sí un orden o
jerarquía.

Ejemplo 1.18
Nivel de satisfacción de los clientes en un restaurante gourmet (muy
satisfecho, satisfecho, ni satisfecho ni insatisfecho, insatisfecho, muy
insatisfecho).

b) Variables cuantitativas
Estas variables toman un valor numérico y se clasifican en discretas y
continuas.

b.1) Variable cuantitativa discreta


Son aquellas cuyos valores son enumerativos o resultan del proceso de
contar.

Ejemplo 1.19
Número de veces que una persona visitó el banco en un mes.

b.2) Variable cuantitativa continua


Son aquellas que toman un número infinito de valores. Generalmente se
les asocia con procesos de medición.

Ejemplo 1.20
Distancia recorrida en kilómetros por un avión en un viaje determinado.

Observación
Las variables cualitativas pueden tomar un valor numérico, pero las
operaciones aritméticas no son significativas para este tipo de datos
Ejemplo: los niveles de satisfacción codificados numéricamente.

28 ESTADÍSTICA GENERAL
1.6 Parámetro
Un parámetro es una medida de resumen relacionada con los datos de toda la
población; es decir, describe una característica de esta. Los parámetros más
usuales son: promedio poblacional (µ), proporción poblacional (π) y varianza
poblacional (σ2).

Ejemplo 1.21
En un estudio sobre las preferencias de los comensales que asistieron a una
feria gastronómica en el último año, se obtuvo que el 67% de la población de
comensales consumió el plato “Chancho al palo”.

1.7 Estadístico o estadígrafo


Un estadístico o estadígrafo es una medida de resumen que se obtiene con los
datos de la muestra. Se caracteriza porque su valor cambia de muestra a muestra;
es decir, presenta variabilidad (no es constante). Los estadísticos más usuales
son: promedio muestral (x ̅), proporción muestral (p) y varianza muestral (s ).
2

Ejemplo 1.22
En un estudio de opinión pública se entrevistó a 766 ciudadanos para conocer el
grado de aceptación con respecto a la gestión presidencial; uno de los resultados
obtenidos fue: el 33% de los entrevistados está a favor de dicha gestión. Este
resultado representa al estadístico proporción muestral de ciudadanos que
están a favor de la gestión presidencial (p = 0.33).

Ejemplo 1.23
Con el fin de conocer el flujo de las ventas en el mes de diciembre del año
2014, el dueño de una empresa de computo revisó 43 facturas de su tienda
comercial y obtuvo información respecto al monto de facturación, tipo de
producto, cantidad de productos vendidos, tipo de cliente (natural/jurídica)
y tipo de compra (contado/crédito). Los resultados obtenidos se muestran a
continuación:
• El 26% de los clientes compró laptops.
• El monto promedio de facturación fue de 465.85 soles.
• En promedio, se vendieron dos productos por factura.
• El 75% de los clientes fueron personas naturales.
• El 80% de los clientes pagó al contado.
a) Defina la población, muestra y unidad elemental.
b) Indique las variables y su tipo.
c) Determine el estadístico y el parámetro para el monto de facturación.
d) Proporcione el estadístico y el parámetro para el tipo de compra.

ESTADÍSTICA GENERAL 29
Solución

a)

Población: Todas las facturas de venta de la empresa de cómputo en el mes


de diciembre del año 2014.
Muestra: Las 43 facturas de venta de la empresa de cómputo en el mes de
diciembre del año 2014.
Unidad de análisis: Una factura de venta de la empresa de cómputo en el mes de
diciembre del año 2014.

b)

Variable Tipo de variable


Monto de facturación Cuantitativa continua
Tipo de producto Cualitativa nominal
Número de productos vendidos Cuantitativa discreta
Tipo de cliente Cualitativa nominal
Tipo de compra Cualitativa nominal

c)

Variable: Monto de facturación


Estadístico Monto promedio de facturación muestral en el mes de diciembre; el
_
valor fue de 465.85 soles (x=465.85).
Parámetro Monto promedio de facturación poblacional en el mes de diciembre
( µ es desconocido).

d)

Variable: Tipo de compra


Estadístico Proporción muestral de clientes que realizan el pago al contado
(p1 = 0.80).
Proporción muestral de clientes que realizan el pago al crédito
(p2 = 0.20).
Parámetro Proporción poblacional de clientes que realizan el pago al contado (
π1 es desconocido).
Proporción poblacional de clientes que realizan el pago al crédito
( π2 es desconocido).

30 ESTADÍSTICA GENERAL
Ejemplo 1.24
El presidente de la región Áncash, conjuntamente con representantes de la
empresa Recreativa S.A., está evaluando instalar el servicio de cine en la ciudad
de Huaraz. Para esto, el encargado del estudio realizó una encuesta en noviembre
del 2014 a 250 personas de dicha ciudad, y cuyas edades se encuentran entre 18
y 39 años. Entre otras, se formularon las siguientes preguntas: ¿Está de acuerdo
en instalar el servicio de cine en la ciudad de Huaraz?, ¿cuánto estaría dispuesto
a pagar por una entrada?, ¿en qué horario de atención asistiría?, ¿qué tipo de
snack le gustaría que se ofreciera? y ¿qué tipo de promociones prefiere?
Del estudio se obtuvo que:
• La edad promedio de los encuestados fue 30.2 años.

• Todos los encuestados manifestaron estar completamente de acuerdo


en la instalación del cine en la ciudad de Huaraz.
• Una persona estaría dispuesta a pagar, en promedio, 10 soles.
• El 64% de los encuestados prefiere el turno noche.

• Al 76% de las personas le gustaría que se ofrezca popcorn, al 15% que se


ofrezca pan con hot-dog y al 9% otros tipos de snacks.
• La quinta parte de los encuestados prefiere que hayan días en que las
entradas se ofrezcan 2x1.

a) Identifique los siguientes conceptos según el enunciado propuesto:

Población Todas las personas de la ciudad de Huaraz cuyas edades se


encuentran entre 18 y 39 años en noviembre del 2014.
Muestra 250 personas de la ciudad de Huaraz cuyas edades se encuentran
entre 18 y 39 años en noviembre del 2014.
Unidad elemental Una persona de la ciudad de Huaraz cuya edad se encuentra entre
18 y 39 años en noviembre del 2014.
• Edad promedio muestral; el valor fue de 30.2 años.
Estadístico(s) • Proporción muestral de personas que prefiere el turno noche; el
valor fue de 0.64.
• Precio promedio muestral que una persona estaría dispuesta a
pagar; el valor fue de 10 soles.
• Proporción muestral de personas que prefieren el popcorn; el
valor fue de 0.76.
• Proporción muestral de personas que prefieren que haya días en
que las entradas se ofrezcan a 2x1; el valor fue de 0.20.

ESTADÍSTICA GENERAL 31
b) Identifique los siguientes conceptos según el enunciado propuesto:

Variable Tipo de variable


Edad Cuantitativa continua
Opinión acerca de la instalación del cine en la ciudad de Huaraz Cualitativa ordinal
Precio de entrada Cuantitativa continua
Horario de atención Cualitativa nominal
Servicio de snack Cualitativa nominal
Tipo de promoción Cualitativa nominal

Tablas de frecuencias para variables cualitativas

1.8 Organización de datos


Después de recopilar los datos, es necesario que se organicen, analicen y
presenten. La presentación de los resultados se puede hacer por medio de un
reporte estadístico, el cual contiene: tablas de frecuencias y/o gráficos, medidas
de resumen, modelos estadísticos, pruebas estadísticas, entre otros, en base a
los cuales se tomarán decisiones.
En esta sección se construirán tablas de frecuencias y gráficos de acuerdo con
el tipo de variable.

1.9 Tablas de frecuencias


Las tablas de frecuencias muestran la distribución de los datos de acuerdo con
los valores que toma la variable que es objeto de estudio. Estas tablas presentan
en sus columnas diversos tipos de frecuencias, tales como las frecuencias
absolutas, relativas y porcentuales.

Componentes de una tabla de frecuencias


Las componentes de una tabla de frecuencias son las siguientes:

1. Numeración de la tabla: La numeración tiene que ser de forma sucesiva


cuando se presentan dos o más tablas.
2. Título de la tabla: El título debe ser redactado en forma adecuada, de manera
breve y clara, para expresar en forma general la descripción de su contenido.
3. Encabezado: En el encabezado se muestra el nombre de la variable y los
tipos de frecuencias que se presentan en la tabla.
4. Cuerpo o contenido: El cuerpo o contenido está formado por las columnas,
donde se muestran las categorías de la variable y las frecuencias respectivas.

32 ESTADÍSTICA GENERAL
5. Fuente: En la fuente se muestra el nombre de la institución de donde se
obtuvieron los datos en caso de que estos no sean propios.

A continuación se presenta una tabla de frecuencias para una variable cualitativa


en la que se incluyen todas las componentes descritas anteriormente:

Tabla Nº 01. Distribución de un grupo de jóvenes según la preferencia de


cerveza en el distrito de La Molina, Diciembre – 2014

Marca de cerveza fi hi pi
Cusqueña 15 0.1667 16.67
Arequipeña 13 0.1444 14.44
Cristal 22 0.2444 24.44
Brahma 15 0.1667 16.67
Pilsen 13 0.1444 14.44
Artesanales 12 0.1333 13.33
Total 90 1 100

Fuente: Departamento de Ventas de la Distribuidora ABC

1.10 Tablas de frecuencias para variables cualitativas


En la construcción de tablas de frecuencias para variables cualitativas se
consideran las siguientes columnas:

1. En la primera columna se muestran los diferentes valores (X1, X2,…,Xm) que


toma la variable. Cabe indicar que los valores que toma la variable se conocen
como categorías.
2. En la segunda columna se muestran las frecuencias absolutas (fi) que
representan el número de veces que se repite cada una de las categorías en
el conjunto de datos.
3. En la tercera columna se muestran las frecuencias relativas (hi= fi /n) que
representan la proporción de cada una de las categorías en el conjunto de
datos.
4. En la cuarta columna se muestran las frecuencias porcentuales (pi=hi x100)
que representan el porcentaje de cada una de las categorías en el conjunto
de datos.
Se debe verificar que la suma de todas las frecuencias absolutas es igual al
número de datos (n) y que la suma de todas las frecuencias relativas es igual
a uno. Es decir:

ESTADÍSTICA GENERAL 33
Donde: m es el número de categorías de la variable de estudio.

Observación
Si se trabaja con todos los datos de la población, se cumple que:

A continuación se presenta el esquema de la tabla de frecuencias para una


variable cualitativa en la que se incluyen las columnas que han sido descritas
anteriormente:

Tabla Nº 02. Distribución de frecuencias para una variable cualitativa

Valores Frecuencias Frecuencias Frecuencias


observados absolutas relativas porcentuales
xi fi hi pi

x1 f1 h1 p1
x2 f2 h2 p2
. . . .
. . . .
xm fm hm pm
Total n 1 100

1.11 Gráficos para variables cualitativas


La información que se presenta en una tabla de frecuencias puede ser
complementada con gráficos estadísticos para su mejor presentación y
entendimiento. Los gráficos que más se utilizan para representar variables
cualitativas son los de barra y sectores circulares.

34 ESTADÍSTICA GENERAL
1. Gráfico de barra
En este tipo de gráfico, a cada categoría le corresponde una barra vertical
(horizontal) cuya altura (longitud) corresponde a su respectiva frecuencia
absoluta, relativa o porcentual.

Pasos para su construcción:

Paso 1: Se traza un sistema de coordenadas; luego, los valores que toma la


variable (categorías) se representan en el eje X, y las frecuencias absolutas,
relativas o porcentuales son representadas en el eje Y.

Paso 2: A cada valor de la variable le corresponde una barra cuya altura


corresponde a su respectiva frecuencia absoluta, relativa o porcentual (se
puede colocar el valor de la frecuencia correspondiente en la parte superior
de la barra).

Observaciones
• Todas las barras deben tener el mismo ancho.
• Los espacios entre las barras tienen que ser iguales.

Ejemplo 1.25
El jefe de servicio de postventa de una empresa de telefonía móvil obtuvo
información sobre el grado de satisfacción de 65 clientes con respecto al nuevo
servicio de Internet que brinda esta compañía. Los resultados obtenidos fueron
los siguientes:

MM B MB MB R B M R R B R M MB
MM B B M B B MM B M R MB R MM
R M MB MB R R M B MM M M MB MB
B R MB B M MM MM R M B MB M R
B M B R R M M R B R MB R MM

Donde:

MM: Muy Malo, M: Malo, R: Regular, B: Bueno, MB: Muy Bueno.

Construya una tabla de frecuencias y un gráfico de barras para representar este


conjunto de datos.

ESTADÍSTICA GENERAL 35
Solución

Tabla Nº 03. Distribución de los clientes según el grado de


satisfacción del servicio de Internet

Grado de
fi hi pi
satisfacción

Muy Malo 8 0.1231 12.31


Malo 14 0.2154 21.54
Regular 17 0.2615 26.15
Bueno 15 0.2308 23.08
Muy Bueno 11 0.1692 16.92
Total 65 1 100

2. Gráfico de sectores circulares


En este tipo de gráfico, a cada categoría le corresponde un sector circular
cuya área es proporcional a su respectiva frecuencia absoluta, relativa o
porcentual. Generalmente se utiliza la frecuencia porcentual.
Para calcular el ángulo (αSi ) del sector circular que corresponde a la categoría
i se utiliza la siguiente fórmula:

36 ESTADÍSTICA GENERAL
Donde:
Si = Sector circular que corresponde a la categoría i.
pi = Frecuencia porcentual que corresponde a la categoría i.
Figura Nº 02. Gráfico de sectores de la
exportación de productos tradicionales en junio 2013

Fuente: elaboración propia.

Ejemplo 1.26
En el Ministerio de Agricultura se capacitó a un grupo de 30 productores del sur
del país. A ellos se les preguntó: ¿cuál es su principal producto de cultivo? Las
respuestas fueron las siguientes:

Papa Papa Habas Papa Papa Habas


Quinua Habas Cebada Papa Papa Cebada
Quinua Cebada Papa Quinua Papa Quinua
Cebada Quinua Papa Quinua Habas Papa
Quinua Cebada Habas Habas Cebada Quinua

Construya un gráfico de sectores para representar a este conjunto de datos.

Solución
• A continuación se muestra la tabla de frecuencias correspondiente:

ESTADÍSTICA GENERAL 37
Tabla Nº 04. Distribución de los productores según el principal
producto de cultivo

Producto fi hi pi
Habas 6 0.2000 20.00
Quinua 8 0.2667 26.67
Cebada 6 0.2000 20.00
Papa 10 0.3333 33.33
Total 30 1 100

Figura Nº 3. Gráfico de sectores de los productores según el


principal producto de cultivo

Donde los ángulos se obtienen de la siguiente manera:


Para habas:

Para quinua:

Y de la misma manera, se obtienen los otros ángulos.

38 ESTADÍSTICA GENERAL
1.12 Ejercicios resueltos
1. El turismo en el Perú se constituye en la tercera industria más grande de
la nación, detrás de la pesca y la minería. Por tal motivo, el Ministerio de
Comercio Exterior y Turismo, a través de sus representantes, llevó a cabo
un estudio para conocer las preferencias del tipo de turismo que se realiza
en el interior del país. Para dicho objetivo, los representantes seleccionaron
al azar a 100 turistas extranjeros que visitaron el Perú en la última semana y
se obtuvo la siguiente información:

El 25% de los turistas prefiere hacer turismo cultural (visitar museos, restos
arqueológicos, entre otros), el 30% prefiere hacer turismo de aventura, el
15% prefiere hacer ecoturismo en la Amazonía peruana, el 25% prefiere
hacer turismo gastronómico, y los restantes, otro tipo de turismo. Asimismo,
se obtuvo que, en promedio, un turista gasta US$70.50 por día en realizar
algunas de estas actividades.

a) Determine la población, muestra y unidad elemental.


b) Identifique las variables de estudio e indique su tipo.
c) De acuerdo con el enunciado, señale los parámetros o estadísticos
presentados.

Solución

a)
Población Todos los turistas extranjeros que visitaron el Perú en la última semana.
Muestra 100 turistas extranjeros que visitaron el Perú en la última semana.
Unidad de Un turista extranjero que visitó el Perú en la última semana.
análisis

b)
Variable Tipo de variable

Tipo de turismo Cualitativa nominal

Gasto diario Cuantitativa continua

ESTADÍSTICA GENERAL 39
c)
Estadístico Parámetro
Porcentaje muestral de turistas extranjeros según el Porcentaje poblacional de
tipo de turismo. turistas extranjeros según el
Ejemplos: tipo de turismo.
• El 25% de los turistas prefiere el turismo cultural. Ejemplos:
• El 30% de los turistas prefiere el turismo de • No hay
aventura.
Gasto diario promedio
Gasto diario promedio muestral.
poblacional.
Ejemplo:
Ejemplo:
• US$70.50
• No hay

2. Un estudiante de la carrera de Administración del programa CPEL se interesó


en recolectar información sobre las preferencias de sus 25 compañeros con
respecto a las playas de Lima y Callao que más visitan. Para esto, el estudiante
elaboró una encuesta que consistía, entre otras, en las siguientes preguntas:
¿Cuál es tu playa preferida?, ¿con quién(es) vas a la playa?, ¿cuántas horas
permaneces en la playa?

Los resultados obtenidos son los siguientes:

Playa Tipo de Horas de 13 El Silencio Familia 6



Preferida compañía permanencia
14 San Bartolo Amigos 7
1 El Silencio Amigos 6
15 Punta Hermosa Amigos 7
2 Punta Hermosa Amigos 5
16 El Silencio Pareja 10
3 El Silencio Amigos 7
17 Punta Hermosa Amigos 6
4 Punta Hermosa Familia 8
18 Punta Hermosa Familia 7
5 El Silencio Amigos 6
19 El Silencio Familia 6
6 San Bartolo Amigos 5
20 San Bartolo Amigos 8
7 El Silencio Pareja 9
21 Punta Hermosa Familia 9
8 San Bartolo Familia 9
22 El Silencio Amigos 8
9 El Silencio Pareja 10
23 San Bartolo Pareja 8
10 Punta Hermosa Amigos 7
24 El Silencio Pareja 7
11 Punta Hermosa Familia 8
25 San Bartolo Amigos 7
12 San Bartolo Pareja 5

40 ESTADÍSTICA GENERAL
I. Para la variable: Tipo de compañía
a) Construya la tabla de frecuencias correspondiente.
b) Interprete f1, h3 y p2.
c) Realice un gráfico de sectores.

II. Para la variable: Playa preferida


a) Realice un gráfico de barras.
b) ¿Qué playa fue la más preferida?
c) ¿Qué porcentaje de estudiantes prefirió la playa Punta Hermosa?

Solución
I.
a)

Tabla Nº 05. Distribución de los estudiantes según


el tipo de compañía

Tipo de compañía fi hi pi

Amigos 12 0.48 48
Familia 7 0.28 28
Pareja 6 0.24 24
Total 25 1 100
b)

f1 = 12 estudiantes concurrieron a la playa con amigos.


h3 = La proporción de estudiantes que concurrieron a la playa con pareja
es 0.24.
p2 = El 28% de los estudiantes visitó la playa con la familia.

ESTADÍSTICA GENERAL 41
Figura Nº 04. Gráfico de sectores de los estudiantes según
el tipo de compañía

II.
a)

b) Como se observa en el gráfico, la playa más preferida por los estudiantes


fue El Silencio.

c) El porcentaje de estudiantes que prefirieron la playa Punta Hermosa es


32%.

42 ESTADÍSTICA GENERAL
1.13 Trabajo colaborativo (para trabajar en clase)
1. Diga si las siguientes afirmaciones son verdaderas (V) o falsas (F). En caso
de que sean falsas, escriba la afirmación correcta:
a) Los valores que se obtienen con los datos de una muestra se denominan
estadísticos. ( )
b) La unidad de análisis es la información que brinda el individuo. ( )
c) Para generalizar los resultados de una muestra a toda la población, se
utiliza la estadística descriptiva. ( )
2. Diga si las siguientes afirmaciones son verdaderas (V) o falsas (F). En caso
de que sean falsas, escriba la afirmación correcta:
a) Para estudiar las características de los turistas que llegan a un hotel, el
administrador seleccionó una muestra aleatoria de 50 de ellos; entonces,
este utilizará la estadística descriptiva para generalizar los resultados. ( )
b) Con la intención de introducir un nuevo producto de belleza al mercado,
el jefe del área de marketing de una empresa realizó un focus group con
12 mujeres. Para esto, el jefe utilizó el muestreo probabilístico. ( )
c) El jefe de Recursos Humanos de una empresa presentará los resultados
que obtuvo a partir de los datos de todos los trabajadores de la empresa.
Para presentar estos resultados, el jefe utilizará la estadística inferencial.
( )
3. Durante los meses de noviembre y diciembre del año 2014 se implementó,
por primera vez en el Perú, la Encuesta Nacional de Educación y Salud. Los
objetivos del sondeo fueron obtener datos precisos sobre comportamientos
relativos a la salud, factores de riesgo y factores de protección entre los
estudiantes, y proveer información para la generación de políticas saludables
en pro de los escolares.
La encuesta fue aplicada a 2,882 estudiantes que cursaban entre el segundo
y el cuarto año de educación secundaria, y que respondieron en forma
anónima y de manera autoadministrada.
A continuación, se presentan algunos de los resultados: (i) El 81.8% de los
estudiantes tiene entre 13 y 15 años de edad, (ii) En promedio, cada estudiante
tiene tres hermanos que viven con él, (iii) EL 20% de los estudiantes
presentan sobrepeso, (iv) El 4.4% de los estudiantes refirió cepillarse los
dientes menos de una vez al día, (v) El 59.6% de los estudiantes tomó por
primera vez alguna bebida que contenía alcohol antes de los 14 años.
a) Defina la población y la muestra.
b) Defina las variables e indique su tipo.
c) Defina en forma adecuada, y en términos del problema, dos posibles
parámetros.
d) ¿El estudio realizado corresponde a una aplicación de la Estadística
Descriptiva o Inferencia Estadística? Sustente su respuesta.

ESTADÍSTICA GENERAL 43
4. El gerente de la empresa minera Antemina S.A. ha realizado un estudio para
conocer la opinión de los ciudadanos respecto a la actividad minera en el
país. La muestra estuvo compuesta por 1 202 personas, entre hombres y
mujeres, de 18 a 70 años, y de todos los niveles socioeconómicos, a nivel
nacional. Algunos de los resultados obtenidos fueron los siguientes:

• El 64% de las personas está a favor de la actividad minera en el país.

• El 58% de las personas piensa que la minería genera empleo, el 16%


piensa que la minería mejora las economías regionales, el 10% piensa que
la minería genera mayor recaudación de impuestos, el 9% piensa que la
minería atrae inversiones, y el 7% piensa otras cosas.

• Por otra parte, de los que rechazan esta actividad, el 62% piensa que
la actividad económica contamina el medio ambiente, el 12% piensa que
solo enriquece a algunas personas, el 9% piensa que se llevan las riquezas
del Perú, el 8% piensa que afecta la salud, y el 9% tiene otras razones.

• Un 3% opina que la minería cuida mucho el medio ambiente, el 31% piensa


que la minería cuida poco el medio ambiente, el 59% piensa que la minería
no cuida el medio ambiente, y el resto no conoce del tema.

Según este enunciado:


a) Identifique: Población, muestra y unidad elemental.
b) Defina las variables de interés y sus tipos.
c) Defina los posibles parámetros para dos variables definidas en b).
d) El 58% de las personas piensa que la actividad minera genera empleo.
¿Este valor representa un parámetro o un estadígrafo (estadístico)?
Sustente.
e) ¿El estudio corresponde a una aplicación de la Estadística Descriptiva o
Inferencia Estadística? Sustente su respuesta.
5. Una compañía extranjera de restaurantes que opera a nivel internacional
está interesada en integrar a su servicio la incomparable cocina peruana.
Para esto, el gerente de marketing de la empresa realizó una encuesta a
35 turistas con la finalidad de conocer sus preferencias con respecto a la
comida peruana. Los resultados obtenidos se muestran a continuación:

44 ESTADÍSTICA GENERAL
Plato de comida
Nº turista Nacionalidad Postre preferido
preferido
1 Argentina Cebiche Mazamorra morada
2 Argentina Lomo saltado Suspiro a la limeña
3 Argentina Cebiche Mazamorra morada
4 Argentina Lomo saltado Mazamorra morada
5 Argentina Cuy chactado Suspiro a la limeña
6 Argentina Cebiche Arroz con leche
7 Argentina Lomo saltado Turrón
8 Argentina Pachamanca Arroz con leche
9 Argentina Cuy chactado Picarones
10 Argentina Cebiche Arroz con leche
11 Colombiana Cuy chactado Suspiro a la limeña
12 Colombiana Pachamanca Arroz con leche
13 Colombiana Cebiche Turrón
14 Colombiana Cebiche Mazamorra morada
15 Colombiana Cebiche Mazamorra morada
16 Colombiana Pachamanca Suspiro a la limeña
17 Colombiana Pachamanca Arroz con leche
18 Colombiana Pachamanca Arroz con leche
19 Brasilera Cebiche Arroz con leche
20 Brasilera Cebiche Arroz con leche
21 Brasilera Cuy chactado Suspiro a la limeña
22 Brasilera Cebiche Arroz con leche
23 Brasilera Pachamanca Arroz con leche
24 Americana Cuy chactado Suspiro a la limeña
25 Americana Pachamanca Turrón
26 Americana Cebiche Arroz con leche
27 Americana Cebiche Turrón
28 Americana Pachamanca Suspiro a la limeña
29 Americana Cebiche Suspiro a la limeña
30 Americana Pachamanca Arroz con leche
31 Europea Cebiche Mazamorra morada
32 Europea Cebiche Mazamorra morada
33 Europea Cuy chactado Mazamorra morada
34 Europea Cuy chactado Mazamorra morada
35 Europea Cuy chactado Arroz con leche

ESTADÍSTICA GENERAL 45
I. Para la variable: Nacionalidad
a) Construya la tabla de frecuencias correspondiente.
b) Interprete f2, h3 y p5.
c) Realice un gráfico de barras.

II. Para la variable: Plato de comida preferido


a) Construya la tabla de frecuencias correspondiente.
b) ¿Qué porcentaje de turistas prefirió el cebiche?
c) ¿Cuántos turistas prefirieron el cuy chactado o la pachamanca?

III. Para la variable: Postre preferido


a) Realice un gráfico de sectores.
b) ¿Cuál fue el postre más preferido por los turistas?
c) ¿Cuántos turistas prefirieron el suspiro a la limeña?

1.14 Trabajo autónomo


1. Relacione los términos estadísticos con las definiciones correspondientes.

Medida de resumen que se obtiene con los


a) Dato ( )
datos de una muestra.
Los elementos tienen la misma probabilidad de
b) Cualitativa ordinal ( )
ser incluidos en la muestra.
c) Estadístico Resultado de la observación de la variable. ( )
d) Muestreo aleatorio simple Guardan entre sí un orden o jerarquía. ( )

2. Para los siguientes enunciados identifique: población, muestra, unidad


elemental, variables, tipo de variables, estadísticos o parámetros adecuados,
y dé un ejemplo de observación para cada variable:

a) Un funcionario de una empresa de servicio de agua potable y alcantarillado


en Lima desea estimar el consumo promedio trimestral de agua por familia
en la urbanización EL SOL de la ciudad.

b) El 36% de los clientes se encuentra satisfecho con los servicios brindados


por los agentes de crédito que se ubican en los diferentes distritos de la
ciudad. Este resultado se obtuvo de 350 clientes entrevistados durante el
mes de agosto de 2014.

46 ESTADÍSTICA GENERAL
3. Con la finalidad de ofrecer futuras promociones a sus clientes, los
vendedores de una empresa productora y comercializadora de equipos
electrodomésticos solicitan la siguiente información:

Nombre: Estado civil:

a) Soltero b) Conviviente

c) Casado d) Separado
Dirección: Sexo:

a) Masculino b) Femenino
Correo electrónico: Teléfono:
¿Dónde compró el equipo?

a) Tienda de electrodomésticos b) Tienda por departamento

c) Centros especializados de la empresa


Ciudad: Distrito:
¿Cuál fue el motivo de la compra del equipo?

a) La garantía b) La calidad c) El precio d) La facilidad de pago


Edad (años): Ingreso mensual (en soles):

a) Menor a 1 500 b) De 1 500 a 2 000

c) De 2 000 a 2 500 d) Mayor o igual a 2 500

Con referencia al texto anterior, complete los siguientes espacios en blanco:

a) La variable “Motivo de la compra del equipo” es de tipo ________________


y un posible estadístico es: _____________________________.

b) La variable “Lugar de compra del equipo” es de tipo ___________________


y un posible parámetro es:______________________________________.

c) La variable “Edad” es de tipo ______________________________ y una


posible gráfica a utilizar es: ______________________________________.

d) La variable “Ingreso mensual” es de tipo ____________________________y


un posible estadístico es: _________________________________.

4. En los últimos años, el consumo del servicio telefónico móvil se ha


incrementado; a raíz de esto, las empresas dedicadas a este rubro han
iniciado una competencia sin cuartel con la finalidad de incorporar más
clientes y retener a los que ya tenían.

ESTADÍSTICA GENERAL 47
Como consecuencia de este boom en telefonía celular, una empresa habilitó
un nuevo servicio en su red de Internet (4G) para algunos modelos de
celulares, pero con algunas restricciones. Debido a los reclamos por fallas
en la red, un funcionario de OSISTEL realizó un estudio que consistió en
encuestar a 400 clientes de Lima Metropolitana con el objetivo de comprobar
cuál es el grado de satisfacción de los clientes con este servicio.
Algunos resultados fueron:

• El 30% de los clientes encuestados respondió que el servicio se hace más


lento el día domingo.

• El 15% de los encuestados respondió que una de las limitaciones del


servicio es que la red no está disponible en ciertos puntos geográficos.

• El tiempo promedio de conexión a Internet es de 10 segundos.

• El 20% de los encuestados respondió que el servicio es muy malo, el 15%


respondió que el servicio es malo, el 25% respondió que el servicio es
regular, el 30% respondió que el servicio es bueno, y el resto respondió
que el servicio es muy bueno.

a) Defina:

Población:

Muestra:

Unidad elemental:

b) Identifique las siguientes variables:

Cualitativa nominal:

Cualitativa ordinal:

Cuantitativa continua:

c) Defina:

Estadísticos:

48 ESTADÍSTICA GENERAL
d) Proponga un parámetro para la variable tiempo de conexión a Internet.

Parámetro:

5. Cierto organismo técnico, orientado a la investigación científica, así como


al estudio y conocimiento del mar peruano y sus recursos, que asesora al
Estado en la toma de decisiones con respecto al uso racional de los recursos
pesqueros y la conservación del ambiente marino, llevó a cabo una encuesta
respecto a la pesquería artesanal en 60 puntos a lo largo del litoral peruano,
de setiembre de 2004 a mayo de 2005. A partir de una muestra de 2 500
pescadores artesanales, se determinó lo siguiente:
• En esta encuesta han prevalecido los pescadores sin carné con un 44% de
participación; además, el 38% de los pescadores tiene carné, el 8% declara
“carné en trámite”, el 3% tiene el carné caducado, y el resto no especifica.

• Uno de los pescadores manifestó que su embarcación es de madera,


respuesta que se da en la mayoría de los casos.

• El 80% de las embarcaciones tiene motor, y el resto se traslada a remo o vela.

• Las artes de pesca más empleadas fueron las redes cortina (33%), pinta
(20%), buceo con compresora (14%), cerco (14%), espinel (10%), y dentro
del rubro “otros” (9%) se ha considerado a chinchorreros, macheros,
camaroneros y pescadores de ribera.

• El arte redes cortina tiene un gasto promedio de operación de US$68.70,


una utilidad neta promedio de US$194.20 y un promedio de 10 trabajadores
por embarcación.

• Uno de los pescadores afirmó que su gasto de operación con el arte buceo
con compresora asciende a US$20.00 y trabajan cinco personas en cada
jornada.

• El arte pinta tiene un gasto promedio de operación de US$27.30 y una


utilidad neta promedio de US$95.60.

ESTADÍSTICA GENERAL 49
a) Complete los espacios según el enunciado y resultados del estudio:

Población:

Muestra:

Unidad elemental:

Dato cualitativo:

Dato cuantitativo discreto:

Dato cuantitativo continuo:

b) Complete los espacios en blanco para las diferentes variables a considerar


en el estudio y señale su tipo.

Variable Tipo de variable

50 ESTADÍSTICA GENERAL
Lección 2

Tablas de frecuencias para variables


cuantitativas discretas y continuas
2.1 Tablas de frecuencias para variables cuantitativas
discretas
Para la construcción de tablas de frecuencias para variables cuantitativas
discretas se consideran las siguientes columnas:

1. En la primera columna se muestran los diferentes valores que toma la


variable cuantitativa discreta (X1, X2,…,Xm).
2. En la segunda columna se muestran las frecuencias absolutas (fi) que
representan el número de veces que se repite cada uno de los valores en el
conjunto de datos.

3. En la tercera columna se muestran las frecuencias relativas que


representan la proporción de cada uno de los valores en el conjunto de
datos.
4. En la cuarta columna se muestran las frecuencias absolutas acumuladas (Fi)
que se obtienen de la siguiente manera:
Fi= f1 + f2 + ... + fi
a partir de la definición, Fm = n
5. En la quinta columna se muestran las frecuencias relativas acumuladas que
se obtienen de la siguiente manera:
Hi= h1 + h2 + ... + hi
a partir de la definición, Hm = 1

Observación
Estas tablas son recomendables cuando la variable no toma gran cantidad
de valores diferentes.

ESTADÍSTICA GENERAL 51
Tabla Nº 06. Distribución de frecuencias
para una variable cuantitativa discreta

Valores Frecuencias Frecuencias Frecuencias absolutas Frecuencias


observados absolutas relativas acumuladas relativas acumuladas
xi fi hi Fi Hi
x1 f1 h1 F1 H1
x2 f2 h2 F2 H2
. . . . .
. . . . .
xm fm hm n 1
Total n 1

2.2 Gráfico de líneas o bastones


Este gráfico se utiliza para representar datos cuantitativos discretos.
Pasos para su construcción:

Paso 1: Se traza un sistema de coordenadas, los valores que toma la variable se


representan en el eje X, y las frecuencias absolutas o relativas se representan en
el eje Y.
Paso 2: Sobre cada valor que toma la variable se levanta una línea cuya altura
corresponde a su respectiva frecuencia absoluta o relativa (se puede colocar el
valor de la frecuencia correspondiente en la parte superior de la línea).

Observaciones
• El grosor de las líneas es el mismo para todos.
• Los espacios entre las líneas deben ser iguales.

52 ESTADÍSTICA GENERAL
Figura Nº 06. Gráfico de líneas de las familias
según el número de hijos

Ejemplo 2.1
El jefe del área de compras y ventas del supermercado De Todo realizó un
estudio acerca del número de artículos que compran los clientes en el horario
de la tarde. A continuación se muestran los resultados obtenidos de 45 clientes
seleccionados aleatoriamente:

4 4 5 5 5 6 6 6 6
7 7 7 7 7 7 7 8 8
8 8 8 8 8 8 8 8 8
9 9 9 9 9 9 9 10 10
10 10 10 11 11 11 11 12 12

Construya la tabla de distribución de frecuencias.

a) ¿Qué porcentaje de clientes compró, por lo menos, nueve artículos en el


horario de la tarde?
b) ¿Cuántos clientes compraron de ocho a once artículos en el horario de
la tarde?
c) Realice un gráfico adecuado.

Solución
a) Sea la variable:
X = Número de artículos que compran los clientes en el horario de la tarde

ESTADÍSTICA GENERAL 53
Tabla Nº 07. Distribución de los clientes según el número
de artículos comprados

Números de artículos fi hi Fi Hi

4 2 0.0444 2 0.4444
5 3 0.0667 5 0.1111
6 4 0.0889 9 0.2000
7 7 0.1556 16 0.3556
8 11 0.2444 27 0.6000
9 7 0.1556 34 0.7556
10 5 0.1111 39 0.8667
11 4 0.0889 43 0.9556
12 2 0.0444 45 1.0000
Total 45 1

a) El porcentaje de clientes que compraron por lo menos nueve artículos


en el horario de la tarde fue 40% [(0.1556 + 0.1111 +0.0889 + 0.0444) x
100% = 40%].
b) El número de clientes que compraron de ocho a once artículos en el
horario de la tarde fue igual a 27 (f5 + f6 + f7 + f8 = 11 + 7 + 5 + 4 = 27).
c)

Figura Nº 07. Gráfico de líneas de los clientes según el número


de artículos comprados

54 ESTADÍSTICA GENERAL
Ejemplo 2.2
En una empresa consultora se realizó una auditoría a las 80 sucursales del Banco
ABC con la finalidad de revisar sus estados contables y financieros; para esto, los
consultores revisaron los libros contables y financieros de cada sucursal durante
varios días. A continuación se muestra un resumen sobre el número de días que
les tomó a los consultores hacer las auditorías en cada una de las 80 sucursales:

16 15 14 15 13 16 15 15 12 15
12 16 16 16 14 15 14 16 12 16
14 15 15 16 12 12 13 13 14 16
14 15 15 13 12 16 13 14 14 14
14 16 12 16 15 15 15 16 15 13
13 12 16 14 13 14 12 15 15 15
15 15 13 14 13 13 15 15 12 15
16 12 13 13 15 14 14 16 13 16

a) Construya la tabla de frecuencias.


b) ¿En cuántas sucursales los auditores demoraron a lo más 13 días?
c) ¿En cuántas sucursales los auditores demoraron entre 13 y 15 días?
d) Interprete (h4 + h5)%
e) Construya un gráfico adecuado.

Solución
a)

Tabla N° 08. Distribución de las sucursales según el número


de días de permanencia de los auditores

Número de días fi hi Fi Hi
12 11 0.1375 11 0.1375
13 14 0.1750 25 0.3125
14 15 0.1875 40 0.5000
15 23 0.2875 63 0.7875
16 17 0.2125 80 1
Total 80 1

ESTADÍSTICA GENERAL 55
b) El número de sucursales donde los auditores demoran a lo más 13 días
es 25.
F2 = f1 + f2 = 11 + 14 = 25
c) El número de sucursales donde los auditores demoran entre 13 y 15 días
es 52.
f2 + f3 + f4 = 14 + 15 + 23 = 52
d) El porcentaje de sucursales donde los auditores se demoran por lo
menos 15 días es 50% [(0.2875 + 0.2125) x 100% = 50%].
e)
Figura Nº 08. Gráfico de líneas de las sucursales según
el número de días de permanencia de los auditores

Ejemplo 2.3
Con el objetivo de conocer las características de las familias que habitan una
vivienda en una urbanización del distrito de La Molina, el personal de una empresa
encuestadora realizó un estudio en 34 viviendas seleccionadas aleatoriamente.
Una de las preguntas fue acerca del número de personas que conforman el
hogar del entrevistado, las respuestas fueron las siguientes:

5 1 6 3 1 4 3 6 3 6 5 1 2 1 4 2 5
2 1 5 3 1 1 4 4 4 4 6 4 6 1 3 3 5

a) Construya una tabla de frecuencias.


b) ¿Qué proporción de viviendas está habitada por tres o menos personas?

56 ESTADÍSTICA GENERAL
c) ¿Qué proporción de personas habita las viviendas con a lo más tres
personas?
d) ¿Qué porcentaje de viviendas está habitada por cinco o más personas?
e) ¿Qué porcentaje de personas habita las viviendas con cuatro o más
personas?
f) Construya un gráfico adecuado.

Solución
a)

Tabla Nº 09. Distribución de las viviendas según el número de


personas que la habitan

Número de personas fi hi Fi Hi
1 8 0.23529 8 0.23529
2 3 0.08824 11 0.32353
3 6 0.17647 17 0.50000
4 7 0.20588 24 0.70588
5 5 0.14706 29 0.85294
6 5 0.14706 34 1
Total 34 1

b) La proporción de viviendas que está habitada por a lo más tres personas


se calcula de la siguiente manera:
H3 = 0.23529+0.08824+0.17647 = 0.50
c) En las 34 viviendas se tienen 115 personas; entonces, la proporción de
personas que habitan las viviendas con a lo más tres personas (P) se
calcula de la siguiente manera:

Donde:

ESTADÍSTICA GENERAL 57
Número de personas (X) fi xi fi
1 8 8
2 3 6
3 6 18
4 7 28
5 5 25
6 5 30
Total 34 115

d) El porcentaje de viviendas que están habitadas por cinco o más personas


se calcula de la siguiente manera: (0.14706+0.14706) x 100 = 29.412%
e) En las 34 viviendas se tienen 115 personas; entonces, el porcentaje de
personas que habitan las viviendas con cuatro o más personas (Q) se
calcula de la siguiente manera:

Donde:
Número de personas (X) fi xi fi
1 8 8
2 3 6
3 6 18
4 7 28
5 5 25
6 5 30
Total 34 115

58 ESTADÍSTICA GENERAL
f)
Figura Nº 09. Viviendas según el número de
personas que la habitan

2.3 Tablas de frecuencias por intervalos


Se emplean para representar la distribución de un conjunto de datos cuando la
variable de estudio es cuantitativa continua o cuando la variable de estudio es
cuantitativa discreta con muchos datos y la mayoría son diferentes.

Para la construcción de tablas de frecuencias para variables cuantitativas


continuas se consideran las siguientes columnas:

• En la primera columna se muestran los datos agrupados en k intervalos


de clase ([y0, y1 >,[y1, y2 >, ... , [yk–1, yk >).

• En la segunda columna se muestran los puntos medios de los intervalos


(x1) que son conocidos como marcas de clases, y se calculan de la
siguiente manera:

• En la tercera columna se muestran las frecuencias absolutas (fi) que


representan el número de observaciones que caen dentro del intervalo
[yi-1, yi> en el conjunto de datos.

• En la cuarta columna se muestran las frecuencias relativas (hi= fi /n) que


representan la proporción de observaciones que caen dentro del intervalo
[yi-1, yi> en el conjunto de datos.

ESTADÍSTICA GENERAL 59
• En la quinta columna se muestran las frecuencias absolutas acumuladas (Fi)
cuyos valores se calculan como en el caso de las variables cuantitativas
discretas.

• En la sexta columna se muestran las frecuencias relativas acumuladas (Hi)


cuyos valores se calculan como en el caso de las variables cuantitativas
discretas.

A continuación se presenta una tabla de frecuencias por intervalos:

Tabla Nº 10. Distribución de frecuencias por intervalos

Frecuencias Frecuencias
Intervalos Marcas Frecuencias Frecuencias
absolutas relativas
de clases de clase absolutas relativas
acumuladas acumuladas
[yk-1, yk> xi fi hi
Fi Hi
[y0, y1> x1 f1 h1 F1 H1
[y1, y2> x2 f2 h2 F2 H2
. . . . . .
. . . . . .
[yk-1, yk> xk fk hk n 1
Total n 1

Pasos para la construcción de una tabla de frecuencias por intervalos:

Paso 1: Calcule el rango (R):


R=Xmax - Xmin
Donde:
Xmax = Representa el máximo valor en el conjunto de datos.
Xmin = Representa el mínimo valor en el conjunto de datos.
Paso 2: Calcule el número de clases o intervalos (k) utilizando la regla de Sturges:
k = 1 + 3.3 log n
Donde:
n = Tamaño de muestra
log n = Logaritmo en base 10 de n
Paso 3: Calcule la amplitud del intervalo de clase (c):

60 ESTADÍSTICA GENERAL
Si la amplitud del intervalo es un número entero, entonces se trabaja con el
número calculado; si no, se redondea por exceso de acuerdo con el número de
decimales del conjunto de datos.
Para el redondeo debe tener en cuenta lo siguiente:
Si los datos son números enteros, la amplitud del intervalo será un número entero;
si los datos tienen un decimal, la amplitud del intervalo tendrá un decimal, y así
sucesivamente.
Por ejemplo, suponga que el valor de c es 6.2603 y los datos tienen dos
decimales; entonces, c también tendrá dos decimales, y su valor redondeado
por exceso será igual a 6.27.

Paso 4: Calcule los límites de los intervalos:


[y0 = Xmin , y1 = y0 +c>
[y1 = y0 +c, y2 = y1 + c>
.
.
.
[yk-1 = yk-2 + c, yk = yk-1 + c>

Paso 5: Obtenga las columnas de las frecuencias correspondientes.

2.4 Gráficos para variables cuantitativas continuas


Los gráficos más utilizados son el histograma y el polígono de frecuencias.

2.4.1 Histograma
Estos gráficos se utilizan para representar variables cuantitativas continuas. En
este tipo de gráfico, a cada intervalo le corresponde una barra cuya altura es
igual o proporcional a su respectiva frecuencia absoluta, relativa o porcentual.
Pasos para su construcción:

Paso 1:
Se traza un sistema de coordenadas; luego, los intervalos se representan en el
eje X, y las frecuencias absolutas o relativas se representan en el eje Y.

Paso 2:
Sobre cada intervalo se levanta una barra cuya altura es igual o proporcional
a su respectiva frecuencia absoluta o relativa. No existen separaciones
entre las barras.

ESTADÍSTICA GENERAL 61
Figura Nº 10. Histograma del número de envíos
internacionales según el costo

18
16
16

14
12
Número de envíos internacionales

12 11

10

8 7
6
6
4
4 3 3

1.50 1.54 1.58 1.62 1.66 1.70 1.74 1.78 1.82

Costo (en miles de soles)

2.4.2 Polígono de frecuencias


El polígono de frecuencias se obtiene al unir los puntos medios de los lados
superiores de las barras de un histograma mediante segmentos de rectas.
Aunque la figura así formada no es un polígono, este se consigue al unir los
puntos medios de las dos barras extremas con los puntos medios de los
intervalos adyacentes, cuya frecuencia es cero.

Figura Nº 11. Polígono de frecuencias del número de envíos


internacionales según el costo

18
16
16

14
Número de envíos internacionales

12
12 11

10

8 7
6
6
4
4 3 3

0
1.48 1.52 1.56 1.60 1.64 1.68 1.72 1.76 1.80 1.84
Costo (en miles de soles)

62 ESTADÍSTICA GENERAL
2.5 Ejercicios resueltos
1. Un grupo de estudiantes de Economía de la Universidad San Ignacio de
Loyola obtuvo información sobre la inversión anual (en miles de soles) de
50 pymes. Los resultados obtenidos se muestran a continuación:

4.128 4.128 10.472 12.375 15.330 17.863 18.036 18.036 18.868 19.004
20.342 21.901 21.901 22.929 23.277 23.594 24.654 24.654 24.727 24.727
25.065 25.779 26.573 26.904 27.495 27.620 27.727 28.040 28.205 28.342
28.956 29.546 29.625 30.573 31.300 31.437 31.913 31.913 33.071 33.071
33.563 34.254 34.254 35.202 36.055 37.345 39.297 39.297 41.137 46.607

a) Construya una tabla de frecuencias.


b) Grafique un histograma y un polígono de frecuencias.
c) Calcule el porcentaje de empresas que tienen una inversión menor de
28 404 soles.
d) Calcule el porcentaje de empresas que tienen una inversión de por lo
menos 34 473 soles.
Solución
a) Sea: X = Inversión anual (en miles de soles)

Paso 1: Calcule el rango

R=46.607-4.128=42.479
Donde:
Xmax = 46.607 (Inversión máxima anual)
Xmin =4.128 (Inversión mínima anual)

Paso 2: Calcule el número de clases o intervalos


k = 1 + 3.3 log 50 = 6.61 ≈ 7 intervalos

Paso 3: Calcule la amplitud de los intervalos

ESTADÍSTICA GENERAL 63
El valor de la amplitud se redondea por exceso con tres decimales
porque los datos tienen tres decimales.

Paso 4: Calcule los límites de los intervalos


[y0 = 4.128, y1 = 4.128 +6.069 = 10.197>
[y1 = 10.197, y2 = 10.197 + 6.069 = 16.266>
.
.
.
[yk-1 = 40.542, yk = 40.542 + 6.069 = 46.611>

Paso 5: Construya las columnas correspondientes

Tabla Nº 11. Distribución de 50 pymes según inversión anual

Inversión anual xi fi hi Fi Hi
(en miles de soles)
[4.128, 10.197> 7.1625 2 0.04 2 0.04
[10.197, 16.266> 13.2315 3 0.06 5 0.10
[16.266, 22.335> 19.3005 8 0.16 13 0.26
[22.335, 28.404> 25.3695 17 0.34 30 0.60
[28.404, 34.473> 31.4385 13 0.26 43 0.86
[34.473, 40.542> 37.5075 5 0.10 48 0.96
[40.542, 46.611> 43.5765 2 0.04 50 1
Total 50 1

64 ESTADÍSTICA GENERAL
b)

Figura Nº 12. Histograma de 50 PYMES


según la inversión anual

18 17

16

14 13
Número de PYMES

12

10
8
8

6 5

4 3
2 2
2

0
4,128 10,197 16,266 22,335 28,404 34,473 40,542 46,611
Inversión

Figura Nº 13. Polígono de frecuencias de


50 PYMES según la inversión anual

18 17

16

14 13
Número de PYMES

12

10
8
8

6 5

4 3
2 2
2

0
1.0935 7.1625 13.2315 19.3005 25.3695 31.4385 37.5075 43.5765 49.6455
Inversión

c) El porcentaje de empresas que tienen una inversión menor de 28 404


soles es 60%

ESTADÍSTICA GENERAL 65
d) El porcentaje de empresas que tienen una inversión de por lo menos 34
473 soles es 14%

2. Se agrupó los datos en una tabla de frecuencias de seis intervalos, donde la


marca de clase del primero fue ocho y del último 18. Además, las frecuencias
absolutas simples de los intervalos uno, cuatro y cinco fueron 80, 150 y
60, respectivamente; mientras que las frecuencias absolutas acumuladas
de los intervalos dos, tres y seis fueron 150, 230 y 500, respectivamente.
Reconstruya la tabla de frecuencias indicando las frecuencias absolutas y
relativas.

Solución
X xi fi hi Fi Hi
[8-a, 8+a> 8 80
[8+a, 8+3a> 150
[8+3a, 8+5a> 230
[8+5a, 8+7a> 150
[8+7a, 8+9a> 60
[8+9a, 8+11a> 18 500
Total 500 1
El ancho de clase se obtiene de la diferencia de los límites de cualquiera de los
intervalos. Por ejemplo, a partir de la diferencia de los límites del tercer intervalo
se tiene:
c = 8+5a-(8+3a) = 2a
En este caso, el valor de a se calcula con la información del último intervalo:

Por lo tanto, el ancho de clase c es igual a dos.


La tabla completa se muestra a continuación:

X xi fi hi Fi Hi
[7;9> 8 80 0.16 80 0.16
[9;11> 10 70 0.14 150 0.3
[11;13> 12 80 0.16 230 0.46
[13;15> 14 150 0.3 380 0.76
[15;17> 16 60 0.12 440 0.88
[17;19] 18 60 0.12 500 1
Total 500 1

66 ESTADÍSTICA GENERAL
2.6 Trabajo colaborativo (para trabajar en clase)
1. El jefe de la unidad de control de calidad de la empresa San Bartolo Industrial,
que se dedica a la fabricación de botellas de plástico para bebidas gaseosas,
tomó una muestra aleatoria de 50 lotes para obtener información acerca del
número de botellas de plástico defectuosas por cada lote. Los resultados
obtenidos fueron los siguientes:

5 6 5 1 6 2 6 3 6 1
5 7 7 4 4 5 1 4 4 5
3 4 4 5 6 1 5 1 6 2
2 6 1 6 3 5 6 2 1 3
7 1 5 5 7 3 1 7 3 6

a) Construya una tabla de frecuencias adecuada.


b) ¿Cuántos lotes tienen menos de cuatro botellas de plástico defectuosas?
c) ¿Cuántos lotes tienen entre tres y seis botellas de plástico defectuosas?
d) ¿Qué porcentaje de lotes tienen a lo más dos botellas de plástico
defectuosas?
e) ¿Cuál es el porcentaje de lotes que contienen más de tres botellas de
plástico defectuosas?
f) Construya un gráfico adecuado para la variable.

2. Una compañía de seguros desea ofrecer un nuevo plan de afiliación


para captar más clientes. Para esto, obtuvo información sobre algunas
características de sus posibles nuevos clientes; entre otras, una de las
variables consideradas en la ficha de afiliación fue: Número de hijos.
A continuación se presenta la información obtenida sobre esta variable para
40 posibles clientes:

0 0 0 0 0 0 1 1 1 1
1 1 1 1 2 2 2 2 2 2
2 2 2 2 2 2 2 2 3 3
3 3 3 3 3 3 3 4 4 5

a) Construya una tabla de frecuencias adecuada.


b) Haga el gráfico correspondiente a la variable estudiada.
c) Interprete f3, h2, H3 y F4, de acuerdo con el contexto del enunciado.

ESTADÍSTICA GENERAL 67
3. La Comisión de Fiscalización del Congreso de la República se interesó en
investigar sobre el número de viajes que realizaron los parlamentarios fuera
del país. Los resultados obtenidos se muestran a continuación:

xi fi Fi hi Hi
0 2 0.04
1 6
2 0.16
3
4 6
5 30
6 5
7 2
8
Total

Si f3 = f6, se pide:
a) Complete los datos que faltan.
b) Represente los datos mediante una gráfica adecuada.
c) Interprete f2, F5, h4 y H5.

4. El gerente de una empresa quiere contratar personal para su nueva sucursal.


Por tal motivo, el jefe de capital humano, encargado de la selección, evaluó
a los postulantes con un examen de aptitud, que consistía en 20 preguntas,
para determinar quiénes se encuentran aptos para cubrir el puesto requerido.
El número de preguntas contestadas correctamente por los postulantes se
muestra a continuación:

Figura Nº 14. Gráfico de líneas de los postulantes

10
10
9

8
Número de postulantes

7
6
6

4 4
4

0
15 16 17 18 19 20
Número de preguntas contestadas

68 ESTADÍSTICA GENERAL
a) Construya la tabla de frecuencias.
b) ¿Qué porcentaje de postulantes contestó a lo más 17 preguntas?
c) ¿Qué porcentaje de postulantes contestó por lo menos 18 preguntas?
d) ¿Qué porcentaje de postulantes contestó entre 16 y 19 preguntas?

5. El gerente de una agencia del banco Financia Bank quiere tener información
acerca de los montos de los ahorros personales (en soles) de sus nuevos
clientes. Para esto, el gerente registró las 50 nuevas cuentas de ahorros
personales que fueron abiertas en el último mes.

Figura Nº 15. Histograma de 50 clientes según


los montos de ahorros personales

14 13

12
11 11
Número de cuentas de ahorros

10
10
9
8 8
8

0
330,82 911,45 1492,08 2072,71 2653,34 3233,97 3814,60 4395,23
Montos de Cuentas de ahorro

a) Construya la tabla de frecuencias correspondiente.


b) Interprete h4 + h5 y 1 – H3.
c) Determine el porcentaje de clientes que ahorran entre 1 492.08 y
3 233.97 soles.

2.7 Trabajo autónomo


1. Diga si las siguientes afirmaciones son verdaderas (V) o falsas (F). En caso
de que sean falsas, escriba la afirmación correcta:

a) La tabla de frecuencias por intervalos se construye únicamente para


variables cuantitativas continuas. ( )
b) El gráfico de lineas se utiliza para representar variables continuas. ( )
c) En una tabla de frecuencias se cumple que f1= h1. ( )

ESTADÍSTICA GENERAL 69
2. Para realizar el control de calidad en el proceso de fabricación de
cuadernos, el jefe de producción tomó una muestra aleatoria de 30 cajas
con 50 cuadernos cada una. En este proceso, el jefe contabilizó el número
de cuadernos defectuosos en cada caja y los registró en sus hojas de
verificación. Los datos obtenidos fueron los siguientes:

0 0 0 1 1 1 1 2 2 2
2 2 2 3 3 3 3 3 3 3
3 4 4 4 4 4 5 5 5 6

a) Indique la variable de estudio y su tipo.


b) Elabore una tabla de frecuencias para la variable de estudio.
c) Interprete 1- H4.
d) Elabore el gráfico correspondiente.

3. El dueño de una estación de servicio quiere comprobar si el tiempo de espera


de los autos para comprar combustible mejoró desde la adquisición de un
nuevo surtidor de combustible. En tal sentido, el dueño registró el tiempo de
espera (en minutos) de 150 vehículos que llegaron a la estación de servicio
durante el día. Los tiempos registrados se muestran a continuación:

Figura Nº 16. Polígono de frecuencias de los 150 autos según


el tiempo de espera en una estación de servicio

40
36

30
30
25
Número de autos

20
16
14
12

10 9
8

0
4,0 6,4 8,8 11,2 13,6 16,0 18,4 20,8 23,2 25,6
Tiempo de espera (en minutos)

70 ESTADÍSTICA GENERAL
a) Construya la tabla de frecuencias.
b) Interprete h3 + h4 y 1 – H2.
c) Determine el porcentaje de autos que tienen un tiempo de espera de
por lo menos 14.8 minutos.

4. Un funcionario del Ministerio de Economía y Finanzas recolectó información


sobre las inversiones (en miles de soles) de las 50 empresas más importantes
de Lima. Los resultados obtenidos se muestran a continuación:

135.24 209.86 214.66 216.72 221.66 223.19 263.1 266.36 272.5 289.34
299.39 301.51 302.17 307.1 319.04 320.6 327.36 330.57 331.56 350.41
352.22 363.12 372.78 376.88 385.82 389.18 399.23 410.46 410.57 422.89
430.84 434.73 437.11 443.02 447.33 447.33 448.75 487.61 493.36 495.17
505.02 507.02 544.3 548.48 563.11 567.06 581.74 584.69 587.96 590.27

a) Construya una tabla de frecuencias.


b) Grafique un histograma y un polígono de frecuencias.
c) ¿Qué porcentaje de las inversiones se encuentran entre 300 y 400 mil
soles?
d) ¿Cuál es la inversión mínima para que una empresa pertenezca al 22%
de las empresas con las mayores inversiones?
e) ¿Cuál es la inversión máxima para que una empresa pertenezca al 27%
de las empresas con las menores inversiones?

5. Los ingresos mensuales (en miles de soles) de un fabricante por el concepto


de venta de calzado se presentan en la siguiente tabla de frecuencias:

Ingresos xi hi% Hi%


[ , > 15
[ 6 , > 45
[ , > 70
[ , > 13.5
[ , > 10

a) Complete la tabla de distribución de frecuencias e interprete h3% y H5%.


b) Grafique el histograma y el polígono de frecuencias correspondiente.
c) Determine el porcentaje de los meses en que se obtuvo ingresos
inferiores a 10.8 miles de soles.

ESTADÍSTICA GENERAL 71
d) El fabricante estableció que un mes es considerado como excelente
si se encuentra dentro del 15% de los meses en que mejores ingresos
se obtuvo. ¿Cuál es el ingreso mínimo para que un mes reciba dicha
denominación?

2.8 Problemas de reforzamiento del capítulo


1. Las microempresas y las pequeñas empresas en el Perú tienen importantes
repercusiones económicas y sociales para el proceso del desarrollo nacional;
entre otras, son generadoras de empleo y constituyen más del 98% de
todas las empresas en el país. Con la finalidad de determinar el grado de
participación de los intermediarios financieros, tanto bancarios como no
bancarios, se hizo un estudio en el que parte de este se refirió a la evaluación
de microempresas y pequeñas empresas textiles y de confecciones de Lima
Metropolitana. Para tal propósito, se tomó una muestra de 52 empresas y se
obtuvo, entre otras, la siguiente información:

• El 85% de los encuestados considera que el factor que más influye


en el desarrollo de la empresa y que es más difícil de solucionar es el
financiamiento.

• El 90% de los encuestados asegura que no es fácil mejorar la tecnología.

• El 30% de los encuestados acostumbra a satisfacer sus necesidades de


capital mediante los bancos.

• El 70% de los encuestados no tiene conocimiento de que existen


organismos exclusivos que prestan apoyo a las microempresas y pequeñas
empresas.

• El 60% considera que no recibe apoyo oportuno de la entidad financiera


a la que acude normalmente.

• Dentro de los factores que afectan el otorgamiento del crédito, el 65% de


los encuestados afirma que exigen demasiadas garantías, el 15% dice que
las tasas de intereses son elevadas, el 10% señala que hay demora en el
otorgamiento de los créditos, y el 10% de los encuestados atribuye otros
factores.

De acuerdo con lo presentado:


a) Defina: Población, muestra y unidad elemental.
b) Identifique todas las variables cualitativas nominales.
c) Defina un estadístico y un parámetro para la variable “Entidad que
satisface sus necesidades de capital”.

72 ESTADÍSTICA GENERAL
2. El financiamiento vehicular se ha vuelto más accesible y ha venido creciendo
más rápidamente en los últimos años, pero cabe precisar que ninguna
entidad financiera aprobará un préstamo si el solicitante no tiene un seguro
vehicular. Como las empresas de estudios de mercado han estimado que
las ventas de autos nuevos crecerán en los próximos años, la compañía
de seguros Mi Auto-Seguro necesita conocer el grado de satisfacción
de sus clientes. Por tal razón, el área de comercialización, por medio de
sus representantes, realizó un estudio para tal fin a partir de una muestra
aleatoria de 50 clientes. Los resultados obtenidos son los siguientes:

A D AC D A D AC A AC AC
B AC B A AC B A AC B A
AC A D AC AC AC A B AC AC
D B AC A A AC AC AC A B
B AC A AC B AC B A AC A

Donde:
A: Alto, AC: Aceptable, B: Bajo y D: Deficiente.
a) Construya una tabla de frecuencias adecuada.
b) Realice el gráfico de barras para la variable estudiada.
c) ¿Qué porcentaje de clientes considera que su grado de satisfacción es
“bajo” o “deficiente”?

3. La inmobiliaria Depa Fácil lanzó a la venta 60 departamentos en el distrito


de Surco. La directiva de la inmobiliaria solicitó al jefe de ventas que
hiciera una presentación de los precios de venta (en miles de soles) de los
departamentos ofertados. Los precios son los siguientes:

101.86 112.99 114.35 114.74 143.76


162.35 185.69 185.70 186.58 186.6
228.47 234.44 237.47 237.50 241.21
254.66 262.20 273.19 276.09 277.03
299.33 309.97 317.55 318.01 327.42
345.31 349.06 353.62 353.99 372.16
143.76 143.92 153.66 158.59 160.59
187.79 187.88 192.00 197.51 201.59
248.28 248.79 249.18 249.78 250.93
284.10 284.15 285.03 285.7 297.70
332.79 335.61 335.64 341.36 344.21
374.41 377.55 382.60 391.74 395.04

ESTADÍSTICA GENERAL 73
a) Construya la tabla de frecuencias.
b) ¿Qué porcentaje de departamentos tiene un precio de a lo más 269.42
mil soles?
c) ¿Qué porcentaje de departamentos tiene un precio de por lo menos
185.64 mil soles?
d) Construya un polígono de frecuencias.

4. Si se tiene la siguiente tabla de frecuencias:

Intervalo xi fi hi Hi
[15 , > 18
[ , > 0.25
[ , > 0.79
[ 39, >
Total

Y se sabe que h3 - h1 = 0.36, complete la tabla.

2.9 Portafolio (para subir al campus virtual)


El gerente del área de ventas de una conocida empresa dedicada a la producción
y venta de embutidos obtuvo la siguiente información sobre sus 40 trabajadores:

74 ESTADÍSTICA GENERAL
Número de Ingreso mensual Gasto mensual Antigüedad ¿En los últimos 12 ¿Ud. y su familia
Tipo de Distrito de
Nº integrantes familiar familiar laboral meses viajó con la viajarán en las próximas
contrato residencia
en la familia (soles) (soles) (años) familia? vacaciones?

1 Indefinido Surco 3 3 600 2 256 2 Sí Definitivamente,sí


2 Indefinido San Isidro 4 3 893 2 456 5 Sí Definitivamente,sí
3 Temporal San Isidro 3 3 564 2 264 5 Sí Definitivamente, sí
4 Indefinido San Miguel 3 4 322 3 132 5 No Definitivamente, sí
5 Temporal Surco 3 3 656 2 334 7 Sí Probablemente, no
6 Indefinido San Isidro 2 4 433 3 165 10 Sí Definitivamente, sí
7 Temporal La Molina 4 3 443 2 157 3 Sí Probablemente, sí
8 Indefinido Surco 1 3 456 2 557 15 No Definitivamente, sí
9 Indefinido San Miguel 2 3 053 2 568 4 Sí Definitivamente, no
10 Indefinido San Isidro 2 3 166 2 854 5 Sí Indeciso
11 Indefinido La Molina 1 4 135 3 893 4 Sí Definitivamente, sí
12 Indefinido Surco 2 3 754 3 469 12 Sí Definitivamente, sí
13 Temporal San Isidro 2 3 085 3 245 9 Sí Indeciso
14 Temporal San Miguel 2 3 624 2 648 7 Sí Probablemente, no
15 Indefinido Surco 2 3 245 2 872 5 Sí Probablemente, no
16 Indefinido Surco 3 3 191 2 645 3 Sí Definitivamente, sí
17 Temporal San Isidro 4 4 656 3 164 12 No Probablemente, no
18 Indefinido Surco 2 3 334 3 165 2 No Definitivamente, sí
19 Indefinido Surco 3 3 642 3 893 8 Sí Probablemente, sí
20 Indefinido San Isidro 4 3 897 3 135 6 Sí Probablemente, sí
21 Temporal Surco 2 4 347 3 154 11 Sí Definitivamente, no
22 Indefinido Surco 4 4 465 2 321 7 Sí Probablemente, sí
23 Temporal Surco 1 4 143 3 164 2 No Probablemente, sí
24 Temporal San Miguel 2 4 954 3 165 7 Sí Probablemente, sí
25 Indefinido San Isidro 2 3 348 3 893 5 Sí Definitivamente no
26 Indefinido San Isidro 1 3 865 3 198 17 Sí Definitivamente, sí
27 Temporal Surco 1 3 962 2 572 2 Sí Definitivamente, sí
28 Indefinido San Miguel 5 3 347 2 568 9 Sí Definitivamente, sí
29 Indefinido La Molina 2 4 322 2 854 3 Sí Definitivamente, sí
30 Temporal Surco 3 3 656 3 893 7 No Indeciso
31 Indefinido San Isidro 2 3 454 3 469 5 No Definitivamente, sí
32 Indefinido La Molina 3 4 465 3 245 4 Sí Definitivamente, no
33 Indefinido San Isidro 3 4 963 2 648 11 Sí Indeciso
34 Temporal Surco 3 4 346 2 872 9 Sí Definitivamente, sí
35 Temporal San Miguel 2 3 436 2 645 7 Sí Definitivamente, sí
36 Indefinido San Isidro 4 3 465 3 164 5 Sí Indeciso
37 Temporal San Isidro 1 4 467 3 165 3 Sí Probablemente, no
38 Temporal Surco 2 3 621 3 893 2 Sí Probablemente, no
39 Indefinido Surco 2 4 573 4 012 2 Sí Definitivamente, sí
40 Indefinido San Isidro 2 3 463 2 956 8 No Probablemente, no

ESTADÍSTICA GENERAL 75
1. De la información anterior:
a) Indique la población, muestra y unidad de análisis en esta investigación.
b) Determine las variables y la naturaleza de cada una de ellas.
c) Defina los estadísticos y parámetros de cada variable de estudio.

Utilice el software estadístico Minitab para responder las siguientes preguntas:

2. Para las siguientes variables cualitativas:


Distrito de residencia:
a) Elabore la tabla de frecuencias.
b) Realice la gráfica correspondiente.
c) Interprete f3 y h2.
Expectativas de viaje en las próximas vacaciones:
a) Elabore la tabla de frecuencias.
b) Realice la gráfica correspondiente.
c) Determine e interprete el porcentaje de trabajadores que viajarían con
su familia en las próximas vacaciones.

3. Para las siguientes variables cuantitativas:


Número de integrantes en la familia:
a) Elabore la tabla de frecuencias.
b) Realice el gráfico correspondiente.
c) Interprete f2 y h4.
Ingreso mensual familiar:
a) Elabore la tabla de frecuencias.
b) Realice el gráfico correspondiente.
c) ¿Cuántos trabajadores tienen un ingreso mensual familiar desde 3 472
soles a menos de 4 422 soles?
Antigüedad laboral:
a) Realice un diagrama de tallo y hojas.
b) ¿Qué porcentaje de trabajadores se encuentra laborando de tres años a
nueve años en la empresa?
c) ¿Qué porcentaje de trabajadores se encuentra laborando por lo menos
una década en la empresa?

76 ESTADÍSTICA GENERAL
2.10 Organización de datos con MINITAB
El Minitab es un programa estadístico que ha sido creado para realizar cálculos
y gráficos estadísticos, los cuales son utilizados para un posterior análisis en el
proceso de toma de decisiones.

A continuación se muestra la ventana de inicio del Minitab:

En la parte superior de esta ventana se tiene la barra de menú y la barra de


herramientas; en la parte central, la ventana de sesión; y en la parte inferior, la
hoja de trabajo.

Barra de menú
En esta barra se encuentran los menús: Archivo, Editar, Datos, Calc, Estadísticas,
Gráfica, Editor, Herramientas, Ventana, Ayuda y Asistente.
A continuación se describen, de manera muy rápida, algunos de los menús que
se utilizarán:

En el menú archivo, usted puede crear, abrir o guardar un proyecto; abrir una
hoja de trabajo, entre otros.
En el menú Calc, usted puede realizar cálculos básicos, generar datos aleatorios,
calcular probabilidades, entre otros.
En el menú Estadísticas, usted puede obtener algunas medidas de resumen,
estimar intervalos de confianza, obtener modelos de regresión y modelos de

ESTADÍSTICA GENERAL 77
series de tiempo, entre otros. Además, nos proporciona la información necesaria
para realizar pruebas de hipótesis, de una manera sencilla y rápida.
En el menú Gráfica, usted puede obtener gráficos de barras, histogramas,
diagrama de tallo y hoja, gráfico de caja, entre otros.

Barra de herramientas
En esta barra se encuentran algunos iconos que representan a las operaciones
más usuales, tales como abrir, guardar, imprimir, entre otras.

Ventana de sesión
Esta ventana tiene la apariencia de un documento en Word. Es la parte donde se
muestran los resultados de los análisis realizados. Cabe indicar que las gráficas
se muestran en otras ventanas.

Hoja de trabajo (Worksheet)


Esta ventana tiene la apariencia de una hoja de cálculo. Es la parte donde se
ingresan los datos que serán analizados.

Ejemplo:
La siguiente base de datos se utilizará para trabajar los primeros tres capítulos:

78 ESTADÍSTICA GENERAL
Número de Ingreso mensual Gasto mensual Antiguedad
Distrito de
Nº Área integrantes familiar familiar laboral
residencia
en la familia (soles) (soles) (años)
1 A La Molina 2 3 600 2 256 2
2 B Los Olivos 3 3 893 2 456 5
3 A La Molina 4 3 564 2 264 5
4 A Los Olivos 2 4 322 3 132 5
5 B Santa Anita 3 3 656 2 334 7
6 B La Molina 4 4 433 3 165 0
7 B Los Olivos 5 3 443 2 157 3
8 A Villa El Salvador 2 4 656 3 456 15
9 A La Molina 3 3 334 3 053 4
10 B La Molina 2 3 642 3 166 5
11 B Los Olivos 3 3 897 2 568 4
12 B Villa El Salvador 4 4 347 4 135 12
13 A Santa Anita 3 4 465 2 854 9
14 A La Molina 3 4 143 3 893 7
15 A La Molina 3 4 954 3 469 5
16 B Villa El Salvador 2 3 348 3 245 3
17 A Los Olivos 4 3 865 2 648 12
18 B La Molina 1 3 962 2 872 2
19 A Villa El Salvador 2 3 347 2 645 8
20 A Santa Anita 2 3 454 3 164 6
21 A La Molina 2 4 465 4 165 11
22 B Villa El Salvador 1 4 963 3 893 7
23 A Villa El Salvador 1 4 346 3 135 2
24 B La Molina 2 3 436 3 154 7
25 A La Molina 2 3 465 2 321 5
26 B La Molina 3 4 467 3 754 17
27 A Villa El Salvador 5 3 621 3 085 2
28 B La Molina 3 4 573 3 624 9
29 A Santa Anita 4 3 463 3 245 3
30 A Villa El Salvador 3 4 456 3 191 7

ESTADÍSTICA GENERAL 79
CONSTRUCCIÓN DE TABLAS DE FRECUENCIAS SIMPLES
1. Construya una tabla de frecuencias para la variable distrito de residencia,
utilizando el programa Minitab.

De la barra de menú, seleccione Estadística/Cuenta de variables individuales:

En la siguiente ventana, seleccione la variable de interés y elija las opciones


Conteos y Porcentajes:

80 ESTADÍSTICA GENERAL
Los resultados se muestran en la ventana de sesión, así:

2. Realice la tabla de frecuencias para la variable número de integrantes en la


familia, utilizando el programa Minitab.

De la barra de menú, seleccione Estadística/Cuenta de variables individuales:

ESTADÍSTICA GENERAL 81
En la siguiente ventana, seleccione la variable de interés y elija las opciones
Conteos, Porcentajes, Conteos acumulados y Porcentajes

Los resultados se muestran en la ventana de sesión, así:

CONSTRUCCIÓN DE GRÁFICAS
3. Realice el gráfico de barras para la variable: Distrito de residencia, utilizando
el programa Minitab.
De la barra de menú, seleccione Gráfica/Gráfica de barras:

82 ESTADÍSTICA GENERAL
Luego, seleccione Simple:

ESTADÍSTICA GENERAL 83
Ahora, seleccione la variable de interés:

En la pestaña Mostrar datos elija barras, y en la pestaña Etiquetas coloque el


título y la etiqueta de datos como se muestra a continuación.

En Mostrar datos, elija Barras:

84 ESTADÍSTICA GENERAL
En Etiquetas/Títulos, coloque el título:

En Etiquetas/Etiquetas de datos, seleccione Usar etiquetas de valor y:

ESTADÍSTICA GENERAL 85
Luego de dar click en “Aceptar” las veces que sea necesario, el gráfico que se
obtiene es el siguiente:

4. Realice el gráfico circular para la variable distrito de residencia utilizando el


programa Minitab.

86 ESTADÍSTICA GENERAL
Ahora, seleccione la variable la variable de interés:

En la pestaña Etiquetas, coloque el título y la etiqueta de datos como se mues-


tra a continuación:

En Etiquetas/Títulos, coloque el título:

ESTADÍSTICA GENERAL 87
En Etiquetas/Etiquetas de división, seleccione todas las opciones que se mues-
tran a continuación:

Luego de dar click en “Aceptar” las veces que sea necesario, el gráfico que se
obtiene es el siguiente:

88 ESTADÍSTICA GENERAL
5. Realice el diagrama de líneas para la variable antigüedad laboral (años),
utilizando el Minitab.

De la barra de menú, seleccione Gráfica/Gráfica de barras:

Luego, seleccione Simple:

ESTADÍSTICA GENERAL 89
Ahora, seleccione la variable de interés:

En la pestaña Mostrar datos elija líneas de proyección, y en la pestaña Etiquetas


coloque el título y la etiqueta de datos como se muestra a continuación.

En Mostrar datos, elija líneas de proyección:


En Etiquetas/Etiquetas de datos, seleccione Usar etiquetas de valor y:

En Etiquetas/Etiquetas de datos, seleccione Usar etiquetas de valor y:

ESTADÍSTICA GENERAL 91
Luego de dar click en “Aceptar” las veces que sea necesario, el gráfico que se
obtiene es el siguiente:

6. Realice el histograma para la variable ingreso mensual familiar, utilizando el


Minitab.

De la barra de menú, seleccione Gráfica/Histograma:

92 ESTADÍSTICA GENERAL
Luego, seleccione Simple:

Ahora, seleccione la variable de interés:

ESTADÍSTICA GENERAL 93
En Etiquetas/Títulos, coloque el título:

Luego de dar click en “Aceptar” las veces que sea necesario, se muestra el
siguiente histograma:

94 ESTADÍSTICA GENERAL
Muchas veces, el histograma que aparece no es el que uno espera, por lo que se
tiene que editar. Para esto, haga doble click en cualquiera de las barras; luego elija
Seccionamiento e ingrese la información, tal como se muestra a continuación:

Luego de dar click en “Aceptar” las veces que sea necesario, se muestra el
histograma buscado:

Para mostrar las etiquetas, haga click derecho en cualquiera de las barras y
seleccione Agregar/Etiquetas de datos:

ESTADÍSTICA GENERAL 95
Luego, seleccione Usar etiquetas de valor y, tal como se muestra a continuación:

Después de modificar la etiqueta en el eje Y, se tiene el siguiente histograma:

96 ESTADÍSTICA GENERAL
7. Realice el polígono de frecuencias de la variable ingreso mensual familiar
utilizando el Minitab.

Luego de calcular las marcas de clase y las correspondientes frecuencias, las


colocamos en una hoja de trabajo. Incluya intervalos con frecuencia cero en los
extremos, tal como se muestra a continuación:

De la barra de menú, seleccione Gráfica/Gráfica de dispersión:

ESTADÍSTICA GENERAL 97
Luego, seleccione Con línea de conexión:

Ingrese las variables X e Y del siguiente modo:

98 ESTADÍSTICA GENERAL
En Escala, en Número de marcas coloque ocho y en Posición de marcas ingrese
las marcas de clase, tal como se muestra a continuación:

Luego de dar click en “Aceptar” las veces que sea necesario, se obtiene el
polígono de frecuencias:

Para etiquetar, dé click derecho en algún punto dentro de la gráfica y seleccione


agregar; luego seleccione etiqueta de datos y agregue la etiqueta.

ESTADÍSTICA GENERAL 99
8. Realice el diagrama de tallo y hoja para la variable ingreso mensual familiar
utilizando el Minitab.

De la barra de menú, seleccione Gráfica/Tallo y hoja:

Ahora, seleccione la variable de interés:

100 ESTADÍSTICA GENERAL


Luego de dar click en “Aceptar”, se obtiene el diagrama de tallo y hoja:

ESTADÍSTICA GENERAL 101


ESTADÍSTICA GENERAL

TAREA ACADÉMICA N° 1
Apellidos y nombres: ..........................................................................................................................
Bloque: .......................................................................................................................................................
Ciclo: ............................................................................................................................................................

Fecha: .........................................................................................................................................................

El jefe del área de Recursos Humanos de la empresa comercializadora ALFA


S.A. seleccionó una muestra aleatoria de 50 empleados y registró la información
que se presenta en la base de datos DATA ALFA.

Problema 1
(2 puntos) Indique el tipo de variable.

Variable Tipo de variable

Problema 2
Construya el histograma para la variable Ingreso mensual con siete intervalos de
clase y responda las siguientes preguntas:

a) (3 puntos) A partir del histograma, construya la tabla de frecuencias.


b) (1 punto c/u) Interprete:

f3:______________________________________________________________
________________________________________________________________

h5%:_____________________________________________________________
________________________________________________________________

n - F2:___________________________________________________________
________________________________________________________________

100 – H4%: _______________________________________________________


________________________________________________________________

Problema 3
(1 punto c/u) Elabore la tabla de distribución de frecuencias para la variable área
donde labora y responda si las siguientes afirmaciones son verdaderas o falsas.
Si la afirmación es falsa, coloque el verdadero valor en el recuadro.

El número de empleados que laboran en el área de Contabilidad o Recursos


Humanos es de 16.
El porcentaje de empleados que laboran en el área de Finanzas es del 10%.
El porcentaje de empleados que laboran en el área de Compras o Mercadotecnia es del
44%.
El porcentaje de empleados que laboran en Finanzas o Mercadotecnia es menor que el
porcentaje de empleados que laboran en el área de Contabilidad o Recursos Humanos.

Problema 4
(1 punto c/u) Construya el gráfico de líneas para la variable años en la empresa
y responda las siguientes preguntas:

a) ¿En qué año o años se encuentra la mayor cantidad de empleados?


......................................................................................................................................................

b) ¿Qué porcentaje de empleados tiene 10 años de experiencia en la


empresa?
......................................................................................................................................................
c) ¿Qué porcentaje de empleados tiene entre 5 y 15 años de experiencia en
la empresa?
......................................................................................................................................................

d) ¿Qué porcentaje de empleados tiene más de 10 años de experiencia en


la empresa?
......................................................................................................................................................

Problema 5
(1 punto c/u) Construya el gráfico de barras para la variable satisfacción laboral
y responda las siguientes preguntas:

a) ¿En qué nivel de satisfacción laboral se encuentra la mayor cantidad de


empleados?
......................................................................................................................................................

b) ¿Cuántos empleados presentan una mala o pésima satisfacción laboral


en la empresa?
......................................................................................................................................................

c) Sin considerar la satisfacción regular, ¿qué porcentaje de empleados


presenta una satisfacción laboral positiva?
......................................................................................................................................................

2.11 Bibliografía
1. Anderson, Sweeney y Williams (2012). Estadística para Administración y
Economía. Undécima edición. Cengage Learning.

2. Wackerly, Mendenhall y Scheaffer (2009). Estadística matemática con


aplicaciones. Sétima edición. Cengage Learning.
Capítulo 2
MEDIDAS DE TENDENCIA
CENTRAL Y NO CENTRAL
f(x)

Moda
0.24
0.22
Mediana
0.20
0.18
0.16 Media
Aritmética
0.14
0.12
0.10
0.08
0.06
0.04
0.02 25% 25% 25% 25%
0.00
Q1 Q2 Q3 X

Capacidades por desarrollar


Al finalizar el capítulo, se espera que el estudiante logre las siguientes capacidades:

• Definir las medidas de tendencia central y no central.


• Calcular las medidas de tendencia central y no central en problemas
contextualizados.
• Interpretar las medidas de tendencia central y no central en problemas
contextualizados.

ESTADÍSTICA GENERAL 107


Motivación
El jefe de ventas de una empresa inmobiliaria, en la ciudad de Trujillo, fue auditado
por la gerencia de la misma con el fin de verificar cuáles fueron los precios
de venta (en miles de soles) de los departamentos. Los resultados fueron los
siguientes:

101.86 112.99 114.35 114.74 143.76 143.76 143.92 153.66 158.59 160.59
162.35 185.69 185.70 186.58 186.60 187.79 187.88 192.00 197.51 201.59
228.47 234.44 237.47 237.50 241.21 248.28 248.79 249.18 249.78 250.93
254.66 262.20 273.19 276.09 277.03 284.10 284.15 285.03 285.70 297.70
299.33 309.97 317.55 318.01 327.42 332.79 335.61 335.64 341.36 344.21
345.31 349.06 353.62 353.99 372.16 374.41 377.55 382.60 391.74 395.04

Si se tiene que hacer un reajuste al 22% de los departamentos con los precios
de venta más bajos, ¿cuál será el precio de venta máximo de un departamento
para que se le haga el reajuste?

Al finalizar el capítulo, el estudiante estará en capacidad de responder esta


pregunta y otras más realizando los cálculos pertinentes.

Saberes previos
• Conceptos básicos de la Estadística.

• Organización de datos.

• Operaciones algebraicas.

108 ESTADÍSTICA GENERAL


Lección 3

Medidas de tendencia central


En esta lección se estudiarán las medidas de tendencia central como parte de
las medidas de resumen.

Las medidas de resumen son útiles para describir un conjunto de datos. A


continuación se presentan las medidas de resumen que serán motivo de estudio:

• Medidas de posición
• Medidas de dispersión
• Medidas de forma
• Medidas de concentración

Estas medidas son presentadas en el siguiente diagrama:

Las medidas de posición son aquellas medidas de resumen cuyos valores


permiten hacer una descripción particular del conjunto de datos. Estas se
dividen en:

• Medidas de tendencia central


• Medidas de tendencia no central

Las medidas de tendencia central son aquellas que tienden a ocupar posiciones
centrales en el conjunto de datos. Entre estas tenemos:

• Media o promedio aritmético


• Mediana
• Moda

3.1 Media aritmética


También llamada promedio aritmético, es la medida central más utilizada, cono-
cida y fácil de calcular e interpretar.
La media aritmética se puede calcular para datos cuantitativos no agrupados y
agrupados.
Esta medida es utilizada para resumir variables cuantitativas.

3.1.1 Cálculo de la media aritmética para datos no agrupados


La media aritmética para datos no agrupados se calcula dividiendo la suma de
todos los valores que toma la variable entre el número total de valores.

ESTADÍSTICA GENERAL 109


Media poblacional
Si X es la variable de estudio, su primer valor se representa como x1, el segundo
como x2, y así sucesivamente hasta el último valor xN, donde N representa el
número total de valores.

La media aritmética poblacional se representa por y se calcula de la siguiente


manera:

Donde:

= Suma de los N valores que toma la variable X en la población

N = Tamaño de la población

Ejemplo 3.1
El administrador de una empresa productora y comercializadora de espárragos
desea conocer el número promedio mensual de latas de espárragos que fueron
exportadas a España (en cientos de unidades) en el año 2014. A continuación,
se muestra las cantidades obtenidas:

Enero Febrero Marzo Abril Mayo Junio


5 790 5 680 5 720 5 740 5 750 5 656
Julio Agosto Setiembre Octubre Noviembre Diciembre
5 780 5 690 5 700 5 770 5 730 5 800

Solución
Sea la variable:
X = Número de latas de espárragos exportadas a España
N = 12 meses
Se tiene:

x1 x2 x3 x4 x5 x6
5 790 5 680 5 720 5 740 5 750 5 656
x7 x8 x9 x10 x11 x12
5 780 5 690 5 700 5 770 5 730 5 800

El promedio se calcula de la siguiente manera:

110 ESTADÍSTICA GENERAL


El número promedio mensual de latas de espárragos exportadas a España en
el año 2014 por la empresa en mención es igual a 5 733.83 cientos de unidades.

Media muestral
Si se trabaja con una muestra de n valores, entonces la media aritmética muestral
se representa por ̅x y se calcula de la siguiente manera:

Donde:
= Suma de los n valores que toma la variable X en la muestra
n = Tamaño de la muestra

3.1.2 Ventajas y desventajas de la media aritmética


Las principales ventajas y desventajas de la media aritmética se resumen en el
siguiente cuadro:

Ventajas Desventajas
• Es conocida y fácil de calcular e • En caso de existir valores extremos o
interpretar. atípicos, la media se ve afectada por estos.
• Para su cálculo se utilizan todas las • No es recomendable para variables con
observaciones del conjunto de datos. distribuciones asimétricas.

Ejemplo 3.2
Una pequeña empresa está compuesta por un supervisor y cinco técnicos. Los
ingresos (en soles) de los técnicos son 790.54, 680.93, 720.34, 740.69 y 750.28
soles, con un ingreso promedio de 735.556 soles. Si se incluye el ingreso del
supervisor, el cual es de 3 864.21 soles, entonces el ingreso promedio de los seis
trabajadores es de 1 257.00 soles.

Como se observa, la media aritmética aumentó en gran medida (70.89%) cuando


se incluyó el ingreso del supervisor (ingreso atípico alto en comparación con
los otros ingresos), por lo que, en este caso, el ingreso promedio deja de ser

ESTADÍSTICA GENERAL 111


representativo para los ingresos de los trabajadores. Este es un ejemplo de una
de las desventajas que presenta la media aritmética.

3.1.3 Propiedades de la media aritmética


a) Si a cada uno de los valores (datos) se le suma o se le resta una constante
(b), los valores del nuevo conjunto de datos tienen la siguiente forma:

La media aritmética del nuevo conjunto de datos es igual a:

b) Si a cada uno de los valores (datos) se le multiplica por una constante


(c), los valores del nuevo conjunto de datos tienen la siguiente forma:

La media aritmética del nuevo conjunto de datos es igual a:

c) Si a cada uno de los valores (datos) se le multiplica por una constante


(c) y se le suma o se le resta una constante (b), los valores del nuevo
conjunto de datos tienen la siguiente forma:

La media aritmética del nuevo conjunto de datos es igual a:

Un resumen de las propiedades se presenta en el siguiente cuadro:

Nuevo Dato Nueva media

Ejemplo 3.3
Una empresa produce piezas metálicas que son utilizadas para la construcción
de edificios. En el año 2013, la producción promedio fue de 55 250 piezas
semanalmente. En el año 2014, por motivos de reparación de algunas de sus
máquinas, la cantidad de piezas metálicas producidas semanalmente disminuyó
en 5 000 unidades. Calcule el número promedio de piezas metálicas producidas
semanalmente en el año 2014.

112 ESTADÍSTICA GENERAL


Solución
Sean las variables:
X = Número de piezas metálicas producidas semanalmente en el año 2013
Y = Número de piezas metálicas producidas semanalmente en el año 2014
La producción semanal en el año 2014 tiene la siguiente forma:

El promedio se obtiene de la siguiente manera:

El número promedio de piezas metálicas producidas semanalmente en el año


2014 fue de 50 250.

Ejemplo 3.4
Considere el ejemplo anterior. Si en el año 2015, la producción semanal se
incrementó en un 9.3% con respecto al año 2014, calcule el número promedio
de piezas metálicas que serán producidas semanalmente en el año 2015.

Solución
Sea la variable:
W = Número de piezas metálicas que serán producidas semanalmente en el año
2015

La producción semanal tiene la siguiente forma:

El promedio se obtiene de la siguiente manera:

El número promedio de piezas metálicas que serán producidas semanalmente


en el año 2015 será de 54 923.25.

ESTADÍSTICA GENERAL 113


3.2 Mediana (Me)
La mediana es el valor que se encuentra en el centro del conjunto de datos,
cuyos valores están ordenados en forma ascendente (descendente). El 50% de
los datos se encuentra a la izquierda de la mediana, y el otro 50% se encuentra
a la derecha.

Esta medida es utilizada para resumir variables cuantitativas y, también, para


variables cualitativas ordinales.

3.2.1 Cálculo de la mediana para datos no agrupados


El cálculo de la mediana para datos no agrupados depende del número de
datos.

a) Cuando el número de datos (n) es impar


Cuando el número de datos es impar, la mediana se calcula de la siguiente
manera:

Ejemplo 3.5
El administrador de una empresa productora y comercializadora de azúcar desea
conocer el número mínimo de sacos exportados mensualmente para pertenecer
al 50% de los meses con mayor cantidad de sacos exportados a EE.UU. (en
cientos de unidades) entre enero y noviembre del año 2014. A continuación se
muestra la cantidad de sacos exportados a EE.UU. en el referido periodo:

Enero Febrero Marzo Abril Mayo Junio


3 780 3 690 3 700 3 770 3 730 3 800
Julio Agosto Setiembre Octubre Noviembre
3 790 3 680 3 720 3 740 3 750

Solución
Sea la variable:
X = Cantidad de sacos exportados mensualmente

114 ESTADÍSTICA GENERAL


Luego de ordenar los datos se tiene:

x1 x2 x3 x4 x5 x6
3 680 3 690 3 700 3 720 3 730 3 740
x7 x8 x9 x10 x11
3 750 3 770 3 780 3 790 3 800

Como n = 11 (impar), la mediana se calcula de la siguiente manera:

Esto quiere decir que la mediana ocupa la sexta posición en el conjunto de


datos. Luego:

b) Cuando el número de datos (n) es par


Cuando el número de datos es par, la mediana es la semisuma de los dos valores
centrales, es decir:

Donde:
• = Primer valor central cuya posición se obtiene al dividir el número de
observaciones entre dos

• = Segundo valor central (adyacente superior del primero)

Ejemplo 3.6
Un funcionario del Ministerio de Agricultura desea conocer la producción mínima
de arroz anual para pertenecer al 50% de los años con mayor producción de arroz
en el país (en toneladas métricas) entre los años 2000 y 2009. A continuación
se muestra la producción de arroz anual en el referido periodo:

2000 2001 2002 2003 2004


724.10 759.93 877.59 958.81 747.57
2005 2006 2007 2008 2009
694.60 805.13 915.64 1 007.17 1 079.85

ESTADÍSTICA GENERAL 115


Solución
Sea la variable:
X = Producción de arroz anual
Luego de ordenar los datos se tiene:

xi x2 x3 x4 x5
694.60 724.10 747.57 759.93 805.13
x6 x7 x8 x9 x10
877.59 915.64 958.81 1 007.17 1 079.85

Como n = 10 años (par), la mediana se calcula de la siguiente manera:

Esto quiere decir que la mediana se obtiene calculando la semisuma de los


valores de la quinta y sexta posición en el conjunto de datos. Es decir:

3.2.2 Ventajas y desventajas de la mediana


Las ventajas y desventajas de la mediana se presentan a continuación:

Ventajas Desventajas
• Es fácil de calcular e interpretar. • Para su cálculo no se utilizan todos los
• La mediana no se ve afectada por valores valores de las observaciones del conjunto de
extremos o atípicos. datos.

Observación
Por lo general, la mediana se utiliza cuando los valores que toma la variable
están muy dispersos.

116 ESTADÍSTICA GENERAL


3.3 Moda (Mo)
La moda es el valor que más se repite en el conjunto de datos.
Esta medida es utilizada para resumir variables cuantitativas y cualitativas.

3.3.1 Cálculo de la moda para datos no agrupados


Si los datos no están agrupados, el cálculo de la moda es inmediato, tal cual se
ha definido.

Ejemplo 3.7
A continuación, se muestran los reportes sobre el número de pedidos de un
producto realizados por internet en 52 días seleccionados aleatoriamente:

67 67 68 70 70 72 75 78 79 79 81 81 82
82 83 84 84 84 85 86 87 88 89 91 91 92
93 94 94 94 95 95 95 95 96 96 96 96 97
97 98 98 99 99 99 10 101 106 107 109 111 112

En tal situación, la moda toma dos valores, 95 y 96, porque ambos son los
que más se repiten y con la misma frecuencia. En este caso, se dice que la
distribución es bimodal.

Observación
Si el conjunto de datos presenta un solo valor con la mayor frecuencia,
entonces se dice que la distribución es unimodal, y si presenta más de
dos valores con iguales frecuencias y mayores a la vez, se afirma que la
distribución es multimodal.

3.4 Relación entre la media aritmética, mediana y moda


Si el conjunto de datos es unimodal, entonces se cumple:
• Si la distribución se extiende más hacia la izquierda, se cumple que:

En este caso, la distribución presenta asimetría negativa.

ESTADÍSTICA GENERAL 117


Gráficamente:

Histograma
60
60

50
Frecuencia absoluta

40
35

30

20
20

10
10
5

0
0 20 40 60 80 100

• Si la distribución es simétrica, se cumple que:

Gráficamente:

Histograma
50
50

40
Frecuencia absoluta

30 30
30

20

10 10
10

0
0 20 40 60 80 100
X
• Si la distribución se extiende más hacia la derecha, se cumple que:

118 ESTADÍSTICA GENERAL


En este caso, la distribución presenta asimetría positiva.
Gráficamente:

Histograma
60
60

50
Frecuencia absoluta

40
35

30

20
20

10
10
5

0
0 20 40 60 80 100
X

3.5 Media ponderada


La media ponderada constituye un caso especial de la media aritmética y se
calcula cuando la variable toma valores que se repiten varias veces. Para un
conjunto de datos: x1, x2, ..., xn, con pesos o ponderaciones: w1, w2,...,wn, la media
ponderada se define de la siguiente manera:

Donde:
• xi = Es el i-ésimo valor que toma la variable

• wi = Es la ponderación del i-ésimo valor que toma la variable

Ejemplo 3.8
El gerente de una empresa está evaluando el desempeño de sus empleados
para recompensarlos con un bono adicional al finalizar el año de trabajo.
Los criterios a considerarse en la evaluación son cuatro: puntualidad,
responsabilidad, participación y capacitación. A cada criterio le corresponde
una calificación (hasta de 20 puntos) y su respectivo peso porcentual con
respecto al total. Para recibir el bono, la calificación promedio correspondiente

ESTADÍSTICA GENERAL 119


a los criterios de calificación debe ser mayor a 17. A continuación se muestran
las calificaciones con sus respectivos porcentajes de los criterios evaluados para
el empleado A:

Criterios Calificación Porcentaje


Puntualidad 16.5 15%
Responsabilidad 17.0 20%
Participación 17.5 25%
Capacitación 17.0 40%

Con la información obtenida, ¿el empleado A recibirá el bono adicional otorgado


por el gerente de la empresa?

Solución:
En este problema, los porcentajes representan las ponderaciones (wi) de las
calificaciones (xi) obtenidas en los criterios evaluados, por lo que la calificación
promedio se calcula de la siguiente manera:

Por lo tanto, el empleado A recibirá el bono adicional ya que su calificación


promedio es mayor a 17.

3.6 Media total


La media total es útil cuando se conocen las medias y los tamaños de varias
muestras, y es de interés calcular la media de todas las muestras juntas. La
fórmula es la siguiente:

Donde:
• ni = Tamaño de la muestra i
• xi = Media aritmética de la muestra i
• k = Número de muestras

120 ESTADÍSTICA GENERAL


Observación
La media total es un caso particular de la media ponderada.

Ejemplo 3.9
El gerente de una empresa hotelera tiene a su cargo dos hoteles. Por registros
de cada hotel, el gerente sabe que, en el último mes, el gasto promedio mensual
de los 55 turistas hospedados en el hotel ubicado en el distrito de La Molina fue
de 1 652.67 soles; mientras que el gasto promedio mensual de los 45 turistas
hospedados en el hotel ubicado en el distrito de Surco fue de 1 611.22 soles.
Calcule el gasto promedio mensual de los 100 turistas en la empresa hotelera.

Solución
Sean las variables:

X1 = Gasto mensual de los turistas del hotel ubicado en el distrito de La Molina


X2 = Gasto mensual de los turistas del hotel ubicado en el distrito de Surco

Se tiene la siguiente información:

Hotel Número de turistas Gasto promedio


La Molina n1 = 55 x1= 1 652.67
Surco n2 = 45 x2= 1 611.22

De donde:

El gasto promedio mensual de los 100 turistas es 1 634.02 soles.

3.7 Ejercicios resueltos


1. El administrador de un hotel piensa mandar a construir más habitaciones en
el último piso de este, y lo hará siempre y cuando, en promedio, más de 32 de
las 40 habitaciones disponibles estén ocupadas diariamente. A continuación

ESTADÍSTICA GENERAL 121


se muestran los resultados obtenidos a partir de una muestra aleatoria de
30 días:

31 25 37 22 32 23 25 26 30 24
29 37 27 29 28 39 34 28 27 29
39 34 35 40 34 34 25 40 33 34

Calcule el número promedio de habitaciones ocupadas por día, y a partir de


lo obtenido, indique si el administrador mandará a construir más habitaciones
en el último piso del hotel.

Solución
Sea la variable:
X = Número de habitaciones ocupadas por día
Se pide:

El número promedio de habitaciones ocupadas diariamente es igual a 31,


por lo que el administrador no mandará a construir más cuartos en el último
piso del hotel.

2. A continuación se muestran los ingresos mensuales (en miles de soles) de


una empresa distribuidora de cerveza en los últimos 24 meses:

228 342 324 564 454 542 216 521 345 361 532 455
872 455 964 239 547 456 632 353 343 978 981 454

a) Calcule el ingreso mensual promedio.


b) Calcule el ingreso mensual mínimo para que un mes se encuentre dentro
del 50% de los meses con los ingresos más altos.
c) Calcule el ingreso mensual más frecuente.
d) Si en otra distribuidora los ingresos mensuales de los últimos 24 meses
fueron un 2.5% más altos, calcule el ingreso mensual promedio.

122 ESTADÍSTICA GENERAL


Solución
Sea la variable:
X = Ingreso mensual
a) Se pide:

El ingreso promedio mensual en los últimos 24 meses es de aproximadamente


506.58 miles de soles.

b) Se pide la mediana.
Primero se ordenan los datos de forma creciente; así:

216 228 239 324 342 343 345 353 361 454 454 455
456 457 521 532 542 547 564 632 872 964 978 981

Luego, la mediana se calcula de la siguiente manera:

Por lo tanto, el ingreso mensual mínimo para que un mes se encuentre


dentro del 50% de los meses con los ingresos mensuales más altos es 455.5
miles de soles.

c) Se pide la moda.
Mo = 454

El ingreso mensual más frecuente registrado en los últimos 24 meses es 454


miles de soles.

d) Sea la variable:
Y = Ingreso mensual de la otra distribuidora
Los ingresos mensuales tienen la siguiente forma:
Y= 1.025X

ESTADÍSTICA GENERAL 123


El ingreso mensual promedio se obtiene de la siguiente manera:

El ingreso promedio mensual de la otra distribuidora es 519.24 miles


de soles.

3.8 Trabajo colaborativo (para trabajar en clase)


El jefe de capital humano seleccionó una muestra de 40 empleados y registró
las siguientes características de los mismos:

Número de Área de Edad Ingresos (en Tiempo de experiencia Horas Número de


trabajador trabajo (años) soles) laboral (en años) trabajadas ausencias
1 A 38 2 026.16 8 180 0
2 B 25 1 995.10 11 162 1
3 A 39 1 398.29 12 168 2
4 A 40 2 685.10 6 170 1
5 A 38 3 158.62 4 178 2
6 B 44 3 243.98 8 164 2
7 A 46 2 034.98 12 160 3
8 A 49 3 370.47 10 180 1
9 B 38 2 603.79 12 158 1
10 A 41 3 378.18 10 158 2
11 A 57 2 959.77 7 172 3
12 B 32 1 897.18 9 172 3
13 A 53 3 243.29 5 174 4
14 A 59 2 899.31 10 164 2
15 A 38 2 816.62 1 160 2
16 A 29 2 432.90 8 180 0
17 A 56 1 946.14 9 172 1
18 B 57 3 279.56 9 180 0
19 A 58 1 791.20 10 184 3
20 A 51 2 632.08 3 168 3
21 A 50 3 248.27 10 176 2
22 A 27 1 898.56 11 172 2
23 B 26 1 922.76 12 167 4
24 B 27 1 056.25 10 174 4
25 A 56 1 282.67 2 162 2
26 B 54 3 441.21 4 174 2
27 A 25 1 260.33 12 170 1
28 B 36 1 891.37 7 173 1
29 A 35 2 818.05 10 160 3
30 B 46 2 453.38 6 180 0
31 A 44 2 151.60 1 180 0
32 B 35 2 474.47 5 180 0
33 B 38 2 165.30 1 173 1
34 B 43 1 789.31 12 174 1
35 A 41 2 711.92 4 168 2
36 A 47 2 904.63 11 175 1
37 A 39 1 791.22 5 164 3
38 A 46 1 369.60 7 174 1
39 B 43 2 434.51 11 169 2
40 B 40 2 590.28 6 167 2

124 ESTADÍSTICA GENERAL


Para las siguientes variables se pide:
1. Edad:
a) Calcule la edad promedio de los trabajadores para cada área de trabajo.
b) Determine la edad promedio de los trabajadores de las dos áreas.
c) Determine la edad más frecuente de los trabajadores para cada área de
trabajo.
2. Ingresos:
a) El jefe de personal de la empresa aumentó los ingresos de los trabajadores
del área A en un 8% más una bonificación de 15 soles por movilidad; y en
el área B, el jefe de personal aumentó los ingresos de los trabajadores
en un 5%. Con el aumento realizado, calcule el nuevo promedio de los
ingresos para cada área.
b) Con el cambio realizado por el jefe de personal, calcule el ingreso
promedio de los trabajadores de las dos áreas.
3. Tiempo de experiencia laboral:
a) Calcule el tiempo promedio de experiencia laboral de los trabajadores.
b) Calcule el tiempo de experiencia laboral mínimo para que un trabajador
pertenezca al 50% de los trabajadores con más años de experiencia
laboral.
c) Calcule el tiempo de experiencia laboral más frecuente de los
trabajadores.
4. Horas trabajadas:
a) Calcule el tiempo promedio de horas trabajadas para el área A.
b) Calcule la hora trabajada mínima para que un trabajador pertenezca al
50% de los trabajadores con más horas trabajadas.
c) Determine la hora trabajada más frecuente para cada área.
5. Número de ausencias
a) Calcule el número promedio de ausencias.
b) Calcule el número de ausencias máximo para que un trabajador
pertenezca al 50% de los trabajadores con menos horas de ausencia.
c) Calcule el número de ausencias más frecuente de los trabajadores.

ESTADÍSTICA GENERAL 125


3.9 Trabajo autónomo
1. Resuelva los siguientes problemas:

a) Complete los espacios en blanco en los siguientes enunciados:


i. Si la distribución es simétrica, la media aritmética, mediana y moda son
_________________________________________________________.

ii. La ________________________________________ es una medida


que no pondera cada uno de los valores por el número de veces que
se repite.

iii. Para calcular la media ponderada se necesitan __________________ y


______________________________.

iv. Para calcular la media total se necesitan _______________________


y ______________________________________________________.

b) Determine la verdad o falsedad de cada uno de los siguientes enunciados.


Si el enunciado es falso, entonces indique el correcto:
i. Las medidas de tendencia central son medidas de posición.
_________________________________________________________

ii. Si la distribución presenta asimetría positiva, entonces se cumple que


Mo < Me < :
_________________________________________________________

iii. Si se conocen las medias de n muestras, y los tamaños de cada


muestra son iguales, la media total es igual a la media aritmética de
las n muestras.

_________________________________________________________

iv. A continuación se muestran las siguientes edades: 29, 35, 32, 39 y


42. Para calcular la edad promedio, será necesario utilizar la media
ponderada.
__________________________________________________________

126 ESTADÍSTICA GENERAL


2. Un comité evaluador de sistemas de información de empresas privadas,
evaluó en un periodo de tres meses lo siguiente: 280 sistemas de información
con un costo de dos mil soles cada uno en el primer mes, 370 sistemas de
información con un costo de 2.3 miles de soles cada uno en el segundo
mes y 400 sistemas de información con un costo de 2.22 miles de soles
cada uno en el tercer mes. Calcule e interprete el costo promedio por
sistema de información.

3. En la provincia A, la producción promedio de 150 productores de algodón


en el primer trimestre del año fue de 1 552 kilogramos; mientras que, en la
provincia B, la producción promedio de 250 productores de algodón en el
mismo trimestre fue de 2 880 kilogramos.

a) Calcule e interprete la producción promedio de algodón de los 400


productores en el primer trimestre.
b) En el segundo trimestre, los productores de algodón de la provincia A
incrementaron su producción en un 5%; mientras que los productores
de algodón de la provincia B incrementaron su producción en un 7.5%
más 150 kilogramos. Calcule e interprete la producción promedio de
algodón de los 400 productores en el segundo trimestre.

4. Una empresa constructora ha contratado 32 maestros de obra para los


diferentes proyectos de vivienda: 16 reciben un pago de 50 soles la hora, 12
reciben un pago de 58.5 soles la hora y el resto recibe un pago de 75 soles
la hora. Calcule el pago promedio por hora de los 32 maestros de obra.

5. Los ingresos (en soles) de los empleados de las empresas A y B que


pertenecen a la empresa Alpha S.A. se presentan a continuación:

Empresa A

2 000 2 056 2 083 2 106 2 113 2 125 2 284 2 207 2 235 2 250
2 251 2 253 2 257 2 259 2 260 2 300 2 341 2 352 2 367 2 370
2 378 2 382 2 388 2 392 2 439 2 456 2 468 2 479 2 493 2 500
2 519 2 527 2 539 2 543 2 554 2 662 2 675 2 684 2 694 2 700

ESTADÍSTICA GENERAL 127


Empresa B

2 000 2 029 2 032 2 054 2 095 2 110 2 149 2 151 2 157 2 169
2 186 2 194 2 200 2 209 2 211 2 216 2 327 2 332 2 347 2 350
2 366 2 373 2 386 2 395 2 400 2 416 2 442 2 458 2 479 2 480
2 497 2 500 2 531 2 547 2 559 2 564 2 570 2 573 2 584 2 590

a) Calcule el ingreso promedio de los empleados de la empresa Alpha S.A.


b) Si los ingresos de los empleados de la empresa A se incrementaran en
20% y los ingresos de los empleados de la empresa B en 15% más una
bonificación de 150 soles, ¿cuál sería el ingreso promedio para cada
empresa? y ¿cuál sería el ingreso promedio de los empleados de la
empresa Alpha S.A.?

128 ESTADÍSTICA GENERAL


Lección 4

Medidas de tendencia no central


Con la finalidad de obtener valores que representen la distribución de un conjunto
de datos, se estudian las medidas de tendencia central, pero también es de
suma importancia estudiar otros valores de la distribución que ocupan lugares
particulares y que son necesarios para un mejor conocimiento de aquella. Estos
valores se denominan cuartiles.

4.1 Cuartiles (Qk)


Los cuartiles son tres valores (Qk; k = 1, 2, 3) que dividen al conjunto de datos en
cuatro partes iguales. Estos son:
• El cuartil 1 (Q1) divide al conjunto de datos en dos partes: el 25% de los
datos son menores (menores o iguales) que el cuartil 1 y el 75% de los
datos son mayores (mayores o iguales) que el cuartil 1.

• El cuartil 2 (Q2) divide al conjunto de datos en dos partes: el 50% de los


datos son menores (menores o iguales) que el cuartil 2 y el 50% de los
datos son mayores (mayores o iguales) que el cuartil 2.

• El cuartil 3 (Q3) divide al conjunto de datos en dos partes: el 75% de los


datos son menores (menores o iguales) que el cuartil 3 y el 25% de los
datos son mayores (mayores o iguales) que el cuartil 3.

Gráficamente:

4.2 Deciles (Dk)


Los deciles son nueve valores (Dk; k = 1, 2, …, 9) que dividen al conjunto de datos
en diez partes iguales.

El decil k (Dk) divide al conjunto de datos en dos partes: el (10k)% de los datos
son menores (menores o iguales) que el decil k y el (100-10k)% de los datos son
mayores (mayores o iguales) que el decil k.

Por ejemplo, el decil 5 (D5) divide al conjunto de datos en dos partes: el 50% de
los datos son menores (menores o iguales) que el decil 5 y el 50% de los datos
son mayores (mayores o iguales) que el decil 5.

ESTADÍSTICA GENERAL 129


Gráficamente:

4.3 Percentiles (Pk)


Los percentiles son noventa y nueve valores (Pk; k = 1, 2,…, 99) que dividen al
conjunto de datos en cien partes iguales.
El percentil k (Pk) divide al conjunto de datos en dos partes: el k% de los datos
son menores (menores o iguales) que el percentil k y el (100 - k)% de los datos
son mayores (mayores o iguales) que el percentil k.
Por ejemplo, el percentil 50 (P50) divide al conjunto de datos en dos partes: el
50% de los datos son menores (menores o iguales) que el percentil 50 y el 50%
de los datos son mayores (mayores o iguales) que el percentil 50.
Gráficamente:

Algunas de las medidas de tendencia no central coinciden, tal como se muestra


a continuación:

Percentil Decil Cuartil


P10 D1
P20 D2
P25 Q1
P30 D3
P40 D4
P50 D5 Q2
P60 D6
P70 D7
P75 Q3
P80 D8
P90 D9

130 ESTADÍSTICA GENERAL


Observación
Los valores del percentil 50 (P50), decil 5 (D5) y cuartil 2 (Q2) son iguales; y,
a su vez, son iguales al valor de la mediana (Me).

4.3.1 Cálculo de percentiles para datos no agrupados


Para el cálculo de percentiles en datos no agrupados se siguen los siguientes
pasos:

a) Ordenan los datos en forma ascendente.


b) Halla la posición (j) del percentil (PK ) a partir de la siguiente expresión:

c) Ubica el percentil en la posición hallada si “j” es un número entero; en


caso contrario, el percentil se calcula con la siguiente fórmula:

Donde:
Li = Límite del lado izquierdo
Ld = Límite del lado izquierdo
dec = Parte decimal de la posición j

Ejemplo 4.1
A continuación se presentan los ingresos semanales (en soles) de un grupo
de pequeñas empresas que forman parte de las pymes:

3 396 2 510 3 141 3 067 2 907 3 478 3 198


3 032 2 643 2 572 3 359 2 554 2 775 2 745

a) Calcule el decil siete de los ingresos semanales de las pequeñas empresas.


b) ¿Entre qué valores se encuentra el 50% central de los ingresos semanales
de las pequeñas empresas?

ESTADÍSTICA GENERAL 131


Solución
a) Sea la variable:
X = Ingresos semanales (en soles) de las pequeñas empresas
Se pide el decil siete (D7), que equivale al percentil 70 (P70). La posición del
percentil se calcula de la siguiente manera:

El percentil 70 se halla entre las posiciones 10 y 11. A continuación se muestran


los valores que corresponden a estas posiciones en el siguiente cuadro:

x1 x2 x3 x4 x5 x6 x7
2 510 2 554 2 572 2 643 2 745 2 775 2 907
x8 x9 x10 x11 x12 x13 x14
3 032 3 067 3 141 3 198 3 359 3 396 3 478

Luego, el percentil se calcula de la siguiente manera:

Donde:
Li = x10 = 3 141 Ld = x11 = 3 198 y dec = 10.5 – 10 = 0.5.

b) El 50% central de los ingresos se encuentra entre los percentiles 25 y 75;


es decir, entre P25 y P75. Gráficamente:

50% central

P25 P75

132 ESTADÍSTICA GENERAL


Cálculo del P25
La posición del percentil se calcula de la siguiente manera:

El percentil 25 se encuentra entre las posiciones tres y cuatro. A continuación,


se muestran los valores que corresponden a estas posiciones en el siguiente
cuadro:

x1 x2 x3 x4 x5 x6 x7

2 510 2 554 2 572 2 643 2 745 2 775 2 907


x8 x9 x10 x11 x12 x13 x14
3 032 3 067 3 141 3 198 3 359 3 396 3 478

Luego, el percentil se calcula de la siguiente manera:

Donde:
Li = x3 = 2 572, Ld = x4= 2 643 y dec = 3.75 – 3 = 0.75

Cálculo del P75


La posición del percentil se calcula de la siguiente manera:

ESTADÍSTICA GENERAL 133


El percentil 75 se encuentra entre las posiciones 11 y 12. A continuación
se muestran los valores que corresponden a estas posiciones en el
siguiente cuadro:

x1 x2 x3 x4 x5 x6 x7
2 510 2 554 2 572 2 643 2 745 2 775 2 907
x8 x9 x10 x11 x12 x13 x14
3 032 3 067 3 141 3 198 3 359 3 396 3 478

Luego, el percentil se calcula de la siguiente manera:

Donde:
Li = x11 = 3 198, Ld = x12 = 3 359 y dec = 11.25 – 11 = 0.25

El 50% central de los ingresos semanales se halla entre 2 625.25 y 3 238.25 soles.

4.4 Ejercicios resueltos


El dueño de un hotel de turistas registró los montos de las compras (en miles de
soles) de 30 clientes, los cuales son mostrados a continuación:

13 14 14 15 15 16 18 19 20 20
21 21 21 22 22 22 22 22 23 24
25 25 25 26 27 27 28 29 30 30

a) Calcule los montos de las compras, máximo y mínimo, de los turistas que
permanecieron en el hotel para pertenecer al quinto inferior y quinto
superior, respectivamente.
b) El dueño del hotel decide que al 35% de los turistas que tienen mayores
montos de compras se les brindará una promoción especial. Calcule el
monto mínimo que debe registrar un turista para que sea considerado
dentro de la promoción.

134 ESTADÍSTICA GENERAL


Solución
Sea la variable:
X = Monto de la compra de un turista
a) Se piden los percentiles 20 (P20) y 80 (P80). Gráficamente se tiene:

Quinto Quinto
Inferior Superior
20% 20%

P20 P80

Cálculo del P20


La posición del percentil se calcula de la siguiente manera:

El percentil 20 se encuentra entre las posiciones seis y siete. A continuación


se muestran los valores que corresponden a estas posiciones en el siguiente
cuadro:

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
13 14 14 15 15 16 18 19 20 20
x11 x12 x13 x14 x15 x16 x17 x18 x19 x20
21 21 21 22 22 22 22 22 23 24
x21 x22 x23 x24 x25 x26 x27 x28 x29 x30
25 25 25 26 27 27 28 29 30 30

Luego, el percentil se calcula de la siguiente manera:

ESTADÍSTICA GENERAL 135


Donde:
Li = 16, Ld = 18 y dec = 0.2

El monto de compras máximo para pertenecer al quinto inferior de los


clientes es 16.4 miles de soles

Cálculo del P80


La posición del percentil se calcula de la siguiente manera:

El percentil 80 se encuentra entre las posiciones 24 y 25. A continuación,


se muestran los valores que corresponden a estas posiciones en el
siguiente cuadro:

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
13 14 14 15 15 16 18 19 20 20
x11 x12 x13 x14 x15 x16 x17 x18 x19 x20
21 21 21 22 22 22 22 22 23 24
x21 x22 x23 x24 x25 x26 x27 x28 x29 x30
25 25 25 26 27 27 28 29 30 30

Luego, el percentil se calcula de la siguiente manera:

Donde:
Li = 26, Ld = 27 y dec = 0.8

El monto de compras mínimo para pertenecer al quinto superior de los


clientes es 26.8 miles de soles

136 ESTADÍSTICA GENERAL


b) Se pide el P65. Gráficamente:

La posición del percentil se calcula de la siguiente manera:

El percentil 65 se encuentra entre las posiciones 20 y 21. A continuación se


muestran los valores que corresponden a estas posiciones en el siguiente
cuadro:

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
13 14 14 15 15 16 18 19 20 20
x11 x12 x13 x14 x15 x16 x17 x18 x19 x20
21 21 21 22 22 22 22 22 23 24
x21 x22 x23 x24 x25 x26 x27 x28 x29 x30
25 25 25 26 27 27 28 29 30 30

Luego, el percentil se calcula de la siguiente manera:

Donde:
Li = 24, Ld = 25 y dec = 0.15
El monto mínimo que debe registrar un cliente para que sea considerado
dentro de la promoción es de 24.15 miles de soles

ESTADÍSTICA GENERAL 137


4.5 Trabajo colaborativo (para trabajar en clase)
En la oficina de Migraciones de una embajada se evalúa y otorga la visa a las
personas que desean viajar a dicho país. Un día cualquiera, un funcionario evaluó
40 solicitudes de visa y obtuvo la siguiente información:

N° Profesión Edad Ingreso Antigüedad Bolsa de viaje Tiempo laborando


(años) familiar laboral (años) (en soles) en la actual
mensual empresa (años)
(en soles)
1 Medicina 18 3 280.27 18 2 208.26 10

2 Medicina 21 3 675.58 11 1 833.91 7


3 Ingeniería de Minas 24 7 229.05 15 5 970.62 12
4 Ingeniería Empresarial 19 4 417.88 7 2 681.61 3
5 Ingeniería Empresarial 25 7 596.35 12 5 590.67 2
6 Comunicaciones 30 5 959.19 13 4 803.46 9
7 Ingeniería Empresarial 20 8 169.05 16 5 741.16 9
8 Ingeniería de Minas 18 8 979.77 4 6 870.54 2
9 Ingeniería de Minas 24 8 535.79 12 6 218.45 8
10 Administración 23 9 309.40 4 7 052.85 2
11 Ingeniería de Minas 16 8 906.50 8 6 904.79 6
12 Gastronomía 18 6 819.93 13 4 604.31 8
13 Comunicaciones 21 5 758.15 16 3 836.48 10
14 Ingeniería Industrial 18 3 483.58 21 1 702.71 14
15 Ingeniería Industrial 27 2 690.42 15 1 337.47 12
16 Gastronomía 30 7 279.90 12 5 287.44 4
17 Ingeniería Industrial 24 9 422.83 7 7 268.28 4
18 Gastronomía 18 6 205.27 16 5 263.88 6
19 Ingeniería Agrónoma 26 9 401.25 17 6 923.31 12
20 Medicina 36 9 363.52 12 7 101.51 6
21 Gastronomía 30 5 769.99 7 3 546.12 4
22 Administración 24 9 187.82 7 7 278.30 3
23 Administración 21 3 160.72 23 1 986.74 15
24 Mecánica 22 2 904.85 4 1 337.09 2
25 Ingeniería Empresarial 25 9 342.58 15 7 082.54 6
26 Comunicaciones 26 6 181.21 24 4 199.26 14
27 Comunicaciones 19 7 629.90 19 6 699.32 14
28 Comunicaciones 20 4 825.67 8 3 371.63 7
29 Ingeniería Agrónoma 26 5 177.48 5 3 869.36 1
30 Gastronomía 20 9 473.00 11 7 338.43 7
31 Ingeniería Industrial 33 9 653.20 24 7 181.53 15
32 Gastronomía 24 7 714.45 8 6 243.45 3
33 Comunicaciones 29 7 871.63 20 6 539.27 14
34 Ingeniería Agrónoma 19 6 303.93 4 4 769.16 2
35 Gastronomía 20 3 152.85 16 2 054.78 7
36 Ingeniería de Minas 27 7 771.69 10 5 725.24 3
37 Ingeniería Industrial 23 5 782.59 15 4 630.32 7
38 Mecánica 19 7 132.07 6 5 995.92 3
39 Ingeniería Empresarial 20 5 149.81 13 3 512.25 12
40 Ingeniería de Minas 27 4 543.53 10 3 230.13 4

138 ESTADÍSTICA GENERAL


Para las siguientes variables se pide:

1. Edad:
a) Calcule el sexto decil de la edad de las personas evaluadas.
b) Calcule el tercer cuartil de la edad de las personas evaluadas.
d) Determine la edad mínima de una persona para que sea considerada
dentro del 45% de las personas con mayor edad.

2. Tiempo laborando en la actual empresa:


a) Calcule el primer cuartil del tiempo laborando en la actual empresa.
b) Calcule el octavo decil del tiempo laborando en la actual empresa.
c) Determine el tiempo máximo del 65% de las personas que presentan los
menores tiempos laborando en su actual empresa.

3. Ingreso familiar mensual:


a) Si el funcionario de la oficina de Migraciones negó la visa a las personas
cuyos ingresos familiares se localizan en el quinto inferior, ¿cuál es el
ingreso familiar máximo para que la oficina de Migraciones le niegue la
visa a una persona?
b) Si el funcionario de la oficina de Migraciones otorgó la visa a las personas
cuyos ingresos familiares se localizan en el quinto superior, ¿cuál es el
ingreso familiar mínimo para que la oficina de Migraciones le otorgue la
visa a una persona?
c) ¿Entre qué valores se encuentran el 50% central de los ingresos
familiares?”.

4. Antigüedad laboral:
a) Si el funcionario de la oficina de Migraciones otorgó la visa a las personas
cuya antigüedad laboral se localiza en el cuarto superior, ¿cuál es la
antigüedad laboral mínima para que la oficina de Migraciones le otorgue
la visa a una persona?
b) Si el funcionario de la oficina de Migraciones negó la visa a las personas
cuya antigüedad laboral se localiza en el cuarto inferior, ¿cuál es la
antigüedad laboral máxima para que la oficina de Migraciones le niegue
la visa a una persona?
c) ¿Entre qué valores se encuentra el 70% central?

ESTADÍSTICA GENERAL 139


5. Monto de bolsa de viaje:
a) ¿Entre qué valores se encuentra el 64% central de los montos de las
bolsas de viaje?
b) Si el funcionario de la oficina de Migraciones negó la visa a las personas
cuyos montos de bolsas de viaje se localizan en el tercio inferior, ¿cuál es
el monto máximo de una bolsa de viaje para que la oficina de Migraciones
le niegue la visa a una persona?
c) Si el funcionario de la oficina de Migraciones otorgó la visa a las personas
cuyos montos de bolsa de viaje se localizan en el tercio superior, ¿cuál es
el monto mínimo de la bolsa de viaje para que la oficina de Migraciones
le otorgue la visa a una persona?

4.6 Trabajo autónomo


1. Complete los espacios en blanco de los siguientes enunciados:

a) Los cuartiles dividen al conjunto de datos en ________________________.


b) El valor del _______________________________ es el mínimo valor
para pertenecer al 15% superior en el conjunto de datos.
c) El valor del _________________________________ es el máximo valor
para pertenecer al 35% inferior en el conjunto de datos.
d) El 60% central del conjunto de datos se encuentra entre los percentiles
_________________________________________________________.

2. El jefe del área de capital humano de una empresa comercial realizó una
capacitación con el fin de ascender a los empleados que obtengan las
mayores calificaciones. Los resultados fueron los siguientes:

4 4 5 5 6 6 7 8 8 9 10 11 11 12 13
14 14 15 15 15 15 15 16 16 17 17 18 19 20 20

a) El jefe del área de capital humano espera que al menos el 50% de los
empleados obtenga una calificación mayor al promedio. ¿Cuál es su
conclusión al respecto?
b) Según las normas establecidas, a los trabajadores cuyas calificaciones
pertenezcan al 15% inferior se les bajará de nivel. ¿Cuál es la calificación
máxima para que un empleado se halle dentro de este grupo?
c) Otra norma señala que los trabajadores cuyas calificaciones pertenezcan
al 60% central se mantendrán en sus mismos puestos. ¿Cuáles son los
límites para que un empleado se encuentre dentro de este grupo?

140 ESTADÍSTICA GENERAL


d) Otra norma señala que a los trabajadores cuyas calificaciones
pertenezcan al 15% superior se les premiará con un ascenso. ¿Cuál es
la calificación mínima para que un empleado se halle dentro de este
grupo?

3. El jefe de ventas de una empresa inmobiliaria fue auditado con la finalidad


de verificar cuáles fueron los precios de venta (en miles de soles) de los
departamentos. Los resultados fueron los siguientes:

101.86 112.99 114.35 114.74 143.76 143.76 143.92 153.66 158.59 160.59
162.35 185.69 185.70 186.58 186.60 187.79 187.88 192.00 197.51 201.59
228.47 234.44 237.47 237.50 241.21 248.28 248.79 249.18 249.78 250.93
254.66 262.20 273.19 276.09 277.03 284.10 284.15 285.03 285.70 297.70
299.33 309.97 317.55 318.01 327.42 332.79 335.61 335.64 341.36 344.21
345.31 349.06 353.62 353.99 372.16 374.41 377.55 382.60 391.74 395.04

a) Por encargo del gerente de la inmobiliaria, se les otorgará un descuento


especial a los propietarios que hayan comprado un departamento cuyo
precio se encuentre dentro del 22% de los departamentos más caros.
¿Cuál será el precio de venta mínimo de un departamento para obtener
este descuento especial?
b) Por otra parte, se tendrá que hacer un reajuste al 22% de los
departamentos con los precios de venta más bajos. ¿Cuál será el precio
de venta máximo de un departamento para que se le haga el reajuste?

4. El gerente de una compañía telefónica está evaluando el consumo per


cápita de minutos mensuales en su servicio de RPN. Para esto, seleccionó
aleatoriamente una muestra de 30 usuarios cuyos tiempos de consumo se
muestran a continuación:

2 182 2 181 3 079 3 228 1 803 2 891


3 495 2 320 1 648 3 257 1 599 2 007
1 595 3 144 2 356 2 121 2 313 2 240
2 446 2 076 2 782 2 939 2 931 1 540
2 016 2 154 2 804 3 282 3 191 2 679

a) Con los datos proporcionados, estime el tiempo límite del 30% de los
usuarios que consumen menos minutos mensuales.
b) Se propone una promoción especial al 10% de los usuarios que más
consumen. ¿Cuál es el tiempo mínimo de consumo para que un usuario
sea beneficiado con esta promoción?

ESTADÍSTICA GENERAL 141


5. El gerente de una empresa hotelera está evaluando los ingresos por
hospedaje del último año de 16 ciudades del país. Los ingresos (en miles de
soles) son mostrados a continuación:

Ciudad Ingreso Ciudad Ingreso


Trujillo 185 Iquitos 194
Chiclayo 170 Tarapoto 217
Tumbes 187 Chachapoyas 184
Piura 187 Ucayali 240
Huaraz 184 Cusco 249
Lima 196 Tacna 170
Arequipa 203 Moquegua 228
Huancayo 179 Ica 197

Utilice las fórmulas correspondientes para resolver las siguientes preguntas:


a) Calcule el ingreso anual promedio de los hoteles que se localizan en las
ciudades cuyos ingresos se encuentran dentro del 70% central de los
ingresos.
b) Calcule el ingreso más frecuente de los hoteles que se localizan en las
ciudades cuyos ingresos se encuentran dentro del 50% central de los
ingresos.

4.7 Problemas de reforzamiento del capítulo


1. Determine la verdad o falsedad de cada uno de los siguientes enunciados.
Si el enunciado es falso, indique el correcto:

a) La media ponderada se calcula cuando existen varias observaciones con


el mismo valor.
_____________________________________________________________

b) El primer cuartil, quinto decil, percentil 50 y la mediana son iguales.


_____________________________________________________________

c) Si la variable es cualitativa, la medida de tendencia central a utilizar es la


moda.
_____________________________________________________________

d) Si la distribución de un conjunto de datos presenta asimetría positiva, se


cumple que:
_____________________________________________________________

142 ESTADÍSTICA GENERAL


2. A continuación se presentan los gastos anuales de exportación (en miles de
cientos de soles) de granos de café de 40 empresas productoras:

4 10 12 15 17 18 18 19 20 21
21 22 23 23 24 24 25 25 26 27
27 28 28 28 29 29 30 31 31 31
31 33 33 34 35 36 37 39 41 46

a) A las empresas con gastos de exportación que se encuentran en el


quinto superior se les aplica un impuesto. Calcule el gasto mínimo para
que a una empresa se le aplique el impuesto.
b) Cuando el valor del gasto de exportación es por lo menos el segundo
decil y a lo más el octavo decil, se considera que el gasto está bajo
control. Calcule los límites para que el gasto reciba esta denominación.
3. Un funcionario del MINCETUR desea conocer el precio que los turistas
pagan por visitar un resto arqueológico ubicado en una ciudad del interior
del país. Para esto, el funcionario entrevistó a 200 turistas y obtuvo que,
en promedio, un turista paga 62.75 dólares. Si el 42% de los turistas fueron
varones y pagaron en promedio 48.63 dólares, calcule el precio promedio
que pagaron las turistas mujeres.
4. El administrador comercial de una empresa productora de verduras
y hortalizas registró las ventas (en miles de soles) efectuadas a 20
supermercados de cierta ciudad en el mes de enero. A continuación se
muestran dichas ventas:

143.33 149.64 156.49 163.34 166.44 173.33 178.53 179.43 183.45


183.86 243.56 256.34 264.54 264.54 273.34 277.42 283.96 286.48

a) Calcule la venta promedio de verduras y hortalizas de la empresa


productora.
b) Calcule la venta mínima del 50% de los días con las ventas más altas de
verduras y hortalizas.
c) Determine la venta más frecuente de verduras y hortalizas registrada en
los supermercados.
d) En el mes de febrero, por algunos problemas administrativos en la
empresa, la venta promedio se redujo en un 12.26%. Calcule el valor de
la venta promedio en ese mes.

ESTADÍSTICA GENERAL 143


4.8 Portafolio (para subir al campus virtual)
A partir de la siguiente información:
Tipo de Distrito de Número de integran- Ingreso mensual familiar Gasto mensual Antigüedad

contrato residencia tes en la familia (soles) familiar (soles) laboral (años)
1 Indefinido Surco 3 3 600 2 256 2
2 Indefinido San Isidro 4 3 893 2 456 5
3 Temporal San Isidro 3 3 564 2 264 5
4 Indefinido San Miguel 3 4 322 3 132 5
5 Temporal Surco 3 3 656 2 334 7
6 Indefinido San Isidro 2 4 433 3 165 10
7 Temporal La Molina 4 3 443 2 157 3
8 Indefinido Surco 1 3 456 2 557 15
9 Indefinido San Miguel 2 3 053 2 568 4
10 Indefinido San Isidro 2 3 166 2 854 5
11 Indefinido La Molina 1 4 135 3 893 4
12 Indefinido Surco 2 3 754 3 469 12
13 Temporal San Isidro 2 3 085 3 245 9
14 Temporal San Miguel 2 3 624 2 648 7
15 Indefinido Surco 2 3 245 2 872 5
16 Indefinido Surco 3 3 191 2 645 3
17 Temporal San Isidro 4 4 656 3 164 12
18 Indefinido Surco 2 3 334 3 165 2
19 Indefinido Surco 3 3 642 3 893 8
20 Indefinido San Isidro 4 3 897 3 135 6
21 Temporal Surco 2 4 347 3 154 11
22 Indefinido Surco 4 4 465 2 321 7
23 Temporal Surco 1 4 143 3 164 2
24 Temporal San Miguel 2 4 954 3 165 7
25 Indefinido San Isidro 2 3 348 3 893 5
26 Indefinido San Isidro 1 3 865 3 198 17
27 Temporal Surco 1 3 962 2 572 2
28 Indefinido San Miguel 5 3 347 2 568 9
29 Indefinido La Molina 2 4 322 2 854 3
30 Temporal Surco 3 3 656 3 893 7
31 Indefinido San Isidro 2 3 454 3 469 5
32 Indefinido La Molina 3 4 465 3 245 4
33 Indefinido San Isidro 3 4 963 2 648 11
34 Temporal Surco 3 4 346 2 872 9
35 Temporal San Miguel 2 3 436 2 645 7
36 Indefinido San Isidro 4 3 465 3 164 5
37 Temporal San Isidro 1 4 467 3 165 3
38 Temporal Surco 2 3 621 3 893 2
39 Indefinido Surco 2 4 573 4 012 2
40 Indefinido San Isidro 2 3 463 2 956 8

144 ESTADÍSTICA GENERAL


Utilice el software estadístico Minitab para responder las siguientes preguntas:

1. Para la variable: Ingreso mensual familiar, calcule e interprete:


a) El ingreso promedio mensual familiar de los trabajadores.
b) El decil 30 (D30) y el decil 80 (D80).
2. Para la variable: Gasto mensual familiar, calcule e interprete:
a) El gasto promedio mensual familiar de los trabajadores.
b) El gasto mensual familiar más frecuente en los trabajadores.
c) El cuartil 1 (Q25) y el cuartil 3 (Q75).
3. Para las variables: Número de integrantes en la familia y Antigüedad laboral,
calcule e interprete:
a) Las medidas de tendencia central.
b) El percentil 27 (P27) y el percentil 76 (P76).

4.9 Medidas de tendencia central y no central con MINITAB


Media aritmética, mediana y moda

1. Calcule la media, mediana y moda de la variable antigüedad laboral (años)


utilizando el Minitab.
Para esto, seleccione Estadísticas/Estadística Básica/Mostrar estadísticos
descriptivos:

ESTADÍSTICA GENERAL 145


Luego, seleccione la variable antigüedad laboral (años):

Después de dar click en Estadísticas, seleccione la media, mediana y moda. Así:

Luego de dar click en “Aceptar”, se obtienen los resultados en la ventana de


sesión:

146 ESTADÍSTICA GENERAL


Percentiles
2. Calcule los percentiles 25, 50 y 75 de la variable Ingreso mensual familiar
utilizando el Minitab. Para esto, seleccione: Estadísticas/Estadística Básica/
Mostrar estadísticos descriptivos:

Luego, seleccione la variable Ingreso mensual familiar:

ESTADÍSTICA GENERAL 147


Después de dar click en Estadísticas, seleccione los percentiles 25, 50 y 75. Así:

Luego de dar click en “Aceptar”, se obtienen los resultados en la ventana


de sesión:

3. Calcule el percentil 80 de la variable Ingreso mensual familiar utilizando el


Minitab.

En el menú Calc elija la opción Calculadora. Luego, seleccione la variable y


en Expresión llene los argumentos de la función elegida; tal como se indica
a continuación:

148 ESTADÍSTICA GENERAL


En Almacenar resultado seleccione la columna donde desee que aparezca el
valor del percentil. El valor del percentil 80 es 4 465.

4.10 Bibliografía
1. Anderson, Sweeney y Williams (2012). Estadística para Administración y
Economía. Undécima edición. Cengage Learning.

2. Wackerly, Mendenhall y Scheaffer (2009). Estadística Matemática con


Aplicaciones. Sétima edición. Cengage Learning.

ESTADÍSTICA GENERAL 149


Capítulo 3
MEDIDAS DE
VARIABILIDAD, ASIMETRÍA
Y CURTOSIS
Desviación
Asimetría
(Xi - µx) Negativa

0 1 2 3 4 5 6 7 8 9 10
µx
Promedio

Capacidades por desarrollar


Al finalizar el capítulo, se espera que el estudiante logre las siguientes capacidades:
• Aplicar el concepto de variabilidad estadística en problemas
contextualizados.
• Utilizar las medidas adecuadas para comparar la variabilidad entre dos o
más conjuntos de datos en problemas contextualizados.
• Utilizar las medidas adecuadas para definir la forma y concentración de
la distribución de un conjunto de datos en problemas contextualizados.
• Interpretar diagramas de caja en problemas contextualizados.

ESTADÍSTICA GENERAL 151


Motivación
J. Wild and Pfannkuch, en el año 1999, señalaron que “la variación es una pieza
fundamental del pensamiento estadístico, pues todo lo que se ha construido
sobre la estadística gira en torno a ella”.

Suponga que un profesor del curso de Estadística tiene dos grupos de alumnos
en las aulas A y B cuyas calificaciones de la primera práctica son las siguientes:

ALUMNO AULA A AULA B


1 14 20
2 14 6
3 12 10
4 13 13
5 14 17
6 13 10
7 15 19
8 14 10
9 13 9
10 12 20
PROMEDIO 13.4 puntos 13.4 puntos

Si las calificaciones son consideradas como un indicador del rendimiento en


el curso, ¿es posible concluir que ambos grupos de alumnos tienen el mismo
rendimiento utilizando solamente como criterio la igualdad de los promedios de
las calificaciones?
Para responder esta pregunta, observe los gráficos N° 1 y N° 2:

Figura Nº 01. Desviaciones de las calificaciones respecto a


su promedio en el aula A

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

x = 13.4

152 ESTADÍSTICA GENERAL


Figura Nº 02. Desviaciones de las calificaciones respecto a
su promedio en el aula B

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

x = 13.4

En los gráficos, los promedios están representados por una línea vertical y las
desviaciones de las calificaciones respecto a dicho promedio están representadas
por líneas horizontales. Estas desviaciones son más grandes en su mayoría en
el aula B, lo que indica que las calificaciones están más alejadas con respecto a
su promedio. Algunas calificaciones son muy bajas (calificación mínima igual a
seis), y otras, muy altas (calificación máxima igual a veinte). Por lo tanto, se puede
concluir que los alumnos no tienen un aprendizaje homogéneo. Lo contrario
ocurre en el aula A, donde las calificaciones se encuentran más cercanas a la
calificación promedio y, además, no presentan alumnos desaprobados. Esto
indica que los rendimientos de los dos grupos de alumnos en la primera práctica
no son los mismos a pesar de que sus calificaciones promedio son iguales.

En este ejemplo, la representación gráfica es de mucha ayuda para tener una


idea rápida de qué tan alejadas están las calificaciones con respecto al promedio.
Esta idea lleva al concepto de variabilidad o dispersión de los datos con respecto
al promedio, y conlleva a preguntas como: ¿se puede cuantificar la variabilidad
de los datos?, ¿existe un número que represente la variabilidad o dispersión?

Saberes previos
• Noción de variabilidad
• Media o promedio
• Cuartiles
• Operaciones algebraicas

ESTADÍSTICA GENERAL 153


Lección 5
Medidas de variabilidad o dispersión
En esta lección se presentarán algunas de las medidas más utilizadas para
cuantificar la variabilidad o dispersión de los datos:

5.1 Rango (R)


Es una medida de variabilidad que se obtiene de la diferencia entre el máximo
y mínimo valor de la variable.

Donde:
Xmax = Máximo valor de la variable
Xmin = Mínimo valor de la variable
Si bien su cálculo es sencillo, el valor es muy inestable porque depende sólo de
los valores extremos. No se considera el resto de los datos.

La unidad de medida del rango es la misma de la unidad de medida de la variable.

Ejemplo 5.1
El jefe del área de control de calidad de una empresa metalmecánica, productora
de brocas para taladro de acero, lleva el registro diario del número de unidades
defectuosas como parte del proceso de control de calidad. A continuación se
presenta una muestra de 30 días:

22 23 23 24 25 27 27 28 30 32
32 35 35 36 36 36 38 38 39 40
43 44 44 45 46 46 46 47 49 51

Obtenga el rango del número de brocas defectuosas por día.

Solución

154 ESTADÍSTICA GENERAL


5.2 Rango intercuartílico (RI)
El rango intercuartílico se define como la diferencia entre los cuartiles tres (Q3)
y uno (Q1). Es el rango en el que se encuentra el 50% central de los datos.

La unidad de medida del rango intercuartílico es la misma de la unidad de


medida de la variable.

Ejemplo 5.2
Obtenga el rango intercuartílico del número de brocas defectuosas por día, del
ejemplo 5.1.

Solución

5.3 Varianza poblacional (σ2)


Mide la variabilidad del conjunto de datos con respecto a la media poblacional. Si
los datos están cerca de la media poblacional, entonces la varianza poblacional
será pequeña. En caso contrario, será grande.

Para el cálculo de la varianza se tienen en cuenta las desviaciones.


Las desviaciones son las diferencias entre los valores de los datos y la
media de estos.

donde:
σ = sigma.
Ejemplo 5.3
Para la variable del ejemplo 5.1, suponga que el número promedio poblacional
(no muestral) de brocas defectuosas es:

Entonces, algunas desviaciones son:

Dato Desviación
22 22 - 36 = -14
23 23 - 36 = -13
... ...
51 51 - 36 = 15

ESTADÍSTICA GENERAL 155


El cálculo de la varianza poblacional se realiza de la siguiente manera: se
calculan los cuadrados de las desviaciones; luego se suman y, finalmente, la
suma obtenida se divide entre el número de desviaciones o entre el número de
datos de la población (N).

En resumen, lo que se calcula es un promedio de los cuadrados de las


desviaciones. Es decir:

5.4 Varianza muestral (s2)


El cálculo de la varianza muestral se realiza de la misma manera que la varianza
poblacional. Pero, en vez de dividir la suma de los cuadrados de las desviaciones
entre el tamaño de la muestra n, se divide entre n-1. Para mayor información,
revise las propiedades de un buen estimador.

Cálculo de la varianza muestral para datos no agrupados u originales

Ejemplo 5.4
Calcule la varianza del número de brocas defectuosas del ejemplo 5.1

Solución

Observación
Un inconveniente al utilizar la varianza como medida de variabilidad o
dispersión de los datos con respecto de la media es que se expresa en la
unidad de medida de los datos al cuadrado. En consecuencia, esto dificulta
su interpretación directa.

156 ESTADÍSTICA GENERAL


5.5 Desviación estándar poblacional (σ)
La desviación estándar poblacional mide la desviación media o promedio de
cada dato con respecto a la media poblacional (μ) y se define como la raíz
cuadrada de la varianza poblacional. En consecuencia, la unidad de medida de
la desviación estándar es igual a la de los datos.

5.6 Desviación estándar muestral (s)


La desviación estándar muestral mide la desviación media o promedio de cada
dato con respecto a la media muestral y se define como la raíz cuadrada de
la varianza muestral.

Observación
La desviación estándar se puede utilizar para comparar la variabilidad
de dos o más conjuntos de datos cuando las unidades de medidas
son las mismas y las medias de los conjuntos de datos son
estadísticamente similares.

Ejemplo 5.5
A continuación se calcula la desviación estándar del número de brocas
defectuosas del ejemplo 5.1:

Suponga que se extrae otra muestra de la producción de 30 días y se obtiene


un promedio de brocas defectuosas igual al anterior (36.23), pero con una
desviación estándar de 15.2. Entonces, se puede concluir que el número de
brocas defectuosas del primer grupo es menos variable que el del segundo
grupo porque la desviación estándar del primer grupo es menor que la obtenida
en el segundo grupo (8.71 < 15.2).
¿Qué pasaría en caso de tener dos o más conjuntos de datos con unidades de
medida distintas o con promedios diferentes?, ¿qué criterio de comparación se
utilizaría?
Para ilustrar este escenario, véase el siguiente ejemplo:

ESTADÍSTICA GENERAL 157


Ejemplo 5.6
En una tienda, el precio promedio de todas las marcas de televisores con las
mismas características es de 4 000 soles, y la desviación estándar es de 300
soles; mientras que el precio promedio de las planchas eléctricas con las mismas
características es de 600 soles, y la desviación estándar es de 300 soles. ¿Cuál
de los artefactos presenta mayor variabilidad en sus precios? Para una mejor
observación, se presenta la información de la siguiente manera:

Medidas de resumen Televisor Plancha eléctrica


Precio promedio 4 000 600
Desviación estándar 300 300

Hay que precisar que, en esta ocasión, los precios promedio ya no son iguales y,
como la desviación estándar mide la desviación media de los datos con respecto
al promedio, entonces se debe plantear la siguiente pregunta: ¿Para cuál de los
artefactos, la desviación estándar es más significativa?
Observando la información, se tiene que, para los televisores, la desviación
estándar (300 soles) es menos significativa en relación con su promedio (4
000 soles), en comparación con las planchas eléctricas, donde la desviación
estándar (300 soles) es más significativa en relación con su promedio
(600 soles).
Esta comparación de la variabilidad entre dos conjuntos de datos a partir de las
proporciones que se forman entre las desviaciones estándar y los respectivos
promedios motiva el estudio del concepto de coeficiente de variación.

5.7 Coeficiente de variación (CV)


El coeficiente de variación es una medida de dispersión relativa porque carece
de una unidad de medida e indica la proporción que representa la desviación
estándar con respecto a la media en el conjunto de datos.
Este coeficiente se utiliza cuando se desea comparar la variabilidad entre dos o
más conjuntos de datos, incluso cuando las unidades de medidas son diferentes.
El coeficiente de variación se puede expresar en porcentaje para una mejor
interpretación.

158 ESTADÍSTICA GENERAL


Ejemplo 5.7
Calcule los coeficientes de variación de los precios de los artefactos del ejemplo 5.6

Solución

Dado que el coeficiente de variación de los precios de las planchas es mayor


que el de los televisores, se puede concluir que hay mayor variabilidad en los
precios de las planchas eléctricas.

5.8 Propiedades de la varianza y desviación estándar


Si X es una variable aleatoria que toma un conjunto de valores con varianza y
desviación estándar , entonces se cumplen las siguientes propiedades:

1. Si a todos los valores que toma la variable se les incrementa o disminuye un


valor constante b, entonces tanto la varianza como la desviación estándar
de la nueva variable (Y = X ± b) son las mismas. Es decir:

2. Si a todos los valores que toma la variable se les multiplica por una constante
c, entonces la varianza de la nueva variable (Y = cX) será igual a la varianza
anterior multiplicada por dicha constante al cuadrado, y la nueva desviación
estándar será igual a la desviación estándar anterior multiplicada por la
constante c. Es decir:

ESTADÍSTICA GENERAL 159


3. La tercera propiedad es consecuencia de las dos primeras, y se da cuando
a los valores que toma la variable se les multiplica por una constante c y
se les incrementa o disminuye en una constante b. Entonces, la varianza
y la desviación estándar de la nueva variable (Y = cX ± b) se obtienen de la
siguiente manera:

Las propiedades se resumen a continuación:

Nueva desviación
Nueva variable Y Nueva varianza
estándar
Y=X±b
Y=cX

Y=cX±b

Ejemplo 5.8
En el ejemplo 5.6, si el precio de todos los televisores se incrementa en 250
soles, calcule la desviación estándar y la varianza del nuevo conjunto de datos.

Solución
Si X representa los precios de los televisores antes del incremento e Y representa
los precios de los televisores después del incremento, las variables se relacionan
de la siguiente manera:
Y = X + 250

Por lo que, utilizando la propiedad 1, se tiene:

La desviación estándar es 300 soles.

La varianza es 90 000 soles2.

160 ESTADÍSTICA GENERAL


Ejemplo 5.9
En el ejemplo 5.6, si el precio de todas las planchas se incrementa en un 15%,
calcule la desviación estándar y la varianza del nuevo conjunto de datos.

Solución
Si X representa los precios de las planchas antes del incremento e Y representa
los precios de las planchas después del incremento, entonces las variables se
relacionan de la siguiente manera:

Y = 1.15 X

En este problema, la constante por la que se tienen que multiplicar los precios
antes del incremento para obtener los precios es 1.15.

Por lo que a partir de la propiedad 2 se tiene:

La desviación estándar es 345 soles.

La varianza es 119 025 soles2.

5.9 Ejercicios resueltos


1. Se realizó un estudio sobre dos marcas de zapatillas (A y B) con el objeto
de determinar cuál de ellas tiene un mejor programa de control de calidad
sobre el desgaste de su producto. Para esto se tomó dos muestras por cada
marca, las cuales se expusieron a una prueba bajo las mismas condiciones, y
se controló el número de horas hasta que se detecte un desgaste significativo.
Los resultados se presentan a continuación:

Marca A (horas) 91 90 83 92 78 93 91
Marca B (horas) 87 60 101 83 105 77

¿Cuál de las dos marcas de zapatillas tiene un mejor programa de control


de calidad sobre el desgaste?

ESTADÍSTICA GENERAL 161


Solución
Para responder la pregunta planteada, se necesita comparar la variabilidad de
los tiempos de desgaste de ambas marcas de zapatillas, para lo cual se utiliza
el coeficiente de variación.
Primero se calculan los promedios:

Se observa que la marca A tiene un tiempo promedio de duración mayor que el


de la marca B.
Luego, se calcula la desviación estándar y el coeficiente de variación para cada
marca:

Para la marca A se tiene:

Luego, el coeficiente de variación es:

Para la marca B se tiene:

162 ESTADÍSTICA GENERAL


Luego, el coeficiente de variación es:

Como se puede observar, el CVA es menor que el CVB. Esto quiere decir que
los tiempos de desgaste de las zapatillas de la marca A son más homogéneos
(se registran desgastes similares) en comparación con los tiempos de desgaste
de las zapatillas de la marca B, lo cual indica que la marca A tiene el mejor
programa de control de calidad sobre el desgaste de zapatillas.

2. Se sabe que, en una empresa de transportes, los consumos diarios en


combustible de los 12 vehículos que la conforman son:

85.7 179.6 180.6 158.3 170.5 162.4


182.2 177.8 152.3 165.6 176.1 280.3

El gerente de operaciones considera que existe mucha variabilidad en el consumo


de combustible; por lo tanto, decide incluir un aditivo especial que le permite
a cada vehículo ahorrar el 10% de lo que consume. ¿Será esta la solución para
disminuir la variabilidad en el consumo de combustible?

Solución
Para responder la pregunta planteada se necesita comparar la variabilidad en
el consumo de combustible antes y después de incluir el aditivo especial. Para
esto se utilizará el coeficiente de variación.

Antes de incluir el aditivo


Si X representa los gastos de transporte antes de incluir el aditivo, se tiene:
• Cálculo de la media

ESTADÍSTICA GENERAL 163


• Cálculo de la varianza y desviación estándar:

• Cálculo del coeficiente de variación:

Después de incluir el aditivo


Si Y representa los consumos de transporte después de incluir el aditivo,
entonces X e Y se relacionan de la siguiente manera:

Y = 0.9X

Observación
Ahorrar el 10% implica que cada uno de los consumos disminuya en
10%; es decir, el valor de 0.9 se obtiene al realizar la siguiente operación:
100% - 10% = 90% = 0.9

Aplicando las propiedades, se tiene:

• Cálculo de la nueva media:

• Cálculo de la nueva desviación estándar:

• Finalmente, el nuevo coeficiente de variación es:

164 ESTADÍSTICA GENERAL


De donde se observa que, al anularse el factor 0.9, el coeficiente de variación
sigue siendo el mismo.

Entonces, se puede concluir que se ha mantenido la variabilidad de los consumos;


por lo tanto, incluir el aditivo no ha solucionado el problema.

Observación
De manera general, un incremento o disminución en porcentaje en cada
valor del conjunto de datos no afecta el valor del coeficiente de variación.

5.10 Trabajo colaborativo (para trabajar en clase)


1. En los siguientes ejercicios, complete los espacios en blanco:
a) Cuando dos muestras de datos tienen las mismas unidades de medida,
medias y desviaciones estándar diferentes, entonces se puede comparar
la variabilidad con: …………………………………………
b) Si la varianza de la variable X es 36, entonces la varianza de la variable
Y = 4X - 20 es: ………………………………………………………………
c) Si la media de la variable W es 64 y la desviación estándar es 15, entonces
el coeficiente de variación de la variable Z = 1.2W + 5 es: …………………………
………………………………………………………………………..

2. Relacione los siguientes enunciados:

a) Coeficiente de variación Es la diferencia entre el dato máximo y el ( )


dato mínimo.
b) Rango intercuartílico Es una medida de dispersión relativa. ( )
c) Si Y=X+k, entonces V(Y) = V(X) Mide la desviación media o promedio de ( )
cada dato con respecto a la media.
d) Rango Propiedad de la varianza. ( )
e) Desviación estándar Mide la variabilidad del 50% central de los ( )
datos.

3. Un agente de compras realizó una prueba para medir los tiempos de vida de
dos marcas de pilas (A y B) antes de realizar la compra de un lote grande de
dicho producto. Los tiempos de vida (en horas) de las pilas seleccionadas
de cada marca se muestran a continuación:

ESTADÍSTICA GENERAL 165


Marca A

10 100 10 200 10 200 10 300 10 300


10 300 10 300 10 400 10 400 10 500

Marca B

8 500 8 500 9 500 9 500 9 800


9 800 10 000 10 100 10 100 10 100

El agente escogerá la marca que presente, al mismo tiempo, mayor duración


y poca variabilidad. ¿Cuál de las dos marcas de pilas debe escoger el agente?

4. El jefe de proyectos de un instituto de investigación obtuvo información


sobre el contenido de nicotina (en gramos) de dos marcas de cigarrillos.
La información obtenida es la siguiente:

Medidas de resumen Marca A Marca B


Promedio de contenido 3.1 2.1
nicotina
Desviación estándar 0.5 0.7

a) ¿Cuál de las dos marcas es más homogénea en su contenido de nicotina?


b) Si en la elaboración de la marca B se incrementó en 10% el contenido de
nicotina y en la marca A se disminuyó en un gramo el contenido de nicotina,
¿en cuál de las dos marcas los cigarrillos contienen cantidades de nicotina
más homogéneas?

5. El helado es un producto estacional cuyas mayores ventas en el Perú se


registran entre los meses de diciembre y abril. El gerente de una empresa
líder en la elaboración industrial de este producto registró el número de cajas
vendidas diariamente durante dicho periodo del penúltimo año y obtuvo
un coeficiente de variación del 35%. Para el último año, con la finalidad de
incrementar las ventas diarias, y asimismo, reducir la variabilidad de dichas
ventas, el gerente decidió aumentar su flota de camiones y logró que las
ventas se incrementaran en el doble más un adicional de 25 cajas, con lo
cual se obtuvo un coeficiente de variación del 28%.

a) ¿Cumplió con el objetivo el gerente?


b) ¿Cuál es el promedio y la desviación estándar del número de cajas diarias
vendidas por la distribuidora luego de incrementar su flota?

166 ESTADÍSTICA GENERAL


c) En otra empresa del mismo rubro se registró, en el último verano, una venta
promedio de 125 cajas diarias y una desviación estándar de 33 cajas para las
ventas diarias. Determine qué empresa presentó más homogeneidad con
respecto al número de cajas vendidas diariamente en el último año.

5.11 Trabajo autónomo


1. Determine si las siguientes afirmaciones son verdaderas o falsas:

a) Para calcular la varianza se toman en cuenta todos los valores de un


conjunto de datos.
b) El coeficiente de variación es una medida de dispersión relativa porque
no tiene unidades de medida.
c) Se utiliza la desviación estándar para comparar la variabilidad de dos
conjuntos de datos solo cuando tienen unidades de medida diferentes.
2. La siguiente información se obtuvo de los ingresos diarios (en soles) de tres
tiendas dedicadas a la venta de artículos de ferretería. Esta información
corresponde a los últimos 10 días:

Tienda X:

Tienda Y:

Tienda Z:

a) Calcule el coeficiente de variación de los ingresos diarios para cada una


de las tiendas.
b) ¿Cuál de las tiendas es más estable con respecto a los ingresos de las
ventas diarias?
3. A continuación, se presenta información sobre la productividad de las tres
empresas más importantes (A, B y C) de la industria textil de fibras de alpaca
en la ciudad de Arequipa: la empresa A, con mayor productividad, tiene
una producción promedio mensual de 9 000 unidades, con una desviación
estándar de 2 000 unidades; la empresa B, por tener menos tecnología,
produce mensualmente las tres cuartas partes de lo que produce A, y la
empresa C produce cada mes 1 750 unidades menos que B.
¿Qué empresa es más homogénea con respecto a la producción mensual de
unidades de fibras de alpaca?

ESTADÍSTICA GENERAL 167


4. Con la finalidad de comparar algunas características de dos cadenas
hoteleras (A y B) en la ciudad de Lima, se presentan dos pequeñas bases
de datos que contienen información de tipo laboral de los empleados de
ambas. En la cadena hotelera A se tiene información de 40 empleados, y
en la cadena hotelera B, de 35 empleados. La información obtenida es la
siguiente:

Empresa A
Número de Edad Ingresos Años de Horas Número de
trabajador (en años) (en soles) experiencia laboral trabajadas ausencias
1 38 2 026.16 8 180 0
2 25 1 995.10 11 162 1
3 39 1 398.29 12 168 2
4 40 2 685.10 6 170 1
5 38 3 158.62 4 178 2
6 44 3 243.98 8 164 2
7 46 2 034.98 12 160 3
8 49 3 370.47 10 180 1
9 38 2 603.79 12 158 1
10 41 3 378.18 10 158 2
11 57 2 959.77 7 172 3
12 32 1 897.18 9 172 3
13 53 3 243.29 5 174 4
14 59 2 899.31 10 164 2
15 38 2 816.62 1 160 2
16 29 2 432.90 8 180 0
17 56 1 946.14 9 172 1
18 57 3 279.56 9 180 0
19 58 1 791.20 10 184 3
20 51 2 632.08 3 168 3
21 50 3 248.27 10 176 2
22 27 1 898.56 11 172 2
23 26 1 922.76 12 167 4
24 27 1 056.25 10 174 4
25 56 1 282.67 2 162 2
26 54 3 441.21 4 174 2
27 25 1 260.33 12 170 1
28 36 1 891.37 7 173 1
29 35 2 818.05 10 160 3
30 46 2 453.38 6 180 0
31 44 2 151.60 1 180 0
32 35 2 474.47 5 180 0
33 38 2 165.30 1 173 1
34 43 1 789.31 12 174 1
35 41 2 711.92 4 168 2
36 47 2 904.63 11 175 1
37 39 1 791.22 5 164 3
38 46 1 369.60 7 174 1
39 43 2 434.51 11 169 2
40 40 2 590.28 6 167 2

168 ESTADÍSTICA GENERAL


Empresa B

Número de Edad Ingresos Años de Horas Número de


trabajador (en años) (en soles) experiencia laboral trabajadas ausencias
1 25 1 985.36 8 180 0
2 37 3 423.14 11 173 1
3 41 2 042.08 12 165 2
4 45 1 774.74 6 170 1
5 45 1 407.52 4 164 2
6 35 2 148.97 8 163 2
7 25 1 241.41 12 155 3
8 45 2 522.79 10 174 1
9 33 3 178.83 12 172 1
10 54 1 794.34 10 162 2
11 54 1 370.61 7 158 3
12 57 3 424.48 9 157 3
13 29 2 132.73 5 145 4
14 35 3 595.00 10 160 2
15 49 3 650.67 1 161 2
16 31 3 191.46 8 180 0
17 49 3 883.00 9 173 1
18 43 3 616.76 9 180 0
19 38 1 599.00 10 154 3
20 46 1 620.91 3 153 3
21 38 3 183.00 10 164 2
22 52 3 459.00 11 165 2
23 55 3 637.12 12 146 4
24 45 1 318.00 10 147 4
25 34 1 761.96 2 162 2
26 44 2 671.09 4 163 2
27 53 3 128.57 12 171 1
28 40 3 351.82 7 170 1
29 50 2 829.87 10 151 3
30 38 1 745.16 6 180 0
31 27 2 531.00 1 180 0
32 36 1 857.63 5 180 0
33 47 1 241.91 1 175 1
34 56 1 967.43 12 173 1
35 42 3 358.06 4 164 2

ESTADÍSTICA GENERAL 169


a) Determine en qué empresa los ingresos son más estables.
b) El jefe de personal de la empresa hotelera A aumentó los ingresos de los
empleados en un 10% más una bonificación de 15 soles por movilidad;
mientras que el jefe de personal de la empresa B aumentó los ingresos
de los empleados en un 5%. Con el incremento realizado, calcule el nuevo
coeficiente de variación de los ingresos de cada empresa. ¿Cuál de ellas
presenta los ingresos más homogéneos después de los cambios?
c) Determine en qué empresa las horas trabajadas por empleado son más
homogéneas.

5. Si:
• Se desea comparar la variabilidad de los ingresos (en soles) de los
trabajadores de las empresas M y N. Si se sabe que tienen iguales
desviaciones estándar, responda:
a) ¿Es necesario calcular el coeficiente de variación? ¿Por qué?
b) Si el ingreso promedio en la empresa M es 1 500 soles, ¿cuánto tendría
que ser el ingreso promedio en la empresa N para decir que en esta
los ingresos presentan menor variabilidad? ¿Por qué?
• Se desea comparar la variabilidad de los ingresos (en soles) de las
empresas M y N. Si se sabe que los ingresos promedio son iguales,
responda:
a) ¿Es necesario calcular el coeficiente de variación? ¿Por qué?
b) Si la desviación estándar en la empresa N es 350 soles, ¿cuánto
tendría que ser la desviación estándar en la empresa M para decir
que en esta los ingresos presentan menor variabilidad? ¿Por qué?

170 ESTADÍSTICA GENERAL


Lección 6

Medidas de asimetría y curtosis.


Diagrama de caja.
6.1 Medidas de asimetría
Estas medidas brindan información sobre la dirección horizontal que toma la
distribución de los datos con respecto a su centro. Si la distribución tiene una
extensión o cola pronunciada hacia la derecha –es decir, hacia los valores más
grandes de la variable–, se afirma que la distribución presenta asimetría positiva.
Por el contrario, si dicha extensión o cola pronunciada se produce por el lado
izquierdo, hacia valores pequeños de la variable, se dice que la distribución
presenta asimetría negativa. Finalmente, si la distribución presenta la misma
forma con respecto a su centro –es decir, el centro actúa como un espejo–, se
afirma que la distribución es simétrica.

• Coeficiente de asimetría de Pearson


El coeficiente de asimetría de Pearson es:

Si Ak < 0, entonces la distribución presenta asimetría negativa.


Si Ak = 0, entonces la distribución es simétrica.
Si Ak > 0, entonces la distribución presenta asimetría positiva.

ESTADÍSTICA GENERAL 171


• Tipos de asimetría representados en histogramas:

Ejemplo 6.1
A continuación se presentan las ventas de los últimos 14 meses, en el
supermercado MARKET, de six pack de leche evaporada (en miles de unidades)
de una marca muy reconocida a nivel nacional:

18.1 18.5 18.7 19.9 20.4 20.5 21.1


21.3 21.3 21.3 21.3 22.0 22.2 22.4

Calcule e interprete el coeficiente de asimetría.

Solución
Cálculo de la media:

172 ESTADÍSTICA GENERAL


Cálculo de la mediana:

Cálculo de la desviación estándar:

Por lo tanto, el coeficiente de asimetría es:

Como Ak = -1.17 es menor que cero, se concluye que las ventas de six pack de
dicha leche evaporada de los últimos 14 meses, en el supermercado MARKET,
presentan asimetría negativa.

6.2 Medidas de curtosis


Estas medidas brindan información sobre la deformación vertical de una
distribución de frecuencias en comparación con la curva normal. Si la distribución
es más apuntalada que la distribución normal, se denomina leptocúrtica; si
la distribución está a la misma altura de la distribución normal, se denomina
mesocúrtica, y si la distribución es más aplanada que la distribución normal, se
denomina platicúrtica.

• Coeficiente de curtosis basado en percentiles


El coeficiente de curtosis está definido de la siguiente manera:

Si Ku < 0.263, entonces la distribución es platicúrtica.


Si Ku = 0.263, entonces la distribución es mesocúrtica.
Si Ku > 0.263, entonces la distribución es leptocúrtica.

ESTADÍSTICA GENERAL 173


• Tipos de curtosis representados en histogramas

Ejemplo 6.2
Considere los siguientes valores para P75, P25, P90 y P10:

P75 = 82.5
P25 = 27.5
P90 = 99
P10 = 11

Calcule el coeficiente de curtosis y defina el tipo.

Solución

Como Ku=0.3125 es mayor que 0.263, se concluye que la distribución es


leptocúrtica.

174 ESTADÍSTICA GENERAL


6.3 Diagrama de caja
Es una representación gráfica de la distribución de una variable cuantitativa. Este
diagrama está compuesto por un rectángulo (el cual contiene el 50% central de
los datos) y dos líneas extendidas, a cada lado del rectángulo, llamadas bigotes.
Los diagramas de cajas permiten comparar la distribución de dos o más
conjuntos de datos de manera simultánea.
El procedimiento para construir el diagrama de caja es el siguiente:

• Ordenar los datos de menor a mayor.


• Calcular los cuartiles: Q1, Q2 (Me) y Q3
• Calcular el rango intercuartílico: RI= Q3 – Q1
• Calcular Q1-1.5RI y Q3+1.5RI

Los datos fuera del intervalo [Q1-1.5RI ; Q3+1.5RI] son considerados datos atípicos
(outliers). Es posible que en una distribución no se encuentre este tipo de datos.
En el gráfico de caja, los datos atípicos son representados mediante asteriscos.
En caso de que existan datos atípicos, se tienen que identificar: el menor valor,
mayor o igual que Q1-1.5RI; y el mayor valor, menor o igual que Q3+1.5RI.
• Trazar el diagrama correspondiente.

Ejemplo de un gráfico de caja:

Diagrama de caja de la variable X

Xmax

Q3
X

Mediana

Q1

Xmin

Donde X es la variable de estudio.

ESTADÍSTICA GENERAL 175


Observación
Para describir el tipo de asimetría en el 50% central de los datos, se tiene
en cuenta el siguiente criterio: si la mediana está más cerca del primer
cuartil, se dice que el 50% central presenta asimetría positiva; si la mediana
está más cerca del tercer cuartil, se afirma que el 50% central presenta
asimetría negativa, y si se halla en el centro de la caja, se dice el 50% central
es simétrico.

Ejemplo 6.3

Considere los datos del ejemplo 6.1, a saber:

18.1 18.5 18.7 19.9 20.4 20.5 21.1


21.3 21.3 21.3 21.3 22.0 22.2 22.4

Construya el diagrama de caja correspondiente.

Solución
Observe que los datos ya están ordenados en forma ascendente.
• Cálculo de los cuartiles:

• Cálculo del recorrido intercuartílico:

• Cálculo de Q1-1.5RI y Q3+1.5RI:

Si hubiera datos fuera del intervalo [16.7875; 24.2875], se considerarían atípicos.


En este caso, no existe ningún dato fuera de dicho intervalo.
• Se traza el diagrama de caja correspondiente:

176 ESTADÍSTICA GENERAL


Diagrama de caja del gasto en transporte
23

Xmax = 22.4
22 Q3 = 21.475

Me = 21.2
21
Gasto (soles)

20
Q1 = 19.6

19

Xmin = 18.1
18

Ciudad A

6.4 Ejercicios resueltos


1. De la base de datos del trabajo autónomo 5.11 (problema 4), calcule e
interprete el coeficiente de asimetría de las edades de los empleados de la
empresa hotelera B.

Solución
• Cálculo de la media:

• Cálculo de la mediana:

• Cálculo de la desviación estándar:

Luego, el coeficiente de asimetría se calcula de la siguiente manera:

ESTADÍSTICA GENERAL 177


Como Ak = -0.3026 es menor que cero, se concluye que la distribución
de las edades de los empleados de la empresa hotelera B presenta
una asimetría negativa.

2. Según un informe de la Sociedad de Industrias, aproximadamente el 96%


de las empresas productoras de calzado en el Perú son microempresas que
se están dedicando a producir calzado de goma, zapatillas, botas de PVC,
calzado plástico, entre otros.
El dueño de una gran cadena de tiendas que se dedica exclusivamente a
la venta de calzado se abastece de la producción de estas microempresas
y expone sus productos en tres segmentos claramente definidos: niños,
damas y caballeros. El registro de las ventas mensuales (en miles de soles)
de la tienda principal durante el año pasado se presenta en los siguientes
diagramas de caja:

a) Indique qué tipo de asimetría presentan cada una de las distribuciones.


b) ¿Cuál de los segmentos presenta mayor variabilidad en el 50% central
de las ventas? Justifique.
c) ¿Es posible que la venta promedio de calzado sea igual entre los
segmentos? Justifique.
d) ¿Cuál de los segmentos presenta mayor homogeneidad en el 25% de las
ventas más altas? Justifique.
e) ¿Cuál de los segmentos presenta un outlier? Considerando que los datos
fueron tomados correctamente, ¿cuál podría ser la justificación de este
valor atípico?

178 ESTADÍSTICA GENERAL


Solución
a) Las ventas mensuales en zapatos para niños presentan asimetría positiva,
las ventas mensuales en zapatos para damas presentan asimetría negativa,
y las ventas mensuales en zapatos para caballeros presentan asimetría
negativa.
b) Las ventas mensuales en zapatos para damas presentan mayor variabilidad
en el 50% central de las ventas porque la caja que les corresponde es de
mayor tamaño.
c) No es posible que el promedio de las ventas entre los segmentos sea igual
pues hay un desfase pronunciado en la ubicación de las cajas.
d) Las ventas mensuales en zapatos para damas presentan mayor homogeneidad
en el 25% de las ventas más altas porque el bigote superior de la caja es de
menor tamaño.
e) Las ventas mensuales en zapatos para niños presentan un outlier que
queda fuera del bigote superior. Este podría corresponder al mes en que se
vendieron zapatos escolares.

6.5 Trabajo colaborativo (para trabajar en clase)


1. Determine si las siguientes afirmaciones son verdaderas o falsas y justifique
su respuesta.
a) Si una distribución tiene asimetría positiva, a lo más el 50% de los datos
es menor que la media aritmética.
b) El coeficiente de curtosis es adimensional.
c) Si el coeficiente de curtosis es menor que cero, entonces la distribución
es platicúrtica.
2. Indique el tipo de asimetría en cada gráfico y el orden en que se encuentran
las medidas de tendencia central en cada una de ellas.

ESTADÍSTICA GENERAL 179


3. Las ventas semanales de computadoras portátiles (en miles de soles) que
se realizan en tres tiendas comerciales, Alpha, Beta y Gamma, han sido
analizadas mediante muestras aleatorias independientes. Los resultados
obtenidos fueron:

Medidas de Alpha Beta Gamma


resumen
Media 20.07 15.33 16.87
Desviación estándar 2.01 1.86 1.35
Mediana 20.055 14.86 16.87

a) ¿Qué tipo de asimetría presentan las ventas semanales de computadoras


portátiles en la tienda comercial Beta? Justifique.
b) ¿Qué tipo de asimetría presentan las ventas semanales de computadoras
portátiles en la tienda comercial Gamma? Justifique.
c) ¿Qué tipo de asimetría presentan las ventas semanales de computadoras
portátiles en la tienda comercial Alpha? Justifique.

4. Los sondeos e investigaciones de mercado sobre la industria textil y del


vestido revelan que las necesidades de los clientes se resumen en que las
prendas deben estar bien confeccionadas, con diversidad de colores y
estilos, siguiendo las nuevas tendencias de la moda, para lograr un producto
totalmente innovador, fresco y de buena calidad. Por tanto, el dueño de una
marca muy reconocida de jeans encarga al gerente de producción que tenga
especial cuidado en cada una de las etapas del proceso de producción. En
una de estas etapas se realiza la costura de la banda o tira de la cintura,
que se encuentra en manos de cuatro costureros (A, B, C y D) que trabajan
con una máquina de coser especial. En conjunto, estos trabajadores
logran una producción diaria de 672 costuras. Los tiempos obtenidos (en
minutos) en la producción del último día se muestran en los siguientes
diagramas de cajas:

180 ESTADÍSTICA GENERAL


Señale si las siguientes afirmaciones son verdaderas o falsas e indique la
alternativa correcta:

VoF

El costurero B demuestra ser más rápido que los otros costureros en realizar la
costura de la banda o tira de la cintura.
Los tiempos que demora el costurero D en realizar la costura de banda o tira de la
cintura son más homogéneos que los tiempos del resto de costureros. (Considere
el 50% central).
El costurero C presenta un momento flojo que obliga al supervisor estar atento
para considerar una posible sanción.
Todos los costureros presentan distribuciones asimétricas en los tiempos de
demora en la costura de banda o tira de la cintura.

5. A continuación se presentan las distribuciones de las puntuaciones obtenidas


por los equipos ganadores en los campeonatos nacionales de tres países
sudamericanos (A, B y C) en los últimos años.

ESTADÍSTICA GENERAL 181


a) ¿Cómo se conocen los valores 91 y 100 que se encuentran por encima
de la caja que corresponde al país A?
b) ¿En cuál de los tres países se presentan puntuaciones más homogéneas
en el 50% central?
c) ¿Sería posible que la puntuación promedio en el país B sea de 50 puntos?
Justifique.
d) ¿Qué país presenta puntuaciones menos variables en el 25% inferior?
Justifique.

6.6 Trabajo autónomo


1. Determine si las siguientes afirmaciones son verdaderas o falsas y justifique
su respuesta.

a) Si una distribución presenta asimetría positiva, entonces existen valores


extremos superiores.
b) El coeficiente de asimetría se aplica a distribuciones bimodales.
c) Si el coeficiente de curtosis es mayor que 0.263, entonces la distribución
es mesocúrtica.

182 ESTADÍSTICA GENERAL


2. Los siguientes datos muestran los gastos diarios (en soles) en comida de 20
turistas seleccionados aleatoriamente que arribaron a la ciudad de Cusco:

186 181 179 173 195 186 194 190 186 188
163 177 168 159 183 179 160 185 192 193

Calcule e interprete el coeficiente de asimetría de los gastos diarios de los


20 turistas.

3. El gerente de producción y distribución primaria de una empresa de servicio


de agua potable y alcantarillado de Lima Metropolitana realizó un estudio
para determinar la cantidad de plomo (en miligramos por litro) en el río
Rímac entre los años 2011 y 2014. El gerente presentó la información en el
siguiente diagrama de caja:

Diagrama de caja de la concentración de plomo en el río Rímac


para los años 2011-2014
Contenido de plomo en miligramos por litro de agua

0,20
0,19
* 0,1860
0,18
0,17 * 0,1700
0,16
0,15
0,14
0,13
0,12
0,11
0,10
0,09
0,08
0,07
0,06
0,05
0,04
0,03
0,02
0,01
0,00

2011 2012 2013 2014

En base a este gráfico, responda:

a) En el año 2013, ¿qué tipo de distribución presentó el contenido de


plomo en miligramos? Indique cuál es la relación entre las medidas de
tendencia central.

ESTADÍSTICA GENERAL 183


b) ¿En qué año el contenido de plomo en miligramos por litro de agua es
más heterogéneo en el 50% central? Justifique.
c) En el año 2014, ¿es posible que la concentración promedio de plomo en
el agua haya sido 0.0380 mililitros? Justifique.
d) ¿En cuál de los cuatro años se presenta menor dispersión en el 25%
superior de la concentración de plomo en el río Rímac? Justifique.

4. El jefe de informática de una compañía implementó un nuevo programa de


computadoras que ayudó a optimizar la información que el área de logística
requería para una mejor organización de la empresa. Como el programa era
innovador, con cierto grado de complejidad por las diferentes aplicaciones
tecnológicas de última generación, los usuarios de dicho programa tuvieron
que seguir una preparación rigurosa. Esta capacitación integral se tuvo
que repetir cuatro veces durante el año pasado; al final de cada una de
ellas, los empleados eran evaluados mediante una prueba que consistía en
utilizar, de manera apropiada, las diferentes aplicaciones del programa. Las
calificaciones obtenidas (en puntos) se muestran en los siguientes diagramas
de caja:

Diagramas de caja de las calificaciones para las cuatro capacitaciones


100
*
*
90

80
Calificaciones

70
*
60

50

40

30

20
Primera_vez Segunda_vez Tercera_vez Cuarta_vez

a) ¿Considera que fue necesario el desarrollo de varias capacitaciones?


¿Por qué?
b) ¿Con cuántas capacitaciones se produjo la mayor homogeneidad en las
calificaciones del 50% central? Justifique.
c) ¿Es posible observar usuarios que destacan o que tienen problemas en
el aprendizaje del programa en la prueba cuatro?

184 ESTADÍSTICA GENERAL


5. De la base de datos del trabajo autónomo 5.11 (problema 4):
a) Calcule e interprete el coeficiente de asimetría de los ingresos de los
empleados de cada una de las empresas hoteleras A y B.
b) Con los resultados de a), ¿se puede afirmar que existen algunos
empleados de la empresa A que tienen ingresos muy inferiores en
comparación con los de la mayoría?
c) Con los resultados de a), ¿se puede afirmar que existen algunos
empleados de la empresa B que tienen ingresos muy superiores en
comparación con los de la mayoría?
d) Calcule e interprete el coeficiente de curtosis de los ingresos de los
empleados de la empresa hotelera B.
e) Presente el diagrama de caja de los ingresos de los empleados de ambas
empresas y verifique si se cumple lo afirmado en a), b) y c).

6.7 Problemas de reforzamiento del capítulo


1. Indique si las siguientes afirmaciones son verdaderas (V) o falsas (F). En
caso de que una afirmación sea falsa, escriba la afirmación correcta.
a) Si un conjunto de datos presenta asimetría positiva, entonces la mediana
es mayor que la media.
b) Una distribución es platicúrtica si presenta los datos muy concentrados
alrededor de la media.
c) Si el coeficiente de asimetría de un conjunto de datos es igual a –0.25,
entonces la distribución presenta asimetría positiva.
2. Pizza Cut ofrece entregas rápidas de pizzas en el servicio por delivery.
Con la finalidad de mejorar el servicio, el propietario ordenó monitorear el
funcionamiento durante los fines de semana del mes pasado a través del
control de los tiempos de entrega de tres de los repartidores motorizados
con los que cuenta la empresa (Paco, Nicola y César). Los tiempos obtenidos
se muestran en el siguiente gráfico:

ESTADÍSTICA GENERAL 185


Diagramas de caja del tiempo de entrega para los tres repartidores motorizados
19

18

17
Tiempo en minutos

16

15

14

13

12 *12,0

11

10 *10,0

Paco Nicola César

a) ¿Cómo se conocen los valores 10 y 12 que se encuentran por debajo


de las cajas que corresponden a Paco y Nicola, respectivamente? ¿Qué
podrían significar estos valores para cada repartidor? Explique.
b) ¿Cuál de los repartidores presenta tiempos más homogéneos?
c) ¿Sería posible que el tiempo promedio de Paco sea menor que 15?
Justifique.
d) ¿Qué se puede decir acerca del tipo de asimetría de los tiempos de
César?

3. Un grupo de estudiantes realizó un estudio para comparar el contenido de


nicotina (en gramos) de dos marcas de cigarrillos. Para esto, seleccionaron
una muestra de cigarrillos por cada marca. Los resultados fueron los
siguientes:

Medidas de resumen Marca A Marca B


Promedio de nicotina 3.10 2.19
Mediana 3.09 2.21
Desviación estándar 0.51 0.75
P10 2.22 1.65
P25 2.86 1.84
P75 3.37 2.53
P90 3.54 2.71

186 ESTADÍSTICA GENERAL


a) Calcule e interprete los coeficientes de asimetría y curtosis de ambas
marcas de cigarrillos.
b) Si en la elaboración de la marca B se incrementó en 10% el contenido
de nicotina y en la marca A se disminuyó el contenido de nicotina en
un gramo, ¿qué sucede con el tipo de asimetría y curtosis de ambas
distribuciones?

4. Los dueños de dos empresas del mismo rubro que operan en un mismo
mercado decidieron comparar los volúmenes de ventas durante el último
año. Para esto, los encargados tomaron muestras de los volúmenes de ventas
(en miles de unidades) en algunas zonas que conforman dicho mercado.
Los resultados obtenidos se muestran a continuación:

Medida de resumen Empresa 1 Empresa 2


Volumen de venta
259 260
promedio (X)
Desviación estándar (s) 29 24

a) Clasifique a las dos empresas según el siguiente criterio:


Si el coeficiente de variación (CV) es a lo más 10%, las ventas son
homogéneas.
• Si el CV es mayor al 10%, pero a lo más 30%, las ventas son variables.

• Si el CV es mayor al 30%, las ventas son heterogéneas.

b) Los encargados hallaron errores en sus cálculos e hicieron las correcciones


necesarias. Estas fueron las siguientes:
• En la empresa 1, las ventas en todas las zonas se incrementaron en “k”
unidades.

• En la empresa 2, las ventas en todas las zonas se incrementaron


en un b%.

Si se sabe que, luego de las correcciones, los coeficientes de variación son


iguales, obtenga el valor de “k”.

ESTADÍSTICA GENERAL 187


6.8 Portafolio (para subir al campus virtual)
Utilice el software estadístico Minitab y la base de datos que se presenta más
abajo para responder las siguientes preguntas:
Nº Tipo de Distrito de Número de Ingreso mensual Gasto mensual Antigüedad
contrato residencia integrantes en la familiar (soles) familiar (soles) laboral
familia (años)
1 Indefinido Surco 3 3 600 2 256 2
2 Indefinido San Isidro 4 3 893 2 456 5
3 Temporal San Isidro 3 3 564 2 264 5
4 Indefinido San Miguel 3 4 322 3 132 5
5 Temporal Surco 3 3 656 2 334 7
6 Indefinido San Isidro 2 4 433 3 165 10
7 Temporal La Molina 4 3 443 2 157 3
8 Indefinido Surco 1 3 456 2 557 15
9 Indefinido San Miguel 2 3 053 2 568 4
10 Indefinido San Isidro 2 3 166 2 854 5
11 Indefinido La Molina 1 4 135 3 893 4
12 Indefinido Surco 2 3 754 3 469 12
13 Temporal San Isidro 2 3 085 3 245 9
14 Temporal San Miguel 2 3 624 2 648 7
15 Indefinido Surco 2 3 245 2 872 5
16 Indefinido Surco 3 3 191 2 645 3
17 Temporal San Isidro 4 4 656 3 164 12
18 Indefinido Surco 2 3 334 3 165 2
19 Indefinido Surco 3 3 642 3 893 8
20 Indefinido San Isidro 4 3 897 3 135 6
21 Temporal Surco 2 4 347 3 154 11
22 Indefinido Surco 4 4 465 2 321 7
23 Temporal Surco 1 4 143 3 164 2
24 Temporal San Miguel 2 4 954 3 165 7
25 Indefinido San Isidro 2 3 348 3 893 5
26 Indefinido San Isidro 1 3 865 3 198 17
27 Temporal Surco 1 3 962 2 572 2
28 Indefinido San Miguel 5 3 347 2 568 9
29 Indefinido La Molina 2 4 322 2 854 3
30 Temporal Surco 3 3 656 3 893 7
31 Indefinido San Isidro 2 3 454 3 469 5
32 Indefinido La Molina 3 4 465 3 245 4
33 Indefinido San Isidro 3 4 963 2 648 11
34 Temporal Surco 3 4 346 2 872 9
35 Temporal San Miguel 2 3 436 2 645 7
36 Indefinido San Isidro 4 3 465 3 164 5
37 Temporal San Isidro 1 4 467 3 165 3
38 Temporal Surco 2 3 621 3 893 2

188 ESTADÍSTICA GENERAL


39 Indefinido Surco 2 4 573 4 012 2
40 Indefinido San Isidro 2 3 463 2 956 8

1. ¿En cuál de los tipos de contrato los ingresos mensuales son más
homogéneos?
2. Para la variable Gasto mensual familiar, indique el tipo de asimetría según el
coeficiente de Pearson y el tipo de curtosis basado en percentiles.
3. Presente y analice el diagrama de caja del ingreso para el tipo de contrato y
el diagrama de caja del gasto mensual para el distrito de residencia.

6.9 Medidas de dispersión con MINITAB


1. Calcule el rango, el rango intercuartil (IQR), la varianza, la desviación
estándar y el coeficiente de variación de la variable Ingreso mensual familiar
utilizando el Minitab.
Para esto, seleccione Estadísticas/Estadística básica/Mostrar estadísticos descriptivos:

ESTADÍSTICA GENERAL 189


Luego, seleccione la variable Ingreso mensual familiar:

Después de dar click en Estadísticas, seleccione las medidas de dispersión pedidas:

Luego de dar click en “Aceptar”, se obtienen los resultados en la ventana de


sesión:

190 ESTADÍSTICA GENERAL


ESTADÍSTICA GENERAL

TAREA ACADÉMICA N° 2

Apellidos y nombres:

Bloque:

Ciclo:

Fecha:

El gerente general de una entidad bancaria seleccionó una muestra aleatoria de


30 clientes y registró la información que se presenta en la base de datos DATA
BANK.
Problema 1

Para la variable Número de cuotas faltantes en el banco:

a) (1 punto) Calcule el valor de la varianza y el coeficiente de variación.

b) (1.5 puntos) Calcule e interprete el coeficiente de asimetría de Pearson.

c) (1.5 puntos) Calcule e interprete el coeficiente de curtosis basado en


percentiles.
Problema 2

Con respecto a la variable Monto de la cuota mensual:

a) (1.5 puntos) El próximo mes, el gerente de la entidad financiera aumentará


un interés del 2.5% a los clientes que se encuentren en el tercio superior.
¿Cuál es el monto mínimo para pertenecer a este grupo?

b) (1.5 puntos) El próximo mes, el gerente de la entidad financiera otorgará


otra línea de crédito a los clientes que se encuentren en el tercio inferior.
¿Cuál es el monto máximo para pertenecer a este grupo?

c) (3 puntos) Calcule e interprete los valores de la media, la mediana y la moda.

d) (2 puntos) Calcule los valores de la media, la mediana y la moda según la


forma de pago que realiza el cliente.

Problema 3
Para la variable Ingreso mensual:

a) (2 puntos) Calcule e interprete el decil 7 (D7)

b) (2 puntos) Calcule e interprete el cuartil 3 (Q3)

c) (2 puntos) ¿Entre qué valores se encuentra el 46% central de los datos?

d) (2 puntos) Elabore el diagrama de cajas agrupadas según la forma de pago.


Mencione dos características que más se resaltan en el diagrama.
6.10 Bibliografía
1. Wackerly, Mendenhall y Scheaffer (2009). Estadística Matemática con
Aplicaciones. Sétima edición. Cengage Learning.

2. Anderson, Sweeney y Williams (2008). Estadística para Administración y


Economía. Décima edición. Cengage Learning.

194 ESTADÍSTICA GENERAL


Capítulo 4

PROBABILIDADES

Capacidades por desarrollar


Al finalizar el capítulo, se espera que el estudiante logre las siguientes capacidades:
• Construir el espacio muestral que corresponde a un experimento aleatorio
en problemas contextualizados.
• Realizar operaciones entre eventos en problemas contextualizados.
• Calcular probabilidades simples y condicionales de eventos en juegos de
azar, en problemas de producción, control de calidad o bajo otro contexto.
• Calcular probabilidades a partir del conocimiento de la independencia de
eventos en problemas sobre juegos de azar, en problemas de producción,
control de calidad o bajo otro contexto.
• Calcular probabilidades utilizando los teoremas de la probabilidad total y
de Bayes en problemas contextualizados.

ESTADÍSTICA GENERAL 195


Motivación
En un intento por burlar la vigilancia en la aduana, un pasajero guarda en su
equipaje diez CD en blanco y ocho CD con programas informáticos grabados
de forma ilegal. Si el inspector de la aduana selecciona al azar tres de los CD
para verificar su contenido, ¿cuál es la probabilidad de arrestar al pasajero por
posesión ilegal de programas informáticos?
En este capítulo se resolverán problemas que, al igual que el ejemplo anterior,
involucran aleatoriedad.

Saberes previos
• Teoría de conjuntos.
• Operaciones algebraicas.

196 ESTADÍSTICA GENERAL


Lección 7

Conceptos básicos
La teoría de la probabilidad se ocupa del estudio de experimentos en que los
resultados no se pueden predecir con exactitud; es decir, los resultados del
experimento son producto del azar.

7.1 Experimento aleatorio


Un experimento es aleatorio cuando el resultado de este no se puede predecir
con exactitud. Es importante tener claro que la repetición de un experimento
implica hacerlo bajo las mismas condiciones y que los resultados obtenidos en
cada repetición no tienen ninguna influencia sobre los resultados futuros.

7.2 Espacio muestral (Ω)


El espacio muestral de un experimento aleatorio es el conjunto formado por
todos los posibles resultados del experimento; además, cada resultado recibe el
nombre de evento elemental. Para representar el espacio muestral se utiliza la
letra griega Ω, y para representar un evento elemental se utiliza la letra w.

Ejemplo 7.1
Sea el experimento:
ε1 = Lanzar un dado y observar el número mostrado en la cara superior.
Este es un ejemplo de un experimento aleatorio porque, aunque se conozcan
todos los números inscritos en las caras del dado, no se puede predecir con
exactitud cuál será el número mostrado en la cara superior.
Si en las caras del dado están inscritos los números 1, 2, 3, 4, 5 y 6, entonces el
espacio muestral que corresponde al experimento es:

Ω = {1, 2, 3, 4, 5, 6}

7.3 Evento (A, B,…)


Un evento es cualquier subconjunto del espacio muestral. Para representar un
evento se utilizan las letras mayúsculas A, B, etc.

ESTADÍSTICA GENERAL 197


Ejemplo 7.2
A partir del experimento del ejemplo 7.1 se definen tres posibles eventos:
A = Número mostrado en la cara superior es igual a seis ⇒ A = {6}
B = Número mostrado en la cara superior es par ⇒ B = {2, 4, 6}
C = Número mostrado en la cara superior es menor que cinco ⇒ C = {1, 2, 3,4}

7.4 Ocurrencia de un evento


Se dice que un evento ocurre si, al realizar el experimento aleatorio, el resultado
observado pertenece a dicho evento.

Ejemplo 7.3
En este ejemplo, considere los eventos del ejemplo 7.2:

A = {6}
B = {2, 4, 6}
C = {1, 2, 3,4}

Suponga que se lanza un dado y el número mostrado en la cara superior es


igual a tres; entonces se puede afirmar que el evento C ha ocurrido porque
tres es un elemento que pertenece al evento C y que los eventos A y B no han
ocurrido porque tres no pertenece a ninguno de los dos eventos.

7.5 Operaciones entre eventos


A. Complemento de un evento (Ac)
Dado un evento A, su complemento se define como el evento formado
por todos los elementos del espacio muestral que no pertenecen al evento
A y se representa como (Ac) En términos de ocurrencia de eventos, el
evento Ac ocurre si el evento A no ocurre.

198 ESTADÍSTICA GENERAL


B. Unión de eventos (AUB)
Dados dos eventos A y B, la unión que se representa como (AUB) , se
define como el evento formado por los elementos que pertenecen al
menos a uno de los dos eventos. En términos de ocurrencia de eventos, el
evento (AUB)ocurre si al menos uno de los dos eventos ocurre.

C. Intersección de eventos (A B)
Dados dos eventos A y B, la intersección que se representa como (A B), se
define como el evento formado por los elementos que pertenecen a los dos
eventos simultáneamente. En términos de ocurrencia de eventos, el evento
(A B) ocurre si, y solo si, los dos eventos ocurren simultáneamente.

D. Eventos mutuamente excluyentes


Dados dos eventos A y B, se dice que estos eventos son mutuamente
excluyentes si no tienen elementos en común, es decir, si su intersección
es el evento vacío. En términos de ocurrencia de eventos, si el evento A
ocurre, entonces el evento B no ocurre.

ESTADÍSTICA GENERAL 199


Ejemplo 7.4
Considere el siguiente experimento:

ε2 = Lanzar un dado dos veces y observar el número mostrado en la cara superior


en cada lanzamiento.

En este experimento, el espacio muestral es:

Ω = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6),
(3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6),
(5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}

Entonces, al lanzar el dado dos veces, se tienen 36 posibles resultados. Ahora,


considere los siguientes eventos:

A = Número mostrado en el primer lanzamiento es igual a uno.


A = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6)}
B = Suma de los números mostrados es igual a cinco.
B = {(1,4), (2,3), (3,2), (4,1)}
C = Suma de los números mostrados es igual a siete.
C = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}

A partir de los eventos definidos, se obtienen arbitrariamente los siguientes


eventos:

• AUB = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,3), (3,2), (4,1)}
• A B = {(1,4)}
• Ac = {(2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1), (3,2), (3,3), (3,4), (3,5), (3,6),
(4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1),
(6,2), (6,3), (6,4), (6,5), (6,6)}
• B C=ø; es decir, B y C son mutuamente excluyentes.
Ahora, suponga que se lanza el dado dos veces y ocurre el evento elemental
(1, 4); es decir, en el primer lanzamiento se muestra el número uno y en el
segundo lanzamiento, el número cuatro. Entonces, se puede afirmar que los
eventos A, B, (AUB) y (A B) han ocurrido porque el evento elemental (1, 4)
es un elemento que pertenece a los eventos mencionados.

7.6 Probabilidad de un evento


Sea Ω el espacio muestral que corresponde a un experimento aleatorio, entonces
la probabilidad del evento se representa como P(A), y satisface:

1.
2.
3. Si son eventos mutuamente excluyentes, entonces:

Propiedades
A partir de la definición de probabilidad, se obtienen las siguientes propiedades:
1. Sea el evento que representa al vacío, entonces la probabilidad de este
evento es:

2. Sea el evento A, con probabilidad P(A), entonces la probabilidad del


complemento del evento A se define de la siguiente manera:

3. Sean A y B dos eventos, con probabilidades P(A) y P(B) respectivamente,


tales que entonces se cumple que:

7.7 Definición clásica de probabilidad


Para un experimento con resultados igualmente probables, se define:

Dado el evento A, la probabilidad de ocurrencia de este evento se calcula de la


siguiente manera:

Donde:
n(A) = número de elementos del evento A
n(Ω) = número de elementos del espacio muestral

ESTADÍSTICA GENERAL 201


Ejemplo 7.5
Considere el experimento del ejemplo 7.4: (ε2 = Lanzar un dado dos veces y
observar el número mostrado en la cara superior en cada lanzamiento) y los
siguientes eventos:

A = Número mostrado en el primer lanzamiento es igual a uno.


B = Suma de los números mostrados es igual a cinco.
C = Suma de los números mostrados es igual a siete.

Ahora, suponga que los 36 posibles resultados tienen la misma probabilidad


de ocurrencia. Se pide:

a) Calcule la probabilidad de ocurrencia de los eventos:


Como los 36 posibles resultados tienen la misma probabilidad de ocurrencia,
entonces se utiliza la definición clásica de probabilidad.
Para calcular la probabilidad del evento C, hay que tener en cuenta que seis
de un total de 36 posibles resultados lo favorecen, por lo que el evento C es
la unión de seis eventos elementales. Entonces:

Con el mismo razonamiento se calculan las otras probabilidades:

b) ¿Cuál de los dos eventos, A o B, tiene mayor probabilidad de ocurrencia?


A partir de la definición clásica de probabilidad, se tiene:

Por lo tanto, el evento A tiene mayor probabilidad de ocurrencia que el


evento B.

202 ESTADÍSTICA GENERAL


7.8 Principio de adición para dos eventos
Dados dos eventos A y B, este principio es útil si nos interesa calcular la
probabilidad de que ocurra al menos uno de los dos eventos. Para dos eventos
A y B cualesquiera se cumple que:

7.9 Ejercicios resueltos


1. La empresa Cyberweb tiene colaboradores capacitados y no capacitados
en relación con los últimos avances tecnológicos.

Al respecto, el gerente de la compañía realizará una supervisión en el área de


programación para saber si sus cuatro programadores están capacitados o
no en dichos avances. Para eso, el gerente entrevistará aleatoriamente, uno
por uno, a estos programadores. Construya el espacio muestral asociado.

Solución
Sean los eventos:
C = Colaborador está capacitado
N = Colaborador no está capacitado
El diagrama de árbol asociado es:

Primera Segunda Tercera Cuarta


selección selección selección selección

C
C
N
C
C
N
N
C
C
C
N
N
C
N
N

C
C
N
C
C
N
N
N
C
C
N
N
C
N
N

ESTADÍSTICA GENERAL 203


Luego, el espacio muestral asociado es:

2. El jefe de Recursos Humanos de una empresa transnacional conoce las


probabilidades de los eventos A y B, donde: A = Empleado domina las
nuevas técnicas aplicadas al marketing y B = Empleado domina las técnicas
estadísticas. Las probabilidades correspondientes son las siguientes:

Si se selecciona un empleado al azar, se pide:


a) Calcule la probabilidad de que el empleado domine al menos una de las
técnicas.
b) Calcule la probabilidad de que el empleado domine las dos técnicas
simultáneamente.
c) Calcule la probabilidad de que el empleado solo domine las nuevas
técnicas aplicadas al marketing.
d) Calcule la probabilidad de que el empleado solo domine las técnicas
estadísticas.

Solución
Primero se representa el ejemplo mediante un diagrama de Venn. Este
diagrama es útil porque permite calcular probabilidades de una manera
rápida y sencilla, incluso, muchas veces, sin necesidad de utilizar las fórmulas
dadas anteriormente.

En el gráfico se observan cuatro eventos mutuamente excluyentes


claramente definidos:

204 ESTADÍSTICA GENERAL


1. Solo ocurre el evento A (El empleado sólo domina las nuevas técnicas
aplicadas al marketing). Este evento se representa como: (A B c)
2. Solo ocurre el evento B (El empleado sólo domina las técnicas estadísticas).
Este evento se representa como: (B A c)
3. Ocurren los dos eventos simultáneamente (El empleado domina las dos
técnicas simultáneamente). Este evento se representa como: (A B)
4. No ocurren ni A ni B (El empleado no domine las nuevas técnicas aplicadas
al marketing ni las técnicas estadísticas). Este evento se representa como:
(A c B c)

En conclusión, se observa que el espacio muestral es la unión de estos cuatro


eventos. Así:

Ω=(A B c ) U (A B) U (B A c ) U (A c B c)

a) Se pide: P(A U B)
Como (A U B) y (A c B c ) son eventos complementarios, se tiene que:

b) Se pide: (A B)
Utilizando el principio de adición, se tiene:

Donde:

c) Se pide: P(A B c )
Del gráfico, se tiene que:

ESTADÍSTICA GENERAL 205


Como el evento A es la unión de dos eventos mutuamente excluyentes,
entonces se cumple:

Donde:

d) Se pide: P(B A c )
A partir del razonamiento anterior, se tiene que:

7.10 Trabajo colaborativo (para trabajar en clase)


1. El gerente de una empresa recibe semanalmente pedidos de uno de sus
clientes. Se dispone de la siguiente información acerca del tipo de productos
que solicita: el 25% de las ocasiones incluye en su pedido el producto A; el
40% de las veces, el B, y en el 15% de los pedidos se solicitan los dos.
a) Represente mediante un diagrama de Venn los siguientes eventos:
i. Se incluya en el pedido el producto A, pero no se incluya el producto B.
ii. Se incluya solo uno de los dos pedidos.
iii. No se incluya ninguno de los dos pedidos.
b) Calcule la probabilidad de que la próxima semana este cliente solicite:
i. El producto A o el producto B.
ii. El producto A y no el producto B.
2. Un proveedor de productos informáticos ha llevado a cabo un estudio
entre sus clientes acerca de la preferencia sobre tres productos (A, B y
C). Encontró que el 50% prefiere A, el 37% prefiere B y el 30% prefiere C.

206 ESTADÍSTICA GENERAL


Además, el 12% prefiere A y B, el 8% prefiere solo A y C, el 5% prefiere solo
B y C, el 13% prefiere solo C, y el 4% prefiere A, B y C.
a) Defina los eventos correspondientes y represente el problema mediante
un diagrama de Venn.
b) Si se elige al azar un cliente, halle la probabilidad que prefiera los tres
productos, o que prefiera solo A, o que prefiera solo B.
3. En una muestra de 120 productos artesanales hechos en el país se encontró
que el 60% de ellos se exportan a Europa, el 30% son cerámicas y el 20%
son telares y se exportan a Asia. Si un producto artesanal se escoge al azar:
a) Calcule la probabilidad de que sea telar.
b) Calcule la probabilidad de que sea telar y se exporte a Europa.
c) Calcule la probabilidad de que sea cerámica y se exporte a Asia.
4. La probabilidad de que una empresa alemana decida invertir en minería en el
departamento de La Libertad es 0.7, que decida invertir en el departamento
de Áncash es 0.4 y que decida invertir en al menos uno de los departamentos
es 0.8.
a) Calcule la probabilidad de que la empresa decida invertir solo en el
departamento de Áncash.
b) Calcule la probabilidad de que la empresa decida no invertir en ambos
departamentos.
5. El gerente de un canal de televisión contrató a un especialista en investigación
de mercados para conocer la preferencia sobre sus tres programas (A, B
y C) más vistos por las familias televidentes. Para ello, se encuestó a 100
familias y se encontró que 50 de ellas prefieren el programa A, 37 prefieren
el programa B y 30 prefieren el programa C. Además, 12 prefieren los
programas A y B, ocho solo prefieren los programas B y C, y 15 prefieren
solo el programa C. Si una familia encuestada se elige al azar, calcule la
probabilidad de que:
a) Prefiera los tres programas de televisión.
b) Prefiera solo el programa A o solo el programa B.
c) No prefiera al menos uno de los tres programas.

7.11 Trabajo autónomo


1. Establezca la verdad o falsedad de cada uno de los siguientes enunciados:

a) Sean A y B dos eventos mutuamente excluyentes Ω =AUB, entonces


P(A) + P(B) = 1

ESTADÍSTICA GENERAL 207


b) Si P(A) + P(B) = 1, entonces Ω =AUB
c) Si una moneda se lanza seis veces, entonces el espacio muestral tiene
64 elementos.
d) Si una moneda se lanza seis veces, entonces solo en seis de todos los
resultados posibles se muestran dos caras.

2. El jefe de control de calidad de una línea de ensamble clasifica las unidades


terminadas como vendibles (V) o no vendibles (N). Durante el proceso
de control de calidad, el jefe observa los artículos uno a uno hasta que
encuentre dos unidades no vendibles; de ser así, se considera todo el lote
como no vendible. Si en un día cualquiera se ensamblan cinco unidades,
se pide:

a) Construya el diagrama de árbol que corresponde al experimento.


b) Determine el espacio muestral correspondiente.

3. El gerente de un consorcio informático y tecnológico contrató a un


especialista en investigación de mercados para conocer la preferencia de
los empresarios sobre la marca y modelo de las computadoras portátiles.

Modelo
Marca
Netbook (N) Notebook (M) Laptops (L)
Toshiba (T) 50 120 200
Sony (S) 48 132 250
HP (H) 62 118 310

Si se selecciona al azar un empresario, se pide:


a) Calcule la probabilidad de que prefiera la marca Toshiba.
b) Calcule la probabilidad de que utilice una notebook.
c) Calcule la probabilidad de que utilice una netbook de la marca Sony.
d) Calcule la probabilidad de que utilice una laptop de la marca HP.

4. La probabilidad de que el chip de un circuito integrado tenga un grabado


defectuoso es 0.12, la probabilidad de que tenga un defecto de cuarteadura
es 0.29, y la probabilidad de que tenga ambos defectos es 0.07.

a) Defina los eventos correspondientes y represente el problema mediante


un diagrama de Venn.

208 ESTADÍSTICA GENERAL


b) Calcule la probabilidad de que un chip de fabricación reciente tenga un
defecto de grabado o de cuarteadura.
c) Calcule la probabilidad de que un chip de fabricación reciente no tenga
ninguno de tales defectos.
5. En una empresa, de los 12 colaboradores del área de Recursos Humanos,
hay ocho que asistirán a una capacitación que se realizará fuera del país, y
de los 10 colaboradores del área de Contabilidad, seis asistirán a la misma
capacitación. Si de esta empresa se elige al azar un colaborador, responda y
justifique las siguientes preguntas:

a) El porcentaje de colaboradores que asistirán a la capacitación supera el


50%.
b) El porcentaje de colaboradores del área de Recursos Humanos que
asistirán a la capacitación no supera el porcentaje de colaboradores del
área de Contabilidad que asistirán a dicha capacitación.

ESTADÍSTICA GENERAL 209


Lección 8

Probabilidad condicional
Una empresa cuenta con clientes nacionales (L) y extranjeros (E) que compran
mercadería a poca (A) y gran (B) escala.

El gerente de la empresa seleccionará aleatoriamente a uno de sus clientes para


hacerle preguntas sobre el servicio que ha recibido, razón por la cual desea
conocer qué tan probable es seleccionar a un cliente extranjero.

Si cada cliente tiene la misma probabilidad de ser elegido, dicha probabilidad se


calcula de la siguiente manera:

P(Cliente sea extranjero)

Ahora, suponga que el gerente de la empresa seleccionó a uno de sus clientes, y


resultó ser un cliente que compra mercadería a gran escala. ¿Qué tan probable
es de que sea un cliente extranjero? Si cada cliente tiene la misma probabilidad
de ser elegido, dicha probabilidad se calcula de la siguiente manera:

P(Cliente sea extranjero si se sabe que compra a gran escala)

Observe que en ambos casos se calcula la probabilidad de que el cliente sea


extranjero, con la diferencia de que en el segundo caso existe una condición
adicional, la cual está dada por el conocimiento de que el cliente compra a gran
escala.

Como en el caso anterior, en muchas ocasiones se pide calcular la probabilidad


de un evento a partir de alguna condición adicional al experimento. Esto lleva a
la siguiente definición:

8.1 Definición
Para dos eventos cualesquiera A y B, con P(B) > 0 la probabilidad condicional
del evento A dado que ocurrió el evento B está definida por:

210 ESTADÍSTICA GENERAL


Ejemplo 8.1
En el último semestre, el gerente de una empresa turística y hotelera registró que
el 35% del personal tiene una especialidad en Gerencia de Proyectos Turísticos y
Hoteleros, el 40% del personal tiene una especialidad en Diseño de Planta y del
Equipamiento Turístico, y el 45% del personal no tiene estas especialidades. Si
un día cualquiera el gerente selecciona aleatoriamente a un empleado de dicho
personal, se pide:

a) Defina los eventos correspondientes y represente el problema mediante un


diagrama de Venn.
b) Calcule la probabilidad de que tenga ambas especialidades.
c) Calcule la probabilidad de que tenga la especialidad en Gerencia de
Proyectos Turísticos y Hoteleros, si se sabe que tiene la especialidad en
Diseño de Planta y del Equipamiento Turístico.
d) Calcule la probabilidad de que tenga la especialidad en Diseño de Planta y
del Equipamiento Turístico, si se sabe que tiene la especialidad en Gerencia
de Proyectos Turísticos y Hoteleros.

Solución
a) Sean los eventos:
I = Empleado tiene la especialidad en Gerencia de Proyectos Turísticos y
Hoteleros P(I) = 0.35
M = Empleado tiene la especialidad en Diseño de Planta y del Equipamiento
Turístico P(M) = 0.40
Como información adicional se tiene:

El diagrama de Venn que corresponde, incluyendo algunos cálculos


posteriores, es:

ESTADÍSTICA GENERAL 211


b) Se pide: P(I M) Del gráfico se tiene que:
(0.35 - x) + x + (0.4 - x) = 0.55

x = 0.2

Luego: P(I M)=0.2

O utilizando el principio de adición de dos eventos, se tiene que:

c) Esta es una probabilidad condicional pues se sabe que el empleado tiene


la especialidad en Diseño de Planta y del Equipamiento Turístico (evento
condicional). Luego, a partir del conocimiento de este evento, se pide calcular
la probabilidad de que tenga la especialidad en Gerencia de Proyectos
Turísticos y Hoteleros.
A partir de la fórmula de la probabilidad condicional, se tiene que:

Interpretación
El 50% de los empleados que tienen la especialidad en Diseño de Planta y
del Equipamiento Turístico también tienen la especialidad en Gerencia de
Proyectos Turísticos y Hoteleros.

d) Como en el problema anterior, se tiene una probabilidad condicional. En


este caso, se sabe que el empleado tiene la especialidad en Gerencia de
Proyectos Turísticos y Hoteleros (evento condicional). Luego, a partir del
conocimiento de este evento, se pide calcular la probabilidad de que también
tenga la especialidad en Diseño de Planta y del Equipamiento Turístico.
A partir de la fórmula de la probabilidad condicional, se tiene que:

212 ESTADÍSTICA GENERAL


Interpretación
Aproximadamente, el 57.14% de los empleados que tienen la especialidad en
Gerencia de Proyectos Turísticos y Hoteleros también tienen la especialidad en
Diseño de Planta y del Equipamiento Turístico.

Observación
El símbolo ≈ quiere decir que el resultado es aproximado.

8.2 Principio de multiplicación para dos eventos


Dados dos eventos (A y B), este principio es útil si es de interés calcular la
probabilidad de que ocurran los dos eventos de manera simultánea. Para dos
eventos A y B cualesquiera se cumple que:

8.3 Principio de multiplicación para n eventos


Dados n eventos A1, A2 ..., An, este principio es útil si es de interés calcular la
probabilidad de que ocurran los n eventos de manera simultánea. Para n eventos,
A1, A2 ..., An, cualesquiera, se cumple que:

Ejemplo 8.2
Una junta de directorio está formada por dos economistas, un administrador y
tres ingenieros. Si se elige tres directivos al azar, calcule la probabilidad de que
el primero sea economista, el segundo ingeniero y el tercero administrador.

ESTADÍSTICA GENERAL 213


Solución
Sean los eventos:
A1 = Primer directivo seleccionado es economista
A2 = Segundo directivo seleccionado es ingeniero
A3 = Tercer directivo seleccionado es administrador
Se pide calcular la probabilidad de que ocurran los tres eventos simultáneamente
. Para esto se utiliza el principio de multiplicación:

Donde:
• P(A1) se obtiene a partir de la definición clásica de probabilidad y del hecho
de que en la primera selección se tienen dos directivos que son economistas
de un total de seis.

• P(A2 /A1) se obtiene a partir de la definición clásica de probabilidad y del


hecho de que en la segunda selección se tienen tres directivos que son
ingenieros de un total de cinco (tener en cuenta que en la segunda selección
hay un directivo menos).

• P(A3 /A1 A2 ) se obtiene a partir de la definición clásica de probabilidad y del


hecho de que en la tercera selección se tiene un directivo que es economista
de un total de cuatro (tener en cuenta que en la tercera selección hay dos
directivos menos).

De los resultados anteriores se obtiene:

214 ESTADÍSTICA GENERAL


8.4 Ejercicios resueltos
1. En la siguiente tabla se muestra a 1 000 empleados clasificados de acuerdo
con los puntajes que obtuvieron en el examen final de una capacitación y el
área en donde laboran:

Área
Puntaje Producción Recursos Finanzas Total
(N) Humanos (H) (F)
Alto (A) 25 75 300 400
Medio (M) 75 165 150 390
Bajo (B) 100 60 50 210
Total 200 300 500 1 000

Si se elige un empleado al azar, calcule las siguientes probabilidades:

a) De que haya obtenido un puntaje medio en el examen. De los 1 000


empleados, 390 de ellos tuvieron un puntaje medio; entonces, la
probabilidad se calcula de la siguiente manera:

b) De que haya obtenido un puntaje alto o labore en el área de Recursos


Humanos.
Utilizando el principio de adición de dos eventos:

Luego,

c) Si se sabe que labora en el área de producción, ¿cuál es la probabilidad


de que haya obtenido un puntaje medio?

ESTADÍSTICA GENERAL 215


Primera forma: Directamente de la tabla
De un total de 200 empleados que laboran en el área de producción, 75
de ellos obtuvieron un puntaje medio en el examen final; entonces, la
probabilidad se calcula de la siguiente manera:

Segunda forma: Con la fórmula

En ambos casos se llega al mismo resultado.


d) Si se sabe que labora en el área de producción, ¿cuál es la probabilidad
de que no haya obtenido un puntaje bajo?
Se pide:

Donde:

e) Si se sabe que obtuvo un puntaje medio o bajo, ¿cuál es la probabilidad


de que no labore en el área de finanzas?
Se pide:

Donde:

216 ESTADÍSTICA GENERAL


Observación
Los eventos M y B son mutuamente excluyentes.

2. Un funcionario de la unidad de banca de inversión Macroinvest reportó


que el 75% de los peruanos invierte en equipo industrial, el 45% de ellos
en materia prima, y el 40% invierte en materia prima si invierte en equipo
industrial. Si se selecciona a un peruano al azar y todos tienen la misma
probabilidad de ser elegidos, se pide:
a) Calcule la probabilidad de que un peruano invierta en equipo industrial
y en materia prima.
b) Calcule la probabilidad de que un peruano invierta en equipo industrial
si se sabe que invierte en materia prima.
Solución
Sean los eventos:
I = Peruano que invierte en equipo industrial P(I) = 0.75
M = Peruano que invierte en materia prima P(M) = 0.45
También:
P(M/I)= 0.40

Se pide la probabilidad de que ocurran los eventos I y M de manera simultánea.


Para esto se utiliza el principio de multiplicación. Así:

Esta es una probabilidad condicional y se calcula de la siguiente manera:

Aproximadamente, el 66.67% de los peruanos que invierten en materia


prima también invierten en equipo industrial.

ESTADÍSTICA GENERAL 217


8.5 Trabajo colaborativo (para trabajar en clase)
1. Establezca la verdad o falsedad de cada uno de los siguientes enunciados:
a) Sean A y B dos eventos mutuamente excluyentes y Ω =A⋃B , entonces P(A/ B) =
P(A)
b) Sean A y B dos eventos mutuamente excluyentes y Ω =A⋃B, entonces
P(A/ Ω) = 1
c) Sean A y B dos eventos definidos a partir del mismo espacio muestral,
entonces se cumple que P(A/ B) = P(B/A)
2. El personal de una empresa de telecomunicaciones maneja tres estaciones
de relevo similares en diferentes distritos de la ciudad de Lima. Durante
un periodo de seis meses se registró el número de desperfectos
reportados por cada estación y sus causas, las cuales son mostradas en la
siguiente tabla:

Estaciones de
Causas de desperfectos relevo
A B C
Problemas de suministro de energía 1 2 1
Problemas en la computadora central 3 4 2
Fallas en el equipo electrónico 4 5 2
Fallas por errores humanos 7 7 5

Si se elige una estación de relevo al azar, se pide:


a) Calcule la probabilidad de que la causa del desperfecto haya sido
ocasionada por problemas de suministro de energía.
b) Calcule la probabilidad de que la causa del desperfecto haya sido
ocasionada por fallas en el equipo electrónico o en la estación A.
c) Calcule la probabilidad de que la causa del desperfecto haya sido
ocasionada por errores humanos si se sabe que no se ha producido en
la estación C.
d) Si el desperfecto se produjo en la estación B, ¿cuál es la probabilidad de
que la causa del desperfecto haya sido ocasionada por problemas en la
computadora central?
3. En una encuesta realizada a colaboradores según su modalidad de
contrato, estos indicaron el motivo principal de ingreso a la empresa donde
laboran. A continuación se presentan los resultados que se muestran en la
siguiente tabla:

218 ESTADÍSTICA GENERAL


Motivo principal de ingreso a la empresa
Modalidad
Prestigio Salario Otros Total
Tiempo completo 421 393 76 890
Tiempo parcial 400 593 46 1 039
Total 821 986 122 1 929

Si se elige al azar a uno de los colaboradores que participó en la encuesta,


se pide:

a) La probabilidad de que su modalidad de contrato sea a tiempo completo.


b) La probabilidad de que el motivo principal de ingreso haya sido el
prestigio.
c) ¿Cuál es la probabilidad de que su modalidad de contrato sea a tiempo
parcial y que el motivo principal de ingreso haya sido el salario?
d) Si se sabe que el colaborador trabaja a tiempo completo, ¿cuál es la
probabilidad de que el motivo principal de ingreso haya sido el prestigio?
e) Si se sabe que el motivo principal ha sido el salario, ¿cuál es la probabilidad
de que su modalidad de contrato sea a tiempo parcial?
4. En una empresa de producción, se sabe que el 85% de los artículos producidos
son exportados al extranjero, el 5% de los artículos producidos son devueltos
porque presentan algún defecto, y el 2% de los artículos producidos que son
exportados al extranjero son devueltos porque presentan algún defecto.
Se pide:

a) La probabilidad de que se haya exportado al extranjero si ha sido


devuelto.
b) La probabilidad de que no sea devuelto si no fue exportado al extranjero.

5. En una empresa, de los 12 colaboradores del área de Recursos Humanos,


hay seis que asistirán a una capacitación, y de los 10 colaboradores del área
de Contabilidad, cinco asistirán a la misma capacitación. Si de esta empresa
se elige al azar a tres colaboradores, se pide:

a) Calcule la probabilidad de que dos de ellos sean de la misma especialidad.


b) Calcule la probabilidad de que solo uno de los tres asista a la capacitación.

ESTADÍSTICA GENERAL 219


8.6 Trabajo autónomo
1. Establezca la verdad o falsedad de cada uno de los siguientes enunciados:
a) Sean A y B dos eventos definidos a partir del mismo espacio muestral,
entonces se cumple que P(A/Ω) = P(A)
b) Sean A y B dos eventos definidos a partir del mismo espacio muestral,
entonces se cumple que P(A/ B) = 1 - P(Ac/B).
c) Sean A y B dos eventos definidos a partir del mismo espacio muestral,
entonces se cumple que P(A/ B) = 1 - P(A/Bc).
2. En un intento por burlar la vigilancia en la aduana, un pasajero guarda
en su equipaje 10 CD en blanco, de los cuales 8 CD contienen programas
informáticos grabados de forma ilegal. Si el inspector de la aduana selecciona
al azar tres de los CD para verificar su contenido, ¿cuál es la probabilidad de
arrestar al pasajero por posesión ilegal de programas informáticos?
3. Un funcionario del Ministerio de Energía y Minas reportó que el 70% de los
cilindros importados de combustible son de Estados Unidos, el 50% de los
cilindros son de Brasil y el 35% de los cilindros son de ambos países. Si se
elige aleatoriamente un cilindro de combustible, se pide:
a) Defina los eventos correspondientes y represente el problema mediante
un diagrama de Venn.
b) Calcule la probabilidad de que el cilindro de combustible importado sea
al menos de uno de los dos países.
c) Calcule la probabilidad de que el cilindro de combustible importado sea
de Brasil si se sabe que se importó de Estados Unidos.
d) Calcule la probabilidad de que el cilindro de combustible importado sea
de Estados Unidos si se sabe que se importó de Brasil.
4. La siguiente tabla presenta la distribución de un grupo de taxistas de
acuerdo con su lugar de trabajo, la posesión de gas en su auto y el estado
del recibo de su cuota inicial.

Lima (L) Callao (C)


Posesión GNV Cuota inicial Cuota inicial Cuota inicial Cuota incial sin
cancelada (I) sin cancelar (S) cancelada (I) cancelar (S)
Con GNV (G) 85 75 70 120
Con GLP (H) 140 100 130 80

Si se elige a un taxista de este grupo, y bajo el supuesto de que todos tienen


la misma probabilidad de ser elegidos, se pide:

220 ESTADÍSTICA GENERAL


a) Calcule la probabilidad de que el taxista trabaje en el Callao.
b) Calcule la probabilidad de que el taxista utilice GNV.
c) Calcule la probabilidad de que el taxista tenga su cuota inicial cancelada.
d) Si canceló su cuota inicial, calcule la probabilidad de que el taxista
trabaje en Lima.
e) Si trabaja en el Callao, calcule la probabilidad de que el taxista no haya
cancelado su cuota inicial.
5. Pensamiento crítico
Se sabe que, en una cierta región del país, el 15% de la población tiene
estudios superiores, el 40% tiene estudios secundarios, el 35% tiene estudios
primarios y el 10% no tiene estudios. De los que tienen estudios superiores,
el 10% está sin trabajo, el 40% está subempleado y los restantes tienen
empleo adecuado. De los que tienen estudios secundarios, el 35% no tiene
empleo y la relación entre los que están subempleados y los que tienen
empleo adecuado es de 10:3. De los que tienen estudios primarios, el 45%
no tiene empleo, el 52% está subempleado y los restantes tienen empleo
adecuado. De los que no tienen estudios, el 48% no tiene empleo, el 50%
está subempleado y los restantes tienen empleo adecuado. Si se elige una
persona al azar:
a) Calcule la probabilidad de que no tenga empleo.
b) Calcule la probabilidad de que tenga empleo adecuado si se sabe que
tiene estudios superiores.
c) Calcule la probabilidad de que tenga por lo menos estudios secundarios
si se sabe que está subempleada.

ESTADÍSTICA GENERAL 221


Lección 9
Eventos independientes
Sea el experimento que consiste en lanzar una moneda y un dado al mismo
tiempo, es claro que el resultado obtenido en el lanzamiento de la moneda
(evento uno) no influye en nada en el resultado obtenido en el lanzamiento del
dado (evento dos) y viceversa. Cuando esto ocurre, se dice que los eventos son
independientes.
Luego, como la ocurrencia de uno de los eventos no afecta en nada a la ocurrencia
del otro, entonces la probabilidad de ocurrencia de cualquiera de estos eventos
tampoco se ve afectada. Esto quiere decir que para dos eventos independientes
se cumple que la probabilidad de ocurrencia de un evento condicionada a la
ocurrencia de otro es la misma. Esto da origen a la siguiente definición:

9.1 Definición
Se dice que dos eventos (A y B) son independientes si la ocurrencia de uno no
afecta en nada a la probabilidad de ocurrencia del otro. Es decir:

A partir de la definición de probabilidad condicional para dos eventos cualquiera


A y B, a saber:

y la definición de eventos independientes, se cumple:

Observación
Este resultado se puede generalizar para n eventos.

222 ESTADÍSTICA GENERAL


Teorema 1
Si A y B son dos eventos independientes, entonces se cumple que:
a) Los eventos A y Bc también son independientes.
b) Los eventos B y Ac también son independientes.
c) Los eventos Ac y Bc también son independientes.

Prueba
La demostración de este teorema es una tarea sencilla. A continuación se
demostrará la parte (b), dejando las partes (a) y (c) para el lector.

Por el principio de multiplicación:


Por complemento de un evento:
Por independencia entre A y B:
Por complemento de un evento:

Ejemplo 9.1
Tres compañías de seguros de vida (Vida, Futuro Seguro y Horizonte) ofrecen
un seguro de viaje a todas las personas interesadas en adquirir un seguro
de este tipo. El año pasado, los porcentajes de los seguros de vida que se
vendieron en las compañías Vida, Futuro Seguro y Horizonte fueron del 40%,
35% y 45%, respectivamente. Si un vendedor de otro tipo de seguro selecciona
aleatoriamente un cliente, de los que adquirieron un seguro el año pasado, de
cada una de las compañías para realizarles una entrevista, calcule la probabilidad
de que solo uno de los clientes haya adquirido un seguro de vida.

(Asuma independencia entre los clientes de las compañías).

Solución
Primero se definen los eventos con sus respectivas probabilidades.
Sean los eventos:
A = Cliente de la compañía Vida adquirió un seguro de vida P(A) = 0.40
B = Cliente de la compañía Futuro Seguro adquirió un seguro de vida
P(B) = 0.35
C = Cliente de la compañía Horizonte adquirió un seguro de vida P(C) = 0.45
D = Solo un cliente adquirió un seguro de vida
Además, tener en cuenta que:

ESTADÍSTICA GENERAL 223


El diagrama de Venn asociado es:
Ω (1)

A (0.40) B (0.35)

A ∩ BC ∩ CC B ∩ AC ∩ CC

C ∩ AC ∩ BC
C (0.45)

Se pide: P(D)
Del diagrama:

Como D es la unión de tres eventos mutuamente excluyentes, entonces se


cumple que:

Como los eventos A, B y C son independientes, se tiene:

Si el vendedor realiza la selección, bajo las mismas condiciones, por ejemplo


unas 100 veces; aproximadamente, en 43 de estas, solo uno de los tres clientes
habrá adquirido un seguro de vida.

9.2 Ejercicios resueltos


1. Con la finalidad de observar la calidad de dos de sus productos terminados,
el jefe de control de calidad de una empresa selecciona aleatoriamente
una unidad de cada uno de estos. Si los porcentajes de las unidades que
satisfacen el control de calidad para los productos A y B son del 97.5% y el
98.5%, respectivamente, calcule la probabilidad de que, al menos, una de las
unidades satisfaga el control de calidad.

224 ESTADÍSTICA GENERAL


Solución
Sean los eventos:

A = Unidad del producto A satisface el control de calidad P(A) = 0.975


B = Unidad del producto B satisface el control de calidad P(B) = 0.985
S = Al menos una de las unidades satisface el control de calidad

El diagrama de Venn asociado es:

A (0.975) B (0.985) Ω (1)

A ∩ BC A∩B B ∩ AC

AC ∩ BC

Se pide:

Como son eventos complementarios, se tiene que:

Aproximadamente, en el 99.96% de las veces en que se repita este


experimento, el número de unidades que satisfaga el control de calidad
será de al menos uno.
2. Suponga que se lanzan dos dados, de modo que cada uno de los 36 posibles
resultados tiene la misma probabilidad de ocurrencia. Dados los siguientes
eventos:
A = Primer lanzamiento es igual a cuatro.
B = La suma de los dos lanzamientos es igual a nueve.

ESTADÍSTICA GENERAL 225


C = La suma de los dos lanzamientos es igual a siete.
¿A y B son independientes? Justifique.
¿A y C son independientes? Justifique.

Solución
Tener en cuenta que dos eventos (A y B) son independientes si se cumple
la siguiente igualdad:

Los 36 posibles resultados en el lanzamiento de dos dados se muestran a


continuación:

Segundo dado
Resultado 1 2 3 4 5 6
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

De donde:

También:

a) Se observa que:

226 ESTADÍSTICA GENERAL


Por lo tanto, A y B no son independientes.
b) Se observa que:

Por lo tanto, A y C son independientes.

9.3 Trabajo colaborativo (para trabajar en clase)


1. Establezca la verdad o falsedad de cada uno de los siguientes enunciados:

a) Si A, B y C son tres eventos mutuamente excluyentes y


entonces
b) Si A y B son dos eventos independientes, entonces
c) Si A y B son dos eventos independientes, entonces
d) Si A y B son dos eventos independientes, entonces

2. Si A y B son eventos independientes y:

P(A) = 0.875 y P(B) = 0.825


Calcule:

3. Omega Constructores se ha presentado a una licitación para participar en


tres importantes proyectos de construcción de carreteras (A, B y C) en
el interior del país; estos se darán a comienzos de mitad de año. En caso
de que reciba cualquiera de los proyectos, Omega tiene que abastecer sus
almacenes de materiales de construcción y constituir su fuerza de trabajo
de manera inmediata. A causa de la falta de planificación en tiempos
pasados, Omega ha perdido considerables cantidades de tiempo y dinero;
por lo que determinar las probabilidades de participación en los proyectos

ESTADÍSTICA GENERAL 227


mencionados es importante para la preparación adecuada. El presidente de
Omega estima que la probabilidad de ganar el proyecto A es 0.75, de ganar
el proyecto B es 0.7 y de ganar el proyecto C es 0.5. Calcule la probabilidad
de que la empresa gane la licitación de:
a) Un proyecto.
b) Dos proyectos.
c) Todos los proyectos.
(Asuma independencia entre los tres proyectos)
4. En la última producción de un dispositivo para computadoras se encontraron
dos tipos de defectos. El 10% de los dispositivos presentó el primer
tipo de defecto y el 5% de los dispositivos presentó el segundo tipo de
defecto. Si un dispositivo de este tipo se escoge aleatoriamente, calcule la
probabilidad de que:
a) No presente ambos tipos de defectos.
b) Presente algún tipo de defecto.
c) Presente solo un tipo de defecto.
(Asuma independencia entre los tipos de defectos)
5. Una empresa de confecciones cuenta con tres operarios para confeccionar
los modelos exclusivos. La probabilidad de que el operario A confeccione una
prenda defectuosa es 0.10, la probabilidad de que el operario B confeccione
una prenda defectuosa es 0.08, y la probabilidad de que el operario C
confeccione una prenda defectuosa es 0.09. El gerente de marketing ofrece
enviar una muestra de dos prendas del último modelo exclusivo a uno de
sus principales clientes, por lo cual el gerente le pide a cada uno de los
operarios que confeccione una prenda.
a) Calcule la probabilidad de que se pueda cumplir con lo ofrecido por el
gerente de marketing.
b) Calcule la probabilidad de que, por lo menos, una de las prendas sea
defectuosa.
(Asuma independencia con respecto a la confección de prendas entre
los tres operarios)

228 ESTADÍSTICA GENERAL


9.4 Trabajo autónomo
1. Establezca la verdad o falsedad de cada uno de los siguientes enunciados:
a) Si A, B y C son tres eventos independientes, entonces también son
mutuamente excluyentes.
b) Si A, B y C son tres eventos independientes, entonces también lo son
sus complementos.
c) Si A y B son dos eventos independientes, entonces
d) Si A y B son dos eventos independientes, entonces

2. Si A, B y C son tres eventos independientes y:

Calcule:

3. En una sucursal del banco Bank, ante la propagación de billetes falsos, cada
vez más difíciles de identificar, se ha decidido adquirir dos detectores de
billetes falsos de alta generación cuyas probabilidades de eficiencia son
0.95 y 0.97. Para comprobar dicha eficiencia, se ingresa un billete falso por
ambos detectores:
a) ¿Cuál es la probabilidad de que solo uno de los detectores lo identifique?
b) ¿Cuál es la probabilidad de que ambos detectores lo identifiquen?
c) ¿Cuál es la probabilidad de que ninguno de los detectores lo identifique?
4. Una empresa inmobiliaria desea construir tres edificios idénticos (A, B
y C) en un tiempo determinado; por lo tanto, el gerente de la compañía
ha dispuesto entregar la construcción de los mismos a tres empresas
constructoras (E1, E2 y E3), cuyas probabilidades de terminar una obra en
el tiempo establecido son: 0.95 para la empresa A, 0.98 para la empresa
B y 0.97 para la empresa C. Si la construcción de los edificios A, B y C es
entregada a las constructoras E1, E2 y E3, respectivamente, calcule:
a) La probabilidad de que a lo más se concluyan dos edificios en el tiempo
determinado.
b) La probabilidad de que ningún edificio se termine en el tiempo
determinado.

ESTADÍSTICA GENERAL 229


c) La probabilidad de que los tres edificios se terminen en el tiempo
determinado.
(Asuma que las condiciones de trabajo serán las mismas y que las
constructoras trabajan de manera independiente)
5. Un tirador participa en un juego que consiste en realizar tiros al blanco
hasta que acierte uno. Si la probabilidad de que un tirador acierte al blanco
en cualquier disparo es igual a 0.75, calcule la probabilidad de que el tirador
termine el juego.
a) ¿Cuántos resultados posibles se tienen en este juego?
b) ¿Qué tiene que suponer para calcular la probabilidad pedida?
c) Si los disparos no fueran independientes, ¿podría calcular la probabilidad
pedida? ¿Por qué?

230 ESTADÍSTICA GENERAL


Lección 10

Probabilidad total y Bayes


10.1 Probabilidad total
En una empresa, un artículo puede ser producido por cualquiera de tres máquinas
A, B y C. Los porcentajes de artículos producidos por A, B y C son 50%, 25% y
25%, respectivamente. Por otro lado, según el último informe, las máquinas A,
B y C han tenido altos porcentajes de artículos defectuosos: 35%, 50% y 40%,
respectivamente.

Si el jefe de control de calidad selecciona un artículo al azar, calcule la probabilidad


de que sea defectuoso.
Para calcular esta probabilidad, se definen los siguientes eventos:

A1 = El artículo es producido por la máquina A


A2 = El artículo es producido por la máquina B
A3 = El artículo es producido por la máquina C
D = El artículo es defectuoso

Una representación gráfica del problema se muestra en la siguiente figura:

A1 A2 A3
Ω (100%)
D

35% (50%) 50% (25%) 40% (25%)

Como un artículo solo puede ser producido por una de las máquinas, entonces
se concluye que los eventos A1, A2 y A3 son mutuamente excluyentes.
Por otro lado, si se expresan los porcentajes en términos probabilísticos, entonces
se tiene que la probabilidad de seleccionar un artículo defectuoso producido por
A es , la probabilidad de seleccionar un artículo defectuoso
producido por B es , y la probabilidad de seleccionar un
artículo defectuoso producido por C es .

ESTADÍSTICA GENERAL 231


Luego, como A1, A2 y A3 son eventos mutuamente excluyentes, entonces
, y y también son mutuamente excluyentes y, además, la unión
de estos tres eventos es D. Por lo que, a partir de la definición de probabilidad
de la unión de eventos mutuamente excluyentes, se tiene que:

Y a partir del principio de multiplicación, esta probabilidad se puede calcular de


la siguiente manera:

Entonces, la probabilidad de que el artículo seleccionado sea defectuoso es


0.40. Esto quiere decir que el 40% de la producción total de los artículos es
defectuoso.

El cálculo de esta probabilidad se puede generalizar para más de tres eventos,


lo cual conduce a la siguiente definición:

Teorema 2: Teorema de la probabilidad total


Sean A1, A2,... An una colección de eventos mutuamente excluyentes
con probabilidades conocidas y cuya unión es el espacio muestral,
es decir: . Sea A un evento cualquiera que satisface:
con probabilidades condicionales conocidas
entonces, la probabilidad del evento A se calcula de la siguiente
manera:

Esta probabilidad es conocida como la probabilidad total del evento A.

232 ESTADÍSTICA GENERAL


10.2 Teorema de Bayes
Ahora, si el jefe de control de calidad selecciona un artículo defectuoso al azar,
calcule la probabilidad de que haya sido producido por la máquina B.
En este problema se tiene que calcular la probabilidad de que el artículo haya
sido producido por la máquina B condicionada al evento: artículo producido es
defectuoso; es decir, se pide:

Entonces, la probabilidad de que un artículo sea producido por la máquina B si


se sabe que es defectuoso es 0.3125. Esto quiere decir que el 31.25% de todos
los artículos defectuosos ha sido producido por la máquina B.
Este problema conduce a la siguiente definición:

Teorema 3: Teorema de Bayes


Sean A, A1, A2,…, An una colección de eventos que satisfacen todas las condiciones
del teorema anterior. Ahora, suponga que es de interés calcular la probabilidad
de que ocurra el evento Ai dado que ocurrió el evento A. Entonces se cumple
que:

Observación
Para calcular probabilidades utilizando los teoremas de la
probabilidad total y de Bayes, se pueden emplear los diagramas de
árbol. Esta representación gráfica permite calcular probabilidades
de una manera práctica y rápida, tal como se verá en los siguientes
ejercicios resueltos.

ESTADÍSTICA GENERAL 233


10.3 Ejercicios resueltos
1. AGROIND S.A. es una empresa agroindustrial, líder en la exportación de
espárragos a nivel mundial. Esta compañía exporta dos tipos de espárragos:
el espárrago blanco y el espárrago verde. Estos se venden en cajas que
contienen 10 atados de medio kilo cada uno. De acuerdo con la experiencia,
se sabe que el 2% de las cajas que contienen espárrago blanco es desechado
al llegar a su destino, al igual que el 4% de las cajas que contienen espárrago
verde. Si un embarque acaba de llegar a su destino con un 65% de cajas
de espárrago verde y un 35% de cajas de espárrago blanco, y una caja
es seleccionada aleatoriamente por el encargado de control de calidad, se
pide:
a) Calcule la probabilidad de que la caja seleccionada no sea desechada.
b) Si la caja seleccionada no es desechada, calcule la probabilidad de que
la caja contenga espárrago blanco.
c) Si la caja seleccionada es desechada, calcule la probabilidad de que la
caja contenga espárrago verde.
Solución
Sean los eventos:
A = Empresa exporta espárrago verde P(A) = 0.65
B = Empresa exporta espárrago blanco P(B) = 0.35
D = Caja es desechada
Además, del enunciado se tienen las siguientes probabilidades condicionales:
P(D/A) = 0.04
P(D/B) = 0.02
Ahora, toda esta información se muestra en el siguiente diagrama de árbol:

D
0.04
A
0.96
5 DC
0.6
Tipo de
espárrago
0.3 D
5
0.02
B
0.98
DC

234 ESTADÍSTICA GENERAL


En el gráfico se observa que las probabilidades que corresponden a las
primeras ramas son las probabilidades de los eventos A y B; es decir,
son probabilidades simples; mientras que las probabilidades de las
segundas ramas son probabilidades condicionales. Esta es una de las
maneras de representar problemas de este tipo.
a) Para calcular esta probabilidad se utiliza el teorema de la probabilidad
total. Así:

Interpretación
Si la llegada de un embarque se repite con las mismas características un
número grande de veces, en el 96.7% de las veces la caja seleccionada no
será desechada.

b) Para calcular esta probabilidad condicional se utiliza el teorema de


Bayes. Así:

Interpretación
Si la llegada de un embarque se repite con las mismas características un
número grande de veces y la caja no se desecha, entonces, aproximadamente
en el 35.47% de las veces la caja contendrá espárrago blanco.

c) Para calcular esta probabilidad condicional se utiliza el teorema de


Bayes. Así:

ESTADÍSTICA GENERAL 235


Interpretación
Si la llegada de un embarque se repite con las mismas características un
número grande de veces y la caja se desecha, entonces, aproximadamente
en el 78.79% de las veces la caja contendrá espárrago verde.

2. El administrador de una estación de servicio de combustible sabe que los


porcentajes de los clientes que consumen combustible de 98 y 95 octanos
son 35 y 40, respectivamente, mientras que el resto consume otro octanaje.
Además, sabe que los porcentajes de los clientes que utilizan tarjeta de
crédito son 85, 65 y 20 si consumen combustible de 98, 95 u otro octanaje,
respectivamente. Si en un día cualquiera, un cliente llega a la estación de
servicio, se pide:

a) Calcule la probabilidad de que el cliente consuma combustible de 98


octanos y utilice tarjeta de crédito.
b) Calcule la probabilidad de que el cliente utilice tarjeta de crédito.
c) Si el cliente utiliza tarjeta de crédito, calcule la probabilidad de que haya
consumido combustible de 95 octanos.
d) Si el 30% de los clientes que consumen combustible de 98 octanos y
utilizan tarjeta de crédito llenan su tanque, calcule la probabilidad de
que un cliente que consume combustible de 98 octanos y utiliza tarjeta
de crédito no llene su tanque.
Solución
Sean los eventos:
A = Cliente consume combustible de 98 P(A) = 0.35
B = Cliente consume combustible de 95 P(B) = 0.40
C = Cliente consume otro combustible P(C) = 0.25
D = Cliente utiliza tarjeta de crédito
Además, del enunciado se tienen las siguientes probabilidades condicionales:
P(D/A) = 0.85
P(D/B) = 0.65
P(D/C) = 0.20
Ahora, toda esta información se muestra en el siguiente diagrama de árbol:

236 ESTADÍSTICA GENERAL


D
A 0.85
0.1
5 DC
5
0.3
5 D
Tipo de
combustible 0.40 B 0.6
0.35
consumido DC
0.
25
D
C 0.20
0.8
0 DC

a) Para calcular esta probabilidad se utiliza el principio de multiplicación.


Así:

De manera general, estas probabilidades se calculan al multiplicar las


probabilidades de las ramas correspondientes.

Interpretación
De todos los clientes que llegan a la estación de servicio, el 29.75% de ellos
consume combustible de 98 octanos y paga con tarjeta de crédito.
b) Para calcular esta probabilidad se utiliza el teorema de la probabilidad
total. Así:

Interpretación
De todos los clientes que llegan a la estación de servicio, el 60.75% de ellos
paga con tarjeta de crédito.
c) Para calcular esta probabilidad condicional se utiliza el teorema de Bayes.
Así:

ESTADÍSTICA GENERAL 237


Interpretación
De los clientes que pagan con tarjeta de crédito, el 42.80% de ellos consume
combustible de 95 octanos.
d) Para responder a esta pregunta se define el siguiente evento:
E = Cliente llena su tanque
El diagrama de árbol correspondiente es:

Para calcular esta probabilidad se utiliza el principio de multiplicación. Así:

Interpretación
De todos los clientes que llegan a la estación de servicio, el 20.83% de ellos
consume combustible de 98 octanos, paga con tarjeta de crédito y no llena
su tanque.

238 ESTADÍSTICA GENERAL


10.4 Trabajo colaborativo (para trabajar en clase)
1. Establezca la verdad o falsedad de cada uno de los siguientes enunciados:
a) Si A, B y C son tres eventos mutuamente excluyentes tal que
Sea D un evento que se define de la siguiente manera:

entonces, por el teorema de la probabilidad total se tiene que:

b) Si A1 y A2 son dos eventos mutuamente excluyentes tal que


Sea D un evento que se define de la siguiente manera:

entonces se puede afirmar:

c) En un diagrama de árbol, la suma de las probabilidades de las ramas que


parten de un mismo punto es, como máximo, uno.
2. Si A y B son dos eventos mutuamente excluyentes tal que se
define de la siguiente manera:

además, se sabe que el evento A tiene el doble de probabilidad que el


evento B, P(D/B) es la tercera parte de P(Dc/B) y P(D/A) es la cuarta parte
de P(Dc/A), se pide:

a) Calcule P (D)
b) Calcule P (A D)
c) Calcule e intérprete P(B/D)
3. Una compañía de seguros no vida ofrece tres tipos de seguros para autos
(Premium, Semi Premium y Básico). El año pasado, el 35% de los seguros
vendidos fue del tipo Premium, el 40% fue del tipo Semi Premium y el resto
fue del tipo Básico. Además, los porcentajes de los seguros vendidos que se
utilizaron por algún tipo de siniestro fueron 24%, 16% y 12%, respectivamente.
Si el actuario, encargado de los seguros para autos, selecciona aleatoriamente
una de las pólizas que corresponde a los seguros vendidos el año pasado,
se pide:
a) Calcule la probabilidad de que la póliza no corresponda a las que
sufrieron algún tipo de siniestro.

ESTADÍSTICA GENERAL 239


b) Si la póliza corresponde a las que sufrieron algún tipo de siniestro,
calcule la probabilidad de que no sea del tipo de seguro Básico.
4. El dueño de una panadería compra sacos de harina a tres proveedores (A,
B y C). El 30% de los sacos proviene de A, el 50% de B y el resto de C.
Además, el 80% de los sacos que proviene de A, el 90% que proviene de B
y el 75% que proviene de C son de excelente calidad. Si un saco de harina es
escogido aleatoriamente, se pide:
a) Calcule la probabilidad de que sea de excelente calidad.
b) Si el saco escogido es de excelente calidad, calcule la probabilidad de
que provenga del proveedor B.
5. Un dispositivo electrónico puede ser ensamblado por cualquiera de dos
personas, A o B. La persona A ensambla el dispositivo en cuatro minutos y
la persona B ensambla el dispositivo en 3.75 minutos. Además, el 90% de los
dispositivos ensamblados por A satisface el control de calidad y el 85% de
los dispositivos ensamblados por B satisface el control de calidad. Si en un
día cualquiera se selecciona un dispositivo al azar, se pide:
a) Calcule la probabilidad de que el dispositivo satisfaga el control de
calidad.
b) Calcule la probabilidad de que el dispositivo haya sido ensamblado por
A, si se sabe que pasó el control de calidad.

10.5 Trabajo autónomo


1. Establezca la verdad o falsedad de cada uno de los siguientes enunciados:
a) En un diagrama de árbol, los eventos que corresponden a ramas que
parten de un mismo punto pueden ocurrir simultáneamente.
b) El teorema de Bayes se utiliza para calcular la probabilidad de un evento
que está condicionado por la ocurrencia de otro.
c) Si A1 y A2 son dos eventos mutuamente excluyentes, tal que
es un evento que se define de la siguiente manera:

entonces se puede afirmar que:

2. Si A1 y A2 son dos eventos mutuamente excluyentes, tal que yD


es un evento que se define de la siguiente manera.

Si: P(A1) = 0.65, P(Dc/A1) = 0.15 y P (Dc/A2) = 0.20, se pide:

240 ESTADÍSTICA GENERAL


a) Calcule P (D)
b) Calcule P (A1 D)
c) Calcule e intérprete P(A2 /D)
3. El jefe de la oficina de créditos y cobranzas de un banco emplea tres
métodos para el cobro de las cuentas atrasadas. El año pasado, el 60% de
las cuentas se cobró en forma personal, el 25% se cobró por teléfono y el
15% se cobró mediante una carta. Además, los porcentajes de los cobros que
se hicieron efectivos con cada uno de los tres métodos fueron 65%, 30% y
15%, respectivamente. Si el jefe de dicha oficina selecciona aleatoriamente
una de las cuentas del año pasado, se pide:
a) Calcule la probabilidad de que el cobro se haya hecho efectivo.
b) Si el cobro se hizo efectivo, calcule la probabilidad de que la cuenta se
haya hecho de forma personal.
4. Una empresa de investigación de mercados es conocida por estudiar las
características de productos que quieren ser lanzados al mercado. Se sabe
que, el año pasado, los productos que no recibieron un informe favorable
por parte de la compañía representaron la cuarta parte de aquellos que sí
lo recibieron. Además, el 60% de los productos que recibieron un informe
favorable fue lanzado al mercado, mientras que el 80% de los productos que
no recibieron un informe favorable no fue lanzado al mercado. Un producto
presentado el año pasado es elegido al azar y se pide:
a) Calcule la probabilidad de que el producto se haya lanzado al mercado.
b) Si se sabe que el producto fue lanzado al mercado, calcule la probabilidad
de que haya recibido un informe favorable.
5. Un componente electrónico se ensambla en cualquiera de tres líneas de
ensamble (L1, L2 y L3) que trabajan con la misma velocidad. Se sabe que los
porcentajes de los componentes defectuosos producidos por las tres líneas son
10%, 12% y 14%, respectivamente. Si se elige un componente al azar, se pide:
a) Defina los eventos necesarios y construya el árbol de probabilidades
que corresponde al experimento.
b) ¿Qué tendría que suponer para calcular las probabilidades faltantes?
¿Por qué?
c) Si en un día se ensamblan 1 000 componentes, ¿cuántos componentes
defectuosos habrán sido ensamblados en la línea L1 según el supuesto
anterior?
d) Si en un día se ensamblan 1 000 componentes, ¿cuántos componentes
resultarán defectuosos según el supuesto anterior?

ESTADÍSTICA GENERAL 241


10.6 Problemas de reforzamiento del capítulo
1. Una empresa de estudio de mercados realizó una encuesta a 200 amas
de casa para determinar las preferencias de consumo de tres marcas de
detergentes (A, B y C). Los resultados obtenidos son los siguientes: todas
las amas de casa consumen alguno de los tres detergentes; todas, menos
50, consumen la marca A; 20 consumen A y B pero no C; ocho consumen
B y C pero no A, y 12 consumen solo C. El número de amas de casa que
consumen A y C es el doble del total de amas de casa que consumen las
tres marcas de detergentes. El número de amas de casa que consumen solo
B es el mismo que el total de las que consumen A y C. Si se selecciona un
ama de casa al azar, calcule la probabilidad de que consuma solamente el
detergente A.
2. El sistema de seguridad de una agencia bancaria está conformado por
tres cámaras, C1, C2 y C3, que funcionan de manera independiente. Las
probabilidades de falla de las cámaras en un día cualquiera son de 0.025,
0.035 y 0.030, respectivamente. Para un día cualquiera se pide:
a) Calcule la probabilidad de que las tres cámaras funcionen.
b) Calcule la probabilidad de que solo una de las cámaras funcione.
3. En una fábrica metalmecánica se quiere estudiar la producción de sus tres
principales máquinas de moldeado de tuercas de alta velocidad traídas
desde Taiwán. La producción de la primera máquina representa el 35% de
la producción total, la producción de la segunda máquina representa el
40% y la tercera máquina produce el resto. Los porcentajes de productos
defectuosos en cada máquina son 2%, 1.5% y 2.5%, respectivamente. Si
en el control de calidad se tomó un producto al azar y se observó que
es defectuoso, calcule la probabilidad de que haya sido producido por la
segunda máquina.

4. Establezca la verdad o falsedad de cada uno de los siguientes enunciados:


a) Sean A y B dos eventos mutuamente excluyentes y , entonces

b) Si entonces
c) Si un dado se lanza tres veces, entonces el espacio muestral tiene 216
elementos.
d) Si un dado se lanza tres veces, entonces solo en seis de todos los
resultados posibles se muestran los tres números iguales.

242 ESTADÍSTICA GENERAL


10.7 Portafolio (para subir al campus virtual)
1. Una empresa de servicio de taxi cuenta con tres marcas diferentes de
automóviles: A, B y C. El municipio de la ciudad estipula que uno de los
requisitos para obtener el permiso de circulación es que las unidades pasen
la revisión técnica. Por tanto, la empresa elige al azar los tres primeros autos
que deben ingresar a la revisión técnica, uno a continuación del otro, con las
posibilidades de aprobar o no dicha revisión. Se pide:
a) Construya el diagrama de árbol.
b) Construya el espacio muestral correspondiente y defina los elementos
del evento D, donde:
D = Por lo menos un auto no logra aprobar la revisión técnica
2. Un vendedor de seguros de vida sabe que la probabilidad de vender
una póliza en un día es mayor mientras más visitas realice a sus clientes
potenciales. Si la probabilidad de que una persona compre una póliza
después de una visita es igual a 0.25 y si el conjunto de visitas constituye
un conjunto de ensayos independientes, ¿cuántos compradores potenciales
debe visitar el vendedor para que la probabilidad de vender al menos una
póliza sea de 0.8?
3. Cierto organismo técnico, orientado a la investigación científica para
el conocimiento del mar peruano y sus recursos, realizó un estudio para
obtener información respecto a la pesca artesanal; para esto, se seleccionó
una muestra aleatoria de 50 pescadores del puerto de Eten y se obtuvo la
siguiente información:

ESTADÍSTICA GENERAL 243


Tipo de Arte o tipo de 26 No precisa Madera Redes de cortina
Nº Condición legal
pesca pesca
27 Con carné Madera Espinel
1 Sin carné Madera Buceo
28 Carné en trámite Otro Redes de cortina
2 Con carné Madera Buceo
29 Con carné Madera Pinta o cordel
3 Con carné Madera Pinta o cordel
30 Con carné Madera Redes de cortina
4 Con carné Otro Pinta o cordel
31 Con carné Madera Pinta o cordel
5 Carné en trámite Madera Redes de cortina
32 Carné en trámite Madera Pinta o cordel
6 No precisa Madera Redes de cortina
33 Con carné Madera Buceo
7 Con carné Madera Redes de cortina
34 Con carné Madera Espinel
8 Carné en trámite Madera Pinta o cordel
35 Con carné Madera Redes de cortina
9 Carné en tramite Madera Redes de cortina
36 Con carné Madera Buceo
10 Con carné Madera Pinta o cordel
37 Carné en trámite Madera Pinta o cordel
11 Con carné Madera Redes de cortina
38 Con carné Madera Pinta o cordel
12 No precisa Madera Buceo
39 Carné en trámite Madera Espinel
13 Carné en trámite Madera Espinel
40 No precisa Otro Redes de cortina
14 Con carné Madera Buceo
41 Con carné Madera Redes de cortina
15 Con carné Madera Redes de cortina
42 Con carné Madera Redes de cortina
16 Con carné Otro Redes de cortina
43 Carné en trámite Madera Buceo
17 Con carné Madera Pinta o cordel
44 Con carné Madera Buceo
18 No precisa Madera Buceo
45 Carné en trámite Madera Redes de cortina
19 Carné en trámite Madera Buceo
46 Carné en trámite Madera Espinel
20 Carné en trámite Madera Redes de cortina
47 Con carné Madera Redes de cortina
21 Con carné Madera Espinel
48 Carné en trámite Madera Redes de cortina
22 Con carné Madera Buceo
49 Con carné Madera Pinta o cordel
23 Carné en trámite Madera Espinel
50 Con carné Madera Espinel
24 Carné en trámite Madera Buceo
25 Con carné Madera Redes de cortina

a) Represente la información mediante un árbol de probabilidades.


b) Si de la muestra anterior se seleccionó un pescador al azar y resultó que
el tipo de pesca que realiza es espinel, calcule la probabilidad de que su
embarcación no sea de madera y que tenga carné de socio de alguna
organización (gremios, sindicatos, asociaciones marítimas, entre otras).

10.8 Bibliografía
1. Meza de Castillo, E. (1995). Probabilidad. Consejo Nacional de Ciencia y
Tecnología.
2. Wackerly, Mendenhall y Scheaffer (2009). Estadística Matemática con
Aplicaciones. Sétima edición. Cengage Learning.
3. Anderson, Sweeney y Williams (2008). Estadística para Administración y
Economía. Décima edición. Cengage Learning.

244 ESTADÍSTICA GENERAL


Capítulo 5
DISTRIBUCIONES
DISCRETAS IMPORTANTES
Gráfica de la distribución Poisson (λ = 8)

0,14

0,12

0,10

0,08
P (X)

0,06

0,04

0,02

0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
X

Capacidades por desarrollar


Al finalizar el capítulo, se espera que el estudiante logre las siguientes capacidades:
• Identificar si un experimento es Binomial o Poisson en problemas
contextualizados.
• Calcula probabilidades utilizando la función de probabilidad correspondiente
a la distribución identificada en problemas contextualizados.

ESTADÍSTICA GENERAL 245


Motivación
Una compañía de seguros, vida y no vida, ofrece tres tipos de seguros para
autos (Premium, Semi Premium y Básico). Se sabe que, en cada uno de los
últimos diez años, el porcentaje de seguros vendidos del tipo Premium fue del
45%; un porcentaje alto, para el precio en el que se ofrece. Si el gerente del área
de seguros no vida selecciona aleatoriamente una póliza de cada uno de los
diez años, calcule la probabilidad de que la mitad pertenezca al seguro de tipo
Premium.

Gráfica de la distribución Binomial (n = 10, p = 0.45)


0,25 0,238367
0,234033

0,20
0,0166478
0,159568
Probabilidad

0,15

0,10
0,076303 0,074603

0,05
0,020724 0,022890

0,002533 0,004162 0,000341


0,00
0 1 2 3 4 5 6 7 8 9 10
Número de seguros vendidos del tipo Premium

Al finalizar el capítulo, el estudiante estará en capacidad de responder esta


pregunta y otras más, utilizando la distribución de probabilidades pertinente.

Saberes previos
• Conceptos básicos sobre probabilidades.
• Operaciones algebraicas.

246 ESTADÍSTICA GENERAL


Lección 11
Distribución Binomial
A partir de ciertas características los siguientes experimentos aceptan un
modelo Binomial:

1. Lanzar una moneda veinte veces y observar el número de caras que


aparecen.
2. Lanzar un dado diez veces y observar el número de veces que el dado
muestra inscrito el número cinco.

Un experimento Binomial tiene las siguientes características:

• Consiste de n ensayos independientes.


• En cada ensayo, solo hay dos posibles resultados, a uno se le denomina
éxito y al otro fracaso.
• La probabilidad p de éxito es la misma en cada ensayo.

En un experimento Binomial lo que interesa es el número de éxitos en n ensayos.


Si X es la variable aleatoria que cuenta el número de éxitos en n ensayos, la
variable puede tomar valores desde cero hasta n. Como X toma un número
finito numerable de valores, se concluye que X es una variable aleatoria discreta.

11.1 Definición
Una variable aleatoria X sigue distribución Binomial con parámetros n y p, y se
representa por X~Bi(n,p), si su función de probabilidad está dada por:

donde:
n = Número de ensayos
p= Probabilidad de éxito en cada ensayo

11.2 Medidas de resumen


Si una variable aleatoria discreta X sigue una distribución Binomial con
parámetros n y p, se cumple:

Esperanza matemática

ESTADÍSTICA GENERAL 247


Varianza

11.3 Gráfica de la distribución Binomial


Para construir la gráfica de una variable con distribución Binomial se siguen los
siguientes pasos:

Paso 1: Se traza un sistema de coordenadas, los valores que toma la variable se


representan en el eje X y las probabilidades se representan en el eje Y.

Paso 2: Sobre cada valor que toma la variable se levanta una línea cuya altura es
igual o proporcional a su respectiva probabilidad.
Gráfica de la distribución Binomial (n = 15, p = 0.35)

0,20

0,15
P(X)

0,10

0,05

0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
X
Gráfica de la distribución Binomial (n = 15, p = 0.5)
0,20

0,15
P(X)

0,10

0,05

0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
X

248 ESTADÍSTICA GENERAL


Ejemplo 11.1
Se lanza una moneda 10 veces, si el interés es contar el número de caras que
aparecen en los 10 lanzamientos, calcule:
a) La probabilidad de que el número de caras sea igual a tres.
b) La probabilidad de que el número de caras sea a lo más dos.
c) La probabilidad de que el número de caras sea al menos dos.
d) El valor esperado y la varianza del número de caras.

Solución
La variable aleatoria es:
X = Número de caras obtenidas en los diez lanzamientos
n=10
p=0.5 (probabilidad de que resulte cara en cualquier lanzamiento)
a) Se pide: P(X = 3)

b) Se pide:

c) Se pide:

ESTADÍSTICA GENERAL 249


d) El valor esperado se calcula de la siguiente manera:

La varianza se calcula de la siguiente manera:

11.4 Ejercicios resueltos


1. Una compañía de seguros, vida y no vida, ofrece tres tipos de seguros para
autos (Premium, Semi Premium y Básico). Se sabe que, en cada uno de los
últimos diez años, el porcentaje de seguros vendidos del tipo Premium fue
del 45%; un porcentaje alto, para el precio en el que se ofrece. Si el gerente
del área de seguros no vida selecciona aleatoriamente una póliza de cada
uno de los diez años, se pide:
a) Calcule la probabilidad de que la mitad pertenezca al seguro de tipo
Premium.
b) Calcule la probabilidad de que como máximo tres pertenezcan al seguro
de tipo Premium.
c) Si se sabe que por lo menos dos de las pólizas no pertenecen al seguro
de tipo Premium. Calcule la probabilidad de que menos de cuatro no
pertenezcan a este tipo de seguro.

Solución
a) Sea la variable:

X = Número de pólizas tipo Premium en un total de 10


Entonces, (X~ Bi(n=10, p=0.45)), donde:
n = Número de años
p = Probabilidad de que una póliza tipo Premium sea vendida

250 ESTADÍSTICA GENERAL


b)

c) Sea la variable:
Y= Número de pólizas que no son del tipo Premium en un total de 10
Entonces, (Y~ Bi(n=10, p=0.55)), donde:
n = Número de años
p = Probabilidad de que una póliza no sea del tipo Premium

2. El administrador de una juguetería desea adquirir un lote de diez naves


espaciales a control remoto. Un fabricante ofrece dicho juguete con cuatro
chips que funcionan independientemente con una probabilidad de 0.9 cada
una; y, con la garantía, de que la nave funcionará correctamente si al menos
tres de sus chips funcionan.
Se sabe que el administrador comprará el lote solo si todas las naves
funcionan, ¿cuál es la probabilidad de que se efectué la compra?

Solución
Sea:
X = Número de chips que funcionan de un total de cuatro

ESTADÍSTICA GENERAL 251


X ~ Bi(n=4, p=0.9)
Una nave funciona si tres o cuatro chips funcionan, entonces:

Ahora, se calcula la probabilidad de que se efectué la compra:


Sea Y = Número de naves que funcionan de un total de diez
Y ~ Bi(n=10, p=0.9477)
Donde:
p = P(Una nave funcione)= 0.9477
La compra se efectúa si todas las naves funcionan:

11.5 Trabajo colaborativo (Para trabajar en clase)


1. El gerente financiero de una entidad bancaria, que cuenta con sucursales
distribuidas en todas las ciudades del país, sabe que la probabilidad de
que cualquiera de las sucursales reciba un cheque sin fondos es 0.02. Si el
gerente selecciona aleatoriamente cinco sucursales, obtenga la distribución
de probabilidades de la variable aleatoria X = Número de sucursales que
reciben un cheque sin fondo, además:
a) Calcule la probabilidad de que mínimo tres sucursales reciban cheques
sin fondos.
b) Calcule la probabilidad de que menos de tres sucursales reciban cheques
sin fondos si se sabe que por lo menos una sucursal recibirá un cheque
sin fondo.
(Asuma independencia con respecto a la recepción de cheques sin
fondo entre las sucursales)
2. Un banco de la ciudad ha iniciado un nuevo programa de crédito de modo
que los clientes que cumplan con los requisitos establecidos pueden obtener

252 ESTADÍSTICA GENERAL


una tarjeta de crédito. De los registros anteriores, se sabe que el 65% de las
solicitudes para obtener una tarjeta de crédito son rechazadas. Para una
muestra aleatoria de seis solicitudes, se pide:
a) Calcule la probabilidad de que como máximo tres solicitudes sean
rechazadas.
b) Calcule la probabilidad de que como mínimo cuatro solicitudes sean
aceptadas.
(Asuma que el número de solicitudes es tan grande que se garantiza la
independencia entres estas)
3. El Turismo en el Perú se constituye en la tercera industria más grande de
la nación, detrás de la pesca y la minería. Una empresa de turismo tiene
información que indica que en cada uno de los últimos 12 vuelos llegados al
país se observó que el 30% de los turistas extranjeros realizaron turismo de
aventura. Si se elige, al azar, un turista extranjero de cada vuelo, calcule la
probabilidad de que:
a) Al menos 10 de los turistas hayan realizado turismo de aventura.
Ningún turista haya realizado turismo de aventura.
b) A lo más nueve turistas extranjeros hayan realizado turismo de aventura,
si se sabe que más de la mitad lo hizo.
(Asuma independencia con respecto a la elección de turistas de cada
vuelo)
4. Un fabricante de envases de vidrio, cuyo método utilizado es por producción
automática de envases, efectuó la venta de un lote de botellas para gaseosas
de un litro. Si un lote está conformado por 12 cajas con ocho botellas cada
una y si cada caja contiene una botella con algún tipo de defecto, se pide:
a) Si usted selecciona una botella de cada caja, calcule la probabilidad de
que el 50% de las botellas sean defectuosas.
b) Si usted selecciona una botella de cada caja, calcule la probabilidad de
que a lo más el 25% de las botellas sean defectuosas.
(Asuma independencia con respecto a la elección de botella de cada
caja)
5. Una empresa realiza operaciones comerciales con tres proveedores A, B y
C. Se sabe que: de A, recibe el 50% de todos los insumos; de B, el 35%; y, el
resto de C. Se ha determinado que la proporción de insumos en mal estado
que provienen de A es 0.0012; de B, 0.0015; y, de C, 0.0018, se pide:
a) Si se elige un insumo al azar, ¿cuál es la probabilidad de que se encuentre
en mal estado?

ESTADÍSTICA GENERAL 253


b) Se eligen cinco insumos con reemplazo, ¿cuál es la probabilidad de que
por lo menos dos se encuentren en mal estado?
(Asuma que el número de insumos recibidos de cada proveedor es tan
grande que se garantiza la independencia entre los eventos definidos)

11.6 Trabajo autónomo


1. Las micro y pequeñas empresas en el Perú tienen importantes repercusiones
económicas y sociales para el proceso del desarrollo nacional, entre otras,
son generadoras de empleo y constituyen más del 98% de todas las empresas
en el país. Por consiguiente, una prestigiosa entidad bancaria tiene un
programa de créditos comerciales especialmente dirigido a estas empresas.
Se sabe que diariamente las cinco agencias con las que cuenta la entidad
reciben ocho solicitudes de crédito; de las cuales, solo son aprobadas dos
en cada una. Si al finalizar un día cualquiera, el gerente financiero de la
entidad selecciona una solicitud de crédito de cada sucursal, se pide:
a) Calcule la probabilidad de que por lo menos seis solicitudes se hayan
aprobado.
b) Si se sabe que más de la mitad de las solicitudes son aprobadas, calcule
la probabilidad de que se aprueben a lo más seis.
(Asuma independencia con respecto a la elección de solicitudes en cada
sucursal)
2. Las cinco sucursales de una cadena de supermercados registran diariamente
que el 80% de sus clientes pagan con tarjeta de crédito cuando el monto
supera los 400 soles. Si al finalizar un día cualquiera, el administrador de
la cadena de supermercados selecciona aleatoriamente un cliente de cada
sucursal cuyo monto superó los 400 soles, se pide:
a) Calcule la probabilidad de que como máximo dos de los clientes paguen
con tarjeta de crédito.
b) Calcule la probabilidad de que por lo menos cuatro de estos clientes
paguen con tarjeta de crédito.
c) ¿Cuántos clientes se espera que paguen con tarjeta de crédito?
(Asuma independencia con respecto a la elección de clientes en cada
sucursal)
3. Un corredor de seguros vida vende pólizas a 20 personas de 30 años que
disfrutan de muy buena salud. Según las tablas actuariales actuales, la

254 ESTADÍSTICA GENERAL


probabilidad de que una persona de esta edad viva 25 años o más es
0.65. Se pide:
a) Calcule la probabilidad de que las 20 personas vivan 25 años o más.
b) Calcule la probabilidad de que a lo más cinco personas vivan 25 años o más.
(Asuma independencia entre el tiempo de vida de las personas)
4. Una avícola prestigiosa vende pavitos en cajas que contienen 25 en total,
con un 80% de pavitos machos. Si de un lote de 20 cajas, se selecciona
aleatoriamente un pavito por cada caja, se pide:
a) Calcule la probabilidad de que no hayan pavitos hembra.
b) Calcule el número esperado de pavitos machos.
(Asuma independencia con respecto a la elección de los pavitos en cada
caja)

5. Un juego consiste en extraer, con reposición, tres tarjetas al azar de una urna
que contiene cuatro tarjetas blancas y cinco tarjetas negras. Si una persona
gana el juego cuando en las tres extracciones obtiene tarjetas blancas, se
pide:
a) ¿En qué consiste el experimento?
b) ¿En qué consiste un ensayo?
c) ¿Cuántas veces se repite dicho ensayo?
d) Defina la variable de estudio.
e) ¿Cuáles son las características por la que se puede atribuir un modelo
Binomial a dicha variable?
f) Calcule la probabilidad de que la persona gane el juego.

ESTADÍSTICA GENERAL 255


Lección 12

Distribución Poisson
A partir de ciertas características los siguientes experimentos aceptan un
modelo Poisson:

1. Observar el número de aviones que llegan a un aeropuerto en una hora


determinada.
2. Observar el número de llamadas que recibe la central telefónica de una
universidad entre las ocho y nueve de la mañana.
En un experimento Poisson, se observa el número de ocurrencias de un evento
en una unidad de espacio o tiempo.

12.1 Definición
Una variable aleatoria X sigue una distribución Poisson con parámetro λ, y se
representa por (X~P (λ)), si su función de probabilidad está dada por:

donde:
λ = Número promedio de ocurrencias de un evento

12.2 Medidas de resumen


Si una variable aleatoria discreta X sigue una distribución Poisson con parámetro
λ, se cumple:

Esperanza matemática

Varianza

256 ESTADÍSTICA GENERAL


12.3 Gráfica de la distribución Poisson
Para construir la gráfica de una variable con distribución Poisson se siguen los
siguientes pasos:
Paso 1: Se traza un sistema de coordenadas, los valores que toma la variable se
representan en el eje X y las probabilidades se representan en el eje Y.
Paso 2: Sobre cada valor que toma la variable se levanta una línea cuya altura es
igual o proporcional a su respectiva probabilidad.

Gráfica de la distribución Binomial (λ = 2)


0,30

0,25

0,20
P(X)

0,15

0,10

0,05

0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Gráfica de la distribución Binomial (λ = 6)


0,18

0,16

0,14

0,12

0,10
P(X)

0,08
0,06
0,04
0,02
0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

ESTADÍSTICA GENERAL 257


Gráfica de la distribución Binomial (λ = 10)
0,14

0,12

0,10

0,08
P(X)

0,06

0,04

0,02

0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

12.4 Ejercicios resueltos


1. Para la fabricación de un producto, el jefe de producción de una empresa
requiere que el insumo llegue por lo menos tres veces por semana. Se
sabe que la empresa se abastece mensualmente trece veces en promedio
(considere que un mes tiene cuatro semanas). Para una semana
cualquiera, calcule la probabilidad de que la fábrica deje de producir por
falta de insumos.

Solución
Sea:
X = Número de veces que llega el insumo a la empresa en una semana
X ~ P(λ=3.25)
El valor de λ se obtiene por una regla de tres simple, así:

258 ESTADÍSTICA GENERAL


Si X ≥ 3, no se detiene la producción, pero si X < 3 se detiene la producción,
luego:

2. El escuadrón de emergencia de un puesto policial puede atender, en


promedio, cinco llamadas de emergencia por hora. Cuando se registran más
de tres llamadas de emergencia en 30 minutos se ven obligados a pedir
refuerzos a otros puestos policiales porque cuentan con pocas unidades
móviles. Si en este momento se cuenta con todas las unidades, calcule la
probabilidad de que en el puesto policial se tenga que pedir refuerzos en los
siguientes 30 minutos.

Solución
Sea la variable:
X = Número de llamadas de emergencia registradas en 30 minutos
X ~ P(λ=2.5)
El valor de λ, se obtiene por una regla de tres simple, así:

Se pide:

ESTADÍSTICA GENERAL 259


Gráfica de la distribución Poisson (λ = 2.5)
0,25

0,20

0,15
P(X)

0,10

0,05

0,00
0 1 2 3 4 5 6 7 8 9 10
Número de llamadas de emergencia

12.5 Trabajo colaborativo (Para trabajar en clase)


1. El número de personas que llega a un supermercado entre las nueve y diez
de la mañana es una variable aleatoria que sigue una distribución Poisson
con parámetro igual a cinco llegadas por minuto. Para un día cualquiera,
se pide:

a) Calcule la probabilidad de que entre las 9:00 y 9:01 no llegue ninguna


persona.
b) Si son las 9:50 de la mañana, calcule la probabilidad de que lleguen
como máximo tres personas en un intervalo de 45 segundos.

2. La secretaria de la oficina de recepción de la central telefónica de una


universidad recibe, en promedio, en un día congestionado 120 llamadas por
hora. Si la secretaria acaba de llegar a la oficina, se pide:

a) Calcule la probabilidad de que reciba tres llamadas en un periodo de un


minuto.
b) Calcule la probabilidad de que reciba una llamada, si se sabe que recibirá
a lo más tres en un periodo de un minuto.

3. El número de accidentes laborales graves en una empresa sigue una


distribución Poisson con una media de 2.7 al año. Dado que las condiciones
de seguridad serán las mismas para el próximo año, se pide:

a) Calcule la probabilidad de que el número de accidentes graves sea a lo


más dos.

260 ESTADÍSTICA GENERAL


b) Calcule la probabilidad de que en los próximos seis meses ocurra un
solo accidente grave.

4. Una máquina fabrica madejas de hilo de 50 metros, se sabe que el número


de defectos por madeja sigue un proceso de Poisson con una media de
dos fallas por cada 50 metros. Se sabe que una madeja es vendible si tiene
menos de tres defectos, en otro caso se desecha.

a) Calcule la probabilidad de que una madeja no sea vendible.


b) Si se fabrican cinco madejas, obtenga la distribución de probabilidades
de la variable aleatoria Y, donde:
Y = Número de madejas vendibles de un total de cinco
c) Si se fabrican diez madejas, calcule la probabilidad de que el 50% de
estas no sean vendibles.

5. Las normas de una empresa establecen que si en un mes, más de cinco


colaboradores llegan tarde, todos los colaboradores no reciben el bono
mensual estipulado en el contrato. Si el número promedio de colaboradores
que llegan tarde es de cinco al mes, se pide:

a) Calcule la probabilidad de que los colaboradores no reciban el bono.


b) Se sabe que en el primer día del siguiente mes llegaran tarde más de
dos colaboradores, calcule la probabilidad de que en el mes referido los
colaboradores reciban el bono.

12.6 Trabajo autónomo


1. El número promedio de personas que realizan transacciones en un cajero
automático es de tres por cada 10 minutos. Si el cajero acaba de ponerse a
disposición de las personas, se pide:

a) Calcule la probabilidad de que en los siguientes diez minutos menos de


dos personas realicen transacciones.
b) Calcule la probabilidad de que en los siguientes veinte minutos ocho
personas realicen transacciones.

2. A una agencia bancaria llegan, en promedio, diez clientes entre las ocho y
nueve de la mañana. Se pide:

a) Calcule la probabilidad de que en un día cualquiera lleguen más de tres


clientes entre las ocho y nueve de la mañana.

ESTADÍSTICA GENERAL 261


b) Calcule la probabilidad de que en por lo menos cuatro de cinco días
observados lleguen más de tres clientes entre las ocho y nueve de la
mañana.
c) Calcule el número esperado de días en los que llegan más de tres clientes
entre las ocho y nueve de la mañana si se observan cinco días.
(Considere independencia entre los días observados)

3. Una fábrica muy prestigiosa de artículos escolares oferta, en su línea de


lápices de colores, cajas con 12 unidades cada una; adicionalmente, en cada
caja se incluye un lápiz de dibujo 2B como oferta. Por información histórica,
se sabe que por cada 50 cajas, dos en promedio, no tienen el lápiz adicional.
Si usted selecciona 100 de estas cajas, ¿cuál es la probabilidad de que todas
presenten el lápiz adicional?

4. Una empresa de transporte recibe, en promedio, cuatro papeletas por


día. Si una nueva norma impuesta por el Ministerio de Transportes ordena
sancionar a las empresas cuando el número de papeletas supera a cinco en
un día; para un día cualquiera, se pide:

a) Calcule la probabilidad de que la empresa de transporte no sea


sancionada.
b) Calcule la probabilidad de que la empresa de transporte no sea
sancionada durante una semana (considere una semana de cinco días).
5. Durante el proceso de control de calidad en una empresa que produce puertas
de madera, cada puerta es revisada en busca de imperfecciones en la superficie.
Es política de la empresa que si se encuentran dos o más imperfecciones, esta
será rechazada y devuelta para su reparación. Si el encargado del proceso de
control de calidad sabe que el número de imperfecciones en una puerta sigue
una distribución Poisson con una media igual a 0.75 imperfecciones. Se pide:

a) Calcule la probabilidad de que una puerta pase el control de calidad.


b) Calcule la probabilidad de que más de dos puertas pasen el control de
calidad, si el número de puertas revisadas es igual a cinco.

12.7 Problemas de reforzamiento del capítulo


1. Un vendedor de seguros, sabe que la probabilidad de vender una póliza de
seguros es mayor mientras más entrevistas realice con clientes potenciales.
Si la probabilidad de que un cliente compre una póliza después de una
visita es 0.40 y cada visita es independiente, calcule el número de clientes

262 ESTADÍSTICA GENERAL


que se tienen que visitar para que la probabilidad de vender al menos una
póliza sea 0.95.

2. En la última producción de cintas satinadas de un centímetro de ancho, el


jefe de control de calidad de una empresa detectó, en promedio, dos fallas
cada 30 metros. Si la cinta se vende en rollos de 20 metros y es devuelto si
presenta dos fallas como mínimo, se pide:

a) Si un rollo de la última producción es vendido, calcule la probabilidad de


que no sea devuelto.
b) Si un comprador hace un pedido de una docena de rollos, ¿cuál es la
probabilidad de que devuelva a lo más un rollo? Considere que los doce
rollos forman parte de la última producción.

3. Una compañía de seguros ofrece dos tipos de seguros para motocicletas


(M y N). Se sabe que en cada uno de los últimos diez años, el porcentaje de
seguros vendidos del tipo M fue del 45%. Si el gerente del área de seguros
selecciona aleatoriamente una póliza de cada uno de los diez años, se pide:

a) Defina la variable de estudio.


b) Identifique la distribución de probabilidades que le corresponde y
diga cuales son las características observadas para decidirse por esta
distribución.
c) Calcule la probabilidad de que como mínimo una y máximo tres pólizas
pertenezcan al seguro del tipo M.
(Considere independencia entre las pólizas vendidas en los diferentes años)

4. Un sistema para detectar incendios está compuesto por n sensores que


actúan de manera independiente; de tal manera, que cualquiera de ellos
puede activarse en caso de incendio. Si se sabe que la probabilidad de que
un sensor se active en caso de incendio es igual a 0.95, resuelva:

a) Si el número de sensores es igual a cuatro, calcule la probabilidad de


que en un incendio se activen dos sensores.
b) Si el número de sensores es igual a cuatro, calcule la probabilidad de
que en un incendio se activen por lo menos tres sensores.
c) Calcule el número n de sensores por el que debe estar compuesto el
sistema para que la probabilidad de que se active por lo menos un
sensor sea igual a 0.9999.

ESTADÍSTICA GENERAL 263


12.8 Portafolio (Para subir al campus virtual)
Utilice el Minitab para resolver los siguientes problemas:

1. Se tiene un mazo de cartas que no incluyen a las cartas J, Q y K, sea el


experimento extraer una carta y observar si es As o no. Si se extraen cuatro
cartas con reposición, se pide:
a) Calcule la probabilidad de que todas sean Ases.
b) Calcule la probabilidad de obtener a lo más dos Ases.
c) Calcule la probabilidad de no obtener Ases.

2. El dueño de una empresa está preocupado por las devoluciones de un


componente electrónico debido a fallos en su funcionamiento. Se sabe que
semanalmente (de lunes a sábado) se devuelven, en promedio, 12 artículos.
Para llevar a cabo un control sobre las devoluciones en la presente semana,
el día domingo, se observará el número de artículos que fueron devueltos
en la semana, se pide:

a) Calcule la probabilidad de que en dicho período se hayan devuelto


menos de ocho artículos.
b) Calcule la probabilidad de que en dicho período se hayan devuelto por
lo menos diez artículos.

3. Se sabe que el número promedio de imperfecciones en un neumático de la


marca ABC es igual a tres, se pide:

a) Defina la variable de estudio e identifique la distribución de probabilidades


que le corresponde.
b) Para un neumático cualquiera de dicha marca, ¿cuál es la probabilidad
de que se encuentren más de cinco imperfecciones?
c) Para diez neumáticos cualquiera de dicha marca, ¿cuál es la probabilidad
de que más de cuatro presenten por lo menos una imperfección?

264 ESTADÍSTICA GENERAL


12.9 Distribuciones discretas (Binomial y Poisson) con
MINITAB
1. Si X es una variable aleatoria discreta que sigue una distribución Binomial
con parámetros n=6 y p= 0.4, calcule P(X = 3) utilizando el Minitab.
Para esto, seleccione: Calc/Distribuciones de probabilidad/Binomial:

Ahora, seleccione Probabilidad, escriba los valores de los parámetros en número


de ensayos y probabilidad del evento; y, en constante de entrada escriba 3;
tal como, se muestra a continuación:

Luego de dar click en aceptar, se obtienen los resultados en la ventana de sesión.

ESTADÍSTICA GENERAL 265


2. Si X es una variable aleatoria discreta que sigue una distribución Binomial
con parámetros n= 6 y p= 0.4, obtenga la distribución de probabilidades
utilizando el Minitab.
Para esto, ingrese los datos en una de las columnas de la ventana Hoja de
trabajo y seleccione Calc/Distribuciones de probabilidad/Binomial. Luego,
ingrese la información correspondiente; tal como, se muestra a continuación:

En este caso, se selecciona la columna de entrada porque los datos han sido
ingresados en una columna.
Las probabilidades respectivas se muestran en la columna C2 (en almacenamiento
opcional se ingresó C2) de la hoja de cálculo:

266 ESTADÍSTICA GENERAL


3. Si X es una variable aleatoria discreta que sigue una distribución Poisson con
parámetro λ = 4, obtenga las probabilidades para 0, 1, 2, 3, 4, 5 y 6 utilizando
el Minitab.
Para esto, ingrese los datos en una de las columnas de la ventana Hoja de
trabajo y seleccione Calc/Distribuciones de probabilidad/Poisson:

ESTADÍSTICA GENERAL 267


Ingrese la información correspondiente; tal como, se muestra a continuación:

En este caso no se eligió una columna para almacenar los resultados (en
almacenamiento opcional no se ingresó nada); por lo tanto, los resultados se
mostrarán en la ventana de sesión:

12.10 Bibliografía
1. Meza de Castillo, E. (1995). Probabilidad. Consejo Nacional de Ciencia y
Tecnología.
2. Wackerly, Mendenhall y Scheaffer (2009). Estadística Matemática con
Aplicaciones. Sétima edición. Cengage Learning.
3. Anderson, Sweeney y Williams (2008). Estadística para Administración y
Economía. Décima edición. Cengage Learning.

268 ESTADÍSTICA GENERAL


Capítulo 6
DISTRIBUCIONES
CONTINUAS
IMPORTANTES
0,24 n=6
0,22
0,20
0,18
0,16
0,14
0,12 n = 12
0,10
0,08 n = 24
0,06
0,04
0,02
0,00
10 20 30 40

Capacidades por desarrollar


Al finalizar el capítulo, se espera que el estudiante logre las siguientes capacidades:
• Calcula probabilidades utilizando la distribución Normal en problemas
contextualizados.
• Calcula probabilidades utilizando las distribuciones Chi –Cuadrado, T -Student y
F- Fisher en problemas contextualizados.

Motivación
La empresa Funning For Relaxing es una empresa organizadora de eventos
(específicamente conciertos de rock) que desarrolla sus actividades en el
departamento de Lima. Actualmente, el gerente general de la empresa ha
cerrado un contrato con una de las bandas más grandes de rock, esta llegará
a Lima el próximo año. Por tal motivo, el gerente realizará una gran campaña

ESTADÍSTICA GENERAL 269


de promoción que consistirá en obsequiar el polo oficial del concierto por la
compra de una entrada.
Para esto, el gerente se contactará con el gerente general de la empresa textil
RAY AND CELANE SA para encargarle la elaboración de los polos oficiales del
evento. Entre las razones para contactarse con esta empresa textil se tienen: el
prestigio y la experiencia con la que cuenta la empresa en este tipo de eventos.

El jefe de producción de la empresa textil confeccionará los polos en tres tallas:


M, L y XL. Dado que los polos serán lo suficientemente anchos, lo que hará
optar por una talla u otra será la estatura del asistente.

Por estudios anteriores, se sabe que las estaturas de los asistentes siguen una
distribución normal con una media de 168.75 cm y una desviación estándar
de 10 cm.

En base a los estándares de calidad, el jefe de producción sabe que la talla M es


apropiada para personas con estaturas de hasta 165 cm, la talla L es apropiada
para personas con estaturas entre 165 cm y 180 cm y la talla XL es apropiada
para personas con estaturas superiores a 180 cm.

51.879%

35.197% 12.924%
165 180
Si el gerente general de la empresa le solicita al jefe de producción el porcentaje
de cada talla que se confeccionará, ¿qué informará el jefe de producción?
Al finalizar el capítulo, el estudiante estará en capacidad de responder esta
pregunta y otras más, utilizando la distribución de probabilidad pertinente.

Saberes previos
• Conceptos básicos sobre probabilidades.
• Distribuciones discretas especiales.

270 ESTADÍSTICA GENERAL


Lección 13
Distribución Normal
La distribución Normal es una de las distribuciones de probabilidades más
importantes y una de las más utilizadas en la Estadística Inferencial.

13.1 Definición
Una variable aleatoria continua X sigue una distribución Normal con parámetros
μ y , y se representa como , si su función de densidad está dada por:

donde:
μ = Media poblacional
σ = Desviación estándar poblacional

13.2 Propiedades de la curva de la distribución Normal


• Tiene forma acampanada.
• Está determinada por dos parámetros: la media (μ) y la varianza .
• Es simétrica con respecto a la media.
• El punto más alto de la curva se encuentra sobre el promedio, el cual
coincide con la mediana y la moda.
• Se hace más plana a medida que la varianza crece.

A continuación, se presentan algunos ejemplos

ESTADÍSTICA GENERAL 271


La gráfica de la distribución Normal es simétrica con respecto a la recta x = μ y
se le conoce con el nombre de “Campana de Gauss”.

A continuación, se presentan algunos resultados válidos para esta curva:

272 ESTADÍSTICA GENERAL


• El área bajo la curva que comprende entre μ-σ y μ+σ es aproximadamente
el 68.26% del área total.

• El área bajo la curva que comprende entre μ − 2σ y μ + 2σ es aproximadamente


el 95.5% del área total.
• El área bajo la curva que comprende entre μ − 3σ y μ + 3σ es aproximadamente
el 99.99% del área total.

13.3 Distribución Normal Estándar


Una variable aleatoria continua X tiene distribución Normal Estándar con
parámetros µ = 0 y σ2= 1 y se representa X N(0,1), si su función de densidad está
dada por:

• Gráfica de la distribución Normal Estándar

13.4 Tabla de la distribución Normal Estándar


Para calcular probabilidades de variables aleatorias continuas que siguen una
distribución Normal, se utiliza la tabla de la distribución normal estándar.

La tabla ha sido diseñada para calcular probabilidades del siguiente tipo:

ESTADÍSTICA GENERAL 273


Donde, z1-α es un número cualquiera.
A continuación, se presenta una parte de la tabla de la distribución Normal
Estándar:

Tabla de distribución Normal Estándar

Z 0 1 2 …… 7 8 9

0.0 0.50000 0.50399 0.50798 …… 0.52790 0.53188 0.53586

0.1 0.53983 0.54380 0.54776 …… 0.56749 0.57142 0.57535

0.2 0.57926 0.58317 0.58706 …… 0.60642 0.61026 0.61409

0.3 0.61791 0.62172 0.62552 …… 0.64431 0.64803 0.65173

0.4 0.65542 0.65910 0.66276 …… 0.68082 0.68439 0.68793

… … … … …… … … …

3.5 0.99977 0.99978 0.99978 …… 0.99982 0.99983 0.99983

3.6 0.99984 0.99985 0.99985 …… 0.99988 0.99988 0.99989

3.7 0.99989 0.99990 0.99990 …… 0.99992 0.99992 0.99992

3.8 0.99993 0.99993 0.99993 …… 0.99995 0.99995 0.99995

3.9 0.99995 0.99995 0.99996 …… 0.99996 0.99997 0.99997

En la tabla, la probabilidad que la variable Z sea menor o igual que z1-α, es el


área bajo la curva del punto z1-α hacia el menos infinito.

274 ESTADÍSTICA GENERAL


• Propiedades

a) P(a≤Z≤b)=P(Z≤b)-P(Z<a)
b) P(Z≥a)=1-P(Z<a)
c) P(Z≥-a)=P(Z≤a)
d) P(Z≤-a)=P(Z≥a)

Observación
Dada la siguiente probabilidad: P(Z≤a), con fines prácticos se puede
considerar:

Ejemplo 13.1
Si Z sigue una distribución Normal Estándar, calcule la probabilidad de que Z
sea menor o igual que 1.63.

ESTADÍSTICA GENERAL 275


Solución
La representación gráfica es la siguiente:

-4 1.63 4

La probabilidad buscada, es el área bajo la curva a la izquierda de 1.63. De la


tabla, se tiene que: P(Z≤1.63)=0.94845

Ejemplo 13.2
Si Z sigue una distribución Normal Estándar, calcule la probabilidad de que Z
sea menor o igual a -2.60.

Solución
La representación gráfica es la siguiente:

-4 -2.60 4

La probabilidad buscada, es el área bajo la curva a la izquierda de -2.60. De la


tabla, se tiene que: P(Z≤-2.60)=0.00466

Ejemplo 13.3
Si Z sigue una distribución Normal Estándar, calcule la probabilidad de que Z
tome valores entre -2.53 y 1.87.

276 ESTADÍSTICA GENERAL


Solución
La representación gráfica es la siguiente:

-4 2.53 1.87 4

La probabilidad buscada, es el área bajo la curva entre - 2.53 y 1.87, luego:

P(-2.53≤Z≤1.87)=P(Z≤1.87)-P(Z<-2.53)

De la tabla, se tiene que:

P(-2.53≤Z≤1.87)=0.96926-0.00570

P(-2.53≤Z≤1.87)=0.96356

Ejemplo 13.4
Si Z sigue una distribución Normal Estándar, calcule la probabilidad de que Z
sea mayor a 1.76.

Solución
La representación gráfica es la siguiente:

-4 1.76 4

ESTADÍSTICA GENERAL 277


La probabilidad buscada, es el área bajo la curva a la derecha de 1.76, luego:

P(Z>1.76)=1-P(Z≤1.76)

De la tabla, se tiene que:

P(Z>1.76)=1-0.96080

P(Z>1.76)=0.0392

Teorema 1
Si la variable aleatoria continua X sigue una distribución Normal con parámetros
μ y σ2, la variable aleatoria:

sigue una distribución Normal Estándar, es decir: Z ~ N(0,1)

Observación
El cambio de variable anterior (X → Z) recibe el nombre de estandarización.

Ejemplo 13.5
Si X es una variable aleatoria continua que sigue una distribución Normal con
media igual a 65 y desviación estándar igual a 36, calcule la probabilidad de
que X sea por lo menos 74.
En este ejemplo, se utiliza el Teorema 7.3. Estandarizando, se tiene:

De la tabla, se tiene que:

P(X≥74)=P(Z≥0.25)

P(X≥74)=1-P(Z<0.25)

P(X≥74)=1-0.59871

P(X≥74)=0.40129

278 ESTADÍSTICA GENERAL


Ejemplo 13.6
Resuelva los siguientes problemas:

a) Si X ~ N(25,36), calcule a, si P(X≤a)=0.83


b) Si X ~ N(μ,121), calcule μ, si P(X<360)=0.975
c) Si X ~ N(300,σ2), calcule σ2, si P(X≥380)=0.19

Solución
a) Se sabe que:

Estandarizando:

De la tabla, se tiene que:

b) Se sabe que:

Estandarizando:

De la tabla, se tiene que:

c) Se sabe que:

Estandarizando:

ESTADÍSTICA GENERAL 279


De la tabla, se tiene que:

Ejemplo 13.7
En un restaurante se sabe que el ingreso diario por la venta de comida sigue una
distribución Normal con media igual a 625 soles y desviación estándar igual a
49 soles. Para un día cualquiera:

a) Defina la variable de interés e identifique los parámetros que le corresponden.


b) Calcule la probabilidad de que el ingreso sea a lo más 600 soles.
c) Calcule la probabilidad de que el ingreso este comprendido entre 611 y
639 soles.
d) Se sabe que solo el 4.5% de los días son considerados con la denominación
de excelente con respecto a la venta de comida, calcule el ingreso mínimo
diario para que un día sea considerado con esta denominación.

Solución
a) Sea la variable:
X = Ingreso diario por la venta de comida
μ = 625 y σ2 = 492
b)

De la tabla se tiene que:

280 ESTADÍSTICA GENERAL


c)

De la tabla, se tiene que:

d) Gráficamente:

0.955 0.045
k
k = Ingreso mínimo para que un día sea considerado excelente

Del gráfico:
P(X≤k)=0.955

Estandarizando, se tiene:

En la tabla de distribución Normal Estándar, el valor de z al que le corresponde


un área igual a 0.955 es aproximadamente 1.70. Igualando, se tiene:

El ingreso mínimo diario para que el día sea considerado con la denominación
de excelente con respecto a la venta de comida es 708.3 soles.

ESTADÍSTICA GENERAL 281


13.5 Ejercicios resueltos
1. La empresa Funning For Relaxing es una empresa organizadora de eventos
(específicamente conciertos de rock) que desarrolla sus actividades en el
departamento de Lima. Actualmente, el gerente general de la empresa ha
cerrado un contrato con una de las bandas más grandes de rock, esta llegará
a Lima el próximo año. Por tal motivo, el gerente realizará una gran campaña
de promoción que consistirá en obsequiar el polo oficial del concierto por la
compra de una entrada.

Para esto, el gerente se contactará con el gerente general de la empresa


textil RAY AND CELANE SA para encargarle la elaboración de los polos
oficiales del evento. Entre las razones para contactarse con esta empresa
textil se tienen: el prestigio y la experiencia con la que cuenta la empresa en
este tipo de eventos.

El jefe de producción de la empresa textil confeccionará los polos en tres


tallas: M, L y XL. Dado que los polos serán lo suficientemente anchos, lo que
hará optar por una talla u otra será la estatura del asistente. Por estudios
anteriores, se sabe que las estaturas de los asistentes siguen una distribución
normal con una media de 168.75 cm y una desviación estándar de 10 cm.

En base a los estándares de calidad, el jefe de producción sabe que la talla


M es apropiada para personas con estaturas de hasta 165 cm, la talla L es
apropiada para personas con estaturas entre 165 cm y 180 cm y la talla XL
es apropiada para personas con estaturas superiores a 180 cm.

Si el gerente general de la empresa le solicita al jefe de producción el


porcentaje de cada talla que se confeccionará, ¿qué informará el jefe de
producción?

Si se espera que al concierto asistan por lo menos 16 300 personas,


¿cuál es el número mínimo de polos que se tendrían que confeccionar
para cada talla?

Solución
a) Sea la variable:
X = Estatura de un asistente al concierto de rock
μ = 168.75 y σ2 = 102
Talla M:

282 ESTADÍSTICA GENERAL


El porcentaje de polos de talla M que se confeccionará es 35.197%.
Talla L:

El porcentaje de polos de talla L que se confeccionará es 51.879%.


Talla XL:

El porcentaje de polos de talla XL que se confeccionará es 12.924%.


Gráficamente, se tiene:

51.879%

35.197% 12.924%

165 180

b) Número de polos de talla M:

El número de polos de talla M que se confeccionará es 5737.

ESTADÍSTICA GENERAL 283


Número de polos de talla L:

El número de polos de talla L que se confeccionará es 8456.


Número de polos de talla XL:

El número de polos de talla XL que se confeccionará es 2107.


2. Una empresa cervecera sabe que el consumo de cerveza anual por persona
en una ciudad sigue una distribución Normal con un consumo promedio de
45 litros y una desviación estándar de siete litros. Para una persona de esta
ciudad, se pide:
a) Defina la variable de interés e identifique los parámetros que le
corresponden.
b) Calcule la probabilidad de que su consumo de cerveza de sea por lo
menos 50 litros.
c) Calcule la probabilidad de que su consumo de cerveza este comprendido
entre 30 y 60 litros.
d) Si se considera buenos bebedores al 10% que más consume, ¿cuántos
litros de cerveza como mínimo tendría que consumir para considerarse
dentro de este grupo?

Solución
a) X = Consumo anual de cerveza por persona
μ =45 y σ2 =49

b)

284 ESTADÍSTICA GENERAL


c)

d) Gráficamente:

0.90 0.10
k
k = Consumo mínimo para que un cliente se considere como buen
bebedor

Del gráfico:
P(X≤k)=0.90

Estandarizando:

En la tabla de la distribución Normal Estándar, el valor de z al que le


corresponde un área igual a 0.90 es aproximadamente 1.28. Igualando,
se tiene:

Para que una persona sea considerada como buen bebedor tendría que
consumir anualmente como mínimo 53.96 litros.

ESTADÍSTICA GENERAL 285


13.6 Trabajo colaborativo (Para trabajar en clase)
1. Si la variable aleatoria X sigue una distribución Normal con media 35 y
varianza 25; es decir, X ~ N(35,25), calcule el valor de k para que:

P(35 – k ≤ X ≤ 35 + k) = 0.99672
2. Si Z es una variable aleatoria continua que sigue una distribución Normal
Estándar. Se pide:
a) Calcule la probabilidad de que Z sea mayor a 2.48.
b) Calcule la probabilidad de que Z sea a los más -2.63.
c) Calcule la probabilidad de que Z sea menor a 1.14.
d) Calcule la probabilidad de que Z sea por lo menos -2.88.
e) Calcule la probabilidad de que Z sea por lo menos -1.25 y a lo más 3.52.

3. Resuelva los siguientes problemas:


a) Si X ~ N(45,36), calcule a, si P(X≤a)=0.92
b) Si X ~ N(286,121), calcule a, si P(X>a)=0.04648
c) Si X ~ N(47,25), calcule a, si P(X≤a)=0.97558
d) Si X ~ N(72,81), calcule a, si P(X≥a)=0.105

4. El jefe del área de ventas de una empresa que comercializa artículos de


belleza, realizó un estudio y encontró que el monto de las compras de los
clientes se distribuyen normalmente con una media de 350 soles y una
desviación estándar de 100 soles. De acuerdo a los resultados obtenidos, el
jefe clasificó a los clientes en las siguientes cuatro categorías:

Categoría del cliente Monto de compra


Categoría 1: Cliente A Si la compra es menor a 170
Categoría 2: Cliente B Si la compra varía desde 170 hasta menos de 258
Categoría 3: Cliente C Si la compra varía desde 258 hasta menos de 456
Categoría 4: Cliente D Si la compra es mayor o igual a 456

a) El jefe del área tiene una idea para fidelizar a sus clientes a través de
una campaña de descuentos por sus compras realizadas, esta campaña
durará todo el siguiente mes. Los descuentos establecidos se muestran
en el siguiente cuadro:

Descuentos por tipo de cliente


Cliente A Cliente B Cliente C Cliente D
10 20 40 50

286 ESTADÍSTICA GENERAL


Estime el descuento promedio por compra que ofrecerá la empresa a
sus clientes en el siguiente mes.
(Sugerencia: Puede considerar un número n de clientes)
b) El gerente de la empresa ha decidido reestructurar el cuadro de categorías
de los clientes, considerando tres en vez de cuatro, con la finalidad de
otorgarles “Puntos Bonus” de acuerdo al monto de la compra realizada.
En la primera categoría (Cliente Normal) se considerará al 35% de los
clientes con los menores montos, en la segunda categoría (Cliente Alto)
al 35% siguiente y en la tercera categoría (Cliente Sobresaliente) al
resto, ¿cuáles son los montos que separan una categoría de la otra?

5. Se sabe que el precio diario de una acción de una entidad financiera en la


Bolsa de valores de Lima sigue una distribución Normal con una desviación
estándar de 255 soles. Un agente, especialista en la bolsa de valores, sabe
que en el 96.8% de los días el precio no supera los 4 689.75 soles, se pide:

a) Calcule el precio promedio diario de una acción.


b) Calcule la probabilidad de que en un día cualquiera el precio sea mayor
que 4248 soles.
c) Calcule la probabilidad de que en más de dos de un total de siete días
el precio sea mayor que 4248 soles.

13.7 Trabajo autónomo


1. Resuelva los siguientes problemas:
a) Si X ~ N(275,σ2), calcule σ2, si P(X≥300)=0.12
b) Si X ~ N(μ,150), calcule μ, si P(X<200)=0.85
c) Si X ~ N(160,σ2), calcule σ2, si P(X≥170)=0.00587
d) Si X ~ N(μ,250), calcule μ, si P(X<200)=0.99774

2. En la ciudad de Lima se sabe que el consumo mensual de agua potable por


familia sigue una distribución Normal con una media de 7500 litros.

a) Suponga que la desviación estándar del consumo mensual de agua


potable por familia es igual a 1500 litros.
i. Calcule la probabilidad de que en un mes cualquiera el consumo
mensual de agua potable por familia sea mayor a 8250 litros.
ii. ¿Cuál debe ser el consumo mínimo mensual de una familia para estar
dentro del 7% de las familias que más consume?

ESTADÍSTICA GENERAL 287


b) Calcule la varianza de la distribución, si se sabe que el 0.75% de las
familias tienen un consumo mayor a 7650 litros.

3. La empresa CLEAN UP está dedicada a la producción de productos de


consumo masivo. En su división de artículos de limpieza envasa bolsas de
detergente cuyo contenido neto sigue una distribución normal con una
media de 275 gramos y una desviación estándar de ocho gramos. Para que
una bolsa de detergente cumpla con los controles de calidad, su contenido
debe encontrarse en el siguiente intervalo: [272.5; 277.5]

a) Si se selecciona una bolsa de detergente al azar, ¿cuál es la probabilidad


de que la bolsa no satisfaga los controles de calidad?
b) Si las bolsas de detergente tiene una capacidad máxima de 290 gramos,
¿cuál es probabilidad de que el contenido de una bolsa se derrame?

4. El jefe de Recursos Humanos de una empresa transnacional, realizó un


estudio sobre el tiempo (en minutos), por día, que las secretarias de las
distintas gerencias se dedican a localizar documentos mal guardados,
mal archivados o mal clasificados. Si luego de un análisis de los datos se
concluye que estos tiempos se distribuyen normalmente con un promedio
de 20 minutos y una desviación estándar de 3.3 minutos, responda:

a) El jefe está preocupado por el tiempo que se pierde en estas labores,


razón por la cual decide establecer una política de llamada de atención.
Esta se detalla a continuación: si el tiempo perdido es mayor a 28
minutos, la secretaria será removida de las oficinas de gerencia; si el
tiempo perdido es menor a 10 minutos, no se le aplicará ninguna sanción,
y si el tiempo perdido se encuentra entre 10 y 28 minutos, recibirá una
fuerte llamada de atención. Determine el porcentaje de secretarias que
pertenecen a cada uno de estos tres grupos.
b) Luego de un análisis, el jefe realiza la siguiente clasificación: las secretarias
poco distraídas representan el 45%, las secretarias medianamente
distraídas representan el 35%, y el resto de ellas son las secretarías muy
distraídas. Determine los límites de tiempo que separan una clasificación
de la otra.
5. Si la variable aleatoria X sigue una distribución Normal con media µ varianza
σ2, es decir, X ~ N (µ, σ2), calcule los parámetros µ y σ2 si se sabe que:
P(X≤115)=0.85 y P(X≥120)=0.025

288 ESTADÍSTICA GENERAL


Lección 14

Distribuciones: Chi-Cuadrado,
T-Student y F-Fisher.
En esta lección se estudiarán las distribuciones Chi-Cuadrado, T-Student y
F-Fisher.

14.1 Distribución Chi – Cuadrado


Una variable aleatoria continua X sigue una distribución Chi-Cuadrado con
parámetro r y se representa por X~ , si su función de densidad de probabilidad
está dada por:

Donde:

r = Grados de libertad

14.1.1 Gráfica de la distribución Chi – Cuadrado


La gráfica de la distribución Chi-Cuadrado es asimétrica y tiene la siguiente
forma:

0,24 n=6
0,22
0,20
0,18
0,16
0,14
0,12 n = 12
0,10
0,08 n = 24
0,06
0,04
0,02
0,00
10 20 30 40

ESTADÍSTICA GENERAL 289


14.1.2 Medidas de resumen para la distribución Chi-Cuadrado
Si una variable aleatoria continua X sigue una distribución Chi-Cuadrado con r
grados de libertad, se cumple:

Esperanza matemática

E(X)=μ=r
Varianza

V(X)=σ2=2r

14.1.3 Relación entre las distribuciones Normal y Chi – Cuadrado


• Si Z sigue una distribución Normal Estándar, Z2~ X2
• Si son k variables aleatorias independientes; tal que,
para cada i = 1,2,3,…,k, se cumple que:

• Si x1, x2, ... , xk son variables aleatorias independientes con distribuciones


Chi-Cuadrado con ri grados de libertad; es decir, para cada i = 1,2,3,…,k,
se cumple:

290 ESTADÍSTICA GENERAL


14.1.4 Uso de la tabla de la distribución Chi – Cuadrado

G. L. Valores de la probabilidad: p

r 0.001 0.005 0.01 0.99 0.995 0.999


1 0.000 0.000 0.000 …… 6.635 7.879 10.828
2 0.002 0.010 0.020 …… 9.210 10.597 13.816
3 0.024 0.072 0.115 …… 11.345 12.838 16.266
4 0.091 0.207 0.297 …… 13.277 14.860 18.467
5 0.210 0.412 0.554 …… 15.086 16.750 20.515
6 0.381 0.676 0.872 …… 16.812 18.548 22.458
7 0.598 0.989 1.239 …… 18.475 20.278 24.322
8 0.857 1.344 1.646 …… 20.090 21.955 26.124
9 1.152 1.735 2.088 …… 21.666 23.589 27.877
… … … … …… … … …

25 8.649 10.520 11.524 …… 44.314 46.928 52.620


26 9.222 11.160 12.198 …… 45.642 48.290 54.052
27 9.803 11.808 12.879 …… 46.963 49.645 55.476
28 10.391 12.461 13.565 …… 48.278 50.993 56.892
29 10.986 13.121 14.256 …… 49.588 52.336 58.301
30 11.588 13.787 14.953 …… 50.892 53.672 59.703

Ejemplo 14.1
Si X es una variable aleatoria continua que sigue una distribución Chi-Cuadrado
con 25 grados de libertad, calcule la probabilidad de que X sea menor o igual a
44.314

Solución
La probabilidad buscada, es el área bajo la curva a la izquierda de 44.314;
es decir:

ESTADÍSTICA GENERAL 291


0 44.314

De la tabla, se tiene que:

P(X≤44.314)=0.99

Ejemplo 14.2
Si es una variable aleatoria continua que sigue una distribución Chi-Cuadrado
con 15 grados de libertad, calcule la probabilidad de que sea menor o igual a
6.262.

Solución
La probabilidad buscada, es el área bajo la curva a la izquierda de 6.262; es
decir:

0 6.262

De la tabla, se tiene que:

P(X≤6.262)=0.025

292 ESTADÍSTICA GENERAL


Ejemplo 14.3
Si X es una variable aleatoria continua que sigue una distribución Chi-Cuadrado
con 16 grados de libertad, calcule la probabilidad de que X tome valores entre
9.312 y 20.465.

Solución
La probabilidad buscada, es el área bajo la curva entre 9.312 y 20.465; es decir:

0 9.312 20.465
De la tabla, se tiene que:

P(9.312≤X≤20.465)=P(X≤20.465)-P(X≤9.312)

P(9.312≤X≤20.465)=0.80-0.10

P(9.312≤X≤20.465)=0.70

Ejemplo 14.4
Si X es una variable aleatoria continua que sigue una distribución Chi Cuadrado
con 23 grados de libertad, calcule la probabilidad de que X sea mayor a 26.018.

Solución
La probabilidad buscada, es el área bajo la curva a la derecha de 26.018; es decir:

0 26.018

ESTADÍSTICA GENERAL 293


De la tabla, se tiene que:

P(X>26.018)=1-P(X≤26.018)

P(X>26.018)=1-0.7

P(X>26.018)=0.3

14.2 Distribución T–Student


Una variable aleatoria continua X sigue una distribución T-Student con parámetro
r y se representa por X ~ tr , si su función de densidad de probabilidad está dada
por:

donde: r = Grados de libertad.

14.2.1 Gráfica de la distribución T-Student


La gráfica de la distribución T-Student tiene forma acampanada y es simétrica
con respecto a cero; tal como se muestra a continuación:

14.2.2 Propiedades de la distribución T-Student


• La gráfica de una variable con distribución T-Student presenta más
dispersión que la gráfica de una variable con distribución Normal Estándar.

294 ESTADÍSTICA GENERAL


• Si r ---> +∞, la varianza de una variable con distribución T-Student tiende
a uno.

• Si una variable aleatoria continua X sigue una distribución T-Student con


r grados de libertad (r > 30), la distribución de esta variable se aproxima
a una Normal Estándar.

14.2.3 Medidas de resumen para la distribución T-Student


Si una variable aleatoria continua X sigue una distribución T-Student con
r grados de libertad, se cumple:

Esperanza matemática

E(X)=μ=0

Varianza

Teorema 2
Si Z y V son dos variables aleatorias continuas independientes; tales que:

y , entonces la variable aleatoria

donde:

ESTADÍSTICA GENERAL 295


14.2.4 Uso de la tabla de la distribución T-Student

G.L. Valores de probabilidad: p

n 0.75 0.8 0.85 0.9 0.99 0.995 0.9995


1 1.000 1.376 1.963 3.078 …… 31.821 63.657 636.619
2 0.816 1.061 1.386 1.886 …… 6.965 9.925 31.599
3 0.765 0.978 1.250 1.638 …… 4.541 5.841 12.924
4 0.741 0.941 1.190 1.533 …… 3.747 4.604 8.610
5 0.727 0.920 1.156 1.476 …… 3.365 4.032 6.869

6 0.718 0.906 1.134 1.440 …… 3.143 3.707 5.959


7 0.711 0.896 1.119 1.415 …… 2.998 3.499 5.408
8 0.706 0.889 1.108 1.397 …… 2.896 3.355 5.041
9 0.703 0.883 1.100 1.383 …… 2.821 3.250 4.781
10 0.700 0.879 1.093 1.372 …… 2.764 3.169 4.587
… … … … … …… … … …

26 0.684 0.856 1.058 1.315 …… 2.479 2.779 3.707


27 0.684 0.855 1.057 1.314 …… 2.473 2.771 3.690
28 0.683 0.855 1.056 1.313 …… 2.467 2.763 3.674
29 0.683 0.854 1.055 1.311 …… 2.462 2.756 3.659
30 0.683 0.854 1.055 1.310 …… 2.457 2.750 3.646

Ejemplo 14.5
Si X es una variable aleatoria continua que sigue una distribución T–Student
con 20 grados de libertad, calcule la probabilidad de que X sea menor o igual
a -2.086.

Solución
La probabilidad buscada es el área bajo la curva a la izquierda de -2.086 con 20
grados de libertad; es decir:

296 ESTADÍSTICA GENERAL


-2.086 0

De la tabla se tiene que: P[X≤-2.086]=0.025

Ejemplo 14.6
Si X es una variable aleatoria continua que sigue una distribución T–Student con
18 grados de libertad, calcule la probabilidad de que X sea menor o igual a 1.734.

La probabilidad buscada es el área bajo la curva a la izquierda de 1.734 con 18


grados de libertad; es decir:

0 1.734

De la tabla, se tiene que: P(X≤1.734)=0.95

Ejemplo 14.7
Si X es una variable aleatoria continua que sigue una distribución T–Student
con 20 grados de libertad, calcule la probabilidad de que X tome valores entre
-2.528 y 1.994.

Solución
La probabilidad buscada es el área bajo la curva entre -2.528 y 1.994 con 20
grados de libertad; es decir:

ESTADÍSTICA GENERAL 297


-2.528 0 1.994
De la tabla, se tiene que:

P(-2.528≤X≤1.994)=P(X≤1.994)-P(X<-2.528)

P(-2.528≤X≤1.994)=0.97-0.01

P(-2.528≤X≤1.994)=0.96

Ejemplo 14.8
Si X es una variable aleatoria continua que sigue una distribución T–Student con
28 grados de libertad, calcule la probabilidad de que X sea por lo menos 1.701.

Solución
La probabilidad buscada es el área bajo la curva a la derecha de 1.701 con 28
grados de libertad; es decir:

0 1.701

De la tabla, se tiene que:


P(X≥1.701)=1-P(X<1.701)

P(X≥1.701)=1-0.95

P(X≥1.701)=0.05

298 ESTADÍSTICA GENERAL


14.3 Distribución F-Fisher
Una variable aleatoria continua X sigue una distribución F-Fisher con parámetros
r1 y r2, y se representa por X ~F( r1 y r2) si su función de densidad de probabilidad
está dada por:

Donde r1 y r2, son enteros positivos y representan los grados de libertad.

14.3.1 Gráfica de la distribución F-Fisher


La gráfica de la distribución F-Fisher es asimétrica y tiene la siguiente forma:

14.3.2 Medidas de resumen para la distribución F-Fisher


Si una variable aleatoria continua X sigue una distribución F-Fisher con r1 y r2
grados de libertad, se cumple:

Esperanza matemática

Varianza

ESTADÍSTICA GENERAL 299


14.3.3 Relación entre las distribuciones F-Fisher y Chi–Cuadrado
Si M y N son dos variables aleatorias continuas independientes tales que
y , la variable aleatoria continua X, definida como:

sigue una distribución F con parámetros r1 y r2

14.3.4 Uso de la tabla de la distribución F-Fisher

300 ESTADÍSTICA GENERAL


Ejemplo 14.9
Si X sigue una distribución F–Fisher con 7 y 8 grados de libertad, calcule el valor
de X que deja a su derecha un área igual a 0.05.

Solución
El valor de X que deja a su derecha un área igual a 0.05 está dado por el punto
F(7; 8). Gráficamente, se tiene:

0 F(7,8; 0.05)

De la tabla, se tiene que: F(7; 8 ; 0.05) = 3.50

Ejemplo 14.10
Si X sigue una distribución F–Fisher con 16 y 25 grados de libertad, calcule el
valor de X que deja a su derecha un área igual a 0.025.

Solución
El valor de X que deja a su derecha un área igual a 0.025 está dado por el punto
F(16; 25). Gráficamente, se tiene:

0 F(16, 25; 0.025)

De la tabla, se tiene que: F(16; 25; 0.025) = 2.38

ESTADÍSTICA GENERAL 301


14.4 Ejercicios resueltos
1. Si X sigue una distribución Chi-Cuadrado con 13 grados de libertad, se pide:
a) Calcule la probabilidad de que sea mayor que 15.119.
b) Calcule la probabilidad de que sea menor que 24.736.
d) Calcule la probabilidad de que sea menor que 12.340 y mayor que 4.107.

Solución
a) Se pide:
P(X>15.119)=1-P(X≤15.119)
P(X>15.119)=1-0.7
P(X>15.119)=0.30
b) Se pide:
P(X<24.736)=0.975
c) Se pide:
P(4.107≤X ≤12.340)= P(X≤12.340)-P(X≤4.107)
P(4.107≤X ≤12.340)= 0.50-0.01=0.49
P(4.107≤X ≤12.340)= 0.49

2. Si X sigue una distribución T-Student con 28 grados de libertad, se pide:


a) Calcule la probabilidad de que X sea por lo menos 1.960
b) Si P(X>k)=0.92, calcule k.

Solución
a) Se pide:
P(X≥1.960)=1-P(X<1.960)
P(X≥1.960)=1-0.97
P(X≥1.960)=0.03
b) Se tiene:
P(X>k)=0.92
1-P(X≤k)=0.92
P(X≤k)=0.08
De la tabla: k=-1.4434

14.5 Trabajo colaborativo (Para trabajar en clase)


1. Calcule k en los siguientes casos:
a) Si

302 ESTADÍSTICA GENERAL


b) Si
c) Si
2. Resuelva los siguientes problemas:
a) Si
b) Si
c) Si
3. Si X sigue una distribución T-Student con 23 grados de libertad, calcule:
a) P(X≤1.9782)
b) P(X>1.4520)
c) P(X≥-1.8316)
4. Si X sigue una distribución T-Student con 17 grados de libertad, calcule:
a) P(-1.8619≤X≤2.0150)
b) P(X>-1.4694)
c) P(-2.5669≤X≤2.898)
5. En cada uno de los siguientes casos, calcule el valor que corresponde en la
tabla de la distribución F-Fisher.
a) F(8; 19; 0.05)
b) F (20; 24; 0.025)

c) F(7; 17; 0.05)

14.6 Trabajo autónomo


1. Resuelva los siguientes problemas:
a) Si
b) Si
c) Si
2. Calcule k en los siguientes casos:
a) Si
b) Si
c) Si
3. Si X sigue una distribución T-Student con 14 grados de libertad, calcule:
a) P(X≤1.8875)
b) P(X>-1.4839)

ESTADÍSTICA GENERAL 303


4. En cada uno de los siguientes casos, calcule el valor que corresponde en la
tabla de la distribución F-Fisher.
a) F(14; 25; 0.05)
b) F(18; 11; 0.025)

c) F(9; 22; 0.05)

5. Si X sigue una distribución T-Student con r grados de libertad, calcule k:


a) Si X ~ t12 y P(X≤k)=0.995
b) Si X ~ t19 y P(X>k)=0.96
c) Si X ~ t4 y P(X>k)=0.75

14.7 Problemas de reforzamiento del capítulo


1. Se sabe que los ingresos mensuales del personal del área de Capital Humano
de una empresa minera se distribuyen normalmente con una media de 7650
soles y una varianza de 850 soles2. Si se selecciona una persona de esta área,
se pide:

a) Defina la variable de interés e identifique los parámetros que le


corresponden.
b) Calcule la probabilidad de que reciba un ingreso de a lo más 7550 soles.
c) Calcule la probabilidad de que reciba un ingreso entre 7599 y 7725 soles.
2. Si X sigue una distribución T-Student con 11 grados de libertad, calcule:
a) P(X≤1.9284)
b) P(X>0.8755)
c) P(X≥-1.3634)
3. Calcule k en los siguientes casos:
a)
b)
c)
4. El dueño de una distribuidora de productos alimentarios determinó que la
demanda anual de aceite vegetal (en litros) por familia en una ciudad se
distribuye normalmente con media igual a 8.5 litros y varianza igual a 4
litros2. Para una familia de esta ciudad, se pide:

a) Defina la variable de interés e identifique los parámetros que le


corresponden.

304 ESTADÍSTICA GENERAL


b) Calcule la probabilidad de que la demanda anual de aceite vegetal
supere los 9.3 litros.
c) Si al 18% de las familias que consumen menos aceite vegetal se les
considera como bajos consumidores, ¿cuantos litros de aceite vegetal
como máximo tendrían que consumir para considerarse dentro de
este grupo?

14.8 Portafolio (para subir al campus virtual)


Resuelva los siguientes problemas utilizando el MINITAB:

1. El gerente general de una compañía importadora de celulares garantiza que


el tiempo de vida de sus baterías siguen una distribución Normal con una
media igual a 2.5 años y una desviación estándar igual a 0.8 años. Si se
selecciona una batería al azar, se pide:
a) Calcule la probabilidad de que su tiempo de vida sea mayor a tres años.
b) Calcule la probabilidad de que su tiempo de vida se encuentre en el
siguiente intervalo:

c) Calcule el tiempo mínimo de vida de una batería para que se encuentre


dentro del 28% de las baterías con mayor duración.

2. Si X sigue una distribución T-Student con r grados de libertad, calcule k:


a) Si X ~ t6 y P(X≤k)=0.96
b) Si X ~ t15 y P(X>k)=0.85
c) Si X ~ t19 y P(X>k)=0.99

3. Calcule k en los siguientes casos:


a)
b)
c)
4. En cada uno de los siguientes casos, calcule el valor que corresponde en la
tabla de la distribución F-Fisher.
a) F(4; 6; 0.05)
b) F(10; 21; 0.025)

c) F(30; 27; 0.05)

d) F(9; 16; 0.025)

ESTADÍSTICA GENERAL 305


14.9 Distribuciones continuas (normal) con MINITAB
1. Si X es una variable aleatoria continua que sigue una distribución Normal
Estándar, calcule P(X≤5) utilizando el Minitab.
Para esto, seleccione Calc/Distribuciones de probabilidad/Normal:

Ahora, ingrese la información correspondiente; tal como, se muestra a


continuación:

306 ESTADÍSTICA GENERAL


Los resultados se presentan en la ventana sesión:

2. Si X es una variable aleatoria continua que sigue una distribución Normal


con media igual a seis y desviación estándar igual a cuatro, calcule P(X≤-4),
P(X≤5), P(X≤10) y P(X≤13) utilizando el Minitab.

Para esto, ingrese los datos en una de las columnas de la ventana Hoja de
trabajo (-4, 5, 10 y 13) y seleccione Calc/Distribuciones de probabilidad/
Normal. Luego, ingrese la información correspondiente; tal como, se muestra
a continuación:

Los resultados se presentan en la ventana sesión:

ESTADÍSTICA GENERAL 307


3. Si X es una variable aleatoria continua que sigue una distribución Normal
Estándar, calcule el valor c para el cual se cumple: P(X≤c)= 0.95.

Para esto, seleccione Calc/Distribuciones de probabilidad/Normal. Luego,


ingrese la información correspondiente; tal como, se muestra a continuación:

Los resultados se presentan en la ventana sesión:

De donde, se observa que el valor de c es 1.64485.

14.10 Bibliografía
1. Meza de Castillo, E. (1995). Probabilidad. Consejo Nacional de Ciencia y
Tecnología.
2. Wackerly, Mendenhall y Scheaffer (2009). Estadística Matemática con
Aplicaciones. Sétima edición. Cengage Learning.
3. Anderson, Sweeney y Williams (2008). Estadística para Administración y
Economía. Décima edición. Cengage Learning.

308 ESTADÍSTICA GENERAL


Capítulo 7
ESTIMACIÓN POR
INTERVALOS

1–α

α/2 α/2 Z
-Z1-α/2 0 Z1-α/2

Capacidades por desarrollar


Al finalizar el capítulo, el estudiante estará en capacidad de:

• Estimar intervalos de confianza para la media, proporción y varianza


poblacional en problemas contextualizados.
• Estimar intervalos de confianza para el cociente de varianzas poblacionales
en problemas contextualizados.
• Estimar intervalos de confianza para la diferencia de medias y proporciones
poblacionales en problemas contextualizados.
• Calcular el tamaño de una muestra en problemas contextualizados.

Motivación
En una editorial están interesados en sacar a la venta una nueva revista
de negocios. Para esto, el jefe de investigación de la editorial realizó una
encuesta en todo Lima y encontró que 300 de un total de 2500 personas

ESTADÍSTICA GENERAL 309


comprarían la revista. Estime un intervalo con un 99% de confianza para la
proporción poblacional de personas que comprarían está revista.

Al finalizar el capítulo, el estudiante estará en capacidad de responder esta


pregunta y otras más, utilizando los conceptos básicos y la organización de
datos.

Saberes previos
• Estadística Descriptiva
• Noción de probabilidad y variable aleatoria
• Distribuciones discretas y continuas especiales

310 ESTADÍSTICA GENERAL


Lección 15
Estimación de parámetros.
Estimación por intervalos para la
media poblacional (µ)
15.1 Estimación puntual de parámetros
Sea X1, X2, X3, … Xn una muestra aleatoria de tamaño n que se obtiene de una
población con función de densidad f(X,θ) cuyo parámetro es θ. Se denomina
estimador puntual del parámetro θ a la estadística θ^ cuyo valor brinda una
estimación del parámetro.

Por ejemplo:

PARÁMETRO ESTIMADOR
Media poblacional: µ Media muestral: x̅
Varianza poblacional: σ2
Varianza muestral: s2
Proporción poblacional: π Proporción muestral: p

No siempre un estimador muestral proporciona una buena estimación del


parámetro; para ser un buen estimador, el valor calculado con la muestra debe
ser muy cercano al valor real del parámetro.

15.2 Estimación por intervalo


En numerosas situaciones, una estimación puntual no brinda demasiada
información sobre el parámetro que se desea estimar por ser un valor único. Para
superar esta situación, se obtiene un intervalo que se conoce como intervalo de
confianza, el cual contiene el parámetro con un nivel de confianza establecido.

ESTADÍSTICA GENERAL 311


15.3 Intervalo de confianza para la media poblacional ( μ )
Se presentan los siguientes casos:

CASO I: Intervalo de confianza para la media poblacional ( μ ) cuando la


varianza de la población ( σ 2 ) es conocida
Sea X1, X2, X3, … Xn una muestra aleatoria tomada de una población Normal con
media desconocida y varianza σ 2 conocida, donde el valor de la media se
n

estima mediante x=
∑ i =1
Xi
.
n
Para la construcción de un intervalo de confianza para la media poblacional ( μ )
se utiliza el valor estandarizado de la media muestral ( x ) , así:

x−μ
Z=
σ/ n

donde Z sigue una distribución normal estándar, es decir: Z ~ N ( 0, 1) .

Para un nivel de confianza de 1 − α y por la simetría de la distribución, se cumple:

1–α

α/2 α/2 Z
-Z1-α/2 0 Z1-α/2

El intervalo con un nivel de confianza de (1 − α ) x 100% para la media poblacional


, cuando la varianza poblacional σ 2 es conocida, es:
σ σ
< x − z1−α /2 ≤ μ ≤ x + z1−α /2 >
n n

312 ESTADÍSTICA GENERAL


Forma resumida
σ
IC ( μ ) : x ± z1−α /2
n

Ejemplo 15.1
El jefe de producción de una fábrica desea estimar el peso promedio de una
bolsa de azúcar en un lote de producción. Para esto, tomó una muestra aleatoria
de 100 artículos y obtuvo un peso promedio de 650 g. Estime un intervalo de
confianza con un 95% si se sabe que la desviación estándar del peso de las
bolsas de azúcar es 150 g.

Solución
Sea la variable:
X = Peso de
dellaartículo
bolsa de azúcar

Datos:
n = 100
x = 650
σ = 150
1 − α = 0.95 → α = 0.05
El intervalo de confianza se obtiene de la siguiente manera:

× ×

620.6 ≤ μ ≤ 679.4
El valor de Z1−α /2 = Z0.975 = 1.96 se obtiene de la tabla de la distribución normal
estándar.

ESTADÍSTICA GENERAL 313


0.95

0.025 0.025
-1.960 0 1.960
0.975

CASO II: Intervalo de confianza para la media poblacional ( ) cuando la varianza


de la población ( σ 2 ) es desconocida y el tamaño de la muestra es menor o igual
que 30

Sea X1, X2, … , Xn una muestra aleatoria tomada de una población Normal con
media y varianza σ 2 desconocida.

Los estimadores puntuales de la media y la varianza poblacional son:

Para un nivel de confianza de 1 − α y por la simetría de la distribución, se cumple:

1–α

α/2 α/2 T
-t1-α/2; n-1 0 t1-α/2; n-1

314 ESTADÍSTICA GENERAL


El intervalo con un nivel de confianza de (1 − α ) x 100% para la media poblacional
, cuando la varianza poblacional σ 2 es desconocida y n ʺ 30 es:

Forma resumida

Ejemplo 15.2
En la cafetería de la universidad se venden hamburguesas de carne cuyo peso
ofrecido es de 200 g. Un estudiante de gastronomía piensa que el peso de
una hamburguesa es menor que lo ofrecido; por tal motivo, tomó una muestra
aleatoria de siete hamburguesas y obtuvo los siguientes resultados:

203, 180, 195, 205, 176, 196, 188

Estime un intervalo con un 90% de confianza para el peso promedio de una


hamburguesa de carne.

Solución

Sea la variable:
X = Peso de la hamburguesa de carne

Datos:
n=7
x = 191.86
s = 11.04
1 − α = 0.90 → α = 0.10
El intervalo de confianza se obtiene de la siguiente manera:

ESTADÍSTICA GENERAL 315


183.75 ≤ ≤ 199.97

El valor de t1−α /2;n−1 = t0.95; 6 = 1.943 se obtiene de la tabla de la distribución T-Student.

0.90

0.05 0.05
-1.943 0 1.943
0.95

CASO III: Intervalo de confianza para la media poblacional ( ) cuando la varianza


de la población ( σ 2 ) es desconocida y el tamaño de la muestra es mayor que 30

Cuando el tamaño de muestra es grande, la distribución T–Student tiende a una


distribución normal estándar. Para n > 30 , el intervalo se calcula de la siguiente
manera:

Forma resumida

316 ESTADÍSTICA GENERAL


Ejemplo 15.3
El entrenador de un equipo de básquet desea estimar la estatura promedio de
los jugadores que se han presentado a las pruebas de preselección para formar
parte del equipo. Para esto, el entrenador tomó una muestra aleatoria de 50
postulantes y obtuvo una talla promedio de 182 cm con una varianza de 9 cm2.
Estime un intervalo de confianza para la estatura promedio de los jugadores
que se han presentado a las pruebas de preselección con un nivel de confianza
del 98%.

Solución
Sea la variable:
X = Estatura del postulante

Datos:
n = 50
x = 182
s2 = 9 → s = 3

1 − α = 0.98 → = 0.02

El intervalo de confianza se obtiene de la siguiente manera:

181.01 ≤ ≤ 182.99

El valor de Z1−α /2 = Z0.99 = 2.33 se obtiene de la tabla de la distribución normal


estándar.

ESTADÍSTICA GENERAL 317


0.98

0.01 0.01

-2.33 0 2.33
0.99

15.4 Ejercicios resueltos


1. Con la finalidad de abrir una pollería en el distrito de San Miguel, el gerente
general de una cadena de pollerías desea estimar, entre otras características,
el ingreso promedio mensual de todas las pollerías que funcionan en dicho
distrito. Para esto, registró el ingreso del mes anterior en nueve pollerías y
obtuvo un ingreso promedio de 9000 soles con una desviación estándar
de 1200 soles. Estime un intervalo con un 95% de confianza para el ingreso
promedio de todas las pollerías y diga si el gerente abrirá la pollería en dicho
distrito.

Se sabe que el gerente solo abrirá la pollería si el ingreso promedio mensual


de todas las pollerías que funcionan en dicho distrito es mayor a 10000 soles.
Suponga que el ingreso mensual sigue una distribución normal.

Solución

Sea la variable:

X = Ingreso mensual de las pollerías

Datos:
n=9
x = 9000
s = 1200
1 − = 0.95 0.05

El intervalo de confianza se obtiene de la siguiente manera:

318 ESTADÍSTICA GENERAL


8077.6 ≤ ≤ 9922.4

El valor de t1−α /2;n−1 = t0.975;8 = 2.306 se obtiene de la tabla de la distribución


T-Student.

2. Un estudiante de psicología de la Universidad San Ignacio de Loyola realizó


un estudio sobre el coeficiente intelectual de los estudiantes de su facultad.
Para esto, seleccionó una muestra aleatoria de 35 estudiantes y obtuvo un
coeficiente intelectual promedio de 100 puntos. Si el puntaje obtenido sigue
una distribución normal con una varianza de 100 puntos2.

a) Estime un intervalo de confianza para el coeficiente intelectual promedio


de todos los estudiantes de la facultad con un nivel de confianza del 99%.

b) En otro estudio similar, el estudiante seleccionó un tamaño de muestra de


25 estudiantes y obtuvo un promedio de 105 puntos con una desviación
estándar de 9 puntos. Con estos datos, el intervalo obtenido es <101.7096,
108.2904>. Indique el nivel de confianza que utilizó.

Solución

a) Sea la variable:

X = Coeficiente intelectual del estudiante

Datos:
n = 35
x = 100
σ = 10
1 − α = 0.99 0.01

El intervalo de confianza se obtiene de la siguiente manera:

ESTADÍSTICA GENERAL 319


95.6390 ≤ ≤ 104.3610

El valor Z1−α /2 = Z0.995 = 2.58 de se obtiene de la tabla de la distribución


normal estándar.

b) Datos
n = 25
x = 105
s=9
101.7096 ≤ ≤ 108.2904

El intervalo de confianza que corresponde es:

A partir del límite inferior del intervalo, se tiene:

105 − 101.7096
t1−α /2;24 = = 1.828
9
25

De la tabla de la distribución T-Student, se obtiene:


1 − α / 2 = 0.96

α = 0.08

Luego: 1 − α = 0.92.

Por lo tanto, el nivel de confianza que se utilizó es 92%.

320 ESTADÍSTICA GENERAL


15.5 Trabajo colaborativo (para trabajar en clase)
1. Un estudiante está interesado en estimar el tiempo promedio que le toma
trasladarse de su casa a la universidad. Para esto, el estudiante registró el
tiempo que le tomó movilizarse durante 20 días y obtuvo un tiempo promedio
de 37 minutos con una desviación estándar de 7 minutos. Estime el tiempo
promedio que le toma a un estudiante trasladarse de su casa a la universidad
con un nivel de confianza del 95%.

(Suponga que el tiempo que le toma al estudiante trasladarse de su casa a la


universidad sigue una distribución normal)

2. El dueño de un hotel cree que la mayoría de las personas que se hospedan


son jóvenes cuya edad promedio no supera los 25 años. Para verificar su
creencia, el dueño tomó una muestra aleatoria de 36 personas y obtuvo una
edad promedio de 24.5 años con una desviación estándar igual a 3.5 años.

a) Defina la variable de interés.


b) Defina el parámetro de interés.
c) Estime un intervalo con un 99% de confianza.

3. Para decidir si un programa de ayuda social en una zona del país se justifica,
un funcionario del gobierno obtuvo información sobre el ingreso mensual
de las familias de dicha zona para luego tomar una decisión al respecto. Si
se tiene evidencia de que el ingreso total mensual en esta zona es menor a
1000000 soles se considerará a la zona como susceptible de ayudad social.
Para esto, se seleccionó una muestra aleatoria de 35 familias de un total
de 1000 y se obtuvo un ingreso mensual promedio de 650 soles con una
desviación estándar de 100 soles. Obtenga un intervalo de confianza para
estimar el ingreso total mensual de las familias de dicha zona con un nivel de
confianza del 95%.

4. El director de una empresa de energía eléctrica quiere verificar el consumo


promedio diario de luz eléctrica, en vatios, de un nuevo complejo habitacional
en la cuidad. Para esto, se tomó una muestra aleatoria de 18 departamentos y
se obtuvo un consumo promedio diario de 17870 vatios con una desviación
estándar de 2000 vatios.

a) Defina la variable de interés.


b) Defina el parámetro de interés.
c) Estime un intervalo con un 96% de confianza para estimar el consumo
diario promedio de luz eléctrica, en vatios, en dicho complejo habitacional.

5. En una cadena de restaurantes, el chef a cargo de las compras y el control


de calidad de los productos recibidos, cree que el lote de sacos de harina

ESTADÍSTICA GENERAL 321


que compraron no cumple con el peso establecido de 50 kg por saco. Para
verificar sus sospechas, el chef tomó una muestra aleatoria de 13 sacos de
harina y registró los siguientes pesos:

50.2 49.8 48.3 49.59 52.0 49.5 50.3 50.1 48.4 49.9 49.1 49.1 49.8

Con esta información y con un nivel de confianza del 90%, ¿es posible
confirmar que el chef está en lo correcto y que decisión tomará?

15.6 Trabajo autónomo


1. Un deportista está interesado en obtener información sobre el precio
promedio de una trotadora eléctrica con las siguientes características: 12
niveles de inclinación, velocidad máxima de 18 km/hora y un peso máximo
de 130 kg. Para esto, seleccionó una muestra aleatoria de 12 máquinas con
dichas características y obtuvo un precio promedio de 3850 soles con una
desviación estándar de 350 soles. En base a estos resultados, resuelva:

a) Defina la variable de interés.


b) Defina el parámetro de interés.
c) Estime un intervalo con un 99% de confianza para el precio promedio de
este modelo de trotadora eléctrica.

2. El director municipal de transporte de la ciudad de Lima cree que el ingreso


promedio mensual de los conductores de transporte público es menor que
2500 soles. Para verificar sus creencias, el director tomó una muestra aleatoria
de 25 conductores de transporte público y obtuvo un ingreso promedio de
2480 soles con una desviación estándar de 225 soles.

a) Estime un intervalo de confianza para el sueldo promedio de los


conductores de transporte público con un nivel de confianza del 94%.
b) El director municipal no quedo conforme con el primer estudio; por lo que,
tomó otra muestra de 25 conductores y obtuvo un ingreso promedio de
2450 soles con una desviación estándar de 100 soles y obtuvo el siguiente
intervalo: <2410.8, 2489.2>. ¿Qué nivel de confianza utilizó el director para
obtener este intervalo?

3. El tiempo promedio que toma producir un artículo en una fábrica es 12 minutos.


Con la finalidad de disminuir el tiempo promedio de producción, el jefe de
producción realizó algunos reajustes en dicho proceso, luego seleccionó una
muestra aleatoria de 16 artículos y obtuvo los siguientes resultados:

11.6 11.8 11.7 11.6 11.8 11.3 11.9 11.9


11.9 11.5 11.6 12.7 11.6 11.5 12.0 11.7

322 ESTADÍSTICA GENERAL


Estime un intervalo para el tiempo promedio que toma producir un artículo.
Utilice un nivel de confianza del 90%.

4. Un chef desea estimar el peso promedio de los tubérculos que compra a su


proveedor. Para esto, el chef tomó una muestra aleatoria de 40 tubérculos
y obtuvo un peso promedio de 36 gramos con una desviación estándar de
siete gramos.

Estime un intervalo de confianza para el peso promedio de los tubérculos


con un nivel de confianza del 98%.

5. El gerente de un banco desea estimar el saldo promedio de las cuentas de


ahorro de sus clientes. Por esta razón, el gerente seleccionó una muestra
aleatoria de 100 de ellos y obtuvo, un saldo promedio de 680 soles y un
intervalo de confianza cuyos límites son 669.185 y 690.815 soles. ¿Qué nivel
de confianza utilizó el gerente si se sabe que la desviación estándar de los
saldos de las cuentas de ahorro es 35 soles?

ESTADÍSTICA GENERAL 323


Lección 16
Estimación por intervalos para
la varianza poblacional (σ ) y la 2

proporción poblacional ( π )
16.1 Intervalo de confianza para la varianza poblacional (σ 2 )
Sea X1, X2, … , Xn una muestra aleatoria tomada de una población Normal con media
desconocida y varianza desconocida σ 2 . Como se mencionó anteriormente,
el estimador puntual de la media poblacional ( ) es la media muestral x y el
estimador puntual de varianza poblacional (σ 2 ) es la varianza muestral s 2 .

Para la construcción de un intervalo de confianza para varianza poblacional


( )
σ 2 se utiliza la siguiente expresión:

χ 2
=
( n − 1) s 2

~ χ n2−1
2
σ

donde χ 2 sigue una distribución chi-cuadrado con n-1 grados de libertad, es


2 2
decir: χ ~ χ n−1 . Para un nivel de confianza de 1 − α , se tiene:

1–α

α/2 α/2
0 X21-α/2; n-1 X21-α/2; n-1

324 ESTADÍSTICA GENERAL


El intervalo con un nivel de confianza de 1 − α para la varianza poblacional es:

( n − 1) s 2

≤σ 2

( n − 1) s 2

χ 12−α /2;n−1 χ α2 /2;n−1

Ejemplo 16.1
Un empresario quiere estimar la varianza de la utilidad de los activos financieros
que poseen las empresas. Para esto, se seleccionó una muestra aleatoria de 18
empresas financieras y obtuvo una varianza de 102400 dólares2. Con un 98% de
confianza, estime la varianza de la utilidad de los activos financieros.

Solución
Sea la variable:
X = Utilidad de los activos financieros

Datos:
n = 18

s 2 = 102400 dólares 2 .

1− = 0.98 0.02

El intervalo de confianza se obtiene de la siguiente manera:

( n − 1) s 2

≤ σ2 ≤
( n − 1) s 2

χ 12−α /2;n−1 χ α2 /2;n−1

(18 − 1)102400 ≤ σ 2

(18 − 1)102400
33.409 6.408

52105.72 ≤ σ 2 ≤ 271660.42

2 2 2 2
Los valores de χ 1−α /2; n−1 = χ 0.99; 17 = 33.409 y χ α /2; n−1
= χ 0.01; 17
= 6.408 se obtienen de la
tabla de la distribución chi-cuadrado.

ESTADÍSTICA GENERAL 325


16.2 Intervalo de confianza para la proporción
poblacional ( π )
Sea X1, X2, …, Xn una muestra aleatoria tomada de una población Bernoulli con
parámetro π, donde π representa la proporción de elementos en la población
que poseen una característica de interés.

La variable aleatoria Xi, se define por,

{
1, si presenta la caracteristica de interés
Xi =
0, si no presenta la caracteristica de interés

El estimador puntual de π es:

Donde , es el número de éxitos en la muestra y sigue una distribución


Binomial con parámetros n y π , así: X ~ B ( n, π ) .

Observación

La media del estimador p es: p


2
π (1 − π )
La varianza del estimador p es : σ p =
n

Para la construcción de un intervalo de confianza para la proporción poblacional


(π ) se utiliza el valor estandarizado de la proporción muestral ( p ) cuando el
tamaño de la muestra es suficientemente grande ( n > 30) , así:

p−π
Z=
π (1 − π )
n

donde Z sigue una distribución normal estándar, es decir: Z ~ N ( 0, 1) .

326 ESTADÍSTICA GENERAL


Para un nivel de confianza de 1 − α y por la simetría de la distribución, se cumple:

1–α

α/2 α/2 Z
-Z1-α/2 0 Z1-α/2

El intervalo con un nivel de confianza de (1 − α )100 % para la proporción


poblacional ≠ es:

p (1 − p ) p (1 − p )
p − z1−α /2 ≤ π ≤ p + z1−α /2
n n

Forma resumida:

p (1 − p )
IC ( π ) : p ± z1−α /2
n

Ejemplo 16.2
En una editorial están interesados en sacar a la venta una nueva revista de
negocios en el departamento de Lima. Para esto, el jefe de investigación de la
editorial realizó una encuesta en todo el departamento de Lima y encontró que
300 de un total de 2500 personas comprarían la revista. Estime un intervalo
con un 99% de confianza para la proporción poblacional de personas que
comprarían dicha revista.

Solución
Sea la variable:
X = Número de personas que comprarían la revista

ESTADÍSTICA GENERAL 327


Datos:
n = 2500

x = 300 ( Número de personas que comprarían la revista en la muestra )

x 300
p= = = 0.12
n 2500

1− = 0.99 0.01

El intervalo de confianza se obtiene de la siguiente manera:

p (1 − p ) p (1 − p )
p − z1−α /2 ≤ π ≤ p + z1−α /2
n n

0.12 (1 − 0.12 ) 0.12 (1 − 0.12 )


0.12 − 2.58 ≤ π ≤ 0.12 + 2.58
2500 2500

0.1032 ≤ π ≤ 0.1368

El valor de Z1−α /2 = Z0.995 = 2.58 se obtiene de la tabla de la distribución normal


estándar.

16.3 Tamaño de muestra


16.3.1 Tamaño de muestra cuando se estima la media poblacional
Con frecuencia se desea saber que tan grande debe ser el tamaño de la muestra
para garantizar con un nivel de confianza dado que el error al estimar la media
poblacional ( ) sea menor que una cantidad especifica ε .

Sea el intervalo:

La longitud del intervalo L es:

328 ESTADÍSTICA GENERAL


Despejando el valor de n , se obtiene:

( )

Como L = 2ε , se tiene:

Ejemplo 6.3
Un director quiere estimar la facturación mensual promedio por consumo de
luz eléctrica en el mes de junio en los hogares de una urbanización de Lima
Metropolitana. Si se desea tener un error máximo de estimación de ocho soles
y se sabe que la desviación estándar de la facturación mensual por luz eléctrica
es de 56 soles, ¿qué tamaño de muestra se necesita para tener un 97% de
confianza en los resultados?

Sea la variable:
X = Monto de la facturación mensual por luz eléctrica

Datos:
n=?
ε =8
σ = 56 soles.
1− = 0.97 0.03

El tamaño de la muestra se obtiene de la siguiente manera:

n = 230.7361 ≈ 231

El valor de Z1−α /2 = Z0.985 = 2.17 se obtiene de la tabla de la distribución normal


estándar.

ESTADÍSTICA GENERAL 329


El tamaño de muestra que se necesita para tener un 97% de confianza en los
resultados es 231 hogares.

16.3.2 Tamaño de muestra cuando se estima la proporción poblacional


Con frecuencia se desea saber que tan grande debe ser el tamaño de la
muestra para garantizar con un nivel de confianza dado que el error al estimar
la proporción poblacional ( π ) sea menor que una cantidad especifica ε .

Sea el intervalo:

[
P p − zα /2
p (1 − p )
n
≤ π ≤ p + z1−α /2
p (1 − p )
n ] = 1− α

La longitud de este intervalo es:

Despejando el valor de , se obtiene:

Como L = 2ε , se tiene:

z12−α /2 p (1 − p )
n= 2
ε

Ejemplo 6.4
El jefe de capital humano de una empresa de Marketing realizará un test
psicológico para estimar el porcentaje de postulantes con un alto perfil creativo.
Por tal motivo, el jefe fijó un error máximo de estimación de 3% y un nivel
de confianza de 93%, ¿qué tamaño de muestra deberá el jefe tomar si por
experiencias anteriores se sabe que el porcentaje de postulantes con un alto
perfil creativo es 7.5%?

Sea la variable:
X = Número de postulantes con un alto perfil creativo

330 ESTADÍSTICA GENERAL


Datos:
n=?
ε = 0.03
p = 0.075
1− = 0.93 0.07

El tamaño de la muestra se obtiene de la siguiente manera:

Z12−α /2 p (1 − p )
n= 2
ε

1.8120.075 (1 − 0.075)
n=
0.032
n = 252.5327 ≈ 253

El valor de Z1−α /2 = Z0.965 = 1.81 se obtiene de la tabla de la distribución normal


estándar.

El tamaño de muestra que se necesita para tener un 93% de confianza en los


resultados es 253 postulantes.

16.4 Ejercicios resueltos


1. Un psicólogo quiere determinar si el exceso en las horas de trabajo de los
conductores de una empresa de transportes influye en la capacidad de
reacción ante un accidente de tránsito. Una variación excesiva del exceso
en las horas de trabajo del colectivo de los conductores origina que estén
propensos a sufrir accidentes por trabajar más de lo establecido. Por tal
motivo, el psicólogo realizó un estudio con los conductores de la empresa
mediante el uso de simuladores de accidentes.

Si en una muestra aleatoria de 18 conductores de esta empresa de transportes


se obtuvo que la desviación estándar del número de horas de trabajo
excedidas es 0.52 horas, estime un intervalo con un 90% de confianza para
la varianza del exceso en las horas de trabajo.

Solución

Sea la variable:

X = Número de horas de trabajo excedidas

ESTADÍSTICA GENERAL 331


Datos:
n = 18

s = 0.52

1− = 0.90 0.10

El intervalo de confianza se obtiene de la siguiente manera:

( n − 1) s 2

≤σ 2

( n − 1) s 2

χ 12−α /2;n−1 χ α2 /2;n−1

(18 − 1) 0.52 2

≤ σ2 ≤
(18 − 1) 0.52 2

27.587 8.672

0.1666 ≤ σ 2 ≤ 0.5301

2 2
Los valores de χ 1−α /2;n−1 = χ 0.95;17 = 27.587 y χ α /2;n−1 = χ 0.05;17 = 8.672 se obtiene de la
2 2

tabla de la distribución chi-cuadrada.

2. En un estudio realizado por una revista internacional se afirma que el 66%


de los divorcios fueron causados por el exceso en el uso del Facebook. Un
psicólogo especializado en consejería matrimonial quiere comprobar si esta
afirmación es verdadera. Para esto, tomó una muestra aleatoria de 300 casos
de divorcios en una ciudad y determinó que 108 no se divorciaron por el
mencionado exceso.

a) Con un 99% de confianza, estime un intervalo para la proporción de


divorcios que fueron causados por el exceso en el uso del Facebook.

b) Debido a los buenos resultados, el psicólogo quiere replicar este estudio en


otra ciudad, pero no sabe cuántas parejas necesitará para su investigación.
Con un error máximo de estimación de 2.5% y sabiendo que la proporción
de parejas que se divorciaron por el exceso en el uso del Facebook es
0.66, ¿qué tamaño de muestra deberá seleccionar el psicólogo? Utilice un
nivel de confianza del 95%.

Solución

Sea la variable:
X = Número de divorcios que fueron causados por el exceso en el uso del Facebook

332 ESTADÍSTICA GENERAL


Datos:
n = 300

x = 192

192
p= = 0.64
300

1 − α = 0.99 → α = 0.01

El intervalo de confianza se obtiene de la siguiente manera:

p (1 − p ) p (1 − p )
p − z1−α /2 ≤ π ≤ p + z1−α /2
n n

0.64 (1 − 0.64 ) 0.64 (1 − 0.64 )


0.64 − 2.58 ≤ π ≤ 0.64 + 2.58
300 300

0.5685 ≤ π ≤ 0.7115

El valor de Z1−α /2 = Z0.995 = 2.58 se obtiene de la tabla de la distribución


normal estándar.

Datos:
n=?

ε = 0.025

p = 0.66

1− = 0.95 = 0.05

El tamaño de la muestra se obtiene de la siguiente manera:

Z12−α /2 p (1 − p )
n= 2
ε

n = 1379.2881 ≈ 1379

ESTADÍSTICA GENERAL 333


El valor de Z1−α /2 = Z0.975 = 1.96 se obtiene de la tabla de la distribución
normal estándar.

El tamaño de muestra que se necesita para tener un 95% de confianza en


los resultados es 1379 casos de divorcios.

EJERCICIO RESUELTO CON EL PROGRAMA MINITAB


Para calcular el intervalo de confianza para la proporción se sigue la ruta:

Estadísticas → Estadística básica → 1 Proporción…

En Datos resumidos, ingrese:

• Número de eventos = 108


• Número de ensayos = 300

En Opciones, ingrese el nivel de confianza dado en el problema (por defecto se


visualiza 95%), y en Método seleccione Aproximación normal.

334 ESTADÍSTICA GENERAL


Haga clic en Aceptar dos veces y se obtiene.

16.5 Trabajo colaborativo (para trabajar en clase)


1. El jefe de producción de una empresa cervecera sabe que la uniformidad
en el contenido de las botellas de cerveza es importante para controlar
la variabilidad en el llenado de las botellas. Cada cierto tiempo, el jefe de
producción toma una muestra aleatoria de 12 botellas y mide el contenido,
todo esto con la finalidad de controlar la variabilidad en el llenado de las
botellas. Si en uno de los controles se obtiene que la desviación estándar es
1.5 mililitros, estime un intervalo de confianza para la varianza del contenido
de las botellas de cerveza. Utilice un nivel de confianza del 95%.

2. Un psicólogo cree que el porcentaje de estudiantes de una universidad que


fuman cigarrillos por ansiedad es mayor a 78%. Para verificar sus creencias,
el psicólogo tomó una muestra aleatoria de 120 estudiantes que fuman
cigarrillos y obtuvo que 99 estudiantes fuman por ansiedad.

3. Estime un intervalo para la proporción de estudiantes que fuman por ansiedad


con un nivel de confianza del 99.366%.

4. Un funcionario de la Defensoría del Cliente Financiero está evaluando realizar


una auditoria en una entidad financiera debido a las quejas de algunos

ESTADÍSTICA GENERAL 335


clientes con respecto a los intereses que les habían cobrado en el último
mes. Por criterios de calidad del servicio en las entidades financieras, este
tipo de quejas no pueden superar el 4%; de ser así, la defensoría del cliente
financiero tiene la potestad de emitir una sanción de hasta cinco UIT. Para
tomar una decisión, el funcionario tomó una muestra aleatoria de 400 clientes
y encontró que 15 de ellos habían presentado quejas por el motivo expuesto
en el último mes. Estime un intervalo de confianza para la proporción de
clientes que presentaron quejas en el último mes debido a los intereses que
les habían cobrado. Utilice un nivel de confianza del 97.556%.

5. El jefe de control de calidad de una empresa que fabrica varillas de fierro


corrugado para construcción, quiere evaluar la calidad del último lote de
su producción porque sospecha que no se cumplieron con los estándares
establecidos. Como el lote es demasiado grande, el jefe seleccionará una
muestra aleatoria de varillas para tomar una decisión. Con un error de
estimación de a lo más 5% y un nivel de confianza del 93%, ¿qué tamaño de
muestra debe utilizar el jefe de control de calidad, si sabe por experiencias
pasadas que la proporción de varillas defectuosas es del 2%?

6. El director de una empresa de energía eléctrica de la ciudad de Lima quiere


obtener información sobre el consumo promedio diario de luz eléctrica (en
vatios) en un distrito de Lima. Si el director está dispuesto a tolerar un error
máximo de estimación de 15 vatios, ¿qué tamaño de muestra necesita si por
experiencias pasadas se sabe que la desviación estándar del consumo por
luz eléctrica es 86 vatios? Utilice un nivel de confianza del 97%.

16.6 Trabajo autónomo


1. Un analista de mercados pretende introducir un nuevo producto lácteo al
mercado local; por tal motivo, desea estimar la proporción de personas que
están dispuestas a adquirir el producto. Para esto, el analista entrevistó a
500 personas y obtuvo que 140 de ellas están dispuestas a adquirir dicho
producto. Estime un intervalo de confianza para la proporción de personas
que están dispuestas a adquirir el producto con un nivel de confianza del
96%.

2. El gerente de marketing de una empresa de gaseosas está analizando la


posibilidad de cambiar sus envases de plástico a vidrio. Por tal motivo,
desea estimar la proporción de clientes que aceptarían el cambio. Para esto,
encuestó a 950 personas que consumen dicha marca de gaseosas y las
clasificó según su posición con respecto al cambio de envase y su estrato
socioeconómico. Los resultados se muestran en el siguiente cuadro:

336 ESTADÍSTICA GENERAL


Estrato socioeconómico
Cambio de envase
A (Alto) B (Medio) C (Bajo)
Si 180 170 220
No 140 160 80

a) Estime la proporción de personas que están a favor del cambio de envase.


Use un nivel de confianza del 98.572%.

b) Estime le proporción de personas que están a favor del cambio de envase


en el estrato socioeconómico A. Use un nivel de confianza del 97.5%.

3. El dueño de una cadena de panaderías ha recibido algunas quejas por parte


de los clientes de una de sus sucursales, la razón: Los panes no están bien
horneados. Como no puede manipular la totalidad de los panes que se
producen por ser muy grande la producción, el dueño ha decidido tomar
una muestra y trabajar con un error máximo de estimación de 0.5. Calcule el
tamaño de muestra si se desea tener un 98% de confianza en los resultados.
Por experiencias anteriores se sabe que la proporción de panes mal horneados
es 1%.

4. Un funcionario del Ministerio de Salud reportó que por lo menos el 40% de


los habitantes de Lima presentan cuadros de trastornos somatomorfos. El
psicólogo de una institución de salud mental cree que este porcentaje no es
correcto; por tal motivo, seleccionó una muestra aleatoria de 850 habitantes
y obtuvo que 408 de ellos presentaban trastornos somatomorfos.

a) Estime un intervalo de confianza para la proporción real de habitantes


que presentan trastornos somatomorfos. Utilice un nivel de confianza del
97%.

b) En base al intervalo construido, ¿existe evidencia suficiente que apoyen


las creencias del psicólogo?

5. En una editorial están interesados en sacar a la venta una nueva revista de


gastronomía. Por tal motivo, el jefe de investigación de la editorial realizó una
encuesta en todo Lima y encontró que 1500 de un total de 2200 personas
comprarían la revista.

a) Obtenga un intervalo con un 95% de confianza para la proporción


poblacional de personas que comprarían la revista.

b) Calcule el número de personas con las que debe trabajar el jefe de


investigación si desea que el error de estimación no sea mayor que 2.5%
con una confianza del 99%.

ESTADÍSTICA GENERAL 337


Lección 17
Estimación de intervalos para
el cociente de varianzas (σ / σ ) y 2
1
2
2

diferencia de medias ( μ − μ ) 1 2

17.1 Intervalo de confianza para el cociente de varianzas


(σ 2
1
/ σ 22 )
Sean y dos muestras aleatorias independientes
2
tomadas de dos poblaciones normalesN μ1 , σ 1 ( ) 2
y N μ 2, σ2 ( ) respectivamente,
σ 2 y σ 22 desconocidas.
con varianzas 1

Para un nivel de confianza de 1 − α , se cumple:

1–α

α/2 α/2 F
0 1 fα/2; n -1; n -1
1 2

fα/2; n -1; n -1
2 1

El intervalo con un nivel de confianza de (1 − α ) x 100% para el cociente de


varianzas poblacionales es:

s12 1 σ 12 s12
> ×
s2 Fα /2, n1 −1; n2 −1
2
≤ ≤ F
σ 22 s22 α /2, n2 −1; n1 −1
>

338 ESTADÍSTICA GENERAL


Ejemplo 17.1
Con la finalidad de comparar el gasto mensual en gaseosas de los distritos A
y B de una ciudad, el jefe de ventas de una empresa seleccionó una muestra
aleatoria de 10 personas de cada distrito y obtuvo la siguiente información:

Gasto en el distrito A 50.8 58.4 56.3 54.2 48.3 60.9 40.4 45.3 52.5 55.9
Gasto en el distrito B 50.4 54.2 60.6 46.9 59.5 65.7 54.8 48.9 57.7

Si los gastos de cada distrito se distribuyen normalmente; con un nivel de


confianza del 90%, ¿puede decir que las varianzas de los gastos en ambos
distritos son homogéneas?

Solución
Sean las variables:

X = Gasto mensual en gaseosas en el distrito A

Y = Gasto mensual en gaseosas en el distrito B

Datos:

Distrito A

n1 = 10
s1 = 6.26

Distrito B

n2 = 9
s2 = 6.09

1− = 0.90 0.10

El intervalo de confianza se obtiene de la siguiente manera:

ESTADÍSTICA GENERAL 339


σ 12
0.33 ≤ 2 ≤ 3.58
σ2

Los valores de F0.05, 8; 9 = 3.23 y F0.05, 9; 8 = 3.39 se obtienen de la tabla de la distribución


F-Fisher.

Como el intervalo contiene el número uno, se concluye que existe evidencia


estadística para pensar que las varianzas de los gastos en ambos distritos son
homogéneas.

Observación
Si el intervalo de confianza para el cociente de varianzas contiene el número
uno, entonces se concluye que existe evidencia estadística para pensar que
las varianzas poblacionales son iguales.

17.2 Intervalo de confianza para la diferencia de dos medias


poblacionales ( μ1 − μ2 )
En este intervalo de confianza se presentan los siguientes casos:

CASO I: Intervalo de confianza para la diferencia de medias poblacionales


( μ 1 − μ 2 ) cuando las varianzas poblacionales ( σ 1 y σ 2 ) son conocidas
2 2

Sean y dos muestras aleatorias independientes tomadas


de dos poblaciones normales μ ( )
yN μ 2 , σ 22 respectivamente, con medias
μ1 y μ 2 desconocidas y varianzas σ 12 y σ 22 conocidas.
Para un nivel de confianza de 1 − α y por la simetría de la distribución, se cumple:

1–α

α/2 α/2 Z
-Z1-α/2 0 Z1-α/2

340 ESTADÍSTICA GENERAL


El intervalo con un nivel de confianza de (1 − α ) ×100% para la diferencia de
medias poblacionales ( μ 1 − μ 2 ) , cuando las varianzas poblacionales σ 1 y σ 2
2 2

son conocidas es:

σ 12 σ 22 σ 12 σ 22
(x − y) − z1− α /2
+
n1 n2
≤ μ1 − μ2 ≤ ( x − y ) + z1−α /2 +
n1 n2

Forma resumida:

σ 12 σ 22
IC ( μ1 − μ 2 ) : ( x − y ) ± z1−α /2 +
n1 n2

Ejemplo 17.2
Un fabricante de baterías desea comparar los tiempos promedio de vida, en
horas, de las baterías fabricadas en dos líneas de producción (I y II). Para esto, el
fabricante tomó una muestra aleatoria de 10 baterías de cada una de las líneas
y obtuvo los siguientes resultados:

Línea de producción Tiempo de duración promedio


Línea I 1475
Línea II 1525

Se sabe que los tiempos de vida de las baterías se distribuyen normalmente con
una desviación estándar de 12 horas para la línea I y 10 horas para la línea II. Con
un nivel de confianza de 90%; estime la diferencia entre los tiempos promedio
de vida de las baterías fabricadas en las dos líneas de producción. ¿Se puede
decir que el tiempo promedio de vida de las baterías es el mismo en las dos
líneas de producción?

Solución
Sean las variables:

X = Tiempo de vida de una batería producida en la línea I

Y = Tiempo de vida de una batería producida en la línea II

ESTADÍSTICA GENERAL 341


Datos:

Línea I

n1 = 10

x1 = 1475

σ 1 = 12

Línea II

n 2 = 10

x 2 = 1525

σ 2 = 10

1− = 0.90 0.10

El intervalo de confianza se obtiene de la siguiente manera:

σ 12 σ 22 σ 12 σ 22
(x − y) − z 1− α /2
+
n1 n2
≤ μ1 − μ 2 ≤ ( x − y ) + z1−α /2 +
n1 n2

122 102 122 102


(1475 − 1525) − 1.64 +
10 10
≤ μ1 − μ 2 ≤ (1475 − 1525) + 1.64 +
10 10

− 58.15 ≤ μ 1 − μ 2 ≤ − 41.85

El valor de Z1−α /2 = Z0.95 = 1.64 se obtiene de la tabla de la distribución normal


estándar.

Como el intervalo no contiene el número cero, se concluye que no existe evidencia


estadística para pensar que el tiempo promedio de vida de las baterías sea el
mismo en las dos líneas de producción.

342 ESTADÍSTICA GENERAL


Observación
Si el intervalo de confianza para la diferencia de medias contiene el valor
cero, entonces se concluye que existe evidencia estadística para pensar
que las medias poblacionales son iguales.

CASO II: Intervalo de confianza para la diferencia de medias poblacionales


( μ 1 − μ 2 ) cuando las varianzas poblacionales ( σ 1 y σ 2 ) son desconocidas,
2 2

pero estadísticamente iguales y la suma de los tamaños de muestra es menor


o igual que 30 ( n1 + n 2 ≤ 30 )
Si la suma de los tamaños de muestra ( n1 + n2 ) es mayor que 30 se utiliza el
intervalo de confianza obtenido en el caso anterior.

Para un nivel de confianza de 1 − α y por la simetría de la distribución, se cumple:

1–α

α/2 α/2 T
-t1-α/2; n +n -2 0 t1-α/2; n +n -2
1 2 1 2

El intervalo con un nivel de confianza de (1 − α ) ×100% para la diferencia de


2 2
medias poblacionales ( μ 1 − μ 2 ) , cuando las varianzas poblacionales σ 1 y σ 2
son desconocidas pero iguales es:

IC ( μ1 − μ 2 ) : ( x − y ) ± t1−α /2;n + n − 2
( n − 1) s + ( n
1
2
1 2
− 1) s22 1 1
+
1 2
n1 + n2 − 2 n1 n2

Se verá un ejemplo en la sección 17.3 (ejercicios resueltos).

ESTADÍSTICA GENERAL 343


CASO III: Intervalo de confianza para la diferencia de medias poblacionales
2 2
( μ 1 − μ 2 ) cuando las varianzas poblacionales ( σ 1 y σ 2 ) son desconocidas,
pero estadísticamente diferentes y la suma de los tamaños de muestra es
menor o igual que 30 ( n1 + n 2 ≤ 30 )
Sean X 1 , X 2 , ⊃, X n1 y Y1 , Y2 , ⊃, Yn 2 ( n1 + n 2 ≤ 30 ) dos muestras aleatorias independientes
( )
tomadas de dos poblaciones normales N μ 1 , σ 12 y N μ 2 , σ 22 respectivamente ( )
con medias 1 y 2 desconocidas y varianzas σ 1 y σ 2 desconocidas pero
2 2

estadísticamente diferentes.

El intervalo con un nivel de confianza de (1 − α )100 % para la diferencia de


2 2
medias poblacionales ( μ1 − μ2 ) cuando las varianzas poblacionales σ 1 y σ 2 son
desconocidas, pero estadísticamente diferentes es:

s12 s22
IC ( μ 1 − μ 2 ) : ( x − y ) ± t1− α /2; g +
n1 n2
donde:
2
s12 s22
+
n1 n2
g= 2 2
−2
2 2
s1
s2
n1 n2
+
n1 + 1 n2 + 1

Se verá un ejemplo en la sección 17.3 (ejercicios resueltos).

17.3 Ejercicios resueltos


1. Un analista financiero quiere comparar el monto promedio de los préstamos
solicitados en dos agencias financieras por las pequeñas empresas que operan
en la ciudad de Lima. El analista seleccionó una muestra de 12 pequeñas
empresas afiliadas a la agencia Finanzas Unidas y obtuvo un monto promedio
de 3600 soles con una desviación estándar de 260 soles; y, otra muestra de
15 empresas afiliadas a la agencia Negocio Creciendo y obtuvo un monto
promedio de 3000 soles con una desviación estándar de 250 soles.

Si se supone que las muestras provienen de dos poblaciones normales e


independientes; con un 95% de confianza, estime la diferencia entre los
montos promedio de los préstamos solicitados en las dos agencias financieras
por las pequeñas empresas que operan en la ciudad de Lima.

344 ESTADÍSTICA GENERAL


Solución

Sean las variables:

X = Monto de préstamo solicitado en la agencia financiera Finanzas Unidas

Y = Monto de préstamo solicitado en la agencia financiera Negocio Creciendo

Datos:

Finanzas Unidas

n1 = 12

x = 3600

s1 = 260

Negocio Creciendo

n 2 = 15

y = 3000

s 2 = 250

1− = 0.95 0.05

El intervalo de confianza para el cociente de varianzas se obtiene de la


siguiente manera:

2602 1 σ 12 2602
≤ ≤ 2.565
2502 2.74 σ 22 2502

σ 12
0.3947 ≤ 2 ≤ 2.7743
σ2

Los valores de f0.025, 14; 11 = 2.74 y f0.025, 11; 14 = 2.565 se obtienen de la tabla de
la distribución F-Fisher.

Como el intervalo contiene el número uno, existe evidencia para pensar


que las varianzas poblacionales son iguales.

ESTADÍSTICA GENERAL 345


Teniendo en cuenta el resultado anterior, el intervalo de confianza para la
diferencia de medias se obtiene de la siguiente manera:

( n − 1) s + ( n
2
− 1) s22 1 1
( x − y ) ± t1−α /2;n +n −2
1 2
1 1 2

n1 + n2 − 2
+
n1 n2

112602 + 142502 1 1
(3600 − 3000) ± 2.06 25
+
12 15

(396.99, 803.01)

El valor de t1−α /2;n1 + n2 − 2 = t0.975; 25 = 2.06 se obtiene de la tabla de la distribución


T-Student.

2. Una importante empresa gastronómica cuenta con dos sucursales A y B


en un solo distrito. Con la finalidad de comparar el ingreso promedio diario
de las dos sucursales, el administrador seleccionó una muestra aleatoria de
10 días de la sucursal A y 12 días de la sucursal B y obtuvo los siguientes
resultados:

Sucursal A 1240 1230 1220 1240 1230 1250 1260 1200 1220 1210
Sucursal B 1250 1170 1170 1240 1260 1270 1300 1220 1280 1300 1280 1220

Asuma que el ingreso diario de cada sucursal sigue una distribución normal
y que las muestras son independientes. Estime con un 90% de confianza la
diferencia entre los ingresos promedio diario de las dos sucursales.

Solución

Sean las variables:

X = Ingreso diario en la sucursal A

Y = Ingreso diario en la sucursal B

Datos:

Sucursal A

n1 = 10

346 ESTADÍSTICA GENERAL


x = 1230

s1 = 18.26

Sucursal B

n 2 = 12

y = 1246.67

s 2 = 44.59

1 − = 0.90 → = 0.10

El intervalo de confianza para el cociente de varianzas se obtiene de la


siguiente manera:

s12 1 σ 12 s12
≤ 2 ≤ 2 fα /2, n −1; n −1
s22 fα /2, n −1; n −1 σ 2 s2 1 2
2 1

18.262 1 σ 12 18.262
≤ ≤ 2.90
44.592 3.105 σ 22 44.592

σ 12
0.0540 ≤ ≤ 0.4863
σ 22

Los valores de f0.05, 11; 9 = 3.105 y f0.05, 9; 11 = 2.90 se obtienen de la tabla de la


distribución F-Fisher.

Como el intervalo no contiene el número uno, existe evidencia para


pensar que las varianzas poblacionales no son iguales.

Teniendo en cuenta el resultado anterior, el intervalo de confianza para la


diferencia de medias se obtiene de la siguiente manera:

ESTADÍSTICA GENERAL 347


18.262 44.592 18.262 44.592
(µ1 -µ2 ) (1230-1246.67) -1.746 + ;( 1230-1246.67) -1.746 +
10 12 10 12

(µ1 µ2 ) 41.3023;7.9623

donde:
2 2
s12 s22 18.262 44.592
+ +
n1 n2 10 12
g= 2 2
−2= 2 2
− 2 = 15.9 ≈ 16
2 2 2 2
s 1
s
2
18.26 44.59
n1 n2 10 12
+ +
n1 + 1 n2 + 1 10 + 1 12 + 1

El valor de t1−α /2; g = t0.95; 16 = 1.746 se obtiene de la tabla de la distribución


T-Student.

17.4 Trabajo colaborativo (para trabajar en clase)


1. Con la finalidad de comparar el gasto mensual en cerveza de los jóvenes
y adultos de una ciudad, el jefe de ventas de una empresa de cervecera
seleccionó una muestra aleatoria de 12 personas de cada grupo de edad y
obtuvo la siguiente información:

Gastos de los
56.0 59.4 61.5 47.3 53.5 70.9 45.6 54.1 57.7 47.8 45.8 49.8
jóvenes
Gastos de los
55.6 63.6 55.8 59.4 61.7 66.1 60.0 50.5 56.9 61.1 63.1 65.1
adultos

Si los gastos de cada grupo de edad se distribuyen normalmente, con un


nivel de confianza del 95%, ¿se puede afirmar que la varianza de los gastos
de los jóvenes es igual a la varianza de los gastos de los adultos?

2. Para determinar la efectividad de un nuevo método de enseñanza del curso


de francés para jóvenes, se seleccionó a 20 jóvenes que no sabían francés,
los mismos que fueron divididos aleatoriamente en dos grupos de 10 cada
uno. Al primer grupo, se le enseño el francés con el método tradicional y al
segundo grupo con el nuevo método. Al final del curso los jóvenes fueron
evaluados respecto a su variabilidad en sus calificaciones; los resultados
obtenidos se muestran a continuación:

348 ESTADÍSTICA GENERAL


Método
Medidas de resumen Nuevo método
tradicional
Desviación estándar 10 11

Si se cree que la variabilidad calificaciones obtenidas con el nuevo método


será más alta. Utilice un intervalo a un nivel de confianza del 90%.

3. Una importante empresa de comida rápida cuenta con dos sucursales A y


B en un solo distrito. El gerente ha recibido quejas de los clientes acerca del
tiempo de atención muy prolongado en la sucursal B respecto a la sucursal
A; si esta afirmación es cierta, se tomarán acciones correctivas en dicha
sucursal. Caso contrario, el proceso de atención continuará normalmente en
ambas sucursales.

Con la finalidad de tomar una decisión, el gerente seleccionó una muestra


aleatoria de nueve clientes en la sucursal A y diez clientes en la sucursal B y
obtuvo los siguientes resultados:

Sucursal A 29 28 27 29 28 30 31 25 27
Sucursal B 30 22 22 29 31 32 35 27 33 35

4. Asuma que los tiempos de atención siguen una distribución normal y que
las muestras son independientes. Utilice un nivel de confianza del 95% y
responda las siguientes preguntas:

a) ¿Las varianzas son iguales?


b) ¿En la sucursal B se tomarán acciones correctivas?

5. Con la finalidad de determinar cuál de sus dos nuevas tortas le produce


mayores ingresos, el dueño de una pastelería seleccionó aleatoriamente los
ingresos (en soles) de 12 días de cada torta. Los resultados obtenidos se
muestran a continuación:

Torta N°1 51.3 46.3 49.3 48.3 47.3 51.3 48.8 49.8 48.8 46.3 43.8 41.3
Torta N°2 46.3 41.3 39.3 38.8 46.3 51.3 46.3 48.8 43.8 44.8 41.3 42.8

Utilice un nivel de confianza del 95% y responda las siguientes preguntas:

a) ¿son homogéneas las varianzas de los ingresos de las tortas?


b) ¿existe evidencia estadística para pensar que la torta 1 produce mayores
ingresos que la torta 2?

ESTADÍSTICA GENERAL 349


6. Un inversionista está por decidir entre Trujillo y Chiclayo para abrir un nuevo
centro comercial. Para esto escogió una muestra aleatoria de 14 ingresos de
cada lugar y obtuvo los ingresos medio de $ 550 y $ 500 y las desviaciones
estándar $ 60 y $ 50 respectivamente. Utilice un nivel de confianza del 95%
y responda las siguientes preguntas:

a) ¿Las varianzas de los ingresos de cada ciudad son homogéneas?


b) ¿Existe diferencias entre los ingresos de las personas de la ciudad de
Trujillo y Chiclayo?

17.5 Trabajo autónomo


1. El gerente de la sección de tarjetas de crédito de una tienda por departamentos
desea saber si existe diferencia significativa entre los ingresos promedio por
las recargas diarias en dos de sus sucursales. Por tal motivo, se seleccionó
una muestra aleatoria de cada sucursal y se obtuvo lo siguiente:

Sucursal A Sucursal B
n1 = 20 n2 = 20

x1 = $500 x 2 = $570
S1 = $20 S2 = $18

¿Existe evidencia estadística suficiente para pensar que existe diferencia


significativa entre los ingresos promedio de las sucursales? Utilice
un nivel de confianza del 95%. Suponga que los ingresos siguen una
distribución normal.

2. Nueve distribuidores de equipos de cómputo cuyas tiendas se encuentran


ubicadas en la avenida Wilson fueron elegidos al azar y consultados acerca
de los precios de un modelo de impresora de inyección de tinta; mientras
que, otros nueve distribuidores cuyas tiendas se encuentran ubicadas en la
avenida Grau fueron elegidos al azar y consultados acerca de los precios del
mismo modelo de impresora. Los resultados se presentan a continuación:

Precio de la Precio de la
impresora A impresora B
n1 = 9 n2 = 9

x1 =387.4 x2 = 392.6
S1 = 22.8 S2 = 21.2

350 ESTADÍSTICA GENERAL


¿Existe evidencia estadística suficiente que permita afirmar que en promedio
la impresora A cuesta menos que la impresora B? Utilice un nivel de confianza
del 99%. Suponga que los precios de las impresoras siguen una distribución
normal.

3. El administrador de la compañía productora de focos ahorradores LIGHTSA


sospecha que en la línea de producción 2 se están envasando cajas de focos
con un número promedio de focos defectuosos mayor que en la línea de
producción 1. Para probar su sospecha, el administrador tomó una muestra
aleatoria de cajas de cada una de las líneas de producción y obtuvo los
siguientes resultados:

Datos Línea 1 Línea 2


Número de cajas 17 11
Número promedio de
2.8 2.6
focos defectuosos
Desviación estándar 1.56 2.43

a) Al nivel de confianza del 95%, ¿puede concluir que las varianzas


poblacionales son homogéneas?
b) Al nivel de confianza del 95%, ¿estime un intervalo de confianza para la
diferencia de medias y diga si existe evidencia estadística que apoye las
sospechas del administrador?

4. El gerente de una empresa dedicada a la venta de productos naturales, con


sedes en Arequipa y Cusco, está interesado en averiguar cuál de las sedes
tiene mayor nivel de ventas en el transcurso del año. Para esto, se tomó una
muestra en cada sede y se obtuvo los siguientes resultados:

Sede Arequipa Sede Cusco


n1 = 13 n2 = 11

x1 = 14560 soles x2 = 13890 soles


S1 = 80 soles S2 = 82 soles

Si se sabe que el nivel de ventas en ambas sedes se comporta según una


distribución normal y que las muestras tomadas son independientes.

a) Con un nivel de confianza del 95%, ¿las varianzas de las ventas de cada
ciudad son homogéneas?
b) Con un nivel de confianza del 95%, ¿se tiene evidencia de que la sede de
Arequipa tiene mayor nivel de ventas que la sede de Cusco?

ESTADÍSTICA GENERAL 351


5. El jefe de logística de una empresa tomará la decisión de comprar un nuevo
equipo de cómputo solo si el tiempo para el procesamiento de la información
es menor con el nuevo equipo en comparación con el tiempo obtenido con el
equipo antiguo. Para tomar una decisión, el jefe tomó una muestra aleatoria
de 100 procesos para cada equipo y obtuvo una media de 10 minutos con el
equipo nuevo y una media de 15 minutos con el equipo antiguo.
Se sabe que la desviación estándar de los tiempos para el procesamiento de
la información de cada equipo de cómputo es de 3 minutos con el equipo
nuevo y 2 minutos con el equipo antiguo.
¿Deberá el jefe de logística adquirir el nuevo equipo de cómputo? Utilice un
nivel de confianza del 90%.

352 ESTADÍSTICA GENERAL


Lección 18
Estimación por intervalos para
la diferencia de proporciones
poblacionales ( π1 − π2 )
18.1 Intervalos de confianza para la diferencia de
proporciones poblacionales ( π1 − π2 )
Sean 1 , 2 X n1 y dos muestras aleatorias independientes de
tamaños n1 y n2 tomadas de dos poblaciones Bernoulli con parámetros π1 y π 2
respectivamente donde π1 y π 2 representan la proporción de elementos que
poseen la misma característica de interés en sus respectivas poblaciones. Si X e
Y representan el número de observaciones que poseen la misma característica
de interés en sus respectivas poblaciones, entonces X e Y son variables
aleatorias binomiales con parámetros ( n1 ,π1 ) y ( n2 ,π 2 ) .

Para un nivel de confianza de 1 − α y por la simetría de la distribución, se cumple:

1–α

α/2 α/2 Z
-Z1-α/2 0 Z1-α/2

El intervalo con un nivel de confianza de (1 − α )×100% para la diferencia de


proporciones poblacionales ( π 1 − π 2 ) , es

p1 (1 − p1 ) p2 (1 − p2 ) p1 (1 − p1 ) p2 (1 − p2 )
(p 1
−p 2 )− z
1− α /2
n1
+
n2
≤ (π 1 − π 2 ) ≤ ( p 1 − p 2 )+ z
1− α /2
n1
+
n2

ESTADÍSTICA GENERAL 353


Forma resumida:

p1 (1 − p1 ) p2 (1 − p2 )
IC ( π 1 − π 2 ) : ( p 1 − p 2 )± z
1− α /2
+
n1 n2

18.2 Ejercicios resueltos


1. La siguiente información corresponde a las preferencias electorales de
ciudadanos peruanos que fueron entrevistados por el personal de dos
empresas encuestadoras (JK y RK) con motivo de las elecciones generales
en el año 2016.

Empresa Tamaño de
Candidato A Candidato B
encuestadora muestra
JK 1600 29% 24%
RK 2000 28% 23%

Para el candidato B. Estime un intervalo de confianza del 95% para la


diferencia de las proporciones poblacionales respecto a los resultados de las
empresas encuestadoras JK y RK.

Solución

Sea la variable:

X1=Número de ciudadanos a favor del candidato B en la encuestadora JK

X2=Número de ciudadanos a favor del candidato B en la encuestadora RK

Datos:

n1 = 1600
p1 = 0.24

n 2 = 2000
p2 = 0.23
1 − α = 0.95 0.05

El intervalo de confianza se obtiene de la siguiente manera:

354 ESTADÍSTICA GENERAL


p1 (1 − p1 ) p2 (1 − p2 )
(p 1
− p2 ) ± z1−α /2
n1
+
n2

0.24 (1 − 0.24 ) 0.23(1 − 0.23)


(0.24 − 0.23) ± 1.96 1600
+
2000

−0.017895, 0.037895

El valor de Z1−α /2 = Z0.975 = 1.96 se obtiene de la tabla de la distribución normal


estándar.

2. La tabla que se presenta a continuación corresponde al número de barras


defectuosas de construcción encontradas en muestras aleatorias de barras
de las empresas Aceros AKI y Fierros Duros (el peso nominal está por debajo
de la especificación técnica de 0.8 kg/m).

Tamaño de Barras
Empresa
muestra defectuosas
AKI 350 26
Fierros Duros 420 40

Estime un intervalo de confianza del 97% para la diferencia de las


proporciones poblacionales de barras defectuosas de las empresas AKI y
Fierros Duros.

Solución

Sea la variable:

X1=Número de barras defectuosas encontradas en la empresa AKI

X2=Número de barras defectuosas encontradas en la empresa Fierros Duros

Datos:

n1 = 350

x1 = 26

p1 = 0.0743

n 2 = 420

ESTADÍSTICA GENERAL 355


x2 = 40

p2 = 0.0952
1 − α = 0.95 0.05

El intervalo de confianza se obtiene de la siguiente manera:

p1 (1 − p1 ) p2 (1 − p2 )
(p 1
− p2 ) ± z1−α /2
n1
+
n2

0.0743(1 − 0.0743) 0.0952 (1 − 0.0952 )


(0.0743 − 0.0952) ± 2.17 350
+
420

−0.0644, 0.0226

El valor de Z1−α /2 = Z0.985 = 2.17 se obtiene de la tabla de la distribución normal


estándar.

EJERCICIO RESUELTO CON EL PROGRAMA MINITAB


Para calcular el intervalo de confianza para la proporción se sigue la siguiente ruta:

Estadísticas → Estadística básica → 2 Proporciones…

356 ESTADÍSTICA GENERAL


En Datos resumidos, ingrese:

• Muestra 1:

■ Número de eventos = 26
■ Número de ensayos = 350

• Muestra 2:

■ Número de eventos = 40
■ Número de ensayos = 420

En Opciones, ingrese el nivel de confianza dado en el problema (por defecto


se visualiza el 95%), y en Método de prueba: Utilice el cálculo agrupado de la
proporción.

Haga clic en Aceptar dos veces y se obtiene:

ESTADÍSTICA GENERAL 357


18.3 Trabajo colaborativo (para trabajar en clase)
1. En la empresa FLASHSA se fabrican focos ahorradores en dos líneas de
producción. Para verificar si las dos líneas de producción fabrican el mismo
porcentaje de focos defectuosos, se seleccionó una muestra aleatoria de
tamaño 154 en la línea 1 donde se encontró nueve focos defectuosos y una
muestra aleatoria de tamaño 175 en la línea 2 donde se encontró 14 focos
defectuosos. Estime un intervalo de confianza del 93% y diga si es razonable
concluir que ambas líneas de producción fabrican la misma proporción de
focos defectuosos.

2. Se entrevistó a dos grupos de hombres, jóvenes y adultos, para conocer


sobre su interés por una de bebida hidratante. En una muestra de 250 adultos
se obtuvo que 28 de ellos estaban interesados en dicha bebida; mientras
que, en una muestra de 200 jóvenes se obtuvo que 155 de ellos no estaban
interesados en dicha bebida. Estime un intervalo de confianza del 93% y diga
si es razonable concluir que el grupo de los jóvenes está más interesado en
dicha bebida hidratante.

3. El ingeniero de control de calidad de la empresa CELANE cree que el


porcentaje de fallas en los polos de exportación es menor que el porcentaje
de fallas en los polos que no son de exportación. Para confirmar sus creencias,
el ingeniero seleccionó una muestra de 125 polos de exportación y obtuvo
que 10 tenían fallas; mientras que, en otra muestra de 100 polos que no son
de exportación se obtuvo que 13 tenían fallas. Con un nivel de confianza del
95%, ¿existe evidencia estadística que apoya las creencias del ingeniero?

4. El gerente de una empresa que comercializa impresoras está interesado en


comparar las cualidades de las dos marcas de impresoras más solicitadas
por los clientes. Por tal motivo, se tomaron dos muestras aleatorias en cada
marca de 200 clientes que utilizaron dichas impresoras. La siguiente tabla
contiene información acerca del tiempo de uso y la opinión con respecto a
la calidad:

Tiempo de uso
Marca Menos de un año Más de un año
Buena Mala Buena Mala
A 70 25 85 20
B 65 35 80 20

a) Estime un intervalo de confianza del 93% y diga si es razonable concluir


que la proporción de clientes que consideraron que sus impresoras eran
malas es mayor en la marca B.

358 ESTADÍSTICA GENERAL


b) Estime un intervalo de confianza del 98% y diga si es razonable concluir
que la proporción de clientes que consideraron que sus impresoras eran
buenas es menor en aquellos clientes que la tienen menos de un año.

18.4 Trabajo autónomo


1. Un psicólogo social quiere comparar la conducta maliciosa y competitiva
de los adolescentes que ven y no ven realities de competencias. Para esto,
tomó una muestra de 400 adolescentes que ven realities de competencias y
obtuvo que 272 de ellos presentaron una conducta maliciosa y competitiva;
mientras que, en una muestra de 500 adolescentes que no ven realities
de competencias, 250 de ellos presentaron una conducta maliciosa y
competitiva. Estime un intervalo de confianza para determinar si la proporción
de adolescentes que presentan una conducta maliciosa y competitiva y
ven realities de competencias difiere de la proporción de adolescentes
que presentan una conducta maliciosa y competitiva y no ven realities de
competencias. Utilice un nivel de confianza del 94%.

2. El gerente de una municipalidad quiere comparar la proporción de usuarios


morosos que tienen deudas vehiculares con la proporción de usuarios
morosos que tienen deuda predial. En una muestra aleatoria de 800
usuarios que pagan impuesto vehicular se encontró que 208 de ellos son
morosos; mientras que, en una muestra aleatoria de 900 usuarios que pagan
impuesto predial se encontró que 250 de ellos son morosos. Si el gerente
cree que la proporción de usuarios morosos por deuda vehicular es mayor
que la proporción de usuarios morosos por deuda predial, ¿existe evidencia
estadística que apoye las creencias del gerente? Utilice un nivel de confianza
del 96%.

3. La gerente de una empresa dedicada a la fabricación de fragancias para


mujeres desea comercializar una nueva fragancia de nombre ROSE; razón
por la cual, la mencionada gerente está interesada en conocer si existe
alguna diferencia entre las proporciones de mujeres, jóvenes y adultas, que
comprarían dicha fragancia si saliera al mercado. Al respecto, el jefe del área de
marketing realizó un estudio de mercado en el que se entrevistó a 750 mujeres
jóvenes y 840 mujeres adultas; de las cuales, 300 y 330 respectivamente,
respondieron que comprarían la fragancia. Estime un intervalo de confianza
para la diferencia de proporciones y diga si la proporción de mujeres jóvenes
que comprarían la fragancia es mayor a la proporción de mujeres adultas que
comprarían dicha fragancia. Utilice un nivel de confianza del 98%.

4. El administrador de un gimnasio desea saber si los varones y mujeres


con edades entre 20 y 40 años están informados sobre los beneficios de

ESTADÍSTICA GENERAL 359


asistir regularmente a un gimnasio. Para esto, el administrador llevó a cabo
un estudio en el que se tomó una muestra aleatoria de 150 hombres y 140
mujeres. Los resultados obtenidos se muestran a continuación:

Informados sobre el No informados sobre el


Género
beneficio beneficio
M 96 54
F 88 52

Con un nivel de confianza del 92%, obtenga un intervalo y diga si se puede


concluir que la proporción de varones que están informados sobre los
beneficios de asistir a un gimnasio es mayor a la proporción de mujeres.

18.5 Problemas de reforzamiento del capítulo


1. Un sociólogo desea comparar las calificaciones de dos grupos de estudiantes
universitarios, estudiantes que trabajan y no trabajan. Para esto, se seleccionó
una muestra aleatoria de 13 estudiantes que trabajan y 16 estudiantes que
no trabajan y se registraron las calificaciones obtenidas. A continuación, se
presentan algunas medidas obtenidas:

Grupo que Grupo que


Medidas de resumen
Trabaja no trabaja
Calificación promedio 13.20 12.35
Desviación estándar de la calificación 1.9 2.1

Asuma que las calificaciones en cada grupo siguen una distribución normal.

a) Con un 90% de confianza, estime el cociente de varianzas de las


calificaciones de ambos grupos de estudiantes. ¿Se puede decir que las
varianzas en ambos grupos son homogéneas?
b) Con un 90% de confianza, estime la diferencia entre las calificaciones
promedio en ambos grupos de estudiantes. ¿Se puede concluir que las
calificaciones promedio en ambos grupos son iguales?

2. Un inversionista desea analizar el comportamiento sobre la rentabilidad de


dos tipos de acciones asociadas a los fondos mutuos de renta fija y renta
variable. Para esto, se seleccionan muestras aleatorias independientes por
cada tipo de acción. Los resultados se muestran a continuación:

360 ESTADÍSTICA GENERAL


Renta fija Renta variable
Acciones Si son No son Si son No son
rentables rentables rentables rentables
Agrarias 15 25 20 20
Mineras 20 40 25 35

a) Con un nivel de confianza del 95%, estime la proporción de acciones


agrarias rentables asociadas a los fondos mutuos de renta fija.
b) Con un nivel de confianza del 95%, estime la diferencia de proporciones
de acciones mineras rentables asociadas a los fondos mutuos de renta fija
y renta variable.

3. Un funcionario del MINCETUR desea comparar los costos de mantenimiento


de los monumentos arqueológicos más visitados por los turistas (La Basílica y
Convento de San Francisco y la Real Fortaleza de San Felipe) en la ciudad de
Lima. Para esto, el funcionario seleccionó muestras aleatorias independientes
de algunos meses y registró los costos de mantenimiento que presentaron
cada uno de los monumentos arqueológicos. A continuación, se presentan
los resultados obtenidos:

Tamaño de Costo
Monumento arqueológico
muestra promedio
La Basílica y Convento de San Francisco 17 2910
Real Fortaleza de San Felipe 11 3240

Se sabe que el costo de mantenimiento sigue una distribución normal


y las varianzas del costo de mantenimiento son 655.36 y 772.84 soles2
respectivamente.

a) Estime el costo promedio de mantenimiento para la Real Fortaleza de San


Felipe. Use un 95% de confianza. Interprete el resultado.
b) Con un 95% de confianza, estime la diferencia entre los costos promedio de
mantenimiento de ambos monumentos arqueológicos. ¿Se puede concluir
que los costos promedio de mantenimiento de ambos monumentos
arqueológicos son iguales?

4. El productor de un canal de televisión desea comparar la proporción de


personas que sintonizan programas educativos en dos distritos de Lima
Metropolitana. Para esto, se entrevistó a 1860 personas del distrito A y se
encontró que el 48% de ellas sintoniza este tipo de programas; mientras que,
se entrevistó a 1950 familias del distrito B y se encontró que 819 de ellas
sintonizan este tipo de programas. Se pide:

ESTADÍSTICA GENERAL 361


a) Para el distrito A, estime la proporción de personas que sintonizan
programas educativos. Use un 97% de confianza.
b) Con un 97% de confianza, estime un intervalo para la diferencia de
proporciones entre las personas que sintonizan programas educativos en
ambos distritos.

18.6 Portafolio (para subir al campus virtual)


Un agente financiero quiere comparar los montos de las aportaciones (en
soles) de los afiliados en dos aseguradoras de fondo de pensiones (Vida Sana y
Seguro Total) en el último trimestre. Se sabe que en la aseguradora Vida Sana se
tiene un total de 145 000 afiliados que hacen sus aportaciones con regularidad.
Para esto, se seleccionaron dos muestras aleatorias independientes de ambas
aseguradoras y se obtuvieron los siguientes resultados:

Monto de la Monto de la
Aseguradora Aseguradora
aportación aportación
Vida Sana 1289.6 Seguro Total 985.6
Vida Sana 899.3 Seguro Total 1056.4
Vida Sana 932.6 Seguro Total 1109.3
Vida Sana 956.7 Seguro Total 1259.0
Vida Sana 1009.7 Seguro Total 1358.4
Vida Sana 1383.1 Seguro Total 1362.9
Vida Sana 1265.4 Seguro Total 995.9
Vida Sana 1245.8 Seguro Total 1310.5
Vida Sana 1168.6 Seguro Total 867.3
Vida Sana 1389.3 Seguro Total 1006.2
Vida Sana 1237.0 Seguro Total 1285.7
Vida Sana 1182.7 Seguro Total 1185.7
Vida Sana 1346.5 Seguro Total 1296.3
Vida Sana 1227.1 Seguro Total 974.6
Seguro Total 1305.8

362 ESTADÍSTICA GENERAL


Se asume que el monto de las aportaciones de los afiliados sigue una distribución
normal. Utilice el software estadístico Minitab para responder las siguientes
preguntas:

1. Para la aseguradora Vida Sana:

a) Estime con un 95% de confianza el monto total de las aportaciones de los


afiliados a esta aseguradora en el último trimestre.
b) Con 95% de confianza, estime el número de afiliados con aportaciones
superiores a 1 250 soles.

2. Para la aseguradora Seguro Total:

a) Estime con un 90% de confianza el monto promedio de las aportaciones


de los afiliados a esta aseguradora en el último trimestre. Interprete los
resultados.
b) Estime con un 90% de confianza la varianza del monto de las aportaciones
de los afiliados a esta aseguradora en el último trimestre.
c) Con un 90% de confianza estime la proporción de aportaciones menores
a 1 250 soles. Interprete los resultados.

3. Para ambas aseguradoras:

a) Estime con un 99% de confianza el cociente entre las aportaciones que


realizan los afiliados de las dos aseguradoras.
b) Estime con un 99% de confianza la diferencia entre las aportaciones
promedio que realizan los afiliados a las dos aseguradoras. Interprete los
resultados.
c) Estime con un 99% de confianza la diferencia entre las proporciones de
aportaciones superiores a 1250 soles que realizan los afiliados de las dos
aseguradoras. Interprete los resultados.

ESTADÍSTICA GENERAL 363


Capítulo 8
PRUEBA DE HIPÓTESIS
Estadística Estadística
Inferencial Descriptiva

Población Muestra

Inferencia del resultado

Capacidades por desarrollar


Al finalizar el capítulo, el estudiante estará en capacidad de:

• Plantear hipótesis estadísticas en problemas contextualizados.


• Definir los tipos de errores en problemas contextualizados.
• Realizar pruebas de hipótesis para una población en problemas
contextualizados.
• Realizar pruebas de hipótesis para dos poblaciones en problemas
contextualizados.

Motivación
Una de las principales funciones de un profesional en Marketing Digital es
posicionar en el mercado los diferentes productos con los que cuenta la empresa
a través de la promoción efectuada por diversos medios de publicidad digital;
ya sea, internet, aplicaciones móviles, entre otras.

364 ESTADÍSTICA GENERAL


Con la finalidad de observar el impacto de utilizar la publicidad digital para
promocionar un nuevo modelo de Smartphone; el gerente de una empresa de
telefonía móvil, especialista en marketing digital, decidió lanzar dicho modelo a
dos mercados, A y B, con las mismas características; pero, solo en el mercado A
se promocionó el modelo mediante publicidad digital. Después de una semana,
se entrevistó a 600 clientes del mercado A y 800 clientes del mercado B, y se
obtuvo que 480 y 125 de ellos conocían dicho modelo en los mercados A y B
respectivamente. Con un nivel de significancia del 5%, ¿cuál es su conclusión?

Al finalizar el capítulo, el estudiante estará en capacidad de responder esta


pregunta y otras más, utilizando los conceptos básicos y la organización de
datos.

Saberes previos
• Estadística Descriptiva
• Nociones de probabilidad
• Estimación por Intervalos

ESTADÍSTICA GENERAL 365


Lección 19
Conceptos básicos y prueba de
hipótesis para la media poblacional
19.1 Prueba de hipótesis
Una prueba de hipótesis es un procedimiento estadístico que conduce al
investigador a tomar una decisión: aceptar o rechazar una afirmación hecha
sobre alguna característica de la población a partir de los resultados obtenidos
de una muestra.

En muchas ocasiones no se dispone de los datos o la información necesaria;


por lo que, hay que recolectarlos, analizarlos y obtener la información necesaria
para realizar la prueba de hipótesis correspondiente.

Estas pruebas son útiles para determinar si la afirmación formulada sobre alguna
característica de la población es consistente con los datos de la muestra.

19.2 Hipótesis estadística


Una hipótesis estadística es una afirmación hecha sobre alguna característica de
la población. Esta hipótesis puede ser formulada en relación a sus parámetros o
un modelo probabilístico, entre otros.

19.3 Tipos de hipótesis


En un problema de prueba de hipótesis, se formulan dos tipos de hipótesis: la
hipótesis nula y la hipótesis alterna.

• Hipótesis Nula (H0)


La hipótesis nula, también conocida como la hipótesis de la igualdad, es la
afirmación que no se rechaza a menos que los datos de la muestra evidencien
lo contrario.

• Hipótesis Alterna (H1)


La hipótesis alterna, también conocida como la hipótesis del investigador, es
la hipótesis que se quiere probar como verdadera.

366 ESTADÍSTICA GENERAL


19.4 Tipos de errores
Como la decisión de aceptar o rechazar la hipótesis nula se toma en base a los
resultados obtenidos de una muestra, existe la posibilidad de cometer dos tipos
de errores, a saber: rechazar la hipótesis nula cuando es verdadera o aceptar
dicha hipótesis cuando es falsa. Estos tipos de errores se conocen como error
tipo I y error tipo II respectivamente.

En un problema de prueba de hipótesis, la probabilidad de cometer el error tipo


I es establecida por el investigador antes de realizar la prueba, esta probabilidad
se conoce como nivel de significancia y se representa con la letra griega alfa
(α). Esta probabilidad se puede interpretar de la siguiente manera para α = 1%:
La probabilidad de cometer el error tipo 1 es como máximo 0.01. Es decir que,
si se toman 100 muestras de la población en estudio y con cada una de estas
se realiza la prueba, se espera que como máximo en una de las cien pruebas
realizadas se cometa el error tipo 1.

Adicionalmente, la probabilidad de cometer el error tipo II se representa con la


letra griega beta (β). Mención aparte, merece la probabilidad de no cometer el
error tipo II, que se conoce como la potencia de una prueba y que es definida a
continuación:

Potencia de una prueba


La potencia de una prueba es la probabilidad de rechazar la hipótesis nula
cuando es falsa y se representa como 1 - β.

Por tal razón, la potencia de la prueba refleja la capacidad de un contraste de


hipótesis para detectar diferencias significativas existentes entre lo afirmado y
lo real; claro está, en caso que dichas diferencias existan.

A continuación, un resumen de los tipos de errores y sus respectivas


probabilidades:

Decisión
Aceptar H0 Rechazar H0

H0 es ERROR TIPO I
P(Decisión correcta) =1-α
verdadera P(Decisión incorrecta) =α

ERROR TIPO II POTENCIA DE UNA PRUEBA


H0 es falsa
P(Decisión incorrecta) =β P(Decisión correcta) =1-β

ESTADÍSTICA GENERAL 367


19.5 Tipos de hipótesis
En un problema sobre prueba de hipótesis para un parámetro, se pueden
encontrar dos tipos de hipótesis: Hipótesis simple e hipótesis compuesta. Estos
tipos son mostrados a continuación:

Hipótesis simple

H0 : θ = θ o

Unilateral con cola hacia la izquierda Bilateral Unilateral con cola hacia la derecha
H1 : θ < θ o H1 : θ ≠ θ o H1 : θ > θ o

Hipótesis compuesta

H0 : θ ≥ θ o H0 : θ ≤ θ o

Unilateral con cola hacia la izquierda Unilateral con cola hacia la derecha
H1 : θ < θ o H1 : θ > θ o

Cabe indicar que la diferencia está dada en la hipótesis nula; es decir, mientras
que, en la hipótesis simple, el valor del parámetro es uno solo, en la hipótesis
compuesta se tiene un conjunto de valores para el parámetro.

Procedimiento para realizar una prueba de hipótesis


El procedimiento a seguir para realizar una prueba de hipótesis consiste de
cinco pasos, tal como se muestra a continuación:

Paso 1: Plantear las hipótesis

Paso 2: Establecer el nivel de significancia

Paso 3: Calcular el valor del estadístico de prueba

368 ESTADÍSTICA GENERAL


La decisión de aceptar o rechazar la hipótesis nula, se hace en base al valor del
estadístico de contraste (estadístico de prueba), este valor se obtiene con los
datos de la muestra.

Paso 4: Establecer la región de rechazo

La región de rechazo, también conocida como región crítica, se establece a


partir del nivel de significancia α.

Paso 5: Concluir de acuerdo al enunciado del problema

Si el valor del estadístico de prueba cae en la región de rechazo, se rechaza la


hipótesis nula (H0), caso contrario no se rechaza.

P-valor
Además del valor del estadístico de prueba, los programas estadísticos
brindan información del p-valor para tomar la decisión de aceptar o rechazar
la hipótesis nula. Cuando la prueba es unilateral con cola a la derecha,
este valor se define como el área bajo la curva a la derecha del valor del
estadístico de prueba, si la prueba es unilateral con cola a la izquierda,
este valor se define como el área bajo la curva a la izquierda del valor del
estadístico de prueba, pero si la prueba es bilateral, este valor se define
como dos veces el área bajo la curva a la derecha o izquierda del valor del
estadístico de prueba en caso de que el valor del estadístico de prueba sea
positivo o negativo respectivamente; luego, el p-valor se compara con el
nivel de significancia α y se rechaza la hipótesis nula, siempre y cuando, el
p-valor sea menor que α.

19.6 Prueba de hipótesis para la media poblacional


Las hipótesis para la media poblacional se presentan a continuación:

Hipótesis simple

H0 : μ = μ o

H1 : µ < µ o H1 : µ ≠ µ o H1 : µ > µ o

ESTADÍSTICA GENERAL 369


Hipótesis compuesta

H0 : μ ≥ μ o H 0 : μ ≤ μo
H1 : µ < µ o H1 : µ > µ o

En este tipo de prueba se presentan los siguientes casos:

a) CASO I: Prueba de hipótesis para la media poblacional ( ) cuando la


varianza de la población ( σ 2 ) es conocida
Sea X1, X2, …, Xn una muestra aleatoria tomada de una población normal con
media desconocida y varianza σ 2 conocida.

El estadístico de prueba que corresponde es:


x − µ0
Z cal = ∼ Ν(0,1)
σ
n

La región de rechazo se establece a partir de la hipótesis alterna definida y


el nivel de significancia dado.

Ejemplo 19.1
Una máquina está regulada para embolsar café con un peso promedio de 250
gramos. El último viernes, el jefe de control de calidad realizó una inspección
para determinar si debía mandar a regular la máquina; para esto, tomó una
muestra aleatoria de 25 bolsas y obtuvo un peso promedio de 247.25 gramos.
¿A qué conclusión llegará el jefe de control de calidad si se sabe que el peso
de las bolsas se distribuye normalmente con una desviación estándar de
ocho gramos? Utilice un nivel de significancia del 10%.

Sea la variable:

X = Peso de una bolsa de café

Datos:

n = 25
σ=8
x̅ = 247.25
α=0.10

370 ESTADÍSTICA GENERAL


Paso 1 (Plantee las hipótesis de prueba)

H0: μ = 250
H1: μ ≠ 250

Paso 2 (Establezca el nivel de significancia)

α=0.10

Paso 3 (Calcule el valor del estadístico de prueba)


x − μ 0 247.25 − 250
Z cal = = = − 1.72
σ 8
n 25

Paso 4 (Establezca la región de rechazo)

-1.72 Z0.05 = -1.64 Z0.95 = 1.64

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Zcal = -1.72 se encuentra en la región de rechazo, se rechaza la hipótesis


nula (H0).

Con un nivel de significancia del 10%, existe evidencia estadística para pensar
que el peso promedio de una bolsa de café es diferente que 250 gramos, por
lo tanto, es recomendable mandar a regular la máquina.

Calculo del p-valor

p − valor = 2 P ( Z > 1.72 ) = 2 1 – P ( Z ≤ 1.72 ) = 2 1 − 0.95728

p − valor = 0.08544

ESTADÍSTICA GENERAL 371


Conclusión con el p-valor
Como el p-valor es menor que alfa (p-valor = 0.08544 < α = 0.10), se
rechaza la hipótesis nula (H0).

b) CASO II: Prueba de hipótesis para la media poblacional ( ) cuando la


varianza de la población ( σ 2 ) es desconocida y el tamaño de la muestra
es menor o igual que 30
Sea X1, X2, … , Xn ( n ≤ 30 ) una muestra aleatoria tomada de una población
Normal con media desconocida y varianza σ 2 desconocida.

El estadístico de prueba que corresponde es:

x − μ0
Tcal = ~ t n−1
s
n

La región de rechazo se establece a partir de la hipótesis alterna definida y


el nivel de significancia dado.

Ejemplo 19.2
Se sabe que el nivel de ventas diario, en soles, de los trabajadores de una
empresa es una variable aleatoria que sigue una distribución normal con
una media de 2500 soles y una desviación estándar de 24.49 soles. Con la
finalidad de mejorar el nivel promedio de ventas diario, el jefe del área de
recursos humanos realizó una capacitación; y, para determinar la efectividad
de esta capacitación, en términos del nivel promedio de ventas diario, un día
cualquiera se seleccionó 20 trabajadores y se obtuvo una venta promedio
de 2538 soles con una desviación estándar de 20 soles. Con un nivel de
significancia del 2%, ¿es posible concluir que después de la capacitación
mejoró el nivel promedio de ventas diario de los trabajadores?

Sea la variable:

X = Nivel de ventas diario después de la capacitación

Datos:

n = 20 < 30
s = 20 ( muestral ) } CASO II

372 ESTADÍSTICA GENERAL


x = 2538

α = 0.02

Paso 1 (Plantee las hipótesis de prueba)


H 0 : µ ≤ 2500

H1 : μ > 2500

Paso 2 (Establezca el nivel de significancia)


α = 0.02

Paso 3 (Calcule el valor del estadístico de prueba)


x − μ 0 2538 − 2500
Tcal = = = 8.50
s 20
n 20

Paso 4 (Establezca la región de rechazo)

t0.98;19 = 2.205 8.50

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Tcal = 8.50 se encuentra en la región de rechazo, entonces se rechaza


H0 .
Con un nivel de significancia del 2%, existe evidencia estadística para pensar
que el nivel promedio de ventas diario es mayor que 2500 soles. Por lo tanto,
es posible concluir que la capacitación mejoró el nivel promedio de ventas
diario de los trabajadores.

ESTADÍSTICA GENERAL 373


c) CASO III: Prueba de hipótesis para la media poblacional ( μ ) cuando la
varianza de la población ( σ 2 ) es desconocida y el tamaño de la muestra
es mayor que 30
Sea X1, X2, … , Xn (n > 30) una muestra aleatoria tomada de una población
normal con media μ desconocida y varianza σ 2 desconocida.

El estadístico de prueba es:


x − μ0
Z cal = ~ N ( 0,1)
s
n

La región de rechazo se establece a partir de la hipótesis alterna definida y


el nivel de significancia dado.

Se verá un ejemplo en la sección 15.7 (ejercicios resueltos).

19.7 Ejercicios resueltos


1. En una oficina de defensa del consumidor se han recibido quejas de los
consumidores de una marca de conservas de frutas. Ellos manifiestan que
las latas de conservas tienen un contenido menor del que ofrecen; es decir,
menos de 350 c.c. Con la finalidad de determinar si existen razones para
que los clientes se quejen, un funcionario de esta oficina tomó una muestra
aleatoria de 36 latas y obtuvo los siguientes resultados:

N° de lata Contenido N° de lata Contenido N° de lata Contenido


1 350.0 13 352.2 25 350.0
2 349.0 14 347.7 26 349.5
3 350.1 15 349.6 27 350.0
4 351.2 16 349.5 28 347.5
5 348.5 17 352.6 29 350.4
6 350.3 18 349.5 30 347.5
7 347.5 19 350.1 31 347.2
8 352.1 20 347.5 32 349.5
9 348.5 21 350.3 33 349.3
10 351.5 22 347.8 34 350.0
11 350.5 23 350.0 35 351.0
12 348.5 24 348.5 36 350.4

374 ESTADÍSTICA GENERAL


a) Pruebe si el contenido de las latas de conservas de frutas sigue una
distribución normal. Utilice un nivel de significancia del 5%.
b) Usando un nivel de significancia del 5%, ¿a qué conclusión llegará el
funcionario de la oficina de defensa del consumidor?
c) ¿Qué posible error se estaría cometiendo?

Solución

a) Sea la variable:

X = Contenido de una conserva de fruta

Para probar si la variable sigue una distribución normal, se utiliza la prueba


de Anderson-Darling.

Hipótesis

H 0 : La variable X sigue una distribución normal


H1 : La variable X no sigue una distribución normal

Gráfica de probabilidad de Contenido


Normal
99
Media 349.5
Desv. Est. 1415
95 N 36
AD 0.544
90 Valor p 0.151

80
70
Porcentaje

60
50
40
30
20
10
5

1
346 347 348 349 350 351 352 353

Contenido

Como p-valor = 0.151 > α = 0.05 no se rechaza la hipótesis nula. Con un


nivel de significancia del 5%, existe evidencia estadística para pensar que
la variable sigue una distribución normal.

ESTADÍSTICA GENERAL 375


Prueba de normalidad de Anderson-Darling

Hipótesis

H 0 : La variable sigue una distribución normal

H1 : La variable no sigue una distribución normal

Decisión

Si el p-valor es menor que el nivel de significancia se rechaza H0.

b) Datos:


n = 36 > 30 
 CASO III
s = 1.42 ( muestral ) 

x = 349.59
α = 0.05

Paso 1 (Plantee las hipótesis de prueba)


H 0 : μ ≥ 350

H1 : μ < 350

Paso 2 (Establezca el nivel de significancia)


α = 0.05

Paso 3 (Calcule el valor del estadístico de prueba)


x − μ 0 349.59 − 350
Zcal = = = − 1.73
s 1.42
n 36

376 ESTADÍSTICA GENERAL


Paso 4 (Establezca la región de rechazo)

-1.73 Z0.05 = -1.64

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Zcal = − 1.73 se encuentra en la región de rechazo, entonces se


rechaza H 0 .

Con un nivel de significancia del 5%, existe evidencia estadística para


pensar que el contenido promedio de las conservas de fruta es menor
que 350 c.c. Por lo tanto, se justifican las quejas de los consumidores.

c) En base al resultado en la parte b, es posible que se esté cometiendo el


error tipo I; es decir, es posible que la decisión de aceptar las quejas de los
clientes no sea la correcta.

2. En una cadena de supermercados se sabe que el monto promedio histórico


de las compras de sus clientes en la sucursal de San Miguel es de 450 soles.

Sin embargo, el gerente cree que, en el último mes, el monto de compra de


los clientes ha disminuido en diferentes proporciones, y como esto afecta
directamente al monto promedio, el gerente ha concluido que el monto
promedio histórico también ha disminuido. Para verificar sus creencias, el
gerente tomó una muestra aleatoria de 25 clientes y obtuvo un monto de
compra promedio de 435 soles con una desviación estándar de 150 soles.
Si los montos de las compras se distribuyen normalmente, ¿existe evidencia
estadística que apoyen las creencias del gerente con un nivel de significancia
del 2.5%?

Solución

Sea la variable:

X = Monto de una compra en la sucursal de San Miguel

ESTADÍSTICA GENERAL 377


Datos:

n = 25 < 30
s = 150 ( muestral ) } CASO II
x = 435
α = 0.025

Paso 1 (Plantee las hipótesis de prueba)


H 0 : μ = 450

H1 : μ < 450

Paso 2 (Establezca el nivel de significancia)


α = 0.025

Paso 3 (Calcule el valor del estadístico de prueba)


x − μ 0 435 − 450
Tcal = = = − 0.50
s 150
n 25

Paso 4 (Establezca la región de rechazo)

t0.025;24 = -2.064 -0.50

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Tcal = − 0.50 se encuentra en la región de no rechazo, entonces no se


rechaza H 0 .

Por lo tanto, no existe evidencia estadística que apoya las creencias del
gerente.

378 ESTADÍSTICA GENERAL


Ejercicio resuelto con el programa MINITAB
Para calcular el estadístico de prueba en una prueba de hipótesis para la media
poblacional se sigue la ruta: Estadísticas → Estadística básica → t de 1 Muestra …

En Datos resumidos, ingrese:

• Tamaño de muestra = 25
• Media de la muestra = 435
• Desviación estándar = 150

En Opciones, ingrese el nivel de confianza dado en el problema (por defecto se


visualiza 95%) y en Hipótesis alterna: Media < media hipotética

ESTADÍSTICA GENERAL 379


Haga clic en Aceptar dos veces y se obtiene:

19.8 Trabajo colaborativo (para trabajar en clase)


1. En las siguientes situaciones, defina la variable, el estadístico, el parámetro y
las hipótesis correspondientes:

I. Con la finalidad de establecer la nueva cuota mensual de los propietarios,


los dirigentes de la cooperativa COVIDA desean saber si el ingreso
promedio familiar mensual de todos los propietarios supera los
5000 soles.

II. El gerente de un restaurante cree que el ingreso promedio diario por la


venta del plato emblema no supera los 500 soles. En caso de que no sea
así, se realizaran algunas promociones para incrementar las ventas de
dicho plato.

III. Con la finalidad de establecer el tipo de modificación que se hará en las


habitaciones personales de un hotel, el administrador de dicho hotel desea
saber si la edad promedio de los clientes que ocupan estas habitaciones
es menor a 25 años.

2. En las siguientes situaciones, defina la variable, el parámetro de interés y


diga de forma escrita, sustentando su respuesta, en cuál de los casos de
prueba de hipótesis para la media se encuentra:

I. Con la finalidad de verificar si el tiempo promedio de ensamblaje de una


computadora es mayor a 30 minutos, el administrador de una empresa
tomó una muestra aleatoria de 12 trabajadores y registró los tiempos
que les tomó ensamblar el mismo modelo de computadora. El tiempo
promedio de ensamblaje fue de 30.5 minutos con una desviación estándar
de 0.5 minutos.

380 ESTADÍSTICA GENERAL


II. El contenido de una botella de aceite sigue una distribución normal con
una media de 900 ml y una desviación estándar de 2 ml. Para llevar a
cabo el control de calidad, el jefe de producción seleccionó una muestra
aleatoria de 25 botellas y obtuvo un contenido promedio de 850 ml. Esta
situación ha ocasionado que el jefe piense que el contenido por botella
sea menor que lo establecido.

3. Establezca si la siguiente afirmación es verdadera o falsa. Si la afirmación es


falsa, entonces, indique la afirmación correcta y justifique.

El jefe de seguridad de las playas del sur se encuentra analizando la posibilidad


de incrementar el número de vigilantes en estas playas, y lo hará, siempre y
cuando, el porcentaje de denuncias por robo en esta segunda quincena de
enero se haya incrementado con respecto a la quincena anterior. Para tomar
una decisión, el jefe de seguridad contrató los servicios de un especialista en
análisis de datos para que lo ayude a tomar la mejor decisión. Si el especialista
decide realizar un contraste de hipótesis para ayudar al jefe de seguridad a
tomar una decisión, entonces cometer el error tipo 2 será lo más perjudicial
para los playeros.

4. El dueño de un restaurante cree que el ingreso promedio diario obtenido por


la venta de su plato principal es de 300 soles. Con la finalidad de verificar sus
creencias, el dueño seleccionó una muestra aleatoria de los ingresos de 20
días y obtuvo los siguientes resultados:

N° de día Ingreso N° de día Ingreso


1 300 11 300
2 350 12 280
3 325 13 370
4 300 14 260
5 325 15 335
6 330 16 345
7 325 17 280
8 330 18 265
9 325 19 255
10 330 20 245

Si los ingresos diarios se distribuyen normalmente, se pide:

a) Defina correctamente las hipótesis de contraste.

ESTADÍSTICA GENERAL 381


b) A un nivel de significancia del 5%, ¿existe evidencia estadística que apoye
las creencias del dueño?

5. Un estudiante de la Facultad de Administración Hotelera, Turismo y


Gastronomía de la Universidad San Ignacio de Loyola realizó un estudio
sobre el perfil del turista extranjero que visitó nuestra capital el año pasado.
Una de las características que consideró fue el gasto realizado por el turista
en su estadía en Lima, que según un estudio hecho por especialistas de la
empresa Travel Perú, fue, en promedio, 1000 dólares.

Si el estudiante seleccionó una muestra aleatoria de 25 turistas extranjeros


que llegaron al Perú el año pasado y obtuvo un gasto promedio de 1150.5
dólares con una desviación estándar de 350.5 dólares, ¿se puede concluir
que el gasto promedio es mayor que el brindado por los especialistas de la
empresa Travel Perú? Utilice un nivel de significancia del 5%.

19.9 Trabajo autónomo


1. Complete los espacios en blanco:

a) En un contraste de hipótesis, se comete el error tipo II cuando …………………


………………………………………………………………………………………

b) En un contraste de hipótesis, la probabilidad de cometer el error tipo I


está dado por ………………………………………………………………………………….

2. Un funcionario del Gobierno Regional de Puno está analizando la posibilidad


de incrementar el presupuesto destinado a una de las zonas rurales más pobres
del departamento, y lo hará, siempre y cuando el ingreso mensual familiar
promedio sea menor que 250 soles. Para tomar una decisión, el presidente
de dicho gobierno contrató a un consultor especializado en este tipo de
problemas, quien tomó la decisión de realizar un contraste de hipótesis para
resolver el problema, ¿cuál de los dos tipos de errores sería más perjudicial
para los pobladores de la zona rural? Fundamente su respuesta.

3. Los fabricantes de una determinada marca de leche afirman que el


porcentaje promedio de materias grasas es menor al 12%. Para corroborar
dicha afirmación, un representante de registros del consumidor tomó una
muestra aleatoria de 20 envases y obtuvo un porcentaje promedio de grasas
igual a 12.6% con una desviación estándar de 2.2%. En base a la información
presentada y utilizando un nivel de significancia del 5%, ¿habrá suficiente
evidencia estadística para aceptar lo afirmado por los fabricantes?

382 ESTADÍSTICA GENERAL


a) Defina en forma clara el parámetro que utilizará en la prueba de hipótesis
respectiva.
b) Defina las hipótesis de prueba.
c) Calcule el estadístico de prueba y el valor crítico
d) ¿Habrá suficiente evidencia estadística para aceptar lo afirmado por los
fabricantes?

4. El gerente del banco LMR, afirma que en lo que va del año, el monto promedio
de los créditos vehiculares personales supera los 60000 soles. Para determinar
si esta afirmación es verdadera, un representante de la JCA, institución que
regula y fiscaliza los movimientos bancarios, tomó una muestra aleatoria de
15 personas con créditos vehiculares y obtuvo un monto promedio de 60250
soles con una varianza de 160000 soles2.

A un nivel de significancia del 3%, ¿apoyan los resultados a la afirmación


hecha por el gerente del banco LMR?

a) Plantee las hipótesis correspondientes.


b) Calcule el estadístico de prueba.
c) Establezca la región de Rechazo.
d) Concluya de acuerdo al contexto.

5. En una unidad escolar se realizó un estudio para valorar las aptitudes


intelectuales en niños de seis años de edad; para esto se utilizó la escala de
inteligencia de Wechsler para niños. Los resultados obtenidos se muestran a
continuación:

Niño CI Niño CI Niño CI


1 92 9 107 17 106
2 94 10 118 18 101
3 95 11 108 19 112
4 95 12 116 20 97
5 97 13 105 21 112
6 101 14 105 22 107
7 98 15 110 23 86
8 99 16 126 24 123

En base a la información mostrada y con un nivel de significancia del 5%,


¿existe evidencia estadística para pensar que el coeficiente intelectual
promedio de los estudiantes de esta unidad escolar está por debajo de la
clasificación Normal Superior? Utilice la siguiente tabla de clasificación para
realizar la prueba:

ESTADÍSTICA GENERAL 383


Clasificación de la inteligencia según
Wechsler
Clasificación CI
Retardo Hasta 69
Limítrofe 70 a 79
Normal Lento 80 a 89
Normal Promedio 90 a 109
Normal Superior 110 a 119
Superior 120 a 129
Muy Superior 130 y más

Considere que los estudiantes de esta unidad escolar presentan características


similares.

384 ESTADÍSTICA GENERAL


Lección 20
Prueba de hipótesis para la
proporción y la varianza poblacional
20.1 Prueba de hipótesis para la proporción poblacional π
Sea X1, X2, … , Xn una muestra aleatoria tomada de una población Bernoulli con
parámetro π, donde π representa la proporción de elementos en la población
que poseen una característica de interés.

Las hipótesis para la proporción poblacional π se presentan a continuación:

Hipótesis simple

H0 : π = π o

Hipótesis compuesta

H0 : π ≥ π o H0 : π ≤ π o

El estadístico de prueba es:

p − π0
Z cal = ~ N ( 0,1)
π0 (1 − π0 )
n

donde p representa la proporción de elementos en la muestra que poseen dicha


característica y su valor se calcula de la siguiente manera:

La región de rechazo se establece a partir de la hipótesis alterna definida y el


nivel de significancia dado.

ESTADÍSTICA GENERAL 385


Ejemplo 20.1
El dueño de una conocida pollería desea saber si las quejas de los clientes por el
servicio recibido en dicho establecimiento supera el 10%; de ser así, se tomarán
acciones de mejoras inmediatas en el servicio. Para tomar una decisión, el dueño
tomó una muestra aleatoria de 100 clientes y obtuvo que 70 de ellos no se
quejaron por el servicio recibido. Con un nivel de significancia del 1%, ¿cuál será
la decisión?

Sea la variable:

X = Número de clientes que se quejaron por el servicio brindado

Datos:

n = 100
30
p= = 0.30
100
α = 0.01

Paso 1 (Plantee las hipótesis de prueba)

H 0 : π ≤ 0.10
H1 : π > 0.10

Paso 2 (Establezca el nivel de significancia)


α = 0.01

Paso 3 (Calcule el valor del estadístico de prueba)

Zcal =
(0.30 − 0.10) = 6.67
( (
0.10 1 − 0.10 )) / 100

386 ESTADÍSTICA GENERAL


Paso 4 (Establezca la región de rechazo)

Z0.99 = 2.33 6.67

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Zcal = 6.67 se encuentra en la región de rechazo, se rechaza la hipótesis


nula (H0).

Con un nivel de significancia del 1%, existe evidencia estadística para pensar que
el porcentaje de personas que formularon quejas respecto al servicio recibido en
dicho establecimiento supera el 10%; por lo tanto, será necesario implementar
acciones de mejora.

20.2 Prueba de hipótesis para la varianza poblacional


Sea X1, X2, …, Xn una muestra aleatoria tomada de una población normal con
media desconocida y varianza σ 2 desconocida.

Las hipótesis para la varianza poblacional se presentan a continuación:

Hipótesis simple

H 0 : σ 2 = σ 02

H1 : σ 2 σ 02 H1 : σ 2 ≠ σ 02 H1 : σ 2 σ 02

Hipótesis compuesta

H 0 : σ 2 ≥ σ 02 H 0 : σ 2 ≤ σ 02

H1 : σ 2 σ 02 H1 : σ 2 σ 02

ESTADÍSTICA GENERAL 387


El estadístico de prueba es:

χ 2
=
( n − 1) s 2

~ χ n2−1
cal
σ 02

La región de rechazo se establece a partir de la hipótesis alterna definida y el


nivel de significancia dado.

Se verá un ejemplo en la sección 16.3 (ejercicios resueltos).

20.3 Ejercicios resueltos


1. Un especialista en la elaboración de pasteles considera que uno de sus nuevos
pasteles tendría aceptación en el mercado luego de un periodo de prueba
transcurrido, si el ingreso promedio diario supera los 350 soles y si existe
estabilidad en los ingresos diarios. El especialista también determina que no
existe estabilidad en los ingresos diarios si la varianza de estos ingresos es
mayor que 100 soles2.

Si luego de transcurrido el periodo de prueba establecido por el especialista


para su nuevo pastel Tres Delicias, se tomó una muestra aleatoria de los
ingresos de 30 días para saber si el pastel ha tenido aceptación en el mercado,
¿cuál será la conclusión? Los ingresos obtenidos se muestran a continuación:

N° de día Ingreso N° de día Ingreso N° de día Ingreso


1 332.20 11 321.75 21 379.50
2 354.20 12 368.50 22 358.60
3 331.10 13 335.50 23 394.90
4 346.50 14 348.70 24 386.10
5 360.80 15 350.90 25 383.35
6 354.75 16 361.35 26 390.50
7 323.40 17 356.95 27 369.60
8 341.00 18 345.40 28 387.20
9 374.00 19 371.25 29 377.85
10 378.40 20 355.85 30 381.15

a) Pruebe si los ingresos siguen una distribución normal. Utilice un nivel de


significación del 5%.

388 ESTADÍSTICA GENERAL


Sea la variable:

X = Ingreso diario

Para probar si la variable sigue una distribución normal, se utiliza la prueba


de Anderson-Darling.

Hipótesis

H 0 : La variable X sigue una distribución normal


H1 : La variable X no sigue una distribución normal

Gráfica de probabilidad de Ingreso diario


Normal - 95% de IC
99
Media 360.5
Desv. Est. 20.46
95 N 36
AD 0.262
90 Valor p 0.680

80
70
Porcentaje

60
50
40
30
20
10
5

1
300 320 340 360 380 400 420

Ingreso diario

Como p-valor = 0.680 > α = 0.05 no se rechaza la hipótesis nula. Con un


nivel de significancia del 5%, existe evidencia estadística para pensar que
la variable sigue una distribución normal.

b) Plantee las hipótesis de prueba, calcule el estadístico de prueba y


establezca la región de rechazo. Utilice un nivel de significación del 5%.

Primero se efectuará la prueba de hipótesis para la varianza; si existe


evidencia estadística de que la varianza de los ingresos es mayor que 100
soles2, se concluirá que el pastel no ha tenido aceptación en el mercado
debido a que no se existe estabilidad en los ingresos diarios de acuerdo
a lo planteado por el especialista. Caso contrario, se probará si el ingreso
promedio diario es mayor que 350 soles.

ESTADÍSTICA GENERAL 389


Datos:
n = 30
s = 20.46
x = 360.71
α = 0.05

Paso 1 (Plantee las hipótesis de prueba)

H 0 : σ 2 ≤ 100
H1 : σ 2 > 100

Paso 2 (Establezca el nivel de significancia)


α = 0.05

Paso 3 (Calcule el valor del estadístico de prueba)


2

χ 2
=
(30 − 1) ( 20.46) = 121.40
cal
100

Paso 4 (Establezca la región de rechazo)

X20.95;29 = 42.557 121.40

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Zcal = 121.40 se encuentra en la región de rechazo, se rechaza


H 0 . Con un nivel de significancia del 5%, existe evidencia estadística para
pensar que no existe estabilidad en los ingresos diarios de acuerdo a lo
planteado por el especialista. Por tanto, se concluye que el pastel no ha
tenido aceptación en el mercado.

390 ESTADÍSTICA GENERAL


2. Un funcionario del Ministerio de Agricultura cree que, en cierta región del
país, menos del 25% de los productores tienen en la cosecha de la quinua su
principal producto de cultivo. Para verificar sus creencias, el funcionario tomó
una muestra aleatoria de 100 productores y obtuvo los siguientes resultados:

Figura Nº01. Distribución de los productores según su producto de cultivo


principal.

Habas
Papa 21.5%
35.8%

Cebada Quinua
19.2% 23.5%

Con un nivel de significancia del 5%, ¿los datos apoyan las creencias del
funcionario?

Sea la variable:

X = Número de productores que tienen en la cosecha de la quinua su principal


producto de cultivo

Datos:

n = 100
p = 0.235

α = 0.05

Paso 1 (Plantee las hipótesis de prueba)

H 0 : π ≥ 0.25
H1 : π < 0.25

ESTADÍSTICA GENERAL 391


Paso 2 (Establezca el nivel de significancia)
α = 0.05

Paso 3 (Calcule el valor del estadístico de prueba)

Zcal =
(0.235 − 0.25) = −0.35
(0.25(1 − 0.25)) / 100
Paso 4 (Establezca la región de rechazo)

Z0.05 = -1.64 -0.35

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Zcal = -0.35 se encuentra en la región de no rechazo, no se rechaza la


hipótesis nula (H0).

Con un nivel de significancia del 5%, no existe evidencia estadística para pensar
que, en dicha región del país, menos del 25% de los productores tienen en la
cosecha de la quinua su principal producto de cultivo. Es decir, los datos no
apoyan las creencias del funcionario.

20.4 Trabajo colaborativo (para trabajar en clase)


1. En las siguientes situaciones, defina la variable, el estadístico, el parámetro y
las hipótesis correspondientes:

a) La máquina alfa produce menos del 3% de artículos defectuosos de la


producción total de un lote.

b) El jefe de ventas de una empresa hará una reestructuración de su equipo


de vendedores si la varianza de la venta total semanal del equipo es mayor
a 2000 dólares2.

392 ESTADÍSTICA GENERAL


2. Un representante de la Municipalidad de Lima quiere determinar si en la
urbanización PREVI se procede o no con la instalación de gas subterráneo.
Debido a que la instalación se hace a través de una red de tuberías subterráneas,
el representante de la municipalidad procederá con la contratación de la
compañía que se hará cargo de la instalación; siempre y cuando, exista
evidencia que más del 70% de las familias de dicha urbanización estén de
acuerdo con la instalación. Si 105 de 130 familias están a favor de la instalación,
con un nivel de significancia del 5%, ¿cuál será la conclusión?

3. Un representante del Ministerio de Trabajo afirmó que el 65% de las personas


que se retiraron de un empleo antes de los 65 años volvieron a trabajar
cuando alguien les ofreció uno. Esta pregunta se hizo a 150 personas en esta
condición, y 102 contestaron en forma afirmativa. Con un nivel de significancia
del 1%, ¿se puede concluir que la afirmación hecha por el representante del
Ministerio es verdadera?

a) Plantee las hipótesis correspondientes.


b) Calcule el estadístico de prueba.
c) Establezca la región de Rechazo.
d) Concluya de acuerdo al contexto.

4. Una conocida cadena de pizzas tiene como lema en el servicio delivery:


“llegamos a lo más en 30 minutos o su pedido es gratis”. El administrador de
la cadena evaluó los servicios de un mes en todas las sedes a partir de una
muestra aleatoria de 276 entregas y encontró que 34 de estas fueron gratis.
Si estos resultados apoyan la hipótesis que más del 10% de las entregas han
sido gratis, el administrador contratará algunas personas más para el servicio.
A un nivel de significancia del 5%, se pide:

a) Plantee las hipótesis correspondientes.


b) Calcule el estadístico de prueba y establezca la región de rechazo.
c) Concluya de acuerdo al contexto.

5. Una máquina envasadora de mermelada está regulada para llenar frascos


con un contenido promedio de 1000 gramos y una varianza de 25 gramos2.
En forma periódica, el jefe de producción toma una muestra aleatoria de
20 frascos y mide el contenido, todo esto con la finalidad de controlar la
variabilidad del proceso.

Si en uno de los controles se obtienen los siguientes resultados:

ESTADÍSTICA GENERAL 393


N° de N° de
Contenido Contenido
frasco frasco
1 1000 11 980
2 1010 12 988
3 990 13 995
4 988 14 985
5 970 15 997
6 972 16 987
7 999 17 975
8 999 18 970
9 1001 19 965
10 1002 20 1005

Con un nivel de significancia del 2.5%, ¿existe evidencia estadística para


pensar que la variabilidad del proceso está bajo control?

20.5 Trabajo autónomo


1. En las siguientes situaciones, defina la variable, el estadístico, el parámetro y
las hipótesis correspondientes:

a) El porcentaje de personas que está a favor de implementar cambios en el


sistema financiero supera el 85%.
b) El jefe de producción de una empresa programará una capacitación de
emergencia para sus trabajadores si la varianza del tiempo de ensamblaje
del producto A es mayor a 25 minutos2.

2. Una editorial está interesada en sacar a la venta una revista sobre la


gastronomía peruana y lo hará, siempre y cuando, más de la cuarta parte
de la población la compre. Para esto, el departamento de investigación de
la editorial realizó una encuesta y encontró que 450 de un total de 1500
personas comprarían la revista.

A un nivel de significancia del 5%, ¿debería la editorial sacar a la venta dicha


revista?

a) Plantee las hipótesis correspondientes.


b) Calcule el estadístico de prueba.
c) Establezca la región de Rechazo.
d) Concluya de acuerdo al contexto.
e) Defina el error tipo I y error tipo II en términos del problema

394 ESTADÍSTICA GENERAL


3. El jefe de control de calidad de una empresa de productos de limpieza
sabe que la uniformidad en el contenido de los envases es importante para
controlar la variabilidad en el llenado de las botellas. Especificaciones de
calidad establecen que la varianza no debe superar los cinco mililitros².

Cada cierto tiempo, el jefe de control de calidad toma una muestra aleatoria
de 20 botellas y mide el contenido, todo esto con la finalidad de controlar la
variabilidad en el llenado de las botellas. Si en uno de los controles se obtiene
que la desviación estándar es 5.05 mililitros, ¿existe evidencia estadística
para pensar que la variabilidad en el llenado de las botellas no está bajo
control? Utilice un nivel de significancia del 5%.

4. Un fabricante de dulces remplazará su sistema actual de producción que


presenta una varianza de 0.05 segundos2 solo si el nuevo sistema resulta
más estable en variabilidad que el actual. Para tomar una decisión, el
fabricante seleccionó una muestra aleatoria de 10 productos del nuevo
sistema y registró sus tiempos de fabricación. Los tiempos obtenidos se
muestran a continuación:

10.20 10.30 10.25 10.15 10.25


10.15 10.25 10.20 10.25 10.30

A un nivel de significancia del 5%, ¿existe evidencia estadística para que el


fabricante reemplace su sistema de producción actual?

5. El administrador de un hotel cree que más del 70% de los clientes que llegan
se retiran muy satisfechos con el servicio recibido.

Para verificar sus creencias, el gerente entrevistó aleatoriamente a 50 clientes,


y ante la pregunta: ¿Qué tan satisfechos se sintieron con el servicio recibido?,
obtuvo los siguientes resultados:

ESTADÍSTICA GENERAL 395


N° de cliente Respuesta N° de cliente Respuesta N° de cliente Respuesta
1 MS 21 MS 41 MS
2 S 22 S 42 S
3 MS 23 N 43 MS
4 MS 24 MS 44 MS
5 MS 25 MS 45 MS
6 MS 26 MS 46 S
7 MS 27 MS 47 MI
8 S 28 MS 48 MS
9 MS 29 I 49 MS
10 MS 30 N 50 S
11 N 31 MS 51 MS
12 MS 32 MS 52 MS
13 MS 33 MS 53 I
14 MS 34 MS 54 MS
15 MS 35 MS 55 MS
16 MS 36 S 56 MS
17 I 37 MS 57 S
18 S 38 N 58 MS
19 MS 39 MS 59 MS
20 MS 40 MS 60 MS

Donde:
MI: Muy Insatisfecho, I: Insatisfecho, N: Ni Satisfecho Ni Insatisfecho, S: Satisfecho y MS: Muy
Satisfecho

A un nivel de significancia del 5%, ¿existe evidencia estadística que apoye las
creencias del administrador?

396 ESTADÍSTICA GENERAL


Lección 21
Prueba de hipótesis para el cociente
de varianzas y para la diferencia de
medias
21.1 Prueba de hipótesis para el cociente de varianzas (σ 2
1
/ σ 22 )
Sean y dos muestras aleatorias independientes tomadas

2 2
( ) ( )
de dos poblaciones normales N μ 1 , σ 12 y N μ 2 , σ 22 respectivamente, con
varianzas σ 1 y σ 2 desconocidas.

σ 12
Las hipótesis para el cociente de varianzas se presentan a continuación:
σ 22

Hipótesis simple

σ 12
H0 : =1
σ 22

Hipótesis compuesta

σ 12 σ 12
H0 : ≥1 H0 : ≤1
σ 22 σ 22

ESTADÍSTICA GENERAL 397


El estadístico de prueba es:

s12
Fcal = ~ F ( n1 − 1, n2 − 1)
s22
La región de rechazo se establece a partir de la hipótesis alterna definida y el
nivel de significancia dado.

Ejemplo 21.1
Con la finalidad de comparar el gasto mensual en gaseosas de los jóvenes
y adultos de una pequeña comunidad, el jefe de ventas de una empresa de
gaseosa seleccionó una muestra aleatoria de 10 personas de cada grupo de
edad y obtuvo la siguiente información:

Gastos de los jóvenes 50.8 54.2 56.3 42.1 48.3 65.7 40.4 48.9 52.5 42.6
Gastos de los adultos 50.4 58.4 50.6 54.2 56.5 60.9 54.8 45.3 51.7 55.9

Si los gastos de cada grupo de edad se distribuyen normalmente, con un nivel


de significancia del 5%, ¿puede afirmar que la varianza de los gastos de los
jóvenes es mayor que la varianza de los gastos de los adultos?

Solución

Sean las variables:

X = Gasto de un joven

Y = Gasto de un adulto

Datos:

Grupo 1: Jóvenes
n1 = 10
s1 = 7.63

Grupo 2: Adultos
n 2 = 10
s 2 = 4.51

α = 0.05

398 ESTADÍSTICA GENERAL


Paso 1 (Plantee las hipótesis de prueba)

H 0 : σ 12 ≤ σ 22
H1 : σ 12 > σ 22

Paso 2 (Establezca el nivel de significancia)


α = 0.05

Paso 3 (Calcule el valor del estadístico de prueba)

s12 7.632
Fcal = = = 2.86
s22 4.512

Paso 4 (Establezca la región de rechazo)

2.86 F9;9;0.05 = 3.18

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Fcal = 2.86 se encuentra en la región de no rechazo, entonces no se rechaza


H 0 . Por lo tanto, no existe evidencia estadística para afirmar que la varianza de
los gastos de los jóvenes es mayor que la varianza de los gastos de los adultos.

21.2 Prueba de hipótesis para la diferencia de medias


poblacionales (μ 1 − μ 2 )
Las hipótesis para la diferencia de medias poblacionales 1
− 2 se presentan a
continuación:

ESTADÍSTICA GENERAL 399


Hipótesis simple

H 0 : μ 1 − μ 2 = μo

Hipótesis compuesta

H 0 : μ1 − μ 2 ≥ μ o H 0 : μ 1 − μ 2 ≤ μo

En este tipo de prueba se presentan los siguientes casos:

a) CASO I: Prueba de hipótesis para la diferencia de medias poblacionales


2 2
( μ 1 − μ 2 ) cuando las varianzas poblacionales ( σ 1 y σ 2 ) son conocidas
Sean y dos muestras aleatorias independientes
tomadas de dos poblaciones normales μ (
y N μ 2 , σ 22 respectivamente, )
con medias μ 1 y μ 2 desconocidas y varianzas σ 12 y σ 22 conocidas.

El estadístico de prueba es:

Z cal =
(x − x )− μ
1 2 0
~ N ( 0,1)
2 2
σ1
σ 2
+
n1 n2

La región de rechazo se establece a partir de la hipótesis alterna definida y


el nivel de significancia dado.

Ejemplo 21.2
Un fabricante de bombillas sospecha que en la línea de producción A se
están produciendo bombillas con un tiempo promedio de vida menor que las
que se producen en la línea B. Para verificar su sospecha, el fabricante tomó
una muestra aleatoria de 10 bombillas de cada una de las líneas y obtuvo los
siguientes resultados:

400 ESTADÍSTICA GENERAL


Línea Duración promedio en horas
A 1475
B 1525

Se sabe que los tiempos de vida de las bombillas se distribuyen


normalmente con una desviación estándar de 10 horas para la línea A y 8
horas para la línea B. Al nivel de significación del 5%, ¿se puede verificar la
sospecha del fabricante?

Solución

Sean las variables:

X = Tiempo de vida de una bombilla producida en A

Y = Tiempo de vida de una bombilla producida en B

Datos:

Grupo 1: Línea A
n1 = 10
x1 = 1475
σ 1 = 10

Grupo 2: Línea B

n 2 = 10
x 2 = 1525
σ2 = 8

α = 0.05

Paso 1 (Plantee las hipótesis de prueba)

H0 : μ 1 ≥ μ 2 (μ 1
− μ 2 ≥ 0)

Paso 2 (Establezca el nivel de significancia)


α = 0.05

ESTADÍSTICA GENERAL 401


Paso 3 (Calcule el valor del estadístico de prueba)

Z cal =
(x − x )−μ
1 2 0
=
(1475 − 1525) − 0 = −12.35
σ 12 σ 22 102 82
+ +
n1 n2 10 10

Paso 4 (Establezca la región de rechazo)

-12.35 Z0.05 = -1.64

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Zcal = − 12.35 se encuentra en la región de rechazo, se rechaza H 0 . Con


un nivel de significancia del 5%, existe evidencia estadística para pensar que
en la línea de producción A se están produciendo bombillas con un tiempo
promedio de vida menor que las que se producen en la línea B.

b) CASO II: Prueba de hipótesis para la diferencia de medias poblacionales


( μ 1 − μ 2 ) cuando las varianzas poblacionales ( σ 12 y σ 22 ) son desconocidas,
pero estadísticamente similares y la suma de los tamaños de muestra es
menor o igual que 30 ( n1 + n 2 ≤ 30 )
Sean y (n
1
+ n 2 ≤ 30 ) dos muestras aleatorias
2
independientes tomadas de dos poblaciones normales N μ 1 , σ 12 y N μ 2 , σ 2 ( ) ( )
respectivamente, con medias μ 1 y μ 2 desconocidas y varianzas σ 12 y σ 22
desconocidas pero estadísticamente similares.

El estadístico de prueba es:

Tcal =
(x − x )− μ
1 2 0
~ tn +n −2
2 2
( n1 − 1) s + ( n2 − 1) s
1 2

1 2 1 1
+
n1 + n2 − 2 n1 n2

402 ESTADÍSTICA GENERAL


La región de rechazo se establece a partir de la hipótesis alterna definida y
el nivel de significancia dado.

Se verá un ejemplo en la sección 17.3 (ejercicios resueltos).

c) CASO III: Prueba de hipótesis para la diferencia de medias poblacionales


( μ 1 − μ 2 ) cuando las varianzas poblacionales ( σ 12 y σ 22 ) son desconocidas,
pero estadísticamente diferentes y la suma de los tamaños de muestra es
menor o igual que 30 ( n1 + n 2 ≤ 30 )
Sean y (n 1
+ n 2 ≤ 30 ) dos muestras aleatorias
2
independientes tomadas de dos poblaciones normales N μ 1 , σ 1 y ( )
2 2
respectivamente con medias μ 1 y μ 2 desconocidas y varianzas σ 1 y σ 2
desconocidas pero estadísticamente diferentes.

El estadístico de prueba es:

Tcal =
(x − x )− μ
1 2 0
~ tg
2 2
s s
1 2
+
n1 n2

donde:
2
s12 s22
+
n1 n2
g= 2 2
−2
s12 s22
n1 n2
+
n1 + 1 n2 + 1

La región de rechazo se establece a partir de la hipótesis alterna definida y


el nivel de significancia dado.

Se verá un ejemplo en la sección 17.3 (ejercicios resueltos).

21.3 Ejercicios resueltos


1. Un analista cree que los sueldos de la empresa DISELTRU exceden a los de
la empresa PETROMOL en más de 400 soles. Para verificar sus creencias, el
analista seleccionó una muestra de 12 empleados de la empresa DISELTRU
y obtuvo un sueldo promedio semanal de 3600 soles con una desviación

ESTADÍSTICA GENERAL 403


estándar de 260 soles; y, una muestra de 15 empleados de la empresa
PETROMOL y obtuvo un sueldo promedio semanal de 3000 soles con una
desviación estándar de 250 soles.

Si se supone que las muestras provienen de dos poblaciones normales e


independientes, ¿a un nivel de significancia del 1%, existe evidencia estadística
que respalde las creencias del analista?

Nota: Verifique que las varianzas poblacionales son iguales

a) Plantee la hipótesis de prueba.

Sean las variables:

X1 = Sueldo de un trabajador de la empresa DISELTRU

X2 = Sueldo de un trabajador de la empresa PETROMOL

Datos:

DISELTRU
n1 = 12
x1 = 3600

s1 = 260

PETROMOL
n 2 = 15

x 2 = 3000
s 2 = 250
H 0 : μ1 − μ 2 ≤ 400
H1 : μ1 − μ 2 > 400

b) Calcule el estadístico de prueba y establezca la región de rechazo.

Estadístico de prueba

Tcal =
(x − x ) − μ
1 2 0
=
(3600 − 3000) − 400
( n − 1) s + ( n − 1) s
1
2
1 2
2
2 1 1
+
(12 − 1) 260 + (15 − 1) 250
2 2
1 1
+
n1 + n2 − 2 n1 n2 12 + 15 − 2 12 15

Tcal = 2.03

404 ESTADÍSTICA GENERAL


Región de rechazo

2.03 t0.99;25 = 2.485

c) Concluya de acuerdo al enunciado del problema.

Como Tcal = 2.03 se encuentra en la región de no rechazo, entonces no se


rechaza H 0 .

Por lo tanto, no existe evidencia estadística que respalde la afirmación del


analista.

2. Una importante empresa telefónica cuenta con dos sucursales A y B en un


solo distrito. El administrador ha recibido quejas de los clientes acerca del
tiempo de atención muy prolongado en la sucursal B; si esta afirmación es
cierta, se tomarán acciones correctivas en dicha sucursal. Caso contrario, el
proceso de atención continuará normalmente en ambas sucursales.

Con la finalidad de tomar una decisión, el administrador seleccionó una


muestra aleatoria de nueve clientes en la sucursal A y diez clientes en la
sucursal y obtuvo los siguientes resultados:

Sucursal A 24 23 22 24 23 25 26 20 22
Sucursal B 25 17 17 24 26 27 30 22 28 30

Asuma que los tiempos de atención siguen una distribución normal y que las
muestras son independientes.

¿Existe suficiente evidencia estadística para afirmar que en la sucursal B se


tomaran acciones correctivas? Use un nivel de significación del 10%.

Primero se efectuará la prueba de hipótesis para la igualdad de varianzas y


luego la prueba de hipótesis para la diferencia de medias.

Sean las variables:

ESTADÍSTICA GENERAL 405


X = Tiempo de atención en la sucursal A

Y = Tiempo de atención en la sucursal B

Datos:

Grupo 1: Sucursal A

n1 = 9
s1 = 1.79
x1 = 23.22

Grupo2: Sucursal B

n 2 = 10
s 2 = 4.72
x1 = 24.6

α = 0.10

Prueba de hipótesis para la igualdad de varianzas

Paso 1

H 0 : σ 12 = σ 22
H1 : σ 12 ≠ σ 22

Paso 2
α = 0.10

Paso 3

s121.792
Fcal = 2 = = 0.14
s2 4.722

406 ESTADÍSTICA GENERAL


Paso 4

0.14 1/F9;8;0.05 = 0.29 F8;9;0.05 = 3.23

Paso 5

Como Fcal = 0.14 se encuentra en la región de rechazo, entonces se


rechaza H 0 . Con un nivel de significancia del 10%, existe evidencia
estadística para pensar que las varianzas son diferentes.

Prueba de hipótesis para la diferencia de medias

Paso 1 (Plantee las hipótesis de prueba)

Paso 2 (Establezca el nivel de significancia)


α = 0.10

Paso 3 (Calcule el valor del estadístico de prueba)

Tcal =
(x − x ) −μ
1 2 0
=
( 23.22 − 24.6) − 0 = −0.86
s12 s22 1.792 4.722
+ +
n1 n2 9 10
donde:
2
s12 s22
+
n1 n2
g= 2 2
− 2 = 12
2
s 1
s 2
2
n1 n2
+
n1 + 1 n2 + 1

ESTADÍSTICA GENERAL 407


Paso 4 (Establezca la región de rechazo)

t0.10;12 = -1.356 -0.86

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Tcal = − 0.86 se encuentra en la región de no rechazo, no se rechaza


H 0 . Por lo tanto, no existe evidencia estadística para pensar que el tiempo
promedio de atención en la sucursal B es más prolongado que el tiempo
promedio de atención en la sucursal A.

Ejercicio resuelto con el programa MINITAB


Para calcular el estadístico de prueba en una prueba de hipótesis para el cociente
de varianzas poblacionales se sigue la ruta: Estadísticas → Estadística básica →
2 varianzas …

408 ESTADÍSTICA GENERAL


En Cada muestra está en su columna, ingrese:

• Muestra 1: Sucursal A
• Muestra 2: Sucursal B

En Opciones, ingrese el nivel de confianza dado en el problema (por defecto se


visualiza el 95%) y en Hipótesis alterna: Relación ≠ relación hipotética.

Haga clic en Utilizar prueba e intervalos de confianza basados en distribución


normal.

Haga clic en Aceptar dos veces y se obtiene:

ESTADÍSTICA GENERAL 409


Para calcular el estadístico de prueba en una prueba de hipótesis para la
diferencia de medias poblacionales se sigue la ruta: Estadísticas → Estadística
básica → t de 2 muestras …

En Cada muestra está en su columna, ingrese:

• Muestra 1: Sucursal A
• Muestra 2: Sucursal B

En Opciones, ingrese el nivel de confianza dado en el problema (por defecto se


visualiza el 95%) y en Hipótesis alterna: Diferencia < diferencia hipotética.

Si las varianzas poblacionales desconocidas se pueden considerar iguales, haga


clic Asumir varianzas iguales. Como en la prueba anterior, se concluyó que las
varianzas no son iguales, entonces no se hace clic en esta opción.

410 ESTADÍSTICA GENERAL


Haga clic en Aceptar dos veces y se obtiene:

21.4 Trabajo colaborativo (para trabajar en clase)


1. Para determinar la efectividad de un nuevo método de enseñanza del curso
de inglés para niños, se seleccionó a 20 niños que no sabían Ingles, los
mismos que fueron divididos aleatoriamente en dos grupos de 10 cada uno.
Al primer grupo, se le enseño el inglés con el método tradicional y al segundo
grupo con el nuevo método. Al final del curso los niños fueron evaluados; los
resultados obtenidos se muestran a continuación:

Método
Medidas de resumen Nuevo método
tradicional
Calificación promedio 87 92
Desviación estándar 10 11

Si se cree que las calificaciones obtenidas con el nuevo método serán más
altas, se pide:

a) Definir las hipótesis de contraste.


b) ¿A un nivel de significancia del 5%, existe evidencia estadística para pensar
que la calificación promedio obtenida con el nuevo método es más alta?
c) Describa claramente sus conclusiones.

2. En una panadería donde se trabaja en dos turnos (mañana y tarde), se cree


que el tiempo promedio de atención a los clientes del turno mañana es mayor
al tiempo promedio de atención del turno tarde en más de dos minutos. El
dueño de la panadería desea verificar si tal afirmación es cierta; para esto,
tomó una muestra aleatoria de 16 tiempos de atención del turno mañana y 11
tiempos de atención del turno tarde y obtuvo lo siguiente:

ESTADÍSTICA GENERAL 411


Turno
Medidas de resumen
Mañana Tarde
Tiempo promedio 7 4
Desviación estándar 2 3

Con un nivel de significancia del 4%, ¿excede el tiempo promedio de atención


del turno mañana en más de dos minutos al tiempo promedio de atención
del turno tarde?

3. El gerente de una empresa dedicada al alquiler de automóviles está por


decidir la marca de neumáticos que comprará para su flota de taxis. En
este momento solo tiene dos opciones: la marca A o la marca B. Como la
marca B es más cara, el gerente se inclinará por esta marca solo si existen
evidencias de que el kilometraje promedio recorrido con esta marca antes
de sufrir algún tipo de desgaste significativo es superior en más de 2000
km que el kilometraje promedio recorrido con la marca A; caso contrario
se inclinará por la marca A. Para esto, el gerente seleccionó 12 neumáticos
de cada marca y los probó hasta que se desgastaron significativamente.
Los resultados obtenidos se muestran a continuación:

Marca del Recorrido promedio


neumático (en km)
A 36000
B 39200

Si por datos históricos, se sabe que las desviaciones estándar para las marcas
de los neumáticos A y B son 5000 km y 6000 km respectivamente, se pide:

a) Establecer las hipótesis correspondientes que ayuden al gerente a tomar


una decisión.
b) Con un nivel de significancia del 5%, ¿cuál será la decisión del gerente?

CASO: PAQUETE TURÍSTICO


Con la finalidad de determinar cuál de sus dos nuevos paquetes turísticos
le produce mayores ingresos, el dueño de una agencia de viajes seleccionó
aleatoriamente los ingresos (en miles de soles) de 12 días de cada paquete.
Los resultados obtenidos se muestran a continuación:

Paquete
5.00 4.50 4.80 4.70 4.60 5.00 4.75 4.85 4.75 4.50 4.25 4.00
N°1
Paquete
4.50 4.00 3.80 3.75 4.50 5.00 4.50 4.75 4.25 4.35 4.00 4.15
N°2

412 ESTADÍSTICA GENERAL


4. Al nivel de significación del 5%, ¿son homogéneas las varianzas de los
ingresos de los paquetes?

5. Al nivel de significación del 5%, ¿existe evidencia estadística para pensar que
el paquete 1 produce mayores ingresos que el paquete 2?

21.5 Trabajo autónomo


El año pasado, el gerente financiero del banco CRÉDITO PERÚ efectúo un estudio
con la finalidad de analizar las diversas características de sus clientes, que tienen
entre 31 y 40 años, y que cuentan con una tarjeta de crédito Visa Signature.
Para esto, el gerente seleccionó aleatoriamente muestras independientes de los
clientes que cuentan con esta tarjeta en tres de sus principales sedes.

Los resultados se muestran a continuación:

Los Olivos San Miguel San Isidro


E I L M N E I L M N E I L M N
31 2.2 15 1.2 3 32 2.3 15 1.1 3 40 3.3 25 2.2 4
34 2.5 16 1.3 3 34 2.5 20 1.3 3 40 6.8 35 3.0 3
35 4.8 25 0.8 4 34 3.8 25 2.2 2 39 2.5 20 2.4 3
40 4.5 25 2.1 4 35 2.7 24 1.5 4 31 5.1 25 2.3 5
37 4.2 28 2.0 5 40 4.5 30 1.4 5 33 2.4 25 1.0 4
32 3.5 15 1.2 2 40 7.0 35 2.5 6 32 3.6 20 2.1 5
33 3.3 22 1.3 3 38 7.5 32 2.7 4 32 6.8 30 3.1 5
32 4.5 25 1.8 4 39 4.2 30 2.0 5 34 4.7 28 1.8 4
40 4.0 30 2.0 5 37 3.2 28 1.8 5 35 5.5 28 2.2 4
35 5.2 30 2.2 3 35 3.1 27 1.5 4 33 5.9 35 2.7 5

Donde:

E = Edad

I = Ingreso mensual (en miles de soles)

L = Línea de crédito (en miles de soles)

M = Monto de crédito utilizado en el último mes (en miles de soles)

N = Número de movimientos realizados en el último mes

ESTADÍSTICA GENERAL 413


1. Al nivel de significación del 5%, ¿son homogéneas las varianzas de las líneas
de crédito de los distritos de Los Olivos y San Miguel?

2. Al nivel de significación del 5%, ¿existe evidencia estadística para pensar que
la línea promedio de crédito en el distrito de San Miguel es mayor que en el
distrito de Los Olivos?

3. Al nivel de significación del 5%, ¿son homogéneas las varianzas de los montos
de crédito utilizados en el último mes de los distritos de San Miguel y San
Isidro?

4. Al nivel de significación del 5%, ¿existe evidencia estadística para pensar que
el monto de crédito promedio utilizado en el último mes en el distrito de San
Miguel es igual que el del distrito de San Isidro?

5. Al nivel de significación del 5%, ¿existe evidencia estadística para pensar


que el ingreso promedio mensual de los clientes del distrito de San Isidro
supera en más de 2500 soles al ingreso promedio mensual de los clientes del
distrito de San Miguel?

414 ESTADÍSTICA GENERAL


Lección 22
Prueba de hipótesis para la diferencia
de proporciones
22.1 Prueba de hipótesis para la diferencia de
proporciones ( π1 − π2 )
Sean y dos muestras aleatorias independientes
tomadas de dos poblaciones Bernoulli con parámetros π1 y π 2
respectivamente donde π1 y π 2 representan la proporción de elementos
que poseen la misma característica de interés en sus respectivas
poblaciones.

En este tipo de prueba se presentan los siguientes casos:

a) Prueba de hipótesis para la igualdad de proporciones


Las hipótesis para una prueba de hipótesis para la igualdad de proporciones
poblacionales ( π1 = π 2 ) se presentan a continuación:

Hipótesis simple

H 0 : π1 − π 2 = 0

Hipótesis compuesta

H 0 : π1 − π 2 ≥ 0 H 0 : π1 − π 2 ≤ 0

El estadístico de prueba es:

Z cal =
(p − p )
1 2
~ N ( 0,1)
1 1
p (1 − p ) +
n1 n2

ESTADÍSTICA GENERAL 415


donde:

x1 + x2 n1 p1 + n2 p2
p = =
n1 + n2 n1 + n2

La región de rechazo se establece a partir de la hipótesis alterna definida y


el nivel de significancia dado.

b) Prueba de hipótesis para la diferencia de proporciones diferente de cero


Las hipótesis para la diferencia de proporciones poblacionales ( π1 − π 2 ) se
presentan a continuación:

Hipótesis simple

H 0 : π1 − π 2 = π o

Hipótesis compuesta

H 0 : π1 − π 2 ≥ π o H 0 : π1 − π 2 ≤ π o

El estadístico de prueba es:

Z cal =
( p − p )− π
1 2 0
~ N ( 0,1)
p (1 − p ) p (1 − p )
1 1 2 2
+
n1 n2

La región de rechazo se establece a partir de la hipótesis alterna definida y


el nivel de significancia dado.

22.2 Ejercicios resueltos


1. Se desea comparar el nivel de sintonía de un programa de televisión en las
familias de dos ciudades A y B. Para esto, en la ciudad A se tomó una muestra
aleatoria de 150 familias y se encontró que 45 familias ven el programa;

416 ESTADÍSTICA GENERAL


mientras que, en la ciudad B se tomó una muestra aleatoria de 180 familias y
se encontró que 63 familias ven el programa. Con un nivel de significación del
3%, ¿existe evidencia estadística para afirmar que el porcentaje de familias
que ven el programa en ambas ciudades es diferente?

Sean las variables:

X = Número de familias que ven el programa en la ciudad A

Y = Número de familias que ven el programa en la ciudad B

Datos:

Ciudad A
n1 = 150
p1 = 0.30

Ciudad B
n 2 = 180
p2 = 0.35

α = 0.03

Paso 1 (Plantee las hipótesis de prueba)

Paso 2 (Establezca el nivel de significancia)


α = 0.03

Paso 3 (Calcule el valor del estadístico de prueba)

p1 − p2 0.30 − 0.35
Z cal = = = − 0.96
1 1 1 1
pˆ (1 − pˆ ) + 0.33( 0.67 ) +
n1 n2 150 180

donde:

x1 + x2 45 + 63 39
pˆ = = = = 0.33
n1 + n2 150 + 180 120

ESTADÍSTICA GENERAL 417


Paso 4 (Establezca la región de rechazo)

Z0.015 = -2.17 -0.96 Z0.985 = 2.17

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Z cal = − 0.96 se encuentra en la región de no rechazo, entonces no se


rechaza H0. Por lo tanto, no existe evidencia estadística para afirmar que el
porcentaje de familias que ven el programa en ambas ciudades es diferente.

2. El gerente de ventas de una gran cadena de tiendas que se dedica a la


comercialización de ropa desea saber con cuál de los siguientes conceptos:
Elegante y tradicional o Fresca y clásica, sus clientes identifican más a la tienda.
Para ello, el gerente seleccionó aleatoriamente a 200 clientes hombres y 380
clientes mujeres y les preguntó con cuál de estos dos conceptos identifican
a la tienda. De los hombres, 130 respondieron elegante y tradicional; y, de las
mujeres 190 respondieron fresca y clásica.

¿Se puede afirmar que la diferencia de proporciones de clientes hombres y


de clientes mujeres que identifican a la tienda con el concepto de fresca y
clásica es mayor que 0.05? Utilice un nivel de significación del 5%.

Sean las variables:

X = Número de clientes hombres que identifican a la tienda con el concepto


de fresca y clásica

Y = Número de clientes mujeres que identifican a la tienda con el concepto


de fresca y clásica

Datos:

Hombres
n1 = 200
p1 = 0.65

418 ESTADÍSTICA GENERAL


Mujeres
n 2 = 380
p2 = 0.50

Paso 1 (Plantee las hipótesis de prueba)

Paso 2 (Establezca el nivel de significancia)


α = 0.05

Paso 3 (Calcule el valor del estadístico de prueba)

p1 − p2 − π 0 0.65 − 0.50 − 0.05


Zcal = = = 2.36
p1 (1 − p1 ) p2 (1 − p2 ) 0.650.35 0.500.50
+ +
n1 n2 200 380

Paso 4 (Establezca la región de rechazo)

t0.95= 1.64 2.36

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Z cal = 2.36 se encuentra en la región de rechazo, se rechaza H0. Con un


nivel de significancia del 5%, existe evidencia estadística para afirmar que la
diferencia de proporciones de clientes hombres y de clientes mujeres que
identifican a la tienda con el concepto de fresca y clásica es mayor que 0.05.

ESTADÍSTICA GENERAL 419


22.3 Trabajo colaborativo (para trabajar en clase)
1. Los directivos de una empresa líder en investigación desean comparar los
porcentajes de aceptación de una nueva reforma política en dos distritos de
Lima. Para esto, el encargado del estudio seleccionó una muestra aleatoria de
150 habitantes en el distrito A y 100 habitantes en el distrito B. Los resultados
obtenidos se muestran a continuación:

Opinión
Distrito Sexo
A favor En contra
Hombre 45 25
A
Mujer 40 40
Hombre 25 15
B
Mujer 30 30

Con un nivel de significancia del 5%, responda las siguientes preguntas:

a) ¿Existe evidencia estadística para pensar que la proporción de habitantes


que está a favor de la nueva reforma política es mayor en el distrito A que
en el distrito B?
b) Para los hombres, ¿existe evidencia estadística para pensar que la
proporción de hombres que está en contra de la nueva reforma política
es mayor en el distrito A que en el distrito B en más de 0.20?

2. El dueño de un hotel quiere comparar dos tipos de insecticidas para moscas,


Naporex y Oxyfly. Para esto, fumigó dos habitaciones con las mismas
características, una habitación con el insecticida Naporex y la otra habitación
con el insecticida Oxyfly. Con la finalidad de comparar los resultados, el dueño
soltó 150 moscas en cada habitación; y después de dos horas, encontró 125
moscas muertas en la habitación que utilizó Naporex y 105 moscas muertas
en la habitación que utilizó Oxyfly.

¿A un nivel de significancia del 5%, existe evidencia estadística para pensar


que el insecticida Naporex produce mejores resultados?

3. El jefe de ventas de una gran cadena de tiendas debe decidir entre dos cursos
de capacitación, A y B, para sus vendedores. Para comparar la eficacia de los
cursos, el jefe tomó una muestra aleatoria de 120 vendedores para el curso
A y otra muestra aleatoria de 100 vendedores para el curso B. Luego de un
tiempo, después de finalizado el curso, encontró que el 75% de los vendedores
que llevó el curso A mejoró significativamente su desempeño; mientras que,
el 55% de los vendedores que llevó el curso B mejoró significativamente
su desempeño.

420 ESTADÍSTICA GENERAL


Como el curso A es más caro, el jefe decidirá enviar a sus vendedores a
dicho curso; siempre y cuando, el porcentaje de vendedores que mejoran
significativamente su desempeño con este curso supere en más del 15% al
porcentaje de vendedores que mejoran significativamente su desempeño
con el curso B. A un nivel de significancia del 5%, ¿cuál será la decisión del
jefe de ventas de esta cadena de tiendas?

CASO: PAGUE DOS Y LLEVE TRES


El gerente de marketing de una empresa que comercializa ropa para caballeros,
desea lanzar la siguiente promoción de camisas al mercado: Pague dos y lleve
tres; razón por la cual, debe decidir entre dos tipos de clientes: Jóvenes o
Adultos. Para tomar una decisión, el gerente seleccionó una muestra aleatoria
de 150 clientes jóvenes y 200 clientes adultos; y encontró, que 90 y 175 de ellos
respectivamente comprarían la promoción.

4. Si el gerente cree que la proporción de clientes adultos que comprarían la


promoción es mayor que la proporción de clientes jóvenes. A un nivel de
significación del 5%, ¿existe evidencia estadística que apoye las creencias
del gerente?

5. Si el gerente cree que la proporción de clientes adultos que comprarían la


promoción es mayor que la proporción de clientes jóvenes en más de 0.20.
A un nivel de significación del 5%, ¿existe evidencia estadística que apoye las
creencias del gerente?

22.4 Trabajo autónomo


1. Se entrevistó a dos grupos de hombres, jóvenes y adultos, para conocer
sobre su interés por un modelo de rasuradora eléctrica. En una muestra de
250 adultos se obtuvo que 25 de ellos estaban interesados en dicho modelo;
mientras que, en una muestra de 200 jóvenes se obtuvo que 150 de ellos
no estaban interesados en tal modelo. Con un nivel de significancia del 5%,
¿existe evidencia estadística para pensar que el grupo de los jóvenes está
más interesado en dicho modelo de rasuradora?

a) Plantee las hipótesis correspondientes.


b) Calcule el estadístico de prueba y establezca la región de Rechazo.
c) Concluya de acuerdo al contexto.
d) Defina los errores tipo I y II de acuerdo a las hipótesis planteadas.

ESTADÍSTICA GENERAL 421


2. Una de las principales funciones de un profesional en Marketing Digital
es posicionar en el mercado los diferentes productos con los que cuenta
la empresa a través de la promoción efectuada por diversos medios de
publicidad digital; ya sea, internet, aplicaciones móviles, entre otras.

Con la finalidad de observar el impacto de utilizar la publicidad digital para


promocionar un nuevo modelo de Smartphone; el gerente de una empresa
de telefonía móvil, especialista en marketing digital, decidió lanzar dicho
modelo a dos mercados con las mismas características, A y B; pero, solo en
el mercado A se promocionó el modelo mediante publicidad digital. Después
de una semana, se entrevistó a 600 clientes del mercado A y 800 clientes del
mercado B, y se obtuvo que 480 y 125 de los ellos conocían dicho modelo
en los mercados A y B respectivamente. Con un nivel de significancia del 5%,
¿cuál es su conclusión?

3. El gerente de ventas de una gran cadena de tiendas que se dedica a la


comercialización de ropa desea saber con cuál de los siguientes conceptos:
Elegante y tradicional o Fresca y clásica, sus clientes identifican más a la tienda.
Para ello, el gerente seleccionó aleatoriamente a 200 clientes hombres y 380
clientes mujeres y les preguntó con cuál de estos dos conceptos identifican
a la tienda. De los hombres, 130 respondieron elegante y tradicional; y, de las
mujeres 190 respondieron fresca y clásica.

¿Se puede afirmar que la proporción de clientes hombres y de clientes


mujeres que identifican a la tienda con el concepto elegante y tradicional es
el mismo? Utilice un nivel de significación del 2.5%.

CASO: PRODUCCIÓN
En una empresa se fabrican dos productos (A y B) en dos turnos de trabajo
(mañana y tarde). Con la finalidad de conocer el número de unidades defectuosas
fabricadas en cada turno de trabajo, el administrador de la empresa tomó dos
muestras independientes, una de cada turno de trabajo, y registró el número de
unidades defectuosas fabricadas de cada producto. Los resultados obtenidos
se muestran a continuación:

PRODUCTO
TURNO A B
Defectuosos Buenos Defectuosos Buenos
Mañana 35 200 65 300
Tarde 20 150 30 200

422 ESTADÍSTICA GENERAL


4. Con un nivel de significancia del 5%, ¿existe evidencia estadística para pensar
que en el turno de la tarde se fabrican productos con un menor porcentaje
de unidades defectuosas?

a) Defina los parámetros de interés.


b) Plantee las hipótesis correspondientes.
c) Calcule el estadístico de prueba y establezca la región de Rechazo.
d) Concluya de acuerdo al contexto.

5. Con un nivel de significancia del 5%, ¿existe evidencia estadística para afirmar
que la proporción de unidades defectuosas del producto B es mayor en la
mañana que en la tarde en más de 0.025?

a) Defina los parámetros de interés.


b) Plantee las hipótesis correspondientes.
c) Calcule el estadístico de prueba y establezca la región de Rechazo.
d) Concluya de acuerdo al contexto.

22.5 Problemas de reforzamiento del capítulo


1. En una reconocida compañía telefónica, el gerente de promoción y marketing
afirmó que cierto modelo de Smartphone promocionado en el mes de
setiembre fue comprado por más del 80% de sus clientes que compraron un
smartphone. El gerente de ventas pensó que esta afirmación era exagerada;
razón por la cual, seleccionó aleatoriamente a 150 clientes que compraron un
smartphone en setiembre y encontró que 130 de ellos compraron el nuevo
modelo. A un nivel de significancia del 5%, ¿existe suficiente evidencia para
concluir que la afirmación del gerente de promoción y marketing es correcta?

a) Defina el parámetro de interés.


b) Plantee las hipótesis correspondientes.
c) Calcule el estadístico de prueba y establezca la región de rechazo.
d) Concluya de acuerdo al contexto.

2. Una compañía empacadora de café garantiza que los sobres que ofrecen
tienen un peso promedio de 15 gramos. El administrador de un supermercado,
en su calidad de comprador comercial, sospecha que el peso promedio de
dicho producto es menor; de ser así, no comprará el producto. Para verificar
sus sospechas, el administrador tomó una muestra aleatoria de 15 sobres
de café y obtuvo un peso promedio de 14.86 gramos con una desviación
estándar de 0.12 gramos. A un nivel de significancia del 10%, se pide:

a) Plantee las hipótesis correspondientes.


b) Calcule el estadístico de prueba y establezca la región de rechazo.
c) Concluya de acuerdo al contexto.

ESTADÍSTICA GENERAL 423


3. Un empresario desea abrir un restaurante; aunque no está seguro del lugar
donde lo abrirá, tiene en mente dos distritos, A o B. La decisión final depende
de la ganancia mensual promedio de los restaurantes que funcionan en
estos distritos. Para esto, el empresario seleccionó aleatoriamente ocho
restaurantes en el distrito 1 y siete restaurantes en el distrito 2. Los resultados
obtenidos son los siguientes:

Medidas de resumen
Distrito 1 Distrito 2
(en soles)
Ganancia promedio 5000 4500
Desviación estándar 250 225

Si el empresario piensa que elegirá el distrito 1, a un nivel de significancia del


5%, ¿existe evidencia estadística que apoye al empresario?

a) Plantee las hipótesis correspondientes.


b) Calcule el estadístico de prueba y establezca la región de rechazo.
c) Concluya de acuerdo al contexto.
d) Defina los errores tipo I y II de acuerdo a las hipótesis planteadas.

4. Un ingeniero cree que la concentración del ingrediente activo de un detergente


líquido para ropa es afectada por el tipo de catalizador (1 o 2) que se utiliza
en el proceso de fabricación. Para verificar sus creencias, el ingeniero realizó
10 observaciones con cada catalizador y obtuvo los siguientes resultados
para la concentración del ingrediente activo (g/l):

Catalizador 1 57.9 66.2 65.4 65.4 65.2 62.6 67.6 63.7 67.2 71.0
Catalizador 2 66.4 71.7 70.3 69.3 64.8 69.6 68.6 69.4 65.3 68.8

¿Puede afirmar que existe diferencia entre las medias de las concentraciones
activas de los dos catalizadores?

22.6 Portafolio (para subir al campus virtual)


Resuelva los siguientes problemas con el uso del MINITAB.
1. El gerente de la empresa “DeliciaKola” sabe que aproximadamente uno de
cada diez consumidores de gaseosas prefiere esta marca. Con la finalidad de
incrementar su clientela, el gerente realizó una intensa campaña publicitaria,
que consistió en publicidad por radio y televisión. Luego de un período
establecido de tiempo y con el propósito de determinar la efectividad de la

424 ESTADÍSTICA GENERAL


campaña, uno de los trabajadores que forma parte del equipo de gerencia
seleccionó aleatoriamente a 350 consumidores de gaseosas y obtuvo que
150 expresaron su preferencia por dicha marca. En base a este resultado y
considerando un nivel de significancia del 5%, ¿existe evidencia estadística
para pensar que la campaña publicitaria resultó efectiva?

a) Plantee las hipótesis correspondientes.


b) Calcule el estadístico de prueba y establezca la región de rechazo.
c) Concluya de acuerdo al contexto.
d) Defina los errores tipo I y II de acuerdo a las hipótesis planteadas.

2. En cierta compañía, se comercializan sus productos mediante catálogos y


ventas puerta por puerta. En dicha compañía, se ha decidido comprobar la
eficacia de una campaña por radio; para lo cual, se seleccionó dos distritos.
Uno recibió campaña por radio y el otro no. El porcentaje de visitas con éxito
en el distrito con campaña por radio fue 41%; mientras que, en el distrito sin
campaña fue 37%. Si se realizaron 800 visitas en cada distrito, ¿proporcionan
estos datos evidencia suficiente de que la campaña por radio brinda mejores
resultados? Utilice un 6 % de significancia.

a) Plantee las hipótesis correspondientes.


b) Calcule el estadístico de prueba y establezca la región de rechazo.
c) Concluya de acuerdo al contexto.
d) Defina los errores tipo I y II de acuerdo a las hipótesis planteadas.

3. El jefe de capital humano de una empresa ha recibido el encargo de analizar


el tiempo que les toma ejecutar una tarea, en minutos, a los colaboradores
de las áreas de administración y contabilidad. Para este fin, seleccionó una
muestra aleatoria de cada área y obtuvo los siguientes resultados:

Administración Contabilidad
n1 = 14 n2 = 13

x1 = 14 x2 = 15.17
S1 = 1.41 S2 = 4.45

Suponga que los tiempos de demora siguen una distribución normal, ¿existe
evidencia estadística suficiente que permita afirmar que los tiempos promedio
de demora son diferentes? Utilice un nivel de significancia de 5%.

ESTADÍSTICA GENERAL 425


Capítulo 9
ANÁLISIS DE VARIANZA
Tratamiento/condición
Personal de las áreas de una empresa
(Ventas, Logística, Marketing, Recursos Humanos)

Grupos divididos 1. Participantes diferentes


entre los sujetos 2. Igual tratamiento
del factor “x” 3. Igual medida de la
variable dependiente

Grupo inicial de los


participantes

Capacidades por desarrollar


Al finalizar el capítulo, el estudiante estará en capacidad de:

• Realizar la prueba de hipótesis para verificar la normalidad de los residuos


y la homogeneidad de varianzas en problemas contextualizados con salidas
obtenidas con el programa Minitab.
• Realizar la prueba de hipótesis para la igualdad de k medias poblacionales
con la técnica del análisis de varianza en problemas contextualizados.
• Interpretar las comparaciones múltiples de Tukey en problemas
contextualizados obtenidas con el programa Minitab.

Motivación
En la fábrica de pantalones Pants, se tienen cuatro trabajadores que se
dedican exclusivamente a coser pantalones previamente cortados. El gerente
de Pants sospecha que los trabajadores no están laborando a un mismo nivel.
Para comprobar la sospecha, el gerente decide registrar en forma aleatoria

426 ESTADÍSTICA GENERAL


el tiempo (en minutos) que demora cada trabajador en coser un pantalón.
Cinco observaciones fueron registradas para cada trabajador, obteniéndose la
siguiente información:

Trabajador
TA TB TC TD
28 27 29 27
25 28 30 28
29 30 32 26
30 28 35 28
28 25 37 27

Además, se sabe que el tiempo que demora cada trabajador en coser un


pantalón sigue una distribución normal y la varianza de los tiempos en todos
los trabajadores es la misma. A un nivel de significancia del 5%, ¿se puede
afirmar que los cuatro trabajadores tienen el mismo tiempo promedio al coser
un pantalón?

Al finalizar el capítulo, el estudiante estará en capacidad de responder esta


pregunta y otras más, utilizando los conceptos básicos y la organización de
datos.

Saberes previos
• Intervalos de confianza.
• Prueba de hipótesis.

ESTADÍSTICA GENERAL 427


Lección 23

23.1 Conceptos básicos


23.1.1 Factor
Es una variable independiente que afecta los resultados del experimento, un
factor puede tener varios niveles. En un experimento se puede evaluar uno o
más factores.

23.1.2 Niveles del factor


Los niveles de un factor son los tipos o grados específicos del factor que se
tendrán en cuenta en la realización del experimento.

Ejemplo:

Factor: Porcentaje de algodón

Niveles: 15%, 20%, 25%, 30%

Observación:
Se debe tener en cuenta que en el tratamiento matemático de los modelos
de diseño de experimento los factores cuantitativos son tratados como
cualitativos y sus niveles son elegidos por intervalos o se codifican. Por lo
general, un factor no suele tener más de cuatro niveles.

23.1.3 Tratamiento
Nivel de un factor o combinación de los niveles de varios factores considerados
en el experimento.

Ejemplo:

Factor 1: Turno de trabajo de un empleado

Niveles o tratamientos: mañana, tarde, noche

23.1.4 Unidad experimental


Es el elemento al cual se le aplica un tratamiento. Un conjunto de unidades
experimentales se le denomina material experimental.

428 ESTADÍSTICA GENERAL


Ejemplo:

• Un ingeniero civil desea evaluar tres diferentes tipos de mezcla, la unidad


experimental es una pared.

23.1.5 Variable respuesta


Es la característica que se desea evaluar como resultado de la aplicación de los
tratamientos.

Ejemplo:

• Calificación obtenida por un estudiante en un examen.


• Tiempo (en minutos) de ensamblaje de una computadora portátil.

23.1.6 Dato u observación


Es el registro numérico obtenido después de la aplicación del tratamiento a la
unidad experimental.

Ejemplos:

• 16 puntos.
• 22.4 minutos.

23.1.7 Experimento
Un experimento es un procedimiento en el cual se crean pruebas con el fin de
verificar una o varias hipótesis relacionadas con un fenómeno determinado.

23.2 Diseño experimental


Es la distribución de los tratamientos a las unidades experimentales.

Tipos de diseños experimentales:

a) No existe restricción a la aleatorización:

Las unidades experimentales son homogéneas. Es decir, solo los tratamientos


puedan afectar los cambios en la variable respuesta. Ejemplo: Diseño
Completamente al Azar (D.C.A.)

b) Existen una o más restricciones a la aleatorización:

En este tipo de diseño las unidades experimentales, se diferencian por una


determinada característica que permite formar bloques o grupos. Ejemplo:
Diseño de Bloques Completos al Azar (D.B.C.A.), Diseño Cuadrado Latino.

ESTADÍSTICA GENERAL 429


23.3 Error experimental
Es la diferencia observada en los valores de la variable respuesta de cada una de
las unidades experimentales por una acción diferente a la de los tratamientos.

a) Fuentes de error experimental


• Principal: Varianza entre las unidades experimentales
• Secundarias: Errores de medición y falta de control de factores o variables
importantes no incluidas en el experimento.

b) Formas de reducir el error experimental


• Utilizando el diseño experimental adecuado.
• Seleccionando minuciosamente el material experimental.
• Incrementando el número de repeticiones en el experimento.

23.4 Principios básicos de un diseño experimental


a) Repetición: Consiste en aplicar el tratamiento a más de una unidad
experimental en condiciones similares.

La repetición permite:

• La estimación del error experimental.


• Obtener estimaciones más precisas del efecto medio de cualquier
tratamiento en estudio.

b) Aleatorización: Consiste en asignar aleatoriamente los tratamientos a las


unidades experimentales.

La aleatorización permite:

• Hacer válidas las conclusiones o inferencia estadística.


• Que las observaciones sean independientes.
• Evitar sesgos.

c) Bloqueo: Consiste en distribuir las unidades experimentales en bloques,


de tal manera que las unidades dentro de cada bloque sean relativamente
homogéneas.

23.5 Modelo Aditivo Lineal


Es una representación estadística de las relaciones existentes entre los factores
o componentes considerados en un diseño experimental.

430 ESTADÍSTICA GENERAL


Por ejemplo:

j: 1, 2, …, k; i: 1, 2, …, r

donde:

Yi j : Valor observado en la i-ésima repetición con el j-ésimo tratamiento.

μ: Efecto de la media general

τ j: Efecto del j-ésimo tratamiento (fijo o aleatorio)

ε ij: Efecto del error experimental de la i-ésima repetición con el j-ésimo


tratamiento.

Tipos de Modelos:
• Modelo I (Efectos Fijos): Ocurre cuando los tratamientos incluidos en
el experimento han sido fijados por el experimentador. En este caso las
conclusiones del experimento son válidas solamente para los tratamientos
evaluados. Este modelo es el más utilizado en el diseño completamente
aleatorizado.

• Modelo II (Efectos Aleatorios): Es el modelo que se presenta cuando los


tratamientos incluidos en el experimento son seleccionados aleatoriamente
de una población de tratamientos. En este caso las conclusiones del
experimento son válidas para la población de los tratamientos.

• Modelo III (Efectos Mixtos): Se presenta cuando se tiene una combinación de


los modelos anteriores.

23.6 Análisis del modelo con efectos fijos


Se usa para probar la igualdad de k medias poblacionales en los niveles de los
factores (tratamientos) que son determinados por el investigador.

Suponga que se tiene k tratamientos o niveles diferentes de un solo factor


que se quieren comparar. La variable respuesta observada en cada uno de
los k tratamientos es una variable aleatoria. Después de aplicar un diseño
completamente aleatorizado y de recolectar la información de la variable, los
datos se presentan en una tabla con la siguiente estructura:

ESTADÍSTICA GENERAL 431


Tratamiento
Repetición Total
1 2 3 … k
1 Y11 Y12 Y13 … Y1k
2 Y21 Y22 Y23 … Y2k
3 Y31 Y32 Y33 … Y3k
⁞ ⁞ ⁞ ⁞ … ⁞
r Yr1 Yr2 Yr3 … Yrk
r

Total T.1 T.2 T.3 … T.k T Y

Tamaño de la
n1 n2 n3 … nk
muestra (nj)

donde:

Yi j : Valor de la observación i para el tratamiento j.

n j: Número de observaciones para el j-ésimo tratamiento.

Y• • : Total de los valores observados Yij.

n: Tamaño de la muestra total para el experimento.

Se plantean las siguientes hipótesis:

H 0 : µ1 = µ 2 = µ 3 =  = µ k
H1 : µi ≠ µj para al menos un par i ≠ j (Al menos un µi es diferente)

Para probar la igualdad de las medias de los k tratamientos se utilizará la técnica


del análisis de varianza.

23.7 Análisis de Varianza (ANOVA)


Es una técnica estadística que permite descomponer la variabilidad total de los
resultados de un experimento en sus distintas fuentes (tratamientos, niveles de
factor, interacciones de niveles, covariables, error experimental, bloques).

Antes de aplicar el ANOVA se desarrollarán dos pruebas: prueba


de homogeneidad de varianzas de Bartlett y prueba de normalidad
de Anderson-Darling.

432 ESTADÍSTICA GENERAL


23.7.1 Tabla ANOVA
Los resultados obtenidos de la descomposición de la varianza total se resumen
en la siguiente tabla:

Fuente de Grados de Cuadrados


Suma de cuadrados Fcal
variación libertad medios
k T2
T2 SCTra
Tratamiento k −1 SCTra = ∑ . j − .. CMTra =
nj n k −1
j =1 CMTra
Fcal =
SCE CME
Error n− k SCE = SCT − SCTra CME =
n− k

Total n−1

donde:

SCTra= Suma de cuadrados del tratamiento.

SCE= Suma de cuadrados del error.

SCT= Suma de cuadrado del total.

CMTra= Cuadrado medio del tratamiento.

CME= Cuadrado medio del error.

El análisis de varianza requiere del cumplimiento de algunos supuestos que se


mencionarán más adelante, si estos supuestos son válidos, el estadístico de
prueba ( Fcal ) sigue una distribución F de Fischer con k – 1 grados de libertad en
el numerador y n – k grados de libertad en el denominador.

ESTADÍSTICA GENERAL 433


Pasos para realizar la prueba
Paso 1 (Plantee las hipótesis de prueba)

H 0 : µ1 = µ 2 = µ3 =  = µk
H1 : Al menos un µi es diferente

Paso 2 (Establezca el nivel de significancia)

Paso 3 (Calcule el valor del estadístico de prueba)

CMTra
Fcal =
CME

Paso 4 (Establezca la región de rechazo)

Región de
Región de no
Rechazo
Rechazo
Fk-1;n-k;α

Se rechaza H0, si:

CMTra
Fcal = > Fk−1, n − k, α
CME

Paso 5 (Concluya de acuerdo al enunciado del problema)

23.8 Supuestos del Modelo


1. Aditividad: Los efectos del modelo son aditivos.

2. Linealidad: Las relaciones entre los efectos del modelo son lineales.

3. Normalidad: Los errores del modelo deben seguir una distribución normal
con media cero y varianza σ2.

434 ESTADÍSTICA GENERAL


Prueba de normalidad de los errores del modelo con Anderson-Darling
Hipótesis

H 0 : Los errores siguen una distribución normal.


H1 : Los errores no sigue una distribución normal.

Decisión

Si p-valor es menor que el nivel de significancia se rechaza H0.

4. Independencia: Los resultados obtenidos en el experimento son


independientes entre sí.

5. Homogeneidad de varianzas: Las diferentes poblaciones generadas por la


aplicación de los diferentes tratamientos tienen varianzas iguales.

Prueba de homogeneidad de varianzas con Bartlett


Hipótesis

H 0 : Las varianzas en los k tratamientos son iguales.

(H 0
: σ 12 = σ 22 = σ 32 =  = σ k2 )
H1 : Al menos una de las varianzas en los k tratamientos es diferente.

(H :σ1 i
2
≠ σ 2j para al menos un par i, j )
Decisión

Si p-valor es menor que el nivel de significancia se rechaza H0.

Ejemplo 23.1
Un psicólogo, especializado en desarrollo personal, efectuó cursos de motivación
(Superación personal, Liderazgo e Integración) dirigidos a los colaboradores
del área de producción de una empresa. Para esto, el psicólogo seleccionó en
forma aleatoria e independiente a cinco colaboradores para que participen
en cada curso. Al final del curso, les aplicó un test motivacional y registró las
puntuaciones obtenidas por cada colaborador. Los resultados se presentan a
continuación:

ESTADÍSTICA GENERAL 435


Curso
Superación Liderazgo Integración
24 19 19
26 20 21
23 22 20
25 21 19
27 23 21

a) Verifique el supuesto de normalidad de los errores. Considere α =0.025.

Gráfica de probabilidad de RESID1


Normal
99
Media 0
Desv. Est. 1.309
95 N 15
90 AD 0.484
Valor p 0.194
80
70
Porcentaje

60
50
40
30
20
10
5

1
-3 -2 -1 0 1 2 3
RESID1

Paso 1
H0: Los errores siguen una distribución normal

H1: Los errores no siguen una distribución normal

Paso 2
Como p-valor = 0.194 > α = 0.025, no se rechaza H0. Con un nivel de significancia
del 2.5%, existe evidencia estadística para pensar que los errores de las
puntuaciones obtenidas siguen una distribución normal.

b) Al nivel de significancia del 2.5%, ¿se puede pensar que las varianzas de las
puntuaciones obtenidas por los colaboradores son iguales en los tres cursos
de motivación?

436 ESTADÍSTICA GENERAL


Prueba de varianzas iguales: Puntuación vs. Curso motivacional
Prueba de Barlett
Valor p 0.641
Curso 1

Curso motivacional

Curso 2

Curso 3

0 1 2 3 4 5 6 7 8
Intervalos de confianza de Bonferroni de 97.5% para Desv. Est.

Paso 1
H0: Las varianzas de las puntuaciones son iguales en los tres cursos de motivación

H1: Al menos una de las varianzas de las puntuaciones no es la misma en los tres
cursos de motivación

Paso 2
Como p-valor = 0.641> α = 0.025, no se rechaza H0. Con un nivel de significancia
del 2.5%, se puede pensar que las varianzas de las puntuaciones obtenidas por
los colaboradores son iguales en los tres cursos de motivación.

c) Al nivel de significancia del 2.5%, ¿se puede pensar que las puntuaciones
promedio obtenidas por los colaboradores en los tres cursos de motivación
son iguales?

Paso 1 (Plantee las hipótesis de prueba)


H0: µ1 = µ2 = µ3 (Las puntuaciones promedio son iguales)
H1 : Al menos un µi es diferente

Paso 2 (Establezca el nivel de significancia)


α = 0.025

ESTADÍSTICA GENERAL 437


Paso 3 (Calcule el valor del estadístico de prueba)

Cursos
Curso1 Curso2 Curso3
24 19 19
26 20 21 Observaciones
23 22 20 yij
25 21 19
27 23 21
T.j 125 105 100 T.. = 330

nj 5 5 5 n =15
T. 2j k r T..2 3302
SCT =∑∑yij2 − = 7354 − = 94
nj 3125 2205 2000 n 15

• Cálculo de la suma de cuadrados del total (SCT):


k T..2 r
23302
SCT =∑∑y − = 7354 −ij
= 94
n 15

• Cálculo de la suma de cuadrados del tratamiento (SCTra):

T..2
k T. 2j3302
SCTra = ∑ − = 7330 − = 70
nj n 15
j =1

• Cálculo de la suma de cuadrados del error (SCE):

SCE = SCT − SCTra = 94 − 70 = 24


• Cálculo de los grados de libertad:

Grados de libertad para el tratamiento: k – 1 = 3 – 1 = 2


Grados de libertad para el error: n – k = 15 – 3 = 12
Grados de libertad para el total: n – 1 = 15 – 1 = 14

• Cálculo del cuadrado medio del tratamiento (CMTra):

SCTra 70
CMTra = = = 35
k −1 2

438 ESTADÍSTICA GENERAL


• Cálculo del cuadrado medio del error (CME):

SCE 24
CME = = =2
n − k 12

CUADRO DEL ANOVA


Grados de Suma de
Fuente de Cuadrado Medio Estadístico de prueba
Libertad Cuadrados
Variación (CM) (Fcal)
(GL) (SC)
Tratamiento 2 70 35 CMTra
Error 12 24 2 Fcal = = 17.5
CME
Total 14 94

Paso 4 (Establezca la región de rechazo)

F2;12;0.025 = 5.10 17.5

Valor crítico: F0 = Fk−1, n − k, α = F2, 12, 0.025 = 5.10

Paso 5 (Concluya de acuerdo al enunciado del problema)


Como Fcal = 17.5 > F0 = 5.10, se rechaza H0. Con un nivel de significancia del 2.5%,
existe evidencia estadística para pensar que al menos una de las puntuaciones
promedio obtenida por los colaboradores en los tres cursos de motivación es
diferente.

23.9 Ejercicios resueltos


1. Un funcionario de MINCETUR desea realizar un estudio con la finalidad de
comparar los precios de tres agencias turísticas reconocidas (1: Lima Moderna,
2: Lima y su Historia, 3: Lima Renace) cuyo destino turístico es la Basílica y

ESTADÍSTICA GENERAL 439


Convento de San Francisco en la ciudad de Lima. Para tal efecto, se contrató
los servicios de un especialista, quien tomó muestras al azar en cada una de
las agencias, 6 turistas, 4 turistas y 5 turistas respectivamente, y registró el
precio por el servicio recibido. Los resultados se presentan a continuación:

Agencia Turística
Lima Lima y su
Lima Renace
Moderna Historia
29 27 30
27 27 30
31 30 31
29 28 27
32 29
30

Con un nivel de significancia del 5%, ¿se puede pensar que por lo menos una
de las agencias ofrece un precio promedio significativamente diferente que
las otras dos agencias?

Considere que se verifican los supuestos de normalidad de los errores y


homogeneidad de varianzas.

Solución

Paso 1 (Plantee las hipótesis de prueba)


H0: µ1 = µ2 = µ3 (los precios promedio del servicio turístico en las tres agencias
son iguales)

H1: µi ≠ µj para al menos un par i, j (Al menos una de las agencias ofrece un
precio promedio significativamente diferente)

Paso 2 (Establezca el nivel de significancia)


α = 0.05

440 ESTADÍSTICA GENERAL


Paso 3 (Calcule el valor del estadístico de prueba)

Agencia Turística
Lima Lima y su Lima
Moderna Historia Renace
29 27 30
27 27 30
31 30 31
29 28 27
32 29
30
nj 6 4 5 n =15
T.j 178 112 147 T.. = 437

T.j2/nj 5280.67 3136 4321.8 ∑T.j2/nj = 12738.47

• Cálculo de la suma de los cuadrados de las observaciones:

• Cálculo de la suma de cuadrados del total (SCT):

• Cálculo de la suma de cuadrados del tratamiento (SCTra):

• Cálculo de la suma de cuadrados del error (SCE):


SCE = SCT − SCTra = 37.733 − 7.203 = 30.53

• Cálculo de los grados de libertad:

Grados de libertad para el factor: k – 1 = 3 – 1 = 2


Grados de libertad para el error: n – k = 15 – 3 = 12
Grados de libertad para el total: n – 1 = 15 – 1 = 14

ESTADÍSTICA GENERAL 441


• Cálculo del cuadrado medio del tratamiento (CMTra):

SCTra 7.203
CMTra = = = 3.602
k −1 2

• Cálculo del cuadrado medio del error (CME):

SCE 30.53
CME = = = 2.544
n− k 12

CUADRO DEL ANOVA


Grados
Suma de Estadístico de
Fuente de de Cuadrado Medio
Cuadrados prueba
Variación Libertad (CM)
(SC) Fcal
(GL)

CMTra
Tratamiento 2 7.203 3.602 Fcal = = 1.42
CME
Error 12 30.530 2.544
Total 14 37.733

Paso 4 (Establezca la región de rechazo)

1.42 F2; 12; 0.05 = 3.89

Valor crítico: F0 = Fk−1, n − k, α


= F2, 12, 0.05 = 3.89

Paso 5 (Concluya de acuerdo al enunciado del problema)


Como Fcal = 1.42 < F0 = 3.89, no se rechaza H0. Con un nivel de significancia
del 5%, existe evidencia estadística para pensar que los precios promedio del
servicio turístico en las tres agencias son iguales.

442 ESTADÍSTICA GENERAL


2. El productor de un canal de televisión del país administra tres tipos de
programas (cómico, deportivo y musical). En cada trimestre, el director realiza
un estudio para conocer el tiempo semanal (en horas) que los miembros
de los hogares sintonizan dichos programas. Por tal motivo, al finalizar el
último trimestre, se seleccionó una muestra aleatoria de cinco hogares para
cada tipo de programa y se registraron los tiempos que los miembros de
los hogares sintonizaron el programa. Los tiempos obtenidos se muestran a
continuación:

Tipo de programa
Cómico Deportivo Musical
14 15 13
13 16 12
15 14 11
16 15 14
14 17 11

De donde:
r

a) A un nivel de significancia del 1%, ¿se puede afirmar que se cumple la


normalidad de los errores?

Gráfica de probabilidad de RESID1


Normal
99
Media 0
Desv. Est. 1.108
95 N 15
90 AD 0.528
Valor p 0.148
80
70
Porcentaje

60
50
40
30
20
10
5

1
-3 -2 -1 0 1 2 3
RESID1

ESTADÍSTICA GENERAL 443


Paso 1 (Plantee las hipótesis de prueba)

H0: Los errores siguen una distribución normal.

H1: Los errores no siguen una distribución normal.

Paso 2 (Concluya de acuerdo al enunciado del problema)

Como p-valor = 0.148 > α = 0.01, no se rechaza H0. Con un nivel de significancia
del 2.5%, existe evidencia estadística para pensar que los errores de las
puntuaciones obtenidas siguen una distribución normal.

b) Al nivel de significación de 2.5%, ¿se puede pensar que las varianzas de


los tiempos semanales de audiencia en los tres programas televisivos son
iguales?

Prueba de varianzas iguales: Tiempo vs. Programa

Prueba de Barlett
Valor p 0.957
Cómico
Programa

Deportivo

Musical

0 1 2 3 4 5 6 7 8
Intervalos de confianza de Bonferroni de 99% para Desv. Est.

Paso 1 (Plantee las hipótesis de prueba)


H0: Las varianzas de los tiempos semanales de audiencia en los tres programas
televisivos son iguales.

H1: Al menos una de las varianzas de los tiempos semanales de audiencia en


los tres programas televisivos es diferente.

Paso 2 (Concluya de acuerdo al enunciado del problema)


Como p-valor = 0.957 > α = 0.025, no se rechaza H0. Con un nivel de
significancia del 2.5%, se puede pensar que las varianzas de los tiempos
semanales de audiencia son iguales en los tres programas televisivos.

444 ESTADÍSTICA GENERAL


c) A un nivel de significancia del 1%, ¿se puede pensar que el tiempo promedio
semanal en los tres tipos de programas es el mismo?

Paso 1 (Plantee las hipótesis de prueba)


H0: µ1 = µ2 = µ3 (El tiempo promedio semanal en los tres tipos de programas
televisivos es el mismo)

H1: µi ≠ µj para al menos un par i, j (El tiempo promedio semanal de audiencia


no es el mismo en al menos uno de los programas televisivos)

Paso 2 (Establezca el nivel de significancia): α = 0.01

Paso 3 (Calcule el valor del estadístico de prueba)

Tipo de programa
Cómico Deportivo Musical
14 15 13
13 16 12
15 14 11
16 15 14
14 17 11
nj 5 5 5 n =15

T.j 72 77 61 T.. = 210

Tj.2/nj 1036.8 1185.8 744.2 ∑T.j2/n.j = 2966.8

• Cálculo de la suma de los cuadrados de las observaciones:

• Cálculo de la suma de cuadrados del total (SCT):

• Cálculo de la suma de cuadrados del tratamiento (SCTra):


k T. 2j
T..2 2102
SCTra = ∑ − = 2966.8 − = 26.8
j =1
n j
n 15

ESTADÍSTICA GENERAL 445


• Cálculo de la suma de cuadrados del error (SCE):
SCE = SCT − SCTra = 44 − 26.8 = 17.2

• Cálculo de los grados de libertad:

Grados de libertad para el factor: k – 1 = 3 – 1 = 2


Grados de libertad para el error: n – k = 15 – 3 = 12
Grados de libertad para el total: n – 1 = 15 – 1 = 14

• Cálculo del cuadrado medio del tratamiento (CMTra):

SCTra 26.8
CMTra = = = 13.4
k −1 2

• Cálculo del cuadrado medio del error (CME):

SCE 17.2
CME = = = 1.43
n− k 12

Cuadro del ANOVA


Fuente de
GL SC CM Fcal
Variación
Tratamiento 2 26.8 13.4
9.37
Error 12 17.2 1.43
Total 14 44.0

Paso 4 (Establezca la región de rechazo)

F2; 12; 0.01 = 6.93 9.37

Valor crítico: FT = Fk−1, n − k, α = F2, 12, 0.01 = 6.93

446 ESTADÍSTICA GENERAL


Paso 5 (Concluya de acuerdo al enunciado del problema)
Como Fc = 9.37 > FT = 6.93, se rechaza H0. Con un nivel de significancia
del 1%, existe evidencia estadística para pensar que el tiempo promedio
semanal de audiencia no es el mismo en al menos uno de los programas
televisivos.

EJERCICIO RESUELTO CON EL PROGRAMA MINITAB


Para calcular el estadístico de prueba al aplicar la técnica del análisis de varianza
se sigue la ruta: Estadísticas → ANOVA → Un solo factor …

Seleccione Los datos de respuesta están en una columna separada para cada
nivel de factor e ingrese en Respuestas los niveles del factor: Cómico, Deportivo
y Musical.

ESTADÍSTICA GENERAL 447


En Opciones ingrese el nivel de confianza dado en el problema. Luego, haga clic
en Aceptar dos veces y se obtiene:

448 ESTADÍSTICA GENERAL


• Para realizar el gráfico de la normalidad con la prueba de Anderson Darling
se hace lo siguiente:

La ruta es la siguiente: Estadísticas → ANOVA → Un solo factor

Luego de ingresar a Almacenamiento haga clic en Residuos.

Haga clic en Aceptar dos veces. Los residuos obtenidos por cada nivel del factor
colóquelos en una sola columna y asígnele un nombre. En este problema se
llamará RESID.

Para realizar el gráfico, la ruta es la siguiente: Estadísticas → Estadística básica


→ Prueba de normalidad …

ESTADÍSTICA GENERAL 449


Luego, en Variable se ingresa RESID y por defecto aparece seleccionada la
prueba de normalidad de Anderson – Darling.

Haga clic en Aceptar y se obtiene la siguiente gráfica:

Gráfica de probabilidad de RESID


Normal
99
Media 0
Desv. Est. 1.108
95 N 15
90 AD 0.528
Valor p 0.148
80
70
Porcentaje

60
50
40
30
20
10
5

1
-3 -2 -1 0 1 2 3
RESID

450 ESTADÍSTICA GENERAL


• Para realizar el gráfico de homogeneidad de varianzas con la prueba de
Bartlett se sigue la ruta: Estadísticas → ANOVA → Prueba de varianzas
iguales …

En Respuestas se ingresan los tres niveles del factor: Cómico - Deportivo -


Musical.

ESTADÍSTICA GENERAL 451


En Opciones, ingrese el nivel de confianza dado en el problema (por defecto se
visualiza el 95%), se hace clic en: Utilice la prueba basándose en la distribución
normal.

Haga clic en Aceptar dos veces y se obtiene la siguiente gráfica:

Prueba de varianzas iguales: Cómico, Deportivo, Musical

Prueba de Barlett
Valor p 0.957
Cómico

Deportivo

Musical

0 1 2 3 4 5
Intervalos de confianza de Bonferroni de 95% para Desv. Est.

23.10 Trabajo colaborativo (para trabajar en clase)


1. Establezca si las siguientes afirmaciones son verdaderas o falsas. Si la
afirmación es falsa, entonces, indique la afirmación correcta y justifique.

a) Los supuestos para aplicar el análisis de varianza son: varianzas


heterogéneas entre los tratamientos y dependencia entre las muestras.

b) El ANOVA se aplica cuando se desea contrastar la hipótesis de que las


medias muéstrales de dos grupos son iguales.

452 ESTADÍSTICA GENERAL


c) El estadístico de prueba utilizado en el análisis de varianza tiene distribución
Fisher.

d) Las sumas de cuadrados de los tratamientos y el error nos brindan las


estimaciones de las varianzas en la prueba del ANOVA.

2. Se analizaron los tiempos (en minutos) que tardan en procesar una pieza
cada una de las cuatro máquinas que posee una empresa productora de
lácteos. Para determinar si hay diferencia en el tiempo de procesamiento, el
gerente de producción seleccionó muestras diferentes para cada máquina.
Se tiene evidencia suficiente para pensar que la distribución de los tiempos
sigue una distribución normal.

a) Con un nivel de significación del 1%, ¿las varianzas de los tiempos de


procesamiento en las cuatro máquinas son iguales? Utilice los resultados
obtenidos con el programa Minitab:

Prueba para igualdad de varianzas

Estadístico
Método de prueba Valor p
Bartlett 0.09 0.845

b) Con un nivel de significación del 1%, ¿se puede considerar que los tiempos
promedio de procesamiento para cada máquina son iguales? Utilice los
resultados obtenidos con el programa Minitab:

Análisis de Varianza

Fuente GL SC CM Fcal

Tratamiento 3 12.107 4.0357 10.59

Error 24 9.143 0.3810

Total 27 21.250

ESTADÍSTICA GENERAL 453


3. Un psicólogo del área de evaluación de una empresa realizó un estudio en el
que compara cuatro estilos de personalidad de los colaboradores en función
de sus ingresos. Para esto, el psicólogo seleccionó una muestra aleatoria
de 20 colaboradores, registró los ingresos mensuales (en soles) y luego los
agrupó en iguales cantidades, y de forma independiente, por cada estilo de
personalidad. Los resultados obtenidos se presentan en el siguiente cuadro:

Estilo de personalidad

Original Patriarcal Optimista Pragmático


5700.0 6500.6 5800.0 6500.6
5460.3 5580.9 6240.7 6290.5
5370.7 6230.6 5730.3 6480.2
5780.6 5920.9 5980.9 5850.1
5570.2 6840.6 5750.8 6320.4

Se sabe que el ingreso mensual de los colaboradores sigue una distribución


normal para todos los estilos de personalidad y que las varianzas son
homogéneas.

a) Indique el factor, los niveles del factor, la variable respuesta y la unidad


experimental.
b) Con un nivel de significancia del 2.5%, ¿se puede pensar que el ingreso
promedio de los colaboradores para cada estilo de personalidad es el
mismo?

4. Un funcionario del Ministerio del Ambiente realizó un estudio de impacto


ambiental, debido a las denuncias anónimas recibidas sobre la contaminación
en el Rio Tallarit. Para analizar el contenido de plomo en el agua del rio,
se contrató los servicios de tres laboratorios, los mismos que hicieron
mediciones en diferentes puntos de su trayectoria. Los resultados obtenidos
son los siguientes:

Medidas de resumen Laboratorio1 Laboratorio2 Laboratorio3


Promedio 5.08 2.833 3.743
Varianza 1.477 1.207 1.006
Tamaño de muestra 5 6 7

Los supuestos de normalidad de los errores y varianzas iguales se cumplen.

454 ESTADÍSTICA GENERAL


¿Sugieren los datos que el contenido de plomo en el agua del rio es similar
en los tres laboratorios? Use α = 0.05.

5. Para lanzar al mercado una marca de café y obtener una gran acogida, un
profesional de marketing quiere elegir entre tres colores para la envoltura
del producto: azul, granate y verde. Para saber si el color influye en el nivel
de ventas, se eligen 12 tiendas, y se envían los productos de color azul a tres
tiendas, los de color granate a cuatro tiendas y los de color verde a cinco
tiendas. Al cabo de un mes, se obtuvo el número de productos vendidos en
las tiendas, los cuales se muestran a continuación:

Color de envoltura
Azul Granate Verde
25 34 45
43 41 42
52 45 46
32 36
28

De donde:

¿Se puede afirmar que las medias de los niveles de ventas del producto son
iguales con los tres colores de envoltura? Utilice un nivel de significancia
del 5%.

Asuma que los supuestos de normalidad de los errores y varianzas iguales


se cumplen.

23.11 Trabajo autónomo


1. El jefe de producción de una fábrica desea determinar si las cuatro máquinas
que participan en el proceso utilizan el mismo tiempo promedio en la
fabricación de un artículo. Para esto seleccionó una muestra aleatoria de
cada máquina de tamaños n1 = 6, n2 = 4, n3 = 4 y n4 = 6, y registró el tiempo
que utilizaron en la fabricación de un artículo. Los resultados obtenidos se
muestran a continuación:

ESTADÍSTICA GENERAL 455


Fuente de Grados de Suma de Cuadrado
Fcal
variación libertad Cuadrados medio
Tratamiento 152.62
Error
Total 542.92

Asuma que los supuestos de normalidad de los errores y varianzas iguales


se cumplen.

a) Plantee las hipótesis adecuadas.


b) Calcule el estadístico de prueba.
c) Establezca la región de rechazo. Utilice un nivel de significancia del 5%.
d) Concluya de acuerdo al contexto.

2. Equippment Home es una empresa que se dedica a vender productos para


el hogar. Actualmente se desea premiar a los trabajadores de las áreas de
ventas de iluminarias, línea blanca y decoración en base a las puntuaciones
(entre 0 a 30 puntos) obtenidas mediante una encuesta que se realizó a una
muestra aleatoria de cinco clientes en cada una de las áreas. Los resultados
se muestran a continuación:

Área de ventas
Iluminarias Línea Blanca Decoración
19 25 14
20 24 14
13 20 16
18 26 15
20 23 13

a) Identifique el factor, niveles del factor, variable respuesta y unidad


experimental.
b) Construya la tabla del análisis de varianza. Al nivel de significancia del 5%,
¿en la empresa Equippment Home se puede concluir que la puntuación
promedio es diferente en al menos una de las tres áreas?
c) Verifique el supuesto de homogeneidad de varianzas y normalidad de los
residuos. Utilice un nivel de significación del 5% y los resultados obtenidos
con el programa Minitab:

456 ESTADÍSTICA GENERAL


Prueba de varianzas iguales: Puntuación vs. Área

Prueba de Barlett
Valor p 0.246
Decoración

Área

Iluminarias

Línea Blanca

0 2 4 6 8 10 12
Intervalos de confianza de Bonferroni de 95% para Desv. Est.

Gráfica de probabilidad de RESIDUO


Normal
99
Media 2.960595E-15
Desv. Est. 2.077
95 N 15
90 AD 0.605
Valor p 0.095
80
70
Porcentaje

60
50
40
30
20
10
5

1
-5.0 -2.5 0.0 2.5 5.0
RESIDUO

3. En la fábrica de pantalones Pants se tienen cuatro trabajadores que se


dedican exclusivamente a coser pantalones previamente cortados. El gerente
de Pants sospecha que los trabajadores no están laborando a un mismo
nivel. Para comprobar sus sospechas, el gerente decide registrar en forma
aleatoria el tiempo (en minutos) que demora cada trabajador en coser un
pantalón. Los resultados para cinco observaciones registradas para cada
trabajador se presentan a continuación:

ESTADÍSTICA GENERAL 457


Trabajador
Trabajador Trabajador Trabajador Trabajador
A B C D
28 27 29 27
25 28 30 28
29 30 32 26
30 28 35 28
28 25 37 27
T.j 140 138 163 136

Con un nivel de significancia del 5%, ¿se puede afirmar que los cuatro
trabajadores presentan el mismo tiempo promedio al coser un pantalón?

Asuma que los supuestos de normalidad de los errores y varianzas iguales


se cumplen.

4. Un grupo de psicólogos evaluó el desarrollo de las competencias gerenciales


en cuatro diferentes empresas con características similares con el fin de
mejorar el desempeño laboral de sus colaboradores. Para tal fin, los psicólogos
seleccionaron una muestra aleatoria de seis gerentes de las diferentes áreas
de cada empresa para que participen en un curso de liderazgo durante
una semana. Al finalizar el curso, se les aplicó un test y se registraron las
puntuaciones obtenidas (entre 0 y 45 puntos). Los resultados obtenidos se
muestran a continuación:

Empresa
Empresa 1 Empresa 2 Empresa 3 Empresa 4
25 20 27 40
33 21 28 43
35 26 21 39
40 22 26 37
29 27 29 33
31 24 23 30

a) Identifique el factor, niveles del factor, variable respuesta y unidad


experimental.
b) Al nivel de significancia del 1%, ¿se puede concluir que existe diferencia
entre las puntuaciones promedio obtenidas por los gerentes en las cuatro
empresas?

458 ESTADÍSTICA GENERAL


c) Verifique el supuesto de homogeneidad de varianzas y normalidad de los
residuos. Utilice un nivel de significación del 1% y los resultados obtenidos
con el programa Minitab:

Gráfica de probabilidad de RESIDUO


Normal
99
Media -2.960595E-15
Desv. Est. 3.808
95 N 24
90 AD 0.206
Valor p 0.853
80
70
Porcentaje

60
50
40
30
20
10
5

1
-10 -5 0 5 10
RESIDUO

Prueba de varianzas iguales: Puntuación vs. Empresa

Prueba de Barlett
Empresa 1 Valor p 0.478

Empresa 2
Empresa

Empresa 3

Línea Blanca

0 5 10 15 20 25
Intervalos de confianza de Bonferroni de 99% para Desv. Est.

5. Un curso tiene tres profesores. Al comienzo de cada ciclo, los estudiantes


matriculados son asignados aleatoriamente a los profesores, luego de la
asignación, el profesor Pérez tiene seis estudiantes a su cargo, el profesor
Rodríguez tiene seis estudiantes y el profesor Bernal tiene cinco estudiantes.
Si al final del ciclo todos los estudiantes son evaluados y se obtienen los
siguientes resultados:

ESTADÍSTICA GENERAL 459


Profesor Pérez Rodríguez Bernal
Calificación
74.5 77 73.8
promedio
Número de
6 6 5
estudiantes
Suma de cuadrados
33573 30706 35000
de las calificaciones

Con un nivel de significación del 5% ¿se puede considerar que los tres
profesores producen resultados equivalentes en las calificaciones de los
estudiantes?

Asuma que los supuestos de normalidad de los errores y varianzas iguales


se cumplen.

460 ESTADÍSTICA GENERAL


Lección 24
COMPARACIONES MÚLTIPLES DE
TUKEY
En el ejemplo 23.2, al aplicar el método del análisis de varianza, se concluyó que
el tiempo promedio semanal de audiencia no es el mismo en al menos uno de
los programas televisivos. En estas circunstancias se necesita dar un paso más
y determinar en qué programa o programas se encuentran las diferencias. Una
técnica a utilizar para hacer las comparaciones entre los k niveles del factor
(tratamientos) es la prueba de comparación múltiple de Tukey.

24.1 Método de Tukey


Esta técnica se desarrolla cuando se rechaza la hipótesis nula en el análisis
de varianza y el modelo es unifactorial equilibrado; es decir, el número de
observaciones en cada nivel del factor es el mismo. En el caso que no fuera
equilibrado el método se denomina Tukey Kramer.

Se basa en la construcción de intervalos de confianza para todas las posibles


comparaciones de las medias poblacionales por parejas, asociadas a los k
niveles del factor; es decir las Ck2 comparaciones por parejas. Por cada intervalo
de confianza para cada par de medias poblacionales que no incluya el valor
cero se concluye que existe una diferencia significativa entre ese par de medias
con un nivel de confianza dado.

En este capítulo, la prueba de Tukey se realizará utilizando el software estadístico


Minitab. Por ejemplo, la siguiente salida es un resultado obtenido con el programa
Minitab para la prueba de Tukey:

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una confianza de
(1 – α) %

Factor N Media Agrupación

Nivel 1 5 25.00 A

Nivel 3 5 24.00 A

Nivel 2 5 20.00 B

ESTADÍSTICA GENERAL 461


En la salida se observan tres niveles del factor a comparar (1, 2, y 3), ordenados
según los valores de las medias muestrales (25, 24 y 20). De manera general,
se presentan sus respectivos tamaños de muestra (n), sus medias muestrales y
la agrupación de los niveles del factor representados por una letra del alfabeto
(A, B, …).

Si un par de niveles del factor comparten la misma letra, se asume la igualdad


de medias entre ese par de niveles del factor, en caso contrario, no se asume la
igualdad de medias entre ese par de niveles del factor.

Luego de cotejar la igualdad de medias entre cada par de niveles del factor,
se puede concluir que niveles del factor son iguales, diferentes, mayor(es) o
menor(es).

Del ejemplo, se observa que los niveles 1 y 3 comparten la letra de agrupación


A, mientras que solo el nivel 2 presenta la letra B, entonces se puede concluir:

• Si se quiere comparar niveles de factor que presentan medias iguales o


diferentes:

■ El nivel 1 y el nivel 3 presentan medias iguales.


■ El nivel 2 presenta media diferente al nivel 1 y nivel 3.

Por lo tanto, μ 1 = μ 3 o μ 2 ≠ ( μ 1 = μ 3 )

• Si se quiere verificar que nivel o niveles son mayores o menores:

■ El nivel 1 y el nivel 3 presentan medias más altas.


■ El nivel 2 presenta media más baja.

Por lo tanto, (μ 1 = μ 3 ) > μ 2

24.2 Ejercicios resueltos


1. En el ejercicio 23.2, se concluyó que existe evidencia estadística para pensar
que el tiempo promedio semanal de audiencia no es el mismo en por lo
menos uno de los programas televisivos. ¿Qué tipo(s) de programa(s)
presentó un tiempo promedio de sintonización semanal más alto? Utilice las
comparaciones múltiples de Tukey.

462 ESTADÍSTICA GENERAL


Comparaciones en parejas de Tukey
Agrupar información utilizando el método de Tukey y una confianza de
99%

Tipo de programa N Media Agrupación

Deportivo 5 15.40 A

Cómico 5 14.40 AB

Musical 5 12.20 B

Solución
• Los programas deportivos y cómicos comparten una misma letra de
agrupación (A). Es decir, μ D = μ C .

• Los programas cómico y musical también comparten una misma letra de


agrupación (B). Es decir, μ C = μ M .

Teniendo en cuentan los tiempos promedio muestrales y la letra compartida,


se concluye que los programas deportivos y cómicos presentan los tiempos
promedio de sintonización semanal más alto.

EJERCICIO RESUELTO CON EL PROGRAMA MINITAB


Para las comparaciones en parejas de Tukey se sigue la ruta: Estadísticas →
ANOVA → Un solo factor …

ESTADÍSTICA GENERAL 463


Seleccione Los datos de respuesta están en una columna separada para cada
nivel de factor e ingrese en Respuestas los niveles del factor: Cómico, Deportivo
y Musical.

En Comparaciones haga clic en Tukey, ingrese el nivel de significancia dado en


el problema (por defecto se visualiza un nivel de significancia de 5%).

464 ESTADÍSTICA GENERAL


Luego, haga clic en Aceptar dos veces.

2. Un ingeniero agrónomo está probando la efectividad del rendimiento, en


kilogramos, de tres tipos de fertilizantes (biocomposta, vermicomposta y
lombricultura) para aplicarlos en sus cultivos de tomates cherry. Para este
propósito, consideró 30 áreas de cultivo con 10 plantas cada una. Los
resultados se muestran a continuación:

Análisis de Varianza
Fuente GL SC CM Valor F Valor p

Fertilizante 2 524.7 262.37 16.43 0.000

Error 27 431.2 15.97

Total 29 955.9

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una confianza de
95%

Fertilizante N Media Agrupación

1: Biocomposta 10 39.58 A

2: Vermicomposta 10 38.86 A

3: Lombricultura 10 30.37 B

ESTADÍSTICA GENERAL 465


Asuma que los supuestos de normalidad de los errores y varianzas iguales
se cumplen.

a) Compare el rendimiento alcanzado con los tres tipos de rendimiento. Use


un nivel de significación de 0.05.
b) ¿Qué tipo de fertilizante presentó una baja efectividad en el rendimiento
de los cultivos de tomate cherry?

Solución

a) Paso 1 (Plantee las hipótesis de prueba)

H0: µ1 = µ2 = µ3 (El rendimiento promedio de los tres fertilizantes es el mismo)

H1: µi ≠ µj para al menos un par (i, j) (Al menos uno de los rendimientos
promedio es diferente)

Paso 2 (Concluya de acuerdo al enunciado del problema)


Como p-valor = 0 < α = 0.05, se rechaza H0. Con un nivel de significancia del
5%, existe evidencia estadística para pensar que por lo menos uno de los
rendimientos promedio es diferente.

b) Los fertilizantes Biocomposta y Vermicomposta comparten la letra de


agrupación A, por lo tanto, se puede pensar que la efectividad promedio del
rendimiento es la misma con ambos tipos de fertilizantes. Además, según
sus medias muestrales, presentan la más alta efectividad del rendimiento en
el cultivo de tomate cherry. Mientras que, solo el fertilizante Lombricultura
presenta la letra de agrupación B y según su media muestral, presenta la
más baja efectividad del rendimiento en el cultivo de tomate cherry. Es decir:
μ L < ( μB = μV ).

24.3 Trabajo colaborativo (para trabajar en clase)


1. Establezca si las siguientes afirmaciones son verdaderas o falsas. Si la
afirmación es falsa, entonces, indique la afirmación correcta y justifique.

a) Cuando la prueba de F es significativa en el ANOVA, no hay que realizar


la prueba de Tukey.

b) La prueba de Tukey se usa para comparar a la vez todos los niveles del
factor a estudiar.

466 ESTADÍSTICA GENERAL


c) En las comparaciones de Tukey con Minitab, cuando dos niveles del factor
presentan la misma letra de agrupación, se concluye que los promedios
de ambos niveles son iguales.

2. El administrador del centro comercial Sagaz & Bella comparó los efectos
de las ventas mensuales obtenidas de cuatro promociones (P1: Gratis por la
compra mayor a S/ 200, P2: 80% de descuento en el segundo producto, P3:
Llévatelo a 3x1 y P4: 50% de descuento en el segundo producto) realizadas
el año pasado por las fiestas navideñas. A continuación, se presenta el
análisis de varianza de las ventas mensuales (en miles de soles) de las cuatro
promociones registradas en 16 días diferentes:

Análisis de Varianza
Fuente GL SC CM Valor F Valor p

Tratamiento 3 96.50 32.167 8.67 0.002

Error 12 44.50 3.708

Total 15 141.00

a) ¿Se puede afirmar que todas las promociones tienen el mismo efecto
sobre las ventas? Use un nivel de significación del 5%.
b) Analice e interprete las comparaciones múltiples de Tukey mediante la
siguiente salida del Minitab:

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una confianza
de 95%

Promoción N Media Agrupación

P1 4 13.00 A

P3 4 11.75 A

P2 4 9.75 AB

P4 4 6.50 B

¿Qué promoción obtuvo las ventas más altas?

ESTADÍSTICA GENERAL 467


3. Un psicólogo social afirma que el comportamiento del receptor de la
comunicación publicitaria se fundamenta del conocimiento de las aportaciones
teóricas y modelizaciones que describen y explican este comportamiento,
considerándose el aprendizaje como un enfoque elaborado de las principales
teorías. Para esto, en una empresa publicitaria, una muestra aleatoria de
12 individuos, agrupados de forma independiente, fueron sometidos a tres
diferentes tipos de aprendizaje (Condicionamiento, Operante y Perceptivo)
y al finalizar la intervención se registraron los puntajes obtenidos (entre 0 y
100 puntos). Los resultados obtenidos son los siguientes:

Análisis de Varianza
Fuente GL SC. CM. Valor F Valor p

Tratamiento 2 834.5 417.25 26.87 0.000

Error 9 139.8 15.53

Total 11 974.2

Gráfica de probabilidad de ERRORES


Normal
99
N 12
AD 0.233
95
Valor p 0.739
90

80
70
Porcentaje

60
50
40
30
20
10
5

1
-10 -5 0 5 10

ERRORES

Prueba de varianzas iguales: Puntaje vs. Aprendizaje

Prueba de Barlett
Valor p 0.758
Condicionamiento
Aprendizaje

Operante

Perceptivo

0 5 10 15 20 25 30 35
Intervalos de confianza de Bonferroni de 97.5% para Desv. Est.

468 ESTADÍSTICA GENERAL


a) Verifique la normalidad de los errores y la homogeneidad de las varianzas.
Use un nivel de significancia de 0.025.
b) Con un nivel de significancia del 2.5%, ¿el psicólogo social puede concluir
que los individuos sometidos a los diferentes tipos de aprendizaje tienen
el mismo comportamiento en la comunicación publicitaria?
c) Analice e interprete las comparaciones múltiples de Tukey, ¿qué tipos de
aprendizaje presentaron puntuaciones iguales?

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una confianza de
97.5%

Aprendizaje N Media Agrupación

Perceptivo 4 91.50 A

Operante 4 74.75 B

Condicionamiento 4 73.00 B

4. El gerente general de una cadena de restaurantes quiere comparar los


ingresos mensuales (en miles de soles) de los trabajadores de sus cuatro
sucursales más importantes que se encuentran distribuidos en diferentes
puntos de la ciudad, por tal motivo, se seleccionó al azar 5 trabajadores
por restaurante. A continuación, se presentan las sumatorias de los ingresos
mensuales y los respectivos tamaños de muestra por restaurante, además
del reporte de Minitab para la prueba Tukey:

Restaurante 1 Restaurante 2 Restaurante 3 Restaurante 4

T.1 = 7.3010 T.2 = 5.1885 T.3 = 6.5900 T.4 = 8.4085

n1 = 5 n2 = 5 n3 = 5 n4 = 5
Además:

ESTADÍSTICA GENERAL 469


Comparaciones en parejas de Tukey
Agrupar información utilizando el método de Tukey y una confianza de
95%

Restaurante N Media Agrupación

R4 5 1.6817 A

R1 5 1.4602 AB

R3 5 1.3180 AB

R2 5 1.0377 B

Utilice un nivel de significancia del 5% para responder las siguientes preguntas:

a) ¿El gerente general puede concluir que los trabajadores de los cuatro
restaurantes tienen el mismo ingreso promedio? Plantee las hipótesis de
prueba, calcule el estadístico de prueba, establezca la región de rechazo
y concluya de acuerdo al contexto.

b) Analice e interprete las comparaciones múltiples de Tukey ¿En qué


restaurante los trabajadores presentan mayores ingresos promedio
mensual?

5. El gerente comercial de la empresa All TV cree que el tiempo promedio que


sus clientes ven televisión por cable difieren según el plan contratado por el
cliente. Para verificar la afirmación, el gerente comercial seleccionó un grupo
de clientes de cada plan contratado y registró el tiempo (en horas) que un
cliente ve televisión por cable. Los tiempos registrados en una muestra de 16
clientes se analizaron en el paquete estadístico Minitab, cuyos resultados se
muestran a continuación:

Análisis de Varianza
Fuente GL SC CM Valor F Valor p

Tratamiento 3 2.280 0.76000 13.57 0.000

Error 20 1.120 0.05600

Total 23 3.400

470 ESTADÍSTICA GENERAL


Prueba de varianzas iguales

Estadística
Método de prueba Valor p

Bartlett 1.95 0.584

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una confianza de
97%

Plan contratado N Media Agrupación

Plan HD 6 6.8000 A

Plan Estelar 6 6.600 A

Plan DVR 6 6.100 B

Plan Básico 6 6.1000 B

a) Verifique la homogeneidad de las varianzas. Use α = 0.03.


b) Al 3% de significancia, ¿se puede afirmar lo que dice el gerente comercial?
c) ¿Qué planes de cable presentan los tiempos promedio más altos?

24.4 Trabajo autónomo


1. El ingeniero encargado del área de transporte en una empresa realizó un
estudio para determinar si la distancia promedio recorrida por tres marcas
de camionetas (M1, M2 y M3) difieren. Luego de aplicar la técnica del análisis
de varianza, se concluyó que la distancia promedio recorrida es diferente
en al menos una marca de camioneta. El ingeniero desea conocer, mediante
los resultados de las comparaciones múltiples de Tukey obtenidos con el
programa Minitab, qué marca de camioneta presenta una distancia recorrida
más larga.

ESTADÍSTICA GENERAL 471


Comparaciones en parejas de Tukey
Agrupar información utilizando el método de Tukey y una confianza de
97.5%

Marca_camioneta N Media Agrupación

M2 4 322.25 A

M3 4 305.00 AB

M1 4 285.00 B

2. Para estudiar el efecto de la temperatura en el rendimiento de un atleta en


una carrera de 10 km, se registró el tiempo empleado por el atleta en dicho
tramo (en minutos) para tres medidas de las temperaturas más frecuentes
(en grados centígrados). Los resultados obtenidos a partir de esos tiempos
se presentan a continuación:

Análisis de Varianza
Fuente GL SC CM Valor F Valor p

Temperatura 2 16.93 8.467 6.35 0.013

Error 12 16.00 1.333

Total 14 32.93

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una confianza de
95%

Temperatura N Media Agrupación

35°C 5 32.40 A

30°C 5 31.00 AB

25°C 5 29.80 B

472 ESTADÍSTICA GENERAL


Asuma que los supuestos de normalidad de los errores y varianzas iguales se
cumplen. Utilice un nivel de significancia del 5% para dar sus conclusiones.

3. Un auditor del MINSA ha recibido el encargo de evaluar los tiempos de demora


(en horas) en atender a los pacientes de cuatro hospitales de la capital. Para
tal fin, el auditor seleccionó una muestra aleatoria de 20 pacientes y registró
los tiempos de atención para cada uno. Los resultados obtenidos a partir de
esos tiempos se presentan a continuación:

Análisis de Varianza
Fuente GL SC CM Valor F Valor p

Tratamiento 3 10.266 3.4220 13.65 0.000

Error 16 4.012 0.2507

Total 19 14.278

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una confianza de
97.5%

Hospital N Media Agrupación

H2 5 4.80 A

H1 5 3.54 B

H4 5 3.10 B

H3 5 3.00 B

Asuma que los supuestos de normalidad de los errores y varianzas iguales se


cumplen. Utilice un nivel de significancia del 2.5% para dar sus conclusiones.

a) ¿Existen diferencias significativas entre los tiempos promedios de demora


en atender a los pacientes en los cuatro hospitales?
b) Analice e interprete las comparaciones múltiples de Tukey.

4. Con la finalidad de analizar el efecto de cuatro diferentes tipos de alimentos


en la crianza de cerdos, se han considerado cerdos de la misma raza y con la
misma edad. Para esto, se seleccionaron las unidades experimentales como
grupos de ocho cerdos para cada tipo de alimentación en 20 granjas y se

ESTADÍSTICA GENERAL 473


registró el peso total ganado (en kilos) después de 2 semanas. Los análisis
de los datos muestran los siguientes resultados:

Análisis de Varianza
Fuente GL SC. CM. Valor F Valor p

Tratamiento 3 491.5 163.834 24.03 0.000

Error 16 109.1 6.817

Total 19 600.6

Prueba de varianzas iguales


Estadística

Método de prueba Valor p

Bartlett 5.32 0.150

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una confianza de
99%

Alimento N Media Agrupación

4 5 30.70 A

2 5 21.420 B

3 5 19.700 B

1 5 17.80 B

474 ESTADÍSTICA GENERAL


Gráfica de probabilidad de RESID1
Normal
99
N 20
AD 0.268
95 Valor p 0.645
90

80
70
Porcentaje

60
50
40
30
20
10
5

1
-5.0 -2.5 0.0 2.5 5.0
RESID1

a) Realice la prueba de homogeneidad de varianza y normalidad de los


residuales. Use α = 0.01.

b) Presente y concluya las pruebas de hipótesis correspondientes al problema


a un nivel de significación de 1%.

c) Realice las comparaciones múltiples de Tukey si fuera necesario. Interprete


los resultados.

5. Para evaluar tres métodos de lectura veloz se seleccionaron a 15 personas,


cada una de ellas con la misma capacidad de lectura. Luego, se asignaron
cinco personas a cada método de estudio de manera aleatoria y una vez
finalizados los programas correspondientes a cada uno de los métodos de
estudio, se les asignó a las 15 personas la misma lectura y se contó el número
de palabras leídas en un minuto. A continuación, se muestran los resultados
obtenidos:

Método 1 Método 2 Método 3


y1 = 605 y2 = 602.5 y3 = 596

n1 = 5 n2 = 5 n3 = 5

s12 = 12.5316 s22 = 17.4724 s32 = 25.8064

ESTADÍSTICA GENERAL 475


Comparaciones en parejas de Tukey
Agrupar información utilizando el método de Tukey y una confianza de
95%

Método_lectura N Media Agrupación

Método 1 5 605.00 A

Método 3 5 602.60 AB

Método 2 5 596.00 B

a) Indique el factor, niveles del factor, variable respuesta y unidad


experimental.
b) Realice la prueba correspondiente. Utilice un nivel de significancia del 5%.
c) Analice e interprete las comparaciones múltiples de Tukey en caso sea
necesario. Utilice un nivel de significancia del 5%.

24.5 Problemas de reforzamiento del capítulo


1. Se analizaron los tiempos (en minutos) que tardan en procesar una pieza
cada una de las cuatro máquinas que posee una empresa productora de
lácteos. Para determinar si hay diferencia en el tiempo de procesamiento, el
gerente de producción seleccionó muestras diferentes para cada máquina.

a) Con un nivel de significación del 1%, ¿Son iguales las varianzas de los
tiempos de procesamiento en cada una de las máquinas? Utilice los
siguientes resultados obtenidos con el Minitab:V

Prueba de varianzas iguales


Estadística

Método de prueba Valor p

Bartlett 0.07 0.963

476 ESTADÍSTICA GENERAL


b) Con un nivel de significación del 1%, ¿puede considerar que los tiempos
promedio de procesamiento que utiliza cada máquina son iguales? Utilice
los siguientes resultados obtenidos con el Minitab:

Análisis de Varianza
Fuente GL SC CM Fcal

Máquina 3 12.107 4.0357 10.59

Error 24 9.143 0.3810

Total 27 21.250

2. Una psicóloga social evaluó el desempeño de los trabajadores de una


empresa en sus puestos de trabajo con el fin de mejorar el ambiente laboral.
Para esto, la psicóloga seleccionó una muestra aleatoria e independiente
de seis colaboradores de cuatro áreas diferentes de la empresa (comercial,
marketing, atención al cliente y logística). A los trabajadores, se les aplicó
un test de intereses profesionales, se registraron las puntuaciones obtenidas
(entre 0 y 45 puntos) y se analizaron con el programa Minitab. Por problemas
técnicos, algunos resultados obtenidos con el software se perdieron, pero se
pudo recuperar lo siguiente:

Análisis de Varianza
Fuente GL SC CM Fcal

Área __ _____ 232.15 _____

Error __ 333.5 ______

Total __ ______

a) Indique el factor, niveles del factor, variable respuesta y unidad


experimental.
b) Complete la tabla de análisis de varianza. Justifique los valores calculados.
c) Con un nivel de significación del 2.5%, ¿la psicóloga puede concluir que
existe diferencia en el desempeño de los trabajadores en las diferentes
áreas de la empresa?
d) Si la prueba de hipótesis es significativa, ¿qué área o áreas presentan
trabajadores con mejor desempeño en sus puestos de trabajo? Utilice los
siguientes resultados obtenidos con el Minitab:

ESTADÍSTICA GENERAL 477


Comparaciones en parejas de Tukey
Agrupar información utilizando el método de Tukey y una confianza de
97.5%

Área N Media Agrupación

Logística 6 37.00 A

Comercial 6 32.17 AB

Atención al cliente 6 25.67 BC

Marketing 6 23.33 C

3. Un funcionario del Ministerio de Transporte y Comunicaciones afirma que el


costo mensual en publicidad de los medios de comunicación es el mismo. El
funcionario seleccionó aleatoriamente a 20 empresas que realizan publicidad
en prensa, radio, internet y televisión (cinco empresas de cada tipo de medio
de comunicación).

a) Con un nivel de significación del 1%, ¿se puede pensar que el funcionario
tiene razón?

Análisis de Varianza
Fuente GL SC CM Fcal

Tratamiento 3 7185.6 2395.20 65.04

Error 16 589.2 36.82

Total 19 7774.8

b) ¿En qué medio de comunicación se puede considerar que los costos son
iguales?

478 ESTADÍSTICA GENERAL


Comparaciones en parejas de Tukey
Agrupar información utilizando el método de Tukey y una confianza de
99%

Medio_comunicación N Media Agrupación

Televisión 5 155.40 A

Radio 5 139.00 B

Prensa 5 133.00 B

Internet 5 103.00 C

c) Verifique el supuesto de normalidad y varianzas iguales. Utilice α = 0.01.


Utilice los siguientes resultados obtenidos con el Minitab:

Gráfica de probabilidad de RESIDUO


Normal
99
AD 0.515
95
Valor p 0.168
90

80
70
Porcentaje

60
50
40
30
20
10
5

1
-15 -10 -5 0 5 10
RESIDUO

Prueba de varianzas iguales: Costo vs. Medio de comunicación

Prueba de Barlett
Valor p 0.9757
Cómico
Programa

Deportivo

Musical

0 1 2 3 4 5 6 7 8
Intervalos de confianza de Bonferroni de 99% para Desv. Est.

ESTADÍSTICA GENERAL 479


4. Un estudiante de gastronomía está interesado en conocer si existe alguna
diferencia entre los precios de un plato de comida en cuatro distritos de
Lima. Para esto, se tomaron muestras de tamaño igual en cinco restaurantes
de cada distrito y obtuvieron los siguientes resultados:

Distrito Precio promedio Suma de los cuadrados de los precios


D1 20.4 2122
D2 23.0 2655
D3 23.0 2659
D4 23.6 2794

Con un nivel de significancia del 2.5%, ¿cuál será la conclusión del estudiante?

24.6 Portafolio (para subir al campus virtual)


Un especialista en comida nacional desea saber si la cantidad de platos
típicos vendidos de las tres regiones del Perú (Costa, Sierra y Selva) durante
un día en una feria gastronómica fueron diferentes. Para ello, seleccionó
una muestra aleatoria de seis restaurantes que ofrecen platos regionales de
la Costa, seis restaurantes que ofrecen platos regionales de la Sierra y seis
restaurantes que ofrecen de la región Selva. La cantidad de platos vendidos se
muestra a continuación:

Región del Perú


Costa Sierra Selva
162 142 126
142 156 122
165 124 138
145 142 140
148 136 150
174 152 128

Utilice el programa Minitab para responder los siguientes problemas:

1. Verifique el supuesto de normalidad de los errores y homogeneidad de


varianzas. Utilice un nivel de significancia del 5%.

2. Con un nivel de significancia del 2.5%, ¿se puede afirmar que la cantidad
promedio de platos típicos vendidos en las tres regiones fueron diferentes?

3. Con un nivel de significancia del 2.5%, ¿en qué región se vendió una mayor
cantidad de platos típicos? Use las comparaciones múltiples de Tukey.

480 ESTADÍSTICA GENERAL


Capítulo 10
PRUEBAS CHI-CUADRADO

1-α

α/2 α/2 X2
0 X2α/2; n-1 X21-α/2; n-1

Capacidades para desarrollar


Al finalizar el capítulo, el estudiante estará en capacidad de:

• Probar si existe relación entre dos variables cualitativas en problemas


contextualizados.
• Probar si dos variables cualitativas son homogéneas en problemas
contextualizados.

Motivación
Un grupo de psicólogos de una correccional juvenil entrevistaron a 200 jóvenes
seleccionados de manera aleatoria con la finalidad de estudiar si existe relación
entre la clasificación de la reinserción a la sociedad de un adolescente y el lugar
de residencia que optaría una vez que se encuentre en libertad. La información
obtenida se muestra a continuación:

ESTADÍSTICA GENERAL 481


Clasificación de la reinserción a la sociedad
Residencia al salir
en libertad No
Sobresaliente Bueno Regular
satisfactorio
Retorna a su hogar 29 34 31 28
No retorna a su 10 16 25 27
hogar

¿Existe relación entre la clasificación de la reinserción a la sociedad de un


adolescente y el lugar de residencia que optaría una vez que se encuentre en
libertad?

Al finalizar el capítulo, el estudiante estará en capacidad de responder esta


pregunta y otras más, utilizando los conceptos básicos y la organización de
datos.

Saberes previos
• Pruebas de hipótesis.

482 ESTADÍSTICA GENERAL


Lección 25

25.1 Prueba de independencia


En esta lección se estudia la relación y el grado de dependencia que existe entre
dos variables categóricas medidas en una población.

Suponga que el interés se centra en probar si dos variables cualitativas (variable


categórica 1 y variable categórica 2) están o no relacionadas a partir de la
información mostrada en la siguiente tabla de contingencia:

Variable Variable categórica 2


Total
categórica 1 B1 B2
A1 O11 O12 n1•
A2 O21 O22 n2•
A3 O31 O32 n3•
Total n•1 n•2 n

Como el interés del estudio está dirigido a probar si las variables están o no
relacionadas (son dependientes o son independientes); por fines prácticos, se
plantea la siguiente hipótesis:

H0: Las variables son independientes (las variables no están relacionadas)

Si la hipótesis planteada es verdadera, se debería de cumplir la siguiente igualdad:

( )
P Ai ∩ B j = P ( Ai ) P B j ( )
y, a partir del resultado anterior, el valor esperado para cada par de valores,
Ai y B j , se calcula de la siguiente manera:

( ) ( )
eij = E Ai ∩ B j = nP Ai ∩ B j = nP ( Ai ) P B j = n ( )
ni. n. j ni. n. j
n n
=
n

En conclusión:

ni. n. j
eij =
n

ESTADÍSTICA GENERAL 483


Si no existe mucha diferencia entre los valores observados y esperados se acepta
la hipótesis nula; es decir, se acepta la hipótesis de independencia entre las
variables, o lo que es lo mismo, se acepta que las variables no están relacionadas.

Finalmente, se utiliza el estadístico chi-cuadrado para medir las diferencias entre


las frecuencias observadas y esperadas.

Observación
De manera general, el valor esperado para cada par de valores, Ai y B j , se
calcula de la siguiente manera:

eij =
(Total de la fila i )(Total de la columna j )
Tamaño de la muestra ( n )

25.1.1 Disposición de los datos


La información obtenida para las variables de estudio se dispone en una tabla
de contingencia; tal como, se muestra a continuación:

Característica o Variable Y
Total
Columna 1 Columna 2 ... Columna c
Fila 1 o11 o12 ... o1c n1•

Fila 2 o21 o22 ... o2c n2•


Característica . . . . .
o Variable X . . . . .
. . . . .

Fila r or2 or2 ... orc nr•

Total n•1 n•2 ... n•c n••

Donde:

oij: Frecuencias observadas

n•j: Total de la columna j (marginal columna)

ni•: Total de la fila i (marginal fila)

n••: Total

484 ESTADÍSTICA GENERAL


25.1.2 Pasos para realizar una prueba de Independencia
La prueba de independencia se resume en los siguientes pasos:

1. Plantear las hipótesis:

H0: πij = πi• π•j para todo i = 1, ... r, j = 1, ... c

H1: πij ≠ πi• π•j para todo i = 1, ... r, j = 1, ... c

Otra forma:

H0: Las variables X e Y son independientes

H1: Las variables X e Y no son independientes

2. Establecer el nivel de significancia: α

3. Calcular el valor del estadístico de prueba

Donde, los valores esperados se calculan de la siguiente manera:

ni nj
eij =
n

4. Establecer la región de rechazo

La región de rechazo, también conocida como región crítica, se establece a


partir del nivel de significancia α.

5. Concluir de acuerdo al enunciado del problema

Si el valor del estadístico de prueba cae en la región de rechazo, se rechaza


la hipótesis nula (H0), caso contrario no se rechaza.

ESTADÍSTICA GENERAL 485


25.2 Coeficiente de contingencia
Si en la prueba de independencia se rechaza H0 entonces, el siguiente paso es
cuantificar la fuerza de la asociación entre las dos variables
2
χ cal
C= 2
χ cal +n

Si C ≥ 0.30, entonces hay una buena asociación entre las variables consideradas.

25.3 Ejercicios resueltos


1. En el Departamento de Psicología de una prestigiosa universidad se ha
llevado a cabo un estudio para investigar si existe relación entre el nivel de
autoestima de los estudiantes y su especialidad. Por tal motivo, el encargado
del estudio seleccionó una muestra aleatoria de 220 alumnos y les aplicó
el test estandarizado de Rosenberg que está constituido por 20 ítems. La
información obtenida se muestra en la siguiente tabla:

Nivel de Especialidad
Total
autoestima Letras Ciencias Ingeniería
Media 16 30 30 76
Alta 58 36 50 144
Total 74 66 80 220

a) ¿Existe alguna relación entre el nivel de autoestima del estudiante y su


especialidad? Utilice un nivel de significación del 5%.

Paso 1 (Plantee las hipótesis de prueba)

H0: El nivel de autoestima de los estudiantes y su especialidad son


independientes (el nivel de autoestima de los estudiantes no tiene relación
con su especialidad)

H1: El nivel de autoestima de los estudiantes y su especialidad no son


independientes (el nivel de autoestima de los estudiantes tiene relación
con su especialidad)

Paso 2 (Establezca el nivel de significancia)


α = 0.05

486 ESTADÍSTICA GENERAL


Paso 3 (Calcule el valor del estadístico de prueba)

Nivel de Especialidad
Total
autoestima Letras Ciencias Ingeniería
o11=16 o12=30 o13=30
Media 76
e11=25.56 e12=22.80 e12=27.64
o21=58 o22=36 o23=50
Alta 144
e21=48.44 e22=43.20 e23=52.36
Total 74 66 80 220

Las frecuencias esperadas se obtienen de la siguiente manera:

e11 =
76×74
= 25.56 e12 =
76×66
= 22.80
76×80
e11 = = 27.64
220 220 220

144×74 144×66 144×80


e21 = = 48.44 e22 = = 43.20 e23 = = 52.36
220 220 220

El estadístico de prueba se calcula así:

2
χ cal = 9.25

Paso 4 (Establezca la región de rechazo)

X20.95; 2 = 5.991 9.25

ESTADÍSTICA GENERAL 487


Paso 5 (Concluya de acuerdo al enunciado del problema)
2
Como χ cal = 9.25 se encuentra en la región de rechazo, se rechaza la
hipótesis nula (Ho). Con un nivel de significancia del 5%, existe evidencia
estadística para pensar que el nivel de autoestima de los estudiantes y su
especialidad no son independientes; es decir, el nivel de autoestima de los
estudiantes tiene relación con su especialidad.

b) Antes de realizar la prueba se creía que si existía alguna relación esta no


era buena, ¿cuál es su opinión?

Para medir esta relación se calcula el coeficiente de contingencia de la


siguiente manera:

9.25
C= = 0.20
9.25 + 220

Como C = 0.20 < 0.30, se concluye que, efectivamente, la relación entre


las dos variables no es buena.

EJERCICIOS RESUELTO CON EL PROGRAMA MINITAB


Para calcular el estadístico de prueba en una prueba de independencia se sigue
la ruta: Estadísticas → Tablas → Tabulación cruzada y Chi-cuadrada…

488 ESTADÍSTICA GENERAL


En Datos resumidos en una tabla de dos factores se ingresa lo siguiente:

• En Columnas que contienen la tabla: Letras, Ciencias e Ingeniería.


• En Filas: Nivel de autoestima.
• En Mostrar: Se mantiene el clic en Conteos.

En la opción Chi-cuadrada, se hace clic en Prueba Chi-cuadrada.

En Estadísticas que se mostrarán en cada celda, haga clic en: Conteos de celdas
esperadas y Contribución de cada celda a chi-cuadrada.

ESTADÍSTICA GENERAL 489


Haga clic en Aceptar dos veces y se obtiene:

2. La siguiente tabla muestra la cantidad de calzados que fueron hechos en dos


plantas de producción (P1 y P2) con tres tipos de materiales (A, B y C). Los
calzados están dirigidos a tres tipos de clientes: damas (D), caballeros (H) y
niños (N).

Los resultados obtenidos se muestran a continuación:

Tipo de material

Tipo de cliente A B C
Tipo de producto
P1 P2 P1 P2 P1 P2
Damas (D) 46 41 42 35 27 24
Caballeros (H) 43 38 34 36 32 26
Niños (N) 33 47 38 38 25 30

Si los operadores tienen la misma capacitación en las dos plantas de


producción, ¿existe alguna relación entre el tipo de material y el tipo de
cliente? Utilice un nivel de significancia del 5%.

490 ESTADÍSTICA GENERAL


Paso 1 (Plantee las hipótesis de prueba)
H0: El tipo de material y el tipo de cliente son independientes

H1: El tipo de material y el tipo de cliente no son independientes

Paso 2 (Establezca el nivel de significancia)


α = 0.05

Paso 3 (Calcule el valor del estadístico de prueba)

Tipo de material
Tipo de cliente Total
A B C
o11= 87 o12=77 o13=51
Damas (D) 215
e11= 83.97 e12=75.50 e13=55.53
o21=81 o22=70 o23=58
Caballeros (C) 209
e21=81.63 e22=73.40 e23=53.98
o31=80 o32=76 o33=55
Niños (N) 211
e31=82.41 e32=74.10 e33=54.49
Total 248 223 164 635

Las frecuencias esperadas se obtienen de la siguiente manera:


215×248 211×164
e11 = = 83.97 , …, e33 = = 54.49
635 635

El estadístico de prueba se calcula así:

2
χ cal = 1.09

ESTADÍSTICA GENERAL 491


Paso 4 (Establezca la región de rechazo)

1.09 X20.95; 4 = 9.488

Paso 5 (Concluya de acuerdo al enunciado del problema)


2
Como χ cal = 1.09 se encuentra en la región de no rechazo, no se rechaza la
hipótesis nula (Ho). Por tanto, existe evidencia estadística para pensar que el
tipo de material y el método aplicado son independientes.

25.4 Trabajo colaborativo (para trabajar en clase)


1. El gerente de una agencia de turismo presentó los siguientes resultados, que
fueron obtenidos, en un estudio sobre el tipo de turismo que prefieren sus
clientes según su edad:

Edad
Tipo de turismo Hasta 25 Más de 25
años años
Científico 30 70
Ecoturismo 80 20
Cultural 30 20

¿Existe alguna relación entre el tipo de turismo preferido por el cliente y su


edad? Utilice un nivel de significancia del 5%.

a) Plantee las hipótesis correspondientes.


b) Calcule el estadístico de prueba, establezca la región de rechazo y
concluya de acuerdo al contexto.
c) Interprete el coeficiente de contingencia.

2. Un grupo de psicólogos de una correccional juvenil entrevistaron a 200


jóvenes seleccionados de manera aleatoria con la finalidad de estudiar si
existe relación entre la clasificación de la reinserción a la sociedad de un

492 ESTADÍSTICA GENERAL


adolescente y el lugar de residencia que optarían una vez que se encuentren
en libertad. La información obtenida se muestra a continuación:

Residencia al salir Reinserción a la sociedad


en libertad Sobresaliente Bueno Regular No satisfactorio
Retorna a su hogar 29 34 31 28
A otro lugar 10 16 25 27

¿Existe relación entre la clasificación de la reinserción a la sociedad de un


adolescente y el lugar de residencia que optarían una vez que se encuentren
en libertad? Utilice un nivel de significancia del 2.5%.

3. Un editor de periódicos quiere determinar si existe alguna relación entre la


frecuencia con la que las personas de su comunidad leen los diarios y su nivel
educativo. Los resultados que se obtuvieron al aplicar una encuesta a los
lectores de la comunidad se muestran a continuación:

Nivel educativo
Frecuencia con que
lee un periódico Superior Superior no Terminó la No terminó la
universitaria universitaria Secundaria secundaria
Pocas veces 22 40 19 26
Todos los días 63 57 22 20

a) ¿Cuál es la conclusión? Utilice un nivel de significancia del 5%.

b) Interprete el coeficiente de contingencia.

4. En una entidad educativa se ha realizado un estudio para averiguar si el nivel


de aprendizaje alcanzado por un grupo de estudiantes está relacionado con
el método de estudio que eligieron (Estaton o Ipler). Para tal objetivo, los
resultados obtenidos se presentan en la siguiente tabla de contingencia:

Método de estudio
Nivel de aprendizaje
Estaton Ipler
Bajo 100 60
Medio 80 50
Alto 70 40

ESTADÍSTICA GENERAL 493


¿Existe alguna relación entre el nivel de aprendizaje y el método de estudio
elegido? Utilice un nivel de significancia del 5%. De ser así, ¿es buena la
relación?

5. En una cadena de pizzerías se han detectado algunas deficiencias en cuanto


al servicio que ofrecen; por tal motivo, el administrador recolectó información
sobre algunas características importantes de sus empleados.

La siguiente tabla muestra los resultados obtenidos para las variables turno
de trabajo y lugar de residencia:

Lugar de Residencia
Lima Cercado Callao
Turno de trabajo
Sexo
Masculino Femenino Masculino Femenino
Mañana 45 55 40 25
Tarde 30 40 50 30
Noche 25 15 20 25

¿Existe alguna relación entre el turno de trabajo y el género de los empleados?


Utilice un nivel de significancia del 5%.

25.5 Trabajo autónomo


1. El Organismo Supervisor de la Inversión en Energía y Minería (OSINERGMIN),
es la entidad pública que se encarga de regular y supervisar que las empresas
del sector eléctrico, hidrocarburos y minero cumplan con las disposiciones
legales de las actividades que desarrollan. En lo que va del año, se ha
observado un incremento considerable en los reclamos presentados a esta
entidad; razón por la cual, un funcionario de OSINERGMIN seleccionó una
muestra aleatoria de los reclamos y los clasificó de acuerdo al sector de la
empresa y al número de reclamos recibidos. Los resultados se presentan en
la siguiente tabla de contingencia:

Tipo de empresa
Número de reclamos recibidos
Eléctrica Hidrocarburos Minero
Menos de cinco 31 19 12
Entre cinco y menos de 10 3 11 3
De diez a más 49 40 12

494 ESTADÍSTICA GENERAL


De encontrarse argumentos para sostener que existe relación entre el
tipo de empresa y el número de reclamos recibidos, el funcionario enviará
supervisores al sector. ¿Cuál es su conclusión? Use α=0.05.

2. Un funcionario de la empresa de investigación de mercado DATA CONSULTOR


realizó un estudio en la ciudad del Cuzco con la finalidad de obtener
información sobre la calidad del servicio que reciben los turistas nacionales
y extranjeros que se hospedan en uno de los hoteles más prestigiosos de la
ciudad. Parte de los resultados obtenidos se presentan en la siguiente tabla
de contingencia:

Opinión sobre el servicio


Tipo de turista
Muy buena Buena Regular Mala
Nacional 12 50 44 10
Extranjero 20 62 47 9

De comprobarse que los datos presentan suficiente evidencia que indique


que existe relación entre el tipo de turista y la opinión sobre el servicio,
el gerente del hotel tomará medidas correctivas al respecto. ¿Cuál es su
conclusión? Use α=0.05.

3. Con la finalidad de conocer el nivel de aceptación de una cerveza light y


una cerveza tradicional en dos diferentes niveles socioeconómicos de la
ciudad (A y B), el encargado del estudio seleccionó una muestra aleatoria
de personas mayores de 18 años y les consultó acerca de su preferencia por
alguno de los tipos de cerveza mencionadas. Los resultados obtenidos se
muestran en la siguiente tabla:

Tipo de cerveza
Nivel
socioeconómico Cerveza
Cerveza light
tradicional
A 430 436
B 391 308

¿Existe alguna relación entre el nivel socioeconómico de una persona y el


tipo de cerveza que prefiere? Utilice un nivel de significancia del 5%.

4. Un grupo de alumnos de la Universidad San Ignacio de Loyola fueron


consultados; entre otras cosas, sobre el número de horas semanales que se
dedican a estudiar fuera de sus horas de clase y las calificaciones obtenidas.
La información obtenida fue clasificada en categorías por un grupo de
especialistas; tal como, se muestran a continuación:

ESTADÍSTICA GENERAL 495


Número de horas Calificación obtenida
semanales de Por debajo del Por encima del
estudio Promedio
promedio promedio
Inferior al promedio 30 20 5
Promedio 20 25 8
Superior al promedio 2 35 55

¿Puede concluir que existe alguna relación entre el número de horas semanales
que se dedican a estudiar fuera de sus horas de clase y las calificaciones
obtenidas? Utilice un nivel de significación del 10%.

5. Un psicólogo cree que existe relación entre la especialidad de un estudiante


y su rendimiento académico en los últimos ciclos. Con la finalidad de
verificar sus creencias, el psicólogo seleccionó una muestra aleatoria de 1350
estudiantes que cursan los últimos ciclos (del séptimo ciclo a más); y a partir
de la información obtenida, obtuvo la siguiente tabla de contingencia:

Rendimiento académico
Especialidad
Optimo Regular Pésimo
Ciencias básicas 125 95 100
Ingeniería 220 100 310
Letras 150 50 200

Al nivel de significancia del 2.5%, ¿puede inferir que existe relación entre la
especialidad de un estudiante y su rendimiento académico en los últimos
ciclos?

496 ESTADÍSTICA GENERAL


Lección 26

26.1 Prueba de homogeneidad


En esta lección se estudia el comportamiento de una variable aleatoria cualitativa
en k poblaciones.

Suponga que el interés se centra en probar si cada categoría Ai es igualmente


probable en k poblaciones, con tamaños de muestra definidos n1, n2, …, nk
respectivamente, a partir de la información mostrada a continuación:

Población
Categoría Total
P1 P2 … Pk
A1 O11 O12 … O1k a1•
A2 O21 O22 … O2k a2•
Total n1 n2 … nk n

¿Será posible concluir que cada categoría Ai es igualmente probable


(homogénea) en las k poblaciones?

Para cada categoría, los valores marginales a1• y a2• se han obtenido de manera
aleatoria; es decir, no han sido definidos previamente. En cambio, los tamaños de
muestra n1, n2, …, nK para las k poblaciones han sido definidos por el investigador
en el proceso del muestreo.

Como el interés del estudio está dirigido a investigar si cada categoría Ai es


igualmente probable (homogénea) en las k poblaciones, se plantea la siguiente
hipótesis:

H0: Cada categoría Ai es igualmente probable en todas las poblaciones

La hipótesis anterior implica que la probabilidad condicional de Ai dado j sea la


misma en todas las poblaciones; es decir:

ai
P ( Ai / P1 ) = P ( Ai / P2 ) = …= P ( Ai / Pk ) = P ( Ai ) = ; ∀i
n

y, a partir del resultado anterior, el valor esperado para cada par de valores,
Ai y B j , se calcula de la siguiente manera:

ai njai
( ) ( )
eij = E Ai / Pj = nj P Ai / Pj = nj P ( Ai ) = nj
n
=
n

ESTADÍSTICA GENERAL 497


En conclusión:

njai
eij =
n

Si no existe mucha diferencia entre los valores observados y esperados se acepta


la hipótesis nula; es decir, se acepta la hipótesis de homogeneidad.

Como en la prueba de independencia, se utiliza el estadístico chi-cuadrado para


medir las diferencias entre las frecuencias observadas y esperadas.

Observación
De manera general, los valores esperados bajo la hipótesis de homogeneidad
se calculan de la siguiente manera:

eij =
(Tamaño de muestra de la población j )(Total de la fila i )
Tamaño de la muestra

Por lo tanto, el procedimiento que se utiliza para el cálculo de las frecuencias


esperadas es el mismo que se utiliza en la prueba de independencia.

26.1.1 Disposición de los datos


La información obtenida para las variables de estudio se dispone en una tabla
de contingencia; tal como, se muestra a continuación:

Población
P1 P2 ... Pk Total
A1 o11 o12 ... o1k n1•
A2 o21 o22 ... o2k n2•
Característica . . . . .
o Variable X . . . . .
. . . . .
Ar or2 or2 ... ork nr•
Total n1 n2 ... nk n

Dónde:

498 ESTADÍSTICA GENERAL


oij: Frecuencias observadas

nj: Tamaño de muestra de la población j (marginal columna)

ni•: Total de la fila i (marginal fila)

n: Total

26.1.2 Pasos para realizar una prueba de homogeneidad


La prueba de homogeneidad se resume en los siguientes pasos:

1. Plantear las hipótesis:

H0: Cada categoría Ai es igualmente probable en todas las poblaciones

H1: Al menos una de las probabilidades es diferente

Otra forma:

H0: Cada categoría Ai es homogénea en todas las poblaciones

H1: Al menos una de las categorías no es homogénea en todas las


poblaciones

2. Establecer el nivel de significancia: α

3. Calcular el valor del estadístico de prueba

donde, las eij son las frecuencias esperadas y se calculan de la siguiente


manera:

njai
eij =
n

4. Establecer la región de rechazo

La región de rechazo, también conocida como región crítica, se establece a


partir del nivel de significancia α.

5. Concluir de acuerdo al enunciado del problema

ESTADÍSTICA GENERAL 499


Si el valor del estadístico de prueba cae en la región de rechazo, se rechaza
la hipótesis nula (H0), caso contrario no se rechaza.

26.2 Ejercicios resueltos


1. Se realizó un estudio sobre el horario preferido de las personas para ir al cine
según su edad. Para esto, se consideró una muestra aleatoria de 120 personas
en los dos grupos de edad que se formaron. Los resultados obtenidos se
muestran a continuación:

Edad
Horario preferido Hasta 25 Más de 25
años años
Antes de las seis de la tarde 60 30
De seis de la tarde a 9 de la noche 40 80
De 9 de la noche a más. 20 10
Total 120 120

¿Será posible concluir que los horarios para ir al cine son igualmente preferidos
en ambos grupos de edades? Utilice un 5% de significancia.

Solución
Paso 1 (Plantee las hipótesis de prueba)

H0: La preferencia por los horarios para ir al cine es homogénea en ambos


grupos de edad.

H1: La preferencia por los horarios para ir al cine difiere en al menos uno de
los grupos de edad.

Paso 2 (Establezca el nivel de significancia)


α = 0.05

500 ESTADÍSTICA GENERAL


Paso 3 (Calcule el valor del estadístico de prueba)

Edad
Horario preferido Hasta 25 Más de 25 Total
años años
o11=60 o12=30
Antes de las seis de la tarde 90
e11=45 e12=45
O21=40 O22=80
De seis de la tarde a 9 de la
120
noche
e21=60 e22=60
O31=20 O32=10
De 9 de la noche a más 30
e31=15 e32=15
Total 120 120 240

Las frecuencias esperadas se obtienen de la siguiente manera:


90×120 90×120 120×120
e11 = = 45 e12 = = 45 e21 = = 60
240 240 240
120×120 30×120 30×120
e22 = = 60 e21 = = 15 e22 = = 15
240 240 240

El estadístico de prueba se calcula así:

2
χ cal = 26.67

Paso 4 (Establezca la región de rechazo)

X20.95; 2 = 5.991 26.67

ESTADÍSTICA GENERAL 501


Paso 5 (Concluya de acuerdo al enunciado del problema)
2
Como χ cal = 26.67 se encuentra en la región de rechazo, se rechaza la hipótesis
nula (Ho). Con un nivel de significancia del 5%, existe evidencia estadística
para afirmar que la preferencia por los horarios para ir al cine difiere en al
menos uno de los grupos de edad.

26.3 Trabajo colaborativo (para trabajar en clase)


1. El gerente de la empresa transnacional INKASURSA desea conocer el turno
de trabajo que prefieren sus colaboradores según su lugar de residencia. La
información recolectada se muestra a continuación:

Lugar de Residencia
Turno de trabajo San Juan de
Lima Cercado Callao
Lurigancho
Mañana 40 45 50
Tarde 30 35 40
Noche 20 25 20

Si se tomó una muestra de 90 colaboradores de Lima Cercado, 105


colaboradores del Callao y 110 colaboradores de San Juan de Lurigancho,
¿existe evidencia estadística para pensar que la preferencia por el turno de
trabajo es homogénea en los tres lugares de residencia? Utilice un nivel de
significancia del 5%.

2. En la empresa de turismo TRAVEL FLYING se desea conocer el tipo de


servicio que prefieren sus clientes (Clásico, Platinum y Premium) según su
nivel socioeconómico. Para tal efecto, se tomó una muestra de 140 clientes
del nivel A, 167 clientes del nivel B y 163 clientes del nivel C. Los resultados
obtenidos son los siguientes:

Tipo de Servicio
Nivel Socioeconómico
Clásico Platinum Premium
A 30 55 55
B 50 65 52
C 25 50 88

Con un nivel de significancia del 2.5%, ¿se puede concluir que la preferencia
por el tipo de servicio es homogénea en los tres niveles socioeconómicos?

502 ESTADÍSTICA GENERAL


3. El ingeniero responsable de la administración del agua de un río de la costa
peruana ha preparado una tabla respecto a la cantidad de permisos y licencias
otorgadas a diferentes sectores económicos. Para esto, se ha considerado
una muestra de 79 entidades del sector agrario, 120 entidades del sector
industrial, 101 entidades del sector energético y 100 entidades del sector
minero; tal como se muestra a continuación:

Sector económico
Tipo de autorización
Agrario Industrial Energético Minero
Permiso 34 56 45 45
Licencia 45 64 56 55

¿Se puede asegurar que los permisos y licencias se han otorgado de forma
similar en los cuatro sectores económicos? Utilice un nivel de significancia
del 5%.

4. En la tabla mostrada se resume la información obtenida de la última


producción de zapatos en la empresa CALZADOSA. En esta se observa que
los tres métodos (1, 2 y 3) se utilizan con los tres tipos de material (A, B y C)
y en las dos plantas de producción (P1 y P2):

Tipo de material
A B C
Método
Planta
P1 P2 P1 P2 P1 P2
1 44 39 40 34 30 25
2 41 36 36 35 27 26
3 38 44 35 39 24 30

En la producción se han fabricado 315 pares en la planta 1 y 308 pares en la


planta 2. Si todos los operarios tienen la misma capacitación, ¿existe evidencia
de que el método aplicado es homogéneo en las dos plantas? Utilice un nivel
de significancia del 5%.

5. El administrador de una empresa comercializadora de conservas de


espárragos desea saber si la participación en el mercado es homogénea
en las cuatro regiones geográficas donde se comercializa. Para esto, el
administrador seleccionó una muestra de 100 consumidores de cada región
geográfica y obtuvo los siguientes resultados:

ESTADÍSTICA GENERAL 503


Región geográfica
Participación de mercado
Noreste Noroeste Sureste Suroeste
Compra la marca 40 55 45 50
No compra la marca 60 45 55 50

Con un 5% de significancia, ¿cuál será la conclusión del administrador?

26.4 Trabajo autónomo


1. En el área de post-grado de una universidad se realizó un estudio para
averiguar las preferencias de sus alumnos respecto a los cursos de post-
grado que ofrecen. Para tal propósito, se seleccionó una muestra de alumnos
de los últimos ciclos por cada especialidad. La información se presenta en la
siguiente tabla de contingencia:

Cursos de postgrado
Especialidad
Maestría Diplomado Ninguno
Administración 22 54 31
Contabilidad 31 36 53
Economía 48 35 14

¿Existe evidencia de que la preferencia por los cursos de postgrado es


homogénea en cada especialidad? Utilice un nivel de significancia del 10%.

2. En el área de recursos humanos de una empresa se desea realizar un estudio


respecto al rendimiento de sus trabajadores según el tipo de categoría
que tienen en la empresa. Los resultados de un muestreo estratificado por
categorías se muestran en la siguiente tabla de contingencia:

Categoría del trabajador


Rendimiento
Empleado Operario Mantenimiento
Excelente 26 45 29
Promedio 21 50 25
Bajo 11 9 15

504 ESTADÍSTICA GENERAL


¿Existe evidencia de que el rendimiento es homogéneo en cada categoría
del trabajador? Utilice un nivel de significancia del 2.5%.

3. Se ha desarrollado un estudio acerca de la efectividad de tres tratamientos


contra el tabaquismo. Para esto, se han considerado cuatro muestras de
pacientes adictos con un tratamiento distinto para cada una. Los resultados
obtenidos se muestran a continuación:

Tratamiento
Resultado Goma de Aerosoles de
Parches Medicamento
Mascar nicotina
Controlado 46 52 34 81
No controlado 29 45 25 20

¿Existe evidencia de que el resultado es homogéneo con cada tratamiento?


Utilice un nivel de significancia del 5%.

4. En una empresa de estudios de mercado se desea conocer las preferencias


del electorado, respecto a los tres candidatos favoritos en estas contiendas
presidenciales, según región geográfica en donde vive. Para tal efecto, se
tomó una muestra de 560 electores de la costa, 420 electores de la sierra y 350
electores de la selva. Los resultados obtenidos se presentan a continuación:

Región Geográfica
Candidato
Costa Sierra Selva
A 150 200 80
B 210 160 110
C 200 60 160

¿Existe evidencia de que la preferencia del electorado es homogénea en


cada región geográfica? Utilice un nivel de significancia del 5%.

5. Un estudio de marketing muestra los resultados respecto a la competencia


en el mercado de tres marcas de gaseosas. Para tal efecto se ha elegido una
muestra por cada nivel socioeconómico (93 en el estrato A, 112 en el estrato
B y 119 en el estrato C); y se les ha consultado, por el género y por el atributo
que más resalta del producto. Los resultados obtenidos se presentan a
continuación:

ESTADÍSTICA GENERAL 505


Marca de Atributo Nivel socioeconómico Género
Total
gaseosa
Color Sabor Precio A B C M F
Cola 1 43 36 26 40 42 23 40 65 105
Cola 2 34 53 15 41 46 15 39 63 102
Cola 3 23 31 63 12 24 81 72 45 117
Total 100 120 104 93 112 119 151 173 324

a) La prueba a realizar entre la marca de gaseosa y atributo es:

b) La prueba a realizar entre la marca de gaseosa y el nivel socioeconómico es:

c) La prueba a realizar entre la marca de gaseosa y género es:

Realice las pruebas definidas en a, b y c.

26.5 Problemas de reforzamiento del capítulo


1. Identifique la prueba de hipótesis que corresponde (homogeneidad o
independencia) en los siguientes enunciados:

a) Se ha tomado una muestra de ciudadanos en los distritos de Lince, Pueblo


Libre y San Miguel, y se les pidió su opinión respecto del Corredor Azul de
la avenida Javier Prado.
b) En una muestra de 350 padres de familia se ha evaluado las preferencias
por los cursos de verano que podrían llevar sus hijos (pintura, deporte,
computación) según el grado de instrucción (primaria, secundaria).
c) En una encuesta a los televidentes del programa ¿Y Tú que Planes?, se
registró el género y el tipo de trabajo del televidente para probar si existe
relación entre estas variables.

506 ESTADÍSTICA GENERAL


2. Complete los espacios en blanco de las siguientes tablas y calcule el
estadístico chi-cuadrado:

a)

Filas: Tipo de motivación Columnas: Grado de riesgo


Alto Bajo Mediano Todo
Afiliación 8 26 16 50
_____ 16 19
_____ 6.250 0.474
Poder 27 9 14 50
15 16 _____
9.600 3.063 _____
Rendimiento 10 13 27 ___
15 _____ 19
1.667 0.563 3.368
Todo 45 _____ 57 ___
Chi-cuadrada de Pearson = _______, GL = ________

b)

Filas: Ingresos ($) Columnas: Distrito


Miraflores Sn Borja Sn Isidro Total
De 1200 a < de 3000 42 25 48 115
46.70 ______ 33.99
0.4728 2.5260 _____
De 3000 a más 25 30 14 ____
______ 20.59 20.40
______ 4.3054 2.0052
De 800 a < de 1200 80 53 ______ 178
______ 53.10 52.61
0.8242 0.0002 1.1017
Total 147 108 ______ 362
Chi-cuadrada de Pearson = _______, GL = ________

ESTADÍSTICA GENERAL 507


3. La empresa Favorita cuenta con tres tipos de producto en el mercado, que se
clasifican como: Tipo A, tipo B y tipo C. El director de marketing de la empresa
cree que el tipo de producto está relacionado con el nivel socioeconómico
del cliente. Para verificar sus creencias, el director recolectó la información
de un grupo de clientes de los diferentes niveles socioeconómicos y obtuvo
los siguientes resultados:

Tipo de producto
Nivel socioeconómico
Tipo A Tipo B Tipo C
Alto 60 40 25
Medio 50 60 32
Bajo 20 50 48

Al 5% de significancia, ¿puede afirmar que el nivel socioeconómico del cliente


está relacionado con el tipo de producto que prefiere?

4. El administrador del centro comercial MEGAPROM desea realizar un estudio


del tipo de cliente que frecuenta sus tiendas y la modalidad de pago que
utilizan cuando efectúan una compra. Para el estudio, el administrador tomó
una muestra aleatoria de los registros de compra por cada modalidad de
pago y los clasificó de acuerdo al tipo de cliente y su modalidad de pago. Los
resultados obtenidos se presentan a continuación:

Modalidad de pago
Tipo de cliente
Contado Crédito
Ama de Casa 54 36
Trabajador independiente 32 47
Trabajador dependiente 66 58

a) De acuerdo a la información que se tiene, ¿qué prueba de hipótesis


corresponde? Justifique.
b) Plantee las hipótesis.
c) Con un nivel de significación del 5%, realice la prueba correspondiente.

508 ESTADÍSTICA GENERAL


26.6 Portafolio (para subir al campus virtual)
Utilice el Minitab, para resolver los siguientes problemas:

1. La empresa Favorita SA, cuenta en el mercado, con tres tipos de productos


que se clasifican como: Tipo A, tipo B y tipo C. El director de Marketing de
la empresa desea saber si el tipo de producto está relacionado con el nivel
socioeconómico del cliente que lo prefiere. Para esto, recolectó información
de un grupo de clientes de los diferentes niveles socioeconómico y obtuvo
los siguientes resultados:

Nivel Tipo de producto


socioeconómico A B C
Alto 60 40 25
Medio 50 60 32
Bajo 20 50 48

Al 5% de significancia, ¿puede afirmar que el nivel socioeconómico del cliente


está relacionado con el tipo de producto que prefiere?

2. En un proceso de fabricación de tornillos, el jefe de producción cree que


la proporción de tornillos defectuosos producidos en tres máquinas es la
misma en cada máquina. Para verificar su creencia, el jefe seleccionó una
muestra de 400 tornillos de la producción de cada máquina y obtuvo los
siguientes resultados:

Tipo de máquina
Estado del tornillo
A B C
Defectuoso 17 23 28
No defectuoso 383 377 372

Realice la prueba de hipótesis correspondientes y diga si los datos favorecen


la creencia del jefe de producción. Utilice un nivel de significación de 0.05.

ESTADÍSTICA GENERAL 509


3. En un estudio sobre la relación entre las condiciones del equipo de una
gasolinera y la política de precios observada en una muestra de 441 gasolineras
se obtuvo lo siguiente:

Política de precios observada


Condición
Elevado Medio Bajo
Abajo del estándar 24 15 17
Estándar 52 73 80
Moderna 58 86 36

Al nivel de significación del 1%, ¿sugiere la información de que las condiciones


del equipo de una gasolinera y la política de precios observada son
independientes?

510 ESTADÍSTICA GENERAL


Capítulo 11
REGRESIÓN LINEAL
SIMPLE

Capacidades para desarrollar


Al finalizar el capítulo, el estudiante estará en capacidad de:

• Determinar la correlación de dos variables cuantitativas mediante el diagrama


de dispersión y el coeficiente de correlación de Pearson en problemas
contextualizados.
• Estimar el modelo de regresión lineal simple en problemas contextualizados.

ESTADÍSTICA GENERAL 511


• Realizar la prueba de significancia del modelo de regresión lineal simple en
problemas contextualizados.
• Verificar los supuestos de los residuos en problemas contextualizados
utilizando los resultados obtenidos con el programa Minitab.

Motivación
El gerente de una cadena de supermercados desea obtener un modelo que le
permita estimar el tiempo que pasan los clientes en la caja registradora con la
finalidad de determinar su asociación con algunas variables como: el tipo de
producto comprado, cantidad de productos comprados por cada tipo, tipo de
pago realizado (con tarjeta o al contado), monto de la compra y el tiempo que
pasan los clientes en la caja registradora. ¿Existe alguna relación entre el tiempo
que pasan los clientes en la caja registradora con las otras variables? ¿Será
posible estimar el tiempo que pasan los clientes en la caja registradora a partir
de la información obtenida para dichas variables?

Los estudios estadísticos requieren la definición de un conjunto de variables


cuantitativas y/o cualitativas obtenidas de una población. Para el caso de las
variables cuantitativas puede existir entre ellas alguna relación funcional que de
ser estimada podría ayudar a explicar el comportamiento de las mismas.

Para obtener una idea de la forma en que estas dos variables están relacionadas
se puede trazar un gráfico de dispersión.

Saberes previos
• Pruebas de hipótesis.

512 ESTADÍSTICA GENERAL


Lección 27

27.1 Gráfica de dispersión


Una gráfica de dispersión es útil para explorar la relación entre un par de variables
continuas.

Ejemplo 1
Las siguientes observaciones corresponden a las Y horas dedicadas al acabado
de X artículos producidos en una carpintería:

Horas de
16 35 56 55 25 50 52 40 80 68 75 55 86 51 31 53
acabado (Y)
Número de
25 16 25 33 18 26 20 19 37 40 35 28 33 23 15 21
artículos (X)

La gráfica de dispersión correspondiente es:

Figura N°1. Gráfica de dispersión de horas de acabado vs número de artículos


producidos

Ejemplo 2
Se realizó un estudio para determinar la relación que existe entre el costo de
un producto (en soles) y la demanda (en miles de unidades) del mismo. En el
presente estudio, se seleccionó una muestra aleatoria de 20 días y se obtuvieron
los siguientes resultados:

ESTADÍSTICA GENERAL 513


Costo (X) Demanda (Y)
2.5 30
2.0 32
1.7 39
2.8 27
2.9 23
1.9 36
3.0 20
1.6 42
2.6 29
2.4 30
1.9 34
2.1 34
3.1 17
1.5 44
2.3 35
1.8 34
3.1 21
2.6 27
2.7 24
2.2 30

La gráfica de dispersión correspondiente es:

Figura N°2. Gráfica de dispersión de la demanda vs costo

Los puntos así dispuestos muestran una relación lineal inversa:

514 ESTADÍSTICA GENERAL


27.2 Análisis de regresión
El análisis de regresión es importante para estudiar la relación entre dos
variables cuantitativas. Es de interés estudiar la forma de la relación, la fuerza
de la asociación entre las dos variables, probar la validez del modelo y realizar
predicciones de la variable dependiente a partir de la variable independiente.

Para esto, se obtiene un modelo que relaciona una variable dependiente (Y)
con una variable independiente (X). Un modelo es una función matemática
que representa la relación entre las variables X e Y. La función matemática más
simple es la ecuación de una recta.

27.2.1 Regresión lineal simple


Es una técnica estadística que permite obtener la ecuación de una recta a partir
de la información obtenida para dos variables cuantitativas, de tal manera que
se puedan realizar estimaciones de la variable dependiente Y, a partir de la
variable independiente o regresora X.

El modelo de regresión lineal simple es:

Y = β 0 + β1X + ε

Donde β 0 y β 1 son parámetros de la ecuación y ε se define como el error


aleatorio.

Donde:
E (ε ) = 0 y V (ε ) = σ 2

Debido a lo anterior, la recta de regresión tiene la siguiente forma:

E (Y ) = Y = β 0 + β 1 X
Gráficamente:

ESTADÍSTICA GENERAL 515


27.2.2 Estimación de los parámetros del modelo
Para estimar los parámetros β 0 y β 1 de la ecuación, se utilizará el método de
mínimos cuadrados, que parte de una muestra de n pares de valores de las
variables X e Y: ( x1 , y1 ) , ( x2 , y2 ) , …, ( xn , yn ) , donde un valor de Y, por ejemplo yi , se
obtiene así:

yi = β 0 + β 1 xi + ε i

A partir de: Y = β 0 + β 1 X + ε

Despejando el error, se tiene: ε i = yi − ( β 0 + β 1 xi )

Donde este error debe ser el mínimo posible, por lo tanto, considerando los
errores de los n pares de valores se forma la siguiente función L:
n n 2
L = ∑ε i2 = ∑ yi − ( β 0 + β 1xi )
i =1 i =1

Luego, se deriva la función L, se iguala a cero y se obtiene:

βˆ 0 = b0 = y − b1 x

Donde:

Por lo que:

SP ( x, y )
βˆ1 = b1 =
SC ( x )

Observación
• SC(x) = Suma de cuadrados de X
• SP(x,y) = Suma de productos de X e Y

516 ESTADÍSTICA GENERAL


Por lo tanto, la recta de regresión estimada tiene la siguiente forma:

Yˆ = b0 + b1 X
donde:

• b0 , es el intercepto con el eje Y de la recta de regresión.


• b1 , es la pendiente de la recta estimada, llamada coeficiente de regresión
el cual se interpreta como el cambio promedio en Y cuando X cambia
en una unidad.

Observación
• Si b1 >0, la tendencia lineal es creciente.
• Si b1 <0, la tendencia lineal es decreciente.
• Si b1 =0, indica que no existe relación lineal entre las variables.

Ejemplo 3
Para los datos presentados en el ejemplo 2, obtenga la ecuación de la recta
estimada.

A partir de los datos, se obtiene lo siguiente:

x = 2.335 y y = 30.4

ESTADÍSTICA GENERAL 517


A partir de los cálculos anteriores, se obtienen las estimaciones de los parámetros
β 1 y β 0 , así:

SP ( x, y ) − 66.58
b1 = = = − 13.4627
SC ( x ) 4.9455

b0 = y − b1x = 30.4 − ( − 13.4627 )( 2.335) = 61.8354

La ecuación de regresión estimada es:

Yˆ = 61.8354 − 13.4627 X
(Demanda = 61.8354 - 13.4627 Costo)

Cuando el costo de un producto se incrementa en un sol, la demanda disminuye


(por el signo negativo de b1), en promedio, en 13.4627 miles de unidades.

27.2.3 Prueba de hipótesis para validar la recta de regresión


Luego de estimar la ecuación de regresión (modelo), no es seguro que el modelo
se pueda utilizar para pronosticar o predecir un valor de Y para cualquier valor
de X, razón por la cual, se procede con la prueba de hipótesis para validar la
significancia del modelo; de manera que, se pueda utilizar para el objetivo que
se obtuvo, la predicción.

Se sabe que la recta de regresión es: E ( Y ) = β 0 + β 1X

Para que esta recta sostenga una dependencia respecto de la variable X, el


término β 1 X debe mantenerse en la ecuación y esto solo es posible cuando
se tiene plena seguridad de que el coeficiente β1 es significativo, es decir, sea
diferente de cero. Los pasos son los siguientes:

Paso 1
H 0 : β 1 = 0 (La recta de regresión no es significativa)

H1 : β 1 ≠ 0 (La recta de regresión es significativa)

Paso 2
Establecer el nivel de significancia α

518 ESTADÍSTICA GENERAL


Paso 3
b1
Calcular el estadístico de prueba T definido como: Tcal = ~ t n− 2
Sb
1

donde:

Se
Sb es la desviación estándar de b1 definido como: Sb =
SC ( X )
1
1

Se es la desviación estándar del error o error estándar de estimación


definido como:

Reemplazando yˆ i = b0 + b1 xi en la expresión anterior se tiene:

donde, CME es el cuadrado medio del error.

Paso 4
Establecer la región de rechazo

RNR

1-α
RR RR

α/2 α/2
t(α/2; n-2) t(1-α/2; n-2)

Paso 5
Concluir

ESTADÍSTICA GENERAL 519


Ejemplo 4:
Para los datos presentados en el ejemplo 2, realice la prueba de significancia de
la recta.

Paso 1:
H 0 : β 1 = 0 (La recta de regresión no es significativa)

H1 : β 1 ≠ 0 (La recta de regresión es significativa)

Paso2:
α=0.05

Paso 3:
− 13.4627
Tcal = = − 13.5059
0.9968
donde:

Se 2.2168
Sb = = = 0.9968
SC ( X ) 4.9455
1

Paso 4:

t0.025; 18 = -2.101 t0.975; 18 = 2.101

Paso 5:
Como Tcal = -13.5059 < -2.101 se encuentra en la región de rechazo, se rechaza
H0. Con un nivel de significancia del 5%, existe evidencia estadística para pensar
que el modelo es significativo.

520 ESTADÍSTICA GENERAL


27.3 Coeficiente de correlación de Pearson (r)
El coeficiente de correlación de Pearson es una medida que cuantifica el grado
de relación lineal entre dos variables aleatorias X e Y cuyos valores ( x1 , y1 ),
( x 2 , y2 ), … , ( x n , y n ) son obtenidos a partir de una muestra de tamaño n. Este
coeficiente toma valores entre -1 y 1.
−1 ≤ r ≤ 1

Fórmula para el cálculo del coeficiente de correlación de Pearson:

Donde:

Observación
SC(y) = Suma de cuadrados de Y

Por tanto, el coeficiente de correlación de Pearson se puede expresar de la


siguiente manera:

SP ( x, y )
r=
SC ( x ) SC ( y )

Si r = 1, se dice que la correlación entre las variables X e Y es perfecta positiva.

Si r = -1, se dice que la correlación entre las variables X e Y es perfecta negativa.

ESTADÍSTICA GENERAL 521


Si − 1 ≤ r ≤ − 0.8 , se dice que existe correlación negativa intensa

Si − 0.8 < r ≤ − 0.2 , se dice que existe correlación negativa normal

Si − 0.2 ≤ r ≤ 0 , se dice que existe correlación negativa débil

Si 0 ≤ r < 0.2 , se dice que existe correlación positiva débil

Si 0.2 ≤ r < 0.8 , se dice que existe correlación positiva normal

Si 0.8 < r < 1 , se dice que existe correlación positiva intensa

Si r = 0, se dice que no hay correlación lineal entre las variables X e Y.

Ejemplo 5
Para los datos del ejemplo 2, calcule el coeficiente de correlación de Pearson:

Cálculos previos:

522 ESTADÍSTICA GENERAL


× ×

Cálculo del coeficiente de correlación:

SP ( x, y ) − 66.58
r= = = − 0.9540
SC ( x ) SC ( y ) 4.9455 984.8

Como el resultado se encuentra entre − 1 ≤ r ≤ − 0.8 la correlación es negativa


intensa.

27.4 Coeficiente de determinación (R2)


Si es de interés conocer qué porcentaje de la variabilidad es explicada por el
modelo, es preciso conocer la variabilidad total de Y. Partiendo de la desviación
respecto a su media, se tiene:

yi − y

donde:

yi = I-ésimo valor de Y

y = Promedio de los n valores de Y

Dicha desviación se puede expresar así:

yi − y = ( yˆ i − y ) + ( yi − yˆ i )

Para una muestra de n valores (xi, yi), se tiene:

SCT = SCReg + SCE


(Variabilidad Total = Variabilidad debido a la regresión + Variabilidad debido al error)

De la expresión anterior se observa que la variabilidad total está compuesta


por dos fuentes, una debido a la regresión y la otra debido al error, como es
de suponer lo más conveniente es que la variabilidad total sea explicada en

ESTADÍSTICA GENERAL 523


su mayoría debido a la regresión. La proporción de la variabilidad total que es
explicada debido a la regresión se obtiene de la siguiente manera:

SCT SCReg SCE


= +
SCT SCT SCT
SCReg SCE
1= +
SCT SCT

El coeficiente de determinación se representa con R2 y se obtiene de la siguiente


manera:

SCReg Variación debido a la regresión


R2 = = ; 0 ≤ R2 ≤ 1
SCT Variación Total

Un coeficiente de determinación cercano a uno 1, indica que la recta de regresión


estimada se ajusta mejor a los datos.

Para una mejor interpretación del coeficiente de determinación es conveniente


convertirlo a porcentaje multiplicando el resultado por 100%, por lo que, R2
indica el porcentaje de la variabilidad total de Y que es explicada por la recta de
regresión estimada.

Ejemplo 6
Para los datos provenientes del ejemplo 2, el coeficiente de determinación R2 se
obtiene de la siguiente manera:

b1SP ( x , y ) ( 13.4627 )( 66.58)


R2 = = = 0.9102
SC ( y ) 984.8

Este valor indica que el 91.02% de la variabilidad de la demanda es explicada por


la recta de regresión estimada.

27.5 Ejercicios resueltos


1. Un corredor de bienes raíces desea saber cómo cambia el precio de una
casa ante un cambio en el tamaño de la misma. Por tal motivo, el corredor
seleccionó una muestra aleatoria de 11 casas y obtuvo información sobre
la superficie (en 100 m2) y el precio (en miles de dólares). Los resultados
obtenidos son los siguientes:

Área (X) 1.0 1.4 1.5 1.5 1.3 1.2 1.0 1.6 1.8 1.4 1.2
Precio (Y) 60 69 74 71 68 56 61 76 82 70 65

524 ESTADÍSTICA GENERAL


a) Realice el gráfico de dispersión.
b) Estime la ecuación de regresión para estimar el precio de una casa a partir
de su tamaño.
c) ¿Es el modelo significativo? Utilice un nivel de significancia del 5%.
d) Calcule el error de predicción para una casa cuyo precio es 140 metros
cuadrados.
e) Obtenga el precio esperado de una casa de 165 metros cuadrados.
f) Interprete el coeficiente de regresión en términos del problema.
g) Interprete el coeficiente de correlación de Pearson.
h) Interprete el coeficiente de determinación.

Solución:
a)
Figura N°3. Gráfica de dispersión del Área vs Precio

b) Cálculos previos:

x = 1.3545 y y = 68.3636

× ×

ESTADÍSTICA GENERAL 525


Cálculo de los coeficientes:

SP ( x , y ) 17.3165
b1 = = = 28.4530
SC ( x ) 0.6086
b0 = y − b1 x = 68.3636 − 28.4530 × 1.3545 29.8240

La ecuación de regresión es:

Yˆ = 29.8240 + 28.4530 X
(Precio = 29.8240 + 28.4530 Área)

c)

Paso 1:
H 0 : β 1 = 0 (El modelo no es significativo)

H1 : β 1 ≠ 0 (El modelo es significativo)

Paso2:
α=0.05

Paso 3:
b1 28.453
Tcal = = = 7.3589
Sb 3.8665
1

donde:

Error estándar de estimación:

× ×

Desviación estándar de b1:

Se 3.0164
Sb = = = 3.8665
SC ( X ) 0.6086
1

526 ESTADÍSTICA GENERAL


Paso 4:

t0.025; 9 = -2.262 t0.975; 9 = 2.262

Paso 5:
Como Tcal = 7.3589>2.262 se encuentra en la región de rechazo, se rechaza
Ho. Con un nivel de significancia del 5%, existe evidencia estadística para
pensar que el modelo es significativo.

d) ei = yi − ŷi = 70 − 69.6582 = 0.3418 miles de dólares , donde:

ŷi = 29.8240 + 28.4530 (1.4 ) = 69.6582

e) ŷi = 29.8240 + 28.4530 (1.65) = 76.77145

f) Cuando el área se incrementa en 100 m2, el precio de la casa aumenta, en


promedio 28.4530 miles de dólares

g)
SP ( x , y ) 17.3165
r= = = 0.9260
SC ( x ) SC ( y ) 0.6086 574.6001

Por tanto, se tiene una relación positiva intensa entre el área y el precio.
2
h) R 2 = ( 0.9260 ) = 0.8575

Este valor indica que el 85.75% de la variabilidad del precio está explicada
por el modelo.

ESTADÍSTICA GENERAL 527


2. Un psicólogo cree que los problemas neuronales de sus pacientes se deben
a la relación entre el peso (X) en kilogramos y la presión sistólica (Y) en
mm Hg de los pacientes. Para verificar sus creencias, el psicólogo realizó
un estudio en nueve pacientes que presentan problemas neuronales. Los
resultados se muestran a continuación.

Peso (X) 75 82 71 97 87 96 91 72 77
Presión Sistólica (Y) 131 151 129 152 151 141 149 134 136

De donde:

a) Calcule la recta de regresión.

× ×

Cálculo de los coeficientes:

SP ( x, y ) 576.5356
b1 = = = 0.7095
SC ( x ) 812.5511

La ecuación de regresión es:

Y = 82.5935 + 0.7095 X
(Presión sistólica = 82.5935 + 0.7095 Peso)

b) Con base en la respuesta dada en el ítem a, realice una estimación de la


presión sistólica de un paciente que tiene un peso de 99 kilogramos.

Y = 82.5935 + 0.7095 ( 99 ) = 152.8340

528 ESTADÍSTICA GENERAL


c) Interprete el coeficiente de determinación.

R2 = 59.38%

El 59.38% de la variabilidad de la presión sistólica está explicada por el


modelo.

d) ¿Es el modelo significativo? Utilice un nivel de significancia del 2%.

Paso 1:
H 0 : β 1 = 0 (El modelo no es significativo)

H1 : β 1 ≠ 0 (El modelo es significativo)

Paso2:
α = 0.02

Paso 3:
Error estándar de estimación:

181042 82.5935 × 1274 0.7095 × 106462


Se = = 6.3594

Desviación estándar de b1:

Se 6.3594
Sb = = = 0.2231
1
SC ( X ) 812.5511

Estadístico de prueba:

b1 0.7095
Tcal = = = 3.1802
Sb 0.2231
1

ESTADÍSTICA GENERAL 529


Paso 4:

t0.01; 7 = 2.998 t0.99; 7 = 2.998


Paso 5:
Como Tcal = 3.1801 > 2.998 se encuentra en la región de rechazo, se rechaza
H0. Con un nivel de significancia del 2%, existe evidencia estadística para
pensar que el modelo es significativo.

EJERCICIO RESUELTO CON EL PROGRAMA MINITAB


• Para calcular la ecuación de regresión y las diferentes medidas se sigue la ruta:
Estadísticas à Regresión → Regresión → Ajustar modelo de regresión …

Ingrese las variables de estudio de la siguiente forma:

• En Respuestas: Presión Sistólica (Y)


• En Predictores continuos: Peso (X)

530 ESTADÍSTICA GENERAL


Haga clic en Aceptar y se obtiene:

• Para realizar la gráfica de residuos se sigue la ruta:

En la ventana de regresión, en donde se ingresaron las variables de estudio,


hacer clic en la opción de Gráficas … y seleccionar Cuatro en uno.

ESTADÍSTICA GENERAL 531


Haga clic en Aceptar dos veces y se obtiene:

532 ESTADÍSTICA GENERAL


De los gráficos a y b, se observa que los residuos se encuentran situados cerca
de la línea diagonal y que el histograma presenta forma simétrica centrada en
cero. Se concluye que los residuos siguen una distribución normal.

En el gráfico c se observa que los residuos varían de -10 a 10 alrededor del punto
cero.

A partir de los resultados mostrados, se concluye que los residuos siguen una
distribución normal con media cero y varianza constante.

En el gráfico d se observa que los residuos no presentan ningún patrón, por lo


tanto, son independientes.

27.6 Trabajo colaborativo (para trabajar en clase)


1. Los siguientes datos pertenecen al residuo de cloro que hay en una piscina
en diferentes momentos después de ser tratada con sustancias químicas:

Número de horas 2 4 6 8 10 12 14 16
Residuo (ppm) 1.8 1.5 1.4 1.1 1.0 0.9 0.7 0.4

ESTADÍSTICA GENERAL 533


a) Estime la ecuación de regresión. Interprete la pendiente.
b) ¿Es el modelo significativo? Utilice un nivel de significancia del 5%.

2. El jefe de personal de una planta de ensamblaje de motores cree que existe


una relación entre la edad del trabajador (X) y su ausentismo (Y). Para
verificar sus creencias, el jefe tomó una muestra aleatoria de 10 empleados.
Los resultados obtenidos se muestran a continuación:

Edad (X) 42 27 36 25 22 39 45 19 33 30
Días de Ausencia (Y) 2 7 5 9 10 4 3 8 6 5

a) Estime la ecuación de regresión. Interprete la pendiente.


b) Con base en la respuesta dada en el ítem a), realice una estimación de los
días que se ausenta un trabajador que tiene una edad de 40 años.
c) Interprete el coeficiente de determinación.

3. En una compañía de seguros se desea determinar el grado de relación que


existe entre el ingreso familiar anual y el monto de seguro de vida del jefe
de familia. Con base a una muestra aleatoria de nueve familias, se obtuvo la
siguiente información (en miles de soles):

Ingreso (X) 45 20 47 30 20 15 35 40 55
Monto (Y) 70 50 90 55 35 40 65 75 105

De donde:

a) Estime la ecuación de regresión. Interprete la pendiente.


b) Con base en la respuesta dada en el ítem a), obtenga el error de estimación
si el ingreso del jefe de familia es 20 mil soles.
c) Interprete el coeficiente de determinación.

4. Se desea estudiar si existe relación entre el daño que sufren los duraznos
(mm2) al caer del árbol y la altura de la que caen (mm). El objetivo del
estudio es proporcionar un modelo de predicción para el daño sufrido por
los duraznos, que sirva de guía para las operaciones de cosecha y acciones a
seguir posteriores a la misma. A partir de los siguientes datos:

534 ESTADÍSTICA GENERAL


Daño (mm2) 7.27 4.91 10.36 5.26 6.09 3.46 8.5 9.34 5.55 8.11 12.58 5.23
Altura de la
366.7 346.8 600 369 418 284.2 558.6 415 349.5 462.8 502.1 351.4
caida (mm)

a) Estime la ecuación de regresión. Interprete la pendiente.


b) Construya el ANOVA correspondiente y diga si el modelo propuesto es
significativo. Utilice un nivel de significación del 5%.
c) Interprete el coeficiente de correlación.

27.7 Trabajo autónomo


1. En la empresa QUIETSA el ingeniero de control de calidad desea estudiar
si existe relación entre la diferencia de temperatura en °C (entre la calle y la
oficina) y el consumo de energía del aire acondicionado (kW). El objetivo del
estudio es proporcionar un modelo de predicción para el consumo de energía,
que sirva para mejorar el uso adecuado de ventilación de los ambientes. En
la siguiente tabla, se muestran los datos obtenidos en el estudio:

Diferencia de Consumo de
temperatura energía (kW)
3.5 73.54
3.6 78.42
3.8 80.64
3.9 83.55
4.2 86.47
4.3 88.61
4.6 95.45
4.7 98.89
4.9 99.34
5.0 99.20
5.3 99.34
5.6 104.45

a) Estime el modelo de regresión e interprete la pendiente.


b) Construya el ANOVA correspondiente y diga si el modelo propuesto es
significativo, utilice un nivel de significación del 5%.
c) Calcule e interprete el coeficiente de correlación.

ESTADÍSTICA GENERAL 535


2. Un profesional de medicina, miembro de la Organización Nacional de Salud,
está investigando si existe relación entre el consumo anual de vino (en litros
por habitante) y el número de muertes por enfermedad cardiaca (por cada
10 000 habitantes) en algunos países europeos. El objetivo del estudio
es proporcionar un modelo de predicción para el número de muertes por
enfermedad cardiaca, que sirva para recomendar el consumo controlado de
vino. En la siguiente tabla, se muestran los datos obtenidos en el estudio:

Consumo anual Número anual de muertes


de Vino por enfermedad cardiaca
3.9 167
2.9 131
2.4 191
2.9 220
4.3 343
0.8 297
2.5 211
3.5 134
2.4 245
0.8 211
0.6 147

a) Estime el modelo de regresión e interprete la pendiente.


b) Construya el ANOVA correspondiente y diga si el modelo propuesto es
significativo, utilice un nivel de significación del 5%.
c) Calcule e interprete el coeficiente de correlación.

3. El gerente de la cadena de supermercados MARKET desea saber si existe


relación entre el monto de compra de un cliente (en soles) y el tiempo que
tarda en pasar por caja (en minutos). Para esto, tomó una muestra aleatoria
de 12 clientes y obtuvo los siguientes resultados:

Monto (X) 35.12 14.44 4.9 78.75 81.25 106.3 61.75 66.89 22.62 54.07 12.03 19.11
Tiempo (Y) 3.5 1.2 0.7 7.0 6.2 8.8 5.3 8.5 2.3 6.6 1.6 2.2

De donde:

536 ESTADÍSTICA GENERAL


a) Estime la recta de regresión.
b) Con base en la respuesta dada en el ítem a), realice una estimación del
tiempo que tardaría un cliente cuyo monto de compra es 100 soles.
c) Interprete el coeficiente de determinación.

4. En una empresa de comunicaciones se quiere probar si existe una relación


lineal entre el tiempo de publicidad (en horas por semana) y el nivel de ventas
(en miles de dólares) de un producto. Para esto, se recolectó información de
las últimas semanas. Los resultados obtenidos son los siguientes:

Tiempo de publicidad (X) 20 25 22 28 36 40


Nivel de ventas (Y) 300 310 305 320 350 420

a) Estime la ecuación de regresión. Interprete la pendiente.


b) Construya el ANOVA correspondiente y diga si el modelo propuesto es
significativo. Utilice un nivel de significación del 5%.
c) Obtenga el error de estimación si el tiempo de publicidad es de 28 minutos.

27.8 Problemas de reforzamiento del capítulo


1. Jorge es dueño de una constructora y desea estimar el gasto (en decenas
de miles de soles) en reparaciones debido a la cantidad de intervenciones
por observaciones en los acabados. Para esto, tomó los datos de algunas
experiencias pasadas en su empresa. En la siguiente tabla se muestran los
datos obtenidos para este estudio:

Intervenciones Gasto
145 9.2
123 8.4
78 7.6
120 8.7
207 15
105 9.2
122 10.5
83 7.1
170 14
187 14.3
111 8.7
162 11.6
180 12.6
132 8.8

ESTADÍSTICA GENERAL 537


a) Verifique los supuestos de los residuos. Utilice el programa Minitab.
b) Estime el modelo de regresión del gasto en función de las intervenciones.
Interprete el coeficiente de regresión.
c) Con un nivel de significación de 5%, ¿se puede afirmar que el modelo es
significativo?

2. En una determinada comunidad autónoma se desea estudiar el consumo


mensual en función de la renta per cápita. Para este estudio, se tomó una
muestra de los registros de siete años. Los datos (en euros) se muestran en
la siguiente tabla:

Renta per cápita Consumo


2850.0 2500
3317.1 2900
4285.7 4100
4772.7 4750
5217.4 5100
5687.5 5620
6664.0 6750

a) Estime el modelo de regresión del gasto en función de las intervenciones.


Interprete el coeficiente de regresión.
b) Con un nivel de significación de 5%, ¿se puede afirmar que el modelo es
significativo?
c) Interprete el coeficiente de determinación.
d) Verifique los supuestos de los residuos.

538 ESTADÍSTICA GENERAL


27.9 Portafolio (para subir al campus virtual)
El monetarismo postula a largo plazo una relación estable entre tres variables
macroeconómicas muy importantes: la tasa de inflación, la tasa de crecimiento
monetario y el cambio porcentual en el PIB a precios constantes. Se seleccionó
una muestra de 16 países latinoamericanos durante el periodo de 2000 – 2010,
y la información registrada se observada en el siguiente cuadro:

Tasa de Tasa de crecimiento Cambio porcentual


País
inflación monetario en el PBI
1 26.4 24.6 2.4
2 41.3 41.6 3.0
3 35.1 38.2 3.9
4 28.2 35.2 4.6
5 9.2 16.5 5.4
6 1.9 9.0 5.7
7 3.0 8.8 4.7
8 0.3 3.5 4.6
9 1.1 5.9 3.9
10 2.1 8.0 4.0
11 5.3 11.3 6.9
12 3.4 8.6 3.7
13 12.5 15.4 5.5
14 8.5 13.4 5.7
15 43.0 40.1 0.7
16 1.1 7.9 6.8

1. Utilizando el programa Minitab, para las variables tasa de inflación y tasa de


crecimiento monetario se pide:
a) Verifique los supuestos de los residuos.
b) Estime el modelo de regresión de la tasa de inflación en función de la tasa
de crecimiento monetario. Interprete el coeficiente de regresión.
c) Con un nivel de significación de 5%, ¿se puede afirmar que el modelo es
significativo?

2. Utilizando el programa Minitab, para las variables tasa de inflación y cambio


porcentual en el PBI se pide:
a) Estime el modelo de regresión de la tasa de inflación en función del
cambio porcentual en el PBI.
b) Interprete el coeficiente de determinación.
c) Estime la tasa de inflación si el cambio porcentual en el PBI es 5.9.

ESTADÍSTICA GENERAL 539


Claves del capítulo 1:
Organización de Datos
Lección 1. Conceptos básicos.

1.1 Trabajo colaborativo


2.
a) (F) Se utilizará la inferencia estadística.
b) (F) Utilizó el muestreo no probabilístico.
c) (F) El jefe utilizará la estadística descriptiva.
2.
a)

Población Todas las personas del país, entre hombres y mujeres, de 18 a 70


años y de todos los niveles socioeconómicos.
Muestra 1 202 personas a nivel nacional, entre hombres y mujeres, de 18 a
70 años y de todos los niveles socioeconómicos.
Unidad experimental Una persona del país, hombre o mujer, de 18 a 70 años y de todos
los niveles socioeconómicos.

b)

Variable Tipo de variable


Opinión sobre la actividad minera Cualitativa nominal
Beneficios de la actividad minera Cualitativa nominal
Perjuicios de la actividad minera Cualitativa nominal
Opinión sobre la influencia de la actividad minera en el medio am- Cualitativa ordinal
biente
Género de la persona Cualitativa nominal
Edad de la persona Cuantitativa continua
Nivel socioeconómico Cualitativa ordinal

c)

El porcentaje de todas las personas del país que están a favor de la actividad
minera en el país.
Parámetro
El porcentaje de todas las personas del país que opinan que la minería cuida
mucho del medio ambiente.

540 ESTADÍSTICA GENERAL


d) Un estadígrafo, porque el resultado se obtuvo del estudio realizado a
una muestra de 1 202 personas.
e) Inferencia Estadística, porque a partir de los resultados obtenidos de la
muestra se puede generalizar para toda la población.

1.2 Trabajo autónomo


2.
a)

Población Todas las familias que viven en la urbanización El Sol.


Muestra Un grupo de familias que viven en la urbanización El Sol.
Unidad experimental Una familia que vive en la urbanización El Sol.

Variable Tipo de variable


Consumo trimestral de agua Cuantitativa continua

Estadístico Consumo promedio trimestral muestral de agua de una familia que vive en
la urbanización El Sol.
Parámetro Consumo promedio trimestral poblacional de agua de una familia que vive
en la urbanización El Sol.

Observación 3
2 706 m

b)
Población Todos los clientes de los agentes de crédito de los diferentes
distritos de la ciudad durante el mes de agosto de 2014.
Muestra 350 clientes de los agentes de crédito de los diferentes distritos
de la ciudad durante el mes de agosto de 2014.
Unidad experimental Un cliente de los agentes de crédito de los diferentes distritos de
la ciudad durante el mes de agosto de 2014.

Variable Tipo de variable


Nivel de satisfacción de los clientes Cualitativa ordinal

Estadístico El 36% de los clientes se encuentran satisfechos con los servicios


brindados por los agentes de crédito.

Observación Satisfecho

ESTADÍSTICA GENERAL 541


4.
a)
Población Todos los clientes de telefonía celular de Lima Metropolitana.
Muestra 400 clientes de telefonía celular de Lima Metropolitana.
Unidad elemental Un cliente de telefonía celular de Lima Metropolitana.

b)
Día de la semana en que el servicio es más lento.
Cualitativa nominal
Limitación del servicio telefónico móvil.
Cualitativa ordinal Opinión del servicio telefónico móvil.
Cuantitativa continua Tiempo de conexión a Internet.

c)
El 30% de los clientes encuestados respondió que el servicio se
Estadísticos hace más lento el día domingo.
El 15% de los encuestados respondió que una de las limitaciones
del servicio es que la red no está disponible en ciertos puntos
geográficos.
El tiempo promedio de conexión a Internet es de 10 segundos.
El 20% de los encuestados respondió que el servicio es muy malo.
El 15% respondió que el servicio es malo.
El 25% respondió que el servicio es regular. El 30% respondió que el
servicio es bueno.
El resto (10%) respondió que el servicio es muy bueno.

d)
Parámetro Tiempo promedio poblacional de conexión a Internet.

542 ESTADÍSTICA GENERAL


Lección 2
Tablas de frecuencias para variables
cuantitativas discretas y continuas.
2.1. Trabajo colaborativo

2.
a )
Número de hijos fi hi Fi Hi
0 6 0.150 6 0.150
1 8 0.200 14 0.350
2 14 0.350 28 0.700
3 9 0.225 37 0.925
4 2 0.050 39 0.975
5 1 0.025 40 1
Total 40 1

b)

c) Interpretación:
f3: 14 posibles nuevos clientes tienen dos hijos.
h2: La proporción de posibles nuevos clientes que tienen un hijo es 0.2.
H3: La proporción de posibles nuevos clientes que tienen a lo más dos
hijos es 0.7.
F4: 37 posibles nuevos clientes tienen a lo más tres hijos.

ESTADÍSTICA GENERAL 543


4.
a)
Número de preguntas contestadas fi hi Fi Hi
15 4 0.100 4 0.100
16 9 0.225 13 0.325
17 10 0.250 23 0.575
18 7 0.175 30 0.750
19 6 0.150 36 0.900
20 4 0.100 40 1
Total 40 1

b) 57.5% c) 42.5% d) 80%

2.2 Trabajo autónomo


2.
a) Variable: Número de cuadernos defectuosos en cada caja.
Tipo de variable: Cuantitativa discreta.

b)
Número de cuadernos fi hi Fi Hi
defectuosos
0 3 0.100 3 0.100
1 4 0.133 7 0.233
2 6 0.200 13 0.433
3 8 0.267 21 0.700
4 5 0.167 26 0.867
5 3 0.100 29 0.967
6 1 0.033 30 1
Total 30 1

c) 1 - H4 = 0.30: La proporción de cajas registradas con cuatro a seis cuadernos


defectuosos es 0.30.

544 ESTADÍSTICA GENERAL


d)

4.
a) R=455.03 k=6.6 ≅ 7 c=(455.03/7)=65.0043 ≅ 65.01
Inversión xi fi hi Fi Hi
[135.24 – 200.25> 167.745 1 0.02 1 0.02
[200.25 – 265.26> 232.755 6 0.12 7 0.14
[265.26 – 330.27> 297.765 10 0.20 17 0.34
[330.27 – 395.28> 362.775 9 0.18 26 0.52
[395.28 – 460.29> 427.785 11 0.22 37 0.74
[460.29 – 525.30> 492.795 5 0.10 42 0.84
[525.30 – 590.31> 557.805 8 0.16 50 1
Total 50 1

b)

c) 28.91%
d) 486.294
e) 307.517

ESTADÍSTICA GENERAL 545


Claves del capítulo 2:
Medidas de Tendencia Central y No Central

Lección 3
Medidas de tendencia central
3.1 Trabajo colaborativo

2.

4.

3.2 Trabajo autónomo


2.
4.

Lección 4
Medidas de tendencia no central

4.1 Trabajo colaborativo


2.
4.

4.2 Trabajo autónomo


2.

4. a) P20=2 130.9 minutos b) P90= 3 254.1 minutos

546 ESTADÍSTICA GENERAL


Claves del capítulo 3:
Medidas de Variabilidad, Asimetría y Curtosis

Lección 5
Medidas de dispersión

5.1 Trabajo colaborativo


2. Relacione los siguientes enunciados:
a) Coeficiente de variación Es la diferencia entre el dato máximo y el dato mínimo. (d)
b) Rango intercuartílico Es una medida de dispersión relativa. (a)
c) Si Y=X+k, entonces Mide la desviación media o promedio de cada dato (e )
V(Y) = V(X) con respecto a la media.
d) Rango Propiedad de la varianza. (c )
e) Desviación estándar Mide la variabilidad del 50% central de los datos. (b)

4.

5.2 Trabajo autónomo


2.
a) CVX = 670%; CVY = 1318%; CVZ = 5.84%
b) Tienda Z (CVX = 670% < CVY = 1318% < CVZ = 5.84%)

4.
a) Empresa A (CVA = 28.59% < CVB = 34.36%)
b) Empresa A (CVA = 0.28% < CVB = 0.34%)
c) Empresa A (CVA = 4.15% < CVB = 6.29%)

ESTADÍSTICA GENERAL 547


Lección 6
Medidas de apuntamiento y curtosis. Diagrama
de caja.
6.1 Trabajo colaborativo
2.

4. FFFV

6.2 Trabajo autónomo


2.

4.
a) Sí, porque las calificaciones mejoran.
b) Con una cuarta vez de capacitación.
c) Sí, en la cuarta capacitación un usuario tiene una calificación por encima
del resto y otro tiene por debajo del resto.

548 ESTADÍSTICA GENERAL


Claves del capítulo 4:
Probabilidades.

Lección 7
Conceptos básicos.
7.5 Trabajo colaborativo
2. a)

4.

ESTADÍSTICA GENERAL 549


7.6 Trabajo autónomo
2.

a) Diagrama del árbol

b) espacio muestral

4.
a)

550 ESTADÍSTICA GENERAL


Lección 8
Probabilidad condicional
8.5 Trabajo colaborativo
2. a) 4/43=0.0930 b) 22/43=0.5116 c) 14/33=0.4242 d) 4/18=0.2222
4. a) 0.40 b) 0.80

8.6 Trabajo autónomo


2. P(X≤3)=1
4. a) 400/800=0.5 b) 350/800=0.4375 c) 425/800=0.53125
d) 225/425=0.5294 e) 200/400=0.5

Lección 9
Eventos independientes

9.3 Trabajo colaborativo


2. a) 0.7219 b) 0.1031 c) 0.1531
4. a) 0.855 b) 0.145 c) 0.14

9.4 Trabajo autónomo


2. a) 0. 112 b) 0.078 c) 0.26
4. a) 0.09693 b) 0.00003 c) 0.90307

Lección 10
Probabilidad Total y Bayes

10.4 Trabajo colaborativo


2. a) 0.2167 b) 0.1333 c) 0.3846
4. a) 0.84 b) 0.5357

ESTADÍSTICA GENERAL 551


10.5 Trabajo autónomo
2. a) 0.8325 b) 0.5525 c) 0.3363
4. a) 0.52 b) 0.9231

Claves del capítulo 5:


Distribuciones Discretas Importantes.

Lección 11
Distribución Binomial

11.5 Trabajo colaborativo


2. a) 0.3529 b) 0.0016
4. a) 0.0099 b) 0.6171

11.6 Trabajo autónomo


2. a) 0.05792 b) 0.73728 c)4 clientes
4. a) 0.0115 b) 16 machos

Lección 12
Distribución Poisson

12.5 Trabajo colaborativo


2. a) 0.1804 b) 0.3158
4. a) 0.3233
b)
Y 0 1 2 3 4 5
P(Y) 0.0035 0.0370 0.1547 0.3239 0.3390 0.1419
c) 0.1263

12.6 Trabajo autónomo


2. a) 0.9897 b) 0.9990 c) 4.9485 5 clientes
4. a) 0.7851 b) 0.2983

552 ESTADÍSTICA GENERAL


Claves del capítulo 6:
Distribuciones Continuas Importantes.

Lección 13
Distribución Normal

13.7 Trabajo colaborativo


2. a) 0.00657 b) 0.00427 c) 0.87286 d) 0.99801 e) 0.89413

4. a) 37.511

b)

Categoría del cliente Monto de compra

Cliente Normal Sí la compra es menor a 311.54


Cliente Alto Sí la compra está entre 311.54 y 402.40
Cliente Sobresaliente Sí la compra es mayor a 402.40

13.8 trabajo autónomo


2. aI) 0.30854 aII) 9720 b) 3810.39
4.
a)

Grupo Porcentaje

Grupo 1: Tiempo menor a 10 minutos 0.12%


Grupo 2: Tiempo entre 10 y 28 minutos 99.12%
Grupo 3: Tiempo mayor a 28 minutos 0.76%

b)

Grupo Tiempo (en minutos)


Grupo 1: Poco distraídas A lo más 19.59
Grupo 2: Medianamente distraídas Más de 19.59 y a lo más 22.78
Grupo 3: Muy distraídas Mayor a 22.78

ESTADÍSTICA GENERAL 553


Lección 14
Distribución Chi-Cuadrado, T-Student y F-Fisher.
14.17 Trabajo colaborativo
2. a) 0.95 b) 0.75 c) 0.6
4. a) 0.93 b) 0.92 c) 0.985

14.18 Trabajo autónomo


2. a) 17.322 b) 2.180 c) 42.796
4. a) 2.11 b) 3.26 c) 2.34

554 ESTADÍSTICA GENERAL


TABLAS
ESTADÍSTICAS
DISTRIBUCIÓN NORMAL ESTÁNDAR

Z 0 1 2 3 4 5 6 7 8 9
-3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
-3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
-3.7 0.00011 0.00010 0.00010 0.00010 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008
-3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
-3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017
-3.4 0.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
-3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035
-3.2 0.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050
-3.1 0.00097 0.00094 0.00090 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071
-3.0 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00104 0.00100
-2.9 0.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139
-2.8 0.00256 0.00248 0.00240 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193
-2.7 0.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.00280 0.00272 0.00264
-2.6 0.00466 0.00453 0.00440 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357
-2.5 0.00621 0.00604 0.00587 0.00570 0.00554 0.00539 0.00523 0.00508 0.00494 0.00480
-2.4 0.00820 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639
-2.3 0.01072 0.01044 0.01017 0.00990 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842
-2.2 0.01390 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.01160 0.01130 0.01101
-2.1 0.01786 0.01743 0.01700 0.01659 0.01618 0.01578 0.01539 0.01500 0.01463 0.01426
-2.0 0.02275 0.02222 0.02169 0.02118 0.02068 0.02018 0.01970 0.01923 0.01876 0.01831
-1.9 0.02872 0.02807 0.02743 0.02680 0.02619 0.02559 0.02500 0.02442 0.02385 0.02330
-1.8 0.03593 0.03515 0.03438 0.03362 0.03288 0.03216 0.03144 0.03074 0.03005 0.02938
-1.7 0.04457 0.04363 0.04272 0.04182 0.04093 0.04006 0.03920 0.03836 0.03754 0.03673
-1.6 0.05480 0.05370 0.05262 0.05155 0.05050 0.04947 0.04846 0.04746 0.04648 0.04551
-1.5 0.06681 0.06552 0.06426 0.06301 0.06178 0.06057 0.05938 0.05821 0.05705 0.05592
-1.4 0.08076 0.07927 0.07780 0.07636 0.07493 0.07353 0.07215 0.07078 0.06944 0.06811
-1.3 0.09680 0.09510 0.09342 0.09176 0.09012 0.08851 0.08691 0.08534 0.08379 0.08226
-1.2 0.11507 0.11314 0.11123 0.10935 0.10749 0.10565 0.10383 0.10204 0.10027 0.09853
-1.1 0.13567 0.13350 0.13136 0.12924 0.12714 0.12507 0.12302 0.12100 0.11900 0.11702
-1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 0.14457 0.14231 0.14007 0.13786
-0.9 0.18406 0.18141 0.17879 0.17619 0.17361 0.17106 0.16853 0.16602 0.16354 0.16109
-0.8 0.21186 0.20897 0.20611 0.20327 0.20045 0.19766 0.19489 0.19215 0.18943 0.18673
-0.7 0.24196 0.23885 0.23576 0.23270 0.22965 0.22663 0.22363 0.22065 0.21770 0.21476
-0.6 0.27425 0.27093 0.26763 0.26435 0.26109 0.25785 0.25463 0.25143 0.24825 0.24510
-0.5 0.30854 0.30503 0.30153 0.29806 0.29460 0.29116 0.28774 0.28434 0.28096 0.27760
-0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636 0.32276 0.31918 0.31561 0.31207
-0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317 0.35942 0.35569 0.35197 0.34827
-0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129 0.39743 0.39358 0.38974 0.38591
-0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038 0.43644 0.43251 0.42858 0.42465
-0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006 0.47608 0.47210 0.46812 0.46414

556 ESTADÍSTICA GENERAL


DISTRIBUCIÓN NORMAL ESTÁNDAR

Z 0 1 2 3 4 5 6 7 8 9
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99896 0.99900
3.1 0.99903 0.99906 0.99910 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929
3.2 0.99931 0.99934 0.99936 0.99938 0.99940 0.99942 0.99944 0.99946 0.99948 0.99950
3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.99960 0.99961 0.99962 0.99964 0.99965
3.4 0.99966 0.99968 0.99969 0.99970 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976
3.5 0.99977 0.99978 0.99978 0.99979 0.99980 0.99981 0.99981 0.99982 0.99983 0.99983
3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989
3.7 0.99989 0.99990 0.99990 0.99990 0.99991 0.99991 0.99992 0.99992 0.99992 0.99992
3.8 0.99993 0.99993 0.99993 0.99994 0.99994 0.99994 0.99994 0.99995 0.99995 0.99995
3.9 0.99995 0.99995 0.99996 0.99996 0.99996 0.99996 0.99996 0.99996 0.99997 0.99997

ESTADÍSTICA GENERAL 557


DISTRIBUCIÓN T-STUDENT

G.L. Valores de Probabilidad: p

n 0.0005 0.005 0.01 0.02 0.025 0.03 0.04 0.05 0.06 0.08 0.10 0.15 0.20 0.25

1 -636.619 -63.657 -31.821 -15.895 -12.706 -10.579 -7.916 -6.314 -5.242 -3.895 -3.078 -1.963 -1.376 -1.000
2 -31.599 -9.925 -6.965 -4.849 -4.303 -3.896 -3.320 -2.920 -2.620 -2.189 -1.886 -1.386 -1.061 -0.816
3 -12.924 -5.841 -4.541 -3.482 -3.182 -2.951 -2.605 -2.353 -2.156 -1.859 -1.638 -1.250 -0.978 -0.765
4 -8.610 -4.604 -3.747 -2.999 -2.776 -2.601 -2.333 -2.132 -1.971 -1.723 -1.533 -1.190 -0.941 -0.741
5 -6.869 -4.032 -3.365 -2.757 -2.571 -2.422 -2.191 -2.015 -1.873 -1.649 -1.476 -1.156 -0.920 -0.727

6 -5.959 -3.707 -3.143 -2.612 -2.447 -2.313 -2.104 -1.943 -1.812 -1.603 -1.440 -1.134 -0.906 -0.718
7 -5.408 -3.499 -2.998 -2.517 -2.365 -2.241 -2.046 -1.895 -1.770 -1.572 -1.415 -1.119 -0.896 -0.711
8 -5.041 -3.355 -2.896 -2.449 -2.306 -2.189 -2.004 -1.860 -1.740 -1.549 -1.397 -1.108 -0.889 -0.706
9 -4.781 -3.250 -2.821 -2.398 -2.262 -2.150 -1.973 -1.833 -1.718 -1.532 -1.383 -1.100 -0.883 -0.703
10 -4.587 -3.169 -2.764 -2.359 -2.228 -2.120 -1.948 -1.813 -1.700 -1.518 -1.372 -1.093 -0.879 -0.700

11 -4.437 -3.106 -2.718 -2.328 -2.201 -2.096 -1.928 -1.796 -1.686 -1.507 -1.363 -1.088 -0.876 -0.697
12 -4.318 -3.055 -2.681 -2.303 -2.179 -2.076 -1.912 -1.782 -1.674 -1.498 -1.356 -1.083 -0.873 -0.695
13 -4.221 -3.012 -2.650 -2.282 -2.160 -2.060 -1.899 -1.771 -1.664 -1.490 -1.350 -1.079 -0.870 -0.694
14 -4.140 -2.977 -2.625 -2.264 -2.145 -2.046 -1.888 -1.761 -1.656 -1.484 -1.345 -1.076 -0.868 -0.692
15 -4.073 -2.947 -2.603 -2.249 -2.131 -2.034 -1.878 -1.753 -1.649 -1.478 -1.341 -1.074 -0.866 -0.691

16 -4.015 -2.921 -2.584 -2.235 -2.120 -2.024 -1.869 -1.746 -1.643 -1.474 -1.337 -1.071 -0.865 -0.690
17 -3.965 -2.898 -2.567 -2.224 -2.110 -2.015 -1.862 -1.740 -1.637 -1.469 -1.333 -1.069 -0.863 -0.689
18 -3.922 -2.878 -2.552 -2.214 -2.100 -2.007 -1.855 -1.734 -1.632 -1.466 -1.330 -1.067 -0.862 -0.688
19 -3.883 -2.861 -2.540 -2.205 -2.093 -2.000 -1.845 -1.729 -1.628 -1.462 -1.328 -1.066 -0.861 -0.688
20 -3.850 -2.845 -2.528 -2.197 -2.086 -1.994 -1.844 -1.725 -1.624 -1.459 -1.325 -1.064 -0.860 -0.687

21 -3.819 -2.831 -2.5176 -2.189 -2.080 -1.988 -1.840 -1.721 -1.621 -1.457 -1.323 -1.063 -0.859 -0.686
22 -3.792 -2.819 -2.508 -2.183 -2.074 -1.983 -1.835 -1.717 -1.618 -1.454 -1.321 -1.061 -0.858 -0.686
23 -3.768 -2.807 -2.4999 -2.177 -2.069 -1.978 -1.832 -1.714 -1.615 -1.452 -1.319 -1.060 -0.858 -0.685
24 -3.745 -2.797 -2.492 -2.172 -2.064 -1.974 -1.828 -1.710 -1.612 -1.450 -1.318 -1.059 -0.857 -0.685
25 -3.725 -2.787 -2.485 -2.167 -2.060 -1.970 -1.825 -1.708 -1.610 -1.448 -1.316 -1.058 -0.856 -0.684

26 -3.707 -2.779 -2.4786 -2.162 -2.056 -1.967 -1.822 -1.706 -1.608 -1.446 -1.315 -1.058 -0.856 -0.684
27 -3.369 -2.615 -2.356 -2.075 -1.979 -1.898 -1.765 -1.657 -1.565 -1.413 -1.288 -1.041 -0.855 -0.676
28 -3.674 -2.763 -2.467 -2.154 -2.048 -1.960 -1.817 -1.701 -1.604 -1.443 -1.313 -1.056 -0.855 -0.683
29 -3.659 -2.756 -2.462 -2.150 -2.045 -1.957 -1.814 -1.699 -1.602 -1.442 -1.311 -1.055 -0.854 -0.683
30 -3.646 -2.750 -2.457 -2.147 -2.042 -1.955 -1.812 -1.697 -1.600 -1.441 -1.310 -1.055 -0.854 -0.683

558 ESTADÍSTICA GENERAL


DISTRIBUCIÓN T-STUDENT

G.L. Valores de Probabilidad: p

n 0.75 0.80 0.85 0.90 0.92 0.94 0.95 0.96 0.97 0.975 0.98 0.99 0.995 0.9995

1 1.000 1.376 1.963 3.078 3.895 5.242 6.314 7.916 10.579 12.706 15.895 31.821 63.657 636.619
2 0.816 1.061 1.386 1.886 2.189 2.620 2.920 3.320 3.896 4.303 4.849 6.965 9.925 31.599
3 0.765 0.978 1.250 1.638 1.859 2.156 2.353 2.605 2.951 3.182 3.482 4.541 5.841 12.924
4 0.741 0.941 1.190 1.533 1.723 1.971 2.132 2.333 2.601 2.776 2.999 3.747 4.604 8.610
5 0.727 0.920 1.156 1.476 1.649 1.873 2.015 2.191 2.422 2.571 2.757 3.365 4.032 6.869

6 0.718 0.906 1.134 1.440 1.603 1.812 1.943 2.104 2.313 2.447 2.612 3.143 3.707 5.959
7 0.711 0.896 1.119 1.415 1.572 1.770 1.895 2.046 2.241 2.365 2.517 2.998 3.499 5.408
8 0.706 0.889 1.108 1.397 1.549 1.740 1.860 2.004 2.189 2.306 2.449 2.896 3.355 5.041
9 0.703 0.883 1.100 1.383 1.532 1.718 1.833 1.973 2.150 2.262 2.398 2.821 3.250 4.781
10 0.700 0.879 1.093 1.372 1.518 1.700 1.812 1.948 2.120 2.228 2.359 2.764 3.169 4.587

11 0.697 0.876 1.088 1.363 1.507 1.686 1.796 1.928 2.096 2.201 2.328 2.718 3.106 4.437
12 0.695 0.873 1.083 1.356 1.498 1.674 1.782 1.912 2.076 2.179 2.303 2.681 3.055 4.318
13 0.694 0.870 1.079 1.350 1.490 1.664 1.771 1.899 2.060 2.160 2.282 2.650 3.012 4.221
14 0.692 0.868 1.076 1.345 1.484 1.656 1.761 1.887 2.046 2.145 2.264 2.624 2.977 4.140
15 0.691 0.866 1.074 1.341 1.478 1.649 1.753 1.878 2.034 2.131 2.249 2.602 2.947 4.073

16 0.690 0.865 1.071 1.337 1.474 1.642 1.746 1.869 2.024 2.120 2.235 2.583 2.921 4.015
17 0.689 0.863 1.069 1.333 1.469 1.637 1.740 1.862 2.015 2.110 2.224 2.567 2.898 3.965
18 0.688 0.862 1.067 1.330 1.466 1.632 1.734 1.855 2.007 2.101 2.214 2.552 2.878 3.922
19 0.688 0.861 1.066 1.328 1.462 1.628 1.729 1.850 2.000 2.093 2.205 2.539 2.861 3.883
20 0.687 0.860 1.064 1.325 1.459 1.624 1.725 1.844 1.994 2.086 2.197 2.528 2.845 3.850

21 0.686 0.859 1.063 1.323 1.457 1.621 1.721 1.840 1.988 2.080 2.189 2.518 2.831 3.819
22 0.686 0.858 1.061 1.321 1.454 1.618 1.717 1.835 1.983 2.074 2.183 2.508 2.819 3.792
23 0.685 0.858 1.060 1.319 1.452 1.615 1.714 1.832 1.978 2.069 2.177 2.500 2.807 3.768
24 0.685 0.857 1.059 1.318 1.450 1.612 1.711 1.828 1.974 2.064 2.172 2.492 2.797 3.745
25 0.684 0.856 1.058 1.316 1.448 1.610 1.708 1.825 1.970 2.060 2.167 2.485 2.787 3.725

26 0.684 0.856 1.058 1.315 1.446 1.608 1.706 1.822 1.967 2.056 2.162 2.479 2.779 3.707
27 0.684 0.855 1.057 1.314 1.445 1.606 1.703 1.819 1.963 2.052 2.158 2.473 2.771 3.690
28 0.683 0.855 1.056 1.313 1.443 1.604 1.701 1.817 1.960 2.048 2.154 2.467 2.763 3.674
29 0.683 0.854 1.055 1.311 1.442 1.602 1.699 1.814 1.957 2.045 2.150 2.462 2.756 3.659
30 0.683 0.854 1.055 1.310 1.441 1.600 1.697 1.812 1.955 2.042 2.147 2.457 2.750 3.646

ESTADÍSTICA GENERAL 559


DISTRIBUCIÓN CHI-CUADRADA
G.L. Valores de la Probabilidad: p
r 0.001 0.005 0.01 0.025 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.975 0.99 0.995 0.999
1 0.000 0.000 0.000 0.001 0.004 0.016 0.064 0.148 0.275 0.455 0.708 1.074 1.642 2.706 3.841 5.024 6.635 7.879 10.828
2 0.002 0.010 0.020 0.051 0.103 0.211 0.446 0.713 1.022 1.386 1.833 2.408 3.219 4.605 5.991 7.378 9.210 10.597 13.816
3 0.024 0.072 0.115 0.216 0.352 0.584 1.005 1.424 1.869 2.366 2.946 3.665 4.642 6.251 7.815 9.348 11.345 12.838 16.266
4 0.091 0.207 0.297 0.484 0.711 1.064 1.649 2.195 2.753 3.357 4.045 4.878 5.989 7.779 9.488 11.143 13.277 14.860 18.467
5 0.210 0.412 0.554 0.831 1.145 1.610 2.343 3.000 3.655 4.351 5.132 6.064 7.289 9.236 11.070 12.833 15.086 16.750 20.515
6 0.381 0.676 0.872 1.237 1.635 2.204 3.070 3.828 4.570 5.348 6.211 7.231 8.558 10.645 12.592 14.449 16.812 18.548 22.458
7 0.598 0.989 1.239 1.690 2.167 2.833 3.822 4.671 5.493 6.346 7.283 8.383 9.803 12.017 14.067 16.013 18.475 20.278 24.322
8 0.857 1.344 1.646 2.180 2.733 3.490 4.594 5.527 6.423 7.344 8.351 9.524 11.030 13.362 15.507 17.535 20.090 21.955 26.124
9 1.152 1.735 2.088 2.700 3.325 4.168 5.380 6.393 7.357 8.343 9.414 10.656 12.242 14.684 16.919 19.023 21.666 23.589 27.877
10 1.479 2.156 2.558 3.247 3.940 4.865 6.179 7.267 8.295 9.342 10.473 11.781 13.442 15.987 18.307 20.483 23.209 25.188 29.588
11 1.834 2.603 3.053 3.816 4.575 5.578 6.989 8.148 9.237 10.341 11.530 12.899 14.631 17.275 19.675 21.920 24.725 26.757 31.264
12 2.214 3.074 3.571 4.404 5.226 6.304 7.807 9.034 10.182 11.340 12.584 14.011 15.812 18.549 21.026 23.337 26.217 28.300 32.909
13 2.617 3.565 4.107 5.009 5.892 7.042 8.634 9.926 11.129 12.340 13.636 15.119 16.985 19.812 22.362 24.736 27.688 29.819 34.528
14 3.041 4.075 4.660 5.629 6.571 7.790 9.467 10.821 12.078 13.339 14.685 16.222 18.151 21.064 23.685 26.119 29.141 31.319 36.123
15 3.483 4.601 5.229 6.262 7.261 8.547 10.307 11.721 13.030 14.339 15.733 17.322 19.311 22.307 24.996 27.488 30.578 32.801 37.697
16 3.942 5.142 5.812 6.908 7.962 9.312 11.152 12.624 13.983 15.338 16.780 18.418 20.465 23.542 26.296 28.845 32.000 34.267 39.252
17 4.416 5.697 6.408 7.564 8.672 10.085 12.002 13.531 14.937 16.338 17.824 19.511 21.615 24.769 27.587 30.191 33.409 35.718 40.790
18 4.905 6.265 7.015 8.231 9.390 10.865 12.857 14.440 15.893 17.338 18.868 20.601 22.760 25.989 28.869 31.526 34.805 37.156 42.312
19 5.407 6.844 7.633 8.907 10.117 11.651 13.716 15.352 16.850 18.338 19.910 21.689 23.900 27.204 30.144 32.852 36.191 38.582 43.820

ESTADÍSTICA GENERAL
20 5.921 7.434 8.260 9.591 10.851 12.443 14.578 16.266 17.809 19.337 20.951 22.775 25.038 28.412 31.410 34.170 37.566 39.997 45.315
21 6.447 8.034 8.897 10.283 11.591 13.240 15.445 17.182 18.768 20.337 21.991 23.858 26.171 29.615 32.671 35.479 38.932 41.401 46.797
22 6.983 8.643 9.542 10.982 12.338 14.041 16.314 18.101 19.729 21.337 23.031 24.939 27.301 30.813 33.924 36.781 40.289 42.796 48.268
23 7.529 9.260 10.196 11.689 13.091 14.848 17.187 19.021 20.690 22.337 24.069 26.018 28.429 32.007 35.172 38.076 41.638 44.181 49.728
24 8.085 9.886 10.856 12.401 13.848 15.659 18.062 19.943 21.652 23.337 25.106 27.096 29.553 33.196 36.415 39.364 42.980 45.559 51.179
25 8.649 10.520 11.524 13.120 14.611 16.473 18.940 20.867 22.616 24.337 26.143 28.172 30.675 34.382 37.652 40.646 44.314 46.928 52.620
26 9.222 11.160 12.198 13.844 15.379 17.292 19.820 21.792 23.579 25.336 27.179 29.246 31.795 35.563 38.885 41.923 45.642 48.290 54.052
27 9.803 11.808 12.879 14.573 16.151 18.114 20.703 22.719 24.544 26.336 28.214 30.319 32.912 36.741 40.113 43.195 46.963 49.645 55.476
28 10.391 12.461 13.565 15.308 16.928 18.939 21.588 23.647 25.509 27.336 29.249 31.391 34.027 37.916 41.337 44.461 48.278 50.993 56.892
29 10.986 13.121 14.256 16.047 17.708 19.768 22.475 24.577 26.475 28.336 30.283 32.461 35.139 39.087 42.557 45.722 49.588 52.336 58.301
30 11.588 13.787 14.953 16.791 18.493 20.599 23.364 25.508 27.442 29.336 31.316 33.530 36.250 40.256 43.773 46.979 50.892 53.672 59.703

560
DISTRIBUCIÓN F DE FISHER

GRADOS DE LIBERTAD DEL NUMERADOR (r1)


F(r1,r2)
1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 25 30 40
1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.9 245.4 246.5 247.3 248.0 249.3 250.1 251.1
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 19.42 19.43 19.44 19.45 19.46 19.46 19.47
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.71 8.69 8.67 8.66 8.63 8.62 8.59
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5.87 5.84 5.82 5.80 5.77 5.75 5.72
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 4.64 4.60 4.58 4.56 4.52 4.50 4.46

6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00 3.96 3.92 3.90 3.87 3.83 3.81 3.77
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.53 3.49 3.47 3.44 3.40 3.38 3.34
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 3.24 3.20 3.17 3.15 3.11 3.08 3.04
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.03 2.99 2.96 2.94 2.89 2.86 2.83
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91 2.86 2.83 2.80 2.77 2.73 2.70 2.66
GRADOS DE LIBERTAD DEL DENOMINADOR. (r2)

11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79 2.74 2.70 2.67 2.65 2.60 2.57 2.53
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69 2.64 2.60 2.57 2.54 2.50 2.47 2.43
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60 2.55 2.51 2.48 2.46 2.41 2.38 2.34
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 2.48 2.44 2.41 2.39 2.34 2.31 2.27
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 2.42 2.38 2.35 2.33 2.28 2.25 2.20

16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.42 2.37 2.33 2.30 2.28 2.23 2.19 2.15
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.38 2.33 2.29 2.26 2.23 2.18 2.15 2.10
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.34 2.29 2.25 2.22 2.19 2.14 2.11 2.06
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 2.26 2.21 2.18 2.16 2.11 2.07 2.03
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 2.22 2.18 2.15 2.12 2.07 2.04 1.99

21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.25 2.20 2.16 2.12 2.10 2.05 2.01 1.96
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 2.17 2.13 2.10 2.07 2.02 1.98 1.94
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.20 2.15 2.11 2.08 2.05 2.00 1.96 1.91
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.18 2.13 2.09 2.05 2.03 1.97 1.94 1.89
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.16 2.11 2.07 2.04 2.01 1.96 1.92 1.87

26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.09 2.05 2.02 1.99 1.94 1.90 1.85
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.08 2.04 2.00 1.97 1.92 1.88 1.84
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.06 2.02 1.99 1.96 1.91 1.87 1.82
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.10 2.05 2.01 1.97 1.94 1.89 1.85 1.81
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.09 2.04 1.99 1.96 1.93 1.88 1.84 1.79

35 4.12 3.27 2.87 2.64 2.49 2.37 2.29 2.22 2.16 2.11 2.04 1.99 1.94 1.91 1.88 1.82 1.79 1.74
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 1.95 1.90 1.87 1.84 1.78 1.74 1.69
45 4.06 3.20 2.81 2.58 2.42 2.31 2.22 2.15 2.10 2.05 1.97 1.92 1.87 1.84 1.81 1.75 1.71 1.66
50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03 1.95 1.89 1.85 1.81 1.78 1.73 1.69 1.63

ESTADÍSTICA GENERAL 561


DISTRIBUCIÓN F DE FISHER

F(r1,r2) GRADOS DE LIBERTAD DEL NUMERADOR (r1)


1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 25 30 40
1 647.8 799.5 864.2 899.6 921.8 937.1 948.2 956.7 963.3 968.6 976.7 982.5 986.9 990.3 993.1 998.1 1001 1006
2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.41 39.43 39.44 39.44 39.45 39.46 39.46 39.47
3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.34 14.28 14.23 14.20 14.17 14.12 14.08 14.04
4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.75 8.68 8.63 8.59 8.56 8.50 8.46 8.41
5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.52 6.46 6.40 6.36 6.33 6.27 6.23 6.18

6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.37 5.30 5.24 5.20 5.17 5.11 5.07 5.01
7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.67 4.60 4.54 4.50 4.47 4.40 4.36 4.31
8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.20 4.13 4.08 4.03 4.00 3.94 3.89 3.84
9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.87 3.80 3.74 3.70 3.67 3.60 3.56 3.51
10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.62 3.55 3.50 3.45 3.42 3.35 3.31 3.26

11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.43 3.36 3.30 3.26 3.23 3.16 3.12 3.06
GRADOS DE LIBERTAD DEL DENOMINADOR (r2)

12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.28 3.21 3.15 3.11 3.07 3.01 2.96 2.91
13 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25 3.15 3.08 3.03 2.98 2.95 2.88 2.84 2.78
14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 3.05 2.98 2.92 2.88 2.84 2.78 2.73 2.67
15 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 2.96 2.89 2.84 2.79 2.76 2.69 2.64 2.59

16 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 2.89 2.82 2.76 2.72 2.68 2.61 2.57 2.51
17 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92 2.82 2.75 2.70 2.65 2.62 2.55 2.50 2.44
18 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.77 2.70 2.64 2.60 2.56 2.49 2.44 2.38
19 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82 2.72 2.65 2.59 2.55 2.51 2.44 2.39 2.33
20 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.68 2.60 2.55 2.50 2.46 2.40 2.35 2.29

21 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87 2.80 2.73 2.64 2.56 2.51 2.46 2.42 2.36 2.31 2.25
22 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70 2.60 2.53 2.47 2.43 2.39 2.32 2.27 2.21
23 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81 2.73 2.67 2.57 2.50 2.44 2.39 2.36 2.29 2.24 2.18
24 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64 2.54 2.47 2.41 2.36 2.33 2.26 2.21 2.15
25 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 2.61 2.51 2.44 2.38 2.34 2.30 2.23 2.18 2.12

26 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59 2.49 2.42 2.36 2.31 2.28 2.21 2.16 2.09
27 5.63 4.24 3.65 3.31 3.08 2.92 2.80 2.71 2.63 2.57 2.47 2.39 2.34 2.29 2.25 2.18 2.13 2.07
28 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55 2.45 2.37 2.32 2.27 2.23 2.16 2.11 2.05
29 5.59 4.20 3.61 3.27 3.04 2.88 2.76 2.67 2.59 2.53 2.43 2.36 2.30 2.25 2.21 2.14 2.09 2.03
30 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 2.41 2.34 2.28 2.23 2.20 2.12 2.07 2.01

35 5.48 4.11 3.52 3.18 2.96 2.80 2.68 2.58 2.50 2.44 2.34 2.27 2.21 2.16 2.12 2.05 2.00 1.93
40 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39 2.29 2.21 2.15 2.11 2.07 1.99 1.94 1.88
45 5.38 4.01 3.42 3.09 2.86 2.70 2.58 2.49 2.41 2.35 2.25 2.17 2.11 2.07 2.03 1.95 1.90 1.83
50 5.34 3.97 3.39 3.05 2.83 2.67 2.55 2.46 2.38 2.32 2.22 2.14 2.08 2.03 1.99 1.92 1.87 1.80

562 ESTADÍSTICA GENERAL

También podría gustarte