Está en la página 1de 164

lOMoARcPSD|30546586

GUIA DE Estadística General 2023

estadistica general (Universidad Científica del Sur)

Studocu no está patrocinado ni avalado por ningún colegio o universidad.


Descargado por lu vvv (ricehom480@apxby.com)
lOMoARcPSD|30546586

Estadística
General

Área de Estadística General


Lima – Perú
2023

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

GUÍA DE LABORATORIO DE ESTADÍSTICA GENERAL


Derechos Reservados 2021
Área de Estadística
Décima segunda Edición 2021

Diseño y Diagramación
Universidad Científica del Sur
Panamericana Sur km 19 - Lima 42

Lima-Perú 610-6400

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Dr. José Carlos Dextre Chacón


Presidente del Directorio

Dr. Manuel Efraín Rosemberg Barrón


Rector

Dr. Luis Javier Cardó Soria


Gerente General

Mg. Lorenzo Wong Lam


Gerente de Educación

Dr. José Agustín Ortiz Elías


Vicerector Académico

Joyce del Pino


Director Departamento Cursos Básicos

Mg. Sarita Bocanegra Gonzales


Responsable del Área de Matemática, Física y Estadística

Mg. Sarita Bocanegra Gonzales


Responsable del Curso de Estadística General

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

CONTENIDO

UNIDAD 1

Capítulo 1: Conceptos 6

Capítulo 2: Presentación de datos 11

UNIDAD 2

Capítulo 3: Medidas de Tendencia Central 25

Capítulo 4: Medidas de Posición No Central 29

Capítulo 5: Medidas de Dispersión 37

Capítulo 6: Asimetría y Curtosis 45

UNIDAD 3

Capítulo 7: Cálculo de Probabilidades 50

Capítulo 8: Distribución Binomial 64

Capítulo 9: Distribución Poisson 68

Capítulo 10: Distribución Normal 72

Capítulo 11: Distribución Muestral 83

UNIDAD 4

Capítulo 12: Intervalos de Confianza 89

Capítulo 13: Tamaño de la muestra 96

Capítulo 14: Prueba de Hipótesis 101

Capítulo 15: Análisis de Varianza 122

Capítulo 16: Regresión y Correlación Lineal 131

Capítulo 17: Tablas de Contingencia y Pruebas Chi – Cuadrado 143

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Elaboración propia

CONCEPTOS BÁSICOS, PRESENTACIÓN DE DATOS

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

CONCEPTOS ESTADÍSTICOS

ESTADÍSTICA
Es una ciencia que nos ofrece un conjunto de métodos y técnicas para: recolectar, clasificar, procesar,
presentar, analizar e interpretar un conjunto de datos, con la finalidad de conocer el problema, obtener
algunas conclusiones y finalmente tomar decisiones.
Es una herramienta fundamental para realizar investigación científica.

ESTADÍSTICA DESCRIPTIVA.
Es un conjunto de métodos que nos permiten describir y resumir los datos observados mediante gráficos
o cuadros y realizando algunos cálculos de indicadores.

ESTADÍSTICA INFERENCIAL
Es un conjunto de métodos que nos permiten hacer generalizaciones o inferencias acerca de una
población a partir de lo observado en una muestra.

POBLACIÓN
Es la totalidad de individuos o de elementos (empresas, personas, objetos etc.) que cumplen o satisfacen
la o las características en estudio.
Por el número de elementos que la componen la población se clasifica en finita e infinita. La población
es finita si tiene un número determinado de elementos en caso contrario es infinita. En la práctica una
población finita con un gran número de elementos se considera como una población infinita; por otro
lado, el tamaño de una población va a depender del objetivo trazado por el investigador.

MUESTRA
Está constituida por una parte de los individuos o elementos que componen la población, seleccionada
de acuerdo a cierta técnica con el fin de obtener información acerca de la población, de la cual proviene.
La muestra debe ser seleccionada de manera que sea representativa, es decir tenga características
similares a las de su población.

PARÁMETRO
Es una medida descriptiva que resume una característica de la población, es decir constituye el valor
real, verdadero; su cálculo implica utilizar toda la información contenida en la población; entre los más
conocidos tenemos:
La media poblacional ( 𝜇 )
La varianza poblacional ( 𝜎 2 )
La desviación estándar poblacional (σ)
La proporción poblacional ( 𝜋 )

ESTADÍSTICO
Es una medida que describe una característica de la muestra, se calcula a partir de los datos observados
en la muestra; es decir constituyen los estimadores de cada uno de sus respectivos parámetros; entre
estos tenemos:
La media muestral ( 𝑥̅ )
La varianza muestral (𝑠 2 )
La desviación estándar muestral(s)
La proporción muestral ( 𝑝 )

VARIABLE
Es una característica definida en la población de acuerdo a cierto interés en una investigación estadística,
que puede tomar dos o más valores (cualidades o números). Puede ser una característica medible (peso,

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

precio, ingresos, temperatura etc.) o una cualidad no medible (estado civil, calidad, color, sexo etc.). Se
representa con las letras mayúsculas X, Y, Z.

CLASIFICACIÓN DE LAS VARIABLES

SEGÚN LA NATURALEZA DE LA VARIABLE

a) VARIABLES CUALITATIVAS O CATEGÓRICAS


Son aquellas cuyos valores expresan cualidades o atributos; estas a su vez pueden ser:

VARIABLES NOMINALES. - Son aquellas en donde no existe un orden preestablecido entre las
categorías de las variables. Ejemplos:

VARIABLE CATEGORIAS
Color Azul, rojo, blanco, verde, negro, amarillo etc.
Estado Civil Soltero, casado, conviviente, viudo, divorciado.
Distrito Lima, La Victoria, Breña, Miraflores, San Isidro, Lince etc
Género Masculino, femenino
Calidad Buena, mala.
Morosidad No Moroso, moroso
Banco donde le depositan Interbank, Pichincha, Scotiabank
su sueldo:

VARIABLES ORDINALES. Son aquellas en donde existe un orden preestablecido entre las
categorías de la variable.

Ejemplos:

VARIABLE CATEGORÏAS
Grado de Instrucción Primaria, Secundaria, Superior
Orden de Mérito Primero, Segundo, Tercero etc.
Nivel Socioeconómico Bajo, Medio, Alto

También podemos considerar como variables ordinales por ejemplo el grado de satisfacción de un
servicio (1 = Muy insatisfecho; 2 = Insatisfecho; 3 = Ni satisfecho ni insatisfecho; 4 = Satisfecho; 5
= Muy satisfecho) o también el grado de depresión, etc.

b) VARIABLES CUANTITATIVAS
Son aquellas que se obtienen como resultado de mediciones o conteos; estas a su vez se clasifican
en:

VARIABLES DISCRETAS
Son aquellas cuyos valores resultan como consecuencia de conteos, y por lo tanto solo pueden
asumir valores enteros positivos, incluido el cero. Ejemplos
Número de empresas, número de hospitales, número de trabajadores, número de comprobantes de
pago, número de máquinas, número de conservas etc.

VARIABLES CONTINUAS
Son aquellas cuyos valores se obtienen por medición, pueden asumir valores decimales. Ejemplos:
El sueldo, el precio, la temperatura, el volumen, el tiempo, el peso, la estatura, la presión etc.

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

SEGÚN LA MEDICIÓN DE LA VARIABLE

a) ESCALA NOMINAL Se tiene una escala nominal si dos o más valores de una variable
sólo permiten percibir las diferencias o semejanzas de las unidades estadísticas que se midan tales
valores son como etiquetas que identifican a las unidades estadísticas y las hacen iguales o diferentes
entre sí. Ejemplo: Color de ojos, género, Especialidad de los estudiantes.

b) ESCALA ORDINAL Cuando los datos pueden acomodarse en algún orden, las diferencias entre los
datos carecen de significado: A es más alto que B, pero no se puede restar A menos B.
Ejemplo: Grado de Instrucción, grado de satisfacción de los clientes.

c) ESCALA DE INTERVALO La escala de intervalo es una escala para la cual el 0 no indica ausencia
de la propiedad que se estudia. Ejemplo: Temperatura.

d) ESCALA DE RAZON Se parece al nivel intervalo con la diferencia que el cero implica ausencia de
la propiedad que se estudia. Ejemplo: Peso, precio, número de hijos

SEGÚN EL ROL QUE TIENEN EN LA INVESTIGACIÓN

a) VARIABLE DEPENDIENTE

La variable dependiente es aquella determinada por el investigador para estudiarla en función de otras
variables denominadas independientes. Generalmente se simboliza esta variable con la letra Y.

b) VARIABLE INDEPENDIENTE

La variable independiente es aquella que es controlada en un experimento por el investigador.


Generalmente se simboliza esta variable con la letra X.
En la mayoría de los experimentos el investigador está interesado en determinar el efecto que tiene la
variable X, sobre la variable Y; para esto el investigador controla los niveles de la variable X y mide el
efecto sobre la otra variable.
Ejemplo:
- La variación en los precios de un determinado artículo, motiva cambios en las ventas. En este
ejemplo las variables son:
Precio = X Venta = Y

- El costo de producción de un artículo, determina su precio de venta. En este caso las variables son:
Costo de producción = X Precio de venta = Y

Podemos notar que el rol que asuma una determinada variable como dependiente o independiente en
una investigación, va a depender con qué variable se le asocie.

Ejemplo:

Para tener conocimiento de la riqueza de nuestra gastronomía se realizó una encuesta a los asistentes a
la feria gastronómica “Invita Perú” en el año 2022, para ello se tomó una muestra aleatoria de 4000
personas, obteniéndose lo siguiente:
a) El 57% cree que el pisco sour es nuestra bebida de bandera.
b) El 65% es la segunda vez que asiste a la feria.
c) El 40% son del género masculino.
d) El gasto promedio de los asistentes asciendo a 50 soles.

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Resolución:
De acuerdo con lo presentado identifique: la población, la muestra, las variables y los tipos de variables

Población Todos los asistentes a la feria gastronómica Invita Perú 2022


Muestra 4000 asistentes a la feria gastronómica Invita Perú 2022
Variable Clasificación Escala de medición
Bebida bandera Cualitativa Nominal
Número de veces que
Cuantitativa discreta Razón
asistió a la feria
Genero del asistente Cualitativa Nominal
Gasto de los asistentes Cuantitativa continua Razón

Ejemplo:
Determinar, en cada caso el tipo de variable, de acuerdo a su naturaleza:

a. Carreras que quieren seguir los alumnos de un centro educativo al terminar la educación
secundaria.
b. Horas que dedican a ver televisión los estudiantes de Primaria en Arequipa.
c. Número de televisores LCD vendidos durante el mes de diciembre del año pasado.
d. Número de pacientes atendidos por emergencia durante el mes pasado.
e. Tiempo utilizado en atender un cliente en la ventanilla de un banco.

Resolución:
a. Carreras que quieren seguir los alumnos de un centro Cualitativa -Nominal
educativo al terminar la Educación Secundaria
b. Horas que dedican a ver televisión los estudiantes de Primaria Cuantitativa continua-Razón
en Arequipa.

c. Número de televisores LCD vendidos durante el mes de Cuantitativa discreta- Razón


diciembre del año pasado.

d. Número de pacientes atendidos por emergencia durante el Cuantitativa discreta- Razón


mes pasado.

e. Tiempo utilizado en atender un cliente en la ventanilla de un Cuantitativa continua- Razón


banco.

10

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS PROPUESTOS

1. Determinar, en cada caso el tipo de variable, de acuerdo a su naturaleza:

a. Tiempo que demora un paciente para ser atendido en un centro médico.


b. Carreras que quieren seguir las alumnas y los alumnos de un centro educativo al terminar la
Educación Secundaria.
c. Intención de voto para las elecciones presidenciales.
d. Horas que dedican a ver televisión los estudiantes de Primaria en Arequipa.
e. Número de aparatos de radio que hay en los hogares de Ayacucho.
f. Grado de instrucción de los trabajadores de una Empresa.
g. Número de televisores LCD vendidos durante el mes de diciembre del año pasado.
h. Temperaturas registradas cada hora en un observatorio.
i. Número de pacientes atendidos por emergencia durante el mes pasado.
j. Tiempo utilizado en atender un cliente en la ventanilla de un banco.
k. Número de empleados que tiene una empresa minera.
l. Número de clientes que llegan entra las 11 a.m. y las 1 p.m. a un banco local.

2. Clasificar cada una de las afirmaciones siguientes ya sea como inferencias o métodos descriptivos.

a. El año pasado en la UCSUR el puntaje promedio del examen de admisión fue 85.
b. El Dr. García, un ecólogo, informó que, en cierto río del oriente peruano, la carne de los peces
contiene un promedio de 300 unidades de mercurio.
c. La compañía “RM” predijo quién sería el ganador en una elección presidencial después de
conocer los resultados de las votaciones de 25 mesas de sufragio de las 2 800 mesas que hubo
en total.

3. Analizar los siguientes casos que se le presentan y resolver:

a) La empresa IDEAL S.A. está realizando un estudio de mercado a


nivel del distrito de Trujillo. En especial está considerando las
familias residentes en las Urbanizaciones San Andrés, California y la
Merced. Su interés es saber cuánto gastan mensualmente en su
consumo mensual de leche de tarro color azul. Si Ud. fuera el
encargado de realizar esta investigación identifique:
Unidad de estudio:
Variable de estudio: Tipo:
Población:
Muestra:

b) El Gerente de Procter & Gamble quiere saber cuál es la marca de


detergente que más prefieren las amas de casa del distrito de Breña.
Para llevar a cabo esta investigación se selecciona una muestra de 608
amas de casa.

Unidad de estudio:
Variable de estudio: Tipo:
Población:
Muestra:

11

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

4. Indique el tipo de variable usando la clasificación según su medición:


a. Tiempo de servicio de los empleados de una empresa.
b. Número de cheques girados por una empresa diariamente en un mes.
c. Número de acciones vendidas cada día en la Bolsa de Valores de Lima.
d. Lugar de nacimiento de las personas que viven en el distrito de Independencia.
e. Nivel de educación de los Limeños.
f. Temperatura y humedad diaria de los Olivos.

5. Cuatro estudiantes de la Universidad A gastan mensualmente s/ 500, s/ 410, s/ 418, s/ 404.


Cuatro estudiantes de la Universidad B gastan mensualmente s/ 410, s/ 395, s/ 380, s/ 387
Se llega a las siguientes conclusiones.
a. El gasto promedio mensual de los cuatro estudiantes de la universidad A es de s/ 433 mientras que el
gasto promedio de los cuatro estudiantes de la universidad B es de 393 soles.
b. El gasto promedio mensual de todos los estudiantes de la Universidad A es mayor que el de todos los
estudiantes de la Universidad B
c. La diferencia entre los dos promedios es de 40
d. Si se selecciona a otro estudiante de la universidad A, probablemente gaste más que el gasto promedio
de los estudiantes de la Universidad B
¿Cuáles de las conclusiones provienen de la Estadística Descriptiva y cuáles de la Estadística
Inferencial?

6. Utilice los términos que aparecen en la siguiente tabla, para asociarlos a las definiciones que
aparecen a continuación:

Es una característica definida de la población que puede tomar


1 Muestra diferentes valores.
Variable
2 cualitativa ordinal Es un subconjunto de la población.
Variable
cuantitativa Medida descriptiva que resume información de una
3 continua característica de la población.
Número de alumnos por sección matriculados en el curso de
4 Variable metodología.
Grado académico de los docentes de la Facultad de
5 Parámetro Contabilidad.
Estadística Método que generaliza resultados para una población analizando
6 Inferencial una parte de ella.
Variable
cuantitativa
7 discreta Valor que resulta de resumir los datos de una muestra.

8 Estadístico Tiempo empleado para ensamblar una computadora.

12

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

7. En el mes de diciembre del 2021 del octavo ciclo de la carrera de Medicina estaba constituido por
984 estudiantes de la UCSUR, distribuido en 10 secciones, la edad promedio es de 23 años, el 43%
es de sexo masculino, se tomó una muestra representativa de 100 estudiantes determinándose que
el 89% trabajaban y pagaban sus pensiones de estudios, además estos tienen un sueldo promedio de
s/2000.

Determinar:
Población:
Muestra:
Unidad de análisis:
Variables:
Dato:

8. Se realizó un estudio para conocer los salarios en soles de los trabajadores de la empresa “Aron
S.A” dedicada a la elaboración de productos químicos y se tomó una muestra de 30 obreros en el
presente mes, se obtuvieron los siguientes datos:

1800, 1750, 1100, 2225, 1990, 1000, 1180, 1378, 1204, 1024, 1002, 1980, 1566, 1400, 1258

Determinar:
Población:
Muestra:
Unidad de análisis:
Variables:
Estadígrafo

9. Clasifique las variables de acuerdo a su naturaleza y de acuerdo a su escala de medición

VARIABLE TIPO DE VARIABLE


Número de hijos de los padres de familia de una
escuela rural.
Estado civil de los trabajadores de la empresa “Mi
País S.A.”
Talla de los alumnos del tercio superior de la carrera
de medicina.
Marcas de zapatos de una mujer.

10. Clasifique las variables de acuerdo a su naturaleza y de acuerdo a su escala de medición

VARIABLE TIPO DE VARIABLE


La marca de los celulares de tus amigos.
Red social preferida por los baby boomer
El color de ojos de los pacientes de la clínica San
Camilo.
Posición en la que llega un corredor en la prueba de
100 metros planos.

13

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

V
11. Clasifique las variables de acuerdo a su naturaleza y de acuerdo a su escala de medición

VARIABLE TIPO DE VARIABLE


Estatura de los habitantes de una ciudad.
El número de hijos en una familia.
Número de clientes atendidos en una tienda.
Tiempo en que se realiza una transacción económica.

12. Indicar el valor de verdad, Verdadero (V) o Falso (F), de cada proposición

La calificación de la satisfacción de servicio del restaurante “Mercedes” de Breña, es


una variable cualitativa ordinal.
El consumo de gasolina que se emplea al viajar a Ica es una variable cuantitativa
continúa.
Numero de falta ortográficas, es una variable cuantitativa.
Parámetro es un número que describe alguna característica de la población o medida
de resumen de una población.
75% de estudiantes proviene del distrito de SJL es una información proviene de una
variable cualitativa.

13. Lea atentamente e indique el valor de verdad de cada tipo de variable que se enuncia:

- Grado en la PNP, es una variable cualitativa ordinal ( )

- Valor de cambio del dólar, no es una variable cuantitativa continua ( )

- El estado civil, es una variable cualitativa discreta ( )

- Accidentes de tránsito en Lima, no es una variable cuantitativa continua ( )

- Partido político preferido, es una variable cualitativa nominal ( )

14

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

PRESENTACIÓN DE DATOS
En todo trabajo de investigación se requiere la recolección de datos para posteriormente realizar el
procesamiento del mismo. Estos datos pueden haber sido recogidos de fuentes primarias o secundarias.

Luego de la recolección de información se debe clasificar u organizar los datos para realizar el análisis
y la interpretación de los resultados. Para facilitar este procedimiento se deberá agrupar la información
en categorías o clases.

Una forma sencilla de agrupar los datos es construyendo tablas de distribución de frecuencias.

Presentación de tablas:
Todo gráfico debe presentar la siguiente
estructura:
1. Numeración
2. Título
3. Contenido
4. Fuente

Datos agrupados por frecuencias

Variable fi Fi hi Hi hi% Hi%

fi= frecuencia absoluta


Fi= frecuencia absoluta acumulada
hi= frecuencia relativa
Hi= frecuencia relativa acumulada
hi%= frecuencia relativa porcentual
Hi%= frecuencia relativa acumulada porcentual

Datos agrupados por clases o intervalos

Clases Xi fi Fi hi Hi hi% Hi%

15

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES CUALITATIVAS

Ejemplo:
El restaurante “Don Tito” busca evaluar el grado de satisfacción de sus clientes: donde B es Bueno, R
es Regular, D es Deficiente. Se tienen los resultados en el siguiente cuadro:

R R R R B B D D B R R
R R R D D R R B R R D
R R R R R R R R D D B

Después del conteo de los datos por categorías tenemos:

Tabla Nº1: Nivel de satisfacción de los clientes

Bueno (B): 1 Regular (R): 15 Deficiente (D): 7

Satisfacción del Cliente fi hi hi%


Deficiente 7 0.304 30.4%
Regular 15 0.652 65.2%
Bueno 1 0.044 4.4%
Total 23 1.00 100%

Nivel de satisfacción de los clientes


70% 65%

60%

50%

40%
30%
30%

20%

10% 4%
0%
Deficiente Regular Bueno

Interpretación: De los 23 comensales encuestados del restaurante “Don Tito” más de la mitad (65%)
manifestaron estar regularmente satisfechos con los servicios y otro porcentaje menor (4%) dijeron estar
bien satisfechos.

16

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES CUANTITATIVAS


a) Tabla de frecuencias para Datos No Agrupados. - Es apropiada para datos cuyos valores
distintos no son muy numerosos.

Ejemplo:

Los siguientes datos corresponden a las edades de 50 estudiantes:

20 22 21 19 18 18 20 22 20 19 20 19
23 19 18 20 21 22 19 20 18 23 20 21
19 22 23 20 21 19 22 18 19 20 21 24
21 20 21 20 24 23 20 21 19 20 22 21
21 22

a) Presentar dichos datos en una tabla de frecuencias


b) Interpretar f1, F4, h3% y H2%

Resolución:

En este caso notamos que la variable edad, apenas está tomando solamente siete valores distintos
que van desde 18 hasta 24.

Variable: La edad del estudiante


Frecuencias Absolutas: fi
Frecuencias Absolutas Acumuladas: Fi
Frecuencias Relativas: hi
Frecuencias Relativas Acumuladas: Hi

La siguiente tabla y el gráfico han sido obtenidos, usando el software MINITAB

Tabla Nº2: Distribución de los estudiantes según su edad

Edad fi Fi hi% Hi%

18 5 5 10% 10%
19 9 14 18% 28%
20 13 27 26% 54%
21 10 37 20% 74%
22 7 44 14% 88%
23 4 48 8% 96%
24 2 50 4% 100%
Total 50 100%

Interpretación: Se observa que el 26% de los estudiantes tienen 20 años de edad mientras que solo un
4% tienen 24 años. También podemos observar que el 54% de los estudiantes tiene una edad máxima
de 20 años.

17

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

f1=5
Interpretación: Hay 5 estudiantes de los 50 que tienen 18 años.

F4=37
Interpretación: Hay 37 estudiantes de los 50 que tienen como máximo 21 años.

h3%=26%
Interpretación: El 26% de los estudiantes tienen una edad de 20 años.

H2%=28%
Interpretación: El 28% de los estudiantes tienen como máximo 19 años

b) Tabla de frecuencias para datos agrupados. - Es apropiada cuando los valores distintos que
toma la variable son muy numerosos. Se siguen los siguientes pasos:
1) Calcular el rango de la variable: R = Valor máximo – Valor mínimo
2) Elegir el número de intervalos de clases: K se sugiere entre 5 y 10 inclusive
3) Calcular la amplitud de los intervalos de clases: C
C= R cuyo cociente en lo posible deberá ser exacto, caso contrario deberá
K trabajarse con los llamados “excesos”

Ejemplo 1:

Como control de la ética publicitaria, se requiere que el rendimiento en millas/galón, de gasolina esté
basado en un buen número de pruebas efectuadas en diversas condiciones. Al tomar una muestra de 50
automóviles se registraron las siguientes observaciones en millas por galón

35,6 27,9 29,3 31,8 22,5 34,2 32,7 26,5 26,4 31 31,6 28,0 33,7
32 28,5 27,5 29,8 34,2 31,2 28,7 30 28,7 33,2 30,5 27,9 31,2
29,5 28,7 23 30,1 30,5 31,3 24,9 26,8 29,9 28,7 30,4 31,3 32,7
30,3 33,5 30,5 30,6 35,1 28,6 30,1 30,3 29,6 31,4 32,4

Presente los datos en una tabla de frecuencias

Resolución:

Rango: R

R = 35,6 – 22,5 = 13,1

K = 1 + 3,32 log 50 = 6,64 K = 6 ó 7 u 8

Si k = 6 C = 13,1 =2,1833………… redondeando C=2,2


6

Exceso E = (6 x 2,2) – 13,1 = 13,2 – 13,1 = 0,1

Si k=7 C = 13,1 =1,8714………… redondeando C=1,9


7
Exceso E = (7 x 1,9) – 13,1 = 13,3 – 13,1 = 0,2

18

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Si k=8 C = 13,1 =1,6375 redondeando C=1,7


8

Exceso E = (8 x 1,7) – 13,1 = 13,6 – 13,1 = 0,5

Eligiendo K=6 por tener el menor exceso

Las frecuencias han sido obtenidas según el programa SPSS

Rendimiento Xi fi Fi hi Hi
(millas/galón)
22,5 - 24,7 23,6 2 2 0,04 0,04
24,7 - 26,9 25,8 4 6 0,08 0,12
26,9 - 29,1 28,0 10 16 0,20 0,32
29,1 - 31,3 30,2 20 36 0,40 0,72
31,3 - 33,5 32,4 9 45 0,18 0,90
33,5 - 35,7 34,6 5 50 0,10 1,00
T O T A L 50 1,00

Se observa que el 60% de los automóviles tienen un rendimiento entre aproximadamente 27 y 31,3
millas por galón de gasolina.

Ejemplo 2

Los siguientes son los puntajes logrados en un examen de cierta asignatura por 50 estudiantes:

61 50 65 70 45 60 80 65 60 65 64 54 65
67 48 64 56 60 61 62 62 57 75 53 58 59
56 54 67 68 60 63 56 53 61 62 69 70 44
47 65 56 57 58 55 51 43 79 72 48

Presentar los datos en una tabla de frecuencias

Resolución

R = 80 – 43 = 37

K = 1 + 3,32 log 50 = 6,64 K = 6 ó 7 u 8

Si k=6 C = 37 = 6,1666………… redondeando C=7


6

Exceso E = (6 x 7) – 37 = 42 - 37 = 5

Si k=7 C = 37 = 5,2857……….. redondeando C=6


7

Exceso E = (7 x 6) – 37 = 42 - 37 = 5
19

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Si k=8 C = 37 = 4,625 redondeando C=5


8

Exceso E = (8 x 5) – 37 = 40 - 37 = 3

Eligiendo K = 8 por tener el menor exceso

Puntaje Xi fi Fi hi Hi
42 – 46 44 3 3 0,06 0,06
47 – 51 49 5 8 0,1 0,16
52 – 56 54 9 17 0,18 0,34
57 – 61 59 12 29 0,24 0,58
62 – 66 64 11 40 0,22 0,8
67 – 71 69 6 46 0,12 0,92
72 – 76 74 2 48 0,04 0,96
77 – 81 79 2 50 0,04 1
Total 50 1

Poco menos de la mitad de los estudiantes (46%) han obtenido entre 57 y 66 puntos.

TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES CUALITATIVAS O


CATEGÓRICAS

Ejemplo 1.- Se realizó un estudio para determinar la cantidad de personas que obtienen un empleo. La
siguiente tabla incluye datos de 400 sujetos seleccionados al azar:

Fuentes de empleo Nº de sujetos Porcentaje


(fi) (hi%)
Anuncios clasificados 56 14%
Empresas de búsqueda de ejecutivos 44 11%
Contactos profesionales 280 70%
Correo masivo 20 5%
Total 400 100%

20

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Gráfico de Barras Simples (EXCEL)

Gráfico de Sectores Circulares (EXCEL)

Diagrama de Pareto (MINITAB)

Fuentes de Empleo
100 100

80 80
Porcentaje

Porcentaje

60 60

40 40

20 20

0 0
. . sq ivo
Fuentes de Empleo f
ro sif bú
sp c la as
cto s de m
a cio as r re
o
nt un es
Co A n pr Co
Em
Porcentaje 70 14 11 5
Porcentaje 70.0 14.0 11.0 5.0
% acumulado 70.0 84.0 95.0 100.0

21

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Ejemplo 2.- La siguiente información se refiere al número de estudiantes matriculados en tres


especialidades de Administración de Empresas, durante los años 2000 y 2005

Especialidad 2000 2005


Finanzas 160 250
Marketing 140 200
Contabilidad 100 150

Gráfico de barras dobles

Ejemplo 3

De una muestra de 20 pacientes de la clínica San Camilo del distrito de San Juan de Lurigancho según
sus gastos en hospitalización:
5000 4500 6000 4200 5500 6700 5000 6900 5500 5800
6500 8000 4800 3000 6500 7000 7500 7800 4900 6600

La información fue obtenida mediante una encuesta realizada se pide


• Construir una distribución de frecuencia.
• Interprete f2; F3; h4%; H4%
R = 8000 – 3000=5000
K = 1 + 3,32 log 20 = 5,32=5 (redondeo simple)

K=5 C = 5000 = 1000


5
Gastos xi fi Fi hi Hi hi% HI%
[3000 4000[ 3500 1 1 0,05 0,05 5% 5%
[4000 5000[ 4500 4 5 0,2 0,25 20% 25%
[5000 6000[ 5500 5 10 0,25 0,5 25% 50%
[6000 7000[ 6500 6 16 0,3 0,8 30% 80%
[7000 8000[ 7500 4 20 0,2 1 20% 100%
20 1 100%
f2: Hay 4 personas de un total de 20, que han gastado en hospitalización de 4000 soles a más, pero
menos de 5000 soles.

22

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

F3: Hay 10 personas de un total de 20, que han gastado en hospitalización de 3000 soles a más, pero
menos de 6000 soles.
h4%: El 30% del total de pacientes, que han gastado en hospitalización de 6000 soles a más, pero
menos de 7000 soles.
H4%: El 80% del total de los pacientes han gastado en hospitalización menos de 7000 soles.

EJERCICIOS PROPUESTOS

1.- Al contar el número de materias reprobadas por los alumnos de cierta Universidad, se han obtenido
los siguientes datos:

1, 1, 2, 3, 2, 6, 0, 0, 1, 0, 4, 5, 0, 0, 0, 3, 2, 1, 3, 1, 1, 1, 0, 1, 2, 0,
0, 5, 4, 2.

a) Construya una tabla de frecuencias.


b) A partir de la tabla de frecuencia complete la siguiente tabla:

FRECUENCIAS VALOR INTERPRETACIÓN


f2
F3
h1%

2.- En un colegio “X” se piensa en la posibilidad de cambiar el timbre por unos acordes de música rock.
Se ha preguntado a 20 alumnos cuál es su opinión acerca de estos acordes, según la escala: No me gusta
nada ( 1 ), Me gusta poco ( 2 ), Me es indiferente ( 3 ), Me gusta bastante ( 4 )
Me gusta muchísimo ( 5 ). Estos han opinado de la siguiente manera (codificada):

5, 4, 1, 2, 2, 4, 2, 5, 3 , 5, 3, 5, 1, 1, 3, 1, 2, 5, 3, 3

Construir la tabla de distribución de frecuencias adecuada para responder las siguientes preguntas:
a) ¿A qué porcentaje de alumnos les gusta poco estos acordes?
b) ¿A cuántos alumnos les gusta bastante los acordes?
c) ¿Cuál es la proporción de alumnos a los que les es indiferente los acordes?
d) ¿Cuál es la proporción de alumnos a los que les gusta poco o no les gusta nada los acordes?
e) ¿Cuál es la proporción de alumnos a los que a lo más les gusta bastante los acordes?

3.- El gerente de una tienda comercial está interesado en el número de veces que 52 clientes han ido a
comprar en su almacén durante un período de dos semanas. Los datos que se registraron fueron:

5 3 3 1 4 4 5 6 4 2 6 6 1
1 14 1 2 4 4 5 6 3 5 3 6 8
4 7 6 5 9 11 3 12 4 7 14 1 1
10 8 9 2 12 5 7 6 4 5 6 5 6

a) Organice los datos en un cuadro de distribución de frecuencias


b) Presente los datos en una gráfica apropiada.
c) A partir de la tabla de frecuencia complete la siguiente tabla:

23

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

FRECUENCIAS VALOR INTERPRETACIÓN


f2
F3
h1%

4.- Los siguientes datos proporcionan los ingresos anuales en miles de dólares de 50 personas:

7,9 10,3 45,7 9,5 43 56 38 6,7 48 30,5 25 40


30 25,5 50 17,1 25,5 43,5 31,6 59 41,5 13,5 12 9,2
42 41,9 35 11,7 55,3 27 58,4 57 29,6 38,5 26 16,5
18 24,9 20 28 28,5 36,4 39,5 5 9 5 6,9 7
12,0 8,3

a) Presentar dichos datos en una tabla de distribución de frecuencias, usando 6 intervalos de clase.
b) Estime la proporción de ingresos que están entre 12,500 dólares y 52,500 dólares.
c) Estimar la proporción de ingresos que están debajo de 50,000 dólares.

5.- Los siguientes datos son calificaciones en la prueba de Miller de personalidad de 82 estudiantes.
22 22 20 27 30 23 29 21 26 31 21 23 25
29 18 22 31 30 28 16 28 33 25 23 31 23
18 24 26 25 17 22 25 28 19 24 20 23 26
21 31 25 24 33 29 20 27 21 25 28 24 23
25 30 27 23 26 22 24 17 33 26 24 19 18
33 25 28 31 29 27 28 24 26 24 22 26 24
18 21 29 22

a) Organice los datos en un cuadro de distribución de frecuencias


b) Presente los datos en una gráfica apropiada.
c) A partir de la tabla de frecuencia complete la siguiente tabla:

FRECUENCIAS VALOR INTERPRETACIÓN


f2
F3
h2%

6.- Cierto investigador especialista en salud pública afirma que el nivel de plomo en sangre en niños en
edad escolar de una cierta región, se ha incrementado. Para verificar este supuesto se toma una muestra
de 120 niños en edad escolar, obteniendo los siguientes resultados:

27,88 28,42 45,81 6,55 6,4 6,14 3,73 26,88 31,93 14,85 26,88 38,35
34,26 38,97 7,22 5,24 15,4 3,73 31,93 28,34 10,79 26,88 6,32 33,09
28,24 4,67 6,07 9,77 5,35 28,34 33,43 14,85 28,84 3,27 4,88 47
6,56 49,24 6,82 35,49 33,43 27,38 11,33 5,44 9,28 4,36 35,6 9,17
34,26 28,84 26,53 7,92 27,96 6,28 38,62 6,55 4,4 10,79 33,09 28,42
27,38 34,47 5,91 33,1 12,04 34,26 4,24 7,22 45,16 5,91 34,94 5,04
27,6 28,42 33,09 13,38 37,47 38,41 4,67 36,23 33,09 6,67 36,71 33,83
5,04 34,98 6,56 36,56 8,85 29,33 4,88 34,26 34,99 4,82 17,96 7,92
4,68 25,21 4,68 35 9,17 25,17 4,82 28,84 34,13 6,28 4,88 8,7
51,24 5,84 34,72 33,83 35,09 28,42 30,83 4,79 5,44 7,17 29,29 32,29

a) Construya una tabla de frecuencias


b) Obtenga un histograma

24

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

c) A partir de la tabla de frecuencia complete la siguiente tabla:

FRECUENCIAS VALOR INTERPRETACIÓN


f2
F3
h3%

7.- En una compañía, el sueldo mínimo y máximo de 200 empleados


es de $ 150 y $300 respectivamente. Tales sueldos se tabulan en una
distribución de frecuencias de 5 intervalos de igual amplitud. Si se
sabe que 20 empleados ganan al menos $150 pero menos de $180; 60
ganan menos de $210; 110 ganan menos de $240; 180 ganan menos
de $270 y el 10% restante de los empleados gana a los más $300,
reconstruir la distribución.

8.- Los siguientes datos corresponde a una muestra de 20 clientes del Banco de Crédito de la ciudad de
Chimbote según sus inversiones mensuales en dólares en el programa Credifondo:
5500 4000 3000 3100 2000 3600 1000 3900 2500 3500
6000 4500 4800 3300 3400 3700 1500 3800 2900 3600

La información fue obtenida mediante una encuesta realizada por la empresa Aries S.A. en enero de
2004. Se pide
a) Identificar la unidad de análisis y la variable de estudio.
b) Construir una distribución de frecuencia. Utilice la regla de Sturges para determinar el número de
intervalos.
c)Interpretar f2, F2, h2%, H2%.
d)Determine qué porcentaje de clientes invierten mensualmente $4000 o más pero menos de $6000.
e) Determinar qué porcentaje de clientes invierten $3500 mensualmente.

9.- Una tienda comercial, ubicada en Lima Metropolitana, vende ropa de moda para damas y caballeros
además de una amplia gama de productos domésticos. A continuación, se presentan las ventas netas
observadas durante los años del 2002 al 2006. Represente gráficamente dicha información.
Año Ventas netas (millones de S/.)
2002 500
2003 519,2
2004 535,8
2005 560,9
2006 544,1

10.- Se ha hecho una encuesta para saber con qué regularidad se lee el periódico en Lima, y los resultados
fueron estos:

RESPUESTAS %
Todos los días 37,5
Una vez por semana 29
Una vez al mes 10,5
Alguna vez al año 12
Nunca
No contesta 0,4

a) ¿Qué tanto por ciento de personas respondieron “nunca”?


b) Si las personas que no contestaron fueron 6, ¿cuántas personas fueron encuestadas?
c) Las personas encuestadas, ¿son muestra o población?

25

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

11. La siguiente distribución muestra el peso en gramos. De 3000 paquetes de un determinado producto.

Peso en gr. [10-15[ [15-20[ [20-25[ [25-30[ [30-35]


hi k/2 0,17 2k k 0,13

a) ¿Cuántos paquetes tienen pesos menos de 20 gramos?


b) ¿Qué porcentaje de paquetes pesan 25 gramos o más?
c) ¿Cuántos paquetes pesan 15 gramos o más pero menos de 25 gramos?
d) ¿Cuántos paquetes pesan entre 15 gramos o más pero menos de 20 gramos?

12. Completar la siguiente tabla de frecuencias:

LI - LS fi Fi hi% Hi%
[ - 8,8[ 12,50%
[ - [ 5
[ - [ 25% 50%
[ - 12,4 [ 32
[ - [ 95,50%
[ - [
Total 40

13. Una empresa que se dedica a preparar dietas, proyecta lanzar al


lanzar el mercado una dieta rigurosa. Los empleados de una compañía
se representaron como voluntarios para dicha promoción. Se realizó
un muestreo con 80 empleados elegidos aleatoriamente.
Los resultados del chequeo de los pesos (en Kg), fueron los siguientes:

80,6 65,8 49,6 79,1 84,4 66,2 79,3 59,4 72,9 73,6
53,2 60,2 91,2 74,8 78,6 81,4 58,6 68,2 67,4 55,6
76,9 77,4 67,9 63,7 49,9 46,4 68,8 67,3 72,3 75,8
88,3 94,6 57,3 87,3 74,3 73,2 90,4 76,3 52,7 71,7
75,6 41,8 73,6 71,4 83,2 67,4 99,3 62,3 89,2 86,8
65,2 62,1 44,8 82,9 81,7 70,4 74,6 76,9 85,7 40,9
54,2 75,3 50,1 61,1 42,3 68,6 56,2 70,8 47,3 66,9
80,2 60,2 71,6 77,1 94,9 61,4 82,1 78,3 51,2 79,3

Se pide:
a) Elaborar una distribución de frecuencias
b) ¿Cuántos empleados tiene pesos entre 45 y 60 kg?
c) ¿Qué porcentaje de empleados tienen pesos mayores a 75 kg?
d)La empresa promotora obsequia uniformes de trabajo a los empleados voluntarios. Suponiendo que
los pesos de los empleados voluntarios es menor igual a 80 kg. ¿Cuántos uniformes deben ser
devueltos?

14. La fábrica de chocolates “Glamour S.A.” produce una gran gama de chocolates. Desea determinar
si realmente el tipo de Choconut es el que presenta el mayor porcentaje de defectuosos con la finalidad
de capacitar al personal en la elaboración de este producto. Para ello el gerente de control de calidad
les pregunta a los trabajadores su opinión acerca del tipo de chocolate que presenta el mayor número
de defectuosos. En la siguiente tabla se presentan las respuestas de los trabajadores:

26

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Tipo de chocolate Nº de trabajadores %


Choconut
De leche 16
De nueces 27,50%
De pasas 7
Total 80

a) Completar los datos que faltan en la tabla


b) Indique e interprete el valor f1
c) Indique e interprete el h2%

15. Los ingresos mensuales de una muestra de pequeños


comerciantes se tabularon en una distribución de frecuencias
simétrica de intervalos de igual amplitud resultando: Ingreso mínimo
$125, marca de clase del cuarto intervalo 𝑥4 =$300. Si el 8% de los
ingresos son menores que $165 y el 70% de los ingresos son menores
a $275, ¿qué porcentaje de ingresos son superiores a $285?

16. Los tiempos de vida útil (en días) de un tipo de batería, se tabulo
en una distribución de frecuencias de 5 intervalos de igual amplitud con frecuencias relativas
acumuladas: 0,10, 0,25, 0,55, 0,80, 1,00. Determine la distribución de frecuencias absolutas si la tercera
frecuencia absoluta es 12, si la segunda marca de clase es 6, y si el límite inferior del cuarto intervalo es
12.

17. Un grupo de personas valora la gestión del departamento de servicio al cliente de un supermercado
catalogándolo como: Excelente (E), Bueno (B), Regular (R) o Malo (M). Los resultados obtenidos son:

E B B R E M B E
B R R R M B B E
M E R R B B E R
R B B E R M E E
B E B B R M R E

a) Elabore una tabla de frecuencia que permita resumir los datos.


b) ¿Qué porcentaje de personas valoró la Gestión del Departamento como Buena?
c) ¿Cuántas personas valoraron la gestión como Excelente o Buena?
d) Interprete f3 y h3%.

18. Una compañía de 20 programadores desea obtener información de los gastos diarios que realizan en
mantenimiento de las computadoras Los datos obtenidos (nuevos soles) son:

Linf Lsup fi hi%


43 47 2
47 61 3
61 65 x
65 69 y 20%
69 73 5

Completa la tabla e interprete: F4 y H3%

27

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

19. La siguiente tabla muestra la distribución de frecuencias del número de horas dedicadas a la semana
enviando mensajes por WhatsApp en un teléfono celular por 60 vendedores de la tienda virtual
"Encantadora" la cual se dedica a la venta de productos de higiene y cuidado personal.

Interprete: h3% y F2

20. El gerente de una compañía registra el número de unidades vendidas de cierto producto completado
por 28 empleados que laboran en la institución en un día de trabajo.

Unidades
vendidas fi
[15 22[ 2
[22 29[ 3
[29 36[ 6
[36 43[ 4
[43 50[ 5
[50 57[ 8

Interprete: h3% y F2

28

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

MEDIDAS DE TENDENCIA CENTRAL, MEDIDAS DE


POSICIÓN,
MEDIDAS DE DISPERSIÓN, ASIMETRÍA Y CURTOSIS

29

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

MEDIDAS DE TENDENCIA CENTRAL

Media Aritmética ( X ): Es el promedio de los datos, y su objetivo principal es encontrar el valor que
debería estar al centro.

Datos No Agrupados: Se utiliza cuando hay datos sueltos y se halla la suma de dichos valores dividida
entre el número de datos, así como se expresa en la fórmula:
Media Aritmética: Datos no agrupados

∑𝑥 ∑ 𝑥𝑖
𝑋̅ = 𝑛 𝑖 (Muestral) µ= (Poblacional)
𝑁

Datos Agrupados: Se utiliza cuando agrupamos datos en una tabla de frecuencias por intervalos o sin
intervalos, se halla multiplicando la marca de clase por la frecuencia absoluta de cada categoría (cuando
se encuentran en intervalos de clase) y sin intervalos se multiplica el valor de la variable por la frecuencia
absoluta, después se debe sumar todos los resultados y dividirlos entre el número total de datos, así como
se expresa en la fórmula:
Media Aritmética: Datos Agrupados
∑ 𝑥𝑖 𝑓 𝑖 ∑ 𝑥𝑖 𝑓 𝑖
𝑋̄ = (Muestral) µ=
𝑁
(Poblacional)
𝑛

Ejemplo 1. Calcular la media aritmética de las notas obtenidas en un examen por una muestra de 8
estudiantes.

12 15 10 13 10 11 16 09

12 + 15+. . . . . . . . . . . . . . . +09 ∑8𝑖=1 𝑥𝑖 96


𝑋̄ = = = = 12
8 8 8

Interpretación: La nota promedio obtenida por los alumnos en dicho examen ha sido igual a 12

Ejemplo 2. Calcular la media aritmética del número de artículos defectuosos observado en 200 lotes.

Artículos Nº de lotes Total de productos


defectuosos defectuosos
Xi fi fi X i
0 12 0
1 33 33
2 42 84
3 59 177
4 32 128
5 16 80
6 06 36
Total 200 538
𝑛
∑ 𝑓𝑋 538
𝑋̄ = 𝑖=1 𝑖 𝑖 = = 2,69 𝑎𝑟𝑡í𝑐𝑢𝑙𝑜𝑠/𝑙𝑜𝑡𝑒
𝑛 200

El número promedio de artículos defectuosos es de 2,7 por lote.

30

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Ejemplo 3. Hallar el peso promedio de 144 conservas de pescado “La Caserita”, cuyos pesos se
encuentran presentados en la siguiente tabla de frecuencias.

Peso (gramos) xi Nº de conservas (fi) (xifi)


153 – 155 154 8 1232
155 – 157 156 17 2652
157 – 159 158 26 4108
159 – 161 160 40 6400
161 – 163 162 32 5184
163 – 165 164 16 2624
165 – 167 166 5 830
Total 144 23030

∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖 23030
𝑋̄ = = = 160 𝑔𝑟𝑎𝑚𝑜𝑠 𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑑𝑎𝑚𝑒𝑛𝑡𝑒
𝑛 144

Mediana (Me): Es la medida de tendencia central, que supera a no más del 50% de los datos y es
superado por el otro 50% restante.

• Datos No Agrupados:
Primero ordenamos los datos de menor a mayor
Mediana: Datos no agrupados
Si el número de datos es impar: Si el número de datos es par:
La mediana es el valor central. La mediana es la semisuma de los dos valores
centrales.

Ejemplo 1 Se tienen los gastos mensuales en consumo de 7 familias (en soles):


470 600 500 580 450 600 650

Ordenando los datos tenemos:


450 470 500 580 600 600 650

Por lo tanto, Me = 580 soles mensual

Interpretación: Esto significa que el 50% de estas familias tienen un gasto mensual máximo de 580
soles y el 50% restante tienen un gasto mensual superior a 580 soles.

Ejemplo 2. Si agregamos una familia más en el ejemplo anterior tenemos:


450 470 500 580 600 600 650 700
En este caso tenemos una Me = (580 + 600)/2 =590 soles

Interpretación: El 50% de los gastos mensuales de estas familias son como máximo 590 soles y el otro
50% son mayores a 590 soles.

Datos agrupados por frecuencias: La mediana se halla aplicando el mismo procedimiento que para
datos no agrupados.

31

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Ejemplo La siguiente información corresponde al precio de cierto artículo observado en 20 tiendas


comerciales
Precio (soles) 𝑓𝑖 𝐹𝑖
11 4 4
12 6 10
13 5 15
14 3 18
15 2 20
Total 20

Por tratarse de un número par de datos, la mediana será el valor central; es decir el promedio de los
términos centrales.

𝑥10 + 𝑥11 12 + 13
𝑀𝑒 = = = 12,5
2 2

Interpretación: El precio máximo de dicho artículo observado en el 50% de estas tiendas comerciales
ha sido de 12,5 soles y en el 50% restante de estas tiendas se observó un precio mayor a 12,5 soles.

Datos agrupados por intervalos. Se utiliza la siguiente fórmula:

𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 𝑐 [ 2 ]
𝑓𝑖

Ejemplo. La siguiente tabla nos muestra los sueldos en dólares de 68 trabajadores de una fábrica.
Calcular la mediana

Sueldos ( $ ) Nº de trabajadores Fi
500 – 700 13 13
700 – 1000 25 38
1000 – 1500 15 53
1500 – 2000 10 63
2000 – 3000 05 68
Total 68

Resolución
Primeramente, hallamos los Fi y como sabemos que n = 68 entonces se tiene que n/2 = 34; luego

34 − 13
𝑀𝑒 = 700 + 300 ( ) = 952
25

Interpretación: El 50 % de los trabajadores tiene un sueldo menor de 952 dólares y el otro


50 % perciben un sueldo mayor que 952 dólares.

Moda (Mo): Es el valor más frecuente de la variable, el que se observa mayor número de veces.

Datos No Agrupados o agrupados por frecuencias: Se ubica el dato que más se repite.

Ejemplo 1 Hallar la moda de los siguientes datos:

10 12 09 13 11 14 12 15 en este caso la moda es 12

32

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Ejemplo 2 Hallar la moda en la siguiente distribución

Nº de hijos Nº de familias
0 80
1 120
2 210
3 380
4 180
5 60
6 ó más 40
Total 1070

La moda en este caso es 3; esto significa que estas familias tienen generalmente tres hijos.

• Datos Agrupados con intervalos de clase:


En cuadros con intervalos de clase, se localiza la clase modal buscando la frecuencia más alta y después
se aplica la siguiente fórmula:
d1
Mo = Li + C [ ]
d1 + d2

Ejemplo La siguiente tabla nos muestra los sueldos en dólares de 68 trabajadores de una
fábrica. Calcular la mediana

Sueldos ( $ ) Nº de trabajadores
500 – 700 13
700 – 900 25
900 –1100 15
1100 –1300 10
1300 –1500 05
Total 68

12
𝑀𝑜 = 700 + ( ) 200 = 𝟖𝟎𝟗, 𝟎𝟗
12 + 10

Esto significa que el sueldo que comúnmente se ha registrado entre los trabajadores ha sido de 809.09
dólares.

Ejemplo. En una encuesta de consumidores de bebidas gaseosas se obtuvo los siguientes resultados:

Marcas de Nº de
gaseosa consumidores
Coca Cola 140
Inca Kola 160
Pepsi Cola 90
Sprite 100
Total 490

En este caso la moda es Inca Kola, ya que es la bebida gaseosa que ha tenido mayor preferencia entre
los consumidores.

33

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS DE MEDIDAS DE TENDENCIA CENTRAL

1.- Los salarios en una Empresa son en promedio S/ 380 semanales,


con posterioridad se incorpora a la Empresa un grupo de trabajadores
igual al 25 % de los que estaban anteriormente. El nuevo grupo ingresa
a la Empresa con un salario medio igual al 60 % de los antiguos. Dos
meses más tarde, la Empresa concede un aumento de salarios de S/ 50.
Hallar el salario promedio del total de trabajadores.
Resolución:
𝑛1 : 𝑁º 𝑑𝑒 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝑎𝑛𝑡𝑖𝑔𝑢𝑜𝑠 → 𝑥̄ 1 : 𝑆𝑎𝑙𝑎𝑟𝑖𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑎𝑛𝑡𝑖𝑔𝑢𝑜𝑠

𝑛2 : 𝑁º 𝑑𝑒 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝑛𝑢𝑒𝑣𝑜𝑠 → 𝑥̄ 2 : 𝑆𝑎𝑙𝑎𝑟𝑖𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑛𝑢𝑒𝑣𝑜𝑠

0,25𝑛1 = 𝑛2

𝑋̄𝑝 = 𝑆𝑎𝑙𝑎𝑟𝑖𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠

𝑆𝑎𝑏𝑒𝑚𝑜𝑠 𝑞𝑢𝑒 𝑥̄ 1 = 380𝑥̄ 2 = 0,6(380) = 228

𝑛1 (380) + 0,25𝑛1 (228)


𝑋̄𝑝 = = 349,6 → 349,6 + 50 = 399,6
1,25𝑛1

2.- En una Compañía que maneja cuatro productos; los márgenes de utilidad y las totales de ventas
observados durante el año pasado aparecen en la siguiente tabla.

Producto Margen de utilidad Venta total


A 4,2 % $ 30000
B 5,5 % $ 20000
C 7,4 % $ 5000
D 10,1 % $ 3000

Calcule el margen de utilidad promedio.

Resolución:
Considerando que las ventas totales no son las mismas para cada producto, utilizaremos un promedio
ponderado

0.042(30000) + 0.055(20000)+. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . +0.101(3000)


𝑋̄𝑝 = = 0,0523
30000 + 20000+. . . . . . . . . . . . . . . . . . . . . . . . +3000

Por lo que el margen de utilidad promedio será del 5,23 %

3.- Una fábrica tiene 3 máquinas. La máquina B produce la mitad de


lo que produce la máquina A y la producción de la máquina C es
inferior en un 20 % de lo que produce la máquina B. Los costos de
producción por unidad son: 3, 4 y 5 soles para las máquinas A, B y C
respectivamente. Se desea ganar el 20 % por unidad. Calcule el precio
medio de venta.

34

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Resolución:

Máquinas Costo por unidad(S/) Cantidad producida Precio de venta


A 3 2x 3,6
B 4 x 4,8
C 5 0,8x 6,0

𝟑, 𝟔(𝟐𝒙) + 𝟒, 𝟖𝒙 + 𝟔(𝟎, 𝟖𝒙)


𝑷𝑽̄ = = 𝟒, 𝟒𝟐 𝒔𝒐𝒍𝒆𝒔
𝟐𝒙 + 𝒙 + 𝟎, 𝟖𝒙

4.- El ingreso per cápita mensual de un país es $315. El sector público


que constituye un 55% de la población percibe 18% del ingreso total.
Calcule el ingreso medio por habitante del sector público y no
público.

Resolución: Consideremos:

𝑛1 𝑥̄ 1 + 𝑛2 𝑥̄ 2
𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑝𝑒𝑟 𝑐á𝑝𝑖𝑡𝑎: 𝑋̄𝑝 = = $315 → 𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑡𝑜𝑡𝑎𝑙 = 315𝑛
𝑛

𝑆𝑒𝑐𝑡𝑜𝑟 𝑃ú𝑏𝑙𝑖𝑐𝑜: 𝑛1 = 0,55𝑛 → 𝑆𝑒𝑐𝑡𝑜𝑟 𝑛𝑜 𝑃ú𝑏𝑙𝑖𝑐𝑜: 𝑛2 = 0,45𝑛

∑ 𝑥1
𝑥̄ 1 = → ∑ 𝑥1 = 𝑛1 𝑥̄ 1 𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑡𝑜𝑡𝑎𝑙𝑑𝑒𝑙𝑆𝑒𝑐𝑡𝑜𝑟𝑃ú𝑏𝑙𝑖𝑐𝑜 → ∑ 𝑥1 = 0,18(315𝑛) = 56,7𝑛
𝑛1
∑ 𝑥1 56,7𝑛
𝑙𝑢𝑒𝑔𝑜 𝑥̄ 1 = = = 103,09 𝑑ó𝑙𝑎𝑟𝑒𝑠 (𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑆𝑒𝑐𝑡𝑜𝑟 𝑃ú𝑏𝑙𝑖𝑐𝑜)
𝑛1 0,55𝑛

𝐴ℎ𝑜𝑟𝑎 ℎ𝑎𝑙𝑙𝑎𝑟𝑒𝑚𝑜𝑠 𝑒𝑙 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑆𝑒𝑐𝑡𝑜𝑟 𝑛𝑜 𝑃ú𝑏𝑙𝑖𝑐𝑜

𝑛1 𝑥̄ 1 + 𝑛2 𝑥̄ 2 56,7𝑛 + 0,45𝑛(𝑥̄ 2 )
315 = = → 315 − 56,7 = 0,45𝑥̄ 2 → 𝑥̄ 2 = 574 𝑑ó𝑙𝑎𝑟𝑒𝑠
𝑛 𝑛
5.- Un grupo de 200 estudiantes, cuya estatura media es de 60,96
pulgadas se divide en dos grupos, uno con estatura media de 63,4
pulgadas y otro con una estatura de 57,3 pulgadas. ¿Cuántos
estudiantes hay en cada grupo?

Resolución: Sea n1 = Nº de hombres y n2 = Nº de mujeres

Sabemos que 𝑛1 + 𝑛2 = 200 → 𝑛1 = 200 − 𝑛2

además 𝑿̄𝒑 = 𝟔𝟎, 𝟗𝟔𝑿̄𝟏 = 𝟔𝟑, 𝟒𝑿̄𝟐 = 𝟓𝟕, 𝟑

(𝟐𝟎𝟎 − 𝒏𝟐 )𝟔𝟑, 𝟒 + 𝟓𝟕, 𝟑𝒏𝟐


𝑙𝑢𝑒𝑔𝑜, 𝟔𝟎, 𝟗𝟔 = → 𝒏𝟐 = 𝟖𝟎𝒏𝟏 = 𝟏𝟐𝟎
𝟐𝟎𝟎

6.- Una estación de servicio automotriz gasta $500 en la compra de latas de aceite que cuestan $10 la
docena; $500 en latas que cuestan $12,5 la docena; otros $500 en latas que cuestan $20 la docena y $500
en otras que cuestan $25 la docena.
Determinar el costo promedio por docena de las latas de aceite.

Resolución:

35

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Hallaremos el costo promedio por docena

Monto Costo por docena Docenas compradas


500 10 50
500 12,5 40
500 20 25
500 25 20
Total = 2000 135

𝟐𝟎𝟎𝟎 𝒅ó𝒍𝒂𝒓𝒆𝒔
𝑿= = 𝟏𝟒, 𝟖 𝒅ó𝒍𝒂𝒓𝒆𝒔/𝒅𝒐𝒄𝒆𝒏𝒂
𝟏𝟑𝟓 𝒅𝒐𝒄𝒆𝒏𝒂𝒔

36

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS PROPUESTOS
1. La siguiente tabla de frecuencias absolutas representa el número de facturas erradas por cada uno de
las 15 distribuidoras de una empresa durante un año.

N° de errores 1 3 5 6 7 10
Frecuencia absoluta 2 2 6 7 10 5

a) Calcule el número promedio de facturas erradas por distribuidoras.


b) ¿Cuál ha sido el número de facturas erradas más frecuente?

2. Una zapatería ha vendido en una semana los pares de calzado que se reflejan en la tabla:

Talla de
37 38 39 40 41 42 43 44 45
calzado
N° de pares 9 16 21 20 25 25 28 30 45

a) Determine la talla promedio de dicha distribución de frecuencias e interprete su respuesta.


b) Determinar la moda e interprete.

3. La empresa Luz del Sur está llevando a cabo un estudio minucioso acerca de los salarios que perciben
los obreros de esta institución, con la finalidad de realizar mejoras económicas entre su personal. La
siguiente tabla muestra los salarios que perciben una muestra de 30 de estos obreros:

Cantidad de
Salarios S/.
obreros
900-1050 6
1050-1200 5
1200-1350 8
1350-1500 3
1500-1650 5
1650-1800 3
Total 30

a) Determinar el salario promedio e interpretar.


b) Determine el salario máximo del 50% de los obreros de la empresa Luz del Sur.
c) Determinar la moda e interpretar.

4. En una ciudad, se tomó una muestra aleatoria de 1059 personas y se les preguntó por su ingreso
mensual, en dólares, obteniéndose los siguientes resultados.

Distribución de personas según su ingreso mensual


Ingreso en dólares Marca de clase fi
300 – 700 80
700 – 1100 200
1100 – 1500 437
1500 – 1900 258
1900 – 2300 84
Total 1059

37

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

a. El ingreso promedio mensual de las 1058 personas.


b. La cantidad de ingreso en dólares del 50% de las personas entrevistadas.
c. La cantidad de ingreso en dólares modal de las personas entrevistadas.
d. Calcule el coeficiente de asimetría.

5. A continuación, se presentan los egresos económicos por día (en soles) de un grupo de familias para
cubrir su alimentación (desayuno, almuerzo, cena). Esta información ha originado el siguiente cuadro
de distribución de frecuencias:

EGRESOS fi
[60 – 63) 3
[63 – 66) 5
[66 – 69) 10
[69 – 72) 6
[72 – 75) 2
[75 – 78) 6
TOTAL 32

a) Calcular las medidas de tendencia central e interpreta los resultados.


b) Calcule el coeficiente de asimetría.

6. El área de recursos humanos del hospital realizó un análisis descriptivo sobre el tiempo de antigüedad
en meses que llevan los empleados en el hospital. Los resultados se muestran en el siguiente gráfico:

a) Calcular las medidas de tendencia central e interpreta los resultados.


b) Calcule el coeficiente de asimetría.

38

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

MEDIDAS DE POSICIÓN NO CENTRAL

Este tipo de medidas llamadas a veces medidas de posición no central, simplemente dividen a todo un
conjunto de datos en partes iguales. Los Cuantiles más comunes son los: Cuartiles, Deciles y Percentiles.

El Cuartil es el número que divide al conjunto de datos en 4 partes iguales, y se representa con la
letra Q. Entonces en un conjunto de datos existen tres cuartiles: Q1, Q2, y Q3, los que dividirán en
cuatro partes iguales a toda la muestra de datos.

La forma más sencilla de trabajar con cuartiles implica ordenar todos los datos (de menor a mayor), y
enseguida proceder a determinar:

Primer cuartil (Q1) que viene a ser el valor máximo del 25% inferior.

Segundo cuartil (Q2) que viene a ser el valor máximo del 50% de los datos previamente ordenados de
menor a mayor y es equivalente a la mediana

Tercer cuartil (Q3) que corresponde al valor máximo del 75% de los datos o también el valor mínimo
del 25% superior.

Cálculo de cuartiles para datos no agrupados

Cálculo del cuartil 1: Q1

Se ordenan los datos en forma ascendente


(𝑛+1)
Se localiza el punto de posición del valor correspondiente a la 4
observación ordenada, luego:

(𝑛+1)
Si 4
es un entero, entonces Q1 es igual a la observación correspondiente al punto de posición.

Ejemplo. Sean los datos:

12, 4, 18, 11, 7, 10, 21, 7, 5, 33, 9

Ordenando: 4 5 7 7 9 10 11 12 18 21 33

Como n = 11 entonces (n + 1)/4 = (11 + 1)/4 = 3 entonces Q1 = 7

(𝑛+1)
Si no es un entero entonces hacemos una interpolación lineal entre los dos valores
4
correspondiente a las dos observaciones entre las cuales se encuentra la fracción.

Ejemplo:

2210, 2255, 2350, 2380, 2380, 2390, 2420, 2440, 2450, 2550, 2630 2825

(𝑛+1) (12+1)
Como n = 12, entonces = = 3,25
4 4

Entonces Q1 = 2350 + 0.25(2380 – 2350) = 2357,5

En general para un número de “n” observaciones en el que los datos no están presentados en clases, una
vez ordenados los datos, la posición de los cuartiles se pueden localizar de la siguiente forma.

39

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

𝑘(𝑛+1)
k = 1,2,3
4

Cálculo de cuartiles para datos agrupados por frecuencias

El procedimiento a seguir es el mismo que se aplicó para datos no agrupados.

Ejemplo: En la siguiente tabla hallar la mediana.

N° de hijos fi Fi
0 5 5
1 8 13
2 11 24
3 9 33
4 5 38
5 2 40
Total 40
𝑥20 +𝑥21 2+2
Me = 2
= 2
=2 (es el promedio de los términos centrales)

Interpretación: El 50% de las familias tiene máximo de 2 hijos

Cálculo de cuartiles para datos agrupados por clases

Los cuartiles se calculan utilizando la siguiente fórmula:


𝑘𝑛
−𝐹𝑖−1
𝑄𝑘 = 𝐿𝑖 + 𝐶 [ 4 ] 𝑘 = 1, 2, 3
𝑓𝑖

Ejemplo Hallar el cuartil 1(sueldos en dólares de 68 trabajadores de una fábrica)

Sueldos ( $ ) Nº de trabajadores Fi
500 – 700 13 13
700 – 1000 25 38
1000 – 1500 15 53
1500 – 2000 10 63
2000 – 3000 05 68
Total 68

En este caso n/4 = 68/4 = 17 luego:

68
− 13
𝑄1 = 700 + 300 [ 4 ] = 748
25

Esto nos indica que el 25 % de los trabajadores ganan menos de 748 dólares y que el 75 % restante de
los trabajadores ganan más de 748 dólares.

El Decil es el número que divide al conjunto de datos en 10 partes iguales, y se representa con la
letra D. Entonces en un conjunto de datos existen nueve deciles: D1, D2,……,D9, los que dividirán en
diez partes iguales a toda la muestra de datos.

40

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

El Percentil es el número que divide al conjunto de datos en 100 partes iguales, y se representa con la
letra P. Entonces en un conjunto de datos existen noventa y nueve percentiles: P1, P2, P3,….,P99 los
que dividirán en cien partes iguales a toda la muestra de datos.

La forma más sencilla de trabajar con cuartiles implica ordenar todos los datos (de menor a mayor), y
enseguida proceder a determinar:

Primer percentil (P1) que corresponde al primer 1% del total de datos

Segundo percentil (P2) que corresponde al 2% del total de datos.

Percentil 50 (P50) que corresponde al 50% del total de datos y es equivalente a la mediana, cuartil 2 y
decil 5.

Percentil 99 (P99) que corresponde al 99% del total de datos

NOTA. - A través del cálculo de los percentiles podemos hallar también deciles y cuartiles.

Cálculo de percentiles para datos no agrupados

Para un número de “n” observaciones en el que los datos no son presentados en clases, una vez ordenados
los datos, la posición de los percentiles se pueden localizar de la siguiente forma.
𝑘(𝑛+1)
100
k = 1,2,3, … . ,99

Ejemplo. Los siguientes datos son los gastos realizados por la compra de medicamentos observado en
una muestra de 16 pacientes atendidos en una farmacia:

30 70 25 90 14 25 62 35 40 28 50 24
41 25 80 60

a) Calcule e interprete el Percentil 70 o D7


Primeramente, ordenamos los datos de menor a mayor

14 24 25 25 25 28 30 35 40 41 50 60 62
1 2 3 4 5 6 7 8 9 10 11 12 13

70 80 90
14 15 16

Luego hallamos el 0,7(n+1) = 0,7(16+1) = 11,9

Entonces P70 = 50 + 0,9(60 – 50) = 59

Interpretación: El 70% de los pacientes gastaron a lo mucho 59 soles en la compra de medicamentos.

b) Calcule e interprete el cuartil 3 o P75

Hallamos el 0,75(17) = 12,75

Luego Q3 = P75 = 60 + 0,75(62 – 60) = 61,5

El 75% de los gastos en la compra de medicamentos fueron menores a 61,5 soles.

41

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

c) Calcule el gasto mínimo del 20% de los mayores gastos.

El gasto mínimo del 20% superior de los gastos, estará dado por el percentil 80 o decil 8

Hallamos el 0,8(17) = 13,6


Luego D8 = P80 = 62 + 0,6(70 – 62) = 66,8

Cálculo de percentiles para datos agrupados por frecuencias

El procedimiento a seguir es el mismo que se aplicó para datos no agrupados.

Ejemplo: En la siguiente tabla hallar el percentil 50 y 90

N° de hijos fi Fi
0 5 5
1 8 13
2 11 24
3 9 33
4 5 38
5 2 40
Total 40

Percentil 50 = Mediana = D5

Hallamos el 0,5(41) = 20,5

Luego: P50 = 2 + 0,5(2 – 2) = 2

Percentil 90 = D9

Hallamos el 0,90(41) = 36,9

Luego P90 = 4 + 0,9(4 – 4) = 4

Cálculo de percentiles para datos agrupados por clases


𝑘𝑛
−𝐹𝑖−1
𝑃𝑘 = 𝐿𝑖 + 𝐴 [100 ] 𝑘 = 1,2,3, … 99
𝑓𝑃𝑖

Ejemplo. - Un laboratorio de análisis clínico proporciona la siguiente información sobre la distribución


de los contenidos de colesterol en la sangre de 80 personas adultas.

Colesterol (mg/100mL) Nº de personas Fi


45 – 90 04 4
90 – 135 06 10
135 – 180 11 21
180 – 225 16 37
225 – 270 21 58
270 – 315 10 68
315 – 360 08 76
360 – 405 04 80
Total 80

42

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

a) ¿Cuál es la cantidad mínima de colesterol del 25% de las personas de más alto dosaje?

Primeramente, hallamos el 0,75(80) = 60

60 − 58
𝑃75 = 270 + 45 [ ] = 279
10
Interpretación
La cantidad mínima de colesterol del 25% de las personas de más alto dosaje es 279 mg/100mL

b) Calcule el percentil 90 = D9

Hallaremos 0.90(80) = 72

72 − 68
𝑃90 = 315 + 45 [ ] = 337,5
8
Interpretación
La cantidad máxima de colesterol del 90% de las personas es de 337,5 mg/100mL y que el 10 %
restante de las personas tienen más de 337,5 mg/100mL.

43

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS PROPUESTOS
1. Suponga que Juan obtiene 86 en la calificación de un examen de inglés. Si esta puntuación
corresponde al percentil 90, entonces 90% de los estudiantes obtuvieron una puntuación menor que la
de Juan y 10% de los estudiantes obtuvieron una puntuación mayor.

2. Sobre las equivalencias que se presentan a continuación, indique cuales son VERDADERAS y
cuáles son FALSAS. Marque con un aspa la opción correcta.
AFIRMACIONES V F
Q1=P25
El segundo cuartil es la mediana
El noveno decil es igual al percentil 9
D7 = P70
El tercer cuartil equivale al percentil 75
El segundo cuartil es menor que el percentil 48
El séptimo decil es menor que el tercer cuartil
El 80% central de los datos se encuentra comprendido entre el decil 2 y el decil
6
El 90% central de los datos se encuentra comprendido entre el percentil 5 y el
percentil 95
Q3 = P3

3.Determine e interprete el percentil 65 en los sueldos mensuales de la tabla siguiente:

Egresado 1 2 3 4 5 6 7 8 9 10 11 12
Sueldo
Mensual 3450 3550 3650 3480 3355 3310 3490 3730 3540 3925 3520 3480
inicial

A partir de los datos encuentre los valores de los siguientes cuantiles:

CUANTIL VALOR INTERPRETACIÓN


P65
P50
D3

4. Los datos de la tabla muestran información sobre la variable X que representa el número de años de
consumo de estupefacientes en una muestra de pacientes del Hospital Nacional del Centro. Completar
los datos que faltan en la siguiente tabla estadística:

Xi fi hi Fi
1 4 0,08
2 4
3 0,16 16
4 7 0,14
5 5 28
6 38
7 7 45
8
Total

44

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

A partir de los datos encuentre los valores de los siguientes cuantiles:

CUANTIL VALOR INTERPRETACIÓN


D9
P20
Q3

5.Se realiza una estadística en la Institución Educativa “Fe y Alegría”, referente a la nota global de cada
uno de los estudiantes que van a acudir a los exámenes de selectividad. Las distribuciones de frecuencias
son las siguientes:

Nota global de
Frecuencias
cada alumno
5,5 10
6,5 15
7,5 20
8,5 30

a) Calcule la nota máxima del 30% de los alumnos menos aplicados


b) Calcule la nota mínima global del 10% de los alumnos más aplicados.
c) Calcule la nota máxima global del 20% de los alumnos menos aplicados

6. En la tabla siguiente se muestra la distancia recorrida por 65 automóviles en un día. Calcular el cuartil
1, el decil 6 de los datos agrupados

Distancia recorrida Frecuencia 𝒇𝒊 Frecuencia


Acumulada 𝑭𝒊
50-60 8 8
60-70 10 18
70-80 16 34
80-90 14 48
90-100 10 58
100-110 5 63
110-120 2 65

7. Millones de estadounidenses trabajan para sus empresas desde sus hogares. A continuación, se
presenta una muestra de datos que dan las edades de estas personas que trabajan desde sus hogares.

18 54 20 46 25 48 53 27 26 37
40 36 42 25 27 33 28 40 45 25

¿Calcule la edad máxima del 30% de las personas más jóvenes que trabajan desde sus hogares?

8.Se analizan los salarios en una de las áreas de una compañía y se obtiene información de 7 salarios
en nuevos soles: 850.000, 740.000, 1350.000, 5565.000, 750.000, 650,000, 680.000.
Calcular el salario mínimo del 30% de los salarios más altos.

9. En el Curso de estadística de un centro de formación bancaria se obtuvieron las notas de 14


estudiantes, las que se detallan a continuación: 12, 14, 15, 13, 16, 17, 19, 11, 13, 15, 16, 18, 13, 17
a) Calcule la nota mínima del 25% de las notas más altas en el curso de estadística.
b) Calcule la nota máxima del 25% de las notas más bajas en el curso de estadística.

45

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

10.Se analizó el impuesto que se aplica, en diversos países de Asia, a la compra de instrumentos
musicales. Los resultados obtenidos fueron los siguientes:

Impuesto Frecuencia Frecuencia


(dólares) Países (fi) Acumulada
(Fi)
50-54 7 7
54-58 10 17
58-62 16 33
22-66 20 53
66-70 18 71
70-74 11 82
74-78 8 90
Total 90

Calcule el percentil 30, el cuartil 2 e interprete.

11.La siguiente tabla, incompleta, muestra la distribución de los años de servicios del personal de una
empresa. La tabla tiene intervalos de igual amplitud.
Intervalos Punto medio fi Fi
3 8
20
50
90
24 - 110
120
Total 120

a) Complete la tabla de distribución de frecuencias.


b) Calcule el promedio y la mediana, ¿estaría usted en condiciones de afirmar que la distribución de
la variable es asimétrica positiva? Presente sus resultados.
c) Se ha decidido invitar al 30% de trabajadores (los más antiguos) al retiro voluntario con
incentivos. ¿Cuántos años de servicio como mínimo debe tener un trabajador para estar
comprendido en este grupo?

12. La siguiente distribución muestra las edades de los trabajadores de una empresa.

Edad N° de trabajadores
18 – 23 8
23 – 28 15
28 – 33 20
33 – 38 25
38 – 43 18
43 – 48 8
48 - 53 6

Por política de la empresa, la gerencia decide despedir al 20% de trabajadores más jóvenes y el 30%
de los trabajadores de mayor edad; después de esta reducción.
a) Encuentre los límites para ser despedido.
b) ¿Cuál es la edad mediana de los trabajadores de la empresa?

46

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

13. La distribución de las puntuaciones en una escala de hostilidad, de 160 sujetos de una muestra, ha
sido la siguiente:
Puntuación fi
0 - 10 10
10 – 20 22
20 – 30 32
30 – 40 44
40 – 50 28
50 – 60 20
60 – 70 4

a) ¿Entre que valores se encuentra el 50% central de los individuos?


b) Calcule el percentil 27.
c) ¿A partir de qué puntuación se encuentra el 12% de los sujetos más hostiles?
d) Si descontamos el 25% de los individuos menos hostiles y el 15% de los más hostiles ¿En qué
intervalo de puntuación se encuentran los restantes?

14. A continuación se presenta la distribución de 200 empresas cajamarquinas de acuerdo a su ganancia


neta en miles de dólares durante el primer trimestre del año 2011. Esta información ha originado el
siguiente cuadro de distribución de frecuencias:

Ganancia fi Hi%
0-4 20
4-8 50
8 - 12 80
12 - 16 35
16 - 20 15
Total

a) ¿Cuánto ganan como máximo el 15 % de las empresas con menores ganancias?


b) ¿Cuánto ganan como mínimo el 20 % de las empresas con mayores ganancias?

15. A continuación, se muestra las calificaciones de 120 estudiantes en un examen de inglés del
BRITÁNICO.
Calificación N° de estudiantes

30 - 40 3
40 – 50 3
50 – 60 10
60 – 70 22
70 – 80 43
80 – 90 32
90 – 100 7
Determinar:
a) La calificación más baja lograda por el 25% superior de la clase.
b) La calificación más alta lograda por el 10% inferior de la clase.

47

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

MEDIDAS DE DISPERSIÓN
Una medida de variabilidad es un número que nos indica el grado de dispersión en un conjunto de datos.
Si el valor es pequeño (respecto a un valor central) entonces hay una gran uniformidad entre los datos
(homogénea).
Por el contrario, un gran valor nos indica poca uniformidad (heterogénea). Cuando es cero quiere decir
que todos los datos son iguales.

Varianza: La varianza mide la mayor o menor representatividad de la media aritmética.


Poblacional (  )
2 2
Muestral ( S )

DATOS NO AGRUPADOS

∑(𝑥𝑖 − 𝜇)2
∑(𝑥𝑖 − 𝑥)2 𝜎2 =
𝑆2 = 𝑁
𝑛−1
DATOS AGRUPADOS

∑(𝑥𝑖 − 𝜇)2 . 𝑓𝑖
∑(𝑥𝑖 − 𝑥)2 . 𝑓𝑖 𝜎2 =
𝑆2 = 𝑁
𝑛−1

Desviación estándar:

Para eliminar el problema de la elevación al cuadrado de los datos en la varianza, se realiza una
transformación que consiste en calcular la raíz cuadrada de la varianza con lo que obtendríamos la
desviación estándar o típica.

DATOS NO AGRUPADOS

S=√S 2 σ=√𝜎 2
DATOS AGRUPADOS

S=√S 2 σ=√𝜎 2

Con lo que la desviación estándar o típica vendrá dada en las mismas unidades que los valores de la
variable.
La desviación estándar o típica siempre es positiva porque la varianza también lo es.
La desviación estándar o típica es la medida de dispersión óptima, más exacta, más estable y más
utilizada, sirviendo de base para las medidas de asimetría y correlación.

Ejemplo 1. Los siguientes datos son los pesos en onzas obtenidos a partir de una muestra de 7 frascos:

4 2 5 4 5 2 6

Calcule la desviación estándar muestral

Resolución

Aplicamos la fórmula:

48

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

𝑛 2
∑𝑛
𝑖=1(𝑋𝑖 − ̄ )2 ∑𝑛𝑖=1 𝑋𝑖2 − (∑𝑖=1 𝑋𝑖 ) ⁄𝑛
𝑋
𝑆2 = =
𝑛−1 𝑛−1

En donde  X2 = 42 + 22 + 52 + ………… ... .+62 = 126

 X = 4 + 2 + 5 + ……………….+ 6 = 28

(28)2
126−
2
𝑆 = 7−1
7
= 2,33 𝑜𝑧 2

Dado que las unidades obtenidas están elevadas al cuadrado, es necesario expresarlo en sus unidades
respectivas, por lo que sacaremos su raíz cuadrada.

En consecuencia: S =√2,33 𝑜𝑧 2 = 1,53 oz aproximadamente.

Interpretación. Los pesos en la muestra se dispersan en promedio aproximadamente en 1,53 onz


alrededor de la media; es decir, el peso promedio de los frascos es de 4 onzas con una desviación
media de 1,53 onzas.

Ejemplo 2. Se tiene la siguiente información:

Edad(Xi) fi fiXi fiXi2


18 3 54 972
19 5 95 1805
20 9 180 3600
21 6 126 2646
22 4 88 1936
23 1 23 529
Total 28 566 11488

Calcule la varianza muestral: S2

(∑ fixi)2
∑ fixi2 −
S2 = n
n−1
(566)2
11488 −
𝑆2 = 27
28
= 1,73 𝑎ñ𝑜𝑠 2

Por lo tanto, la desviación estándar muestral (S) será:

S = √1,73𝑎ñ𝑜𝑠 2 = 1,3153 años

Lo cual significa que la edad promedio de estas personas es de 20,2 años con una desviación media de
1,3 años.

49

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Ejemplo 3. Un laboratorio de análisis clínico proporciona la siguiente información sobre la distribución


de los contenidos de colesterol en la sangre de 80 personas adultas.

Colesterol Nº de
Xi Xifi Xi2fi
(mg/100mL) personas
45 – 90 4 67,5 270 18225
90 – 135 6 112,5 675 75937,5
135 – 180 11 157,5 1732,5 272868,75
180 – 225 16 202,5 3240 656100
225 – 270 21 247,5 5197,5 1286381,25
270 – 315 10 292,5 2925 855562,5
315 – 360 8 337,5 2700 911250
360 - 405 4 382,5 1530 585225
Total 80 18270 4661550

Calcule la desviación estándar muestral

(∑ fixi)2
∑ fixi2 −
S2 = n
n−1
(18270)2
4661550 −
2 80
S =
79

4661550−4172411.25
S2 = 79
= 6191,63 (mg/100ml)2

S = 78,7 mg/100ml

Propiedades de la Varianza:

1. La varianza será siempre un valor positivo o cero.

2. Var(𝑥) = 0, si x=constante. La varianza de una constante es cero (todos los datos son iguales)
3. Var(𝑎𝑥) = a 2 Var(𝑥), si se tiene la varianza de un conjunto de datos y a cada observación se multiplica
por una constante, entonces la nueva varianza de los datos se obtiene multiplicando a la varianza de los
datos por a 2 .

4. Var (𝑥 + 𝑏) = Var(𝑥). Si a todos los valores de la variable se les suma un mismo número, la varianza
no varía.
5. 𝑉𝑎𝑟(𝑎𝑥 + 𝑏) = a 2 𝑉𝑎𝑟(𝑥)
Si todos los valores de la variable se multiplican por un mismo número y luego se le suma otro número,
la varianza queda multiplicada por el cuadrado de la constante a.

6. Las unidades de medida de la varianza son las unidades de los datos al cuadrado.

Rango o amplitud: Es la medida de variabilidad más sencilla entre todas las mencionadas.
El rango de un conjunto de datos es la diferencia entre dato mayor y el dato menor:

𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛

50

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Donde:
Xmax: Valor máximo observado de la variable.
Xmín: Valor mínimo observado de la variable.

Coeficiente de Variación: Es una medida de dispersión relativa que se usa para comparar la variación
en diferentes conjuntos de datos que no vienen dadas en las mismas unidades o que las medias no son
iguales, el cual mide la magnitud de la desviación estándar en relación a la media aritmética, expresada
como porcentaje:
𝑆
𝐶𝑉 =
𝑥
Ejemplo 1. Supongamos que un grupo de niños de 7 años tenga una talla media de 45 pulgadas con
σ = 2,5 y un peso medio de 50 libras con σ = 6 libras. ¿En cuál de las dos características es más variable
este grupo?

Característica Promedio Desv. estándar C.V (%)


Talla 45 pulgadas 2,5 5,6
Peso 50 libras 6 12

Este grupo de niños es más variable en el peso.


Podemos concluir que los niños son aproximadamente dos veces más variable (12/5,6 = 2,1) en el
peso, que en la talla

Otros ejemplos:
1.- El coeficiente de variación de los ingresos mensuales de 100
empleados de una compañía es 0,6. Después de un aumento general
de S/. 90 mensuales para cada uno de los trabajadores de la compañía,
el coeficiente de variación es ahora de 0,55. Determinar la cantidad de
dinero que necesitará mensualmente la compañía para pagar los
sueldos después de hacer efectivos los aumentos.

Solución: Sea X: Sueldos antes del aumento

Antes Después

𝑆 𝑆
𝐶. 𝑉 = = 0,6 𝐶. 𝑉 = = 0,55
𝑋̅ 𝑋̅ + 90

Luego 𝑆 = 0,6𝑋̄ 𝑆 = 0,55(𝑋̄ + 90)

Igualando las desviaciones estándar S

0,6𝑋̄ = 0,55(𝑋̄ + 90)

0,6𝑋̄ = 0,55𝑋̄ + 49,5 → 0,05𝑋̄ = 49,5 → 𝑋̄ = 990 (Sueldo promedio anterior)

𝑋̄ + 90 = 1080 (Sueldo promedio actual)

Luego: Dinero total para pagar los sueldos será 100(1080) = 108,000 𝑠𝑜𝑙𝑒𝑠

51

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

2.- Una muestra de 70 datos da una media de 120 y una desviación


estándar de 6; otra muestra de 30 datos da una estándar de 5. Se reúnen
las dos muestras formando una sola muestra de 100 datos. Calcule el
coeficiente de variación de esta muestra de 100 datos.
Solución: Se tiene que:

𝑛1 = 70 𝑛2 = 30
𝑋̅1 = 120 𝑋̅2 = 125
𝑆1 = 6 𝑆2 = 5

𝑆
Hallaremos: 𝐶. 𝑉 = 𝑋̅

𝒏 𝑿 +𝒏 𝑿 ̄ ̄
𝟕𝟎(𝟏𝟐𝟎)+𝟑𝟎(𝟏𝟐𝟓)
en este caso 𝑿̄ = 𝟏 𝒏𝟏 +𝒏𝟐 𝟐 = 𝟕𝟎+𝟑𝟎
= 𝟏𝟐𝟏, 𝟓
𝟏 𝟐

(∑ 𝑿)𝟐⁄
2 ∑ 𝑿𝟐 − 𝒏
Sabemos que: 𝑆 = 𝒏−𝟏

(∑ 𝑿𝟏 +∑ 𝑿𝟐 )𝟐⁄
(∑ 𝑿𝟐𝟏 +∑ 𝑿𝟐𝟐 )− 𝒏
en este caso por tratarse de dos grupos 𝑺𝟐 =
𝒏−𝟏

(∑ 𝑋1 )2⁄ 2
∑ 𝑋12 − 𝑛1 ∑ 𝑋12 − (8400) ⁄70
𝑆12 = → 36 = → ∑ 𝑋12 = 1010484
𝑛1 − 1 69

(∑ 𝑋2 )2⁄ 2
∑ 𝑋22 − 𝑛2 ∑ 𝑋22 − (3750) ⁄30
𝑆22 = → 25 = → ∑ 𝑋22 = 469475
𝑛−2 29
(12150)2⁄
1479959− 100
Luego, 𝑆 2 = = 37,72 𝑢2 → 𝑆 = 6,14𝑢
99

6,14
Por lo tanto 𝐶. 𝑉 = 121,5 𝑥100% = 5,05%

52

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS PROPUESTOS

1. La cadena de gimnasios Millenium Fit Spa ha evaluado el pago por concepto de membresía (en
dólares), de sus clientes de tres tipos: Estándar, Ejecutiva y Premium, encontrando la siguiente
información para una muestra de 200 clientes de cada tipo de membresía

Membresía Membresía Membresí


Dato
Estándar Ejecutiva a Premiun
Valor promedio (dólares) 130 240 350
Valor mínimo 80 180 280
Valor máximo 280 300 400
Q1 150 210 320
10% de los clientes pagan un valor
100 195 300
de membresía menor o igual a
75% de los clientes tienen valor de
250 260 360
membresía menor o igual a
Varianza (dólares2) 1024 256 40000
El 90% de los clientes pagan un
265 290 385
valor de membresía menor o igual a

Señale la valides de las siguientes afirmaciones:

N° AFIRMACION VóF SUSTENTO


1 Los clientes del tipo de
membresía estándar muestran
una dispersión relativa alta.
2 El 50% central de los clientes
con membresía ejecutiva son
menos dispersos que el 50%
central de los clientes con
membresía Premium
3 Los clientes de la membresía
Premium son los más dispersos
de todo el grupo.
4
El rango intercuartílico de los
clientes de membresía ejecutiva
es 30
5
La desviación estándar de los
clientes con membresía Premium
es de 20.
6 El 25% de las membresías más
caras de los clientes estándar es
más disperso que el 25% de las
membresías más caras de los
clientes ejecutivos.

2.Recientemente, el ministro de Trabajo y Promoción del Empleo ha publicado información acerca de


los salarios que perciben los controladores de tráfico aéreo en el Perú. (salarios anuales en miles de
dólares) Los datos obtenidos de una muestra de 300 controladores a nivel nacional se muestran a
continuación:

53

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

a) Defina la variable en estudio, tipo y escala de medición.

b) Calcule e interprete: rango, desviación estándar y coeficiente de variación

c) El ministro ha señalado que, dado que el gobierno plantea el incremento del salario de los
controladores aéreos en 4000 dólares al año, esto permitirá que los salarios sean más
homogéneos. Señale como afectaría este incremento a las medidas de dispersión (tanto absolutas
como relativas) de la variable en estudio.

3. De las mediciones biométricas efectuadas con cierto número de estudiantes se han extraído los
siguientes datos:
Los varones de 17 años tienen un peso medio de 60,8 kg. con una desviación estándar de 6,69 kg.
Los varones de 10 años tienen un peso medio de 30,5 kg y una desviación estándar de 5,37 kg
A partir de los datos anteriores se puede afirmar que el peso es más variable a los 10 años que a los 17
años. Rpta. Efectivamente el peso es más variable a los 10 años.

4. Se tiene la siguiente información sobre una distribución de frecuencias de los pesos en kg de 50


elementos de un determinado material. La amplitud de los intervalos de clase es igual a 20:

[Li-1 - Li> xi fi Fi xifi


850
1710
27 2730
9
- 260 1500
50
Complete la tabla y calcule la varianza de los pesos.

54

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

5.Cierta fábrica tiene un departamento de producción y otro de ventas. Las tablas que se muestran a
continuación muestran los salarios percibidos hasta fines de mayo de este año (expresado en miles de
soles):

Dpto. producción Dpto. ventas


Nº de Nº de
Intervalos Intervalos
trabajadores trabajadores
1 – 1.5 12 6-8 4
1.5 – 2 28 8 – 10 6
2 – 2.5 32 10 – 12 12
2.5 – 3 24 12 – 14 15
3 – 3.5 12 14 – 16 3

a. Hallar la desviación típica correspondiente a cada departamento.

b. Determinar cuál de los departamentos presenta mayor dispersión relativa.

6. Dos países son igual de ricos, porque tienen la misma renta per cápita (o renta media), de 8000 dólares
al año. Pero en el país A la desviación típica es de 1000 dólares y en el país B es de 4000 dólares. ¿Qué
podemos decir sobre la distribución de la riqueza de ambos países gracias a este dato?

7. Determinar la varianza del conjunto de observaciones x1, x2, x3, x4, x5, a los cuales se les ha restado
4, obteniéndose el siguiente conjunto: 3, 0, 2, 4, 1.

8. La empresa Atención SAC, se preocupa por brindar un servicio adecuado a sus clientes y brinda
especial interés a los reclamos que presentan sus clientes, así como el tiempo que les toma atender dichos
reclamos. El servicio de atención a los clientes se brinda en dos turnos, mañana y tarde, por dos grupos
distintos de analistas. El jefe de calidad ha considerado importante analizar los resultados de la atención
en cada uno de estos turnos, a fin de determinar si existe variación, por lo que obtuvo información del
tiempo que demoró la atención a los clientes:

Turno Mañana
12 12 13 13 14 14 14 14 14 15
15 16 16 16 18 18 18 19 19 19
20 20 20 20 20 21 22 22 22 23
23 23 24 24 24 24 24 24 24 24

Turno Tarde
8 8 9 9 10 10 10 10 10 12
12 13 13 13 15 15 15 16 16 16
17 17 17 17 17 18 19 19 19 20
20 20 21 21 21 24 24 25 26 26

a) ¿En qué rango se encuentra el tiempo de atención a los clientes en cada turno?
b) Calcule la varianza en los turnos mañana y tarde.

9. Se seleccionó una muestra de 20 botellas de vidrio de un tipo particular y se determinó la resistencia


de cada botella a la presión interna. Considere la siguiente información parcial
sobre la muestra:
mediana=202,2 cuarto inferior= 196,0 cuarto superior =216,8
Las tres observaciones más pequeñas 125,8 188,1 193,7
Las tres observaciones más grandes 221,3 230,5 250,2

55

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

a. ¿Hay valores atípicos en la muestra? ¿Hay algún valor atípico extremo?


b. Construya una gráfica de caja que muestre los valores atípicos y comente sobre cualquier
característica interesante.

10. Se obtuvieron observaciones de resistencia al estallamiento (lb/ pulg2) mediante pruebas con
soldaduras de cierre de tobera, así como con soldaduras para tobera de envases de producción
Prueba 7200 6100 7300 7300 8000 7400 7300 7300 8000 6700 8300
Envase 5250 5625 5900 5900 5700 6050 5800 6000 5875 6100 5850 6600
Construya una gráfica de caja comparativa y comente sobre las características interesantes.

56

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

ASIMETRÍA Y CURTOSIS

ASIMETRÍA

Índice de Asimetría de Pearson

Si:
𝟑(𝐱̅ − 𝐌𝐞)
As < 0 Distribución Asimetría negativa 𝐀𝐬 =
As = 0 Distribución Simétrica
𝐬
As > 0 Distribución Asimetría positiva

b) Medida de Yule Bowley o Medida Cuartílica


𝐐𝟏 + 𝐐𝟑 − 𝟐𝐐𝟐
𝐀𝐬 =
𝐐𝟑 − 𝐐𝟏
La medida de Bowley varía entre -1 y 1
Si:
As < 0 Distribución Asimetría negativa
As = 0 Distribución Simétrica
As > 0 Distribución Asimetría positiva

c) Medida de Fisher
Datos sin agrupar:
∑(𝑥𝑖 − 𝑥̅ )2
𝐴𝑠 =
𝑛𝜎 2

57

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Cálculo en el SPSS:

CURTOSIS

K<0 Platicurtica
K = 0 Mesocurtica
K>0 Leptocurtica

Cálculo en SPSS

58

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS PROPUESTOS

1. La Dirección General de ESSALUD está interesada en estudiar los


casos de varicela en los niños. Para ello selecciona una muestra aleatoria
de niños que acaban de salir del proceso de la enfermedad (grupo I) del
distrito de Miraflores y otro grupo de niños (grupo II) del distrito de Breña.
Se registró la edad en que se presentó la mencionada enfermedad en ambos
grupos de niños. Los datos se muestran a continuación:

Grupo I 1 2 4 1 𝑥̅ 1 = 2 𝑆12 = 1,5


Grupo II 2 7 7 8 𝑥̅ 2 = 6 𝑆22 = 5,5

Calcule los índices de asimetría y curtosis para cada grupo de niños.

2.Los siguientes datos corresponden a la cantidad de goles


realizados por el Club Alianza Lima en el último torneo de fútbol

2 5 3 4 1 2 0 3 4 2

Determine el coeficiente de asimetría y curtosis. Realice la gráfica


respectiva.

3.Se evalúo a una sección de estudiantes que llevaron el curso de Estadística en el Ciclo Verano de una
universidad peruana. Determine la asimetría y curtosis que presentan los siguientes datos.
Notas fi
0–5 3
5 – 10 5
10 – 15 12
15 – 20 10
Total

4.Los siguientes datos corresponden al número de hijos de las


trabajadoras del sexo femenino del Centro de Salud “El Olivar”
Número de
Número de hijos
trabajadoras
0 13
1 20
2 25
3 20
4 11

Analiza la forma de la distribución calculando los coeficientes adecuados.

59

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

5. Se evaluó a un grupo de estudiantes de la carrera de Estomatología


para establecer la cantidad de piezas dentales que extraen por día.

2 1 3 3 4 5 7 2

Determine el tipo de distribución que presentan los datos.

6.Un grupo de jóvenes de la Facultad de Ingeniería han sido encuestados en relación a su estatura. Los
datos se han procesado mediante el IBM SPSS. Los resultados se muestran en la tabla adjunta. Calcule
los coeficientes de asimetría de Pearson e indique si la distribución de estaturas es simétrica o asimétrica.

ESTATURA DEL ENCUESTADO


Nº Validos 50
Perdidos 0
Media 1,633
Mediana 1,64
Moda 1,64
Desv. Tip. 0,627
Varianza 0,004

7.Una muestra de digitadoras de textos reveló que su rapidez media


de tecleo es de 87 palabras por minuto, con una mediana de 73
palabras. La desviación estándar es de 16,9 palabras por minuto.
¿Cuál es el coeficiente de asimetría? Interprete la respuesta, luego
conteste: ¿La mayoría de las secretarias son rápidas tecleando o son
lentas?

8. Dadas las siguientes mediciones de la emisión diaria (en toneladas) de óxido de azufre en una planta
industrial: Construya una distribución de frecuencias y luego calcule los coeficientes de asimetría y
curtosis:

8,3 15,8 16,2 18,5 22,7 23


11 13,4 17,3 19,1 22,7 23,9
11,2 15,1 17,9 19,6 22,3 24,6
12,2 15,8 18 20,1 21,9 26,4
12,3 13,4 18,4 20,5 21,3 26,8

60

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

PROBABILIDADES DISTRIBUCIONES: BINOMIAL,


POISSON, NORMAL, MUESTRAL

61

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

PROBABILIDADES
CONCEPTOS BÁSICOS:

Probabilidad: Es la medida numérica de la posibilidad de que un evento pueda ocurrir.


Su valor está entre 0 y 1.

Experimento aleatorio: Es un proceso cuyo resultado no puede ser predicho de anterioridad con
seguridad.
Ejemplo:
a) lanzamiento de una moneda
b) lanzamiento de un dado

Evento o suceso: Es cualquier subconjunto de un espacio muestral.

Ejemplo:
a) A = {obtener un número impar al lanzar un dado}
A = {1, 3, 5}

Espacio muestral: Es el conjunto de todos los posibles resultados asociados a un experimento. Su


símbolo es Ω.
Ejemplo:
a) Experimento: lanzamiento de un dado
Ω = {1, 2, 3, 4, 5, 6}

Notación de probabilidades:
P: denota una probabilidad.
A, B, y C. denotan eventos específicos.
P(A): denota la probabilidad de que ocurra el evento A.

Probabilidad de un evento
La probabilidad del evento A es el cociente entre el número de resultados favorable a la ocurrencia del
evento A y el número de resultados posibles.

Características
Sea un espacio muestral y sean A y B dos eventos cualesquiera de este:
• P(Ω) = 1 P(Փ ) = 0
• 0 ≤ P(A) ≤ 1
• Si A y B son eventos no disjuntos de Ω, se cumple que: P(A ∪ B) = P(A) + P(B) - P(A∩B)
• Si A y B son eventos disjuntos de Ω, se cumple que: P(A ∪ B) = P(A) + P(B)

62

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS DE PROBABILIDADES
1.- En una compañía hay 6 varones y 4 damas que aspiran a ser
miembros de un comité. Si se debe escoger dos al azar. ¿Cuál es la
probabilidad de que:
a) Los dos sean hombres
b) Sean un hombre y una mujer o dos mujeres.
Resolución:
a) Sea el evento A = {Los dos sean hombres}
6
( ) 1
𝑃(𝐴) = 2 =
10
( ) 3
2

b) Sean los eventos:

B = {Sean un hombre y una mujer} C = {Sean dos mujeres} luego hallaremos:

6 4 4
( ) ( ) + ( ) 24 + 6 2
𝑃(𝐵 ∪ 𝐶) = 𝑃(𝐵) + 𝑃(𝐶) → 𝑃(𝐵 ∪ 𝐶) = 1 1 2 = =
10 45 3
( )
2
2.- Un lote contiene 100 artículos de los cuales 20 son defectuosos.
Se inspecciona del siguiente modo. Se sacan 5 artículos del lote: si los
5 son buenos se acepta el lote; en otro caso se rechaza. ¿Cuál es la
probabilidad de rechazar el lote?

Resolución: Sea X: Nº de artículos defectuosos en la muestra de tamaño 5

P(Rechazar el lote) = P ( X = 1 ) + P ( X = 2 ) + P ( X = 3 ) + P ( X = 4 ) + P ( X = 5 )

P(Rechazar el lote)= 1 – P ( X = 0 ) = 1 – P ( Aceptar el lote )


(80)
5
en donde, 𝑃(𝐴𝑐𝑒𝑝𝑡𝑎𝑟) = = 0,32 → 𝑃(𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟) = 1 − 0,32 = 0,68
(100)
5

3.- Un recién graduado solicita empleo en la compañía A y en la B. Se


estima que la probabilidad de ser contratado por A es 0,7 y de ser
contratado por B es 0,5. En tanto que la probabilidad de que se rechace
por lo menos una de sus solicitudes es de 0,6. ¿Cuál es la probabilidad
de ser contratado al menos por una de las compañías?
Resolución Sean los eventos:
𝐴 = {𝐸𝑙 𝑟𝑒𝑐𝑖𝑒𝑛 𝑔𝑟𝑎𝑑𝑢𝑎𝑑𝑜 𝑠𝑒𝑎 𝑐𝑜𝑛𝑡𝑟𝑎𝑡𝑎𝑑𝑜 𝑝𝑜𝑟 𝑙𝑎 𝑐𝑜𝑚𝑝𝑎ñí𝑎 𝐴} → 𝑃(𝐴) = 0,7
𝐵 = {𝐸𝑙 𝑟𝑒𝑐𝑖𝑒𝑛 𝑔𝑟𝑎𝑑𝑢𝑎𝑑𝑜 𝑠𝑒𝑎 𝑐𝑜𝑛𝑡𝑟𝑎𝑡𝑎𝑑𝑜 𝑝𝑜𝑟 𝑙𝑎 𝑐𝑜𝑚𝑝𝑎ñí𝑎 𝐵} → 𝑃(𝐵) = 0,5
𝐴´ ∪ 𝐵´ = {𝑆𝑒𝑎 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑜 𝑑𝑒 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑐𝑜𝑚𝑝𝑎ñí𝑎𝑠} → 𝑃(𝐴´ ∪ 𝐵´) = 0,6

63

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Hallaremos 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝑆𝑒𝑎 𝑐𝑜𝑛𝑡𝑟𝑎𝑡𝑎𝑑𝑜 𝑒𝑛 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑐𝑜𝑚𝑝𝑎ñ𝑖𝑎𝑠)


𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
Por otro lado 𝑃(𝐴′ ∪ 𝐵′) = 𝑃(𝐴 ∩ 𝐵)′ = 1 − 𝑃(𝐴 ∩ 𝐵) = 0,6 → 𝑃(𝐴 ∩ 𝐵) = 0,4
Luego, 𝑃(𝐴 ∪ 𝐵) = 0,7 + 0,5 − 0,4 = 0,8

4.- Suponga que en un sorteo la probabilidad de ganar el primer premio


es 2/5 y la de ganar el segundo premio es 3/8. Si la probabilidad de
ganar al menos uno de los dos premios es 3/4. Calcular la probabilidad
de ganar:
a) Sólo uno de los dos premios
b) Ninguno de los dos premios
Resolución Sean los eventos:
2
a) 𝐴 = {𝐺𝑎𝑛𝑎𝑟 𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑝𝑟𝑒𝑚𝑖𝑜} → 𝑃(𝐴) = 5
3
𝐵 = {𝐺𝑎𝑛𝑎𝑟 𝑒𝑙 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 𝑝𝑟𝑒𝑚𝑖𝑜} → 𝑃(𝐵) =
8
𝐴 ∪ 𝐵 = {𝐺𝑎𝑛𝑎𝑟 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑜𝑠 𝑝𝑟𝑒𝑚𝑖𝑜𝑠} → 𝑃(𝐴 ∪ 𝐵) = 3/4
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
3/4 = 2/5 + 3/8 − 𝑃(𝐴 ∩ 𝐵) → 𝑃(𝐴 ∩ 𝐵) = 1/40

15 1 14
40 40 40

15+14 29
Luego 𝑃(𝐴𝐵′ ∪ 𝐵𝐴′ ) = 40
= 40 = 0,725

b) 𝑃(𝐴′ ∩ 𝐵′) = 𝑃(𝐴 ∪ 𝐵)′ = 1 − 𝑃(𝐴 ∪ 𝐵) = 1 − 3/4 = 1/4 = 0,25

5.- Un banco de sangre dispone de 10 unidades de sangre tipo A. De


ellas cuatro están contaminadas con suero de hepatitis. Se seleccionan
aleatoriamente 3 de estas unidades para utilizarlas con tres pacientes
diferentes.
a) ¿Cuál es la probabilidad de que los tres pacientes estén expuestos a
contraer hepatitis por esta razón?
b) ¿Qué al menos dos de ellos no estén expuestos a contraer hepatitis?
Resolución:
a) P (X = 3) en donde X: Nº de pacientes expuestos a contraer hepatitis

64

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

4
( ) 4
𝑃(𝑋 = 3) = 3 = = 0,033
10 120
( )
3
𝑏)𝑃(𝑋 ≥ 2) = 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) X: Nº de pacientes no expuestos a contraer

6 4 6
( )( ) 60 ( ) 20
𝑃(𝑋 = 2) = 2 1 = 𝑃(𝑋 = 3) = 3 =
10 120 10
( ) ( ) 120
3 3

60+20
Luego 𝑃(𝑋 ≥ 2) = 120
= 0,667

PROBABILIDAD CONDICIONAL
Se trata de dos eventos A y B definidos en un mismo espacio muestral, en donde uno de ellos
(evento B) ya ocurrió, es decir se conoce su resultado.

𝑷(𝑨 ∩ 𝑩)
𝑷(𝑨/𝑩) =
𝑷(𝑩)

Ejemplo 1.- Una cierta compañía compra insumos de tres proveedores


A, B y C.
Proveedor A abastece con 40% de los insumos, de los cuales el 8% son
defectuosos.
Proveedor B abastece con el 35% de los cuales el 9% son defectuosos.
Proveedor C abastece con el 25% de los cuales el 10% son defectuosos.
Si se elige un insumo al azar:
a) ¿Cuál es la probabilidad de que este sea defectuoso?
b) Si el insumo salió defectuoso. ¿Cuál es la probabilidad de que haya sido adquirido del proveedor A?
Resolución: Proveedor Calidad Total
Defectuoso No Defectuoso
A 0,032 0,368 0,40
B 0,0315 0,3185 0,35
C 0,025 0,225 0,25
Total 0,0885 0,9115 1,00

a) Según la tabla: P (Defectuoso) = 0,0885


𝑨 𝑷(𝑨∩𝑫) 𝟎,𝟎𝟑𝟐
b) 𝑷 ( ) = = = 𝟎, 𝟑𝟔
𝑫 𝑷(𝑫) 𝟎,𝟎𝟖𝟖𝟓

65

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

OTRO MÉTODO: DIAGRAMA DEL ÁRBOL


D
P(D/A) = 0,08

A P(D’/A) = 0,92
P(A) = 0,40
D’
P(B)=0,35 P(D/B) = 0,09
B D
P(D’/B) = 0,91
P(C) = 0,25
D’
C P(D/C) = 0,10
D
P(D’/C) = 0,9

D’

a) Ahora hallaremos la probabilidad de obtener un artículo defectuoso


P(D) = P(A)P(D/A) + P(B)P(D/B) + P(C)P(D/C)
P(D) = (0,40x0,08) + (0,35x0,09) + (0,25x0,10) = 0,0885

b) Ahora hallaremos la probabilidad que un artículo sea proveniente del proveedor A, sabiendo
que el artículo seleccionado salió defectuoso.
D
P(A ∩ D) P(A)P (A) 0,40x0,08
P(A/D) = = = = 0,36
P(D) P(D) 0,0885

Ejemplo 2.- Una cierta prueba médica tiene una efectividad de 99%
para descubrir la presencia o no de una enfermedad (resultado positivo
cuando realmente lo tiene o negativo cuando realmente no lo tiene).
Se aplica masivamente la prueba a una población en la cual hay 1%
de individuos con la enfermedad; se desea saber qué porcentaje de los
individuos con resultados positivos tendrán efectivamente la
enfermedad.
Resolución: Sean los eventos
𝑃 = {𝑅𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜 𝑠𝑒𝑎 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜}
𝐸 = {𝑃𝑒𝑟𝑠𝑜𝑛𝑎 𝑡𝑒𝑛𝑔𝑎 𝑙𝑎 𝑒𝑛𝑓𝑒𝑟𝑚𝑒𝑑𝑎𝑑} → 𝑃(𝐸) = 0,01

𝐸
Se pide hallar 𝑃 ( )
𝑃

𝑃 𝑃(𝐸∩𝑃)
Se sabe que: 𝑃 (𝐸 ) = 0,99 = 𝑃(𝐸)
→ 𝑃(𝐸 ∩ 𝑃) = 0,99𝑥0,01 = 0,0099

66

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

𝑃′ 𝑃(𝐸′ ∩ 𝑃′)
𝑃 ( ) = 0,99 = → 𝑃(𝐸′ ∩ 𝑃′) = 0,99𝑥0,99 = 0,9801
𝐸′ 𝑃(𝐸′)

Tiene la enfermedad: E No tiene la enfermedad: E’ Total


Resultado Positivo: P 0,0099 0,0099 0,0198
Resultado Negativo: P’ 0,0001 0,9801 0,9802
Total 0,01 0,99 1,000

𝑬 𝑷(𝑬∩𝑷) 𝟎,𝟎𝟎𝟗𝟗
Luego 𝑷 (𝑷) = = 𝟎,𝟎𝟏𝟗𝟖 = 𝟎, 𝟓
𝑷(𝑷)

MÉTODO DEL DIAGRAMA DEL ÁRBOL:

P
P ( P/E ) = 0,99

E P ( P’/E ) = 0,01
P ( E ) = 0,01
P’

P
P ( E’) = 0,99 P ( P/E’ ) = 0,01

E’
P ( P’/E’) = 0,99

P’

Ahora hallaremos la probabilidad que un resultado sea positivo, sabiendo que realmente tiene la
enfermedad.

P (E  P ) P (E ) P (P / E ) 0.01 x 0.99
P (E / P ) = = = = 0.50
P(P) P (P ) 0.0198

EVENTOS INDEPENDIENTES

67

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Dos eventos A y B son independientes si la ocurrencia de uno no afecta la ocurrencia del otro
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∩ 𝑃(𝐵)
Ejemplo 1.- La proporción general de artículos defectuosos en un
proceso continuo es 0.10. Cuál es la probabilidad de que elegidos dos
al azar:
a) Ninguno sea defectuoso
b) Cuando menos uno no tenga defectos

Resolución Sean los eventos:


𝐴 = {𝐸𝑙 𝑎𝑟𝑡í𝑐𝑢𝑙𝑜 𝐴 𝑡𝑒𝑛𝑔𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑜𝑠} → 𝑃(𝐴) = 0,10
𝐵 = {𝐸𝑙 𝑎𝑟𝑡í𝑐𝑢𝑙𝑜 𝐵 𝑡𝑒𝑛𝑔𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑜𝑠} → 𝑃(𝐵) = 0,10
𝐴′ = {𝐸𝑙 𝑎𝑟𝑡í𝑐𝑢𝑙𝑜 𝐴 𝑛𝑜 𝑡𝑒𝑛𝑔𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑜𝑠} → 𝑃(𝐴′) = 0,90
𝐵′ = {𝐸𝑙 𝑎𝑟𝑡í𝑐𝑢𝑙𝑜 𝐵 𝑛𝑜 𝑡𝑒𝑛𝑔𝑎 𝑑𝑒𝑓𝑒𝑐𝑡𝑜𝑠} → 𝑃(𝐵′) = 0,90
a) Hallaremos la probabilidad que ninguno sea defectuoso
𝑷(𝑨′ ∩ 𝑩′) = 𝑷(𝑨′)𝒙𝑷(𝑩′) Por ser eventos independientes
= 𝟎, 𝟗𝟎𝒙𝟎, 𝟗𝟎 = 𝟎, 𝟖𝟏
b) Ahora hallaremos la probabilidad de que cuando menos uno no tenga defectos
𝑃(𝐴′ ∪ 𝐵′) = 𝑃(𝐴 ∩ 𝐵)′ = 1 − 𝑃(𝐴 ∩ 𝐵)
= 1 − (0,10)𝑥(0,10) = 1 − 0,01 = 0,99
Otro método:
Esto implica que por lo menos uno de los dos artículos no tenga defectos
𝑃(𝐴′ ∪ 𝐵′) = 𝑃(𝐴′ ∩ 𝐵) + 𝑃(𝐴 ∩ 𝐵′) + 𝑃(𝐴′ ∩ 𝐵′)
𝑃(𝐴′ ∪ 𝐵′) = (0,09)(0,10) + (0,10𝑥0,90) + (0,90)(0,90) = 0,99

Ejemplo 2.- La probabilidad de que se alivie un resfriado con el


antibiótico A es de 0,7 y con el antibiótico B es de 0,8. Se tienen dos
pacientes resfriados, uno toma el antibiótico A y el otro el B. ¿Cuál
es la probabilidad de que:
a) Ambos se curen
b) Uno se cure y el otro no se cure
Resolución Sean los eventos:
𝐴 = {𝐸𝑙 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒 𝐴 𝑠𝑒 𝑐𝑢𝑟𝑒 𝑐𝑜𝑛 𝑒𝑙 𝑎𝑛𝑡𝑖𝑏𝑖ó𝑡𝑖𝑐𝑜 𝐴} → 𝑃(𝐴) = 0,70
𝐵 = {𝐸𝑙 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒 𝐵 𝑠𝑒 𝑐𝑢𝑟𝑒 𝑐𝑜𝑛 𝑒𝑙 𝑎𝑛𝑡𝑖𝑏𝑖ó𝑡𝑖𝑐𝑜 𝐵} → 𝑃(𝐵) = 0,80
𝐴′ = {𝐸𝑙 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒 𝐴 𝑛𝑜 𝑠𝑒 𝑐𝑢𝑟𝑒 𝑐𝑜𝑛 𝑒𝑙 𝑎𝑛𝑡𝑖𝑏𝑖ó𝑡𝑖𝑐𝑜 𝐴} → 𝑃(𝐴′) = 0,30
𝐵′ = {𝐸𝑙 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒 𝐵 𝑛𝑜 𝑠𝑒 𝑐𝑢𝑟𝑒 𝑐𝑜𝑛 𝑒𝑙 𝑎𝑛𝑡𝑖𝑏𝑖ó𝑡𝑖𝑐𝑜 𝐵} → 𝑃(𝐵′) = 0,20
a) Hallaremos la probabilidad de que ambos pacientes se curen
𝑷(𝑨 ∩ 𝑩) = 𝑷(𝑨)𝒙𝑷(𝑩) = 𝟎, 𝟕𝒙𝟎, 𝟖 = 𝟎, 𝟓𝟔
b) Ahora hallaremos la probabilidad de que uno se cure y el otro no se cure
𝑃(𝐴 ∩ 𝐵′) + 𝑃(𝐴′ ∩ 𝐵) = 𝑃(𝐴)𝑥𝑃(𝐵′) + 𝑃(𝐴′)𝑥𝑃(𝐵)
= (0,7𝑥0,2) + (0,3𝑥0,8) = 0,14 + 0,24 = 0,38

68

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS PROPUESTOS

1.- En un grupo de alumnos de la especialidad de contabilidad se ha


determinado de que el 40 % tienen dificultades en el curso de análisis
matemático (M), 20% tienen dificultades en el curso de estadística
aplicada (E) y el 5% tienen dificultades en ambos cursos (M y E). De
este grupo de alumnos de contabilidad seleccionamos uno al azar se
pide contestar las preguntas.
a) Calcular la probabilidad de que tenga dificultad en el curso de
análisis matemático o estadística aplicada.
b) Calcular la probabilidad de que el alumno tenga dificultad en el curso de estadística; dado que tiene
dificultad en el curso de análisis matemático.
c) Calcular la probabilidad de que el alumno de contabilidad no tenga dificultad en el curso de análisis
matemático ni en el curso de estadística aplicada.

2.- A continuación, se presenta una tabla en el cual se han


Hábito de Rendimiento en
clasificado a 100 alumnos según hábito de fumar y
fumar matemáticas Total
rendimiento en el curso de matemática:
Malo Bueno
De este grupo seleccionamos un estudiante al azar, se pide
contestar las preguntas:
a) Calcular la probabilidad de que tenga un rendimiento Si 25 5 30
malo en matemáticas; dado de que fuma cigarrillos.
b) Calcular la probabilidad de que no fume cigarrillos si No 15 55 70
se sabe que tiene un buen rendimiento en matemáticas. Total 40 60 100

3.- La UCSUR recientemente lanzó una campaña publicitaria para el


examen de admisión 2012, instalando cuatro anuncios panorámicos
en el panamericano norte. Se sabe por experiencia que la probabilidad
de que el primer anuncio sea visto por un conductor es de 0,75. La
probabilidad de que el segundo sea visto es de 0,82, la probabilidad
para el tercero es de 0,87 y la del cuarto es de 0,90. Suponiendo que
el evento de que un conductor vea uno cualquiera de los anuncios
publicitarios es independiente de si ha visto o no los demás. Cuál es
la probabilidad de que:
a) Los cuatro anuncios sean vistos por un conductor.
b) El primero y el cuarto sean vistos, sin que el segundo y el tercero sean notados.
c) Exactamente uno de los anuncios sea visto.
d) Ninguno de los anuncios sea visto.
e) El tercero y cuarto anuncios no sean vistos.

4.- Se estima que el 30% de los habitantes de EEUU son obesos y que el 3% sufre de diabetes. El 2%
son obesos y sufren de diabetes. Calcular la probabilidad de que una persona elegida al azar.
a) Sea obesa o sufra de diabetes. Rpta. 0,31
b) Sea obesa pero no sufra de diabetes. Rpta 0,28

5.- De todos los pacientes con cáncer, el 52% son mujeres. El 40% de todos los pacientes sobrevive al
menos 5 años desde el momento del diagnóstico. No obstante, esta tasa de sobrevivencia es válida
solamente para el 35% de las mujeres. ¿Cuál es la probabilidad de que un paciente con cáncer
seleccionado aleatoriamente sea mujer y sobreviva al menos 5 años? Rpta. 0,182

69

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

6.- Una empresa constructora del programa MI VIVIENDA descubrió


que sólo el 20% de todos los trabajos se terminaban a tiempo; mientras
que el 30% sufrían sobrecostos. Además, los sobrecostos se
presentaban el 75% de las veces en las que se terminaban el trabajo a
tiempo. El propietario de la empresa desea conocer la probabilidad de
que un trabajo:
a) Tenga sobrecostos y se termine a tiempo Rpta. 0,15
b) Tenga sobrecostos o se termine a tiempo. Rpta. 0,35
c) Se termine a tiempo, dado que no tiene sobrecostos. Rpta. 0,0714

7.- La distribución de los tipos de sangre en EEUU entre los individuos de raza blanca es
aproximadamente la siguiente: A: 40% B = 11% AB = 4% O = 45%
Tras un accidente automovilístico, un individuo de raza blanca es conducido a una clínica de
emergencia. Se le hace un análisis de sangre para establecer el grupo al que pertenece. ¿Cuál es la
probabilidad de que sea del tipo A o del B? Rpta. 0,51

8.- En un estudio sobre alcohólicos se informa que el 40% de los


mismos tiene padre alcohólico y que el 6% tiene madre alcohólica.
El 42% tiene al menos uno de los padres alcohólicos. ¿Cuál es la
probabilidad de que elegido uno al azar:
a) Tenga ambos padres alcohólicos. Rpta. 0,04
b) Tenga un padre alcohólico, pero no una madre alcohólica.
Rpta. 0,36
c) Tenga una madre alcohólica; si se sabe que el padre no lo es.
Rpta. 0,033

9.- De 1000 jóvenes de 18 años, 600 tienen empleo y 800 son bachilleres. De los 800 bachilleres, 500
tienen trabajo. ¿Cuál es la probabilidad de que un joven de 18 años tomado aleatoriamente sea:
a) Un bachiller empleado
b) Empleado pero no bachiller
c) Desempleado o un bachiller
d) Desempleado o no bachiller

10.- El Sr. Conti, propietario de un restaurante, ha mejorado la infraestructura para una buena
presentación. Observa que el 25% de todos los autos que pasan por allí, se detienen para consumir algún
alimento.
a) ¿Cuál es la probabilidad de que los próximos cuatro carros se detengan?
b) ¿Cuál es la probabilidad de que el primer auto pare, que el segundo y tercero no lo hagan y el cuarto
pare?

11.- LLusol compra tres acciones diferentes. La probabilidad de que


la primera aumente su valor es 1/3, la probabilidad de que la segunda
aumente es de 3/4 y la probabilidad de que la tercera aumente su valor
es de 1/10. Determine la probabilidad de que:
a) Todas aumenten de valor
b) Una aumente su valor

12.- Con base en su experiencia un médico ha recabado la siguiente información, relativa a las
enfermedades de sus pacientes: 5 % creen tener cáncer y lo tienen; 45 % creen tener cáncer y no lo
tienen; 10 % no creen tener, pero sí lo tienen; y finalmente 40 % creen no tenerlo, lo cual es cierto. De
entre los pacientes del doctor se seleccionó uno al azar
a) Cuál es la probabilidad que el paciente tenga cáncer? Rpta. 0,15
b) Cuál es la probabilidad de que el paciente tenga cáncer, si cree no tenerlo? Rpta. 0,2

70

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

13.- Se estima que el 15 % de la población adulta padece de


hipertensión, además se sabe que el 75% de todos los adultos creen
no tener este problema. Se estima también que el 6 % de la población
tiene hipertensión, pero no es consciente de padecer dicha
enfermedad.
a) Si un paciente adulto cree que no tener hipertensión. ¿Cuál es la
probabilidad de que la enfermedad, de hecho, exista? Rpta. 0,08
b) Si la enfermedad existe. ¿Cuál es la probabilidad de que el paciente
lo sospeche? Rpta. 0,60

14.- Sólo el 60% de los estudiantes de la clase de matemática del Profesor X pasaron la primera prueba.
De quienes pasaron el 80% estudiaron, el 20% de quienes no pasaron si estudiaron.
a) ¿Cuál es la probabilidad de que un estudiante pase o estudie?
b) ¿Cuál es la probabilidad de que un estudiante pase, pero no estudie?

15.- El 5% de las unidades producidas en una fábrica se encuentran defectuosas cuando el proceso de
fabricación se encuentra bajo control. Si el proceso se encuentra fuera de control, se produce un 30% de
unidades defectuosas. La probabilidad marginal de que el proceso se encuentre bajo control es de 0,92.
Si se escoge aleatoriamente una unidad y se encuentra que es defectuosa, ¿Cuál es la probabilidad de
que el proceso se encuentre bajo control?

16.- Una planta armadora recibe microcircuitos provenientes de tres


distintos fabricantes B1, B2 y B3. El 50% del total se compra a B1,
mientras que a B2 y B3 se les compra un 25% a cada uno.
El porcentaje de circuitos defectuosos para B1, B2 y B3 es 5, 10 y
12% respectivamente. Si un circuito está defectuoso, ¿cuál es la
probabilidad de que haya sido vendido por el proveedor B2?

17.- Se estima que la probabilidad de que una compañía B tenga éxito al comercializar un producto es
de 0,95 si su competidora la compañía A no interviene en el mercado; y es de 0,15 si la compañía A
interviene en el mercado. Si se estima que A intervendría en el mercado con probabilidad de 0,7
a) ¿Cuál es la probabilidad de que la compañía B tenga éxito? Rpta. 0,39
b) Si la compañía B no tuviera éxito ¿En cuánto se estima la probabilidad de que A intervenga en el
mercado? Rpta. 0,975

18.- Contratistas S.A. está negociando dos contratos. La Gerencia piensa que la probabilidad de ganar
el primer contrato es de 60% y que el ganador tendrá ventaja definitiva en la negociación del segundo
contrato. La Gerencia cree que si Contratistas S.A gana el primer contrato va a tener un 70% de
probabilidad de ganar el segundo contrato, en caso contrario disminuirá a 0,10.
a) ¿Cuál es la probabilidad de que Contratistas S.A. pierda ambos contratos? Rpta. 0,36
b) ¿Cuál es la probabilidad que gane el segundo contrato? Rpta. 0,46

19.- Una Compañía tiene 1000 repuestos para cierto ensamblado.


El 20% de las partes son defectuosas; además el 40% se compraron a
proveedores de fuera y el resto fue fabricado por la misma compañía.
De los comprados fuera de la compañía el 80% son buenos. Si se elige
un repuesto al azar entre esta existencia. ¿Cuál es la probabilidad de
que:
a) Sea fabricado por la Compañía y esté buena. Rpta. 0,48
b) Sea defectuosa o comprada. Rpta. 0,52
c) No sea fabricada por la Compañía ni sea buena. Rpta. 0,08
d) Sea comprada, siendo defectuosa. Rpta. 0,4

71

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

20.- En un cajón hay 80 artículos buenos y 20 malos; en un segundo


cajón el 30% son malos y en un tercer cajón el 25% son malos. Se sabe
que el número de artículos del tercer cajón es el triple de los que hay
en el segundo y que en total hay 260 artículos. Se mezclan los artículos
de las cajas.
a) Si se extrae al azar un artículo. Calcule la probabilidad de que sea
malo si se sabe que pertenece al 2𝑑𝑜 cajón. Rpta. 0,3
b) Si se extraen al azar dos artículos. Calcule la probabilidad de que el
primero y el segundo sean malos. Rpta. 0,056

21.- Se ha determinado que el porcentaje de televidentes que ven los programas A, B y C son
respectivamente 0,4. 0,5 y 0,3. Cada televidente ve los programas independientemente uno del otro. Si
se elige al azar a uno de tales televidentes. ¿Qué probabilidad hay de que vea:
a) Dos de los tres programas. Rpta. 0,29
b) Al menos uno de los tres programas. Rpta. 0,79

22.- En cierta región la probabilidad de que llueva en cualquier día del año es 0,1. Suponiendo la
independencia de un día con otro. ¿Cuál es la probabilidad de que la primera lluvia ocurra después de
14 días sin lluvia? Rpta. 0,023

23.-El gerente de INGENIEROS METAC S.A.C., es una organización


orientada a suministrar productos, servicios y desarrollo de soluciones
de ingeniería aplicada, considera que la probabilidad de que los
accidentes en Transmisiones & Ejes hayan sido ocasionados por las
conexiones eléctricas es 0,24, por falla mecánica es 0,18 y por
conexiones eléctricas o falla mecánica es 0,39. Si se selecciona al azar
un accidente producido en Transmisiones & Ejes y definiendo los
eventos de interés:
E = {Accidentes por conexiones eléctricas}, M = {Accidentes por falla mecánica}
P ( E ) = 0,24 y P ( M ) = 0,18 → P ( E  M ) = 0,39
a) Determine la probabilidad que se haya producido por ambos tipos de falla.
b) ¿Cuál es la probabilidad de que el accidente se haya producido por solo un tipo de falla?
24.-Después de una política de mejora de la calidad de la producción de Chemi-latex, tanto en el área
de llenado como el de sellado, los trabajadores fueron sensibilizados para realizar sus labores de
producción de la mejor manera y así disminuir los productos defectuosos en la producción. Para
corroborarlo se toma una muestra de 80 productos, encontrándose que 25 presentan defectos en el
llenado, 32 presentan defectos en el sellado y 30 no presentaban defectos. Si se selecciona un producto
al azar.
a) Determine la probabilidad de que se hayan producido ambos tipos de defectos.
b) ¿Cuál es la probabilidad de que se haya producido solo uno de los tipos de defectos?
c) ¿Los eventos defecto en el sellado y defecto en llenado son mutuamente excluyentes? Explique.
25.-Una caja contiene 24 resistencias con etiqueta negra y 24 con
etiqueta roja; de los de etiqueta negra cinco son de 5 ohmios y el resto
de 8 ohmios; mientras que los de etiqueta roja doce son de 5 ohmios
y el resto de 8 ohmios:
a) Si se selecciona una resistencia al azar de la caja, ¿cuál es la
probabilidad que la resistencia sea de 8 ohmios?
b) Si se seleccionan al azar dos resistencias de la caja, ¿cuál es la probabilidad que las dos sean de igual
color.

72

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

c)Si se seleccionan al azar tres resistencias de la caja, ¿cuál es la probabilidad que dos sean de 5 ohmios
y una de 8 ohmios?
26.- En un estudio de 420000 usuarios de teléfono celular de
Movistar, se encontró que 135 desarrollaron cáncer cerebral o del
sistema nervioso. Estime la probabilidad de que un usuario de
teléfono celular que se seleccionó al azar desarrolle un cáncer de este
tipo. ¿Qué sugiere el resultado acerca de los teléfonos celulares como
causantes de cáncer de este tipo?
27.- En la fabricación de un cierto tipo de clavos, aparecen un cierto nº de ellos defectuosos. Se han
estudiado 200 lotes de 500 clavos cada uno obteniendo:

Clavos defectuosos 1 2 3 4 5 6 7 8

Nº de lotes 5 15 38 42 49 32 17 2

Se selecciona al azar un lote, determine las siguientes probabilidades:


a) ¿Cuál es la probabilidad de se encuentre 7 clavos defectuosos?
b) ¿Cuál es la probabilidad de encontrar al menos 3 clavos defectuosos?
c) ¿Cuál es la probabilidad de encontrar a lo más 5 clavos defectuosos?
d) ¿Cuál es la probabilidad de encontrar menos de tres clavos y más de 7 clavos defectuosos?

28.-Un profesor de Estadística sabe que el 80% de sus estudiantes


terminan los problemas asignados como tarea. Determinó, además,
que de los estudiantes que cumplen con la tarea, el 90% aprobará el
curso. De aquellos estudiantes que no terminan su tarea, el 60%
aprobará. Si un alumno recibió una calificación aprobatoria, ¿Cuál es
la probabilidad de que sí haya hecho sus tareas?

29.- Suponga que la empresa TEC adquiere sus productos de tres proveedores: A, B y C. El proveedor
A suministra el 60% de sus productos, el proveedor B el 30% y el proveedor C el 10%. La calidad de
sus productos varía entre los proveedores, siendo las tasas defectuosas del proveedor A 0,25%, del
proveedor B 1% y del proveedor C 2%. Se selecciona un producto al azar:
a) ¿Cuál es la probabilidad de que el producto sea defectuoso?
b) Cuando se encuentre un producto defectuoso. ¿Cuál será el proveedor más probable?

30.- Los registros de los delitos en la Comisaría de Cusco muestran


que el 10% de ellos son violentos y el 90% son no violentos. Se señala
también que son denunciados, el 90% de los delitos violentos y solo
el 70% de los delitos no violentos.
a) ¿Cuál es la proporción global de delitos que se denuncian?
b) Si no se denuncia un delito ante la policía, ¿Cuál es la probabilidad
de que el delito sea no violento?

31.-La empresa “Sazón Romelia” distribuye sus productos a cuatro


mayoristas. El porcentaje de producción total que se obtiene en cada
mayorista es del 20%, 50%, 10% y 20% respectivamente, y además
el porcentaje de envasado incorrecto en cada mayorista es del 2%,
1%, 7% y 4%. Tomamos un producto de la empresa al azar en
almacén principal.

73

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

a)¿Cuál es la probabilidad de que se encuentre defectuosamente envasado?


b)¿Cuál es la probabilidad de que se encuentre bueno?

32. -En un laboratorio hay tres jaulas. En la jaula I hay 4 conejos negros y 2 blancos, la jaula II tiene 4
conejos negros y 4 blancos y la jaula III contiene 5 conejos negros y 6 blancos. Se selecciona al azar
una de las jaulas y se saca un conejo al azar de esa jaula. ¿Cuál es la probabilidad que el conejo escogido
sea blanco?

33.- El 70% del ganado es inyectado con una vacuna para combatir
una enfermedad grave. La probabilidad de recuperarse de la
enfermedad es 1 en 20 si no ha habido tratamiento y de 1 en 5 si hubo
tratamiento. Si un animal infectado se recupera, ¿Cuál es la
probabilidad de que haya recibido la vacuna preventiva?

34.-Una unidad de producción de enlatados de atún marca “Campomar” produce 9000 envases diarios.
La máquina A produce 3000 de estos envases, de los cuales 2% son defectuosos y la maquina B
produce el resto, se sabe que de la maquina B, el 4% son defectuosos. Calcular:
a) La probabilidad de que un envase elegido al azar este defectuoso.
b) La probabilidad de que proceda de la maquina B, si el envase tiene defectos.
c) La probabilidad de que proceda de la maquina A, si el envase tiene defectos.

35.- De 400 estudiantes de Ciencias de la Empresa, 100 cursan


Finanzas y 80 cursan Economía. Estas cifras incluyen 30 estudiantes
que cursan ambas materias.
a) ¿Cuál es la probabilidad de que un estudiante elegido
aleatoriamente curse Finanzas o Economía?
b) ¿Qué probabilidad hay de que al elegir un estudiante al azar curse
Economía, dado que cursa Finanzas?

74

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

DISTRIBUCIÓN DISCRETA

DISTRIBUCIÓN BINOMIAL

Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos los
siguientes requisitos:
1. El procedimiento tiene un número fijo de ensayos.

2. Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no afecta las
probabilidades de los demás ensayos).

3. Todos los resultados de cada ensayo deben estar clasificados en dos categorías (generalmente
llamadas éxito y fracaso).

4. La probabilidad de un éxito permanece igual en todos los ensayos.

𝒏
𝑷(𝑿 = 𝒙) = ( ) 𝒑𝒙 𝒒𝒏−𝒙 , 𝒙 = 𝟎, 𝟏, 𝟐, 𝟑, . . . . . . . . . . . . . . . . . , , 𝒏
𝒙

Donde: (𝑛) = 𝑥!(𝑛−𝑥)!


𝑛!
𝑥

n: es el número de veces que se repite el experimento o el tamaño de muestra


x: es el número de éxitos que se desea obtener en n
p: es la probabilidad de éxito
q: es la probabilidad de fracaso.

Ejemplo 1.- Un fabricante envía sus productos en lotes de 20


unidades a sus clientes. El fabricante sabe que la probabilidad de que
cualquier artículo esté defectuoso es de 0,05.
Calcular la probabilidad de que determinado lote:
a) No contenga artículos defectuosos
b) ¿Cuál es el número de artículos defectuosos que se espera
encontrar en un lote?
Resolución:

a) Hallaremos P (X = 0) en donde X: Nº de artículos defectuosos en un lote

𝟐𝟎
𝑷(𝑿 = 𝟎) = ( ) (𝟎, 𝟎𝟓)𝟎 (𝟎, 𝟗𝟓)𝟐𝟎 = 𝟎, 𝟑𝟔
𝟎

La probabilidad que no contenga artículos defectuosos es 36%

b) Ahora hallaremos el Nº promedio de artículos defectuosos por lote


𝐸(𝑋) = 𝑛𝑝
𝐸(𝑋) = 20(0,05) = 1
El número de artículos defectuosos por lote es 1.

75

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Ejemplo 2.- El 20% de todas las mujeres que reciben a un vendedor


de aspiradoras en sus hogares terminan por comprar una. ¿Cuál es la
probabilidad de que entre 6 mujeres que admiten la demostración del
vendedor en sus casas:
a) Exactamente dos compren una aspiradora.
b) Al menos una acabe por comprar la aspiradora.
c) A lo más una no compre una aspiradora.

Resolución:
a) Exactamente dos compren una aspiradora
luego hallaremos P(X=2) en donde X: Número de mujeres que compran aspiradoras.

𝟔
𝑷(𝑿 = 𝟐) = ( ) (𝟎, 𝟐)𝟐 (𝟎, 𝟖)𝟒 = 𝟎, 𝟐𝟒𝟓𝟕𝟔
𝟐

Interpretación: Aproximadamente el 25% de las veces que 6 mujeres admitan al vendedor hacer
demostraciones en sus casas; 2 de ellas terminarán comprando una aspiradora.

b) Al menos una acabe por comprar la aspiradora

𝑷(𝑿 ≥ 𝟏) = 𝑷(𝑿 = 𝟏) + 𝑷(𝑿 = 𝟐) + 𝑷(𝑿 = 𝟑) + 𝑷(𝑿 = 𝟒) + 𝑷(𝑿 = 𝟓) + 𝑷(𝑿 = 𝟔)


Luego 𝑷(𝑿 ≥ 𝟏) = 𝟏 − 𝑷(𝑿 = 𝟎) en donde X: N° de mujeres que compran
𝟔
𝑷(𝑿 = 𝟎) = ( ) (𝟎, 𝟐)𝟎 (𝟎, 𝟖)𝟔 = 𝟎, 𝟐𝟔𝟐𝟏𝟒
𝟎
Por lo tanto, 𝑷(𝑿 ≥ 𝟏) = 𝟏 − 𝟎, 𝟐𝟔𝟐𝟏𝟒 = 𝟎, 𝟕𝟑𝟖

Interpretación: El 74 % de las veces que 6 mujeres admitan al vendedor hacer demostraciones en sus
casas; al menos una de ellas acabará comprando una aspiradora.

c) Ahora hallaremos la probabilidad que a lo más una no compre

𝑷(𝑿 ≤ 𝟏) = 𝑷(𝑿 = 𝟎) + 𝑷(𝑿 = 𝟏) X: N° de amas de casa que no compran la aspiradora


𝟔
𝑷(𝑿 = 𝟎) = ( ) (𝟎, 𝟖)𝟎 (𝟎, 𝟐)𝟔 = 𝟎, 𝟎𝟎𝟎𝟎𝟔𝟒
𝟎
𝟔
𝑷(𝑿 = 𝟏) = ( ) (𝟎, 𝟖)𝟏 (𝟎, 𝟐)𝟓 = 𝟎, 𝟎𝟎𝟏𝟓𝟑𝟔
𝟏
Luego 𝑷(𝑿 ≤ 𝟏) = 𝟎, 𝟎𝟎𝟏𝟔

Ejemplo 3.- En una empresa donde los empleados son 80% hombres
y 20% mujeres; están aptos para jubilarse el 10% de las mujeres y el
15% de los hombres. De 5 solicitudes para jubilarse ¿Cuál es la
probabilidad de que al menos dos estén aptos para jubilarse?

Resolución:
Sea X: N° de empleados aptos para jubilarse

𝑷(𝑿 ≥ 𝟐) = 𝟏 − {𝑷(𝑿 = 𝟎) + 𝑷(𝑿 = 𝟏)}


𝟓
𝑷(𝑿 = 𝟎) = ( ) (𝒑)𝟎 (𝒒)𝟓 en donde p: probabilidad que una persona esté apta para jubilarse
𝟎
luego 𝒑 = 𝟎, 𝟏𝟓(𝟎, 𝟖) + 𝟎, 𝟏(𝟎, 𝟐) = 𝟎, 𝟏𝟒
𝟓
En consecuencia 𝑷(𝑿 = 𝟎) = ( ) (𝟎, 𝟏𝟒)𝟎 (𝟎, 𝟖𝟔)𝟓 = 𝟎, 𝟒𝟕𝟎𝟒
𝟎
𝟓
𝑷(𝑿 = 𝟏) = ( ) (𝟎, 𝟏𝟒)𝟏 (𝟎, 𝟖𝟔)𝟒 = 𝟎, 𝟑𝟖𝟐𝟗
𝟏

76

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Por lo tanto 𝑷(𝑿 ≥ 𝟐) = 𝟏 − 𝟎, 𝟖𝟓𝟑𝟑 = 𝟎, 𝟏𝟒𝟔𝟕

Interpretación: El 14,67% de las veces que 5 personas presentan sus solicitudes para jubilarse; por lo
menos dos de ellas estarán aptos para jubilarse.

Ejemplo 4.- El jefe de la sección de recaudación de cierto municipio


observa que, de todas las multas de aparcamiento que se ponen, se
pagan el 78%. La multa es de $2. En la semana más reciente, se han
puesto 620 multas.
a) Halle la media y la desviación estándar del número de multas que
se pagan.
b) Halle la cantidad de dinero que se obtiene por el pago de estas
multas; así como también su desviación estándar.

Resolución:

a) Sea X: Nº de multas impuestas

E ( X ) = n p = 620 ( 0,78) = 483,6

La media es aproximadamente 484 multas las cuales serán pagadas

V ( X ) = n p q = 620 x 0,78 x 0,22 = 106,392 luego σ = 10,315 multas

b) Recaudación por el pago de multas = 483,6 x 2 = 967,2 dólares

La desviación estándar será: 10,315 (2) = 20,63

Ejemplo 5.- La probabilidad de cura de una enfermedad normalmente


mortal con cierto medicamente, se estima en 0,30. Si cinco enfermos
se tratan con este medicamento. ¿Cuál es la probabilidad de que al
menos cuatro se curen?

Resolución:

a) Hallaremos P ( X ≥ 4 ) en donde X: Nº de pacientes que se curan

𝑛
𝑃[𝑋 = 𝑥] = ( ) 𝑝 𝑥 𝑞 𝑛−𝑥 𝑥 = 0,1,2,3, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 𝑛
𝑥

𝑃(𝑋 ≥ 4) = 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5)

5
𝑃(𝑋 = 4) = ( ) (0,3)4 (0,7)1 = 0,02835
4

5
𝑃(𝑋 = 5) = ( ) (0,3)5 (0,7)0 = 0,00243
5

Luego 𝑃(𝑋 ≥ 4) = 0,02835 + 0,00243 = 0,03078

Interpretación: Aproximadamente el 3,1% de las veces que cinco pacientes se traten con este
medicamento, al menos cuatro se curarán

77

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Ejemplo 6.- Se somete a un estudiante a un examen del tipo verdadero


– falso que contiene 10 preguntas; para que apruebe debe responder
correctamente a 8 preguntas o más. Si el estudiante está adivinando.
¿Cuál es la probabilidad de que apruebe el examen?

Resolución: Sea X: Nº de preguntas contestadas correctamente

𝑷(𝑿 ≥ 𝟖) = 𝑷(𝑿 = 𝟖) + 𝑷(𝑿 = 𝟗) + 𝑷(𝑿 = 𝟏𝟎)

𝟏𝟎
𝑷(𝑿 = 𝟖) = ( ) (𝟎, 𝟓)𝟖 (𝟎, 𝟓)𝟐 = 𝟎, 𝟎𝟒𝟑𝟗𝟒𝟓
𝟖

𝟏𝟎
𝑷(𝑿 = 𝟗) = ( ) (𝟎, 𝟓)𝟗 (𝟎, 𝟓)𝟏 = 𝟎, 𝟎𝟎𝟗𝟕𝟔𝟓
𝟗

𝟏𝟎
𝑷(𝑿 = 𝟏𝟎) = ( ) (𝟎, 𝟓)𝟏𝟎 (𝟎, 𝟓)𝟎 = 𝟎, 𝟎𝟎𝟎𝟗𝟕𝟔
𝟏𝟎

Por lo tanto, P (X ≥ 8) = 0,0547

Interpretación: Si se le planteara 10 preguntas del tipo verdadero-falso y esto se repitiera varias veces;
en el 5,5% de estas veces el responderá al menos ocho preguntas correctamente.

78

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

DISTRIBUCIÓN DE POISSON

Una distribución de probabilidad Poisson resulta de un procedimiento que cumple con todos los
siguientes requisitos:

1. El experimento consiste en contar el número “x” de veces que ocurre un evento en particular durante
una unidad de tiempo dada, o en un área o volumen dado.

2. La probabilidad de que un evento ocurra en una unidad dada de tiempo, área o volumen es la misma
para todas las unidades.

3. El número de eventos que ocurren en una unidad de tiempo, área o volumen es independiente del
número de los que ocurren en otras unidades.

4. El número medio (o esperado) de eventos en cada unidad se denota por la letra griega µ (“mu”)

Estudia a los eventos independientes que suceden con muy poca frecuencia y que ocurren en un
determinado espacio, volumen o tiempo.

𝑒 −𝜇 . 𝜇 𝑥
𝑃[𝑋 = 𝑥] =
𝑥!

X= 0, 1, 2, 3, 4 ……………….

Ejemplo 1.- El promedio de llamadas telefónicas en una hora es de 3.


¿Cuál es la probabilidad de recibir:
a) Exactamente 2 llamadas en una hora
b) Dos o más llamadas en 90 minutos
Resolución:

a) Hallaremos P (X = 2)
X: Nº de llamadas en una hora µ=3

Según la distribución de Poisson

𝑒 −𝜇 . 𝜇 𝑥
𝑃[𝑋 = 𝑥] =
𝑥!
𝑒 −3 32
Luego 𝑃(𝑋 = 2) = 2!
= 0,224

Respuesta: La probabilidad de recibir exactamente 2 llamadas en una hora es 22,4%.

b) Enseguida hallaremos la probabilidad de que ocurran dos o más llamadas en 90 minutos

X: Nº de llamadas en 90 minutos. µ = 4,5

𝑃(𝑋 ≥ 2) = 1 − {𝑃(𝑋 = 0) + 𝑃(𝑋 = 1)}


𝑒 −4,5 (4,5)0
𝑃(𝑋 = 0) = = 𝑒 −4,5
0!

79

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

𝑒 −4.5 (4,5)1
𝑃(𝑋 = 1) = = 4,5𝑒 −4,5
1!
Luego 𝑃(𝑋 ≥ 2) = 1 − 5.5𝑒 −4,5 = 1 − 0,0611 = 0,9389

Respuesta: La probabilidad de recibir dos o más llamadas en 90 minutos es 93,89%.

Ejemplo 2.- Una fábrica envía al depósito 500 artículos.


La probabilidad de deterioro de un artículo en el camino es de 0,002.
Hallar la probabilidad de que en el camino se deterioren:
a) Menos de tres artículos.
b) Por lo menos un artículo.

Resolución:
a) Este es un problema de tipo binomial, pero dado que np ≤ 1 puede ser resuelto también a través
de Poisson; con el cual hallaremos un resultado bastante aproximado

En este caso µ = np = 500(0,002) = 1

𝑃(𝑋 < 3) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)

𝑒 −1 10
𝑃(𝑋 = 0) = = 𝑒 −1
0!
𝑒 −1 11
𝑃(𝑋 = 1) = = 𝑒 −1
1!
𝑒 −1 12 𝑒 −1
𝑃(𝑋 = 2) = =
2! 2
Luego 𝑃(𝑋 < 3) = 2,5𝑒 −1 = 0,92

Respuesta: La probabilidad de que en el camino se deterioren menos de tres artículos es 92%.

b) 𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 = 0) = 1 − 𝑒 −1 = 1 − 0,36788 = 0,63212

Respuesta: La probabilidad de que en el camino se deterioren por lo menos un artículo es 63.21%.

Ejemplo 3.- Un líquido contiene cierta bacteria con un promedio de


3 bacterias por centímetro cúbico. Calcular la probabilidad de que:
a) No contenga bacteria alguna una muestra de 1/3 de cc.
b) Contenga por lo menos una bacteria una muestra de 2 cc.

Resolución:

a) Hallaremos P ( X = 0 ) X: Nº de bacterias en 1/3 de cc

Según la Distribución de Poisson

𝑒 −𝜇 . 𝜇 𝑥
𝑃[𝑋 = 𝑥] =
𝑥!
Donde:
µ= Promedio de bacterias en 1/3 de cc = 1

𝑒 −1 10
Luego 𝑃(𝑋 = 0) = = 𝑒 −1 = 0,368
0!

Respuesta: La probabilidad de que no contenga bacteria alguna una muestra de 1/3 de cc es 36,8%.

80

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

b) 𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 = 0)
X: N° de bacterias en una muestra de 2cc
µ: Número promedio de bacterias en 2 de cc µ= 6
𝑒 −6 60
𝑃(𝑋 = 0) = = 𝑒 −6
0!

Luego: 1 − 𝑒 −6 = 0,9975

Respuesta: La probabilidad de que contenga por lo menos una bacteria una muestra de 2 cc es 99.75%.

Ejemplo 4.- Una vacuna produce inmunidad contra la polio en un


99,99%. Suponiendo que la vacuna ha sido administrada a 10000
niños.
a) ¿Cuál es el número esperado de niños que no han sido inmunizados?
b) ¿Cuál es la probabilidad que menos de 2 niños no sean inmunes?

Resolución:

a) Dado que np ≤ 1 usaremos la aproximación de la Binomial a la de Poisson en donde


µ = np

En este caso µ = np = 10000 (0,0001) = 1 niño

Interpretación: El número promedio de niños que no queden inmunizados contra la polio en un grupo
de 10, 000 niños vacunados es 1.

b) P(X < 2) = P(X = 0) + P(X = 1)

𝑒 −1 10
𝑃(𝑋 = 0) = = 𝑒 −1
0!
𝑒 −1 11
𝑃(𝑋 = 1) = = 𝑒 −1
1!
Luego: 𝑃(𝑋 < 2) = 2𝑒 −1 = 0,7358

Interpretación: Si se aplicara esta vacuna a 10000 niños varias veces, en el 73,58% de estas veces
menos de dos niños no quedarán inmunizados.

81

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

DISTRIBUCIÓN CONTINUA
DISTRIBUCIÓN NORMAL

Es una distribución de probabilidad que se diferencia de las anteriores por ser de variable aleatoria
continua. Es una de las más importantes ya que la mayoría de los trabajos de investigación están basados
en muestras aleatorias provenientes de poblaciones que se distribuyen normalmente.

Características de la Distribución Normal

•Tiene forma de campana y posee una sola cima en el centro de la distribución. La media aritmética,
la mediana y la moda son iguales, y se localizan en el centro de la distribución.

•El área total bajo la curva es de 1. La mitad del


área bajo la curva normal se localiza a la derecha
de este punto central, y la otra mitad, a la izquierda.

•Es simétrica respecto de la media. Si hace un corte


vertical, por el valor central, a la curva normal,
las dos mitades son imágenes similares.

•Desciende suavemente en ambas direcciones del


valor central. Es decir, la distribución es asintótica.
La curva se aproxima más y más al eje X, sin
tocarlo. En otras palabras, las colas de la curva se
extienden indefinidamente en ambas direcciones.

•La localización de una distribución normal se determina a través de la media. La dispersión o


propagación de la distribución se determina por medio de la desviación estándar

Esperanza y Varianza de una Distribución Normal

Esperanza de una Distribución Normal E(x) = µ

Varianza de una Distribución Normal Var(x) =  2

Para calcular probabilidades asociadas a partir de


la función de densidad se requiere de
matemáticas avanzadas; por lo que el cálculo de
estas, se hará en base a una tabla conocida como
Tabla de la Distribución Normal Estándar.

Estandarización
Si la variable aleatoria X tiene una distribución X∼N(µ, 𝜎) , entonces la variable aleatoria

𝑥−𝜇
𝑧=
𝜎
Tiene distribución normal estándar.

Distribución Normal Estándar: Una variable aleatoria X tiene una distribución normal estándar, si
sus parámetros son µ = 0 y 𝜎 2 = 1.

82

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Ejemplo1.- Una máquina expendedora de refrescos se regula de


manera que descargue un promedio de 196 g por vaso. La cantidad
descargada tiene aproximadamente distribución normal con una
desviación estándar de 14 gramos.
a) ¿Cuál es la probabilidad de obtener un vaso con más de 218,4
gramos?

Resolución:
Consideremos a X: Cantidad descargada por la máquina vendedora de refrescos, la cual se distribuye
normalmente con µ = 196 gr y σ = 14 g
Hallaremos:

𝑃(𝑋 > 218.4)

Estandarizando la variable continua

𝑋−𝜇 218,4 − 196


𝑍= → 𝑍= = 1,6
𝜎 14

𝑃(𝑍 > 1.6) = 0,0548

Interpretación: El 5,48% de los vasos tendrán una cantidad mayor de 218,4 gramos.

b) Si los vasos pueden contener solo 224 gramos sin que haya derrame. ¿En cuántos vasos de 200
vendidos es probable que el líquido se derrame?

Resolución:
𝟐𝟐𝟒 − 𝟏𝟗𝟔
𝑷(𝑿 > 𝟐𝟐𝟒) → 𝒁 = = 𝟐 𝒍𝒖𝒆𝒈𝒐 𝑷(𝒁 > 𝟐) = 𝟎, 𝟎𝟐𝟐𝟖
𝟏𝟒

𝑬(𝒙) = 𝒏𝒑 = 𝟐𝟎𝟎(𝟎, 𝟎𝟐𝟐𝟖) = 𝟒, 𝟓𝟔

Por lo tanto, el número de vasos que se derramarán aproximadamente será 5.

Ejemplo 2.- La puntuación media en un examen final de una


asignatura fue de 72 y la varianza 81. El 10% superior de los alumnos
reciben calificación A. ¿Cuál es la puntuación mínima que un
estudiante debe tener para recibir una calificación A?

Resolución:

𝑿−𝝁 𝑿 − 𝟕𝟐
𝒁= → 𝟏, 𝟐𝟖 = → 𝑿 = 𝟖𝟑, 𝟓
𝝈 𝟗

Respuesta: La puntuación mínima que un estudiante debe tener para recibir una calificación A es
83,5.

83

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Ejemplo 3.- Una variable aleatoria tiene una distribución normal con σ = 21.5. Hallar su media si la
probabilidad de que la variable aleatoria tome un valor menor que 120,5 es de 0,8849

Resolución:
Se sabe que 𝑷(𝑿 < 𝟏𝟐𝟎, 𝟓) = 𝟎, 𝟖𝟖𝟒𝟗

𝑿−𝝁 𝟏𝟐𝟎, 𝟓 − 𝝁
𝒁= → 𝟏, 𝟐 = → 𝝁 = 𝟗𝟒, 𝟕
𝝈 𝟐𝟏, 𝟓

Respuesta: La media tendrá que ser 94,7 para que la variable aleatoria tome un valor menor que 120,5
con una probabilidad de 0,8849.

Ejemplo 4.- Suponga que las puntuaciones obtenidas en un examen


de un curso tienen distribución normal con µ = 80. Si el 95% de los
examinados obtienen puntajes entre 60,4 y 99,6

a) Calcule el valor de la desviación estándar

𝑿−𝝁 𝟗𝟗, 𝟔 − 𝟖𝟎
𝒁= → 𝟏, 𝟗𝟔 = → 𝝈 = 𝟏𝟎
𝝈 𝝈

Respuesta: El valor de la desviación estándar será 10

b) ¿Qué porcentaje de los examinados obtuvieron entre 55 y 98 puntos

Calculando:

55 − 80 98 − 80
𝑍1 = = −2,5 𝑍2 = = 1,8
10 10

𝑷(−𝟐. 𝟓 < 𝒁 < 𝟏, 𝟖) = 𝟎, 𝟒𝟗𝟑𝟖 + 𝟎, 𝟒𝟔𝟒𝟏 = 𝟎, 𝟗𝟓𝟕𝟗 → 𝟗𝟓, 𝟕𝟗%


Respuesta: El porcentaje de alumnos examinados que obtuvieron un puntaje entre 55 y 98 es 95,8%.

84

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Ejemplo 5.- Los puntajes del coeficiente de inteligencia tomados a


un grupo de personas adultas, en un proceso de selección de personal
están distribuidos normalmente con una media de 105 y una
desviación estándar de 12.
a) Si el puntaje mínimo para aprobar es 90. ¿Cuál es el porcentaje de
no aprobados?
b) Si han aprobado el 80% de las personas. ¿Cuál es el puntaje
mínimo aprobatorio?

Resolución:
a) Consideremos a X: Puntaje del coeficiente de inteligencia, la cual se distribuye normalmente
con µ = 105 y σ = 12

Hallaremos
𝑃(𝑋 < 90) estandarizando el valor de X mediante la fórmula

𝑋−𝜇 90 − 105
𝑍= →𝑍= = −1,25
𝜎 12

𝑃(𝑍 < −1,25) = 0,1056, 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 10,56%

Respuesta: El porcentaje de no aprobados es 10,56%.

b) Ahora hallaremos el puntaje mínimo aprobatorio

80%

𝑿−𝟏𝟎𝟓
−𝟎, 𝟖𝟒 = 𝟏𝟐
→ 𝑿 = 𝟗𝟒, 𝟗𝟐 aproximadamente 95 puntos

Respuesta: El puntaje mínimo aprobatorio es aproximadamente 95 puntos.

Ejemplo 6.- En una distribución normal hay 47 % de valores


inferiores a 47 y 28% superiores a 70.
Calcular la proporción de valores entre 57 y 86.

Resolución

85

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

47 − 𝜇 70 − 𝜇
−0,08 = 0,58 =
𝜎 𝜎

𝜇 − 0,08𝜎 = 47 𝜇 + 0,58𝜎 = 70

Luego 𝜇 − 0,08𝜎 = 47 (1)


𝜇 + 0,58𝜎 = 70 (2)

Resolviendo las ecuaciones (1) y (2) obtenemos 𝜇 = 49,79 𝜎 = 34,85

57−49,79 86−49,79
Ahora 𝑍1 = 34,85
= 0,21 𝑍2 = = 1,04
34,85

𝑃(0,21 < 𝑍 < 1,04) = 𝑃(0 < 𝑍 < 1,04) − 𝑃(0 < 𝑍 < 0,21)
= 0,3508 − 0,0832 = 0,2676 → 26,76%
Respuesta: La proporción de valores entre 57 y 86 es 26,76%.

EJERCICIOS PROPUESTOS

1.- Para estudiar la regulación hormonal de una línea metabólica se


inyectan ratas albinas con un fármaco que inhibe la síntesis de
proteínas del organismo. En general 4 de cada 20 ratas mueren a
causa del fármaco antes de que el experimento haya concluido. Si se
trata a 10 animales con el fármaco. ¿Cuál es la probabilidad:
a) Que exactamente 3 no lleguen vivas al final del experimento
Rpta. 0,2013
b) Que al menos 8 lleguen vivas al final del experimento
Rpta. 0,6778

2.- Se determina que un 25% de los niños expuestos a un determinado agente infeccioso contraerán la
enfermedad producida por dicho agente. Entre un grupo de 4 niños igualmente expuestos al agente
infeccioso. ¿Cuál es la probabilidad de que:
a) Exactamente 2 niños se enfermen Rpta. 0,211
b) Por lo menos un niño se enferme Rpta. 0,684

86

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

3.- En cierto país en desarrollo el 30% de los niños están desnutridos; en una muestra aleatoria de 25
niños de esa área. ¿Cuál es la probabilidad de que el número de niños desnutridos sea:
a) Menos de cinco Rpta. 0,0905
b) Menos de 7 pero más de 4? Rpta. 0,2502

4.- La probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es 0,8. Si se sabe
que 15 personas contraen esta enfermedad. ¿Cuál es la probabilidad:
a) Que sobrevivan de 4 a 7
b) No sobrevivan exactamente 5

5.-Se tiene información que, en la comisaria de Chorrillos, el 25% de los detenidos se encuentran allí
por delitos menores. Se selecciona una muestra aleatoria de 24. ¿Cuál es la probabilidad de que el
número de detenidos por delitos menores en esa muestra sea 10?

6.- Se sabe que en el comercial HND el 70% de los establecimientos


comerciales pequeños no entregaban boleta al momento de efectuar
una transacción económica.
a) ¿Cuál es la probabilidad de que, en una muestra de 16 negocios, a
lo más la mitad entregue boleta?
b) ¿Cuál es la probabilidad de que, en una muestra de 15 negocios,
la quinta parte no entregue boleta?

7.- La probabilidad de que una persona se muera por consumir


bebidas alcohólicas es 0,4. Después de un estudio realizado en la
zona de Bayóvar se conoce que a la semana 30 personas consumen
bebidas alcohólicas, cual es la probabilidad que:
a) Sobrevivan al menos 14 personas
b) Sobrevivan exactamente 5
c) Cuantos, en promedio, sobrevivirán
d) ¿Cuál es la varianza de la variable aleatoria en cuestión?

8.- La encargada de los préstamos del banco “INTERBANK” estima, con base en sus años de
experiencia, que la probabilidad de que un solicitante no sea capaz de pagar su préstamo es 0,035. El
mes pasado realizó 45 préstamos. ¿Cuál es la probabilidad de que 3 préstamos no sean pagados
oportunamente?
,
9.- En “MoneyGram” se evalúa el número de envíos de dinero al
extranjero que se realizó en un mes determinado. Suponga que 55%
de todas sus transacciones fueron envíos de dinero al extranjero y
considere una muestra de 10 transacciones. ¿Cuál es la probabilidad
de que:
a) Cuando mucho 8 de las transacciones sean envíos de dinero al
extranjero?
b) Por lo menos 6 de las transacciones sean envíos de dinero al
extranjero?
c) Más de 6 de las transacciones sean envíos de dinero al extranjero?

10.- “CAJA RURAL APU” informó que el 30% de los préstamos garantizados con joyería vencieron.
Si se toma una muestra aleatoria de 10 préstamos
a) ¿Cuál es la probabilidad de que ninguno esté vencido?
b) ¿Cuál es la probabilidad de que 2 estén vencidos?

87

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

11.- El 28% de los tornillos de la última producción para la empresa “MAESTRO” están defectuosos.
Determinar la probabilidad de que de 8 tornillos seleccionados aleatoriamente por lo menos 3 estén
defectuosos.

12.- Un prominente médico afirma que 70% de las personas con cáncer de pulmón son fumadores
empedernidos. Si su afirmación es correcta:
Encuentre la probabilidad que, de 10 de tales pacientes admitidos recientemente en un hospital, menos
de 3 sean fumadores empedernidos.

13.- Si la probabilidad de que un individuo sufra una reacción desfavorable por una inyección de cierto
suero es de 0,001. Determinar la probabilidad de que de 200 personas:
a) Exactamente 3 sufran la reacción. Rpta. 0,0011
b) Dos o más sufran la reacción. Rpta. 0,0175

14.- El número promedio de Buses que llegan cada día al Terminal


Terrestre de Atocongo es 16. Las facilidades que tiene el terminal
hacen que puedan llegar hasta 22 buses por día. ¿Cuál es la
probabilidad de que, en un día dado, se tenga que rechazar el ingreso
de buses al Terminal Terrestre de Atocongo?
Rpta. 0,05824

15.- En Caja Sullana se analiza la cantidad de clientes que se atiende en las ventanillas, se obtuvo que
la cantidad de clientes promedio que se atiende en esta institución financiera en un lapso de 50 minutos
es de 20 clientes.
a) ¿Cuál es la probabilidad de que se atiendan a 10 clientes en 25 minutos?
b) ¿Cuál es la probabilidad de que se atiendan a 7 clientes en 10 minutos?

16.- En una investigación realizada en la calle Miramar, se ha determinado que el número de muertes
debido a accidentes de tránsito ha sido en promedio 10 en dos meses. Suponiendo que el número de
muertes sigue una distribución de Poisson.
a) Hallar la probabilidad de que en un determinado mes mueran 3 personas.
b) Hallar la probabilidad de que en un determinado mes no mueran 4 personas.

17. En la oficina de ventas de “PARALELO” se analiza el número


de ventas al día, se tiene la información que tiene un promedio de
9,5 ventas al día. Suponiendo que los pedidos siguen una
distribución de Poisson.
a) ¿Cuál es la probabilidad de que se realicen menos de 5 ventas en
un día determinado?
b) ¿Cuál es la probabilidad de que se realicen al menos 3 ventas en
un día determinado?
c) ¿Cuál es la probabilidad de que se realicen al menos 12 ventas en
4 días?

18.- De la población de valores de Z seleccionamos uno al azar, se pide:


I. Determinar las probabilidades siguientes:
a) P ( Z > 1,37 )
b) P ( Z < - 0,84 )
c) P ( Z ≥ - 2,05 )
d) P ( 1,64 < Z < 1,96 )
e) P ( - 0,84 < Z < 0,84 )
f) P ( -1,24 < Z < 1,63 )
g) P ( - 1 < Z < 2)

88

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

II. Calcular el valor de Zo en las siguientes expresiones:


a) P ( Z > zo ) = 0,025
b) P ( Z < zo ) = 0,15
c) P ( Z ≥ zo ) = 0,85
d) P ( Z < zo ) = 0,10
e) P ( - zo < Z < zo ) = 0,8
f) P ( - zo < Z < zo ) = 0,98

19.-Una población normal tiene una media de 20 y una desviación estándar de 4


a) Calcule el valor de z asociado con 25
b) ¿Qué proporción de la población se encuentra entre 20 y 25?
c) ¿Qué proporción de la población es menor que 18?

20.-Una población normal tiene una media de 12,2 y una desviación estándar de 2,5.
a) Calcule el valor de z asociado con 14,3.
b) ¿Qué proporción de la población se encuentra entre 12,2 y 14,3?
c) ¿Qué proporción de la población es menor que 10?

21.- Supóngase que se sabe que los pesos de 300 individuos están distribuidos en forma normal con
media de 68 Kg y una desviación estándar de 11,5 Kg.
a) Cuál es la probabilidad de que una persona seleccionada al azar pese 70 Kg o menos?
b) Cuántas personas se espera encontrar que pesen 70 Kg o menos?

22.- En la empresa DURACELL, hicieron un análisis del tiempo de


duración de las pilas que desean vender. Una pila elegida al hacer
dura en promedio 2,9 años, con una desviación estándar de 0,5 años.
Asumiendo que la vida de las pilas DURACELL está normalmente
distribuida, encuentre la probabilidad de que una pila dada dure
menos de 2,3 años.

23.-El precio medio de las acciones de las empresas que forman el


M&H es $30, y la desviación estándar es $8,20. Suponga que los precios de las acciones se distribuyen
normalmente.
a) ¿Cuál es la probabilidad de que las acciones de una empresa tengan un precio mínimo de $40?
b) ¿Cuál es la probabilidad de que el precio de las acciones no supere $20?
c) ¿Qué tan alto debe ser el precio de las acciones de una firma para situarla en el 10% de las principales
empresas?

24.-Un estudio reciente con respecto a salarios por hora de integrantes


de equipos de mantenimiento de las aerolíneas más importantes
demostró que el salario medio por hora era de $20,5, con una
desviación estándar de $3,50. Suponga que la distribución de los
salarios por hora es una distribución de probabilidad normal. Si elige
un integrante de un equipo al azar, ¿cuál es la probabilidad de que
gane:
a) Entre $20,5 y $24 la hora?
b) Más de $24 la hora?
c)Menos de $19 la hora?

25.-Entre las ciudades de Estados Unidos con una población de más de 250 000 habitantes, la media del
tiempo de viaje de ida al trabajo es de 24,3 minutos. El tiempo de viaje más largo pertenece a la ciudad
de Nueva York, donde el tiempo medio es de 38,3 minutos. Suponga que la distribución de los tiempos

89

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

de viaje en la ciudad de Nueva York tiene una distribución de probabilidad normal y la desviación
estándar es de 7,5 minutos.
a) ¿Qué porcentaje de viajes en la ciudad de Nueva York consumen menos de 30 minutos?
b) ¿Qué porcentaje de viajes consumen entre 30 y 35 minutos?
c) ¿Qué porcentaje de viajes consumen entre 30 y 40 minutos?

26.- Las precipitaciones anuales en una región alcanzan, de media,


los 1500 mm, con una desviación típica de 200mm. Calcule,
suponiendo que siguen una distribución normal, la probabilidad de
que en un año determinado la lluvia:
a. No supere los 1200 mm
b. Supere los 1500 mm.
c. Esté entre 1700 y 2300 mm.
d. Deseamos seleccionar el 25% de los años más lluviosos, ¿a partir
de qué cantidad de agua hemos de escogerlos? ¿Y si deseáramos
seleccionar los menos lluviosos?

27.- Supóngase que se sabe que los niveles de glucosa en sangre extraída a 150 niños en ayunas están
distribuidos normalmente con una media de 66 y una varianza de 42.
a) Cuál es la probabilidad de un niño seleccionado al azar presente un nivel de glucosa en sangre mayor
o igual a 71?
b) Cuántos niños presentan un nivel de glucosa en sangre menor o igual a 61?
c) Determinar la mediana y la moda de la distribución.

28.- Supóngase que la estancia promedio de internación en un


hospital es de 5,5 días, con una desviación estándar de 1,8 días. Si
se supone que la duración de la internación se distribuye
normalmente, encuentre la probabilidad de que un paciente
seleccionado al azar de dicho grupo tenga una duración de
internación:
a) De más de 6 días.
b) Entre 4 y 7 días.
c) De menos de 3 días.

29.- El nivel de colesterol en los trabajadores administrativos tiene distribución normal. Por otro lado se
sabe que el 5% superior de los trabajadores su colesterol está por encima de 280 y que el 10% inferior
de los trabajadores su colesterol está por debajo de 170. Se pide determinar los valores de la media y
varianza de la distribución normal. Si de esta población seleccionamos un trabajador al azar, cuál es la
probabilidad de que su colesterol sea mayor a 250.

30.- Calcular k si P (X ≤ k) = 0,6141 y X sigue una N(15,4).

31.- De una variable normal N(µ; σ) se sabe que P (X ≤ 7 ) = 0,9772 y P (X ≤ 6,5) = 0,8413.
Calcular:
a) µ y σ.
b) P (5,65 ≤ X ≤ 6,25)
c) El número k tal que P (X > k) = 0,3

90

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

32.- La presión arterial sistólica de los cobayos tiene distribución


normal con una media de 95 y una desviación estándar de 9. Si de esta
población seleccionamos un cobayo al azar, ¿cuál es la probabilidad
de que:
a) Su presión arterial sistólica sea menor a 75?
b) Su presión arterial sistólica esté comprendida entre 75 y 120.
c) Si el número de cobayos es de 1000 ¿Cuántos cobayos se espera
que su presión arterial sistólica sea mayor a 120?
d) A qué valor de presión arterial sistólica se localiza el 25% inferior de la población de cobayos?

33.- Las calificaciones de una prueba final de una cierta signatura tienen distribución normal con media
de 12. Si el 95,44% de los examinados obtuvieron calificaciones entre 8 y 16.
a) Calcule la desviación estándar Rpta. 2
b) Si la nota aprobatoria es 11. ¿Qué porcentaje de alumnos aprobaron el curso? Rpta. 69,15%
c) ¿Qué nota mínima deberá tener un alumno para estar ubicado en el quinto superior? Rpta. 13,7

34.-. El número promedio de personas que comen en un restaurante es aproximadamente normal, con
una media de 250 y una desviación estándar de 20 por día.
a) Si el consumo promedio por cliente es de $4 ¿Cuál es el consumo diario esperado? Rpta. $1000
b) ¿Cuál es la probabilidad de que el consumo exceda a $1100? Rpta. 0,1056

35.- Suponga que la demanda mensual de un bien de consumo se distribuye normalmente con una
media de 650 kg y una desviación estándar de 100 kg.
a) ¿Qué probabilidad hay de que la demanda no supere los 500 kg? Rpta. 0,0668
b) ¿Qué cantidad del bien debe haber mensualmente a fin de satisfacer la demanda máxima en un
89,8 %? Rpta. 777 kg

36.- Trescientas estudiantes tienen talla media de 65 pulgadas y


desviación estándar de 2 pulgadas. Las 300 tallas presentan
distribución normal y se miden a la pulgada más cercana.
a) ¿Cuántas estudiantes tienen talla de 64 pulgadas o menos?
b) ¿Debajo de qué talla están el 30% de las estudiantes?
c) ¿Cuántas de las estudiantes tienen talla que difiere de la media por
más de una desviación estándar?

37.- En base a pruebas y la experiencia, un fabricante de lavadoras mecánicas modelo 101XE, decide
que la vida media con uso familiar normal es de 5,8 años, con desviación estándar de 2 años. Si la vida
de este modelo presenta distribución normal:
a) ¿Qué garantía debe ofrecer si está dispuesto a reparar únicamente al 1% de las lavadoras vendidas?
b) Si da una garantía de dos años ¿Qué porcentaje de las máquinas necesitarán reparación antes que
expire el período de garantía?

38.- Una máquina automática que expende café llena los vasos con 6 onzas de café, con desviación
estándar de 0,40 onzas. Si se usan vasos de 7 onzas ¿Qué porcentaje de ellas se derramarán?

39.- Suponga que el ingreso familiar mensual en una comunidad tiene distribución normal con media
de $400 y desviación estándar $50.
a) Si el 10% de las familias debe pagar un impuesto. ¿A partir de qué ingreso familiar se debe pagar el
impuesto? Rpta. $464
b) Si el ahorro familiar está dado por la relación Y = X - 50
4
¿Cuál es la probabilidad de que el ahorro sea superior a $75? Rpta. 0,0228

91

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

DISTRIBUCIONES MUESTRALES
Se denomina distribución muestral de una estadística a su distribución de probabilidad.
Por ejemplo, a la distribución de probabilidad de la estadística media 𝑥 , se le denomina distribución
muestral de la media.
Para determinar la distribución muestral de un estadístico es necesario conocer:
a) La población y el parámetro.
b) Todas las muestras posibles y todos los valores posibles.

DISTRIBUCIÓN DE LA MEDIA MUESTRAL

La distribución de la media muestral es la distribución de todos los valores que toma el estadístico
(media muestral), valores que se obtienen a partir de todas las posibles muestras de tamaño n tomadas
de la población.
A continuación, se presentan dos resultados importantes:
• Si la variable aleatoria X sigue una distribución Normal, la distribución de la variable aleatoria x es
Normal, es decir:
𝜎2
• Si X ~ 𝑁(𝜇, 𝜎 2 ) entonces 𝑋~ 𝑁(𝜇, ) Si la variable aleatoria X no sigue una distribución Normal,
𝑛
entonces por el teorema del límite central, para n suficientemente grande (n > 30), la distribución de la
variable aleatoria x es aproximadamente Normal, es decir:
𝜎2
𝑋 ≅ 𝑁(𝜇, )
𝑛
La media de la media muestral y la varianza de la media muestral se representa como 𝜇𝑋 y σ2 X
respectivamente, además:

𝜇𝑋 = 𝜇
2
𝜎2
𝜎 𝑋=
𝑛
TEOREMA: Si la variable aleatoria X sigue una distribución N(μ, 𝜎 2 ), la variable aleatoria:

𝑥−𝜇
𝑧= 𝜎
√𝑛

sigue una distribución Normal Estándar, es decir: Z ~ N(0,1).

Donde:
𝑥: media muestral
𝜇: media poblacional
𝜎: desviación estándar poblacional
n: tamaño de la muestra.

Ejemplo 1.- La distribución de la cantidad de cereal que una máquina vierte en cajas de tamaño
económico, tiene un peso X que se distribuye normalmente con media 0,999 kg y desviación estándar
0,05 kg. Si se eligen 4 cajas al azar. ¿Cuál es la probabilidad de que el promedio de los pesos netos de
las 4 cajas esté entre 0,999 y 1,049 kg?

Resolución
𝑥−𝜇
Sabemos que 𝑧= 𝜎
√𝑛

92

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

0,999−0,999 1,049−0,999
Hallaremos 𝑃 = (0,999 ≤ 𝑋̅ ≤ 1,049) = 𝑃 ( 0,05/ 4 ≤ 𝑍 ≤ 0,05/ 4 )
√ √
,
𝑃 = (0 ≤ 𝑍 ≤ 2) = 0,4772

Ejemplo 2. Si la distribución del peso de los caballeros que viajan por avión entre dos ciudades tiene
una media de 163 libras y una desviación estándar de 18 libras. ¿Cuál es la probabilidad de que el peso
total combinado de 36 de esos pasajeros sea mayor de 6000 libras?

Resolución: Hallaremos 𝑃 = (∑36


𝑖=1 𝑋𝑖 > 6000)

∑𝑛𝑖=1 𝑋𝑖 − 𝑛𝜇 6000 − 36(163)


𝑍= = = 1,22
√𝑛𝜎 2 √36(18)2

Luego P ( Z > 1,22 ) = 0,1112

∑𝑛
𝑖=1 𝑋𝑖 −𝑛𝜇 𝑋̅−𝜇 6000
Otro método: 𝑍 = = 𝜎 en donde 𝑋̅ = 36 = 166,67
√𝑛𝜎 2
√𝑛

Luego hallaremos 𝑃(𝑋̅ > 166,67)

𝑥−𝜇
Enseguida aplicamos la fórmula: 𝑧 = 𝜎
√𝑛

166,67 − 163
𝑧= = 1,22
18
√36

Ejemplo 3. La calificación en una prueba de aptitud es una variable aleatoria X que tiene distribución
normal con media igual a 100.
Si se supone que la desviación estándar de todas las calificaciones es  = 15, ¿cuántas calificaciones
se deben escoger para que la media muestral esté en el intervalo de 90,2 a 109,8 con probabilidad 0,95?

Resolución

Se sabe que µ = 100 σ = 15 Hallaremos:

𝑃(90,2 ≤ 𝑋̅ ≤ 109,8) = 0,95

90,2 − 100 109,8 − 100


𝑃( ≤𝑍≤ ) = 0,95
15 15
√𝑛 √𝑛

Lo cual significa que P(-1,96 ≤ Z ≤ 1,96 ) = 0,95

Por lo tanto

93

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

109,8 − 100 15
1,96 = → 1,96 ( ) = 9,8
15 √𝑛
√𝑛

29,4
= 9,8 → √𝑛 = 3 → 𝑛 = 9
√𝑛

Ejemplo 4. Los tiempos de espera para los clientes que pasan por una caja registradora a la salida de
una tienda de menudeo son variables aleatorias independientes con una media de 1,5 minutos y una
varianza de 1. Estime la probabilidad de que se pueda atender a 100 clientes en menos de 2 horas.

Resolución:
Sea la variable X: Tiempo de espera que pasan por una caja registradora a la salida de una tienda de
menudeo

Calcularemos 𝑃 = (∑100
𝑖=1 𝑋𝑖 < 120)

∑𝑛𝑖=1 𝑋𝑖 − 𝑛𝜇 120 − 100(1,5)


𝑍= = = −3 → 𝑃(𝑍 < −3) = 0,00135
√𝑛𝜎 2 √100(1)

120
Otro método: Se sabe que 𝑋̅ = 100 = 1,2

1,2−1,5
Hallaremos 𝑃(𝑋̅ < 1,2) → 𝑍= 1 = −3
√100

DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL

Sea 𝑋1 , 𝑋2 , 𝑋3 ,….,𝑋𝑛 una muestra aleatoria de tamaño n, con distribución Bernoulli con parámetro
π, donde:
π: Proporción de éxitos en la población

Si la proporción de éxitos en la muestra (p), sigue una distribución Binomial entonces, la media y la
varianza de p se obtienen de la siguiente manera:

𝜇𝑝 = 𝜋
𝜋(1 − 𝜋)
𝜎 2𝑝 =
𝑛
OBSERVACIÓN

Si n es suficientemente grande (np o nq ≥ 5), entonces la variable aleatoria

𝑝−𝜋
𝑧=
√𝜋(1 − 𝜋)
𝑛

sigue una distribución Normal Estándar, es decir: Z~N(0,1).

Donde:

94

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

p: proporción muestral
𝜋: proporción poblacional
n: tamaño de la muestra.

Ejemplo 1. La persona encargada de recibir los pedidos de cierto artículo tiene la siguiente política:
selecciona una muestra de 400 artículos; si 3 % o más de los artículos son defectuosos rechaza el pedido,
en caso contrario, lo acepta. Hallar la probabilidad de rechazar un pedido si en toda la población el 2 %
de artículos son defectuosos.

Resolución

Hallaremos 𝑃(𝑝 ≥ 3%)

𝑝−𝜋 0,03 − 0,02 0,01


𝑍= = = = 1,43
0,007
√𝜋(1 − 𝜋) √0,02𝑥0,98
𝑛 400

Luego P (Z  1,43) = 0,0764

Es decir, se espera que el 7,64 % de las remesas sean rechazadas.

Ejemplo 2. El gerente de ventas de “TV cable” estima en 20% las conexiones domiciliarias clandestinas.
¿Cuál es la probabilidad de que una muestra de 100 conexiones domiciliarias seleccionada de una
población de 1000 domicilios que tienen “TV cable” más del 30% resulten clandestinas.

Resolución: Hallaremos la probabilidad

𝑃(𝑝̂ > 0,30)

𝑝̂ − 𝑝
𝑍=
√𝑝𝑞 (𝑁 − 𝑛)
𝑛 𝑁−1

0,30 − 0,20
𝑍= = 2,63
√0,2 𝑥 0,8 (1000 − 100)
100 999

𝑃(𝑍 > 2,63) = 0,00427

95

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS PROPUESTOS

1. Un estudio reciente de un organismo de vigilancia ambiental


determinó que la cantidad de contaminantes en el río Rímac (en partes
por millón) tiene una distribución normal con media de 64 ppm y
desviación estándar de 17,6. Suponga que se toman 35 muestras al
azar del río. Encuentre la probabilidad de que el promedio muestral
de la cantidad de contaminantes sea:
a) Mayor que 72 ppm.
b) Entre 64 y 72 ppm.
c) Exactamente 64 ppm.
d) Mayor que 94 ppm.

2. La distribución de los ingresos anuales de todos los administrativos de una determinada institución
educativa y con cinco años de experiencia sigue una distribución normal con una media de $19000 y
una desviación estándar de $2000. Si extraemos una muestra aleatoria de 30 administrativos ¿cuál es la
probabilidad de que sus ingresos promedios sean más de $19750 anualmente?

3. En una muestra de 25 observaciones a partir de una distribución normal con media 98,6 y
desviación estándar 17,2,
a) ¿Cuánto vale P(92 < x < 102)?
b) Encuentre la probabilidad correspondiente dada una muestra de 36.

3. Dionisio Romero Paoletti dueño de una gran compañía de tarjetas


de crédito sabe que el saldo promedio mensual de un cliente dado es
$112 y la desviación estándar es $56. Si Dionisio audita 50 cuentas
seleccionadas al azar, encuentre la probabilidad de que el saldo
promedio mensual de la muestra sea:
a) Menor que $100.
b) Entre $100 y $130.

4. Para una muestra de 19 observaciones de una distribución normal con media 18 y desviación estándar
4.8, calcule
a) P(16 < 𝑥 < 20)
𝑥 > 21)
b) P ( ̅
c) Suponga un tamaño de muestra de 40. ¿Cuál es la nueva probabilidad en el inciso a)?

5. A partir de una población de 125 artículos con media de 105 y desviación estándar de 17, se eligieron
64 artículos.
a) ¿Cuál es el error estándar de la muestra?
b) ¿Cuál es la P(107,5 < 𝑥 < 109)?

6. Luisa Aliaga Ricaldi, investigadora de la Colombian Cofee


Corporation, está interesada en determinar la tasa de uso de café por
hogar en Estados Unidos. Ella cree que el consumo anual por hogar
tiene distribución normal con media 𝜇 desconocida y desviación
estándar cercana a 1,25 libras. Si Luisa toma una muestra de 36
hogares y registra su consumo de café durante un año, ¿cuál es la
probabilidad de que la media de la muestra se aleje de la media de la
población no más de media libra?

7. De una población de 75 elementos con media de 364 y varianza de 18, se seleccionaron 32 elementos
al azar sin reemplazo.

96

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

a) ¿Cuál es el error estándar de la media?


b) ¿Cuál es la P(363 < 𝑥< 366)?

8. Suponga que la proporción  de padres asistentes a las reuniones


del colegio Fe y Alegría N°5 es 0,55. En una muestra de 45 padres
de familias ¿Cuál es la probabilidad que la proporción muestral de
padres asistentes a las reuniones del colegio Fe y Alegría N°5 sea
mayor al 60%?

9. Reportajes en periódicos nos dicen que el estadounidense tiene sobrepeso. Muchos de nosotros hemos
tratado de bajar de peso cuando terminamos la preparatoria o la universidad. Y en efecto, sólo 19% de
adultos dicen que no sufren de problemas de pérdida de peso. Suponga que la cifra de 19% es correcta
y que se selecciona una muestra aleatoria de n= 100 adultos.
a. La distribución de p, es decir, la proporción muestral de adultos que no sufren de excesos de peso,
tiene una distribución normal aproximada ¿cuál es su media y desviación estándar?
b. ¿Cuál es la probabilidad de que la proporción muestral p exceda a 0,25?

10. Una máquina empaqueta un determinado producto, en paquetes


cuyo peso, en gramos, se distribuye normalmente con una desviación
estándar de 20 gramos, y con una media que debe ser bien regulada.
a) La media µ está bien regulada si sólo el 1% de los pesos de todos
los paquetes que produce la máquina tienen pesos mayores a 546,6
gramos, ¿calcule el valor de µ?
b) Con la media bien regulada, se programa el siguiente control del
peso del producto: Cada hora se escogen al azar 4 paquetes, si el
promedio de los pesos no está entre 480 y 520 gramos, se para la
máquina para mantenimiento. En caso contrario se continua con el proceso. ¿Cuál es la probabilidad de
parar la máquina cuando realmente está bien regulada?
c) Si la máquina está bien regulada, ¿con qué tamaño de muestra se consigue que la media muestral sea
a lo más 490,2 gramos con probabilidad igual a 0,025?

11. La utilidad (en miles de soles) por la venta de cierto artículo, es


una variable aleatoria con distribución normal. Se estima que en el
5% de las ventas las utilidades serían menos de 6,71, mientras que el
1% de las ventas serían mayores que 14,66. Si se realizan 16
operaciones de ventas, ¿cuál es la probabilidad de que el promedio
de la utilidad por cada operación esté entre 10 y 11 miles de soles?

12.Se estima que el 60% de los votos de los electores de la ciudad favorecen al candidato Sr. Noel
Tasilla Ramírez. Si se selecciona una muestra aleatoria de 600 electores de la ciudad, ¿qué
probabilidad hay de que la proporción muestral de votos a favor del Sr. Noel Tasilla Ramírez esté
entre 47% y 55%?

13. De 3000 empleados de una empresa se escoge una muestra


aleatoria de 300 empleados para una encuesta sobre condiciones
laborales. ¿Cuál es la probabilidad de que la proporción muestral a
favor de las condiciones laborales esté comprendida en el intervalo
0,76 y 0,84, si se estima en 84% del total de empleados el porcentaje
a favor de las condiciones laborales?

14. Por datos obtenidos con anterioridad, se sabe que el 70% de las familias que tienen teléfono no se
encuentran en las horas de la tarde del día domingo. Se toma una muestra aleatoria de 36 familias del
directorio telefónico y se les llama. ¿Cuál es la probabilidad de que el 50% o más estén ausentes?

97

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

15. Se toma una muestra aleatoria de 200 unidades producidas en una hora por una máquina. Se sabe
que el 10% de las unidades producidas son defectuosas. ¿Cuál es la probabilidad de que, en la muestra
tomada, 16 o más artículos resulten defectuosos?

16. En cierto proceso de producción se utiliza el siguiente sistema de


control de calidad: se elige una muestra de 26 unidades, si el
porcentaje de unidades de la muestra no excede el valor de p, se
continua el proceso. Si se sabe que el proceso ocasiona un 10% de
unidades defectuosas, en promedio, determine el valor de p, para que
exista un 62% de probabilidad de continuar el proceso, cuando la
proporción de piezas defectuosas es inferior a p.

17. Se tiene establecido que las facturas de los clientes tienen una desviación estándar de S/ 45. Si se
toma una muestra de 225 facturas. ¿Cuál es la probabilidad de que el valor medio de la muestra se desvíe
de la media de todas las 2000 facturas por S/ 7,5 soles o más? Rpta. 0,008
18. Una investigadora de una empresa cafetalera sabe que el consumo mensual de café por casa está
normalmente distribuido, con una media desconocida y una desviación estándar de 0,3 kg.
Si se toma una muestra aleatoria de 36 casas y se registra su consumo de café durante un mes. ¿Cuál es
la probabilidad de que la media de la muestra difiera de la verdadera media en menos de 100 gramos?
Rpta. 0,9544

19. Las cuentas de gastos en gasolina por día de los vendedores de una empresa de cigarros tiene una
media de 65 pesos y una desviación estándar de σ = 7 pesos. Si se selecciona una muestra aleatoria de
25 cuentas, y considerando que estos gastos tienen una distribución normal, ¿cuál es la probabilidad de
que la muestra revele una media:
a) Al menos de 68 pesos?
b) Entre 64 pesos y 66 pesos?
c) ¿Cuál es el gasto máximo reportado del 20% de los vendedores que gastan menos en este rubro?

20. De las 420 empresas manufactureras en cierta zona de Gamarra, 20% de ellas se dedican a la
producción de calzado. Si se toma una muestra aleatoria de 80 empresas, ¿cuál es la probabilidad de
que, de esa muestra, 18% o más se dediquen a la producción de calzado?

21. Se sabe que el 7% de los focos que llegan a las tiendas distribuidoras Promart presentan algún tipo
de defecto. Si de un pedido de 5 000 focos se extrae una muestra aleatoria de tamaño 100, sin reemplazo.
a) Determina el valor esperado de la distribución muestral de proporciones.
b) Determina el error estándar de la distribución muestral de proporciones.
c) ¿Cuál es la probabilidad de que 10 focos o más de la muestra estén defectuosos?
d) ¿Cuál es la probabilidad de que la proporción de focos defectuosos este entre 8 y 9%?

22. Los registros que lleva el departamento de servicios de una agencia automotriz “Ramírez” indican
que 18% de todos los automóviles nuevos de la marca Polka han requerido cierto tipo de reparación
durante el periodo de su garantía. Si se toma una muestra de 64 automóviles nuevos de esta marca, ¿cuál
es la probabilidad de que:
a) El porcentaje de autos que necesiten reparación este entre 12 y 16%?
b) A lo sumo 20% necesiten reparación?
c) Si se toma una muestra al azar de 80 automóviles nuevos, 8 o más necesiten algún tipo de
reparación?

98

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

INTERVALOS DE CONFIANZA
TAMAÑO DE LA MUESTRA Y MUESTREO,PRUEBA DE
HIPÓTESIS, ANÁLISIS DE VARIANZA, REGRESIÓN Y
CORRELACIÓN LINEAL, PRUEBA DE CHI CUADRADO

99

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL

CASO: Cuando la muestra proviene de una población normal con σ2 conocida

Sea X1, X2, X3, …………..,Xn una muestra aleatoria extraída de una población normal donde
2 es conocida, entonces el intervalo de confianza para la media poblacional está dado por:
𝜎 𝜎
𝑋̅ − 𝑍𝛼⁄ ≤ 𝜇 ≤ 𝑋̅ + 𝑍𝛼⁄
2 2
√𝑛 √𝑛

El nivel de confianza (1- α) es la probabilidad de que la estimación efectuada se ajuste a la realidad; es


decir, que caiga dentro de un intervalo determinado basado en el estimador y que capte el valor
verdadero del parámetro a medir.

El nivel de significancia (α) es la probabilidad de que el intervalo de confianza hallado no contenga al


verdadero valor del parámetro.
𝑧𝛼⁄2 es llamado coeficiente de confiabilidad cuyo valor se encuentra en la tabla de la distribución normal
estándar y va depender del nivel de confianza.
σ es la desviación estándar poblacional.

Nota
- Cuando la población es finita de tamaño N y el tamaño de la muestra es mayor del 5 % con
respecto a N, se debe usar el factor de corrección para población finita.

- Para muestras pequeñas seleccionadas de poblaciones no normales, no se puede esperar que


el grado de confianza sea exacto. Sin embargo, para muestras de tamaño grande n  30,
independientemente de la forma de la distribución de la población, se puede hallar un intervalo
de confianza para  considerando la distribución muestral de 𝑋̅. De acuerdo al Teorema de
Límite Central, 𝑋̅ tiene distribución aproximadamente normal con media  y varianza 2/n

Ejemplo 1.- Un director de producción sabe que la cantidad de impurezas contenida en los envases de
cierta sustancia química sigue una distribución normal con una desviación estándar de 3.8 g.
Se extrae una muestra aleatoria de 9 envases cuyos contenidos de impurezas son los siguientes:
18,2 16,6 13,7 12,3 15,9 18 17,4 16,2 y 21,8
Determinar un intervalo de confianza del 95% para a media
Solución: Dado que σ es conocida utilizaremos la variable Z para dicha estimación
𝜎 𝜎
𝑋̄ − 𝑍𝛼⁄2 ≤ 𝜇 ≤ 𝑋̄ + 𝑍𝛼⁄2
√𝑛 √𝑛
Luego los límites de confianza estarán dados por 𝑋̄ ± 𝑍𝛼/2 𝜎𝑥̄
3,8
16,67 ± 1,96 ( ) = 16,67 ± 2,48 → 14,2 ≤ 𝜇 ≤ 19,2
√9

Con un 95% de confiabilidad podemos afirmar que la cantidad promedio de impurezas en los envases
está entre 14,2 y 19,2

100

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

También podemos afirmar con un 95% de confiabilidad de que la cantidad media de impurezas
contenida en los envases es de 16,7 con un margen de error de 2,48

Ejemplo 2.- Supongamos que un investigador está interesado en estimar el nivel medio de alguna
enzima en cierta población, toma una muestra de 10 individuos, determina el nivel de la enzima de cada
uno y obtiene una media igual a 22. Suponga además que la variable de interés está distribuida
normalmente con varianza de 45. Encuentre un intervalo de confianza del 98% para la media
poblacional.
Resolución: Dado que σ es conocida utilizaremos la variable Z para dicha estimación
𝜎 𝜎
𝑋̄ − 𝑍𝛼⁄2 ≤ 𝜇 ≤ 𝑋̄ + 𝑍𝛼⁄2
√𝑛 √𝑛
𝜎
Luego los límites de confianza estarán dados por 𝑋̄ ± 𝑍𝛼/2
√𝑛

6,7082
22 ± 2,33 ( ) = 22 ± 4,94 → 17,06 ≤ 𝜇 ≤ 26,94
√10

La cantidad promedio de dicha enzima estaría entre 17 y 27 aproximadamente.

CASO: Cuando la muestra proviene de una población normal con σ2 desconocida

Dado que no se conoce 2 ésta deberá ser estimada por la varianza muestral y la variable
estadística a usarse será la T de Student:

𝑋̅−𝜇
𝑇=𝑆 cuya distribución de t de Student con n-1 grados de libertad

√𝑛

Luego el intervalo de confianza está dado por:

𝑆 𝑆
𝑋̅ − 𝑡𝛼⁄2 ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝛼⁄2
√𝑛 √𝑛

Ejemplo 1.- En el departamento de personal de una compañía grande se requiere estimar los gastos
familiares en odontología de sus empleados para determinar la factibilidad de proporcionarles un plan
de seguro dental. Una muestra aleatoria de 10 empleados reveló los siguientes gastos (en dólares)
durante el año anterior:
110 362 246 85 510 208 173 425 316 179
Establezca un intervalo de confianza del 90% para el gasto promedio familiar en odontología

Resolución: En este caso como la varianza σ2 es desconocida utilizaremos la variable T de Student:


𝑠 𝑠
𝑋̄ − 𝑡𝛼⁄2 ≤ 𝜇 ≤ 𝑋̄ + 𝑡𝛼⁄2
√𝑛 √𝑛

Cálculos

101

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Para 𝒏 = 𝟏𝟎 se tiene que 𝑿̄ = 𝟐𝟔𝟏, 𝟒 𝑺 = 𝟏𝟑𝟖, 𝟖


𝑠
Luego los límites de confianza estarán dados por 𝑋̄ ± 𝑡𝛼/2 𝑛

138,8
261,4 ± 1.8331 ( ) = 261,4 ± 80,46 → 180,9 ≤ 𝜇 ≤ 341,9
√10
Podemos concluir con un 90% de confiabilidad que el gasto promedio familiar en odontología en dicha
empresa es de 261,4 dólares con un margen de error de 80,46 dólares.
También podemos concluir con un 90% de confiabilidad de que el gasto promedio familiar en
odontología en dicha empresa estaría entre 181 y 342 dólares.

Ejemplo 2.- Una compañía emplea 200 agentes de ventas; en una muestra aleatoria de 25 los auditores
encontraron un gasto promedio de $220 con una desviación estándar de $20 en sus cuentas de gasto de
representación en una semana. Establezca un intervalo de confianza del 98% para el gasto promedio
semanal.
𝑛
Resolución: En este caso dado que N es conocido y 𝑁
> 5% usaremos el factor de corrección para
𝑁−𝑛
poblaciones finitas (√ 𝑁−1 ) por lo tanto:

𝑠 𝑁−𝑛
Los límites de confianza estarán dados por 𝑋̄ ± 𝑡𝛼/2 (√ 𝑁−1 )
√𝑛

20 200 − 25
220 ± 2,4922 ( )√ = 220 ± 9,3 → 210,7 ≤ 𝜇 ≤ 229,3
√25 200 − 1

Ejemplo 3.- Se desea determinar el peso total de una partida de 10000 naranjas. Como solo se tiene una
balanza pequeña y además no se dispone de tiempo; se selecciona una muestra aleatoria de 16 naranjas,
la cual da una media de 175 gramos y una desviación estándar de 25 gr. Determinar un intervalo de
confianza del 98% para el peso total de la partida de naranjas.
Resolución:
El peso total estimado estará dado por: 𝑁𝑋̄ = 10000(175) = 1750000𝑔, 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 1750𝑘𝑔.
Ahora estimaremos un intervalo de confianza para el peso total de las naranjas; para lo cual
primeramente estimaremos un intervalo de confianza para el peso promedio por naranja.
𝑠 𝑁−𝑛
Los límites de confianza estarán dados por 𝑋̄ ± 𝑡𝛼/2 (√ 𝑁−1 )
√𝑛

25 10000 − 16
175 ± 2,6025 ( )√ = 175 ± 16,2526 → 158,7474 ≤ 𝜇 ≤ 191,2526
√16 10000 − 1

Luego 10000(158,7474) ≤ 𝑁𝜇 ≤ 10000(191,2526)

1587474 ≤ 𝑁𝜇 ≤ 1912526, 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 1587,5 ≤ 𝑁𝜇 ≤ 1912,5

Es decir, el peso total de las naranjas estaría entre 1587,5 𝑦 1912,5 𝑘𝑔

102

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Ejemplo 4.- Un sondeo efectuado en 400 familias de cierta clase social de una ciudad encontró un gasto
mensual promedio de S/74 en productos de tocador con desviación estándar de S/ 40.
¿Con qué nivel de confianza se puede afirmar que el gasto promedio mensual en artículos de tocador
está entre 71 y 77?
Resolución: En este caso utilizaremos la variable Z por ser una muestra muy grande
Sabemos que el margen de error (e) está dado por 𝑍𝛼/2 𝜎𝑥̄

𝑺
̂ 𝒙̄ = 𝒆 → 𝒁𝜶/𝟐
En este caso 𝒁𝜶/𝟐 𝝈 =𝒆
√𝒏

𝟒𝟎
𝒁𝜶/𝟐 = ±𝟑 → 𝒁𝜶/𝟐 (𝟐) = ±𝟑 → 𝒁𝜶/𝟐 = ±𝟏, 𝟓
√𝟒𝟎𝟎

Luego el nivel de confianza estará dado por: 𝑷(−𝟏, 𝟓 ≤ 𝒁 ≤ 𝟏, 𝟓) = 𝟎, 𝟖𝟔𝟔𝟒

103

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN


POBLACIONAL

Sea X1, X2, X3,………………………,Xn una muestra aleatoria de tamaño n escogida de una
población de Bernoulli B(1,p) cuyo parámetro p es la proporción de éxitos en la población.
El estimador puntual de p es:

∑𝑛𝑖=1 𝑋𝑖 𝑋 𝑁° 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎


𝑝̂ = = =
𝑛 𝑛 𝑛

Donde 𝑋𝑖 toma el valor 1 si presenta la característica estudiada y el valor 0 si no lo presenta.

Sabemos que:

𝐸(𝑝̂ ) = 𝑝

𝑝𝑞 𝑝(1 − 𝑝)
𝑉(𝑝̂ ) = =
𝑛 𝑛

En consecuencia, la variable aleatoria

𝑝̂ −𝑝
𝑍= 𝑝(1−𝑝)
tiene distribución aproximadamente 𝑁(0, 1)

𝑛

Por consiguiente, el intervalo de confianza del (1 – α )100% para el parámetro p es:

̂𝒒
𝒑 ̂ 𝒑̂𝒒
̂
̂ − 𝒁𝜶⁄ √ ≤ 𝒑 ≤ 𝒑
𝒑 ̂ + 𝒁𝜶⁄ √
𝟐 𝒏 𝟐 𝒏

𝑛
Nota. - Si el muestreo es sin reemplazo en una población finita de tamaño N y > 5%
𝑁
entonces resulta adecuado usar el factor de corrección por población finita.

Ejemplo 1.- En cierta ciudad, se entrevistó a una muestra de 500 bebedores de cerveza, hallándose que
114 de ellos preferían la marca X a la de Y. Hállese el intervalo de confianza del 98% para la fracción
de bebedores de cerveza de esa ciudad que prefieren la marca X.

Resolución:
𝒙
̂ = 𝒑𝒓𝒐𝒑𝒐𝒓𝒄𝒊ó𝒏 𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒍 → 𝑝̂ =
𝑺𝒆𝒂 𝒑
𝒏
𝑵º 𝒅𝒆 𝒃𝒆𝒃𝒆𝒅𝒐𝒓𝒆𝒔 𝒅𝒆 𝒄𝒆𝒓𝒗𝒆𝒛𝒂 𝒒𝒖𝒆 𝒑𝒓𝒆𝒇𝒊𝒆𝒓𝒆𝒏 𝒍𝒂 𝒎𝒂𝒓𝒄𝒂 𝑿
̂=
𝒑
𝑻𝒂𝒎𝒂ñ𝒐 𝒅𝒆 𝒎𝒖𝒆𝒔𝒕𝒓𝒂
𝟏𝟏𝟒
̂=
𝒑 = 𝟎, 𝟐𝟐𝟖
𝟓𝟎𝟎

𝒑̂ (𝟏 − 𝒑
̂) 𝒑̂ (𝟏 − 𝒑
̂)
̂ − 𝒁𝜶⁄ √
𝒑 ̂ + 𝒁𝜶⁄ √
≤𝒑≤𝒑
𝟐 𝒏 𝟐 𝒏

104

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

𝑝̂ (1 − 𝑝̂ ) 0,228𝑥0,772
𝑝̂ ± 𝑍𝛼⁄2 √ → 0,228 ± 2,33√
𝑛 500

0,228 ± 0,044 → 0,184 ≤ 𝑝 ≤ 0,272

Ejemplo 2.- De una lista de opinión pública, se invita a 100 personas de un total de 1000 a expresar su
preferencia por los productos A y B; 30 personas prefirieron A, de esto se concluye que entre 210 y 390
de la población prefieren el producto A. ¿Qué nivel de significación se usa en este informe?
Resolución:
𝑛
En este caso dado que N es conocido y > 5% usaremos el factor de corrección para poblaciones
𝑁
finitas.
𝟑𝟎
Se tiene que: 𝒏 = 𝟏𝟎𝟎 𝑵 = 𝟏𝟎𝟎𝟎 → ̂=
𝒑 = 𝟎, 𝟑𝟎
𝟏𝟎𝟎

𝑝̂ (1 − 𝑝̂ ) 𝑁 − 𝑛 0,30𝑥0,70 1000 − 100


𝑝̂ ± 𝑍𝛼⁄2 √ √ → 𝑝̂ + 𝑍𝛼/2 √ √ = 0,39
𝑛 𝑁−1 100 1000 − 1

0,30𝑥0,70 1000 − 100


𝑍𝛼/2 √ √ = 0,09
100 1000 − 1

𝑍𝛼 (0,046)(0,949) = 0,09 → 𝑍𝛼 (0,043) = 0,09 → 𝑍𝛼 = 2,09


2 2 2

Luego 𝜶 = 𝟏 − 𝑷(−𝟐, 𝟎𝟗 ≤ 𝒁 ≤ 𝟐, 𝟎𝟗) = 𝟎, 𝟗𝟔𝟑

EJERCICIOS PROPUESTOS
1. Una encuesta efectuada a una muestra aleatoria de 150 familias en cierta comunidad urbana reveló
que, en el 87 por ciento de los casos, por lo menos uno de los miembros de la familia tenía alguna forma
de seguro relacionado con la salud. Construir un intervalo de confianza del 99 por ciento para la
proporción real (P) de familias en la comunidad con las características de interés.

2. Una muestra de 100 hombres adultos aparentemente sanos, de 25 años de edad, muestran una presión
sistólica sanguínea media de 125. Si se supone que la desviación estándar de la población es de 15,
calcular el intervalo de confianza del 90 por ciento para 𝜇.

3. En un estudio diseñado para establecer la relación entre un medicamento y cierta anomalía en los
embriones de pollo, se inyectaron con el medicamento 50 huevos fecundados al cuarto día de
incubación. En el vigésimo día de incubación se examinaron los embriones y se observó la presencia de
la anomalía en 12 de ellos. Encontrar un intervalo de confianza del 90 por ciento para P.

105

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

4. En una muestra de 60 pacientes la cantidad mínima requerida para que un anestésico surta efecto en
una intervención quirúrgica fue por término medio de 50 mg, con una desviación típica de 10,2 mg,
Obtener un intervalo de confianza para la media al 95%, suponiendo que la muestra fue extraída
mediante muestreo aleatorio simple sobre una población normal

5. Un psicólogo advierte que el tiempo medio de reacción de 36 ratas a un choque eléctrico de 18 voltios
es de 0,45 segundos, con desviación estándar de 0,06 segundos. Encuentre un intervalo de confianza del
90% para el tiempo medio de reacción de todas las ratas de la misma cepa a un choque de 18 voltios?

6. Un estudio de 50 hogares de cuatro personas cada uno, tomados aleatoriamente, que viven en cierta
ciudad, mostró un gasto promedio de 76 dólares por semana en alimentos, con desviación estándar de 3
dólares. Encuentre el gasto semanal promedio en alimentos en todos los hogares de cuatro personas en
dicha ciudad, con una confianza de un 98%.

7. Una muestra aleatoria de 49 personas que habitan en apartamentos de dos piezas en cierta ciudad,
mostró que pagaban un alquiler mensual promedio de $129,5 con desviación estándar de $18,75
Construya un intervalo de confianza del 99% para el alquiler promedio mensual pagado por
apartamentos de dos piezas en dicha ciudad. Rpta [122,3; 136,7]

8. Un analista de investigación de mercados escoge una muestra aleatoria de 100 clientes de un conjunto
de 500 clientes de una gran tienda que declaran sus ingresos mayores a $800.
El encuentra que los clientes de la muestra gastaron en la tienda un promedio de $2500 por año. Si con
este valor de la muestra se estima que el gasto promedio de la población varía entre 2446 a 2554. ¿Qué
nivel de confianza se utilizó? Suponga que la desviación estándar de la población es de $300.
Rpta. 0,9556

9. Para determinar el rendimiento anual de ciertos valores, un grupo de inversionistas tomó una muestra
aleatoria de 49 de tales valores encontrando una media de 8,71% y una desviación estándar de 2,1%.
a) Estime el verdadero rendimiento anual promedio de tales valores mediante un intervalo de
confianza del 96%. Rpta. [8,1%; 9,3%]
b) Calcule el nivel de significancia si el rendimiento anual promedio de todos los valores se estima
entre 7,96% y 9,46%. Rpta. 0,0124
10. El Gerente de ventas de la tienda “CREDITOS” quiere determinar el porcentaje de clientes morosos
por más de $100. Una muestra aleatoria de 200 de tales clientes de la tienda reveló que 50 de ellos eran
morosos.
a) Halle un intervalo de confianza del 98% para la proporción de clientes morosos por más de $100?
b) Si la estimación de la proporción de clientes morosos está en el intervalo [0,183 ; 0,317]. ¿Con qué
grado de confianza se realizó esta investigación? Rpta. 0,9714

11. El consumo regular de cereales preendulzados contribuye a la caída de los dientes, enfermedades
del corazón y otros procesos degenerativos. En una muestra aleatoria de 20 porciones sencillas de un
cereal el contenido promedio de azúcar fue de 11,3 gr con desviación estándar de 2,45 gr. Suponiendo
que los contenidos de azúcar están distribuidos normalmente. Determine un intervalo de confianza del
95% para el contenido promedio de azúcar en porciones sencillas de dicho cereal.
Rpta 10,15 ≤ µ ≤ 12,45

12. Algunos investigadores creen que la vitamina C puede ser útil para reducir el colesterol en las
paredes internas de las arterias. Se observa el nivel de colesterol de 50 personas (con niveles de colesterol
mayores que lo normal) antes y después de un tratamiento de un mes bajo un régimen de 500 mg de
vitamina C por día, obteniéndose una media de 64,3 mg/100ml y desviación estándar de 18,9 mg en la

106

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

disminución del nivel de colesterol. Estime la disminución promedio por persona del nivel de colesterol,
usando un intervalo de confianza del 90%. Rpta 59,8 ≤ µ ≤ 68,8

13. Se determinaron los niveles del PH de la saliva en una muestra aleatoria de niños de escuela primaria,
los cuales presentaban una alta incidencia de caries. Los resultados fueron los siguientes:
7,36 7,04 7,19 7,41 7,10 7,15 7,36 7,57 7,64 7,00 7,25 7,19
Halle un intervalo de confianza para la media con un 98% de confiabilidad.

14. Ciertos investigadores se interesan por la calidad del aire; uno de estos indicadores es el número de
microorganismos de partículas de suspensión por m3. Para controlar la situación se hace una lectura cada
6 días extrayendo 1m3 de aire a través de un filtro y determinando el número de µg de partículas
concentradas en él. Los datos observados para un período de 30 días fueron:
58 70 57 61 59
Supóngase que por experiencias anteriores se sabe que la variable número de microorganismos de
partículas está distribuida normalmente con varianza de 9. Halle un intervalo de confianza para la media
con α = 0.01 Rpta 58 ≤ µ ≤ 64 aproximadamente
15. Se pretende estimar el número promedio de latidos por minuto para cierta población. Se encontró
que el número promedio de latidos por minuto para 49 personas era de 90. Considere que esos 49
pacientes constituyen una muestra aleatoria y que la población sigue una distribución normal, con una
desviación estándar de 10. Use α = 0,02 Rpta 87 ≤ µ ≤ 93
16. Entre 100 peces capturados en cierto lago 18 no eran comestibles debido a la contaminación del
medio ambiente. ¿Con qué confianza se puede asegurar que el error de estimación es a lo mucho de
0,065? Rpta. 0,909
17. En una muestra al azar de 127 niños de guarderías infantiles se han diagnosticado 7 niños con
sintomatología autista y 12 niños con enuresis nocturna. Utilizando α = 0,05.
a) Determine un intervalo de confianza para la proporción de niños autistas que hay en la población,
origen de la muestra. Rpta. 0,015 ≤ p ≤ 0,095
b) Determine un intervalo de confianza para la proporción de niños con enuresis nocturna que hay en la
población, origen de la muestra. Rpta. 0,043 ≤ p ≤ 0,14

107

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

MUESTREO Y TAMAÑO DE LA MUESTRA

MUESTREO: Técnica estadística que permite seleccionar los elementos que se analizarán o
evaluarán de la población.

Se pueden realizar diferentes tipos de muestreo, que quedan clasificados en dos grandes grupos:
probabilísticos y no probabilísticos. En el muestreo probabilístico, todos los individuos o elementos de
la población tienen la misma probabilidad de ser incluidos en la muestra extraída, asegurándonos la
representatividad de la misma. En el muestreo no probabilístico, por su parte, los elementos de la
muestra se seleccionan siguiendo criterios determinados.

MUESTREO PROBABILISTICO

Muestreo aleatorio simple, cuando todos los elementos de la población tienen la misma probabilidad
de ser seleccionados en la muestra y esta probabilidad es conocida. Este tipo de muestreo es más
recomendable, cuando las unidades de análisis son relativamente homogéneas. Para seleccionar una
muestra de este tipo se requiere tener en forma un listado de todos los elementos que integran la
población investigada y utilizar tablas de números aleatorios o un software estadístico.

Muestreo aleatorio sistemático, el cual es susceptible de ser más preciso que el muestreo aleatorio
simple. Se elige un primer elemento luego se van escogiendo los demás elementos a intervalos
constantes a partir del primero hasta completar el tamaño de la muestra.

Muestreo aleatorio estratificado, se usa para estimar parámetros de poblaciones muy heterogéneas,
consistes en la separación de las unidades de la población en grupos o estratos, de tal manera que entre
estratos haya cierta heterogeneidad, pero además exista cierta homogeneidad dentro de cada estrato. De
cada estrato se extrae una muestra aleatoria simple.

Muestreo aleatorio conglomerado, no se necesita un marco muy específico como en el caso del
muestreo aleatorio simple en el que era necesario disponer de un listado de unidades de la población, o
como en el muestreo estratificado, donde era necesario disponer de listados de unidades por estratos. Se
divide previamente a la población en conglomerados o áreas convenientes, de los cuales se seleccionará
algunos de ellos para la muestra, con lo que sólo es necesario un marco de conglomerados que será más
fácil de conseguir y más barato. Se pueden utilizar como marco divisiones territoriales ya establecidas
por necesidades administrativas para las cuales existe ya información. También se pueden utilizar como
marco áreas geográficas cuyas características están ya muy delimitadas.

Tamaño de muestra(n)

PARA ESTIMAR LA MEDIA PARA ESTIMAR LA PROPORCIÓN


SITUACIÓN
POBLACIONAL POBLACIONAL

N ES 𝑧𝛼2⁄ . 𝜎 2 𝑧𝛼2⁄ . 𝑝. 𝑞
2 2
INFINITA 𝑛= 𝑛=
𝑒2 𝑒2

𝑧𝛼2⁄ . 𝑁. 𝜎 2 𝑧𝛼2⁄ . 𝑁. 𝑝𝑞
2 2
N ES FINITA 𝑛= 𝑛=
𝜎 2 𝑧𝛼2⁄ + (𝑁 − 1)𝑒 2 𝑝𝑞𝑧𝛼2⁄ + (𝑁 − 1)𝑒 2
2 2

108

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Donde:

Precisión de estimación (e) llamado también margen de error o error de muestreo y viene a ser la
diferencia máxima que existirá entre el valor del estadístico y el parámetro.
𝑧𝛼⁄2 es llamado coeficiente de confiabilidad cuyo valor se encuentra en la tabla de la distribución normal
estándar y va depender del nivel de confianza.
N corresponde al tamaño de la población
𝜎 2 es la varianza poblacional
p es la proporción que posee la característica que se estudia
q es la proporción que no posee la característica que se estudia. (q =1- p)

EJERCICIOS DESARROLLADOS

Ejemplo 1: Se quiere hacer una encuesta para estimar el tiempo


promedio por semana que los niños ven televisión. Por estudios
anteriores se sabe que la desviación estándar de dicho tiempo es de 3
horas. Con el nivel de confianza del 95%.
a) ¿Qué tamaño de muestra se debe elegir, de tal manera que el error
de estimación no sea superior a media hora?
Resolución
𝒁𝜶/𝟐 𝝈 𝟐 𝟏, 𝟗𝟔𝒙𝟑 𝟐
𝒏=( ) =( ) = 𝟏𝟑𝟖, 𝟑 → 𝒏 = 𝟏𝟑𝟗 𝑛𝑖ñ𝑜𝑠
𝒆 𝟎, 𝟓
El tamaño de la muestra es de aproximadamente 139 niños.
b) ¿Qué costo se debe presupuestar para hacer la encuesta, si esta tiene un costo fijo de $5000 más un
costo variable de $2 por cada entrevista?
Resolución:
5000 + 2 (139) = $5278

El costo que se debe presupuestar es de $5278


Ejemplo 2: Un analista de investigación de mercados escogió una muestra aleatoria de 100 clientes de
una población de 500 clientes de una gran tienda que declaran ingresos mayores a $800. El encontró que
los clientes de la muestra gastaban en la tienda un promedio de $ 1000 por año. Si con este valor de la
muestra estimó que el gasto promedio por año de esta población varía de $940 a $1060. Suponga que la
desviación estándar de tal población es de $300

a) ¿Qué nivel de confianza se utilizó?

Datos
n = 100 Se sabe que: 904 ≤  ≤ 1060 luego e = $ 60
N = 500
𝑋̅ = $1000 𝑍𝛼⁄ 𝜎 𝑁 − 𝑛
2 √
=𝑒
√𝑛 𝑁−1

109

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

300 500 − 100


𝑍𝛼⁄2 √ = 60
√100 500 − 1

26,86 𝑍𝛼⁄2 = 60 luego 𝑍𝛼⁄2 = 2,23

Luego el nivel de confianza será: P ( - 2,23  Z  2,23 ) = 0,9743

Es decir, se tiene una confianza del 97,43 % de que la media muestral


𝑋̅ = $1000 difiere de la media verdadera en a lo más $ 60.

b) De qué tamaño tendrá que ser la muestra para que se tenga una confianza del 97 % de que, al
estimar la media de la población, el error de estimación no sea mayor a $ 50.

𝑧𝛼2⁄ . 𝜎 2 . 𝑁 (2,17)2 . (300)2 . 500


2
𝑛= = = 126,8 ≈ 127
𝑧𝛼2⁄ 𝜎 2 + 𝑒 2 (𝑁 − 1) (2,17)2 . (300)2 + (50)2 (499)
2

Ejemplo 3: La oficina de Planificación Familiar de cierto distrito


desea determinar la proporción de familias con un ingreso mensual
inferior a S/ 800. Estudios previos han indicado que esta proporción
era del 20%. ¿Qué tamaño muestral se requiere para asegurar con una
confianza del 95% que el error en la estimación de esta proporción no
sobrepase a 0,03?
Solución:
𝒁𝟐 𝜶/𝟐 𝒑𝒒 (𝟏, 𝟗𝟔)𝟐 (𝟎, 𝟐)(𝟎, 𝟖)
𝒏= → 𝒏 = = 𝟔𝟖𝟑𝒇𝒂𝒎𝒊𝒍𝒊𝒂𝒔
𝒆𝟐 (𝟎, 𝟎𝟑)𝟐
El tamaño de la muestra es de aproximadamente 683 familias.

Ejemplo 4. En una determinada región se tomó una muestra aleatoria de 125 individuos, de los
cuales 12 padecían afecciones pulmonares.
a) Estímese la proporción de individuos con afecciones pulmonares en dicha región; con un
95% de confiabilidad.
b) Si queremos estimar dicha proporción con un error máximo del 4%, con una confianza del 95%,
¿qué tamaño de muestra debemos tomar?

Solución Se sabe que:


𝒙 𝑷𝒆𝒓𝒔𝒐𝒏𝒂𝒔 𝒄𝒐𝒏 𝒂𝒇𝒆𝒄𝒄𝒊𝒐𝒏𝒆𝒔 𝒑𝒖𝒍𝒎𝒐𝒏𝒂𝒓𝒆𝒔
̂ = 𝒑𝒓𝒐𝒑𝒐𝒓𝒄𝒊ó𝒏 𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒍 → 𝒑
Sea 𝒑 ̂= =
𝒏 𝑻𝒂𝒎𝒂ñ𝒐 𝒅𝒆 𝒎𝒖𝒆𝒔𝒕𝒓𝒂

𝟏𝟐
̂=
luego 𝒑 = 𝟎, 𝟎𝟗𝟔
𝟏𝟐𝟓

𝑝̂ 𝑞̂ 𝑝̂ 𝑞̂
𝑝̂ − 𝑍𝛼 √ £ 𝑝 £ 𝑝̂ + 𝑍𝛼/2 √
2 𝑛 𝑛

𝑝̂𝑞̂
En consecuencia, los límites serán 𝑝̂ ± 𝑍𝛼/2 √
𝑛

110

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

0,096𝑥0,904
0,096 ± 1,96√ , 𝑙𝑢𝑒𝑔𝑜 0,096 ± 0,052
125

Por lo tanto 0,044 < 𝑝 < 0,148

Conclusiones:

- Podemos afirmar con un 95% de confiabilidad que la proporción de personas que padecen de
afecciones pulmonares en dicha región estaría entre el 4% y 15%
- También podemos afirmar con un 95% de confiabilidad que la proporción de personas que
padecen de afecciones pulmonares en dicha región es del 9,6%, con un margen de error de 5,2%

b) Si queremos estimar dicha proporción con un error máximo del 3%, para una confianza
del 95%, ¿qué tamaño de muestra debemos tomar?

𝑝̂𝑞̂
Sabemos que 𝑍𝛼/2 √ 𝑛 = 𝑒 (𝑚𝑎𝑟𝑔𝑒𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟)

2
𝑍𝛼/2 𝑝̂𝑞̂
luego 𝑛 = 𝑒2
𝑐𝑢𝑎𝑛𝑑𝑜 𝑛𝑜 𝑠𝑒 𝑐𝑜𝑛𝑜𝑐𝑒 𝑁

(1,96)2 (0,096)(0,904)
𝑛= = 370,4 → 𝑛 = 371𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠
(0,03)2

Con una muestra de 371 personas estaremos 95% seguro, que a partir de dicha muestra obtendremos
una proporción muestral cuyo valor diferirá de la verdadera proporción en a lo más 0,03.

EJERCICIOS PROPUESTOS

1. Se ha proyectado una encuesta para determinar los gastos


médicos anuales promedio por familia de los empleados de una gran
compañía. La administración de la compañía desea tener una
confianza del 95% de que el promedio de la muestra esté correcto en
una escala de ± $50 de los gastos reales promedio por familia. Un
estudio piloto señala que la desviación estándar se puede estimar
como $400. ¿Qué tamaño de muestra se necesita?

2. Si un gerente de control de calidad quisiera estimar la vida promedio de un producto en una escala
± 20 horas con una confianza del 95% y también supone que la desviación estándar del proceso
permanece en 100 horas ¿qué tamaño de muestra se necesita?

3. Si una cadena de supermercados quisiera estimar el importe promedio de ventas en una escala de ±
$100 con una confianza del 99% y si se supone que la desviación estándar de la población es $200
¿qué tamaño de muestra se necesita?

4. Si una compañía de gas quisiera estimar el tiempo de espera promedio en días, dentro de ±5 días con
una confianza del 95% y si se supone que la desviación estándar de la población es de 20 días ¿qué
tamaño de muestra se necesita?

111

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

5. Un analista político quisiera estimar la proporción de votantes


que elegirán al candidato demócrata en una campaña presidencial.
El analista quisiera tener una confianza del 90% de que su
predicción esté correcta en una escala de ±0,04 de la proporción
real. ¿Qué tamaño de muestra se necesita?

6. El gerente de un banco quiere tener una confianza del 90% de estar en lo correcto en una escala de
± 0,05 de la proporción real de depositantes, que tienen al mismo tiempo cuentas de ahorro y de
cheques. ¿Qué tamaño de muestra se necesita?

7. ¿Qué tamaño de muestra se necesitará si una compañía de


autobuses quisiera realizar una encuesta, en la que desearía tener
una confianza del 95% de estar en lo correcto en una escala de
± 0,02 de la proporción real de viajeros que utilizarían el servicio de
autobús? En base a la experiencia con otras rutas, se supone que la
proporción real es de aproximadamente 0,40.

8. Un equipo de investigación médica está seguro sobre un suero que han desarrollado, el cual curará
cerca del 75% de los pacientes que sufren de ciertas enfermedades. ¿Qué tamaño debe ser la muestra
para que el grupo pueda estar seguro en un 98% que la proporción muestral de los que se curan esté
dentro de ± 0,04 de la proporción de todos los casos que el suero curará? Rpta. n = 637

9. El mantenimiento de cuentas puede resultar demasiado costoso, si el


promedio de compra por cuenta, baja de cierto nivel. El gerente de un
gran almacén por departamentos desea estimar el promedio de lo
comprado mensualmente por los clientes que usan la cuenta de
crédito, con un error de $2500, y con un nivel de confianza del 95%.
¿Cuántas cuentas deberá seleccionar, si se sabe que la desviación
estándar es de $ 30 000, la cual fue obtenida de los balances mensuales
de las cuentas de crédito?
10. Una firma constructora desea estimar la resistencia promedio de las barras de acero utilizadas en la
construcción de edificios de apartamentos. ¿Qué tamaño de muestra requiere para garantizar con nivel
de significancia del 2% de no sobrepasar un error de 5kg? La desviación estándar de la resistencia de
este tipo de barras se estima en 25 kg.

11.Un investigador está interesado en estimar la ganancia promedio


en peso total en 4 semanas de 2000 pollitos alimentados con una
nueva ración. Obviamente pesar cada ave seria tedioso y llevaría
demasiado tiempo. Por tanto, se debe determinar el número de
pollitos a seleccionar en una muestra tomando en cuento que el error
máximo permitido es 10 gramos. Muchos estudios similares sobre
nutrición de pollitos se han llevado a cabo en el pasado. Usando
datos de estudios, el investigador encontró que la varianza es aproximadamente de 36 gramos.
Determine el tamaño de muestra requerido.

12.Se desea realizar una investigación sobre el número de unidades


que se encuentran en mal estado en 4000 cajas y la proporción de
cajas que contienen unidades en mal estado. Se realiza una encuesta
preliminar de 80 cajas con el siguiente resultado, presentado en una
tabla de frecuencias:

112

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Nº de unidades defectuosas 0 1 2 3 4 5 10 12
Nº de cajas examinadas 27 15 12 12 6 4 2 2

Determine el tamaño de muestra con un error de 0,8 y un nivel de confianza de 94%.

13. Se desea estimar el promedio de pH de las lluvias en un área que experimenta una gran
contaminación por parte de la descarga del humo de una planta de energía eléctrica. Si se sabe que la
desviación estándar tiene un valor de 0,5 pH y se desea que la estimación difiera a lo más en 0,1 de la
media verdadera con una probabilidad de 0,95. ¿Cuántas lluvias deben incluirse aproximadamente en la
muestra (una lectura de pH por lluvia)? Rpta. n = 97 aprox.

113

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

PRUEBAS DE HIPÓTESIS

PRUEBAS DE HIPÓTESIS ACERCA DE UNA SOLA MEDIA

1° Caso: Cuando la muestra proviene de una población normal con varianza σ2 conocida

Sea X la media de una muestra aleatoria de tamaño n seleccionada de una población con media  y
varianza 2 supuestamente conocida.
Si la población es normal, entonces la distribución de la estadística X es exactamente normal
N (, 2/ n)

La estadística para esta prueba es:

𝑋̅−𝜇
𝑍=𝜎  N (0, 1)
⁄ 𝑛

1.- Diez análisis repetidos de la concentración de mercurio en una muestra de condensado de gas
comercial proporcionaron los siguientes resultados en ng/mL
23,3 22,5 21,9 21,5 19,9 21,3 21,7 23,8 22,6 24,7
Suponiendo que la concentración de mercurio se distribuye normalmente con una desviación estándar
igual a 1,5 y teniendo en cuenta que a partir de una media igual a 24 existe una alta toxicidad.
Con α = 0,05 ¿Evidencian los datos la existencia de una alta toxicidad?

Resolución A partir de los datos obtenemos 𝑋̅ = 22,32 luego plantearemos las hipótesis:

1) Hipótesis 𝐻0 : 𝜇 ≥ 24 La concentración de mercurio no es menor de 24 ng/mL


(Existencia de una alta toxicidad)
𝐻1 : 𝜇 < 24 La concentración de mercurio es menor de 24 ng/mL
(No hay existencia de una alta toxicidad)
2) Nivel de significación: 𝛼 = 0,05

𝑋̅−𝜇 22,32−24
3) Estadístico de prueba: 𝑍𝑐 = 𝜎 = 1,5 = −3,54
⁄ 𝑛
√ √10

4) Regla de decisión: Rechazaremos 𝑯𝟎 si 𝑍𝑐 < 𝑍𝛼 = −1,645


(Valor interpolado hallado en la tabla normal estandarizada)

Por lo tanto, la decisión será rechazar la hipótesis 𝐻0

5) Conclusión: Los datos no evidencian la existencia de una alta toxicidad con un nivel de significancia
de 0,05.

Ejemplo 2. La estatura media de los alumnos de cierta universidad es de 1,68 m con desviación
estándar de 5 cm. ¿Hay razón para creer, que se ha producido un cambio en la estatura promedio, si una
muestra de 25 estudiantes dio una estatura promedio de 1,70 m?
Suponiendo que la estatura de los alumnos de cierta universidad se distribuye normalmente utilice un
nivel de significación de 0,05.
Resolución
1) Hipótesis 𝐻0 : 𝜇 = 1,68 𝑚 La estatura promedio de los alumnos es de 1,68
(No hay un cambio en la estatura)
𝐻1 : 𝜇 ≠ 1,68 𝑚 La estatura promedio de los alumnos es diferente de 1,68
(Hay un cambio en la estatura)

114

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

2) Nivel de significación: 𝛼 = 0,05

𝑋̅−𝜇 1,70−1,68
3) Estadístico de prueba: 𝑍𝑐 = 𝜎 → 𝑍𝑐 = 0,05 =2
⁄ 𝑛
√ √25

4) Regla de decisión: Rechazaremos 𝑯𝟎 si 𝑍𝑐 < −𝑍𝛼/2 𝑜 𝑍𝑐 > 𝑍1−𝛼/2 en donde 𝑍𝛼/2 = −1,96 y
𝑍1−𝛼/2 = 1,96 (Valor hallado en la tabla normal estandarizada)
Por lo tanto, la decisión será rechazar la hipótesis 𝐻0

5) Conclusión: La muestra está evidenciando que la estatura promedio ha cambiado con un nivel de
significancia de 0,05.

2° Caso: Cuando la muestra proviene de una población normal con varianza σ2 desconocida

Cuando el muestreo se realiza a partir de una población que sigue una distribución normal con una
varianza poblacional desconocida, entonces la distribución de la media muestral sigue una distribución
T. La estadística de prueba es:
𝑋̅ − 𝜇
𝑇𝑐 =
𝑆⁄
√𝑛
Ejemplo 1.- Una máquina vendedora de refrescos se ajusta para servir 6 onzas por vaso. La máquina se
pone en funcionamiento y se analiza una muestra de 9 vasos obteniendo un llenado medio de 6,4 onzas
con desviación estándar de 0,5 onzas. A un nivel de significancia de 0,05. ¿Esto evidencia de que la
máquina está llenando demasiado los vasos? Suponiendo que el contenido de llenado de maquina se
distribuye normalmente.
Resolución
Sea X la variable aleatoria que denota la cantidad servida por la máquina. Se supone que la variable X
se distribuye normalmente con media µ y varianza σ2 desconocida.
1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0 : 𝜇 = 6 𝑜𝑛𝑧𝑎𝑠 La cantidad de llenado promedio de la maquina no es superior a 6 onzas
𝐻1 : 𝜇 > 6 𝑜𝑛𝑧𝑎𝑠 La cantidad de llenado promedio de la maquina es superior a 6 onzas
2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,05

𝑋̄ − 𝜇 6,4 − 6
3) Estadístico de prueba ∶ 𝑇𝑐 = → 𝑇𝑐 = = 2,4
𝑆⁄ 0,5
√𝑛 ⁄
√9
4) 𝐑𝐞𝐠𝐥𝐚 𝐝𝐞 𝐝𝐞𝐜𝐢𝐬𝐢ó𝐧: 𝑅𝑒ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0 𝑠𝑖 𝑇𝑐 > 𝑡(1 − 𝛼; 𝑛 − 1)
𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑡(1 − 𝛼; 𝑛 − 1) = 1,86(Valor hallado en la tabla t de Student) con n-1 grados de libertad
Por lo tanto rechazaremos la hipótesis H0
5) 𝐂𝐨𝐧𝐜𝐥𝐮𝐬𝐢ó𝐧: Efectivamente, los resultados evidencian que la máquina está llenando
demasiado los vasos con un nivel de significancia de 0, 05.
Ejemplo 2.- En su calidad de comprador comercial para una marca privada de un supermercado,
suponga que se toma una muestra aleatoria de 12 sobres de café de una empacadora. Se encuentra que
el peso promedio de café de cada sobre es de 15,97 gramos con desviación estándar de 0,15 gr.
Los empacadores afirman que el peso neto promedio mínimo de café es de 16 gr por sobre. ¿Puede
rechazarse esta afirmación con un nivel de significación del 5%? Suponiendo que el peso de los sobres
de café de una empacadora se distribuye normalmente.
Solución

115

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0 : 𝜇 ≥ 16𝑜𝑛𝑧𝑎𝑠 El peso promedio un sobre de café no es menor a 16 onzas


𝐻1 : 𝜇 < 16𝑜𝑛𝑧𝑎𝑠 El peso promedio un sobre de café es menor a 16 onzas
2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,05

𝑋̄ − 𝜇 15,97 − 16
3) Estadístico de prueba ∶ 𝑇𝑐 = → 𝑇𝑐 = = −0,69
𝑆⁄ 0,15
√𝑛 ⁄
√12
4)Regla de decisión: 𝐑𝐞𝐜𝐡𝐚𝐳𝐚𝐫𝐞𝐦𝐨𝐬 𝑯𝟎 𝑠𝑖 𝑇𝑐 < 𝑡(𝛼; 𝑛 − 1)
en donde 𝑡(𝛼; 𝑛 − 1) = −1,80 (Valor hallado en la tabla t de Student) con n − 1
grados de libertad)
Por lo tanto la decisión será 𝐧𝐨 𝐫𝐞𝐜𝐡𝐚𝐳𝐚𝐫 𝐥𝐚 𝐡𝐢𝐩ó𝐭𝐞𝐬𝐢𝐬 𝐇𝟎

5) 𝐂𝐨𝐧𝐜𝐥𝐮𝐬𝐢ó𝐧: No tenemos razones suficientes como para rechazar tal afirmación es decir,
el peso promedio un sobre de café por lo menos 16 onzas con un nivel de significancia de
0,05.
Ejemplo 3.- Cuando funciona correctamente; un proceso produce frascos de mermelada, cuyo contenido
pesa en promedio 200 gramos. Una muestra aleatoria de 9 frascos de una remesa presentó los siguientes
pesos (en gramos) para el contenido:
214 197 197 206 208 201 197 203 209
Contrastar la hipótesis nula, de que el proceso está funcionando correctamente, al nivel del 5%.
Suponiendo que el peso de los frascos de mermelada se distribuye normalmente.
Solución
1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠
𝐻0 : 𝜇 = 200 𝑔𝑟𝑎𝑚𝑜𝑠 El peso promedio de un frasco de mermelada es de 200 gramos
𝐻1 : 𝜇 ≠ 200 𝑔𝑟𝑎𝑚𝑜𝑠 El peso promedio de un frasco de mermelada es diferente de 200 gramos
2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,05

𝑋̄ − 𝜇 203,56 − 200
3) Estadístico de prueba ∶ 𝑇𝑐 = → 𝑇𝑐 = = 1,74
𝑆⁄ 6,13

√𝑛 √9
4)𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0 𝑠𝑖 𝑇 < 𝑡(𝛼/2; 𝑛 − 1) 𝑜 𝑇 > 𝑡(1 − 𝛼/2; 𝑛 − 1)
𝛼 𝛼
𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑡(1 − 2 ; 𝑛 − 1) = 2,306 𝑡 ( 2 ; 𝑛 − 1) = −2,306

(Valor hallado en la tabla t de Student) con n-1 grados 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑.


Por lo tanto la decisión será no rechazar la hipótesis H0

5) 𝐂𝐨𝐧𝐜𝐥𝐮𝐬𝐢ó𝐧: Los datos recogidos en la muestra proporcionan evidencia suficiente


como para sostener que el proceso está bajo control con un nivel de significancia de 0,05.
Ejemplo 4.- En el pasado una planta química ha producido un promedio de 1100 kg/día de un
compuesto. Los archivos del año pasado en base a 260 días de operación muestran lo siguiente:
𝑋̄ = 1060𝑘𝑔/𝑑í𝑎 𝑆 = 340𝑘𝑔

116

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Se desea saber si el promedio de producción diaria ha bajado significativamente durante el


año pasado. Suponiendo que el peso de la producción diaria de cierto compuesto se distribuye
normalmente utilice α = 0,05.

Solución: Utilizaremos la variable Z por ser la muestra muy grande

1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠
𝐻0 : 𝜇 = 1100𝑘𝑔 La producción promedio de un compuesto por día es 1110 kg
𝐻1 : 𝜇 < 1100𝑘𝑔 La producción promedio de un compuesto por día es menor de 1110 kg

2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,05


𝑋̄−𝜇 1060−1100
3) Estadístico de prueba: 𝑍𝑐 = 𝜎̂ → 𝑍𝑐 = 340⁄ = −1,897

√𝑛 √260

4)𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0 𝑠𝑖 𝑍 < 𝑍𝛼


𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑍𝛼 = −1,645 (𝐕𝐚𝐥𝐨𝐫 𝐡𝐚𝐥𝐥𝐚𝐝𝐨 𝐞𝐧 𝐥𝐚 𝐭𝐚𝐛𝐥𝐚 𝐧𝐨𝐫𝐦𝐚𝐥 𝐞𝐬𝐭𝐚𝐧𝐝𝐚𝐫𝐢𝐳𝐚𝐝𝐚)
Por lo tanto la decisión será 𝐫𝐞𝐜𝐡𝐚𝐳𝐚𝐫 𝐥𝐚 𝐡𝐢𝐩ó𝐭𝐞𝐬𝐢𝐬 𝐇𝟎

5) 𝐂𝐨𝐧𝐜𝐥𝐮𝐬𝐢ó𝐧: 𝐿𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎𝑛 𝑞𝑢𝑒 𝑙𝑎 𝑝𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑛 𝑏𝑎𝑗ó


𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎𝑚𝑒𝑛𝑡𝑒 con un nivel de significancia de 0,05.
Ejemplo 5.- Se ha valorado el tiocianato en el plasma de los individuos de una muestra formada por 38
fumadores y se ha observado una media de 1,1 mg/l y una desviación estándar de 0,4 mg. El tiocianato
en el plasma de la población adulta presenta distribución normal con una media de 0,9 mg/l.
¿El consumo de tabaco aumenta el nivel de tiocianato en el plasma? Use α = 0,05
Solución:
Sea X la variable aleatoria que denota la cantidad de tiocianato en el plasma. Se supone que la variable
X se distribuye normalmente con media µ y varianza σ2 desconocida.
1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0 : 𝜇 = 0,9 𝑚𝑔 El consumo de tabaco no aumenta el nivel de tiocianato en el plasma de
los individuos
𝐻1 : 𝜇 > 0,9𝑚𝑔 El consumo de tabaco aumenta el nivel de tiocianato en el plasma
los individuos
2) 𝑁𝑖𝑣𝑒𝑙𝑑𝑒𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,05

𝑋̄ − 𝜇 1,1 − 0,9
3)Estadístico de prueba ∶ 𝑇𝑐 = → 𝑇𝑐 = = 3,08
𝑆⁄ 0,4

√𝑛 √38
4)𝐑𝐞𝐠𝐥𝐚 𝐝𝐞 𝐝𝐞𝐜𝐢𝐬𝐢ó𝐧: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0 𝑠𝑖 𝑇𝑐 > 𝑡(1−𝛼;𝑛−1)
𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑡(1−𝛼;𝑛−1) = 1.69 (𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝑡 𝑑𝑒 𝑆𝑡𝑢𝑑𝑒𝑛𝑡) 𝑐𝑜𝑛 𝑛 − 1 𝑔𝑟𝑎𝑑𝑜𝑠

𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑.
𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑙𝑎 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛 𝑠𝑒𝑟á 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0

5) 𝐂𝐨𝐧𝐜𝐥𝐮𝐬𝐢ó𝐧: 𝐸𝑥𝑖𝑠𝑡𝑒 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑠𝑢𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑐𝑜𝑚𝑜 𝑝𝑎𝑟𝑎 𝑐𝑜𝑛𝑐𝑙𝑢𝑖𝑟 𝑞𝑢𝑒 𝑒𝑙 𝑐𝑜𝑛𝑠𝑢𝑚𝑜 𝑑𝑒 𝑡𝑎𝑏𝑎𝑐𝑜
117

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

𝑎𝑢𝑚𝑒𝑛𝑡𝑎 𝑒𝑙 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑡𝑖𝑜𝑐𝑖𝑎𝑛𝑎𝑡𝑜 𝑒𝑛 𝑒𝑙 𝑝𝑙𝑎𝑠𝑚𝑎 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝑑𝑒 0,05.


Ejemplo 6.- Las especificaciones de determinado medicamento exigen 30% de aspirina en cada
comprimido. Se toman aleatoriamente y analizan 16 comprimidos; la concentración media de aspirina
es 30,4% con desviación estándar de 0,8%. ¿El fármaco, cumple las especificaciones a nivel de
significación de 0,01? Nota: La concentración de aspirina de cada comprimido se distribuye
normalmente.
Resolución:
1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠
𝐻0 : 𝜇 = 30 La concentración media de aspirina en cada comprimido de cierto medicamento es 30%
𝐻1 : 𝜇 ≠ 30 La concentración media de aspirina en cada comprimido de cierto medicamento es del 30%
2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,01

𝑋̄ − 𝜇 30,4 − 30
3) Estadístico de prueba ∶ 𝑇𝑐 = → 𝑇𝑐 = =2
𝑆⁄ 0,8

√𝑛 √16
4)𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0 𝑠𝑖 𝑇𝑐 < 𝑡(𝛼/2;𝑛−1) 𝑜 𝑇𝑐 > 𝑡(1−𝛼/2;𝑛−1)
𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑡(𝛼/2;𝑛−1) = −2,9467 𝑦 𝑡(1−𝛼;𝑛−1) = 2,9467
2
(𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝑡 𝑑𝑒 𝑆𝑡𝑢𝑑𝑒𝑛𝑡) 𝑐𝑜𝑛 𝑛 − 1 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑.

Por lo tanto, la decisión será no rechazar la hipótesis Ho


5) 𝐂𝐨𝐧𝐜𝐥𝐮𝐬𝐢ó𝐧: Tenemos razones sufucientes como para concluir que el fármaco si cumple

con las especificaciones establecidas con un nivel de significancia de 0,01.

PRUEBAS DE HIPÓTESIS ACERCA DE UNA SOLA PROPORCIÓN

En muchos problemas prácticos, queremos contrastar hipótesis sobre la proporción de elementos de una
población que poseen cierto atributo. La inferencia sobre la proporción poblacional se basa en la
proporción de individuos de una muestra aleatoria que poseen el atributo de interés.
Para evaluar la magnitud de la diferencia entre la proporción muestral ( p̂ ) y la proporción poblacional
(p) supuesta, es necesario que la muestra aleatoria sea lo suficientemente grande (np o nq ≥ 5) es decir
n ≥ 100 aproximadamente.

La variable estadística para esta prueba es:


𝑝̂ − 𝑝
𝑍𝑐 =
𝑝𝑞

𝑛

Ejemplo 1.- Una industria lechera está estudiando la posibilidad de cambiar sus botellas para la leche
por envases de plástico; pero el cambio no se hará a no ser que por lo menos 70% de sus clientes lo
prefieran. Cuando se ha hecho una encuesta a 200 de sus clientes, 120 de ellos están a favor del cambio.
¿Hará el cambio de envases a un nivel de significancia de 0,05?
Resolución:
1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0 : 𝑝 ≥ 0,7
𝐻1 : 𝑝 < 0,7

118

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,05


𝑝̂ − 𝑝 0,6 − 0,7
3) Estadístico de prueba: 𝑍𝑐 = → 𝑍𝑐 = = −3,08
𝑝𝑞
√ √0,7𝑥0,3
𝑛 200
4) 𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0 𝑠𝑖 𝑍𝑐 < 𝑍𝛼

𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑍𝛼 = −1,65 (𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝑛𝑜𝑟𝑚𝑎𝑙 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑖𝑧𝑎𝑑𝑎)


𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑙𝑎 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛 𝑠𝑒𝑟á 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0

5) 𝐂𝐨𝐧𝐜𝐥𝐮𝐬𝐢ó𝐧: No tenemos suficiente razón como para sugerir se haga el cambio de envase
con un nivel de significancia de 0,05.
Ejemplo 2.- Un fabricante de lavadoras automáticas produce un modelo particular en tres colores A, B
y C. De las primeras 1000 lavadoras vendidas, se nota que 400 eran del color A. ¿Concluiría que los
clientes tienen una preferencia por el color A? Use α = 0,01
Resolución:
1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠
𝐻0 : 𝑝 ≤ 0,33 El porcentaje de personas que prefieren la lavadora de color blanco no es superior al 33%
𝐻1 : 𝑝 > 0,33 El porcentaje de personas que prefieren la lavadora de color blanco es superior al 33%
2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,01
𝑝̂ − 𝑝 0,40 − 0,33
3) Estadístico de prueba: 𝑍𝑐 = → 𝑍𝑐 = = 4,707
𝑝𝑞
√ √0,33𝑥0,67
𝑛 1000
4) 𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0 𝑠𝑖 𝑍𝑐 > 𝑍1−𝛼

𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑍1−𝛼 = 2,33 (Valor hallado en la tabla normal estandarizada).


Por lo tanto la decisión será rechazar la hipótesis H0

5) 𝐂𝐨𝐧𝐜𝐥𝐮𝐬𝐢ó𝐧: Los datos muestran evidencia mas que suficiente como para concluir que los
clientes tienen mayor preferencia por la lavadora de color A con un nivel de significancia de 0,01
.
Ejemplo 3.- De una lista de 2000 clientes de un banco comercial se seleccionó una muestra aleatoria
para obtener opinión acerca del servicio. En la muestra se halló que 215 no tenían quejas del servicio,
25 tenían quejas y 10 no opinan al respecto. Tradicionalmente el 5% tenían quejas del servicio, sin
embargo, se cree que ahora este porcentaje aumentó. ¿Cuál es la situación actual si se quiere una
probabilidad de 0,008 de cometer error de tipo I?
Resolución:
1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0 : 𝑝 = 0,05 El porcentaje de quejas respecto a un servicio es 5%
𝐻1 : 𝑝 > 0,05 El porcentaje de quejas respecto a un servicio es superior al 5%

2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,008

119

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

𝑝̂ − 𝑝 25
3) Estadístico de prueba: 𝑍𝑐 = 𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑝̂ = = 0,10
250
√𝑝𝑞 (𝑁 − 𝑛)
𝑛 𝑁−1

0,10 − 0,05
→ 𝑍𝑐 = = 3,88
√0,05𝑥0,95 (2000 − 250)
250 2000 − 1
4) 𝐑𝐞𝐠𝐥𝐚 𝐝𝐞 𝐝𝐞𝐜𝐢𝐬𝐢ó𝐧: Rechazaremos 𝐻0 𝑠𝑖 𝑍𝑐 > 𝑍1−𝛼

𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑍1−𝛼 = 2.41 (𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝑛𝑜𝑟𝑚𝑎𝑙 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑖𝑧𝑎𝑑𝑎).


𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑙𝑎 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛 𝑠𝑒𝑟á 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0

5) 𝐂𝐨𝐧𝐜𝐥𝐮𝐬𝐢ó𝐧: 𝐿𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑠𝑡á 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎𝑛𝑑𝑜 𝑞𝑢𝑒 𝑒𝑙 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑞𝑢𝑒𝑗𝑎𝑠 ℎ𝑎 𝑎𝑢𝑚𝑒𝑛𝑡𝑎𝑑𝑜


con un nivel de significancia de 0,008.

Ejemplo 4.- Una compañía farmacéutica afirma que un fármaco que elabora alivia los síntomas del
resfriado común durante un período de 10 horas en el 90% de quienes lo ingieren. En una muestra
aleatoria de 400 personas que ingirieron el fármaco, 350 aliviaron durante 10 horas. Al nivel de
significación de 0,05 la afirmación del fabricante es exacta?
Solución:
1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠
𝐻0 : 𝑝 = 0,9 El porcentaje de personas aliviadas de los síntomas de un resfriado es 90%
𝐻1 : 𝑝 ≠ 0,9 El porcentaje de personas aliviadas de los síntomas de un resfriado es diferente del 90%

2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,05


𝑝̂ − 𝑝 0,875 − 0,9
3) Estadístico de prueba: 𝑍𝑐 = → 𝑍𝑐 = = −1,67
𝑝𝑞
√ √0,9𝑥0,1
𝑛 400
4) 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑦𝑎 𝑞𝑢𝑒 𝑍1−𝛼/2 = 1,96 𝑦 𝑍𝛼/2 = −1,96

5) 𝐶𝑜𝑛𝑐𝑙𝑢𝑠𝑖ó𝑛: 𝑆𝑒 𝑡𝑖𝑒𝑛𝑒 𝑟𝑎𝑧𝑜𝑛𝑒𝑠 𝑠𝑢𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑐𝑜𝑚𝑜 𝑝𝑎𝑟𝑎 𝑒𝑠𝑡𝑎𝑟 𝑑𝑒 𝑎𝑐𝑢𝑒𝑟𝑑𝑜 𝑐𝑜𝑛


𝑙𝑎 𝑎𝑓𝑖𝑟𝑚𝑎𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑓𝑎𝑏𝑟𝑖𝑐𝑎𝑛𝑡𝑒 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 𝑒𝑙 porcentaje de personas aliviadas de los síntomas
𝑑𝑒 𝑢𝑛 𝑟𝑒𝑠𝑓𝑟𝑖𝑎𝑑𝑜 𝑒𝑠 𝑑𝑒𝑙 90% 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝑑𝑒 0,05.

120

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS PROPUESTOS
1.- El jefe de la Biblioteca Especializada de la Facultad de Ingeniería Eléctrica y Electrónica de la UNAC
manifiesta que el número promedio de lectores por día es de 350. Para confirmar o no este supuesto se
controla la cantidad de lectores que utilizaron la biblioteca durante 30 días. Se considera el nivel de
significancia de 0,05

Datos:

Día Usuarios Día Usuarios Día Usuario

1 356 11 305 21 429

2 427 12 413 22 376

3 387 13 391 23 328

4 510 14 380 24 411

5 288 15 382 25 397

6 290 16 389 26 365

7 320 17 405 27 405

8 350 18 293 28 369

9 403 19 276 29 429

10 329 20 417 30 364

2.- Los siguientes valores son las presiones sistólicas sanguíneas (en mm de Hg) de 12 pacientes que
experimentan terapia con drogas debido a que padecen de hipertensión.

183, 152, 178, 157, 194, 163, 144, 114, 178, 152, 118, 158

¿Puede concluirse a base de estos datos que la media de la población es menor que 165?
Utilice  = 0,05.

121

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

3.- Caso: Nivel de hemoglobina de la gestante

INTRODUCCIÓN

El nivel bajo de hemoglobina en gestantes durante el embarazo es previsible por las modificaciones
fisiológicas que suceden en el sistema circulatorio materno al final del embarazo, modificaciones a las
que se tiene que adaptar el cuerpo de la gestante. El nivel bajo de hemoglobina en la sangre de la gestante
puede conllevar a muchas patologías durante el embarazo, parto y puerperio, entre ellas el parto
pretérmino.

En el Hospital Santa Rosa se observa que la mayoría de las gestantes que acuden en el tercer trimestre
presentan un nivel de hemoglobina por debajo de lo normal, así como también se reportan con frecuencia
casos de amenaza de parto pretérmino; por lo cual se desea realizar un estudio para evaluar la relación
que existe entre el nivel de hemoglobina y el parto pretérmino.

ANTECEDENTES:

La Encuesta Demográfica de Salud Familiar 2000 (ENDES 2000) reporta un 38.6% de la prevalencia
de anemia (hemoglobina < 11g/dl.) en la mujer gestante. La OMS considera a la anemia como un factor
que aumenta el riesgo de parto pretérmino en la gestante.

Por ello el Ministerio de Salud en coordinación con el Centro Latinoamericano de Perinatología (CLAP),
establecen pautas para el control pre natal, una de ellas es la suplementación de hierro a todas las
gestantes que acuden al control, pero esto aún no se logra inclusive en un hospital de referencia.

PLANTEAMIENTO DEL PROBLEMA:

El jefe del Servicio de Gineco-Obstetricia del Hospital Santa Rosa desea saber si el nivel de hemoglobina
en promedio, de las gestantes en el tercer trimestre con diagnóstico de parto pre-término es menor a 11 mg/
dl; para lo cual toma una muestra al azar de 30 gestantes con dicho de diagnóstico, con un nivel de
significancia del 5%. Nota: Asumir que el nivel de hemoglobina de las gestantes en el tercer trimestre
presenta distribución normal.

BASE DE DATOS: Nivel de Hemoglobina en el 3er. Trimestre

10,9 11,2 9,8 11,6 9,9 10 11,2 10,2 10,8 9,5 10 10,9 11,5 10,4 10,9
10,3 11,7 11,2 9,8 10,4 11,4 11,3 10,5 10,2 11,1 10,6 9,9 8,9 10,8 9,5

4.- Un fabricante de cereales afirma que el peso promedio de cada caja de cereal es de 500 gramos. ¿Los
datos que a continuación se le dan apoyan la afirmación del fabricante? Pruebe con un nivel de
significancia α = 0,10

506, 508, 499, 503, 504, 510, 497, 512,


514, 505, 493, 496, 506, 502, 509, 496

5.- Los siguientes datos corresponden a los pesos en Kg de 15 hombres escogidos al azar: 72, 68, 63,
75, 84, 91, 66, 75, 86, 90, 62, 87, 77, 70, 69.

Pruebe la Ho: 𝜇 ≥ 74 con un nivel de significancia de 0,05. Nota: Asumir que el peso de los hombres
presenta distribución normal.

122

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

6.-Los húmeros de animales de la misma especie tienden a tener aproximadamente las mismas razones
longitud/anchura. Cuando se descubren húmeros fósiles, los arqueólogos con frecuencia pueden
determinar la especie a la que pertenece el animal examinando las razones longitud/anchura de los
huesos. Se sabe que la especie A tiene una razón media de 8,5. Suponga que se desenterraron 41 húmeros
fósiles en una excavación del África Oriental, donde se cree que habitó la especie A. Se midieron las
razones longitud/anchura de los huesos y se presentan en la siguiente tabla:

10,73 8,89 9,07 9,2 10,33 9,98 9,84 9,59


8,48 8,71 9,57 9,29 9,94 8,07 8,37 6,85
8,52 8,87 6,23 9,41 6,66 9,35 8,86 9,93
8,91 11,77 10,48 10,39 9,39 9,17 9,89 8,17
8,93 8,8 10,02 8,38 11,67 8,3 9,17 12,0
9.38
Queremos probar si los huesos desenterrados pertenecen a la especie A con un nivel de significación
de un 5%. Nota: Supongamos que los datos presentan distribución normal.

7.- Las especificaciones de construcción en cierta ciudad requieren que las tuberías de desagüe
empleadas en áreas residenciales tengan una resistencia media a la ruptura de más de 2500 libras por pie
lineal. Un fabricante que quisiera proveer a la ciudad de tubos para desagüe ha presentado una licitación
junto con la siguiente información adicional: un contratista independiente seleccionó al azar siete
secciones de los tubos del fabricante y determinó su resistencia a la ruptura. Los resultados (libras por
pie lineal) son los siguientes:

2610 2750 2420 2510 2540 2490 2680

¿Hay suficientes pruebas para llegar a la conclusión de que los tubos de desagüe del fabricante cumplen
con las especificaciones requeridas? Utilice un nivel de significación de un 10%.
Nota: Supongamos que los datos presentan distribución normal

8.- Un fabricante de cigarrillos afirma que sus cigarrillos no contienen más de 25 mg de nicotina. Una
muestra de 16 cigarrillos tiene una media de 26,4 y una desviación estándar igual a 2. ¿Proporcionan
estos datos suficiente evidencia para no estar de acuerdo con la afirmación del fabricante?
Nota: Supongamos que la cantidad de nicotina de los cigarrillos presentan distribución normal use
un nivel de significancia α = 0,05.

9.- Al investigar prácticas comerciales pretendidamente desleales, una comisión estatal toma una
muestra aleatoria de 49 barras de chocolate de “9 onzas” de un gran despacho. La media de los pesos
muestrales fue de 8,94 oz y la desviación estándar 0,12. Mostrar que a un nivel de significación de 0,05,
la comisión tiene fundamentos para proceder contra el fabricante.
Nota: Supongamos que el peso de las barras de chocolate presenta distribución normal.

10.- Se encuentra que el gasto promedio mensual en alimentación de empleados para una muestra de 50
empresas de una industria específica es de 420,4 con una desviación estándar de 55,7 Existe un total de
380 empresas en ese ramo industrial. Antes de recolectar los datos, se planteó la hipótesis de que el gasto
promedio mensual en alimentación de empleados por empresa en esa industria no era superior a 408.
Pruebe esa hipótesis con un nivel de significación de 0.05 además supongamos que el gasto mensual en
alimentación de los empleados de una industria específica presenta distribución normal.

11.- Al gerente del departamento de crédito de una compañía petrolera le gustaría determinar si el
saldo promedio mensual en contra de los tarjetahabientes es igual a $75. Un auditor selecciona una
muestra aleatoria de 100 cuentas y encuentra que la deuda promedio es de $83,4 con desviación

123

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

estándar de la muestra de $23,65. Utilizando el nivel de significación de 0,05 ¿Debería el auditor llegar
a la conclusión de que existe evidencia de que el saldo promedio es diferente de $75?
Nota: El saldo mensual en contra de los tarjetahabientes presenta distribución normal.

12.- Las cajas de un cereal producidas en una fábrica deben tener un contenido de 16 onzas. Un
inspector tomó una muestra que arrojó los siguientes pesos en onzas:
15,7 15,7 16,3 15,8 16,1 15,9 16,2 15,9 15,8 15,6
Indicar si es razonable que el inspector, usando un nivel de significación del 5 % ordene se multe al
fabricante. Nota: El contenido de las cajas de cereal presenta distribución normal

13.- En una oficina gubernamental se investiga a un empacador de pescado congelado. Los empaquetes
que utiliza indican que contiene 12 onzas de pescado, en tanto que se han recibido quejas de que ello
no es cierto. La oficina adquiere 100 paquetes de pescado procesado por esta compañía y encuentra
que:
100 100

∑ 𝑋𝑖 = 1150 ∑ 𝑋𝑖2 = 13249 , 75


𝑖=1 𝑖=1

Con base a esta muestra y con un nivel de significancia  = 0,01. ¿Cuál es su conclusión?
Nota: El peso de los empaques de pescado presenta distribución normal.

14.- Ante un reclamo sobre el tiempo de realización de una tarea, los empleados de una compañía
sostienen que en promedio ellos completan la tarea en a lo más 13 minutos. Si Ud. Es el gerente de la
compañía.
¿Qué conclusión obtiene si para una muestra de 400 tareas se obtiene un promedio de tiempo de
terminación de 14 minutos? Se sabe que, por información de trabajos similares, que los tiempos de
ejecución de la tarea tiene una distribución normal, con desviación estándar de 10 min. Use  = 0.05

15.- Un vendedor de seguros de vida dice que en promedio un trabajador en la ciudad de Lima
metropolitana tiene no más de S/ 25000 de seguro de vida personal. Para probar esto, muestrea
aleatoriamente 100 trabajadores en Lima metropolitana y encuentra que esta muestra de trabajadores
promedia S/ 26650 de seguro de vida personal y que la desviación estándar es S/ 12000.
Determine si la prueba muestra suficiente evidencia para rechazar la hipótesis nula planteada por el
vendedor. Nota: Las cantidades de dinero en los seguros de vida personal presenta distribución
normal use un nivel de significancia  = 0,05

16.- Al estudiar si conviene o no una sucursal en la ciudad de Tarapoto, la gerencia de una gran tienda
comercial de Lima, establece el siguiente criterio para tomar una decisión. Abrir la sucursal solo si el
ingreso promedio familiar mensual en dicha ciudad es no menos de $500 y no abrirla en caso contrario.
Si una muestra aleatoria de 100 ingresos familiares de esa ciudad ha dado una media de $480. ¿Cuál
es la decisión a tomar al nivel de significación del 5 %?
Nota: El ingreso familiar mensual en dicha ciudad presenta distribución normal

17.- Los sacos de café que recibe un exportador de cierto proveedor deben tener un peso promedio de
100 kilos. Un inspector tomó una muestra de 50 sacos de un lote de 500 sacos de café encontrando una
media de 99 kilos y una desviación estándar de 3 kilos.
Con un nivel de significancia  = 0,01 ¿Es razonable que el exportador rechace el lote de sacos de
café?
Nota: Suponga que el peso de los sacos que recibe un exportador de cierto proveedor de café presenta
distribución normal.

124

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

18.- Un investigador está realizando una prueba para determinar si una nueva medicina tiene el efecto
colateral de elevar la temperatura del cuerpo. Se entiende que la temperatura del cuerpo humano se
distribuye normalmente con una media de 98,6 ºF. Se administra la nueva medicina a 9 pacientes, se
toman las temperaturas y se obtiene una media de 99 ºF y una desviación estándar de 0,36 ºF. ¿Debería
permitirse a la compañía poner a la venta la nueva medicina, si el nivel de significación se especifica en
0,01?

19.- Cinco hipertensos reciben un nuevo fármaco que disminuye la presión arterial en:
14 25 13 18 20 puntos respectivamente.
¿El nuevo fármaco disminuye la presión arterial en por lo menos 20 puntos?
Nota: Suponga que los datos de la presión arterial presentan distribución normal.

20.- Se conoce que el valor medio de protombina es de aproximadamente 20 mg/100ml de plasma.


Una muestra de 625 pacientes con deficiencia de vitamina K presenta un nivel medio de protombina de
18,50 mg/100ml. La desviación estándar de la muestra es 4 mg. ¿Tienen los pacientes con deficiencia
de vitamina K un nivel significativamente más bajo de protombina que la población general?
Nota: Suponga que la cantidad de protombina presenta distribución normal.

21.- Se llevó a cabo un estudio sobre nutrición en un país en desarrollo. Una muestra de 500 campesinos
adultos reportó un consumo promedio diario de 1985 calorías con una desviación estándar de 210.
¿Puede concluirse a partir de estos datos que la media de la población es menor que 2000?
Nota: Suponga que la cantidad de calorías presenta distribución normal use α = 0,05.

22.- Antes el número medio de ataques de angina de pecho por semana entre los pacientes era de 1,03.
Se está probando un nuevo medicamento y se espera que reduzca esta cifra. Los datos se obtienen
mediante la observación de una muestra de 20 pacientes que están utilizando el nuevo fármaco.

1 3 0 1 1 1 0 2 2 0 0 1 0
0 0 1 1 1 1 0

Supongamos que la cantidad de ataques de angina de pecho distribución normal ¿Puede rechazarse
la hipótesis de investigación al nivel 0,01?

23.- Un productor de cápsulas de uña de gato envía al mercado en promedio 1000 por semana. La
demanda tiene distribución normal; sin embargo, en un estudio reciente, una muestra de 36 semanas
dio una demanda promedio de 850 cápsulas y una desviación estándar de 360 cápsulas.
En el nivel de significación de 0,05. ¿Es posible concluir que la media de la demanda semanal está
bajando?

24.- El gerente de un laboratorio farmacéutico quiere determinar si cierto somnífero aumenta las horas
de sueño en las personas. Para este fin, selecciona una muestra aleatoria de 10 pacientes y registra el
número de horas de sueño ganadas al aplicar el somnífero a cada paciente; los resultados fueron:

Paciente: 1 2 3 4 5 6 7 8 9 10
Nº de horas: 1,2 -1,3 1,7 0,9 2,4 0,8 -1,0 1,8 2 2,1

Suponiendo que las horas de sueño ganadas con el somnífero en cada paciente es una variable aleatoria
con distribución normal. Al nivel de significancia del 5%. ¿Hay prueba de que el somnífero aumenta
las horas de sueño?

25.- Se sospecha que una nueva medicina es eficaz en menos del 90% para curar cierta enfermedad,
pero el laboratorio que la fábrica cree que es efectiva por lo menos en un 90%. En una muestra de 400
personas que tenían la enfermedad, 320 se curaron con la aplicación de la medicina. ¿Se ha de concluir
que la medicina es eficaz por lo menos en un 90%? Use un nivel de significancia α = 0,05

125

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

26.- Un fabricante de televisores afirma que su póliza de garantía que en el pasado no más de 10% de
sus aparatos de televisión necesitaron reparación durante sus primeros dos años de operación. Con el
fin de probar la validez de esta afirmación, una agencia de pruebas del gobierno selecciona una muestra
de 100 aparatos de televisión y encuentra que 14 de ellos requirieron alguna reparación dentro de los
dos primeros años de operación. Utilizando un nivel de significación de 0.01 ¿Es válida la afirmación
del fabricante o existe evidencia de que ésta no es válida?

27.- Una cadena de tiendas de ropa está considerando la propuesta de un fabricante sobre la venta de
un gran lote de camisas, a precios de liquidación. El fabricante afirma que no más del 2 % de las
camisas tienen defectos de fabricación. Los representantes de la cadena inspeccionan una muestra de
400 camisas del lote y encuentran 15 camisas con defectos de fabricación.
¿Deberá la cadena rechazar la propuesta del fabricante, si ha decidido comprar el lote, a condición de
que lo afirmado por el fabricante sea cierto con una probabilidad de 1 en 10?

126

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

PRUEBAS DE HIPÓTESIS ACERCA DE LA DIFERENCIA DE DOS


MEDIAS POBLACIONALES

CASO: Muestras independientes provenientes de dos poblaciones normales con varianzas


desconocidas e iguales

Si dos muestras aleatorias e independientes de tamaños n1 y n2 respectivamente, se sacan de dos


poblaciones normales con medias µ 1 y µ 2 y con varianza común pero desconocidas, entonces la variable
aleatoria

(𝑿̄𝟏 − 𝑿̄𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )


𝑻=
(𝒏 − 𝟏)𝑺𝟐𝟏 + (𝒏𝟐 − 𝟏)𝑺𝟐𝟐 𝟏 𝟏
√ 𝟏 (𝒏 + 𝒏 )
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟏 𝟐

Tiene distribución T con n1 + n2 – 2 grados de libertad.

El objetivo del análisis es el de contrastar la hipótesis de que las medias poblacionales son iguales:

𝝁𝟏 = 𝝁𝟐 o lo que es lo mismo 𝝁𝟏 − 𝝁𝟐 = 0

Nota. - En caso de existir duda sobre la igualdad de las varianzas debe llevarse a cabo la prueba de
igualdad de varianzas.

La prueba T de Student para muestras independientes es una técnica de análisis frecuentemente utilizada
para analizar datos. Sirve para averiguar si dos grupos difieren en alguna variable cuantitativa de interés;
así `por ejemplo, para comparar en una variable cuantitativa: un grupo experimental y un grupo control,
o dos grupos distintos. (hombres y mujeres: fumadores y no fumadores; etc.). Muestras independientes
es sinónimo de grupos aleatorios; esto implica que se está trabajando con dos grupos de sujetos distintos,
aleatoriamente seleccionados de sus respectivas poblaciones

Ejemplo 1.- Un fabricante de cigarrillos anuncia que el contenido de alquitrán de los cigarrillos marca
B es menor que los de la marca A. Para probarlo se anotan los contenidos de alquitrán:

Marca A ( mg ) : 12 9 13 11 14
Marca B ( mg ) : 8 10 7

Utilice α = 0,05 para determinar si el anuncio es válido.


Nota: Suponga que la cantidad de alquitrán de los cigarrillos presenta distribución normal y que las
varianzas poblacionales son desconocidas pero iguales.

Solución

1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0 : 𝜇𝐴 ≥ 𝜇𝐵 El contenido de alquitrán de los cigarrillos marca B no es menor que el


contenido de alquitrán de los cigarrillos marca A.

𝐻1 : 𝜇𝐵 < 𝜇𝐴 El contenido de alquitrán de los cigarrillos marca B es menor que el


contenido de alquitrán de los cigarrillos marca A.

2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,05

127

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

(𝑋̄𝐵 − 𝑋̄𝐴 ) − (𝜇𝐴 − 𝜇𝐵 )


3) 𝐸𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑝𝑟𝑢𝑒𝑏𝑎 ∶ 𝑇𝑐 =
(𝑛𝐴 − 1)𝑆𝐴2 + (𝑛𝐵 − 1)𝑆𝐵2 1 1
√ ( + )
𝑛𝐴 + 𝑛𝐵 − 2 𝑛𝐴 𝑛𝐵

𝐶á𝑙𝑐𝑢𝑙𝑜𝑠: 𝑋̄𝐴 = 11,8 𝑋̄𝐵 = 8,33 𝑆𝐴2 = 3,7 𝑆𝐵2 = 2,33

8,33 − 11,8
→ 𝑇𝑐 = = −2,64
√4(3,7) + 2(2,33) (1 + 1)
5+3−2 5 3

4) 𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0 𝑠𝑖 𝑇𝑐 < −𝑡(𝛼;𝑛1+𝑛2−2)


𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑡(𝛼;𝑛1+𝑛2−2) = −1,94
(𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝑡 𝑑𝑒 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 𝑐𝑜𝑛 6 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑).
𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑙𝑎 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛 𝑠𝑒𝑟á 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0

5) 𝐂𝐨𝐧𝐜𝐥𝐮𝐬𝐢ó𝐧: El anuncio es válido es decir que el contenido de alquitrán de los cigarrillos marca B
no es menor que el contenido de alquitrán de los cigarrillos marca A con un nivel de significancia de
0,05.

Ejemplo 2.- Se aplicó un mismo test a dos grupos de personas con el objeto de analizar si existe o no
diferencia entre las puntuaciones medias; elija α = 0,05

Grupo I: 26 24 18 17 18 20 18
Grupo II: 38 26 24 24 30 22

Nota: Suponga que las puntuaciones del test en ambos grupos presentan distribución normal y que las
varianzas poblacionales desconocidas pero iguales.

Solución

1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0 : 𝜇1 = 𝜇2 No existe diferencia entre las puntuaciones medias de los grupos


𝐻1 : 𝜇1 ≠ 𝜇2 Existe diferencia entre las puntuaciones medias de los grupos

2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,05

(𝑋̄1 − 𝑋̄2 ) − (𝜇1 − 𝜇2 )


3)𝐸𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑝𝑟𝑢𝑒𝑏𝑎 ∶ 𝑇𝑐 =
(𝑛 − 1)𝑆12 + (𝑛2 − 1)𝑆22 1 1
√ 1 ( + )
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

𝐶á𝑙𝑐𝑢𝑙𝑜𝑠: 𝑋̄1 = 20,14 𝑋̄2 = 27,33 𝑆12 = 12,143 𝑆22 = 34,667

20,14 − 27,33
→ 𝑇𝑐 = = −2,73
√6(12,143) + 5(34,667) (1 + 1)
7+6−2 7 6

4) 𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0 𝑠𝑖 𝑇𝑐 < 𝑡(𝛼;𝑛1+2−2) 𝑜 𝑇𝑐 > 𝑡(1−𝛼;𝑛1+2−2)


2 2

𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑡(𝛼;𝑛1+2−2) = −2,73 𝑦 𝑡(1−𝛼;𝑛1+2−2) = 2,73


2 2

128

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

(𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝑡 𝑑𝑒 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 𝑐𝑜𝑛 11 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑)


𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑙𝑎 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛 𝑠𝑒𝑟á 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0

5) 𝐶𝑜𝑛𝑐𝑙𝑢𝑠𝑖ó𝑛: 𝑆í 𝑒𝑥𝑖𝑠𝑡𝑒 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠 𝑝𝑢𝑛𝑡𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎𝑠 𝑒𝑛 𝑎𝑚𝑏𝑜𝑠


𝑔𝑟𝑢𝑝𝑜𝑠 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝑑𝑒 0,05.

Ejemplo 3. La directora de presupuesto de una cierta compañía desea comparar los gastos diarios (en
dólares) respecto al transporte del equipo de ventas y del personal de cobranza. Recopiló la siguiente
información muestral:

Ventas ( $ ) 131 135 146 165 136 142


Cobranza ( $ ) 130 102 129 143 149 120 139

Al nivel de significancia de 0,05 ¿Puede concluirse que los gastos medios diarios del equipo de ventas
son mayores?

Nota: Suponga que los gastos diarios del personal de ventas y de cobranza presentan distribución
normal y que las varianzas poblacionales desconocidas pero iguales.

H0: µ 1 ≤ µ 2 Los gastos medios diarios del equipo de ventas no son mayores que los gastos medios
gastos del equipo de cobranza
H1: µ 1 > µ 2 Los gastos medios diarios del equipo de ventas son mayores que los gastos medios gastos
del equipo de cobranza
α = 0,05

Cálculos
𝑥̄ 1 = 142,5 𝑥̄ 2 = 130,3
𝑠12 = 149,9 𝑠22 = 249,24

142,5 − 130,3 12,2


𝑇𝑐 = = = 1,53
7,954
√5(149,9) + 6(249,24) (1 + 1)
6+7−2 6 7

Según la tabla T de Student con 11 grados de libertad y para α= 0,05 se tiene un valor
𝑡(1−α ;𝑛1+2−2) = 1,80

La regla de decisión será no rechazar H0 si: 𝑇𝑐 < 1,80.

Conclusión. - Los datos de la muestra evidencian los gastos medios diarios del equipo de ventas
no son mayores que los gastos medios gastos del equipo de cobranza con un nivel de significancia de
0,05.

CASO: Muestras dependientes o datos apareados

En este caso se supone que las muestras aleatorias no son independientes y se tomaron
aleatoriamente de poblaciones normales. En realidad; no se trata de dos grupos aleatorios, sino
de un solo grupo de sujetos al que se toman dos medidas o una medida en dos momentos
distintos. No hay necesidad de probar la igualdad de varianzas ya que es una sola la población;
así, por ejemplo:

129

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

• Cuando un mismo test es administrado al mismo grupo de personas en dos ocasiones


distintas (antes y después de un tratamiento)
• Dos productos son evaluados por un conjunto de degustadores o catadores.
• Dos conjuntos de mediciones de las mismas personas; de mediciones tomados a
hermanos, mellizos o gemelos.

La variable estadística de la prueba es:

𝑑̄ ∑𝑛𝑖=1 𝑑𝑖
𝑇𝑐 = 𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑑̄ =
𝑆𝑑 𝑛

√𝑛

𝑛 2 (∑𝑛𝑖=1 𝑑𝑖 )2⁄
∑ 𝑑
𝑖=1 𝑖 − 𝑛
𝑆𝑑2 =
𝑛−1

Ejemplo 1.- Un fabricante de productos alimenticios hace una prueba previa con cierto tipo de salsa
envasada, que puede preparar en una forma más espesa (A) o en otra forma menos espesa (B). Para
medir la preferencia por uno y otro tipo de salsa, utiliza una muestra de diez amas de casa, quienes
manifiestan sus preferencias por dichos tipos de salsa, con los siguientes resultados en puntajes

Salsa A ( ptos): 3 1 5 2 0 4 3 3 2 5
Salsa B ( ptos): 2 4 4 7 3 4 6 5 5 8

Al nivel de significación del 5% ¿Se puede concluir que el tipo de salsa menos espesa (B) tiene
mayores oportunidades de funcionar en el mercado, que el tipo más espeso (A)?.
Nota: Suponga que la diferencia de las puntuaciones presenta distribución normal.

Solución

1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0 : 𝜇𝐴 ≥ 𝜇𝐵 El tipo de salsa (B) no tiene mayores oportunidades de funcionar en el


mercado, que el tipo de salsa (A)

𝐻1 : 𝜇𝐴 < 𝜇𝐵 El tipo de salsa (B) tiene mayores oportunidades de funcionar en el mercado,


que el tipo de salsa (A)

2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,05

3) Variable estadística de la prueba:

𝑑
𝑇𝑐 =
𝑆𝑑
√𝑛

Salsa A ( ptos ): 3 1 5 2 0 4 3 3 2 5
Salsa B ( ptos ): 2 4 4 7 3 4 6 5 5 8
Diferencias: 1 -3 1 -5 -3 0 -3 -2 -3 -3

Cálculos

130

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

10 10

∑ 𝑑𝑖 = −20 ∑ 𝑑𝑖2 = 76
𝑖=1 𝑖=1

(−20)2⁄
76 − 10 = 4 → 𝑑̄ = −20 = −2
𝑆𝑑2 = 𝑆𝑑 = 2
9 10

𝑑̄ −2
𝐿𝑢𝑒𝑔𝑜 𝑇 = = = −3,16
𝑆𝑑 2⁄
⁄ √10
√𝑛

4)𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0 𝑠𝑖 𝑇 < 𝑡(𝛼,𝑛−1)

𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑡(𝛼,𝑛−1) = −1.83


(𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝑡 𝑑𝑒 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 𝑐𝑜𝑛 9 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑)
𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑙𝑎 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛 𝑠𝑒𝑟á 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0

5) 𝐶𝑜𝑛𝑐𝑙𝑢𝑠𝑖ó𝑛: 𝐿𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛𝑎𝑛 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑠𝑢𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑐𝑜𝑚𝑜 𝑝𝑎𝑟𝑎 𝑐𝑜𝑛𝑐𝑙𝑢𝑖𝑟 𝑞𝑢𝑒
𝑙𝑎 𝑠𝑎𝑙𝑠𝑎 𝐵 𝑡𝑖𝑒𝑛𝑒 𝑚𝑎𝑦𝑜𝑟 𝑜𝑝𝑜𝑟𝑡𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑣𝑒𝑛𝑡𝑎 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝑑𝑒 0,05.

Ejemplo 2.- Se desea analizar el efecto de una droga sobre la presión de la sangre (presión sanguínea
disminuye) para lo cual se utiliza una muestra de 10 personas, obteniendo los siguientes datos (presión
codificada). Utilice α = 0,05

Antes de la droga 14 15 12 9 14 12 10 9 13 12
Después de la droga 10 12 12 7 15 10 7 8 11 11

Nota: Suponga que la diferencia de las presiones sanguíneas después y antes de aplicar la droga
presenta distribución normal.

Solución

1) 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0 : 𝜇𝐴 ≤ 𝜇𝐷 La presión sanguínea después de aplicar la droga no disminuye

𝐻1 : 𝜇𝐴 > 𝜇𝐷 La presión sanguínea después de aplicar la droga disminuye

2) 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛: 𝛼 = 0,05

3) Estadístico de prueba:

𝑑
𝑇= 𝑆𝑑
√𝑛

Antes: 14 15 12 9 14 12 10 9 13 12
Después: 10 12 12 7 15 10 7 8 11 11
Diferencias: 4 3 0 2 -1 2 3 1 2 1

Cálculos
10 10

∑ 𝑑𝑖 = 17 ∑ 𝑑𝑖2 = 49
𝑖=1 𝑖=1

131

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

(17)2⁄
49 − 10 = 2,233 → 𝑑̄ = 17 = 1,7
𝑆𝑑2 = 𝑆𝑑 = 1,494
9 10

𝑑̅ 1,7
Luego 𝑇𝑐 = 𝑆𝑑 = 1,494 = 3,6
√𝑛 √10

4) 𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0 𝑠𝑖 𝑇𝑐 > 𝑡(1−𝛼;𝑛−1)

𝑒𝑛 𝑑𝑜𝑛𝑑𝑒 𝑡(1−𝛼;𝑛−1) = 1,83 (𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝑡 𝑑𝑒 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 𝑐𝑜𝑛 9 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑).
𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑙𝑎 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛 𝑠𝑒𝑟á 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻0

5) 𝐶𝑜𝑛𝑐𝑙𝑢𝑠𝑖ó𝑛: 𝐿𝑜𝑠 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎𝑛 𝑞𝑢𝑒 𝑙𝑎 𝑑𝑟𝑜𝑔𝑎 𝑠í 𝑡𝑢𝑣𝑜 𝑒𝑓𝑒𝑐𝑡𝑜


𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜 𝑝𝑎𝑟𝑎 𝑟𝑒𝑑𝑢𝑐𝑖𝑟 𝑙𝑎 𝑝𝑟𝑒𝑠𝑖ó𝑛 𝑠𝑎𝑛𝑔𝑢í𝑛𝑒𝑎 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝑑𝑒 0,05.

132

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS PROPUESTOS

1.- En un estudio sobre cáncer pulmonar se dispone del contenido de nicotina de varios cigarrillos
tomados de dos marcas diferentes:

Marca X : 17; 20; 20; 23


Marca Y : 18; 20; 21; 22; 24

Utilizando el nivel de significación de 0,05, ¿puede concluirse que el contenido nicotínico de ambas
marcas de cigarrillos no es el mismo?
Nota: Suponga que el contenido de nicotina en ambos grupos presentan distribución normal y que las
varianzas poblacionales desconocidas pero iguales.

2.- Dos empresas dedicadas a servir comidas rápidas a domicilio han alcanzado una notable popularidad
en cierta ciudad. Se pide a siete clientes habituales de cada empresa que informen sobre los tiempos (en
minutos) que ha tardado su pedido, obteniéndose los siguientes resultados:

Empresa A: 15 23 30 22 22 29 25
Empresa B: 12 21 25 22 15 21 15

Con esta información y con un nivel de significación del 1%. ¿Se puede considerar que los tiempos de
entrega de los pedidos son iguales en ambas empresas?
Nota: Suponga que el tiempo de pedido en ambas empresas presentan distribución normal y que las
varianzas poblacionales son desconocidas pero iguales.

3.- Se desea comparar la calidad de dos nuevas clases de trigo. Para ello se toman 10 fincas al azar,
plantando en cada una de ellas y en dos partes distintas ambas clases. Los datos sobre la producción en
las 10 fincas son los siguientes:

Clase A: 57 49 60 55 57 48 50 61 52 56
Clase B: 55 48 58 56 54 48 52 56 50 58

¿Podemos aceptar que la producción es la misma para ambas clases de trigo con un nivel de confianza
del 95%, suponiendo que las distribuciones son normales?
Nota: Suponga que la cantidad producida en las dos clases de trigo presentan distribución normal y
que las varianzas poblacionales son desconocidas pero iguales.

4.- Los datos que siguen corresponden a 10 hombres entre 45 y 55 años. Se trata de lecturas del colesterol
tomadas tras 12 horas de ayuno y repetidas una hora después de comer.

Sujeto 1 2 3 4 5 6 7 8 9 10
Ayuno 180 210 195 220 210 190 225 260 200 210
Después 185 225 200 225 200 180 235 265 195 220

¿Hubo un incremento significativo del colesterol después de la comida?


Nota: Suponga que la diferencia de las lecturas del colesterol presenta distribución normal.

5.- Se dividieron 30 pacientes de epilepsia en dos muestras aleatorias iguales. Al grupo A se les dio un
tratamiento que incluía dosis diarias de vitamina D. Al grupo B se le dio el mismo tratamiento excepto
que no recibió vitamina D sino un placebo en su lugar. Las medias del número de ataques
experimentados durante el tratamiento por los dos grupos fueron:

133

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

𝑋̄𝐴 = 15 𝑋̄𝐵 = 24 𝑆𝐴2 = 8 𝑆𝐵2 = 12

¿Hay suficiente evidencia que indique que la vitamina D reduce el número de ataques epilépticos?
Use α = 0,05 Rpta. La vitamina D sí reduce el Nº de ataques epilépticos
Nota: Suponga que la cantidad de ataques experimentados durante el tratamiento por los dos grupos
presentan distribución normal y que las varianzas poblacionales son desconocidas pero iguales.

6.- Los siguientes datos fueron recabados en un experimento que fue diseñado para verificar si existe
una diferencia sistemática en los pesos en gramos obtenidos con dos diferentes balanzas:

Balanza I: 11,23 14,36 8,33 10,50 23,42 9,15 13,47 6,47 12,40 19,38
Balanza II: 11,27 14,41 8,35 10,52 23,41 9,17 13,52 6,46 12,45 19,35

¿Existe diferencia significativa entre los pesos obtenidos con las dos balanzas? Use un nivel de
significancia  = 0,05
Nota: Suponga que los pesos obtenidos con las dos balanzas presentan distribución normal y que las
varianzas poblacionales son desconocidas pero iguales.

7.- Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y mujeres para realizar
determinada tarea. Una muestra aleatoria de 9 hombres y 8 mujeres han dado los siguientes tiempos en
minutos:

Hombres: 12 28 10 25 24 19 22 33 17
Mujeres: 16 20 16 20 16 17 15 21

¿Se puede concluir que los hombres emplean mayor tiempo que las mujeres para hacer la tarea?
Use un nivel de significancia  = 0,05
Nota: Suponga que los tiempos que utilizan para realizar una tarea en ambos grupos presentan
distribución normal y que las varianzas poblacionales son desconocidas pero iguales.

8.- Se desea determinar el contenido de grasa en la carne para poder fijar su precio de venta al
consumidor. Una compañía empacadora de carne está considerando el uso de dos métodos diferentes
para determinar el porcentaje de grasa. Ambos métodos fueron usados para evaluar el contenido de grasa
en doce diferentes muestras de carne. Los resultados se muestran en la siguiente tabla:

Método A: 24,1 28,1 26 28,6 23,2 28,1 24,2 25,7 22,8 24 25 25 28


Método B: 23,7 27,4 25,9 28,2 23,5 28,4 24,6 25,4 22,5 22,5 24 24 27,2

¿Sugieren estos datos que los dos métodos difieren en su medición del contenido de grasa en la carne?
Use un nivel de significancia  = 0,05
Nota: Suponga que los contenidos de grasa que hay en la carne con ambos métodos presentan
distribución normal y que las varianzas poblacionales son desconocidas pero iguales.

9.- Un gerente de publicidad de una compañía de cereales para el desayuno desea determinar si un nuevo
envase podría aumentar las ventas del producto. Para probar la factibilidad de la nueva forma del envase
se seleccionó una muestra de 40 tiendas similares y se asignaron en forma aleatoria, 20 de ellas como
mercado de prueba de la nueva forma del envase, en tanto que las otras 20 continuarían recibiendo el
envase antiguo. Las ventas semanales durante el tiempo del estudio fueron las siguientes:

Nuevo Antiguo
Media = 130 cajas Media = 117 cajas
Desv. estándar = 10 cajas Desv. estándar = 12 cajas

134

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Con un nivel de significancia α = 0,05. ¿La nueva forma del envase dio como resultado mayores ventas?
Nota: Suponga que las ventas con ambos envases presentan distribución normal y que las varianzas
poblacionales son desconocidas pero iguales.

10.- Un investigador cree tener razón para creer que cierto medicamento aumentará el contenido de
hemoglobina en gr/100 ml para ello mide el contenido de hemoglobina de 8 sujetos antes y después de
la administración del medicamento.

Antes 10 9 11 12 8 7 12 10
Después 12 11 13 14 9 10 12 14

Analice los datos y determine el efecto del medicamento además utilice un nivel de significancia
α = 0,01
Nota: Suponga que la diferencia de la hemoglobina del colesterol después y antes de administrar el
medicamento presenta distribución normal. Rpta. El medicamento sí es efectivo

11.- Los siguientes datos son porcentajes de grasa encontrados en dos tipos de carne:

Carne A: 30 26 30 19 25 37 27 38 26 31
Carne B: 40 34 28 29 26 36 28 37 35 42

¿Tienen las carnes diferente contenido de grasa? Use un nivel de significancia  = 0,05
Nota: Suponga que el porcentaje de grasa en ambas carnes presenta distribución normal y que las
varianzas poblacionales son desconocidas pero iguales.

12.- Un psicólogo desea verificar que cierto fármaco aumenta el tiempo de reacción a un estímulo dado.
Para una muestra de 4 individuos se obtuvieron los siguientes tiempos de reacción en décimos de
segundo, antes y después de inyectarse el fármaco:

Tiempo de reacción
Individuo Antes Después
1 7 13
2 2 3
3 12 18
4 12 13

Con un nivel de significación del 5 % realice una prueba para determinar si el fármaco aumenta
significativamente el tiempo de reacción.
Nota: Suponga que la diferencia de los tiempos de reacción después y antes de aplicar el fármaco
presenta distribución normal.

13.- Se desea comparar dos dietas. Se seleccionaron 80 individuos al azar en una población de músicos
excedidos de peso; 45 integrantes de este grupo recibieron la dieta A, los otros 35 la dieta B. Las pérdidas
de peso en libras durante un período de una semana resultaron ser los siguientes:

Dietas Media muestral ( lbs ) Varianza muestral


Dieta A 10,3 7
Dieta B 7,3 3,25

Usando un nivel de significancia α = 0,01. ¿Cuál dieta fue mejor en la reducción de peso?
Nota: Suponga que la pérdida de peso con ambas dietas presenta distribución normal y que las
varianzas poblacionales son desconocidas pero iguales.

135

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

14.- Se administran dos nuevos medicamentos a pacientes con un padecimiento cardíaco. El primer
medicamento bajó la presión sanguínea de 16 pacientes en un promedio de 11 puntos con una desviación
estándar de 6. El segundo medicamento bajó la presión sanguínea de otros 20 pacientes en un promedio
de 12 puntos con una desviación estándar de 8.
¿Existe diferencia significativa entre los efectos de ambos medicamentos? Use un nivel de significancia
α = 0,05. Nota: Suponga que la presión sanguínea con ambos medicamentos presenta distribución
normal y que las varianzas poblacionales son desconocidas pero iguales.

Rpta. No existe diferencia significativa

15.- Veinticuatro animales de laboratorio con deficiencia de vitamina D, se dividieron en dos grupos
iguales: El grupo I recibió un tratamiento consistente en una dieta que proporcionaba la vitamina D.
El grupo II no fue tratado. Al término del período experimental se hicieron las determinaciones del
calcio en el suero, obteniéndose los siguientes resultados:

𝑮𝑹𝑼𝑷𝑶 𝑻𝑹𝑨𝑻𝑨𝑫𝑶 𝑮𝑹𝑼𝑷𝑶 𝑵𝑶 𝑻𝑹𝑨𝑻𝑨𝑫𝑶


𝑋̄1 = 11,1𝑚𝑔/100𝑚𝑙 𝑋̄2 = 7,8𝑚𝑔/100𝑚𝑙
𝑆1 = 1,5𝑚𝑔 𝑆2 = 2,0𝑚𝑔

Suponiendo que las poblaciones son normales y que las varianzas poblacionales son desconocidas pero
iguales. ¿Existe diferencia significativa? Rpta. Sí

16.- El tiempo de recuperación fue observado para pacientes al azar y sometidos a dos tipos distintos
de procedimientos quirúrgicos. Los datos son los siguientes:

PROCEDIMIENTO 1 PROCEDIMIENTO 2
𝑛1 =21 𝑛2 =23
𝑥
̅̅̅1 = 7,3 𝑥
̅̅̅2 = 8,9
𝑠12 = 1,23 𝑠22 = 1,49

¿Presentan los datos suficiente evidencia para concluir que hay diferencia entre los tiempos medios de
recuperación de los dos procedimientos quirúrgicos? Use un nivel de significancia α = 0,05.
Nota: Suponiendo que las poblaciones son normales y que las varianzas poblacionales son
desconocidas pero iguales.

17.- Once estudiantes de medicina midieron la presión sanguínea del mismo paciente y repitieron la
medición al día siguiente. A continuación, se listan las lecturas sistólicas en mmHg.

Día 1: 138 130 135 140 120 125 120 130 130 144 143
Día 2: 116 120 125 110 120 135 124 118 120 130 140

Con un nivel de significancia α = 0,05 ¿Existe diferencia significativa entre ambas mediciones?
Nota: Suponiendo que las mediciones de ambos grupos son normales y que las varianzas
poblacionales son desconocidas pero iguales.

136

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

ANÁLISIS DE VARIANZA (ANOVA)

TÉRMINOS BÁSICOS

Unidad experimental
Es el sujeto u objeto, intervalo de espacio o tiempo, sobre el que se experimenta o se aplica el
tratamiento.
Ejemplo:
En el campo industrial: el trabajador, una máquina, un lote de material.

Factor
Es una variable independiente de interés del experimentador, en la cual se desea estudiar su efecto
sobre la variable respuesta. En la gran mayoría de las investigaciones de tipo cualitativo o cuantitativo,
se trabaja con más de una variable independiente.

• Factor cualitativo:

– Tipos de dietas de animales.


– Marcas de fármacos utilizados para el tratamiento de una enfermedad.

• Factor cuantitativo:

– Cantidad de nutrientes de un tipo de alimento en diferentes cantidades.


– Cantidad de megabytes de memoria en las computadoras.

Niveles de un factor
Son los diferentes tipos o grados específicos del factor que se tendrán en cuenta en la realización del
experimento. Los niveles de un factor reciben el nombre de “tratamientos”.

Ejemplo:

• En fármacos para la relajación muscular:


Niveles: Innovar, Droperidol, Fentanyl.
• En temperatura:
Niveles: 40°C, 50°C, 60°C.

Tratamientos
Un tratamiento es un efecto que se desea estudiar. Implica el nivel particular de
un factor que deben imponerse a una unidad experimental dentro del marco del
diseño seleccionado.
Ejemplo:
• Utilizar en el cultivo de trigo la variedad Buck Ponch.
• Utilizar el Droperidol como fármaco para la relajación muscular.

PRINCIPIOS BÁSICOS DE UN DISEÑO EXPERIMENTAL


Existen tres principios básicos:

• Repetición del experimento.


• Aleatoriedad.
• Formación de bloques.

137

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

El modelo de clasificación de un solo factor completamente aleatorizado es:

Xij = µ + αi + εij (i = 1,2,………….k , j = 1,2,………………ni)

Xij Denota la j- ésima unidad experimental sujeta al i-ésimo tratamiento


µ : es la media general o media total
αi : es el i- ésimo tratamiento
εij : error experimental causados por todos los factores desconocidos.

En el modelo de clasificación de un factor completamente aleatorizado los valores Xij se registran en


la siguiente tabla.

Donde:
Ti◼: es la suma de datos de la muestra i.
Ti◼◼: es la suma total de datos de las k muestras
n: es el total observado en las k muestras
i◼: es la media de la muestra i
◼◼: es media total muestral

HIPOTESIS PARA MODELOS DE CLASIFICACIÓN DE UN SOLO FACTOR


COMPLETAMENTE ALEATORIZADOS

La prueba del ANOVA se basa en dos estimaciones independientes de la varianza poblacional σ²


(Varianza entre grupos y Varianza dentro de los grupos).
Estas estimaciones se obtienen particionando la suma de cuadrados en dos componentes, las cuales
son:

SCT = SCTR + SCE

Donde:

SCT: es la suma de cuadrados totales

𝑘 𝑛𝑖 𝑘 𝑛𝑖
2 𝑇 2 ∎∎
𝑆𝐶𝑇 = ∑ ∑(𝑥𝑖𝑗 − 𝑥̅∎∎ ) = ∑ ∑ 𝑥 2 𝑖𝑗 −
𝑛
𝑖=1 𝑗=1 𝑖=1 𝑗=1

138

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

SCTR: es la suma de cuadrados entre los tratamientos

𝑘 𝑘
𝑇 2 𝑖∎ 𝑇 2 ∎∎
𝑆𝐶𝑇𝑅 = ∑ 𝑛𝑖 (𝑥𝑖∎ − 𝑥̅∎∎ )2 =∑ −
𝑛𝑖 𝑛
𝑖=1 𝑖=1

SCE: es la suma de cuadrados del error (o dentro de los tratamientos)

𝑘 𝑛𝑖
2
𝑆𝐶𝐸 = ∑ ∑(𝑥𝑖𝑗 − 𝑥̅𝑖∎ ) = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅
𝑖=1 𝑗=1

EJERCICIOS DE ANÁLISIS DE VARIANZA


Ejemplo 1:
Se realizan cuatro mezclas experimentales para medir la resistencia de concreto y se sometieron a cargas
de compresión hasta romperse. ¿Hay evidencia estadística que permita concluir que los tipos de mezcla
influyen en la resistencia del concreto? Use un nivel de significación del 5%.

Mezcla A Mezcla B Mezcla C Mezcla D


2,3 2,2 2,15 2,25
2,2 2,1 2,15 2,15
2,25 2,2 2,2 2,25

Resolución

Mezcla A Mezcla B Mezcla C Mezcla D


2,3 2,2 2,15 2,25
2,2 2,1 2,15 2,15
2,25 2,2 2,2 2,25
Total 6,75 6,5 6,5 6,65 26,4
n 3 3 3 3 12
Medias 2,25 2,17 2,17 2,22 8,8
2
𝑇∎∎
𝑛
SCT = ∑𝑘𝑖=1 ∑𝐽=1
𝑖 2
𝑥𝑖𝑗 − 𝑛
=

26,42
𝑆𝐶𝑇 = 2, 32 + 2, 22 + 2,252 +. . . . +2,252 − 12
= 0,035
𝑘 2 2
𝑇𝑖∎ 𝑇∎∎
SCTR= ∑ − =
𝑛𝑖 𝑛
𝑖=1

6,75 6,5 6,5 6,65 26, 42


𝑆𝐶𝑇𝑅 = + + + − = 0,015
3 3 3 3 12

139

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

SCE = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅 =

𝑆𝐶𝐸 = 0,035 − 0,015 = 0,02

1.Planteamiento de Hipótesis
Ho: µ1 = µ2 = µ3 = µ4 (la resistencia del concreto en los distintos tipos de mezclas es la misma).
H1: La resistencia del concreto en al menos uno de los cuatro tipos de mezclas es diferente.

2. Nivel de significancia
α = 0,05

3. Estadígrafo o estadístico

Suma de Grados de Cuadrados Razón F


Fuente de Variación cuadrados libertad Medios calculada
Tratamientos 0,015 3 0,005 2
Error 0,02 8 0,0025

Total 0,035 11

4. Regla de Decisión
Región Crítica

Primero se encuentra el valor crítico que es F(1-α, k-1, n-k)=F(0,95 , 3, 8) = 4,07.


La región critica es: (4,07, +∞).
El valor de 2 no pertenece a la región critica por lo tanto no se debe rechazar Ho

5. Conclusión

Finalmente hay suficiente evidencia estadística para decir que no hay diferencias entre las resistencias
del concreto en los distintos tipos de mezclas con un nivel de significancia de 0,05.

Ejemplo 2:

La fábrica de pantalones A&M tiene cuatro trabajadores que se dedican exclusivamente a coser
pantalones previamente cortados. El gerente de A&M sospecha que los trabajadores no están trabajando
a un mismo nivel. Para probar su sospecha, el gerente decide registrar en forma aleatoria el tiempo (en
minutos) que demora cada trabajador en coser un pantalón. Cinco observaciones fueron registradas para
cada trabajador, obteniéndose la siguiente información:

Trabajador 1 Trabajador 2 Trabajador 3 Trabajador 4


28 27 29 27
25 28 30 28
29 30 32 26
30 28 35 28
28 25 37 27

140

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Resolución

Trabajador Trabajador Trabajador Trabajador


1 2 3 4
28 27 35 27
25 28 45 28
29 30 38 26
30 28 35 28
28 25 42 27
Total 140 138 195 136 609
n 5 5 5 5 20
Medias 28 27,6 39 27,2 121,8
2
𝑇∎∎
𝑛
SCT = ∑𝑘𝑖=1 ∑𝐽=1
𝑖 2
𝑥𝑖𝑗 − 𝑛
=
6092
SCT = 282 + 252 + 29 +. . . . +272 −
2
20
= 596,95
𝑘 2 2
𝑇𝑖∎ 𝑇∎∎
SCTR= ∑ − =
𝑛𝑖 𝑛
𝑖=1

140 138 195 136 56092


SCTR = + + + − = 488,95
5 5 5 5 20

SCE = SCT − SCTR =

SCE = 596,95 − 488,95 = 108

1.Planteamiento de Hipótesis
Ho: µ1 = µ2 = µ3 = µ4 (Los tiempos promedios que demoran los trabajadores en coser un pantalón
es el mismo).
H1: Al menos unos de los tiempos promedios que demoran los trabajadores en coser un pantalón es
diferente).

2. Nivel de significancia
α = 0,05
3. Estadígrafo o estadístico

Suma de Grados de Cuadrados Razón F


Fuente de Variación cuadrados libertad Medios calculada
Tratamientos 488,95 3 162,9833 24,15
Error 108 16 6,75

Total 596,95 19

4. Regla de Decisión
Región Crítica

141

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Primero se encuentra el valor crítico que es F(1-α, k-1, n-k) = F(0,95 , 3, 16) =3,24.
La región critica es: (3,24, +∞).
El valor de 24,15 si pertenece a la región critica por lo tanto se debe rechazar Ho.

5. Conclusión

Finalmente hay suficiente evidencia estadística para decir que hay diferencias entre los tiempos
promedios que demoran los trabajadores en coser un pantalón con un nivel de significancia de 0,05.

Ejemplo 3:
Los datos de la siguiente tabla representan el número de horas de alivio que proporcionan cinco marcas
diferentes de tabletas contra el dolor de cabeza que se administran a 25 sujetos que sufren de fiebres de
38ºC o más.
Realice el análisis de varianza y pruebe la hipótesis, en el nivel de
significancia de 0,05 que el número promedio de horas de alivio que proporcionan las tabletas es el
mismo para las cinco marcas.

Tabletas
A B C D E
5.2 9.1 3.2 2.4 7.1
4.7 7.1 5.8 3.4 6.6
8.1 8.2 2.2 4.1 9.3
6.2 6.0 3.1 1.0 4.2
3.0 9.1 7.2 4.0 7.6

Solución
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 (𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 ℎ𝑜𝑟𝑎𝑠 𝑑𝑒 𝑎𝑙𝑖𝑣𝑖𝑜 𝑒𝑠 𝑒𝑙 𝑚𝑖𝑠𝑚𝑜 𝑝𝑎𝑟𝑎 𝑙𝑎𝑠
𝑐𝑖𝑛𝑐𝑜 𝑚𝑎𝑟𝑐𝑎𝑠 𝑑𝑒 𝑡𝑎𝑏𝑙𝑒𝑡𝑎𝑠).
𝐻1 : 𝐸𝑛 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑎𝑟𝑐𝑎𝑠 𝑑𝑒 𝑡𝑎𝑏𝑙𝑒𝑡𝑎𝑠 𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑎𝑙𝑖𝑣𝑖𝑜𝑛 𝑜 𝑒𝑠 𝑒𝑙
𝑚𝑖𝑠𝑚𝑜.
α = 0,01
(137,9)2
𝑆𝐶𝑇 = (5,2)2 + (4,7)2 +. . . . . . . . . . . . . . . . . . . . . +(7,6)2 −
25
= 898,61-760,66 = 137,95

(27,2)2 + (39,5)2 + (21,5)2 + (14,9)2 + (34,8)2 (137,9)2


𝑆𝐶𝐴 = − = 78,42
5 25

𝑆𝐶𝐸 = 137,95 − 78,42 = 59,53

Suma de Grados de Cuadrados Razón F


Fuente de Variación cuadrados libertad Medios calculada
Tabletas 78,42 4 19,61 6,59
Error 59,53 20 2,98

Total 137,95 24

4. Regla de Decisión
Primero se encuentra el valor crítico que es F(1-α, k-1, n-k) = F(0,95 , 4, 20) =2,87.
La región critica es: (2,87, +∞).
El valor de 6,59 si pertenece a la región critica por lo tanto se debe rechazar Ho.

142

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

5. Conclusión Hay suficiente evidencia estadística para concluir que existe diferencia significativa
entre los efectos de las tabletas con respecto al tiempo promedio de alivio con un nivel de significancia
de 0,01.

7
Horas promedio de alivio

A B C D E
Tabletas

EJERCICIOS PROPUESTOS
1.- Cinco laboratorios participan en un estudio para la determinación de la concentración de plomo en
muestras de agua. Los resultados, obtenidos para réplicas de cada muestra analizada en los laboratorios,
se expresan en ppm y se presentan en la siguiente tabla:

Réplica Lab. A Lab. B Lab. C Lab. D Lab. E


1 9,8 9,5 10,1 9,2 10,6
2 11,4 9,6 10,4 9,3 10,5
3 10,3 9,9 10,0 8,6 11,1

¿La determinación de los niveles de concentración de plomo en muestras de agua es la misma en dichos
laboratorios? Use un nivel de significancia α = 0,05

2) Un fabricante está interesado en estudiar la resistencia a la tensión de una fibra sintética, y sospecha
que puede estar relacionada con el porcentaje de algodón en su composición. Con este fin, estudia la
resistencia de la fibra considerando 5 niveles de porcentaje de algodón en su composición. Los datos
observados se muestran en la siguiente tabla.

Porcentaje de algodón
15 20 25 30 35
7 12 14 19 7
Tensión de ruptura

7 17 18 25 10
15 12 18 22 11
11 18 19 19 15
9 18 19 23 11

143

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Contrastar al 5 % de significación si el fabricante está acertado en su sospecha.

3.- Se recolectaron muestras de agua en 4 lugares distintos de un río, para determinar si la cantidad de
oxígeno disuelto, varía de un lugar a otro. Los lugares 1 y 2 se escogieron arriba de una planta industrial,
una cerca de la orilla y la otra a mitad del río; el lugar 3 se tomó adyacente a la descarga del agua
industrial de la planta y el lugar 4 se tomó río abajo a mitad del río. Los datos se presentan en la siguiente
tabla (a mayor contaminación, menor es la lectura de oxígeno):

Lugar Contenido medio de oxígeno disuelto


Lugar 1: 5,9 6,1 6,3 6,1 6
Lugar 2: 6,3 6,6 6,4 6,4 6,5
Lugar 3: 4,8 4,3 5 4,7 5,1
Lugar 4: 6,0 6,2 6,1 5,8

Al nivel de significación de 0,01 ¿Proporcionan los datos evidencia suficiente para indicar una diferencia
entre las cantidades medias de oxígeno disuelto para los 4 lugares?

4.- La siguiente tabla muestra las concentraciones arteriales de epinefrina en plasma sanguíneo (en 10-8
gramos por mililitro) que se encontró en 15 pacientes sometidos a cirugía durante un período en el que
estuvieron anestesiados, usando 3 tipos diferentes de anestesia, aplicando cada tipo de anestesia a cada
uno de los 5 pacientes elegidos al azar de los 15:

Anestesia Pacientes
Tipo 1 9 12 10 8 15
Tipo 2 20 21 23 17 30
Tipo 3 6 5 8 16 7

Tomando un nivel de significancia de α = 0,01 ¿Se puede decir que si se observan diferencias en la
concentración de epinefrina según el tipo de anestesia usada?

5) Tres profesores dan clases teóricas en una misma autoescuela. Se desea contrastar, si existen
diferencias significativas en la forma de enseñanza de los tres profesores. Para ello se seleccionan tres
muestras de alumnos y se anota el número de preguntas correctas en el examen.

Profesor 1 Profesor 2 Profesor 3


43 48 29
35 47 31
44 44 28
46 46 42
39 39 31
44 45 36
38 48 35
42 48 36
45 45 39

Contrastar al 5 % de significación si existen diferencias entre los profesores.

6.- Se realizó un estudio para determinar la proliferación de hongos debido al exceso de residuos
alimenticios de los peces. Se observaron estas condiciones con peces en estadios, de alevines, juveniles
y adultos. Los peces alevines, juveniles y adultos fueron alimentados con cantidades de alimento que
variaban entre 3, 6 y 9 gramos al día respectivamente. Los datos a continuación representan el número
de colonias de hongos presentes en cada acuario.

144

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

3 gramos 6 gramos 9 gramos


18 22 41
14 26 32
7 13 47
9 33 51
19 55
20
29
48 162 226
Total = 436

Con un nivel de significancia α = 0,01 ¿Cuál es su conclusión?

7) Un fabricante de cereales tiene que elegir entre tres colores para las cajas de cereales: rojo, amarillo
y azul. Para averiguar si el color influye en las ventas, se eligen 16 tiendas de tamaño parecido. Se envían
cajas rojas a 6 de estas tiendas, cajas amarillas a 5 y cajas azules a las 5 restantes. Después de unos días,
se comprueba el número de cajas vendidas en cada tienda. La tabla adjunta muestra los resultados (en
decenas de cajas) obtenidos.

Rojo Amarillo Azul


43 52 61
52 37 29
59 38 38
76 64 53
61 74 79
81

Complete la tabla del análisis de la varianza y contraste la hipótesis nula de que las medias poblacionales
de los niveles de ventas de las cajas de los tres colores son iguales.

8) Un profesor tiene una c1ase de 23 estudiantes. Al comienzo de cada cuatrimestre asigna a cada
estudiante aleatoriamente a uno de los cuatro profesores ayudantes que tiene: Sánchez, Hervás, Alarcos
o Blázquez. Anima a los estudiantes a reunirse con su profesor ayudante para que les explique la materia
difícil del curso. AI final del cuatrimestre, se hace un examen. La tabla adjunta muestra las calificaciones
obtenidas por los estudiantes que trabajan con estos profesores ayudantes.

Sánchez Hervás Alarcos Blázquez


72 78 80 79
69 93 68 70
84 79 59 61
76 97 75 74
64 88 82 85
81 68 63

Complete la tabla del análisis de la varianza y contraste la hipótesis nula de la igualdad de las medias
poblacionales de las calificaciones de estos profesores ayudantes.

145

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

9) Tres proveedores suministran piezas en envíos de 500 unidades. Se han comprobado minuciosamente
muestras aleatorias de seis envíos de cada uno de los tres proveedores y se ha anotado el número de
piezas que no se ajustan a las normas. La tabla muestra este número.

Proveedor A Proveedor B Proveedor C


28 22 33
37 27 29
34 29 39
29 20 33
31 18 37
33 30 39

Contraste la hipótesis nula de que la igualdad de las medias poblacionales del número de piezas por
envío de los tres proveedores no se ajusta a las normas.

10) La Asociación Nacional de comerciantes en Automóviles (ANCA) quiere comparar el


comportamiento del gasto de gasolina de distintas marcas de auto, para ello obtuvo una muestra aleatoria
del consumo de gasolina en litros de dichos automóviles en 40 de sus distintos modelos. Utilice un nivel
de significancia de α = 0.05. ¿El consumo de gasolina tiene un comportamiento similar?

Honda-Civic Honda-Accord Nissan-Sentra Nissan Tillda


50 35 40 37
30 32 36 40
39 33 38 42
47 38 42 30
35 48 65 33
53 35 38 38
48 43 46 40
42 40 45 46
40 50 50 49
55 49 50 50

REGRESIÓN Y CORRELACIÓN LINEAL

En diversos problemas vinculados con el análisis de la información es importante estudiar las relaciones
que pueden existir entre dos o más variables. Preguntas como: ¿las personas con mayor poder adquisitivo
tienen mayor grado de educación? están referidas a las relaciones que podrían existir entre las variables
“poder adquisitivo” y “educación”. Las relaciones entre variables pueden explorarse algunas veces
usando gráficos adecuados, pero también existen medidas que indican no solo la existencia de la relación
sino también la fuerza de esta. A estas medidas se les llama medidas de correlación cuando las variables
en estudio son numéricas u ordinales y medidas de asociación si las variables son nominales.

El coeficiente de correlación de Pearson Es un número que indica el grado de asociación entre dos
variables cuantitativas (numéricas) y se define del siguiente modo:

𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌
𝑟=
√[𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋)2 ][𝑛 ∑ 𝑌𝑖2 − (∑ 𝑌)2 ]

Los valores que puede tomar el coeficiente de correlación "r" son: -1 ≤ r ≤ 1.


Si "r" > 0 La correlación lineal es positiva (si sube el valor de una variable sube el de la otra). La
correlación es más fuerte cuanto más se aproxime a 1.

146

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Si "r" < 0 La correlación lineal es negativa (si sube el valor de una variable disminuye el de la otra). La
correlación negativa es tanto más fuerte cuanto más se aproxime a -1.
Si "r" = 0 No existe correlación lineal entre las variables, aunque podría existir otro tipo de correlación
(parabólica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera próximo a 1 ó -1, tampoco esto quiere decir
obligatoriamente que existe una relación de causa-efecto entre las dos variables, ya que este resultado
podría haberse debido al puro azar.

Diagrama de dispersión Se utiliza para graficar la relación entre dos variables X e Y, consiste en una
nube de puntos que nos mostrará visualmente si existe o no correlación dependiendo de la tendencia de
los puntos.

Regresión Lineal El modelo de regresión lineal se usa para expresar la relación lineal que puede existir
entre los valores de una variable “Y” y los valores de una variable “X”.
X: Variable independiente.
Y: Variable dependiente.

Modelo de regresión lineal simple Los modelos de regresión que relacionan valores x de una
variable independiente X con valores y de una variable dependiente Y, cuya forma es

𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝜀

La expresión 𝛽0 + 𝛽1 𝑋 es la parte estructural lineal, mientras que 𝜀 resume la parte aleatoria que
influye débilmente en la variable dependiente Y. A la ecuación 𝑦 = 𝛽0 + 𝛽1 𝑋, que expresa la
estructura lineal, se llama la ecuación de regresión lineal. A los coeficientes 𝛽0 y 𝛽1 se les llama
coeficiente de regresión.
Se considera de este modo que los puntos (x,y) no necesariamente esta sobre la recta
𝑦 = 𝛽0 + 𝛽1 𝑋 sino que fluctúan aleatoriamente a su alrededor.
Se asume que 𝜀 es una variable aleatoria cuya distribución es normal de media 0 varianza
constante.

Ecuación de regresión lineal


La estimación de los valores 𝛽0 y 𝛽1 se realiza usando el método de mínimos cuadrados y los
valores obtenidos de la muestra (𝑥1 , 𝑦1 ), . . . . . , (𝑥𝑛 , 𝑦𝑛 )

El modelo estimado es 𝑌̂ = 𝛽̂0 + 𝛽̂1 𝑋


Donde:

𝛽̂0 = 𝑦̅ − 𝛽̂1 𝑥̅

𝑛(∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 ) − (∑𝑛𝑖=1 𝑥𝑖 )(∑𝑛𝑖=1 𝑦𝑖 )


𝛽̂1 = 2
𝑛(∑𝑛𝑖=1 𝑥𝑖 2 ) − (∑𝑛𝑖=1 𝑥𝑖 )

2
Coeficiente de Determinación ( R ) Medida de Bondad de Ajuste: Mide la proporción de la
variabilidad total de Y que es explicada por X a través del modelo de regresión lineal simple.
𝑹𝟐 = 𝒓𝟐

147

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS DE REGRESIÓN Y CORRELACIÓN LINEAL

Ejemplo 1.- El costo de fabricar un lote de cierto producto depende del tamaño del lote, como se
aprecia en el siguiente conjunto de datos:
Costo ($10): 30 70 140 270 530 1010 2500 5020
Tamaño del lote: 1 5 10 25 50 100 250 500
(100 unidades)

a) Grafique un diagrama de dispersión


b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.
c) Grafique sobre el diagrama de dispersión, la línea de regresión.
d) Estime el costo para un lote cuyo tamaño es de 500 unidades
e) Calcule el error estándar de estimación
f) Calcule e interprete el coeficiente de correlación.
g) Interprete el coeficiente de determinación.

Resolución
a) Diagrama de Dispersión

Gráfica de dispersión de Y vs. X

5000

4000
Costo ( 10 dólares ): Y

3000

2000

1000

0 100 200 300 400 500


Tamaño del lote ( 100 unidades): X

b) Determinación de la Ecuación de regresión lineal: 𝑌̂ = 𝑎 + 𝑏𝑋


∑ 𝑋𝑖2 ∑ 𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑋𝑖 𝑌𝑖
𝑎=
𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 )2
𝑛 ∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖
𝑏=
𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 )2

𝑒𝑛 𝑑𝑜𝑛𝑑𝑒: ∑ 𝑋𝑖 = 941 ∑ 𝑌𝑖 = 9570 ∑ 𝑋𝑖 𝑌𝑖 = 3271030 ∑ 𝑋𝑖2 = 325751


325751(9570)−941(3271030)
Luego 𝑎 = 8(325751)−(941)2
= 22,8987

148

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

8(3271030)−(941)(9570)
𝑏= 8(325751)−(941)2
= 9,975

𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑙𝑎 𝑒𝑐𝑢𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑠𝑒𝑟á: 𝑌̂ = 22,8987 + 9,975𝑋

Interpretación: Al aumentar el tamaño del lote en 100 unidades, el costo aumentará en 9,975
decenas de dólar o sea aproximadamente en 100 dólares.

c) Gráfica de la línea de regresión lineal

Gráfica de línea ajustada


Y = 22,90 + 9,975 X

S 12,0374
5000
R-cuad. 100,0%
R-cuad.(ajustado) 100,0%

4000
Costo ( Y )

3000

2000

1000

0 100 200 300 400 500


Tamaño del lote ( X )

d) Costo estimado para un lote de 500 unidades: 𝑌̂ = 22,8987 + 9,975(5) = 72,8


Es decir, el costo estimado sería de 728 dólares.

e) Cálculo del Error Estándar de Estimación: Sy/x

∑ 𝑌 2 − 𝑎 ∑ 𝑌 − 𝑏 ∑ 𝑋𝑌
𝑆𝑦/𝑥 = √
𝑛−2

32849700 − 22,8987(9570) − 9,975(3271030)


𝑆𝑦/𝑥 = √ = 12,0374 𝑑𝑒𝑐𝑒𝑛𝑎𝑠 𝑑𝑒 𝑑ó𝑙𝑎𝑟𝑒𝑠
8−2

f) Cálculo del coeficiente de correlación: r


𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌
𝑟=
√[𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋)2 ][𝑛 ∑ 𝑌𝑖2 − (∑ 𝑌)2 ]

149

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

𝟖(𝟑𝟐𝟕𝟏𝟎𝟑𝟎) − (𝟗𝟒𝟏)(𝟗𝟓𝟕𝟎)
𝒓= =𝟏
√[𝟖(𝟑𝟐𝟓𝟕𝟓𝟏) − (𝟗𝟒𝟏)𝟐 ][𝟖(𝟑𝟐𝟖𝟒𝟗𝟕𝟎𝟎) − (𝟗𝟓𝟕𝟎)𝟐 ]

Interpretación: Existe una correlación lineal positiva perfecta; a medida que el tamaño del lote se
incrementa, el costo también crecerá.
g) Cálculo del Coeficiente de Determinación: r2 = 1
Interpretación: Las variaciones que se observa en el costo, se debe únicamente a la variación del
tamaño del lote.

Ejemplo 2.- Se llevó a cabo un experimento para estudiar el efecto de cierto medicamento para
disminuir la frecuencia cardíaca en adultos. La variable independiente es la dosis en miligramos del
medicamento y la variable dependiente es la diferencia entre la frecuencia cardíaca más baja después
de la administración del medicamento y un control antes de administrarlo. Se reunieron los siguientes
datos:

Dosis Disminución de la frecuencia


(mg) cardíaca (latidos/min)
0.50 10
0.75 08
1.00 12
1.25 12
1.50 14
1.75 12
2.00 16
2.25 18
2.50 17
2.75 20
3.00 18
3.25 20
3.50 21
a) Grafique un diagrama de dispersión
b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.
c) Grafique sobre el diagrama de dispersión, la línea de regresión.
d) Estime la disminución de la frecuencia cardíaca para una dosis de 2 mg
e) Calcule el error estándar de estimación
f) Calcule e interprete el coeficiente de correlación.
g) Calcule e interprete el coeficiente de determinación

150

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Resolución:

a) Diagrama de Dispersión

Gráfica de dispersión de Y vs. X

Y: Disminución de la frecuencia cardíaca (lat/min)


22

20

18

16

14

12

10

0.5 1.0 1.5 2.0 2.5 3.0 3.5


X: Dosis ( mg )

b) Determinación de la ecuación de regresión lineal: 𝑌̂ = 𝑎 + 𝑏𝑋


∑ 𝑋𝑖2 ∑ 𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑋𝑖 𝑌𝑖
𝑎=
𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 )2
𝑛 ∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖
𝑏=
𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 )2

𝑒𝑛 𝑑𝑜𝑛𝑑𝑒: ∑ 𝑋𝑖 = 26 ∑ 𝑌𝑖 = 198 ∑ 𝑋𝑖 𝑌𝑖 = 442,5 ∑ 𝑋𝑖2 = 63,375

63,375(198)−26(442,5)
Luego 𝑎 = = 7,055
13(63,375)−(26)2

13(442,5)−(26)(198)
𝑏= 13(63,375)−(26)2
= 4,088

𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑙𝑎 𝑒𝑐𝑢𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑠𝑒𝑟á: 𝑌̂ = 7,055 + 4,088𝑋

Interpretación: Al aumentar la dosis del medicamento en 1 mg. la reducción de los latidos del
corazón, se incrementan en 4 lat/min aproximadamente; es decir por cada mg de la dosis, los
latidos del corazón se reducen en 4 aproximadamente.
c) Gráfica de la línea de regresión lineal

151

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Gráfica de línea ajustada


Y = 7.055 + 4.088 X
22 S 1.35579

Reducción de la frecuencia cardíaca: Y


R-cuad. 90.4%
20 R-cuad.(ajustado) 89.5%

18

16

14

12

10

0.5 1.0 1.5 2.0 2.5 3.0 3.5


Dosis: X

d) Disminución estimada de la frecuencia cardíaca para una dosis de 2 mg:


𝑌̂ = 7,055 + 4,088(2) = 15
Es decir, para una dosis de 2 mg de dicho medicamento, se espera que la frecuencia cardíaca
disminuya en 15 lat/min aproximadamente.

e) Cálculo del error estándar de estimación: Sy/x

∑ 𝑌 2 − 𝑎 ∑ 𝑌 − 𝑏 ∑ 𝑋𝑌
𝑆𝑦/𝑥 = √
𝑛−2

3226 − 7,055(198) − 4,088(442,5)


𝑆𝑦/𝑥 = √ = 1,3558𝑙𝑎𝑡𝑖𝑑𝑜𝑠
13 − 2

f) Cálculo del coeficiente de correlación:

𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌
𝑟=
√[𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋)2 ][𝑛 ∑ 𝑌𝑖2 − (∑ 𝑌)2 ]

𝟏𝟑(𝟒𝟒𝟐, 𝟓) − (𝟐𝟔)(𝟏𝟗𝟖)
𝒓= = 𝟎, 𝟗𝟓𝟎𝟕
√[𝟏𝟑(𝟔𝟑, 𝟑𝟕𝟓) − (𝟐𝟔)𝟐 ][𝟏𝟑(𝟑𝟐𝟐𝟔) − (𝟏𝟗𝟖)𝟐 ]

Interpretación: Existe una correlación lineal positiva entre la dosis del medicamento y la reducción
de la frecuencia cardíaca; a medida que se aumenta la dosis del medicamento entonces la reducción
de la frecuencia también aumentará.
g) Cálculo del coeficiente de determinación: r2 = 0,904
Interpretación: El 90,4% de las variaciones que se observa en la reducción de la frecuencia cardíaca,
se debe a la variación de la dosis del medicamento; el 9,6% restante se debe a la influencia o efecto
de alguna otra variable no tomada en cuenta en el presente estudio.

152

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

EJERCICIOS PROPUESTOS
1.- Una muestra aleatoria de cinco familias da la siguiente información en relación al ingreso familiar
mensual y los gastos mensuales en gastos en seguros de salud.

Familia Ingreso mensual Gastos en seguros de salud


Ávila 3500 320
Benavides 2800 280
Calderón 4700 410
Díaz 2100 120
Ercilla 3150 340

a) Grafique un diagrama de dispersión


b) Determine la ecuación de regresión lineal.
c) Interprete el coeficiente de regresión lineal.
d) Grafique sobre el diagrama de dispersión la línea de regresión.
e) Pruebe otros modelos de regresión y elija el mejor a base del coeficiente de determinación.
f) Estímese el gasto anual en prevención de la salud de una familia cuyo ingreso mensual es
2500 soles.
g) Calcule el error estándar de la estimación del modelo
h) Calcule e interprete el coeficiente de determinación

2.- Con la siguiente información:

Horas-hombre por mes de instrucción 200 500 450 800 900 150 300 600
Accidentes por millón de Horas-hombre 7 6,4 5,2 4 3,1 8 6,5 4,4

a) Grafique el diagrama de dispersión


b) Determine una ecuación que describa la relación entre la frecuencia de accidentes y el nivel de
educación preventiva. Grafique esta ecuación.
c) Interprete los valores de los coeficientes de regresión.
d) Calcule el error estándar de la estimación del modelo.
e) Calcule e interprete el coeficiente de correlación.
f) Calcule e interprete el coeficiente de determinación.
g) Estime el número de accidentes si el número de horas de instrucción fuese 340.

3.- El editor en jefe de un importante periódico metropolitano ha


intentado convencer al dueño del periódico para que mejore las
condiciones de trabajo en el taller de prensas. Está convencido de que,
cuando trabajan las prensas, el grado de ruido crea niveles no
saludables de tensión y ansiedad. Recientemente hizo que un
psicólogo realizara una prueba durante la cual los prensistas se
situaron en cuartos con niveles variables de ruido y luego se le hizo
otra prueba para medir niveles de humor y ansiedad. La siguiente
tabla muestra el índice de su grado de ansiedad o nerviosismo y el
nivel de ruido al que se vieron expuestos. (1 es bajo y 10 es alto).
Nivel de ruido 4 3 1 2 6 7 2 3
Grado de ansiedad 39 38 16 18 41 45 25 38

a) Represente gráficamente estos datos.


b) Desarrolle una ecuación de estimación que describa los datos.
c) Pronostique el grado de ansiedad que podríamos esperar cuando el nivel de ruido es 5.

153

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

d) Calcule e interprete el coeficiente de correlación


e) Calcule e interprete el coeficiente de determinación
f) Calcule el error estándar de la estimación.

4.- Se ha medido la variación de creatinina en pacientes tratados con Captopril (droga antihipertensión)
tras la suspensión del tratamiento con diálisis, resultando la siguiente tabla:
Días tras la diálisis: X 1 5 10 15 20 25 35
Creatinina (mg/dl): Y 5,7 5,2 4,8 4,5 4,2 4 3,8

a) Calcule el modelo de regresión lineal


b) Interprete la variación de creatinina, en función de los días
transcurridos tras la diálisis.
c) Si un individuo presenta 8 días tras la suspensión del tratamiento
con diálisis, que sucede con la creatinina (mg/dl).

5.- En un grupo de 8 pacientes se registran las medidas antropométricas peso (kg) y edad (años)
obteniendo el modelo de regresión:
𝑌̂ = 20,61 + 2,83𝑋
a) Interprete la recta de regresión lineal
b) ¿Cómo cree Ud. que será el diagrama de dispersión?

6.- Una cadena de restaurantes de comida rápida decide llevar a cabo un experimento para medir la
influencia del gasto en publicidad sobre las ventas. En 8 regiones del país, se realizaron diferentes
variaciones relativas en el gasto de publicidad, comparado con el año anterior y se observaron las
variaciones en los niveles de ventas resultantes. La tabla muestra los resultados:

Incremento del gasto


en publicidad ( % ) 0 4 14 10 9 8 6 1
Incremento en las ventas ( % ) 2,4 7,2 10,3 9,1 10,2 4,1 7,6 3,5

a) Calcule el coeficiente de correlación lineal.


b) Estimar la ecuación regresión lineal del incremento en las ventas sobre el incremento del gasto en
publicidad
c) Calcule el error estándar de estimación.
d) Estime el incremento en las ventas, si el gasto en publicidad es del 10%.

7.- Los siguientes datos se refieren al número de horas de estudio invertidas por
los estudiantes fuera de clase durante un período de tres semanas para cierto
curso, junto con las calificaciones que obtuvieron en un examen aplicado al
final de ese período.

Calificaciones 64 61 84 70 88 92 72 77
Horas de estudio 20 16 34 23 27 32 18 22

a) Calcule el coeficiente de correlación lineal.


b) Estimar la ecuación regresión lineal
c) Calcule el error estándar de estimación.
d) Estime la calificación para un estudiante que estudió 24 horas durante dicho período de tiempo.

154

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

8.- Un editor tomó una muestra de 7 libros anotando el precio y el número de páginas respectivo,
obteniendo los siguientes datos.

Número de páginas 630 550 400 250 370 320 610


Precio ( $10 ) 10 8 7 4 6 6 9

a) Calcule el coeficiente de correlación lineal.


b) Estimar la ecuación regresión lineal
c) Calcule el error estándar de estimación.
d) Estimar el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 páginas en una
segunda edición. ¿En cuánto se incrementará su precio?

9.- Un investigador de una fábrica de refrescos ha tomado al azar 8 semanas


del año observando en cada semana la temperatura media (ºC) y la cantidad
de refrescos (miles) pedidos durante cada uno de dichos períodos. La
información es la siguiente:

Temperatura 10 28 12 31 30 19 24 15
Pedidos 21 65 19 72 75 36 67 24

a) Calcule el coeficiente de correlación lineal.


b) Halle la ecuación regresión lineal
c) Calcule el error estándar de estimación.
d) Estimar el pedido de refrescos para una semana cuya temperatura media es de 20ºC.

10.- Se efectúa un experimento médico para determinar el efecto de la droga efedrina en las pulsaciones
del corazón. Un paciente recibe diversas dosis diarias de la droga durante seis días. La tabla
que sigue resume los resultados del experimento.
Dosis diaria total Nº de pulsaciones
de efedrina (granos) por minuto
3 70
2 60
1 50
3 80
5 100
4 90
Nota: 1 grano = 0,06 gramos
a) Grafique un diagrama de dispersión
b) Determine la ecuación de regresión lineal. Interprete los coeficientes de regresión lineal. Grafique
sobre el diagrama de dispersión, la línea de regresión.
c) Estímese el número de pulsaciones para una dosis diaria de 4 granos de efedrina.
d) Calcule el error estándar de la estimación del modelo
e) Calcule e interprete el coeficiente de correlación.
f) Calcule e interprete el coeficiente de determinación

11.- La siguiente tabla ilustra los valores del consumo de metil mercurio y la cantidad total de mercurio
en la sangre de 12 individuos expuestos a la primera sustancia por haber consumido peces contaminados.

155

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Consumo de metil Mercurio en la sangre


mercurio ( ng/g )
(µgHg/día)
180 90
200 120
230 125
410 290
600 310
550 290
275 170
580 375
105 70
250 105
460 205
650 480

a) Calcule el coeficiente de correlación lineal.


b) Estimar la ecuación regresión lineal de la cantidad de mercurio en la sangre sobre el consumo
de metil mercurio.
c) Calcule el error estándar de estimación.
d) Estime la cantidad de mercurio en la sangre, considerando una ingesta de 300 µg de mercurio.

12.- Se quiere determinar la relación entre la experiencia en ventas y el volumen de ventas para cada
vendedor basado en un grupo de 10 vendedores de una compañía de seguros. Los años de experiencia
en ventas y los volúmenes de ventas son:

Experiencia en ventas Volumen de ventas


(años) ($10,000)
1 3
2 2
3 5
4 4
5 6
6 8
7 9
8 9
9 12
10 10

a) Halle la ecuación de regresión lineal. Interprete el coeficiente de regresión


b) Estime las ventas para un vendedor con 5 años de experiencia
c) Calcule e interprete el coeficiente de correlación
d) Interprete el coeficiente de determinación

13.- En una muestra de 8 pacientes se miden las cantidades antropométricas peso y edad obteniéndose
los siguientes resultados

Edad (años) 12 8 10 11 7 7 10 14
Peso (kg) 56 42 51 54 40 39 49 58

a) Calcule e interprete el coeficiente de correlación


b) Halle la ecuación de regresión lineal
c) Estime el peso para un paciente de 10 años de edad
d) Determine e interprete el coeficiente de determinación

156

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

14.- Consideremos los siguientes datos respecto al precio de venta ($1000) de una muestra de viviendas
y sus áreas (100 pies2) correspondientes a cada una de ellas, en cierta ciudad.

Precio de venta: 41 32 24 44 42 36 35 40 29 26
Área de la vivienda: 13 10 08 14 14 12 10 12 10 08

a) Hallar la ecuación de regresión lineal


b) Interprete el coeficiente de regresión lineal
c) Estime el precio de venta para una vivienda cuya área es de 1000 pies2
d) Calcule e interprete el coeficiente de correlación lineal
e) Interprete el coeficiente de determinación

157

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

CHI CUADRADO
PRUEBA DE INDEPENDENCIA

Es una prueba de hipótesis que tiene por objeto probar si dos variables cualitativas nominales son
independientes entre sí.

Hipótesis:

H0: X e Y son independientes (no están relacionados)


H1: X e Y no son independientes (están relacionados)

Estadístico de prueba:
𝑟 𝑐 2
2
(𝑂𝑖𝑗 − 𝑒𝑖𝑗 ) 𝑛𝑖∎ 𝑛∎𝑗
𝜒𝑐 = ∑∑ ∼ 𝜒 2 (𝑟−1)(𝑐−1) 𝑒𝑖𝑗 =
𝑒𝑖𝑗 𝑛∎∎
𝑖=1 𝑗=1

Criterio de rechazo:

𝜒𝑐 2 > 𝜒 2 𝛼 ,(𝑟−1)(𝑐−1)

Conclusión:

Ejemplo 1.- Se tiene la siguiente información obtenida de una muestra de 5,000 fallecidos.

DIAGNÓSTICO
Muerte por cáncer Muerte por otras Total
de pulmón causas

Fumadores 348 3152 3500


No 82 1418 1500
Fumadores
Total 430 4570 5000

Se desea probar la hipótesis de que el fumar y la muerte por cáncer pulmonar son independientes con
α = 0,01

Solución
𝐻0 : No existe relación entre el hábito de fumar y la muerte por cáncer pulmonar.
𝐻1 : Sí existe relación entre el hábito de fumar y la muerte por cáncer pulmonar.
Nivel de significancia 𝛼 = 0,01

DIAGNÓSTICO
Muerte por cáncer de pulmón Muerte por otras causas Total

Fumadores 348 301 3,152 3199 3500


No Fumadores 82 129 1418 1371 1500
Total 430 4570 5000

158

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

(348 − 301)2 (3,152 − 3199)2 (82 − 129)2 (1418 − 1371)2


𝜒𝑐2 = + + + = 26,764
301 3199 129 1371
2
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑠𝑖 𝜒𝑐2 > 𝜒(1−α;gl) (𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝜒 2 𝑐𝑜𝑛 1 𝑔. 𝑙
2
𝐸𝑛 𝑒𝑠𝑡𝑒 𝑐𝑎𝑠𝑜 𝜒(1−α;gl) = 6,635. 𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0

Conclusión: Los resultados muestrales proporcionan evidencia suficiente como para concluir que
ambos factores están relacionados con nivel de significación de 0,01.

PRUEBA DE HOMOGENEIDAD

Se caracteriza porque tiene como objetivo probar la igualdad de proporciones (probar si los datos de
cierta muestra provienen de la misma población).
Además, los totales ya sea de filas o columnas son determinados o fijados de antemano por el
investigador.

Hipótesis:

H0: Las proporciones son iguales


H1: Al menos una de las proporciones no es la misma.

Estadístico de prueba:
𝑟 𝑐 2
2
(𝑂𝑖𝑗 − 𝑒𝑖𝑗 ) 𝑛𝑖∎ 𝑛∎𝑗
𝜒𝑐 = ∑∑ ∼ 𝜒 2 (𝑟−1)(𝑐−1) 𝑒𝑖𝑗 =
𝑒𝑖𝑗 𝑛∎∎
𝑖=1 𝑗=1

Criterio de rechazo:

𝜒𝑐 2 > 𝜒 2 𝛼 ,(𝑟−1)(𝑐−1)

Ejemplo 1.- El director de compras de una fábrica grande debe decidir


por la compra de una de las cuatro marcas que hay en el mercado. Para
probar si existe diferencia significativa en la calidad de las máquinas,
obtiene una muestra de la producción de 150 artículos para cada una
de ellas y observa el número de defectuosos. Los resultados se dan en
la siguiente tabla:

MÁQUINAS
A B C D Total
Defectuosos 21 12 15 18 66
Buenos 129 138 135 132 534
Total 150 150 150 150 600

159

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Solución
𝐻0 : 𝑝𝐴 = 𝑝𝐵 = 𝑝𝐶 = 𝑝𝐷 (La proporción de defectuosos son las mismas en cada una de las máquinas).
𝐻1 : Al menos en una de las máquinas la proporción de defectuosos no es la misma.
Nivel de significancia 𝛼 = 0,05

MÁQUINAS
CALIDAD A B C D Total
Defectuosos 21 16,5 12 16,5 15 16,5 18 16,5 66
Buenos 129 133,5 138 133,5 135 133,5 132 133,5 534
Total 150 150 150 150 600

(21 − 16,5)2 (129 − 133,5)2 (132 − 133,5)2


𝜒𝑐 2 = + +. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . + = 3,064
16,5 133,5 133,5

2
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑠𝑖 𝜒𝑐 2 > 𝜒(1−α;gl) (𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝜒 2 𝑐𝑜𝑛 3𝑔. 𝑙)
2
𝐸𝑛 𝑒𝑠𝑡𝑒 𝑐𝑎𝑠𝑜 𝜒(1−α;gl) = 7,815. 𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0

Conclusión: La proporción de piezas defectuosas en las cuatro máquinas es la misma con un nivel de
significancia de 0,05.

Ejemplo 2.- Se sostiene que una droga determinada es efectiva para la curación del catarro común. En
un experimento con 164 personas con catarro, a la mitad de ellas se le suministró la droga y a la otra
mitad se le suministró píldoras azucaradas. Las reacciones de los pacientes aparecen anotadas en la
siguiente tabla:

REACCIONES
Mejorados Empeorados Efecto Nulo Total

Droga 52 10 20 82

Azúcar 44 12 26 82

Total 96 22 46 164

Solución
𝐻0 : 𝐿𝑎 𝑑𝑟𝑜𝑔𝑎 𝑦 𝑙𝑎𝑠 𝑝í𝑙𝑑𝑜𝑟𝑎𝑠 𝑡𝑖𝑒𝑛𝑒𝑛 𝑖𝑔𝑢𝑎𝑙 𝑒𝑓𝑒𝑐𝑡𝑜.
𝐻1 : 𝐿𝑎 𝑑𝑟𝑜𝑔𝑎 𝑦 𝑙𝑎𝑠 𝑝í𝑙𝑑𝑜𝑟𝑎𝑠 𝑛𝑜 𝑡𝑖𝑒𝑛𝑒𝑛 𝑖𝑔𝑢𝑎𝑙 𝑒𝑓𝑒𝑐𝑡𝑜.
𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝛼 = 0,05

REACCIONES
Mejorados Empeorados Efecto Nulo Total

Droga 52 48 10 11 20 23 82

Azúcar 44 48 12 11 26 23 82

Total 96 22 46 164

160

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

(52 − 48)2 (10 − 11)2 (26 − 23)2


𝜒𝑐 2 = + +. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . + = 1,631
48 11 23
2
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒 𝑑𝑒𝑐𝑖𝑠𝑖ó𝑛: 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑠𝑖 𝜒𝑐 2 > 𝜒(1−α;gl) (𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝜒 2 𝑐𝑜𝑛 2𝑔. 𝑙)
2
𝐸𝑛 𝑒𝑠𝑡𝑒 𝑐𝑎𝑠𝑜 𝜒(1−α;gl) = 5,991. 𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0

Conclusión: Las drogas y las píldoras azucaradas producen reacciones similares.

EJERCICIOS PROPUESTOS
1.- Una encuesta realizada en 378 hospitales por el Colegio de
Cirujanos Americanos produjo los datos de la tabla siguiente:

Tipo de tumor Total


Benigno Maligno
Usan anticonceptivos 138 49 187
No usan 39 41 80
No conocen su uso 35 76 111
Total 212 166 378

¿Proporcionan los datos evidencia suficiente para indicar una dependencia entre el tipo de tumor y el
uso de anticonceptivos orales? Use un nivel de significancia α = 0,05 Rpta. Sí existe dependencia
entre el tipo de tumor y el uso de anticonceptivos orales

2.- Sobre una muestra de 500 niños de cierta escuela primaria se hizo un estudio acerca de su estado de
nutrición y el desempeño académico, obteniéndose los siguientes resultados:

Desempeño Académico Estado de Nutrición Total


Pobre Bueno
Malo 105 15 120
Satisfactorio 80 300 380
Total 185 315 500

Existe relación entre el desempeño académico y el estado de nutrición. Use un nivel de significancia
α = 0,01 Rpta. Sí existe relación entre el desempeño académico y el estado de nutrición

3.- Se llevó a cabo una encuesta con respecto a la preferencia del consumidor para determinar si existía
alguna predilección entre las tres marcas competitivas (A, B y C) dependiendo de la región geográfica
en la que habita el consumidor. La información obtenida es la siguiente:

Región I Región II Región III Total


Marca A 40 52 25 117
Marca B 52 70 35 157
Marca C 68 78 60 206

Total 160 200 120 480


Con esta información ¿La preferencia por una determinada marca depende de la región geográfica?
Rpta. No existe dependencia entre el área geográfica y la preferencia de una marca

161

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

4.- Se tomó una muestra de 400, 500 y 400 compradores de las ciudades de Piura, Trujillo y Chiclayo
respectivamente con la finalidad de determinar si la proporción verdadera de compradores que se
inclinan por el producto A en lugar del B, es la misma en las tres ciudades. Use un nivel de significancia
α = 0,05

Producto A Producto B Total


Piura 232 168 400
Trujillo 260 240 500
Chiclayo 197 203 400
Total 689 611 1300

5.- Se examinó una muestra de 2,000 registros médicos los cuales dieron los siguientes resultados:

Muerte por cáncer Muerte por otras causas Total


del intestino
Fumadores 22 1,178 1,200
No Fumadores 26 774 800
Total 48 1,952 2,000

Probar la hipótesis que las dos clasificaciones son independientes con un nivel de significancia α = 0,05

6.- Cierta compañía desea determinar si el ausentismo se relaciona


con la edad. Se toma una muestra de 200 empleados al azar y se
clasifica según su edad y causa de ausentismo:

CAUSA EDAD
Menos de 30 30 - 50 Más de 50
Enfermedad 40 28 52
Otras 20 36 24

¿Está la edad relacionada con el ausentismo? Use un nivel de significancia α = 0,01

7.- Una fábrica de automóviles quiere averiguar si el sexo de sus


posibles clientes no tiene relación con la preferencia del modelo. Se
toma una muestra aleatoria de 2,000 posibles clientes y se clasifican
así:

SEXO MODELO
I II III
Masculino 350 270 380
Femenino 340 400 260

Contrastar la hipótesis de que el sexo no tiene relación con la preferencia hacia un determinado modelo
para un nivel de significancia α = 0,01

8.- Se desea determinar si existe algún tipo de relación entre la concentración de procaína usada en
operaciones del molar mandibular y el porcentaje de casos satisfactorios (efectividad clínica de la
anestesia). Se tuvo la siguiente información:

Solución de procaína Casos satisfactorios Casos no satisfactorios


1.0 % 07 18
Más de 1.0 % 63 12

162

Descargado por lu vvv (ricehom480@apxby.com)


lOMoARcPSD|30546586

Contrastar la hipótesis use un nivel de significancia de α = 0,05

9.- Un investigador estudia el nivel de efectividad de tres remedios


R1, R2 y R3 para aliviar cierta enfermedad. Para esto escogió tres
muestras aleatorias de tamaños 50, 70 y 60 pacientes con la
enfermedad, suministrando a la primera el remedio R1, a la segunda
muestra el remedio R2 y a la tercera el remedio R3; y midiendo la
efectividad de los remedios en tres niveles: Sin alivio, cierto alivio y
alivio total. Los resultados del experimento se dan en la tabla que
sigue:

Efectividad Remedios para la alergia


R1 R2 R3
Sin alivio 10 20 15
Cierto alivio 30 20 20
Alivio total 10 30 25

¿Puede inferir que los tres remedios para la alergia son igualmente efectivos?

10.- El ingeniero quiere saber si hay diferencias en la calidad de los productos procesados en los tres
turnos operativos de una fábrica. Para esto se tomó una muestra aleatoria de tamaño 100 de cada turno
del día anterior y las clasificó según el turno de su producción: mañana, tarde y noche; y según su
calidad: defectuoso o no defectuoso. Los resultados se dan en la siguiente tabla:

Calidad Turnos de producción


Mañana Tarde Noche
Defectuosos 3 12 15
No defectuosos 97 88 85

Pruebe al nivel de significación del 5% la hipótesis de la igualdad de las tres proporciones reales de
producción defectuosa.

163

Descargado por lu vvv (ricehom480@apxby.com)

También podría gustarte