Documentos de Académico
Documentos de Profesional
Documentos de Cultura
APLICADA A LA PSICOLOGÍA
Asignatura: Estadística Aplicada a la Psicología
ÍNDICE
INTRODUCCION
Control de Lectura Nº 1
Bibliografía de la Unidad I
Autoevaluación No. 01
Actividad N°01
Actividad N°02
Bibliografía de la Unidad II
ucontinental.edu.pe | 2
Asignatura: Estadística Aplicada a la Psicología
Autoevaluación No. 02
Actividad N°01
Actividad N°02
Autoevaluación No. 04
Actividad N°1
Actividad N°2
Tarea Académica N° 2
Glosario
Bibliografía de la Unidad IV
Autoevaluación No. 04
ANEXO
Clave de respuestas
ucontinental.edu.pe | 3
Asignatura: Estadística Aplicada a la Psicología
INTRODUCCIÓN
El Autor
ucontinental.edu.pe | 4
Asignatura: Estadística Aplicada a la Psicología
DIAGRAMA DE PRESENTACIÓN
DE LA ASIGNATURA
COMPETENCIA:
UNIDADES DIDACTICAS:
ucontinental.edu.pe | 5
Asignatura: Estadística Aplicada a la Psicología
ucontinental.edu.pe | 6
Asignatura: Estadística Aplicada a la Psicología
1.1Definiciones Básicas 11
1.1.1 Unidad elemental
Es el elemento o unidad base de la población o de la muestra que permite
obtener información o datos referidos a ciertas características o variables que
nos interesan para explicar determinado fenómeno.
También es llamada unidad de observación, unidad de análisis, unidad
estadística, caso o elemento. Por ejemplo, en estudios de satisfacción del
cliente en una tienda de retails, la unidad elemental es cada consumidor.
Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una
lista de todos los individuos que pertenecen a la población objetivo. En vez de
eso, la unidad de muestreo es cada familia y la unidad elemental es cada
individuo que vive en una familia.
1.1.6 Muestreo
Conjunto de métodos y procedimientos estadísticos destinados a la selección
de una o más muestras. Es la técnica elegida para seleccionar a la muestra. El
objetivo principal de un diseño de muestreo es proporcionar procedimientos
para la selección de muestras que sean representativas de la población en
estudio.
El muestreo comprende por lo menos dos etapas:
La selección de las unidades
El registro de las observaciones.
1
Estadística. Mario Triola 10°Ed.
ucontinental.edu.pe | 7
Asignatura: Estadística Aplicada a la Psicología
FICHA TÉCNICA
Título del estudio: Encuesta de Opinión en Lima Metropolitana Noviembre
2009
Objetivos del Estudio: Evaluación y opinión sobre la situación económica
Encuestadora: Pontificia Universidad Católica del Perú
Nº de registro: 0108 REE/JNE
ucontinental.edu.pe | 8
Asignatura: Estadística Aplicada a la Psicología
ucontinental.edu.pe | 9
Asignatura: Estadística Aplicada a la Psicología
Limitaciones
• Requiere de una lista precisa de las unidades de muestreo, que puedan
identificarse y numerarse. Se puede, tal vez, numerar cada expediente de
un procedimiento de compras, pero no se puede enumerar ni identificar
exhaustivamente a los pacientes ambulatorios que van a atenderse a un
hospital público en determinado momento.
• Cada unidad de muestreo debe tener la misma probabilidad de ser elegido
que cualquier otra unidad.
• Es poco económico frente a determinadas circunstancias, como
cuando llevar a cabo un procedimiento de auditoría implica la destrucción de
la unidad muestreada. En estos casos, el muestreo aleatorio simple ofrece
tamaños de muestra mayores que otros métodos más específicos.
Ejercicio
1
Una empresa de alimentos tiene registrado en el cuadro siguiente,
información acerca del ingreso mensual (en nuevos soles) y años cumplidos en
la empresa de cada uno de sus 150 trabajadores.
2
TOMADO DEL LIBRO DE MARIO TRIOLA 10ª ED. CAPÍTULO 1.
ucontinental.edu.pe | 10
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 11
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 12
Asignatura: Estadística Aplicada
Cuadro N°2: TABLA DE NÚMEROS ALEATORIOS (UPC, 2010)
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C2
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 0
9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
ucontinental.edu.pe | 13
Asignatura: Estadística Aplicada
Limitaciones
• Es equivalente a un muestreo agrupado del que se extrae un solo grupo, por lo que
pierde robustez en cuanto a la representatividad esperada. Para intentar neutralizar
este efecto, su puede elegir más de un grupo (en términos prácticos, habrá de
elegirse una unidad “A” situada entre 1 y k, y al menos una unidad “B” ≠ “A”,
también situada entre 1 y k y seguir el procedimiento de extracción a partir de “A” y
de “B”). No obstante, esto atenta contra la eficiencia del plan ya que implica un
derroche de recursos frente al muestreo aleatorio simple.
• No permite identificar periodicidad oculta. Por ejemplo, frente a mayores
ventas los primeros sábados del mes, o asignaciones de planes sociales antes
de fin de mes.
• No permite identificar sistematicidad oculta. Por ejemplo, considérese un diente
defectuoso en un engranaje, y que ese diente incida sobre cierto lote de productos.
Ejemplo
Se tiene una población de 40 personas y se desea elegir a cinco de ellas
mediante un muestreo sistemático. ¿Cuál es el arranque aleatorio para este
ejemplo? Seleccione la muestra indicando la posición de cada elemento
elegido.
Ejemplo
Se tiene información de 40 alumnos del curso de Estadística II del ciclo
regular. Obtenga una muestra aleatoria de ocho personas usando el muestreo
sistemático y elabore una tabla con los elementos seleccionados.
Cuadro N° 03: Individuos Registrados
Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura
1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 69
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 74
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 90
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 164
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162
ucontinental.edu.pe | 14
Asignatura: Estadística Aplicada
Ejercicio 2
Una empresa de alimentos (la misma del ejercicio 1) tiene un total de 150
empleados y ha registrado en la tabla que se muestra a continuación
información acerca de las variables: ingreso mensual (en soles), nivel de
educación y años cumplidos en la empresa.
Aplique el muestreo sistemático para seleccionar una muestra de ocho
empleados. Elabore un listado con la muestra seleccionada.
Si se tiene que usar más de una variable para formar los estratos, cuidar
que estas no estén relacionadas entre sí.
No se deben considerar la formación de muchos estratos, generalmente se
usan entre tres y ocho estratos.
Los estratos pequeños no contribuyen mucho a la reducción del error, por lo
tanto pueden no ser considerados.
Limitaciones
Cálculos complejos para estimar la precisión.
ucontinental.edu.pe | 15
Asignatura: Estadística Aplicada
Ejemplo
La empresa embotelladora DEL VALLE tiene 120 empleados de los cuales
tiene información de las variables: ingreso en soles, tipo de profesión y años en
la empresa.
Cuadro N° 04: REGISTRO DE TRABAJADORES
AÑOS EN AÑOS EN
INGRESO TIPO INGRESO TIPO
N° LA N° LA
EN SOLES PROFESION EN SOLES PROFESION
EMPRESA EMPRESA
1 2100 C.EMPRESA 5 61 2300 INGENIERÍA 15
ucontinental.edu.pe | 16
Asignatura: Estadística Aplicada
Solución
Se divide a la población en estratos que sean mutuamente excluyentes, luego
los estratos 1, 2 y 3 son: C.Empresa, Ingeniería y C.Sociales,
respectivamente. Para cada uno de los estratos, seleccionamos muestras
aleatorias simples.
ucontinental.edu.pe | 17
Asignatura: Estadística Aplicada
Ejercicio 3
ucontinental.edu.pe | 18
Asignatura: Estadística Aplicada
Solución:
Posición Nh
Estrato Nh nh = xn
(desde – N
hasta)
Panamericana N1= n1 =
Estudio 92 N2= n2 =
Oxígeno N3= n3 =
Total
Luego, para cada estrato realice un muestreo aleatorio simple utilizando la tabla
de números aleatorios.
ucontinental.edu.pe | 19
Asignatura: Estadística Aplicada
Muchos pacientes pagan de $25 a $50 por una sesión de terapia de contacto en la
que el terapeuta coloca sus manos a unos centímetros del cuerpo del paciente, sin
tener realmente contacto físico. El objetivo es curar una amplia variedad de
problemas médicos, incluyendo cáncer, SIDA, asma, enfermedades cardiacas,
dolores de cabeza, quemaduras y fracturas óseas. La teoría básica plantea que un
terapeuta de contacto capacitado profesionalmente puede detectar un mal
alineamiento en el campo de energía del paciente y generar un equilibrio energético
que incrementa el proceso de curación.
Cuando Emily Rosa, una niña de nueve años, estaba en cuarto grado, eligió el tema
de la terapia de contacto para el proyecto de una feria de ciencias y convenció a 21
terapeutas de contacto experimentados para que participaran en una prueba
sencilla de su capacidad para detectar el campo de energía humana. Emily utilizó
un cartón con dos agujeros para introducir las manos. Cada terapeuta de contacto
pasaba sus dos manos a través de los agujeros, y Emily colocaba su mano por
arriba de una de las manos del terapeuta; luego, se le pedía al terapeuta que
identificara la mano que Emily había elegido.
La niña lanzaba una moneda para seleccionar al azar la mano sobre la que colocaba
la suya. Esta prueba se repitió 280 veces. Si los terapeutas de contacto realmente
tenían la habilidad de percibir un campo energético humano, debían identificar la
mano correcta mucho más del 50% de las veces. Si no tenían tal capacidad y sólo
hacían conjeturas, debían acertar alrededor del 50% de las veces. Emily obtuvo los
siguientes resultados: de los 280 ensayos, los terapeutas de contacto identificaron
la mano correcta 123 veces, es decir, tuvieron una tasa de éxito del 44%. Emily,
con la ayuda de su madre, un especialista en estadística y un médico, envió sus
hallazgos para publicarlos en el prestigioso Journal of the American Medical
Association. Después de una cuidadosa y detallada revisión del diseño experimental
y de los resultados, se publicó el artículo "A Close Look at a Therapeutic Touch"
(Journal of the American Medical Association, vol. 279, núm. 13). Emily se convirtió
en la investigadora más joven en publicar un artículo en esa revista. Además, ganó
el primer premio de la feria de ciencias por su proyecto.
Consideremos los principales resultados del proyecto de Emily. En los 280 ensayos,
los terapeutas de contacto acertaron 123 veces. Tenemos una proporción muestral
con n = 280 y x = 123. Los argumentos en contra de la validez del estudio podrían
incluir la aseveración de que el número de ensayos es demasiado pequeño para ser
significativo, o que los terapeutas de contacto tuvieron un mal día y que, debido al
azar, no tuvieron tanto éxito como la población de todos los terapeutas de
contacto. En este capítulo analizaremos estos temas.
También es importante señalar que el proyecto de Emily Rosa fue relativamente
sencillo. Recuerde que ella realizó el estudio cuando cursaba el cuarto grado de
primaria. Su proyecto es el tipo de actividad que cualquier estudiante de un curso
de introducción a la estadística podría llevar a cabo. Después de comprender los
conceptos que se enseñan en el curso de introducción a la estadística típico, los
estudiantes tienen la habilidad para realizar trabajos significativos e importantes.
ucontinental.edu.pe | 20
Asignatura: Estadística Aplicada
ACTIVIDAD No 1
Aplica los métodos de muestreo estudiados y compara promedios muestréales
con poblacionales para obtener conclusiones.
ucontinental.edu.pe | 21
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 22
Asignatura: Estadística Aplicada
Estimación puntual
Es una medida descriptiva numérica aplicada a las características en las
unidades de la muestra, calculada con ciertos procedimientos establecidos
por indicadores estadísticos conocidos como estimadores o estadísticos.
Intervalo de confianza
Es un intervalo de valores dentro de los cuales se espera que esté
comprendido el parámetro con un nivel de confianza dado o con un error
conocido.
Nivel de confianza
Expresa la probabilidad de alcanzar la precisión deseada entre el valor
estimado y el parámetro. Se representa como: 1-.
Nivel de riesgo
Expresa la probabilidad de no alcanzar la precisión deseada, también es
conocido como nivel de significancia. Se representa con: .
3
Mario Triola. Estadística. 2009
ucontinental.edu.pe | 23
Asignatura: Estadística Aplicada
Parámetro
Estimador Estimación
poblacional
n n
Media X i x i
̂ X i 1
x i 1
n n
1 n
1 n
xi x
2
Varianza 2 ̂ 2 S 2 ( X i X )2 s2
n 1 i 1 n 1 i 1
X númeroéxitos x
Proporción pó π pˆ pˆ
n númeropruebas n
Eficiente: Se dice que los estimadores son eficientes cuando generan una
distribución muestral con el mínimo error estándar es decir, entre dos
estimadores insesgados de un parámetro dado es más eficiente el de menor
varianza.
ucontinental.edu.pe | 24
Asignatura: Estadística Aplicada
pˆ qˆ pˆ qˆ
pˆ z , pˆ z
2
n 2
n
pˆ qˆ N n pˆ qˆ N n
pˆ Z1 / 2 p pˆ Z1 / 2
n N 1 n N 1
Ejemplo
El dueño de un diario se interesa en la proporción de reporteros varones que
cometen errores al momento de entregar el reporte final. Al seleccionar una
muestra aleatoria de 100 reporteros varones encontró que 24 cometían
errores. Calcule e interprete un intervalo de confianza del 99% para la
verdadera proporción de reporteros varones que cometen errores al
momento de entregar el reporte final.
Solución
24
i) La estimación puntual de p es pˆ 0,24 y Z 0,995 2,58
100
0,13 p 0,35
ucontinental.edu.pe | 25
Asignatura: Estadística Aplicada
x z / 2 , x z / 2
n n
Donde la variable aleatoria Z sigue una distribución N(0,1).
n
0,05
Si el muestreo es sin reemplazo y la fracción de muestreo N el error
estándar será:
N n
x y los límites de confianza se calculan con la siguiente fórmula.
n N 1
N n N n
x Z1 / 2 x Z1 / 2
n N 1 n N 1
Ejemplo
Un artículo publicado en un diario local indica que el tiempo promedio empleado
por los hogares de Lima Metropolitana en ver televisión en el horario de 8 p.m.
a 11 p.m. es de 7,75 horas. Suponga que el tiempo tiene una distribución
aproximadamente normal con desviación estándar de 3,45 horas. Para
corroborar dicha afirmación un grupo de estudiantes selecciona una muestra de
180 hogares de L.M. y obtuvo que el tiempo promedio fue de 7,42 horas por
semana. ¿Será cierta la afirmación publicada por el diario local al 96% de
confianza?
Solución:
i) La estimación puntual de es x =7,42 siendo n=180
ii) 1- = 0,96 = 0.04 entonces: Z 1 / 2 = Z(0.98) = 2,05
como: x Z1 / 2 x Z1 / 2
n n
3,45 3,45
iii) IC ( ) 7,42 (2,05) 7,42 (2,05)
180 180
6,8928 7,9472
Ejemplo
Se tienen 50 000 trabajadores de construcción civil empadronados en el
Ministerio de Trabajo, de los cuales se tomó una muestra aleatoria de 400 y se
analizó el ingreso diario. Si la media de los trabajadores encuestados es de 74
soles diarios con una desviación estandar de 10.68 soles, construya un intervalo
de confianza del 90% para el ingreso diario de todos los trabajadores de
construcción civil.
ucontinental.edu.pe | 26
Asignatura: Estadística Aplicada
Solución
i) x =74; n=400; N=50 000 y s=10.68
ii) 1- = 0,90 = 0.1 entonces: Z 1 / 2 = Z(0.90) = 1.645
N n N n
iii) x Z1 / 2 x Z1 / 2
n N 1 n N 1
iv)
10.68 50000 400 10.68 50000 400
IC ( ) 74 (1.645 ) x 74 (1.645 ) x
400 50000 1 400 50000 1
v) IC ( ) 73 .13 74 .87
Distribución t-Student
ucontinental.edu.pe | 27
Asignatura: Estadística Aplicada
Ejemplo
El jefe del área de prensa de un diario desea evaluar la habilidad de su
equipo de trabajo en el digitado de una misma noticia. Para realizar dicho
estudio selecciona al azar una muestra aleatoria de redactores obteniendo
los siguientes resultados (en minutos):
3,2 4,8 5,3 9,1 6,3 8,2 6,5 9,6 10,3 8,6
6,3 7,9 8,2 7,9 6,9 9,3 8,6 6,8 10,1 9,0
Ejemplo
Pamela, estudiante de estadística para Ciencias de la Empresa piensa que el
gasto promedio semanal en fotocopias de los estudiantes de su facultad es
de 3.5 soles. Para verificar si es cierto lo que está pensando ha elegido al
azar una muestra de 9 estudiantes de un total de 120 estudiantes que llevan
el curso de estadística para comunicadores, resultando los siguientes gastos:
ucontinental.edu.pe | 28
Asignatura: Estadística Aplicada
Solución:
i) n=9; N=120; 1-α=0.96
ii) x =2.3889 siendo s= 0.7639 y n/N=0.0758>0.05
iii) t / 2;n 1 =2.44898
iv)
IC ( ) x t
N n
s
n 1;
2
N 1
n
2,3889 2,44898
0,7639 120 9
9 120 1
1,7866 2,9912
Conclusión: Con un nivel de confianza del 96% se puede decir que el gasto
promedio semanal en fotocopias de los estudiantes de su facultad es menor
a 3.5 soles, por lo que podríamos decir que lo que piensa Pamela no es
cierto.
donde n21,1 / 2 es tal que P n21 n21,1 / 2 y
2
n21, / 2 es tal que P n21 n21, / 2 1
2
ucontinental.edu.pe | 29
Asignatura: Estadística Aplicada
Ejemplo
Un fabricante de baterías para automóviles afirma que sus baterías durarán,
en promedio, tres años con una varianza de un año. Si cinco de estas
baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años, construya un
intervalo de confianza del 95% para y decida si la afirmación del
2
Solución
i) s2 = 0,815, n=5
ii) El valor 21-/2 , es un valor 2 con = 5-1 grados de libertad, que deja un
área de 0,025 a la izquierda y por lo tanto un área de 0,975 a la derecha, es
20,975 = 0,484; de la misma forma, el valor 2/2 es igual a 20,025 = 11,143.
(5 1)(0.815 ) (5 1)(0.815 )
iii) 2
11 .143 0.484
iv) 0.3 6.7
2
Ejemplo
Se desea estimar la varianza de la longitud de ciertos cables. En una
muestra de 25 cables se encuentra que la longitud tiene una media de 80 m
y una desviación de 3 m. Hallar un intervalo con una confianza del 95%,
para la varianza de las longitudes de los cables.
Solución
i) n 25 : x 80 , s 3 , s 2 9
ii) N .C. 0.95 1 0.025 , 1 0.975
2 2
iii) ( 0.025, 24) 12 .4011 , ( 0.975, 24) 39 .3641
2 2
ucontinental.edu.pe | 30
Asignatura: Estadística Aplicada
24 9 24 9
iv) 2
39 .3641 12 .4011
v) 5.49 2 17 .42
Ajuste de Tamaño de
muestra para
población finita
n0
n
n
1 0
N
Donde:
E: Es el error permitido;
Z: El valor estándar normal asociado con el grado de confianza
elegido,
: La desviación de la población, obtenida de estudios anteriores,
experiencias previas o se puede estimar la desviación estándar
muestral mediante un estudio piloto
no: Tamaño de muestra calculada de una población infinita
N: Tamaño de población
Se dice que una población es finita si la relación n/N > 5%
z 2 pq z 2 pqN
n 2 n 2
E E ( N 1) z 2 pq
ucontinental.edu.pe | 31
Asignatura: Estadística Aplicada
Donde:
E: Es el error permitido;
Z: El valor estándar normal asociado con el grado de confianza
elegido,
P: La proporción de éxito de la población, obtenida de estudios
anteriores, experiencias previas o se puede estimar la proporción
de éxito muestral mediante un estudio piloto.
q: La proporción de fracaso de la población se obtiene por
complemento de p: q = 1 – p
N: Tamaño de población
Ejemplo
Se desea estimar el peso promedio de los sacos que son llenados por
un nuevo instrumento en una industria. Se conoce que el peso de un
saco que se llena con este instrumento es una variable aleatoria con
distribución normal. Si se supone que la desviación típica del peso es
de 0,5 kg. Determine el tamaño de muestra aleatoria necesaria para
determinar una probabilidad igual a 0,95 de que el estimado y el
parámetro se diferencien modularmente en menos de 0,1 kg.
Solución
i) e=0.1; 0.5; 0.05
ii) Z 1 1,96
2
0,51,96
2
iii) n 96 ,4
0,1
Evidentemente un tamaño de muestra no puede ser fraccionario por
lo que se debe aproximar por exceso. El tamaño de muestra sería de
97.
Ejemplo
La Dirección Regional de Trabajo planea realizar un estudio con el
objetivo de conocer el promedio de horas semanales trabajadas por
las mujeres del servicio doméstico. La muestra será extraída de una
población de 10000 mujeres que figuran en los registros del seguro
social y de las cuales se conoce a través de un estudio piloto que su
varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y
estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser
el tamaño muestral requerido?
Solución
i) e=0.1; 9.648 ; 0.05
ii) Z 1 1,96
2
9.648 1,96
2
iii) n 3706
0,1
iv) Como 10000<3706x(3706-1), se corrige el tamaño de muestra
3706
n 2704
3706
1
10000
Ejemplo
En un lote de frascos para medicina, con una población de 8000
unidades, se desea estimar la media de la capacidad en centímetros
ucontinental.edu.pe | 32
Asignatura: Estadística Aplicada
Solución
i) e=0.25 cm3; 2cm3 ; 0.05
ii) Z 1 1,96
2
N . 2 Z 2 2
iii) n
Ne 2 Z 2 2
8000 (2) 2 (1.96) 2
iv) n
8000 (0.25) 2 (2) 2 (1.96) 2
122931 .2
v) n 239
515 .37
Solo faltaría muestrear 204 frascos, pues los datos de los 35 frascos
del premuestreo siguen siendo válidos.
Ejemplo
En una investigación, se desea determinar en que proporción los
niños de una región toman leche en el desayuno. Si se sabe que
existen 1500 niños y deseamos tener una precisión del 10 %, con un
nivel de significancia del 5%. ¿De que tamaño debe de ser la
muestra?
Solución
i) N=1500; e=10%=0.1; 0.05
ii) p = 0.5 y q = 0.5
N . p.q.Z 2 2
iv) n
N .e 2 p.q.Z 2 2
1500 (0.5)(0.5)(1.96) 2
v) n
1500 (0.1) 2 (0.5)(0.5) / 1.96) 2
vi) n 90
Se deben muestrear 90 niños.
Nivel de Confianza 99.73% 99% 98% 96% 95.45% 95% 90% 80%
Valores de Z 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28
ucontinental.edu.pe | 33
Asignatura: Estadística Aplicada
ACTIVIDAD N°2
Ingreso Ingreso
N Número Nivel Número Nivel
semana N° semana
° de hijos educativo de hijos educativo
l l
1 75 3 Primaria 51 160 1 Secundaria
2 80 2 Primaria 52 335 1 Secundaria
3 90 3 Primaria 53 220 2 Secundaria
4 110 1 Primaria 54 250 3 Secundaria
5 95 2 Primaria 55 180 2 Secundaria
6 85 2 Primaria 56 130 2 Secundaria
7 110 4 Primaria 57 220 2 Secundaria
8 110 2 Primaria 58 460 3 Secundaria
9 90 2 Primaria 59 220 1 Secundaria
10 130 3 Primaria 60 395 2 Secundaria
11 120 1 Primaria 61 380 3 Secundaria
12 90 3 Primaria 62 310 3 Secundaria
13 102 3 Primaria 63 300 3 Secundaria
14 80 2 Primaria 64 580 3 Secundaria
15 80 2 Primaria 65 540 2 Secundaria
16 80 1 Primaria 66 280 2 Secundaria
17 110 1 Primaria 67 285 1 Secundaria
18 90 1 Primaria 68 430 3 Secundaria
19 100 2 Primaria 69 420 3 Secundaria
20 85 3 Primaria 70 280 2 Secundaria
21 120 2 Primaria 71 250 2 Secundaria
22 105 2 Primaria 72 300 2 Secundaria
23 120 1 Primaria 73 340 3 Superior
24 250 3 Primaria 74 540 2 Superior
25 200 4 Primaria 75 550 2 Superior
26 120 2 Primaria 76 440 2 Superior
27 195 3 Primaria 77 690 3 Superior
28 100 3 Primaria 78 550 2 Superior
29 250 2 Primaria 79 430 2 Superior
30 280 3 Primaria 80 620 3 Superior
31 250 2 Primaria 81 600 3 Superior
32 230 2 Primaria 82 630 2 Superior
33 120 2 Primaria 83 690 1 Superior
34 200 3 Primaria 84 350 2 Superior
ucontinental.edu.pe | 34
Asignatura: Estadística Aplicada
2. Los siguientes datos han sido extraídos de una investigación realizada por
La Defensoría del Pueblo, Comisión de la Verdad y Reconciliación, Comité
Internacional Cruz Roja y Coordinadora Nacional de Derechos Humanos sobre
un total de 150 personas extraviadas en el Perú entre los años 1980 y 1996
en tres departamentos donde hubo el brote terrorista: Ayacucho, Huánuco y
San Martín.
ucontinental.edu.pe | 35
Asignatura: Estadística Aplicada
PRÁCTICA Nº 1
ucontinental.edu.pe | 36
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 37
Asignatura: Estadística Aplicada
AUTOEVALUACION No 1
1. Correlacione:
DEFINICIONES CONCEPTO
1 Es una técnica en el que el sujeto no Muestreo
sabe si está recibiendo el tratamiento estratificado
2 Los miembros de una población se Muestreo
seleccionan de forma que cada sistemático
miembro individual tenga la misma
posibilidad de ser elegido
3 Selecciona directamente los individuos Muestra
de la población para la muestra aleatoria
4 Se selecciona un punto de partida, Muestreo de
después se elige cada k-esimo conveniencia
elemento de la población
5 Subdividimos a la población en al Estudio a ciegas
menos dos subgrupos diferentes, cada
subgrupo posee gran homogeneidad
respecto alguna característica.
A) 3,4,5,2,1
B) 5,4,3,2,1
C) 3,5,4,2,1
D) 5,4,2,3,1
E) 5,3,2,1,4
A) 0.014
B) 0.015
C) 0.897
D) 0.028
E) 0.196
3. 459 bombillas seleccionados al azar fueron probados en un laboratorio, 291
duraron más de 500 horas. Encuentre una estimación puntual de la verdadera
proporción de todas las bombillas que duran más de 500 horas.
A) 0.632
B) 0.366
C) 0.388
D) 0.888
E) 0.634
A) II, III y IV
B) I, II, y V
C) I, IV y V
D) II y IV
ucontinental.edu.pe | 38
Asignatura: Estadística Aplicada
E) III, IV y V
A) Más angosto para un nivel confianza de 99% que para un nivel confianza de
95%.
B) Más amplio para una muestra de tamaño 100 que para una muestra de
tamaño 50.
C) Más amplio para una desviación estándar de 3.56 que para un nivel de
confianza de 90%
D) Más amplio cuando la proporción de la muestra sea 0.50 que cuando la
proporción de la muestra sea 0.20.
E) Más amplio a nivel de confianza 99% que al de 95%
A) 205
B) 167
C) 135
D) 68
E) 152
Son verdaderos:
A) I, III y IV
B) III y V
C) IV y V
D) II y III
E) I y IV
ucontinental.edu.pe | 39
Asignatura: Estadística Aplicada
máquinas operadas con monedas. El dueño actual asegura que en los últimos
5 años el promedio de ingresos diarios ha sido 675 dólares con una
desviación estándar de 75 dólares. Una muestra de 30 días revela un ingreso
promedio diario de 625 dólares. ¿Existe evidencia de que la aseveración del
dueño actual no es válida? (use un nivel de significancia de 0.01). Determine
el valor del estadístico de prueba y si se aprueba o no la hipótesis nula.
A) -3.651; se rechaza Ho
B) -2.381, se acepta Ho
C) 2.381, se rechaza Ho
D) -4.724, se acepta Ho
E) -1.452, se acepta Ho
10. Las Razones por las que no se debe usar la distribución “t”
A) II y IV
B) III y V
C) I
D) IV
E) III
ucontinental.edu.pe | 40
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 41
Asignatura: Estadística Aplicada
1.1.1 HIPÓTESIS
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de
una o más poblaciones.
4
Mario Triola. Estadística. 2009
ucontinental.edu.pe | 42
Asignatura: Estadística Aplicada
H0
DECISIÓN H0 FALSA
VERDADERA
CORRECTO ERROR TIPO II
ACEPTAR H0
1-
ucontinental.edu.pe | 43
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 44
Asignatura: Estadística Aplicada
5 Tomado de Estadística aplicada a la Administración y Economía, Alfredo Díaz Mata, Capítulo 9, pág. 279. Primera
Edición.
ucontinental.edu.pe | 45
Asignatura: Estadística Aplicada
Ejemplo6
Los científicos han citado al benceno, un disolvente químico de uso común en
la síntesis de plásticos como un posible agente causante de cáncer. Ciertos
estudios han demostrado que las personas que trabajan con benceno durante
más de cinco años tienen una incidencia de leucemia 20 veces mayor que la
de la población en general. En consecuencia el gobierno recomienda que el
nivel máximo permisible de benceno en dicho lugar de trabajo se baje de 10
partes por millón (ppm) a 1 ppm. Supongamos que una fábrica de artículos de
acero, que expone diariamente a sus trabajadores al benceno, está siendo
investigada por una certificadora de calidad, para ello se examinan 20
muestras de aire tomadas durante un período de un mes para determinar el
contenido de benceno, obteniendo en el análisis una media de 2.1 ppm y una
desviación estándar de 1.7 ppm.
¿La fábrica de artículos de acero estaría haciendo caso omiso a la
recomendación? Utilice un nivel de confianza del 0.95.
Solución
i) El parámetro de interés es la media de la población , se desea probar:
H0: 1
H1: >1
La certificadora quiere corroborar la hipótesis de investigación de que el nivel
medio de benceno en la planta de fabricación excede a 1 ppm. Donde es la
verdadera media. La prueba es unilateral derecha.
ii) El nivel de significancia es =0.05, lo que nos permite calcular el valor
crítico t (desviación estándar muestral conocida y n<30) y ubicarlo en la
gráfica que corresponde a una prueba de hipótesis unilateral derecha.
6 Tomado de Probabilidad y Estadística para Ingeniería y Ciencias, William Mendenhall, Capítulo 9, pág. 441. Cuarta
Edición.
ucontinental.edu.pe | 46
Asignatura: Estadística Aplicada
7 Tomado de Probabilidad y Estadística para Ingeniería y Ciencias, William Mendenhall, Capítulo 9, pág. 465. Cuarta
Edición.
ucontinental.edu.pe | 47
Asignatura: Estadística Aplicada
x 54
iii) pˆ , por lo que utilizando los datos del problema: pˆ 0 .9
n 60
iv) El estadístico de prueba es:
pˆ HIPOTESIS
Z
HIPOTESIS(1 HIPOTESIS)
n
0.9 0.95
Z 1.78
0.95 .(1 0.95)
60
v) Se puede rechazar la hipótesis nula con =0.05, ya que el valor calculado
o estimador -1.78 cae a la izquierda del -1.645 lo que indica que se encuentra
en la región de rechazo.
vi) Por lo tanto, existe evidencia estadística para sustentar la hipótesis de que
la proporción de puentes de autopista de acero intemperizado que tienen
buen desempeño es menor que 0.95.
Ejemplo8
Un estudio realizado a fumadores que intentaban dejar el hábito con
terapia de parches de nicotina reveló que 39 de ellos continuaban fumando
un año después de iniciado el tratamiento y 32 habían dejado de fumar
(según datos de "High-Dose Nicotine Patch Therapy", de Dale et al, Journal
of the American Medical Association, vol. 274, núm. 17). Utilice un nivel de
significancia de 0.10 para probar la aseveración de que, de los fumadores
que intentaban dejar el cigarrillo, la mayoría continúa fumando un año
después de iniciar el tratamiento. ¿Sugieren estos resultados que la terapia
de parches de nicotina es ineficaz?
Solución
i) El parámetro de interés es una proporción de la población , se desea probar:
H0: = 0.50
ucontinental.edu.pe | 48
Asignatura: Estadística Aplicada
H1: > 0.50
Donde es la verdadera proporción de todos los que continúan fumando un
año después de iniciar el tratamiento, siendo la prueba unilateral derecha.
ii) El nivel de significancia es =0.1, lo que nos permite calcular el valor
crítico z y ubicarlo en la gráfica:
x 39
iii) pˆ , por lo que utilizando los datos del problema: pˆ 0.55
n 39 32
iv) El estadístico de prueba es:
pˆ HIPOTESIS
Z
HIPOTESIS(1 HIPOTESIS)
n
0.55 0.5
Z 0.84
0.5.(1 0.5)
71
v) El estadístico de prueba 0.84 cae a la izquierda del valor crítico 1.645 en la
región de aceptación, por lo que existe evidencia estadística para aceptar la
hipótesis nula.
vi) Como el 50% o menos deja de fumar, la terapia de parches no es eficaz.
2
El proceso que sigue una prueba de hipótesis para la varianza es el mismo
que utilizamos en las anteriores secciones, es muy usual aplicar esta prueba
cuando se require comprobar el grado de variabilidad de un proceso.
Ejemplo9
Se sabe que el contenido en gramos de un producto fabricado por una
compañía, no reúne las especificaciones si la varianza de un lote de
producción se aleja demasiado hacia arriba o hacia debajo de 6.5. Comprobar
si un gran lote de producción reúne las especificaciones, si una muestra
aleatoria de 20 unidades extraída aleatoriamente de dicho lote arrojó una
varianza de 7.3. Utilizar un nivel de significación del 5%. Se sabe que el
contenido del producto se distribuye normalmente.
Solución
9
Tomado de Estadística, Hugo Gómez Giraldo, Capítulo 8, pág. 238.
ucontinental.edu.pe | 49
Asignatura: Estadística Aplicada
i) H 0 : 6.5
2
H a : 6.5
2
menor que 8.90652 o mayor que 32.8523, se rechaza la hipótesis nula de que
la varianza sigue siendo de 6.5, con un nivel de significación del 5%”.
iv) El estadístico de prueba se calcula teniendo en cuenta n=20, s2=7.3 y
utilizando la fórmula:
(n 1) s 2 (20 1).x7.3
2 21 .34
2
6.5
v) Como el estadístico de prueba 21.34 se encuentra en la región de confianza
o de aceptación. Entonces con podemos afirmar con un nivel de significancia
del 5% que existe evidencia estadística para aceptar que la varianza del
contenido del producto es el mismo.
Ejemplo10
Un supervisor de control de calidad en una enlatadora sabe que la cantidad
exacta contenida en cada lata varía, pues hay ciertos factores imposibles de
controlar que afectan la cantidad de llenado. El llenado medio por lata es
importante pero igualmente importante es la variación de la cantidad de
2
7.96 7.9 7.98 8.01 7.97 7.96 8.03 8.02 8.04 8.02
¿Esta información proporciona con un nivel de significancia del 0.05 pruebas
suficientes de que la desviación estándar de las mediciones de llenado es
menor que 0.1 onzas?
Solución
i) H 0 : 0.1
2
H a : < 0.1
2
ii) La prueba es unilateral izquierda, con 0.05, por lo que el valor crítico es:
iii) El estadístico de prueba se calcula utilizando la desviación estándar de la
muestra s=0.043 y n=10.
10
Tomado de Probabilidad y Estadística para Ingeniería y Ciencias, William Mendenhall, Capítulo
9, pág. 474. Cuarta Edición.
ucontinental.edu.pe | 50
Asignatura: Estadística Aplicada
(n 1) s 2 (10 1).x0.043 2
2
1.66
2 0.12
iv) Como el estadístico de prueba 1.66 es menor que 3.325 y cae en la región
de rechazo, existe evidencia estadística para rechazar la hipótesis nula.
Entonces el supervisor puede llegar a la conclusión con un nivel de
significación del 0.05 de que la varianza de la población de todas las
cantidades de llenado es menor que 0.01, o sea <0.1.
ucontinental.edu.pe | 51
Asignatura: Estadística Aplicada
PRUEBA ESTADÍSTICO
(x 1 x 2 ) d 0
1 – 2 = d0 z
1 y 2 conocidas 12 22
n1 n 2
1 – 2 = d0 ( x1 x 2 ) d 0 (n 1 1)s 12 (n 2 1)s 22
1 = 2 desconocidas t ;s 2
n1 n 2 2
p
1 1
sp
n1 n 2
ucontinental.edu.pe | 52
Asignatura: Estadística Aplicada
Ejemplo
Una compañía de transportes requiere comprar un gran lote de buses para el
transporte urbano con el fin de reemplazar su parque automotor y para tal fin
desea comprobar la afirmación hecha por el proveedor de la marca B, en el
sentido de que la marca A es menos ahorradora de combustible. Para tal fin la
empresa toma una muestra aleatoria de 35 vehículos marca A y encuentra
que la misma tiene un promedio en el rendimiento de 18 kilómetros/galón con
una desviación estándar de 8 kilómetros/galón, mientras que una muestra de
32 vehículos marca B presenta un promedio de 22 kilómetros/galón con
desviación estándar de 3 kilómetros /galón. ¿Qué decisión debe tomar el
gerente de la compañía con un nivel de significación del 5%?
Solución
i) Las desviaciones estándar se asumen conocidas puesto que los tamaños de
muestra son mayores que 30; por lo cual, según el teorema central del límite,
las diferencias de las medias muestrales, se distribuirán aproximadamente
como una distribución normal.
ii) H 0 : A B 0
Ha: A B 0
La prueba es unilateral a la izquierda.
Ejemplo
Una compañía de transportes requiere comprar un gran lote de buses para el
transporte urbano con el fin de reemplazar su parque automotor y para tal fin
desea comprobar la afirmación hecha por el proveedor de la marca B, en el
sentido de que la marca A es menos ahorradora de combustible. Para tal fin la
empresa toma una muestra aleatoria de 13 vehículos marca A y encuentra
que la misma tiene un promedio en el rendimiento de 18 kilómetros/galón con
una desviación estándar de 8 kilómetros/galón, mientras que una muestra de
15 vehículos marca B presenta un promedio de 22 kilómetros/galón con
desviación estándar de 3 kilómetros /galón. ¿Qué decisión debe tomar el
gerente de la compañía con un nivel de significación del 1%?
Solución
i) Se sabe que las poblaciones se distribuyen aproximadamente a la ley
ucontinental.edu.pe | 53
Asignatura: Estadística Aplicada
Ejercicio
El jefe de personal de una gran empresa afirma que la diferencia de los
promedios de antigüedad entre los obreras y obreros de la compañía es de
3.5 años. El presidente de la compañía considera que ésta diferencia es
superior. Para comprobar dicha situación, se toma una muestra aleatoria de
40 obreras cuyo promedio de antigüedad es de 12.4 años con desviación
estándar de 1.5 años y de un grupo de 45 obreros cuyo promedio de
antigüedad es de 8.3 años con desviación estándar de 1.7 años. Comprobar
la hipótesis con un nivel de significación del 5%.
Ejercicio
Proceso Rendimiento %
1 24.2 26.6 25.7 24.8 25.9 26.5
2 21.0 22.1 21.8 20.9 22.4 22.0
ucontinental.edu.pe | 54
Asignatura: Estadística Aplicada
¿Hay alguna razón para creer que el proceso 1 tiene un rendimiento medio
mayor?
Ejemplo
Una compañía asegura que el mercado para su producto X tiene una
aceptación de iguales proporciones en la ciudad A que en la ciudad B. Un
especialista en mercado pone en duda dicha afirmación y para tal fin tomó
una muestra aleatoria de 500 amas de casa en la ciudad A y encontró que el
59.6% de las mismas prefería el artículo X. Por otra parte tomó una muestra
aleatoria de 300 amas de casa en la ciudad B y encontró que el 50% de las
mismas preferían el artículo X. ¿Existe una diferencia real entre las dos
ciudades? Nivel de significación 5%
Solución
i) H 0 : P A =P B ,
H a : P A P B;
La prueba es bilateral, puesto que el especialista en mercado no está
afirmando que ciudad tiene más proporción que la otra.
ii) Nivel de significación = 0.05, por lo que z=±1.96
iii) Como las diferencias de las proporciones muestrales se distribuyen
normalmente y la prueba es bilateral entonces el criterio de decisión será “Si
el valor z es mayor que 1.96 o menor que -1.96 se rechaza la hipótesis nula
de que la proporción es idéntica en ambas ciudades”.
iv) Con los datos n 1 =500, p 1 =0.596, n 2 =300, p 2 =0.50 se puede calcular el
estadístico de prueba:
x1=0.956x500 ; x2=0.5x300
x1 x2 ( pˆ 1 pˆ 2 )
pˆ 0.56 ; q̂ =0.44 y z =2.56
n1 n2 1 1
pˆ qˆ
n1 n2
iv) Como el valor de Z calculado (+2.65) se encuentra en la zona de rechazo,
entonces, con un nivel de significación del 5%, debemos rechazar la hipótesis
nula de que las proporciones en ambas ciudades son iguales.
Ejercicio
La fracción de productos defectuosos producidos por dos líneas de producción
se está analizando. Una muestra aleatoria de 1000 unidades de la línea 1
tiene 10 defectuosas, en tanto que una muestra aleatoria de 1200 unidades
de la línea 2 tiene 25 defectuosas. ¿Es razonable concluir que la línea de
producción 2 produce una fracción más alta de producto defectuoso que la
línea 1? Use 0.01 .
ucontinental.edu.pe | 55
Asignatura: Estadística Aplicada
D D D
2
Dónde: D y SD
j j
n n 1
Rechazaríamos H 0 : D 0 si t 0 t 2 , n 1 o si t 0 t 2,n 1 . Las alternativas de
un lado se tratarían de manera similar.
Ejemplo
En 0.05 , ¿existe alguna razón para creer que el tiempo de armado para el
proceso actual es mayor que el del método propuesto por más de dos
minutos?
Solución
i) Las hipótesis so: H0 : D 2
H1 : D 2
ii) Calculando las diferencias:
ucontinental.edu.pe | 56
Asignatura: Estadística Aplicada
D D D
2
iii) D = 4.75 y S D
j j
= 3.69
n n 1
D 4.75 2
iv) El estadístico de prueba sería: t0 = = 2.107
SD n 3.69 8
ucontinental.edu.pe | 57
Asignatura: Estadística Aplicada
TIPO 1 63 81 57 66 82 82 68 59 75 73
TIPO 2 64 72 83 59 65 56 63 74 82 82
Pruebe la hipótesis de que las dos varianzas sean iguales. Use .05
Solución
i) H 0 : 1 2
2 2
H1 : 12 22
iii) La región de confianza está dada por [0.248; 4.03]. Si el F calculado cae fuera
del intervalo dado entonces se rechaza la hipótesis nula.
X 1 70 .6
X 2 70
S12 88 .71
S 22 100 .44
S12 88 .71
Calculamos F0 2
= 0.877
S 2 100 .44
v) Como F calculado cae dentro del intervalo dado por la regi ón de confianza o
zona de aceptación, entonces se acepta que las varianzas son iguales.
ucontinental.edu.pe | 58
Asignatura: Estadística Aplicada
Una pequeña empresa que elabora botanas (papas fritas, cacahuates, etc.) tiene
4 rutas para el reparto de sus productos dentro de la ciudad. Para cubrir estas
rutas tiene 4 conductores básicos y uno complementario, el conductor
complementario sirve para cubrir las ausencias o vacaciones o enfermedad de los
otros 4 y se le ocupa para otros menesteres si no se le requiere como conductor.
El puesto de conductor complementario se rota entre todos los choferes sobre una
misma base mensual. Es importante tanto desde el punto de vista de eficiencia,
como de justicia, que todas las rutas tengan la misma duración, también es
importante que todos los conductores sean igualmente eficientes en todas las
rutas para que los conductores puedan sustituirse el uno al otro sin pérdida de
tiempo, por ello la gerencia de distribución implementó un programa de
capacitación para que los conductores se familiaricen con todas las rutas. Al cabo
de esta capacitación se hicieron recorridos de prueba con el objetivo de
investigar, por una parte, si todas las rutas se recorrían en el mismo tiempo y por
otra parte si los conductores eran igualmente eficientes en todas. La gerencia de
distribución desea saber si el tiempo medio de las cuatro rutas es igual y si la
eficiencia de todos los conductores en las rutas es igual. La información de los
recorridos y los conductores se da a continuación:
Cuadro N°14: Conductores vs Recorridos.
Conductor/Ruta Ruta A Ruta B Ruta C Ruta D
Antúnez 224 227 237 248
Becerra 242 235 262 250
Cervantes 225 240 235 261
Dominguez 232 253 259 255
Escamilla 232 245 257 261
En este ejemplo se tienen datos se clasifican de acuerdo con dos variables: el
conductor y la ruta que son, entonces, los 2 factores. Aquí las hipótesis que se
prueban son:
Para las rutas:
11
Tomado de ESTADÍSTICA APLICADA A LA ADMINISTRACIÓN Y ECONOMÍA, ALFRED DÍAZ MATA,
CAPÍTULO 12, PÁG. 347.
ucontinental.edu.pe | 59
Asignatura: Estadística Aplicada
Ho : A B C D
H1: Por lo menos una de las medias poblacionales de los tratamientos no es igual
las otras.
En donde las diferentes medias son las medias de las 4 rutas.
Para los conductores:
Ho : 1 2 3 4
H1: Por lo menos una de las medias poblacionales de los bloques (conductores)
no es igual las otras.
En donde las diferentes medias son las medias de los 5 conductores.
En este ejemplo, el tratamiento son las diferentes rutas y a la variable del
conductor, cuyos datos están en los renglones, se le conoce como grupos, a su
vez, tratamientos y grupos son los dos factores a los que se refiere el nombre de
esta técnica de análisis de varianza de dos factores.
Un detalle que vale la pena tener presente respecto a este ANOVA de 2 factores
es que se tiene un solo dato para cada conductor y para cada ruta, ya que el
análisis de varianza de este par de factores, se refiere también a conjuntos de
datos clasificados de acuerdo con 2 variables, pero en este caso, con cuando
menos 2 observaciones para cada par de factores.
- 12 22 32 ..... k2 2
El método de ANOVA con un criterio o factor requiere del cálculo de dos
estimaciones independientes para 2 , la varianza poblacional común. Estas dos
2 2 2
estimaciones se denotan por sb y s w . s b se denomina estimación de la varianza
2
entre muestras y s w se denomina estimación de la varianza al interior de las
s b2
muestras. El estadístico tiene una distribución muestral resultando: F . El
s w2
valor crítico para la prueba F es: F (k 1, k (n 1)) , donde el número de grados de
libertad para el numerador es k-1 y para el denominador es k(n-1), siendo el
nivel de significancia siendo k = número de muestras.
ucontinental.edu.pe | 60
Asignatura: Estadística Aplicada
PROCEDIMIENTO12
( Xij X )
i 1 j 1
SCT
Grados de libertad
Gl. Totales = n – 1
Gl. Tratamientos = c -1
Gl. Error = n – c
Estadístico calculado Fc
Fcalculado = PCTr / PCE
Regla de decisión
Si Fcalculado es mayor al Fcrítico se rechaza Ho indicando que los efectos de los
diferentes niveles del factor tienen efecto significativo en la respuesta.
12
Tomado de Estadística. Richard C.Weimer. CECSA. Segunda Edición.2000
ucontinental.edu.pe | 61
Asignatura: Estadística Aplicada
Ejemplo13
Una empresa ensambla cuadros para un solo modelo de bicicleta. La planta
trabaja 3 turnos: el matutino, el vespertino y el nocturno. Los trabajadores se
rotan cada uno de los turnos, por lo que, al cabo de un trimestre, todos ellos
laboraron los tres turnos. El director de producción quisiera saber si existe
diferencia entre la producción promedio de los 3 turnos, ya que la fábrica trabaja
a plena capacidad desde hace más de un año y no hay variaciones signifi cativas
en el número de empleados, en la maquinaria, ni en los procesos productivos; el
director considera que con un análisis de varianza puede contestar esta pregunta;
para ello obtiene una muestra aleatoria de la producción de 6 días de cada turno.
Los datos se muestran a continuación:
TURNO
MATUTINO VESPERTINO NOCTURNO
129 138 118
141 142 120
128 140 132
145 149 118
135 129 136
144 148 138
Solución
i) Las hipótesis son:
Ho : 1 2 3
H1: Por lo menos una de las medias poblacionales de los bloques (conductores)
no es igual las otras.
13
Tomado de ESTADÍSTICA APLICADA A LA ADMINISTRACIÓN Y ECONOMÍA, ALFRED DÍAZ MATA,
CAPÍTULO 12, PÁG. 349
ucontinental.edu.pe | 62
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 63
Asignatura: Estadística Aplicada
Ejercicio14
PROMEDIO
14
Tomado de ESTADÍSTICA APLICADA A LA ADMINISTRACIÓN Y ECONOMÍA, ALFREDO DÍAZ MATA, CAPÍTULO 12,
PÁG. 350
ucontinental.edu.pe | 64
Asignatura: Estadística Aplicada
TRATAMIENTOS
1 2 3 MEDIAS (HORIZONTAL)
1 … … … …
BLOQUES
2 … … … …
3 … … … …
MEDIAS (VERTICAL) … … … MEDIA GLOBAL
En este caso la desviación cuadrática total puede ser desdoblada en tres sumandos
debido a razones intergrupales (por efectos del tratamiento) simbolizada como
DCT, en un sumando debido a razones intergrupales (por efectos de errores
aleatorios) DCE y en otro sumando debido a razones de bloque DC bloque. La
desviación cuadrática intrabloque DCbloque es similar a la desviación cuadrática de
los tratamientos sólo que en vez de trabajar a nivel de los términos de una fila, se
trabaja a nivel de los términos de una columna. De manera análoga, el cuadrado
medio intrabloque es similar al cuadrado medio intragrupo sólo que en vez de
trabajar a nivel de los términos de una fila se hace a nivel de los términos de una
columna.
DCE
El cuadrado medio de los errores se define como: CME
r 1k 1
Se generan entonces las siguientes razones:
CMtrat CMbloque
Ftrat y Fbloques Fcalculado
CMerr CMerr
Ejemplo
ucontinental.edu.pe | 65
Asignatura: Estadística Aplicada
MÁQUINAS
DÍAS 1 2 3 4
1 30 31 32 33
2 30 35 34 36
3 28 32 35 37
4 29 36 37 35
5 30 34 34 33
Solución
i) La solución la realizaremos íntegramente utilizando el Excel, para ello copiamos la
tabla dada a una hoja de Excel, vamos a Datos…Análisis de Datos…y Análisis de
Varianza de dos factores con una sola muestra por grupo.
ii)
ucontinental.edu.pe | 66
Asignatura: Estadística Aplicada
iii) Luego:
TRATAMIENTO
ALUMNOS
Prof.1 Prof.2 Prof.3 Prof.4
ucontinental.edu.pe | 67
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 68
Asignatura: Estadística Aplicada
Puedes creer que esto puede ser casualidad o si eres mal pensado que está
preparado, por eso nada mejor que hacer un estudio probabilístico riguroso de esta
paradoja
Estimación de la probabilidad
¿Cuál es la probabilidad de que en un grupo de n personas, por lo menos
dos de ellas coincidan en su cumpleaños?, desechamos los años bisiestos y los
gemelos, y asumimos que existen 365 cumpleaños que tienen la misma
probabilidad.
Solución
Utilizando la regla de Laplace y la combinatoria:
El truco es calcular primero la probabilidad de n personas tengan cumpleaños
diferentes
Sea el suceso:
A = {"al menos dos personas celebran su cumpleaños a la vez"}
y su complementario:
Ac = {"no hay dos personas que celebren su cumpleaños a la vez"}
Caso particular: n=5
El número de casos posibles de celebración de cumpleaños, suponiendo el año de
365 días, es:
3655 = 6,478 × 10 12
El número de casos favorables : como la primera de las personas puede haber
nacido uno de los 365 días del año, la siguiente unos de los 364 días restantes y así
sucesivamente, resultan365 × 364 × 363 × 362 × 361 = 6,303 × 10 12 casos de
que no existan dos personas que hayan nacido el mismo día .
Aplicando la regla de Laplace
P(Ac) =casos favorables/casos posibles =6,303 / 6,478 = 0,973
p(A) = 1 - p(Ac) = 1 - 0,973 = 0,027
El problema puede generalizarse para una reunión de n personas.
La probabilidad de que al menos dos de ellas cumplan años el mismo día
es:
ucontinental.edu.pe | 69
Asignatura: Estadística Aplicada
ACTIVIDAD N°1
Aplica la prueba de hipótesis en diferentes muestras de manera
individual para la media, proporción o desviación estándar.
2. Para estimar el tiempo promedio que lleva ensamblar cierto componente de una
computadora, el supervisor de una empresa electrónica tomó a 40 técnicos el
tiempo que tardaban en ejecutar esta tarea, obteniéndose una media de 12.73
minutos y una desviación estándar de 2.06 minutos. Con una confianza del 99%,
calcule el IC para el tiempo promedio que lleva ensamblar el componente de la
computadora.
ucontinental.edu.pe | 70
Asignatura: Estadística Aplicada
constituyen una fuerte evidencia de que la mayoría de las personas (más del 50%)
se oponen a este tipo de donación. Construya un estimado del intervalo de
confianza del 99% de la proporción de adultos que considera que no debe
permitirse la donación de seres humanos. Con base en el resultado, ¿existen
fuertes evidencias que apoyen la afirmación de que la mayoría de la gente se opone
a este tipo de donación?
ucontinental.edu.pe | 71
Asignatura: Estadística Aplicada
ACTIVIDAD N°2
Aplica la prueba de hipótesis a dos muestras diferentes y realiza el
análisis de varianza respectivo.
1. En una muestra tomada de una base de datos se obtuvo las horas de operación
hasta averiarse de cierto componente de una computadora
334 376 331 54 345 81 344 316 48 10 332 20 311 345 327
a. Verifique si la media del tiempo de avería de los componentes es
significativamente menor que 300 horas. Use α=0.10.
b. Verifique que más del 60% del tiempo de operación es mayor que 300 horas.
Use α=0.05
N° 1 2 3 4 5 6 7 8 9 10 11
Electrónico 178 161 194 204 185 179 173 172 108 181 185
Mecánico 128 89 150 191 188 209 53 131 184 97 112
ucontinental.edu.pe | 72
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 73
Asignatura: Estadística Aplicada
PRÁCTICA N°2
1. Un alto dirigente del emporio comercial Gamarra afirma que el salario promedio
por semana de los hombres supera en $13 al salario promedio de las mujeres. Para
comprobar la afirmación un grupo de trabajo escogió una muestra aleatoria de 20
hombres y otra de 25 mujeres encontrando los promedios de $110 y $100
respectivamente. Aplicando un intervalo de confianza del 98% para la diferencia de
dos medias, ¿es consistente la afirmación del dirigente? El grupo supone que los
salarios en cada caso siguen el modelo de probabilidad normal con varianzas de
100 y 64 dólares.
Independencia 12 17 14 18 9 19 10 20 15 12 16 9 14
Rímac 12 14 13 11 12 15 14 15 11 13 12 11 14
Las muestras revelaron además que las dos poblaciones de ventas son normales
con varianzas diferentes. Aplicando un intervalo de confianza del 95% para la
diferencia de dos medias poblacionales ¿es válido inferir que los dos locales tienen
igual promedio de ventas del producto?
Equipo1 2 13 15 9 8 6 9 18
Equipo2 10 10 11 13 11 12 7
ucontinental.edu.pe | 74
Asignatura: Estadística Aplicada
1 1 2 3 4 5 6 7
ucontinental.edu.pe | 75
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 76
Asignatura: Estadística Aplicada
AUTOEVALUACIÓN N°2
1.- En los últimos años se han registrado un gran número de lavadoras de ropa,
tanto electrónicas como mecánicas, con serias fallas en su funcionamiento. Se
desea analizar y comparar el costo de reparación de cada tipo de artefacto. Para
ello se ha seleccionado una muestra aleatoria de cada tipo de lavadora y se han
registrado en la tabla los costos de reparación en soles. Se sabe que el número
de fallas tiene distribución normal.
N° 1 2 3 4 5 6 7 8 9 10 11
Electrónico 178 161 194 204 185 179 173 172 108 181 185
E) S 22 = 615,87273
2.- En los últimos años se han registrado un gran número de lavadoras de ropa,
tanto electrónicas como mecánicas, con serias fallas en su funcionamiento. Se
desea analizar y comparar el costo de reparación de cada tipo de artefacto. Para
ello se ha seleccionado una muestra aleatoria de cada tipo de lavadora y se han
registrado en la tabla los costos de reparación en soles. Se sabe que el número
de fallas tiene distribución normal.
N° 1 2 3 4 5 6 7 8 9 10 11
Electrónico 178 161 194 204 185 179 173 172 108 181 185
Mecánico 128 89 150 191 188 209 53 131 184 97 112
ucontinental.edu.pe | 77
Asignatura: Estadística Aplicada
A) Ho: 1 < 2
H1: 1 > 2
B) T x1 x 2 1 2 o 2,10512
exp
S12 S22
n1 n2
2
S 12 S 22
C) n1 n2
v 2 2
16
S 12 S 22
n1 n2
n1 1 n2 1
D) Tcrítico= 1,75305
A) F calculado = 0.9622
B) F crítico = 6.82
C) t calculado= 1.8695
D) t critico = 1.98229
E) Se rechaza lo que afirma el ingeniero.
4.- Un fabricante de impresoras desea estimar la vida media de sus margaritas de
impresión. La estimación ha de estar dentro de 2 horas en torno a la media y
tener un nivel de confianza del 90%. Si una muestra piloto revela una
desviación típica de 25 horas, ¿cuál debe ser el tamaño de la muestra?
A) 164
B) 423
C) 24
D) 115
E) 625
ucontinental.edu.pe | 78
Asignatura: Estadística Aplicada
5.- En los últimos años se han registrado un gran número de lavadoras de ropa,
tanto electrónicas como mecánicas, con serias fallas en su funcionamiento. Se
desea analizar y comparar el costo de reparación de cada tipo de artefacto. Para
ello se ha seleccionado una muestra aleatoria de cada tipo de lavadora y se han
registrado en la tabla los costos de reparación en soles. Se sabe que el número
de fallas tiene distribución normal.
N° 1 2 3 4 5 6 7 8 9 10 11
Electrónico(1) 178 161 194 204 185 179 173 172 108 181 185
A) α=0.005
B) Tcalculado=2.3152
C) T critico = 2.798
D) Sd = 2.8277
E) d = 2.5
ucontinental.edu.pe | 79
Asignatura: Estadística Aplicada
C) SCA=42.6
D) SCT=189
E) Fcrítico=3.16
ucontinental.edu.pe | 80
Asignatura: Estadística Aplicada
MARCAS DE NEUMÁTICOS
N1 N2 N3 N4
55 63 48 59
53 67 50 68
50 55 59 57
60 62 50 66
55 70 47 71
65 75 61 73
Al nivel de significancia del 5% ¿indican estos datos que las marcas de neumáticos
producen efectos significativos en el rendimiento?
Luego marque lo incorrecto.
A) Fcalculado=6.77
B) SCT=1550.96
C) SCA=781.46
D) SCE=769.5
E) Fcrítico=3.10
MÉTODO
OPERARIO I II III
1 3 9 5
2 4 8 6
3 3 7 8
4 5 9 7
5 4 6 9
Al nivel de significancia del 5% ¿existirá alguna diferencia entre los métodos de
montaje de las prendas?
Marque lo incorrecto.
A) SCA=44.8
B) SCE=16.533
C) SCT=69.9
D) FB=0.377
E) FA=13.714
ucontinental.edu.pe | 81
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 82
Asignatura: Estadística Aplicada
Como has podido observar la mayoría de las pruebas que hemos realizado se
refiere al análisis del parámetro poblacional como la media, varianza y proporción
para lo cual se hicieron supuestos sobre las poblaciones a quienes pertenecían las
muestras, dichos supuestos por ejemplo era que provenían de poblaciones con
comportamiento normal. Pero en la práctica no siempre las poblaciones son
normales por lo que ya no podríamos aplicar los métodos anteriormente estudiados,
se necesita para ello algún método alternativo que requiera dicha suposición. Estos
métodos son conocidos como Pruebas no paramétricas o sin distribución, los cuáles
nos permiten realizar inferencias en situaciones donde no conocemos el
comportamiento probabilístico de la variable en análisis. Su gran ventaja respecto a
los métodos paramétricos es que utiliza cálculos que no son tan laboriosos además
de no tener en cuenta la forma de la distribución (función de probabilidad). Hay que
tener en cuenta que las pruebas no paramétricas se ven limitadas por la pérdida de
información al trabajar sólo con los rangos por lo que a menudo no son tan claras o
eficientes pero esto se ve recompensado por la sencillez, rapidez y necesidad de
utilizar poca información.
En realidad existe una gran cantidad de pruebas de las cuáles desarrollaremos las
más conocidas y utilizadas, de las cuáles podemos observar su eficiencia respecto a
las pruebas paramétricas:
Para las pruebas de signos y alguna otra prueba no paramétrica, al lugar que ocupa
cada dato ordenado de menor a mayor se le conoce como rango, y si hay algún
15
Tomado de Estadística, Mario Triola, 10°Ed., Capítulo 13, pág. 677.
ucontinental.edu.pe | 83
Asignatura: Estadística Aplicada
empate entre los rangos se utiliza la media de dichos rangos en cada uno de los
datos, de la siguiente forma:
Serie de datos inicial: 3;6;6;6;11;14;14 y 16
Análisis de rangos:
Dato 3 6 6 6 11 14 14 16
Posición 1 2 3 4 5 6 7 8
Rango 1 3 3 3 5 6.5 6.5 8
Se supone que se tienen datos antes y después para una muestra y se desean
comparar estos conjuntos de datos correspondientes. Se hace restando las
observaciones por pares, y se anota el signo algebraico resultante. No es
importante la magnitud de la diferencia, sino solo si resulta un signo más o un
signo menos.
ucontinental.edu.pe | 84
Asignatura: Estadística Aplicada
H0: m = p o Med1=Med2
H1: m p o Med1≠Med2
H0: π1 = 0.5
H1: π1 ≠ 0.5
H0: m = p H0: m = p
H1: m > p ó H1: m < p
Lo que quiere decir que si dos conjuntos de datos tienen medianas iguales,
entonces el número de signos positivos debe ser aproximadamente igual al número
de signos negativos.
16
Fuente: Tomado de Estadística, Mario Triola, 10°Ed., Capítulo 13, pág. 679
ucontinental.edu.pe | 85
Asignatura: Estadística Aplicada
Ejemplo17
Se le pidió a un grupo de 20 alumnos que calificaran el desempeño de 2 profesores,
de acuerdo con varios criterios y en una escala de 1 a 10. Se obtuvieron los
resultados que se muestran a continuación:
CALIFICACIÓN
ALUMNO PROFESOR A PROFESOR B
1 7 9
2 5 6
3 8 5
4 9 8
5 3 4
6 8 5
7 10 10
8 8 9
9 3 6
10 5 4
11 7 10
12 9 6
13 5 3
14 4 4
15 7 9
16 10 10
17 10 9
18 5 8
19 5 4
20 6 6
Probar a un nivel de significancia de 0.05 la hipótesis de que no existe diferencia
entre las calificaciones asignadas por los alumnos a los dos profesores.
Solución
i) Planteamos las hipótesis:
H0: Med1 = Med2
H1: Med1 ≠ Med2
o de manera equivalente:
H0: π1 = 0.5
H1: π1 ≠ 0.5
CALIFICACIÓN
ALUMNO PROFESOR A (x1) PROFESOR B (x2) Signo de (x1-x2)
1 7 9 -
2 5 6 -
3 8 5 +
4 9 8 +
5 3 4 -
6 8 5 +
7 10 10 0
8 8 9 -
9 3 6 -
10 5 4 +
17
Tomado de ESTADÍSTICA APLICADA A LA ADMINISTRACIÓN Y ECONOMÍA, ALFREDO DÍAZ MATA,
CAPÍTULO 17, PÁG. 521
ucontinental.edu.pe | 86
Asignatura: Estadística Aplicada
11 7 10 -
12 9 6 +
13 5 3 +
14 4 4 0
15 7 9 -
16 10 10 0
17 10 9 +
18 5 8 -
19 5 4 +
20 6 6 0
iii) Al encontrar las diferencias igual a cero, eliminamos sus respectivos pares por lo
que el nuevo tamaño de muestra es n=16. Importante recordar que el cero no
tiene signo, por lo que no se le puede asignar el signo positivo.
v) Contrastando con la tabla de valores críticos para la prueba del signo de Mario
Triola, el valor crítico con un nivel de significancia de 0.05 y n=16, es: 3. La tabla
de valores críticos se presenta a continuación.
ucontinental.edu.pe | 87
Asignatura: Estadística Aplicada
Ejemplo
Un analista de mercado desea medir la efectividad de una campaña promocional del
producto de su empresa. Antes de la campaña, selecciona 12 tiendas minoristas y
registra las ventas del mes. Durante el segundo mes se termina la campaña
promocional y se registran de nuevo las ventas. El cuadro siguiente muestra los
niveles de ventas, del primer y segundo mes.
Se desea probar con un nivel de significancia de 0.05 que la campaña promocional
incrementó las ventas.
18
Tomado de Estadística, Mario Triola, 10°Ed., Apéndice A, página 743
ucontinental.edu.pe | 88
Asignatura: Estadística Aplicada
Solución
i) Planteamos las hipótesis:
H0: m = p
H1: m > p
Se entiende que para que la promoción sea exitosa se requiere que el número de
diferencias negativas sea pertinentemente grande, o sea interesa que el número
de signos menos sea mayor que el número de signos positivos. Planteando de
otra manera utilizando la probabilidad:
H0: π1 = 0.5
H1: π1 > 0.5
x 0.5 0.5n
Z
0.5 n
ucontinental.edu.pe | 89
Asignatura: Estadística Aplicada
Ejemplo
Se ha pedido a una muestra aleatoria de 100 niños que comparen dos nuevos
sabores de helado: mantequilla de maní y fresa. Cincuenta y seis miembros de la
muestra prefieren el helado de mantequilla de maní, 40 el de fresa y 4 no
manifiestan ninguna preferencia. Averigüe si existe una preferencia general por
cualquiera de los dos sabores con un nivel de significancia de 0.05
Solución
i) Sea P la proporción de la población que prefiere el helado de fresa, por lo que
x=40, siendo el valor de n=96
H0: P = 0.5 H1: P≠0.5
ii) El valor del estadístico de prueba es:
40 0.5 0.5.x96
Z =-1,53
0.5 x 96
iii) Analizando el valor crítico:
ANTES 8 7 6 9 7 10 8 6 5 8 10 8
DESPUÉS 6 5 8 6 9 8 10 7 5 6 9 8
Ejercicio
Un taller de reparación para CPUs de computadoras cambió el método de pago de
salario por hora a salario por hora más un bono calculado sobre el tiempo requerido
para desmontar, reparar y volver a ensamblar el CPU. Los siguientes son datos
recabados para 25 CPUs antes del cambio y 25 después para el número de horas
requeridas. A un nivel de significancia de 0.10, ¿el nuevo plan incrementó la
productividad?
ANTES 29 34 32 19 31 22 28 31 32 44 41 23 34
DESPUÉS 32 19 22 21 20 24 25 31 18 22 24 26 41
ANTES 25 42 20 25 33 34 20 21 22 45 43 31
DESPUÉS 34 27 26 25 31 19 22 32 31 30 29 20
ucontinental.edu.pe | 90
Asignatura: Estadística Aplicada
Ejercicio
Se ha examinado una muestra de 50 empresas peruanas que compraron
franquicias el año 2012. Los rendimientos de las acciones en torno a la fecha de
compra fueron positivos 31 veces, negativos 12 y cero 3. Contraste la hipótesis de
que hay una mayor probabilidad de rendimientos positivos alrededor de la fecha de
compra de una franquicia.
ucontinental.edu.pe | 91
Asignatura: Estadística Aplicada
Ejemplo
Una pizzería cercana al campus universitario está considerando la posibilidad de
utilizar una nueva receta para hacer la salsa que echa a las pizzas. Se elige una
muestra aleatoria de ocho estudiantes y se pide a cada uno que valore en una
escala de 1 a 10 su opinión sobre la salsa original y sobre la salsa propuesta. El
cuadro siguiente muestra las puntuaciones obtenidas en la comparación; los
números más altos indican que gusta más el producto.
¿Indican los datos una tendencia general a preferir la nueva salsa a la original?
19
Tomado de Estadística, Mario Triola, 10°Ed., Apéndice A, página 744
ucontinental.edu.pe | 92
Asignatura: Estadística Aplicada
PUNTUACIÓN
ESTUDIANTE SALSA ORIGINAL SALSA PROPUESTA
A 5 7
B 3 8
C 4 3
D 7 6
E 2 8
F 5 8
G 6 6
H 4 8
Solución
i) Planteamos las hipótesis:
H0: P = 0.5 (No hay preferencia por alguna de las dos salsas)
H1: P < 0.5 (Existe preferencia por el nuevo producto)
PUNTUACIÓN
ESTUDIANTE SALSA ORIGINAL SALSA PROPUESTA DIFERENCIA
(ORIGINAL-NUEVO)
A 5 7 -2
B 3 8 -5
C 4 3 1
D 7 6 1
E 2 8 -6
F 5 8 -3
G 6 6 0
H 4 8 -4
ucontinental.edu.pe | 93
Asignatura: Estadística Aplicada
iii) Luego hallamos los rangos de los valores absolutos de las diferencias y
DIFERENCIA VALOR RANGOS RANGO
(ORIGINAL-NUEVO) ABSOLUTO CON SIGNO
-2 2 3 -3
-5 5 6 -6
1 1 1.5 1.5
1 1 1.5 1.5
-6 6 7 -7
-3 3 4 -4
0 0 -- --
-4 4 5 -5
Suma de rangos (+): 3
Suma de rangos (-): 25
El estadístico de prueba T es 3.
iv) El valor crítico se busca en la tabla de valores críticos para la prueba de rangos
con signos de Wilcoxon, con n=7 y 0.05 en una cola. Tcrítico=4.
v) Como el estadístico de prueba T=3 es menor que el valor crítico se rechaza la
hipótesis nula, es decir que es probable que las puntuaciones del nuevo producto
sean mayores.
Ejemplo
En un estudio se compararon empresas que tenían sofisticados métodos de
postauditoría y empresas que no tenían métodos de ese tipo. Se examinó una
muestra de 31 pares de empresas. Se calculó el cociente entre la valoración de
mercado y los costes de reposición de los activos de cada una y se utilizó como
medida de los resultados de las empresas. En cada uno de los 31 pares, una de las
empresas utilizaba un sofisticado método de postauditoría y la otra no. Se
calcularon las 31 diferencias entre los cocientes y se ordenaron las diferencias
absolutas. La menor de las sumas de los rangos, 189, correspondió a los pares en
los que el cociente era mayor en el caso de la empresa que carecía de sofisticados
métodos de postauditoría. Contraste la hipótesis nula de que la distribución de las
diferencias entre los cocientes está centrada en 0 frente a la hipótesis alternativa
de que tiende a ser menor en las empresas que carecen de sofisticados métodos de
postauditoría.
Solución
i) Como la muestra es n=31, y T=189, calculamos el estadístico de prueba con la
fórmula:
n(n 1)
T
Z calculado 4
n(n 1)(2n 1)
24
31(31 1)
189
ii) Z calculado
4 =-1.16
31(31 1)(2.31 1)
24
iii) La prueba es de una sola cola, por lo que Zcrítico=1.645
ucontinental.edu.pe | 94
Asignatura: Estadística Aplicada
iv) Al ser el Zcalculado menor que el Zcrítico, no existe evidencia estadística para
rechazar la hipótesis nula.
Ejercicio
Se pide a una muestra aleatoria de 10 estudiantes que valoren en una cata a ciegas
la calidad de dos marcas de cerveza, una nacional y una importada. Las
valoraciones se basan en una escala de 1 (mala) a 10 (excelente). La tabla adjunta
muestra los resultados. Utilice el contraste de Wilcoxon para contrastar la hip6tesis
nula de que la distribución de las diferencias pareadas está centrada en 0 frente a
la hipótesis alternativa de que la población de todos los estudiantes bebedores de
cerveza prefiere la marca importada.
ESTUDIANTE A B C D E F G H I J
NACIONAL 2 3 7 8 7 4 3 4 5 6
IMPORTADA 6 5 6 8 5 8 9 6 4 9
Ejercicio
De 721 usuarios de Internet elegidos al azar, se descubrió que 358 de ellos usan
Internet para planear viajes (según datos de una encuesta local). Utilice un nivel de
significancia de 0.02 para probar la aseveración de que, de los usuarios de Internet,
menos del 50% utiliza este medio para planear viajes. ¿Los resultados son
importantes para los agentes de viajes?
1.3 PRUEBA DE LA SUMA DE RANGOS DE WILCOXON PARA MUESTRAS
INDEPENDIENTES. (Mata, 2013)
La prueba de la suma de rangos de Wilcoxon utiliza los rangos de los valores
de dos conjuntos independientes de datos muestrales para probar la hipótesis nula
de que las dos poblaciones tienen medianas iguales. La prueba de rangos con signo
de Wilcoxon estudiada en la sección anterior utiliza datos apareados, pero la prueba
de suma de rangos de Wilcoxon de la presente sección utiliza dos muestras
independientes que no están relacionadas ni asociadas o apareadas.
El fundamento de la suma de rangos de Wilcoxon es el siguiente: si dos
muestras se obtienen de poblaciones idénticas y los valores individuales se
acomodan en rangos como un conjunto combinado de valores, entonces el rango
alto y el bajo deberían caer de manera uniforme entre las dos muestras. Si los
rangos bajos se encuentran predominantemente en una muestra y los rangos altos
se encuentran predominantemente en la otra muestra, sospechamos que las dos
poblaciones tienen medianas diferentes.
Asumamos que se dispone de la muestra de tamaño n1 de la primera
población y la muestra de tamaño n2 de la segunda. Se juntan las dos muestras y
se ordenan las observaciones en sentido ascendente, asignando, en caso de
empate, la media de los puestos correspondientes. Sea T la suma de los puestos de
las observaciones de la primera población (T en el contraste de la suma de puestos
de Wilcoxon es igual que R1 en el contraste U de Mann-Whitney). Suponiendo que la
hipótesis nula es verdadera, el estadístico de la suma de puestos de Wilcoxon, T,
tiene la media:
n1 (n1 n2 1)
T
2
y la varianza:
n1 n2 (n1 n2 1)
T2
12
Por lo que cuando n1≥10 y n2≥10 la distribución normal es una excelente
aproximación a la distribución de la variable aleatoria:
T T
Zcalculado
T
ucontinental.edu.pe | 95
Asignatura: Estadística Aplicada
Ejemplo
En un estudio que pretendía comparar los resultados de empresas que revelan las
predicciones de la dirección sobre los beneficios con los resultados de las que no las
revelan, se tomaron muestras aleatorias de 80 empresas de cada una de las
poblaciones. Se midió la variabilidad de la tasa de crecimiento de los beneficios en
los 10 periodos anteriores en cada una de las 160 empresas y se ordenaron estas
variabilidades. La suma de los puestos de las empresas que no revelan las
predicciones de la dirección sobre los beneficios era 7287. Contraste la hipótesis
nula de que las posiciones centrales de las distribuciones poblacionales de las
variabilidades de los beneficios son las mismas en los dos tipos de empresas frente
a la hipótesis alternativa bilateral.
Solución
i) Como T=7.287, calculamos los demás indicadores, siendo n1=80 y n2=80
n1 (n1 n2 1) 80(161)
ii) T 6440
2 2
n n (n n2 1) 80.x80(161)
iii) T 1 2 1 85867
2
12 12
iv) Calculamos entonces el estadístico de prueba:
7287 6440
Zcalculado 2.89
85867
v) Al ser el estadístico de prueba 2.89 mayor que el valor crítico al 0.05 de
significancia 1.645, podemos concluir que existe evidencia estadística para rechazar
la hipótesis nula. Lo que quiere decir que estos datos constituyen, pues, una prueba
contundente en contra de la hipótesis de que las posiciones centrales de las
distribuciones de las variabilidades poblacionales de las tasas de crecimiento de los
beneficios de las empresas que revelan las predicciones de los beneficios son
iguales que las de las empresas que no las revelan.
Ejemplo
La tabla siguiente muestra el número de horas semanales que los estudiantes
afirman que dedican a estudiar las asignaturas de introducci6n a la economía
financiera y a la contabilidad. Los datos proceden de muestras aleatorias de 10
estudiantes de economía financiera y 12 de contabilidad. ¿Indican los datos la
existencia de una diferencia en el numero mediano de horas semanales que dedican
los estudiantes a estudiar las asignaturas de introducci6n a la economía financiera y
a la contabilidad?
Solución
i) Planteamos las hipótesis.
Ho: Med(1)=Med(2) Los estudiantes dedican la misma cantidad de tiempo
para
ambas asignaturas.
H1: Med(1)≠Med(2) Los estudiantes no dedican la misma cantidad de tiempo
para
ambas asignaturas.
ii) Unimos en un solo conjunto a las dos muestras y ordenamos los datos de forma
ascendente, luego en el cuadro inicial indicamos los rangos al lado de cada dato.
ucontinental.edu.pe | 96
Asignatura: Estadística Aplicada
n1 (n1 n2 1) 10(10 12 1)
iii) T 115
2 2
n n (n n2 1) 10 x12(10 12 1)
iv) T 1 2 1 230
2
12 12
v) Calculamos entonces el estadístico de prueba:
93 .5 115
Zcalculado 1.42
230
vi) Por lo que podemos concluir que existe evidencia estadística para aceptar la
hipótesis nula, o sea que no se puede establecer diferencias en el tiempo dedicado
al estudio de ambas asignaturas.
Ejercicio
Se pregunta a una muestra aleatoria de 50 estudiantes de una facultad que sueldo
debería estar dispuesta la universidad a pagar para atraer a la persona idónea para
hacerse cargo de la Coordinación Académica. Se hace la misma pregunta a una
muestra aleatoria independiente de 50 profesores. A continuación, se juntan las
100 cifras sobre el sueldo y se ordenan (asignándose 1 al sueldo más bajo). La
suma de los rangos de los profesores es 2024.
Contraste la hipótesis nula de que no existe ninguna diferencia entre las posiciones
centrales de las distribuciones de los sueldos propuestos por los estudiantes y por
los profesores frente a la hipótesis alternativa de que en conjunto los estudiantes
propondrían un sueldo más alto para atraer al Coordinador Académico.
Ejercicio
Un estudio utilizó tomografía computarizada (TC) por rayos X para reunir datos de
volúmenes cerebrales de un grupo de pacientes con trastorno obsesivo-compulsivo
y un grupo de control de personas saludables. La lista adjunta presenta los
resultados muestrales (en mililitros) para volúmenes del hemisferio derecho (según
datos de “Neuroanatomical Abnormalities in Obsesive-Compulsive Disorder
Detected with Quantitative X-Ray Computed Tomography”, de Luxenberg et al.,
American Journal of Psychiatry, vol. 145, núm. 9). Utilice un nivel de significancia
de 0.01 y pruebe la aseveración de que los pacientes obsesivo-compulsivos y las
personas saludables tienen la misma mediana de volúmenes cerebrales. Con base
en este resultado, ¿podemos concluir que el trastorno obsesivo-compulsivo tiene
una base biológica?20
20
Tomado de Estadística, Mario Triola, 10°Ed., Cap.13, página 700
ucontinental.edu.pe | 97
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 98
Asignatura: Estadística Aplicada
2
k
Oi Ei 2
i 1 Ei
donde:
O representa la frecuencia observada de un resultado.
E representa la frecuencia esperada de un resultado.
k representa el número de categorías diferentes o resultados.
n representa el número total de ensayos.
Es importante indicar que los valores críticos se calculan en la tabla de distribución
chi-cuadrada utilizando k-1 grados de libertad. Todas las pruebas son de cola
derecha.
DIAGRAMA N°02: PRUEBAS DE BONDAD DE AJUSTE 21
21
Fuente: Tomado de Estadística, Mario Triola, 10°Ed., Capítulo 11, página 594
ucontinental.edu.pe | 99
Asignatura: Estadística Aplicada
Ejemplo
El gerente de ventas de una empresa concesionaria de varias marcas de
automóviles, tiene la responsabilidad de controlar el nivel de existencias para
cuatro tipos de automóvil vendidos por dicha empresa. En el pasado, ha ordenado
nuevos automóviles bajo la premisa de que los cuatro tipos son igualmente
populares y la demanda de cada tipo es la misma. Sin embargo, recientemente las
existencias se han vuelto más difíciles de controlar, y considera que debería probar
su hipótesis respecto a una demanda uniforme.
¿Qué podemos concluir acerca de los datos observados?
Solución
i) Planteamos las hipótesis.
H0: La demanda es uniforme para los cuatro tipos de autos.
H1: La demanda no es uniforme para los cuatro tipos de autos.
ii) Como el total de ventas es 48, si la demanda es uniforme se espera de que cada
marca debe vender 12 unidades, por lo que nuestro tablero quedaría:
Marca de auto Unidades vendidas (fo) Unidades esperadas (fe)
Kía 15 12
Toyota 11 12
Hyundai 10 12
Chevrolet 12 12
iii) Calculamos el estadístico de prueba utilizando las frecuencias observadas y las
frecuencias esperadas.
k
Oi Ei 2
2
i 1 Ei
2
15 12 2 11 12 2 10 12 2 12 12 2 1.17
12 12 12 12
iv) Ubicamos el valor crítico en la tabla de valores críticos de chi cuadrado,
utilizando k-1 grados de libertad, siendo k=4, por lo que los grados de libertad son
3 y un nivel de significancia del 0.05.
02.05,3 7.815
v) La regla de decisión la podemos observar en el siguiente gráfico, teniendo en
cuenta lo siguiente:
ucontinental.edu.pe | 100
Asignatura: Estadística Aplicada
Ejemplo
Un ingeniero de control de calidad toma una muestra de 10 neumáticos que salen
de una línea de ensamblaje y desea verificar sobre la base de los datos que siguen,
los números de llantas con defectos observadas en 200 días, si es cierto que el 5%
de todos los neumáticos tienen defecto; es decir, si el muestrea una población
binomial con n = 10 y 0.05 .
Solución
i) Planteamos las hipótesis:
Ho: La población es binomial
Ha: La población no es binomial
ii) Hallamos las frecuencias esperadas utilizando la distribución binomial:
f ( x)
n
x
x
(1 ) n x , con n = 10 y 0.05
iii) Reemplazando los valores:
f (0) 0.05
10
0
0
(1 0.05)10 0 = 0.599
f (1) 0.05
10
1
1
(1 0.05)10 1 = 0.315
ucontinental.edu.pe | 101
Asignatura: Estadística Aplicada
viii) Como 8.26 es mayor que 5.99, rechaza la hipótesis nula con un nivel de
significancia de 0.05. Por lo que se concluye que el verdadero porcentaje de
neumáticos con defecto no es el 5%.
Ejercicio
Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se observó el
número de caras de cada serie. El número de series en los que se presentaron 0, 1,
2, 3, 4 y 5 caras se muestra en la siguiente tabla.
ucontinental.edu.pe | 102
Asignatura: Estadística Aplicada
Ajuste los datos a una distribución binomial con un nivel de significancia del 0.05.
Use n=5.
Nota: Para hallar recuerde que n , entonces primero halle la media y luego
divídala entre n.
22
Tomado de Estadística, Mario Triola, 10°Ed., Cap.11, página 606
ucontinental.edu.pe | 103
Asignatura: Estadística Aplicada
k = Categorías o celdas.
Con n renglones y m columnas en la tabla de contingencia, el estadístico de prueba
tiene una distribución ji cuadrada con (n – 1).(m – 1) grados de libertad, siempre y
cuando las frecuencias esperadas sean 5 o más para todas las categorías. En
consecuencia proseguimos con el cálculo de la estadística de prueba ji cuadrada.
En situaciones como las siguientes, se puede estar interesado en determinar si dos
variables están relacionadas:
2
38 32 .43 2 31 36 .57 2 9 14 .57 2 22 16 .43 2
32 .43 36 .57 14 .57 16 .43
ucontinental.edu.pe | 104
Asignatura: Estadística Aplicada
2 5.8227
v) La regla de decisión la podemos observar en el siguiente gráfico, teniendo en
cuenta lo siguiente:
Grados de libertad= (2-1).(2-1)=1
Nivel de significancia=0.05
vi) Como el valor calculado 5.8227 es mayor que el valor crítico 3.8414 se rechaza
la hipótesis nula de independencia de las variables por lo que se concluye que la
práctica de algún deporte disminuye la depresión.
Ejercicio
La oficina de Recursos Humanos de la universidad quiere determinar si la
satisfacción en el trabajo es independiente del puesto de trabajo. Para ello realizó
un estudio entre los docentes administrativos y encontró los resultados mostrados
en la tabla siguiente. Con un nivel de significancia de 0.05, pruebe si son
dependientes la satisfacción en el trabajo y el puesto de trabajo.
Ejercicio
En un experimento para estudiar la dependencia de la hipertensión de los hábitos
de fumar, se tomaron los siguientes datos de 180 individuos:
No Fumadores Fumadores
fumadores moderados empedernidos
Con hipertensión 21 36 30
Sin hipertensión 48 26 19
ucontinental.edu.pe | 105
Asignatura: Estadística Aplicada
2
38 36
2
8 36
2
30 36
2
...
93 89
2
36 36 36 89
2 65.85
ucontinental.edu.pe | 106
Asignatura: Estadística Aplicada
v) Como el estadístico de prueba 65.85 es mayor que el valor crítico 11.07 hay
evidencia estadística para rechazar la hipótesis nula. Se concluye entonces que el
contenido de flúor en el agua puede ser la causa de la diferencia en la incidencia de
caries en las ciudades analizadas.
Ejercicio
Un investigador estudia la efectividad de tres remedios R1, R2 y R3 para aliviar
cierta enfermedad. Para esto escogió tres muestras aleatorias de tamaños 50, 70 y
60 de pacientes con dicha enfermedad, suministrando a la primera el remedio R1, a
la segunda el remedio R2 y a la tercera el remedio R3 midiendo la efectividad de los
remedios en tres niveles: Sin alivio, cierto alivio y alivio total. Los resultados del
experimento se presentan en la tabla siguiente:
23
Tomado de Estadística Aplicada, Manuel Córdova Zamora, 1°Ed., Cap.7, página 349
ucontinental.edu.pe | 107
Asignatura: Estadística Aplicada
12 Ri2
K 3( n 1 )
n( n 1 ) ni
Ejemplo
Un nuevo gerente de un proveedor de supermercados debe comparar el tiempo que
toma a tres clientes pagar por los productos entregados. Se seleccionan
aleatoriamente varias compras de cada cliente, junto con el número de días que
cada uno se tomó en liquidar su cuenta. Los resultados aparecen en la tabla
siguiente:
ucontinental.edu.pe | 108
Asignatura: Estadística Aplicada
29 15 22 8.5 31 16
22 8.5 21 6.5
21 6.5
R1= 62 R2= 34.5 R3= 74.5
iii) Calculando el estadístico K, con n=18, se tiene:
6 d i
2
rs 1
n(n 2 1)
Donde:
n: número de pares de datos muestrales.
di: son las diferencias entre los puestos de los miembros de los distintos
pares.
24
Tomado de Estadística, Mario Triola, 10°Ed., Cap.13, página 706
ucontinental.edu.pe | 109
Asignatura: Estadística Aplicada
n xy x y
rs
n x 2 x
2
n y 2 y
2
25
Tomado de Estadística, Mario Triola, 10°Ed., Cap.13, página 709
ucontinental.edu.pe | 110
Asignatura: Estadística Aplicada
6 d i 6 47 .5
2 2
rs 1 =1
n(n 2 1) 11(11 2 1)
rs 0.7841
v) El valor crítico lo ubicamos en la tabla de valores críticos del coeficiente de
correlación de rangos de Spearman, siendo 0.618.
vi) Como el valor calculado es mayor que el valor crítico rechazamos la hipótesis
nula y aceptamos que existe algún tipo de correlación entre las calificaciones de los
dos supervisores.
26
Tomado de Estadística Aplicada a la Administración y la Economía, Alberto Díaz Mata, 1°Ed., Cap.17,
página 541
ucontinental.edu.pe | 111
Asignatura: Estadística Aplicada
Ejercicio
La tabla adjunta muestra el rendimiento porcentual de una muestra aleatoria de 20
fondos de inversión a largo plazo en un periodo de 12 meses y los activos totales
(en millones de dólares).
RENDIMIENTO ACTIVOS RENDIMIENTO ACTIVOS RENDIMIENTO ACTIVOS
29.3 300 16 421 12.9 75
27.6 70 15.5 99 11.3 610
23.7 3004 15.2 756 9.9 264
22.3 161 15 730 7.9 27
22 827 14.4 436 6.7 71
19.6 295 14 143 3.3 719
17.6 29 13.7 117
27
Tomado de Estadística, Mario Triola, 10°Ed., Apeéndice A, página 783
ucontinental.edu.pe | 112
Asignatura: Estadística Aplicada
AAAABBAAABBBAAAAAAABB
Entonces definimos una racha como una sucesión de uno o más símbolos idénticos
que están precedidos o seguidos por un símbolo diferente o por ninguno, siendo la
longitud de una racha el número de símbolos iguales que incluye.
La sucesión anterior presenta 6 rachas, las cuales se pueden separar por barras
verticales:
AAAA/BB/AAA/BBB/AAAAAAA/BB
Se observa entonces que hay una racha de longitud 4, 4(A), dos rachas de longitud
2, (2B), una racha de longitud 3, (3A), etc.
Estadístico de prueba:
donde:
y:
NOTA: Para analizar datos numéricos, o sea la aleatoriedad por arriba o por debajo
de la media o de la mediana, se prueba la aleatoriedad por la forma como los datos
numéricos fluctúan por encima o por debajo de una media o mediana.
ucontinental.edu.pe | 113
Asignatura: Estadística Aplicada
28
Tomado de Estadística, Mario Triola, 10°Ed., Cap.13, página 718
ucontinental.edu.pe | 114
Asignatura: Estadística Aplicada
Ejemplo
El principal diario de la localidad mantenía un registro del sexo de las personas que
llamaban a la oficina de circulación para quejarse de los problemas con la entrega
de la revista sabatina. Para un sábado reciente, estos datos fueron los siguientes:
M, F, F, F, M, M, F, M, F, F, F, F, M, M, M, F, M, F, M, F, F, F, F, M, M, M, M, M
Usando el nivel de significancia de 0.05, pruebe la aleatoriedad de esta secuencia.
¿Hay algo respecto a la naturaleza de este problema que nos lleve a la conclusión
que una secuencia así no es aleatoria?
Solución
i) Planteamos las hipótesis:
H0: Existe aleatoriedad en la muestra.
H1: No existe aleatoriedad en la muestra.
ii) Identificamos las rachas:
M/FFF/MM/F/M/FFFF/MMM/F/M/F/M/FFFF/MMMMM
Encontramos un total de G=13 rachas.
iii) El estadístico de prueba es 13 y el valor crítico lo ubicamos en la tabla de
valores críticos para la prueba de rachas con n1= 14 para los varones y n2=14 para
las mujeres siendo de 9 a 21 rachas.
iv) Como el estadístico de prueba se encuentra entre los valores críticos se acepta
la hipótesis nula de existencia de aleatoriedad. Por lo que no hay evidencia para
pensar que la secuencia no es aleatoria.
29
Tomado de Estadística, Mario Triola, 10°Ed., Apéndice A, página 784, tabla A10
ucontinental.edu.pe | 115
Asignatura: Estadística Aplicada
Ejemplo
Se asumen niveles de producción diarios en una mina de carbón seleccionada para
un estudio estadístico, y éstos son, 31, 57, 52, 22, 24, 59, 25, 29, 27, 44, 43, 32,
40, 37, y 60 toneladas. Se desea analizar dicha producción para verificar algún
problema recurrente en las máquinas. ¿Habrá algún indicio para pensar que existe
algún problema cíclico en las máquinas?
Solución
i) Siendo la mediana de 37, se utiliza como valor de referencia.
ii) Las observaciones caen o por arriba (A) o por abajo (B) de 37, se representan de
la siguiente manera:
31 57 52 22 24 59 25 29 27 44 43 32 40 37 60
B A A B B A B B B A A B A A
Ejercicio
Pruebe la aleatoriedad de la siguiente muestra usando un nivel de significancia de
0.05:
A, B, A, A, A, B, B, A, B, B, A, A, B, A, B, A, A, B, B, B, B, A, B, B, A, A, A, B, A, B,
A, A
Ejercicio
La municipalidad provincial recibe diariamente solicitudes para matrimonios civiles.
Un estudio registra las solicitudes de los últimos 30 días hábiles.
3, 4, 6, 8, 4, 6, 7, 2, 5, 7, 4, 8, 4, 7, 9, 5, 9, 10, 5, 7, 4, 9, 8, 9, 11, 6, 7, 5, 9, 12
Con un nivel de significancia del 0.01 ¿existen motivos para pensar que la serie
registrada proviene de alguna característica del entorno?
ucontinental.edu.pe | 116
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 117
Asignatura: Estadística Aplicada
ACTIVIDAD N°1
Aplica las pruebas del signo y las pruebas de bondad, independencia y
homogeneidad en distintas series de datos.
1. La tabla de abajo lista datos apareados de estaturas que se midieron de 12
hombres estudiantes de estadística. Utilice un nivel de significancia de 0.05 y
pruebe la aseveración de que no hay diferencia entre las estaturas reportadas y las
estaturas medidas.
3. Abajo se listan los pesos (en gramos) de dulces M&M que se tomaron del
conjunto de datos 19 del Apéndice B del libro Estadística de Mario Triola. Utilice un
nivel de significancia de 0.05, y pruebe la aseveración de que los dulces M&M
clásicos rojos y cafés tienen pesos con la misma distribución. Esto es, pruebe la
aseveración de que las poblaciones de dulces M&M clásicos rojos y cafés son
idénticas.
Caramelos Rojos
Caramelos Cafés
ucontinental.edu.pe | 118
Asignatura: Estadística Aplicada
N° de accidentes de N° de
trabajo semanas
0 4
1 7
2 23
3 24
4 15
5 13
6 ó más 14
Utilizando un nivel de significación del 1%, determine si hay alguna relación entre
el nivel directivo y su interés por los temas ambientales.
ucontinental.edu.pe | 119
Asignatura: Estadística Aplicada
ACTIVIDAD N°2
Verifica las características de dos o más muestras aplicando las pruebas
no paramétricas.
Aplica la aleatoriedad de una muestra utilizando la prueba de rachas.
Los datos son mediciones de sangre de 50 sujetos (de los EE.UU. Departamento de
Salud y Servicios Humanos, el Centro Nacional de Estadísticas de Salud, Salud
Tercera Encuesta Nacional de Examen de Nutrición). El género, la edad, el recuento
de glóbulos blancos, glóbulos rojos, hemoglobina y recuento de plaquetas se
indican para cada sujeto. El recuento de células de la sangre se mide en células por
micro litro; hemoglobina se mide en g / dl, recuento de plaquetas es número por
mm3.
a. Verifique la aleatoriedad de la muestra respecto al género.
b. Demuestre si existe correlación entre el contenido de plaquetas y de glóbulos
blancos de los varones.30
Sex White bcc Platelets
F 8.9 224
M 5.25 264.5
M 5.95 360
M 10.05 384.5
F 6.5 364.5
F 9.45 468
M 5.45 171
M 5.32 328.5
F 7.65 323.5
F 6.4 306.5
F 5.15 264.5
F 16.6 233
F 5.75 254.5
M 5.55 267
F 11.6 463
M 6.85 238
M 6.65 251
F 5.9 282.5
F 9.3 307.5
M 6.3 321.5
F 8.55 360.5
M 6.4 282.5
F 10.8 315
F 4.85 284
F 4.9 259.5
M 7.85 291.5
F 8.75 259.5
M 7.7 164
M 5.3 199.5
M 6.5 220
F 6.9 369
M 4.55 245
M 7.1 266
M 8 369
M 4.7 210.5
M 4.4 234
F 9.75 471
M 4.9 244.5
M 10.75 365.5
30
Extraído del Apéndice B del libro Estadística Mario Triola
ucontinental.edu.pe | 120
Asignatura: Estadística Aplicada
PRÁCTICA Nº 3
1. La siguiente tabla muestra un estudio sobre el número de obreros por empresa,
realizado en 65 empresas de la capital:
Nº de obreros Nº de empresas
[ 30 - 50 > 10
[ 50 - 70 > 8
[ 70 - 90 > 12
[ 90 - 110 > 20
[ 110 -130 > 15
Verifique si la distribución tiene un comportamiento normal.
E F M A M J J A S O N D
9 5 7 14 8 1 7 6 4 5 1 9
A un nivel de significación del 5%, ¿se puede afirmar que la probabilidad de que
algún electrodoméstico requiera reparación dentro del período de garantía es
similar entre ellos?
4. Se estudió el orden de preguntas de examen para ver su efecto en la ansiedad.
Los resultados muestrales se listan abajo. Utilizando un nivel de significancia de
0.05, pruebe la aseveración de que las dos muestras provienen de poblaciones con
las mismas calificaciones. Finalmente pruebe la aleatoriedad de las muestras
tomando los datos de manera horizontal para cada una.
ucontinental.edu.pe | 121
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 122
Asignatura: Estadística Aplicada
AUTOEVALUACIÓN Nº 3
Son
correctas:
A) Sólo I y II
B) Sólo I
C) Sólo I y III
D) Ninguna.
E) I; II y III
Son correctas
A) I; II y III
B) Sólo I y II
C) Sólo I
D) Sólo II
E) Sólo III
3. Se desea probar si la estatura de los empleados tiene distribución
normal. Se toma una muestra aleatoria de 200 empleados a quienes
se les pregunta su estatura en pulgadas. Los resultados obtenidos
son:
ucontinental.edu.pe | 123
Asignatura: Estadística Aplicada
Reputación 1 2 3 4 5 6 7 8 9 10
Probable 3 4 1 2 9 5 10 6 7 8
compra
ucontinental.edu.pe | 124
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 125
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 126
Asignatura: Estadística Aplicada
31
Tomado de Estadística, Mario Triola, 10°Ed., Cap.10, página
ucontinental.edu.pe | 127
Asignatura: Estadística Aplicada
Correlación Correlación
negativa positiva
perfecta Ninguna perfecta
correlación
Moderada
Moderada correlación
correlación positiva
negativa
Fuerte Débil Débil Fuerte
correlación correlación correlación correlación
negativa negativa positiva positiva
-1 - 0.5 0 0.5 1
Ejemplo
Se tiene los valores registrados de las visitas realizadas y los pedidos hechos
por 10 vendedores de una empresa. Calcula el coeficiente de correlación de
Pearson.
N°VENDEDOR VISITAS PEDIDOS EN
REALIZADAS (X) MILLONES S/. (Y)
1 245 13.4
2 172 10.3
3 291 15.1
4 124 6.9
5 191 7.3
6 218 14.2
7 101 5.2
ucontinental.edu.pe | 128
Asignatura: Estadística Aplicada
8 259 11.8
9 307 14.3
10 142 5.5
Solución
i) Calculamos ∑x,∑y, ∑x.y, ∑x2 y ∑y2.
ii)
N°VENDEDOR VISITAS PEDIDOS EN x.y X2 Y2
REALIZADAS MILLONES
(X) S/. (Y)
H0 : 0 H1 : 0
ucontinental.edu.pe | 129
Asignatura: Estadística Aplicada
r n2
Estadístico de Prueba: t
1 r2
- Para cada valor de” x” hay un grupo de valores de “y”, y estos valores “y”
están distribuidos normalmente.
- Toda las medias de estas distribuciones normales de Y están sobre la línea
de regresión.
- Las desviaciones estándar de estas distribuciones normales son iguales.
- Los valores de “y” son estadísticamente independientes.
ECUACIÓN DE REGRESIÓN: y a bx
32
Tomado de Estadística, Mario Triola, 10°Ed., Cap.10, página 526
ucontinental.edu.pe | 130
Asignatura: Estadística Aplicada
80.00
70.00
60.00 Y Tiempo
Y Tiempo
50.00
Pronóstico Y Tiempo
40.00
30.00 Lineal (Pronóstico Y
20.00 Tiempo)
10.00
0.00
0 5 10 15 20 25
X Servicios
b 2 2 y b x
n x y x y
n x x
a
n n
s y,x
(y y est )2
también: S y . X
Y 2
a Y b XY
n2 n2
INTERVALO DE CONFIANZA
Estima el valor medio de y para una x dada:
1 ( x x) 2
yest t / 2;n2 .s yx .
n ( x) 2
x 2
n
INTERVALO DE PREDICCIÓN
Estima el rango de valores de y para una x dada:
1 ( x x) 2
yest t / 2;n2 .s yx . 1
n ( x ) 2
x n
2
Ejemplo
El gerente municipal de construcción considera que la demanda de camionadas
de hormigón puede estar relacionada con el número de permisos de construcción
emitidos en el municipio durante el trimestre anterior.
El gerente ha recolectado los datos que se muestran en la tabla.
Permisos de Camionadas de
construcción (X) hormigón (Y)
15 6
9 4
40 16
ucontinental.edu.pe | 131
Asignatura: Estadística Aplicada
20 6
25 13
25 9
15 10
35 16
Solución
i) Realizamos el gráfico de dispersión para el análisis visual
n X Y XY X2 Y2
1 15 6 90 225 36
2 9 4 36 81 16
3 40 16 640 1600 256
4 20 6 120 400 36
5 25 13 325 625 169
6 25 9 225 625 81
7 15 10 150 225 100
8 35 16 560 1225 256
Totales 184 80 2146 5006 950
n XY X Y
r
n X 2
X nY 2 (Y ) 2
2
8(2146 ) (184 )(80 )
r
8(5006 ) (184 ) 8(950 ) (80)
2 2
2448
r 0.90 Por lo tanto podemos indicar que existe buena relación
7430400
entre las dos variables, siendo el 81% de la variación total explicado por el
análisis de regresión.
ucontinental.edu.pe | 132
Asignatura: Estadística Aplicada
b 2 2 ; b 0.395
n x y x y
n x x
a
y b x ; a 0.915
n n
vi) Planteamos la ecuación de la regresión:
y a bx
y 0.915 0.395 x
vii) El número de camionadas cuando el número de permisos de construcción es 30 se
puede encontrar sustituyendo el valor en la ecuación.
x 30
y 0.915 0.395 (30 ) x
y 12 .76 13
El número de embarques será de 13 aproximadamente.
viii) Por lo tanto, la desviación estándar de la regresión es
S y. X
Y 2
a Y b XY
n2
SY . X 2.2 embarques
1 ( x x) 2
s yx . 1 2.4
n ( x) 2
x n
2
t / 2;n2 2.447
Finalmente reemplazando en la fórmula del intervalo de predicción:
Y’= 13 ± 2.447 (2.40)
ucontinental.edu.pe | 133
Asignatura: Estadística Aplicada
Ejercicio
La temperatura del aire disminuye con la altura de la localidad, los datos
siguientes refuerzan la idea y hacen presumir una relación lineal entre la
temperatura Y y la altura X observada en ciertos puntos de la costa y parte de la
sierra al amanecer.
REGRESIÓN EXPONENCIAL
y ab x
REGRESIÓN POTENCIAL
y ax b
REGRESIÓN POLINOMIAL
y a0 a1 x a 2 x 2 ... a k x k
REGRESIÓN CUADRÁTICA
ucontinental.edu.pe | 134
Asignatura: Estadística Aplicada
y a0 a1 x a2 x 2
1.2 CORELACIÓN REGRESIÓN MÚTIPLE
ucontinental.edu.pe | 135
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 136
Asignatura: Estadística Aplicada
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.98913768
Coeficiente de determinación R^2 0.97839335
R^2 ajustado 0.96398892
Error típico 0.67538163
Observaciones 6
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 61.9649123 30.9824561 67.9230769 0.003176
Residuos 3 1.36842105 0.45614035
Total 5 63.3333333
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%
Intercepción -8.89473684 2.80805902 -3.16757475 0.05057503 -17.8312339 0.0417602 -17.83123389 0.041760203
X1 0.36842105 0.35262721 1.04478905 0.37289365 -0.75379612 1.49063823 -0.753796124 1.490638229
X2 0.78947368 0.17891297 4.41261304 0.02159713 0.22009278 1.35885459 0.220092779 1.35885459
Intercepción = 0 =-8.894737
Variable X1 = 1 = 0.3684211
Variable X1 = 2 = 0.7894737
vi) Por lo tanto, la ecuación de regresión múltiple ajustada es :
Ejemplo
Elija el mejor modelo para el comportamiento de los siguientes datos:
x y
5 69
9 68
10 45
15 48
15 53
16 50
23 45
25 40
26 23
28 36
29 21
31 32
33 21
34 15
35 26
36 10
Solución
ucontinental.edu.pe | 137
Asignatura: Estadística Aplicada
ii) Haciendo click derecho en cualquier punto activar el comando Agregar línea de
tendencia.
iii) Se muestran las opciones donde debemos realizar la prueba en cada modelo
para poder observar el coeficiente de correlación.
ucontinental.edu.pe | 138
Asignatura: Estadística Aplicada
iv) Activamos también Presentar el valor R en el gráfico asi como Presentar ecuación en el
gráfico.
ucontinental.edu.pe | 139
Asignatura: Estadística Aplicada
Ejercicio
Elija el mejor modelo para el comportamiento de los siguientes datos:
x y
48 1
56 1.25
58 1
58 3
59 4.5
62 3
ucontinental.edu.pe | 140
Asignatura: Estadística Aplicada
67 2.5
68 3
69 6
69 4
75 1.5
78 3.6
79 5
102 1.25
109 3
110 4
ucontinental.edu.pe | 141
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 142
Asignatura: Estadística Aplicada
33
Tomado de Estadística, Mario Triola, 10°Ed., Cap.14, página 740
ucontinental.edu.pe | 143
Asignatura: Estadística Aplicada
Para ambos casos se debe tener en cuenta en el análisis de las gráficas que los
procesos estarán fuera de control si tienen los siguientes comportamientos:
34
Tomado de Estadística, Mario Triola, 10°Ed., Cap.14, página 737
ucontinental.edu.pe | 144
Asignatura: Estadística Aplicada
Ejemplo
Se toman las medidas de los diámetros de una pieza cilíndrica, el tamaño de muestra de cada
subgrupo es de cinco, y se toman 25 subgrupos a intervalos de 1 hr. Realice la carta de control
X R.
muestra subgrupo 1 2 3 4 5 6 7 8 9 10 11 12 13
1 0.65 0.75 0.75 0.60 0.70 0.60 0.15 0.60 0.65 0.60 0.80 0.85 0.70
2 0.70 0.85 0.80 0.70 0.75 0.75 0.80 0.70 0.80 0.70 0.75 0.75 0.70
3 0.65 0.75 0.80 0.70 0.65 0.75 0.65 0.80 0.85 0.60 0.90 0.85 0.75
4 0.65 0.85 0.70 0.75 0.85 0.85 0.75 0.75 0.85 0.80 0.50 0.65 0.75
5 0.85 0.65 0.75 0.65 0.80 0.70 0.70 0.75 0.75 0.65 0.80 0.70 0.70
muestra subgrupo 14 15 16 17 18 19 20 21 22 23 24 25
1 0.65 0.90 0.75 0.75 0.75 0.65 0.60 0.50 0.60 0.80 0.65 0.65
2 0.70 0.80 0.80 0.70 0.70 0.65 0.60 0.55 0.80 0.65 0.60 0.70
3 0.85 0.80 0.75 0.85 0.60 0.85 0.65 0.65 0.65 0.75 0.65 0.70
4 0.75 0.75 0.80 0.70 0.70 0.65 0.60 0.80 0.65 0.65 0.60 0.60
5 0.60 0.85 0.65 0.80 0.60 0.70 0.65 0.80 0.75 0.65 0.70 0.65
Solución
i) Calculamos el rango y el promedio para cada grupo:
ucontinental.edu.pe | 145
Asignatura: Estadística Aplicada
muestra subgrupo 1 2 3 4 5 6 7 8 9 10 11 12 13
1 0.65 0.75 0.75 0.60 0.70 0.60 0.15 0.60 0.65 0.60 0.80 0.85 0.70
2 0.70 0.85 0.80 0.70 0.75 0.75 0.80 0.70 0.80 0.70 0.75 0.75 0.70
3 0.65 0.75 0.80 0.70 0.65 0.75 0.65 0.80 0.85 0.60 0.90 0.85 0.75
4 0.65 0.85 0.70 0.75 0.85 0.85 0.75 0.75 0.85 0.80 0.50 0.65 0.75
5 0.85 0.65 0.75 0.65 0.80 0.70 0.70 0.75 0.75 0.65 0.80 0.70 0.70
Promedio 0.70 0.77 0.76 0.68 0.75 0.73 0.61 0.72 0.78 0.67 0.75 0.76 0.72
Rango 0.20 0.20 0.10 0.15 0.20 0.25 0.65 0.20 0.20 0.20 0.40 0.20 0.05
muestra subgrupo 14 15 16 17 18 19 20 21 22 23 24 25
1 0.65 0.90 0.75 0.75 0.75 0.65 0.60 0.50 0.60 0.80 0.65 0.65
2 0.70 0.80 0.80 0.70 0.70 0.65 0.60 0.55 0.80 0.65 0.60 0.70
3 0.85 0.80 0.75 0.85 0.60 0.85 0.65 0.65 0.65 0.75 0.65 0.70
4 0.75 0.75 0.80 0.70 0.70 0.65 0.60 0.80 0.65 0.65 0.60 0.60
5 0.60 0.85 0.65 0.80 0.60 0.70 0.65 0.80 0.75 0.65 0.70 0.65
Promedio 0.71 0.82 0.75 0.76 0.67 0.70 0.62 0.66 0.69 0.70 0.64 0.66
Rango 0.25 0.15 0.15 0.15 0.15 0.20 0.05 0.30 0.20 0.15 0.10 0.10
LIC R D3 R 0
iv) Finalmente calculamos los límites para las medias:
v) Luego graficamos:
UCL=0.8254
0.8
Sample Mean
0.7 Mean=0.7112
0.6 LCL=0.5970
Subgroup 0 5 10 15 20 25
0.7 1
0.6
Sample Range
0.5
0.4 UCL=0.4187
0.3
0.2 R=0.198
0.1
0.0 LCL=0
ucontinental.edu.pe | 146
Asignatura: Estadística Aplicada
Ejemplo
Un fabricante de latas de aluminio registra el número de partes defectuosas,
tomando muestras cada hora de n = 50, con 30 subgrupos. Realizar la gráfica de
control para la siguiente serie de datos obtenida durante el muestreo.
Solución
i) Calculamos la fracción defectuosa de cada muestra:
Muestra Latas defectuosas Fracción defectuosa Muestra Latas defectuosas Fracción defectuosa
np p np p
1 12 0.24 16 8 0.16
2 15 0.30 17 10 0.20
3 8 0.16 18 5 0.10
4 10 0.20 19 13 0.26
5 4 0.08 20 11 0.22
6 7 0.14 21 20 0.40
7 16 0.32 22 18 0.36
8 9 0.18 23 24 0.48
9 14 0.28 24 15 0.30
10 10 0.20 25 9 0.18
11 5 0.10 26 12 0.24
12 6 0.12 27 7 0.14
13 17 0.34 28 13 0.26
14 12 0.24 29 9 0.18
15 22 0.44 30 6 0.12
p (1 p ) 0.23 * 0.77
LSC p p 3 = 0.2313 3 =0.4102
n 50
ucontinental.edu.pe | 147
Asignatura: Estadística Aplicada
p (1 p ) 0.23 * 0.77
LIC p p 3 = 0.2313 3 =0.05243
n 50
0.5 1
1
0.4 UCL=0.4102
Proportion
0.3
P=0.2313
0.2
0.1
LCL=0.05243
0.0
0 10 20 30
Sample Number
ucontinental.edu.pe | 148
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 149
Asignatura: Estadística Aplicada
ACTIVIDAD N°1
Verifica la correlación entre dos variables, aplica la prueba de hipótesis
respectiva y estructura la ecuación de regresión.
Llamadas de ventas 20 40 20 30 10 10 20 20 20 30
Copiadoras vendidas 30 60 40 60 30 40 40 50 30 70
2. Los siguientes datos son las ventas (miles de dólares) de una estación de
gasolina y la cantidad de automóviles atendidos.
AUTOS ATENDIDOS 276 265 264 285 255 232 238 271 224
203 230
VENTAS 2.1 2.3 2.3 2.3 2.5 2.1 1.9 2.4 1.8
1.2 2.2
ucontinental.edu.pe | 150
Asignatura: Estadística Aplicada
ACTIVIDAD N°2
Realiza el control estadístico de procesos utilizando los gráficos de control.
ucontinental.edu.pe | 151
Asignatura: Estadística Aplicada
PRÁCTICA Nº 4
Análisis de caso y toma de decisiones utilizando los contenidos de la
unidad III y IV.
C 0 10 20 30 40 50
g 52 60 64 73 76 81
Costo de mantenimiento 759 582 371 608 994 124 220 551 949
Tiempo de operación 9 6 4 10 12 3 2 9 13
ucontinental.edu.pe | 152
Asignatura: Estadística Aplicada
GLOSARIO35
35
Glosario Básico INEI
ucontinental.edu.pe | 153
Asignatura: Estadística Aplicada
ucontinental.edu.pe | 154
Asignatura: Estadística Aplicada
error muestral (por lo tanto, se obtiene menor precisión de las estimaciones acerca
de la población) que una muestra aleatoria simple del mismo tamaño. Los
elementos individuales dentro de cada "conglomerado" tienden frecuentemente
a ser iguales.
1. Bondad de un ajuste.
2. Criterio de independencia.
3. Criterio de homogeneidad.
REGIÓN DE RECHAZO.- Conocida también como región crítica, está formada por
el conjunto de valores con los cuales se rechaza la hipótesis nula.
ucontinental.edu.pe | 155
Asignatura: Estadística Aplicada
BIBLIOGRAFIA
ucontinental.edu.pe | 156
Asignatura: Estadística Aplicada
AUTOEVALUACIÓN Nº4
1. De un conjunto de datos se ha calculado la data que aparece en el cuadro debajo.
i. Elija la ecuación de regresión que exprese la variable de
respuesta (y) de la cantidad de nicotina en términos de la variable
de predicción (x) de la cantidad de alquitrán.
ii. Elija la ecuación de regresión que exprese la variable de
respuesta (y) de la cantidad de nicotina en términos de la variable
de predicción (x) de la cantidad de monóxido de carbono.
iii. Elija la ecuación de regresión que exprese la variable de
respuesta (y) de la cantidad de nicotina en términos de las
variables de predicción (x) de la cantidad de alquitrán y la
cantidad de monóxido de carbono.
iv. De las ecuaciones de regresión elegidas en los incisos i), ii) e
iii), ¿cuál es la mejor ecuación para predecir la cantidad de nicotina?
v. ¿La mejor ecuación de regresión identificada en el inciso es una
buena
ecuación para predecir la cantidad de nicotina? ¿Por qué?
VARIABLE DE R2
PREDICCIÓN (X) R R2 AJUSTADO ECUACIÓN DE REGRESIÓN SIGNIFICANCIA
Monóxido de
carbono, 0.9661 0.9333 0.9282 y´=0.182 - 0.0186 X1 + 0.0818X2 5.16523E-16
Alquitrán
Monóxido de
0.8633 0.7453 0.7358 y´=0.1916+0.0606 X 1.67085E-09
carbono
Alquitrán 0.9614 0.9242 0.9214 y´=0.1540+0.0650 X 1.17863E-16
A) i) Y´=0.1540 + 0.0650X
ii) Y´=0.1916 +0.0606X
iii) Y´=0.182 - 0.0186X1+0.0818X2
iv) La mejor ecuación para hacer predicciones es la tercera
v) Sólo tiene una variable.
B) i) Y´=0.1916 +0.0606X
ii) Y´=0.1540 + 0.0650X
iii) Y´=0.182 - 0.0186X1+0.0818X2
iv) La mejor ecuación para hacer predicciones es la tercera
v) Por el tipo de variable
C) i) Y´=0.1540 + 0.0650X
ii) Y´=0.1916 +0.0606X
iii) Y´=0.182 +0.0818X2
iv) La mejor ecuación para hacer predicciones es la primera
v) Tiene más variables dependientes
D) i) Y´=0.1540+0.0650X
ii) Y´=0.1916+0.0606X
iii) Y´=0.182-0.0186X1+0.0818X2
iv) La mejor ecuación para hacer predicciones es la primera
v) Tiene más variables independientes.
E) i) Y´=0.1540 + 0.0650X
ii) Y´=0.1916+0.0606X
iii) Y´=0.182-0.0186X1+0.0818X2
iv) La mejor ecuación para hacer predicciones es la segunda
v) Contiene las variables más importantes.
ucontinental.edu.pe | 157
Asignatura: Estadística Aplicada
A) VVVV
B) FVVV
C) VFVV
D) VFFV
E) FVFF
1 10 12 13 08
2 13 11 10 06
3 10 09 11 13
4 08 12 13 11
5 14 10 11 05
A) i) Y= 4.8952X2 – 0.0286
ucontinental.edu.pe | 158
Asignatura: Estadística Aplicada
B) i) Y= 4.8952X2 – 0.0286X+0.0048
ii) 705 metros
iii) La distancia de 705 metros sobrepasa la altura de 50 metros que tiene el
edificio.
C) i) Y= 0.0286X +0.0048
ii) 705 metros
iii) La distancia de 705 metros sobrepasa la altura de 50 metros que tiene el
edificio.
D) i) Y= 14.657X – 6.1143
ii) 169.67 metros
iii) La distancia de 169.77 metros sobrepasa la altura de 50 metros que tiene el
edificio, el experimento está errado.
E) i) Y= 14.657X – 6.1143
ii) 169.67 metros
iii) La distancia de 169.77 metros sobrepasa la altura de 50 metros que tiene el
edificio.
5. Construya una gráfica para las medias y determine si la media del proceso está
bajo control estadístico. Si no es así, identifique cuál de los tres criterios para
establecer una falta de control conduce al rechazo de una media estadísticamente
estable. ¿Necesita este proceso una acción correctiva? 36
Marque lo incorrecto.
36
Tomado de Estadística, Mario Triola, 10°Ed., Cap.14, página 747
ucontinental.edu.pe | 159
Asignatura: Estadística Aplicada
37
Tomado de Estadística, Mario Triola, 10°Ed., Cap.14, página 747
ucontinental.edu.pe | 160
Asignatura: Estadística Aplicada
AUTOEVALUACIÓN N°01
PRIMERA UNIDAD
N° DE PREGUNTA RESPUESTA
1 D
2 A
3 E
4 B
5 E
6 B
7 D
8 D
9 A
10 C
AUTOEVALUACIÓN N°02
SEGUNDA UNIDAD
N° DE PREGUNTA RESPUESTA
1 E
2 C
3 C
4 B
5 D
6 E
7 A
8 E
9 E
10 C
AUTOEVALUACIÓN N°03
TERCERA UNIDAD
N° DE PREGUNTA RESPUESTA
1 C
2 D
3 A
4 E
5 E
AUTOEVALUACIÓN N°04
CUARTA UNIDAD
N° DE PREGUNTA RESPUESTA
1 D
2 E
3 A
4 D
5 D
ucontinental.edu.pe | 161
Asignatura: Estadística Aplicada
BIBLIOGRAFÍA
BÁSICA
Triola, Mario F. Estadística. Pearson Educación, México 2013.
COMPLEMENTARIA
Jorge Inafuko, Jorge Rubio. Estadística Aplicada. Universidad del
Pacífico. 2014.
Jay L. Devore. Probabilidad y Estadísitca para Ingeniería y Ciencias.
Cengage Learning. 2012.
Fernando Miranda, Jesús Salinas. Estadística General. UNALM. 2012.
William Mendenhall, Robert J. Beaver, Barbara M. Beaver.
Introducción a la Probabilidad y Estadística. Cengage Learning. 2010.
Ross, Sheldon M. Introducción a la Estadística. Academic Press. 2010
Milton, Susan, Arnold Jesé. Probabilidad y Estadística con aplicaciones
para ingeniería y ciencias computacionales. Mc Graw-Hill, México.
2004.
RECURSOS DIGITALES
Instituto Nacional de Estadística e Informática. En:
http://www.inei.gob.pe/
Lidia PR, Hugo MA, Rodrigo VR. Comprensión De Las Distribuciones
Muestrales En Un Curso De Estadística Para Ingenieros/understanding
of Sample Distributions for a Course on Statistics for Engineers.
Revista Chilena de Ingenieria 2007;15(1):6-17.
José Ramón LC, Jorge AG, Randy Howard AS, Wilder CC. Mezclas Con
Potencial Coagulante Para Tratamiento De Lixiviados De Un Relleno
Sanitario. Interciencia 2008;33(1):22-28.
Araujo I, Montilla M, Carmen Cárdenas, Lenín Herrera, al e. Lodos
Estabilizados Y Cepas Bacterianas En La Biorremediación De Suelos
Contaminados Con Hidrocarburos. Interciencia 2006;31(4):268-275.
S R, R B, A V. ESTUDIO ESTADÍSTICO DE LA CORRELACIÓN ENTRE
CONTAMINANTES ATMOSFÉRICOS Y VARIABLES METEOROLÓGICAS
EN LA ZONA NORTE DE CHIAPAS, MÉXICO/Statistical study of the
correlation between atmospheric pollutants and meteorological
variables in northern Chiapas, Mexico. Universidad y Ciencia
2010;26(1):65-80.
ucontinental.edu.pe | 162