Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica II Cibertec PDF
Estadistica II Cibertec PDF
Índice
Presentación 05
Red de contenidos 06
Sesiones de aprendizaje
SEMANA 1 : • Definiciones básicas: Población, marco muestral, 07
muestra, censo y muestreo: Ventajas y desventajas
• Diseño de la encuesta por muestreo. Tipos de muestreo
• Distribuciones muestrales
SEMANA 2 : • Estimación Puntual. Propiedades de un estimador. 19
Estimación de intervalos de confianza
• Intervalos de confianza para la media con varianza
conocida, muestra grande
• Tamaño muestral para estimar una media
• Intervalo de confianza para la diferencia de medias de
dos distribuciones con ambas desviaciones estándar
conocidas, muestras grandes
SEMANA 3 : • Intervalo de confianza para la media con varianza 35
desconocida. Muestra pequeña
• Intervalo de confianza para la diferencia de medias con
varianzas desconocidas pero iguales, muestras
pequeñas
SEMANA 4 : • Intervalo de confianza para una proporción. Muestras 45
grandes
• Tamaño muestral para estimar una proporción
• Tamaño de muestra para poblaciones finitas
• Intervalo de confianza para la diferencia de proporciones
SEMANA 5 : • Hipótesis estadística. Tipos de errores I y II, Nivel de 55
significación, Región crítica o región de rechazo. Región
de aceptación
• Prueba de Hipótesis para medias, muestras grandes.
Prueba bilateral de una hipótesis sobre la media
• Prueba unilateral de una hipótesis sobre la media, caso I,
caso II
• Prueba de Hipótesis para la diferencia de medias.
Desviación estándar conocidas, muestras grandes
SEMANA 6 : • Prueba de Hipótesis para medias, muestras pequeñas 73
• Prueba bilateral de una hipótesis sobre la media
• Prueba unilateral de una hipótesis sobre la media, caso
I, caso II
• Prueba de Hipótesis para la diferencia de medias
• Desviación estándar desconocidas, Muestras pequeñas
Presentación
La globalización ha creado un campo muy extenso de desarrollo para los
nuevos profesionales, ya sea en servicios o en producción. Es por esto que
tienen que estar preparados para enfrentar cualquier reto en el campo
laboral. Las comunicaciones y el software han hecho que en la actualidad
todo profesional esté en constante contacto con la información estadística.
Más aún, muchas veces es necesario realizar alguna medición estadística
para tener una idea acerca de la producción de una empresa, del mercado
bursátil a nivel mundial, del precio de los metales en el mercado Europeo, el
control de epidemias en zonas determinadas, el control de los precios de la
canasta familiar, etc, de manera que se pueda tomar la decisión adecuada
para que dichos estudios sean siempre favorables.
El propósito de este manual es brindar conceptos claros de estadística
inferencial y sus numerosas aplicaciones en el campo laboral. Por otra parte,
se pretende dar al futuro profesional las herramientas necesarias para
interpretar y evaluar información estadística, para que adquiera destreza en
la interpretación, y manejo de las definiciones y teoremas.
En una primera etapa se desarrollará el marco teórico y práctico de la
Estadística Inferencial. En la segunda etapa se desarrollará la aplicación de
Métodos regresivos para predecir situaciones experimentales basadas en
datos reales.
Finalmente es importante resaltar que este curso es netamente práctico. Por
ello en cada sesión se desarrollará la teoría necesaria en forma concreta,
dándole mayor énfasis a la parte práctica y a la interpretación de resultados.
Red de contenidos
σ²
conocida
σ²
Intervalos de desconocida
confianza
Proporciones
σ²
conocida
Prueba de σ²
hipótesis desconocida
Muestreo
Proporciones
Lineales
Simple
No Lineales
Regresiones
Múltiple
Correlaciones
Serie de
tiempo
SEMANA
1
TEORÍA DE MUESTREO
TEMAS
OBJETIVOS ESPECÍFICOS
CONTENIDOS
ACTIVIDADES
TEORÍA DE MUESTREO
La teoría de muestreo es un estudio de las relaciones existentes entre una
población y muestras extraídas de la misma. Tiene gran interés en muchos
aspectos de la estadística. Por ejemplo, permite estimar cantidades
desconocidas de la población (tales como la media poblacional, la varianza,
etc.), frecuentemente llamadas parámetros poblacionales o brevemente
parámetros, a partir del conocimiento de las correspondientes cantidades
muestrales (tales como la media muestral, la varianza, etc.), a menudo
llamadas estadísticos muestrales o brevemente estadísticos.
La teoría de muestreo es también útil para determinar si las diferencias que se
puedan observar entre dos muestras son debidas a la aleatoriedad de las
mismas o si por el contrario son realmente significativas. Tales preguntas
surgen, por ejemplo, al ensayar un nuevo suero para el tratamiento de una
enfermedad, o al decidir si un proceso de producción es mejor que otro. Estas
decisiones envuelven a los llamados ensayos e hipótesis de significación, que
tienen gran importancia en teoría de la decisión.
En general, un estudio de inferencias, realizado sobre una población mediante
muestras extraídas de la misma, junto con las indicaciones sobre la exactitud
de tales inferencias aplicadas a la teoría de la probabilidad, se conoce como
inferencia estadística.
DISTRIBUCIONES MUESTRALES
Considérense todas las posibles muestras de tamaño n que pueden extraerse
de una población dada (con o sin reemplazo). Para cada muestra se puede
calcular un estadístico, tal como la media, la desviación estándar, etc., que
variará de una muestra a otra. De esta forma, se obtiene una distribución del
estadístico que se conoce como distribución muestral.
Si, por ejemplo, el estadístico de que se trata es la media muestral, la
distribución se conoce como distribución muestral de medias Análogamente se
obtendrían las distribuciones mustrales de las desviaciones estándar,
varianzas, medianas, proporciones, etc.
µ p − p = µ p − µ p = p1 − p2
1 2 1 2
p1 (1 − p1 ) p2 (1 − p2 )
σ p − p = σ p2 + σ p2 = +
1 2 1 2
n1 n2
µs − s = µs − µs
1 2 1 2
σ s − s = σ + σ s2
1 2
2
s1 2
ERRORES TÍPICOS
La desviación estándar de la distribución muestral de un estadístico se conoce
también como su error estándar. En la tabla se han anotado los errores típicos
de distribuciones muestrales para diversos estadísticos bajo las condiciones de
muestreo aleatorio sin reemplazo para una población infinita (o muy grande) o
con reemplazo para una población finita. También, se apuntan notas especia-
les que indican las condiciones para las que los resultados son válidos, así
como otras notas de interés.
∧
Las cantidades µ , σ , p, µ r y x, s, p, x r denotan, respectivamente, las medias,
desviaciones estándar, proporciones y momentos de orden r respecto de la
media en la población y en la muestra.
Es de notar que si el tamaño de la muestra n es bastante grande, las
distribuciones muestrales son normales o casi normales. Por esta razón, los
métodos se conocen como métodos para grandes muestras. La teoría de
pequeñas muestras, o teoría de muestreo exacto, como a veces se llama, se
usa cuando n<30. Entonces, las muestras se llaman pequeñas.
Cuando los parámetros de la población, tales como σ , p, µ r se desconocen,
pueden estimarse mediante sus correspondientes estadísticos muestrales:
∧
s, p, xr , si las muestras son suficientemente grandes.
ACTIVIDADES
1. Una población se compone de los cinco números 2, 3, 6, 8, 11. Considere
todas las muestras posibles de tamaños que puedan extraerse con
remplazamiento de esta población. Halle lo siguiente:
5. Los cojinetes de bolas de una determinada casa pesan 0,50 onzas con una
desviación estándar de 0,02 onzas. ¿Cuál es la probabilidad de que dos
lotes de 1000 cojinetes cada uno difieran en un peso superior a 2 onzas?
7. Se pesan tres cantidades dando 20,48; 35,97 y 62,34 libras con desviaciones
estándar de 0,21; 0,46 y 0,54 libras respectivamente. Halle la media y la
desviación estándar de la suma de las cantidades.
Autoevaluación
1. Quinientos cojinetes de bolas tienen un peso medio de 5,02 onzas y una
desviación estándar de 0,30 onzas. Halle la probabilidad de que una
muestra al azar de 100 cojinetes elegidos entre este grupo tenga un peso
total (a) comprendido entre 496 y 500 onzas, (b) de más de 510 onzas.
3. Ciertos tubos fabricados por una compañía tienen una duración media de
800 horas y una desviación estándar de 60 horas. Halle la probabilidad de
que una muestra al azar de 16 tubos, tomada entre ellos tenga una duración
media entre 790 y 810 horas.
8. Un cierto tipo de bombilla eléctrica tiene una duración media de 1500 horas
y una desviación estándar de 150 horas. Se conectan tres bombillas de
forma que cuando una se funde, otra sigue alumbrando. Suponiendo que
las duraciones se distribuyen normalmente. ¿Cuál es la probabilidad de que
se tenga luz
8.1 al menos 5000 horas?
8.2 como mucho 4200 horas?
10. Una población está formada por los cuatro números 3, 7, 11, 15. Considere
todas las posibles muestras de tamaño dos que pueden extraerse de esta
población con reemplazo. Halle lo siguiente:
10.1 la media poblacional
10.2 la desviación estándar poblacional
10.3 la media de la distribución muestral de medias
10.4 la desviación estándar de la distribución muestral de medias
11. Ciertos tubos fabricados por una compañía tienen una duración media de
800 horas y una desviación estándar de 60 horas. Halle la probabilidad de
que una muestra al azar de 16 tubos, tomada de ellos tenga una duración
media de:
11.1 entre 790 y 810 horas
11.2 menor de 785 horas
14. De un total de 1 000 muestras de 200 niños cada una, ¿en cuántas cabe
esperar que entre el 40 % y el 60 % sean niñas?
15. Una urna contiene 80 bolas de las que 60 % son rojas y 40 % blancas. De
un total de 50 muestras de 20 bolas cada una, sacadas de la urna con
reemplazo, ¿en cuántas cabe esperar 12 bolas rojas y 8 blancas?
16. A y B fabrican dos tipos de cables, que tienen unas resistencias medias a la
rotura de 4000 y 4500 libras con desviaciones estándar de 300 y 200 libras,
respectivamente. Si se comprueban 100 cables de A y 50 cables de B,
¿cuál es la probabilidad de que la media de resistencia a la rotura de B sea
(a) al menos 600 libras más que A, (b) al menos 450 libras más que A?
18. Los resultados de una elección mostraron que un cierto candidato recibió el
65 % de los votos. Halle la probabilidad de que en dos muestras al azar
compuesto cada una de 200 votantes, haya una diferencia superior al 10 %
en las proporciones que votaron a dicho candidato.
Para recordar
En el uso de Distribuciones muestrales se debe tener en cuenta que las
n variables aleatorias independientes a estudiar deben ser continuas.
Para un proceso Normal se debe tener en cuenta la media promedio y
la desviación estándar común y finitas.
SEMANA
2
INTERVALOS DE CONFIANZA
TEMAS
• Estimación Puntual. Propiedades de un estimador. Estimación de intervalos
de confianza
• Intervalos de confianza para la media con varianza conocida, muestra
grande
• Tamaño muestral para estimar una media
• Intervalo de confianza para la diferencia de medias de dos distribuciones
con ambas desviaciones estándar conocidas, muestras grandes
OBJETIVOS ESPECÍFICOS
CONTENIDOS
ACTIVIDADES
INTERVALO DE CONFIANZA
ESTIMACIÓN DE PARÁMETROS
TIPOS DE ESTIMACIÓN
a) Estimación Puntual
LIC µ LCS
p [L − E ≤ θ ≤ L + E ] = 1 − α
LIC = L – E
LSC = L + E
σ σ
x − Z tab , x + Z tab
n n
σ) conocida
Desviación estándar poblacional (σ
E = Z tab * σ x
σ
σx =
n
Donde:
σx : Error estándar de la media para una población
n : tamaño de muestra
Ztab : se obtiene a partir del nivel de confianza
σ) desconocida
Desviación estándar poblacional (σ
( X − Y ) − (µ x − µ y )
Z=
σ x2 σ y2
+
n m
Luego:
σ x2 σ y
2
σ x2 σ y
2
p ( X − Y ) − Z o + ≤ µ1 − µ 2 ≤ ( X − Y ) + Z o + =1−α
n m n m
Se obtiene el intervalo aleatorio
σ x2 σ y
2
σ x2 σ y2
( X − Y ) − Z o + , (X − Y ) + Zo +
n m n m
ACTIVIDADES
3. Para una población con una varianza conocida de 185, una muestra de 64
individuos conduce al valor de 217 como estimación de la media. Construya
una estimación de intervalo que incluya a la media de la población 68,3% de
las veces.
9. Una muestra de 150 bombillas del fabricante A dieron una vida media de
1400 horas y una desviación estándar de 120 horas. Una muestra de 100
bombillas del fabricante B dieron una vida media de 1200 horas y una
desviación estándar de 80 horas. Halle el intervalo de confianza al 99% para
la diferencia de las vidas medias de las poblaciones A y B.
Autoevaluación
1. La panificadora Gabino está interesada en adquirir una camioneta usada.
Selecciona al azar 125 ofertas de venta y encuentra que el precio promedio
de una camioneta en esta muestra es de $3250. La empresa sabe que la
desviación estándar de los precios de las camionetas usadas en la ciudad
es de $615. Construya una estimación de intervalo para el precio promedio
13. Una compañía tiene 500 cables. Un ensayo con 40 cables elegidos al azar
dieron una media de resistencia a la rotura de 2400 libras y una desviación
típica de 150 libras. ¿Con qué grado de confianza cabe decir que la media
de resistencia a la rotura de los 460 cables restantes sea 2400 ± 35 libras?
14. En una granja de 1000 pollos se va a experimentar con una nueva dieta de
engorde. Si se sabe que la desviación típica del aumento de peso en un
periodo de un mes es igual a dos onzas. ¿Qué tamaño debe tomarse una
muestra que conduzca a una estimación del aumento de peso de la
totalidad de la parvada, si se quiere que esta estimación no contenga un
error mayor que 40 lb. (una 1b = 16 oz.) con probabilidad de 0.95?
16. De qué tamaño debe ser la muestra para poder tener 95% de confianza en
que el error de estimación es de 5 o menos. Suponga que la desviación
estándar poblacional es de 25.
17. La revista “Unidos por Siempre” dio a conocer el costo promedio de una
boda, que es de s/. 19000 soles. Suponga que la desviación estándar
poblacional es de s/. 9400 con una confiabilidad del 95%. ¿Qué tamaño
debe tener la muestra si el error de estimación deseado es de s/. 1000
soles?
2000. Suponga que desea una estimación por intervalo de 95% de nivel de
confianza para la media del sueldo anual inicial. ¿De qué tamaño debe
tomarse la muestra, si el error de estimación deseado es de $ 200.
21. Determine el tamaño mínimo de muestra que se debe tomar para estimar
al 85% de confianza el porcentaje de limeños que actualmente utiliza
Internet diariamente. El año pasado se realizó una investigación que indicó
que el 18% de los limeños utilizaba Internet diariamente. Se desea que el
error al hacer la estimación no sea mayor que 5%.
25. Una muestra al azar de 200 pilas de la marca A para calculadoras tiene
una vida media de 140 horas y una desviación estándar de 10 horas. Una
muestra al azar de 120 pilas de la marca B para calculadoras tiene una
vida media de 125 horas y una desviación estándar de 9 horas. Determine
el intervalo de confianza al 99% para la diferencia de medias de las dos
marcas de pilas para calculadoras
Para recordar
La precisión de una estimación puntual puede evaluarse en la muestra,
por estimación de un intervalo junto con una medida de la seguridad
que tal intervalo contenga la parámetro desconocido de la población.
SEMANA
3
INTERVALO DE CONFIANZA
PARA MUESTRAS PEQUEÑAS
TEMAS
• Intervalo de confianza para la media con varianza desconocida. Muestra
pequeña.
• Intervalo de confianza para la diferencia de medias con varianzas
desconocidas pero iguales. Muestras pequeñas.
OBJETIVOS ESPECÍFICOS
CONTENIDOS
ACTIVIDADES
S S
x − t tab , x + t tab
n n
p [L − E ≤ θ ≤ L + E ] = 1 − α
L: Estadístico correspondiente
E: Error estándar de estimación
1 - α: Nivel de confianza
θ: Parámetro por estimar
∧
E = Ttab * σ x
∧ S
σx =
n
Donde:
S : desviación estándar de la muestra
∧
σ : Error estándar de la media para una población
x
−
n m n+m−2
Donde:
S c : es la desviación estándar combinada de las dos muestras
(n − 1) S x2 + (m − 1) S y2
Sc =
n+m−2
p [LIC ≤ µ 1 − µ 2 ≤ LSC ]= 1 − α
Luego:
1 1 1 1
p ( X − Y ) − t o S c + ≤ µ1 − µ 2 ≤ ( X − Y ) + to S c + =1−α
n m n m
Se obtiene el intervalo aleatorio
1 1 1 1
( X − Y ) − t o S c + , ( X − Y ) + to S c +
n m n m
ACTIVIDADES
280 295 289 294 308 320 350 300 310 285
302 305 398 397 300 365 380 395 399 360
6,0 7,0 1,2 6,6 6,9 6,7 7,2 7,0 7,0 6,3
5,8 6,7 6,0 7,3 6,6 6,4 7,3 7,2 6,0 6,8
Analista
164,4 165,2 169,2 168,2 167,3 168,2 169,5 167,2 168,1 169,3
01
Analista
163,2 165,3 167,2 168,9 169,9 165,4 167,3 162,3 163,2 165,2
02
TIPO 1 481 506 494 506 661 572 602 487 524 661
TIPO 2 526 511 556 542 491 498 537 582 605 605
8. Dos analistas tomaron lecturas repetidas en la dureza del agua de las napas
freáticas a lo largo del valle del Rimac. Determine un intervalo de confianza
Analista A 0,46 0,62 0,37 0,45 0,38 0,37 0,44 0,48 0,53 0,47
Analista B 0,82 0,64 0,54 0,55 0,58 0,42 0,48 0,33 0,32 0,25
Autoevaluación
1. Se pidió al personal de ventas de la Distribuidora Continental que
presentara informes semanales con los clientes llamados durante la
semana. En una muestra de 18 informes semanales se determinó un
promedio de 22,4 llamadas a clientes por semana y una desviación estándar
de 5 llamadas. Determine el intervalo de confianza al 95% para el número
promedio de llamadas semanales a clientes.
4,03 4,05 4,15 4,00 3,99 4,00 3,98 3,97 4,10 4,12
4,08 4,05 4,00 4,04 4,05 4,00 3,99 3,97 4,00 3,98
280 295 298 310 312 297 285 265 279 308 300 290
20,0 21,5 19,7 20,6 19,5 18,4 19,6 20,8 21,9 21,4 20,0 21,5
8,24 8,23 8,20 8,29 8,31 8,25 8,24 8,31 8,29 8,20
8,31 8,26 8,25 8,29 8,27 8,32 8,31 8,21 8,20 8,30
5,0 4,2 4,8 5,2 5,5 5,9 6,1 6,8 5,2 4,2 5,8 4,5
18 22 14 19 21 23 17 26 28 12 14 26
10. Las cajas de un cereal producidos por una fábrica deben tener un
contenido de 16 onzas. Un inspector tomó una muestra que arrojó los
siguientes pesos en onzas:
12. Una compañía productora de maíz híbrido planta dos nuevas hileras de
maíz hídrico en 10 granjas diferentes. Las producciones en bushel por acre
fueron las siguientes:
Hídrico I 90 85 94 78 86 85 92 95 95 82
Hídrico II 84 89 87 92 90 91 87 87 81 80
Determine el intervalo de confianza del 95% para la diferencia entre las dos
producciones medias de maíz híbrido.
Para recordar
La precisión de una estimación puntual puede evaluarse en la muestra
menor de 30, por estimación de un intervalo aplicando la tabla de
distribución t´student.
Los datos tienen que ser de muestra, como la media muestral y la
desviación estándar muestral.
SEMANA
4
INTERVALO DE CONFIANZA
PARA UNA PROPORCIÓN
TEMAS
• Intervalo de confianza para una proporción. Muestras grandes
• Tamaño muestral para estimar una proporción
• Tamaño de muestra para poblaciones finitas
• Intervalo de confianza para diferencia de proporciones
OBJETIVOS ESPECÍFICOS
CONTENIDOS
ACTIVIDADES
N−n
fc =
N −1
El tamaño mínimo de muestra para una población finita usa el factor de
corrección para la población
∧ ∧
p (1 − p ) N − n
E 2 = Ztab
2
( )( )
n N −1
∧ ∧
n Z p(1 − p )
2
= tab
)
N −n E 2
( )
N −1
Luego:
∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧
p (1 − p ) p (1 − p ) ∧ ∧ p (1 − p ) p (1 − p 2)
p ( p1 − p2 ) − Zo 1 1
+ 2 2
≤ (π1 −π2 ) ≤ ( p1 − p2 ) + Zo 1 1
+ 2
=1−α
n1 n2 n1 n2
∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧
∧ ∧
( p − p ) − Z p (1 − p ) p (1 − p 2)
∧ ∧ p1 (1 − p1 ) p 2 (1 − p 2 )
1 1
+ 2 , ( p1 − p2 ) + Ztab +
1 2 tab
n1 n2 n1 n2
ACTIVIDADES
1. Una tienda de computación, que compra al mayoreo chips sin probar para
computadoras, está considerando cambiar de proveedor por otro que se los
suministre probados y con una garantía a un precio más alto. Con el fin de
saber si este es un plan costeable, determine la porción de chips
defectuosos que le suministra su actual proveedor. Se probó una muestra
de 200 chips y de éstos, 5% tenía defectos.
a) Estime el error estándar de la porción de chips defectuosos.
b) Construya un intervalo de confianza de 98% para la porción de chips
defectuosos adquiridos.
3.1 Estime el error estándar de la porción de personas que tuvo esta grave
interpretación errónea sobre el postre.
3.2 Construya un intervalo de confianza de 96% para la porción real de la
población.
8 En una muestra al azar de 400 adultos y 600 adolescentes que veían cierto
programa de televisión, 100 adultos y 300 adolescentes dijeron que les
gustaba. Halle los límites de confianza al 95% para la diferencia de
proporciones de todos los adultos y adolescentes que ven el programa y les
gusta.
Autoevaluación
1. Durante un año y medio las ventas han estado disminuyendo de manera
coherente en las 1500 sucursales de una cadena de comida rápida. Una
empresa de asesores ha determinado que 30% de una muestra de 95
sucursales tienen claros signos de una mala administración. Construya un
intervalo de confianza de 98% para esta porción.
13. En una muestra al azar de 600 mujeres, 300 indican que están a favor
de la ayuda del estado a los colegios privados. En una muestra al azar de
400 hombres, 100 indican que están a favor del mismo. Determine un
intervalo de confianza (a) del 95%, (b) 90% para la diferencia de
proporciones de todas las mujeres y todos los hombres que favorecen tal
ayuda.
Para recordar
El estimador puntual de la proporción p en la distribución binomial se
usa como estimador puntual del parámetro p.
SEMANA
5
HIPÓTESIS ESTADÍSTICA
TEMAS
• Hipótesis estadística. Tipos de errores I y II. Nivel de significación. Región
crítica o región de rechazo. Región de aceptación
• Prueba de Hipótesis para medias, muestras grandes. Prueba bilateral de
una hipótesis sobre la media
• Prueba unilateral de una hipótesis sobre la media, caso I, caso II
• Prueba de Hipótesis para diferencia de media. Desviación estándar
conocidas, Muestras grandes
OBJETIVOS ESPECÍFICOS
ACTIVIDADES
HIPÓTESIS ESTADÍSTICA
DECISIONES ESTADÍSTICAS
Para que cualquier ensayo de hipótesis o reglas de decisión sea bueno, debe
diseñarse de forma que minimice los errores de decisión. Esto no es tan
sencillo como pueda parecer, puesto que para un tamaño de muestra dado, un
intento de disminuir un tipo de error, va generalmente acompañado por un
incremento en el otro tipo de error. En la práctica, un tipo de error puede tener
más importancia que el otro, y as se tiende a conseguir poner una limitación al
error de mayor importancia. La única forma de reducir al tiempo ambos tipos de
error es incrementar el tamaño de la muestra, lo cual puede ser o no ser
posible.
NIVEL DE SIGNIFICACIÓN
Crítica o de Rechazo es la región que contiene los valores para los cuales se
rechaza la hipótesis bajo consideración.
Región de aceptación es la región que contiene a los valores para los cuales
no se rechaza la hipótesis bajo consideración.
Caso I
1. Se formula la hipótesis nula y la hipótesis alternativa
H o : µ = µo
H1 : µ < µo
Donde µ o es el valor de la media poblacional.
2. Se escoge el nivel de significancia α .
3. Una estadística para la media de la población es la media muestral x . Si la
población es normal (o si la muestra es grande n ≥ 30 , aun cuando la
población no es normal).
σ2
La distribución de x es N ( µ , ).
n
x − µo
La variable aleatoria Z = tiene una distribución normal estándar N
σ
n
(0,1)
4. La región critica (R.C.) es 〈−∞, Z α 〉 , donde Z o es tal que P[Z < Z α ] = α
5. Se calcula x de los datos, luego se obtiene Z
x − µo
Z=
σ
n
0 Z 1−α
σ σ
µ o − Zα / 2 , µo + Zα /2
n n
5. Se calcula x a partir de la muestra observada,(también S si no se conoce la
varianza σ 2 y la muestra n es grande)
6. Se compara Z con Z α/2.
Si Z ∈ 〈−∞,− Z α / 2 〉 0 Z ∈ 〈+ Z α / 2 ,+∞〉 , se rechaza la hipótesis nula Ho
Si Z ∈ 〈− Z α / 2 ,+ Z α / 2 〉 , se acepta la hipótesis nula Ho
Zα / 2 0 Zα / 2
Caso I:
1. Considérese la siguiente hipótesis:
Ho : µx = µy o Ho : µx − µ y = 0
H1 : µ x 〉µ y H1 : µ x − µ y 〉0
+
n m n m
P Z〉
xc =α
σ x2 σ y
2
+
n m
σ x2 σ y2
Luego: + x c = Z 1−α
n m
5. Se calcula la diferencia de las medias muestrales ( x − y ) y S x − y si no se
conoce σ x , σ y . Para muestras grandes se utiliza S x − y .
2 2
0 Z 1−α
Caso II:
1. Considérese la siguiente hipótesis:
Ho : µx = µy o Ho : µx − µ y = 0
H1 : µ x 〈µ y H 1 : µ x − µ y 〈0
2. Se escoge el nivel de significancia α .
3. La estadística para la diferencia de medias poblacionales ( µ x − µ y ) es la
diferencia de medias muestrales ( x − y ) . Si la población tiene una
distribución normal con desviaciones estándar conocidas σ x y σ y
conocidas (o si las muestras son grandes n ≥ 30 , , m ≥ 30 aun cuando la
población no es normal).
La distribución de ( x − y ) es normal con media ( µ x − µ y ) y varianza
σ x2 σ y2
( + ).
n m
( x − y) − (µ x − µ y )
Por tanto, la variable aleatoria Z=
σ x2 σ y2
+
n m
Tiene una distribución normal estándar.
4. En el supuesto de que Ho es verdadero, es decir, que ( µ x − µ y ) = 0 . La
[
región crítica (R.C.) es 〈−∞, xc 〉 , tal que P ( x − y ) 〈 x c = α ]
( x − y)
P =α
xc
〈
σx +σy σ x2 σ y
2 2 2
+
n m n m
P Z〈
xc =α
σ x2 σ y
2
+
n m
σ x2 σ y2
Luego + x c = Zα
n m
5. Se calcula la diferencia de las medias muestrales ( x − y ) y S x − y si no se
conoce σ x , σ y . Para muestras grandes se utiliza S x − y .
2 2
Ho : µx = µy o Ho : µx − µ y = 0
H1 : µ x ≠ µ y H1 : µ x − µ y ≠ 0
2. Se escoge el nivel de significancia α .
3. La estadística para la diferencia de medias poblacionales ( µ x − µ y ) es la
diferencia de medias muestrales ( x − y ) . Si la población tiene una
distribución normal con desviaciones estándar conocidas σ x y σ y
conocidas (o si las muestras son grandes n ≥ 30 , , m ≥ 30 aun cuando la
población no es normal).
La distribución de ( x − y ) es normal con media ( µ x − µ y ) y varianza
σ x2 σ y2
( + ).
n m
( x − y) − (µ x − µ y )
Por tanto, la variable aleatoria: Z=
σ x2 σ y2
+
n m
Tiene una distribución normal estándar.
4. En el supuesto de que Ho es verdadero, es decir que ( µ x − µ y ) = 0 . La
[
región de aceptación (R.A.) es 〈 a, b〉 , tal que P a 〈 ( x − y ) 〈 b = 1 − α ]
( x − y)
P = 1−α
a b
〈 〈
σx +σy σ x2 σ y σ x2 σ y
2 2 2 2
+ +
n m n m n m
P = 1−α
a b
〈Z 〈
σx +σy σ x2 σ y
2 2 2
+
n m n m
σ x2 σ y2
Luego, a = −Z α / 2 +
n m
σ x2 σ y2
b = +Zα / 2
+
n m
5. Calcúlese la diferencia de las medias muestrales ( x − y ) . También S x2 , S y2 si
no se conoce σ x , σ y y las muestras son grandes.
2 2
Zα / 2 0 Zα / 2
ACTIVIDADES
Autoevaluación
1. La comisión promedio que cargan las compañías de corretaje de tiempo
completo en una venta de valores comunes es de $144 con una desviación
estándar de $52. Se tomó una muestra aleatoria de 121 compras y se
determinó que habían pagado una comisión promedio de $151. A un nivel
de significancia de 0,10, ¿puede concluirse que las comisiones son mayores
que el promedio de la industria?
11. En Julio del 2007, el Ministerio de Trabajo consideró una propuesta para
exigir a las compañías que informaran del efecto potencial de la existencia
de opciones para los empleados sobre las ganancias por acción (GPA). Una
muestra de 41 empresas de alta tecnología reveló que la nueva propuesta
reduciría las GPA en un monto del 13,8 con una desviación estándar de
18,9%. Otra muestra aleatoria de 35 productores de bienes de consumo
mostró que la propuesta reduciría las GPA en 9,1% en promedio, con una
desviación estándar del 8.7%. Con base en estas muestras, ¿Es razonable
llegar a la conclusión (a un nivel α = 0,01) de que la propuesta del Ministerio
de Trabajo ocasionará una mayor reducción en las GPA para las empresas
de alta tecnología o para los productores de bienes de consumo?
Para recordar
Para una prueba de hipótesis se debe formular adecuadamente la
hipótesis nula con un nivel de significancia de acuerdo con la realidad
del proceso.
SEMANA
6
HIPÓTESIS ESTADÍSTICA
MUESTRAS PEQUEÑAS
TEMAS
• Prueba de Hipótesis para medias. Muestras pequeñas
• Prueba bilateral de una hipótesis sobre la media
• Prueba unilateral de una hipótesis sobre la media, caso I, caso II
• Prueba de Hipótesis para diferencia de media
• Desviación estándar desconocidas. Muestras pequeñas
OBJETIVOS ESPECÍFICOS
ACTIVIDADES
Caso I
1. Se formula la hipótesis nula y la hipótesis alternativa
H o : µ = µo
H1 : µ < µo
Donde µ o es el valor de la media poblacional.
2. Se escoge el nivel de significancia α .
3. Una estadística de prueba es x , para muestras pequeñas se usa la variable
aleatoria.
x − µo
t=
S
n
Tiene una distribución t con (n-1) grados de libertad.
[ ]
4. La región critica (R.C.) es 〈−∞, xc 〉 , donde x c es tal que P x < x c = α
x− µ xc − µ
p o
〈 = α
s s
n n
xc − µ
p T 〈 = α
s
n
p [T 〈 t c ] = α
5. Se calcula x de los datos, luego se obtiene tα
x − µo
tα =
s
n
6. Se compara t con tα
xc − µ
p t 〉 = α
s
n
p [t 〉 t c ]= α
x − µo
t1−α =
s
n
6. Se compara t con t1−α
Si t > t1−α t ∈ 〈t1−α , + ∞〉 , se rechaza la hipótesis nula Ho
Si t < t1−α t ∈ 〈−∞,t1−α 〉 , se acepta la hipótesis nula Ho
0 Z 1−α
a − µ x− µ b − µo
p o
≤ ≤ = 1−α
s s s
n n n
Luego, la región de aceptación:
s s
µ o − tα / 2 , µ o + tα / 2
n n
7. Se calcula x a partir de la muestra observada,(también S si no se conoce la
varianza σ 2 y la muestra n es grande).
− tα / 2 0 + tα / 2
Caso I:
1. Considérese la siguiente hipótesis:
Ho : µx = µy o Ho : µx − µ y = 0
H1 : µ x 〉µ y H1 : µ x − µ y 〉0
2. En el supuesto de que Ho es verdadero, es decir, que ( µ x − µ y ) = 0 . Se
calcula t1−α , de tal manera que P[t 〉 t1−α ] = 1 − α . La región crítica (R.C.) es
〈t1−α ,+∞〉 ,
0 t1−α
Caso II:
1. Considérese la siguiente hipótesis:
Ho : µx = µy o Ho : µx − µ y = 0
H1 : µ x 〈µ y H 1 : µ x − µ y 〈0
2. En el supuesto de que Ho es verdadero, es decir que ( µ x − µ y ) = 0 . Se
calcula t1−α , de tal manera que P[t 〈tα ] = α . La región crítica (R.C.) es
〈−∞, t ∞ 〉 ,
Prueba Bilateral
1. Considérese la siguiente hipótesis:
Ho : µx = µy o Ho : µx − µ y = 0
H1 : µ x ≠ µ y H1 : µ x − µ y ≠ 0
2. En el supuesto de que Ho es verdadero, es decir que ( µ x − µ y ) = 0 . Se
calcula − tα / 2 y + tα / 2 , de tal manera que P [− t α / 2 〈 t 〈 t α / 2 ] = 1 − α . La región
crítica (R.C.) es 〈−∞,−tα / 2 〉 U 〈+tα / 2 ,+∞〉
− tα / 2 0 + tα / 2
ACTIVIDADES
.
1. Una máquina produce ejes que. según las especificaciones, deben tener
100 mm de diámetro. Para mantener la calidad requerida, todos los días se
examina una muestra de 16 ejes para determinar si es necesario detener la
producción y reajustar la máquina. Un día determinado, la muestra da los
siguientes resultados:
4. En el taller mecánico de Jerry utilizan una sierra a motor para cortar el tubo
de metal que se utiliza en la manufactura de dispositivos de medición de
presión. La longitud de los segmentos de tubo está distribuida normalmente.
Se cortaron 25 piezas de tubo con la sierra calibrada para cortar secciones
de 5,00 pulgadas de longitud. Cuando se midieron estas piezas, se encontró
que su longitud media era de 4,7 pulgadas y con una desviación estándar
de 0,06 pulgadas. Utilice valores probables para determinar si la máquina
debe ser recalibrada, debido a que la longitud media es significativamente
diferente a 5,00 pulgadas.
Ing.
Ambient 2,86 2,77 3,18 2,80 3,14 2,87 3,19 3,24 2,91 3,00 2,83
al
Ing.
Industri 3,35 3,32 3,36 3,63 3,41 3,37 3,45 3,43 3,44 3,17 3,26
al
¿Estos datos indican que existe una base fundada para los rumores?
Establezca y pruebe hipótesis apropiadas a un nivel α =0,02.
Antes 14 15 18 18 30 10 8 26 13 29 24
Después 23 14 13 29 33 11 12 25 21 26 24
Archivo 1 2 3 4 5 6 7
UIltima 14,4 Haynes 9,52 10,17 10,33 10,02 10,72 9,62 9,17
PerFAXtion 14,4 Extel 10,92 11,46 11,18 12,21 10,42 11,36 10,47
Autoevaluación
1. Un documental de televisión acerca de la alimentación excesiva afirmaba
que los estadounidenses tienen un sobrepeso aproximado de 10 lb en
promedio. Para probar esta afirmación, se examinó a 18 individuos elegidos
aleatoriamente, y se encontró que su sobrepeso promedio era de 12,4 lb,
con una desviación estándar de muestra de 2,7 lb. A un nivel de
significancia de 0,01; ¿hay alguna razón para dudar de la validez del valor
afirmado de 10 lb?
Ejecutivos de cuenta 13 10 11 12 13 12 10 12 - -
Empresa 1 2 3 4 5 6 7 8 9
2002 1,38 1,26 3,64 3,50 2,47 3,21 1,05 1,98 2,72
2003 2,45 1,50 4,59 3,06 2,11 2,80 1,59 0,92 0,47
Comerciante 1 2 3 4 5 6 7 8 9
Precio Apple $350 419 385 360 405 395 389 409 375
Precio Akita $370 425 369 375 389 385 395 425 400
Para recordar
Para una prueba de hipótesis se deberá tener en cuenta en los datos,
que tienen que ser de muestra, como la media muestral y la desviación
estándar muestral.
SEMANA
8
PRUEBA DE HIPÓTESIS
PARA LAS PROPORCIONES
TEMAS
OBJETIVOS ESPECÍFICOS
.
CONTENIDOS
• Prueba de Hipótesis para las proporciones, muestras grandes
• Prueba bilateral de una hipótesis sobre las proporciones
• Prueba unilateral de una hipótesis sobre la media, caso I, caso II
• Prueba de Hipótesis para la diferencia entre dos proporciones
.
ACTIVIDADES
Caso I
1. Se formula la hipótesis nula y la hipótesis alternativa
Ho :π = πo
H1 : π < π o
2. Se escoge el nivel de significancia α .
3. Una estadística de prueba es una variable aleatoria binomial X que tiene una
distribución binomial, cuando n es pequeño se utiliza esta distribución.
∧
p− π o
Z=
π o (1 − π o )
n
6. Se compara Z con Zα
Si Z < Zα. Z ∈ 〈−∞, Z α 〉 , se rechaza la hipótesis nula Ho
Si Z > Zα. Z ∈ 〈 Z α , + ∞〉 , se acepta la hipótesis nula Ho
Caso II
1. Se formula la hipótesis nula y la hipótesis alternativa
Ho :π = πo
H 1 : π 〉π o
2. Se escoge el nivel de significancia α
3. Una estadística de prueba es una variable aleatoria binomial X que tiene
una distribución binomial, cuando n es pequeño se utiliza esta distribución.
4. La región critica (R.C.) es 〈 Z α + ∞〉 , donde Z o es tal que P[Z > Z 1−α ] = α
5. Se calcula x de la muestra de tamaño n, luego se obtiene Z
x − np o
Z=
np o (1 − p o )
∧
p− π o
Z=
π o (1 − π o )
n
6. Se compara Z con Zo
Si Z > Z 1-α Z ∈ 〈 Z 1−α + ∞〉 , se rechaza la hipótesis nula Ho
Si Z < Z 1-α Z ∈ 〈−∞, Z 1−α 〉 , se acepta la hipótesis nula Ho
0 Z 1−α
π o (1 − π o ) π o (1 − π o )
π o − Z α / 2 , π o + Zα /2
n n
5. Se calcula x de la muestra de tamaño n; luego, se obtiene Z
x − np o
Z=
np o (1 − p o )
∧
p− π o
Z=
π o (1 − π o )
n
Zα / 2 0 Zα / 2
∧ ∧
( p1 − p 2 )
Z=
π 1 (1 − π 1 ) π 2 (1 − π 2 )
+
n1 n2
∧ ∧
( p1 − p 2 )
Z=
1 1
π 1 (1 − π 1 )(
+ )
n1 n 2
Es el valor de la normal estándar cuando Ho es verdadera, siendo n1 y n2
grandes.
∧
Para calcular Z se debe hallar el valor de π a partir de su estimador p
∧ x + x2
p = 1
n1 + n 2
Luego, el valor de verdad de la estadística Z es:
∧ ∧
( p1 − p 2 )
Z=
1 1∧ ∧
+ )p (1 − p )(
n1 n2
Desviaciones Estándar Conocidas, Muestras Grandes
Prueba Unilateral
Caso I:
1. Considérese la siguiente hipótesis:
H o : π1 = π 2 o H o : π1 − π 2 = 0
H 1 : π 1 〉π 2 H 1 : π 1 − π 2 〉0
2. Se escoge el nivel de significancia α
∧ ∧
3. La estadística de prueba es la variable aleatoria ( p 1 − p 2 ) que tiene una
distribución aproximadamente normal cuando n1 y n2 grandes. Es decir, la
variable aleatoria:
∧ ∧
( p1 − p 2 )
Z=
π 1 (1 − π 1 ) π 2 (1 − π 2 )
+
n1 n2
Suponiendo que Ho sea verdadera.
0 Z 1−α
Caso II:
1. Considérese la siguiente hipótesis:
H o : π1 = π 2 o H o : π1 − π 2 = 0
H 1 : π 1 〈π 2 H 1 : π 1 − π 2 〈0
2. Se escoge el nivel de significancia α .
∧ ∧
3. La estadística de prueba es la variable aleatoria ( p 1 − p 2 ) que tiene una
distribución
aproximadamente normal cuando n1 y n2 grandes. Es decir, la variable
aleatoria:
∧ ∧
( p1 − p 2 )
Z=
π 1 (1 − π 1 ) π 2 (1 − π 2 )
+
n1 n2
Suponiendo que Ho sea verdadera.
3. La región crítica (R.C.) es Z 〈 Z α , para la hipótesis alternativa H 1 : π 1 〈π 2
∧ x ∧ x ∧ x + x2
4. Se calcula p 1 = 1 y p 2 = 2 , luego p = 1
n1 n2 n1 + n 2
∧ ∧
( p1 − p 2 )
Luego, se halla: z =
∧ ∧ 1 1
p (1 − p )( + )
n1 n 2
5. Conclusión: si z se encuentra en la región crítica 〈−∞, Z α 〉 , se rechaza Ho,
en caso contrario se acepta.
Prueba Bilateral
1. Considérese la siguiente hipótesis:
H o : π1 = π 2 o H o : π1 − π 2 = 0
H1 : π 1 ≠ π 2 H1 : π 1 − π 2 ≠ 0
2. Se escoge el nivel de significancia α
∧ ∧
3. La estadística de prueba es la variable aleatoria ( p 1 − p 2 ) que tiene una
distribución aproximadamente normal cuando n1 y n2 grandes. Es decir, la
variable aleatoria:
∧ ∧
( p1 − p 2 )
Z=
π 1 (1 − π 1 ) π 2 (1 − π 2 )
+
n1 n2
Suponiendo que Ho sea verdadera.
Zα / 2 0 Zα / 2
ACTIVIDADES
2. El director de cierto colegio muy famoso cree que, en parte debido al estatus
económico de los padres, el porcentaje de los que han terminado
secundaria que asisten a este colegio es mayor que el promedio de la
ciudad. En el período de los cinco años precedentes, el 20% de todos los
que terminaron secundaria de la ciudad entraron a la Universidad, mientras
que en el mismo período, 350 de los 1500 exalumnos de su colegio entraron
a la Universidad. ¿Se justifica que el director diga que el porcentaje de sus
exalumnos que entraron a la Universidad es significativamente mayor que
20%? Pruebe con el nivel de significación del 1%.
6. En una conferencia de prensa, una alta autoridad anuncia que el 90% de los
habitantes adultos de la ciudad de Lima están a favor de cierto proyecto
económico del gobierno. En una muestra aleatoria de 625 adultos se
observó que 540 están a favor del proyecto. Si usted desea rechazar la
hipótesis verdadera no más de una en vez de 100. ¿Concluiría que la
popularidad del proyecto ha sido exagerada por la autoridad?
7. Una gran cadena hotelera está tratando de decidir si convierte más de sus
habitaciones en cuartos para no fumadores. En una muestra aleatoria de
400 huéspedes tomada el año anterior, 166 de éstos pidieron habitaciones
para no fumadores. Este año, 205 huéspedes de una muestra de 380
prefirieron cuarto para no fumadores. ¿Recomendaría usted que la cadena
de hoteles destine más habitaciones a no fumadores? Apoye su
8. Una planta de energía eléctrica operada con carbón está considerando dos
sistemas diferentes para abatir la contaminación del aire. El primer sistema
ha reducido la emisión de contaminantes a niveles aceptables 68% del
tiempo según se determinó de 200 muestras de aire. El segundo sistema,
que es más caro, ha reducido la emisión de contaminantes a niveles
aceptables 76% de las veces, según quedó determinado de 250 muestras
de aire. Si el sistema caro es significativamente más eficiente en la
reducción de contaminantes a niveles aceptables que el otro sistema,
entonces el administrador de la planta deberá instalar el sistema caro. ¿Cuál
sistema será instalado si la administración utiliza un nivel de significancia de
0,02 al tomar la decisión?
10. Una muestra aleatoria de 100 hombres fue tomada de la ciudad de Lima y
se encontró que 60 se mostraron a favor sobre una ley del divorcio. Una
muestra al azar de 100 mujeres escogidas de la misma ciudad reveló que
40 de ellas están a favor de dicha ley. ¿Es igual la proporción de hombres
que de mujeres que favorecen una nueva ley sobre el divorcio? Use un nivel
de significancia de 0,05.
Autoevaluación
1. De un total de 10200 préstamos otorgados por una cooperativa de crédito
en los últimos cinco años, 350 se muestrearon para determinar qué porción
de préstamos se otorgaron a mujeres. Esta muestra indicó que 39% de los
créditos fueron dados a empleadas. Un censo completo de préstamos de
hace cinco años mostraba que el 41% de los prestatarios eran mujeres. A
un nivel de significancia de 0,02, ¿puede concluir que la porción de
préstamos otorgados a mujeres ha cambiado significativamente en los
últimos cinco años?
3. Algunos teóricos financieros cree que los precios diarios del mercado de
valores constituyen un “paseo azaroso con rumbo positivo”. Si esto es
exacto, entonces el promedio industrial Dow Jones debería mostrar una
ganancia en más de 50% de todos los días de actividad financiera. Si el
promedio se incrementó en 101 de 175 días escogidos aleatoriamente,
¿Qué piensa de la teoría sugerida? Use un nivel de significancia de 0,01.
10. Una corredora de bolsa afirma que ella puede predecir, con 85% de certeza,
el ascenso o caída, durante el mes siguiente, de un valor del mercado de
valores. Para probarlo, predice el resultado de 60 valores y acierta en 45 de
sus predicciones. ¿Presentan estos datos evidencia concluyente (con α =
0,04) de que la exactitud de sus predicciones es significativamente menor
que el declarado 85%?
12. Se estima que alrededor del 52% de hogares limeños son suscriptores de la
televisión por cable. Los editores de la revista “Cable y más” estaban
seguros de que sus lectores tenían suscripción por cable en un promedio
más alto que la población en general y querían usar este hecho para
ayudar a vender este espacio de publicidad para los canales de estreno por
cable. Para verificar este parecer, muestrearon a 250 suscriptores de la
revista y encontraron que 146 de ellos tenían suscripción a televisión por
cable. A un nivel de significancia de 2%. ¿los datos de la encuesta apoyan
el parecer de los editores?
Para recordar
En una prueba de hipótesis de proporciones, se debe tener en claro el
análisis porcentual del problema.
SEMANA
9
PRUEBA DE BONDAD DE AJUSTE
TEMAS
OBJETIVOS ESPECÍFICOS
.
CONTENIDOS
• Definición del x²
• Ensayos de significación
• Prueba de bondad de ajuste. Tablas de contingencia
• Correlación de la continuidad. Coeficientes de contingencias
• Prueba de Kolmogorov-Smirnov
ACTIVIDADES
Suceso E1 E2 Es ... Ek
Frecuencia
observada O1 O2 Os ... Ok
Frecuencia
esperada e1 e2 es ... ek
(O1 − e1 )
2
(O2 − e 2 )
2
(Ok − ek )2 K (O − ej )
2
χ = + + ... + =∑
2 j
e1 e2 ek j =1 ej
χ =∑ −n
2 j
j =1 ej
Si χ 2 = 0 las frecuencias observadas y teóricas concuerdan exactamente;
mientras que si χ 2 > 0 , no coinciden exactamente. A valores mayores de χ 2 ,
mayores son las discrepancias entre las frecuencias observadas y esperadas.
La distribución muestral de χ 2 se aproxima muy estrechamente a la distribución
Chi cuadrado
1 1
(ν − 2 ) − χ2
Y = Yo ( χ ) 2 2
e 2
1
− χ2
(ν − 2 )
Y = Yo ( χ ) e 2
ENSAYOS DE SIGNIFICACIÓN
En la práctica, las frecuencias esperadas se calculan de acuerdo con una
hipótesis Ho. Si bajo esta hipótesis el valor calculado de χ 2 dado por
K (O − ej )
2 K (O ) 2
j =1 ej j =1 ej
como χ 02,.95 o χ 02,.99 que son los valores críticos a los niveles de significación de
0,05 y 0,01 respectivamente), se deduce que las frecuencias observadas
difieren significativamente de las esperadas y se rechaza Ho al nivel de
significación correspondiente. En caso contrario, se aceptará o al menos no se
rechazará. Este procedimiento se llama ensayo o prueba de chi cuadrado
de la hipótesis.
Debe advertirse que en aquellas circunstancias en que χ 2 esté muy próximo a
cero debe mirarse con cierto recelo, puesto que es raro que las frecuencias
observadas concuerden demasiado bien con las esperadas. Para examinar
tales situaciones, se puede determinar si el valor calculado de χ 2 es menor que
χ 02, 05 o χ 02,01 en cuyos casos se decide que la concordancia es bastante buena
a los niveles de significación de 0,05 a 0,01 respectivamente. .
j =1 ej
5. Regla de rechazo:
Rechazar Ho si χ 2 > χ α2
en donde a es el nivel de significancia para la prueba, y los grados de
libertad son (k – 1)
TABLAS DE CONTINGENCIA
Las tablas de clasificación doble o tablas h x k, en las que las frecuencias
observadas ocupan h filas y k columnas. Tales tablas se llaman a menudo
tablas de contingencia.
Suceso E1 E2 Es ... Ek
Frecuencia
observada O1 O2 Os ... Ok
Frecuencia
esperada e1 e2 es ... ek
K (O − ej )
2
χ =∑2 j
ej j =1
Las frecuencias esperadas son halladas bajo una determinada hipótesis Ho.
Una hipótesis normalmente supuesta es la de que las dos clasificaciones son
independientes entre sí.
Tablas 2 x 2
n(a1b2 − a 2 b1 ) 2
χ2 =
n1 n2 na nb
I II Totales
A a1 a2 na
B b1 b2 nb
Totales n1 n2 n
Tablas 2 x 3
I II III Totales
A a1 a2 a3 na
B b1 b2 b3 nb
Totales n1 n2 n3 n
COEFICIENTE DE CONTINGENCIA
CORRELACIÓN DE ATRIBUTOS
LA PRUEBA DE KOLMOGOROV-SMIRNOV
La prueba de Kolmogorov-Smirnov, bautizada así en honor de los estadísticos
A. N. Kolmogorov y N. V. Smirnov quienes la desarrollaron, se trata de un
método no paramétrico sencillo para probar si existe una diferencia significativa
entre una distribución de frecuencia observada y otra de frecuencia teórica. La
prueba K-S es, por consiguiente, otra medida de la bondad de ajuste de una
distribución de frecuencia teórica, como lo es la prueba Chi cuadrada. Sin
embargo, la prueba K-S tiene varias ventajas sobre la prueba χ 2 : es una
prueba más poderosa, y es más fácil de utilizar, puesto que no requiere que los
datos se agrupen de alguna manera.
La estadística K-S, Dn, es particularmente útil para juzgar qué tan cerca está la
distribución de frecuencia observada de la distribución de frecuencia esperada,
Ho: Una distribución de Poisson con λ = 8,5 es una buena descripción del
patrón de uso.
H1: Una distribución de Poisson con λ = 8,5 no es una buena descripción del
patrón de uso.
α = 0,01 nivel de significancia para probar estas hipótesis
Una prueba K-S siempre debe ser una prueba de un extremo. Los valores
críticos para Dn se han tabulado y pueden encontrarse en la tabla de Valores
críticos de bondad de ajuste de Kolmogorov-Smirnov. Se busca en la fila de n =
3,754 (el tamaño de muestra) y la columna para un nivel de significancia de
0,01, se encontrará que el valor crítico de Dn debe calcularse usando la
fórmula:
1,63
Dn =
n
1,63
Dn = = 0,0266
3754
El siguiente paso es comparar el valor calculado de Dn con el valor crítico de Dn
que se encuentra en la tabla. Si el valor de la tabla para el nivel de significancia
Frecuencia Frecuencia
Frecuencia
Número Frecuencia Acumulativa Acumulativa Desviación
Acumulativa
ocupado observada Observada Observada absoluta
Observada
relativa esperada
O O O 0,0000 0,0002 0,0002
1 5 5 0,0013 0,0019 0,0006
2 14 19 0,0051 0,0093 0,0042
3 24 43 0,0115 0,0301 0,0186
4 57 100 0,0266 0,0744 0,0478
5 111 211 0,0562 0,1496 0,0934
6 197 408 0,1087 0,2562 0,1475
7 278 686 0,1827 0,3856 0,2029
8 378 1,064 0,2834 0,5231 0,2397
9 418 1,482 0,3948 0,6530 0,2582
10 461 1,943 0,5176 0,7634 0,2458
11 433 2,376 0,6329 0,8487 0,2158
12 413 2,789 0,74*9 0,9091 0,1662
13 358 3,147 0,8383 0,9486 0,1103
14 219 3,366 0,8966 0,9726 0,0760
15 145 3,511 0,9353 0,9862 0,0509
16 109 3,620 0,9643 0,9934 0,0291
17 57 3,677 0,9795 0,9970 0,0175
18 43 3,720 0,9909 0,9987 0,0078
19 16 3,736 0,9952 0,9995 0,0043
20 7 3,743 0,9971 0,9998 0,0027
21 8 3,751 0,9992 0,9999 0,0007
22 3 3,754 1,0000 1,0000 0,0000
ACTIVIDADES
Use α = 0,05 para determinar si estos datos respaldan los que publicó la
empresa.
Industria
Licenciado en Petróleo Química Eléctrica Computación
Administración 30 15 15 40
Ingeniería 30 30 20 20
Tipo de actitud
Tipos de revista Cantidad de anuncios Cantidad de anuncios
con actitudes de culpa con actitudes de
miedo
Noticias y opinión 20 10
Editorial general 15 11
Orientada hacia la 30 19
familia
Comercial o financiera 22 17
Orientada hacia la mujer 16 14
Afroamericana 12 15
Sexo
Más difícil comprar regalo para Hombres Mujeres
Consorte 37 25
Padres 28 31
Hijos 7 19
Hermanos 8 3
Parientes políticos 4 10
Otros parientes 16 12
Resultados de la prueba
51-60 61-70 71-80 81-90 91-100
Frecuencia
30 100 440 500 130
observada
Frecuencia
40 170 500 390 100
esperada
Autoevaluación
1. A continuación, se observa una tabla de contingencias de 3 x 3, con
frecuencias observadas en una muestra de 240. Pruebe la independencia
entre las variables de renglón y de columna usando la prueba x2 con α =
0,05.
Variable de columna
Variable de renglón A B C
P 20 30 20
Q 30 60 25
R 10 15 30
2. Una de las preguntas de una encuesta fue la siguiente: “Durante los últimos
12 meses, en viajes de negocios, ¿qué tipo de boleto de avión compró con
más frecuencia?” Las repuestas obtenidas se ven en la siguiente tabla de
contingencias:
Usando α = 0,05 pruebe la independencia del tipo de vuelo y tipo de boleto.
¿Cuál es su conclusión?
Tipo de vuelo
Producto
Vendedor A B C
Abanto 14 12 4
Marini 21 16 8
Noel 15 5 10
6. Halley Torres y Aarón Delguiudice son críticos de cine que, con frecuencia,
difieren acerca de las mejores películas. En un artículo de una revista
especializada, se mencionan los resultados de 160 películas por parte de
ambos críticos. Cada resultado puede ser Buena, Regular o Mala.
Calificación de Delguiudece
Calificación de Torres Mala Regular Buena
Mala 24 8 13
Regular 8 13 11
Buena 10 9 64
Cantidad de llamadas
que entran durante Frecuencia observada
un intervalo de un minuto
0 15
1 31
2 20
3 15
4 13
5 4
6 2
Total 100
18 20 22 27 22
25 22 27 25 24
26 23 20 24 26
27 25 19 21 25
26 25 31 29 25
25 28 26 28 24
Cantidad de
Día pasajeros
Lunes 13
Martes 16
Miércoles 28
Jueves 17
Viernes 16
13. Los resultados de una Encuesta Anual de satisfacción de trabajo indicó que
el 28% de los gerentes de sistemas de información está muy satisfecho con
su trabajo, el 46% medianamente satisfecho, el 12% no está satisfecho ni
insatisfecho, el 10% está medianamente insatisfecho y el 4% está muy
insatisfecho. Suponga que en una muestra de 500 programadores
obtuvieron los siguientes resultados.
Categoría Cantidad
Muy satisfechos 105
Medianamente satisfechos 235
Ni satisfechos ni insatisfechos 55
Medianamente insatisfechos 90
Muy insatisfechos 15
Región
Clase de empleo Edición oriental Edición occidental
Tiempo completo 1105 31
Tiempo parcial 31 15
Independiente / consultor 229 186
Sin empleo 485 344
Número de 6o
0 1 2 3 4 5
llegadas por día más
Número de días 6 18 30 24 11 2 9
Ingresos en miles
25-30 31-36 37-42 43-48 49-54 55-60 61-66
Frecuencia
9 22 25 30 21 12 6
observada
Frecuencia
6 17 32 35 18 13 4
esperada
Para recordar
Se deben plantear en forma adecuada la hipótesis nula para una mejor
aplicación de la prueba de bondad de ajuste.
SEMANA
10
REGRESIÓN LINEAL SIMPLE
TEMAS
OBJETIVOS ESPECÍFICOS
CONTENIDOS
ACTIVIDADES
n∑ xy − ∑ x∑ y Sx y
b= ó b=
n∑ x 2 − (∑ x )
2
S x2
∧ Sx y ∧
( y - y) = ( x − x)
S x2
Coeficiente de correlación r:
n∑ x y − ∑ x∑ y Sx y
r= ó r=
n∑ x 2 − (∑ x ) n∑ y 2 − (∑ y ) Sx S y
2 2
SC ( y ) − b2 .SC ( x)
S xy = n−2
(∑ x ) 2
(∑ y ) 2
SC(x) = ∑ x2 −
n
SC(y) = ∑ y2 −
n
SP(xy) = ∑ xy −
(∑ x )(∑ y ) b=
SP(xy)
n SC(x)
b 2 .SC(x)
a = y − bx r =
2
SC(y)
ACTIVIDADES
Cigüeñas 27 38 13 24 6 19 15
Bebes 35 46 19 32 15 31 20
Tamaño del 7,8 6,9 6,7 6,0 6,9 5,2 6,3 8,4 7,2 10,1 10,8 7,7
aumento
Número de 64 73 42 49 71 46 32 88 53 84 85 93
ventas
4.1 Desarrolle una ecuación de estimación que mejor describa estos datos.
4.2 Calcule el error estándar de la estimación de esta relación.
Año 1 2 3 4 5 6 7 8 9 10
Extracción 0,25 0,28 0,38 0,45 0,68 0,78 1,20 1,80 2,15 2,98
Embarque 1 2 3 4 5 6 7 8 9 10
Volumen Exp. 82 102 125 132 147 161
865 915 950 980
5 0 0 5 0 5
Precio
12,00 12,50 13,80 15,40 17,50 18,00 20,00
($)
# Pág. 175 240 280 320 380 420 500
Semana 2 3 4 5 6 7
Tiempo de
10 15 16 18 26 30
propaganda
Venta del producto
3000 3320 - 3850 4000 4200
($)
10. Una empresa que fabrica Plantas de zapatillas quiere estudiar la relación
entre las edades (en años) de un tipo de máquinas compradas para la
Años 5.0 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0
No de 453 564 624 679 964 985
-- -- --
Artículos 4 5 8 4 2 5
Autoevaluación
1. Suponga que usted tiene a su cargo el dinero de la municipalidad de San
Marcos (Ancash). Se le dan los siguientes datos de antecedentes sobre el
suministro de dinero y el producto nacional bruto (ambos en millones de
soles):
Suministro de
2,0 2,5 3,2 3,6 3,3 4,0 4,2 4,6 4,8 5,0
dinero
Producto Nacional
5,0 5,5 6,0 7,0 7,2 7,7 8,4 9,0 9,7 10,0
Bruto
Altura del oponente (H) pies 6,0 5,5 5.2 5.1 5,0
Lanzamientos no regresados(L) 12 9 7 7 3
número de veces de
interrupción al 5 10 10 15 15 20 20 25
trabajador
Calificación del trabajador
en la prueba de 58 41 45 27 26 12 16 3
hostilidad-9
Nivel de ruido 4 3 1 2 6 7 2 3
Grado de ansiedad 39 38 16 18 41 45 25 38
Número del 1 2 3 4 5 6 7 8 9 10
vendedor
Calificación (T) 2,6 3,7 2,4 4,5 2,6 5,0 2,8 3,0 4,0 3,4
Unidades 95 140 85 180 100 195 115 136 175 150
vendidas (S)
X (juegos de fútbol) 20 30 10 12 15 25 34
Y (accidentes menores) 6 9 4 5 7 8 9
Gastos generales 191 170 272 155 280 173 234 116 153 178
Unidades 40 42 53 35 56 39 48 30 37 40
Tamaño (KB) 200 269 300 358 450 490 500 550
Tiempo (seg.) 10,9 12,1 14,4 17,8 18,9 19,5 21,8 24,9
Para recordar
Se deben identificar adecuadamente la variable independiente y la variable
dependiente.
SEMANA
11
REGRESIÓN NO LINEAL
TEMAS
• Análisis de Regresión no lineal: Cuadrática
• Análisis de Regresión no lineal: Potencial
• Análisis de Regresión no lineal: Exponencial
• Análisis de Regresión no lineal Logarítmica
OBJETIVOS ESPECÍFICOS
CONTENIDOS
ACTIVIDADES
Regresiones no lineales
En un análisis de regresión cuando los valores de la variable independiente (X)
y la variable dependiente (Y) no se ajustan a una línea de regresión, se podrá
conseguir una relación lineal mediante una transformación de estos valores.
Regresión Potencial
y = Ax B ln y = ln(A) + B.ln(x)
Regresión Exponencial y = Ae Bx ln y = ln(A) + Bx
Regresión Hiperbólica y = 1 /( A + Bx) 1/y = A + Bx
y = A + Bx + Cx
2
Regresión Cuadrática
ACTIVIDADES
X 2 3 5 7 9 11 13 16 21
Y 1 2 5 16 28 38 50 72 90
Años 1 2 3 4 5 6
10,50
Precio ($) 8,200 6,500 ----- 4,500 3,800
0
Tiempo (Horas) 3 4 5 6 7 8
Volumen (u3) 250 350 700 870 1080 1600
Presión
3 4 5 6 7 8
(Kg./cm.2)
Volumen (cm3) 50 60 70 85 98 110
Uso semanal 13 10 20 28 32 17 24 31 40 38
(horas)
Gastos 17,0 22,0 30,0 37,0 47,0 30,5 32,5 39,0 51,5 40,0
anuales de
mantenimie
nto
10. Los datos siguientes muestran las ventas (en millones) de cajas y los
gastos de publicidad (en miles de soles) para siete marcas de gaseosas.
Autoevaluación
3. A continuación, observamos datos sobre el porcentaje de vuelos que llegan
puntuales y la cantidad de quejas por 100 00 pasajeros.
Porcentaje
Aerolínea Quejas
puntual
WAYRA PERÚ 81,8 0,21
L C BUSRE 76,6 0,58
TACA 76,6 0,85
AERO
75,7 0,68
CONDOR
ATSA 73,8 0,74
IBERIA 72,2 0,93
LAN PERÚ 71,2 0,72
STAR PERÚ 70,8 1,22
AERO MÉXICO 68,5 1,25
4.1 Trace el diagrama de dispersión para estos datos, con las tarifas de
negocios como variable independiente.
5 La empresa Vista reúne los datos que muestran qué publicistas obtienen la
mayor difusión durante las horas estelares de TV en 6 canales de televisión.
A continuación, se presentan los datos de la cantidad de familias
espectadoras, en millones, y la cantidad de veces que salió el anuncio al
aire durante la semana del 23 de julio al 10 de agosto.
Vendedor 1 2 3 4 5 6 7 8 9 10
Años de
1 3 4 4 6 8 10 10 11 13
Experiencia
Ventas anuales (S/.
80 97 92 102 103 111 119 123 117 136
miles)
6.1 Trace el diagrama de dispersión para estos datos, con los años de
experiencia como la variable independiente.
6.2 Forme una adecuada ecuación de regresión con la que se puedan
predecir las ventas anuales, dados los años de experiencia.
6.3 Use la ecuación estimada de regresión para predecir las ventas anuales
de un vendedor con 9 años de experiencia.
Clase
75 82 85 87 88 91 92 93 105
de llanta
Capacidad 1 1 1 1 1 1 1 2
853
de carga 047 135 201 235 356 389 433 039
7.1 Trace un diagrama de dispersión para estos datos, con la clase de llanta
como variable independiente.
7.2 Desarrolle una ecuación de regresión que mejor se aproxime a la
realidad de los datos observados.
7.3 Estime la capacidad de carga para una llanta cuya clase es 90.
8 Los datos siguientes muestran los ingresos de los casinos y de sus hoteles,
en miles de soles.
8.1 Trace un diagrama de dispersión para estos datos, con los ingresos en
el hotel como variable independiente.
8.2 Desarrolle una ecuación de regresión que mejor se aproxime a la realidad
de los datos observados.
8.3 Suponga que los ingresos del hotel fueron de s/. 500 millones. ¿Cuál es un
estimado de los ingresos del casino?
8.4 ¿Qué tan confiable es dicha ecuación? Justifique estadísticamente su
respuesta.
Empresa Xi Yi
Wong 72 61
Mc Donald’s 47 16
Hiraoka 51 32
Ebel 57 46
Aceros Arequipa 55 36
10 En el país, las autoridades del gobierno consideran que para que las
deducciones totales sean razonables, es necesario considerar el ingreso
bruto del causante. Las grandes deducciones, que comprenden los pagos a
instituciones de beneficencia y por gastos médicos, son más razonables
para causantes con grandes ingresos brutos ajustados. Si un causante pide
deducciones mayores que el promedio para determinado nivel de ingresos,
aumentan las posibilidades de una auditoría fiscal. A continuación vemos
datos sobre el impuesto bruto ajustado y el promedio o cantidad razonable
de deducciones agrupadas. Los datos están en miles de dólares.
Ingresos Deducciones
brutos ajustadas totales (s/.
ajustados miles)
22 9,6
27 9,6
32 10,1
48 11,1
66 13,5
85 17,7
120 25,5
11 En los siguientes datos, se ven las tasas de ocupación (%) y las tarifas por
noche ($) en las regiones hoteleras más importantes de Estados Unidos.
Valuación de la Cantidad
propiedad vencida
(en miles de soles) (en soles)
18,8 445
24,4 539
20,4 1 212
35,8 2 237
14,8 479
40,4 1 181
49,0 4 187
14,5 409
37,3 1 002
54,7 2 062
Valor de la línea 20 20 40 30 60 40
Cantidad de partes defectuosas 21 19 15 16 14 17
encontradas
Distancia al trabajo 1 3 4 6 8 10 12 14 14 18
Cantidad de días de ausencia 8 5 8 7 6 3 5 2 4 2
Para recordar
Se deben identificar adecuadamente las ecuaciones de regresión no lineal.
SEMANA
12
REGRESIÓN LINEAL MÚLTIPLE
TEMAS
OBJETIVOS ESPECÍFICOS
CONTENIDOS
.
ACTIVIDADES
∑Y = na + b ∑X 1
+ c ∑X 2
∑YX a ∑X
b ∑ X1 + c ∑ X X
2
1
= 1
+ 1 2
∑ Y X = a ∑ X + b ∑ X X +c ∑ X 2
2
2 2 1 2
Para medir esta variación, se debe utilizar de nuevo la medida conocida como
error estándar de la estimación:
∧
Sea el modelo de la forma: Y = a + bX 2 + cX 2
∧
Se =
∑ (Y − Y ) 2
n − k −1
Donde:
. y = valores de muestra -de la variable dependiente
∧
. Y = valores correspondientes estimados a partir de la ecuación de
regresión.
n = número de puntos de dato de la muestra
. k = número de variables independientes
El denominador de esta ecuación indica que, en la regresión múltiple con k
variables independientes, el error estándar tiene n-k - 1 grados de libertad. Esto
es así debido a que los grados de libertad se ven reducidos de su valor n en los
k + 1 constantes numéricas, a, bl, b2, ..., bk, que fueron estimadas de la misma
muestra.
Como fue el caso en la regresión simple, se puede utilizar el error estándar de
la estimación y la distribución t para formar un intervalo de confianza
aproximado alrededor de nuestro valor estimado Y. Si se desea construir un
∧
intervalo de confianza del 95% alrededor de esta estimación de Y con (n-k –
1) grados de libertad. Luego de hallar el valor apropiado de t, se puede calcular
los límites del intervalo de confianza de esta forma:
∧
LSup = Y + tS e Límite superior
∧
LInf = Y − tS e Límite inferior
ACTIVIDADES
X1 18 19 21 22 23 27 29 21 23
X2 6 9 5 7 8 7 5 6 5
Y 60 69 62 65 69 70 71 65 64
X1 8 9 1 2 3 7 9 1 3
X2 6 9 5 7 8 7 5 6 5
Y 6 6,9 6,2 6,5 7,2 7,0 7,1 6,6 6.8
X1 4 8 12 16 20 24 28 32
X2 3 6 14 18 29 37 38 42
Y 24 21 20 15 14 10 7 5
Ajuste a los datos una curva de regresión lineal múltiple y estime P cuando
X1 es 91, X2 es 80 y X3 es 70
Autoevaluación
1. Se desea predecir el número de solicitudes de reembolso de los impuestos
prediales, en una municipalidad, durante los días hábiles del período que va
del 1 de marzo al 15 de abril, de modo que se pueda planearse mejor las
necesidades de personal durante dicho periodo. Se ha hecho la hipótesis de
que varios factores pueden ser útiles en la predicción. Los datos
correspondientes a estos factores y el número de solicitudes de reembolso
de años anteriores son las siguientes:
X1 X2 X3 Y
Índice Población dentro Ingreso promedio Número de
económico de una milla a la para la solicitudes de
redonda de la municipalidad reembolso, del 1 de
oficina marzo al 15 de abril
99 10 188 21 465 2 306
106 8 566 22 228 1 266
100 10 557 27 665 1 422
129 10 219 25 200 1 721
179 9 662 26 300 2 544
Precio de Pies
Dormitorios Baños Antigüedad
venta cuadrados
49,65 8,9 1 1,0 2
67,95 9,5 1 1,0 6
81,15 12,6 2 1,5 11
81,60 12,9 2 1,5 8
91,50 19,0 2 1,0 22
95,25 17,6 1 1,0 17
100,35 20,0 2 1,5 12
104,25 20,6 2 1,5 11
112,65 20,5 1 2,0 9
149,70 25,1 2 2,0 8
160,65 22,7 2 2,0 18
232,50 40,8 3 4,0 12
Año Y X1 X2 X3
Millones de Tasa de Limitación Número de
tons. inflación de construcciones
vendidas importación
1 4,2 3,1 3,10 6,2
999
1 3,1 3,9 5,00 5,1
998
1 4,0 7,5 2,20 5,7
997
1 4,7 10,7 4,50 7,1
996
1 4,3 15,5 4,35 6,5
995
Ventas Ventas
tiempo (miles de tiempo (miles de
dólares) dólares)
1 4 618 7 19746
2 311 8 34215
3 7 119 9 50306
4 4 367 10 65717
5 5 118 11 86434
6 8 887 12 105464
X1 X2 Y
Resultado de la prueba Experiencia en Evaluación del
sobre aptitudes Trabajos anteriores desempeño
74 5 28
87 11 33
69 4 21
93 9 40
81 7 38
97 10 46
11 El Banco de Lima desea abrir nuevas cuentas de cheques para clientes que
emitirán al menos 30 cheques al mes. Para ayudarse en la selección de los
nuevos clientes, el banco ha estudiado la relación existente entre el número
de cheques expedidos, y la edad y el ingreso anual de ocho de sus clientes
actuales. La variable EDAD fue registrada con respecto al año más reciente
y la variable INGRESO anual fue registrada en miles de dólares. Los datos
se presentan a continuación:
Para recordar
Se deben diferencias la variable dependiente de las variables
independientes.
SEMANA
13
CORRELACIÓN
CORRELACIÓN ENTRE DOS VARIABLES
TEMAS
OBJETIVOS ESPECÍFICOS
CONTENIDOS
• Análisis de correlación
• Correlación entre dos variables, dependiente e independiente
• Coeficiente de correlación lineal (fórmula de Pearson)
ACTIVIDADES
n∑ x y − ∑ x∑ y
r=
n∑ x 2 − (∑ x ) n∑ y 2 − (∑ y )
2 2
Sx y
r=
Sx S y
ACTIVIDADES
Tamaño 108,00 4,40 3,50 3,60 39,00 68,40 7,50 5,50 375,00 12,20 4,40
Precio 12,0 4,0 5,0 5,0 13,0 19,0 8,5 5,0 15,0 6,0 12,0
Peso al nacer 3.52 2.95 3.90 4.20 3.85 2.85 3.05 2.95 3.80
Peso de adulto 72.5 85.3 94.2 78.4 65.4 80.4 74.5 60.3 90.5
Semana 2 3 4 5 6 7
Tiempo de propaganda
35 52 62 68 76 80
(minutos/semana)
Venta del producto ( miles $) 30 120 180 100 310 200
.
5. Debido a la demanda de sus publicaciones y del fuerte incremento de la
competencia desleal e informal, la editorial Vinces Vives ha tomado la
decisión de preparar algunos libros de uso popular en la educación primaria.
Teniendo como único parámetro la cantidad de páginas de dicho libro. Se
toma una muestra de siete (07) de ellos, y se anota el precio de venta que
debería tener por la cantidad de páginas que tendría dicho libro. En la
siguiente tabla, se recopilan dichos datos.
Precio
12.00 12.50 13.80 15.40 17.50 18.00 20.00
($)
# Pág. 175 140 280 320 280 360 300
7.1 Use estos datos para deducir una ecuación de regresión con la que se
pueda predecir el costo total para determinado volumen de producción.
7.2 ¿Cuál es el costo variable, o costo adicional, por unidad producida?
7.3 Calcule el coeficiente de determinación. ¿Qué porcentaje de la
variación en el costo total puede explicar el volumen de producción?
7.4 El programa de producción de la empresa indica que el mes próximo
se deben producir 500 unidades. ¿Cuál será el costo total estimado
para esta operación?
Autoevaluación
1. En finanzas, es de interés ver la relación entre Y, devolución promedio de
acciones, y X, la devolución global del mercado. El coeficiente de pendiente
calculado por la regresión lineal es denominada la beta de las acciones por
los analistas de inversiones. Una beta mayor que 1 indica que las acciones
son relativamente sensibles a cambios de mercado, mientras que una beta
menor que 1 indica que las acciones son relativamente insensibles. Para los
datos siguientes, calcule la beta y pruebe si esta es significativamente
menor que1. Use α = 0,05.
Y (%) 10 12 8 15 9 11 8 10 13 11
X (%) 11 15 3 18 10 12 6 7 18 13
Área
(mile
s 1,1 1,5 1,6 1,6 1,4 1,3 1,1 1,7 1,9 1,5 1,3
pies²
)
Valor
(mile
s de 75 95 110 102 95 87 82 115 122 98 90
dólar
es)
Para recordar
El coeficiente de Pearson define el grado de asociación entre la variable
independiente y dependiente
Si el coeficiente de Pearson es pequeño entonces no tendrá sentido
encontrar la ecuación de regresión para predecir valores a futuro.
SEMANA
14
CORRELACIÓN ENTRE DOS VARIABLES
TEMAS
• Coeficiente de correlación generalizado (coeficiente de determinación)
• Coeficiente de correlación de rango (fórmula de Spearman)
OBJETIVOS ESPECÍFICOS
CONTENIDOS
• Coeficiente de Determinación
• Error de estimación
• Pendiente de una recta de población
• Coeficiente de correlación de rango (fórmula de Spearman)
ACTIVIDADES
a ∑ y + b∑ x y − n y 2
r =
2
∑y 2
− ny 2
S 2x y
r = 2 2
2
Sx S y
Se =
n−2
∧ 2
∑
y − y
Se =
n−2
Donde:
y = Es el valor de la variable independiente.
∧
y = Valores estimados de la ecuación de estimación correspondiente.
n = El número de puntos de datos utilizados.
Como se aplica en el error estándar, mientras más grande sea el error estándar
de estimación, mayor será la dispersión de los puntos alrededor de la línea de
regresión.
Se
Sb =
∑x 2
− nx 2
Donde:
Sb = error estándar del coeficiente de regresión
Se = error estándar de estimación
x = valor de la variable independiente
x = la media de los valores de la variable independiente
Puesto que la prueba se basa en una distribución t student con (n-2) grados de
libertad, usamos t para denotar la estadística estandarizada.
6∑ d 2
rs = 1 −
(
n n2 −1 )
rs = coeficiente de correlación de rango
n = número de observaciones apareadas
d = diferencia entre rangos para cada pareja de observaciones
Si el valor del coeficiente de rangos es +1 o -1, significa que existe una asociación
perfecta entre las dos variables.
ACTIVIDADES
2.1 Con estos datos, forme una ecuación de regresión que relacione la
indicación de absorbencia de luz con los miligramos de proteína de la
muestra.
2.2 Calcule r2. ¿Se sentiría cómodo con este modelo de regresión, al estimar la
cantidad de proteína de una muestra?
2.3 En una muestra que se acaba de recibir, la indicación de absorbencia fue
de 0,941. Estime la cantidad de proteína en esa muestra.
X 30 17 35 28 42 25 19 29
Y 35 31 43 46 50 32 33 42
Cantidad de horas 5.0 8.0 2.0 4.0 3.0 7.0 1.0 6.0
extra
Años de empleo 1.0 6.0 4.5 2.0 7.0 8.0 4.5 3.0
Compañía A B C D E F G H I J K
Gastos 60 37 30 20 24 42 39 54 48 58 26
Accidentes 5 7 6 9 7 4 8 2 4 3 8
¿Existe una correlación significativa entre los gastos y los accidentes en las
plantas de las compañías químicas? Use una correlación de rango (en la que 1
represente el mayor gasto y tasa de accidentes) para respaldar su conclusión.
Pruebe al nivel de significancia de 1 %.
Autoevaluación
1. “El granjerito” trató de determinar la relación entre el porcentaje de
metionina que se agrega al alimento y el peso corporal de pollos. Con los
datos obtenidos se aplicó el análisis de regresión y se determinó la siguiente
línea de regresión:
yˆ = 0,21 + 0,42 x
En donde:
ŷ = peso corporal estimado en kilogramos
X = porcentaje de metionina adicional en el alimento
El coeficiente de determinación, r2, fue 78, lo que indica que el ajuste fue
razonablemente bueno para los datos. Suponga que se usó una muestra de
( )
2
∧
tamaño 30 para el estudio, y ∑ y − y = 45 . Calcule ∑ y − y .
2
2. ¿A los directores y principales ejecutivos se les paga de acuerdo con las
ganancias obtenidas por las empresas? La siguiente tabla muestra una lista
de datos corporativos sobre el cambio porcentual en el rendimiento de las
acciones durante un periodo de dos años, y el cambio porcentual en la
paga a los directores y principales ejecutivos, inmediatamente después de 2
años.
3. La revista Etiqueta Negra informó que “la beta” de mercado para Backus es
1,25. Las betas de mercado para acciones individuales se determinan con
regresión lineal simple. Para cada acción, la variable dependiente es el
rendimiento trimestral porcentual (reevaluación del capital más dividendos)
menos el rendimiento porcentual que se podría obtener con una inversión
libre de riesgos (la tasa de Bonos de la Tesorería se usa como tasa libre de
riesgo). La variable independiente es el rendimiento trimestral porcentual
(reevaluación del capital más dividendos) para el mercado de acciones
(S&P 500) menos el rendimiento porcentual de una inversión libre de
riesgos. Con los datos trimestrales se determina una ecuación; la beta de
mercado para la acción es la pendiente de la ecuación estimada de
regresión (b1), y su valor se interpreta con frecuencia, como medida del
riesgo asociado con esas acciones. Las betas del mercado mayores que
uno indican que la acción es más volátil que el promedio del mercado. En la
tabla siguiente se presentan las diferencias entre el rendimiento porcentual y
el rendimiento libre de riesgo de 10 trimestres de las empresas Backus y
Brahama.
Backus 1,2 -2,5 -3,0 2,0 5,0 1,2 3,0 -1,0 0,5 2,5
Brahama -0,7 -2,0 -5,5 4,7 1,8 4,1 2,6 2,0 -1,3 5,5
Años de experiencia 4 3 4 6 7 5 5 2 1 3
Promedio de
3.4 3.2 3.5 2.9 3.4 3.9 3.6 3.0 2.5 3.0
calificaciones
Rango de éxito (10 =
4 2 6 7 9 8 10 3 1 5
tope)
Solicitante 1 2 3 4 5 6 7 8 9 10 11 12 13 1.4
Encuestador 1 1 11 13 2 12 10 3 4 14 5 6 9 7 8
Encuestador 2 4 12 11 2 14 10 1 3 13 8 6 7 9 5
Producción diaria 7.2 5.5 6.2 8.3 5.2 2.0 3.0 0.5 9.0 6.0
Días trabajados
1 2 3 4 5 6 7 8 9 10
conjuntamente
31 93 135
32 85 143
33 91 118
34 94 147
35 94 138
10. Los siguientes son los salarios y datos de edad de los 10 candidatos a
doctorado que se gradúan este año de la Escuela de Doctorado en
Contabilidad de la Universidad Peruana de Ciencias. Al nivel de significancia
de 0.05, ¿la correlación de rango de edad y salario sugiere que los
candidatos de mayor edad obtienen salarios iniciales mayores?
Salario en
Edad
dólares
67,000 29
60,000 25
57,500 30
59,500 35
50,000 27
55,000 31
59,500 32
63,000 38
69,500 28
72,000 34
1 1,000 40
2 1,200 54
3 900 41
4 1,450 60
5 2,000 65
6 1,300 50
7 1,650 42
8 1,700 65
9 500 43
10 2,100 66
Para recordar
El coeficiente de Determinación define el modelo mas confiable para
una acertada predicción
SEMANA
15
SERIE DE TIEMPO
TEMAS
OBJETIVOS ESPECÍFICOS
CONTENIDOS
ACTIVIDADES
SERIES DE TIEMPO
Las ideas anteriores suministran una posible técnica para analizar las series de
tiempo. Se supone que en las series de tiempo la variable Y es un producto de
Y = T x C x S x I = TCSI
Ejemplo 1:
Dados los números 2, 6, 1, 5, 3, 7, 2 un movimiento medio de orden 3 está
dado por la sucesión.
ESTIMACIÓN DE LA TENDENCIA
ACTIVIDADES
Año 1991 1992 1993 1994 1995 1996 1997 1998 19969 2000
Producción
media 50,0 36,5 43,0 44,5 38,9 38,1 32,6 38,7 41,7 41,1
mensual
Producción
Movimiento total de Movimiento medio de
Años media
5 años 5 años
mensual
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
Movimiento
Movimiento total de Movimiento medio
Años medio de 4
2 años de la col. 3 centrado de 4 años
años
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
Movimiento
Movimiento Movimiento
medio
Años Y total de 4 total de 2 años
centrado de 4
años de la col. 3
años
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2.5 Represente el movimiento medio de (2.1) junto con los datos originales.
2.6 Obtenga los valores de tendencia para los datos de la tabla mediante el
método de semimedias donde la media se toma de (2.1)
Año 1991 1992 1993 1994 1995 1996 1997 1998 19969 2000
Valores de
tendencia
2.7 Utilice el método de mínimos cuadrados para ajustar una recta a los
datos de (2.1) y halle los valores de tendencia.
Año 1991 1992 1993 1994 1995 1996 1997 1998 19969 2000
Valores de
tendencia
Años 1 2 3 4 5 6 7 8 9 10
Ventas 400 390 320 340 270 260 300 320 340 370
Año 1 2 3 4 5 6 7 8 9 10
Rendimiento 0.64 0.73 0.94 1.14 1.33 1.53 1.67 1.68 2.10 2.50
4.1 Emplee una proyección de tendencia lineal para pronosticar esta serie de
tiempo en el próximo año.
4.2 ¿Qué nos dice este análisis de tendencia temporal acerca de la
Compañía Metalúrgica?
4.3 De acuerdo con los datos históricos, ¿es bueno invertir en esta empresa?
Autoevaluación
1. Identifique con qué movimiento característico de una serie de tiempo se
podría asociar principalmente cada una de los siguientes supuestos:
1.1 Un retroceso
1.2 Un incremento de empleo durante los meses de verano
1.3 La disminución de mortandad debido al avance de la ciencia
1.4 Una huelga del acero
1.5 Una demanda continuamente creciente de automóviles pequeños
Año 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Consumo
de 656 804 836 765 777 711 755 747 696 677
algodón
4.4 Represente el movimiento medio de los apartados (4.2) y (4.3) junto con
los datos originales y compare los resultados
Ene. Feb Marzo Abril May Jun Jul Ago. Sep Oct Nov Dic
1997 52,6 45,3 56,1 59,8 54,3 58,7 59,9 51,7 47,2 52,8 37,9 38,6
1998 44,6 46,7 53,5 53,7 49,1 50,1 45,7 44,3 30,0 22,2 49,2 66,9
1999 65,5 67,7 79,3 75,4 72,1 64,7 65,7 62,6 46,8 50,2 74,0 69,1
2000 51,0 50,9 58,2 55,9 47,0 44,8 44,0 41,0 20,9 35,1 57,7 61,6
2001 68,0 57,0 58,7 54,7 53,1 49,3 48,7 52,3 31,3 29,1 58,8 55,2
2002 48,4 39,2 35,5 32,5 35,1 34,2 31,4 19,0 10,7 27,2 51,9 60,7
Año 1 2 3 4 5 6 7
Asistencia 28,000 30,000 31,500 30,400 30,500 32,200 30,800
Año 1 2 3 4 5 6 7 8
Costo/unidad
20.50 24.50 28.20 27.50 26.60 30.10 31.40 36.50
($)
7.1 Trace la gráfica de esta serie de tiempo. ¿Parece haber una tendencia
lineal?
7.2 Determine una ecuación del componente de tendencia lineal para la serie
de tiempo.
7.3 ¿Cuál es el aumento anual promedio de costo que ha tenido la empresa?
8.1 Deduzca una ecuación de tendencia lineal para esta serie de tiempo.
8.2 Use la ecuación de la tendencia para estimar el porcentaje de mujeres
gerentes para el 2003 y 2004.
Para recordar
Se deben diferenciar adecuadamente los movimientos de la serie de
tiempo.
SEMANA
16
SERIE DE TIEMPO
TEMAS
• Modelos de estimación
• Métodos de estimación de la tendencia
• Predicción mediante la serie de tiempo
OBJETIVOS ESPECÍFICOS
CONTENIDOS
ACTIVIDADES
SERIE DE TIEMPO
Varios son los métodos que se utilizan para el cálculo del índice estacional:
Método del porcentaje medio. En este método los datos de cada mes se
expresan como porcentajes de la media anual. Los porcentajes de meses que
se corresponden en diferentes años son entonces promediados mediante su
media o mediana. Si se emplea la media, es mejor evitar los valores extremos
que puedan aparecer.
Los 12 porcentajes resultantes dan el índice estacional. Si su media no es 100
% (es decir, si la suma no es 1200 %) deberá ajustarse multiplicando por un
factor adecuado.
Después de que se haya hecho esto, los datos originales para cada mes se
expresan como porcentajes de los correspondientes al movimiento medio
centrado de 12 meses. Los porcentajes para los meses correspondientes son
DESESTACIONALIZACIÓN DE DATOS
Después de que los datos han sido desestacionalizados, pueden también ser
ajustados a su tendencia dividiendo los datos por los correspondientes valores
de tendencia. De acuerdo con la Ecuación TCSI, el proceso de ajuste para la
variación estacional y los valores de tendencia se consiguen al dividir Y por ST,
que da CI, es decir, variaciones cíclicas e irregulares. Un apropiado
movimiento medio de unos pocos meses de duración (por ejemplo, 3, 5 ó 7
meses, de modo que no es necesaria la sucesión centrada) posteriormente
sirve para suavizar las variaciones irregulares (I) y deja solamente las
variaciones cíclicas. Una vez que éstas han sido aisladas, pueden ser
estudiadas con detalle. Si aparece una periodicidad (o periodicidad
aproximada) de ciclos, pueden construirse unos índices cíclicos análogamente
a como se obtuvieron los índices estacionales.
COMPARACIÓN DE DATOS
Se debe tener siempre cuidado al comparar datos y que tal comparación esté
correctamente justificada. Por ejemplo, al comparar los datos de marzo con los
de febrero, se debe tener en cuenta que marzo tiene 31 días, mientras que
febrero tiene 28 ó 29. Análogamente, al comparar los meses de febrero para
diferentes años, se debe tener presente que en años bisiestos febrero tiene 29
días en lugar de 28. El número de días laborables durante varios meses del
mismo o años diferentes, puede también diferir debido a fiestas, huelgas, paros
temporales, etc.
PREDICCIÓN
7. Combinando los resultados de los pasos 1-6 y con cualquier otro tipo de
información útil, hacer una predicción (si se desea) y si es posible discutir
las fuentes de error y su magnitud
ACTIVIDADES
Ene Feb Mar Abril May Jun Jul Ago Sep Oct Nov Dic
1991 318 281 278 250 231 216 223 245 269 302 325 347
1992 342 309 299 268 249 236 242 262 288 321 342 364
1993 367 328 320 287 269 251 259 284 309 345 367 394
1994 392 349 342 311 290 273 282 305 328 364 389 417
1995 420 378 370 334 314 296 305 330 356 396 422 452
1996 453 412 398 362 341 322 335 359 392 427 454 483
1997 487 440 429 393 370 347 357 388 415 457 491 516
1998 529 477 463 423 398 380 389 419 448 493 526 560
Ene Feb Mar Abril May Jun Jul Ago Sep Oct Nov Dic
1991
1992
1993
1994
1995
1996
1997
1998
Total
Media
Ene Feb Mar Abril May Jun Jul Ago Sep Oct Nov Dic
1991
1992
1993
1994
1995
1996
1997
1998
Total
Media
Ene Feb Mar Abril May Jun Jul Ago Sep Oct Nov Dic
1991
1992
1993
1994
1995
1996
1997
1998
Autoevaluación
1. En la siguiente tabla se da el consumo medio mensual, en millares de
fanegas de algodón nacional y de importación en Estados Unidos durante los
años 1990-1999.
Año 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Consumo
de 656 804 836 765 777 711 755 747 696 677
algodón
1.1 Obtenga los valores de tendencia para los datos mediante el método de
semimedias, donde la media se toma como
(a) la media aritmética
(b) la mediana
Construir un gráfico con los resultados obtenidos
1.2 Obtenga los valores de tendencia para los datos mediante
(a) el método libre
(b) un movimiento medio de orden adecuado
Comparar con los resultados
1.3 Emplee el método de mínimos cuadrados para ajustar una recta a los
datos de la tabla
Ene Feb Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1996 85,6 80.9 92,2 101,8 132,6 141,2 130,5 119,0 93,6 86,6 68,4 70,4
1997 78,7 78,8 91,5 102,5 135,0 128,0 117,7 105,7 92,1 87,7 75,9 94,6
1998 103,9 101,9 121,4 133,5 156,0 154,0 135,6 118,7 95,0 91,6 91,3 109,0
1999 118,7 116,6 143,3 142,0 164,5 160,9 129,7 109,4 92,6 87,8 86,8 97,0
2000 108,1 104,3 121,1 129,4 157,9 151,9 123,0 102,1 91,9 94,7 92,7 105,8
2001 114,6 114,1 129,6 135,4 151,9 149,0 127,6 109,8 92,4 93,1 92,3 103,4
2002 115,3 110,3 124,6 132,3 159,3 148,1 125,8 106,9 90,1 100,3 94,1 105,7
2003 118,6 113,4 129,5 130,3 150.6 144,7 126,9 97,7 8607 91,9 90,0 107,2
Ene Feb Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1996 12,63 11,72 13,43 12,53 13,29 13,27 12,36 13,27 13,10 13,86 13,39 15,38
1997 11,84 11,74 12,74 13,40 14,85 13,81 13,40 13,45 13,62 14,82 14,01 16,91
1998 13,05 12,33 13,96 14,17 14,66 14,58 14,38 14,18 14,08 14,95 13,96 16,44
1999 12,34 12,06 13,54 14,32 14,25 14,66 14)39 13,90 14,14 14,66 14,53 17,87
2000 13,15 12,64 14,57 15,49 15,33 15,60 15,26 15,48 15,76 15,68 15,75 19,12
2001 13,73 13,55 15,72 14,89 16,11 16,58 15,38 16,19 15,58 16,13 16,49 19,38
2002 14,74 14,06 15,79 16,44 17,20 17,11 16,86 17,49 16,37 16,95 17,13 19,84
2003 15,29 13,78 15,55 16,27 17,36 16,60 16,60 17,00 16,33 17,36 17,04 21,17
Ene. Feb. Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1998 3661 2834 2999 3152 3977 3295 3807 3307 3312 4317 3139 2700
1999 3562 2911 2868 2912 3678 2606 2969 3149 3364 4156 3139 2672
2000 3351 2730 2801 2957 3883 3204 3758 3229 3153 4024 2797 2413
2001 2967 2462 2412 2445 3345 2730 3251 2708 2711 3629 2685 2518
2002 2505 2556 3256 2757 3754 3052 3015 3883 3148 3282 3758 2669
2003 2713 2751 3517 2971 3835 3143 2397 3700 3155 3284 3740 2641
2004 2565 2616 3446 2696 3558 2959 2708 3737 2849 2920 3223 2221
2005 2164 2108 2702 2105 2729 2489 2138 3146 2570 2733 2462 2188
Ene Feb Mar Abril May Jun Jul Ago Sep Oct Nov Dic
1991 316 285 288 253 225 225 223 235 269 302 323 352
1992 338 312 305 274 244 246 242 252 285 321 342 364
1993 363 321 315 294 259 261 259 274 309 345 367 394
1994 389 353 352 320 260 283 282 308 325 364 389 421
1995 425 383 378 324 315 296 305 330 356 396 422 452
1996 454 417 402 356 351 332 335 358 392 427 454 492
1997 488 446 412 398 387 357 357 388 415 457 491 521
1998 519 487 457 425 402 390 389 419 448 493 526 568
Ene. Feb. Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1996 84,6 87.9 98,2 107,8 132,7 144,2 132,5 120,6 98,6 90,6 78,4 90,4
1997 77,7 76,8 99,5 108,5 135,8 128,0 117,7 105,7 92,1 87,7 75,9 98,6
1998 100,9 105,9 120,4 138,5 156,7 154,0 135,6 118,7 95,0 91,6 91,3 107,0
1999 115,7 120,6 148,3 146,0 164,5 160,9 129,7 109,4 92,6 87,8 86,8 99,0
2000 104,1 115,3 134,1 132,4 157,5 151,9 123,0 102,1 91,9 94,7 92,7 109,8
2001 117,6 118,1 134,6 138,4 151,3 149,0 127,6 109,8 92,4 93,1 92,3 106,4
2002 118,3 119,3 144,6 139,3 159,2 148,1 125,8 106,9 90,1 100,3 94,1 108,7
2003 113,6 115,4 139,5 140,3 150,8 144,7 126,9 97,7 8607 91,9 90,0 109,2
Año 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Media
67.4 81.3 82.5 74.8 79.7 74.3 77.5 73.7 69.6 69.7
Mensual
Ene Feb Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1996 85,6 80.9 92,2 101,8 132,6 141,2 130,5 119,0 93,6 86,6 68,4 70,4
1997 78,7 78,8 91,5 102,5 135,0 128,0 117,7 105,7 92,1 87,7 75,9 94,6
1998 103,9 101,9 121,4 133,5 156,0 154,0 135,6 118,7 95,0 91,6 91,3 109,0
1999 118,7 116,6 143,3 142,0 164,5 160,9 129,7 109,4 92,6 87,8 86,8 97,0
2000 108,1 104,3 121,1 129,4 157,9 151,9 123,0 102,1 91,9 94,7 92,7 105,8
2001 114,6 114,1 129,6 135,4 151,9 149,0 127,6 109,8 92,4 93,1 92,3 103,4
2002 115,3 110,3 124,6 132,3 159,3 148,1 125,8 106,9 90,1 100,3 94,1 105,7
2003 118,6 113,4 129,5 130,3 150.6 144,7 126,9 97,7 8607 91,9 90,0 107,2
Ene Feb Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
116,3 108,2 121,4 126,8 143,4 135,6 112,5 90,9 82,6 92,1 91,2 108,0
Ene Feb Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
1998 3661 2834 2999 3152 3977 3295 3807 3307 3312 4317 3139 2700
1999 3562 2911 2868 2912 3678 2606 2969 3149 3364 4156 3139 2672
2000 3351 2730 2801 2957 3883 3204 3758 3229 3153 4024 2797 2413
2001 2967 2462 2412 2445 3345 2730 3251 2708 2711 3629 2685 2518
2002 2505 2556 3256 2757 3754 3052 3015 3883 3148 3282 3758 2669
2003 2713 2751 3517 2971 3835 3143 2397 3700 3155 3284 3740 2641
2004 2565 2616 3446 2696 3558 2959 2708 3737 2849 2920 3223 2221
2005 2164 2108 2702 2105 2729 2489 2138 3146 2570 2733 2462 2188
Ene. Feb. Mar Abril Mayo Jun Jul Ago. Sep Oct Nov Dic
2742 2291 2398 2489 3419 2813 2249 2712 2190 2908 2403 2376
12. Identifique los índices estaciónales mensuales de los tres años de gastos
para un edificio de departamentos en Surco, de acuerdo con la siguiente
tabla. Emplee un cálculo de promedios móviles de 12 meses.
Gastos
Mes Año 1 Año 2 Año 3
Enero 170 180 195
Febrero 180 205 210
Marzo 205 215 230
Abril 230 245 280
Mayo 240 265 290
Junio 315 330 390
Julio 360 400 420
Agosto 290 335 330
Septiembre 240 260 290
Octubre 240 270 295
Noviembre 230 255 280
Diciembre 195 220 250
15 de julio 25 28 35 50 60 60 40 35 30 25 25 20
16 de julio 28 30 35 60 65 50 50 40 35 25 20 20
17 de julio 35 42 45 72 75 60 60 45 40 25 25 25
13.1 Identifique los índices estacionales por hora para las 12 indicaciones
de cada día.
13.2 Con los índices estaciónales determinados en el inciso a, se eliminó el
efecto estacional la ecuación de tendencia para los datos
desestacionalizada fue T=32.983 + 3922 t. Use sólo el componente de
tendencia para determinar pronósticos para las 12 horas del 18 de julio.
Año
1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002
%
55 38 54 37 52 40 53 36 50 37 55
Movimientos
Para recordar
Se deben tener en claro los pasos fundamentales de la serie de tiempo.