Documentos de Académico
Documentos de Profesional
Documentos de Cultura
6 Estadstica II PDF
6 Estadstica II PDF
Director
HONORIO MIGUEL HENRIQUEZ PINEDO
Subdirector acadmico
CARLOS ROBERTO CUBIDES OLARTE
Decano de pregrado
JAIME ANTONIO QUICENO GUERRERO
2
INDICE DE CONTENIDOS
3
6.1 Intervalos de confianza.
6.2 Estimacin para la media poblacional. Muestras grandes.
6.3 Estimacin para la media poblacional. Muestras pequeas.
6.4 Estimacin de una proporcin de poblacional. Muestras grandes.
6.5 Estimacin de una proporcin de la poblacin Muestras pequeas.
6.6 Anlisis de sensibilidad en Excel para la estimacin del intervalo.
4
DE LOS NUCLEOS TEMTICOS Y PROBLEMTICOS
Espacio
Problemtica
Tiempo y Pblica
Territorio
ADMINISTRACIN
PBLICA
Gestin del TERRITORIAL Problemtica
Desarrollo del Estado y
del Poder
Economa de Organizaciones
lo Pblico Pblicas
Formacin
General
Cada uno de los siete ncleos temticos que componen el programa tiene una
valoracin relativa en nmero de crditos y, en consecuencia, vara tambin en
el nmero de asignaturas que lo conjugan. El primer momento en cualquier
proceso de formacin ha de establecer las particularidades del programa, de
ah que sea necesario dar a conocer los ncleos temticos con su respectiva
valoracin en nmero de crditos: Problemtica pblica, once (11) crditos;
Problemtica del estado y del poder, 23 crditos; Organizaciones pblicas, 24
crditos; Espaciotiempo y territorio, 22 crditos; Gestin del desarrollo, 16
crditos; Economa de lo pblico, 18 crditos; y Formacin general, 21 crditos.
5
EL TRABAJO DEL TUTOR
6
E
STADSTICA II
7
INTRODUCCION:
En el mdulo anterior de estadstica se vieron los conceptos y herramientas
para recopilar datos, procesarlos, analizarlos y analizar los resultados.
Generalmente estos datos corresponden a hechos cumplidos, pero a partir de
ellos se debe mirar los que vendra hacia el futuro con el comportamiento de
las mismas variables. Las organizaciones pblicas y privadas toman decisiones
permanentemente basndose en los resultados histricos; pero los resultados
se vern en el futuro por lo que la toma de decisiones se vuelve incierta y llena
de incertidumbre.
En este mdulo ordenaremos nuestro conocimiento para darle valores a la
posibilidad que ocurran esos hechos futuros y con otras herramientas
estadsticas le daremos valor a la incertidumbre y la certeza que ocurran esos
eventos.
La probabilidad y otros parmetros de medicin hacia el futuro son elementos
fundamentales en los ejecutivos privados y funcionarios pblicos que tienen su
hombro la responsabilidad de planear, dirigir y programar la ejecucin de las
actividades de su entorno, en beneficio de una sociedad, familia o empresa.
Objetivos
Formar el participante en la utilizacin de medias que analizan hacia el futuro
los resultados de hechos. El asistente adquirir los conceptos y herramientas
que le permitirn ser un usuario casi permanente de las probabilidades, el
muestreo, las estimaciones, las pruebas de hiptesis, los modelos de
regresin lineal o lineal.
Objetivos especficos.
Conceptualizar los principios tericos bsicos de la inferencia estadstica.
Aplicar las fases metodolgicas de una investigacin por muestreo.
Estimar promedios poblacionales, totales, proporciones y varianzas
Determinar tamaos de muestra.
Revisar la fundamentacin de los procedimientos de prueba de hiptesis.
Estudiar la correlacin de Pearson entre parejas de variables.
Estudiar la fundamentacin de los modelos de regresin como tcnica de
anlisis economtrico.
Analizar el comportamiento de series cronolgicas econmicas y sociales.
Proyectar variables econmicas utilizando los modelos de regresin lineal y
no lineal.
8
Inferir comportamiento de poblaciones (datos reales de un problema) a partir de
muestras aleatorias.
Identificar la distribucin de probabilidades, en las situaciones que se viven a
diario en las empresas.
Utilizar correctamente un software estadstico, e interpretar acertadamente los
resultados para la toma de decisin ante una situacin real del mercadeo y la
logstica.
Mapa conceptual.
Metodologa.
Evaluacin
9
UNIDAD 1. ESTADSTICA DESCRIPTIVA.
10
objetos, como las llantas producidas durante una semana en una fbrica, o
todas las truchas que habitan en una presa. Una poblacin tambin puede
estar formada por un grupo de medidas, como podran ser los salarios de los
empleados, o las estaturas de los alumnos de un curso.
Simbologa Bsica:
ni Frecuencia absoluta
hi Frecuencia relativa
Ni Frecuencia absoluta acumulada
Hi Frecuencia relativa acumulada
Ejemplo 1
11
Ejemplo 2
12
Fuente: archivo Frecuencias.xls; hoja: Ejemplo 1
13
1.4 Medidas de dispersin en Excel.
VARIANZA POBLACIONAL = n = ;n =
2 2
; =
i i i
n n n n
(X X) (X X ) * ni
2 2
n 1 n 1
Ejemplo 5:
14
Fuente: Archivo: Medidas de posicin y dispersion.xls; Hoja: ejemplo 4
15
UNIDAD 2. TEORA DE PROBABILIDADES.
Los encargados de tomar decisiones no saben con certeza lo que puede ocurrir
en un futuro cercano o lejano. Sin embargo la decisin la tiene que tomar. Por
ejemplo un fabricante ha desarrollado un nuevo producto basado en la
determinacin de las necesidades del mercado. Se desea saber si el mercado
comprar o no el producto. Una forma de minimizar el riesgo de tomar una
decisin incorrecta sera contratar a una empresa de encuestas para que tome
una muestra de 100 o 1200 o 2000 elementos de la poblacin y preguntarle a
cada persona cmo reaccionara ante el nuevo producto. Otro ejemplo podra
darse cuando el director de un departamento de Planeacin de una entidad
oficial no sabe cunto presupuestar para la reparacin de vas. Debe tomar
datos de las reparaciones anteriores y predecir aproximadamente el valor a
presupuestar.
Ejemplo:
Experimento Aleatorio Posibles resultados Espacio Muestral
Jugar un partido de Ganar, empatar, S= {ganar, empatar,
futbol perder perder}
16
Lanzar un Dado 1, 2, 3, 4, 5, 6 S= {1, 2, 3, 4, 5, 6}
Lanzar una moneda Cara, Sello S= {cara, sello}
17
Eventos disjuntos o excluyentes Eventos no disjuntos
Complemento.
A se conoce como el complemento de un evento, donde el
complemento donde A = {x / x A}
Interseccin
A B= A B
Unin de eventos.
AUB AUB
18
2.5.1 Se denomina permutacin a las diferentes ordenaciones que se
pueden hacer con un conjunto de eventos. (a1, a2, a3, , an). El nmero de
permutaciones que se pueden hace con n elementos es n!, donde
n ! = 1 x 2 x 3 x . x n
El nmero de permutaciones de r elementos que se pueden tomar de un
conjunto de n elementos es
n!
n Pr = n x (n - 1) x (n - 2) x......x (n - r + 1) =
(n - r )!
Ejemplo. Una junta est compuesta por 5 vocales de los cuales se debe elegir
el presidente, el secretario y el fiscal. El nmero de forma como se puede
formar esa junta es
5! 120
5P3 = 5 x 4 x 3 = 60 = = = 60
(5 3) ! 2
En Excel =PERMUTACIONES(5;3)
n n!
= n Cr =
r (n r )!*r !
Ejemplo. De junta compuesta por 10 miembros se va a sacar la comisin de
empalme compuesta por 4 personas. De cuntas formas se puede sacar esa
comisin?
n n!
= n Cr =
r (n r )!*r !
19
10 10!
=10 C 4 = = 5040
4 (10 4)!*4!
En Excel =PERMUTACIONES(10;4)
20
UNIDAD 3. DISTRIBUCIONES DE PROBABILIDAD EN EXCEL
Segn el tipo de valor que toma la variable discretas, reales y continuas. Las
variables discretas son aquellas cuyos valores son nmeros enteros. Las
variables reales son las que toman valores decimales. La variables continuas
son las que toman valores en un intervalo.
21
En ella observamos que esas considerados todos los posibles valores de la
variable y que las suma de estas probabilidad es 1.
i =1 i =1
= E ( X ) = P( X i ) * X i ; con P( X ) = 1
i
m m
22
3.2.2 Varianza esperada
m
Ejemplo. Varianza para el lanzamiento de las monedas
La variable binomial es una variable aleatoria discreta, slo puede tomar los
valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas. Como
hay que considerar todas las maneras posibles de obtener x-xitos y (n-x)
fracasos debemos calcular stas por combinaciones (nmero combinatorio n
sobre x).
23
La funcin de probabilidad binomial est dada por
n
P ( X = x) = p x + q n x ; con x = 1,2,3,.....
x
Ejemplo:
En una universidad el 20% de los alumnos son empleados oficiales. Se
selecciona una muestra de 20 alumnos. Cul es la probabilidad que en la
muestra haya 0, 1, 2, 3, etc., empleados oficiales.
24
Repita el ejercicio con una probabilidad de p = 0.5
25
Repetir el ejercicio suponiendo que el nmero de empleados oficiales es 20 y
no oficiales, es 20
26
3.3.3 Distribucin de Poisson
La llamada distribucin de probabilidad de Poisson describe la cantidad de
veces que ocurre un evento en un intervalo de tiempo determinado o de
espacio o de volumen. El valor de la probabilidad est dada por la siguiente
funcin.
e - * x
P(X = x) = ; para x = 0,1,2,3,.........
x!
12 15 10 12 15 18 15 12
11 15 16 14 13 16 17 13
14 18 12 14 16 15 14 12
27
Con estos datos se pueden resolver preguntas como: Cul es la probabilidad
que en un intervalo de 15 minutos lleguen exactamente 10 clientes?
e -14.125 *14.12510
P(X = 10) = = 0.06393107
10!
En Excel =POISSON(10;14.125;0)
28
3.4 Taller en Excel.
29
UNIDAD 4. DISTRIBUCIN DE PROBABILIDAD NORMAL
30
Para entender el comportamiento de la distribucin normal, tomemos la
siguiente distribucin de Probabilidad.
x ( x )2
1
P ( X x) = e 2 2
dx
2
31
Donde es la media y es la desviacin estndar y 2 es la varianza.
Xi X
=Z Es el nmero de dispersiones de la
variable medida en desviaciones estndar. Esta medida se conoce como Z y el
procedimiento se le conoce como estandarizacin.
Tabla N 1
32
Tabla N 2
Tabla N 3
4 3.5
X = 3.5; = 1.1 X i = 4; Z = = 0.45
1.1
33
Cul es la probabilidad que en un da se vendan 2.8 o menos millones de
pesos?
2.8 3.5
X = 3.5; = 1.1 X i = 2.8; Z = = 0.67
1.1
3.8 3.5
X = 3.5; = 1.1 X i = 3.8; Z = = 0.27
1.1
34
P(Xi3.8)=1-P(X3.8) = P(Z 0.27) =1P(Z < 0.27) = 0.6064199 = 0.3935801
3.0 3.5
X = 3.5; = 1.1 X i = 30; Z = = 0.45
1.1
4.0 3.5
X = 3.5; = 1.1 X i = 4; Z = = 0.45
1.1
=DISTR.NORM(4;3.5;1.1;1) = 0.675281858
=DISTR.NORM(3.5;3.5;1.1;1) = 0.262269718
35
36
UNIDAD 5. MUESTREO Y DISTRIBUCIONES MUESTRALES.
5.1 Muestreo
El anlisis de la informacin que resultan de los procesos de las organizaciones
es importante para la toma de decisiones y controlar la gestin.
Cuando se aplica esta tcnica se est expuesto a que los valores de la muestra
no correspondan con los parmetros de poblacin, es decir se est expuesto a
lo que se conoce como el error del muestreo. Con la muestra adecuada SE
trata de conocer los rasgos de la los parmetros poblacionales.
37
o Muestreo aleatorio sistemtico
o Muestreo aleatorio estratificado
o Muestreo aleatorio por conglomerados
38
Una muestra de conglomerados, usualmente produce un mayor error muestral
que una muestra aleatoria simple del mismo tamao. En una localidad pueden
vivir gente pobre como tambin pueden vivir puede vivir gente acomodada.
Como ejemplo podemos suponer que una poblacin est compuesta por cinco
elementos cuyos valores son S = {1,2,3,4,5}.
39
Se observa que la media Poblacional () es igual a la media de todas la media
de tamao 2 ( ( X = 3.0) = 3.0).
No ocurre lo mismo con la varianza, pues la varianza poblacional es 2.0; 2 =
2.0, mientras que la varianza de las medias muestrales es 1.0
2 2
2 = = =1
X
n 2
2
Si 2 = entonces = ,
X
n n
donde L es el error es tan dar del muestreo para poblaciones inf initas.
n
40
Se observa que la media muestral es igual a la media poblacional X =
Pero la relacin entre la varianza de las medias muestrales y la varianza
poblacional es
2 N-n N-n
X2 = * ; donde ; se le conoce como factor de correcin para poblacin finita
n N -1 N -1
41
El mismo procedimiento se puede aplicar la misma poblacin pero tomando
muestras de tamao 3.
42
la distribucin original de la cual se toma la muestra. En otras palabras, el
teorema de lmite central es cierto para todas las distribuciones.
43
Ahora trataremos de resolver a pregunta Cul es el nmero adecuado de
elemento que se debe analizar u menor error?
Z12 / 2 * 2
n=
E2 Donde Z es el nivel de confianza y E es el error estndar
permitido.
44
Tamao de la muestra para estimar la media poblacional para poblaciones
finitas est dada por
N 2 * Z12 / 2 * 2
n= 2
E *( N 1) + Z12 / 2 * 2 Donde Z es el nivel de confianza y E es el error
Z12 / 2 * P * Q
n=
2 Donde Z es el nivel de confianza, P es la probabilidad de
N 2 * Z12 / 2 * P * Q
n= 2
*( N 1) + Z12 / 2 * P * Q Donde Z es el nivel de confianza, P es la
Ejemplo 1. Encuestas pasadas indican que los clientes de una empresa pedan
en promedio 2500 unidades con una desviacin de 600 unidades. Para
actualizar la opinin de los clientes hacia la empresa se va a aplicar una
encuesta a una parte de los elementos de la poblacin. De qu tamao debe
ser la muestra si se quiere un nivel de confianza del 90% y un error de 100.
1.642 * 6002
n= = 96.82; Se deben aplicar 97 encuestas.
1002
45
que realice una encuesta que tenga un nivel de confianza del 0.95 y un error
del 5%. De qu tamao deber de ser la muestra?
46
Unidad 6. Estimacin por intervalo.
47
El intervalo de confianza Es el conjunto de valores obtenido a partir de los
datos muestrales en el que hay una determinada probabilidad de que se
encuentre el parmetro poblacional. Esta probabilidad se le conoce como el
nivel de confianza.
Por ejemplo, en una encuesta se encontr que en una determinada regin el
ingreso mensual promedio de los trabajadores de la construccin es 2.5 SMLM.
Un intervalo podr ser que el salario promedio global este entre 2 y 3 SMLM. Y
cul es la seguridad que eso sea as? Se podr indicar que se tiene una
seguridad del 90% que eso es as.
En la distribucin normal P(-1.96 < z < 1.96) = 0.95, lo que indica que si una
variable tiene distribucin normal N(; ), entonces el 95% de las muestras
X
cumplen que 1.96 1.96 , donde X = , error estndar del
X n
muestreo
Despejando se tiene que X 1.96 * X + 1.96 * con una probabilidad
n n
de 1-
48
6.2 Estimacin para la media poblacional. Muestras grandes.
Cuando el tamao de la muestra es grande o la variable tiene distribucin
normal, el intervalo de confianza est dado por
X Z / 2 * X + Z / 2 *
n n
P X Z / 2 * X + Z / 2 * = 1
n n
5 5
P 14.6 1.28 * 14.6 + 1.28 * = 0.80
1600 1600
49
6.3 Estimacin para la media poblacional. Muestras pequeas.
Cuando el nmero de observaciones es menor de 30, la estimacin del
intervalo se basa en las suposiciones que si la poblacin es normal o que si se
conoce ls desviacin estndar de la poblacin.
X Z / 2 * X + Z / 2 *
n n
50
Para la estimacin del intervalo de confianza, el valor de t depende de los
grados de libertad, n-1, (fila) y del nivel de confianza.
s s s s
X t* X +t* ; P X t * X +t* = 1
n n n n
51
para la media poblacional.
En ese caso
n = 10; X = 2.5; s = 0.8 horas;1 = 0.95, por lo tan to; t 9;0.95 = 2.262
0 .8 0. 8
P 2.5 2.262 * 2.5 + 2.262 * = 0.95
10 10
P[1.92775 3.0722] = 0.95
Se estima que la poblacin debe ver en promedio entre 1.93 horas y 3.07 horas
de televisin al da, con un nivel de confianza del 95%
p * (1 p ) p * (1 p ) p * (1 p ) p * (1 p )
pZ* p+Z* ; P p Z * X +Z* = 1
n n n n
nmero de xitos
Recuerde que p =
n
Ejemplo. La cadena de televisin TVK est considerando la posibilidad de
sustituir una de sus series policiales por una serie de comedia con orientacin
familiar. Antes de tomar una decisin, los directores de la red toman una
muestra de 400 televidentes. Despus de ver la nueva serie, 250 indican que s
la veran y sugieren que reemplace a la serie policaca. Estime el valor de la
proporcin poblacional con un nivel de 99%
n = 400; X = 250; p = 400/250 = 0.625; q = 1-0.625 = 0.375; 1- = 0.99; Z
0.995 = 2.58
52
Entre el 60.08% y el 64.92% de los televidentes aceptna el cambio de
programa
p * (1 p ) p * (1 p ) p * (1 p ) p * (1 p )
p t* p+t* ; P p t * p+t* = 1
n n n n
0 .8 * 0 .2 0 .8 * 0 .2
P 0.80 2.0639 * 0.80 + 2.0639 * = 0.95
25 25
53
6.7 Anlisis de sensibilidad en Excel para la estimacin del intervalo.
54
UNIDAD 7. PRUEBA DE HIPTESIS
En caso que no se logre tomar como vlida la hiptesis nula se debe tener una
afirmacin alterna que se debe dar como vlidas y conocida cono la hiptesis
alterna que se denota como H1
55
H0 : 48 H1 : < 48
Luego de tener H0 y H1 se procede a tomar una muestra aleatoria de bateras y
medir su vida media.
Para probar si la hiptesis nula es cierta, se toma una muestra aleatoria y se
calcula la informacin, como el promedio, la proporcin, etc. Esta informacin
muestral se llama estadstica de prueba.
56
7.4 Prueba de Hiptesis Unilaterales y Bilaterales sobre la Media
Debido a que los dos errores anteriores a la vez son imposibles de controlar,
vamos a fijarnos solamente en el nivel de significacin, este es el que nos
interesa ya que la hiptesis alternativa que estamos interesados en probar y no
queremos aceptarla si en realidad no es cierta, es decir, si aceptamos la
hiptesis alternativa queremos equivocarnos con un margen de error muy
pequeo.
Ejemplos Para H1: > valor aceptado, la regin de rechazo est dada
por:
/2 /2
57
(2-colas, Z* t*)
.05/2 .05/2
.02
De la tabla de la distribucin
.05/2=0.025 .05/2=0.025 normal, la
P(Z<z) =.025 corresponde a un
valor Z= -1.96. Por simetra la
-1.96 1.96
Solucin:
a. Del ejemplo 1(a), = .05, y = 14, tenemos:
58
De la tabla de la distribucin t, la
.05/2=0.025 .05/2=0.025 P(T<t) =.025 corresponde a un
valor t= -2.086. Por simetra la
P(T>t)=.025 corresponde a t=
-2.086 2.086
d. H0 : p .6 e. H0 : 4
H1 : p < .6 H1 : < 4
EJERCICIOS
En los ejercicios (1-6) determine si la regin de rechazo para la hiptesis nula
est en la cola izquierda, en la cola derecha, o ambas colas. Para el nivel de
significancia dibuje la regin de rechazo.
1. H0 : 11; H1 : > 11 2. H0 : 5.8; H1 : < 5.8
3. H0 : p = 0.4; H1 : p 0.4 4. H0 : = 110; H1 : 110
5. H0 : p 0.3; H1 : p < 0.3 6. H0 : p 0.8; H1 : p < 0.8
8. a) z, si = .01 b) t, si = .05 y = 13
9. a) z, si = .02 b) t, si = .01 y = 5
59
10. a) z, si = .025 b) t, si = .01 y = 9
60
7.4.2 Muestras Pequeas
61
As: conocemos que x N u , de lo que deducimos que
n
xu
N [0,1] de forma que la hiptesis nula es: H0: = .
n
xu
El estadstico est dado por: Z = .
n
5.
57
6. Realizamos la prueba estadstica: Z = = 10
2
100
7. Dado que Z=-10 y no pertenece a la regin de aceptacin estamos en
condiciones de rechazar la hiptesis nula, luego aceptar la alternativa :
0 7.
62
%. Hay evidencia de que el ingreso diario promedio sea menor del que
afirma el presente dueo?.
5.
625 675
6. Realizamos la prueba estadstica: Z = = 3.65
75
30
7. Dado que Z=-3.65 y no pertenece a la regin de aceptacin estamos en
condiciones de rechazar la hiptesis nula, luego aceptar la alternativa:
< 7.
X
En este caso el estadstico de prueba ser t =
s
n
63
Ejemplo . Se escoge a 17 individuos al azar y se les mide, resultando que su
estatura media es de 1,71 metros con desviacin tpica de 0,02 .Contrastar
la hiptesis de que la estatura media nacional sea de 1.75 metros si
utilizamos un nivel del significacin del 5%. Se supone normalidad
1.71 1.75
5. Se calcula el estadstico de prueba. t = = 8.25
0.02
17
6. Dado que t=-8.25 y no pertenece a la regin de aceptacin estamos en
condiciones de rechazar la hiptesis nula, luego aceptar la alternativa:
1.75.
H0: P = p0.
H1: p p0.
H0: p p0.
H1: p > p0.
H0: p p0.
H1: p < p0.
64
P p0
Z=
p 0 (1 p0 )
n
x
Donde P = (proporcin muestral)
n
1. H0: p = 0.3
H1: p 0.30
3. Z* = +/- 1.96
65
que al menos el 50 % de los consumidores ver con buenos ojos la innovacin.
Se realiza un sondeo de mercado y resulta que de 100 consumidores
encuestados 40 son favorables a la innovacin.
Para el punto a)
Aplicando el procedimiento para probar una hiptesis tenemos:
1. H0: p 0.5
H1: p > 0.5
3. Z = 2.33
40
5. Realizamos la prueba estadstica: P = = 0.4
100
P p0 0.4 0.5
Z= = = 2
p0 (1 p0 ) 0.5(1 0.5)
n 100
Para el punto b)
66
Aplicando el procedimiento para probar una hiptesis tenemos:
1. H0: p 0.3
H1: p > 0.3
3. Z = 2.33
Analizaremos en forma completa los errores Tipo I y Tipo II, con respecto a las
prueba de una media hipottica. Sin embargo los conceptos que se ilustran
aqu son aplicables tambin a otros modelos de pruebas de hiptesis.
67
La nica forma en que se puede determinar la probabilidad del error Tipo II
( ) es con respecto a un valor especfico incluido dentro del rango de la
hiptesis alternativa.
News & World Report public un artculo sobre la carrera de xitos de Wal-
Mart. Actualmente es la mayor cadena de ventas al por menor de la nacin.
Empez con una sola tienda de descuento en la pequea localidad de Rogers,
Arkansas, y a crecido hasta poseer 1300 tiendas en 25 estados. Este xito le
ha valido a Sam Walton, fundador y mayor accionista, el ttulo del hombre ms
rico de Amrica. Las ventas anuales se cifran en 15 millones de dlares por
tienda.
a) Si se elige al azar una muestra de 120 tiendas y se hallan unas ventas
medias de 15.39 millones de dlares, con una desviacin estndar de
2.9 millones de dlares. Pruebe la hiptesis = 15 millones con un nivel
de significancia del 10%
b) Si la es en realidad 14.8 millones de dlares, Cul es la probabilidad
de cometer el error Tipo II.
Datos
n = 120
X = 15.39 millones
= 2.9 millones
= .10
1.Establecer la hiptesis
Ho: = 15
H1: 15
68
X
4. Calcular la estadstica de prueba Z = el valor de la media poblacional
n
15.39 15
es el que esta a prueba en la hiptesis por lo tanto Z = = 1.47
2.9
120
5. Conclusin. Existe evidencia para decir que las ganancias anuales por
tienda son de 15 millones de dlares por tienda con un nivel de significancia
de 0.10.
69
70
UNIDAD 8. REGRESIN Y CORRELACIN SIMPLES.
En la Estadstica descriptiva se analiz el comportamiento de una variable
aleatoria. En cada variable se hace un anlisis y luego se busc hacer un
estimado a cerca de un parmetro poblacional utilizando las tcnicas de
Estimacin por intervalo o un aprueba de hiptesis utilizando las distribuciones
de probabilidad.
Ahora se buscar analizar dos variables que de alguna forma podran tener un
relacin donde el resultado de una esta ligado al resultado de la otra variable.
El espacio muestral de un experimento con dos variables consiste en cierto
conjunto de pares ordenados de medidas. Es decir, se hacen dos
observaciones en cada prueba. Por ejemplo, en un almacn se puede observar
los descuentos y el volumen de ventas. Otro ejemplo podra ser que a cada
estudiante se observara su estatura y el peso. La tabulacin de los datos
podra tener las siguientes tablas de resultados.
Ejemplo 1:
Ejemplo 2:
71
altos y que los padres bajos mostraban tendencia a tener hijos bajos. Pero con
todo, la estatura promedio de los hijos de padres muy altos era menor que la
estatura promedio de sus padres, en tanto que los hijos de padres muy bajos,
en promedio, eran ms altos que sus padres. Galton llam esta tendencia hacia
la estatura promedio de todos los hombres con el nombre de regresin.
Asociaciones parecidas en otros varios fenmenos fueron observadas por
Galton, quien entonces las generaliz como una ley universal de
comportamiento entre dos o ms variables asociadas.
El anlisis de la regresin se clasifica generalmente en dos tipos, simple y
mltiple. La regresin simple es aquella en que entran solamente dos variables,
tales como la regresin de Y respecto a X antes mencionada. La regresin
mltiple es aquella en la que intervienen tres o ms variables, una de las cuales
es la variable dependiente, la que se va a asociar con los valores de todas las
dems.
Por dems, el estudio se restringir a la regresin simple solamente o sea
aquella en que la ecuacin que describe la relacin entre X y Y es lineal y se
representa grficamente por una recta. A veces ocurre que una ecuacin de
regresin que describe de la mejor manera posible la relacin entre variables
resulta curvilnea; su representacin geomtrica es entonces una curva en vez
de una recta.
Cuando se encuentra que unas variables estn relacionadas entre s, suele ser
til averiguar cuan estrecha es la relacin. El grado de relacin entre stas se
denomina tambin correlacin entre las variables. El problema de correlacin
est ntimamente asociado al de la regresin y es parte integrante del anlisis
de dos variables.
El anlisis de correlacin es el conjunto de tcnicas estadsticas empleados
para medir la intensidad de la asociacin entre dos variables. El objetivo es
determinar que tan intensa es la relacin entre las dos variables.
72
35
30
25
Ventas
20
15
10
1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5
Descuentos (%)
100
90
80
Peso (Kgs)
70
60
50
40
155 160 165 170 175 180 185
Estatura (cm s)
73
2. Se supone que la relacin entre X y Y. est dada por la ecuacin: Yi = +
Xi + i, donde , son los parmetros poblacionales y i es el error por la
diferencia entre Yi y el valor esperado de Y como variable aleatoria
determinada por el valor de X en particular. La variable dependiente es la que
se predice o calcula mientras que la independiente es la base del clculo.
es la interseccin de la recta con el eje Y y es la pendiente de la recta de
regresin. Cuando es negativo, la recta es decreciente y si es positivo, la
recta de regresin es creciente. Otros autores se refieren al modelo de
regresin lineal con la ecuacin Y = A + B*X
35
30
25
Ventas
20
15
10 y = 10,201 + 5,2122x
5
0
0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5
Descuentos (%)
100
90
y = 1,4779x - 180,4
80
Peso (Kgs)
70
60
50
40
155 160 165 170 175 180 185
Estatura (cm s)
1 2 3 4
74
2. Tendencia lineal creciente
3. Tendencia no-lineal creciente
4. Tendencia lineal decreciente.
Las frmulas de y
Donde
n ( X i Yi ) ( X i )( Yi ) Y X
= ; = * = Y X
i i
n( X i2 ) ( X i )
2
n n
240.13 26,5
= 5,21119947 * = 10.2033214
10 10
75
Trazado de la lnea de regresin
35
30
25
Ventas
20
15
10 y = 10,201 + 5,2122x
5
0
0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5
Descuentos (%)
Debido a que no hay diferencia entre los valores observados y los valores
pronosticados, no existe error en esta estimacin.
Obtener una prediccin perfecta en los aspectos de economa y administracin
es prcticamente imposible. Por ejemplo, los ingresos anuales provenientes de
ventas de gasolina (Y) con base en los registros de automviles (X) hasta cierta
fecha, sin duda podran aproximarse con gran exactitud, pero el pronstico no
sera preciso con redondeo a unidades monetarias enteras, o tal vez hasta el
millar de unidades monetarias. Aun los pronsticos de resistencia a la tensin
mecnica de los alambres de acero, con base en el dimetro externo de los
mismos, no siempre son exactos, debido a ligeras diferencias en la
composicin del acero.
76
Entonces, lo que se necesita es una medida que indique qu tan preciso es el
pronstico de Y con base en X o, por el contrario, cuan inexacta podra ser la
prediccin. A esta medida se le denomina error estndar de estimacin, el
cual se representa por sx,y (es el mismo concepto que el de la desviacin
estndar). La desviacin estndar mide la dispersin respecto a la lnea de
regresin.
Error estndar de estimacin. Es la medida de la dispersin de los valores
observados, con respecto a la lnea de regresin.
El error estndar de estimacin se determina aplicando la siguiente ecuacin.
Obsrvese que sta es muy semejante a la de la desviacin estndar de una
muestra.
(Y Y )
2
10,83506
ERROR ESTANDAR DE LA ESTIMACION : S Y , X = = 1.163779599
8
Las desviaciones son las desviaciones verticales con respecto a la
Y Y
recta de regresin. Deben sumar cero. Uno puntos estarn por encima de la
i
Y 2
( Yi ) ( X i * Yi )
ERROR ESTANDAR DE LA ESTIMACION : S Y , X =
i
n2
77
8.3 Coeficiente de correlacin.
Es el valor que mide de laguna manera la intensidad de la relacin entre dos
conjuntos de variables.
n( X iYi ) ( X i )(Yi )
r=
[n( X i
2
) ( X ) ] [n( Y ) ( Y ) ]
i
2
i
2
i
2
78
10 * 675,6630 26,5 * 240,13
r= = 0.974564139
(10 * 77,770 26,5 )* (10 * 5981.9733 240,13
2 2
79
Ventas ( millones $ )
36,00
31,00
26,00
21,00
16,00
11,00
0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5
80
8.5 Modelos de regresin no lineal
81
EJERCICIO
82
3. Taller. Realice el pronstico para los aos 6, 7, 8, 9 y 10.para los siguientes
datos
83
84
85
86
87
RAFAEL VARGAS BARRERA
Profesor ESAP
Matemtico
Especialista en Costos y Control de Gestin
Master en finanzas
rvargas@etb.net.co
88