Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Inferencial-Estadistica Inferencial PDF
Estadistica Inferencial-Estadistica Inferencial PDF
ESTADSTICA INFERENCIAL
MDULO EN REVISIN
PROGRAMA A DISTANCIA DE
ADMINITRACION DE EMPRESAS.
ESTADSTICA INFERENCIAL
COMPILADOR:
REDISEO:
2014
TABLA DE CONTENIDO
INTRODUCCIN
JUSTIFICACIN
FORMAS DE ABORDAR LA LECTURA DEL MODULO
PROPSITOS DE FORMACIN
REFERENTE TERICO
ESTRUCTURA DEL MODULO ESTADSTICA INFERENCIAL
COMPETECIAS TRANSVERSALES A DESARROLLAR
SABERES
1
1.1
1.2
2.3
2
2.1
2.2
2.3
2.4
3
3.1
3.2
3.3
3.4
4
4.1
4.2
4.3
lineal.
1. INTRODUCCIN
de decisiones en
condiciones de incertidumbre.
2. JUSTIFICACIN
La inferencia estadstica, como parte de la Estadstica que comprende los
mtodos y procedimientos para deducir propiedades de una poblacin a partir del
estudio de una parte de sta, es esencial para el administrador de empresas, el
contador y el economista dado que los diversos mtodos de estimacin, prediccin
y contraste de hiptesis son las herramientas fundamentales en la toma
de
Estimado(a) estudiante:
Formarse como profesional en administracin de empresas en un programa a
distancia, requiere dedicacin, responsabilidad y de un buen mtodo de estudio
para cada uno de los mdulos que conforman el pensum acadmico.
Mantener una actitud de superacin para que con su esfuerzo personal logre
el desarrollo concienzudo de cada una de las actividades propuestas.
4. PROPSITOS DE FORMACIN
Al final del curso el alumno ser capaz de utilizar los mtodos y modelos
estadsticos
apropiados
5. REFERENTE TERICO
DISTRIBUCIONES
FUNDAMENTALES DE
MUESTREO
Distribucin en el
muestreo de la media
muestral
Distribucin en el
muestreo de una
proporcin muestral
Intervalos de confianza
para la media
poblacional
ESTIMACIONES POR
INTERVALOS
Intervalos de confianza
para la proporcin
poblacional
Intervalos de confianza
para la diferencia de
media de dos
poblaciones
ESTADSTICA
INFERENCIAL
CONTRASTE DE
HIPTESIS
Verificacin de hiptesis
y capacidad explicativa
de una funcin de
regresin lineal.
para proporciones
para proporciones
la
http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal
PRESENTACION
La rama de la estadstica dedicada a la inferencia trata bsicamente con las
generalizaciones y predicciones, por ejemplo, se puede estar interesado en
averiguar acerca de la media o varianza de la distribucin poblacional de las
rentas familiares en una ciudad de la Costa Atlntica, o sobre la proporcin de
familias de esta ciudad que tienen unos ingresos inferiores a $450.000.
Para hacer este tipo de afirmaciones las poblaciones suelen ser demasiado
grandes para estudiarlas en su totalidad, por lo tanto se hace necesario elegir una
muestra representativa que tenga un tamao ms manejable, sobre la base de la
informacin muestral; nuestro objetivo ser hacer inferencia acerca de la poblacin
de la que procede la muestra.
PREGUNTA PROBLEMA
Cmo se puede aplicar las distribuciones muestrales en la solucin de situaciones
concretas de una empresa?
COMPETENCIAS ESPECFICAS
SABERES
Distribucin muestral
Distribucin en el muestreo de la media muestral
Distribucin en el muestreo de una proporcin muestral
ACTIVIDAD GRUPAL
SABERES Y ACTIVIDADES
1 DISTRIBUCIONES MUESTRALES
Quienes toman decisiones lo hacen con solo tomar una muestra.Por ejemplo,
considrese un fabricante que desea saber los tiempos que requieren en promedio
los trabajadores para terminar un trabajo dado, o la cantidad promedio de
combustible necesario para enviar un camin a cierta distancia, o la edad
promedio de quienes utilizan un producto, o la porcin de mercado para un
producto, o el porcentaje de unidades defectuosas en un lote de produccin o
sobre la proporcin de personas que ven un determinado programa de televisin.
En todos estos casos el estadstico est interesado en saber algo sobre una
poblacin estadstica. A falta de un censo, el conocimiento deseado sobre
parmetros como la media de la poblacin ( ), la desviacin estndar de la
poblacin ( ) o la proporcin de una poblacin ( ), slo se puede adquirir si se
saca una muestra representativa de la poblacin, se calcula los estadsticos como
la media muestral ( X ), la desviacin estndar (S) o la proporcin muestral (P), y
se hace inferencia sobre los parmetros a partir del ellos. El proceso de inferir los
valores de parmetros desconocidos de una poblacin, a partir del estadstico de
una muestra conocida se denomina estimacin.
media muestral.
Dado
mustrales
Para ilustrar el concepto consideremos que de una gran empresa que tiene 300
empleados se desea tomar una muestra, por ejemplo de 25 empleados, y a partir
de esta muestra calcular el salario medio, y la proporcin P, de hombres que
laboran en la empresa. Esta media muestral sirve despus como estimacin de ,
media aritmtica del salario de los 300 trabajadores.
300
SALARIO MENSUAL
( Miles de peso)
SEXO
Alejandro
400
Berena
300
Carlos
350
Sandra
500
Eliecer
450
b) Sexo.
x 2000 400
(x )
N
3
0,6 (Proporcin de hombres)
5
5000 ,
5000 70,71
Nmero de la
Unidades en la
muestra
muestra
(miles de pesos)
hombres (Ph)
ABC
350
2/3
ABS
400
1/3
ABE
383,333
2/3
ACS
416,667
2/3
ACE
400
3/3
ASE
450
2/3
BCS
383,333
1/3
BCE
366,667
2/3
BSE
416,667
1/3
10
CSE
433,333
2/3
C3
Como = 400 mil, la probabilidad de elegir al azar una muestra que de una
estimacin exacta de es solamente de: (
Es evidente que nunca se podr calcular el tamao real del error muestral, puesto
que la media poblacional sigue siendo desconocida, pero hay que ser consciente
de la probabilidad de incurrir en este error.
Con una poblacin de N = 5 se puede listar todas las medias mustrales posibles,
junto con su probabilidad. Dicha lista se llama DISTRIBUCIN MUSTRAL y se
refleja en la tabla 1.3
Probabilidad
350
1/10
366,667
1/10
383,333
2/10
400
2/10
416,667
2/10
433,333
1/10
450
1/10
Una posible interpretacin de la tabla 1.3 es: Si han de seleccionarse, por ejemplo
1.000 muestras aleatorias simples de tamao n=3, de la poblacin de N = 5,
podra esperarse calcular 100 veces un salario medio de 350 mil pesos o 200
veces un salario medio de 400 mil pesos.
tiene media
, entonces,
( )
( )
Esto quiere decir, que la media de las medias mustrales, conocida como la media
general, es igual a la media poblacional.
, K numero de muestras
es la varianza
,Knmero de muestras.
(
(
)
)
Pesos al cuadrado.
Si se extrae la raz cuadrada de la varianza de la distribucin de estas medias
mustrales se tiene el error tpico de la distribucin muestral.
Error tpico de la distribucin muestral en medias mustrales.
Para el ejemplo:
pesos
tiene varianza
, entonces:
(
(
)
)
( )
Luego
1.2.2
Supngase que se tienen los ingresos de varios millares de estudiantes que dan
una media de 500 mil pesos y que dichos ingresos siguen una distribucin normal.
Si se eligen todas las muestras de tamao n de esa poblacin normal de ingreso
de los estudiantes, la distribucin muestral de las medias mustrales tambin ser
normal.
, entonces,
Esto quiere decir que las estn menos dispersas que los datos originales.
De la expresin
* +*
varianza es:
* + [
EJEMPLO 1.1
La oficina del DANE desea estimar el ndice de natalidad por 100.000 habitantes
en las 100 localidades ms grandes del pas. Se sabe que la desviacin tpica de
los ndices de natalidad de estos 100 centros urbanos es de 12 nacimientos por
cada 100.000 habitantes.
a. Calcular la varianza y la desviacin tpica de la distribucin muestral de
n= 8
localidades.
b. Calcular la varianza y la desviacin tpica de la distribucin muestral de n= 15
localidades.
SOLUCION:
a. Como la fraccin
b. Como
* +*
+*
+ [
1.5
DISTRIBUCIN
EN
EL
MUESTREO
DE
UNA
PROPORCIN
MUESTRAL
( )
( )
( )
),
luego: (
( )
de xitos en la poblacin.
Su varianza es :
( )
( )
( )
EJEMPLO 1.2
La desviacin tpica de las compras realizadas por los clientes de una tienda
concreta es de 18 dlares. Si se toma una muestra al azar de 100 consumidores.
a. Cul es el error tpico de la distribucin muestral?
b. Cul es la probabilidad de que la media muestral supere la media poblacional
en ms de 5 dlares?
SOLUCION:
a.
se establece en
se tiene:
o un rea de 0,4973.
Luego: (
La duracin de las bombillas producidas por un cierto fabricante tiene una media
de 1.200 horas y una desviacin tpica de 400 horas. La poblacin sigue una
distribucin normal. Suponga que se han comprado 49 bombillas que pueden ser
consideradas como una muestra aleatoria de la produccin del fabricante.
a. Cul es la media de la media muestral de la duracin de estas bombillas?
b. Cul es la varianza de la media muestral?
c. Cul es el error estndar de la media muestral?
d. Cul es la probabilidad de que el tiempo medio de la duracin de las 49
bombillas sea de menos a 1050 horas?
SOLUCIN:
a.
Como
b.
c.
d.
La probabilidad pedida es : (
La probabilidad que una variable aleatoria sea menor que -2,63 segn la tabla 1
del apndice es: 0,5 0,4957 = 0,0043, luego la probabilidad de que el tiempo
medio de duracin de las 49 bombillas sea menor de 1.050 horas es del 0,43%.
EJEMPLO 1.4
SOLUCIN:
se establece en
y adems la fraccin
Luego: (
:
)
EJEMPLO 1.5
Una empresa empacadora de cereales asegura que la media del peso que
contienen las cajas de estos cereales es de 200 gramos y sus desviacin tpica de
6 gramos. La distribucin en los pesos es normal. Se eligen 4 cajas que pueden
ser consideradas como una muestra aleatoria del total de la produccin.
a. Cul es el error estndar de la media muestral del peso de estas 4 cajas?
b. Cul es la probabilidad de que, como media, el peso de estas 4 cajas sea
menor que 197 gramos?
c. Cul es la probabilidad de que, como media, el peso de estas 4 cajas sea
mayor que 206 gramos?
d. Cul es la probabilidad de que, como media, el peso de estas cuatro cajas
este entre 195 y 205 gramos?
SOLUCION:
a.
b. Se calcula el valor de Z:
Luego:
y
(
EJEMPLO 1.6
El dueo de una tienda de discos ha comprobado que el 20% de los clientes que
entran a su tienda realizan alguna compra. Un da entran a la tienda 180 personas,
que pueden ser considerados como una muestra aleatoria de todos los clientes:
a. Cul ser la media de la proporcin muestral de clientes que realizaron
alguna compra?
b. Cul es la varianza de la proporcin muestral?
c. Cul es el error estndar de la proporcin muestral?
d. Cul es la probabilidad de que la proporcin muestral sea menor que 0,15?
SOLUCION:
a.
( )
( )
b. La distribucin muestral de
(
tiene varianza
)
es:
=0,0298
(ver grafica)
EJEMPLO 1.7
Un proceso industrial genera el 8% de unidades defectuosas. Usted compra 100
unidades, cual es la probabilidad de que sean defectuosas menos del 10%.
SOLUCION:
EJEMPLO 1.8
Un proceso de produccin en curso produce un 10% de artculos defectuosos. Un
inspector de calidad toma una muestra aleatoria simple de 70 artculos y
rechazar toda la produccin si ms de un 5% de la muestra est defectuosa.
Cul es la probabilidad de rechazo?
SOLUCION:
1.5 RESUMEN
* +*
* + [
media
la
varianza
de
la
lasproporcionesmuestralesestn
( )
distribucin
dadas
( )
muestral
de
por:
si
Taller 1
1. Los gastos semanales (en dlares) en publicidad hechos por N = 5
competidores se indican en la siguiente tabla. Establezca la distribucin
muestral para el promedio de gastos, para una muestra aleatoria simple de 3
competidores.
COMPETIDOR
DOLRES
100
92
118
70
135
7. Una fbrica tiene a 439 obreros contratados. De ellos 239 estn preocupados
sobre sus futuras pensiones. Se toma una muestra de 80 obreros y se les
interroga con el fin de estimar la proporcin de la poblacin que est
preocupada sobre el futuro de su pensin.
unidades que midan entre 9.5 y 10.5 pulgadas, cuntas de las muestras de la
muestra de 100 habr que desechar?
10. El alcalde una ciudad de 950 vecinos piensa que la renta media de stos es de
por lo menos $625.000, con una desviacin tpica de $85.900. Si se toma una
muestra aleatoria de 150 personas. Cul es la probabilidad de la renta media
de estos sea mayor que $640.000?
12. Una compaa farmacutica sabe que un 5% de todos los usuarios de cierto
medicamento experimentan graves efectos colaterales. Si se examina una
muestra aleatoria simple de 120 usuarios, calcule cul es la probabilidad de
hallar:
a. Qu no hay efectos colaterales.
b. Entre 5 y 10 casos con efectos colaterales.
c. Ms de 10 casos con efectos colaterales.
http://www.educandus.cl/estadistica/ejercicios/bases_teoricas/Distribucion/ResueltosDistribucio
nesMuestrales.pdf
Evaluacin
Con base en la informacin responda las preguntas 1 a 4
B. 40,0
C. 4,00
D. 400
B. 0,3944
C. 0,50
D. 0,8944
B. 0,8413
C. 0,1587
D. 0,1857
B. 77,34%
C. 45,32%
D. 27,34%
B.4,24
C.0,60
D.9,13
B. 24,54%
C. 30,85%
D. 25,46%
B. 0,0934
C. 0,1857
D. 0,1587
B. 0,8384
C. 0,0808
D. 0,9192
35
30
25
20
15
10
5
0
1
PRESENTACION
10 11 12 13 14 15 16 17 18 19 20 21 22
se har
preguntas del tipo: puedo estar totalmente seguro de que el verdadero porcentaje
de piezas defectuosas est entre el 5% y el 15%? o es muy posible que entre el
8% y el 12% de las piezas sean defectuosas? Esta clase de preguntas va ms
all de la contenida en una simple estimacin puntual; son preguntas que buscan
conocer la fiabilidad de dicho estimador.
PREGUNTA PROBLEMA
Cmo se pueden aplicar los intervalos de confianza en la toma de decisiones
empresariales?
COMPETENCIAS ESPECFICAS
1. Estima e interpreta intervalos de confianza para la media poblacional
2. Estima e interpreta intervalos de confianza para la proporcin poblacional
3. Estima e interpreta intervalos de confianza para la diferencia de dos media
poblacionales
SABERES
Intervalos de confianza
A. x R / x 5
B. x R / x 2
C. x R / 1 x 5
D. x R / 0 x 7
E. x R / 4 x 5
F. x R / x 3
ACTIVIDAD GRUPAL
1 Socialice
los
resultados
obtenidos
individualmente
escriba
sus
conclusiones al respecto.
2 Haga un listado de las dudas e inquietudes presentadas en la socializacin
de las actividades anteriores.
3 Realice diferentes redacciones para la interpretacin de los intervalos de
confianza. Seleccione la que considere ms adecuada y que presente
mayor claridad.
SABERES Y ACTIVIDADES
Se puede partir del hecho que cualquier parmetro que se estime es igual al estadstico
que se utilice como estimacin puntual ms el error muestrale (negativo o positivo).
Para el caso de la media muestral se tiene:
X + e
Si tomamos como ejemplo los datos de la tabla 1.2 y se selecciona la muestra (1), X =
350.000, aqu se manifiesta un error muestral de
a construir dichos intervalos al hacer que la estimacin puntual sea el centro del
intervalo y creando un rango abajo y arriba del centro con ayuda del error estndar
del estimador (error tpico). Entonces el parmetro desconocido se supone que se
encuentra dentro del intervalo pero no necesariamente en su centro.
Sin embargo, los lmites del intervalo no necesitan estar precisamente en el error
estndar abajo o arriba de la estimacin puntual. Al definir un coeficiente C como
cualquier valor positivo de fraccin o entorno se puede hacer la afirmacin
EJEMPLO 2.1
Una muestra de salarios ha determinado X = $ 396.670 que podra servir como
estimacin puntual de , el error tpico es X = 35.250. Crear varias estimaciones
posibles de intervalos de con base en error estndar de 0.5, 1.0, 2.0
SOLUCIN:
I .C para X C . X
a) Si C se toma como 0.5, se estima que se encuentre entre los lmites:
396.670 .05 (32.250)
Luego 380545 412.795
461170
producen
Considere
una
distribucin
normalmente
distribuida
de
sea
comprendido en el intervalo
X ( Z . ) X (Z. )
X
X Z . X , por lo
En efecto
335,57 364,44
b) Si Z = 1.0, se tiene que el 68% de todos los valores de X caen dentro del
intervalo de X 1 X . Se puede tener un 68,28 % de confianza en que
nuestro mtodo de construccin de intervalo producir un intervalo que
contendr a .
321,13 378,87
Este intervalo no contiene a
X 400
cuando es desconocido.
EJEMPLO 2.2
SOLUCION:
4 minutos.
n 50 llamadas
X 9,1 minutos
Nivel de confianza 95%
4
0,5657
50
Luego
I.C Para X Z . X
I.C Para 9,1 (1,96) (0.5657 )
I.C Para 9.1 1,1085
Luego:
7,99 10.21
duracin media de las llamadas que entran a la central telefnica esta entre 7,99 y
10,21 minutos.
EJEMPLO 2.3
SOLUCION:
N 75
99
n 36
X 736
Nivel de confianza 99,8
Luego
n
99
36
N n
N 1
75 36
75 1
11,98
EJEMPLO 2.4
En una ciudad donde hay 200 gasolineras, un economista toma una muestra
aleatoria de 50 de ellas, cuyo precio promedio de gasolina es de 5.839 pesos por
galn, con una desviacin estndar muestral de 68 pesos por galn. Determine e
interprete un intervalo de confianza del 80% para el precio promedio en la ciudad,
si se supone que la distribucin poblacional es normal.
SOLUCION:
N = 200 gasolineras
n= 50
Se tiene una muestra grande, con una fraccin de muestreo n/N mayor del 10%,
luego se hace necesario aplicar el factor de correccin. es desconocido.
S
N n
68
.
N 1
n
50
200 50
8,35
200 1
I .C para X Z .S X
Luego
Esto nos indica que el precio promedio de la gasolina por galn en la ciudad esta
entre 5828,31 y 5849,69 pesos.
Cuando se toma una muestra pequea (n< 30) la distribucin normal puede ser
inadecuada. Es decir, cuando la muestra es pequea y es desconocida, no se
deber aplicar la distribucin Z. En este caso de muestras pequeas, los errores
estndar de la media y la proporcin
Como primero lo demostr William S Gosset, cervecero ingls, que escriba bajo el
seudnimo de student (estudiante), en las circunstancias especificadas, se
puede derivar mejores estimaciones de intervalos si se usa una funcin de
densidad de probabilidad algo diferente de la curva normal.
Gosset, describi una distribucin muestral para una variable aleatoria, t, derivada
de una poblacin normalmente distribuida y definida en analoga a la desviacin
normal estndar Z. Esto se ilustra en la figura 2.1
indefinidamente en ambos
n 1
n 3
Esta varianza de t implica que existe una distribucin t diferente para cada tamao
muestral n, y tambin que la distribucin t se aproxima a la distribucin Z
t ( df ) o t , df
de
0.1 , t1 (10) 1,372. En otras palabras, 0.1 del rea bajo la curva t apropiada para
una muestra de n = 11 est asociada con t > 1,372.
Debido a la simetra de la curva 0.1 del rea bajo esta curva tambin esta
asociada con
valor t es igual a 0.8 . Para construir una estimacin de intervalos con un nivel de
confianza de 0.8, o sea del 80% se debe usar t = 1,372. Luego los intervalos de
confianza se pueden construir con ayuda de los valores t de la tabla 2 del
apndice as:
EJEMPLO 2.5
10
21
22
17
19
14
19
SOLUCION:
Se debe suponer que la distribucin de la poblacin es normal, como un primer
paso, se tiene que hallar la media y la varianza muestral (con la ayuda de una
calculadora).
X 16,22
S X 4,79
Luego
SX
I .C para X t S X
4,79
1,5967
9
con
donde
t 0.10, 8 1,860
EJEMPLO 2.6
El convenio colectivo entre el sindicato de una empresa y la administracin de la
misma exiga que la produccin media de una seccin de la fbrica se mantuviera
en 112 unidades por empleado y mes. Surgieron desacuerdos entre las partes
sobre el cumplimiento de esta norma. El convenio colectivo especificaba que si la
produccin media descenda por debajo de la cantidad estipulada de = 112,
estaba autorizada a tomar medidas correctivas. Para ahorrar costo se decidi
inspeccionar solamente 20 obreros que dieron una media de 106 unidades.
Supngase que se hall una desviacin tpica de 8,5 unidades y que los niveles de
produccin siguen una distribucin normal sugiere un intervalo de confianza del
90% que ha habido violacin del convenio y que est justificado, por lo tanto,
tomar medidas correctivas?
SOLUCION:
I .C para X t
S
n
8.5
2.5
(1 )
n
Px (1 Px )
n
, as:
Px (1 Px )
Px (1 Px )
, donde la variable Z se
Px Z
2
n
n
distribuye normalmente.1
EJEMPLO 2.7
En una encuesta a 673 grandes almacenes, 521 declaraban tener problemas con
los robos de los empleados se puede llegar a la conclusin, con una confianza
del 99% de que estos datos indican que el 78% de todas las tiendas tiene
dificultades similares?
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p253
SOLUCION:
I .C para Px Z S P ;
SP
0,774 0,226
673
EJEMPLO 2.8
Un almacn de la ciudad quiere estimar la proporcin de clientes que pagan con
tarjetas de crditos. Una muestra de 79 clientes indic que 12 utilizaban el
plstico. Construir e interpretar el intervalo de confianza para el almacn.
SOLUCION:
Px
SP
12
0,1519
79
0,1519 0,8481
79
0,040
I .C para Px Z . S P
I .C para 0,15189 2,580,040
I .C para 0,15189 0,1042
0,05 0,26
Esto quiere decir que la proporcin de clientes que pagan con tarjeta de crdito
esta entre el 5% y el26%.
EJEMPLO 2.9
En una compaa de autobuses, cada mes, miles de sus autobuses llegan a cierta
terminal. Con ayuda de una muestra aleatoria de 49 autobuses, sin
remplazamiento, ha de construirse un intervalo de confianza del 99,9% para la
proporcin de todos los que llegan a tiempo. La proporcin muestral de llegada
exacta es de 0,64.
SOLUCION:
SP
0,640,36 0,0686
49
I .C para Px Z S P
Luego: I .C para 0,64 3,27 0,0686
0,42 0,86
Con un confianza del 99.9% se puede afirmar que el porcentaje de autobuses que
llegan a tiempo a la terminal est entre 42% y 86%
Resumen
INTERVALO DE CONFIANZA: Si de una poblacin dada se toman repetidamente
muestras aleatorias de tamao n, se encontraran muchos valores diferentes de un
estadstico muestral dado. Si a este valor se suma y se resta una cierta cantidad,
el estadstico muestral se convierte en un rango de valores entre los que
presumiblemente se puede encontrar el parmetro poblacional desconocido. A
este rango de valores se le llama intervalo de confianza.
I .C para X Z .S X
cuando es desconocido.
I .C para X (t ) (S X ) , Donde S X
S
,
n
X
S
n
SP
Px (1 Px )
N n
. Utilizando el factor de correccin .
N 1
n
cuando sea
requerido.
Px (1 Px )
Px (1 Px )
, donde la variable Z se
Px Z
2
n
n
distribuye normalmente.2
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p253
Taller 2
1. Una muestra de 155 usuarios del tren suburbano emplean en este medio de
transporte una hora y 37 minutos en promedio, con una desviacin tpica de
42 minutos. Cul es el intervalo del 90% para el tiempo medio de todos los
usuarios?
Z
n
problema sanitario.
19,8
18,6
18,4
19,2
20,8 19,4
20,5
21,4 20,6
13. In a simple random sample of 500 employees, 160 preferred to take training
classes in the morning rather than in the afternoon. Construct a 95% C.I. on the
true proportion of employees who favor morning training classes
14. Human beings vary in the time it takes them to respond to driving hazards. In
one experiment in which 100 healthy adults between age 21 and 30 years were
subjected to a certain driving hazard, and the sample variance of the observed
times it took them to respond was 0.0196 second squared. Assuming that the
times to respond are normally distributed, estimate the variability in the time
response of the given age group using a 95% C.I
15. Suppose you want to estimate the average weight of chickens in a laboratory.
You like to be 95% certain that the error is at most 0.1lbs. How many chickens
you should include in your sample?
Evaluacin
Con base en la informacin responda las preguntas 1 y 2
x
i 1
25
x
i 1
2
i
1.508
95.628 4
A.
95.628 1508
25
(1508) 2
25
25
B.
95.628
C.
95.628 1508
24
(1508) 2
25
24
95.628
D.
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p52
A. 95,05 104,95
B. 94,12 105,88
C. 99,01 100,99
D. 98,82 101,18
A. 0,589 y 0,754
B. 0,602 y 0,741
C. 0,589 y 0,602
D. 0,602 y 0,754
PRESENTACION
Cuando se extrae una muestra aleatoria, de una poblacin, la evidencia obtenida
puede usarse para realizar inferencia sobre las caractersticas de la poblacin.
Como hemos visto, una posibilidad es estimar los parmetros desconocidos de la
poblacin mediante el clculo de estimadores puntuales o intervalos de confianza.
Alternativamente, la informacin muestral puede emplearse para verificar la
validez de una conjetura o hiptesis, que se haya formulado sobre la poblacin.6
.
PREGUNTA PROBLEMA
Son las pruebas de hiptesis una herramienta fundamental en la toma de
decisiones en la empresa?
COMPETENCIAS ESPECFICAS
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p281
SABERES
ACTIVIDAD GRUPAL
1. Socialice
los
resultados
obtenidos
individualmente
escriba
sus
conclusiones al respecto.
2. Indique los criterios que se deben tener en cuenta para aplicar una prueba t
o una prueba Z.
3. Indique los criterios que se deben tener en cuenta para determinar si una
prueba de hiptesis es bilateral o unilateral.
SABERES Y ACTIVIDADES
3. CONTRASTE DE HIPOTESIS
1. Un fabricante de
Una hiptesis, nula o alternativa, puede designar un nico valor, llamado 0 , para
el parmetro poblacional . En este caso se dice que la hiptesis es simple. La
notacin simblica para una hiptesis de este tipo es
H 0 : 0
Que se lee La hiptesis nula es que el parmetro poblacional es igual al valor
especfico 0 7. La hiptesis alternativa es H A : 0 .
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p282
H0 : 150
H A : 150
H 0 : 0 ,
especifica mente
H 0 : 500 gr
H A : 500 gr
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p282
H 0 : 500
H A : 500
En el sistema:
H 0 : 0
, la hiptesis nula dice que el parmetro es mayor o
H A : 0
igual que un valor especfico, en tanto que en la alternativa dice que es menor que
ese valor, este sistema de hiptesis se plantea cuando algo puede ser con
seguridad mayor que un cierto valor, pero donde valores menores seran
inaceptables. Por ejemplo, si de una batera se garantiza que tendra una duracin
de 100 horas, nadie se preocupar si dura ms; pero la alternativa de que dure
menos podra ser verdad y exigira una accin correctiva rpida.
En el sistema
H 0 : 0
, la hiptesis nula dice que el parmetro es menor o
H A : 0
igual que un valor especfico, en tanto que la alternativa dice que es mayor que
ese valor. La hiptesis alternativa sugiere que el promedio es mayor que 0 . Este
tipo de hiptesis se establece cuando algo puede ser con seguridad menor o igual
que un cierto valor, pero donde valores mayores seran inaceptables, por ejemplo,
si se considera la hiptesis nula el tiempo promedio de entrega de una compaa
de transporte es igual o menor que tres das, nadie se quejara si es menor, pero
si es mayor sera causa de alarma.
FORMA 2
FORMA 3
H 0 : 0
H A : 0
H 0 : 0
H A : 0
H 0 : 0
H A : 0
FORMA 2
FORMA 3
H 0 : A B
H A : A B
H 0 : A B
H A : A B
H 0 : A B
H A : A B
Por lo tanto, la hiptesis nula puede decir, forma 1, que dos medias poblacionales
son las mismas, por ejemplo, que la duracin promedio de dos tipos de llantas son
idnticas. O puede decir forma 2, que una media poblacional es mayor o igual que
otra, por ejemplo que los sueldos promedios de la industria de la construccin en
Bogot son al menos iguales pero posiblemente mayores que los de Barranquilla.
O puede decir forma 3, que una media poblacional es menor o igual que otra, por
ejemplo que la produccin promedio de la fbrica A es al menos igual o
posiblemente menor que la produccin en la fbrica B.
por
se sustituye
Cada estadstico muestral tiene una distribucin muestral propia que puede
aproximarse muchas veces por la distribucin normal para muestras grandes, o
por una distribucin t de student para muestras pequeas. Es as como el
estadstico de prueba se puede convertir en un valor Z o un valor t al dividir la
diferencia entre el estadstico muestral y el valor extremo del parmetro
poblacional postulado en la hiptesis nula entre el error estndar del estadstico
muestral.
x 0
X 0
Para una media poblacional Muestras pequeas
SX
Px
tan
diferente del valor del parmetro contenido en la hiptesis, que excluya atribuir la
diferencia al error muestral.
H0 : 150 ;
H A : 150
X C , demasiado alejados por encima o por debajo de 150 para permitir suponer
que = 150. Si se contrasta la hiptesis nula al nivel de significancia del 5%, se
deben encontrar valores crticos de la media muestral por encima o por debajo del
valor hipottico = 150 que enmarque el 95% del rea comprendida bajo la
curva normal. El 5% restante se divide por igual en dos colas, como se muestra en
la figura 3.1.
H
SX
S
S
SX
n
n
N n
Error tpico de la distribucin muestral.
N 1
Son muchos los casos en que interesa contrastar una hiptesis en relacin con el
valor de una media poblacional, entre los cuales se pueden citar:
EJEMPLO 3.1
SOLUCIN:
Fase 1: Formulacin de las hiptesis
Como el convenio exige una produccin media de 50 unidades, el sistema de
hiptesis se establece as:
H 0 : 50
H A : 50
Se trata de una prueba bilateral, puesto que la hiptesis nula puede ser rechazada
si los resultados de la muestra estn muy por encima o por debajo de 50. Aparece
una regin de rechazo en cada una de las colas de la distribucin.
5,7
0,465
150
Adems:
Luego:
X C H Z X
X C 50 1,96(0,465)
X C 50 0,911
49,1 - - - - - - - - -
50.91
H 0 si X
es menor que 49,1 o mayor que 50,91. Esto se ilustra en la figura 3,2
FIGURA 3.2
Fase 4: Conclusin
EJEMPLO 3.2
Una compaa lctea utiliza una mquina para llenar sus latas de kumis de 18
onzas. Si la mquina funciona mal, tiene que ser ajustada. Se elige una muestra
de 50 latas, que dan una media de 18,9 onzas, con una desviacin tpica de 4,7
onzas. Si se admite un error del 5%. Deber reajustarse la mquina?
SOLUCION:
Fase 1: Formulacin de la hiptesis
Como el llenado debe ser de 18 onzas, el sistema de hiptesis conveniente es:
H 0 : 18
H A : 18
Nuevamente se trata de una prueba bilateral dado que la hiptesis nula puede ser
rechazada si los resultados de la muestra estn muy por encima o por debajo de
18 onzas.
SX
S
4,7
0,665
n
50
X C H ZS X
X C 18 (1,96) (0,665)
X C 18 1,3
16,7 - - - - - - - 19,3
es
menor que 16,7 o mayor que 19,3; esto se ilustra en la figura 3.3.
FIGURA 3.3
Fase 4: Conclusin
Una X de 18,9
EJEMPLO 3.3
33
2534
22
3130
32 3131 38
2429
26
25
SOLUCION:
El problema plantea que los agentes deben imponer una media de 27 multas, ni
ms ni menos, entonces el sistema de hiptesis se establece as:
H 0 : 27
H A : 27
Se trata de una prueba bilateral, dado que la hiptesis nula puede ser rechazada,
si los resultados de la muestra estn muy por encima o por debajo de 27. Como
slo se dispone de datos originales, se hace necesario determinar la media y la
desviacin tpica muestral. Los clculos indican que:
X 29,27
S 4,3
S
4,3
SX
1,11
n
15
Dado que la muestra es pequea el estadstico a utilizar es la prueba t de student,
como n = 15, con una nivel de confianza del 95% y 15 - 1 = 14 grados de libertad,
el valor de t es 2,145
X C H t S X
As:
X C 27 (2,145) (1,11)
X C 27 2,38
24,62 --------------29,38
No rechazar la hiptesis nula si la media muestral est entre 24,62 y 29,38 multas.
Rechazar la hiptesis nula si la media muestral es inferior a 24,62 o superior a
29,38.Ver figura 3.4
FIGURA 3.4
OBSERVACIONES
1. Si la desviacin tpica de la poblacin es conocida, se utilizar la prueba z, con
independencia del tamao de la muestra, siempre que la poblacin sea normal.
2. Aplicar una prueba t si se cumplen las condiciones siguientes:
a. La muestra es pequea ( n < 30)
b. Se sabe que la poblacin es normal.
c. es desconocida.
3. Si no se sabe si la poblacin es normal, aplicar una prueba NO
PARAMETRICA, sea conocida o desconocida.
EJEMPLO 3.4
SOLUCIN:
A pesar de que el tamao de la muestra se puede considerar pequeo, el
estadstico de prueba a usar es Z dado que se conoce la desviacin tpica
poblacional. Se tiene que:
X 1,95
0 2
0,06
X
n 9
0,05
0,06
0,02
9
H0 : 2
HA : 2
X C H Z X
X C 2 (1,96) ( 0,02)
X C 2 0,0392
FIGURA 3.5
Como X = 1,95 < 1,96 se rechaza la hiptesis nula y por lo tanto se concluye que
la media poblacional no es de dos centmetros y que el taladro no funciona
correctamente.
H 0 : 0
Sistema 3
H 0 : 0
H A : 0
H A : 0
la
1%. La desigualdad H
afirmacin ambigua
EJEMPLO 3.5
Supngase que en el ejemplo 3.2 la compaa lctea afirma que las latas de
kumis contienen una media de ms de 18 onzas, Si se interpreta correctamente,
ello significa que 18 , como sta desigualdad no contiene el signo igual, ha de
ser la hiptesis alternativa; mientras que la hiptesis nula ser 18 . Luego el
sistema de hiptesis se puede formular as:
H0 : 18
H A : 18
Pero si la compaa lctea hubiera afirmado que las latas de kumis contienen una
media de 18 onzas o ms, la interpretacin correcta sera
18 , como esta
H 0 : 18
H A : 18
Una vez establecido el sistema de hiptesis adecuado, es conveniente determinar
en qu extremo de la curva se encuentra la regin de rechazo. Para ello basta con
responder la pregunta
H 0 : 18
HA :
18
Escrita de esta forma, la hiptesis nula no permite utilizar valores pequeos para
la media. Establece claramente que la media es igual o menor que 18 onzas. Los
valores menores que 18, apoyarn y no refutarn la hiptesis nula. Los resultados
a la izquierda de 18 confirmarn la hiptesis nula de que es igual o menor que
18. As pues, son slo valores superiores a 18 los que dan lugar al rechazo de la
hiptesis nula. Por lo tanto, la regin de rechazo se encuentra en el extremo
derecho o superior de la distribucin. Esta prueba de cola a la derecha se ilustra
en la figura 3.6.
FIGURA 3.6
El valor crtico de la media muestral que marca una diferencia significativa con
hipottica limita la regin de rechazo en la cola derecha. La frmula de este valor
crtico en una prueba de cola a la derecha es:
H0 :
HA :
18
18
FIGURA 3.7
El valor crtico de la media muestral que marca una diferencia significativa con la
OBSERVACIONES
Es bueno recordar que para rechazar una prueba unilateral se deben tener en
cuenta las siguientes recomendaciones:
EJEMPLO 3.6
SOLUCIN
10.000 y
H 0 : 10.000
H A : 10.000
X C H Z S X
SX
H 10.000
S
207
20,7
n
100
0,4900
XC
X C 10.000 48,23
X C 9.952
millas
FIGURA 3.8
Como X = 9.112
nos indica que la afirmacin no es cierta. Por tanto el gerente del concesionario
est mintiendo.
EJEMPLO 3.7
empresario.
SOLUCIN:
Ms de 10.000 millas por trmino medio se pueden expresar con la siguiente
desigualdad
hiptesis es entonces:
H 0 : 10.000
H A : 10.000
Ahora la prueba es de cola a la derecha (Ver figura 3.9). Se tiene que:
n 100
Luego:
X 9.112
S 207
S X 20,7
1%
X C H Z S X
XC
X C 10.000 48,23
X C 10.048,2
millas
FIGURA 3.9
No rechazar la hiptesis nula si la media muestral es menor que 10.048,2 millas.
Rechazar la hiptesis nula si la media muestral es superior a 10.048,2 millas.
EJEMPLO 3.8
SOLUCION:
X 198,4
4 grs
10%
n 16
4
1
16
X C H Z X
X C 200 (1,28) (1)
X C 200 1,28
X C 198,72
FIGURA 3.10
Como 198,4 es menor que 198,6 se rechaza la hiptesis nula de que 200 y en
consecuencia se puede decir que el fabricante no tiene la razn.
X C H t S X
X C H t S X
EJEMPLO 3.9
Una compaa que recibe cargamento de pilas tiene como poltica aceptar el envo
si el tiempo medio de vida de las pilas del cargamento es como mnimo de 50
horas. Para un cargamento en particular, el tiempo medio de vida en una muestra
aleatoria de 9 pilas fue de 48,2 horas con una desviacin tpica de 3 horas, si se
considera un nivel de significancia del 5% qu se podra decir de la aceptacin de
este lote.
SOLUCIN:
H 0 : 50
H A : 50
La hiptesis alternativa indica que es una prueba de cola a la izquierda por lo que
el valor crtico se calcula con el uso de la frmula:
X C H t S X
SX
Ademas,
S
n
3
9
X C 50 (1,86) (1)
As : X C
XC
Como
50 1,86
48,14
indica que no hay suficiente evidencia para rechazar el envo. Ver FIGURA 3.11
FIGURA 3.11
EJEMPLO 3.10
SOLUCION:
H 0 : 30
H A : 30
Se requiere una prueba de cola a la derecha con 25 -1 = 24 grados de libertad.
Para una prueba unilateral t0,05( 24) 1,711
X C H
t SX
X C 30 (1,711) ( 0,62)
X C 30 1,06
XC
31,06
libras
FIGURA 3.12
Como
EJEMPLO 3.11
ApexCompany supone que el 15% de las mercancas que producen por un nuevo
mtodo son defectuosas. En una muestra de 132 unidades hay 22 defectuosas.
Con un nivel de significancia del 10% Qu se puede decir de la suposicin de
ApexCompany?
SOLUCION:
El sistema de hiptesis es:
H 0 : 0.15
H A : 0.15
(0,15) ( 0.85)
0,031
132
PC H Z P
PC 0,15 (0,031) (1,65)
PC 0,15 0,05
PC 0,1 0.2
No rechazar Ho si la proporcin muestralPx est entre 0,10 y 0,20. Rechazar la
hiptesis Ho si Px es inferior a 0,10 o superior a 0,20
Px
22
0,17
132
Como Px = 0,17 est entre 0,10 Y 0,20, no se rechaza la hiptesis nula. Puede
decirse entonces que efectivamente el 15% de las mercancas producidas por la
compaa son defectuosas.
EJEMPLO 3.12
SOLUCION:
14
0.26
n 54
54
H ( 1 H )
(0,30 ) ( 0,70)
0,062
n
54
0.07
P
Px
PH 0,30
El 30% como mnimo se puede expresar como 0.30 que es la hiptesis nula,
luego el sistema a contrastar es:
H 0 : 0,30
H A : 0.30
La hiptesis alternativa indica una prueba de cola a la izquierda. El valor crtico se
determina al reemplazar en la frmula
PC : H Z P
Donde la tabla del apndice 1 muestra un valor de Z = 1,48
Luego
FIGURA 3.13
Como 0.26 > 0.21 no se rechaza la hiptesis nula, esto nos indica que puede
fundar su propia empresa.
EJEMPLO 3.13
SOLUCION:
H 0 : 0.10
H A : 0.10
La hiptesis alternativa indica que es una prueba de cola a la derecha, por tanto el
valor crtico se calcula con la expresin
H 0.10
PC H Z P
0.04
Px
36
0,12
300
H ( 1 H )
n
(0.10) (0.9)
0.017
300
El valor de Z para 4%, (0.5 - 0.04 = 0.46) segn la tabla 1 del apndice es igual
a 1,75, As:
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p308
d a y por
xi yi ,
da
S
2
d
2
i
nd a
n 1
dC t
Sd
n
EJEMPLO 3.14
PAREJA DE ESTUDIANTES
ASISTE
NO ASISTE
1
2
3
4
5
6
82
73
59
48
69
93
75
71
52
46
70
83
Asumiendo que las diferencias en las puntuaciones sigue una distribucin normal,
contrastar al nivel de significancia del 5% que la media de los puntajes es mayor
para los estudiantes que asisten al curso de preparacin.
SOLUCION:
Fase 1. Formulacin de la hiptesis
Sea
H0 : A B
H A : A B
dC t
Parejas de estudiantes
Asiste
No asiste
di
di2
1
2
3
4
5
6
SUMATORIA
82
73
59
48
69
93
75
71
52
46
70
83
7
2
7
2
-1
10
27
49
4
49
4
1
100
207
da
27
4,5
6
2
nd a
207 6 ( 4,5) 2 85,5
S
17,1
n 1
5
5
Sd 17,1 4,13
2
d
Sd
n
2
i
Con 0.05
t0.05 ; 5 2,015
dc t
Sd
n
4,13
d C 2,015
6
d C 3,4
FIGURA 3.14
Fase 3: Regla de decisin
No rechazar H0 si d a 3,39 , rechazar la hiptesis nula si da > 3,39
Fase 4: Conclusin
Como d a 4,5 3,39 se rechaza la hiptesis nula y se concluye que la media es
mayor para los estudiantes que asisten al curso de preparacin.
dc Z X
X
XB
XB
XB
Donde
A2 B2
nA
nB
Para llevar a cabo la prueba se compara la diferencia real entre las medias
mustrales, da X A X B con la diferencia crtica dC
EJEMPLO 3.15
X A =1.512 dlares
y X E =1.317
SOLUCIN:
H 0 : A E
H A : A E
La diferencia crtica se calcula con la frmula
dC Z X A X E
XE
A2
nA
E2
nE
517 2 4852
230
302
44,06
FIGURA 3.15
Regla de decisin:
No rechazar la hiptesis nula si: - 86,34 < d a < 86,34
Como da dC
EJEMPLO 3.16
Una empresa fabricante de camisas para hombres tiene dudas sobre el tiempo
medio necesario para fabricar sus dos modelos: clsico e informal. El jefe de
produccin afirma que lleva ms tiempo producir las camisas clsicas que fabricar
las informales. Los datos de produccin indican que para fabricar 90 camisas
clsicas se requiri una media de 140,2 horas con una desviacin tpica de 22,7
horas, mientras que para fabricar 110 camisas informales se tard una media de
131,7 horas con una desviacin tpica de 23,9 horas. Si el jefe de produccin tiene
razn, abandonarn la produccin de las camisas clsicas. Se deber hacer un
cambio en la lnea de produccin?
SOLUCION:
SX C
XI
SC2
S I2
nC
nI
XI
Como el jefe de produccin afirma que lleva ms tiempo producir las camisas
clsicas C , que las informales
H 0 : C I
H A : C I
Que exige una prueba de cola a la derecha.
SXC X I
(22,7)2
(23,9) 2
3,30
90
110
es Z 1,65
FIGURA 3.16
Resumen
El contraste de hiptesis, es un procedimiento que puede emplearse para
verificar, con base en la informacin muestral, la validez de una conjetura o
hiptesis, que se haya formulado sobre la poblacin.
FORMA 1
FORMA 2
FORMA 3
H 0 : 0
H A : 0
H 0 : 0
H A : 0
H 0 : 0
H A : 0
Prueba bilateral
Prueba unilateral
Prueba unilateral
FORMA 1
FORMA 2
FORMA 3
H0 : A B
H A : A B
H 0 : A B
H A : A B
Prueba bilateral
Prueba unilateral
H0 : A B
H A : A B
Prueba unilateral
modo sealado.
X 0
X 0
Para una media poblacional Muestras pequeas
SX
Px 0
X C H Z S X
X C H t S X
PC H Z P
X C H Z S X
XC
H Z X
X C H t S X
X C H t S X
PC H Z P
PC H Z P
Taller 3
1. Un fabricante ha estado recibiendo quejas de sus clientes por que los pedidos
llegan 12 o ms das despus de haber sido enviados. El fabricante selecciona
al azar 25 de los pedidos de la semana siguiente y los enva de una manera
diferente. Un estadstico ha de probar si el nuevo procedimiento es mejor, a un
nivel de significancia de = 0.05. El tiempo medio de entrega en la muestra
resulta de X =10, con una desviacin estndar muestral de s = 3 das. Haga la
prueba.
197
197
206
208
201
197
203
209
de 12,2 cajas.
Contrastar, al nivel del 5%, la hiptesis nula de que la media poblacional del
incremento en las ventas es al menos
era hombre y el otro mujer. La tabla adjunta recoge la mayor oferta salarial
que recibi cada miembro de la muestra al terminar su carrera. Asumiendo que
las distribuciones son normales contrastar la hiptesis de que la verdadera
media es mayor para los hombres que para las mujeres.
PAREJA
MUJER
1524
1586
1472
1540
1568
1566
1586
1590
1434
1486
1446
1596
1572
1608
1524
1588
10. Una revista especializada en computacin afirma que la gente tarda mximo34
horas, en promedio, en aprender un nuevo programa informtico. Est esta
afirmacin respaldada al nivel del 10% si 35 personas tardaron en aprender el
programa un promedio de 38,6 horas con una desviacin estndar de15,8
horas?
10
Evaluacin
1. Un fabricante de detergente afirma que el contenido medio de los paquetes
que vende es de al menos 200 gramos. Se sabe que la distribucin de los
pesos es normal, con desviacin tpica de cuatro gramos. Una muestra de
16 paquetes da una media de 198,4 gramos. Para realizar el contraste de
hiptesis, al nivel del10%, el sistema requerido es:
A.
H 0 : 200
H A : 200
B.
H 0 : 200
H A : 200
D.
C.
H 0 : 200
H A : 200
H 0 : 200
H A : 200
3.
A. 12.5
B. 50
C. 0,25
D. 1
A.
H 0 : 0.25
H A : 0,25
H 0 : 0,25
H A : 0,25
B.
H 0 : 0,25
H A : 0,25
D.
C.
H 0 : 25
H A : 25
A.0,240
B. 0,024
C. 0,283
D. 0,239
H 0 : 200
y
H A : 200
__
A. X X c
__
C. X X c
__
__
B. X cInf X X cSup
__
D. X X c
http://www.virtual.unal.edu.co/cursos/ciencias/2007315/html/un6/cont_08_69.html
PRESENTACION
PREGUNTA PROBLEMA
Cmo crees que el anlisis de regresin lineal puede aplicarse en la solucin
de situaciones especficas de una empresa?
COMPETENCIAS ESPECFICAS
SABERES
B. 2x 3 y 2 y 2
C. 3x 2 y 3 4 x
D. x 3 y 5
B. 1,5
C. -0,5
D. -1,5
ACTIVIDA GRUPAL
Socialice
los
resultados
obtenidos
individualmente
escriba
sus
conclusiones al respecto.
Redacte un informe sobre la importancia de la aplicacin de la regresin
lineal en que hacer de su profesin.
Escriba un listado de las dudas y dificultades en el desarrollo de la actividad
individual.
SABERES Y ACTIVIDADES
de
una
ms
variables
adicionales
(VARIABLES
EJEMPLO 4.1
EJEMPLO 4.2
EJEMPLO 4.3
De los ejemplos anteriores se puede deducir que dentro del anlisis de regresin
nos interesa lo que se conoce como la dependencia estadstica, y no la
dependencia funcional o determinstica entre las variables, como aquellas que se
representan en la fsica clsica.
Precio
1
2
.
.
.
i
.
.
.
n
X1
X2
.
.
.
Xi
.
.
.
Xn
Cantidad demandada
Y1
Y2
.
.
.
Yi
.
.
.
Yn
4. 2 TERMINOLOGIA Y NOTACIN
Variable Dependiente
Variable Independiente
Variable Explicada
Variable Explicativa
Variable Predicha
Variable Predictor
Variable Regresada
Variable Regresor
Variable Respuesta
Variable de Control.
Variable Endgena
Variable Exgena
Tabla 4.2
Ingreso familiar
80
55
65
79
60
70
84
Consumo por
65
74
90
semana.
75
80
70
85
88
115
162
191
Total
325
Valor esperado
65
77
E (Y/X= 120) = (1/5) (79) + (1/5) (84) + (1/5)(90) + (1/5) (94) + (1/5) (98) = 89.
En la ltima fila de la tabla 4.2 se muestran los dems valores esperados para Y
dado Xi respectivos.
Los valores de la tabla 4.2 se muestran en el siguiente diagrama de dispersin.
De aqu se puede concluir que cada media condicional E (Y/Xi) est en funcin de
Xi. Simblicamente:
E(Y/Xi) = f ( Xi)
(4.1)
(4.2)
Como se aprecia en la figura 4.3 a medida que el ingreso familiar aumenta, los
gastos de consumo familiar en promedio tambin aumentan. Pero si observamos
la tabla 4.2 se deduce que no necesariamente aumentan con el nivel de ingreso.
Por ejemplo: para un nivel de ingreso de $100.000 existe una familia cuyos gastos
de consumo de $65.000 son menores que el gasto de consumo de dos familias
cuyo ingreso semanal es solo de $80.000.
Sin embargo los gastos de consumo promedio de las familias con ingresos
semanales de $100.000 son superiores que los de familia con ingresos semanales
de $80.000; $77.000 y $65.000 mil respectivamente.
De este anlisis se concluye que para un nivel de ingreso dado Xi, los gastos de
consumo de una familia se concentran alrededor del consumo promedio de todas
las familias para ese mismo Xi, esto es, alrededor de su esperanza condicional.
Por consiguiente, se puede expresar la desviacin de un Yi individual alrededor de
su valor esperado as:
(4.3)
La ecuacin 4.3 postula que los gastos de una familia, dado su nivel de ingreso,
son iguales a los gastos promedios de consumo de todas las familias con ese nivel
de ingreso, ms una cantidad que es aleatoria.
Si se supone que E( Y/Xi) es lineal en Xi como en la ecuacin 4.2, entonces:
Yi = E( Y/Xi) +
i
(4.4)
En otras palabras, el supuesto de que la lnea de regresin pasa por los medios
condicionales implica que los
son iguales a
si
E(Yi / Xi) 0
Como en la prctica lo que est al alcance del analista es una muestra de valores
de Y correspondientes a valores fijos de X, se debe hacer consideraciones de
muestreo. Por consiguiente la tarea es la estimacin de la Funcin de Regresin
Muestral (FRM) con base en informacin muestral. Para ello supngase que se
obtienen dos muestras de Y seleccionadas aleatoriamente para valores fijos de X.
(vase tabla 4.3). Ahora se cuenta con un solo valor de Y para cada X dado.
respectivamente; aqu no existe modo alguno de afirmar con certeza cul de las
dos
lneas
representan
la
verdadera
lnea
de
regresin
poblacional.
muestras diferentes y no es
Muestra aleatoria 2
70
80
55
80
65
100
88
100
90
120
90
120
95
140
80
140
110
160
118
160
115
180
120
180
120
200
145
200
140
220
135
220
155
240
145
240
150
260
175
260
la regresin lineal
Yi 1 2 Xi
donde : Yi Estimador de E (Y / Xi)
I Estimador de 1
2 Estimador de 2
En la forma estocstica la funcin de regresin poblacional es:
Yi 1 2 Xi ei
En donde ei denota el trmino residual (muestral).
1 y 2
negativos. Si se quiere penalizar por igual los valores positivos y los negativos de
la misma magnitud, una posibilidad es trabajar con los cuadrados de ei . La suma
de las descripciones al cuadrado entre los puntos y la recta es:
ei
(Yi Yi ) 2
(Y i 1 2 Xi ) 2
Para minimizar,
respecto a 1 y 2 se tiene:
e 2 i
1
ei2
2
2 Yi 1 2 X i 0
2 Xi(Yi 1 2 Xi) 0
Yi Xi 0
Xi Yi Xi 0
1
Luego:
(1)
(2)
Yi
i 1
XiYi
i 1
Xi , entonces , Yi n
i 1
i 1
1 Xi 2
2
i
(1)
en (1) se tiene:
Yi 2 X i
Xi
(2)
(*)
Yi 2
XiYi
Xi
Xi X
XiYi
XiYi
Xi Yi
2 Xi
Xi Yi
Xi Yi
X
2
i
2
i
2 X i2
2 X i2
Entonces: 2
Xi
Xi Yi
n
Xi2
n
XiYi
X
2
i
n Xi
Yi
n.n
2
n Xi
n.n
EJEMPLO 4.4
Con los siguientes datos relativos a consumo renta (en Dlares) de 15 familias
ajuste una regresin:
Consumo = 1 2 renta.
Los datos se dan en dlares semanales.
Consumo 74 98
Renta
80 53 57 81 44 90 72 47 87 50 42 101 44
80 110 90 60 60 65 45 91 78 84 87 92 90 98
Solucin: Y
1 2 Xi
56
Yi
Xi
(Consumo)
(Renta)
XiYi
X i2
74
80
5920
6400
98
110
10780
12100
80
90
7200
8100
53
60
3180
3600
57
60
3420
3600
81
65
5265
4225
44
45
1980
2025
90
91
8190
8281
72
78
5616
6084
47
84
3948
7056
87
87
7569
7569
50
92
4600
8464
42
90
3780
8100
101
98
9898
9604
44
56
2464
3136
Y 68
X 79,06
XiYi 83810
2
i
98344
Xi Yi n X Y
X nX
0,69
2
98344 93757 ,25
4586,75
98344 15 (79,06)
2
i
2 0,69
1 Y 2 X
1 68 (0,69) (79,06)
1 13,38
n 15
dems
puntos.
SUPUESTO 1
El valor medio o promedio de i es igual a cero, ese decir, E( i /Xi) = 0.
Con este supuesto se asegura que aquellos factores que no estn
explcitamente incluidos en el modelo no afectan sistemticamente al valor de
Y. En otras palabras, se supone que los valores positivos de i se cancelan
con los valores negativos de tal forma que sus efectos promedios sobre Y es
cero.
SUPUESTO 2
Igual varianza para i . Esto quiere decir que el trmino aleatorio tiene la
misma varianza en cada periodo o elemento de la muestra. A esta propiedad
se le denomina HOMOCEDASTICIDAD, e implica que las observaciones de
Yi que corresponden a diferentes valores de Xi tienen la misma varianza.
Varianza de X i E i E ( i ) E ( i ) 2 2
2
SUPUESTO 3
No existe auto correlacin entre las i
Esto significa que los trminos aleatorios de un periodo son independientes
de los de cualquier otro periodo o covarianza.
( i , j ) E i E ( i ) j E ( j ) 0
SUPUESTO 4
Cero varianza entre i y Xi
Aqu se supone que el trmino de perturbacin es independiente de la
variable explicativa. Este supuesto se introduce para poder establecer un
efecto individualizado de X y de i sobre la variable Y. Si la variable
explicativa y el trmino aleatorio estn correlacionados no es posible
establecer su efecto individual sobre la variable explicada.
Dado que las perturbaciones siguen una distribucin para las que se han
introducido unos supuestos, la forma de clculo de los estimadores hace que ellos
tambin sean variables aleatorias con una cierta distribucin. Esto implica que el
verdadero valor puede cambiar de una muestra a otra y por ello resulta
conveniente alguna medida de precisin de estos estimadores. Para ello en
estadstica se utiliza la desviacin estndar o ERROR ESTANDAR DE LOS
ESTIMADORES. En este sentido cabe sealar que si a los supuestos anteriores
se les aade la hiptesis de que la variable i sigue una distribucin normal, con
media cero y varianza 2 , se puede demostrar que el cociente entre la diferencia
Donde
desviacin estndar o
representa la
error
estndar de 1 y se
obtiene mediante la
frmula:
ei2
S
n2
2
e
EJEMPLO 4.5
Con los datos relativos a Consumo Renta de 15 familias (ejemplo 4.4), construir
un intervalo de confianza del 95% para el coeficiente de regresin.
SOLUCION:
S
2
S e2
2
i
nX
ei2
S
, para este caso n 2 = 15 2 = 13
n2
2
e
2
i
ei Yi Yi ,
Yi 13,38 0,69 X i
Xi
Yi
80
ei2
74
Yi 13,38 0,69 X i
68,58
ei Yi Yi
5,42
29,3764
110
98
89,28
8,72
76,0384
90
80
75,48
4,52
20,4304
60
53
54,78
-1,78
3,1684
60
57
54,78
2,22
4,9284
65
81
58,23
22,77
518,4729
45
44
44,43
-0,43
0,1849
91
90
76,17
13,83
191,2689
78
72
67,20
4,80
23,0400
84
47
71,34
-24,34
592,4356
87
87
73,41
13,59
184,6881
92
50
76,86
-26,86
721,4596
90
42
75,48
-33,48
1120,9104
98
101
81,00
20,00
400,0000
56
44
52,02
-8,02
64,3204
1020
1019,04
0,96
3950,7228
1186
Luego S e2
As, S
2
2
i
3950,7228
3950,7228
303,90
13
S e2
2
i
nX
303,90
303,90
0,2574
2
4586,746
98344 15(79,06)
i i
S
t , n2 se puede verificar o
H o : 1 h
H A : 1 h
Como
i i
S
i h
S
t n2 .
Este valor se contrasta con el valor terico arrojado por las tablas de distribucin al
nivel de significancia escogido con n 2 grados de libertad. Debe tenerse en
cuenta si la hiptesis es bilateral o unilateral.
En el caso de una hiptesis bilateral, si el valor del estadstico es tal que t t c se
rechaza Ho.
EJEMPLO 4.6
Ho : 2 0
H A : 2 0
La eleccin del test de una sola cola responde al conocimiento que se tiene sobre
la teora de consumo que es funcin directa de renta.
Para un nivel de significancia del 5% y 13 grados de libertad, t c 1,77
Ahora, t
2 2
S
2
S
0,69
2,68
0,2574
Existe una medida de uso muy generalizada en el anlisis de regresin que indica
el grado de explicacin que la variable independiente logra al ajustar los datos
mediante una relacin lineal que se denomina coeficiente de determinacin, R
squared; cuando los datos son arrojados mediante ordenador.
11
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p398
12
PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p399
(Y
Y )2
Variabilidad
Total
SCT
(Y Y )
2
i
Variabilidad
no exp licada
SCE
SCR SCE
SCT SCT
Luego R 2 1
Pero
SCR
R2
SCT
SCE
SCT
Yi
74
Yi 13,38 0,69 X i
68,58
ei Yi Yi
5,42
98
89,28
80
Yi Y
6
Yi Y
0,58
8,72
30
21,28
75,48
4,52
12
7,48
53
54,78
-1,78
-15
-13,22
57
54,78
2,22
-11
-13,22
81
58,23
22,77
13
-9,77
44
44,43
-0,43
-24
-23,57
90
76,17
13,83
22
8,17
72
67,20
4,80
-0,8
47
71,34
-24,34
-21
3,34
87
73,41
13,59
19
5,41
50
76,86
-26,86
-18
8,86
42
75,48
-33,48
-26
7,48
101
81,00
20,00
33
13
44
52,02
-8,02
-24
-15,98
R2 1
3950,7228
0,3563
6138
( S XY ) 2
X Y
R
, donde S XY XY
S X SY
n
2
SX X
Para el ejemplo:
Y
Y
n
SY
S XY 83810
(1186 )(1020 )
3162
15
S X 98344
(1186) 2
4570,93
15
SY 75498
(1020) 2
6138
15
R2
( S XY ) 2
(3162 ) 2
9998244
0,3563
S X SY
(4570,93)(6138) 28056368 ,34
http://www.uv.es/uriel/material/Morelisi.pdf
http://www.youtube.com/watch?v=J1DoRMupI8k
http://www.slideshare.net/adangraus/regresion-lineal-simple-13381573
Resumen
En trminos generales se puede decir que: El anlisis de regresin est
relacionado con el estudio de la dependencia de una variable (VARIABLE
DEPENDIENTE)
de
una
ms
variables
adicionales
(VARIABLES
respecto a 1 y 2 se tiene:
Yi
2 Xi
n
Y 2 X
Xi Yi n X Y
X nX
2
i
Y 1 2 Xi
El Coeficiente de determinacin R2
variable independiente logra al ajustar los datos mediante una relacin lineal Es
una medida de uso muy generalizada en el anlisis de regresin.
(Y
Y )2
Variabilidad
Total
SCT
(Y Y )
2
i
Variabilidad
no exp licada
SCE
R2 1
SCE
SCT
0 R2 1
Taller 4
1. Una compaa asigna diferentes precios a una radio grabadora particular en 8
ciudades diferente del pas, la tabla adjunta muestra el nmero de unidades
vendidas y los precios correspondientes en miles de pesos.
Ventas:
420
380
350
400
440
380
450
420
Precio:
55
60
65
60
50
65
45
50
a. realice un grfico con estos datos y estime la regresin lineal de las ventas
sobre el precio.
b. Qu efectos se esperara en las ventas si se produjera un incremento de
10.000 pesos
c. Halle un estimador puntual del volumen de venta cuando el precio de radio
grabadora en una ciudad dada es de 48. 000 pesos.
d. Si el precio de una radio grabadora se fija en 48.000 pesos, hallar intervalos de
confianza del 95% para el volumen de ventas reales en una ciudad concreta y
para el nmero esperado de ventas en esa regin.
Y
X
22,6
2
i
145,7
X 25,4
X Y 150,5
i
i i
10
12
28
24
18
16
15
12
Puntuacin en el test:
55
60
85
75
80
85
65
60
X 2.550
n 1
Y 16
3.500.000
X Yi Y
n 1
18.000
2,4
7,2
14
10,3
10
9,1
10,2
4,1
7,6
3,5
Y = 0.00027
+ 0.7916X, donde Y es la
3.6
3.3
2.8
2.6
2.7
2.9
2.0
2.6
24
21
22
22
18
13
BENEFICIOS
GASTOS DE INVESTIGACION
50
60
40
50
30
45
50
50
40
40
30
50
40
45
35
55
9. Los economistas suelen afirmar que las variaciones del PNB real afectan a la
rentabilidad de los fondos de inversin. A continuacin se presentan los datos
recogidos para u periodo de 10 aos.
Porcentaje de variacin del PNB real
1.3
1.5
0.2
-1.1
1.9
2.1
2.6
2.4
3.1
2.7
21.0
25.0
18.0
7.0
25.0
21.0
31.0
29.0
33.0
32.0
Evaluacin
RESPONDA LAS PREGUNTAS CON BASE EN LA SIGUIENTE INFORMACION
x 62,5
y 23421,27
y 413,7
411,25
xy 2930,45
B.
(62,5)(413,7)
10
(62,5) 2
411,25
10
D.
2930,45
C.
(62,5)(413,7)
10
411,25 (6,25) 2
2930,45
2930,45 10(62,5)(413,7)
A.
411,25 10(62,5) 2
2930,45 10(6,25)(41,37)
411,25 10(62,5) 2
indica que:
413,7
A.
10
B.
413,7
10
C.
D.
(62,5)(413,7)
10
(62,5) 2
411,25
10
2930,45
(62,5)(413,7)
10
411,25 (6,25) 2
2930,45
10
411,25 10(62,5) 2
413,7 2930,45 10(6,25)(41,37)
10
411,25 10(62,5) 2
TABLA 1
DISTRIBUCION NORMAL13
Z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
13
0.00
0.0000
0.0398
0.0793
0.1179
0.1554
0.1915
0.2257
0.2580
0.2881
0.3159
0.3413
0.3643
0.3849
0.4032
0.4192
0.4332
0.4452
0.4554
0.4641
0.4713
0.4772
0.4821
0.4861
0.4893
0.4918
0.4938
0.4953
0.4965
0.4974
0.4981
0.4987
0.01
0.0040
0.0438
0.0832
0.1217
0.1591
0.1950
0.2291
0.2611
0.2910
0.3186
0.3438
0.3665
0.3869
0.4049
0.4207
0.4345
0.4463
0.4564
0.4649
0.4719
0.4778
0.4826
0.4864
0.4896
0.4920
0.4940
0.4955
0.4966
0.4975
0.4982
0.4987
0.02
0.0080
0.0478
0.0871
0.1255
0.1628
0.1985
0.2324
0.2642
0.2939
0.3212
0.3461
0.3686
0.3888
0.4066
0.4222
0.4357
0.4474
0.4573
0.4656
0.4726
0.4783
0.4830
0.4868
0.4898
0.4922
0.4941
0.4956
0.4967
0.4976
0.4982
0.4987
0.03
0.0120
0.0517
0.0910
0.1293
0.1664
0.2019
0.2357
0.2673
0.2967
0.3238
0.3485
0.3708
0.3907
0.4082
0.4236
0.4370
0.4484
0.4582
0.4664
0.4732
0.4788
0.4834
0.4871
0.4901
0.4925
0.4943
0.4957
0.4968
0.4977
0.4983
0.4988
0.04
0.0160
0.0557
0.0948
0.1331
0.1700
0.2054
0.2389
0.2704
0.2995
0.3264
0.3508
0.3729
0.3925
0.4099
0.4251
0.4382
0.4495
0.4591
0.4671
0.4738
0.4793
0.4838
0.4875
0.4904
0.4927
0.4945
0.4959
0.4969
0.4977
0.4984
0.4988
0.05
0.0199
0.0596
0.0987
0.1368
0.1736
0.2088
0.2422
0.2734
0.3023
0.3289
0.3531
0.3749
0.3944
0.4115
0.4265
0.4394
0.4505
0.4599
0.4678
0.4744
0.4798
0.4842
0.4878
0.4906
0.4929
0.4946
0.4960
0.4970
0.4978
0.4984
0.4989
0.06
0.0239
0.0636
0.1026
0.1406
0.1772
0.2123
0.2454
0.2764
0.3051
0.3315
0.3554
0.3770
0.3962
0.4131
0.4279
0.4406
0.4515
0.4608
0.4686
0.4750
0.4803
0.4846
0.4881
0.4909
0.4931
0.4948
0.4961
0.4971
0.4979
0.4985
0.4989
0.07
0.0279
0.0675
0.1064
0.1443
0.1808
0.2157
0.2486
0.2794
0.3078
0.3340
0.3577
0.3790
0.3980
0.4147
0.4292
0.4418
0.4525
0.4616
0.4693
0.4756
0.4808
0.4850
0.4884
0.4911
0.4932
0.4949
0.4962
0.4972
0.4979
0.4985
0.4989
0.08
0.0319
0.0714
0.1103
0.1480
0.1844
0.2190
0.2517
0.2823
0.3106
0.3365
0.3599
0.3810
0.3997
0.4162
0.4306
0.4429
0.4535
0.4625
0.4699
0.4761
0.4812
0.4854
0.4887
0.4913
0.4934
0.4951
0.4963
0.4973
0.4980
0.4986
0.4990
http://www.disfrutalasmatematicas.com/datos/distribucion-normal-estandar.html
0.09
0.0359
0.0753
0.1141
0.1517
0.1879
0.2224
0.2549
0.2852
0.3133
0.3389
0.3621
0.3830
0.4015
0.4177
0.4319
0.4441
0.4545
0.4633
0.4706
0.4767
0.4817
0.4857
0.4890
0.4916
0.4936
0.4952
0.4964
0.4974
0.4981
0.4986
0.4990
TABLA 2
DISTRIBUCION t (Unilateral)
TABLA 3
DISTRIBUCION t (Bilateral)
BIBLIOGRAFIA
CIBERGRAFIA
Distribuciones muestrales
http://ftp.utalca.cl/profesores/gicaza/Clases/7Distribuciones%20Muestrales.pdf
http://www.geociencias.unam.mx/~ramon/EstInf/Clase4.pdf
http://www.educatina.com/matematicas/probabilidad-y-estadistica/estadistica/poblacionestadistica/diferencias-en-la-distribucion-de-medias-muestrales-video
http://www.educandus.cl/estadistica/ejercicios/bases_teoricas/Distribucion/ResueltosDistribucio
nesMuestrales.pdf
Intervalos de confianza
http://www.slideshare.net/yohanabonillagutierrez/taller-intervalos-de-confianza
http://www.iesxunqueira1.com/Download/pdf/teointervalos.pdf
Prueba de hiptesis
http://www.youtube.com/watch?v=AJcy4eZMwWM
http://www.itch.edu.mx/academic/industrial/estadistica1/cap02.html
http://www.virtual.unal.edu.co/cursos/ciencias/2001091/html/un6/cont_601_54.html
Regresin Lineal
http://www.uv.es/uriel/material/Morelisi.pdf
http://www.youtube.com/watch?v=J1DoRMupI8k
http://www.slideshare.net/adangraus/regresion-lineal-simple-13381573
ESTADSTICA INFERENCIAL