Está en la página 1de 180

DIRECCIN DE EDUCACIN ABIERTA Y A DISTANCIA Y VIRTUALIDAD

PROGRAMA ADMINISTRACIN DE EMPRESAS

ESTADSTICA INFERENCIAL
MDULO EN REVISIN

DIRECCIN DE EDUCACIN ABIERTA Y A


DISTANCIA Y VIRTUALIDAD

PROGRAMA A DISTANCIA DE
ADMINITRACION DE EMPRESAS.

ESTADSTICA INFERENCIAL
COMPILADOR:
REDISEO:

EVER ANAYA COHEN


ROBINSON MORALES MEDINA
SINCELEJO

2014

TABLA DE CONTENIDO
INTRODUCCIN
JUSTIFICACIN
FORMAS DE ABORDAR LA LECTURA DEL MODULO
PROPSITOS DE FORMACIN
REFERENTE TERICO
ESTRUCTURA DEL MODULO ESTADSTICA INFERENCIAL
COMPETECIAS TRANSVERSALES A DESARROLLAR

SABERES
1
1.1
1.2
2.3

UNIDAD UNO: DISTRIBUCIONES FUNDAMENTALES DE MUESTREO


Distribucin muestral
Distribucin en el muestreo de la media muestral
Distribucin en el muestreo de una proporcin muestral

2
2.1
2.2
2.3
2.4

UNIDAD DOS: ESTIMACIONES POR INTERVALOS


Intervalos de confianza
Intervalos de confianza para la media poblacional
Intervalos de confianza para proporciones poblacionales
Intervalos de confianza para la media de dos poblaciones

3
3.1
3.2
3.3
3.4

UNIDAD TRES: CONTRASTE DE HIPTESIS


Concepto del contraste de hiptesis.
Prueba de hiptesis para la media poblacional
Prueba de hiptesis para la proporcin poblacional
Prueba de hiptesis para la diferencia de dos medias poblacionales

4
4.1
4.2
4.3
lineal.

UNIDAD CUATRO: REGRESIN LINEAL SIMPLE Y MULTIPLE


Interpretacin de la regresin, terminologa y notacin
Estimacin por mnimos cuadrados
Verificacin de hiptesis, capacidad explicativa de una funcin de regresin

1. INTRODUCCIN

Para el administrador de empresas es esencial la compresin de la Estadstica


inferencial dado que los diversos mtodos de estimacin, prediccin y contraste de
hiptesis son las herramientas fundamentales en la toma

de decisiones en

condiciones de incertidumbre.

Generalmente las poblaciones suelen ser demasiado grandes para estudiarlas en


su totalidad, por tanto se hace necesario la seleccin de una muestra
representativa que tenga un tamao ms manejable, la cual se utiliza para obtener
conclusiones generalizadas sobre la poblacin. Este tema se aborda en la primera
unidad.

Dada la utilidad de los intervalos de confianza en la toma de decisiones sobre


numerosas situaciones relacionadas con la empresa, en la unidad 2 se explica el
modo de construirlos e interpretarlos.

La unidad 3 desarrolla la forma como determinar la validez de una hiptesis o


conjetura sobre una situacin presentada en el mbito empresarial. En esta unidad
se estudian los contrastes de hiptesis para una o dos poblaciones.

El conocimiento del tipo de funcin que liga a determinadas variables econmicas


permitir descubrir la relacin que existe entre las mismas para ser utilizadas en la
toma de decisiones de poltica econmica o poltica empresarial. Por ello es
importante determinar la forma analtica y concreta de esta relacin recurriendo al
anlisis de regresin, y en especial al de regresin lineal, tema de la ltima unidad
del mdulo.

2. JUSTIFICACIN
La inferencia estadstica, como parte de la Estadstica que comprende los
mtodos y procedimientos para deducir propiedades de una poblacin a partir del
estudio de una parte de sta, es esencial para el administrador de empresas, el
contador y el economista dado que los diversos mtodos de estimacin, prediccin
y contraste de hiptesis son las herramientas fundamentales en la toma

de

decisiones en condiciones de incertidumbre, de tal manera que les permita ir ms


all de solo reportar y describir datos.

3. FORMAS DE ABORDAR LA LECTURA DEL MODULO

Estimado(a) estudiante:
Formarse como profesional en administracin de empresas en un programa a
distancia, requiere dedicacin, responsabilidad y de un buen mtodo de estudio
para cada uno de los mdulos que conforman el pensum acadmico.

Respondiendo a los propsitos del nivel de Estadstica Inferencial, ste mdulo ha


sido diseado para el trabajo auto dirigido, de modo que Usted pueda
responsabilizarse de su propio aprendizaje y enfrentar con xito la formacin
Estadstica requerida por la carrera profesional que ha elegido.

Un aprendizaje afectivo y duradero del Mdulo exige, de su parte:

Mantener una actitud de superacin para que con su esfuerzo personal logre
el desarrollo concienzudo de cada una de las actividades propuestas.

Tener un conocimiento profundo de su CIPAS, consiguiendo as que el


trabajo de equipo adquiera una intencin seria y metdica, para compartir
logros, ampliar experiencias, resolver dudas y afianzar aprendizajes
adquiridos.

Utilizacin adecuada de todos los apoyos institucionales, como el servicio de


tutora, la biblioteca, los materiales y medios audiovisuales, as como la
consulta en Internet,

Con tal propsito le recomendamos el siguiente procedimiento:


1. Realice una lectura atenta de cada una de las unidades, sealando y
anotando las ideas centrales, los conceptos bsicos y sus relaciones.

2. Desarrolle cada actividad, siguiendo las orientaciones que se le dan, sin


omitir ninguna por elemental que le parezca.
3. Una vez termine el desarrollo de los talleres, compare las soluciones con
las obtenidas por sus compaeros de grupo.

4. Anote las dudas e inquietudes para llevarlas al tutor y dems compaeros


en la sesin presencial.
5. Complemente la actividad con la consulta de textos, documentos, revistas,
pginas web, ect. Para fortalecer sus conocimientos sobre los temas
desarrollados en el mdulo.

Con la repeticin de ste procedimiento se pretende que cada uno de Ustedes


construya su propio mtodo de estudio, teniendo claro el tiempo que debe
dedicarle, el lugar de estudio ms adecuado, y la disciplina personal para
cumplir con la distribucin que haga de su tiempo y con los compromisos que
demanda el hecho de ser estudiante a distancia.

4. PROPSITOS DE FORMACIN
Al final del curso el alumno ser capaz de utilizar los mtodos y modelos
estadsticos

apropiados

para el tratamiento de la informacin numrica

fundamental para la toma de decisiones cuando existan condiciones de


incertidumbre, de formular y solucionar problemas propios de las ciencias
administrativas

5. REFERENTE TERICO

El Ministerio de Educacin Nacional en su documento serie lineamientos


curriculares (1998) en cumplimiento del artculo 78 de la Ley 115 de 1994
consideran que las matemticas en la escuela tienen un papel esencialmente
instrumental, que por una parte se refleja en el desarrollo de habilidades y
destrezas para resolver problemas de la vida prctica, para usar gilmente el
lenguaje simblico, los procedimientos y algoritmos y, por otra, en el desarrollo del
pensamiento lgico-formal, as como el pensamiento variacional.

Jos Chacn en su libro, Una Introduccin a la Estadstica Inferencial concluye


que sta es necesaria cuando queremos hacer alguna afirmacin sobre ms
elementos de los que vamos a medir. La estadstica inferencial hace que ese salto
de la parte al todo se haga de una manera controlada. Aunque nunca nos ofrece
r seguridad absoluta, s nos ofrecer una respuesta probabilstica. Esto es import
ante: la estadstica no decide; slo ofrece elementos para que el investigador o el
lector decidan. En muchos casos, distintas personas perciben diferentes conclusi
ones de los mismos datos.

Ciro Martinez B, en el libro Estadstica y Muestreo, opina que la estadstica facilita


una serie de instrumentos o tcnicas que, al ser utilizadas correctamente, permiten
determinar el grado de validez y confiabilidad, ya sea en las predicciones o las
conclusiones obtenidas a partir de la muestra.

PAUL NEWBOLD en el libro, Estadstica para los Negocios y la economa, realiza


un estudio completo sobre las distribuciones muestrales, los intervalos de
confianza, las pruebas de hiptesis y la regresin lineal; temas del presente
modulo
Mohammed A. Shayib, en el libro, Applied Statistics, aporta en otro idioma un
estudio completo sobre los temas tratados,
aplicacin.

as como algunos problemas de

6. ESTRUCTURA DEL MODULO

DISTRIBUCIONES
FUNDAMENTALES DE
MUESTREO

Distribucin en el
muestreo de la media
muestral

Distribucin en el
muestreo de una
proporcin muestral

Intervalos de confianza
para la media
poblacional

ESTIMACIONES POR
INTERVALOS

Intervalos de confianza
para la proporcin
poblacional

Intervalos de confianza
para la diferencia de
media de dos
poblaciones

ESTADSTICA
INFERENCIAL

Prueba de hiptesis para


la media poblacional

CONTRASTE DE
HIPTESIS

Prueba de hiptesis para


la proporcin
poblacional

Prueba de hiptesis para


la difrencia de media de
dos poblacioones

Estimacin por mnimos


cuadrados
REGRESIN LINEAL
SIMPLE

Verificacin de hiptesis
y capacidad explicativa
de una funcin de
regresin lineal.

7. COMPETECIAS TRANSVERSALES A DESARROLLAR


Competencias del Saber

Comprende las distribuciones mustrales de medias y proporciones.


Interpreta intervalos de confianza para le media
poblacionales.

para proporciones

Comprende el contraste de hiptesis para la media y proporcin poblacional.


Comprende el mtodo de los mnimos cuadrados para determinar la

ecuacin de regresin lineal.

Competencias del Saber Hacer

Aplica las distribuciones mustrales de medias y proporciones en


situaciones concretas de la Administracin, para el clculo de
probabilidades
Estima intervalos de confianza para le media
poblacionales.

para proporciones

Formula y contrasta hiptesis en situaciones especficas de


Administracin, tanto para la media muestral como para proporciones
Utilizar el mtodo de mnimos cuadrados ordinarios, para la estimacin de
parmetros del modelo de regresin en dos variables y establecer
inferencias a cerca de estos.

la

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal

PRESENTACION
La rama de la estadstica dedicada a la inferencia trata bsicamente con las
generalizaciones y predicciones, por ejemplo, se puede estar interesado en
averiguar acerca de la media o varianza de la distribucin poblacional de las
rentas familiares en una ciudad de la Costa Atlntica, o sobre la proporcin de
familias de esta ciudad que tienen unos ingresos inferiores a $450.000.

Para hacer este tipo de afirmaciones las poblaciones suelen ser demasiado
grandes para estudiarlas en su totalidad, por lo tanto se hace necesario elegir una
muestra representativa que tenga un tamao ms manejable, sobre la base de la
informacin muestral; nuestro objetivo ser hacer inferencia acerca de la poblacin
de la que procede la muestra.

PREGUNTA PROBLEMA
Cmo se puede aplicar las distribuciones muestrales en la solucin de situaciones
concretas de una empresa?

COMPETENCIAS ESPECFICAS

1. Define que es una distribucin muestral.


2. Utiliza informacin para crear una distribucin muestral.
3. Aplica las distribuciones mustrales de medias y proporciones para el

clculo de probabilidades en situaciones concretas de empresas

SABERES

Distribucin muestral
Distribucin en el muestreo de la media muestral
Distribucin en el muestreo de una proporcin muestral

DINMICA PARA CONSTRUIR EL CONOCIMIENTO


ACTIVIDAD PREVIA (Trabajo Individual)

Supongamos una poblacin de 6 familias cuyos gastos mensuales en educacin,


en miles de pesos, son: 120, 100, 90, 95, 115, 110.
Con base en esta informacin responde:
1. Cuantas muestras diferentes de 3 familias pueden obtenerse?
2. Cuantas muestras diferentes de 4 familias pueden obtenerse?
3. La media muestral del gasto es igual para cada muestra?
4. La media de las medias muestrales es igual para las muestras de tres familias
que para las de cuatro?
5. La media para la poblacin es igual a la media de las medias muestrales para
las muestras de tres familias o para las de cuatro familia.
6. La desviacin estndar de la media de medias es igual para cualquier tamao
de muestra?
7. La desviacin estndar de la media de medias muestrales es igual a la de la
poblacin?

ACTIVIDAD GRUPAL

1 Socialice los resultados obtenidos individualmente y escriba sus conclusiones


al respecto.
2 Justifique el uso del factor de correccin para poblaciones finitas al calcular el
error tpico.
3 Haga un listado de las dudas e inquietudes presentadas en la socializacin de
las actividades anteriores.

SABERES Y ACTIVIDADES
1 DISTRIBUCIONES MUESTRALES

1.1 DISTRIBUCION MUESTRAL

Quienes toman decisiones lo hacen con solo tomar una muestra.Por ejemplo,
considrese un fabricante que desea saber los tiempos que requieren en promedio
los trabajadores para terminar un trabajo dado, o la cantidad promedio de
combustible necesario para enviar un camin a cierta distancia, o la edad
promedio de quienes utilizan un producto, o la porcin de mercado para un
producto, o el porcentaje de unidades defectuosas en un lote de produccin o
sobre la proporcin de personas que ven un determinado programa de televisin.

En todos estos casos el estadstico est interesado en saber algo sobre una
poblacin estadstica. A falta de un censo, el conocimiento deseado sobre
parmetros como la media de la poblacin ( ), la desviacin estndar de la
poblacin ( ) o la proporcin de una poblacin ( ), slo se puede adquirir si se
saca una muestra representativa de la poblacin, se calcula los estadsticos como
la media muestral ( X ), la desviacin estndar (S) o la proporcin muestral (P), y
se hace inferencia sobre los parmetros a partir del ellos. El proceso de inferir los
valores de parmetros desconocidos de una poblacin, a partir del estadstico de
una muestra conocida se denomina estimacin.

Para comprender la naturaleza de una estimacin estadstica es necesario


entender bien el concepto de la distribucin muestral, sta proporciona un enlace
importante entre la muestra individual que por lo general se toma y la poblacin
sobre la cual se hace inferencia. Es importante distinguir entre las caractersticas
poblacionales y sus correspondientes cantidades mustrales, por ejemplo la media
( ), que es un atributo de la poblacin, es un nmero fijo desconocido. Para hacer
inferencia sobre tal atributo, se extrae una muestra de la poblacin y se calcula la

media muestral.

Dado

que para cada muestra que se extraiga se

obtendr,posiblemente, un valor diferente de la media, se puede pensar en esta


cantidad

como una variable aleatoria con una cierta distribucin de probabilidad.

La distribucin de probabilidad de los posibles resultados

mustrales

proporcionan una base para realizar inferencia sobre la poblacin.

Para ilustrar el concepto consideremos que de una gran empresa que tiene 300
empleados se desea tomar una muestra, por ejemplo de 25 empleados, y a partir
de esta muestra calcular el salario medio, y la proporcin P, de hombres que
laboran en la empresa. Esta media muestral sirve despus como estimacin de ,
media aritmtica del salario de los 300 trabajadores.

Como es posible extraer

300

C 25 1,95 x10 36 muestras diferentes de tamao 25, para

hacer ms didctico el ejemplo, supngase que se tiene una poblacin de N=5


empleados cuyo salario y sexo se muestran a continuacin:

TABLA 1.1 Poblacin hipottica de salarios y sexo de empleados.


EMPLEADO

SALARIO MENSUAL
( Miles de peso)

SEXO

Alejandro

400

Berena

300

Carlos

350

Sandra

500

Eliecer

450

Con esta informacin completa al alcance

es fcil calcular las medidas de

resumen de dicha poblacin como es el salario mensual medio ( ), junto con su


varianza ( 2 ) y desviacin estndar ( ), as como la proporcin de hombres (

h ) en las filas de empleados.


Medidas de resumen:
a). Salario.

b) Sexo.

x 2000 400

(x )
N

3
0,6 (Proporcin de hombres)
5

5000 ,

5000 70,71

Supngase que no se dispone de esta informacin tipo censo, por lo tanto se


decide hacer la estimacin con una muestra aleatoria de n = 3 empleados con el
fin de estimar los parmetros desconocidos, entonces se elige al azar una de las
muestras posibles, (vase tabla 1.2), por ejemplo, la muestra conformada por los
empleados: Berena, Sandra, Eliecer. (B,S,E) con los cuales se tiene que: =
416.666 pesos, da una estimacin del salario mensual medio de 416.666 pesos y
una proporcin de hombres en la empresa del 33.3%.

TABLA 1.2 Estimaciones para cada una de las muestras seleccionadas


Media muestral ( ) Proporcion de

Nmero de la

Unidades en la

muestra

muestra

(miles de pesos)

hombres (Ph)

ABC

350

2/3

ABS

400

1/3

ABE

383,333

2/3

ACS

416,667

2/3

ACE

400

3/3

ASE

450

2/3

BCS

383,333

1/3

BCE

366,667

2/3

BSE

416,667

1/3

10

CSE

433,333

2/3

Si se supone que la probabilidad de elegir cualquier muestra es la misma, la


probabilidad de elegir una muestra que d una de 350 mil es: (
5

C3

Como = 400 mil, la probabilidad de elegir al azar una muestra que de una
estimacin exacta de es solamente de: (

8 de las 10 muestra darn por resultado una cantidad errnea en el proceso de


estimacin de . Esta cantidad se llama ERROR MUESTRAL, y es la diferencia
entre y la media muestral que se utiliz para estimarla. La diferencia se debe al
azar; si el azar dicta que se extraigan unas cuantas observaciones muy grandes,
la media aritmtica dar estimaciones excesivas de , por ejemplo: Si por azar
sucede que se elija la muestra 9 en la tabla 1.2, la estimacin de sera

que es superior al valor de la media aritmtica en la poblacin, si por el


contrario el azar hace que se extraiga la muestra 1, la muestra dar una
estimacin insuficiente de (

ERROR MUESTRAL: Es la diferencia entre el parmetro y el estadstico de la


muestra utilizado para estimarlo.

Es evidente que nunca se podr calcular el tamao real del error muestral, puesto
que la media poblacional sigue siendo desconocida, pero hay que ser consciente
de la probabilidad de incurrir en este error.

Con una poblacin de N = 5 se puede listar todas las medias mustrales posibles,
junto con su probabilidad. Dicha lista se llama DISTRIBUCIN MUSTRAL y se
refleja en la tabla 1.3

TABLA 1.3 Distribucin muestral de la media


Media Muestral

Nmero de muestras que Poseen

Probabilidad

350

1/10

366,667

1/10

383,333

2/10

400

2/10

416,667

2/10

433,333

1/10

450

1/10

Una posible interpretacin de la tabla 1.3 es: Si han de seleccionarse, por ejemplo
1.000 muestras aleatorias simples de tamao n=3, de la poblacin de N = 5,
podra esperarse calcular 100 veces un salario medio de 350 mil pesos o 200
veces un salario medio de 400 mil pesos.

ESTADIGRAFOS Y DISTRBUCION MUESTRAL


Supongamos que se ha extrado una muestra aleatoria de una poblacin y
que se desea hacer inferencia sobre ciertas caractersticas de la distribucin
de la poblacin, esta inferencia est basada en algn estadgrafo, es decir,
alguna funcin particular de la informacin muestral. La lista de todos los
valores posibles de un estadstico y la probabilidad asociada a cada valor se
denomina distribucin muestral.

1.2 DISTRIBUCION EN EL MUESTREO DE LA MEDIA MUESTRAL

Supngase que se ha extrado una muestra de n observaciones de una poblacin


con una media y varianza 2 , si se representan los elementos de la muestra por
, antes de que la muestra haya sido seleccionada, habr
incertidumbre sobre los resultados. Esta incertidumbre es consecuencia del hecho
de que cada uno de los miembros de la muestra es una variable aleatoria con
media

y varianza x2 . Si el inters es hacer inferencia sobre la media

poblacional, un punto de partida es el promedio de los valores mustrales, es


decir, el anlisis de la distribucin muestral de la variable aleatoria .

En primer lugar se determina la media de esta distribucin. Como para variables


aleatorias discretas y continuas, la esperanza matemtica de una suma es la
suma de las esperanzas matemticas, se tiene que: (
(

)y como cada variable aleatoria

tiene media

, entonces,

Pero la media muestral es la suma de los valores de la muestra multiplicada por


1/n, por lo tanto,

( )

En consecuencia, la media de la distribucin en el muestreo de la media muestral


es la media poblacional

( )
Esto quiere decir, que la media de las medias mustrales, conocida como la media
general, es igual a la media poblacional.

, K numero de muestras

ACTIVIDAD: Verifica estos valores con los datos de la tabla 1.3

1.2.1 ERROR TIPICO DE LA DISTRIBUCION MUESTRAL DE MEDIAS

La distribucin muestral de las medias mustrales tienen tambin una varianza.


Esta varianza de la distribucin de todas las medias mustrales mide la dispersin
de las observaciones individuales (medias mustrales) en torno a su media (media
general). Se calcula como cualquier otra varianza, es la media aritmtica de los
cuadrados de las desviaciones respecto a la media. Es decir, si

es la varianza

de la distribucin muestral de las medias mustrales, entonces:


(

,Knmero de muestras.

Con los salarios de los 5 ejecutivos del ejemplo se tiene:


(

(
(

)
)

Pesos al cuadrado.
Si se extrae la raz cuadrada de la varianza de la distribucin de estas medias
mustrales se tiene el error tpico de la distribucin muestral.
Error tpico de la distribucin muestral en medias mustrales.

Para el ejemplo:

pesos

ERROR TIPICO: Es la medida de la variacin de las medias mustrales en


torno a la media general. Por tanto, mide la tendencia a incurrir en error de
muestreo en el intento de estimar el parmetro.

Si el tamao de la poblacin es muy grande con respecto al tamao muestral,


entonces, una consecuencia del muestreo aleatorio simple es que la distribucin
de cada uno de los valores de la muestra es independiente de la de los otros, en
tal caso la varianza de la suma es la suma de las varianzas y por tanto:
(
Como cada

tiene varianza

, entonces:

(
(

)
)

( )

Luego

Esto implica que la varianza de la distribucin muestral de decrece a medida


que aumenta el tamao de la muestra. As, cuantas ms observaciones tenga la
muestra, ms concentrada estar la distribucin muestral de la media muestral
alrededor de la media poblacional. En otras palabras cuanto mayor sea la
muestra, ms segura ser nuestra inferencia acerca de la media poblacional.

Se puede encontrar una aproximacin suficiente de la varianza y del error tpico


con mucha ms facilidad mediante las expresiones:

Es evidente que estos formatos suponen conocer la varianza de la poblacin.

1.2.2

ERROR TIPICO Y NORMALIDAD.

Si los datos de una poblacin siguen una distribucin normal, la distribucin


muestral de las medias mustrales tambin ser normal, es decir, si de una
poblacin que sigue una distribucin normal se toman todas las muestras posibles
de tamao determinado y despus se calculan las medias de todas esas
muestras, las medias mustrales seguirn una distribucin normal.

Supngase que se tienen los ingresos de varios millares de estudiantes que dan
una media de 500 mil pesos y que dichos ingresos siguen una distribucin normal.
Si se eligen todas las muestras de tamao n de esa poblacin normal de ingreso
de los estudiantes, la distribucin muestral de las medias mustrales tambin ser
normal.

Como el error tpico de la media muestral es

, entonces,

Esto quiere decir que las estn menos dispersas que los datos originales.

De la expresin

tambin se puede concluir que a medida que aumenta el

tamao de la muestra el error tpico ser menor.

1.3 TEOREMA CENTRAL DEL LMITE

Una distribucin de medias mustrales sigue una distribucin normal si las


muestras se toman de una poblacin normal, pero en muchos casos la poblacin
no sigue una distribucin normal, entonces debemos recurrir al teorema central del
lmite. Esta proposicin esencial afirma que para cualquier poblacin sea normal o
no, la distribucin de las medias muestralesse aproximar a la normalidad si el
tamao de la nuestra es grande, (n30)
TEOREMA CENTRAL DEL LIMITE:
desviacin tpica

Para una poblacin con media y

medida que el tamao de la muestra n aumenta, la

distribucin muestral de medias mustrales se aproxima a una distribucin


normal con

1. 4 FACTOR DE CORRECCION CON POBLACIONES FINITAS.

El teorema central del lmite y la hiptesis de una distribucin normal de las


medias mustrales slo se aplica si el muestreo se realiza con remplazamiento o
la extraccin se hace de una poblacin infinita. Si la poblacin es finita y el nmero
n de miembros de la muestra no es una fraccin muy pequea del nmero N
(supera el 10%) de la poblacin, no se puede asumir que los valores individuales
de la muestra se distribuyan independientemente. Si la extraccin se hace sin
sustitucin el proceso de muestreo queda alterado, la probabilidad de elegir un
elemento dado en cualquier extraccin depende de la seleccin previa realizada
anteriormente.

Si se quiere compensar esta modificacin de probabilidades es preciso utilizar el


factor de correccin para poblaciones finitas al calcular el error tpico. En concreto,

se deduce que si la extraccin se hace sin sustitucin de una poblacin finita, la

* +*

varianza es:

* + [

EJEMPLO 1.1
La oficina del DANE desea estimar el ndice de natalidad por 100.000 habitantes
en las 100 localidades ms grandes del pas. Se sabe que la desviacin tpica de
los ndices de natalidad de estos 100 centros urbanos es de 12 nacimientos por
cada 100.000 habitantes.
a. Calcular la varianza y la desviacin tpica de la distribucin muestral de

n= 8

localidades.
b. Calcular la varianza y la desviacin tpica de la distribucin muestral de n= 15
localidades.

SOLUCION:

a. Como la fraccin

se puede considerar pequea, no se necesita el

factor de correccin. La varianza y el error tpico son:


(

b. Como

, no es una fraccin pequea (mayor que el 10%) es preciso

aplicar el factor de correccin, por tanto, La varianza y el error tpico son:

* +*

+*

+ [

1.5

DISTRIBUCIN

EN

EL

MUESTREO

DE

UNA

PROPORCIN

MUESTRAL

Si se repite un experimento que tiene probabilidad de xito , entonces la variable


aleatoria X , que recoge el nmero total de xitos en n repeticiones, sigue una
distribucin binomial. Un problema comn consiste en que el parmetro sea
desconocido. Por ejemplo: una corporacin financiera interesada en determinar
cul es la proporcin de clientes que pagan puntualmente sus obligaciones
crediticias o un gerente interesado en la proporcin de artculos defectuosos que
se producen en un turno determinado en una factora. En situaciones de este tipo
es natural basar nuestra inferencia en la proporcin de xitos en una muestra
tomada de la poblacin que nos interese.
PROPORCION MUESTRAL
Sea X el nmero de xitos en una muestra binomial, de n observaciones,
donde la probabilidad de xito es , entonces, la proporcin de xito en la
muestra

Recibe el nombre de proporcin muestral.

La media y la varianza de la distribucin muestral de la proporcin muestral puede


deducirse fcilmente a partir de la media y la varianza del nmero de xitos que
viene dado por:

( )

( )

( )

),

luego: (

( )

.Es decir, la media de la proporcin muestral es la proporcin

de xitos en la poblacin.

Su varianza es :

( )

( )

( )

La desviacin tpica de la proporcin muestral, es la raz cuadrada de la varianza


y recibe el nombre de error estndar y est dada por:

Se utiliza el factor de correccin si la proporcin de la muestra con respecto a la


poblacin

supera el 10%. En tal caso la desviacin tpica de la distribucin de

proporciones muestrales queda:

Si se resta a la proporcin muestral su media y se divide por el error estndar,


se obtiene una variable aleatoria con distribucin normal estndar.

1.6 APLICACIONES DE LAS DISTRIBUCIONES MUSTRALES.

La importancia de las distribuciones mustrales estriba en que muchas decisiones


se toman a partir de resultados mustrales, por ejemplo:

El director de una empresa elige una muestra de un producto para determinar


si se cumplen determinadas especificaciones de produccin.

Un organismo oficial toma una muestra de vecinos de una poblacin para


decidir si un determinado programa de Bienestar producir los resultados
deseados.

El gerente de una compaa de seguro elige una muestra para determinar la


proporcin de clientes que utilizan el seguro por accidente de sus vehculos.

Una aplicacin muy corriente de la distribucin muestral es determinar la


probabilidad de que la media de una muestra caiga dentro de un intervalo
determinado. Puesto que la distribucin muestral seguir una distribucin normal
porque: 1. La muestra se toma de una poblacin normal y 2. El teorema Central
del Lmite garantiza la normalidad si se seleccionan muestras grandes, y adems,
muchas decisiones empresariales dependen de una muestra completa y no solo
de una observacin, entonces la frmula de transformacin ha de ser modificada
para que se tenga en cuenta que no estamos interesados en una observacin X
sino en la media y la frmula Z se convierte en:

Variable tipificada de la distribucin muestral.

EJEMPLO 1.2
La desviacin tpica de las compras realizadas por los clientes de una tienda
concreta es de 18 dlares. Si se toma una muestra al azar de 100 consumidores.
a. Cul es el error tpico de la distribucin muestral?
b. Cul es la probabilidad de que la media muestral supere la media poblacional
en ms de 5 dlares?

SOLUCION:

a.

b. Como la diferencia entre

se establece en

se tiene:

o un rea de 0,4973.
Luego: (

Es decir, la probabilidad de que la media muestral supere la media poblacionalen


ms de 5 dlares es de 0,27%
EJEMPLO 1.3

La duracin de las bombillas producidas por un cierto fabricante tiene una media
de 1.200 horas y una desviacin tpica de 400 horas. La poblacin sigue una
distribucin normal. Suponga que se han comprado 49 bombillas que pueden ser
consideradas como una muestra aleatoria de la produccin del fabricante.
a. Cul es la media de la media muestral de la duracin de estas bombillas?
b. Cul es la varianza de la media muestral?
c. Cul es el error estndar de la media muestral?
d. Cul es la probabilidad de que el tiempo medio de la duracin de las 49
bombillas sea de menos a 1050 horas?

SOLUCIN:

a.

Como

b.

c.

d.

Se calcula el valor de Z as:

La probabilidad pedida es : (

La probabilidad que una variable aleatoria sea menor que -2,63 segn la tabla 1
del apndice es: 0,5 0,4957 = 0,0043, luego la probabilidad de que el tiempo
medio de duracin de las 49 bombillas sea menor de 1.050 horas es del 0,43%.

EJEMPLO 1.4

En un curso de administracin de empresas hay 250 estudiantes. Cada uno de los


integrantes de una muestra aleatoria de 50 estudiantes es interrogado con el fin de
estimar la cantidad de tiempo que gasta semanalmente en resolver los problemas
de estadsticas. Supngase que la desviacin tpica de la poblacin es de 30
minutos.
a. Cul es la probabilidad de que la media muestral exceda a la media
poblacional en ms de 2,5 minutos?
b. Cul es la probabilidad de que la media muestral este ms de 5 minutos por
debajo de la media poblacional?
c. Cul es la probabilidad de que la media muestral difiera de la media
poblacional en ms de 10 minutos?

SOLUCIN:

a. Como la diferencia entre

se establece en

y adems la fraccin

, entonces se debe utilizar el factor de correccin para


poblaciones finitas en el clculo el error estndar, es decir:

Luego: (

La probabilidad de que la media muestral exceda a la media poblacional en ms


de 2,5 minutos es del 25,46%

b. La expresin que la media muestral este ms de 5 minutos por debajo de la


media poblacional se puede escribir como
Luego: (

:
)

La probabilidad de que la media muestraleste ms de 5 minutos por debajo de la


media poblacional es de 9,51%

c. La expresin que la media muestral difiera de la media poblacional en ms de


10 minutos se puede escribir as:

Luego la probabilidad de que la media muestral difiera en mas de 10 minutos de la


media poblacional est dada por:
(

EJEMPLO 1.5

Una empresa empacadora de cereales asegura que la media del peso que
contienen las cajas de estos cereales es de 200 gramos y sus desviacin tpica de
6 gramos. La distribucin en los pesos es normal. Se eligen 4 cajas que pueden
ser consideradas como una muestra aleatoria del total de la produccin.
a. Cul es el error estndar de la media muestral del peso de estas 4 cajas?
b. Cul es la probabilidad de que, como media, el peso de estas 4 cajas sea
menor que 197 gramos?
c. Cul es la probabilidad de que, como media, el peso de estas 4 cajas sea
mayor que 206 gramos?
d. Cul es la probabilidad de que, como media, el peso de estas cuatro cajas
este entre 195 y 205 gramos?

SOLUCION:
a.

b. Se calcula el valor de Z:
Luego:

La probabilidad pedida es del 15,87%.


c. Se calcula el valor de Z:
Luego:

La probabilidad pedida es del 2,28%

Ahora se pide calcular (

y
(

EJEMPLO 1.6
El dueo de una tienda de discos ha comprobado que el 20% de los clientes que
entran a su tienda realizan alguna compra. Un da entran a la tienda 180 personas,
que pueden ser considerados como una muestra aleatoria de todos los clientes:
a. Cul ser la media de la proporcin muestral de clientes que realizaron
alguna compra?
b. Cul es la varianza de la proporcin muestral?
c. Cul es el error estndar de la proporcin muestral?
d. Cul es la probabilidad de que la proporcin muestral sea menor que 0,15?

SOLUCION:
a.

( )

( )

b. La distribucin muestral de
(

tiene varianza
)

El error muestral de la distribucin de

es:

=0,0298

c. La variable tipificada es:


Por lo tanto (

(ver grafica)

La probabilidad de que la proporcin muestral sea menor que 0,15 es de 4,75%

EJEMPLO 1.7
Un proceso industrial genera el 8% de unidades defectuosas. Usted compra 100
unidades, cual es la probabilidad de que sean defectuosas menos del 10%.

SOLUCION:

La probabilidad de que sean defectuosos menos del 10% es del 77%.

EJEMPLO 1.8
Un proceso de produccin en curso produce un 10% de artculos defectuosos. Un
inspector de calidad toma una muestra aleatoria simple de 70 artculos y
rechazar toda la produccin si ms de un 5% de la muestra est defectuosa.
Cul es la probabilidad de rechazo?
SOLUCION:

La probabilidad de que sea rechazada toda la produccin es del 91,77%


Consulte las siguientes pginas en intenet:
http://ftp.utalca.cl/profesores/gicaza/Clases/7Distribuciones%20Muestrales.pdf
http://www.geociencias.unam.mx/~ramon/EstInf/Clase4.pdf
http://www.educatina.com/matematicas/probabilidad-y-estadistica/estadistica/poblacionestadistica/diferencias-en-la-distribucion-de-medias-muestrales-video

1.5 RESUMEN

La DISTRIBUCIN MUESTRAL proporciona un enlace importante entre la


muestra individual que por lo general se toma y la poblacin sobre la cual se hace
inferencia y se define como La lista

de todos los valores posibles de un

estadstico y la probabilidad asociada a cada valor.

ERROR MUESTRAL: Es la diferencia entre el parmetro y el estadstico de la


muestra utilizado para estimarlo.

ERROR TIPICO: Es la medida de la variacin de las medias mustrales en torno a


la media general. Por tanto, mide la tendencia a incurrir en error de muestreo en el
intento de estimar el parmetro y est dado por

TEOREMA CENTRAL DEL LIMITE:

A medida que el tamao de la muestra n

aumenta, la distribucin muestral de medias mustrales se aproxima a una


distribucin normal con

Si la poblacin es finita y el nmero n de miembros de la muestra no es una


fraccin muy pequea del nmero N de la poblacin, no se puede asumir que los
valores individuales de la muestra se distribuyan independientemente, la
probabilidad de elegir un elemento dado en cualquier extraccin depende de la
seleccin previa realizada anteriormente. Para compensar esta modificacin de
probabilidades es preciso utilizar el factor de correccin para poblaciones finitas al

calcular la varianza y el error tpico. Si la extraccin se hace sin sustitucin de una


poblacin finita, la varianza es:

* +*

* + [

PROPORCION MUESTRAL: Sea X el nmero de xitos en una muestra binomial,


de n observaciones, donde la probabilidad de xito es entonces, la proporcin
de xito en la muestra
La

media

, Recibe el nombre de proporcin muestral.

la

varianza

de

la

lasproporcionesmuestralesestn

( )

distribucin
dadas

( )

muestral

de
por:

La desviacin tpica de la proporcin muestral, es la raz cuadrada de la varianza y


recibe el nombre de error estndar.

si

Variable tipificada de la distribucin muestral de medias.

Variable tipificada de la proporcin muestral.

Taller 1
1. Los gastos semanales (en dlares) en publicidad hechos por N = 5
competidores se indican en la siguiente tabla. Establezca la distribucin
muestral para el promedio de gastos, para una muestra aleatoria simple de 3
competidores.
COMPETIDOR

DOLRES

100

92

118

70

135

2. Un banco reporta que la poblacin de sus saldos de depsito a la vista estn


normalmente distribuidos con una media de 1.200 y una desviacin estndar
de 250. Un auditor rechaza certificar el reporte del banco y toma una muestra
aleatoria de 36 estados de cuentas. El certificar el reporte solo si la media
muestral se encuentra a 50 dlares de la supuesta media poblacional. Cul
es la probabilidad de dicho hallazgo?

3. Una fbrica produce pistones cuyos dimetros se encuentran adecuadamente


clasificados por

una distribucin normal con un dimetro promedio de 20

centmetros y una desviacin estndar igual a 0,004 centmetros. Para que un


pistn sirva, su dimetro debe encontrarse entre 4,998 y 5,002 centmetros. Si
el dimetro del pistn es menor que 4,998 se desecha; si es mayor que 5,002
el pistn puede reprocesarse. Se selecciona una muestra de 8 pistones. Qu
porcentaje ser desechado? Qu porcentaje ser reprocesado?

4. Cuando un cierto proceso

de produccin est funcionando correctamente,

la resistencia en ohmios de los componentes producidos sigue una distribucin


normal con media 92 y desviacin tpica 3,6. Se toma una muestra aleatoria de
cuatro componentes

a. Hallar la media de la distribucin muestral de la media muestral de la


resistencia.
b. Hallar la varianza de la media muestral.
c. Hallar el error estndar de la media muestral
d. Cul es la probabilidad de que la media muestral resulte ser mayor que 93
ohmios.

5. Supongamos que la desviacin tpica de la cuota pagada mensualmente por


los estudiantes de cierta ciudad americana es de 40 dlares. Se toma una
muestra de 100 estudiantes

con el fin de estimar la renta media pagada

mensualmente por el total de la poblacin de estudiantes.

a. Cul ser el error estndar de la media muestral de la cuota mensual?


b. Cul es la probabilidad de que la media muestral exceda a la media
poblacional en ms de cinco dlares?
c. Cul es la probabilidad de que la media muestral este ms de 4 dlares por
debajo de la media poblacional?
d. Cul es la probabilidad de que la media muestral difiera de la media
poblacional en ms de tres dlares

6. Una compaa quiere estimar la proporcin de personas que son posibles


compradores de afeitadoras elctricas y que ven los partidos de ftbol del
campeonato nacional. Se toma una muestra de 120 individuos que se
identificaron como posibles compradores de afeitadoras elctricas.Suponga

que la proporcin de posibles compradores de afeitadoras elctricas en la


poblacin que ven las transmisiones es del25%.

a. 0.10 es la probabilidad de que la proporcin muestral exceda a la proporcin


poblacional en qu valor?
b. 0,05 es la probabilidad de que la proporcin muestral este por debajo de la
proporcin poblacional en qu cantidad?
c. 0,30 es la probabilidad de que la proporcin muestral difiera de la proporcin
poblacional en qu cantidad?

7. Una fbrica tiene a 439 obreros contratados. De ellos 239 estn preocupados
sobre sus futuras pensiones. Se toma una muestra de 80 obreros y se les
interroga con el fin de estimar la proporcin de la poblacin que est
preocupada sobre el futuro de su pensin.

a. Cul ser el error estndar de la proporcin muestral de obreros


preocupados?
b. Cul es la probabilidad de que la proporcin muestral sea menor que 0.5?
c. Cul es la probabilidad de que la proporcin muestral se encuentre entre 0.5
y 0,6?

8. El incremento porcentual del salario de los directores ejecutivos de medianas


corporaciones sigue una distribucin normal con una media del 12.2% y una
desviacin tpica del 3.6%. Se toma una muestra aleatoria de 81 de estos
directores ejecutivos. Cul es la probabilidad de que, en promedio, los
individuos de la muestra tengan incrementos salariales menores del 10%?

9. Un proceso de fabricacin produce unidades de longitud media igual a 10


pulgadas, con una desviacin tpica de 3.2 pulgadas. Si solo se pueden utilizar

unidades que midan entre 9.5 y 10.5 pulgadas, cuntas de las muestras de la
muestra de 100 habr que desechar?

10. El alcalde una ciudad de 950 vecinos piensa que la renta media de stos es de
por lo menos $625.000, con una desviacin tpica de $85.900. Si se toma una
muestra aleatoria de 150 personas. Cul es la probabilidad de la renta media
de estos sea mayor que $640.000?

11. La desviacin tpica del tiempo empleado para formar a un trabajador en la


realizacin de una tarea es de 40 minutos. Se toma una muestra aleatoria de
64 trabajadores:

1. Cul es la probabilidad de que la media muestral supere a la media


poblacional en ms de 5 minutos?
a. Cul es la probabilidad de que la media muestral sea inferior en
b. Cul es la probabilidad de que la media muestral sea inferior en mas de 4
minutos a la media poblacional.
c. Cul es la probabilidad de que la media muestral difiera de la media
poblacional en ms de 3 minutos?

12. Una compaa farmacutica sabe que un 5% de todos los usuarios de cierto
medicamento experimentan graves efectos colaterales. Si se examina una
muestra aleatoria simple de 120 usuarios, calcule cul es la probabilidad de
hallar:
a. Qu no hay efectos colaterales.
b. Entre 5 y 10 casos con efectos colaterales.
c. Ms de 10 casos con efectos colaterales.

http://www.educandus.cl/estadistica/ejercicios/bases_teoricas/Distribucion/ResueltosDistribucio
nesMuestrales.pdf

Evaluacin
Con base en la informacin responda las preguntas 1 a 4

Supongamos que la desviacin tpica de la cuota pagada mensualmente por los


estudiantes de cierta ciudad americana es de 40 dlares y se toma una muestra
de 100 estudiantes con el fin de estimar la renta media pagada mensualmente
por el total de la poblacin de estudiantes.

1. El error estndar, en dlares, de la media muestral de la cuota mensual es:


A. 0,40

B. 40,0

C. 4,00

D. 400

2. La probabilidad de que la media muestral exceda a la media poblacional


en ms de cinco dlares es:
A. 0,1056

B. 0,3944

C. 0,50

D. 0,8944

3. La probabilidad de que la media muestral este ms de 4 dlares por debajo


de la media poblacional es:
A. 0,3413

B. 0,8413

C. 0,1587

D. 0,1857

4. La probabilidad de que la media muestral difiera de la media poblacional en


ms de tres dlares es:
A. 54,68%

B. 77,34%

C. 45,32%

D. 27,34%

Con base en la informacin responda las preguntas 5 a 8

En un curso de administracin de empresas hay 250 estudiantes. Cada uno de


los integrantes de una muestra aleatoria de 50 estudiantes es interrogado con el
fin de estimar la cantidad de tiempo que gasta semanalmente en resolver los
problemas de estadsticas. Supngase que la desviacin tpica de la poblacin es
de 30 minutos

5. El error estndar, minutos, de la media muestral del tiempo que se gasta


semanalmente en resolver los problemas de estadsticas, es:
A. 3,80

B.4,24

C.0,60

D.9,13

6. La probabilidad de que la media muestral exceda a la media poblacional en


ms de 2,5 minutos es:
A. 74,54%

B. 24,54%

C. 30,85%

D. 25,46%

7. La probabilidad de que la media muestral este ms de 5 minutos por debajo


de la media poblacional es:
A. 0,8413

B. 0,0934

C. 0,1857

D. 0,1587

8. La probabilidad de que la media muestral difiera de la media poblacional en


ms de 7 minutos es:
A. 0,0658

B. 0,8384

C. 0,0808

D. 0,9192

35
30
25
20
15
10
5
0
1

PRESENTACION

10 11 12 13 14 15 16 17 18 19 20 21 22

Se estudi anteriormente la estimacin de un parmetro desconocido de la


poblacin, es decir, el clculo de un nico nmero que fuera una buena
aproximacin para dicho parmetro. En la gran mayora de los casos prcticos, un
estimador puntual por si solo no es adecuado. Por ejemplo, supongamos que un
control realizado sobre una muestra aleatoria de piezas procedentes de un gran
lote de produccin nos lleva a estimar que un 10% de todas las piezas son
defectuosas.

Un gerente que se enfrente a este dato posiblemente

se har

preguntas del tipo: puedo estar totalmente seguro de que el verdadero porcentaje
de piezas defectuosas est entre el 5% y el 15%? o es muy posible que entre el
8% y el 12% de las piezas sean defectuosas? Esta clase de preguntas va ms
all de la contenida en una simple estimacin puntual; son preguntas que buscan
conocer la fiabilidad de dicho estimador.

En otras palabras se trata de la

bsqueda de un estimador por intervalos, un rango de valores entre los que


posiblemente se encuentre la cantidad que se estima.

PREGUNTA PROBLEMA
Cmo se pueden aplicar los intervalos de confianza en la toma de decisiones
empresariales?

COMPETENCIAS ESPECFICAS
1. Estima e interpreta intervalos de confianza para la media poblacional
2. Estima e interpreta intervalos de confianza para la proporcin poblacional
3. Estima e interpreta intervalos de confianza para la diferencia de dos media
poblacionales

SABERES

Intervalos de confianza

Intervalos de confianza para la media poblacional

Intervalos de confianza para proporciones poblacionales

Intervalos de confianza para la diferencia de media de dos poblaciones

DINMICA PARA CONSTRUIR EL CONOCIMIENTO

ACTIVIDAD PREVIA (Trabajo Individual)

. Clasifica los siguientes intervalos en Abiertos, Cerrados o semi abierto:

A. x R / x 5

B. x R / x 2

C. x R / 1 x 5

D. x R / 0 x 7

E. x R / 4 x 5

F. x R / x 3

2. Estimar un parmetro por intervalo consiste en:


A. Hallar el mximo valor que puede tomar el parmetro.
B. Calcular el valor mnimo del parmetro.
C. Calcular entre que valores est el parmetro.
D. Calcular entre que valores est, posiblemente, el parmetro.

3. Al estimar un intervalo de confianza para un parmetro, se cumple que:

A. La amplitud es independiente del tamao de la muestra.


B. La amplitud es independiente del nivel de confianza.
C. A mayor nivel de confianza, mayor amplitud para una misma muestra.
D. A menor nivel de confianza, mayor amplitud para una misma muestra.

ACTIVIDAD GRUPAL

1 Socialice

los

resultados

obtenidos

individualmente

escriba

sus

conclusiones al respecto.
2 Haga un listado de las dudas e inquietudes presentadas en la socializacin
de las actividades anteriores.
3 Realice diferentes redacciones para la interpretacin de los intervalos de
confianza. Seleccione la que considere ms adecuada y que presente
mayor claridad.

SABERES Y ACTIVIDADES

2. ESTIMACION POR INTERVALOS

2.1 INTERVALOS DE CONFIANZA

Se puede partir del hecho que cualquier parmetro que se estime es igual al estadstico
que se utilice como estimacin puntual ms el error muestrale (negativo o positivo).
Para el caso de la media muestral se tiene:

X + e
Si tomamos como ejemplo los datos de la tabla 1.2 y se selecciona la muestra (1), X =
350.000, aqu se manifiesta un error muestral de

e = 50.000 por lo tanto

350.000 50.000 400.000


Al seleccionar la muestra (6)

X = 450.000, se manifiesta un error muestral

negativo de e = - 50.000, por lo tanto:

= 450.000 + (-50.000) = 400.000


La inevitable incertidumbre sujeta a cualquier estimacin puntual se puede hacer
explcita si se presenta una estimacin por intervalos y se indica por ejemplo que
I S , en donde I es el lmite inferior y S es el lmite superior. Se acostumbra

a construir dichos intervalos al hacer que la estimacin puntual sea el centro del
intervalo y creando un rango abajo y arriba del centro con ayuda del error estndar
del estimador (error tpico). Entonces el parmetro desconocido se supone que se
encuentra dentro del intervalo pero no necesariamente en su centro.
Sin embargo, los lmites del intervalo no necesitan estar precisamente en el error
estndar abajo o arriba de la estimacin puntual. Al definir un coeficiente C como
cualquier valor positivo de fraccin o entorno se puede hacer la afirmacin

I.C = Estimacin puntual C.(error tpico)

INTERVALO DE CONFIANZA: Si de una poblacin dada se toman


repetidamente muestras aleatorias de tamao n, se encontraran muchos valores
diferentes de un estadstico muestral dado. Si a este valor se suma y se resta
una cierta cantidad, el estadstico muestral se convierte en un rango de valores
entre los que presumiblemente se puede encontrar el parmetro poblacional
desconocido. A este rango de valores se le llama intervalo de confianza

EJEMPLO 2.1
Una muestra de salarios ha determinado X = $ 396.670 que podra servir como
estimacin puntual de , el error tpico es X = 35.250. Crear varias estimaciones
posibles de intervalos de con base en error estndar de 0.5, 1.0, 2.0

SOLUCIN:

I .C para X C . X
a) Si C se toma como 0.5, se estima que se encuentre entre los lmites:
396.670 .05 (32.250)
Luego 380545 412.795

b) Si C se toma como 1, se estima que se encuentra entre los lmites


396670 (1) (32250)
Luego 364420 428920

c) Si C se toma como 2.0, se estima que se encuentra entre los lmites


396670 (2) (32250)
Luego 332170

461170

El ejemplo nos muestra claramente que valores ms grande de C

producen

intervalos ms anchos y, por tanto, estimaciones menos precisas. El ancho del


intervalo est relacionado con el grado de confianza con el que se puede indicar
que el parmetro de la poblacin en procesos de estimacin se encuentra entre
los lmites del intervalo.

Si la distribucin muestral del estimador utilizado es aproximadamente normal, el


coeficiente C de la expresin:
I.C = Estimacin puntual C (error tpico)
Se puede tratar como un valor Z tal que
I.C = Estimacin puntual Z (error tpico)
La tabla 1 del apndice se puede utilizar para calcular las reas bajo la curva
normal que se encuentra dentro de los lmites as calculados.

Considere

una

distribucin

normalmente

distribuida

de

sea

X 40 y X 4,66. Para hacer estimaciones de intervalos de la media


poblacional, se puede ver a
tanto

comprendido en el intervalo

X ( Z . ) X (Z. )
X

X Z . X , por lo

Si la muestra aleatoria seleccionada de la tabla 1.2 produce una X 350 qu


puede concluirse?

Al igual que en el ejemplo 2.1 la respuesta depende del valor de Z.


a) Si Z = 0.5, se tiene que el rea bajo la curva normal estndar entre el centro y
Z = 0.5 es 0,1915, por lo tanto el rea entre Z = - 0.5 y Z = 0.5 es igual a
2(0,1915) = 0.383. Debido a que el centro de la distribucin muestral se
encuentra en

X , se puede tener un 38% de confianza en que nuestro

mtodo de construccin del intervalo producir un intervalo que en realidad


contiene a .

En efecto

350 0.5( 28,87) 350 0,5(28,87) ;

335,57 364,44

Este intervalo no contiene a X 400

b) Si Z = 1.0, se tiene que el 68% de todos los valores de X caen dentro del
intervalo de X 1 X . Se puede tener un 68,28 % de confianza en que
nuestro mtodo de construccin de intervalo producir un intervalo que
contendr a .
321,13 378,87
Este intervalo no contiene a

X 400

c) Si Z = 2.0, entonces 95,44% de todos los valores de X caen dentro del


intervalo de X 2 X . Por lo tanto se puede tener un 95,44% de confianza
en que nuestro mtodo de construccin de intervalo producir un intervalo que
contendr a .
292,26 407,74
Este intervalo contiene a X 400

Se nota que un valor de Z ms pequeo significa una mayor precisin en la


estimacin (un intervalo ms angosto), pero tambin implica un menor grado de
confianza en la estimacin. Un valor de Z mayor quiere decir menos precisin
(un intervalo ms ancho) pero implica un mayor grado de confianza.

Si de una poblacin dada se toman repetidamente muestras aleatorias


simples de tamao n, se encontraran muchos valores diferentes de un
estadstico muestral dado y se podr construir muchos intervalos de
confianza diferentes; algunos de ellos contendrn el parmetro poblacional
desconocido pero otros no. El porcentaje de intervalos que se puede esperar
contengan el valor real del parmetro, cuando se utilice una y otra vez el
mismo procedimiento de construccin, se denomina Nivel de confianza.
El porcentaje de intervalos que se espera no contengan el valor real del

parmetro, se denomina Nivel de significancia ()

2.1.1 INTERPRETACION DE LOS INTERVALOS DE CONFIANZA.

Un intervalo de confianza se puede interpretar de dos maneras diferente.


Consideremos el ejemplo 2.1 parte c; en l se tiene un nivel de significancia del
95,44%, entonces este intervalo se puede interpretar as:

1. Confa al 95,44% en que la media de salarios se encuentra entre $292.260 y


$ 407.740.

2. Si se construyen todos los intervalos de confianza posible ( n C N ), el 95,44%


de ellos incluir el parmetro desconocido, media de los salarios.

2.3 INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL.


MUESTRAS GRANDES.

Una de las aplicaciones ms corrientes de los intervalos de confianza es la de


estimar la media poblacional. Por ejemplo: La estimacin del nivel medio de
produccin, estimacin del nivel medio de ventas trimestrales, estimacin del nivel
medio salarial de una empresa.

Para la construccin del intervalo de confianza se utilizan las frmulas:

I .C para X Z . X cuando se conoce


I .C para X Z .S X

cuando es desconocido.

EJEMPLO 2.2

La operadora de una central telefnica est conciente de que la poblacin de


duracin de llamadas est normalmente distribuida con una desviacin
estndar de cuatro minutos. Una muestra aleatoria de 50 llamadas produce
una duracin media de 9.1 minutos. Construya e interprete un intervalo de
confianza del 95% para la duracin media de todas las llamadas.

SOLUCION:

4 minutos.

n 50 llamadas
X 9,1 minutos
Nivel de confianza 95%

Se tiene una poblacin grande, con conocido, luego:

4
0,5657
50

Para un nivel de confianza del 95%; Z = 1,96

Luego

I.C Para X Z . X
I.C Para 9,1 (1,96) (0.5657 )
I.C Para 9.1 1,1085

Luego:

7,99 10.21

Esto quiere decir que con una confianza del 95%

se puede afirmar que la

duracin media de las llamadas que entran a la central telefnica esta entre 7,99 y
10,21 minutos.

EJEMPLO 2.3

Se sabe que la poblacin normalmente distribuida de inversiones en acciones


hechas por 75 empleados de una firma tiene una desviacin estndar de 99
dlares. Una muestra aleatoria de 36 empleados demuestra una inversin media
de 736 dlares, construya e interprete un intervalo de confianza del 99,8% para la
inversin media de todos los empleados

SOLUCION:

N 75
99
n 36
X 736
Nivel de confianza 99,8

Como la fraccin de muestreo n/N es mayor del 10% se aplica el factor de


correccin para calcular X

Luego

n
99

36

N n
N 1
75 36
75 1

11,98

Luego I.C para X Z . X el valor de Z requerido es de 3,08


As I.C para 736 ( 3.08) (11,98)
699,1 772,9
Lo cual indica que la inversin media de los empleados de la firma en estudio est
comprendida entre 699,1 y 772,9 dlares.

EJEMPLO 2.4
En una ciudad donde hay 200 gasolineras, un economista toma una muestra
aleatoria de 50 de ellas, cuyo precio promedio de gasolina es de 5.839 pesos por
galn, con una desviacin estndar muestral de 68 pesos por galn. Determine e
interprete un intervalo de confianza del 80% para el precio promedio en la ciudad,
si se supone que la distribucin poblacional es normal.

SOLUCION:
N = 200 gasolineras
n= 50

X = 5.839 pesos por galn


S = 68
Nivel de confianza = 80%

Se tiene una muestra grande, con una fraccin de muestreo n/N mayor del 10%,
luego se hace necesario aplicar el factor de correccin. es desconocido.

S
N n
68
.

N 1
n
50

200 50
8,35
200 1

El valor de Z requerido es de 1,28

I .C para X Z .S X
Luego

I .C para 5839 (1,28) ( 8,35)


I .C para 5839 10,688
5828,31 5849,69

Esto nos indica que el precio promedio de la gasolina por galn en la ciudad esta
entre 5828,31 y 5849,69 pesos.

2.4 INTERVALOS DE CONFIANZA PARA LA MEDIA


POBLACIONALMUESTRAS PEQUEAS.

Existe un nmero infinito de situaciones prcticas donde no es posible obtener una


muestra grande, las razones sobran, incluyendo el alto costo de muestreo. Un
ejemplo comn es el de las compaas de seguro que comprueban la resistencia
de los automviles a las colisiones. Destruir 30 vehculos o ms puede ser muy
costoso.

Cuando se toma una muestra pequea (n< 30) la distribucin normal puede ser
inadecuada. Es decir, cuando la muestra es pequea y es desconocida, no se
deber aplicar la distribucin Z. En este caso de muestras pequeas, los errores
estndar de la media y la proporcin

X y P se estiman solo en forma

deficiente con la ayuda de desviaciones estndar mustrales, S y Px

Como primero lo demostr William S Gosset, cervecero ingls, que escriba bajo el
seudnimo de student (estudiante), en las circunstancias especificadas, se
puede derivar mejores estimaciones de intervalos si se usa una funcin de
densidad de probabilidad algo diferente de la curva normal.

Gosset, describi una distribucin muestral para una variable aleatoria, t, derivada
de una poblacin normalmente distribuida y definida en analoga a la desviacin
normal estndar Z. Esto se ilustra en la figura 2.1

FIGURA 2.1 Comparacin de la distribucin Z y la distribucin t

FIGURA 2.2 Familia de distribuciones t

Como la curva normal estndar, la funcin de densidad de probabilidad de Gosset,


ahora llamada distribucin t de student, es:

1. De un solo pico sobre la media de la variable aleatoria. La media, la mediana y


la moda son cero.
2. Perfectamente simtrica alrededor de su valor central.
3. Caracterizada por colas que se extienden

indefinidamente en ambos

direcciones desde el centro y se aproximan pero nunca tocan al eje horizontal.

La nica diferencia es que la variable aleatoria es t y no Z; como resultado de esto


la varianza de la distribucin no es igual a 1, sino que es igual a

n 1
n 3

Esta varianza de t implica que existe una distribucin t diferente para cada tamao
muestral n, y tambin que la distribucin t se aproxima a la distribucin Z

medida que aumenta el tamao muestral. La distribucin t para n = tiene una


varianza igual a uno (1) y es indistinguible de la normal (vase figura 2.2).

EL valor adecuado de t se puede encontrar en la tabla 2 del apndice. Dicha tabla


muestra el rea bajo una

curva especfica, definida por un nmero dado de

grados de libertad, que se encuentran a la derecha de un valor especfico de t (df),


esta rea de cola superior se denomina y este valor de t se designa como t .
Con frecuencia los grados de libertad (df) aplicables se agregan al subndice ya
sea en parntesis o despus de una coma:

t ( df ) o t , df

Por ejemplo, para 10 grados de libertad y un rea de cola superior

de

0.1 , t1 (10) 1,372. En otras palabras, 0.1 del rea bajo la curva t apropiada para
una muestra de n = 11 est asociada con t > 1,372.

Debido a la simetra de la curva 0.1 del rea bajo esta curva tambin esta
asociada con

t < - 1,372. En consecuencia, 0.8 del rea bajo la curva esta

asociada con valores de t entre 1,372 y

1,372; la probabilidad para dicho

valor t es igual a 0.8 . Para construir una estimacin de intervalos con un nivel de
confianza de 0.8, o sea del 80% se debe usar t = 1,372. Luego los intervalos de
confianza se pueden construir con ayuda de los valores t de la tabla 2 del
apndice as:

EJEMPLO 2.5

Una empresa de alquiler de coches est interesada en conocer el tiempo medio


que sus vehculos permanecen en el taller de reparaciones. Una muestra aleatoria
de 9 coches indic que el pasado ao el nmero de das que cada uno de estos
coches haba permanecido fuera de servicio fue:
16

10

21

22

17

19

14

19

Especificando las hiptesis necesarias, calcular e interpretar intervalos de


confianza del 90% para el nmero medio de das que la totalidad de los vehculos
de la empresa se encuentran fuera de servicio.

SOLUCION:
Se debe suponer que la distribucin de la poblacin es normal, como un primer
paso, se tiene que hallar la media y la varianza muestral (con la ayuda de una
calculadora).

X 16,22
S X 4,79
Luego

SX

I .C para X t S X

4,79
1,5967
9

con

donde

t 0.10, 8 1,860

I .C para 16,22 (1,860) (1,5967 )


As: I .C para 16,22 2,9696
13,25 19,19
Con un nivel de confianza del 90% se estima que,en promedio, los vehculos de la
empresa se encuentran fuera de servicio entre 13 y 19 das.

EJEMPLO 2.6
El convenio colectivo entre el sindicato de una empresa y la administracin de la
misma exiga que la produccin media de una seccin de la fbrica se mantuviera
en 112 unidades por empleado y mes. Surgieron desacuerdos entre las partes
sobre el cumplimiento de esta norma. El convenio colectivo especificaba que si la
produccin media descenda por debajo de la cantidad estipulada de = 112,
estaba autorizada a tomar medidas correctivas. Para ahorrar costo se decidi
inspeccionar solamente 20 obreros que dieron una media de 106 unidades.
Supngase que se hall una desviacin tpica de 8,5 unidades y que los niveles de
produccin siguen una distribucin normal sugiere un intervalo de confianza del

90% que ha habido violacin del convenio y que est justificado, por lo tanto,
tomar medidas correctivas?

SOLUCION:

Para un intervalo de confianza del 90% y 19 grados de libertad, el valor de t


adecuado es de 1,729. Luego:

I .C para X t

S
n

8.5

I .C para 106 (1,729)


20
I .C para 106 3,29
as
102,71 109,29

Se observa que la produccin media especificada en el convenio colectivo no se


encuentra en el intervalo. Se puede concluir, con un nivel de confianza del 90% de
que se est violando el convenio. Por lo tanto los directivos de la fbrica estn en
su derecho de emprender acciones contra el descenso de la productividad de la
empresa.

2.5

INTERVALOS DE CONFIANZA PARA PROPORCIONES


POBLACIONALES.

Supongamos ahora que estamos interesados en la proporcin de miembros de la


poblacin que poseen un determinado atributo. Por ejemplo: una empresa quiere
saber qu proporcin de clientes pagan a crdito frente a quien lo hacen de
contado o puede estar interesada en conocer el porcentaje de sus productos que

son defectuosos frente al de unidades no defectuosas. En cada uno de estos


casos solo hay dos resultados posibles.El inters se centra en la proporcin de
respuestas que se clasifican en uno de estos dos resultados.

En el captulo anterior se dedujo el error tpico de la distribucin muestral de


proporciones mustrales con
parmetro

(1 )
n

esta frmula contiene el

que se pretende estimar, por lo tanto se utiliza la proporcin

muestralPx como estimador del error y se tiene S P

Px (1 Px )
n

, as:

Si Px es la proporcin observada de xitos en una muestra aleatoria de n


observaciones procedentes de una poblacin con una proporcin de xito ,
entonces, si n es grande, un intervalo de confianza para del 1 % para la
proporciono poblacional viene dado por I .C para Px Z S p
Es decir Px Z

Px (1 Px )
Px (1 Px )
, donde la variable Z se
Px Z
2
n
n

distribuye normalmente.1

EJEMPLO 2.7

En una encuesta a 673 grandes almacenes, 521 declaraban tener problemas con
los robos de los empleados se puede llegar a la conclusin, con una confianza
del 99% de que estos datos indican que el 78% de todas las tiendas tiene
dificultades similares?

PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p253

SOLUCION:

I .C para Px Z S P ;

SP

0,774 0,226
673

I .C para P 0,774 (2,58) (0,016)


I .C para P 0,774 0,0412
0,732 P 0,815
Con una confianza del 99% se puede concluir que el 78% de todas las tiendas
tienen problemas con los robos de los empleados.

EJEMPLO 2.8
Un almacn de la ciudad quiere estimar la proporcin de clientes que pagan con
tarjetas de crditos. Una muestra de 79 clientes indic que 12 utilizaban el
plstico. Construir e interpretar el intervalo de confianza para el almacn.

SOLUCION:

Px

SP

12
0,1519
79

0,1519 0,8481
79

0,040

I .C para Px Z . S P
I .C para 0,15189 2,580,040
I .C para 0,15189 0,1042
0,05 0,26
Esto quiere decir que la proporcin de clientes que pagan con tarjeta de crdito
esta entre el 5% y el26%.

EJEMPLO 2.9

En una compaa de autobuses, cada mes, miles de sus autobuses llegan a cierta
terminal. Con ayuda de una muestra aleatoria de 49 autobuses, sin
remplazamiento, ha de construirse un intervalo de confianza del 99,9% para la
proporcin de todos los que llegan a tiempo. La proporcin muestral de llegada
exacta es de 0,64.

SOLUCION:

SP

0,640,36 0,0686
49

Un nivel de confianza del 99,9% requiere un Z = 3,27

I .C para Px Z S P
Luego: I .C para 0,64 3,27 0,0686
0,42 0,86
Con un confianza del 99.9% se puede afirmar que el porcentaje de autobuses que
llegan a tiempo a la terminal est entre 42% y 86%

Consulte las pginas:


http://www.slideshare.net/yohanabonillagutierrez/taller-intervalos-de-confianza
http://www.iesxunqueira1.com/Download/pdf/teointervalos.pdf

Resumen
INTERVALO DE CONFIANZA: Si de una poblacin dada se toman repetidamente
muestras aleatorias de tamao n, se encontraran muchos valores diferentes de un
estadstico muestral dado. Si a este valor se suma y se resta una cierta cantidad,
el estadstico muestral se convierte en un rango de valores entre los que
presumiblemente se puede encontrar el parmetro poblacional desconocido. A
este rango de valores se le llama intervalo de confianza.

Nivel de confianza (NC): Porcentaje de intervalos que se espera contengan el


valor real de un parmetro, cuando se utilice una y otra vez el mismo
procedimiento de construccin.

Nivel de significancia: Porcentaje de intervalos que se espera no contengan el


valor real de un parmetro, cuando se utilice una y otra vez el mismo
procedimiento de construccin, (= 1-NC).

Para la construccin del intervalo de confianza para la media poblacional se


utilizan las frmulas:

I .C para X Z . X cuando se conoce

I .C para X Z .S X

cuando es desconocido.

Para el clculo cuando la muestra es pequea, se utiliza

I .C para X (t ) (S X ) , Donde S X

S
,
n

X
S
n

Para la construccin del intervalo de confianza para la proporcin poblacional se


utiliza la proporcin muestralPx como estimador

SP

del error y se tiene

Px (1 Px )
N n
. Utilizando el factor de correccin .
N 1
n

cuando sea

requerido.

Si Px es la proporcin observada de xitos en una muestra aleatoria de n


observaciones procedentes de una poblacin con una proporcin de xito P,
entonces, si n es grande, un intervalo de confianza para del 1 % para la
proporciono poblacional viene dado por I .C para P Px Z S p
Es decir Px Z

Px (1 Px )
Px (1 Px )
, donde la variable Z se
Px Z
2
n
n

distribuye normalmente.2

PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p253

Taller 2
1. Una muestra de 155 usuarios del tren suburbano emplean en este medio de
transporte una hora y 37 minutos en promedio, con una desviacin tpica de
42 minutos. Cul es el intervalo del 90% para el tiempo medio de todos los
usuarios?

2. El propietario de una pequea empresa desea estimar el tiempo medio


necesario para realizar una tarea determinada. Tiene que asegurarse al 90%
de confianza de que

el error es inferior a 0.5 minutos. Se sabe que la

desviacin tpica es de 3.2 minutos. Cuntas observaciones de tiempos de


ejecucin tiene que hacer?

Z
n

3. El director de una tienda de animales de compaa est preocupado por el


aumento del nmero de cachorros que enferman antes de ser vendidos. De 53
cachorros estudiados, 35 mostraban algn signo de

problema sanitario.

Elaborar e interpretar el intervalo del 95%

4. En la calificacin de su eficacia, 312 empleados recibieron una puntuacin


media del 73,9 con s = 15.6. Si un intervalo de confianza del 95% indica que la
media de todos los empleados

es menor que 65, la direccin pretende

implantar un nuevo programa de formacin. Calcular e interpretar el intervalo


correcto. Se llevar a cabo el programa?

5. Suponga que como experto en control de calidad quiere estimar el espesor


medio de las lentes pticas fabricadas por su empresa. Una muestra de 120

lentes da una media de 0.52mm .Se sabe que la desviacin tpica de la


poblacin es de 0,17mm. Usted piensa que puede arriesgarse a una
probabilidad de error de slo el 1%. Construya el intervalo de confianza
adecuado.

6. Un proceso produce bolsas de azcar refinada. El peso del contenido de estas


bolsas tienen una distribucin normal con desviacin tpica 15gr. Los
contenidos de una muestra aleatoria de 25 bolsas tienen un peso medio de
100gr. Calcular un intervalo de confianza del 95% para el verdadero peso
medio de todas las bolsas de azcar producidas por el proceso.

7. Una muestra aleatoria de 10 autos americano de un determinado modelo


consumen las siguientes cantidades en kilmetros por litro.
17,9

19,8

18,6

18,4

19,2

20,8 19,4

20,5

21,4 20,6

Calcular un intervalo de confianza del 90% para el consumo de gasolina medio


poblacional de los automviles de este modelo, suponiendo que la distribucin
de la poblacin es normal.

8. De una muestra aleatoria de 95 pequeas empresas fabricantes, 29 sealaron


las mejoras en la calidad como la ms importante iniciativa para incrementar la
competitividad de sus productos.

a) Calcular un intervalo de confianza del 99% para la proporcin poblacional


b) Sin hacer los clculos, determinar si un intervalo de confianza del 90%
tendr una longitud mayor, menor o igual a la del intervalo calculado en la
parte a).

9. De una muestra aleatoria de 198 estudiantes de marketing, 98 consideraron


como poco tico inflar las calificaciones acadmicas. Utilizando esta
informacin, un experto en estadstica calcul un intervalo de confianza de
0,435 a 0,554

para la proporcin poblacional. Cul es el contenido

probabilstico de dicho intervalo?

10. Un ingeniero de control de calidad est inspeccionando la maquinaria que se


supone verter 20 onzas de detergente liquido en un recipiente. Una muestra
de 12 recipientes deja ver que la cantidad media dosificada es de 18,9 onzas,
siendo la desviacin estndar de 3.1 onzas. Construya un intervalo de
confianza del 90% para la cantidad media dosificada por la maquinaria,
suponiendo que dichas cantidades estn normalmente distribuidas. funciona
bien la maquinaria?

11. Al muestrear en forma aleatoria 60 de los 900 empleados de la compaa, el


gerente de personal encuentra que un 25% prefieren el plan recientemente
propuesto de trabajar slo cuatro das de la semana, pero ms horas cada da.
Construya un intervalo de confianza para la proporcin de todos los empleados
que nose inclinaron por la propuesta.

12. En una muestra aleatoria de 100 familias, se encuentra que 59 prefieren la


marca KEMA de un determinado producto. Construya un intervalo de
confianza del 98% para la proporcin de todas las familias con esa preferencia.

13. In a simple random sample of 500 employees, 160 preferred to take training
classes in the morning rather than in the afternoon. Construct a 95% C.I. on the
true proportion of employees who favor morning training classes

14. Human beings vary in the time it takes them to respond to driving hazards. In
one experiment in which 100 healthy adults between age 21 and 30 years were
subjected to a certain driving hazard, and the sample variance of the observed
times it took them to respond was 0.0196 second squared. Assuming that the
times to respond are normally distributed, estimate the variability in the time
response of the given age group using a 95% C.I

15. Suppose you want to estimate the average weight of chickens in a laboratory.
You like to be 95% certain that the error is at most 0.1lbs. How many chickens
you should include in your sample?

16. A certain change in a manufacturing procedure for component parts is being


considered. Samples are taken using the existing procedure and the new one.
If 75 items out of 1500 items, from the existing procedure, were found to be
defective, while 80 items out of 2000 items for the new procedure were found
defective. Find a 90% confidence interval for the true difference in the fraction
defective between the existing and the new procedures.3

Mohammed A. Shayib, Applied Statistics, bookboon.com, 2013 p129,133,135, 154

Evaluacin
Con base en la informacin responda las preguntas 1 y 2

La calificacin que obtienen los vendedores de una firma comercial en una


prueba de aptitud, sigue una distribucin normal. Se extrae una muestra de 25
25

calificaciones que dan lugar a los siguientes estadsticos:

x
i 1

25

x
i 1

2
i

1.508

95.628 4

1. La varianza muestral estar dada por:

A.

95.628 1508
25

(1508) 2
25
25

B.

95.628
C.

95.628 1508
24

(1508) 2
25
24

95.628
D.

PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p52

2. Un intervalo de confianza del 90% para la media tendr:

1. una longitud mayor que uno del 80%


2. una longitud menor que uno del 80%
3. una longitud igual que uno del 95%
4. una longitud mayor que uno del 95%

3. Un proceso produce bolsas de azcar refinado. El peso del contenido sigue


una distribucin normal con desviacin tpica 15 gramos. Los contenidos de
una muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos.
El intervalo de confianza del 95% para el verdadero peso medio de todas
las bolsas de azcar producidas por el proceso est dado por:

A. 95,05 104,95

B. 94,12 105,88

C. 99,01 100,99

D. 98,82 101,18

4. Como parte de un estudio de mercado, en una muestra de 125personas se


encontr que 84 de ellas tenan conocimiento de cierto producto 5 . El
intervalo de confianza del 90% para la proporcin de personas de la
poblacin que tienen conocimiento del producto, tiene respectivamente los
siguientes limites inferior y superior:

A. 0,589 y 0,754

B. 0,602 y 0,741

C. 0,589 y 0,602

D. 0,602 y 0,754

HILDEBRAND Y OTT. Estadstica aplicada a la administracin y a la Economa. U.S.A, Addison Wesley


Iberoamericana 1997, p307.
5

PRESENTACION
Cuando se extrae una muestra aleatoria, de una poblacin, la evidencia obtenida
puede usarse para realizar inferencia sobre las caractersticas de la poblacin.
Como hemos visto, una posibilidad es estimar los parmetros desconocidos de la
poblacin mediante el clculo de estimadores puntuales o intervalos de confianza.
Alternativamente, la informacin muestral puede emplearse para verificar la
validez de una conjetura o hiptesis, que se haya formulado sobre la poblacin.6
.

PREGUNTA PROBLEMA
Son las pruebas de hiptesis una herramienta fundamental en la toma de
decisiones en la empresa?

COMPETENCIAS ESPECFICAS

PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p281

1. Formula y contrastar hiptesis para la media poblacional, para situaciones


especficas de la empresa.
2. Formula y contrasta hiptesis para una proporcin poblacional.
3. Identifica cuando una hiptesis es unilateral o bilateral.
4. Formular y contrastar hiptesis para la diferencia de medias dos poblaciones.

SABERES

Concepto del contraste de hiptesis.

Prueba de hiptesis para la media poblacional

Prueba de hiptesis para la proporcin poblacional

Prueba de hiptesis para la diferencia de dos medias poblacionales

DINMICA PARA CONSTRUIR EL CONOCIMIENTO


ACTIVIDAD PREVIA (Trabajo Individual)

De las siguientes afirmaciones, cules son verdaderas y cules falsas?


1. En un sistema de hiptesis, la hiptesis nula es la que se contrasta.
2. La hiptesis nula siempre es aceptada.
3. Si la hiptesis nula se acepta, entonces la alternativa tambin es vlida.
4. La expresin X c X Z X se puede utilizar para calcular el valor crtico en
una prueba unilateral de cola derecha para la media poblacional.
5. En una prueba bilateral, se puede rechazar la hiptesis nula si la media
muestral resulta mayor que el valor critico calculado.

6. El procedimiento para contrastar hiptesis para la proporcin poblacional,


es el mismo utilizado en el contraste de hiptesis para la media.
7. Se puede realizar contraste de hiptesis para comparar dos medias
poblacionales.
8. En algunos problemas de contraste de hiptesis se requiere el uso del
factor de correccin

ACTIVIDAD GRUPAL

1. Socialice

los

resultados

obtenidos

individualmente

escriba

sus

conclusiones al respecto.

2. Indique los criterios que se deben tener en cuenta para aplicar una prueba t
o una prueba Z.

3. Indique los criterios que se deben tener en cuenta para determinar si una
prueba de hiptesis es bilateral o unilateral.

4. Haga un listado de las dudas e inquietudes presentadas en la socializacin de


las actividades anteriores.

SABERES Y ACTIVIDADES

3. CONTRASTE DE HIPOTESIS

3.1 CONCEPTO DEL CONTRASTE DE HIPOTESIS

Veamos el concepto con base en algunos ejemplos ilustrativos:

1. Un fabricante de

bateras podra afirmar que la duracin promedio de las

bateras tipo A es de 150 horas.

2. Una compaa recibe un gran cargamento de piezas. Slo puede aceptar el


envo si no hay ms de un 5% de piezas defectuosas. La decisin de aceptar o
no el envo se puede basar en el anlisis de una muestra aleatoria de piezas.

3. Un fabricante de detergentes afirma que, en promedio, el contenido de cada


bolsa pesa al menos 500 gramos, Para verificar esta afirmacin, se pesa el
contenido de una muestra aleatoria y se infiere el resultado a partir de los datos
mustrales.

4. Una factora puede afirmar que la produccin de la mquina A contiene menos


unidades defectuosas que los de la mquina B, para verificar esta afirmacin
no es necesario revisar toda la produccin de las dos mquinas, basta con
tomar muestras aleatorias en ambas y hacer la inferencia a toda la produccin.

De estos ejemplos se concluye que la hiptesis se formula sobre la poblacin, y


las conclusiones sobre la validez de esta hiptesis se basa en la informacin
muestral. La hiptesis que se contrasta se llama Hiptesis nula (Ho) y con la que
se contrasta,

hiptesis alternativa (Ha). Despus, a partir de los resultados

obtenidos en una muestra, o bien rechazamos la hiptesis nula y se acepta como


verdadera la alternativa, o bien, aceptamos la hiptesis nula y se supone que la
alternativa es falsa. El hecho de no rechazar la hiptesis nula no implica que esta
sea correcta, significa simplemente que los datos de la muestra no son suficientes
para inducir el rechazo.

3.2 FORMULACION DE DOS HIPOTESIS OPUESTAS

Una hiptesis, nula o alternativa, puede designar un nico valor, llamado 0 , para
el parmetro poblacional . En este caso se dice que la hiptesis es simple. La
notacin simblica para una hiptesis de este tipo es

H 0 : 0
Que se lee La hiptesis nula es que el parmetro poblacional es igual al valor
especfico 0 7. La hiptesis alternativa es H A : 0 .

PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p282

La situacin descrita en (1) es un ejemplo de este tipo, aqu el fabricante afirma


que la duracin promedio de las bateras tipo A que l fabrica es de 150 horas.

H0 : 150

H A : 150

La hiptesis alternativa en cada caso sugiere que el promedio es mayor o menor


que 0 ; Siempre que una hiptesis alternativa contenga desviaciones desde la
hiptesis nula en cualquier direccin se denomina HIPOTESIS DE DOS COLAS.
Este tipo de hiptesis se establece cuando la precisin es de gran importancia y
las desviaciones en cualquier direccin son inaceptables por igual.

Una hiptesis tambin puede designar un rango de valores para el parmetro


poblacional desconocido. Una hiptesis de este tipo se denomina compuesta y
ser cierta para ms de un valor del parmetro poblacional.8 Un ejemplo de este
caso es la situacin (3) descrita por el fabricante de detergentes donde afirma que
en promedio el contenido de cada bolsa pesa al menos 500 gramos, aqu la
hiptesis nula se puede escribir as:

H 0 : 0 ,
especifica mente
H 0 : 500 gr
H A : 500 gr

PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p282

Si en cambio el fabricante asegura que las bolsas de detergentes contienen una


media de ms de 500 gramos, entonces el sistema queda as:

H 0 : 500
H A : 500

Se nota que en cualquiera de los sistemas planteados, la hiptesis alternativa se


indica siempre como inexacta, la nula puede ser indicada como , , . En todo
caso se acostumbra que la H0 contenga el signo de igualdad.

En el sistema:

H 0 : 0
, la hiptesis nula dice que el parmetro es mayor o
H A : 0

igual que un valor especfico, en tanto que en la alternativa dice que es menor que
ese valor, este sistema de hiptesis se plantea cuando algo puede ser con
seguridad mayor que un cierto valor, pero donde valores menores seran
inaceptables. Por ejemplo, si de una batera se garantiza que tendra una duracin
de 100 horas, nadie se preocupar si dura ms; pero la alternativa de que dure
menos podra ser verdad y exigira una accin correctiva rpida.

En el sistema

H 0 : 0
, la hiptesis nula dice que el parmetro es menor o
H A : 0

igual que un valor especfico, en tanto que la alternativa dice que es mayor que
ese valor. La hiptesis alternativa sugiere que el promedio es mayor que 0 . Este
tipo de hiptesis se establece cuando algo puede ser con seguridad menor o igual
que un cierto valor, pero donde valores mayores seran inaceptables, por ejemplo,
si se considera la hiptesis nula el tiempo promedio de entrega de una compaa
de transporte es igual o menor que tres das, nadie se quejara si es menor, pero
si es mayor sera causa de alarma.

El sistema de hiptesis sobre el valor de una media poblacional , se indica por lo


general en una de estas tres formas con referencia a un valor especfico 0 .
FORMA 1

FORMA 2

FORMA 3

H 0 : 0
H A : 0

H 0 : 0
H A : 0

H 0 : 0
H A : 0

Puede darse el caso que se necesite comparar entre si dos poblaciones


separadas, como por ejemplo: la duracin comparativa de dos productos, la
fiabilidad relativa de dos procesos de fabricacin o el nivel de eficacia de dos
esquemas publicitarios. Las hiptesis opuestas sobre la diferencia entre dos
medias poblacionales A y B se indican del mismo modo sealado.
FORMA 1

FORMA 2

FORMA 3

H 0 : A B
H A : A B

H 0 : A B
H A : A B

H 0 : A B
H A : A B

Por lo tanto, la hiptesis nula puede decir, forma 1, que dos medias poblacionales
son las mismas, por ejemplo, que la duracin promedio de dos tipos de llantas son
idnticas. O puede decir forma 2, que una media poblacional es mayor o igual que
otra, por ejemplo que los sueldos promedios de la industria de la construccin en
Bogot son al menos iguales pero posiblemente mayores que los de Barranquilla.
O puede decir forma 3, que una media poblacional es menor o igual que otra, por
ejemplo que la produccin promedio de la fbrica A es al menos igual o
posiblemente menor que la produccin en la fbrica B.

Las hiptesis sobre una proporcin de la poblacin , tal como la proporcin de


unidades defectuosas producidas en un proceso, se formulan de una manera
anloga a aquellas sobre una media poblacional, simplemente

por

se sustituye

, dejando todo lo dems sin cambios, incluyendo las hiptesis sobre la

diferencia entre las proporciones de la poblacin.

3.3 SELECCIN DE UN ESTADISTICO DE PRUEBA.

Despus de haber diseado el sistema de hiptesis adecuado, el segundo paso


para contrastarla es la seleccin de un estadstico de prueba.

Un ESTADSTICO DE PRUEBA es aquel valor calculado a partir de los


datos mustrales en una prueba de hiptesis para establecer si se rechaza
o no se rechaza la hiptesis nula.

Cada estadstico muestral tiene una distribucin muestral propia que puede
aproximarse muchas veces por la distribucin normal para muestras grandes, o
por una distribucin t de student para muestras pequeas. Es as como el
estadstico de prueba se puede convertir en un valor Z o un valor t al dividir la
diferencia entre el estadstico muestral y el valor extremo del parmetro
poblacional postulado en la hiptesis nula entre el error estndar del estadstico
muestral.

x 0

Para una media poblacional Muestras grandes

X 0
Para una media poblacional Muestras pequeas
SX
Px

Para una proporcin de la poblacin

3.4 DERIVACION DE UNA REGLA DE DECISIN

Una vez establecido el sistema de hiptesis y el estadstico de prueba adecuado,


se debe determinar una regla de decisin que nos indique si se rechaza o no la
hiptesis nula. Esta regla de decisin especifica un valor del estadstico

tan

diferente del valor del parmetro contenido en la hiptesis, que excluya atribuir la
diferencia al error muestral.

Supngase que se desea contrastar la hiptesis para la situacin planteada en (1).


Un fabricante de bateras afirma que la duracin promedio de las bateras tipo A
es de 150 horas

H0 : 150 ;

H A : 150

En este caso, la regla de decisin especfica valores crticos de la media muestral

X C , demasiado alejados por encima o por debajo de 150 para permitir suponer
que = 150. Si se contrasta la hiptesis nula al nivel de significancia del 5%, se
deben encontrar valores crticos de la media muestral por encima o por debajo del
valor hipottico = 150 que enmarque el 95% del rea comprendida bajo la
curva normal. El 5% restante se divide por igual en dos colas, como se muestra en
la figura 3.1.

FIGURA 3.1 Contraste de hiptesis al 95%

Los valores de X comprendidos en el intervalo del 95% son lo bastante cercanos


al valor hipottico de 150 para que se pueda atribuir la diferencia al error muestral.
Esta diferencia se dice que es insignificante estadsticamente al nivel del 5% y se
puede explicar por la fluctuacin aleatoria de la muestra. Por consiguiente, no se
rechaza la hiptesis nula.
Si el valor obtenido para X se sita ms all de esos valores crticos en una u
otra cola, se rechaza la hiptesis nula de que = 150. Estos valores crticos se
determinan con la siguiente formula
Donde:

H
SX

Valor hipottico de la media poblacional

S
S
SX
n
n

N n
Error tpico de la distribucin muestral.
N 1

A partir de estos valores se formula la regla de decisin

REGLA DE DECISIN: La regla de decisin es un enunciado que se


emite para determinar si se rechaza o no la hiptesis nula. Especfica el
valor crtico de los resultados mustrales.

3.5 PRUEBA DE HPOTESIS PARA UNA MEDIA POBLACIONAL.

Son muchos los casos en que interesa contrastar una hiptesis en relacin con el
valor de una media poblacional, entre los cuales se pueden citar:

Un proceso industrial produce partes metlicas de una longitud promedio de

0 = 5 pulgadas, perfora orificios con un dimetro promedio de 1,2 pulgadas o


hace mangas de camisa de un largo promedio de 33 pulgadas.

La cantidad promedio de detergente puesto en una caja por una mquina


llenadora es igual o excede de 0 = 1 libra.

El promedio de resistencia a la ruptura de cierto tipo de cable es al menos


5000 libras.

El tiempo promedio de entrega de una compaa de transporte es igual o


menor de 0 = 3 das

El tiempo promedio de secado de una pintura es a lo ms de 4 horas.

Algunos funcionarios de la administracin pueden estar interesados en conocer


la renta media de los contribuyentes de un municipio determinado.

En definitiva, un gran nmero de decisiones empresariales, se toman a partir de la


media poblacional. Si se pueden recopilar datos en relacin con este parmetro,
las decisiones seran ms fiables y es probable que produzcan resultados
favorables. En todo caso para llevar a cabo el contraste de una hiptesis nula es
necesario agotar las siguientes cuatro fases:

Fase 1: Formular las hiptesis


Fase 2: Calcular el valor crtico
Fase 3: Formular la regla de decisinpara decidir si se acepta o rechaza la
hiptesis nula

Fase 4: Exponer la conclusin en relacin con la aceptacin o el rechazo de la


hiptesis nula y cualquier otra interpretacin que pudiera derivarse de dicha
conclusin.

Esto se ilustra en las siguientes situaciones.

EJEMPLO 3.1

Un convenio trabajadores- direccin de una fbrica, exige una produccin media


diaria de 50 unidades. Una muestra de 150 das revela una media de
47,3unidades con una desviacin tpica de 5,7 unidades. Poner = 5% y
determinar si se cumple esta clusula del contrato.

SOLUCIN:
Fase 1: Formulacin de las hiptesis
Como el convenio exige una produccin media de 50 unidades, el sistema de
hiptesis se establece as:

H 0 : 50
H A : 50
Se trata de una prueba bilateral, puesto que la hiptesis nula puede ser rechazada
si los resultados de la muestra estn muy por encima o por debajo de 50. Aparece
una regin de rechazo en cada una de las colas de la distribucin.

Fase 2: Clculo del valor crtico

Para encontrar el valor crtico se debe empezar por encontrar el valor de Z


adecuado, segn el nivel de significancia seleccionado. Para el ejemplo, se divide

el nivel de confianza entre dos, es decir, 0,95/ 2 = 0,475, que corresponde a un


valor Z = 1,96.

5,7
0,465
150

Adems:

Luego:

X C H Z X

X C 50 1,96(0,465)
X C 50 0,911
49,1 - - - - - - - - -

50.91

Fase 3 Regla de decisin:


No rechazar H 0 si X est comprendida entre 49,1 y 50,91. Rechazar

H 0 si X

es menor que 49,1 o mayor que 50,91. Esto se ilustra en la figura 3,2

FIGURA 3.2
Fase 4: Conclusin

Una X de 47,3 est en la regin de rechazo demasiado alejado de H 50 .


Debe rechazarse la hiptesis nula lo que indica que no se est cumpliendo la
clusula del contrato.

EJEMPLO 3.2

Una compaa lctea utiliza una mquina para llenar sus latas de kumis de 18
onzas. Si la mquina funciona mal, tiene que ser ajustada. Se elige una muestra
de 50 latas, que dan una media de 18,9 onzas, con una desviacin tpica de 4,7
onzas. Si se admite un error del 5%. Deber reajustarse la mquina?

SOLUCION:
Fase 1: Formulacin de la hiptesis
Como el llenado debe ser de 18 onzas, el sistema de hiptesis conveniente es:

H 0 : 18
H A : 18
Nuevamente se trata de una prueba bilateral dado que la hiptesis nula puede ser
rechazada si los resultados de la muestra estn muy por encima o por debajo de
18 onzas.

Fase 2: Clculo del valor crtico


El valor de Z se encuentra de forma anloga al ejemplo 3.1 y Z = 1,96

SX

S
4,7

0,665
n
50

X C H ZS X
X C 18 (1,96) (0,665)
X C 18 1,3
16,7 - - - - - - - 19,3

Fase 3: Regla de decisin

Aceptar H0 si X est comprendido entre 16,7 y 19,3. Rechazar H0 si X

es

menor que 16,7 o mayor que 19,3; esto se ilustra en la figura 3.3.

FIGURA 3.3
Fase 4: Conclusin

Una X de 18,9

est en la zona de aceptacin. Por lo tanto no se rechaza la

hiptesis nula; es decir no existe suficiente evidencia para rechazar la hiptesis


nula. Luego se puede concluir que no es necesario ajustar la mquina.

EJEMPLO 3.3

El departamento de polica de una ciudad de la costa ha encontrado que los


agentes de trfico deben imponer una media de 27 multas de trnsito al mes. Si
un agente impone ms de estas multas, quizs sea demasiado celoso en el
cumplimiento de su deber. Si entrega menos multas puede que el agente no est
haciendo un buen trabajo. Para evaluar a sus agentes, el jefe de polica anot el
nmero de multas

impuestas por 15 agentes. Los resultados se muestran a

continuacin. Al nivel del 5% le parece que la fuerza policial cumple


satisfactoriamente su cometido?
28

33

2534

22

3130

32 3131 38

2429

26

25

SOLUCION:

El problema plantea que los agentes deben imponer una media de 27 multas, ni
ms ni menos, entonces el sistema de hiptesis se establece as:

H 0 : 27
H A : 27

Se trata de una prueba bilateral, dado que la hiptesis nula puede ser rechazada,
si los resultados de la muestra estn muy por encima o por debajo de 27. Como
slo se dispone de datos originales, se hace necesario determinar la media y la
desviacin tpica muestral. Los clculos indican que:

X 29,27
S 4,3
S
4,3
SX

1,11
n
15
Dado que la muestra es pequea el estadstico a utilizar es la prueba t de student,
como n = 15, con una nivel de confianza del 95% y 15 - 1 = 14 grados de libertad,
el valor de t es 2,145

X C H t S X
As:

X C 27 (2,145) (1,11)
X C 27 2,38
24,62 --------------29,38

No rechazar la hiptesis nula si la media muestral est entre 24,62 y 29,38 multas.
Rechazar la hiptesis nula si la media muestral es inferior a 24,62 o superior a
29,38.Ver figura 3.4

FIGURA 3.4

Como la media muestral es de29,27 no se debe rechazar la hiptesis nula de


=27 y se concluye que la fuerza policial cumple satisfactoriamente su cometido.

OBSERVACIONES
1. Si la desviacin tpica de la poblacin es conocida, se utilizar la prueba z, con
independencia del tamao de la muestra, siempre que la poblacin sea normal.
2. Aplicar una prueba t si se cumplen las condiciones siguientes:
a. La muestra es pequea ( n < 30)
b. Se sabe que la poblacin es normal.
c. es desconocida.
3. Si no se sabe si la poblacin es normal, aplicar una prueba NO
PARAMETRICA, sea conocida o desconocida.

EJEMPLO 3.4

Como parte de un proceso de ensamblaje, se usa un taladro para hacer agujeros


en una lmina de metal. Cuando el taladro funciona adecuadamente, los
dimetros de estos agujeros tienen una distribucin normal con media 2
centmetros y desviacin tpica 0,06 centmetros. Peridicamente se miden los

dimetros de una muestra aleatoria de agujeros para controlar que el taladro


funciona adecuadamente. Asuma que la desviacin tpica no vara. Una muestra
aleatoria de 9 medidas da un dimetro medio de 1,95 centmetros. Contrastar la
hiptesis nula de que la media poblacional es de dos centmetros.

SOLUCIN:
A pesar de que el tamao de la muestra se puede considerar pequeo, el
estadstico de prueba a usar es Z dado que se conoce la desviacin tpica
poblacional. Se tiene que:

X 1,95

0 2

0,06
X

n 9

0,05

0,06
0,02
9

El sistema de hiptesis a contrastar es:

H0 : 2
HA : 2

Los valores crticos estn dados por

X C H Z X
X C 2 (1,96) ( 0,02)
X C 2 0,0392

1,96 ------------- 2,039

Aceptar H 0 si X est comprendida entre 1,96 y 2,039. Rechazar H 0 si X es


menor que 1.93 o mayor que 2,039. Ver figura 3.5

FIGURA 3.5
Como X = 1,95 < 1,96 se rechaza la hiptesis nula y por lo tanto se concluye que
la media poblacional no es de dos centmetros y que el taladro no funciona
correctamente.

Hasta ahora slo se han considerado situaciones que conducen a hiptesis


bilaterales puesto que la media poblacional era exactamente igual a un
determinado valor especfico, originndose regiones de rechazo a ambos lados de
la curva. Pero tambin se puede presentar problemas en que interese uno slo de
los extremos. Si este es el caso, entonces se originan los sistemas de hiptesis
unilaterales como los tratados al inicio del captulo. La decisin de cul de las dos
colas es la que debe contener la regin de rechazo es algo delicado y depende
nica y exclusivamente del problema en estudio.

Para determinar la manera de identificar y abordar pruebas unilaterales es crucial


determinar qu sistema de hiptesis es el correcto. En primer lugar se observa
que el signo igual aparece en la hiptesis nula de ambos sistemas; esto es:
Sistema 2

H 0 : 0

Sistema 3

H 0 : 0

H A : 0

H A : 0

Esto es as porque se considera que con la hiptesis nula se contrasta la


Ausencia de diferencia, es decir, la hiptesis nula implica que el valor real del
parmetro no difiere de forma significativa de su valor hipottico.
Otra explicacin de por qu la hiptesis nula debe contener el signo igual se basa
en que lo que se contrasta es la hiptesis nula, no la alternativa; adems se
contrasta a un nivel de significancia concreto, no se puede contrastar

la

a un nivel de significancia especifico, por ejemplo

1%. La desigualdad H

es ambiguo por que no dice el valor preciso de .

afirmacin ambigua

Por consiguiente, para que la hiptesis nula se pueda contrastar a un nivel de


significancia especfico ha de contener la precisin que le proporciona el signo
igual.

Para determinar el sistema de hiptesis adecuado se debe prestar atencin a la


formulacin del problema como se muestra en los siguientes ejemplos.

EJEMPLO 3.5

Supngase que en el ejemplo 3.2 la compaa lctea afirma que las latas de
kumis contienen una media de ms de 18 onzas, Si se interpreta correctamente,
ello significa que 18 , como sta desigualdad no contiene el signo igual, ha de
ser la hiptesis alternativa; mientras que la hiptesis nula ser 18 . Luego el
sistema de hiptesis se puede formular as:

H0 : 18

H A : 18

Pero si la compaa lctea hubiera afirmado que las latas de kumis contienen una
media de 18 onzas o ms, la interpretacin correcta sera

18 , como esta

desigualdad contiene el signo igual se convierte en la hiptesis nula y el sistema


de hiptesis pasara a ser:

H 0 : 18
H A : 18
Una vez establecido el sistema de hiptesis adecuado, es conveniente determinar
en qu extremo de la curva se encuentra la regin de rechazo. Para ello basta con
responder la pregunta

Qu provocar el rechazo de la hiptesis nula?

Considrese el sistema de hiptesis:

H 0 : 18
HA :

18

Escrita de esta forma, la hiptesis nula no permite utilizar valores pequeos para
la media. Establece claramente que la media es igual o menor que 18 onzas. Los
valores menores que 18, apoyarn y no refutarn la hiptesis nula. Los resultados
a la izquierda de 18 confirmarn la hiptesis nula de que es igual o menor que
18. As pues, son slo valores superiores a 18 los que dan lugar al rechazo de la
hiptesis nula. Por lo tanto, la regin de rechazo se encuentra en el extremo
derecho o superior de la distribucin. Esta prueba de cola a la derecha se ilustra
en la figura 3.6.

FIGURA 3.6

El valor crtico de la media muestral que marca una diferencia significativa con
hipottica limita la regin de rechazo en la cola derecha. La frmula de este valor
crtico en una prueba de cola a la derecha es:

En el caso de que la compaa lctea hubiera indicado que la media fuera 18 o


ms. El sistema de hiptesis sera entonces:

H0 :
HA :

18
18

Para determinar que extremo de la curva es el que contiene la regin de rechazo


habr que volver a contestar la pregunta Qu podra causar el rechazo de la
hiptesis nula? Tal como se ha indicado, la hiptesis nula admite que existen
valores grandes de la media muestral mayores de 18 que apoyarn y no refutarn
la hiptesis nula. As pues, son los valores significativamente inferiores a 18 los
que provocaran un rechazo de la hiptesis nula. La regin de rechazo estar
solamente en el extremo inferior o izquierdo de la distribucin. Esta prueba de
cola a la izquierda se muestra en la figura 3.7

FIGURA 3.7

El valor crtico de la media muestral que marca una diferencia significativa con la

hipottica, limita la regin de rechazo en la cola izquierda. La frmula de este


valor crtico es:

OBSERVACIONES

Es bueno recordar que para rechazar una prueba unilateral se deben tener en
cuenta las siguientes recomendaciones:

1. Si la interpretacin correcta de la formulacin tiene el signo igual, esta es la


hiptesis nula; si no contiene el signo igual, es la hiptesis alternativa.

2. La cola que contiene la regin de rechazo viene indicada por el smbolo de


desigualdad de la hiptesis alternativa.

EJEMPLO 3.6

Un concesionario de autos afirma que los propietarios de sus coches usados


pueden recorrer una media de 10.000 millas como mnimo sin necesidad de
ninguna reparacin. Con objeto de determinar el grado de honestidad del gerente
se eligen 100 clientes y se halla que recorrieron una media de 9.112 millas sin
reparacin, con una desviacin estndar de 207 millas. Se quiere estar seguro al
99% de que el gerente no miente. Cmo podra contrastar su afirmacin?

SOLUCIN

Como la media de 10.000 millas como mnimo se puede escribir

10.000 y

esta desigualdad contiene el signo de igualdad, se convierte en la hiptesis nula,


luego el sistema de hiptesis adecuado es:

H 0 : 10.000
H A : 10.000

Segn la hiptesis alternativa se requiere una prueba de cola a la izquierda. El


valor crtico es entonces:

X C H Z S X

SX

El valor de Z es 0,5 0,01 =

H 10.000

S
207

20,7
n
100

0,4900

al buscar este valor en la tabla 1 del

apndice da un valor de 2,33 luego:

XC

10.000 ( 2,33) ( 20,7)

X C 10.000 48,23
X C 9.952

millas

No rechazar la hiptesis nula si la media muestral es superior a 9.952 millas.


Rechazar la hiptesis nula si la media muestral es inferior a 9.952 millas. Ver
figura 3.8

FIGURA 3.8
Como X = 9.112

es menor que 9.952 rechazamos la hiptesis nula. Lo que

nos indica que la afirmacin no es cierta. Por tanto el gerente del concesionario
est mintiendo.
EJEMPLO 3.7

Si en el ejemplo anterior el gerente en cambio de afirmar que los clientes pueden


recorrer 10.000 millas como mnimo, afirma que pueden recorrer ms de 10.000
millas por trmino medio; con la dems informacin del ejemplo 3.6 y el mismo
nivel de significancia contraste la hiptesis

para probar la honestidad del

empresario.

SOLUCIN:
Ms de 10.000 millas por trmino medio se pueden expresar con la siguiente
desigualdad

10.000 que representa la hiptesis alternativa, el sistema de

hiptesis es entonces:

H 0 : 10.000
H A : 10.000
Ahora la prueba es de cola a la derecha (Ver figura 3.9). Se tiene que:

n 100
Luego:

X 9.112

S 207

S X 20,7

1%

X C H Z S X

XC

10.000 ( 2,33) ( 20,7)

X C 10.000 48,23
X C 10.048,2

millas

FIGURA 3.9
No rechazar la hiptesis nula si la media muestral es menor que 10.048,2 millas.
Rechazar la hiptesis nula si la media muestral es superior a 10.048,2 millas.

Como X =9.112 es menor que 10.048, no se rechaza la hiptesis nula de

10.000 . Se rechaza la afirmacin del gerente de que 10.000 ,


confirmndose la deshonestidad del empresario.

EJEMPLO 3.8

Un Fabricante de detergentes afirma que el contenido de los paquetes que vende


pesa, por trmino medio, al menos 200 gramos. Se sabe que la distribucin de los
pesos es normal, con desviacin tpica de 4 gramos. Una muestra aleatoria de 16
paquetes da un peso medio de 198,4 gramos. Con un nivel de significancia del
10% Tiene razn el fabricante?

SOLUCION:

A pesar de que la muestra es pequea, se puede utilizar como estadstico de


prueba Z dado que la distribucin es normal y se conoce la desviacin tpica
poblacional.

X 198,4

4 grs

10%

n 16

4
1
16

La afirmacin al menos 200 gramos se puede expresar en el lenguaje de las


desigualdades as:

200 que es la hiptesis nula, luego el sistema queda:


H 0 : 200
H A : 200

De la hiptesis alternativa se deduce que es una prueba de cola a la izquierda


(Ver figura 3.10), por tanto, el valor crtico se encuentra utilizando la frmula

X C H Z X
X C 200 (1,28) (1)
X C 200 1,28
X C 198,72

FIGURA 3.10

Como 198,4 es menor que 198,6 se rechaza la hiptesis nula de que 200 y en
consecuencia se puede decir que el fabricante no tiene la razn.

Cuando no se dispone de muestras grandes y se sabe que la distribucin es


normal y se desconoce la desviacin tpica poblacional, hay que utilizar la prueba t
de student. La frmula de X C se convierte en

X C H t S X

Pr ueba de cola a la derecha

X C H t S X

Pr ueba de cola a la izquierda

Esto se ilustra en los siguientes ejemplos:

EJEMPLO 3.9

Una compaa que recibe cargamento de pilas tiene como poltica aceptar el envo
si el tiempo medio de vida de las pilas del cargamento es como mnimo de 50
horas. Para un cargamento en particular, el tiempo medio de vida en una muestra
aleatoria de 9 pilas fue de 48,2 horas con una desviacin tpica de 3 horas, si se
considera un nivel de significancia del 5% qu se podra decir de la aceptacin de
este lote.

SOLUCIN:

Aqu se tiene una muestra pequea, por lo que el estadstico t es el adecuado. La


frase como mnimo 50 horas se puede escribir

50 esta desigualdad que

contiene el signo igual se convierte en la hiptesis nula, el sistema es pues:

H 0 : 50
H A : 50

La hiptesis alternativa indica que es una prueba de cola a la izquierda por lo que
el valor crtico se calcula con el uso de la frmula:

X C H t S X

La tabla 2 del apndice muestra que el valor de t para = 5% y 9 - 1 = 8 grados


de libertad es:

t 0,05 (8) 1,86

SX

Ademas,

S
n

3
9

X C 50 (1,86) (1)
As : X C

XC

Como

50 1,86
48,14

X = 48,2 es mayor que 48,14 no se rechaza la hiptesis nula. Esto nos

indica que no hay suficiente evidencia para rechazar el envo. Ver FIGURA 3.11

FIGURA 3.11

EJEMPLO 3.10

El gerente de una empresa dedicada al transporte de encomiendas teme que el


peso medio de sus envos sea superior a 30 libras. Este supuesto es indeseable
porque cualquier peso superior implica costos de envo adicional. Si el contraste
de hiptesis sugiere que el peso medio es superior a 30 libras, la empresa revisar
su procedimiento de embalaje. Para determinar el peso medio de todos los envos
de la empresa, se eligen al azar 25 rdenes. La media muestral es de 32,1 libras
con una desviacin tpica de 3,1 libras.

Formular la hiptesis para la empresa y realizar la prueba con 0.05

SOLUCION:

Como ser superior a 30 libras se escribe 30 , esta desigualdad se trata de


la hiptesis alternativa, puesto que no contiene el signo de igualdad. Entonces:

H 0 : 30
H A : 30
Se requiere una prueba de cola a la derecha con 25 -1 = 24 grados de libertad.
Para una prueba unilateral t0,05( 24) 1,711

Luego el valor crtico es:

X C H

t SX

X C 30 (1,711) ( 0,62)
X C 30 1,06
XC

31,06

libras

No rechazar la hiptesis nula si la media muestral es inferior a 31,06. Rechazar la


hiptesis nula si la media muestral es superior a 31,06. Ver grfico 3.12

FIGURA 3.12

Como

X = 32,1 es mayor que 31,06, lo probable es que sea mayor que 30 y

se rechaza la hiptesis nula de 30 . La empresa deber tomar medidas para


reducir el peso de sus expediciones y evitar costos de envos excesivos.

3.6 PRUEBA DE HIPTESIS PARA PROPORCIONES

Cuando se trata de una proporcin las observaciones cumplen una determinada


especificacin, as el inters no se centra en la media de la poblacin, sino en el
tanto por ciento de sta que cumplen o dejan de cumplir dicha especificacin. La
prueba de proporciones poblacionales sigue el mismo esquema establecido como
se muestra en los siguientes ejemplos:

EJEMPLO 3.11

ApexCompany supone que el 15% de las mercancas que producen por un nuevo
mtodo son defectuosas. En una muestra de 132 unidades hay 22 defectuosas.
Con un nivel de significancia del 10% Qu se puede decir de la suposicin de
ApexCompany?

SOLUCION:
El sistema de hiptesis es:

H 0 : 0.15
H A : 0.15

(0,15) ( 0.85)
0,031
132

Como 0,90/2 = 0.45 se obtiene de la tabla el valor de Z = 1,65 Luego:

PC H Z P
PC 0,15 (0,031) (1,65)
PC 0,15 0,05

PC 0,1 0.2
No rechazar Ho si la proporcin muestralPx est entre 0,10 y 0,20. Rechazar la
hiptesis Ho si Px es inferior a 0,10 o superior a 0,20

Px

22
0,17
132

Como Px = 0,17 est entre 0,10 Y 0,20, no se rechaza la hiptesis nula. Puede
decirse entonces que efectivamente el 15% de las mercancas producidas por la
compaa son defectuosas.

EJEMPLO 3.12

Suponga que ha estado trabajando en una empresa de publicidad durante 5 aos.


Ahora piensa crear su propia empresa, pero le preocupa si perder muchos de los
actuales clientes. Decide que slo se establecer por su cuenta si el 30% como
mnimo de las cuentas que ahora gestiona le siguen a su nuevo negocio. Para

comprobarlo, encuentra que 14 de 54 cuentas que toma como muestra expresan


su deseo de acompaarle si funda su empresa. Al nivel del 7%. Deber fundar
su propia empresa?

SOLUCION:

14
0.26
n 54
54
H ( 1 H )
(0,30 ) ( 0,70)

0,062
n
54

0.07
P

Px

PH 0,30

El 30% como mnimo se puede expresar como 0.30 que es la hiptesis nula,
luego el sistema a contrastar es:

H 0 : 0,30
H A : 0.30
La hiptesis alternativa indica una prueba de cola a la izquierda. El valor crtico se
determina al reemplazar en la frmula

PC : H Z P
Donde la tabla del apndice 1 muestra un valor de Z = 1,48

Luego

PC 0.30 (1,48) (0,062)


PC 0.30 0,092
PC 0.21

No rechazar la hiptesis nula si la proporcin muestral es superior a 0,21.

FIGURA 3.13

Como 0.26 > 0.21 no se rechaza la hiptesis nula, esto nos indica que puede
fundar su propia empresa.

EJEMPLO 3.13

En sus funciones de analista de marketing recin contratado por RAMM Industrias


se le encarga garantizar que ms del 10% de la poblacin conozca su nueva lnea
de productos. De 300 personas encuestadas 36 manifestaron conocerla. Con un
nivel de significancia de = 4%, ha cumplido usted con su trabajo?

SOLUCION:

Ms del 10% se puede expresar

. Como esta desigualdad no contiene

el signo de igualdad se convierte en la hiptesis alternativa, luego el sistema de


hiptesis es:

H 0 : 0.10
H A : 0.10
La hiptesis alternativa indica que es una prueba de cola a la derecha, por tanto el
valor crtico se calcula con la expresin

H 0.10

PC H Z P

0.04

Px

36
0,12
300

H ( 1 H )
n

(0.10) (0.9)
0.017
300

El valor de Z para 4%, (0.5 - 0.04 = 0.46) segn la tabla 1 del apndice es igual
a 1,75, As:

PC 0.10 (1,75) ( 0,017)


PC 0,10 0,030
PC 0,13
Rechazar la hiptesis nula si la proporcin muestral es superior a 0,13.
Como 0,12 < 0,13 no se rechaza la hiptesis nula, esto nos indica que no se ha
cumplido con lo encomendado.

3.7 PRUEBA DE HIPTESIS PARA LA DIFERENCIA ENTRE DOS


MEDIAS POBLACIONALES

Hasta ahora se han manejado situaciones

en las que interviene una sola

muestra. Examinaremos ahora el caso en que se dispone de muestras aleatorias


de dos poblaciones, y en el que el parmetro de inters consiste en la diferencia
entre las dos medias poblacionales. En los procedimientos que se desarrollaran
para contrastar este tipo hiptesis, la metodologa adecuada depende de la
manera en la que se tomaron las muestras9, es as como se necesita considerar
separadamente los casos de los pares asociados y las muestras independientes.

3.7.1 CONTRASTE DE HIPOTESIS - MUESTRA PAREADA

PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p308

Se entiende por muestra pareada, llamada tambin de pares coincidentes, un


procedimiento en el cual se hace coincidir varias parejas de observaciones con la
mayor exactitud posible en las caractersticas de inters. Los dos conjuntos de
observaciones slo difieren en un aspecto

o tratamiento, cualquier diferencia

posterior de los dos grupos se atribuye a ese tratamiento.

Supngase que se dispone

de una muestra aleatoria de n pares de

observaciones xi , yi , de dos poblaciones con medias A y B . Se denota por

S d2 la media y la varianza observada para las n diferencias

d a y por

xi yi ,

los cuales estn dados por:

da

S
2
d

Media de las diferencias en observaciones pareadas.

2
i

nd a

n 1

Varianza de las diferencias en observaciones pareadas

Cuando se hace contraste de hiptesis con muestras pareadas por lo general se


trabaja con muestras pequeas, en este caso el valor crtico est dado por:

dC t

Sd
n

Diferencia crtica en la media de observaciones pareadas.

Para llevar a cabo un contraste de hiptesis para muestras pares se sigue el


mismo procedimiento visto para los contraste de una poblacin.

EJEMPLO 3.14

Una corporacin ofrece cursos de preparacin a los estudiantes para superar


exmenes. Como parte de un experimento para evaluar la eficiencia del curso, se
elige doce estudiantes y se dividen en 6 parejas, de manera que los dos miembros
de cada pareja tengan similares expedientes acadmicos. Antes de realizar el
examen, se elige aleatoriamente un miembro de cada pareja para asistir al curso
de preparacin. La siguiente tabla muestra las puntuaciones conseguidas en el
examen.

PAREJA DE ESTUDIANTES

ASISTE

NO ASISTE

1
2
3
4
5
6

82
73
59
48
69
93

75
71
52
46
70
83

Asumiendo que las diferencias en las puntuaciones sigue una distribucin normal,
contrastar al nivel de significancia del 5% que la media de los puntajes es mayor
para los estudiantes que asisten al curso de preparacin.

SOLUCION:
Fase 1. Formulacin de la hiptesis
Sea

a la media de los estudiantes qu e asisten al curso de preparacin


B la media de los estudiantes que no asisten asisten al curso de preparacin

La media es mayor para los estudiantes que asisten al curso de preparacin se


puede escribir como A B . Cmo esta desigualdad no contiene el signo igual,
se convierte en la hiptesis alternativa. El sistema a contrastar es:

H0 : A B

Que corresponde a una prueba unilateral a la derecha.

H A : A B

Fase 2:Clculo del valor crtico


El valor crtico se obtiene con el uso de la frmula

dC t

Parejas de estudiantes

Asiste

No asiste

di

di2

1
2
3
4
5
6
SUMATORIA

82
73
59
48
69
93

75
71
52
46
70
83

7
2
7
2
-1
10
27

49
4
49
4
1
100
207

da

27
4,5
6
2

nd a
207 6 ( 4,5) 2 85,5
S

17,1
n 1
5
5
Sd 17,1 4,13
2
d

Sd
n

2
i

Con 0.05

y 6 -1 = 5 grados de libertad el valor de t es:

t0.05 ; 5 2,015
dc t

Sd
n

4,13
d C 2,015

6
d C 3,4

FIGURA 3.14
Fase 3: Regla de decisin
No rechazar H0 si d a 3,39 , rechazar la hiptesis nula si da > 3,39

Fase 4: Conclusin
Como d a 4,5 3,39 se rechaza la hiptesis nula y se concluye que la media es
mayor para los estudiantes que asisten al curso de preparacin.

3.7.2 CONTRASTE DE HIPTESIS EN MUESTRAS INDEPENDIENTES

Cuando se toman muestras independientes, no es preciso hacer ningn esfuerzo


para que coincidan las observaciones de una muestra con las otras. A diferencia
de las muestras pareadas, las muestras independientes no tienen por qu ser del
mismo tamao.

Las muestras independientes, son muestras aleatorias tomadas de dos


poblaciones distintas.

Al contrastar hiptesis de dos poblaciones distintas con muestras independientes


DIFERENCIA CRTICA: Diferencia entre dos medias mustrales que es demasiado
grande para que pueda atribuirse al azar de la extraccin. Por el contrario, se
puede decir que las medias mustrales difieren en una cantidad tan grande por
que preceden de poblaciones dismiles que tiene medias desiguales.

se sigue el mismo procedimiento estudiado hasta ahora teniendo en cuenta los


siguientes elementos adicionales.

Cuando las varianzas poblacionales son conocidas, la diferencia crtica se halla


por medio de la frmula:

dc Z X
X

XB

Diferencia crtica entre medias muestrales.

XB

Es el error tpico de la diferencia entre las dos medias muestrales.

ERROR TPICO DE LA DIFERENCIA ENTRE DOS MEDIAS MUESTRALES

Si se toman varios pares de muestras de dos poblaciones, las diferencias entre


las medias de los pares de muestra varan. El error tpico mide esa variacin.
La frmula de clculo es:

XB

Donde

A2 B2

nA
nB

Error tpico de la diferencia entre dos medias muestrales.

A2 y B2 son las varianzas de las dos poblaciones y nA y nB

Son los dos tamaos mustrales.

Para llevar a cabo la prueba se compara la diferencia real entre las medias
mustrales, da X A X B con la diferencia crtica dC

EJEMPLO 3.15

El CITIBANK quiere comparar el nivel medio de las cuentas de ahorro abiertas en


Bancos comerciales de Amrica con los de Europa. Muestras de 230 Bancos de

Amrica y 302 de Europa tienen medias de

X A =1.512 dlares

y X E =1.317

dlares, respectivamente. Se sabe que la desviacin tpica en las cuentas de


ahorro son de A 517 dlares y E 485 dlares . Contrastar la hiptesis nula de
que no hay diferencia de ahorros medios al nivel del 5%.

SOLUCIN:

No hay diferencia de ahorros medios se puede escribir como A E que se


convierte en la hiptesis nula, el sistema a contrastar es:

H 0 : A E
H A : A E
La diferencia crtica se calcula con la frmula

dC Z X A X E

XE

A2
nA

E2
nE

517 2 4852
230

302

44,06

El valor de Z para 0,05 en una prueba bilateral es 1,96.


Luego

dC (1,96) (44,05) 86,34

FIGURA 3.15

Regla de decisin:
No rechazar la hiptesis nula si: - 86,34 < d a < 86,34

Ahora da X A X E 1.512 1.317 195

Como da dC

se rechaza la hiptesis nula. Los datos sugieren que el nivel

medio de ahorro en los dos continentes es diferente

EJEMPLO 3.16

Una empresa fabricante de camisas para hombres tiene dudas sobre el tiempo
medio necesario para fabricar sus dos modelos: clsico e informal. El jefe de
produccin afirma que lleva ms tiempo producir las camisas clsicas que fabricar
las informales. Los datos de produccin indican que para fabricar 90 camisas
clsicas se requiri una media de 140,2 horas con una desviacin tpica de 22,7
horas, mientras que para fabricar 110 camisas informales se tard una media de
131,7 horas con una desviacin tpica de 23,9 horas. Si el jefe de produccin tiene
razn, abandonarn la produccin de las camisas clsicas. Se deber hacer un
cambio en la lnea de produccin?

SOLUCION:

Como las varianzas poblacionales son desconocidas, se utilizan las varianzas


mustrales como estimaciones y el error tpico de la diferencia entre medias
mustrales se estimar por la frmula:

SX C

XI

SC2
S I2

nC
nI

La diferencia crtica se convierte en dC Z S X C

XI

Como el jefe de produccin afirma que lleva ms tiempo producir las camisas
clsicas C , que las informales

I , se puede escribir C I , y como esta

desigualdad no contiene el signo igual se toma como hiptesis alternativa y el


sistema es:

H 0 : C I
H A : C I
Que exige una prueba de cola a la derecha.

El valor de Z correspondiente a una prueba unilateral con 0,05

El valor crtico se obtiene reemplazando en la frmula d C Z S X C X I

SXC X I

(22,7)2
(23,9) 2

3,30
90
110

dC (1,65) (3,30) 5,45

es Z 1,65

FIGURA 3.16

Regla de decisin: no rechazar la hiptesis nula si d a 5,45 .


Como da X C X I 140,2 131,7 8,5 es mayor que d C 5,45 se rechaza la
hiptesis nula y el argumento del jefe de produccin queda respaldado, las
camisas clsicas deben dejar de fabricarse.

Consulte en internet las siguientes pginas:


http://www.youtube.com/watch?v=AJcy4eZMwWM
http://www.itch.edu.mx/academic/industrial/estadistica1/cap02.html
http://www.virtual.unal.edu.co/cursos/ciencias/2001091/html/un6/cont_601_54.html

Resumen
El contraste de hiptesis, es un procedimiento que puede emplearse para
verificar, con base en la informacin muestral, la validez de una conjetura o
hiptesis, que se haya formulado sobre la poblacin.

La hiptesis que se contrasta se llama Hiptesis nula (Ho) y con la que se


contrasta, hiptesis alternativa (Ha).

La hiptesis opuesta sobre el valor de una media poblacional, , se indica por lo


general en una de tres formas con referencia a un valor especfico 0 .

FORMA 1

FORMA 2

FORMA 3

H 0 : 0
H A : 0

H 0 : 0
H A : 0

H 0 : 0
H A : 0

Prueba bilateral

Prueba unilateral

Prueba unilateral

Las hiptesis opuestas sobre la diferencia entre dos medias poblacionales

A y B se indican del mismo modo sealado.

FORMA 1

FORMA 2

FORMA 3

H0 : A B
H A : A B

H 0 : A B
H A : A B

Prueba bilateral

Prueba unilateral

H0 : A B
H A : A B
Prueba unilateral

Las hiptesis opuestas sobre la proporcin poblacional

se indican del mismo

modo sealado.

Un estadstico de prueba es aquel valor calculado a partir de los datos


mustrales en una prueba de hiptesis para establecer si se rechaza o no se
rechaza la hiptesis nula. Entre ellos tenemos:

X 0

Para una media poblacional Muestras grandes

X 0
Para una media poblacional Muestras pequeas
SX
Px 0

Para una proporcin de la poblacin

La regla de decisin es un enunciado que se emite para determinar si se rechaza


la hiptesis nula. Especfica el valor crtico de los resultados mustrales; que se
determina con las expresiones:
Para pruebas bilaterales

X C H Z S X

X C H t S X

PC H Z P

Para pruebas unilaterales

X C H Z S X
XC

H Z X

X C H t S X
X C H t S X

PC H Z P
PC H Z P

Taller 3
1. Un fabricante ha estado recibiendo quejas de sus clientes por que los pedidos
llegan 12 o ms das despus de haber sido enviados. El fabricante selecciona
al azar 25 de los pedidos de la semana siguiente y los enva de una manera
diferente. Un estadstico ha de probar si el nuevo procedimiento es mejor, a un
nivel de significancia de = 0.05. El tiempo medio de entrega en la muestra
resulta de X =10, con una desviacin estndar muestral de s = 3 das. Haga la
prueba.

2. La administracin federal de aviacin cree que el nmero de despegues y


aterrizajes en aeropuertos en los Estados Unidos el ao pasado fue de 50 por
da. Elabore una propuesta de hiptesis adecuada de esta creencia en el nivel
de significancia de = 0.01, y use estos datos mustrales: n = 100, X = 71,
s = 30 (hay 13.000 aeropuertos en los Estados Unidos).

3. Un gerente desea probar la resistencia a la tensin del hilo que ha de usarse


en las nuevas mquinas de su compaa, la cual debe ser de por lo menos 25
libras. Se toma una muestra aleatoria de 16 carretes de varias remesas de
entrada al almacn cuya resistencia promedio es de 24 libras, con una
desviacin estndar de 0.5 libras. Haga una prueba de hiptesis a un nivel de
significancia de = 0.10 y diga si el hilo es apropiado.

4. Un economista desea probar si el salario promedio de mecnicos de aviacin


en EEUU es en realidad de 600 dlares por mes, como se ha estado diciendo.
Se toma una muestra aleatoria de n = 100 de los 29.952 mecnicos de
aviacin del pas; el nivel de significancia deseado es de = 0.05. La muestra

indica un salario medio de 675 dlares mensuales y una desviacin estndar


de 32 dlares. Haga la prueba.

5. Cuando funciona correctamente, un proceso produce frascos de champ cuyo


contenido pesa, en promedio, 200 gramos. Una muestra aleatoria de 9 frascos
de una remesa present los siguientes pesos (en gramos) para el contenido:
214

197

197

206

208

201

197

203

209

Asumiendo que la distribucin de la poblacin es normal, contrastar al nivel del


5%, la hiptesis nula de que el proceso est funcionando correctamente frente
a la alternativa bilateral.

6. Un distribuidor de cerveza afirma que una nueva presentacin, que consiste


en una fotografa de tamao real de un atleta muy famoso, incrementar las
ventas del producto en los supermercados en una media de 50 cajas
semanales. Para una muestra de 20 supermercados, el incremento medio en
las ventas fue de 41,3

cajas con una desviacin tpica

de 12,2 cajas.

Contrastar, al nivel del 5%, la hiptesis nula de que la media poblacional del
incremento en las ventas es al menos

de 50 cajas, indicando cualquier

supuesto que se haga.

7. Un funcionario que trabaja en el departamento de colocacin de una


Universidad, quiere determinar si los hombres y las mujeres graduados en
Administracin de Empresas reciben, en promedio, diferentes ofertas de
salarios en su primer trabajo despus de graduados. El funcionario seleccion
aleatoriamente 8 pares de egresados en esa disciplina de manera que las
calificaciones, intereses e historia de los integrantes de cada pareja fuesen lo
ms parecido posible. La mayor diferencia fue que un miembro de cada pareja

era hombre y el otro mujer. La tabla adjunta recoge la mayor oferta salarial
que recibi cada miembro de la muestra al terminar su carrera. Asumiendo que
las distribuciones son normales contrastar la hiptesis de que la verdadera
media es mayor para los hombres que para las mujeres.

PAREJA

MAYOR OFERTA SALARIAL (Miles de pesos)


HOMBRE

MUJER

1524

1586

1472

1540

1568

1566

1586

1590

1434

1486

1446

1596

1572

1608

1524

1588

8. Su empresa ha determinado en el pasado que el 53% exactamente de la gente


de su rea de marketing prefieren su producto. Se han gastado varios millones
de pesos en una campaa publicitaria para aumentar su participacin en el
mercado. Una muestra de 622 personas tomada despus de la campaa
revela que 346 prefieren su producto. Al nivel de significancia del 4%, se
podr concluir que se ha invertido bien el dinero en publicidad?

9. En calidad de nuevo directivo en formacin de la empresa KAM, su jefe le ha


encomendado que determine si los envos de la factora salen a tiempo. Usted
decide contrastar la hiptesis de que por lo menos el 95% de los pedidos
cumplen con los requisitos de plazo. Para guardar las espaldas, fija un nivel de
significancia del 1% y selecciona una muestra de 112 pedidos y encuentra que
8 de ellos se han retrasado. Qu le dira a su jefe?

10. Una revista especializada en computacin afirma que la gente tarda mximo34
horas, en promedio, en aprender un nuevo programa informtico. Est esta
afirmacin respaldada al nivel del 10% si 35 personas tardaron en aprender el
programa un promedio de 38,6 horas con una desviacin estndar de15,8
horas?

11. En un proceso de produccin de su empresa tienen que llenarse botellas de


agua pura mineral por lo menos con 16,2 onzas. En caso contrario, el proceso
se interrumpe mientras se hacen los ajustes necesarios. Como estadstico
oficial de la empresa, se le ha asignado la responsabilidad de determinar, con
una confianza del 99%, si el proceso funciona como es debido. En una muestra
de 24 botellas se halla que el peso medio del contenido es de 15,7 onzas y la
desviacin estndar de 3,7 onzas.

Deber ordenar que el proceso se detenga para realizar los ajustes?


12. The government of a wealthy country intends to institute a program to
discourage investment in foreign countries by its citizens. It is known that in the
past 35% of the countrys adult citizens held investment in foreign countries.
The government wishes to determine if the current percentage of adult citizens,
who own foreign investment is greater than this long term figure of 35%. A
random sample of 800 adults is selected, and it is found that 320 of these
citizens hold foreign assets. Is this percentage greater than 35%? Use a 10%
significance level for testing this claim10

10

Mohammed A. Shayib, Applied Statistics, bookboon.com, 2013, 172

Evaluacin
1. Un fabricante de detergente afirma que el contenido medio de los paquetes
que vende es de al menos 200 gramos. Se sabe que la distribucin de los
pesos es normal, con desviacin tpica de cuatro gramos. Una muestra de
16 paquetes da una media de 198,4 gramos. Para realizar el contraste de
hiptesis, al nivel del10%, el sistema requerido es:

A.

H 0 : 200

H A : 200

B.

H 0 : 200
H A : 200

D.

C.

H 0 : 200
H A : 200
H 0 : 200
H A : 200

2. El error tpico de la distribucin muestral del ejercicio 1 es:

3.

A. 12.5

B. 50

C. 0,25

D. 1

De una muestra de 361 propietarios de pequeas empresas que


quebraron, 105 no tuvieron asesora profesional antes de abrir el negocio.
Para contrastar la hiptesis nula de que como mucho el 25% de todas estas
pequeas empresa no tuvo asesora profesional antes de abrir el negocio,
el sistema de hiptesis requerido es:

A.

H 0 : 0.25
H A : 0,25

H 0 : 0,25

H A : 0,25

B.

H 0 : 0,25
H A : 0,25

D.

C.

H 0 : 25
H A : 25

4. El error tpico aproximado de la distribucin muestral del ejercicio 2 es:

A.0,240

B. 0,024

C. 0,283

D. 0,239

H 0 : 200
y
H A : 200

5. En un contraste de hiptesis cuyo sistema a contrastar es


__

se ha obtenido una media X y punto crtico X c , se rechaza la hiptesis


nula si:

__

A. X X c
__

C. X X c

__

__

B. X cInf X X cSup
__

D. X X c

http://www.virtual.unal.edu.co/cursos/ciencias/2007315/html/un6/cont_08_69.html

PRESENTACION

Existen muchos casos en la teora econmica y en el campo de la administracin


en los que se hace indispensable el uso del anlisis y correlacin como
herramienta fundamental para la constatacin de teoras relacionadas con la
naturaleza de las variables en la verificacin de la dependencia de una con
respecto a otra, y de esta forma hacer estimaciones y predicciones partiendo de
observaciones de la misma empresa.
En este captulo se presentan algunos conceptos fundamentales de anlisis de
regresin; utilizando como ayuda el modelo de regresin lineal en dos variables,
en el cual, la variable dependiente se expresa como una funcin lineal de una sola
variable independiente.

PREGUNTA PROBLEMA
Cmo crees que el anlisis de regresin lineal puede aplicarse en la solucin
de situaciones especficas de una empresa?

COMPETENCIAS ESPECFICAS

1. Interpreta correctamente los conceptos bsicos del anlisis de regresin


lineal simple.
2. Utiliza el mtodo de mnimos cuadrados ordinarios (MCO), para la
estimacin de los parmetros del modelo de regresin en dos variables.
3.

Establece inferencia acerca de los parmetros estimados

SABERES

Interpretacin de la regresin, terminologa y notacin

Estimacin por mnimos cuadrados

Verificacin de hiptesis, capacidad explicativa de una funcin de regresin

DINMICA PARA CONSTRUIR EL CONOCIMIENTO


ACTIVIDAD PREVIA (Trabajo Individual)
1. De las siguientes, es una ecuacin lineal:
A. 2 x 3 y 2 xy 1

B. 2x 3 y 2 y 2

C. 3x 2 y 3 4 x

D. x 3 y 5

2. En la ecuacin lineal 2 x 4 y 6 la pendiente es:


A. 0,5

B. 1,5

C. -0,5

D. -1,5

3. En una ecuacin lineal, la pendiente representa:

A. El incremento de la variable independiente con respecto a la variable


dependiente.
B. El incremento de la variable dependiente con respecto a la variable
independiente.
C. El intersecto con el eje X.
D. El intersecto con el eje Y.

4. Estimar la regresin lineal de Y sobre X, consiste en:

A. Determinar el intersecto con el eje Y.


B. Determinar el intersecto con el eje X.
C. Determinar la pendiente y la constante de regresin.
D. Determinar el coeficiente de determinacin.

ACTIVIDA GRUPAL
Socialice

los

resultados

obtenidos

individualmente

escriba

sus

conclusiones al respecto.
Redacte un informe sobre la importancia de la aplicacin de la regresin
lineal en que hacer de su profesin.
Escriba un listado de las dudas y dificultades en el desarrollo de la actividad
individual.

SABERES Y ACTIVIDADES

4. REGRESION LINEAL SIMPLE

Es comn que los economistas y administradores de empresa estn interesados


en la forma en que dos variables estn relacionadas. En general, cualquier estudio
econmico o empresarial debe comenzar con un conjunto de proposiciones que
emanan de la teora econmica y que el analista est interesado en constatar. Las
funciones de demanda de produccin son ejemplos claros de relaciones sobre las
que se puede estar interesado en constatar determinadas propiedades.

Se comenzar por la forma ms simple de regresin, que es la relacin lineal entre


dos variables.

4.1 INTERPRETACIN DE LA REGRESIN

En trminos generales se puede decir que: El anlisis de regresin est


relacionado con el estudio de la dependencia de una variable (VARIABLE
DEPENDIENTE)

de

una

ms

variables

adicionales

(VARIABLES

EXPLICATIVAS) con la perspectiva de estimar y/o predecir el valor (poblacional)


medio o promedio de la primera en trminos de los valores conocidos o fijos de las
segundas.

EJEMPLO 4.1

Un economista puede estar interesado en estudiar la dependencia que existe


entre los gastos personales de consumo y el ingreso personal real. Este tipo de
anlisis puede ser de gran ayuda para estimar la propensin marginal a consumir,
es decir, el cambio promedio en los gastos de consumo ante una variacin, de por
ejemplo, una unidad en el ingreso real.

EJEMPLO 4.2

Un profesional en economa laboral puede estar interesado en estudiar la relacin


existente entre el porcentaje de cambios en los salarios monetarios o nominales y
la tasa de desempleo. Dicho conocimiento puede ser de gran ayuda para realizar
conjeturas sobre el proceso inflacionario por el cual puede atravesar una
determinada economa, puesto que los aumentos en salarios probablemente se
refieran en aumento en los precios.

EJEMPLO 4.3

El director de mercado de una empresa puede estar interesado en conocer la


manera como se relaciona la demanda de su producto con los gastos en
publicidad en que incurre dicha empresa. Este tipo de estudio sera de gran
utilidad para averiguar la elasticidad de la demanda del producto en los gastos de
publicidad de la empresa, es decir, la respuesta promedio de la demanda ante un
aumento de una unidad, por ejemplo un dlar, en el presupuesto de gastos de
publicidad. Este conocimiento a la vez puede ser de mucha utilidad para
determinar el presupuesto ptimo de publicidad.

De los ejemplos anteriores se puede deducir que dentro del anlisis de regresin
nos interesa lo que se conoce como la dependencia estadstica, y no la
dependencia funcional o determinstica entre las variables, como aquellas que se
representan en la fsica clsica.

En las relaciones estadsticas entre variables tratamos esencialmente con


variables ALEATORIAS O ESTOCSTICAS, es decir, variables que tienen
distribuciones probabilsticas.

La mejor forma de ilustrar la regresin lineal, es utilizando los diagramas de


dispersin.

Supngase que X es el precio de un determinado bien a lo largo del tiempo e Y la


cantidad de demanda del mismo. Si la informacin disponible se refiere a n
observaciones, por ejemplo la cantidad demandada por un grupo de familias, sta
aparece recogida en dos series en la tabla 4.1.

Tabla 4.1 Cantidad demandada por un grupo de familias


Perodo

Precio

1
2
.
.
.
i
.
.
.
n

X1
X2
.
.
.
Xi
.
.
.
Xn

Cantidad demandada
Y1
Y2
.
.
.
Yi
.
.
.
Yn

Si el precio y la cantidad demandada son variables independientes, se movern


una al margen de la otra. En este caso, la representacin en un sistema de
coordenadas de los pares de la tabla anterior generara una nube de puntos como
las de la figura 4.1.

En el caso de que ambas variables no sean independientes, sino que estn


relacionadas funcionalmente, y si la relacin existente entre ambos es inversa, un
valor elevado de Y aparecer asociado a un valor pequeo de X y viceversa. En
trminos grfico, la relacin entre demanda y precio podra entonces tomar la
forma recogida en el diagrama de puntos de la figura 4.2.

La representacin grfica es eficaz para obtener una informacin intuitiva sobre la


evolucin de dos variables (y su relacin). Esta informacin, sin embargo, no suele
ser suficiente para el empresario o economista, que normalmente pretender
cuantificar la relacin existente entre las variables analizadas.

Dos tcnicas ampliamente utilizadas con objeto de cuantificar la relacin existente


entre las variables son el anlisis de regresin y el anlisis de correlacin. Aunque
estn estrechamente relacionadas conceptualmente las dos son muy diferentes.

La regresin es una expresin cuantitativa de la naturaleza bsica de la relacin


entre las variables dependientes e independientes. Por ejemplo, dado un modelo
de regresin simple con una variable independiente, el modelo determinar si las
dos variables tienden a desplazarse en la misma direccin (las dos crecen o
decrecen al mismo tiempo) o en sentido opuesto (una aumenta cuando la otra
disminuye). Tambin indicar la cantidad en qu Y cambiar cuando la variable
independiente vare en una unidad.

En el anlisis de correlacin el objetivo fundamental es la medicin de la fuerza o


grado de asociacin lineal entre variables, el coeficiente de correlacin mide la
solidez de dicha relacin.

4. 2 TERMINOLOGIA Y NOTACIN

Los trminos variables dependientes y variable explicativa se definen o describen


de varias maneras:

Variable Dependiente

Variable Independiente

Variable Explicada

Variable Explicativa

Variable Predicha

Variable Predictor

Variable Regresada

Variable Regresor

Variable Respuesta

Variable de Control.

Variable Endgena

Variable Exgena

Si estamos estudiando la dependencia de una variable en una sola variable


explicativa, como en el ejemplo de las ventas y la publicidad, dicho estudio se
conoce como Anlisis de Regresin Simple o en dos variables

4.3 FUNCIN DE REGRESIN POBLACIONAL


Se ha dicho que el objetivo del anlisis de regresin es estimar o predecir el valor
medio o promedio de la variable dependiente con base en los valores fijos o
conocidos de la variable explicativa.

Veamos mediante un ejemplo como se lleva acabo este anlisis:


Supngase que se est interesado en estudiar la relacin existente entre los
gastos de consumo familiar semanal Yy el ingreso familiar disponible semanal X.
Es decir, se desea predecir el nivel promedio de gastos de consumo semanales,
conociendo el ingreso de la familia en este lapso.

Se parte de una poblacin de 60 familias, divididas en 10 grupos con el mismo


ingreso aproximadamente.

Tabla 4.2

Datos hipotticos de ingresos familiares por semana

Ingreso familiar

80

100 120 140 160 180 200 220 240 260

55

65

79

80 102 110 120 135 137 150

60

70

84

93 107 115 136 137 145 152

Consumo por

65

74

90

95 110 120 140 140 155 175

semana.

75

80

94 103 116 130 144 152 165 178

70

85

98 108 118 135 145 157 175 180

88

113 125 140

160 189 185

115

162

191

Total

325

462 445 707 678 750 685 1043 966 1211

Valor esperado

65

77

89 101 113 125 137 149 161 173

Esta tabla se puede interpretar as:


Para un ingreso semanal de 100 mil pesos, hay 6 familias cuyos gastos de
consumo semanales estn entre 65 mil y 88 mil pesos. Es decir, cada columna
muestra la distribucin de los gastos de consumo Y correspondiente a un nivel fijo
de Ingreso X, esto es, muestra la distribucin condicional de Y dado valores de X.

Mediante el uso de la probabilidad condicional se puede calcular el valor esperado


de Y dado X, que es simplemente la media o valor promedio de la poblacin. Para
los datos hipotticos del ejemplo la media condicional de Y dado X = 120 se
calcula as:

E (Y/X= 120) = (1/5) (79) + (1/5) (84) + (1/5)(90) + (1/5) (94) + (1/5) (98) = 89.
En la ltima fila de la tabla 4.2 se muestran los dems valores esperados para Y
dado Xi respectivos.
Los valores de la tabla 4.2 se muestran en el siguiente diagrama de dispersin.

FIGURA 4.3 Distribucin de gastos para diferentes niveles de ingreso

En el diagrama se muestra claramente que, en promedio, los gastos de consumo


aumentan al incrementarse el ingreso. La anterior afirmacin puede apreciarse
mejor si se concentra la atencin en los puntos que representan diferentes valores
condicionales medios de Y que aparecen exactamente sobre una lnea recta con
pendiente positiva. Esta lnea se denomina lnea de regresin lineal.

De aqu se puede concluir que cada media condicional E (Y/Xi) est en funcin de
Xi. Simblicamente:

E(Y/Xi) = f ( Xi)

(4.1)

En donde f (Xi) denota una funcin de la variable explicativa X.

La ecuacin 4.1 se conoce como la funcin de regresin poblacional (FRP). Dicha


funcin denota nicamente que la media poblacional de la distribucin de Y dado
Xi est funcionalmente relacionada con Xi. Es decir, dice cmo la respuesta media
o promedio de Y vara con X.

En situaciones reales no se cuenta con la totalidad de la poblacin para efectuar el


anlisis. Por tanto la forma funcional de FRP debe ser aproximada de una manera
emprica; se puede suponer que la FRP es una funcin lineal de Xi.
E(Y/Xi) =

(4.2)

En la cual 1 y 2 son parmetros desconocidos pero fijos que se denominan


coeficientes de regresin. Esta expresin se conoce como funcin de regresin
lineal poblacional.

4.4 ESPECIFICACIONES ESTADISTICAS DE LA FRP.

Como se aprecia en la figura 4.3 a medida que el ingreso familiar aumenta, los
gastos de consumo familiar en promedio tambin aumentan. Pero si observamos
la tabla 4.2 se deduce que no necesariamente aumentan con el nivel de ingreso.
Por ejemplo: para un nivel de ingreso de $100.000 existe una familia cuyos gastos
de consumo de $65.000 son menores que el gasto de consumo de dos familias
cuyo ingreso semanal es solo de $80.000.

Sin embargo los gastos de consumo promedio de las familias con ingresos
semanales de $100.000 son superiores que los de familia con ingresos semanales
de $80.000; $77.000 y $65.000 mil respectivamente.

De este anlisis se concluye que para un nivel de ingreso dado Xi, los gastos de
consumo de una familia se concentran alrededor del consumo promedio de todas
las familias para ese mismo Xi, esto es, alrededor de su esperanza condicional.
Por consiguiente, se puede expresar la desviacin de un Yi individual alrededor de
su valor esperado as:

(4.3)

En donde la desviacin i es una variable aleatoria no observable que toma


valores positivos o negativos y se le conoce como perturbacin estocstica o
trmino del error estocstico.

La ecuacin 4.3 postula que los gastos de una familia, dado su nivel de ingreso,
son iguales a los gastos promedios de consumo de todas las familias con ese nivel
de ingreso, ms una cantidad que es aleatoria.
Si se supone que E( Y/Xi) es lineal en Xi como en la ecuacin 4.2, entonces:
Yi = E( Y/Xi) +

i
(4.4)

Ahora si se toma el valor esperado en la ecuacin 4.3 a ambos lados se tiene:


E (Yi / Xi ) = E [ E (Yi/Xi)] + E ( i /Xi)
= E (Y / Xi ) + E ( i / Xi)
Puesto que E ( Yi/ Xi ) = E ( Y/ Xi ), entonces E ( i / Xi) = 0

En otras palabras, el supuesto de que la lnea de regresin pasa por los medios
condicionales implica que los

valores medios condicionales

son iguales a

cero. De donde se deduce que:


E ( Y/ Xi ) = 1 2 Xi es equivalente a :
Yi = 1 2 Xi i

si

E(Yi / Xi) 0

La especificacin estocstica de 4.4 ofrece la ventaja de mostrar que, adems del


ingreso, existen otras variables que afectan los gastos de consumo de una familia,
los cuales no se pueden explicar en su totalidad por la variable incluida en el
modelo de regresin.

4.5 FUNCION DE REGRESION MUESTRAL (FRM)

Como en la prctica lo que est al alcance del analista es una muestra de valores
de Y correspondientes a valores fijos de X, se debe hacer consideraciones de
muestreo. Por consiguiente la tarea es la estimacin de la Funcin de Regresin
Muestral (FRM) con base en informacin muestral. Para ello supngase que se
obtienen dos muestras de Y seleccionadas aleatoriamente para valores fijos de X.
(vase tabla 4.3). Ahora se cuenta con un solo valor de Y para cada X dado.

Al realizar un diagrama de dispersin con los datos de la tablas 4.3 se observa


que no es factible estimar con precisin la FRP, debido a las fluctuaciones
mustrales como se ve en la figura 4.4, en donde se grafican dos lneas de
regresin muestral que tratan de ajustar lo mejor posible los puntos de dispersin.
FRM1 y FRM2

son las resultantes de la primera y segunda muestra

respectivamente; aqu no existe modo alguno de afirmar con certeza cul de las
dos

lneas

representan

la

verdadera

lnea

de

regresin

poblacional.

Supuestamente, ambas representan la lnea de regresin poblacional, pero debido


a las fluctuaciones mustrales son una aproximacin de la verdadera FRP. En
general se obtendr N FRMS diferentes para N

muestras diferentes y no es

factible que estas sean iguales.

TABLA 4.3 Muestras de Y para valores fijos de X


Muestra aleatoria 1

Muestra aleatoria 2

70

80

55

80

65

100

88

100

90

120

90

120

95

140

80

140

110

160

118

160

115

180

120

180

120

200

145

200

140

220

135

220

155

240

145

240

150

260

175

260

FIGURA 4.4 Distribucin de un solo gasto para diferentes niveles de ingreso.

De manera anloga a la FRP en que se fundamenta

la regresin lineal

poblacional, es posible desarrollar el concepto de funcin de regresin muestral.


Para representar la lnea de regresin muestral, la expresin a utilizar es:

Yi 1 2 Xi
donde : Yi Estimador de E (Y / Xi)
I Estimador de 1

2 Estimador de 2
En la forma estocstica la funcin de regresin poblacional es:

Yi 1 2 Xi ei
En donde ei denota el trmino residual (muestral).

En sntesis, el objetivo fundamental del anlisis de regresin consiste en estimar


la FRP Yi 1 2 Xi i
Con base en la FRM Yi 1 2 Xi ei

FIGURA 4.5 Comparativo de la FRM con la FRP

4.6 ESTIMACION POR MINIMOS CUADRADOS

Supngase que se dispone de ( x1 , y1 ) , ( x2 , y 2 ) ... ( xn , y n ) n pares de observaciones.


El objetivo es encontrar la recta que se ajuste mejor a estos datos, es decir,
estimar los coeficientes desconocidos de la recta de regresin poblacional. La
manera natural de estimar los parmetros, es encontrar estimadores de
que hagan mnimos los errores.

1 y 2

FIGURA 4.6 Estimacin minimizando los errores

Cualquier estimador razonable de la recta de regresin dejar algunos de los


datos observados por debajo y otros por encima de la recta estimada. Por lo tanto

alguno de los ei de la ecuacin

ei Y i 1 2 Xi , sern positivos y otros

negativos. Si se quiere penalizar por igual los valores positivos y los negativos de
la misma magnitud, una posibilidad es trabajar con los cuadrados de ei . La suma
de las descripciones al cuadrado entre los puntos y la recta es:

ei

(Yi Yi ) 2

(Y i 1 2 Xi ) 2

El mtodo de mnimos cuadrados selecciona cono estimador de la recta de


regresin poblacional, a aquellos valores para los cuales esta suma de cuadrado
es menor.

Para minimizar,

respecto a 1 y 2 se tiene:

e 2 i
1

ei2
2

2 Yi 1 2 X i 0
2 Xi(Yi 1 2 Xi) 0

Yi Xi 0
Xi Yi Xi 0
1

Luego:

(1)

(2)

Las ecuaciones (1) y (2) se pueden escribir:


n

Yi
i 1

XiYi
i 1

Xi , entonces , Yi n

i 1

i 1

1 Xi 2

2
i

Estas ecuaciones se llaman

(1)

Ecuaciones Normales. Este sistema se puede

en (1) se tiene:

Yi 2 X i

Xi

(2)

resolver por sustitucin u otro mtodo.


Despejando

(*)

Sustituyendo * en (2) se obtiene:

Yi 2
XiYi

Xi

Xi X

XiYi

XiYi

Xi Yi

2 Xi

Xi Yi

Xi Yi
X

2
i

2
i

2 X i2

2 X i2

Entonces: 2

Xi

Xi Yi
n
Xi2
n

XiYi
X

2
i

n Xi

Yi

n.n
2
n Xi
n.n

EJEMPLO 4.4

Con los siguientes datos relativos a consumo renta (en Dlares) de 15 familias
ajuste una regresin:
Consumo = 1 2 renta.
Los datos se dan en dlares semanales.
Consumo 74 98
Renta

80 53 57 81 44 90 72 47 87 50 42 101 44

80 110 90 60 60 65 45 91 78 84 87 92 90 98

Solucin: Y

1 2 Xi

56

Yi

Xi

(Consumo)

(Renta)

XiYi

X i2

74

80

5920

6400

98

110

10780

12100

80

90

7200

8100

53

60

3180

3600

57

60

3420

3600

81

65

5265

4225

44

45

1980

2025

90

91

8190

8281

72

78

5616

6084

47

84

3948

7056

87

87

7569

7569

50

92

4600

8464

42

90

3780

8100

101

98

9898

9604

44

56

2464

3136

Y 68

X 79,06

XiYi 83810

2
i

98344

Xi Yi n X Y
X nX

83810 (15) (79,06) (68)


83810 80641,2
3168,8

0,69
2
98344 93757 ,25
4586,75
98344 15 (79,06)

2
i

2 0,69
1 Y 2 X
1 68 (0,69) (79,06)
1 13,38

n 15

As el modelo estimado queda representado por Y = 13,38 + 0,69X

Se puede interpretar la regresin estimada de la siguiente manera: Si la renta


semanal aumenta en un dlar, se espera que el consumo promedio diario
aumente aproximadamente en 69 centavos de dlar.

Si la renta de una familia fuera de cero dlares, se esperara que el consumo


semanal sea de aproximadamente 13,4 dlares.

La grfica 4.7 presenta la recta de regresin estimada junto con los

dems

puntos.

FIGURA 4.7 Estimacin Consumo - Renta

4.7 SUPUESTOS FUNDMENTALES PARA EL MODELO DE REGRESION


LINEAL

Se ha dicho que en el anlisis de regresin el objetivo no es solamente

obtener 1 y 2 , si no tambin hacer inferencia acerca de los verdaderos


valores de 1 y 2 . Es decir, se puede estar interesado en saber que tan

cerca estn 1 y 2 de los parmetros poblacionales, as como que tan

ajustado est Y i al verdadero E(Y/Xi). Por lo tanto se hace necesario plantear


ciertos supuestos sobre la manera como se genera Xi y i , dado que

Yi 1 2 X i i . Lo cual muestra que Yi depende tanto de Xi como de i .


As, para hacer cualquier inferencia estadstica sobre Yi y sobre 1 y 2 , se
deben plantear los siguientes supuestos:

SUPUESTO 1
El valor medio o promedio de i es igual a cero, ese decir, E( i /Xi) = 0.
Con este supuesto se asegura que aquellos factores que no estn
explcitamente incluidos en el modelo no afectan sistemticamente al valor de
Y. En otras palabras, se supone que los valores positivos de i se cancelan
con los valores negativos de tal forma que sus efectos promedios sobre Y es
cero.

SUPUESTO 2
Igual varianza para i . Esto quiere decir que el trmino aleatorio tiene la
misma varianza en cada periodo o elemento de la muestra. A esta propiedad
se le denomina HOMOCEDASTICIDAD, e implica que las observaciones de
Yi que corresponden a diferentes valores de Xi tienen la misma varianza.

Varianza de X i E i E ( i ) E ( i ) 2 2
2

SUPUESTO 3
No existe auto correlacin entre las i
Esto significa que los trminos aleatorios de un periodo son independientes
de los de cualquier otro periodo o covarianza.

( i , j ) E i E ( i ) j E ( j ) 0

SUPUESTO 4
Cero varianza entre i y Xi
Aqu se supone que el trmino de perturbacin es independiente de la
variable explicativa. Este supuesto se introduce para poder establecer un
efecto individualizado de X y de i sobre la variable Y. Si la variable
explicativa y el trmino aleatorio estn correlacionados no es posible
establecer su efecto individual sobre la variable explicada.

Adems, sobre la variable independiente se establece que:


Los valores de la variable permanecen fijos de una muestra a otra.
La variable se mide sin error de observacin.

4.8 VERIFICACIN DE HIPTESIS

Dado que las perturbaciones siguen una distribucin para las que se han
introducido unos supuestos, la forma de clculo de los estimadores hace que ellos
tambin sean variables aleatorias con una cierta distribucin. Esto implica que el
verdadero valor puede cambiar de una muestra a otra y por ello resulta
conveniente alguna medida de precisin de estos estimadores. Para ello en
estadstica se utiliza la desviacin estndar o ERROR ESTANDAR DE LOS
ESTIMADORES. En este sentido cabe sealar que si a los supuestos anteriores

se les aade la hiptesis de que la variable i sigue una distribucin normal, con
media cero y varianza 2 , se puede demostrar que el cociente entre la diferencia

de los estimadores 1 y 2 y los parmetros poblacionales, y sus desviaciones


estndar S y S se distribuyen como una t de student con n 2 grados de
1

libertad (numero de observaciones menos numero de parmetros estimados). Esto


es:

Donde

desviacin estndar o

representa la
error

estndar de 1 y se
obtiene mediante la
frmula:

El error estndar de 2 , S se calcula con la frmula:


2

En ambas expresiones se representa la varianza residual corregida, estimador


insesgado de la varianza del trmino de perturbacin 2 y se define as:

ei2
S
n2
2
e

Dada una muestra y obtenida una estimacin de 1 mediante el mtodo de


mnimos cuadrados, se puede construir un intervalo de confianza a travs de la
expresin

i S t , n2 , la cual arrojara dos valores entre los cuales se encuentra

el parmetro buscado con nivel de significancia que se desee. Cuanto mas


pequeo sea dicho intervalo, mas precisa ser la estimacin.

EJEMPLO 4.5
Con los datos relativos a Consumo Renta de 15 familias (ejemplo 4.4), construir
un intervalo de confianza del 95% para el coeficiente de regresin.

SOLUCION:

Primero se debe calcular el error estndar de 2 ,

S
2

S e2

2
i

nX

ei2
S
, para este caso n 2 = 15 2 = 13
n2
2
e

2
i

SCE , suma de cuadrados

ei Yi Yi ,

Yi 13,38 0,69 X i

Luego reemplazando cada valor de Xi, se obtiene el valor estimado respectivo


para Yi, como se muestra en la siguiente tabla.

Xi

Yi

80

ei2

74

Yi 13,38 0,69 X i
68,58

ei Yi Yi
5,42

29,3764

110

98

89,28

8,72

76,0384

90

80

75,48

4,52

20,4304

60

53

54,78

-1,78

3,1684

60

57

54,78

2,22

4,9284

65

81

58,23

22,77

518,4729

45

44

44,43

-0,43

0,1849

91

90

76,17

13,83

191,2689

78

72

67,20

4,80

23,0400

84

47

71,34

-24,34

592,4356

87

87

73,41

13,59

184,6881

92

50

76,86

-26,86

721,4596

90

42

75,48

-33,48

1120,9104

98

101

81,00

20,00

400,0000

56

44

52,02

-8,02

64,3204

1020

1019,04

0,96

3950,7228

1186

Luego S e2

As, S
2

2
i

3950,7228

3950,7228
303,90
13

S e2

2
i

nX

303,90
303,90

0,2574
2
4586,746
98344 15(79,06)

Al reemplazar los valores S 0,2574 ; n 2 = 13 y t 0.5,13 2,160 , los lmites del


2

intervalo para el coeficiente de regresin son:

2 S t0.5 ,13 0,69 (0,2574 )(2,160) 0,69 0,556 .

As, 2 (0.134 , 1.246) , lo que indica que el parmetro 2 aproximadamente est


entre 0,13 y 1,25 con una confianza del 95%.

Adems si e hace uso de la expresin

i i
S

t , n2 se puede verificar o

contrastar la hiptesis acerca de un parmetro determinado. Esto es, si se quiere


verificar que 1 toma un valor concreto h, se platea como sistema de hiptesis:

H o : 1 h
H A : 1 h

Como

i i
S

t n 2 , bajo la hiptesis nula se puede obtener t

i h
S

t n2 .

Este valor se contrasta con el valor terico arrojado por las tablas de distribucin al
nivel de significancia escogido con n 2 grados de libertad. Debe tenerse en
cuenta si la hiptesis es bilateral o unilateral.
En el caso de una hiptesis bilateral, si el valor del estadstico es tal que t t c se
rechaza Ho.
EJEMPLO 4.6

Verificar si la renta es explicativa de las variaciones en el consumo (Ej. 4.4)


SOLUCION:
Se formula es sistema de hiptesis:

Ho : 2 0
H A : 2 0

La eleccin del test de una sola cola responde al conocimiento que se tiene sobre
la teora de consumo que es funcin directa de renta.
Para un nivel de significancia del 5% y 13 grados de libertad, t c 1,77

Ahora, t

2 2
S

2
S

0,69
2,68
0,2574

FIGURA 4.8 Prueba de hiptesis, Consumo - Renta

Como t t c se rechaza Ho y por lo tanto se puede decir que en la muestra

estudiada 2 0,69 es un parmetro significativo, pudindose concluir entonces


que la renta es explicativa de las variaciones en la cantidad consumida.

4.9 CAPACIDAD EXPLICATIVA DE UNA ECUACION DE REGRESION LINEAL.

Una ecuacin de Regresin puede considerase como un intento de emplear la


informacin proporcionada por una variable independiente X para explicar el
comportamiento de una variable dependiente Y.11

Existe una medida de uso muy generalizada en el anlisis de regresin que indica
el grado de explicacin que la variable independiente logra al ajustar los datos
mediante una relacin lineal que se denomina coeficiente de determinacin, R
squared; cuando los datos son arrojados mediante ordenador.

11

PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p398

El coeficiente de determinacin se representa por R2 y se calcula mediante


el cociente entre la varianza explicada por el modelo y la varianza total de la
variable dependiente.

Para los valores muestrales, la recta de regresin estimada puede escribirse

como Y 1 2 X i ei o tambin, Y Y ei donde Y 1 2 X i

La cantidad Yi es el valor predicho por la recta de regresin para la variable


dependiente, y el residuo ei es la diferencia entre los valores observado y
predicho. Por tanto, el residuo representa la parte del comportamiento de la
variable dependiente que no puede ser explicada por su relacin lineal con la
variable independiente12 (Ver figura 4.9)

FIGURA 4.9. Particin de los componentes de la variacin de Yi

12

PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa, Prentice Hall 1997, p399

Ahora si a la ecuacin Y Y ei se resta Y a cada lado se obtiene:

(Yi Y ) (Yi Y ) ei . Elevando al cuadrado ambos trminos de la ecuacin y


sumando respecto al ndice i, se obtiene como resultado:

(Y

Y )2

Variabilidad
Total
SCT

(Y Y )

Variabiliada exp licada


por el mod elo
SCR

2
i

Variabilidad
no exp licada

SCE

Dnde: SCT = Suma de cuadrados total.


SCR = Suma de cuadrados de la regresin.
SCE = Suma de cuadrados residual (o del error).
Al dividir la ecuacin SCT = SCR + SCE entre SCT se tiene:

SCT SCR SCE

SCT SCT SCT


1

SCR SCE

SCT SCT

Luego R 2 1

Pero

SCR
R2
SCT

SCE
SCT

0 R 2 1 , ya que es imposible explicar ms del 100% de la variable Y.

Con los valores del ejemplo 4.4 se obtiene la siguiente informacin:

Yi

74

Yi 13,38 0,69 X i
68,58

ei Yi Yi
5,42

98

89,28

80

Yi Y
6

Yi Y
0,58

8,72

30

21,28

75,48

4,52

12

7,48

53

54,78

-1,78

-15

-13,22

57

54,78

2,22

-11

-13,22

81

58,23

22,77

13

-9,77

44

44,43

-0,43

-24

-23,57

90

76,17

13,83

22

8,17

72

67,20

4,80

-0,8

47

71,34

-24,34

-21

3,34

87

73,41

13,59

19

5,41

50

76,86

-26,86

-18

8,86

42

75,48

-33,48

-26

7,48

101

81,00

20,00

33

13

44

52,02

-8,02

-24

-15,98

SCE ei2 3950,7228

SCT (Yi Y ) 2 6138

SCR (Yi Y ) 2 2176,2828


El coeficiente de determinacin es por tanto:

R2 1

3950,7228
0,3563
6138

Este resultado indica que aproximadamente el 36% de la variabilidad muestral del


consumo est explicada por su dependencia lineal con la renta por hogar.
Otra forma de calcular el coeficiente de determinacin R2 es utilizando las formula:

( S XY ) 2
X Y
R
, donde S XY XY
S X SY
n
2

SX X

Para el ejemplo:

Y
Y
n

SY

S XY 83810

(1186 )(1020 )
3162
15

S X 98344

(1186) 2
4570,93
15

SY 75498

(1020) 2
6138
15

R2

( S XY ) 2
(3162 ) 2
9998244

0,3563
S X SY
(4570,93)(6138) 28056368 ,34

Consulte las siguientes pginas en internet:

http://www.uv.es/uriel/material/Morelisi.pdf
http://www.youtube.com/watch?v=J1DoRMupI8k
http://www.slideshare.net/adangraus/regresion-lineal-simple-13381573

Resumen
En trminos generales se puede decir que: El anlisis de regresin est
relacionado con el estudio de la dependencia de una variable (VARIABLE
DEPENDIENTE)

de

una

ms

variables

adicionales

(VARIABLES

INDEPENDIENTES) con la perspectiva de estimar y/o predecir el valor


(poblacional) medio o promedio de la primera en trminos de los valores
conocidos o fijos de la segunda.

En trminos grfico, la relacin entre demanda y precio podra entonces tomar la


forma recogida en el diagrama de puntos

La representacin grfica es eficaz para obtener una informacin intuitiva sobre la


evolucin de dos variables (y su relacin). Esta informacin, sin embargo, no suele
ser suficiente para el empresario o economista, que normalmente pretender
cuantificar la relacin existente entre las variables analizadas.

El mtodo de mnimos cuadrados selecciona cono estimador de la recta de


regresin poblacional, a aquellos valores para los cuales esta suma de cuadrado
es menor.
Para minimizar,

respecto a 1 y 2 se tiene:

Yi

2 Xi
n

Y 2 X

Xi Yi n X Y
X nX

2
i

La recta estimada de regresin queda expresada como

Y 1 2 Xi
El Coeficiente de determinacin R2

indica el grado de explicacin que la

variable independiente logra al ajustar los datos mediante una relacin lineal Es
una medida de uso muy generalizada en el anlisis de regresin.

El coeficiente de determinacin se representa por R2 y se calcula mediante


el cociente entre la varianza explicada por el modelo y la varianza total de la
variable dependiente.

(Y

Y )2

Variabilidad
Total
SCT

(Y Y )

Variabiliada exp licada


por el mod elo
SCR

2
i

Variabilidad
no exp licada

SCE

Dnde: SCT = Suma de cuadrados total.


SCR = Suma de cuadrados de la regresin.
SCE = Suma de cuadrados residual (o del error).

R2 1

SCE
SCT

0 R2 1

Taller 4
1. Una compaa asigna diferentes precios a una radio grabadora particular en 8
ciudades diferente del pas, la tabla adjunta muestra el nmero de unidades
vendidas y los precios correspondientes en miles de pesos.

Ventas:

420

380

350

400

440

380

450

420

Precio:

55

60

65

60

50

65

45

50

a. realice un grfico con estos datos y estime la regresin lineal de las ventas
sobre el precio.
b. Qu efectos se esperara en las ventas si se produjera un incremento de
10.000 pesos
c. Halle un estimador puntual del volumen de venta cuando el precio de radio
grabadora en una ciudad dada es de 48. 000 pesos.
d. Si el precio de una radio grabadora se fija en 48.000 pesos, hallar intervalos de
confianza del 95% para el volumen de ventas reales en una ciudad concreta y
para el nmero esperado de ventas en esa regin.

2. Para una muestra de 20 observaciones mensuales, un analista financiero quiere


efectuar la regresin de la tasa porcentual del rendimiento (Y) de las acciones de
una empresa sobre la tasa porcentual del rendimiento (X) de un ndice burstil.
Dispone de la siguiente informacin:

Y
X

22,6

2
i

145,7

X 25,4
X Y 150,5
i

i i

a. Estime la regresin lineal de Y sobre X.


b. Interprete la pendiente de la recta de regresin muestral
c. Interprete la constante de la recta de regresin muestral.

3. Una compaa distribuye un test de aptitud entre todos sus nuevos


representantes de venta. La direccin tiene inters en conocer la capacidad del
test para predecir el eventual xito de estos representantes. La tabla adjunta
recoge el valor de las ventas semanales medias (en millones de peso) y las
puntuaciones obtenidas en el test de aptitud para una muestra aleatoria de 8
representantes
Ventas semanales:

10

12

28

24

18

16

15

12

Puntuacin en el test:

55

60

85

75

80

85

65

60

Estime la regresin lineal de las ventas semanales sobre las puntuaciones en el


test de aptitud.

4. Se conjetura que el nmero de botellas de una cerveza importada que se vende


cada noche en los restaurantes de una ciudad depende linealmente del costo
medio de las cenas en esos restaurantes. Los siguientes resultados se obtuvieron
de una muestra de 17 restaurantes de aproximadamente de igual tamao, donde

X 2.550

n 1

Y 16

3.500.000

X Yi Y
n 1

18.000

Hallar la recta de regresin muestral

5. Una cadena de restaurantes de comidas rpidas decide llevar a cabo un


experimento para medir la influencia del gasto en publicidad sobre las ventas. En 8
ciudades del pas, se realizaron diferentes variaciones relativas en el gasto en
publicidad, comparado con el del ao anterior, y se observaron las variaciones en
los niveles de ventas resultantes. La tabla adjunta muestra los resultados.

Incremento del gasto en publicidad (%) Incremento en las ventas (%)


0

2,4

7,2

14

10,3

10

9,1

10,2

4,1

7,6

3,5

a. Estimar la regresin lineal del incremento en las ventas sobre el gasto en


publicidad.
b. Hallar un intervalo de confianza del 90% para la pendiente de la recta de
regresin.

6. Se intent evaluar el tipo a plazo como predictor del tipo al contado en el


mercado de valores. Para una muestra de 79 observaciones trimestrales, se
obtuvo la regresin lineal estimada

Y = 0.00027

+ 0.7916X, donde Y es la

Variacin real en el tipo al contado y X es la Variacin en el tipo a plazo. El


coeficiente de determinacin fue de 0.097 y la desviacin tpica estimada de la
pendiente de la recta de regresin poblacional fue de 0.2759.

a. Interpretar la pendiente de la recta de regresin estimada.


b. Interpretar el coeficiente de determinacin
c. Contrastar la hiptesis de que la pendiente de la recta de regresin es positiva,
interprete el resultado.
d. Contrastar la hiptesis de que la pendiente de la recta de regresin poblacional
es 1.

7. La tabla muestra, para 8 marcas de caf instantneo, el nmero medio de


adquisiciones por comprador (Y) y el porcentaje de compradores en un ao (X)

3.6

3.3

2.8

2.6

2.7

2.9

2.0

2.6

24

21

22

22

18

13

a. Estimar la regresin de las adquisiciones por comprador sobre el porcentaje


de compradores.
b. Interpretar la pendiente de la recta de regresin estimada.
c. Hallar e interpretar el coeficiente de determinacin.
d. Hallar e interpretar un intervalo de confianza del 90% para la pendiente de la
recta de regresin poblacional.
e. Hallar un intervalo de confianza del 90% para las adquisiciones por comprador
esperadas en una marca cuyo porcentaje de compradores es 20.

8. Supongamos que el pasado ao ocho empresas tuvieron los beneficios y gastos


(en millones de pesos) en investigacin recogidos en la tabla adjunta.

a. Ajuste una lnea de regresin tomando los beneficios como variable


dependiente y los gastos en investigacin como variable independiente.
b. Obtenga

el coeficiente de terminacin y verifique la significacin de la

pendiente de la recta de regresin. A partir de los resultados obtenidos,


podremos concluir que los gastos en investigacin originan beneficios?

BENEFICIOS

GASTOS DE INVESTIGACION

50
60
40
50
30
45
50
50

40
40
30
50
40
45
35
55

9. Los economistas suelen afirmar que las variaciones del PNB real afectan a la
rentabilidad de los fondos de inversin. A continuacin se presentan los datos
recogidos para u periodo de 10 aos.
Porcentaje de variacin del PNB real

Rendimiento de los fondos de


inversin (%)

1.3
1.5
0.2
-1.1
1.9
2.1
2.6
2.4
3.1
2.7

21.0
25.0
18.0
7.0
25.0
21.0
31.0
29.0
33.0
32.0

a. Qu sugiere el coeficiente de regresin?


b. Respalda el coeficiente de determinacin esta afirmacin?
c. Calcular e interpretar el error tpico de la estimacin.

Evaluacin
RESPONDA LAS PREGUNTAS CON BASE EN LA SIGUIENTE INFORMACION

Se prueba una campaa publicitaria para un producto en 10 ciudades. La


intensidad X de la publicidad vara de una ciudad a otra. El porcentaje Y de
familiaridad con el producto se determina por medio de una encuesta despus
de la campaa publicitaria; en esta se obtuvo el siguiente resumen numrico:

x 62,5
y 23421,27

y 413,7

411,25

xy 2930,45

1. La pendiente de la recta estimada est dada por la expresin:

B.

(62,5)(413,7)
10
(62,5) 2
411,25
10

D.

2930,45
C.

(62,5)(413,7)
10
411,25 (6,25) 2

2930,45

2930,45 10(62,5)(413,7)
A.
411,25 10(62,5) 2

2930,45 10(6,25)(41,37)
411,25 10(62,5) 2

2. El valor de la pendiente de regresin indica:

A. El incremento en el porcentaje de aceptacin del producto por cada


punto de aumento en la intensidad de la publicidad.
B. El incremento en la intensidad de la publicidad por cada punto de
aumento en el porcentaje de aceptacin del producto.

C. El incremento en el porcentaje de aceptacin del producto cuando la


intensidad de la publicidad es cero.
D. El incremento en la intensidad de la publicidad cuando el aumento en
el porcentaje de aceptacin del producto es cero.

3. El valor de coeficiente de determinacin R2

indica que:

A. La intensidad en la publicidad est explicada por su dependencia


lineal con el porcentaje de aceptacin en un R2x100%
B. La intensidad en la publicidad est explicada por su dependencia
lineal con el porcentaje de aceptacin en un R2%
C. El porcentaje de aceptacin est explicado en un R2% por su
dependencia lineal con La intensidad en la publicidad.
D. El porcentaje de aceptacin est explicado en un R2x100% por su
dependencia lineal con La intensidad en la publicidad.

4. La constante de regresin est dada por la expresin:

413,7

A.
10

B.

413,7

10

C.

D.

(62,5)(413,7)
10
(62,5) 2
411,25
10

2930,45

(62,5)(413,7)
10
411,25 (6,25) 2

2930,45

413,7 2930,45 10(62,5)(413,7)

10
411,25 10(62,5) 2
413,7 2930,45 10(6,25)(41,37)

10
411,25 10(62,5) 2

TABLA 1
DISTRIBUCION NORMAL13

Z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0

13

0.00
0.0000
0.0398
0.0793
0.1179
0.1554
0.1915
0.2257
0.2580
0.2881
0.3159
0.3413
0.3643
0.3849
0.4032
0.4192
0.4332
0.4452
0.4554
0.4641
0.4713
0.4772
0.4821
0.4861
0.4893
0.4918
0.4938
0.4953
0.4965
0.4974
0.4981
0.4987

0.01
0.0040
0.0438
0.0832
0.1217
0.1591
0.1950
0.2291
0.2611
0.2910
0.3186
0.3438
0.3665
0.3869
0.4049
0.4207
0.4345
0.4463
0.4564
0.4649
0.4719
0.4778
0.4826
0.4864
0.4896
0.4920
0.4940
0.4955
0.4966
0.4975
0.4982
0.4987

0.02
0.0080
0.0478
0.0871
0.1255
0.1628
0.1985
0.2324
0.2642
0.2939
0.3212
0.3461
0.3686
0.3888
0.4066
0.4222
0.4357
0.4474
0.4573
0.4656
0.4726
0.4783
0.4830
0.4868
0.4898
0.4922
0.4941
0.4956
0.4967
0.4976
0.4982
0.4987

0.03
0.0120
0.0517
0.0910
0.1293
0.1664
0.2019
0.2357
0.2673
0.2967
0.3238
0.3485
0.3708
0.3907
0.4082
0.4236
0.4370
0.4484
0.4582
0.4664
0.4732
0.4788
0.4834
0.4871
0.4901
0.4925
0.4943
0.4957
0.4968
0.4977
0.4983
0.4988

0.04
0.0160
0.0557
0.0948
0.1331
0.1700
0.2054
0.2389
0.2704
0.2995
0.3264
0.3508
0.3729
0.3925
0.4099
0.4251
0.4382
0.4495
0.4591
0.4671
0.4738
0.4793
0.4838
0.4875
0.4904
0.4927
0.4945
0.4959
0.4969
0.4977
0.4984
0.4988

0.05
0.0199
0.0596
0.0987
0.1368
0.1736
0.2088
0.2422
0.2734
0.3023
0.3289
0.3531
0.3749
0.3944
0.4115
0.4265
0.4394
0.4505
0.4599
0.4678
0.4744
0.4798
0.4842
0.4878
0.4906
0.4929
0.4946
0.4960
0.4970
0.4978
0.4984
0.4989

0.06
0.0239
0.0636
0.1026
0.1406
0.1772
0.2123
0.2454
0.2764
0.3051
0.3315
0.3554
0.3770
0.3962
0.4131
0.4279
0.4406
0.4515
0.4608
0.4686
0.4750
0.4803
0.4846
0.4881
0.4909
0.4931
0.4948
0.4961
0.4971
0.4979
0.4985
0.4989

0.07
0.0279
0.0675
0.1064
0.1443
0.1808
0.2157
0.2486
0.2794
0.3078
0.3340
0.3577
0.3790
0.3980
0.4147
0.4292
0.4418
0.4525
0.4616
0.4693
0.4756
0.4808
0.4850
0.4884
0.4911
0.4932
0.4949
0.4962
0.4972
0.4979
0.4985
0.4989

0.08
0.0319
0.0714
0.1103
0.1480
0.1844
0.2190
0.2517
0.2823
0.3106
0.3365
0.3599
0.3810
0.3997
0.4162
0.4306
0.4429
0.4535
0.4625
0.4699
0.4761
0.4812
0.4854
0.4887
0.4913
0.4934
0.4951
0.4963
0.4973
0.4980
0.4986
0.4990

http://www.disfrutalasmatematicas.com/datos/distribucion-normal-estandar.html

0.09
0.0359
0.0753
0.1141
0.1517
0.1879
0.2224
0.2549
0.2852
0.3133
0.3389
0.3621
0.3830
0.4015
0.4177
0.4319
0.4441
0.4545
0.4633
0.4706
0.4767
0.4817
0.4857
0.4890
0.4916
0.4936
0.4952
0.4964
0.4974
0.4981
0.4986
0.4990

TABLA 2
DISTRIBUCION t (Unilateral)

TABLA 3
DISTRIBUCION t (Bilateral)

BIBLIOGRAFIA

GEORGE C. CANAVOS. Probabilidad y Estadstica Aplicaciones y mtodos.


Mxico, Mc Graw Hill 1995.

HILDEBRAND Y OTT. Estadstica aplicada a la administracin y a la


Economa. U.S.A, Addison Wesley Iberoamericana 1997.
KEINZ KOHLER. Estadstica para negocios y economa, editorial cesca
MEYER P. Probabilidad y aplicaciones estadsticas, Fondo educativo
Interamericano.
MORRIS H GROOT. Probabilidad y estadstica, Mxico, Mc Graw Hill 1996.

PAUL NEWBOLD. Estadstica para los Negocios y la economa. Espaa,


Prentice Hall 1997.

STEVENSON WILLIAM. Estadstica para administracin y economa, Editorial


Harla.
WALPOLE MYERS. Probabilidad y estadstica, Mxico, Mc Graw Hill 1995.

CIBERGRAFIA
Distribuciones muestrales
http://ftp.utalca.cl/profesores/gicaza/Clases/7Distribuciones%20Muestrales.pdf
http://www.geociencias.unam.mx/~ramon/EstInf/Clase4.pdf
http://www.educatina.com/matematicas/probabilidad-y-estadistica/estadistica/poblacionestadistica/diferencias-en-la-distribucion-de-medias-muestrales-video

http://www.educandus.cl/estadistica/ejercicios/bases_teoricas/Distribucion/ResueltosDistribucio
nesMuestrales.pdf
Intervalos de confianza
http://www.slideshare.net/yohanabonillagutierrez/taller-intervalos-de-confianza
http://www.iesxunqueira1.com/Download/pdf/teointervalos.pdf

Prueba de hiptesis
http://www.youtube.com/watch?v=AJcy4eZMwWM
http://www.itch.edu.mx/academic/industrial/estadistica1/cap02.html
http://www.virtual.unal.edu.co/cursos/ciencias/2001091/html/un6/cont_601_54.html

Regresin Lineal
http://www.uv.es/uriel/material/Morelisi.pdf
http://www.youtube.com/watch?v=J1DoRMupI8k
http://www.slideshare.net/adangraus/regresion-lineal-simple-13381573

DIRECCIN DE EDUCACIN ABIERTA Y A DISTANCIA Y VIRTUALIDAD


PROGRAMA ADMINISTRACIN DE EMPRESAS

ESTADSTICA INFERENCIAL

Carretera Troncal de Occidente - Va Corozal - Sincelejo (Sucre)


Telfonos: 2804017 - 2804018 - 2804032, Ext. 126, 122 y 123
Mercadeo: 2806665 Celular: (314) 524 88 16
E- Mail: facultadeducacion@cecar.edu.co

También podría gustarte