Está en la página 1de 62

LIBRO: ESTADISTICA PARA ADMINISTRADORES

Autor:

M.C. Adrian Morales Glvez

M.C. Adrian Morales Glvez 1


LIBRO: ESTADISTICA PARA ADMINISTRADORES

CONTENIDO

UNIDAD I
TEORIA DEL MUESTREO
1.- SESGO Y ERROR EN EL MUESTREO
2.- SELECCIN DE UNA MUESTRA ALEATORIA
3.- POBLACIONES Y MUESTRAS
4.- ESTIMACION BASADA EN UNA MUESTRA ALEATORIA
5.- PARAMETROS Y ESTADISTICOS
6.- MUESTREO ALEATORIO ESTRATIFICADO
7.- MUESTREO POR CONGLOMERADOS
8.- DETERMINACION DEL TAMAO DE MUESTRA

UNIDAD II
DISTRIBUCIONES MUESTRALES
1.- DISTRIBUCIONES RELACIONADAS CON LA DISTRIBUCION NORMAL: JI CUADRADA,
t Y F.
2.- TEOREMACENTRAL DEL LMITE
3.- DISTRIBUCION DE MUESTREO PARA LA MEDIA MUESTRAL
4.- DISTRIBUCION DE LA PROPORCION MUESTRAL

UNIDAD III
ESTIMACION
1.- DEFINICION DE ESTIMADOR Y ESTIMACION
2.- PROPIEDADES DE LOS ESTIMADORES: INSESGAMIENTO, INSESGAMIENTO
ASINTOTICO, CONSISTENCIA, ERROR CUADRATICO MEDIO, EFICIENCIA
3.- ESTIMACION DE LA MEDIA, LA VARIANZA Y PROPORCIONES

UNIDAD IV
INTERVALOS DE CONFIANZA
1.- CONCEPTO DE INTERVALO DE CONFIANZA
2.- INTERVALOS DE CONFIANZA PARA LA MEDIA
3.- INTERVALO DE CONFIANZA PARA PROPORCIONES

UNIDAD V
PRUEBAS DE HIPOTESIS
1.- CONCEPTO DE PRUEBAS DE HIPOTESIS
2.- TIPOS DE ERROR Y NIVEL DE SIGNIFICANCIA
3.- CURVA CARACTERISTICA OPERATIVA Y CURVA DE POTENCIA
4.- PRUEBAS DE HIPOTESIS PARA LA MEDIA Y PROPORCIONES

M.C. Adrian Morales Glvez 2


LIBRO: ESTADISTICA PARA ADMINISTRADORES

INTRODUCCION

En el presente libro, se pretende ser una herramienta que sirva a los


estudiantes de la carrerera de Administracin, en donde se desarrollen mtodos
estadsticos para resolver problemas planteados en la administracin de las
empresas u organizaciones.

En el primer capitulo, se tratan temas de muestreo en sus diferentes tipos, y


en el capitulo II, se desarrollan temas de distribuciones mustrales; en el capitulo III
se desarrolla el tema de estimaciones; es muy importante desarrollar los mtodos
estadsticos para solucionar problemas de administracin con el uso eficiente y
adecuado de la estadstica.

El libro no deja de ser un material de consulta, ya que la practica de los


diferentes fenmenos que se presentan en la vida real de una empresa, los
problemas son diversos y de diferente naturaleza.

M.C. Adrian Morales Glvez 3


LIBRO: ESTADISTICA PARA ADMINISTRADORES

UNIDAD I

TEORIA DEL MUESTREO

Uno de los propsitos de la estadstica inferencial es estimar las caractersticas poblacionales


desconocidas, examinando la informacin obtenida de una muestra, de una poblacin. El
punto de inters es la muestra, la cual debe ser representativa de la poblacin objeto de
estudio.

Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras reflejen
observaciones a la poblacin de la que proceden, ya que solo se pueden hacer observaciones
probabilsticas sobre una poblacin cuando se usan muestras representativas de la misma.

ERRORES EN EL MUESTREO

Cuando se utilizan valores mustrales, o estadsticos para estimar valores poblacionales, o


parmetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no
muestral.

El error muestral se refiere a la variacin natural existente entre muestras tomadas de la


misma poblacin.
Cuando una muestra no es una copia exacta de la poblacin; an si se ha tenido gran cuidado
para asegurar que dos muestras del mismo tamao sean representativas de una cierta
poblacin, no esperaramos que las dos sean idnticas en todos sus detalles. El error muestral
es un concepto importante que ayudar a entender mejor la naturaleza de la estadstica
inferencial.

Los errores que surgen al tomar las muestras no pueden clasificarse como errores mustrales y
se denominan errores no mustrales.
El sesgo de las muestras es un tipo de error no muestral.

El sesgo muestral se refiere a una tendencia sistemtica inherente a un mtodo de muestreo


que da estimaciones de un parmetro que son, en promedio, menores (sesgo negativo), o
mayores (sesgo positivo) que el parmetro real.
El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorizacin.

M.C. Adrian Morales Glvez 4


LIBRO: ESTADISTICA PARA ADMINISTRADORES

ERROR MUESTRAL

Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la media
poblacional , entonces la media muestral, como medida, conlleva algn error. Por ejemplo,
supongamos que se ha obtenido una muestra aleatoria de tamao 25 de una poblacin con
media = 15: si la media de la muestra es x=12, entonces a la diferencia observada x- = -3
se le denomina el error muestral. Una media muestral x puede pensarse como la suma de dos
cantidades, la media poblacional y el error muestral; si e denota el error muestral,
Entonces:

Ejemplo 1.5

Se toman muestras de tamao 2 de una poblacin consistente en tres valores, 2, 4 y 6, para


simular una poblacin "grande" de manera que el muestreo pueda realizarse un gran nmero
de veces, supondremos que ste se hace con reemplazo, es decir, el nmero elegido se
reemplaza antes de seleccionar el siguiente, adems, se seleccionan muestras ordenadas. En
una muestra ordenada, el orden en que se seleccionan las observaciones es importante, por
tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2),
se seleccion primero 4 y despus 2. La siguiente tabla contiene una lista de todas las
muestras ordenadas de tamao 2 que es posible seleccionar con reemplazo y tambin contiene
las medias mustrales y los correspondientes errores mustrales. La media poblacional es
igual a
= (2+4+6)/3 = 4.

Ntese las interesantes relaciones siguientes contenidas en la tabla:

La media de la coleccin de medias muestrales es 4, la media de la poblacin de la que se


extraen las muestras. Si x denota la media de todas las medias muestrales entonces
tenemos:
x = (3+4+3+4+5+5+2+4+6)/9 = 4

La suma de los errores muestrales es cero.


e1 + e2 + e3 +. . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0

M.C. Adrian Morales Glvez 5


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Muestras ordenadas X Error muestral e = x -

(2,2) 2 2 4 = -2

(2,4) 3 3 4 = -1

(2,6) 4 44=0

(4,2) 3 3 4 = -1

(4,4) 4 44=0

(4,6) 5 54=1

(6,2) 4 44=0

(6,4) 5 54=1

(6,6) 6 64=2

En consecuencia, si x se usa para medir, estimar, la media poblacional , el promedio de


todos los errores mustrales es cero.

MUESTRAS ALEATORIAS

Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan muestras
por muchas razones; una enumeracin completa de la poblacin, llamada censo, puede ser
econmicamente imposible, o no se cuenta con el tiempo suficiente.

A continuacin se ver algunos usos del muestreo en diversos campos:

1. Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos
midan la opinin pblica y el apoyo en las elecciones.
2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan
para determinar la eficiencia de una tcnica o programa de enseanza.
3. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la
calidad.
4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban
la eficacia de una tcnica o de un frmaco nuevo.
5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la
produccin los efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los
criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.

M.C. Adrian Morales Glvez 6


LIBRO: ESTADISTICA PARA ADMINISTRADORES

La aleatorizacin se refiere a cualquier proceso de seleccin de una muestra de la poblacin


en el que la seleccin es imparcial o no est sesgada; una muestra elegida con procedimientos
aleatorios se llama muestra aleatoria.

Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio simple, el
muestreo estratificado, el muestreo por conglomerados y el muestreo sistemtico.

Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin tengan
la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.

Ejemplo 1.1

Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadstica de 20 alumnos. 20C5 da el nmero total de formas de elegir una muestra no
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos las
15,504 en trozos separados de papel, una tarea tremenda, luego los colocamos en un
recipiente y despus los revolvemos, entonces podremos tener una muestra aleatoria de 5 si
seleccionamos un trozo de papel con cinco nombres.

Un procedimiento ms simple para elegir una muestra aleatoria sera escribir cada uno de los
20 nombres en pedazos separados de papel, colocarlos en un recipiente, revolverlos y despus
extraer cinco papeles al mismo tiempo.

Otro mtodo para obtener una muestra aleatoria de 5 estudiantes en un grupo de 20 es


utilizando una tabla de nmeros aleatorios. Se puede construir la tabla usando una calculadora
o una computadora. Tambin se puede prescindir de estas y hacer la tabla escribiendo diez
dgitos del 0 al 9 en tiras de papel, las colocamos en un recipiente y los revolvemos, de ah,

la primera tira seleccionada determina el primer nmero de la tabla, se regresa al recipiente y


despus de revolver otra vez se selecciona la seguida tira que determina el segundo nmero de
la tabla; el proceso contina hasta obtener una tabla de dgitos aleatorios con tantos nmeros
como se desee.

Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico, imposible
o no deseado; aunque sera deseable usar muestras aleatorias simples para las encuestas
nacionales de opinin sobre productos o sobre elecciones presidenciales, sera muy costoso o
tardado.

Una poblacin est formada por la totalidad de las observaciones en las cuales se tiene cierto
observa.

Una muestra es un subconjunto de observaciones seleccionadas de una poblacin.

M.C. Adrian Morales Glvez 7


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Comentario [A1]: Da 27-Sep-10 513


PARMETROS Y ESTADSTICOS Tarea: Estratificado y Conglomerados

Parmetros poblacionales
Se llama parmetros poblacionales a cantidades que se obtienen a partir de las
observaciones de la variable y sus probabilidades y que determinan perfectamente la
distribucin de esta, as como las caractersticas de la poblacin, por ejemplo: La media, , la
varianza 2, la proporcin de determinados sucesos, P.
Los Parmetros poblacionales son nmeros reales, constantes y nicos.

Parmetros mustrales
Los Parmetros mustrales son resmenes de la informacin de la muestra que nos
"determinan" la estructura de la muestra.
Los Parmetros mustrales no son constantes sino variables aleatorias pues sus valores
dependen de la estructura de la muestra que no es siempre la misma como consecuencia del
muestreo aleatorio. A estas variables se les suele llamar estadsticos.
Los estadsticos se transforman en dos tipos: estadsticos de centralidad y estadsticos de
dispersin.

ESTADSTICOS DE CENTRALIDAD:

Son medidas de la tendencia central de la variable. Los ms conocidos son:

La media aritmtica
Es el valor esperado de las observaciones de la muestra calculada como si la muestra fuera
una variable completa, es decir, multiplicando observaciones por frecuencias y sumando.
Si x1, x2,.., xn representan una muestra de tamao n de la poblacin, la media aritmtica se
calcula como:

La media aritmtica es la medida de la tendencia central que posee menor varianza. Engloba
en ella toda la informacin de la muestra; esto, con ser una ventaja, supone una cierta
desventaja pues los valores muy extremos, en muestras pequeas afectan mucho a la media.
La media de la media aritmtica es igual a la de las observaciones () y su varianza es igual a
la de las observaciones partidas por n. En poblaciones normales, la distribucin de la media es
normal,

Si la poblacin no es normal, pero la muestra es grande (n 30), por el teorema central del
lmite la distribucin de la media ser asintticamente normal.

M.C. Adrian Morales Glvez 8


LIBRO: ESTADISTICA PARA ADMINISTRADORES

La mediana
En una variable se define como el punto para el cual la funcin de distribucin alcance el
valor 0.5; en una muestra la mediana es el valor central.
Para calcularla se ordenan las observaciones de menor a mayor. Si n es impar, la mediana es
la observacin central

Si n es par, la mediana se define como la media de las dos observaciones centrales

En resumen, podramos decir que la mediana es el valor que es mayor o igual que el 50% de
las observaciones de la muestra y menor o igual que el otro 50%.
No tiene por qu ser igual a una de las observaciones de la muestra.
Es ms fcil de calcular que la media aritmtica y apenas se afecta por observaciones
extremas; sin embargo tiene mayor varianza que X y slo toma en cuenta la informacin de
los valores centrales de la muestra.

La moda
Es el valor ms frecuente.
Su clculo es el ms simple de los tres correspondientes a estadsticos de centralidad pero la
moda es el estadstico de mayor varianza.
La moda puede no existir y cuando existe no es necesariamente nica. No tiene sentido en
muestras pequeas en las que la aparicin de coincidencias en los valores es con gran
frecuencia ms producto del azar que de otra cosa.

M.C. Adrian Morales Glvez 9


LIBRO: ESTADISTICA PARA ADMINISTRADORES

La media es el estadstico de centralidad ms usado cuando uno espera que la poblacin


tenga una distribucin ms o menos simtrica, sin estar clasificada en grupos claramente
diferenciados.
En el caso de distribuciones muy asimtricas, con una cola muy larga, la mediana es,
normalmente, el valor de eleccin dado que la media suele estar desplazada respecto al ncleo
principal de observaciones de la variable. En estos casos, la mediana es el valor que mejor
expresa el punto donde se acumulan mayoritariamente las observaciones de la variable.
En el caso de poblaciones o muestras subdivididas en grupos claramente definidos la media y
la mediana carecen, normalmente, de sentido y los valores que ms claramente reflejan el
comportamiento de las observaciones de la variable son las modas.
Otros estadsticos de centralidad son los cuantiles.

Los cuantiles o percentiles


Un percentil X, PX, es un valor de la distribucin muestral o poblacional de la variable que es
mayor o igual que el X% de las observaciones de la variable P (Y PX) = X%.
Existe un tipo especial de cuantiles llamados cuartiles.
Los cuartiles son tres valores que dividen la distribucin en cuatro partes equivalentes
porcentualmente.
o El primer cuartil es el valor que es mayor o igual que el 25% de las observaciones de la
muestra y menor o igual que el 75%.
o El segundo cuartil es la mediana.
o El tercer cuartil es mayor o igual que el 75% de las observaciones de la muestra y menor
o igual que el 25%.

ESTADSTICOS DE DISPERSIN

Los estadsticos de dispersin son parmetros muestrales que expresan la dispersin de los
valores de la variable respecto al punto central, es decir, su posicin relativa. Los ms
importantes son:
El rango
Es la diferencia entre las dos observaciones extremas, la mxima menos la mnima. Expresa
cuantas unidades de diferencia podemos esperar, como mximo, entre dos valores de la
variable.
El rango estima el campo de variacin de la variable.
Se afecta mucho por observaciones extremas y utiliza nicamente una pequea parte de la
informacin.

La varianza
Es la desviacin cuadrtica media de las observaciones a la media muestral.

Su concepto es anlogo al de la varianza poblacional. No obstante esta expresin de clculo


de la varianza muestral no se utiliza mucho pues sus valores tienden a ser menores que el de
la autntica varianza de la variable (debido a que la propia media muestral tiene una varianza
que vale un ensimo de la de las observaciones) Para compensar esta deficiencia y obtener
valores que no subestimen la varianza poblacional (cuando estamos interesados en ella y no
en la varianza muestral) utilizaremos una expresin, esencialmente igual que la anterior salvo
que el denominador est disminuido en una unidad.

M.C. Adrian Morales Glvez 10


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Normalmente, estaremos interesados en saber cosas acerca de la varianza poblacional y no de


la varianza muestral. Por tanto, en adelante, cuando hablemos de varianza muestral, salvo
indicacin expresa, nos referiremos a la segunda.
Es el estadstico de dispersin ms usado por las propiedades de su distribucin. Si la
poblacin de la que procede la muestra es normal:

Con n-1 grados de libertad.


Adems, utiliza toda la informacin de la muestra.
Su mayor inconveniente consiste en que se expresa en unidades cuadrticas. Por ello, para
muchos propsitos se utiliza otro estadstico de dispersin que la desviacin tpica.
Si no disponemos de una calculadora, el clculo de la varianza puede ser complicado porque,
habitualmente, los valores de las desviaciones de las observaciones a la media resultan ser
nmeros con varias cifras decimales. Por ello, se suele utilizar una ecuacin que deriva
directamente de la anterior:

o, alternativamente, la equivalente a aquella de "la media de los cuadrados menos el cuadrado


de la media".

La desviacin tpica

Es la raz cuadrada positiva de la varianza y, por tanto, se expresa en las unidades de medida
de la variable.

Su concepto es anlogo al de la desviacin tpica poblacional.


Coeficiente de variacin
Es el cociente entre la desviacin tpica y la media aritmtica mustrales y expresa la
variabilidad de la variable en tanto por uno, sin dimensiones.

Permite comparar muestras de variables de distinta naturaleza o muestras de la misma


variable en poblaciones en las que el orden de magnitud de las observaciones sea muy
diferente.

M.C. Adrian Morales Glvez 11


LIBRO: ESTADISTICA PARA ADMINISTRADORES

MUESTREO ESTRATIFICADO

El muestreo estratificado requiere de separar a la poblacin segn grupos que no se


traslapen llamados estratos, y de elegir despus una muestra aleatoria simple en cada estrato.
La informacin de las muestras aleatorias simples de cada estrato constituira entonces una
muestra global.

Ejemplo 1.2
Suponga que nos interesa obtener una muestra de las opiniones de los profesores de una gran
universidad. Puede ser difcil obtener una muestra con todos los profesores, as que
supongamos que elegimos una muestra aleatoria de cada colegio, o departamento acadmico;
los estratos vendran a ser los colegios, o departamentos acadmicos.

MUESTREO POR CONGLOMERADOS

El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de unidades
heterogneas entre s de la poblacin llamadas conglomerados. Cada elemento de la
poblacin pertenece exactamente a un conglomerado, y los elementos dentro de cada
conglomerado son usualmente heterogneos o dismiles.

Ejemplo 1.3
Suponga que una compaa de servicio de televisin por cable est pensando en abrir una
sucursal en una ciudad grande; la compaa planea realizar un estudio para determinar el
porcentaje de familias que utilizaran sus servicios, como no es prctico preguntar en cada
casa, la empresa decide seleccionar una parte de la ciudad al azar, la cual forma un
conglomerado.

En el muestreo por conglomerados, stos se forman para representar, tan fielmente como sea
posible, a toda la poblacin; entonces se usa una muestra aleatoria simple de conglomerados
para estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y
prisiones se realizan, generalmente, con base en el muestreo por conglomerados.
El muestreo sistemtico es una tcnica de muestreo que requiere de una seleccin aleatoria
inicial de observaciones seguida de otra seleccin de observaciones obtenida usando algn
sistema o regla.

M.C. Adrian Morales Glvez 12


LIBRO: ESTADISTICA PARA ADMINISTRADORES

UNIDAD II

DISTRIBUCIONES MUESTRALES Y EL TEOREMA CENTRAL DEL LMITE

DISTRIBUCIONES MUSTRALES

Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia, impredecibles.
No se esperara que dos muestras aleatorias del mismo tamao y tomadas de la misma
poblacin tenga la misma media muestral o que sean completamente parecidas; puede
esperarse que cualquier estadstico, como la media muestral, calculado a partir de las medias
en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la
distribucin de todos los valores posibles de un estadstico. Tales distribuciones sern muy
importantes en el estudio de la estadstica inferencial, porque las inferencias sobre las
poblaciones se harn usando estadsticas muestrales. Como el anlisis de las distribuciones
asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad de un estadstico
muestral como un instrumento para hacer inferencias sobre un parmetro poblacional
desconocido.
Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a otra, se le
puede considerar como una variable aleatoria con su correspondiente distribucin de
frecuencias.
La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral.
En general, la distribucin muestral de un estadstico es la de todos sus valores posibles
calculados a partir de muestras del mismo tamao.
Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacin grande.
Se calcula la madia muestral x para cada muestra; la coleccin de todas estas medias
muestrales recibe el nombre de distribucin muestral de medias, lo que se puede ilustrar en
la siguiente figura:

Suponga que se eligen muestras aleatorias de tamao 20, de una poblacin grande, y se
calcula la desviacin estndar de cada una. La coleccin de todas estas desviaciones estndar
muestrales se llama distribucin muestral de la desviacin estndar, y lo podemos ver en
la siguiente figura:

M.C. Adrian Morales Glvez 13


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Ejemplo 1.6
Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0, 2, 4 y
6. Encuentre:
, la media poblacional.
, la desviacin estndar poblacional.
x, la media de la distribucin muestral de medias.
x, la desviacin estndar de la distribucin muestral de medias.
Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de medias.
Solucin:

La media poblacional es:

La desviacin estndar de la poblacin es:

A continuacin se listan los elementos de la distribucin muestral de la media y la


correspondiente distribucin de frecuencias.

M.C. Adrian Morales Glvez 14


LIBRO: ESTADISTICA PARA ADMINISTRADORES

La media de la distribucin muestral de medias es:

d) La desviacin estndar de la distribucin muestral de medias es:

De

aqu que podamos deducir que:


Como para cualquier variable aleatoria, la dsitribucin muestral de medias tiene una media o
valor esperado, una varianza y una desviacin estndar, se puede demostrar que la
distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:

Distribuciones muestrales
Despus de haber realizado el ejercicio anterior se puede ver que una distribucin muestral se
genera extrayendo todas las posibles muestras del mismo tamao de la poblacin y
calculndoles a stas su estadstico.
Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de medias
ser normal sin importar el tamao de la muestra.

M.C. Adrian Morales Glvez 15


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la


muestra debe ser mayor o igual a 30, para que la distribucin muestral tenga una forma
acampanada. Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin
muestral de ser normal.
Para muchos propsitos, la aproximacin normal se considera buena si se cumple n=30. La
forma de la distribucin muestral de medias sea aproximadamente normal, an en casos
donde la poblacin original es bimodal, es realmente notable.

DISTRIBUCION JI-CUADRADA (X2)

En realidad la distribucin ji-cuadrada es la distribucin muestral de s2. O sea que si se


extraen todas las muestras posibles de una poblacin normal y a cada muestra se le calcula su
varianza, se obtendr la distribucin muestral de varianzas.

Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el


estadstico X2. Si se elige una muestra de tamao n de una poblacin normal con varianza

, el estadstico:

tiene una distribucin muestral que es una distribucin ji-cuadrada con gl=n-1 grados de
libertad y se denota X2 (X es la minscula de la letra griega ji). El estadstico ji-cuadrada esta
dado por:

donde n es el tamao de la muestra, s2 la varianza muestral y la varianza de la poblacin


de donde se extrajo la muestra. El estadstico ji-cuadrada tambin se puede dar con la
siguiente expresin:

M.C. Adrian Morales Glvez 16


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Propiedades de las distribuciones ji-cuadrada


Los valores de X2 son mayores o iguales que 0.
La forma de una distribucin X2 depende del gl=n-1. En consecuencia, hay un nmero infinito
de distribuciones X2.
El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
Las distribuciones X2 no son simtricas. Tienen colas estrechas que se extienden a la derecha;
esto es, estn sesgadas a la derecha.
Cuando n>2, la media de una distribucin X2 es n-1 y la varianza es 2(n-1).
El valor modal de una distribucin X2 se da en el valor (n-3).
La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor
(n-3) = (gl-2).

La funcin de densidad de la distribucin X2 esta dada por:

para x>0
La tabla que se utilizar para estos apuntes es la del libro de probabilidad y estadstica de
Walpole, la cual da valores crticos (gl) para veinte valores especiales de . Para
denotar el valor crtico de una distribucin X2 con gl grados de libertad se usa el smbolo
(gl); este valor crtico determina a su derecha un rea de bajo la curva X2 y sobre el
2
eje horizontal. Por ejemplo para encontrar X 0.05(6) en la tabla se localiza 6 gl en el lado
izquierdo y a o largo del lado superior de la misma tabla.

Clculo de Probabilidad
El clculo de probabilidad en una distribucin muestral de varianzas nos sirve para saber
como se va a comportar la varianza o desviacin estndar en una muestra que proviene de una
distribucin normal.

M.C. Adrian Morales Glvez 17


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Ejemplos:
Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus destinos en
una ciudad grande forman una distribucin normal con una desviacin estndar =1 minuto.
Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza
muestral sea mayor que 2.
Solucin:
Primero se encontrar el valor de ji-cuadrada correspondiente a s2=2 como sigue:

El valor de 32 se busca adentro de la tabla en el rengln de 16 grados de libertad y se


encuentra que a este valor le corresponde un rea a la derecha de 0.01. En consecuencia, el
valor de la probabilidad es P(s2>2)

Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una poblacin


normal con varianza
, tenga una varianza muestral:
Mayor que 9.1
Entre 3.462 y 10.745
Solucin.
Primero se proceder a calcular el valor de la ji-cuadrada:

Al buscar este nmero en el rengln de 24 grados de libertad nos da un rea a la derecha de


0.05. Por lo que la P(s2 >9.1) = 0.05
Se calcularn dos valores de ji-cuadrada:

y
Aqu se tienen que buscar los dos valores en el rengln de 24 grados de libertad. Al buscar el
valor de 13.846 se encuentra un rea a la derecha de 0.95. El valor de 42.98 da un rea a la
derecha de 0.01. Como se est pidiendo la probabilidad entre dos valores se resta el rea de
0.95 menos 0.01 quedando 0.94.
Por lo tanto la P(3.462 s2 10.745) = 0.94

M.C. Adrian Morales Glvez 18


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Estimacin de la Varianza
Para poder estimar la varianza de una poblacin normal se utilizar la distribucin ji-
cuadrada.

Al despejar esta frmula la varianza poblacional nos queda:

Los valores de X2 dependern de nivel de confianza que se quiera al cual le llamamos


. Si nos ubicamos en la grfica se tiene:

Ejemplos:
Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas
por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un
intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que
distribuye esta compaa, suponga una poblacin normal.
Solucin:
Primero se calcula la desviacin estndar de la muestra:

al elevar este resultado al cuadrado se obtiene la varianza de la muestra s2= 0.286.


Para obtener un intervalo de confianza de 95% se elige un = 0.05. Despus con el uso de
la tabla con 9 grados de libertad se obtienen los valores de X2.

M.C. Adrian Morales Glvez 19


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Se puede observar en la grfica anterior que el valor de X2 corre en forma normal, esto es de
izquierda a derecha.
Por lo tanto, el intervalo de confianza de 95% para la varianza es:

Graficamente:

Se observa que la varianza corre en sentido contrario, pero esto es slo en la grfica. La
interpretacin quedara similar a nuestros temas anteriores referentes a estimacin. Con un
nivel de confianza del 95% se sabe que la varianza de la poblacin de los pesos de los
paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.

En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad


de los resultados que producen muestras estndar. En un estudio de la cantidad de calcio en el
agua potable, el cual se efecta como parte del control de calidad, se analiz seis veces la
misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes por
milln fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los resultados de la
poblacin para este estndar, usando un nivel de confianza del 90%.
Solucin:
Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285.
Se busca en la tabla los valores correspondientes con 5 grados de libertad, obtenindose dos
resultados. Para X2(0.95,5)= 1.145 y para X2(0.0,5)= 11.07.
Entonces el intervalo de confianza esta dado por:

M.C. Adrian Morales Glvez 20


LIBRO: ESTADISTICA PARA ADMINISTRADORES

DISTRIBUCION "F" FISHER

La necesidad de disponer de mtodos estadsticos para comparar las varianzas de dos


poblaciones es evidente a partir del anlisis de una sola poblacin. Frecuentemente se desea
comparar la precisin de un instrumento de medicin con la de otro, la estabilidad de un
proceso de manufactura con la de otro o hasta la forma en que vara el procedimiento para
calificar de un profesor universitario con la de otro.

Intuitivamente, podramos comparar las varianzas de dos poblaciones, y ,


utilizando la razn de las varianzas muestrales s21/s22. Si s21/s22 es casi igual a 1, se tendr

poca evidencia para indicar que y no son iguales. Por otra parte, un valor muy
grande o muy pequeo para s21/s22, proporcionar evidencia de una diferencia en las varianzas
de las poblaciones.
La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada
independientes, cada una dividida entre sus respectivos grados de libertad. Esto es,

donde U y V son variables aleatorias ji-cuadrada independientes con grados de libertad


respectivamente.
Sean U y V dos variables aleatorias independientes que tienen distribucin ji cuadradas con
grados de libertad, respectivamente. Entonces la distribucin de la variable aleatoria

est dada por:

M.C. Adrian Morales Glvez 21


LIBRO: ESTADISTICA PARA ADMINISTRADORES

y se dice que sigue la distribucin F con grados de libertad en el numerador y grados


de libertad en el denominador.
La media y la varianza de la distribucin F son:

para

para

La variable aleatoria F es no negativa, y la distribucin tiene un sesgo hacia la derecha. La


distribucin F tiene una apariencia muy similar a la distribucin ji-cuadrada; sin embargo, se
encuentra centrada respecto a 1, y los dos parmetros proporcionan una flexibilidad
adicional con respecto a la forma de la distribucin.
Si s12 y s22 son las varianzas muestrales independientes de tamao n 1 y n2 tomadas de
poblaciones normales con varianzas y , respectivamente, entonces:

Para manejar las tablas de Fisher del libro de Introduccin a la Inferencia Estadstica del autor
Genther, se tendr que buscar primero los grados de libertad dos para luego localizar el rea
correspondiente, relacionndola con los grados de libertad uno, para calcular el valor de F.
Las tablas tienen la siguiente estructura:

P 1 2 3 . .. 500

6 0.0005

0.001

0.005

0.9995 30.4

El valor de 30.4 es el correspondiente a una Fisher que tiene 3 grados de libertad uno y 6
grados de libertad dos con un rea de cero a Fisher de 0.995. Si lo vemos graficamente:

M.C. Adrian Morales Glvez 22


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Como nos podemos imaginar existen varias curvas Fisher, ya que ahora su forma depende de
dos variables que son los grados de libertad.

Ejemplos :
Encontrar el valor de F, en cada uno de los siguientes casos:

El rea a la derecha de F, es de 0.25 con =4 y =9.

El rea a la izquierda de F, es de 0.95 con =15 y =10.

El rea a la derecha de F es de 0.95 con con =6 y =8.

El rea a la izquierda de F, es de 0.10 con con =24 y


=24
Solucin:
Como el rea que da la tabla es de cero a Fisher, se tiene que localizar primero los grados de
libertad dos que son 9, luego un rea de 0.75 con 4 grados de libertad uno.

En este caso se puede buscar el rea de 0.95 directamente en la tabla con sus respectivos
grados de libertad.

Se tiene que buscar en la tabla un rea de 0.05, puesto que nos piden un rea a la derecha de F
de 0.95.

M.C. Adrian Morales Glvez 23


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Se busca directamente el rea de 0.10, con sus respectivos grados de libertad.

Si s12 y s22 son las varianzas muestrales de muestras aleatorias independientes de tamaos
n1=10 y n2 =20, tomadas de poblaciones normales que tienen las mismas varianzas, encuentre
P(s12/s22 2.42).
Solucin:
Primero se establecen los grados de libertad. Como en el numerador est la poblacin uno y
en el denominador la poblacin dos, entonces los grados de libertad uno equivalen a 10-1=9 y
los grados de libertad dos a 20-1=19.
Se procede a ir a la tabla a buscar los grados de libertad dos que son 19 y se observa que no
estn, por lo tanto se tiene que interpolar entre 15 y 20 grados de libertad, buscando el valor
de fisher que quedara:

Este valor de 2.42 se busca en la columna de 9 grados de libertad uno, con 15 grados de
libertad dos, y se encuentra los siguiente:

Area

0.90 2.09

0.95 2.59

Al interpolar entre estos dos valores nos queda un rea de 0.933.


Se procede a hacer lo mismo pero con 20 grados de libertad dos:

Area

0.95 2.39

0.975 2.84

Al interpolar entre estos dos valores nos queda un rea de 0.9516.


Ahora ya se tienen las dos reas referentes a los grados de libertad dos, por lo que se
interpolar para ver cunto le corresponde a los grados libertad dos con un valor de 19.

M.C. Adrian Morales Glvez 24


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Area

15 0.933

20 0.9516

Al interpolar nos queda que para 9 grados de libertad uno y 19 grados de libertad dos con un
valor de Fisher de 2.42 el rea a la izquierda es de 0.9478.

Si s12 y s22 representan las varianzas de las muestras aleatorias independientes de tamao n1=
2
25 y n2 = 31, tomadas de poblaciones normales con varianzas 1 =10 y
2 2 2
2 = 15, respectivamente, encuentre P(s1 /s2 > 1.26).
Solucin:
Calcular el valor de Fisher:

Luego se va a la tabla de Fisher a buscar 30 grados de libertad 2 con 24 grados de libertad


uno. Cuando se este en esta posicin se busca adentro de la tabla el valor de Fisher de 1.89. Al
localizarlo y ver a la izquierda de este valor se obtiene un rea de 0.95, pero esta rea
correspondera a la probabilidad de que las relaciones de varianzas muestrales fueran menor a
1.26, por lo que se calcula su complemento que sera 0.05, siendo esta la probabilidad de que
s12/s22 > 1.26.

INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS DE DOS


DISTRIBUCIONES NORMALES

Supngase que se tienen dos poblaciones normales e independientes con varianzas


2 2
desconocidas y 2 , respectivamente. De este par de poblaciones, se tienen disponibles
dos muestras aleatorias de tamaos n1 y n2, respectivamente, sean s12 y s22 las dos varianzas
muestrales. Se desea conocer un intervalo de confianza del 100( ) por ciento para el
2 2
cociente de las dos varianzas, 1 / 2 .
Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se
coloca la varianza muestral mayor en el numerador del estadstico F.
Ejemplos:

M.C. Adrian Morales Glvez 25


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Un fabricante de automviles pone a prueba dos nuevos mtodos de ensamblaje de motores


respecto al tiempo en minutos. Los resultados se muestran el la tabla:
Mtodo 1 Mtodo 2

n1 = 31 n2 = 25

s12 = 50 s22 = 24
2 2
Construya un intervalo de confianza del 90% para 1 / 2 .
Solucin:
Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la
siguiente frmula:

al despejar: .
F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En este
caso los grados de libertad uno valen 30 y los grados de libertad dos 24.

y
Estos resultados los podemos interpretar de la siguiente manera:
2 2
Con un nivel de confianza del 90% se sabe que la relacin de varianzas 1 / 2 esta entre
1.07 y 3.93. Esto supondra que la varianza de la poblacin 1 es mayor a la varianza de la
poblacin 2 entre 1.07 y 3.93.
Una compaa fabrica propulsores para uso en motores de turbina. Al ingeniero de
manufactura le gustara seleccionar el proceso que tenga la menor variabilidad en la rugosidad
de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso, la cual tiene
una desviacin estndar s1 = 4.7 micropulgadas, y una muestra aleatoria de n2=12 partes del
segundo proceso, la cual tiene una desviacin estndar s2 = 5.1 micropulgadas. Se desea
2
encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas 1 /
2
2 . Suponga que los dos procesos son independientes y que la rugosidad de la superficie est
distribuida de manera normal.
Solucin:
Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la
siguiente frmula:

M.C. Adrian Morales Glvez 26


LIBRO: ESTADISTICA PARA ADMINISTRADORES

al despejar: .
En este caso los grados de libertad uno valen 11 y los grados de libertad dos 15.

Estos resultados los podemos interpretar de la siguiente manera:


Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las
desviaciones estndar de la rugosidad de la superficie de los dos procesos sean diferentes con
un nivel de confianza del 90%.

DISTRIBUCION "t DE STUDENT"

Supngase que se toma una muestra de una poblacin normal con media y varianza
es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la

distribucin es una distribucin normal estndar. Supngase que la varianza de la


poblacin
reemplaza por s? La distribucin t proporciona la respuesta a esta pregunta.

La media y la varianza de la distribucin t son para >2,


respectivamente.
La siguiente figura presenta la grfica de varias distribuciones t. La apariencia general de la
distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas y
unimodales, y el valor mximo de la ordenada se alcanza en la media
la distribucin t tiene colas ms amplias que la normal; esto es, la probabilidad de las colas es
mayor que en la distribucin normal. A medida que el nmero de grados de libertad tiende a
infinito, la forma lmite de la distribucin t es la distribucin normal estndar.

M.C. Adrian Morales Glvez 27


LIBRO: ESTADISTICA PARA ADMINISTRADORES

PROPIEDADES DE LAS DISTRIBUCIONES T

Cada curva t tiene forma de campana con centro en 0.


Cada curva t, est ms dispersa que la curva normal estndar z.
A medida que aumenta, la dispersin de la curva t correspondiente disminuye.
A medida que , la secuencia de curvas t se aproxima a la curva normal estndar, por
lo que la curva z recibe a veces el nombre de curva t con gl =
La distribucin de la variable aleatoria t est dada por:

Esta se conoce como la distribucin t con grados de libertad.


Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media

y desviacin estndar . Entonces la variable aleatoria tiene una distribucin t


con = n-1 grados de libertad.
La distribucin de probabilidad de t se public por primera vez en 1908 en un artculo de W.
S. Gosset. En esa poca, Gosset era empleado de una cervecera irlandesa que desaprobaba la
publicacin de investigaciones de sus empleados. Para evadir esta prohibicin, public su
trabajo en secreto bajo el nombre de "Student". En consecuencia, la distribucin t
normalmente se llama distribucin t de Student, o simplemente distribucin t. Para derivar la
ecuacin de esta distribucin, Gosset supone que las muestras se seleccionan de una
poblacin normal. Aunque esto parecera una suposicin muy restrictiva, se puede mostrar
que las poblaciones no normales que poseen distribuciones en forma casi de campana an
proporcionan valores de t que se aproximan muy de cerca a la distribucin t.
La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la muestra y
siempre es mayor a uno. Unicamente cuando el tamao de la muestra tiende a infinito las dos
distribuciones sern las mismas.

Se acostumbra representar con el valor t por arriba del cual se encuentra un rea igual a
. Como la distribucin t es simtrica alrededor de una media de cero,

M.C. Adrian Morales Glvez 28


LIBRO: ESTADISTICA PARA ADMINISTRADORES

tenemos ; es decir, el valor t que deja un rea de a la derecha y por


tanto un rea de a la izquierda, es igual al valor t negativo que deja un rea de en la
cola derecha de la distribucin. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc.
Para encontrar los valores de t se utilizar la tabla de valores crticos de la distribucin t del
libro Probabilidad y Estadstica para Ingenieros de los autores Walpole, Myers y Myers.
Ejemplo:
El valor t con = 14 grados de libertad que deja un rea de 0.025 a la izquierda, y por tanto
un rea de 0.975 a la derecha, es
t0.975=-t0.025 = -2.145

Si se observa la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que se
tiene que hacer la resta de . La manera de encontrar el valor de t es buscar el valor de
en el primer rengln de la tabla y luego buscar los grados de libertad en la primer
columna y donde se intercepten y se obtendr el valor de t.

Ejemplo:
Encuentre la probabilidad de t0.025 < t < t0.05.
Solucin:

Como t0.05 deja un rea de 0.05 a la derecha, y t0.025 deja un rea de 0.025 a la izquierda,
encontramos un rea total de 1-0.05-0.025 = 0.925.
P( t0.025 < t < t0.05) = 0.925
Ejemplo:
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamao 15 que se
selecciona de una distribucin normal.

Solucin:

M.C. Adrian Morales Glvez 29


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a
este valor le corresponde un rea de 0.05 a la izquierda, por ser negativo el valor. Entonces si
se resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a
valor de 0.005 en el primer rengln con 14 grados de libertad y se obtiene un valor de t =
2.977, pero como el valor de est en el extremo izquierdo de la curva entonces la
respuesta es t = -2.977 por lo tanto:
P(-2.977 < t < -1.761) = 0.045

Ejemplo:
Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto proceso en
lotes es 500 gramos por milmetro de materia prima. Para verificar esta afirmacin toma una
muestra de 25 lotes cada mes. Si el valor de t calculado cae entre t0.05 y t0.05, queda satisfecho
con su afirmacin. Qu conclusin extraera de una muestra que tiene una media de 518
gramos por milmetro y una desviacin estndar de 40 gramos? Suponga que la distribucin
de rendimientos es aproximadamente normal.
Solucin:
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el
fabricante queda satisfecho con esta afirmacin si una muestra de 25 lotes rinde un valor t
entre 1.711 y 1.711.
Se procede a calcular el valor de t:

Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un
valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es
aproximadamente de 0.02. De aqu que es probable que el fabricante concluya que el proceso
produce un mejor producto del que piensa.

TEOREMA CENTRAL DEL LMITE

Si se seleccionan muestras aleatorias de n observaciones de una poblacin con media y


desviacin estndar , entonces, cuando n es grande, la distribucin muestral de medias
tendr aproximadamente una distribucin normal con una media igual a y una desviacin

estndar de . La aproximacin ser cada vez ms exacta a medida de que n sea cada vez
mayor.

M.C. Adrian Morales Glvez 30


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Ejemplo:
Para la dsitribucin muestral de medias del ejercicio pasado, encuentre:
El error muestral de cada media
La media de los errores muestrales
La desviacin estndar de los errores muestrales.
Solucin:

En la tabla siguiente se ven las muestras, las medias de las muestras y los errores muestrales:
Muestra x Error muestral, e=x-

(0,0) 0 0 - 3 = -3

(0,2) 1 1 - 3 = -2

(0,4) 2 2 - 3 = -1

(0,6) 3 33=0

(2,0) 1 1 3 = -2

(2,2) 2 2 3 = -1

(2,4) 3 33=0

(2,6) 4 43=1

(4,0) 2 2 3 = -1

(4,2) 3 33=0

(4,4) 4 43=1

(4,6) 5 53=2

(6,0) 3 33=0

(6,2) 4 43=1

(6,4) 5 53=2

(6,6) 6 63=3
La media de los errores muestrales es e, es:

La desviacin estndar de la distribucin de los errores muestrales


e, es entonces:

M.C. Adrian Morales Glvez 31


LIBRO: ESTADISTICA PARA ADMINISTRADORES

La desviacin estndar de la distribucin muestral de un estadstico se conoce como error


estndar del estadstico. Para el ejercicio anterior el error estndar de la media denotado por
x, es 1.58. Con esto se puede demostrar que si de una poblacin se eligen muestras de
tamao n con reemplazo, entonces el error estndar de la media es igual a la desviacin
estndar de la distribucin de los errores muestrales.

En general se tiene:
Cuando las muestras se toman de una poblacin pequea y sin reemplazo, se puede usar la
formula siguiente para encontrar x .

Donde es la desviacin estndar de la poblacin de donde se toman las muestras, n es el


tamao de la muestra y N el de la poblacin.
Como rfegla de clculo, si el muestreo se hace sin reemplazo y el tamao de la poblacin es al
menos 20 veces el tamao de la muestra (N 20), entonces se puede usar la frmula.

El factor se denomina factor de correccin para una poblacin finita.

Ejemplo:
Suponga que la tabla siguiente muestra la antigedad en aos en el trabajo de tres maestros
universitarios de matemticas:
Maestro de matemticas Antigedad

A 6

B 4

C 2

Suponga adems que se seleccionan muestras aleatorias de tamao 2 sin reemplazo. Calcule
la antigedad media para cada muestra, la media de la distribucin muestral y el error
estndar, o la desviacin estndar de la distribucin muestral.
Solucin:
Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras posibles de tamao
2, con sus respectivas medias muestrales.
Muestras Antigedad Media Muestral

A,B (6,4) 5

A,C (6,2) 4

B,C (4,2) 3

La media poblacional es:

La media de la distribucin muestral es:

M.C. Adrian Morales Glvez 32


LIBRO: ESTADISTICA PARA ADMINISTRADORES

La desviacin estndar de la poblacin es:

El error estndar o la desviacin estndar de la distribucin muestral es:

Si utilizamos la frmula del error estndar sin el factor de correccin tendramos que:

Por lo que observamos que este valor no es el verdadero. Agregando el factor de correccin
obtendremos el valor correcto:

El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el valor del
error estndar:

M.C. Adrian Morales Glvez 33


LIBRO: ESTADISTICA PARA ADMINISTRADORES

DISTRIBUCIN DE MUESTREO PARA LA MEDIA MUESTRAL

Si recordamos a la distribucin normal, esta es una distribucin continua, en forma de


campana en donde la media, la mediana y la moda tienen un mismo valor y es simtrica.
Con esta distribucin podamos calcular la probabilidad de algn evento relacionado con la
variable aleatoria, mediante la siguiente frmula:

En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con
esta frmula se pueden a hacer los clculos de probabilidad para cualquier ejercicio,
utilizando la tabla de la distribucin z.
Sabemos que cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao
de una poblacin normal, la distribucin muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la formula de la distribucin normal
con y , entonces la frmula para calcular la probabilidad del comportamiento
del estadstico, en este caso la media de la muestra , quedara de la siguiente manera:

y para poblaciones finitas y muestro con reemplazo:

Ejemplo:
Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40
horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida
promedio de menos de 775 horas.
Solucin:

Este valor se busca en la tabla de z

La interpretacin sera que la probabilidad de que la media de la muestra de 16 focos sea


menor a 775 horas es de 0.0062.

Ejemplo:

Las estaturas de 1000 estudiantes estn distribuidas aproximadamente en forma normal con
una media de 174.5 centmetros y una desviacin estndar de 6.9 centmetros. Si se extraen
200 muestras aleatorias de tamao 25 sin reemplazo de esta poblacin, determine:
El nmero de las medias muestrales que caen entre 172.5 y 175.8 centmetros.
El nmero de medias muestrales que caen por debajo de 172 centmetros.

M.C. Adrian Morales Glvez 34


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Solucin:
Como se puede observar en este ejercicio se cuenta con una poblacin finita y un muestreo sin
reemplazo, por lo que se tendr que agregar el factor de correccin. Se proceder a calcular el
denominador de Z para slo sustituirlo en cada inciso.

(0.7607)(200)=152 medias muestrales

(0.0336)(200)= 7 medias muestrales

DISTRIBUCIN DE LA PROPORCION MUESTRAL

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que
queremos investigar la proporcin de artculos defectuosos o la proporcin de alumnos
reprobados en la muestra. La distribucin muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribucin se genera de igual manera que la distribucin
muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el
estadstico proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters
y "n" el tamao de la muestra) en lugar del estadstico media.

M.C. Adrian Morales Glvez 35


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Una poblacin binomial est estrechamente relacionada con la distribucin muestral de


proporciones; una poblacin binomial es una coleccin de xitos y fracasos, mientras que una
distribucin muestral de proporciones contiene las posibilidades o proporciones de todos los
nmeros posibles de xitos en un experimento binomial, y como consecuencia de esta
relacin, las afirmaciones probabilsticas referentes a la proporcin muestral pueden evaluarse
usando la aproximacin normal a la binomial, siempre que np 5 y
n(1-p) 5. Cualquier evento se puede convertir en una proporcin si se divide el nmero
obtenido entre el nmero de intentos.

GENERACIN DE LA DISTRIBUCIN MUESTRAL DE PROPORCIONES

Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos defectuosos. Se van a
seleccionar 5 artculos al azar de ese lote sin reemplazo. Genere la distribucin muestral de
proporciones para el nmero de piezas defectuosas.
Como se puede observar en este ejercicio la Proporcin de artculos defectuosos de esta
poblacin es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote estn
defectuosas.
El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12 elementos es
12C5=792, las cuales se pueden desglosar de la siguiente manera:

Proporcin de artculos Nmero de maneras en las que


Artculos Buenos Artculos Malos
defectuoso se puede obtener la muestra

1 4 4/5=0.8 8C1*4C4=8

2 3 3/5=0.6 8C2*4C3=112

3 2 2/5=0.4 8C3*4C2=336

4 1 1/5=0.2 8C4*4C1=280

5 0 0/5=0 8C5*4C0=56

Total 792

Para calcular la media de la distribucin muestral de proporciones se tendra que hacer la


sumatoria de la frecuencia por el valor de la proporcin muestral y dividirla entre el nmero
total de muestras. Esto es:

M.C. Adrian Morales Glvez 36


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Como podemos observar la media de la distribucin muestral de proporciones es igual a la


Proporcin de la poblacin.
p =P
Tambin se puede calcular la desviacin estndar de la distribucin muestral de proporciones:

La varianza de la distribucin binomial es 2= npq, por lo que la varianza de la distribucin


muestral de proporciones es 2p =(Pq)/n. Si se sustituten los valores en esta frmula tenemos
que:

, este valor no coincide con el de 0.1681, ya que


nos falta agregar el factor de correccin para una poblacin finita y un muestreo sin
reemplazo:

La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de


proporciones est basada en la aproximacin de la distribucin normal a la binomial . Esta
frmula nos servir para calcular la probabilidad del comportamiento de la proporcin en la
muestra.

A esta frmula se le puede agregar el factor de correccin de si se cumple con las condiciones
necesarias.

Ejemplo:

M.C. Adrian Morales Glvez 37


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos.
Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la
proporcin de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solucin:
Este ejercicio se puede solucionar por dos mtodos. El primero puede ser con la
aproximacin de la distribucin normal a la binomial y el segundo utilizando la frmula de la
distribucin muestral de proporciones.
Aproximacin de la distribucin normal a la binomial:
Datos:
n=800 estudiantes
p=0.60
x= (.55) (800) = 440 estudiantes
p(x
Media= np= (800) (0.60)= 480

p(
extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.

Distribucin Muestral de Proporciones


Datos:
n=800 estudiantes
P=0.60
p= 0.55

Observe que este valor es igual al obtenido en el


mtodo de la aproximacin de la distribucin normal a la binomial, por lo que si lo buscamos
en la tabla de "z" nos da la misma probabilidad de 0.0017.

M.C. Adrian Morales Glvez 38


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Tambin se debe de tomar en cuenta que el factor de correccin de 0.5 se esta dividiendo
entre el tamao de la muestra, ya que estamos hablando de una proporcin.
La interpretacin en esta solucin, estara enfocada a la proporcin de la muestra, por lo que
diramos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa
universidad, la proporcin de estudiantes que fuman cigarrillos sea menor al 55% es del
0.17%.

Ejemplo:
Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden
presentar una reaccin adversa a l, ms an, se piensa que alrededor del 3% de los usuarios
tienen tal reaccin. Si una muestra aleatoria de 150 personas con malestar estomacal usa el
medicamento, encuentre la probabilidad de que la proporcin de la muestra de los usuarios
que realmente presentan una reaccin adversa, exceda el 4%.
Resolverlo mediante la aproximacin de la normal a la binomial
Resolverlo con la distribucin muestral de proporciones
Aproximacin de la distribucin normal a la binomial:
Datos:
n=150 personas
p=0.03
x= (0.04) (150) = 6 personas
p(x>6) =?
Media = np= (150) (0.03)= 4.5

p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer
una muestra de 150 personas, mas de 6 presentarn una reaccin adversa.
Distribucin Muestral de Proporciones
Datos:
n=150 personas
P=0.03
p= 0.04
p(p>0.04) = ?

M.C. Adrian Morales Glvez 39


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Observe que este valor es igual al obtenido y la interpretacin es: existe una probabilidad del
17% de que al tomar una muestra de 150 personas se tenga una proporcin mayor de 0.04
presentando una reaccin adversa.

Ejemplo:
Se sabe que la verdadera proporcin de los componentes defectuosos fabricados por una firma
es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamao 60 tenga:
Menos del 3% de los componentes defectuosos.
Ms del 1% pero menos del 5% de partes defectuosas.
Solucin:

Datos:
n= 60 artculos
P=0.04
p= 0.03
p(p<0.03) = ?

La probabilidad de que en una muestra de 60 artculos exista una proporcin menor de 0.03
artculos defectuosos es de 0.2327.
Datos:
n= 60 artculos
P=0.04
p= 0.01 y 0.05

p(0.01<p<0.05) = ?

M.C. Adrian Morales Glvez 40


LIBRO: ESTADISTICA PARA ADMINISTRADORES

UNIDAD III

ESTIMACION

El objetivo principal de la estadstica inferencial es la estimacin, esto es que mediante el


estudio de una muestra de una poblacin se quiere generalizar las conclusiones al total de la
misma. Como vimos en la seccin anterior, los estadsticos varan mucho dentro de sus
distribuciones muestrales, y mientras menor sea el error estndar de un estadstico, ms
cercanos sern unos de otros sus valores.
Existen dos tipos de estimaciones para parmetros; puntuales y por intervalo. Una estimacin
puntual es un nico valor estadstico y se usa para estimar un parmetro. El estadstico usado
se denomina estimador.
Una estimacin por intervalo es un rango, generalmente de ancho finito, que se espera que
contenga el parmetro.

ESTIMACIN PUNTUAL

La inferencia estadstica est casi siempre concentrada en obtener algn tipo de conclusin
acerca de uno o ms parmetros (caractersticas poblacionales). Para hacerlo, se requiere que
un investigador obtenga datos muestrales de cada una de las poblaciones en estudio.
Entonces, las conclusiones pueden estar basadas en los valores calculados de varias
cantidades muestrales. Por ejemplo, representamos con (parmetro) el verdadero promedio
de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas de
semiconductores. Podra tomarse una muestra aleatoria de 10 conexiones para determinar la
resistencia a la ruptura de cada una, y la media muestral de la resistencia a la ruptura se

poda emplear para sacar una conclusin acerca del valor de . De forma similar, si es la
varianza de la distribucin de resistencia a la ruptura, el valor de la varianza muestral s2 se
podra utilizar pra inferir algo acerca de .
Cuando se analizan conceptos generales y mtodos de inferencia es conveniente tener un
smbolo genrico para el parmetro de inters. Se utilizar la letra griega para este
propsito. El objetivo de la estimacin puntual es seleccionar slo un nmero, basados en
datos de la muestra, que represente el valor ms razonable de .
Una muestra aleatoria de 3 bateras para calculadora podra presentar duraciones observadas
en horas de x1=5.0, x2=6.4 y x3=5.9. El valor calculado de la duracin media muestral es =
5.77, y es razonable considerar 5.77 como el valor ms adecuado de .
Una estimacin puntual de un parmetro es un slo nmero que se puede considerar como
el valor ms razonable de . La estimacin puntual se obtiene al seleccionar una estadstica
apropiada y calcular su valor a partir de datos de la muestra dada. La estadstica seleccionada
se llama estimador puntual de .
El smbolo (theta sombrero) suele utilizarse para representar el estimador de y la
estimacin puntual resultante de una muestra dada. Entonces se lee como "el estimador
puntual de es la media muestral ". El enunciado "la estimacin puntual de es 5.77" se
puede escribir en forma abreviada .

M.C. Adrian Morales Glvez 41


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Ejemplo:
En el futuro habr cada vez ms inters en desarrollar aleaciones de Mg de bajo costo, para
varios procesos de fundicin. En consecuencia, es importante contar con mtodos prcticos
para determinar varias propiedades mecnicas de esas aleaciones. Examine la siguiente
muestra de mediciones del mdulo de elasticidad obtenidos de un proceso de fundicin a
presin:
44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1
Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar la
varianza poblacional . Un estimador natural es la varianza muestral:

En el mejor de los casos, se encontrar un estimador para el cual siempre. Sin


embargo, es una funcin de las Xi muestrales, por lo que en s misma una variable aleatoria.
+ Error de estimacin
Entonces el estimador preciso sera uno que produzca slo pequeas diferencias de
estimacin, de modo que los valores estimados se acerquen al valor verdadero.

PROPIEDADES DE LOS ESTIMADORES

Insesgado.- Se dice que un estimador puntual es un estimador insesgado de si ,


para todo valor posible de . En otras palabras, un estimador insesgado es aquel para el cual
la media de la distribucin muestral es el parmetro estimado. Si se usa la media muestral
para estimar la media poblacional , se sabe que la , por lo tanto la media es un
estimador insesgado.
Eficiente o con varianza mnima.- Suponga que 1 y 2 son dos estimadores insesgados de
. Entonces, aun cuando la distribucin de cada estimador est centrada en el valor verdadero
de , las dispersiones de las distribuciones alrededor del valor verdadero pueden ser
diferentes.
Entre todos los estimadores de que son insesgados, seleccione al que tenga varianza
mnima. El resultante recibe el nombre de estimador insesgado con varianza mnima
(MVUE, minimum variance unbiased estimator) de .
En otras palabras, la eficiencia se refiere al tamao de error estndar de la estadstica. Si
comparamos dos estadsticas de una muestra del mismo tamao y tratamos de decidir cual de
ellas es un estimador mas eficiente, escogeramos la estadstica que tuviera el menor error
estndar, o la menor desviacin estndar de la distribucin de muestreo.
Tiene sentido pensar que un estimador con un error estndar menor tendr una mayor
oportunidad de producir una estimacin mas cercana al parmetro de poblacin que se esta
considerando.

M.C. Adrian Morales Glvez 42


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Como se puede observar las dos distribuciones tienen un mismo valor en el parmetro slo
que la distribucin muestral de medias tiene una menor varianza, por lo que la media se
convierte en un estimador eficiente e insesgado.

Coherencia.- Una estadstica es un estimador coherente de un parmetro de poblacin, si al


aumentar el tamao de la muestra se tiene casi la certeza de que el valor de la estadstica se
aproxima bastante al valor del parmetro de la poblacin. Si un estimador es coherente se
vuelve ms confiable si tenemos tamaos de muestras ms grandes.
Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la informacin contenida de
la muestra que ningn otro estimador podra extraer informacin adicional de la muestra
sobre el parmetro de la poblacin que se esta estimando.
Es decir se pretende que al extraer la muestra el estadstico calculado contenga toda la
informacin de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se
necesitan todos los datos. Cuando se calcula la mediana de una muestra slo se utiliza a un
dato o a dos. Esto es solo el dato o los datos del centro son los que van a representar la
muestra. Con esto se deduce que si utilizamos a todos los datos de la muestra como es en el
caso de la media, la varianza, desviacin estndar, etc.; se tendr un estimador suficiente.

Estimadores con mnima varianza


Si T1 y T2 son dos estimadores insesgados con varianzas V (T1) y V (T2), respectivamente, y
V(T1) < V(T2), se dice que T1 es ms eficiente que T2.
Sea X1, X2,..., Xn una muestra aleatoria de tamao n. Sabemos que tanto como X1 son
estimadores insesgados de
V(
Eficiencia Relativa
Los estimadores insesgados suelen compararse en trminos de sus respectivas varianzas. Si

la varianza de T2, se dice que T1 es ms eficiente que T2. Tambin se puede usar la siguiente

relacin

para medir la eficiencia relativa de T2 con respecto a T1.


Ejemplo. Al calcular la media de una poblacin normal sobre la base de una muestra de
tamao 2n+1, cul es la eficiencia de la mediana con relacin a la media?
Se sabe que la varianza de la media
tamao 2n+1 de una poblacin normal se sabe que el valor esperado y la varianza de la
mediana estn dados por:

M.C. Adrian Morales Glvez 43


LIBRO: ESTADISTICA PARA ADMINISTRADORES

La eficiencia relativa est dada por:

La eficiencia asinttica de la mediana con respecto a la media est dada por:

a media muestral es un estimador ms eficiente de la media poblacional que la mediana


muestral.
La media requiere slo el 64% de las observaciones que requiere la mediana para estimar la

ESTIMACIN POR INTERVALOS

Un estimado puntual, por ser un slo nmero, no proporciona por s mismo informacin
alguna sobre la precisin y confiabilidad de la estimacin. Por ejemplo, imagine que se usa el
estadstico para calcular un estimado puntual de la resistencia real a la ruptura de toallas de
papel de cierta marca, y suponga que = 9322.7. Debido a la variabilidad de la muestra,
nunca se tendr el caso de que = . El estimado puntual nada dice sobre lo cercano que esta
de . Una alternativa para reportar un solo valor del parmetro que se est estimando es
calcular e informar todo un intervalo de valores factibles, un estimado de intervalo o intervalo
de confianza (IC). Un intervalo de confianza se calcula siempre seleccionando primero un
nivel de confianza, que es una medida del grado de fiabilidad en el intervalo. Un intervalo de
confianza con un nivel de confianza de 95% de la resistencia real promedio a la ruptura podra
tener un lmite inferior de 9162.5 y uno superior de 9482.9. Entonces, en un nivel de
confianza de 95%, es posible tener cualquier valor de entre 9162.5 y 9482.9. Un nivel de
confianza de 95% implica que 95% de todas las muestras dara lugar a un intervalo que
incluye o cualquier otro parmetro que se est estimando, y slo 5% de las muestras
producir un intervalo errneo. Cuanto mayor sea el nivel de confianza podremos creer que el
valor del parmetro que se estima est dentro del intervalo.
Una interpretacin correcta de la "confianza de 95%" radica en la interpretacin frecuente de
probabilidad a largo plazo: decir que un evento A tiene una probabilidad de 0.95, es decir que
si el experimento donde A est definido re realiza una y otra vez, a largo plazo A ocurrir
95% de las veces. Para este caso
El 95% de los intervalos de confianza calculados contendrn a .

M.C. Adrian Morales Glvez 44


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Esta es una construccin repetida de intervalos de confianza de 95% y se puede observar que
de los 11 intervalos calculados slo el tercero y el ltimo no contienen el valor de .
De acuerdo con esta interpretacin, el nivel de confianza de 95% no es tanto un enunciado
sobre cualquier intervalo en particular, ms bien se refiere a lo que sucedera si se tuvieran
que construir un gran nmero de intervalos semejantes.

ENCONTRAR Z A PARTIR DE UN NIVEL DE CONFIANZA

Existen varias tablas en las cuales podemos encontrar el valor de z, segn sea el rea
proporcionada por la misma. En esta seccin se realizar un ejemplo para encontrar el valor
de z utilizando tres tablas diferentes.
Ejemplo:
Encuentre el valor de z para un nivel de confianza del 95%.
Solucin 1:
Se utilizar la tabla que tiene el rea bajo la curva de - hasta z. Si lo vemos grficamente
sera:

El nivel de confianza bilateral est dividido en partes iguales bajo la curva:

En base a la tabla que se esta utilizando, se tendr que buscar el rea de 0.975, ya que cada
extremo o cola de la curva tiene un valor de 0.025.

M.C. Adrian Morales Glvez 45


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Por lo que el valor de z es de 1.96.


Solucin 2:
Si se utiliza una tabla en donde el rea bajo la curva es de 0 a z:

En este caso slo se tendr que buscar adentro de la tabla el rea de 0.475 y el resultado del
valor de z ser el mismo, para este ejemplo 1.96.

Solucin 3:
Para la tabla en donde el rea bajo la curva va desde z hasta :

Se busca el valor de 0.025 para encontrar z de 1.96.


Independientemente del valor del Nivel de Confianza este ser el procedimiento a seguir para
localizar a z. En el caso de que no se encuentre el valor exacto se tendr que interpolar.

ESTIMACIN DE LA MEDIA

Es conocido de nosotros durante este curso, que en base a la distribucin muestral de medias
que se gener en el tema anterior, la formula para el calculo de probabilidad es la siguiente:

. Como en este caso no conocemos el parmetro y lo queremos estimar por medio


de la media de la muestra, slo se despejar de la formula anterior, quedando lo siguiente:

De esta formula se puede observar que tanto el tamao de la muestra como el valor de z se
conocern. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de
confianza establecido. Pero en ocasiones se desconoce por lo que en esos casos lo correcto
es utilizar otra distribucin llamada "t" de student si la poblacin de donde provienen los
datos es normal.

M.C. Adrian Morales Glvez 46


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Para el caso de tamaos de muestra grande se puede utilizar una estimacin puntual de la
desviacin estndar, es decir igualar la desviacin estndar de la muestra a la de la poblacin
(s= ).
Ejemplos:
Se encuentra que la concentracin promedio de zinc que se saca del agua a partir de una
muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro.
Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de zinc en
el ro. Suponga que la desviacin estndar de la poblacin es 0.3.
Solucin:
La estimacin puntual de es = 2.6. El valor de z para un nivel de confianza del 95% es
1.96, por lo tanto:

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo ser ms
amplio:

El intervalo de confianza proporciona una estimacin de la presicin de nuestra estimacin


puntual. Si es realmente el valor central de intervalo, entonces estima sin error. La
mayor parte de las veces, sin embargo, no ser exactamente igual a y la estimacin
puntual es errnea. La magnitud de este error ser el valor absoluto de la diferencia entre y

, y podemos tener el nivel de confianza de que esta diferencia no exceder .


Como se puede observar en los resultados del ejercicio se tiene un error de estimacin mayor
cuando el nivel de confianza es del 99% y ms pequeo cuando se reduce a un nivel de
confianza del 95%.
Una empresa elctrica fabrica focos que tienen una duracin aproximadamente distribuida de
forma normal con una desviacin estndar de 40 horas. Si una muestra de 30 focos tiene una
duracin promedio de 780 horas, encuentre un intervalo de confianza de 96% para la media
de la poblacin de todos los focos que produce esta empresa.

M.C. Adrian Morales Glvez 47


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Solucin:

Con un nivel de confianza del 96% se sabe que la duracin media de los focos que produce la
empresa est entre 765 y 765 horas.
La prueba de corte sesgado es el procedimiento ms aceptado para evaluar la calidad de una
unin entre un material de reparacin y su sustrato de concreto. El artculo "Testing the Bond
Between Repair Materials and Concrete Substrate" informa que, en cierta investigacin, se
obtuvo una resistencia promedio muestral de 17.17 N/mm2, con una muestra de 48
observaciones de resistencia al corte, y la desviacin estndar muestral fue 3.28 N/mm2.
Utilice un nivel de confianza inferior del 95% para estimar la media real de la resistencia al
corte.
Solucin:
En este ejercicio se nos presentan dos situaciones diferentes a los ejercicios anteriores. La
primera que desconoce la desviacin estndar de la poblacin y la segunda que nos piden un
intervalo de confianza unilateral.
El primer caso ya se haba comentado y se solucionar utilizando la desviacin estndar de la
muestra como estimacin puntual de sigma.
Para el intervalo de confianza unilateral, se cargar el rea bajo la curva hacia un solo lado
como sigue:

Esto quiere decir que con un nivel de confianza de 95%, el valor de la media est en el
intervalo (16.39, ).

ESTIMACIN DE UNA PROPORCIN

Un estimador puntual de la proporcin P en un experimento binomial est dado por la


estadstica P=X/N, donde x representa el nmero de xitos en n pruebas. Por tanto, la
proporcin de la muestra p =x/n se utilizar como estimador puntual del parmetro P.
Si no se espera que la proporcin P desconocida est demasiado cerca de 0 de 1, se puede
establecer un intervalo de confianza para P al considerar la distribucin muestral de
proporciones.

Al despejar P de esta ecuacin nos queda:

M.C. Adrian Morales Glvez 48


LIBRO: ESTADISTICA PARA ADMINISTRADORES

En este despeje podemos observar que se necesita el valor del parmetro P y es precisamente
lo que queremos estimar, por lo que lo sustituiremos por la proporcin de la muestra p
siempre y cuando el tamao de muestra no sea pequeo.

Cuando n es pequea y la proporcin desconocida P se considera cercana a 0 a 1, el


procedimiento del intervalo de confianza que se establece aqu no es confiable, por tanto, no
se debe utilizar. Para estar seguro, se debe requerir que np nq sea mayor o igual a 5.
El error de estimacin ser la diferencia absoluta entre p y P, y podemos tener el nivel de
confianza de que esta diferencia no exceder

Ejemplos:
Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias
para evaluar la funcin elctrica de su producto. Todos los reproductores de discos compactos
deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores
tiene como resultado 15 que fallan en una o ms pruebas. Encuentre un intervalo de confianza
de 90% para la proporcin de los reproductores de discos compactos de la poblacin que no
pasan todas las pruebas.

Solucin:

n=500
p = 15/500 = 0.03
Z (0.90) = 1.645

0.0237<P<0.0376

Se sabe con un nivel de confianza del 90% que la proporcin de discos defectuosos que no
pasan la prueba en esa poblacin esta entre 0.0237 y 0.0376.

En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se encontraron 20
defectuosas.

M.C. Adrian Morales Glvez 49


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Si la proporcin p de pilas defectuosas en esa muestra se usa para estimar P, que vendr a ser
la proporcin verdadera de todas las pilas defectuosas tipo B fabricadas por la Everlast
Company, encuentre el mximo error de estimacin tal que se pueda tener un 95% de
confianza en que P dista menos de de p.
Solucin:
p=x/n = 20/400=0.05
z(0.95)=1.96

Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista menos de
0.021 de p. En otras palabras, si p=0.05 se usa para estimar P, el error mximo de estimacin
ser aproximadamente 0.021 con un nivel de confianza del 95%.
Para calcular el intervalo de confianza se tendra:

Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se sabe
que la proporcin de pulas defectuosas de esta compaa est entre 0.029 y 0.071.
Si se requiere un menor error con un mismo nivel de confianza slo se necesita aumentar el
tamao de la muestra.
En un estudio de 300 accidentes de automvil en una ciudad especfica, 60 tuvieron
consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de confianza
para aproximar la proporcin de todos los accidentes automovilsticos que en esa ciudad
tienen consecuencias fatales.

Solucin:

P= 60/300 = 0.20
Z (0.90) = 1.645
0.162<P<0.238

M.C. Adrian Morales Glvez 50


LIBRO: ESTADISTICA PARA ADMINISTRADORES

UNIDAD IV

INTERVALOS DE CONFIANZA

La idea de la estimacin por intervalo de confianza es definir, alrededor de la media

emprica, un intervalo aleatorio (que depende de experimentos) que contiene a con una
probabilidad alta. La longitud de este intervalo es la que mide la exactitud de la estimacin.

Teorema 4.3 Sea una sucesin de variables aleatorias independientes

con una misma ley, de esperanza y varianza ambas finitas. Para todo
denotemos por:

Sea un nmero real (pequeo). Sea el nmero real tal que:

Denotemos:

Entonces:

Se dice que los intervalos aleatorios y son intervalos de confianza para

, de nivel de confianza asinttico .


Interpretacin:

M.C. Adrian Morales Glvez 51


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Como el valor de es desconocido no hay ninguna razn a priori para que la desviacin
estndar sea conocida. Si es desconocida, se la estima por la desviacin estndar

emprica . Esta es la razn por la cual damos dos intervalos de confianza. El valor de

se obtiene a partir de un mdulo de clculo numrico. Los valores ms usados son los
siguientes:

Los intervalos y son aleatorios. Como resultado de la sucesin de

experimentos , y habrn tomado valores particulares y . No se podr decir que la

probabilidad de que pertenezca a es de . Tanto como y son nmeros

reales fijos y el resultado ser verdadero o falso, pero no depender ya del azar.

Lo que podremos decir es que este encuadre (de entre y ) se obtiene como resultado
de un experimento que tenia un porcentaje alto de posibilidades de dar un resultado
verdadero. Para , si repetimos veces la serie de experimentos para obtener
intervalos, podemos esperar que uno de ellos sea falso. Hay que ver un intervalo de

confianza como una precisin que se da del valor estimado de :

INTERVALO PARA LA MEDIA SI SE CONOCE LA VARIANZA:

Este no es un caso prctico (no se puede conocer sin conocer previamente ), pero sirve
para introducirnos en el problema de la estimacin confidencial de la media;

INTERVALOS DE CONFIANZA PARA LA MEDIA (CASO GENERAL):


Este se trata del caso con verdadero inters prctico. Por ejemplo sirve para estimar intervalos
que contenga la media del colesterol en sangre en una poblacin, la altura, el peso, etc.,
cuando disponemos de una muestra de la variable.

INTERVALO DE CONFIANZA PARA LA VARIANZA:


ste es otro caso de inters en las aplicaciones. El objetivo es calcular un intervalo de
Confianza para , cuando slo se dispone de una muestra.

M.C. Adrian Morales Glvez 52


LIBRO: ESTADISTICA PARA ADMINISTRADORES

ESTIMACIN DE TAMAO MUESTRAL


La utilidad consiste en decidir cul deber ser el tamao necesario de una muestra para
obtener intervalos de confianza para una media, con precisin y significacin dadas de
antemano. Para que esto sea posible es necesario poseer cierta informacin previa, que se
obtiene a partir de las denominadas muestras piloto.
Ms adelante, consideramos el caso en que tenemos dos poblaciones donde cada una sigue su

propia ley de distribucin y . Los problemas asociados a este caso son

DIFERENCIA DE MEDIAS HOMOCEDTICAS


Se realiza el clculo del intervalo de confianza suponiendo que ambas variables tienen la
misma varianza, es decir son homocedticas. En la prctica se usa este clculo, cuando
ambas variables tienen parecida dispersin.

DIFERENCIA DE MEDIAS (CASO GENERAL)

Es el mismo caso que el anterior, pero se realiza cuando se observa que hay diferencia notable
en la dispersin de ambas variables.

M.C. Adrian Morales Glvez 53


LIBRO: ESTADISTICA PARA ADMINISTRADORES

UNIDAD V

PRUEBAS DE HIPOTESIS

Las secciones anteriores han mostrado cmo puede estimarse un parmetro a partir de los
datos contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador
puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos
problemas de ingeniera, ciencia, y administracin, requieren que se tome una decisin entre
aceptar o rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el nombre
de hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que
muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la
ingeniera, pueden formularse como problemas de prueba de hiptesis.

Una HIPTESIS ESTADSTICA es una proposicin o supuesto sobre los parmetros de


una o ms poblaciones.
Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido
utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters
se centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae en
decir si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de manera
formal como:

Ho; = 50 cm/s
H1; 50 cm/s

La proposicin Ho; = 50 cm/s, se conoce como hiptesis nula, mientras que la proposicin
H1; 50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que la hiptesis
alternativa especifica valores de que pueden ser mayores o menores que 50 cm/s, tambin
se conoce como hiptesis alternativa bilateral. En algunas situaciones, lo que se desea es
formular una hiptesis alternativa unilateral, como en:

Ho; = 50 cm/s Ho; = 50 cm/s

H1; < 50 cm/s H1; > 50 cm/s

Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres
maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces
el objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor
del parmetro.

M.C. Adrian Morales Glvez 54


LIBRO: ESTADISTICA PARA ADMINISTRADORES

2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o
modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las
especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las
especificaciones.

Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el
nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del
empleo de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta
informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si
esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse
hincapi en que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con
certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es
imposible en muchas situaciones prcticas. Por tanto, es necesario desarrollar un
procedimiento de prueba de hiptesis teniendo en cuenta la probabilidad de llegar a una
conclusin equivocada.

La HIPTESIS NULA, representada por Ho, es la afirmacin sobre una o ms caractersticas


de poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").

La HIPTESIS ALTERNATIVA, representada por H1, es la afirmacin contradictoria a Ho,


y sta es la hiptesis del investigador.
La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia muestral
sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se contina creyendo
en la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un anlisis por
prueba de hiptesis son rechazar Ho o no rechazar Ho.

TIPOS DE ERROR

El ERROR TIPO I se define como el rechazo de la hiptesis nula Ho cuando sta es


verdadera. Tambin es conocido como nivel de significancia.
Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del 5%.
Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de significancia
sera del 10%.
Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50 cm/s,
aunque la media muestral caiga dentro de la regin de aceptacin. En este caso se acepta Ho
cuando sta es falsa. Este tipo de conclusin recibe el nombre de error tipoII.

El ERROR TIPO II ERROR se define como la aceptacin de la hiptesis nula cuando


sta es falsa.
Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones diferentes que
determinan si la decisin final es correcta o errnea.
Decisin Ho es verdadera Ho es falsa

Aceptar Ho No hay error Error tipo II

Rechazar Ho Error tipo I No hay error

M.C. Adrian Morales Glvez 55


LIBRO: ESTADISTICA PARA ADMINISTRADORES

Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de uno por
lo general tiene como resultado un aumento en la probabilidad del otro.
El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I, siempre
se puede reducir al ajustar el o los valores crticos.
Un aumento en el tamao muestral n reducir y de forma simultnea.
Si la hiptesis nula es falsa, es un mximo cuando el valor real del parmetro se aproxima
al hipottico. Entre ms grande sea la distancia entre el valor real y el valor hipottico, ser
menor

NIVEL DE SIGNIFICANCIA

Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuesto a
correr el riesgo de cometern error de tipo I, se llama nivel de significacin.
Esta probabilidad, denota a menudo por se, suele especificar antes de tomar la muestra, de
manera que los resultados obtenidos no influyan en nuestra eleccin.
En la prctica, es frecuente un nivel de significacin de 0,05 0,01, si bien se une otros
valores. Si por ejemplo se escoge el nivel de significacin 0,05 ( 5%) al disear una regla de
decisin, entonces hay unas cinco (05) oportunidades entre 100 de rechazar la hiptesis
cuando debiera haberse aceptado; Es decir, tenemos un 95% de confianza de que hemos
adoptado la decisin correcta. En tal caso decimos que la hiptesis ha sido rechazada al nivel
de significacin 0,05, lo cual quiere decir que tal hiptesis tiene una probabilidad 0,05 de ser
falsa.

PRUEBA DE UNO Y DOS EXTREMOS.

Cuando estudiamos ambos valores estadsticos es decir, ambos lados de la media lo llamamos
prueba de uno y dos extremos o contraste de una y dos colas.
Con frecuencia no obstante, estaremos interesados tan slo en valores extremos a un lado de
la media (o sea, en uno de los extremos de la distribucin), tal como sucede cuando se
contrasta la hiptesis de que un proceso es mejor que otro (lo cual no es lo mismo que
contrastar si un proceso es mejor o peor que el otro) tales contrastes se llaman unilaterales, o
de un extremo. En tales situaciones, la regin crtica es una regin situada a un lado de la
distribucin, con rea igual al nivel de significacin.

CURVA CARACTERSTICA OPERATIVA Y CURVA DE POTENCIA

Podemos limitar un error de tipo I eligiendo adecuadamente el nivel de significancia. Es


posible evitar el riesgo de cometer el error tipo II simplemente no aceptando nunca la
hiptesis, pero en muchas aplicaciones prcticas esto es inviable. En tales casos, se suele
recurrir a curvas caractersticas de operacin o curvas de potencia que son grficos que
muestran las probabilidades de error de tipo II bajo diversas hiptesis. Proporcionan
indicaciones de hasta que punto un test dado nos permitir evitar un error de tipo II; es decir,
nos indicarn la potencia de un test a la hora de prevenir decisiones errneas. Son tiles en el
diseo de experimentos por que sugieren entre otras cosas el tamao de muestra a manejar.

M.C. Adrian Morales Glvez 56


LIBRO: ESTADISTICA PARA ADMINISTRADORES

PRUEBAS DE HIPTESIS PARA LA MEDIA Y PROPORCIONES

Debido a la dificultad de explicar este tema se enfocar un problema basado en un estudio en


una fbrica de llantas.
En este problema la fbrica de llantas tiene dos turnos de operarios, turno de da y turno
mixto. Se selecciona una muestra aleatoria de 100 llantas producidas por cada turno para
ayudar al gerente a sacar conclusiones de cada una de las siguientes preguntas:
1.- Es la duracin promedio de las llantas producidas en el turno de da igual a 25 000
millas?
2.- Es la duracin promedio de las llantas producidas en el turno mixto menor de 25 000
millas?
3.- Se revienta ms de un 8% de las llantas producidas por el turno de da antes de las 10
000 millas?
Prueba De Hiptesis Para La Media
En la fbrica de llantas la hiptesis nula y alternativa para el problema se plantearon como
sigue:
Ho: = 25 000
H1: 25 000

Si se considera la desviacin estndar las llantas producidas en el turno de da, entonces,


con base en el teorema de limite central, la distribucin en el muestreo de la media seguira la
distribucin normal, y la prueba estadstica que esta basada en la diferencia entre la media
de la muestra y la media hipottica se encontrara como sigue:

Si el tamao de la regin de rechazo se estableciera en 5% entonces se podran determinar


los valores crticos de la distribucin. Dado que la regin de rechazo esta dividida en las dos
colas de la distribucin, el 5% se divide en dos partes iguales de 2.5%.
Dado que ya se tiene la distribucin normal, los valores crticos se pueden expresar en
unidades de desviacin. Una regin de rechazo de 0.25 en cada cola de la distribucin normal,
da por resultado un rea de .475 entre la media hipottica y el valor crtico. Si se busca est
rea en la distribucin normal, se encuentra que los valores crticos que dividen las regiones
de rechazo y no rechazo son + 1.96 y - 1.96

Por tanto, la regla para decisin sera:


Rechazar Ho si Z > + 1.96
O si Z < - 1.96

M.C. Adrian Morales Glvez 57


LIBRO: ESTADISTICA PARA ADMINISTRADORES

De lo contrario, no rechazar Ho
No obstante, en la mayor parte de los casos se desconoce la desviacin estndar de la
poblacin. La desviacin estndar se estima al calcular S, la desviacin estndar de la
muestra. Si se supone que la poblacin es normal la distribucin en el muestreo de la media
seguira una distribucin t con n-1 grados de libertad. En la prctica, se a encontrado que
siempre y cuando el tamao de la muestra no sea muy pequeo y la poblacin no este muy
sesgada, la distribucin t da una buena aproximacin a la distribucin de muestra de la media.
La prueba estadstica para determinar la diferencia entre la media de la muestra y la media
de la poblacin cuando se utiliza la desviacin estndar S de la muestra, se expresa con:

Para una muestra de 100, si se selecciona un nivel de significanca de .05, los valores
crticos de la distribucin t con 100-1= 99 grados de libertad se puede obtener como se indica
en la siguiente tabla:
Como esta prueba de dos colas, la regin de rechazo de .05 se vuelve a dividir en dos partes
iguales de .025 cada una. Con el uso de las tablas para t, los valores crticos son 1.984 y
+1.984. la regla para la decisin es:
Rechazar Ho si >+1.984
O si - 1.984

De lo contrario, no rechazar Ho

Los resultados de la muestra para el turno de da fueron =25 430 millas, =4 000 millas
y = 100. Puesto que se esta probando si la media es diferente a 25 000 millas, se tiene con
la ecuacin
Dado que = 1.075, se ve que -1.984 < +1.075 < + 1.984, entonces no se rechaza Ho.
Por ello, la de cisin de no rechazar la hiptesis nula Ho. En conclusin es que la duracin
promedio de las llantas es 25 000 millas. A fin de tener en cuenta la posibilidad de un error de
tipo II, este enunciado se puede redactar como "no hay pruebas de que la duracin promedio
de las llantas sea diferente a 25 000 millas en las llantas producidas en el turno de da".

M.C. Adrian Morales Glvez 58


LIBRO: ESTADISTICA PARA ADMINISTRADORES

PRUEBA DE HIPTESIS PARA PROPORCIONES

El concepto de PRUEBA de hiptesis se puede utilizar para probar hiptesis en relacin con
datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fbrica de llantas
quera determinar la proporcin de llantas que se reventaban antes de 10,000 millas. Este es
un ejemplo de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a la
proporcin de los valores que tienen una caracterstica particular.
El gerente de la fbrica de llantas quiere que la calidad de llantas producidas, sea lo bastante
alta para que muy pocas se revienten antes de las 10,000 millas. Si ms de un 8% de las
llantas se revientan antes de las 10,000 millas, se llegara a concluir que el proceso no
funciona correctamente. La hiptesis nula y alternativa se pueden expresar como sigue:
Ho: p .08 (funciona correctamente)
H1: p > .08 (no funciona correctamente)

La prueba estadstica se puede expresar en trminos de la proporcin de xitos como sigue:


En donde
p = proporcin de xitos de la hiptesis nula
Ahora se determinar si el proceso funciona correctamente para las llantas producidas para el
turno de da. Los resultados del turno de da indican que cinco llantas en una muestra de 100
se reventaron antes de 10,000 millas para este problema, si se selecciona un nivel de
significanca de .05, las regiones de rechazo y no rechazo se estableceran como a
continuacin se muestra:
Y la regla de decisin sera:
Rechazar Ho si > + 1.645; de lo contrario no rechazar Ho.
Con los datos que se tienen,

= = .05
Y entonces,

= = = = -1.107

Z -1.107 < + 1.645; por tanto no rechazar Ho.

La hiptesis nula no se rechazara por que la prueba estadstica no ha cado en la regin de


rechazo. Se llegara a la conclusin de que no hay pruebas de que ms del 8% de las llantas
producidas en el turno de da se revienten antes de 10,000 millas. El gerente no ha encontrado
ninguna prueba de que ocurra un nmero excesivo de reventones en las llantas producidas en
el turno de da.

M.C. Adrian Morales Glvez 59


LIBRO: ESTADISTICA PARA ADMINISTRADORES

UNIDAD VI

ANALISIS DE REGRESION Y CORRELACION LINEAL

La Regresin y la correlacin son dos tcnicas estadsticas que se pueden utilizar para
solucionar problemas comunes en los negocios.
Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna
Relacin Funcional entre dos o ms variables, donde una variable depende de la otra
variable.

Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un


modelo de Regresin Simple.

"Y es una funcin de X"


Y = f(X)
Como Y depende de X,
Y es la variable dependiente, y
X es la variable independiente.
En el Modelo de Regresin es muy importante identificar cul es la variable dependiente y
cul es la variable independiente.
En el Modelo de Regresin Simple se establece que Y es una funcin de slo una variable
independiente, razn por la cual se le denomina tambin Regresin Divariada porque slo hay
dos variables, una dependiente y otra independiente y se representa as:

Y = f (X)
"Y est regresando por X"

La variable dependiente es la variable que se desea explicar, predecir. Tambin se le llama


REGRESANDO VARIABLE DE RESPUESTA.

La variable Independiente X se le denomina VARIABLE EXPLICATIVA REGRESOR y


se le utiliza para EXPLICAR Y.

DEFINICIN DE CORRELACIN LINEAL

En ocasiones nos puede interesar estudiar si existe o no algn tipo de relacin entre dos
Variables aleatorias. As, por ejemplo, podemos preguntarnos si hay alguna relacin entre las
notas de la asignatura Estadstica I y las de Matemticas I. Una primera aproximacin al
Problema consistira en dibujar en el plano R2 un punto por cada alumno: la primera
coordenada

M.C. Adrian Morales Glvez 60


LIBRO: ESTADISTICA PARA ADMINISTRADORES

De cada punto sera su nota en estadstica, mientras que la segunda sera su nota en
Matemticas. As, obtendramos una nube de puntos la cual podra indicarnos visualmente la
existencia o no de algn tipo de relacin (lineal, parablica, exponencial, etc.) entre ambas
notas.
Otro ejemplo, consistira en analizar la facturacin de una empresa en un periodo de tiempo
dado
y de cmo influyen los gastos de promocin y publicidad en dicha facturacin. Si
consideramos
un periodo de tiempo de 10 aos, una posible representacin sera situar un punto por cada
ao
de forma que la primera coordenada de cada punto sera la cantidad en euros invertidos en
publicidad, mientras que la segunda sera la cantidad en euros obtenidos de su facturacin. De
esta manera, obtendramos una nube de puntos que nos indicara el tipo de relacin existente
entre ambas variables.
En particular, nos interesa cuantificar la intensidad de la relacin lineal entre dos variables. El
Parmetro que nos da tal cuantificacin es el coeficiente de correlacin lineal de Pearson r,
cuyo valor oscila entre 1 y +1:

DEFINICIN Y CARACTERSTICAS DEL CONCEPTO DE REGRESIN LINEAL


En aquellos casos en que el coeficiente de regresin lineal sea cercano a +1 o a 1, tiene
sentido considerar la ecuacin de la recta que mejor se ajuste a la nube de puntos (recta de
mnimos cuadrados). Uno de los principales usos de dicha recta ser el de predecir o estimar
los valores de Y que obtendramos para distintos valores de X. Estos conceptos quedarn
representados en lo que llamamos diagrama de dispersin:

AJUSTE POR MINIMOS CUADRADOS

Consiste en determinar los valores muestra, es decir, encontrar los


valores de a y b con los datos observados de la muestra. El mtodo de estimacin es el de
Mnimos Cuadrados, mediante el cual se obtiene:

Luego, la ecuacin de regresin muestral estimada es

Que se interpreta como:

Es el valor estimado de la variable Y cuando la variable X = 0

Est expresado en las mismas unidades de Y por cada unidad de X. Indica el nmero de
unidades en que vara Y cuando se produce un cambio, en una unidad, en X (pendiente de la
recta de regresin).
Un valor negativo de b sera interpretado como la magnitud del decremento en Y por cada
unidad de aumento en X.

M.C. Adrian Morales Glvez 61


LIBRO: ESTADISTICA PARA ADMINISTRADORES

BIBLIOGRAFA

1.- LIND, Douglas y MARCHAL, William y MASON, Robert. Estadstica para administracin y
ava
economa. 11 edicin.
2.- BERENSON M. Y D.M. LEVINE, Estadstica para administracin y economa, Mxico:
McGraw Hill. 1991
3.- KAZMIER L. Y A. DIAZ MATA, Estadstica aplicada a la administracin y economa,
Mxico McGraw Hill, 1996, 520 pp.
4.- MENDEHALL W. y J.E. REINMUTH, Estadstica para administracin y economa,
Mxico: Ibero Amrica: 1931, 708 pp.
En Internet: monografas, google, altavista

M.C. Adrian Morales Glvez 62

También podría gustarte